網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)淺析

2018-04-02 09:13:58王宏宇陳冬梅

電腦知識與技術(shù) 2018年5期

王宏宇　陳冬梅

摘要：黨的十九大報告提出“加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè)，建立網(wǎng)絡(luò)綜合治理體系，營造清朗的網(wǎng)絡(luò)空間。”，這是對新時期網(wǎng)絡(luò)信息內(nèi)容安全及管理的新要求。該文通過對網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)的分析和對網(wǎng)絡(luò)信息傳播的基本特征的提取，提出了一個針對網(wǎng)絡(luò)信息傳播的控制模型，以便及時發(fā)現(xiàn)并阻止網(wǎng)絡(luò)上的各種非法和不良信息傳播，保障網(wǎng)絡(luò)信息內(nèi)容安全。

關(guān)鍵詞：信息內(nèi)容安全；信息過濾；網(wǎng)絡(luò)輿情監(jiān)測

當(dāng)前網(wǎng)絡(luò)已經(jīng)成為傳播力強(qiáng)大、影響十分廣泛的大眾傳媒，各種信息通過文字、圖片、音頻、視頻等在網(wǎng)絡(luò)上傳播，極大地滿足了公眾的信息需求。但是網(wǎng)絡(luò)信息傳播中也出現(xiàn)了一些錯綜復(fù)雜的現(xiàn)象，虛假信息、垃圾信息、淫穢色情等非法有害信息不時出現(xiàn)，這給國家和社會帶來了不可低估的破壞作用和負(fù)面影響。如何應(yīng)對網(wǎng)絡(luò)信息傳播中出現(xiàn)的各種問題，保障網(wǎng)絡(luò)信息內(nèi)容安全，成為政府和業(yè)界急需研究的內(nèi)容。2012年12月底全國人大常委會通過的《關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》中第五條，規(guī)定了對用戶發(fā)布和傳播的非法和不良信息進(jìn)行監(jiān)管。黨的十九大報告提出“加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè)，建立網(wǎng)絡(luò)綜合治理體系，營造清朗的網(wǎng)絡(luò)空間?！庇职丫W(wǎng)絡(luò)內(nèi)容安全放在重要位置，以此為出發(fā)點(diǎn)，本文探討如何及時發(fā)現(xiàn)并阻止網(wǎng)絡(luò)上的各種不良和非法信息傳播，保障網(wǎng)絡(luò)信息內(nèi)容安全。

1網(wǎng)絡(luò)信息內(nèi)容安全面臨的威脅

隨著互聯(lián)網(wǎng)的快速發(fā)展，人們現(xiàn)在無論是在生活還是工作中，都離不開它。特別是在Web 2.0時代，用戶原創(chuàng)內(nèi)容UGC大量出現(xiàn)，隨之一些垃圾信息、廣告、色情圖片等內(nèi)容也悄然破壞著互聯(lián)網(wǎng)的純凈度。

網(wǎng)絡(luò)信息內(nèi)容安全，是研究如何在迅速變化且包含海量信息的互聯(lián)網(wǎng)中，通過計(jì)算機(jī)對與特定主題相關(guān)的數(shù)據(jù)和信息進(jìn)行自動采集、分析鑒別和響應(yīng)控制的技術(shù)。它較傳統(tǒng)網(wǎng)絡(luò)安全級別更高，是對網(wǎng)絡(luò)信息傳播進(jìn)行管控的重要手段，對加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè)、營造清朗的網(wǎng)絡(luò)空間、保障社會的和諧穩(wěn)定具有重要意義。在互聯(lián)網(wǎng)傳播的信息內(nèi)容中，面臨的不良和非法信息威脅主要有如下三類。垃圾信息，主要是指隱藏在文本、評論、彈幕、郵件等中的各種無用、不需要信息，包括垃圾文本，垃圾廣告、垃圾郵件等；色情信息，主要是指有性誘惑、性暗示的和涉黃露點(diǎn)的文字、圖片和視頻等信息；涉政信息，指危害國家安全，影響社會穩(wěn)定，反黨反政府的謠言、虛假信息和暴力恐怖信息等。

2網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)

網(wǎng)絡(luò)信息內(nèi)容安全面臨的問題主要表現(xiàn)在不良信息泡括虛假信息、垃圾信息、不道德信息）和非法信息通過各種開放的網(wǎng)絡(luò)所提供的自由流動的環(huán)境肆意擴(kuò)散。這些不良和非法信息不僅對公共利益和國家安全構(gòu)成威脅，而且其肆意傳播會威脅到公民個人的財產(chǎn)和生命安全。網(wǎng)絡(luò)信息內(nèi)容安全保障的重點(diǎn)是加強(qiáng)信息在傳播過程中的控制和管理，現(xiàn)在采用的主要方法有網(wǎng)絡(luò)輿情監(jiān)測和信息過濾。

2.1信息過濾

信息過濾一般是指滿足用戶信息需求的信息選擇過程。對網(wǎng)絡(luò)信息內(nèi)容安全來說，信息過濾是指從海量動態(tài)的網(wǎng)絡(luò)信息中，將剔除不良信息和非法信息后的內(nèi)容展現(xiàn)給用戶的過程，有效過濾網(wǎng)絡(luò)上發(fā)布和傳播的各種海量動態(tài)信息內(nèi)容是其實(shí)現(xiàn)的重點(diǎn)和難點(diǎn)。

網(wǎng)絡(luò)信息內(nèi)容安全過濾同一般的信息過濾相比，有如下特點(diǎn)：一是要過濾的內(nèi)容實(shí)時、動態(tài)、多樣且具有一定的隱蔽性；二是過濾的對象主要是文本、圖片和音視頻三種內(nèi)容，比較明確；三是過濾的目標(biāo)清晰主要實(shí)現(xiàn)廣告過濾、智能鑒黃、涉政檢測和暴恐識別這四個目標(biāo)；四是過濾的內(nèi)容所處場景多樣，有評論、簽名、頭像、聊天室、彈幕、直播、視頻等多種應(yīng)用場景。

當(dāng)前實(shí)現(xiàn)互聯(lián)網(wǎng)信息過濾的方法主要有以下三種。一是IP地址或網(wǎng)址過濾，是指建立含有非法或不良信息的網(wǎng)站所對應(yīng)的IP地址或網(wǎng)址數(shù)據(jù)庫，當(dāng)這些IP地址或網(wǎng)址被用戶訪問時予以阻斷。二是通過匹配關(guān)鍵詞和特征庫來實(shí)現(xiàn)過濾，是指在包含URl、檢索詞、文本、文檔等信息內(nèi)容的網(wǎng)頁或網(wǎng)站中，識別匹配指定的關(guān)鍵詞和特征，以檢測傳輸?shù)男畔⒅惺欠窈胁涣蓟蚍欠ㄐ畔?。三是基于互?lián)網(wǎng)信息內(nèi)容的過濾，即對實(shí)時傳輸?shù)暮Ａ炕ヂ?lián)網(wǎng)信息，通過采用基于自然語言、深度學(xué)習(xí)等技術(shù)的智能識別技術(shù)來實(shí)現(xiàn)過濾。

前兩種方法在實(shí)際應(yīng)用中容易實(shí)現(xiàn)，應(yīng)用范圍較廣，過濾的速度也較快。但是對IP地址或網(wǎng)址過濾來說，如果非法或不良信息的網(wǎng)站所對應(yīng)的IP地址或網(wǎng)址更新速度較慢的話，過濾效果將大打折扣，而且存在著用戶通過鏡像、代理、“翻墻”等手段實(shí)現(xiàn)對被封鎖網(wǎng)站內(nèi)容的訪問。匹配關(guān)鍵詞和特征庫的過濾主要缺陷是準(zhǔn)確率較低，誤報和漏報率較高，以致被濾掉的信息范圍擴(kuò)大。基于互聯(lián)網(wǎng)信息內(nèi)容的過濾雖然過濾的效率較低、速度較慢、實(shí)現(xiàn)難度較大，但是其過濾準(zhǔn)確度高，適用范圍廣，可以有效地避免前兩種方法的缺陷，已經(jīng)成為過濾研究的重點(diǎn)，也是未來過濾方法發(fā)展的方向和趨勢。

2.2網(wǎng)絡(luò)輿情監(jiān)測

網(wǎng)絡(luò)輿情監(jiān)測就是指通過信息采集、搜索引擎、數(shù)據(jù)挖掘等技術(shù)，對動態(tài)、交互、海量的互聯(lián)網(wǎng)信息進(jìn)行采集、敏感詞過濾、主題檢測、專題聚焦、統(tǒng)計(jì)分析等處理，從而發(fā)現(xiàn)網(wǎng)絡(luò)敏感事件并及時預(yù)警。

網(wǎng)絡(luò)輿情監(jiān)測技術(shù)既與信息的組織和分析相關(guān)，又與自然語言處理技術(shù)密不可分。目前實(shí)現(xiàn)網(wǎng)絡(luò)輿情監(jiān)測的技術(shù)主要有通過網(wǎng)絡(luò)數(shù)據(jù)挖掘的主題監(jiān)測和基于統(tǒng)計(jì)規(guī)則的模式識別兩種?；诮y(tǒng)計(jì)規(guī)則的模式識別技術(shù)在輿情監(jiān)測應(yīng)用中，因?yàn)椴煌男畔⒃串a(chǎn)生信息的規(guī)律差異較大，使其只能在較小的范圍內(nèi)進(jìn)行定點(diǎn)監(jiān)測，故有較大的局限性?，F(xiàn)在應(yīng)用較多的網(wǎng)絡(luò)輿情監(jiān)測技術(shù)主要是通過網(wǎng)絡(luò)數(shù)據(jù)挖掘的主題監(jiān)測來實(shí)現(xiàn)。這種方法通過網(wǎng)絡(luò)爬蟲和網(wǎng)頁清洗等技術(shù)從WEB中提取與目標(biāo)相關(guān)的輿情信息，并利用自然語言處理、數(shù)據(jù)挖掘等技術(shù)對其進(jìn)行輿情分類、主題檢測、網(wǎng)絡(luò)輿情意見挖掘和觀點(diǎn)分析以及網(wǎng)絡(luò)輿情危機(jī)預(yù)警。

3關(guān)鍵技術(shù)研究

無論是基于內(nèi)容的過濾，還是網(wǎng)絡(luò)輿情監(jiān)測其涉及的關(guān)鍵技術(shù)主要有信息采集、信息內(nèi)容的分析鑒別和響應(yīng)控制技術(shù)三類，如圖1所示。

3.1信息采集

信息內(nèi)容的采集是網(wǎng)絡(luò)信息傳播管控的首要任務(wù)。但是一些非法、不良信息的傳播者為了逃避管控，經(jīng)常會使用隱藏、加密、信息變換等技術(shù)傳播信息，以至對其難以有效地管控。

通信對象、通信方式和通信內(nèi)容是構(gòu)成信息傳播的三個基本要素，針對以上情況下可對信息采集對象進(jìn)行擴(kuò)展，在采集信息時對通信對象即“誰和誰在通信”，“以那種方式通信”這些信息也進(jìn)行采集。如使用通信對象這個要素進(jìn)行信息傳播管控，需要采集非法、不良信息內(nèi)容傳播者的身份，如IP地址等信息。但在實(shí)際信息傳播過程中，非法、不良信息傳播者可能會盜用IP地址或采用IP地址欺騙等技術(shù)隱藏身份信息，這時可以通過非法、不良信息傳播者與訪問者之間的通信行為加以管控，也就是通過“以那種方式通信”這個要素來控制。

為了提高信息采集效率，及時獲取實(shí)時的網(wǎng)絡(luò)信息內(nèi)容，同時降低后期處理技術(shù)部署成本，可以采用網(wǎng)絡(luò)端口鏡像技術(shù)和網(wǎng)絡(luò)爬蟲技術(shù)相結(jié)合的方式進(jìn)行信息內(nèi)容的獲取。

3.2信息內(nèi)容的分析鑒別

信息內(nèi)容的分析鑒別是指在內(nèi)容理解的基礎(chǔ)上，通過對網(wǎng)絡(luò)上傳輸?shù)暮Ａ?、動態(tài)信息進(jìn)行提取、分析后，及時地將非法和不良信息通過響應(yīng)控制技術(shù)處理，從而達(dá)到對信息傳播進(jìn)行管控的目的。由于它涉及數(shù)據(jù)庫、數(shù)理統(tǒng)計(jì)分析、知識論、模識識別、自然語言處理、計(jì)算機(jī)視覺、圖像處理及理解、人工智能等多個學(xué)科和領(lǐng)域，因此技術(shù)復(fù)雜，實(shí)現(xiàn)難度較大。

信息內(nèi)容的分析鑒別主要是通過格式、內(nèi)容、段落、主題、圖片、音，視頻等信息所呈現(xiàn)出的特征來進(jìn)行分析、判斷的一種鑒別方法，根據(jù)鑒別的信息對象不同可分為文本內(nèi)容分析鑒別、圖像內(nèi)容分析鑒別、音頻內(nèi)容分析鑒別、視頻內(nèi)容分析鑒別和混合信息內(nèi)容鑒別。要實(shí)現(xiàn)信息內(nèi)容的分析鑒別，主要通過以下兩個方面的工作來完成。一是信息內(nèi)容的預(yù)處理工作，即通過從信息源中提取能判別或反映信息性質(zhì)的隱性和顯性特征，實(shí)現(xiàn)對傳播信息內(nèi)容數(shù)據(jù)的預(yù)處理，使被監(jiān)測的信息內(nèi)容通過特征項(xiàng)被有效地標(biāo)識出來。二是信息內(nèi)容的匹配，即根據(jù)一定的匹配方法和規(guī)則將被監(jiān)測的信息內(nèi)容與不良和非法信息模板匹配，通過匹配的結(jié)果對被監(jiān)測信息內(nèi)容進(jìn)行相應(yīng)處理，并將處理的結(jié)果返回給用戶。常用的匹配方法有統(tǒng)計(jì)模式識別、關(guān)鍵詞匹配、正則表達(dá)式匹配及數(shù)據(jù)的挖掘分析等。

3.3響應(yīng)控制

響應(yīng)包括被動響應(yīng)和主動響應(yīng)。被動響應(yīng)是指對鑒別的結(jié)果和訪問請求路徑等進(jìn)行記錄，并由監(jiān)控者決定是否采取措施進(jìn)行下一步處理。主動響應(yīng)是指采用過濾、裁剪、替換、阻斷等方式對互聯(lián)網(wǎng)信息進(jìn)行管控，通過對鑒別后的信息源或信道采取具體的相應(yīng)措施而體現(xiàn)出主動響應(yīng)的處理結(jié)果。

傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用大部分是基于B/S架構(gòu)的，信息主要來源于網(wǎng)站，所以如發(fā)現(xiàn)網(wǎng)站中有非法、不良信息，一般來說常將網(wǎng)站的域名、IP地址等信息添加到黑名單中并加以訪問阻斷。如MAC地址過濾、DNS過濾、防火墻ACL和路由黑洞等傳統(tǒng)網(wǎng)絡(luò)阻斷與控制技術(shù)都是基于這一思想。隨著WEB 2.0應(yīng)用的普及和移動互聯(lián)網(wǎng)的快速發(fā)展，用戶之間的信息傳遞更加密切頻繁，用戶成為主要的信息來源。若使用傳統(tǒng)技術(shù)方法可能會導(dǎo)致用戶不能接入到移動互聯(lián)網(wǎng)中，因此針對移動互聯(lián)網(wǎng)應(yīng)用以HTTP應(yīng)用為主，大多數(shù)應(yīng)用是基于TCP協(xié)議這一應(yīng)用類型高度集中的特點(diǎn)，根據(jù)IP偽裝原理，可以采用面向應(yīng)用錯誤代碼和TCP鏈接的實(shí)時阻斷控制技術(shù)。

響應(yīng)控制部分與信息采集部分在實(shí)際部署中的處理能力必須匹配，響應(yīng)控制的效果由信息采集部分的速度和精度所決定。為了對網(wǎng)絡(luò)的運(yùn)行不產(chǎn)生影響，信息采集部分可以采用旁路方式部署。響應(yīng)控制部分與網(wǎng)絡(luò)串聯(lián)部署時會對網(wǎng)絡(luò)流量產(chǎn)生影響，因此，當(dāng)網(wǎng)絡(luò)流量有較大增長時，響應(yīng)控制部分與信息采集部分須同步升級。

4結(jié)語

互聯(lián)網(wǎng)信息流的復(fù)雜性決定了沒有任何一種技術(shù)可以完美解決互聯(lián)網(wǎng)信息傳播管控中的所有問題，所以在實(shí)際部署應(yīng)用中我們必須綜合各種技術(shù)，優(yōu)勢互補(bǔ)，為基于互聯(lián)網(wǎng)的網(wǎng)絡(luò)社會打造一個全方位、立體化的綜合管控技術(shù)體系，從而“加強(qiáng)網(wǎng)絡(luò)社會管理，推進(jìn)網(wǎng)絡(luò)依法規(guī)范有序運(yùn)行?！北Ｕ掀湫畔鞑グ踩?。

電腦知識與技術(shù)2018年5期

電腦知識與技術(shù)的其它文章: 城市不透水表面變化對污染物產(chǎn)出的影響研究; 新媒體閱讀環(huán)境下淺談獨(dú)立學(xué)院電子閱覽室服務(wù)轉(zhuǎn)型; 療養(yǎng)院的人臉識別系統(tǒng)設(shè)計(jì); 基于旋轉(zhuǎn)平移和尺度不變特征的場景識別技術(shù)研究; 勢科學(xué)視角下信息表示與運(yùn)算基礎(chǔ)教學(xué)改革實(shí)踐; 試論電子商務(wù)對國內(nèi)貿(mào)易的影響

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)淺析