国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)淺析

2018-04-02 09:13:58王宏宇陳冬梅
電腦知識與技術(shù) 2018年5期

王宏宇 陳冬梅

摘要:黨的十九大報告提出“加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè),建立網(wǎng)絡(luò)綜合治理體系,營造清朗的網(wǎng)絡(luò)空間。”,這是對新時期網(wǎng)絡(luò)信息內(nèi)容安全及管理的新要求。該文通過對網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)的分析和對網(wǎng)絡(luò)信息傳播的基本特征的提取,提出了一個針對網(wǎng)絡(luò)信息傳播的控制模型,以便及時發(fā)現(xiàn)并阻止網(wǎng)絡(luò)上的各種非法和不良信息傳播,保障網(wǎng)絡(luò)信息內(nèi)容安全。

關(guān)鍵詞:信息內(nèi)容安全;信息過濾;網(wǎng)絡(luò)輿情監(jiān)測

當(dāng)前網(wǎng)絡(luò)已經(jīng)成為傳播力強(qiáng)大、影響十分廣泛的大眾傳媒,各種信息通過文字、圖片、音頻、視頻等在網(wǎng)絡(luò)上傳播,極大地滿足了公眾的信息需求。但是網(wǎng)絡(luò)信息傳播中也出現(xiàn)了一些錯綜復(fù)雜的現(xiàn)象,虛假信息、垃圾信息、淫穢色情等非法有害信息不時出現(xiàn),這給國家和社會帶來了不可低估的破壞作用和負(fù)面影響。如何應(yīng)對網(wǎng)絡(luò)信息傳播中出現(xiàn)的各種問題,保障網(wǎng)絡(luò)信息內(nèi)容安全,成為政府和業(yè)界急需研究的內(nèi)容。2012年12月底全國人大常委會通過的《關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》中第五條,規(guī)定了對用戶發(fā)布和傳播的非法和不良信息進(jìn)行監(jiān)管。黨的十九大報告提出“加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè),建立網(wǎng)絡(luò)綜合治理體系,營造清朗的網(wǎng)絡(luò)空間?!庇职丫W(wǎng)絡(luò)內(nèi)容安全放在重要位置,以此為出發(fā)點(diǎn),本文探討如何及時發(fā)現(xiàn)并阻止網(wǎng)絡(luò)上的各種不良和非法信息傳播,保障網(wǎng)絡(luò)信息內(nèi)容安全。

1網(wǎng)絡(luò)信息內(nèi)容安全面臨的威脅

隨著互聯(lián)網(wǎng)的快速發(fā)展,人們現(xiàn)在無論是在生活還是工作中,都離不開它。特別是在Web 2.0時代,用戶原創(chuàng)內(nèi)容UGC大量出現(xiàn),隨之一些垃圾信息、廣告、色情圖片等內(nèi)容也悄然破壞著互聯(lián)網(wǎng)的純凈度。

網(wǎng)絡(luò)信息內(nèi)容安全,是研究如何在迅速變化且包含海量信息的互聯(lián)網(wǎng)中,通過計(jì)算機(jī)對與特定主題相關(guān)的數(shù)據(jù)和信息進(jìn)行自動采集、分析鑒別和響應(yīng)控制的技術(shù)。它較傳統(tǒng)網(wǎng)絡(luò)安全級別更高,是對網(wǎng)絡(luò)信息傳播進(jìn)行管控的重要手段,對加強(qiáng)互聯(lián)網(wǎng)內(nèi)容建設(shè)、營造清朗的網(wǎng)絡(luò)空間、保障社會的和諧穩(wěn)定具有重要意義。在互聯(lián)網(wǎng)傳播的信息內(nèi)容中,面臨的不良和非法信息威脅主要有如下三類。垃圾信息,主要是指隱藏在文本、評論、彈幕、郵件等中的各種無用、不需要信息,包括垃圾文本,垃圾廣告、垃圾郵件等;色情信息,主要是指有性誘惑、性暗示的和涉黃露點(diǎn)的文字、圖片和視頻等信息;涉政信息,指危害國家安全,影響社會穩(wěn)定,反黨反政府的謠言、虛假信息和暴力恐怖信息等。

2網(wǎng)絡(luò)信息內(nèi)容安全技術(shù)

網(wǎng)絡(luò)信息內(nèi)容安全面臨的問題主要表現(xiàn)在不良信息泡括虛假信息、垃圾信息、不道德信息)和非法信息通過各種開放的網(wǎng)絡(luò)所提供的自由流動的環(huán)境肆意擴(kuò)散。這些不良和非法信息不僅對公共利益和國家安全構(gòu)成威脅,而且其肆意傳播會威脅到公民個人的財產(chǎn)和生命安全。網(wǎng)絡(luò)信息內(nèi)容安全保障的重點(diǎn)是加強(qiáng)信息在傳播過程中的控制和管理,現(xiàn)在采用的主要方法有網(wǎng)絡(luò)輿情監(jiān)測和信息過濾。

2.1信息過濾

信息過濾一般是指滿足用戶信息需求的信息選擇過程。對網(wǎng)絡(luò)信息內(nèi)容安全來說,信息過濾是指從海量動態(tài)的網(wǎng)絡(luò)信息中,將剔除不良信息和非法信息后的內(nèi)容展現(xiàn)給用戶的過程,有效過濾網(wǎng)絡(luò)上發(fā)布和傳播的各種海量動態(tài)信息內(nèi)容是其實(shí)現(xiàn)的重點(diǎn)和難點(diǎn)。

網(wǎng)絡(luò)信息內(nèi)容安全過濾同一般的信息過濾相比,有如下特點(diǎn):一是要過濾的內(nèi)容實(shí)時、動態(tài)、多樣且具有一定的隱蔽性;二是過濾的對象主要是文本、圖片和音視頻三種內(nèi)容,比較明確;三是過濾的目標(biāo)清晰主要實(shí)現(xiàn)廣告過濾、智能鑒黃、涉政檢測和暴恐識別這四個目標(biāo);四是過濾的內(nèi)容所處場景多樣,有評論、簽名、頭像、聊天室、彈幕、直播、視頻等多種應(yīng)用場景。

當(dāng)前實(shí)現(xiàn)互聯(lián)網(wǎng)信息過濾的方法主要有以下三種。一是IP地址或網(wǎng)址過濾,是指建立含有非法或不良信息的網(wǎng)站所對應(yīng)的IP地址或網(wǎng)址數(shù)據(jù)庫,當(dāng)這些IP地址或網(wǎng)址被用戶訪問時予以阻斷。二是通過匹配關(guān)鍵詞和特征庫來實(shí)現(xiàn)過濾,是指在包含URl、檢索詞、文本、文檔等信息內(nèi)容的網(wǎng)頁或網(wǎng)站中,識別匹配指定的關(guān)鍵詞和特征,以檢測傳輸?shù)男畔⒅惺欠窈胁涣蓟蚍欠ㄐ畔?。三是基于互?lián)網(wǎng)信息內(nèi)容的過濾,即對實(shí)時傳輸?shù)暮A炕ヂ?lián)網(wǎng)信息,通過采用基于自然語言、深度學(xué)習(xí)等技術(shù)的智能識別技術(shù)來實(shí)現(xiàn)過濾。

前兩種方法在實(shí)際應(yīng)用中容易實(shí)現(xiàn),應(yīng)用范圍較廣,過濾的速度也較快。但是對IP地址或網(wǎng)址過濾來說,如果非法或不良信息的網(wǎng)站所對應(yīng)的IP地址或網(wǎng)址更新速度較慢的話,過濾效果將大打折扣,而且存在著用戶通過鏡像、代理、“翻墻”等手段實(shí)現(xiàn)對被封鎖網(wǎng)站內(nèi)容的訪問。匹配關(guān)鍵詞和特征庫的過濾主要缺陷是準(zhǔn)確率較低,誤報和漏報率較高,以致被濾掉的信息范圍擴(kuò)大。基于互聯(lián)網(wǎng)信息內(nèi)容的過濾雖然過濾的效率較低、速度較慢、實(shí)現(xiàn)難度較大,但是其過濾準(zhǔn)確度高,適用范圍廣,可以有效地避免前兩種方法的缺陷,已經(jīng)成為過濾研究的重點(diǎn),也是未來過濾方法發(fā)展的方向和趨勢。

2.2網(wǎng)絡(luò)輿情監(jiān)測

網(wǎng)絡(luò)輿情監(jiān)測就是指通過信息采集、搜索引擎、數(shù)據(jù)挖掘等技術(shù),對動態(tài)、交互、海量的互聯(lián)網(wǎng)信息進(jìn)行采集、敏感詞過濾、主題檢測、專題聚焦、統(tǒng)計(jì)分析等處理,從而發(fā)現(xiàn)網(wǎng)絡(luò)敏感事件并及時預(yù)警。

網(wǎng)絡(luò)輿情監(jiān)測技術(shù)既與信息的組織和分析相關(guān),又與自然語言處理技術(shù)密不可分。目前實(shí)現(xiàn)網(wǎng)絡(luò)輿情監(jiān)測的技術(shù)主要有通過網(wǎng)絡(luò)數(shù)據(jù)挖掘的主題監(jiān)測和基于統(tǒng)計(jì)規(guī)則的模式識別兩種?;诮y(tǒng)計(jì)規(guī)則的模式識別技術(shù)在輿情監(jiān)測應(yīng)用中,因?yàn)椴煌男畔⒃串a(chǎn)生信息的規(guī)律差異較大,使其只能在較小的范圍內(nèi)進(jìn)行定點(diǎn)監(jiān)測,故有較大的局限性?,F(xiàn)在應(yīng)用較多的網(wǎng)絡(luò)輿情監(jiān)測技術(shù)主要是通過網(wǎng)絡(luò)數(shù)據(jù)挖掘的主題監(jiān)測來實(shí)現(xiàn)。這種方法通過網(wǎng)絡(luò)爬蟲和網(wǎng)頁清洗等技術(shù)從WEB中提取與目標(biāo)相關(guān)的輿情信息,并利用自然語言處理、數(shù)據(jù)挖掘等技術(shù)對其進(jìn)行輿情分類、主題檢測、網(wǎng)絡(luò)輿情意見挖掘和觀點(diǎn)分析以及網(wǎng)絡(luò)輿情危機(jī)預(yù)警。

3關(guān)鍵技術(shù)研究

無論是基于內(nèi)容的過濾,還是網(wǎng)絡(luò)輿情監(jiān)測其涉及的關(guān)鍵技術(shù)主要有信息采集、信息內(nèi)容的分析鑒別和響應(yīng)控制技術(shù)三類,如圖1所示。

3.1信息采集

信息內(nèi)容的采集是網(wǎng)絡(luò)信息傳播管控的首要任務(wù)。但是一些非法、不良信息的傳播者為了逃避管控,經(jīng)常會使用隱藏、加密、信息變換等技術(shù)傳播信息,以至對其難以有效地管控。

通信對象、通信方式和通信內(nèi)容是構(gòu)成信息傳播的三個基本要素,針對以上情況下可對信息采集對象進(jìn)行擴(kuò)展,在采集信息時對通信對象即“誰和誰在通信”,“以那種方式通信”這些信息也進(jìn)行采集。如使用通信對象這個要素進(jìn)行信息傳播管控,需要采集非法、不良信息內(nèi)容傳播者的身份,如IP地址等信息。但在實(shí)際信息傳播過程中,非法、不良信息傳播者可能會盜用IP地址或采用IP地址欺騙等技術(shù)隱藏身份信息,這時可以通過非法、不良信息傳播者與訪問者之間的通信行為加以管控,也就是通過“以那種方式通信”這個要素來控制。

為了提高信息采集效率,及時獲取實(shí)時的網(wǎng)絡(luò)信息內(nèi)容,同時降低后期處理技術(shù)部署成本,可以采用網(wǎng)絡(luò)端口鏡像技術(shù)和網(wǎng)絡(luò)爬蟲技術(shù)相結(jié)合的方式進(jìn)行信息內(nèi)容的獲取。

3.2信息內(nèi)容的分析鑒別

信息內(nèi)容的分析鑒別是指在內(nèi)容理解的基礎(chǔ)上,通過對網(wǎng)絡(luò)上傳輸?shù)暮A?、動態(tài)信息進(jìn)行提取、分析后,及時地將非法和不良信息通過響應(yīng)控制技術(shù)處理,從而達(dá)到對信息傳播進(jìn)行管控的目的。由于它涉及數(shù)據(jù)庫、數(shù)理統(tǒng)計(jì)分析、知識論、模識識別、自然語言處理、計(jì)算機(jī)視覺、圖像處理及理解、人工智能等多個學(xué)科和領(lǐng)域,因此技術(shù)復(fù)雜,實(shí)現(xiàn)難度較大。

信息內(nèi)容的分析鑒別主要是通過格式、內(nèi)容、段落、主題、圖片、音,視頻等信息所呈現(xiàn)出的特征來進(jìn)行分析、判斷的一種鑒別方法,根據(jù)鑒別的信息對象不同可分為文本內(nèi)容分析鑒別、圖像內(nèi)容分析鑒別、音頻內(nèi)容分析鑒別、視頻內(nèi)容分析鑒別和混合信息內(nèi)容鑒別。要實(shí)現(xiàn)信息內(nèi)容的分析鑒別,主要通過以下兩個方面的工作來完成。一是信息內(nèi)容的預(yù)處理工作,即通過從信息源中提取能判別或反映信息性質(zhì)的隱性和顯性特征,實(shí)現(xiàn)對傳播信息內(nèi)容數(shù)據(jù)的預(yù)處理,使被監(jiān)測的信息內(nèi)容通過特征項(xiàng)被有效地標(biāo)識出來。二是信息內(nèi)容的匹配,即根據(jù)一定的匹配方法和規(guī)則將被監(jiān)測的信息內(nèi)容與不良和非法信息模板匹配,通過匹配的結(jié)果對被監(jiān)測信息內(nèi)容進(jìn)行相應(yīng)處理,并將處理的結(jié)果返回給用戶。常用的匹配方法有統(tǒng)計(jì)模式識別、關(guān)鍵詞匹配、正則表達(dá)式匹配及數(shù)據(jù)的挖掘分析等。

3.3響應(yīng)控制

響應(yīng)包括被動響應(yīng)和主動響應(yīng)。被動響應(yīng)是指對鑒別的結(jié)果和訪問請求路徑等進(jìn)行記錄,并由監(jiān)控者決定是否采取措施進(jìn)行下一步處理。主動響應(yīng)是指采用過濾、裁剪、替換、阻斷等方式對互聯(lián)網(wǎng)信息進(jìn)行管控,通過對鑒別后的信息源或信道采取具體的相應(yīng)措施而體現(xiàn)出主動響應(yīng)的處理結(jié)果。

傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用大部分是基于B/S架構(gòu)的,信息主要來源于網(wǎng)站,所以如發(fā)現(xiàn)網(wǎng)站中有非法、不良信息,一般來說常將網(wǎng)站的域名、IP地址等信息添加到黑名單中并加以訪問阻斷。如MAC地址過濾、DNS過濾、防火墻ACL和路由黑洞等傳統(tǒng)網(wǎng)絡(luò)阻斷與控制技術(shù)都是基于這一思想。隨著WEB 2.0應(yīng)用的普及和移動互聯(lián)網(wǎng)的快速發(fā)展,用戶之間的信息傳遞更加密切頻繁,用戶成為主要的信息來源。若使用傳統(tǒng)技術(shù)方法可能會導(dǎo)致用戶不能接入到移動互聯(lián)網(wǎng)中,因此針對移動互聯(lián)網(wǎng)應(yīng)用以HTTP應(yīng)用為主,大多數(shù)應(yīng)用是基于TCP協(xié)議這一應(yīng)用類型高度集中的特點(diǎn),根據(jù)IP偽裝原理,可以采用面向應(yīng)用錯誤代碼和TCP鏈接的實(shí)時阻斷控制技術(shù)。

響應(yīng)控制部分與信息采集部分在實(shí)際部署中的處理能力必須匹配,響應(yīng)控制的效果由信息采集部分的速度和精度所決定。為了對網(wǎng)絡(luò)的運(yùn)行不產(chǎn)生影響,信息采集部分可以采用旁路方式部署。響應(yīng)控制部分與網(wǎng)絡(luò)串聯(lián)部署時會對網(wǎng)絡(luò)流量產(chǎn)生影響,因此,當(dāng)網(wǎng)絡(luò)流量有較大增長時,響應(yīng)控制部分與信息采集部分須同步升級。

4結(jié)語

互聯(lián)網(wǎng)信息流的復(fù)雜性決定了沒有任何一種技術(shù)可以完美解決互聯(lián)網(wǎng)信息傳播管控中的所有問題,所以在實(shí)際部署應(yīng)用中我們必須綜合各種技術(shù),優(yōu)勢互補(bǔ),為基于互聯(lián)網(wǎng)的網(wǎng)絡(luò)社會打造一個全方位、立體化的綜合管控技術(shù)體系,從而“加強(qiáng)網(wǎng)絡(luò)社會管理,推進(jìn)網(wǎng)絡(luò)依法規(guī)范有序運(yùn)行?!北U掀湫畔鞑グ踩?。

益阳市| 孟津县| 玉环县| 渭源县| 颍上县| 乐陵市| 佳木斯市| 华阴市| 吐鲁番市| 大同县| 昭通市| 福安市| 喀什市| 上杭县| 鱼台县| 凤山市| 山东| 潜山县| 安乡县| 德阳市| 神木县| 兴义市| 横峰县| 新建县| 莆田市| 饶阳县| 临泽县| 华容县| 宜阳县| 黑河市| 潼南县| 灌南县| 柞水县| 遂昌县| 普格县| 镇沅| 东乡县| 南郑县| 道孚县| 屏东市| 酒泉市|