陳樂朋 周家政
摘要:隨著近年來中國網(wǎng)民數(shù)量眾多而網(wǎng)絡(luò)給予了眾多網(wǎng)民言論自由,因此網(wǎng)絡(luò)輿情越來越被關(guān)注,對網(wǎng)絡(luò)輿情的預(yù)警也越來越迫切。該文采用了五個指標對“廈門PX事件”、“昆明PX事件”和“寧波PX事件”進行量化描述,通過Matlab建立BP神經(jīng)網(wǎng)絡(luò)識別模型中進行學(xué)習(xí),然后再對“寧波PX事件”進行預(yù)警識別。模型具有較好的識別能力,預(yù)警結(jié)果的準確率達到了90%以上。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;BP神經(jīng)網(wǎng)絡(luò);預(yù)警
中圖分類號:C915 文獻標識碼:A 文章編號:1009-3044(2014)22-5283-04
互聯(lián)網(wǎng)這些年來在我國的快速的發(fā)展,我國網(wǎng)民人數(shù)較之前有了大幅的提升。網(wǎng)絡(luò)的開放性和靈活性讓其成為反映社會輿情的主要載體之一。而近兩三年網(wǎng)絡(luò)輿情引發(fā)的事件激增,引起了政府的高度重視,網(wǎng)絡(luò)儼然已成為政府部門了解民意的又一理想窗口。顯然,能夠直觀表達網(wǎng)絡(luò)輿情的光定性的解讀遠遠不夠,對于決策者更希望得到一個輿論事件過程中所處的量化等級。由于輿情危機產(chǎn)生具有模糊性和隨機性是非線性的,因此通過建立預(yù)警指標,再利用容錯能力高,通過學(xué)習(xí)復(fù)雜數(shù)據(jù)發(fā)現(xiàn)規(guī)律進行識別的人工神經(jīng)網(wǎng)絡(luò)是不二選擇。故本文的核心在于BP神經(jīng)網(wǎng)絡(luò)[1]。
1 網(wǎng)絡(luò)輿情危機預(yù)警指標體系
網(wǎng)絡(luò)輿情危機的發(fā)生,受到多種隨機因素的影響,而且每個因素對結(jié)果所起的效果大小也是不一樣的。因此網(wǎng)絡(luò)輿情危機預(yù)警的關(guān)鍵是建立科學(xué)、系統(tǒng)的預(yù)警指標體系。依據(jù)近些年來網(wǎng)絡(luò)輿情方面專家的調(diào)查匯總和政府機構(gòu)對輿情監(jiān)督部門的考察,并結(jié)合網(wǎng)絡(luò)輿情與危機預(yù)警機制方面的資料,經(jīng)過多次地調(diào)試整理匯總制定出,對網(wǎng)絡(luò)輿情信息從五個具體的指標構(gòu)建了網(wǎng)絡(luò)輿情危機預(yù)警指標體系[2]。
1.1 輿情預(yù)警指標
1.1.1 輿情信息的敏感度
網(wǎng)絡(luò)上有各式各樣的信息,而這些各式各樣的信息其敏感度也是不同的,對于可能造成社會動蕩的網(wǎng)絡(luò)信息則是政府最為關(guān)注的。顯然各條信息所引起的社會敏感度是不同的,敏感度越高說明產(chǎn)生輿論危機的可能性就越高。這種指標的量化標準采用專家打分的方法得到。得分設(shè)定的范圍為[0,1],0、0.5、0.7、1表示的意義依次為“具有敏感性”、“敏感”、“很敏感”、“相當敏感”。
1.1.2 輿情信息的流通量
輿情信息的流通量反映出輿情信息在網(wǎng)絡(luò)上傳播情況和討論熱度。而這些網(wǎng)絡(luò)上的流通信息會被搜索引擎例如Google、百度等抓取。因此通過限定時間段搜索引擎搜索關(guān)鍵詞得到的搜索量可以作為流通量使用。
1.2.3 輿情觀點傾向度
輿情觀點傾向度主要量化網(wǎng)民對于某個輿論信息觀點傾向度。分別由1,0,-1表示正面、中立、反面觀點,用[f(x)][f(x)]表示各個觀點面傾向度,n表示發(fā)表觀點的總觀點數(shù),此指標用[μ]表示:
其實就是求各個觀點總和的均值,其取值范圍在(-1,1)。這部分則是通過統(tǒng)計事件討論最熱的貼吧的跟帖信息或者微博評論進行打分得到的。
1.2.4 輿情影響范圍
輿情影響范圍是指在某一時刻或時間段內(nèi),輿情信息所影響的區(qū)域性范圍。對于這部分的評分依照我國的行政地域劃分進行評分。即村\社區(qū)、鄉(xiāng)\鎮(zhèn)\街道、縣\區(qū)、市、省、國家。其取值范圍為[0,1]。這部分的取值則是通過新聞報道中時間的發(fā)展態(tài)勢進行取值。地域?qū)?yīng)的取值見下表:
1.2.5 網(wǎng)絡(luò)輿情媒體曝光度
網(wǎng)絡(luò)輿情信息被媒體曝光之后則將網(wǎng)絡(luò)信息的討論引到現(xiàn)實社會中,而現(xiàn)實中媒體的報道是有著比網(wǎng)絡(luò)更為嚴格的審查制度。媒體的報道無疑對網(wǎng)絡(luò)輿情有著更為影響力的宣傳進而推動著輿論的發(fā)展。而這部分的數(shù)據(jù)則采用Google news中通過對時間段的設(shè)定搜索關(guān)鍵詞得到相應(yīng)的搜索到的新聞條數(shù)進行量化評價媒體的曝光度。
1.2.6 輿情指標
而結(jié)果評級依照《國家突發(fā)公共事件總體應(yīng)急預(yù)案》將預(yù)警等級設(shè)為四個等級:特別嚴重、嚴重、較重和一般。而根據(jù)網(wǎng)絡(luò)輿情危機的嚴重程度、經(jīng)濟程度、可控性等方面將預(yù)警設(shè)為5個等級:安全、輕警、中警、重警、急警[7]。
2 數(shù)據(jù)獲取與處理
2.1 事件的選取和回顧
在實證分析中以“寧波PX事件”為預(yù)警模型的最終目標,而選擇了“廈門PX事件”和“昆明PX事件”為學(xué)習(xí)樣本進行學(xué)習(xí)。這一連串關(guān)于PX事件其危害的對象不僅僅是政府形象更是對整個社會和諧穩(wěn)定造成了較大的影響。尤其是寧波PX事件中,甚至出現(xiàn)了不理智的因受謠言的蠱惑沖擊政府機關(guān)掀翻執(zhí)勤警車的情況。倘若能及時且準確地對此類事件進行預(yù)警并作出相應(yīng)的預(yù)防措施就能對事件進行有效的控制。
2.2 指標數(shù)據(jù)的獲取
對于所建立的模型而言其關(guān)鍵不僅僅在于預(yù)警模型的指標的建立和神經(jīng)網(wǎng)絡(luò)的識別。其數(shù)據(jù)的獲取亦是十分關(guān)鍵的一步。根據(jù)各個數(shù)據(jù)的特點,整理各個指標數(shù)據(jù)獲取方式如下。
將廈門PX事件和昆明PX事件作為一個學(xué)習(xí)樣本,其數(shù)據(jù)清單如表3所示。
同樣將模型的預(yù)警目標——“寧波PX事件”作為目標數(shù)據(jù),其數(shù)據(jù)清單如表4所示。
2.3 輸入數(shù)據(jù)的標準化處理
網(wǎng)絡(luò)輿情危機預(yù)警指標體系中有5個預(yù)警指標,其中存在定性指標和定量指標兩大類,并且對各個指標的數(shù)據(jù)進行了量化處理,然而各個指標的單位的量綱是不同的,為了能夠?qū)Ω鱾€指標進行對比評分 ,需要將它們進行標準化得到[0,1]無量綱指標。
量化的指標均有正負方向均有正負方向之分,自然這些數(shù)據(jù)的標注化方法均有不同:
1)正向指標處理:正向指標表示值越大越安全,危機等級越小無量綱化以最小值為基準,正向無量綱化處理方程:
2) 負向指標處理:負向指標在文章中表示指標值越小越安全,危機等級越小。無量綱化以最大值為基準,負向的無量綱化處理方程:
其中,X 表示量化后的指標值, [xmin]表示指標的最小值, [xi] 表示指標的實際值, [xmax]表示指標的最大值。
3 輿情預(yù)警模型的建立及結(jié)果
3.1 模型的建立
神經(jīng)網(wǎng)絡(luò)模型是一個典型的“輸入-處理-輸出”的過程。輸入是采集到的指標的實際值,輸出是模型識別的結(jié)果,即預(yù)警的敏感度,而中間過稱則采用BP神經(jīng)網(wǎng)絡(luò)模型進行學(xué)習(xí)計算,這部分相當于“黑匣子”。在處理的時候,該文采用三層BP網(wǎng)絡(luò)(一個輸入層、一個隱含層、一個輸出層)的網(wǎng)絡(luò)結(jié)構(gòu),那么輸入、輸出節(jié)點數(shù)分別是5和1[8]。
在設(shè)置完參數(shù)之后用第四章所講述的利用Matlab軟件完成模型的建立。
3.2 結(jié)果及檢驗
通過搜集得到的數(shù)據(jù)匯編成的學(xué)習(xí)樣本,并將其中的70%作為樣本,30%作為檢驗樣本進行。
通過計算可以得到該表,從該表中容易得到,學(xué)習(xí)過程中準確率達到了91.76%。并在測過程中抽取了5項進行預(yù)測,得到的準確率為92.31%,其較高的準確率。因此有理由認為該模型在未來的預(yù)測過程中其準確率應(yīng)該達到90%以上。
4 研究結(jié)論
本文的研究結(jié)果表明:基于輿情量化指標的BP神經(jīng)網(wǎng)絡(luò)能夠?qū)W(wǎng)絡(luò)輿情信息進行較為準確的預(yù)警,無論是學(xué)習(xí)還是最后實踐的識別準確率都達到了80%以上。這種預(yù)警方法通過輿情信息的預(yù)警指標利用量化評價方法可以降低人為的主管臆斷,而實驗結(jié)果也表明了其擁有較高的識別準確率。并且利用Matlab進行編程得到的預(yù)警模型具有廣泛的應(yīng)用前景和使用價值。模型可以為政府提供網(wǎng)絡(luò)輿情的預(yù)警,也為企業(yè)的網(wǎng)絡(luò)聲譽進行預(yù)警為企業(yè)的公關(guān)提供預(yù)警參考。
參考文獻:
[1] 薛圈圈.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情危機預(yù)警研究[D].江西:江西財經(jīng)大學(xué),2010:25-30.
[2] 戴媛.我國網(wǎng)絡(luò)輿情安全評估指標體系研究[D].北京:北京化工大學(xué),2008:13-22.
[3] 袁越.廈門PX時間[OL].http://news.sina.com.cn/c/2007-09-27/165713986641.shtml.
[4] 王秀娟.昆明PX事件[N].中國石油石化,2013.
[5] 大公網(wǎng).鎮(zhèn)海PX項目引發(fā)群體性事件[OL].http://www.takungpao.com/mainland/node_13226.htm.
[6] 周子健.基于網(wǎng)絡(luò)搜索量的上海世博會國際影響力研究[J].藝海,2011(5):80-82.
[7] 王新輝.基于BP神經(jīng)網(wǎng)絡(luò)的國際電子商務(wù)信用風險預(yù)警模型研究[D].沈陽:沈陽工業(yè)大學(xué),2008:7-14.
[8] 楊淑娥,黃禮.基于BP神經(jīng)網(wǎng)絡(luò)的上市公司財務(wù)預(yù)警模型.系統(tǒng)工程理論與實踐[J].2005(1):21-26.