丁勝鋒+楊紹輝
[摘 要]目前,隨著海量網(wǎng)絡(luò)輿情成指數(shù)增加,傳統(tǒng)的數(shù)據(jù)處理技術(shù)不支持對(duì)海量輿情潛在信息的發(fā)現(xiàn)與挖掘,無(wú)法找到輿情信息之間的規(guī)則或關(guān)系,不能根據(jù)輿情現(xiàn)狀預(yù)測(cè)未來(lái)發(fā)展趨勢(shì)。在這種形勢(shì)下,非常有必要把數(shù)據(jù)挖掘技術(shù)應(yīng)用到網(wǎng)絡(luò)輿情管理中,充分發(fā)揮數(shù)據(jù)挖掘的具體優(yōu)勢(shì),從而實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情的及時(shí)發(fā)現(xiàn)、快速分析、準(zhǔn)確追蹤和理性引導(dǎo)。
[關(guān)鍵詞]數(shù)據(jù)挖掘;網(wǎng)絡(luò)輿情;研究
[中圖分類(lèi)號(hào)] G41,TP399 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 2095-3437(2016)11-0173-02
隨著因特網(wǎng)在全世界范圍內(nèi)的普及,作為繼報(bào)刊、廣播、電視之后發(fā)展起來(lái)的與傳統(tǒng)大眾媒體并存的新媒體,因特網(wǎng)被稱(chēng)為第四媒體,它成為反映社會(huì)輿情的主要載體之一。隨著信息技術(shù)的高速發(fā)展,人們積累的數(shù)據(jù)量越來(lái)越多,僅依靠傳統(tǒng)的人工方法收集和處理海量網(wǎng)絡(luò)信息是十分困難的。在這種情況下,迫切需要更加科學(xué)有效的信息處理技術(shù),快速準(zhǔn)確地分析網(wǎng)絡(luò)輿情動(dòng)態(tài),及時(shí)對(duì)網(wǎng)絡(luò)的熱點(diǎn)、焦點(diǎn)與敏感話(huà)題做出反應(yīng),從而提高網(wǎng)絡(luò)的監(jiān)管能力和網(wǎng)絡(luò)突發(fā)事件的處置能力。
一、數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘的對(duì)象是大量的、包含噪聲的數(shù)據(jù)源或數(shù)據(jù)庫(kù),而挖掘的結(jié)果是對(duì)用戶(hù)有幫助且事先未知的信息或知識(shí)。
近年來(lái)網(wǎng)絡(luò)數(shù)據(jù)的爆炸性增長(zhǎng)與數(shù)據(jù)處理技術(shù)的滯后之間的矛盾越來(lái)越突出,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并能從實(shí)際的海量數(shù)據(jù)源中抽取知識(shí)。數(shù)據(jù)挖掘技術(shù)被越來(lái)越多的行業(yè)和領(lǐng)域所采用,取得了較好的效果,為人們的正確決策提供了有力的幫助。[1] [2]
二、新形勢(shì)下網(wǎng)絡(luò)輿情現(xiàn)狀分析
(一)大數(shù)據(jù)背景的網(wǎng)絡(luò)輿情更加復(fù)雜
第一,網(wǎng)絡(luò)輿情數(shù)據(jù)量巨大。數(shù)據(jù)的海量性和偶然性因素使社會(huì)輿情難以有效捕獲,演變和發(fā)展過(guò)程難以推測(cè),傳統(tǒng)的處理方法顯得捉襟見(jiàn)肘。第二,網(wǎng)絡(luò)輿情選擇性傳播。網(wǎng)絡(luò)數(shù)據(jù)的無(wú)限性和網(wǎng)民關(guān)注能力的有限性之間存在矛盾,這導(dǎo)致網(wǎng)民不能全面、準(zhǔn)確了解輿情的真面目。網(wǎng)絡(luò)媒體具備人際傳播和大眾傳播的特點(diǎn),容易讓同類(lèi)網(wǎng)民找到共鳴點(diǎn),從而使一些偏激輿論被放大。第三,網(wǎng)絡(luò)輿論話(huà)語(yǔ)權(quán)較分散。大數(shù)據(jù)背景下數(shù)據(jù)的獲取相對(duì)容易,更多的機(jī)構(gòu)或個(gè)人通過(guò)信息分析得出的結(jié)論迅速傳播,有效管理輿情的難度越來(lái)越大。
(二)網(wǎng)絡(luò)媒體影響力增強(qiáng)
在互聯(lián)網(wǎng)發(fā)展的早期,網(wǎng)絡(luò)媒體主要通過(guò)引用或轉(zhuǎn)載報(bào)紙、廣播、電視的報(bào)道內(nèi)容,然后進(jìn)行補(bǔ)充式的討論。隨著近年來(lái)移動(dòng)客戶(hù)端設(shè)備、軟件的出現(xiàn)和網(wǎng)民數(shù)量的大幅度增長(zhǎng),傳統(tǒng)媒體的傳播優(yōu)勢(shì)逐漸減少。網(wǎng)絡(luò)媒體依靠其傳播的快速性和便捷性,吸引網(wǎng)民發(fā)布信息,引發(fā)輿論,反過(guò)來(lái)影響傳統(tǒng)媒體的討論。網(wǎng)絡(luò)媒體已經(jīng)成為傳統(tǒng)媒體報(bào)道內(nèi)容的重要來(lái)源之一。
(三)網(wǎng)絡(luò)輿情載體多樣化,影響力迅速提高
隨著微信、微博、QQ等網(wǎng)絡(luò)輿情載體的發(fā)展,網(wǎng)民的組織化程度越來(lái)越高。網(wǎng)民通過(guò)微信、微博、QQ、社交類(lèi)網(wǎng)站來(lái)組建各種群組。這些網(wǎng)絡(luò)載體能為網(wǎng)民提供Blog、Microblog、微信、圖像、音頻、視頻等多種線(xiàn)上、線(xiàn)下互動(dòng)功能。網(wǎng)民不再是一個(gè)獨(dú)立的個(gè)體,通過(guò)加入各種群組,他們能夠獲取小范圍的消息,并迅速把消息傳播到全世界的每個(gè)角落。同時(shí)移動(dòng)互聯(lián)網(wǎng)的應(yīng)用擴(kuò)大了網(wǎng)民相互交流的時(shí)間域和空間域,“任何一個(gè)在場(chǎng)的人都可能一轉(zhuǎn)身,上網(wǎng)發(fā)送文字、圖片、視頻,給政府的事件處置及輿情應(yīng)對(duì)帶來(lái)挑戰(zhàn)”,“移動(dòng)終端在突發(fā)事件‘現(xiàn)場(chǎng)直播的優(yōu)勢(shì),讓其他媒體望塵莫及”。[3] [4]
(四)網(wǎng)絡(luò)輿情走向現(xiàn)實(shí)生活,推動(dòng)事件發(fā)展
隨著社會(huì)的進(jìn)步,越來(lái)越多的網(wǎng)民不再在網(wǎng)絡(luò)平臺(tái)上議論和分析社會(huì)上的熱點(diǎn)、敏感事件,不再滿(mǎn)足于在網(wǎng)絡(luò)上等待熱點(diǎn)事情的真相,而是積極走向社會(huì)現(xiàn)實(shí),親自調(diào)查以還原事件真相。這增加了熱點(diǎn)事件的透明度,加快了相關(guān)政府部門(mén)、企事業(yè)單位或個(gè)人對(duì)事情的處理速度。
(五)網(wǎng)絡(luò)輿情導(dǎo)控與應(yīng)對(duì)存在不足
第一,輿情應(yīng)急準(zhǔn)備不足,響應(yīng)速度緩慢。目前網(wǎng)絡(luò)輿情管控體系還不完善,這導(dǎo)致我們?cè)谔幚硗话l(fā)事件時(shí)反應(yīng)緩慢;在網(wǎng)絡(luò)輿論爆發(fā)之時(shí),難以進(jìn)行有效監(jiān)測(cè)、研判和引導(dǎo)。第二,危機(jī)處理方式被動(dòng),缺乏有效的制度。在一些敏感事件的處理中,我們常常采取回避、封堵或冷處理的辦法,試圖淡化輿情,急于控制事態(tài)而非疏導(dǎo),這容易引發(fā)深層次的輿情危機(jī)。第三,輿情管控手段落后,設(shè)備投入不足。出現(xiàn)突發(fā)問(wèn)題時(shí),經(jīng)常采用簡(jiǎn)單粗暴的手段來(lái)拖延或壓制,如刪帖、封IP、斷網(wǎng)等。第四,網(wǎng)民配合消極。強(qiáng)大的網(wǎng)民力量,沒(méi)有有效地配合相關(guān)部門(mén)的工作,容易被錯(cuò)誤的輿論所引導(dǎo)和控制。[5]
三、數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的應(yīng)用
(一)網(wǎng)絡(luò)輿情關(guān)聯(lián)分析
在網(wǎng)絡(luò)輿情管理中應(yīng)用關(guān)聯(lián)分析方法,能從海量、不完全、復(fù)雜多變的網(wǎng)絡(luò)輿情信息中尋找輿情演變的內(nèi)在原因和規(guī)律,分析各內(nèi)在因素之間的關(guān)系。禽流感該如何更好地監(jiān)控?今天你寫(xiě)B(tài)log了嗎?這兩個(gè)事件放在一起看不出有什么特別的意義。但事實(shí)上,美國(guó)一家公司研究發(fā)現(xiàn),這兩個(gè)事件之間有聯(lián)系,可以通過(guò)互聯(lián)網(wǎng)上的Blog網(wǎng)頁(yè)挖掘出和禽流感相關(guān)的信息,從而建立一個(gè)禽流感預(yù)警機(jī)制。
(二)網(wǎng)絡(luò)輿情聚類(lèi)分析
聚類(lèi)分析是一個(gè)將數(shù)據(jù)集中的所有數(shù)據(jù),按照相似性劃分為多個(gè)類(lèi)別的過(guò)程。聚類(lèi)分析之后,應(yīng)盡可能保證類(lèi)別相同的數(shù)據(jù)之間具有較高的相似性,而類(lèi)別不同的數(shù)據(jù)之間具有較低的相似性。依照網(wǎng)民表達(dá)的特點(diǎn)和性質(zhì),網(wǎng)絡(luò)輿情聚類(lèi)主要有過(guò)程聚類(lèi)和觀(guān)點(diǎn)聚類(lèi)兩種。過(guò)程聚類(lèi)主要指分析網(wǎng)民的思想觀(guān)點(diǎn)、態(tài)度情緒的改變,從而掌握網(wǎng)絡(luò)輿情的演變過(guò)程,監(jiān)測(cè)二次輿情的發(fā)生。觀(guān)點(diǎn)聚類(lèi)主要指把網(wǎng)民的相同觀(guān)點(diǎn)匯集起來(lái),分析網(wǎng)民的各種觀(guān)點(diǎn)、情緒的分布和占比。
(三)網(wǎng)絡(luò)輿情分類(lèi)分析
網(wǎng)絡(luò)輿情信息一般分為四類(lèi)。第一,思想反映類(lèi)。這主要是指社會(huì)上各個(gè)層次的網(wǎng)民的主流觀(guān)點(diǎn),思想動(dòng)態(tài)。第二,問(wèn)題傾向類(lèi)。這主要是指政府機(jī)關(guān)、企事業(yè)單位工作中存在的問(wèn)題及不足。第三,工作動(dòng)態(tài)類(lèi)。這主要是指宣傳思想政治工作的形勢(shì)和動(dòng)態(tài)。第四,對(duì)策建議類(lèi)。這主要是指針對(duì)社會(huì)熱點(diǎn)、焦點(diǎn)話(huà)題提出的對(duì)策和建議。
根據(jù)自身需求,首先對(duì)海量的網(wǎng)絡(luò)輿情信息進(jìn)行篩選,然后進(jìn)行分類(lèi)和分組,如分成教育醫(yī)療、反恐除暴、網(wǎng)絡(luò)安全、食品安全、城鎮(zhèn)化等類(lèi)別,為下一步的工作打下基礎(chǔ)。最后對(duì)各類(lèi)別的輿情信息進(jìn)行分析和挖掘,得到有針對(duì)性的知識(shí)或經(jīng)驗(yàn)。
(四)網(wǎng)絡(luò)輿情預(yù)測(cè)分析
預(yù)測(cè)分析是指在掌握歷史資料和調(diào)研資料等現(xiàn)有信息的基礎(chǔ)上,依照一定的方法和規(guī)律,對(duì)事物未來(lái)趨勢(shì)或可能的結(jié)果進(jìn)行測(cè)算,以預(yù)先了解事情發(fā)展的過(guò)程與結(jié)果。例如美國(guó)最重要的以軍事為主的綜合性戰(zhàn)略研究機(jī)構(gòu)蘭德公司,運(yùn)用運(yùn)籌學(xué)理論和方法,曾經(jīng)就“中國(guó)是否出兵朝鮮”、“中美建交”、“古巴導(dǎo)彈危機(jī)”、“美國(guó)經(jīng)濟(jì)大蕭條”和“德國(guó)統(tǒng)一”等重大事件進(jìn)行了成功預(yù)測(cè),揭示了事件的變化規(guī)律和趨勢(shì)。[6]
(五)網(wǎng)絡(luò)輿情序列分析及時(shí)間序列
序列分析是指通過(guò)對(duì)網(wǎng)絡(luò)輿情信息發(fā)生的時(shí)間序列進(jìn)行排序梳理,得出的重復(fù)發(fā)生概率較高的模式。序列分析技術(shù)可以很好地應(yīng)用于網(wǎng)絡(luò)輿情的監(jiān)控和預(yù)警。在輿情信息匯集和分析的基礎(chǔ)上,對(duì)社會(huì)運(yùn)行接近負(fù)向質(zhì)變的臨界值的程度做出初步確定的早期預(yù)報(bào)。事實(shí)證明,在一些危害社會(huì)穩(wěn)定的不良事件發(fā)生之前、發(fā)生過(guò)程中,甚至是結(jié)束后,都能通過(guò)大量的網(wǎng)絡(luò)信息的收集、整理分類(lèi),有針對(duì)地選取數(shù)據(jù)并對(duì)該數(shù)據(jù)進(jìn)行規(guī)律預(yù)測(cè)或優(yōu)先等級(jí)排序,從而有步驟、有計(jì)劃的處理網(wǎng)絡(luò)輿情,這樣就能通過(guò)對(duì)輿情的收集達(dá)到實(shí)現(xiàn)對(duì)不良事件的預(yù)防和控制的目的;能夠及時(shí)掌握網(wǎng)絡(luò)輿情動(dòng)態(tài),避免很多事件向消極的方向發(fā)展,使對(duì)不良網(wǎng)絡(luò)輿情的處理從即時(shí)處置型向事前預(yù)警型轉(zhuǎn)變。在大規(guī)模輿情危機(jī)爆發(fā)之前,應(yīng)盡早針對(duì)熱點(diǎn)話(huà)題梳理情況,快速應(yīng)對(duì)。[7]
(六)網(wǎng)絡(luò)輿情偏差分析
偏差分析是指發(fā)現(xiàn)數(shù)據(jù)集中的異常數(shù)據(jù)。2008年3月14日發(fā)生在西藏拉薩的打砸搶燒事件,是一起駭人聽(tīng)聞的嚴(yán)重暴力犯罪事件,給當(dāng)?shù)厝嗣袢罕娚?cái)產(chǎn)造成了重大損失,使當(dāng)?shù)氐纳鐣?huì)秩序受到嚴(yán)重破壞。這一事件遭到了全國(guó)各族人民的強(qiáng)烈譴責(zé),但同時(shí)針對(duì)這一動(dòng)亂事件,西方媒體卻歪曲事實(shí),混淆視聽(tīng),在報(bào)道中出現(xiàn)了極大的偏差,違背了新聞道德,損害了中國(guó)的國(guó)家利益。
四、結(jié)束語(yǔ)
隨著信息技術(shù)的快速發(fā)展,網(wǎng)絡(luò)輿情復(fù)雜多變,傳統(tǒng)的數(shù)據(jù)分析技術(shù)難以奏效。新興的數(shù)據(jù)挖掘技術(shù)能夠?qū)W(wǎng)絡(luò)輿情進(jìn)行關(guān)聯(lián)分析、聚類(lèi)分析、分類(lèi)分析、預(yù)測(cè)分析、序列分析和偏差分析,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)輿情快速準(zhǔn)確的監(jiān)測(cè)、研判和引導(dǎo),取得了較好的效果。
[ 參 考 文 獻(xiàn) ]
[1] 趙新輝,郭瑞.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情智能監(jiān)測(cè)與引導(dǎo)平臺(tái)設(shè)計(jì)研究[J].電腦知識(shí)與技術(shù),2012(1):1-2,4.
[2] 殷衛(wèi)東,朱曉華,趙俊凱.網(wǎng)絡(luò)輿情技術(shù)淺析[J].信息網(wǎng)絡(luò)安全,2012(3):5-9.
[3] 柳勝?lài)?guó).網(wǎng)絡(luò)輿情中的具有影響力個(gè)體信息發(fā)現(xiàn)與WEB日志數(shù)據(jù)挖掘預(yù)處理技術(shù)[J].價(jià)值工程,2012(16):186-187.
[4] 楊永紅.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情研究[D].重慶:重慶大學(xué),2010.
[5] 徐曉日.網(wǎng)絡(luò)輿情事件的應(yīng)急處理研究[J].華中電力大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2007(1):89-93.
[6] 樂(lè)爍.蘭德公司發(fā)展經(jīng)驗(yàn)與對(duì)我國(guó)智庫(kù)建設(shè)的啟示[D].武漢:湖北大學(xué),2013.
[7] 朱毅華,郭詩(shī)云,張超群.網(wǎng)絡(luò)輿情研究中的仿真方法應(yīng)用綜述[J].情報(bào)雜志,2013(10):29-35.
[責(zé)任編輯:陳 明]