牟馨憶 陳亞寧
摘 ?要 ?隨著互聯(lián)網(wǎng)技術的發(fā)展,微博、微信、知乎等社交平臺成為廣大網(wǎng)民針對現(xiàn)實生活中的熱點、焦點問題表達觀點和情感的地方。網(wǎng)絡對社會監(jiān)督起到重要作用,認識和分析網(wǎng)絡輿情事件的演化,能夠發(fā)現(xiàn)輿情發(fā)展的潛在風險,避免群眾的過激行為。以杭州女童失蹤案為例,選擇知乎作為研究平臺,使用網(wǎng)絡輿情“六階段”模型,結合“百度指數(shù)”可視化工具進行發(fā)展階段劃分。通過爬蟲、關鍵詞提取、主題聚類等方法獲得每個階段公眾關注的主題,分析這一網(wǎng)絡輿情事件的演化,了解其產(chǎn)生的效應并提出建議。
關鍵詞 ?網(wǎng)絡輿情;輿情演化;突發(fā)事件
中圖分類號 ?G2 ? ? ?文獻標識碼 ?A ? ? ?文章編號 ?2096-0360(2019)16-0020-04
1 ?背景
隨著互聯(lián)網(wǎng)技術的發(fā)展和完善,網(wǎng)絡成為人們生活中不可缺少的部分,網(wǎng)絡輿情也逐漸在社會輿情中占據(jù)重要地位。由于網(wǎng)絡的虛擬性和開放性,網(wǎng)絡輿情的傳播存在反復波動的特點[1]。公眾的討論內(nèi)容往往隨時間變化,輿情演化的每個階段呈現(xiàn)不同的特點。這是由于剛開始人們獲取的信息是不完整、不全面的,隨著相關人員介入調(diào)查,更多真相公布于世人面前,人們能挖掘出更多信息,而其中不乏與最初的報道相悖的,網(wǎng)絡輿情的焦點也會隨之轉移。
隨著微博、微信等App的廣泛應用,網(wǎng)絡輿情的傳播變得越來越迅速,用戶的觀點和情感不僅能夠影響輿情的傳播速度,還能感染其他用戶的情緒導致輿論的爆發(fā)[2-3]。研究網(wǎng)絡輿情事件的演化過程,能夠幫助公眾更清晰、全面地了解整個事件的真相,對于突發(fā)事件的應急管理和輿情引導具有重要意義。
2 ?相關研究
不同學者對輿情演化的階段有不同的看法。目前的研究主要有兩個角度:一是基于關鍵詞分析,通過分析關鍵詞的變化來了解整個事情發(fā)酵的過程;二是考慮時序特征,按時間軸劃分固定階段,對各段文本進行分析,再進行合并[4]。對于階段的劃分,不同的學者也選擇了不同的指標。目前,大多數(shù)文獻把話題的生存周期描述為三個階段:產(chǎn)生(提出)→發(fā)展(熱議)→消退(趨冷)[1]。微博數(shù)量和轉發(fā)、評論量是許多學者關注的指標,蔣知義[5]等人依據(jù)微博數(shù)量將輿情事件劃分為5個階段。油永華[6]則依據(jù)關注度和關注度增量兩個指標,將網(wǎng)絡輿情發(fā)展階段分成三個階段。崔鵬[7]等建立了輿情發(fā)展生命周期“六階段”模型,并根據(jù)演化特點設置了5個關鍵點。
3 ?輿情事件演化分析
3.1 ?研究方法
本文基于網(wǎng)絡爬蟲和主題提取等方法,對突發(fā)事件在網(wǎng)絡平臺上的主題演化進行研究。本文選擇知乎作為研究的網(wǎng)絡平臺,選擇杭州女童失蹤案進行分析,爬取用戶對于事件的觀點,進行主題抽取,把握輿情演變規(guī)律,提出有針對性的輿情管理建議。
1)網(wǎng)絡爬蟲。網(wǎng)絡爬蟲能夠按照一定的規(guī)則,自動爬取網(wǎng)絡上的數(shù)據(jù)。本文使用Gooseeker網(wǎng)絡爬蟲軟件,編寫規(guī)則對知乎上相關問題的回答進行抓取。選擇了“如何看待杭州千島湖9歲女童被租客帶走,且租客后續(xù)自殺一事?”等幾個知乎話題,爬取問題下面網(wǎng)友的回答、用戶名、時間等信息。
2)關鍵詞獲取。TF-IDF是一種統(tǒng)計方法,TF是詞頻,IDF是逆文檔頻率,TF-IDF能夠評估一個詞對一個文檔的重要程度。其主要思想是:一個詞在一個文檔中出現(xiàn)頻率高,而在其他文檔中出現(xiàn)頻率低,則這個詞具有很好的區(qū)分能力,能夠體現(xiàn)該文檔的特點。
3)主題抽取。本文采用Word2Vec+Kmeans的方法訓練聚類主題。對于主題提取這個任務來說,對關鍵詞聚類是一種合理的方法。Word2Vec是一種利用神經(jīng)網(wǎng)絡將詞進行向量化的工具。得到詞向量后,可以基于詞向量之間的距離或者相似度來進行聚類,從而獲得聚類主題。
3.2 ?研究流程
本文的研究流程如圖1所示,包含數(shù)據(jù)獲取、數(shù)據(jù)預處理、輿情演變分析、可視化分析4個階段。
4 ?杭州女童失蹤案演化分析
4.1 ?數(shù)據(jù)獲取及預處理
微博、微信等平臺除了有網(wǎng)民的觀點表達以外,還有大量的媒體對事件的報道和相關新聞,存在一定的干擾,而知乎全是網(wǎng)友的觀點表達和看法分析,所以本文選擇了知乎作為研究平臺。選擇“如何看待杭州千島湖9歲女童被租客帶走,且租客后續(xù)自殺一事?”“杭州9歲女童失蹤事件透著哪些不合理之處?”“杭州千島湖9歲失聯(lián)女童遺體被找到,案件真相如何?”這幾個問題,爬取問題下面的所有回答,一共獲得數(shù)據(jù)7 582條。爬取的維度包括用戶名、回答內(nèi)容、回答時間、贊同人數(shù)等。獲得數(shù)據(jù)后需要對重復和缺失數(shù)據(jù)、無關數(shù)據(jù)等進行刪除,處理后剩余數(shù)據(jù)7 576條。
4.2 ?主題演化分析
本文根據(jù)杭州女童失蹤案事件的性質(zhì)和特點,采用崔鵬[7]等提出的輿情演化的六階段模型進行分析,采用Word2Vec+Kmeans進行主題聚類,對六階段模型進行話題的分析。
本文使用“百度指數(shù)”這一可視化工具來進行分析。通過“百度指數(shù)”搜索2019年7月1日至2019年8月1日期間關鍵詞“杭州女童”的情況,對結果進行描述分析,總結該事件的輿情傳播階段特征。搜索指數(shù)的結果顯示7月10日前沒有此事件的搜索,而實際上7月8日開始已有網(wǎng)友在其他平臺討論這個事件,這是知乎、微博等平臺的某些討論內(nèi)容沒有進入到百度指數(shù)的統(tǒng)計中導致的,于是本文考慮了其他平臺的討論后對此模型的時間進行了修正。
結合“百度指數(shù)”的可視化結果和崔鵬等學者提出的輿情演化六階段模型,此次事件的生命周期過程可以表示為圖2。依據(jù)時間把爬取的語料進行劃分,使用TF-IDF算法為每個階段篩選出100個關鍵詞,手動刪除其中的無關詞,用Word2vec訓練詞向量后,使用Kmeans對詞向量進行聚類后通過歸納得到各階段主題,如表1。由于Kmeans聚類需要提前確定聚類數(shù),可用Bcubed精度和召回率等外在方法和輪廓系數(shù)等內(nèi)在方法來評估不同聚類數(shù)時的聚類質(zhì)量,以確定最優(yōu)聚類數(shù)。本文為了本文為了簡單并能夠說明主要內(nèi)容,對每個階段都選擇聚類數(shù)3為例來進行實驗。
醞釀階段:此事件的嫌疑人兩名租客在6月29日進入女童家中,預謀將女童帶走,在7月8日前該事件并未在網(wǎng)絡上曝光。7月8日淳安縣公安接到女童父親報案,公安和救援人員動身。這個階段的信息披露還不多,可以歸為該事件的醞釀階段。
爆發(fā)階段:兩名租客在寧波東錢湖自殺身亡而女童仍未找到是本次事件的危機點。事件由此進入爆發(fā)階段。女童祖父母同意租客將孩子帶走的原因被披露,女童父母婚姻關系信息曝光,租客帶走女童的動機疑點重重,女童失蹤的原因在網(wǎng)絡上引起熱議。
擴散階段:爆發(fā)點在7月12日,此時女童仍未被找到但搜尋到了其市民卡的線索,案情相關監(jiān)控視頻曝光,犯罪嫌疑人兩名租客的基本信息、活動軌跡以及抖音等社交賬號也被披露。從爆發(fā)階段開始該事件也在不斷的進行擴散,影響也在不斷的擴大。最典型的是犯罪嫌疑人兩名租客的相關信息曝光表明其疑似崇拜“三山國王”,這引起了眾多網(wǎng)友的指責和猜想,公眾開始懷疑嫌疑人動機的不合理之處,網(wǎng)友紛紛提出自己的見解,認為這與非法宗教組織有關而非普通的拐騙拐賣。輿情發(fā)酵達到第一個峰值。
反復階段:此次事件的反復階段伴隨著越來越多的信息補充,使得真相逐漸浮出水面。相關新聞媒體報道女童父親與租客的聯(lián)系、與女兒的通話內(nèi)容,女童祖父母得知噩耗后的悲痛,女童遺體被發(fā)現(xiàn)等重要信息再次引起輿論的爆發(fā)。
消退階段:隨著警方發(fā)布此次案件的警情通報,警方回答了公眾對該事件嫌疑人自殺動機、兩人殺害女童的動機等六大疑問,關于此事件的輿情才逐漸消退。這個階段公眾的關注重點是反思家長對兒童安全的監(jiān)管問題,同時呼吁社會關注留守兒童的生活和安全防范教育,避免類似悲劇再次發(fā)生。
長尾階段:在案件調(diào)查結束后,此次事件的熱度基本消退。有部分與女童接觸過的網(wǎng)友在知乎等平臺分享與女童及其祖父母的相處經(jīng)歷,也有部分當?shù)鼐W(wǎng)友分享當?shù)厝说纳L環(huán)境和淳樸性格,解開了部分網(wǎng)友對女童祖父母的誤解,網(wǎng)友均表達對女童家人的同情和祝福。
4.3 ?可視化分析
使用“百度指數(shù)”工具對輿論主體搜索用戶進行用戶畫像分析。
從搜索用戶的地域分布來看,搜索較高的用戶集中于廣東和浙江兩個省份。這兩個省份均與本輿情事件有緊密聯(lián)系。一方面,從事件發(fā)生的地點來看,失聯(lián)女童來自杭州千島湖,也是從此地被租客帶走,這樣的突發(fā)事件必然牽動著當?shù)厝说男摹6捎诖舜问录奶厥庑?,帶走女童的租客反常地帶女童到浙江、福建、廣東多個省份的海域,網(wǎng)絡爆料的其曾發(fā)布的相關照片和視頻,成為了尋找女童的線索,許多網(wǎng)友擴散信息,致使這一事件在這些地區(qū)迅速升溫。此外,兩名租客均來自廣東,且在此次輿情事件的擴散階段爆出租客疑似信奉廣東潮州等地的“三山國王”,有網(wǎng)友由此猜測此次事件與宗教信仰有關,也有當?shù)氐木W(wǎng)友解釋這僅是當?shù)卣5拿耖g信仰而非邪教,再次激發(fā)了輿論,使廣東省的討論熱度上升。
從搜索用戶的人群屬性來看,關注此事件的用戶年齡集中在30~49歲的中年人,性別差異不大。一方面,相比于年輕人,這個年齡段的用戶更加關注社會事件而非娛樂熱點;另一方面,這個年齡段的用戶大多正是為人父母的階段,杭州女童失蹤一案牽動著他們的心,也給他們對待兒童的安全問題敲響了警鐘。
5 ?建議
杭州女童失蹤案這一網(wǎng)絡熱點事件不僅給公眾對兒童安全防范帶來了警示,其中的輿情發(fā)酵也值得思考。反轉新聞、謠言傳播等都是在輿情發(fā)展中需要關注和控制的。針對這些問題,本文提出以下建議:
1)官方媒體和意見領袖要預防謠言的散播。本次事件中有部分自媒體用戶和網(wǎng)友針對不完全的信息就指責女童的祖父母不愛孩子、虐待孩子、重男輕女,并誤導了其他網(wǎng)友在網(wǎng)絡上對女童祖父母破口大罵。這不僅對案件調(diào)查毫無幫助,甚至給受害者家庭帶來了二次傷害。在這個網(wǎng)絡時代,“大V”或者營銷號等擁有影響力的用戶應該意識到自身的責任,不輕易散布未經(jīng)證實的消息。
2)普通民眾要做到不信謠、不傳謠,不要依靠不完整的視頻片段或者網(wǎng)友的猜測就著急“站隊”,要做到“耳聽八方”,對官方媒體保持信任。
參考文獻
[1]陳福集,馬梅蘭.網(wǎng)絡輿情事件的話題演化分析[J].情報雜志,2016,35(5):58-64.
[2]紀雪梅.特定事件情境下中文微博用戶情感挖掘與傳播研究[D].天津:南開大學,2014.
[3]張鵬,蘭月新,李昊青,等.基于HAYASHI數(shù)量化理論的網(wǎng)絡謠言分類應對策略分析[J].情報雜志,2016,35(1):110-115.
[4]任中杰,張鵬,李思成,等.基于微博數(shù)據(jù)挖掘的突發(fā)事件情感態(tài)勢演化分析[J].情報雜志,2019,38(2):140-148.
[5]蔣知義,馬王榮,鄒凱,等.基于情感傾向性分析的網(wǎng)絡輿情情感演化特征研究[J].現(xiàn)代情報,2018,38(4):50-57.
[6]油永華.大數(shù)據(jù)環(huán)境下網(wǎng)絡輿情發(fā)展階段分析[J].價值工程,2017(35):177-180.
[7]崔鵬,張巍,何毅,等.突發(fā)公共事件網(wǎng)絡輿情演化及政府應對能力研究[J].現(xiàn)代情報,2018(2):75-83.