來(lái)能燁 汪明艷 周成陽(yáng)
摘要:新冠肺炎疫情暴發(fā)后,網(wǎng)絡(luò)輿情傳播迅速,如何準(zhǔn)確把握輿情傳播熱點(diǎn),引導(dǎo)輿情理性發(fā)展成為一個(gè)重要課題。本文基于生命周期理論,結(jié)合TF-IDF特征詞-權(quán)值模型和隱含狄利克雷分布(LDA)主題模型,研究輿情傳播者在輿情發(fā)展各階段關(guān)注的主題內(nèi)容及演化過(guò)程,為應(yīng)對(duì)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情危機(jī)、精準(zhǔn)監(jiān)測(cè)輿情走向提供相關(guān)決策依據(jù)。
關(guān)鍵詞:突發(fā)公共衛(wèi)生事件;網(wǎng)絡(luò)輿情;主題挖掘;生命周期理論
中圖分類號(hào):G353.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-9436(2021)08-0-03
0 引言
2019年新冠肺炎疫情暴發(fā),成為全球重大突發(fā)公共衛(wèi)生事件,引起了世界各國(guó)人們的高度關(guān)注,數(shù)十億人急切地希望通過(guò)社交媒體獲取疫情相關(guān)信息,在此背景下,與新冠肺炎疫情相關(guān)的話題迅速引發(fā)大量討論。各類造謠、不實(shí)疫情信息在全球化的社交媒體網(wǎng)絡(luò)上泛濫擴(kuò)散,此次疫情催生了第一個(gè)真正意義上社交媒體的“信息疫情”[1]。因此,在積極推進(jìn)疫情防控舉措的同時(shí),有效應(yīng)對(duì)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情傳播以及精準(zhǔn)監(jiān)測(cè)輿情傳播走向也是一項(xiàng)重要工作。
本文以新冠肺炎疫情暴發(fā)期間新浪微博的數(shù)據(jù)為研究對(duì)象,基于生命周期理論,結(jié)合TF-IDF特征詞-權(quán)值模型和隱含狄利克雷分布主題(LDA)模型,分析在輿情傳播周期各階段網(wǎng)民關(guān)注的焦點(diǎn)主題及演化趨勢(shì),刻畫此次疫情網(wǎng)絡(luò)輿情特征,為相關(guān)部門掌握突發(fā)公共衛(wèi)生事件焦點(diǎn)主題、提升政府輿論引導(dǎo)能力提供決策支持。
1 相關(guān)研究
1.1 主題挖掘模型
網(wǎng)絡(luò)輿情中的主題分析是定性研究中較為常見的一種形式,其中最具代表性的是LDA主題模型。王雅靜等學(xué)者提出基于LDA主題模型的微博在線用戶特征預(yù)測(cè)方法,以實(shí)現(xiàn)對(duì)所有用戶的特征預(yù)測(cè)[2]。曹樹金等學(xué)者采用輿情演化分析方法研究網(wǎng)絡(luò)輿情傳播周期各階段的熱點(diǎn)主題和時(shí)序發(fā)展趨勢(shì)[3]。趙凱等學(xué)者通過(guò)“困惑度—主題方差”相結(jié)合的方法改進(jìn)了LDA主題模型最優(yōu)主題數(shù)的確定方法[4]。
1.2 突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情傳播研究
陳璟浩等學(xué)者采用描述性統(tǒng)計(jì)法、列聯(lián)表分析法、回歸分析法等方法,分析突發(fā)公共衛(wèi)生事件中網(wǎng)民關(guān)注度變化,以提高政府信息供給效率[5]。任立肖等學(xué)者將食品安全突發(fā)事件網(wǎng)絡(luò)輿情參與主體分為消費(fèi)人群、有關(guān)部門、網(wǎng)絡(luò)輿情原創(chuàng)者、網(wǎng)絡(luò)輿情旁觀者等9種類型[6]。另有學(xué)者把突發(fā)公共衛(wèi)生事件的利益相關(guān)者分類為醫(yī)療衛(wèi)生部門、傳統(tǒng)媒體、自媒體、普通群眾、易感人群以及患者等6大類。
2 研究設(shè)計(jì)
2019年暴發(fā)的新冠肺炎疫情是一次重大突發(fā)公共衛(wèi)生事件,通過(guò)采集該事件中新浪微博平臺(tái)的相關(guān)數(shù)據(jù),基于LDA主題模型并結(jié)合生命周期理論劃分輿情事件階段,分析輿情傳播各階段中網(wǎng)民關(guān)注的焦點(diǎn)主題及演化特征??傮w研究思路為:首先對(duì)采取的微博數(shù)據(jù)進(jìn)行歸一化處理;其次以生命周期理論為依據(jù)結(jié)合輿情發(fā)展劃分輿情傳播的不同階段;再次利用TF-IDF算法計(jì)算各詞項(xiàng)權(quán)重,通過(guò)LDA主題模型提取相關(guān)主題詞和概率值;最后進(jìn)行網(wǎng)絡(luò)輿情主題內(nèi)容演化和強(qiáng)度演化分析。
3 實(shí)證分析
3.1 數(shù)據(jù)采集與預(yù)處理
本文研究的網(wǎng)絡(luò)輿情事件是2019年末暴發(fā)的新冠肺炎疫情,因?yàn)樵撌录哂休^大的社會(huì)影響,研究疫情期間的網(wǎng)民評(píng)論內(nèi)容有利于分析輿情傳播者情感的演化。新冠肺炎疫情在傳播意義上的突發(fā)期以2020年1月23日武漢采取“封城”措施為標(biāo)志,武漢“封城”后,網(wǎng)絡(luò)輿情呈爆發(fā)態(tài)勢(shì)。2月19日,新華社等國(guó)內(nèi)主流媒體開始陸續(xù)報(bào)道疫情向好的方向發(fā)展,以此為標(biāo)志,新冠肺炎疫情由突發(fā)期過(guò)渡到平穩(wěn)期。筆者編寫Python程序采集新浪微博用戶數(shù)據(jù),設(shè)置“新冠肺炎疫情”為關(guān)鍵詞,時(shí)間范圍設(shè)定為2020年1月23日—2020年2月19日,爬取共計(jì)四周的新浪微博數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再進(jìn)行微博事件文本分析,通過(guò)文本分詞、添加自定義詞匯、添加停用詞典,去掉對(duì)文本分析無(wú)用的停用詞,最終獲得23665條微博內(nèi)容,提取參與社會(huì)網(wǎng)絡(luò)構(gòu)建的用戶3610個(gè)。
3.2 輿情演化階段劃分
按日統(tǒng)計(jì)參與輿情傳播的用戶數(shù),得到傳播者數(shù)量演化趨勢(shì)如圖1所示。利用大連理工大學(xué)中文情感詞匯本體庫(kù)的褒貶義詞匯對(duì)評(píng)論數(shù)據(jù)進(jìn)行情感強(qiáng)度計(jì)算,將輿情用戶每天的情感強(qiáng)度進(jìn)行累加得出群體情感強(qiáng)度,如圖2所示。
通過(guò)對(duì)比發(fā)現(xiàn),網(wǎng)民的輿情傳播行為和情感強(qiáng)度呈正相關(guān)。根據(jù)圖1、圖2中用戶數(shù)量變化和情感強(qiáng)度變化,結(jié)合現(xiàn)有的突發(fā)事件輿情階段劃分[7],現(xiàn)將輿情演化階段劃分為四個(gè)階段。第一階段為輿情形成期(2020年1月23日至1月29日),第二階段為輿情爆發(fā)期(2020年1月30日至2月5日),第三階段為輿情緩解期(2020年2月6日至2月12日),第四階段為輿情平復(fù)期(2020年2月13日至2月19日)。
3.3 主題及階段演化
本文基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法確定文檔語(yǔ)料參數(shù)和主題數(shù)量,在LDA主題模型提取詞匯的基礎(chǔ)上,利用TF-IDF算法計(jì)算各詞項(xiàng)權(quán)重,依據(jù)主題間的相似度最小原則提取各階段網(wǎng)民關(guān)注主題。
通過(guò)對(duì)輿情形成期文本集進(jìn)行主題模型分析,得到7個(gè)主題,每個(gè)主題提取相關(guān)程度最高的10個(gè)詞語(yǔ),計(jì)算其概率值,根據(jù)每一類主題關(guān)鍵詞的特征對(duì)輿情形成階段主題特征歸納總結(jié)如下。
主題1:患者感染新冠病毒后出現(xiàn)發(fā)熱等癥狀,在定點(diǎn)醫(yī)院接受隔離治療。
主題2:各地召開新聞發(fā)布會(huì),公布防疫和救治情況,確保人民群眾生命和健康安全。
主題3:表達(dá)對(duì)抗議一線工作者的贊美、感謝和鼓舞。
主題4:各地醫(yī)院召集醫(yī)務(wù)人員緊急支援武漢。
主題5:愛(ài)心人士為醫(yī)院捐贈(zèng)醫(yī)療物資。
主題6:各地報(bào)告新增確診病例和累計(jì)確診情況。
主題7:防控形勢(shì)嚴(yán)峻,農(nóng)村地區(qū)防控亟待關(guān)注,轉(zhuǎn)發(fā)倡議避免人群聚集。
在輿情形成期,輿情傳播者參與數(shù)較少,隨著初始階段感染病例增加,輿情傳播者對(duì)疫情進(jìn)展的關(guān)注度持續(xù)提升,在網(wǎng)絡(luò)平臺(tái)互相交流,求證最新消息。網(wǎng)絡(luò)輿情主題內(nèi)容大部分集中在輿情事件本身數(shù)據(jù)的統(tǒng)計(jì)和現(xiàn)狀的描述,以及各地官方機(jī)構(gòu)召開新聞發(fā)布會(huì)上。
對(duì)輿情暴發(fā)期文本集進(jìn)行主題模型分析,根據(jù)主題間的相似度最小原則最終得到6個(gè)主題,歸納總結(jié)如下。
主題1:多地每天公布確診病例涉足的場(chǎng)所和小區(qū)。
主題2:各地通報(bào)確診患者治愈出院數(shù)例。
主題3:不準(zhǔn)確的信息和謠言時(shí)有出現(xiàn),發(fā)布頭條文章呼吁不信謠、不傳謠。
主題4:社區(qū)一線在防控指揮部統(tǒng)一調(diào)度下,科學(xué)有序參與疫情防控工作。
主題5:《新英格蘭醫(yī)學(xué)雜志》刊登新論文,作者主要來(lái)自中國(guó)疾病預(yù)防控制中心、湖北疾病預(yù)防控制中心和香港大學(xué)等機(jī)構(gòu)。
主題6:網(wǎng)民通過(guò)多種創(chuàng)作形式為中國(guó)加油。
隨著輿情事件的不斷演化,大量輿情傳播者涌入,評(píng)論數(shù)量大幅度增長(zhǎng),人們對(duì)輿情事件的關(guān)注度急速上升,輿論進(jìn)入白熱化階段。除了關(guān)注疫情傳播現(xiàn)狀外,輿情關(guān)注主題逐漸轉(zhuǎn)向“早期人傳人跡象”和“科研發(fā)表風(fēng)波”。中國(guó)疾病預(yù)防控制中心等機(jī)構(gòu)發(fā)表在《新英格蘭醫(yī)學(xué)雜志》的一篇論文引起了軒然大波,輿情傳播者質(zhì)疑中國(guó)疾病預(yù)防控制中心何時(shí)發(fā)現(xiàn)病毒有“人傳人”跡象。值得注意的是,謠言在這一階段逐漸傳播開來(lái),同時(shí)相應(yīng)的辟謠信息也開始出現(xiàn)。
對(duì)輿情緩解期文本集進(jìn)行主題模型分析,根據(jù)主題間的相似度最小原則最終得到5個(gè)主題,歸納總結(jié)如下。
主題1:向所有奮戰(zhàn)在一線的工作人員致敬。
主題2:新加坡總理李顯龍談病毒——如果致死率能與流感保持一致,或會(huì)改變應(yīng)對(duì)策略。
主題3:新冠肺炎疫情是公共衛(wèi)生事件,不是國(guó)家和種族之間的問(wèn)題。
主題4:在新冠肺炎疫情防控期間穩(wěn)定勞動(dòng)關(guān)系,支持企業(yè)復(fù)工復(fù)產(chǎn)。
主題5:通報(bào)疫情最新動(dòng)態(tài),如累計(jì)病例、治愈信息等。
在這一階段,用戶參與數(shù)有所減少,輿情事件的討論度下降,但網(wǎng)民情感強(qiáng)度依舊處于較高水平。在媒體和意見領(lǐng)袖的引導(dǎo)下,網(wǎng)民關(guān)注于以鐘南山、李蘭娟院士為代表的“抗疫英雄”,以及各地醫(yī)護(hù)人員奉獻(xiàn)精神所產(chǎn)生的正能量。官方發(fā)布最新信息,媒體及時(shí)報(bào)道疫情防控工作,使得防控信息覆蓋面擴(kuò)大,同時(shí)政府加大網(wǎng)絡(luò)謠言整治力度,網(wǎng)民的信息接收度逐漸飽和,輿情傳播者不斷增強(qiáng)自我防病意識(shí)和社會(huì)信心,除了繼續(xù)關(guān)注疫情影響及現(xiàn)狀,還增加了對(duì)國(guó)外疫情的關(guān)注。
對(duì)輿情平復(fù)期文本集進(jìn)行主題模型分析,根據(jù)主題間的相似度最小原則最終得到9個(gè)主題,歸納總結(jié)結(jié)果如下。
主題1:康復(fù)病人捐獻(xiàn)血漿,這是目前治療病毒感染的最有效的方法。
主題2:確診病例患者治愈出院的情況。
主題3:新聞發(fā)布會(huì)介紹防控工作和醫(yī)療隊(duì)援助工作的相關(guān)情況,并回答記者提問(wèn)。
主題4:鐘南山院士接受采訪。
主題5:基于近期情況及采取的措施,新增感染人數(shù)逐步減少,疫情有望結(jié)束。
主題6:企業(yè)做好疫情防控,推動(dòng)復(fù)工復(fù)產(chǎn)。
主題7:專家告訴大家特殊時(shí)期應(yīng)如何調(diào)整心理狀態(tài)。
主題8:各地防控指揮部、紅十字會(huì)發(fā)放捐贈(zèng)物資公示。
主題9:各地實(shí)行外出人員申報(bào)健康證明臨時(shí)措施,提供免費(fèi)健康證明服務(wù)。
在輿情平復(fù)期,輿情傳播者的注意力和興趣發(fā)生轉(zhuǎn)移,轉(zhuǎn)向?qū)?fù)工復(fù)產(chǎn)的討論以及鐘南山院士講話。隨著更多疫情防控細(xì)節(jié)被公開,相關(guān)事件被逐步理清,以及疫情好轉(zhuǎn)和經(jīng)濟(jì)的逐步恢復(fù),輿情傳播者對(duì)突發(fā)公共衛(wèi)生事件的判斷逐漸歸于理性,輿情傳播者的情緒狀態(tài)在慢慢地平復(fù)。
3.4 突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情治理建議
通過(guò)研究發(fā)現(xiàn),社交媒體上公眾對(duì)疫情防控、民生保障的關(guān)注僅次于對(duì)疫情風(fēng)險(xiǎn)的認(rèn)知和社會(huì)心態(tài)調(diào)整的關(guān)注。因此,有關(guān)部門除了及時(shí)公布疫情最新進(jìn)展,提高信息透明度,滿足公眾信息需求,也要關(guān)注民生保障措施的落實(shí)。在重大突發(fā)公共衛(wèi)生事件中,政府不能因充當(dāng)全方位的輿情防控角色而忽視輿情傳播者在輿情治理中的關(guān)鍵作用,應(yīng)利用社交媒體平臺(tái)引導(dǎo)公眾自發(fā)參與疫情防控工作,從而與公眾形成平衡化的網(wǎng)絡(luò)輿情防控共同體。及時(shí)掌握輿情傳播者不同階段的關(guān)注主題,從認(rèn)知、行為、情感等多角度引導(dǎo)他們參與輿情治理。一方面,政府可以從信息源著手,做好權(quán)威信息發(fā)布,消除信息不對(duì)稱。若未及時(shí)發(fā)現(xiàn)輿情關(guān)注主題熱點(diǎn),發(fā)布的信息不能解決公眾疑慮,可能使輿情事件愈演愈烈,引發(fā)謠言。政府要針對(duì)公眾的核心訴求,進(jìn)行妥善解答和回應(yīng),牢牢把握話語(yǔ)權(quán),消除公眾心中的不確定性,降低因公眾情緒傳播而產(chǎn)生的輿情風(fēng)險(xiǎn)。另一方面,政府要做好網(wǎng)絡(luò)輿情熱點(diǎn)主題監(jiān)測(cè),判斷、預(yù)測(cè)并及時(shí)預(yù)警主題內(nèi)容演變趨向。網(wǎng)絡(luò)輿情事件爆發(fā)前都會(huì)有一定的征兆,政府及相關(guān)部門應(yīng)形成一套涵蓋疫情預(yù)警、疫情應(yīng)對(duì)和疫情消解的處理機(jī)制,利用現(xiàn)代信息網(wǎng)絡(luò)技術(shù),實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)輿論動(dòng)態(tài),發(fā)現(xiàn)敏感信息,
4 結(jié)語(yǔ)
本文以2019年新冠肺炎疫情為具體案例,結(jié)合生命周期理論和LDA主題模型挖掘輿情傳播周期中各階段下網(wǎng)民關(guān)注的焦點(diǎn)主題,并分析主題內(nèi)容演化特征,目的在于為政府信息公開、應(yīng)對(duì)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情危機(jī)提供建議。由于各種原因,本文的研究還存在兩點(diǎn)不足,第一,LDA主題模型抽取的特征詞不夠貼合主題,未能挖掘更深入細(xì)致的有效信息;第二,輿情發(fā)展階段沒(méi)有針對(duì)突發(fā)公共衛(wèi)生事件的特性細(xì)分展開。
參考文獻(xiàn):
[1] 徐劍,錢燁夫.“信息疫情”的定義、傳播及治理[J].上海交通大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2020,28(05):121-134.
[2] 王雅靜,郭強(qiáng),鄧春燕,等.基于LDA主題模型的用戶特征預(yù)測(cè)研究[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2020,17(04):9-15.
[3] 曹樹金,岳文玉.突發(fā)公共衛(wèi)生事件微博輿情主題挖掘與演化分析[J].信息資源管理學(xué)報(bào),2020,10(06):28-37.
[4] 趙凱,王鴻源. LDA最優(yōu)主題數(shù)選取方法研究:以CNKI文獻(xiàn)為例[J].統(tǒng)計(jì)與決策,2020,36(16):175-179.
[5] 陳璟浩,陳美合,曾楨.突發(fā)公共衛(wèi)生事件中中國(guó)網(wǎng)民關(guān)注度分析——基于新冠肺炎網(wǎng)絡(luò)輿情數(shù)據(jù)[J].現(xiàn)代情報(bào),2020(10):11-21.
[6] 任立肖,張亮.食品安全突發(fā)事件網(wǎng)絡(luò)輿情的分析模型——基于利益相關(guān)者的視角[J].圖書館學(xué)研究,2014(01):65-70.
[7] 謝耘耕,榮婷.微博輿論生成演變機(jī)制和輿論引導(dǎo)策略[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2011(05):70-74.
作者簡(jiǎn)介:來(lái)能燁(1994—),女,浙江杭州人,碩士在讀,研究方向:信息管理。
汪明艷(1975—),女,吉林吉林人,博士,教授,研究方向:電子商務(wù)、數(shù)據(jù)分析、輿論治理。
周成陽(yáng)(1995—),男,上海人,碩士在讀,研究方向:信息管理。