摘 要:文章構(gòu)建以輿情客體為核心的突發(fā)事件網(wǎng)絡輿情事件圖譜,旨在呈現(xiàn)輿情客體與輿情本體之間的關(guān)聯(lián)關(guān)系,支撐以風險防范化解與應急管理為導向的突發(fā)事件網(wǎng)絡輿情監(jiān)測與治理。首先,考慮到網(wǎng)絡輿情信息的多樣性、模糊性,設計突發(fā)事件網(wǎng)絡輿情事件圖譜的結(jié)構(gòu),將其劃分為輿情主體層、輿情本體層和輿情客體層,并提出網(wǎng)絡輿情事件圖譜的構(gòu)建流程和方法;其次,探索網(wǎng)絡輿情事件圖譜的應用場景,提出一系列基于事件圖譜的網(wǎng)絡輿情演化分析方法;最后,以2023年涿州暴雨為例開展實證研究,構(gòu)建了涿州暴雨災害事件的網(wǎng)絡輿情事件圖譜,并基于事件圖譜分析網(wǎng)絡輿情的演化過程,梳理了關(guān)鍵事件的發(fā)展趨勢。研究表明:網(wǎng)絡輿情事件圖譜能夠有效描述輿情主體、輿情本體和輿情客體及其間關(guān)聯(lián),描述網(wǎng)絡輿情的演化趨勢,呈現(xiàn)風險建構(gòu)的關(guān)鍵節(jié)點,揭示關(guān)鍵事件的次生風險和衍生風險,為面向突發(fā)事件應急管理的網(wǎng)絡輿情治理提供新的視角和參考依據(jù)。
關(guān)鍵詞:網(wǎng)絡輿情;事件圖譜;突發(fā)事件;應急管理;輿情客體
中圖分類號:G206 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2024044
Research on the Construction and Application of the Online Public Opinion Event Graph of Emergency Events
Abstract The construction of an emergency online public opinion event graph, centered on the public opinion object, aims to illustrate the correlations between the public opinion object and public opinion ontology. This supports the monitoring and governance of emergency online public opinion, focusing on risk prevention, mitigation, and emergency management. Firstly, considering the diversity and ambiguity of online public opinion information, we design the structure of an online public opinion event graph for emergencies. This structure is divided into the public opinion subject layer, public opinion ontology layer, and public opinion object layer, and we propose the construction process and method for the online public opinion event graph. Secondly, we explore the application scenarios of the online public opinion event graph and introduce a series of online public opinion evolution analysis methods based on the event graph. Finally, an empirical study is conducted on the Zhuozhou rainstorm of 2023, constructing the online public opinion event graph for the Zhuozhou rainstorm disaster and analyzing the evolution process of online public opinion using the event graph to delineate the development trends of key events. The study demonstrates that the online public opinion event graph effectively describes the subjects, ontology, and objects of public opinion and their interconnections, presents the evolution trend of online public opinion, identifies key nodes of risk construction, and reveals secondary and derivative risks of key events. This provides new perspectives and reference bases for the governance of online public opinion in the context of emergency management.
Key words online public opinion; event graph; emergencies; emergency management; public opinion objects
在媒介化社會的背景下,現(xiàn)實世界與網(wǎng)絡空間的虛實融合促使突發(fā)事件與網(wǎng)絡輿情之間的相互作用越來越強,任何重大突發(fā)事件的發(fā)生都會引發(fā)網(wǎng)絡輿情[1]。人類不僅要面對突發(fā)事件的原生風險,還要應對處理網(wǎng)絡輿情帶來的次生風險[2]。網(wǎng)絡輿情作為風險建構(gòu)的場域,一方面可以賦能突發(fā)事件的風險溝通、應急救援和應急恢復,提升公眾的風險意識和自救互救能力[3];另一方面也可能導致突發(fā)事件的社會風險放大,進而引發(fā)信息疫情和次生事件[4]。因此,在突發(fā)事件情境下,網(wǎng)絡輿情的監(jiān)測與治理應以防范化解重大風險和賦能突發(fā)事件的應急管理為目標導向。
網(wǎng)絡輿情演化過程的全景呈現(xiàn)是輿情治理的基礎(chǔ),現(xiàn)有研究從輿情傳播、主題演化、情感演化、演化周期等方面出發(fā),提出了一系列演化分析方法。特別是對突發(fā)事件網(wǎng)絡輿情的研究,學者們通過主題識別和情感分析,梳理主題的分布情況以及情感的演化趨勢;通過主題聚類圖譜和社會網(wǎng)絡分析,提煉主題和情感在輿情主體之間的傳播模式[5];依托網(wǎng)絡輿情事理圖譜,從事理邏輯的維度揭示網(wǎng)絡輿情的演化路徑。然而,突發(fā)事件網(wǎng)絡輿情分析不能局限于輿情本體和輿情主體,還需要聚焦輿情客體,呈現(xiàn)公眾對突發(fā)事件風險的認知景觀,特別是他們對不同災害事件、受災情況以及救援行動的態(tài)度和情感傾向,進而讓網(wǎng)絡輿情治理服務于突發(fā)事件的風險溝通與應急管理。
基于此,本研究創(chuàng)新性地以突發(fā)事件應急管理為導向,以事件為中心組織網(wǎng)絡輿情信息,構(gòu)建網(wǎng)絡輿情事件圖譜,開展輿情本體與輿情客體的關(guān)聯(lián)分析,全面呈現(xiàn)公眾對突發(fā)事件的認知和情緒動態(tài)。具體擬解決以下三個問題:(1)如何利用事件圖譜來關(guān)聯(lián)輿情本體、輿情主體和輿情客體;(2)如何構(gòu)建突發(fā)事件網(wǎng)絡輿情事件圖譜;(3)如何基于事件圖譜開展網(wǎng)絡輿情演化分析。
1 研究綜述
1.1 突發(fā)事件網(wǎng)絡輿情
突發(fā)事件網(wǎng)絡輿情是公眾在網(wǎng)絡空間內(nèi)對自己關(guān)心或利益相關(guān)的公共事務所持有的多種情緒、意愿、態(tài)度以及意見的總和[6]。同突發(fā)事件的孕育、爆發(fā)、蔓延與恢復一樣,突發(fā)事件網(wǎng)絡輿情的演化也會經(jīng)歷一個完整的生命周期,其演化過程呈現(xiàn)顯著的階段性特征[7]。依據(jù)輿情熱度的變化趨勢,突發(fā)事件網(wǎng)絡輿情的演化可以劃分為形成、高潮和消散三個階段[8],或起始、爆發(fā)、蔓延和衰退四個階段[9]。其中,社會安全事件和公共衛(wèi)生事件的網(wǎng)絡輿情經(jīng)常表現(xiàn)為“形成-爆發(fā)-消散”三階段的多次循環(huán),呈現(xiàn)“多峰”特征[8]。安璐和吳林進一步依據(jù)峰值數(shù)量來劃分突發(fā)事件公共衛(wèi)生事件的演化階段[10]。網(wǎng)絡輿情形成與演化是一個多元、復雜的動態(tài)系統(tǒng),突發(fā)事件是網(wǎng)絡輿情形成的重要現(xiàn)實根源,輿情主體、客體、本體和媒體是網(wǎng)絡輿情形成與演化的關(guān)鍵因素[11]。其中,輿情主體是在網(wǎng)絡空間表達觀點、情緒的主體;輿情客體是網(wǎng)絡輿情的現(xiàn)實根源,是引發(fā)網(wǎng)絡輿情的刺激物;輿情本體就是網(wǎng)絡輿情信息,是網(wǎng)民的情緒、意愿、態(tài)度等的總和。
1.2 網(wǎng)絡輿情演化研究現(xiàn)狀
突發(fā)事件網(wǎng)絡輿情的演化分析主要圍繞演化階段、輿情本體和輿情主體三個維度[5]。具體而言,早期研究側(cè)重于輿情演化的時序分析,以及傳播路徑和傳播動力學的分析。一方面,通過案例研究方法,解構(gòu)輿情演化的各個階段,歸納輿情傳播的關(guān)鍵路徑,探索網(wǎng)絡輿情的演化模式[8];另一方面,采用仿真模擬方法,分析網(wǎng)絡輿情的動態(tài)演化過程,利用演化博弈揭示輿情主體之間的作用機制[12],采用傳播動力學分析和預測網(wǎng)絡輿情的演化趨勢[13]。隨著自然語言處理技術(shù)的發(fā)展,相關(guān)研究開始聚焦輿情本體的演化分析,包括主題識別、情感分析、主題演化分析等。主題識別可以有效捕捉媒體議程和公眾議程,LDA(Latent Dirichlet Allocation)是最受歡迎的輿情主題識別方法,但它并不適用于短文本的聚類任務。因此,學者們提出了一系列基于詞向量的主題識別與主題發(fā)現(xiàn)方法,包括Word2vec、BERTopic[14]等。主題演化分析主要是跟蹤熱點主題的演化趨勢,分析熱點主題在不同演化階段的分布情況,從而呈現(xiàn)輿情焦點的轉(zhuǎn)移路徑及輿論的演化過程[15]。情感分析則主要是計算帖子的情感傾向,分析網(wǎng)絡輿情和熱點話題的情感分布情況,呈現(xiàn)公眾情緒的變化過程。
值得注意的是,現(xiàn)有網(wǎng)絡輿情演化研究傾向開展演化階段、輿情本體和輿情主體的關(guān)聯(lián)分析,融合多維度特征來描述網(wǎng)絡輿情的演化過程。一方面,將輿情本體與輿情主體關(guān)聯(lián),利用主題聚類圖譜描述輿情主題與輿情主體之間的關(guān)聯(lián)關(guān)系[16],利用情感圖譜實現(xiàn)輿情主體與輿情情感傾向的關(guān)聯(lián)分析[17];另一方面,將演化階段、輿情主題、輿情情感關(guān)聯(lián),分階段梳理輿情主題-情感的分布情況[18]。然而,上述研究側(cè)重于呈現(xiàn)輿情信息的分布情況和演化趨勢,無法直接揭示公眾對不同災害事件和應急管理措施的情緒、態(tài)度與意見。
1.3 事件表示模型概述
知識表示就是一種代理[13],傳統(tǒng)的知識表示側(cè)重于描述客觀事物的靜態(tài)特征。以事件為中心的知識表示更加符合人類的認知模式,能夠更好地描述人類的行為模式和社會的發(fā)展規(guī)律[19]。因此,學者們提出了事件模式、事件本體、事件圖譜等以事件為中心的知識表示模型。事件模式可以描述事件的關(guān)鍵特征,事件本體則可以進一步表示事件之間的關(guān)系,但是它們都依賴于專家知識。鑒于此,學界開始探索自下而上的事件表示方法,并基于事件抽取技術(shù),構(gòu)建以事件為中心的知識圖譜。具體而言,Glava?觢和?譒najder率先提出了事件圖譜的概念[20];Rospocher等進一步提出了一種以事件為中心的知識圖譜,其節(jié)點是事件和實體,邊包含事件-實體關(guān)系、事件-事件關(guān)系以及實體之間的關(guān)系[21]。事件圖譜是結(jié)構(gòu)化的語義知識庫,是一種以事件為中心的知識表示模型,其將現(xiàn)實世界的事件、實體、事件特征和實體特征表示為節(jié)點,并用邊代表事件、實體、屬性之間的關(guān)聯(lián)。旨在集成具象的事件信息,刻畫現(xiàn)實事件的演化過程,同時描述抽象的事理知識,揭示事件演化規(guī)律[22],進而服務于安全態(tài)勢感知,并為管理決策提供情報支撐[23]。
1.4 面向應急管理的事件圖譜構(gòu)建方法
事件圖譜構(gòu)建是在事件表示模型語義指導下,從非結(jié)構(gòu)化文本中提取事件、事件論元等事件信息及知識關(guān)聯(lián),并將這些信息存儲于圖數(shù)據(jù)庫[23]。這一過程主要包括四個關(guān)鍵任務:事件抽取、事件關(guān)系抽取、事件共指消歧和事件論元補全[24]。其中,事件抽取可以進一步劃分為限定域事件抽取和開放域事件抽取。前者是在既定事件類型和論元角色的基礎(chǔ)上,識別觸發(fā)詞和事件論元;后者則是在沒有預定義事件模式的情況下,從文本中檢測新的或意外的事件。事件關(guān)系抽取則可以劃分為關(guān)系抽取、關(guān)系識別和序列標注,抽取的關(guān)系類型主要包括因果關(guān)系、時序關(guān)系、共指關(guān)系和子事件關(guān)系[25]。事件共指消歧是將描述同一現(xiàn)實事件的不同事件提及關(guān)聯(lián)起來。事件論元補全則是聚焦現(xiàn)有事件,補充其缺失的論元信息和論元角色。
目前,學者們已經(jīng)將知識圖譜、事理圖譜和事件圖譜應用于應急信息的組織與分析。一方面,聚焦突發(fā)事件、金融風險事件和國家安全事件,利用知識圖譜挖掘和組織應急知識[26];使用事件圖譜集成事件信息,呈現(xiàn)事件的演化過程[23];依托事理圖譜,揭示事件演化模式[27]。另一方面,聚焦突發(fā)事件網(wǎng)絡輿情,利用輿情事理圖譜描述網(wǎng)絡輿情的演化過程,反映突發(fā)事件的演化趨勢[28],使用事件圖譜描述公眾的風險認知,呈現(xiàn)社會風險的演化過程[22]。然而,現(xiàn)有事件圖譜模型主要圍繞風險事件的事實信息,無法直接用于輿情信息的組織與分析。同時,目前缺乏領(lǐng)域事件圖譜構(gòu)建的統(tǒng)一框架和體系化方法。因此,亟需構(gòu)建面向應急管理的網(wǎng)絡輿情事件圖譜表示模型,提出事件圖譜構(gòu)建的體系化方法。
2 研究設計
突發(fā)事件的網(wǎng)絡輿情信息大都聚焦于現(xiàn)實事件,包括災害事件、受災情況和救援行動等。輿情信息要么直接描述現(xiàn)實事件的特征,要么是公眾對現(xiàn)實事件所持有認知、態(tài)度、情感和行為傾向[29]。因此,本研究將輿情信息視為公眾對突發(fā)事件的認知、態(tài)度與情感,并以事件為中心,集成同一事件的輿情信息,關(guān)聯(lián)輿情客體與輿情本體,開展面向應急管理的網(wǎng)絡輿情演化分析(見圖1)。
2.1 網(wǎng)絡輿情事件圖譜的結(jié)構(gòu)設計
突發(fā)事件網(wǎng)絡輿情不僅可以反映公眾對突發(fā)事件所持有的觀點、態(tài)度和情緒,還可以在一定程度上描述突發(fā)事件的演化過程。然而,輿情信息存在很強的主觀性和多元性,圍繞同一事件存在大量不同的信息、觀點和情緒。因此,網(wǎng)絡輿情事件圖譜不僅需要描述事件的特征與事件之間的關(guān)聯(lián),還需要集成和協(xié)調(diào)不同主體針對同一事件所持有的多元認知與復雜情緒?;诖?,本研究提出了網(wǎng)絡輿情的事件圖譜模型,包括輿情主體層、輿情本體層和輿情客體層(見圖2)。
(1)輿情主體層。輿情主體是在網(wǎng)絡空間發(fā)布事件信息,表達觀點、情緒的主體。輿情主體層主要用于描述主體之間的關(guān)聯(lián)關(guān)系和互動關(guān)系,其節(jié)點是網(wǎng)絡用戶和用戶屬性,邊表示用戶之間的關(guān)注、轉(zhuǎn)發(fā)、評論關(guān)系。
(2)輿情本體層。輿情本體就是輿情信息。突發(fā)事件網(wǎng)絡輿情信息是人們在網(wǎng)絡空間建構(gòu)的事件主觀理解,既包括突發(fā)事件的事實信息,也包含輿情主體對突發(fā)事件的關(guān)注、態(tài)度、情緒及反應等“建構(gòu)性”信息。輿情本體層關(guān)注輿情信息本身,其節(jié)點是帖子和帖子屬性,邊表示帖子之間的轉(zhuǎn)發(fā)、評論關(guān)系,帖子屬性包括點贊量、評論量、情感傾向等。
(3)輿情客體層。輿情客體是網(wǎng)絡輿情的現(xiàn)實根源,突發(fā)事件是網(wǎng)絡輿情的重要客體。輿情客體層聚焦于突發(fā)事件,其節(jié)點包括事件、事件屬性和抽象事件,jHNlKrhEcnEQ1mtvgaWiWQ==邊包括事件之間因果關(guān)系和時序關(guān)系。事件指在某個特定的時間和環(huán)境下發(fā)生的、由若干角色參與、表現(xiàn)出若干動作特征的一件事情,包括突發(fā)事件發(fā)生、發(fā)展過程中涉及的一系列災害事件、承災事件和救災事件。抽象事件是具有部分共同特征的事件集合,也稱為事件類,事件是抽象事件在特定時空下的具象呈現(xiàn)。事件與抽象事件之間的邊則表示事件與抽象事件之間的上下位關(guān)系。
(4)輿情主體層、本體層和客體層之間的關(guān)聯(lián)。輿情主體層和輿情本體層之間的邊表示用戶與帖子之間的發(fā)布關(guān)系;輿情客體是輿情本體的描述對象,輿情本體層與輿情客體層之間的邊表示帖子與事件之間的指向關(guān)系。
2.2 網(wǎng)絡輿情事件圖譜的構(gòu)建方法
2.2.1 數(shù)據(jù)采集與預處理
新浪微博是網(wǎng)絡輿情發(fā)生、發(fā)展和突發(fā)事件風險建構(gòu)與風險溝通的重要場域。因此,本研究利用關(guān)鍵詞在新浪微博平臺檢索輿情信息,并利用Python采集帖子的內(nèi)容、發(fā)布時間、點贊量、評論文本、用戶ID、微博認證信息等。同時,利用Jieba分詞對帖子內(nèi)容進行分詞和詞性標注,刪除停用詞和無關(guān)字符,利用正則表達式對帖子進行篩選,刪除無關(guān)內(nèi)容。
2.2.2 事件抽取和事件對齊
限定域事件抽取可以依據(jù)預設的事件模式,從非結(jié)構(gòu)化文本中提取事件和關(guān)鍵事件信息。然而,突發(fā)事件領(lǐng)域缺乏完善的事件模式和語料庫?;诖?,本研究擬采用一種基于領(lǐng)域觸發(fā)詞的事件抽取方法,旨在提高事件抽取的準確性和完整性。首先,分別以突發(fā)事件網(wǎng)絡輿情信息和普通的微博信息為語料,并利用百度的通用信息抽取模型(Universal Information Extraction,UIE)[30]直接從突發(fā)事件輿情信息和普通微博信息中提取事件觸發(fā)詞和常識性事件觸發(fā)詞;其次,從觸發(fā)詞中剔除常識性事件觸發(fā)詞,并通過詞性標注,刪除連詞、副詞、介詞等無實際意義的觸發(fā)詞,構(gòu)建專注于突發(fā)事件領(lǐng)域的事件觸發(fā)詞語料庫;最后,通過文本分句和觸發(fā)詞識別,從輿情信息中篩選出包含事件觸發(fā)詞的候選語句,并使用LTP工具(Language Technology Platform)[31]對候選語句進行語義角色標注,用以提取候選語句中包含的事件觸發(fā)詞和事件論元,從而獲得完整的事件元組。
網(wǎng)絡輿情信息的多樣性和預設事件模式的缺失,導致事件抽取結(jié)果存在很強的不確定性。因此,需要通過知識融合來實現(xiàn)事件對齊和事件映射,獲得標準的事件類型和事件論元。首先,通過事件觸發(fā)詞聚類確定事件類型。一方面,利用BERT-wwm-ext模型[32]將觸發(fā)詞嵌入為向量;另一方面,使用K-means++算法對觸發(fā)詞向量進行聚類,從而得到事件類型集合。其次,通過事件論元的聚類來確定論元角色。本研究使用BERT-wwm-ext將事件論元嵌入為向量,并利用余弦相似度計算它們之間的相似性,合并相似度高于閾值的事件論元,進而實現(xiàn)事件論元的對齊。最后,依據(jù)事件類型和事件論元的組合進行事件對齊,獲得標準化的事件元組,即輿情客體層的事件節(jié)點,并通過事件嵌入和聚類算法,再次對事件元組進行聚類,得到抽象事件,即輿情客體層的抽象事件節(jié)點。
2.2.3 事件關(guān)系抽取
網(wǎng)絡輿情事件圖譜的事件關(guān)系涵蓋了輿情客體層中的事件關(guān)聯(lián),以及抽象事件之間的事理邏輯關(guān)系。通過事件關(guān)系抽取,可以直接提取事件之間的聯(lián)系?;谑录c抽象事件之間的映射關(guān)系,可以進一步確定抽象事件之間的關(guān)系。本研究擬在事件抽取的基礎(chǔ)上,進行事件關(guān)系抽取和事件關(guān)系泛化。首先,通過事件觸發(fā)詞的匹配,篩選輿情信息中包含兩個以上觸發(fā)詞的候選帖子,以確定候選事件對;其次,采用模式匹配的方法判斷候選事件之間是否存在因果或時序線索,進而確認候選事件之間的關(guān)聯(lián)關(guān)系;最后,根據(jù)事件與抽象事件之間的聯(lián)系,確定抽象事件之間的事理邏輯關(guān)系。
2.2.4 圖譜構(gòu)建
首先,通過數(shù)據(jù)采集和預處理,獲得帖子、帖子屬性、用戶、用戶屬性及其間關(guān)聯(lián);其次,通過事件抽取和事件對齊獲得事件和抽象事件,以及事件與帖子、用戶、抽象事件之間的聯(lián)系;最后,通過事件關(guān)系抽取得到事件之間的聯(lián)系以及抽象事件之間的關(guān)聯(lián)?;诖耍瑢⑸鲜鎏?、用戶、事件、抽象事件和它們的屬性依次存儲于圖數(shù)據(jù)庫,并根據(jù)它們之間的關(guān)聯(lián)建立節(jié)點之間的連接,從而構(gòu)建網(wǎng)絡輿情事件圖譜。相較于傳統(tǒng)關(guān)系數(shù)據(jù)庫,圖數(shù)據(jù)庫專門針對復雜數(shù)據(jù)的關(guān)聯(lián)查詢進行了優(yōu)化,更適合存儲像知識圖譜這樣的大規(guī)模復雜網(wǎng)絡結(jié)構(gòu)數(shù)據(jù)。Neo4j圖數(shù)據(jù)庫可以實現(xiàn)事件和事件關(guān)聯(lián)的動態(tài)存儲和有效管理,非常適合存儲多層結(jié)構(gòu)的網(wǎng)絡輿情事件圖譜。因此,本研究擬采用Neo4j數(shù)據(jù)庫存儲網(wǎng)絡輿情事件圖譜,用以支撐事件圖譜的可視化和關(guān)聯(lián)查詢分析。
2.3 基于事件圖譜的網(wǎng)絡輿情演化分析方法
相較于傳統(tǒng)的網(wǎng)絡輿情演化分析,面向應急管理的網(wǎng)絡輿情演化分析需要更加關(guān)注輿情主體對輿情客體所持有的認知、態(tài)度、情感和行為傾向,尤其是他們對不同災害事件、受災情況以及救援行動的態(tài)度和情感傾向。因此,本研究開展基于事件圖譜的網(wǎng)絡輿情演化分析,以事件和抽象事件為中心,分析事件和抽象事件關(guān)注度和情感傾向的分布情況和演化趨勢:
(1)帖子關(guān)注度和情感傾向計算。計算每個帖子的關(guān)注度和情感傾向。一方面,通過計算評論量、轉(zhuǎn)發(fā)量和點贊量的均值,得到每個帖子的關(guān)注度;另一方面,通過百度的通用信息抽取框架得到帖子的情感傾向以及相應的概率值,再通過計算得到帖子的情感得分,并將其映射到[-1,1]區(qū)間。
(2)事件關(guān)注度和情感傾向計算。根據(jù)輿情熱度劃分網(wǎng)絡輿情的演化周期,分階段計算每個事件和抽象事件的關(guān)注度和情感傾向。一方面,計算每個事件和抽象事件下帖子關(guān)注度的均值,并進行對數(shù)轉(zhuǎn)換,以此表示事件和抽象事件的關(guān)注度;另一方面,計算每個事件和抽象事件下帖子情感得分的均值,以此表示事件和抽象事件的情感傾向。
(3)事件關(guān)注度和情感傾向演化趨勢分析。將帖子、事件和抽象事件的關(guān)注度和情感傾向存儲于Neo4j數(shù)據(jù)庫中,以屬性的形式展示。同時,以演化周期為單位,分析帖子、事件和抽象事件的分布情況,以及它們的關(guān)注度和情感傾向的演化過程,并構(gòu)建熱度圖來描述這些演化過程。
(4)關(guān)鍵事件演化趨勢分析。分析關(guān)鍵事件的演化趨勢。基于網(wǎng)絡輿情事件圖譜,挖掘關(guān)鍵事件,并分析相應輿情話題的演化趨勢。具體的,通過分析每個事件的關(guān)注度和情感演化趨勢,分階段挖掘關(guān)注度較高,情感變化程度較大,或負面情緒占比較高的事件,再分析它們的演化趨勢,進而呈現(xiàn)網(wǎng)民對相關(guān)事件的態(tài)度、情感傾向和行為趨勢,識別次生風險。
3 實證研究
2023年7月底,京津冀地區(qū)出現(xiàn)嚴重洪澇災害,其中河北省涿州市受災最為嚴重。2023年涿州暴雨是繼2021年“7·20”鄭州特大暴雨后,又一次社會力量廣泛參與的洪澇災害救援行動。涿州暴雨迅速引發(fā)了廣泛的網(wǎng)絡輿情,網(wǎng)絡輿情作為風險建構(gòu)的場域,不僅加速了救援信息的擴散,還激發(fā)了廣泛的公眾關(guān)注與參與。因此,2023年涿州暴雨事件不僅是一次嚴重的自然災害,更是網(wǎng)絡輿情治理與突發(fā)事件應急管理的典型案例?;诖?,本研究以涿州暴雨為案例,構(gòu)建突發(fā)事件網(wǎng)絡輿情事件圖譜,以輿情客體為中心,分析網(wǎng)絡輿情的演化過程。
3.1 數(shù)據(jù)采集與數(shù)據(jù)預處理
以“涿州暴雨”為關(guān)鍵詞,在微博平臺檢索2023年7月16日至8月14日期間發(fā)布的帖子,并利用Python采集帖子的文本內(nèi)容、點贊量、評論量和評論文本等。經(jīng)過數(shù)據(jù)篩選與數(shù)據(jù)預處理獲得97307條原創(chuàng)帖子、56836條轉(zhuǎn)發(fā)和41407條評論。
3.2 網(wǎng)絡輿情事件圖譜的構(gòu)建
首先,構(gòu)建了突發(fā)事件領(lǐng)域觸發(fā)詞語料庫,用以篩選候選事件語句,再使用UIE從候選語句中提取事件和事件信息,通過篩選獲得了33444個事件;其次,利用LTP從事件中提取SPO(Subject-Predicate-Object)三元組,通過BERT-wwm-ext計算事件觸發(fā)詞之間的余弦相似度,以及事件論元之間的余弦相似度,合并相似度高于0.88的觸發(fā)詞和事件論元,同時通過Kmean++開展進一步的事件泛化;最后,基于規(guī)則模版開展事件關(guān)系抽取,獲得20408條事件關(guān)系和313條抽象事件因果關(guān)系?;诖?,本研究將用戶、帖子、事件、抽象事件、屬性以及它們之間的關(guān)系存儲于Neo4j圖數(shù)據(jù)庫,構(gòu)建涿州暴雨災害事件網(wǎng)絡輿情事件圖譜(見圖3)。該圖譜包含101203個用戶節(jié)點、144705帖子節(jié)點、17078個事件節(jié)點和37抽象事件節(jié)點。
3.3 網(wǎng)絡輿情演化分析
3.3.1 網(wǎng)絡輿情的演化周期
通過帖子的時間序列分析,得到帖子數(shù)量的分布情況(見圖4)。在圖4左側(cè)子圖描述的是每日帖子數(shù)量的變化趨勢,右側(cè)子圖描述的是7月31日至8月2日期間,每小時帖子數(shù)量的變化趨勢。涿州網(wǎng)絡輿情的熱度在8月1日8時開始快速上升,并迅速達到頂峰。由此可知,7月31日是網(wǎng)絡輿情的潛伏階段;8月1日和8月2日是網(wǎng)絡輿情的爆發(fā)階段;8月3日至8月8日是網(wǎng)絡輿情的持續(xù)階段,8月9日至8月12日是網(wǎng)絡輿情的恢復階段。
3.3.2 網(wǎng)絡輿情演化趨勢
首先,基于網(wǎng)絡輿情事件圖譜,計算每個帖子、事件和抽象事件的關(guān)注度和情感傾向,并以屬性的形式存儲到事件圖譜;其次,基于網(wǎng)絡輿情的生命周期,分階段分析帖子的分布情況,事件和抽象事件關(guān)注度和情感傾向的演化過程;最后,繪制了帖子分布情況、抽象事件關(guān)注度和情感演化趨勢的熱度圖(見圖5)。其中,帖子分布圖的數(shù)值表示每個階段,公眾對不同事件的討論熱度;事件關(guān)注度演化趨勢圖反映了公眾對不同事件關(guān)注度的演化過程;情感演化圖的數(shù)值是事件情感得分的相反數(shù),顏色越深表示負面情緒越重;負面情緒占比圖可以描述負面情緒信息的分布情況和演化趨勢。
由圖可知,涿州暴雨災害事件的演化過程呈現(xiàn)出顯著的階段性特征。在不同階段,不同輿情主體針對不同事件表達出了一定的情感傾向和關(guān)注度。具體而言:(1)潛伏階段,網(wǎng)絡輿情的話題呈現(xiàn)出顯著的分散特征,主要圍繞“道路管控”“被困失聯(lián)”“泄洪”“被淹”“涿州受災”等災害事件,而且負面情緒占比很高,充分反映了災區(qū)民眾內(nèi)心的恐慌與不安。(2)爆發(fā)階段,輿情信息高度匯聚于“被淹”“急需救援”“關(guān)注涿州”“傷亡”等受災事件和救災事件上。此時,負面情緒依然占據(jù)主導地位,災區(qū)民眾紛紛通過社交媒體平臺發(fā)出求救信號,涿州暴雨事件開始受到社會的廣泛關(guān)注。(3)持續(xù)階段,涿州暴雨災害事件的討論熱度不減,討論焦點轉(zhuǎn)向了“急需支援”“涿州加油”“被淹”“祈?!薄案兄x”“恢復正?!钡仁录?。在此階段,“傷亡”vaf8bpiNSHWWdxifBhlkOg==事件的關(guān)注度相對較高,災害事件的負面情緒雖有所緩和但仍保持較高比例。(4)恢復階段,隨著供電、供水和通訊的逐步恢復,網(wǎng)絡輿情的熱度不斷下降,但是輿情信息中仍存在一定的負面情緒。
3.3.3 關(guān)鍵事件的演化趨勢
網(wǎng)絡輿情事件圖譜中的事件是網(wǎng)絡輿情的指向物,也是引發(fā)不同輿情話題的現(xiàn)實根源。因此,本研究進一步基于網(wǎng)絡輿情事件圖譜,挖掘關(guān)鍵的事件節(jié)點,并分析相應輿情話題的演化趨勢。通過事件關(guān)注度和事件情感演化趨勢分析,可以發(fā)現(xiàn)一些“異常節(jié)點”:潛伏階段的“被困失聯(lián)”事件,其情感得分為前者為-0.45,負面情緒占比高達0.83;爆發(fā)階段的“災情嚴重”和“涿州情況”事件,它們的負面情緒都占比非常高,分別為0.61和0.59;持續(xù)階段的“補償損失”事件,其關(guān)注度異常突出;恢復階段“致敬英雄”和“感動”事件,它們是該階段討論的重要對象。因此,通過設定關(guān)注度和情感得分的閾值,可以基于事件圖譜有效監(jiān)測“異常事件”。在此基礎(chǔ)之上,進一步分析抽象事件下的子事件及其對應文本,可以更加深入地感知關(guān)鍵事件的演化趨勢。以“補償損失”這一抽象事件為例,它涵蓋了“理賠”“政府補償”“基礎(chǔ)設施受損”“賠償”及“追責”等多個具體事件。通過深入剖析相關(guān)文本可以發(fā)現(xiàn):在輿情持續(xù)階段,社會公眾對于暴雨事件導致的財產(chǎn)損失展現(xiàn)出了極高的關(guān)注度。鑒于這種高度的社會關(guān)注,中國郵政、順豐、保險公司及政府機構(gòu)等迅速響應,紛紛發(fā)布理賠相關(guān)信息,這一系列行動促使網(wǎng)絡輿情逐漸轉(zhuǎn)向積極態(tài)勢。
3.4 討論與分析
以輿情客體為核心,構(gòu)建的涿州暴雨災害事件網(wǎng)絡輿情事件圖譜,不僅全面展現(xiàn)了輿情主體、輿情本體與輿情客體之間的多維度、多層次關(guān)聯(lián),還支撐了圍繞輿情客體展開的網(wǎng)絡輿情演化分析、關(guān)鍵節(jié)點識別以及關(guān)鍵路徑挖掘等工作。具體而言,基于領(lǐng)域觸發(fā)詞語料庫,采用UIE技術(shù)提取的事件具有較強的領(lǐng)域針對性,主要聚焦于涿州暴雨的災害事件、受災情況以及相關(guān)的救援行動;融合LTP和BERT-wwm-ext方法,所提取的事件元組標準化程度較高,有效對齊并區(qū)分了不同類型的事件;構(gòu)建的涿州暴雨災害事件網(wǎng)絡輿情事件圖譜,能夠從不同尺度,準確地揭示社會公眾對不同現(xiàn)實事件的認知和態(tài)度。同時,借助網(wǎng)絡輿情事件圖譜的分析,清晰呈現(xiàn)了事件關(guān)注度和情感傾向的演化趨勢,揭示了公眾對于不同災害事件以及救援行動的態(tài)度和情感變化過程;通過關(guān)鍵事件的深入挖掘,有效識別了網(wǎng)絡輿情中的“異常節(jié)點”,為后續(xù)的輿情治理與輿論引導工作提供了明確的方向。
綜上,本研究提出的突發(fā)事件網(wǎng)絡輿情事件圖譜不僅能夠全面揭示輿情主體、輿情本體與輿情客體之間的復雜關(guān)聯(lián),還能進一步支持網(wǎng)絡輿情演化趨勢分析和關(guān)鍵事件識別。當然,網(wǎng)絡輿情事件圖譜的功能和應用場景遠不止于此。它還可以廣泛應用于輿情監(jiān)測與預警、輿情演化趨勢的預測、意見領(lǐng)袖的識別、風險識別與預測等多個領(lǐng)域。具體而言,事件圖譜是一個多層網(wǎng)絡結(jié)構(gòu),可以運用復雜網(wǎng)絡分析方法來計算統(tǒng)計各節(jié)點的統(tǒng)計特征,識別出關(guān)鍵節(jié)點,挖掘關(guān)鍵路徑,并預測潛在的演化路徑,支撐面向輿情客體的風險識別、風險預測、意見領(lǐng)袖識別等,從而更加有效地支撐突發(fā)事件網(wǎng)絡輿情治理。
4 結(jié)語
本研究的學術(shù)價值主要體現(xiàn)在以下三個方面:(1)提出了一種以輿情客體為核心的網(wǎng)絡輿情事件圖譜,并根據(jù)輿情信息特征設計了事件圖譜的結(jié)構(gòu);(2)構(gòu)建了網(wǎng)絡輿情事件圖譜的統(tǒng)一框架與體系化方法;(3)探索了輿情事件圖譜的應用場景,提出了基于事件圖譜的網(wǎng)絡輿情演化分析方法。本研究的應用價值體現(xiàn)在兩個方面:(1)網(wǎng)絡輿情事件圖譜能夠有效呈現(xiàn)公眾對不同災害事件、災害影響和救災行動的認知、態(tài)度和情感,有助于決策者全面感知不同事件的次生風險和社會風險,從而支撐突發(fā)事件的應急管理;(2)通過挖掘事件圖譜中的關(guān)鍵節(jié)點,可以識別網(wǎng)絡輿情的關(guān)鍵輿情客體,了解相應輿情話題的演化過程,以及輿情客體與輿情本體相互作用的關(guān)鍵節(jié)點,支撐以防范化解重大風險為導向的網(wǎng)絡輿情治理。
誠然,本研究仍存在一定的局限性。一方面,采用的事件抽取模型難以有效提取領(lǐng)域特殊事件,模型精度尚存提升空間;另一方面,目前缺乏統(tǒng)一的事件模式,事件要素的標準化程度相對較低。因此,未來進一步構(gòu)建面向突發(fā)事件的事件類型、論元角色集合,提出標準化的事件模式,構(gòu)建更加完善的突發(fā)事件網(wǎng)絡輿情事件圖譜。同時,未來將進一步探索基于事件圖譜的網(wǎng)絡輿情演化態(tài)勢,以及突發(fā)事件風險的察覺、理解與預測方法,研究關(guān)鍵節(jié)點與關(guān)鍵路徑的有效識別方法,以期揭示輿情本體、輿情客體與輿情主體之間復雜而深刻的作用模式。
參考文獻:
[1] 丁柏銓.重大公共危機事件與輿論關(guān)系研究——基于新媒體語境和傳統(tǒng)語境中情形的比較[J].江海學刊,2014(1):200-207,239.
[2] 陳華明,孫藝嘉,余林星.突發(fā)事件風險媒介化:“信息疫情”的本質(zhì)、演化與治理[J].新聞界,2023(5):41-48,96.
[3] 韓文靜,喻馨君.“全民看?!钡健白跃然ゾ取保簶O端天氣事件的社會化傳播與救援實踐——以鄭州“7·20”特大暴雨災害為例[J].新聞愛好者,2022(8):20-24.
[4] 黃仕靖,陳國華,袁勤儉.突發(fā)事件社會風險放大的信息作用機制研究[J].圖書與情報,2021(2):54-66.
[5] An L,Zhou W,Ou M,et al.Measuring and profiling the topical influence and sentiment contagion of public event stakeholders[J].International Journal of Information Management,2021,58:102327.
[6] 史波.公共危機事件網(wǎng)絡輿情內(nèi)在演變機理研究[J].情報雜志,2010,29(4):41-45.
[7] 曾潤喜,王晨曦,陳強.網(wǎng)絡輿情傳播階段與模型比較研究[J].情報雜志,2014,33(5):119-124.
[8] 杜洪濤,王君澤,李婕.基于多案例的突發(fā)事件網(wǎng)絡輿情演化模式研究[J].情報學報,2017,36(10):1038-1049.
[9] 安璐,李倩.基于熱點主題識別的突發(fā)事件次生衍生事件探測[J].情報資料工作,2020,41(6):26-35.
[10] 安璐,吳林.融合主題與情感特征的突發(fā)事件微博輿情演化分析[J].圖書情報工作,2017,61(15):120-129.
[11] 王平,謝耘耕.突發(fā)公共事件網(wǎng)絡輿情的形成及演變機制研究[J].現(xiàn)代傳播(中國傳媒大學學報),2013,35(3):63-69.
[12] 祁凱,楊志.突發(fā)危機事件網(wǎng)絡輿情治理的多情景演化博弈分析[J].中國管理科學,2020,28(3):59-70.
[13] 蘇妍嫄,張金純,張亞明.突發(fā)事件網(wǎng)絡輿情傳播動力學模型綜述[J].現(xiàn)代情報,2022,42(12):160-177.
[14] 胡凱茜,李欣,王龍騰.基于BERTopic模型的網(wǎng)絡暴力事件衍生輿情探測[J].情報雜志,2024,43(7):146-153.
[15] 曹樹金,岳文玉.突發(fā)公共衛(wèi)生事件微博輿情主題挖掘與演化分析[J].信息資源管理學報,2020,10(6):28-37.
[16] 張柳,王晰巍,黃博,等.基于LDA模型的新冠肺炎疫情微博用戶主題聚類圖譜及主題傳播路徑研究[J].情報學報,2021,40(3):234-244.
[17] 安璐,歐孟花.突發(fā)公共衛(wèi)生事件利益相關(guān)者的社會網(wǎng)絡情感圖譜研究[J].圖書情報工作,2017,61(20):120-130.
[18] 王璐,李詩軒,陳燁.基于主題-情感融合分析的新冠疫苗輿情演化研究[J/OL].情報科學,1-27[2024-07-11].http://kns.cnki.net/kcms/detail/22.1264.G2.20240129.0935.004.html.
[19] 劉宗田,黃美麗,周文,等.面向事件的本體研究[J].計算機科學,2009,36(11):189-192,199.
[20] Glava?觢 G,?譒najder J.Event graphs for information retrieval and multi-document summarization[J].Expert Systems with Applications,2014,41(15):6904-6916.
[21] Rospocher M,Van Erp M,Vossen P,et al.Building event-centric knowledge graphs from news[J].Journal of Web Semantics,2016,37:132-151.
[22] 劉偉利,張海濤,張鑫蕊,等.三元空間視域下重大突發(fā)事件的事件圖譜研究[J].圖書情報工作,2024,68(10):135-146.
[23] 李綱,王施運,毛進,等.面向態(tài)勢感知的國家安全事件圖譜構(gòu)建研究[J].情報學報,2021,40(11):1164-1175.
[24] Guan S,Cheng X,Bai L,et al.What is event knowledge graph:A survey[J].IEEE Transactions on Knowledge and Data Engineering,2022,35(7):7569-7589.
[25] Ali W,Zuo W,Ying W,et al.Causality extraction:A comprehensive survey and new perspective[J].Journal of King Saud University-Computer and Information Sciences,2023,35(7):101593.
[26] 杜志強,李鈺,張葉廷,等.自然災害應急知識圖譜構(gòu)建方法研究[J].武漢大學學報(信息科學版),2020,45(9):1344-1355.
[27] 劉政昊,曾曦,張志劍.面向應急管理的金融突發(fā)事件事理知識圖譜構(gòu)建與分析研究[J].信息資源管理學報,2022,12(3):137-151.
[28] 張詩瑩,李陽.融合事理知識圖譜與網(wǎng)絡輿情分析的突發(fā)事件情報支持路徑及實證研究——以?;肥鹿蕿槔跩].信息資源管理學報,2023,13(4):60-71.
[29] 姚樂野,孟群.重特大自然災害輿情演化機理:構(gòu)成要素、運行邏輯與動力因素[J].情報資料工作,2020,41(5):49-57.
[30] Lu Y,Liu Q,Dai D,et al.Unified structure generation for universal information extraction[EB/OL].[2024-07-11].https://arxiv.org/pdf/2203.12277.pdf.
[31] Che W,F(xiàn)eng Y,Qin L,et al.N-LTP:An open-source neural language technology platform for Chinese[EB/OL].[2024-07-11].https://arxiv.org/pdf/2009.11616.pdf.
[32] Cui Y,Che W,Liu T,et al.Revisiting pre-trained models for Chinese natural language processing[EB/OL].[2024-07-11].https://arxiv.org/pdf/2004.13922.pdf.
作者簡介:劉偉利,吉林大學商學與管理學院博士研究生,研究方向:突發(fā)事件與網(wǎng)絡輿情;張海濤,吉林大學商學與管理學院、吉林大學信息資源研究中心、吉林大學國家發(fā)展與安全研究院教授,博士生導師,研究方向:數(shù)據(jù)智慧與社會治理、信息行為與智慧服務;龐宇飛,吉林大學商學與管理學院博士研究生,研究方向:突發(fā)事件與網(wǎng)絡輿情;劉彥輝,吉林大學商學與管理學院博士研究生,研究方向:突發(fā)事件與網(wǎng)絡輿情。