張思龍 王蘭成 婁國哲
收稿日期:2020-08-03
基金項目:全軍研究生重點課題(項目編號:2018JY62);裝備軍內(nèi)科研2019年課題和國防大學(xué)數(shù)據(jù)工程專項(項目編號:DSJGCZY19012)。
作者簡介:張思龍(1987-),男,講師,博士研究生,研究方向:計算機情報分析、網(wǎng)絡(luò)輿情監(jiān)測。王蘭成(1962-),男,教授,博士生導(dǎo)師,研究方向:計算機情報分析、網(wǎng)絡(luò)輿情監(jiān)測。婁國哲(1982-),男,講師,博士,研究方向:網(wǎng)絡(luò)輿情監(jiān)測、政工信息化。
摘要:[目的/意義]知識圖譜基礎(chǔ)應(yīng)用對于加強網(wǎng)絡(luò)輿情研判系統(tǒng)智能化水平具有重要意義。[方法/過程]本文在相關(guān)研究基礎(chǔ)上,針對知識圖譜在系統(tǒng)中融合路徑進(jìn)行了探析,并提出了基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型,對網(wǎng)絡(luò)輿情研判系統(tǒng)構(gòu)建實踐和應(yīng)用進(jìn)行了探討。[結(jié)果/結(jié)論]研究表明,基于知識圖譜的應(yīng)用,有利于網(wǎng)絡(luò)輿情大數(shù)據(jù)的精準(zhǔn)獲取和智能化計算,有利于統(tǒng)一網(wǎng)絡(luò)輿情信息資源和加強語義分析,有利于準(zhǔn)確分析研判網(wǎng)絡(luò)輿情的風(fēng)險點、矛盾點,有利于輿情自動編報、精準(zhǔn)推薦和決策支持。
關(guān)鍵詞:知識圖譜;網(wǎng)絡(luò)輿情;研判系統(tǒng);人工智能;融合路徑
DOI:10.3969/j.issn.1008-0821.2021.04.002
〔中圖分類號〕G203〔文獻(xiàn)標(biāo)識碼〕A〔文章編號〕1008-0821(2021)04-0010-07
Research on Network Public Opinion Analysis and
Judgment System Based on Knowledge Graph
Zhang SilongWang LanchengLou Guozhe
(National Defense University Political College,Shanghai 200433,China)
Abstract:[Purpose/Significance]The research of knowledge graph is at the cutting edge of world information technology,and the basic application of that is of great significance to strengthen the intelligent level of network public opinion analysis and judgment system;[Method/Process]On the basis of related research,this paper discussed the fusion path of knowledge graph in the system,then put forward the network public opinion analysis and judgment system model based on knowledge graph,and discussed the construction practice and application of system;[Result/Conclusion]The research showed that the application of knowledge graph was conducive to the accurate acquisition and intelligent calculation of network public opinion big data,the unification of network public opinion information resources and the enhancement of semantic analysis,the accurate analysis and judgment of risk points and contradiction points of network public opinion,as well as the automatic public opinion reporting,accurate recommendation and decision support.
Key words:knowledge graph;network public opinion;analysis and judgment system;artificial intelligence;fusion path
知識圖譜是一種面向人工智能的高級語義建模、知識組織、知識匹配和推理計算技術(shù)。在基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)中,任務(wù)關(guān)聯(lián)的目標(biāo),例如事件、機構(gòu)、地區(qū)、人物、行業(yè)、企業(yè)、產(chǎn)品等與領(lǐng)域情報相關(guān)的概念或?qū)嶓w,以及各類概念或?qū)嶓w之間的關(guān)系(比如任職、發(fā)布等),都在知識圖譜中以節(jié)點和邊的形式結(jié)構(gòu)化。網(wǎng)絡(luò)輿情研判數(shù)據(jù)采集、分析處理、輿情編報等業(yè)務(wù)運用知識圖譜技術(shù)進(jìn)行有效數(shù)據(jù)管理,同時針對業(yè)務(wù)需求中的任何分析意圖,進(jìn)行細(xì)粒度的語義理解和精確匹配。
大數(shù)據(jù)時代,網(wǎng)絡(luò)輿情研判任務(wù)更加復(fù)雜,知識分布更加分散,有效數(shù)據(jù)獲取和精準(zhǔn)研判更加困難。研究基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)旨在達(dá)到3個方面的期望:①在網(wǎng)絡(luò)輿情文本等數(shù)據(jù)語義表達(dá)和關(guān)聯(lián)上,突破傳統(tǒng)的關(guān)鍵詞詞袋、向量空間等模型,轉(zhuǎn)變?yōu)楦Ⅲw、更全面、更開放、更規(guī)范的語義網(wǎng)絡(luò)模型,使得研判業(yè)務(wù)目標(biāo)數(shù)據(jù)都能包含在統(tǒng)一的模型框架中;②在網(wǎng)絡(luò)輿情研判知識匹配和擴展上,借鑒人工智能技術(shù)的應(yīng)用,使之更加智能化和精確化;③在輿情知識推理和智能化研判上,運用知識圖譜積累的大量知識點及其關(guān)系,機器學(xué)習(xí)自動發(fā)現(xiàn)隱含的知識和關(guān)系模式,提高大數(shù)據(jù)知識發(fā)現(xiàn)及預(yù)測的效果和可解釋性。
1相關(guān)研究現(xiàn)狀
1.1網(wǎng)絡(luò)輿情研判相關(guān)研究
1.1.1網(wǎng)絡(luò)輿情研判信息處理流程
網(wǎng)絡(luò)輿情研判屬于網(wǎng)絡(luò)輿情管理的研究范疇,是對網(wǎng)絡(luò)媒體和用戶產(chǎn)生的并在網(wǎng)絡(luò)上進(jìn)行傳播的輿情信息進(jìn)行價值或趨向判定的過程。在工作實踐中,網(wǎng)絡(luò)輿情研判的信息處理一般包括網(wǎng)絡(luò)輿情信息搜集、網(wǎng)絡(luò)輿情信息分析、網(wǎng)絡(luò)輿情信息編報和網(wǎng)絡(luò)輿情信息控制等流程,如圖1所示。
其中,信息搜集是網(wǎng)絡(luò)輿情研判的開始;信息分析是網(wǎng)絡(luò)輿情研判的關(guān)鍵,主要完成真?zhèn)闻袛?、分類篩選、統(tǒng)計分析等工作,提煉出輿情矛盾點、異化點、風(fēng)險點,為網(wǎng)絡(luò)輿情信息編報提供數(shù)據(jù)支撐;信息編報是網(wǎng)絡(luò)輿情研判的重要過程,研判人員通過編報選題、材料海選、資料歸集、歸納意見形成編報內(nèi)容,按照對應(yīng)編輯刊物的格式編寫,審查核對后上報相關(guān)部門,網(wǎng)絡(luò)輿情的重要性主要通過輿情編報體現(xiàn);信息控制是網(wǎng)絡(luò)輿情研判的反饋機制,目的是減少有害信息傳播,預(yù)防輿情危機事件發(fā)生。從業(yè)務(wù)流程上看,它并不屬于網(wǎng)絡(luò)輿情研判的范疇,但它卻是研判成果作用于網(wǎng)絡(luò)輿情發(fā)展的進(jìn)一步行動,同時信息控制的效果也需要研判進(jìn)行評估。
1.1.2網(wǎng)絡(luò)輿情研判方法和模型
網(wǎng)絡(luò)輿情研判相關(guān)研究主要有兩個思路:一是從輿情安全評估和預(yù)警角度研究網(wǎng)絡(luò)輿情評估指標(biāo)和方法;二是從信息傳播角度研究網(wǎng)絡(luò)輿情演化模型。
網(wǎng)絡(luò)輿情評估指標(biāo)體系相關(guān)研究主要集中在通用輿情、特定事件輿情和特定領(lǐng)域輿情的評估等,比如劉健等[1]面向微博信息傳播,研究設(shè)計了信息傳播者、受傳者、信息內(nèi)容、傳播渠道、傳播環(huán)境屬性等指標(biāo);陳建敏等[2]引入信息空間模型,提出涉軍網(wǎng)絡(luò)輿情信息指標(biāo)體系設(shè)計思路、原則和方法等。對應(yīng)的評估方法主要有基于層次分析法(APH)和基于模糊評價法的研究方法。層次分析法廣泛應(yīng)用于指標(biāo)體系設(shè)計,同時基于指標(biāo)體系的輿情評估也多基于層次分析法分析指標(biāo)權(quán)重?;谀:u價法即通過概率等數(shù)學(xué)手段處理模糊的評價對象,比如輿情熱點詞匯、評論意見等。近幾年兩種方法趨于結(jié)合,如王高飛等[3]將層次分析法與模糊綜合分析法相結(jié)合,構(gòu)建基于AHP-模糊綜合分析的移動社交網(wǎng)絡(luò)輿情預(yù)警模型,通過實證說明模型的有效性和準(zhǔn)確性。
網(wǎng)絡(luò)輿情演化模型及模擬仿真研究方面,早期主要基于生命周期理論對網(wǎng)絡(luò)輿情生命周期進(jìn)行劃分。隨著大數(shù)據(jù)時代的到來,面對海量的輿情數(shù)據(jù)和復(fù)雜的網(wǎng)絡(luò)傳播路徑,越來越多的學(xué)者引入了復(fù)雜網(wǎng)絡(luò)、模擬仿真、數(shù)據(jù)挖掘、人工智能等技術(shù)研究輿情擴散機理、群體性事件預(yù)測等。如劉繼等[4]基于復(fù)雜網(wǎng)絡(luò)對輿情團落進(jìn)行分析,利用深度學(xué)習(xí)提高輿情智能計算能力,對網(wǎng)絡(luò)輿情事件進(jìn)行演化推理,提升網(wǎng)絡(luò)輿情態(tài)勢智能分析水平;彭程等[5]基于SIR傳染病模型與EGM灰色預(yù)測模型,提出一種實現(xiàn)輿情預(yù)警與輿情防控模型等。
1.2知識圖譜及其在網(wǎng)絡(luò)輿情研究中的應(yīng)用
知識圖譜(Knowledge Graph,KG)由Google最先提出,目標(biāo)是使其主營的搜索業(yè)務(wù)實現(xiàn)智能化,目前已成為人工智能領(lǐng)域的技術(shù)前沿。知識圖譜是指描述現(xiàn)實世界中概念、常識及其關(guān)系的結(jié)構(gòu)化的語義知識庫,其基本組成單元是〈概念/實體,關(guān)系,概念/實體〉三元組和〈概念/實體,屬性,屬性值〉三元組。知識圖譜通過兩種基本組成單元將知識表達(dá)為圖結(jié)構(gòu),易于知識的展現(xiàn)、維護、檢索和推理?;谥R圖譜的應(yīng)用,可以提升社交網(wǎng)絡(luò)的輿情分析管控能力,如馬哲坤等[6]基于突發(fā)事件網(wǎng)絡(luò)輿情的時間特征指標(biāo)建立含有語義關(guān)系的突發(fā)話題圖譜,實現(xiàn)突發(fā)事件網(wǎng)絡(luò)輿情熱點話題傳播分析。
也有研究者基于知識圖譜構(gòu)建事件類知識圖譜用于網(wǎng)絡(luò)輿情事件研判。如Gottschalk S等[7]提出了一種以事件為中心的多語言時序知識圖譜,從現(xiàn)有大型知識圖譜中抽取事件、關(guān)系,并進(jìn)行了融合;彭立發(fā)[8]以事件類型的實體為例,提出并構(gòu)建了一個以事件為中心、通過事件要素進(jìn)行關(guān)聯(lián)擴展的網(wǎng)絡(luò)社區(qū)知識圖譜。
基于知識圖譜,Li Z等[9]于2018年提出了事理圖譜概念,描述事件之間的順承關(guān)系和因果關(guān)系,用于發(fā)現(xiàn)事件的演化規(guī)律和后續(xù)事件的預(yù)測。周京艷等[10]比較了概念地圖、知識圖譜、事理圖譜的概念內(nèi)涵,界定了情報事理圖譜的概念,認(rèn)為事理圖譜在情報理論、情報判讀和情報預(yù)測等方面均具有重要價值。單曉紅等[11]以醫(yī)療領(lǐng)域網(wǎng)絡(luò)輿情事件為例,分別構(gòu)建網(wǎng)絡(luò)輿情事理圖譜和抽象網(wǎng)絡(luò)輿情事理圖譜,從兩個層次分析網(wǎng)絡(luò)輿情的演化路徑。
1.3研究評述
首先,大數(shù)據(jù)時代海量數(shù)據(jù)規(guī)模成為網(wǎng)絡(luò)輿情研判首要解決的一大難題,而當(dāng)前的輿情評估方法還大多限于抽樣式的評估方法,缺乏全面的綜合評估;其次,網(wǎng)絡(luò)輿情研判的內(nèi)容也主要以社會安全事件為主,其中應(yīng)急性、個案化較多,長遠(yuǎn)性的研究較少,輿情預(yù)警和應(yīng)對也多采取人工搜索和自覺發(fā)現(xiàn);最后,從輿情分析的重要目的,輿情決策的角度講,當(dāng)前輿情研判的現(xiàn)狀還存在不足,在輿情案例研究、政策法規(guī)和領(lǐng)域知識等方面出現(xiàn)了供需不匹配的問題,尤其當(dāng)前大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)輿情形勢瞬息萬變,更需要即時作出輿情決策,知識需求更為迫切。
鑒于此,本文研究基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng),旨在構(gòu)建各領(lǐng)域網(wǎng)絡(luò)輿情研判知識圖譜,加強大數(shù)據(jù)和人工智能聯(lián)合應(yīng)用,推動網(wǎng)絡(luò)輿情研判工作從抽樣式模糊評估向綜合式精準(zhǔn)評估轉(zhuǎn)變,推動網(wǎng)絡(luò)輿情研判工作從就事論事的應(yīng)急式向統(tǒng)攬全局的跟蹤式轉(zhuǎn)變,推動網(wǎng)絡(luò)輿情研判案例庫知識庫建設(shè),不斷強化網(wǎng)絡(luò)輿情研判決策支持能力。
2基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型
2.1知識圖譜在系統(tǒng)中的融合路徑探析
結(jié)合輿情研判信息處理流程,探討知識圖譜在網(wǎng)絡(luò)輿情研判數(shù)據(jù)管理、信息處理和知識服務(wù)過程中的融合路徑,以期更好發(fā)揮知識圖譜技術(shù)優(yōu)勢,強化系統(tǒng)功能。
1)基于知識圖譜構(gòu)建網(wǎng)絡(luò)輿情信息資源的分類和畫像,強化系統(tǒng)數(shù)據(jù)管理功能
網(wǎng)絡(luò)輿情信息資源分類和畫像,就是匹配輿情數(shù)據(jù)、需求數(shù)據(jù)、案例庫、業(yè)務(wù)數(shù)據(jù)等信息資源的特征和屬性,分析獲知信息資源的使用度、接受度和使用任務(wù)等。比如構(gòu)建輿情事件和典型媒體主題圖譜、輿情應(yīng)急響應(yīng)決策圖譜[12],借鑒知識圖譜的方法深度挖掘數(shù)據(jù),構(gòu)建基于資源畫像的社交媒體內(nèi)部、外部資源聚合模型等[13]。
通過構(gòu)建的信息資源的分類和畫像還可以較為精準(zhǔn)地確定數(shù)據(jù)采集方向,加之基于知識圖譜的數(shù)據(jù)采集和存儲方案,面向不同任務(wù)自動關(guān)聯(lián)采集站點、自動確定數(shù)據(jù)格式和存儲方式也是強化輿情數(shù)據(jù)采集管理、保證輿情研判質(zhì)量的重要手段。如麻友等[14]在數(shù)據(jù)主題挖掘基礎(chǔ)上,利用知識圖譜發(fā)掘領(lǐng)域?qū)嶓w及其關(guān)聯(lián),實現(xiàn)特定領(lǐng)域數(shù)據(jù)的抽取。
2)基于知識圖譜創(chuàng)新輿情信息處理技術(shù),強化系統(tǒng)智能分析能力
知識圖譜在網(wǎng)絡(luò)輿情研判信息處理中的融合應(yīng)用是基于知識圖譜構(gòu)建網(wǎng)絡(luò)輿情研判系統(tǒng)的主要目的,主要集中在事件分析、用戶分析和輿情可視化分析等方面的創(chuàng)新研究。事件分析任務(wù)主要有事件監(jiān)測、事件摘要、事件演化追蹤、事件預(yù)測等[6-11]。用戶分析任務(wù)主要有用戶畫像[15]、用戶推薦[16]、行為分析[17]等。可視化分析任務(wù)包括可視化事件知識圖譜、事理圖譜構(gòu)建和可視化輿情展示等。王晰巍等[12]構(gòu)建了校園突發(fā)網(wǎng)絡(luò)輿情事件主題圖譜,并對“北京交通大學(xué)實驗室爆炸”事件進(jìn)行可視化分析;牟冬梅等[18]構(gòu)建微博輿情社會屬性與外化表現(xiàn)模型,并以某疫苗事件為例進(jìn)行實證研究及可視化展示。
3)基于知識圖譜強化系統(tǒng)知識管理、知識檢索和服務(wù)能力
基于知識圖譜為網(wǎng)絡(luò)輿情研判業(yè)務(wù)提供知識管理和優(yōu)化,比如面向重大主題輿情監(jiān)控構(gòu)建重大輿情主題知識圖譜;面向事件演變追蹤構(gòu)建網(wǎng)絡(luò)輿情事理圖譜;面向關(guān)鍵組織和人物分析構(gòu)建組織或人物圖譜等。
當(dāng)前,網(wǎng)絡(luò)輿情知識檢索服務(wù)面臨3個難題,極大限制了系統(tǒng)效能:一是海量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)無法自動建立有效的標(biāo)簽或索引;二是存在大量冗余數(shù)據(jù);三是語義解析和檢索能力不足。針對以上問題,知識圖譜等語義網(wǎng)技術(shù)提供了研究思路。如王丹等[19]針對數(shù)據(jù)冗余和語義解析問題,提出了基于元數(shù)據(jù)的信息知識組織智能檢索系統(tǒng)設(shè)計方法等。
2.2系統(tǒng)模型設(shè)計
基于知識圖譜技術(shù)并融合大數(shù)據(jù)處理理論設(shè)計網(wǎng)絡(luò)輿情研判系統(tǒng)模型,包括輿情知識庫(知識圖譜)、數(shù)據(jù)源及其獲取、網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理、網(wǎng)絡(luò)輿情圖譜分析、分析結(jié)果展示和決策支持等功能模塊,如圖2所示。該模型中各模塊之間信息和知識互通,形成有機整體。
圖2基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型
1)輿情知識庫(知識圖譜)模塊。該模塊主要用于整合業(yè)務(wù)知識、提煉知識需求、指導(dǎo)數(shù)據(jù)獲取、輿情知識匹配、知識管理服務(wù)等。本文設(shè)計輿情知識庫包括領(lǐng)域知識庫、業(yè)務(wù)知識庫、輿情事件庫、用戶行為庫、輿情案例庫和決策支持庫等。這里需要注意的是,知識圖譜技術(shù)并非是所有用于研判的輿情信息和知識的最佳組織方案,比如研判系統(tǒng)中的業(yè)務(wù)流程知識使用工作流更合適,體量較大的輿情數(shù)據(jù)(照片、長視頻、軟件、文件等)使用組織好的文件系統(tǒng)更合適,但輿情處理時這些信息的摘要或索引數(shù)據(jù)需要添加到知識圖譜中,便于輿情知識檢索利用。
2)數(shù)據(jù)源及其獲取模塊。該模塊主要用于輿情研判數(shù)據(jù)篩選和獲取。大數(shù)據(jù)時代網(wǎng)絡(luò)輿情信息涉及的范圍十分廣泛,網(wǎng)絡(luò)輿情研判系統(tǒng)數(shù)據(jù)來源不僅包括網(wǎng)絡(luò)新聞媒體、社交網(wǎng)絡(luò)、論壇博客、網(wǎng)絡(luò)直播以及微博、微信自媒體,還包括電子政務(wù)網(wǎng)站、輿情工作部門的業(yè)務(wù)數(shù)據(jù)等。根據(jù)不同領(lǐng)域、不同類型的研判任務(wù),其數(shù)據(jù)源的選擇和各數(shù)據(jù)源的價值評價是不同的,此時輿情知識庫必須為數(shù)據(jù)源選擇和數(shù)據(jù)獲取提供業(yè)務(wù)指導(dǎo),既能保證研判信息全面無遺漏,又能保證精準(zhǔn)避免不必要的數(shù)據(jù)冗余和資源浪費,從而構(gòu)建包含媒體報道、網(wǎng)民意見、政府工作等全角度、全方位、立體化的輿情數(shù)據(jù)來源。
3)網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理模塊。數(shù)據(jù)獲取后首先解決的是快速存取、檢索和計算問題,研究基于Hadoop+Spark等大數(shù)據(jù)存儲和計算架構(gòu),構(gòu)建網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理平臺,研究構(gòu)建網(wǎng)絡(luò)輿情內(nèi)容數(shù)據(jù)倉庫和用戶行為數(shù)據(jù)倉庫,進(jìn)行初步的數(shù)據(jù)融合和特征計算,為后續(xù)分析工作提供數(shù)據(jù)支撐。
4)網(wǎng)絡(luò)輿情圖譜分析模塊。該模塊借助知識圖譜將網(wǎng)絡(luò)輿情研判目標(biāo)各類信息都集中到知識圖譜構(gòu)建及應(yīng)用的統(tǒng)一架構(gòu)中。從數(shù)據(jù)、信息和知識的關(guān)系上來看,知識往往是對數(shù)據(jù)和信息進(jìn)行組織、總結(jié)、體系化歸納而得到的,而這個過程需要借助語義分析的能力。網(wǎng)絡(luò)輿情圖譜分析借助知識圖譜語義表達(dá)的優(yōu)勢強化輿情研判信息的組織、集成和分析,首先針對輿情研判任務(wù),可以從事件(內(nèi)容傳播)和人物(用戶行為)兩個角度對信息進(jìn)行組織,構(gòu)建網(wǎng)絡(luò)輿情事件知識圖譜和網(wǎng)絡(luò)輿情人物知識圖譜。具體的,綜合運用數(shù)據(jù)融合、文本分析、深度語義挖掘、智能信息處理等大數(shù)據(jù)處理技術(shù),同時結(jié)合輿情知識庫中相關(guān)領(lǐng)域知識、業(yè)務(wù)知識和輿情案例等知識保障,實現(xiàn)網(wǎng)絡(luò)輿情大數(shù)據(jù)的數(shù)據(jù)整合、信息要素提取、事件抽取和人物畫像等圖譜構(gòu)建任務(wù),根據(jù)圖譜分析的方法完成態(tài)勢分析、專題分析、熱點發(fā)現(xiàn)、預(yù)警等輿情事件分析任務(wù),完成人物畫像、軌跡識別、情感分析和行為預(yù)測等輿情用戶行為分析任務(wù),且兩者之間存在關(guān)聯(lián)分析。另外,通過跟蹤式圖譜分析還可以專門針對某一特定事件進(jìn)行監(jiān)控,探索其演化規(guī)律和傳播效應(yīng),為輿情監(jiān)督和管控等提供必要的案例素材。
5)分析結(jié)果展示和決策支持模塊。該模塊功能面向的是網(wǎng)絡(luò)輿情研判工作人員或輿情決策者,主要用于針對特定時期和特定任務(wù)條件下,根據(jù)輿情圖譜分析結(jié)果進(jìn)行可視化展示,比如輿情態(tài)勢圖譜、輿情指數(shù)發(fā)展曲線、用戶情緒分布等,同時還需要支持輿情信息的即時查詢,支持針對特定用戶的輿情信息精準(zhǔn)推薦,支持輿情行動決策的智力支持。另外,通過人機交互,實現(xiàn)輿情研判系統(tǒng)與輿情決策者的交互,交互方式力求簡單明了,能夠?qū)浨闆Q策者的知識需求進(jìn)行實時的準(zhǔn)確傳遞和反饋,發(fā)揮輿情決策者通過自身業(yè)務(wù)知識對網(wǎng)絡(luò)輿情的把控優(yōu)勢。
3基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)建構(gòu)和探討
3.1新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判系統(tǒng)建構(gòu)實踐
基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)能力還需要不斷地實踐應(yīng)用,進(jìn)行檢驗。2020年春節(jié)前突發(fā)新型冠狀病毒肺炎疫情,相關(guān)部門十分警惕由此產(chǎn)生的網(wǎng)絡(luò)空間信息疫情,即針對疫情產(chǎn)生的虛假、恐慌、不穩(wěn)定的危害性信息傳播。即使當(dāng)前國內(nèi)已然進(jìn)入了后疫情時期,但仍需關(guān)注國際疫情發(fā)展?fàn)顩r以及潛在的輿情風(fēng)險,并做好應(yīng)對和治理工作。
本文對基于知識圖譜的新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判進(jìn)行了研究,認(rèn)為系統(tǒng)研究核心任務(wù)在于對輿情應(yīng)對業(yè)務(wù)的理解和疫情輿情知識圖譜的設(shè)計。本文結(jié)合業(yè)務(wù)工作,設(shè)定應(yīng)用場景為新冠疫情條件下涉政網(wǎng)絡(luò)輿情事件發(fā)現(xiàn)、跟蹤和應(yīng)對的研判任務(wù),主要從網(wǎng)絡(luò)輿情研判和應(yīng)對業(yè)務(wù)問題、事件解析、數(shù)據(jù)獲取、知識圖譜構(gòu)建和應(yīng)用等方面介紹相關(guān)工作。
3.1.1網(wǎng)絡(luò)輿情研判和應(yīng)對業(yè)務(wù)問題
政府應(yīng)對新冠疫情的發(fā)生、發(fā)現(xiàn)、防控等工作過程中涉及政策法規(guī)、行政監(jiān)督、科學(xué)研究、社區(qū)防控和群眾工作等方方面面,牽扯各級政府機關(guān)、各地區(qū)社會組織和團體、公民個體等復(fù)雜關(guān)系,任何矛盾問題都有可能在互聯(lián)網(wǎng)、社會化媒體環(huán)境下被曝光放大,演變?yōu)樯嬲浨槲C。同時,自媒體時代信息發(fā)布較為自由,起點較低,任何不實的舉報、虛假的宣傳、曲解的報道都有可能浪費行政力量,造成社會恐慌情緒。比如武漢市青山區(qū)“垃圾車送肉”事件、“武漢9日夜轉(zhuǎn)運病人一幕”事件、“火神山醫(yī)院漏水”事件等。因此新冠疫情條件下網(wǎng)絡(luò)輿情應(yīng)對業(yè)務(wù)的核心是發(fā)現(xiàn)疫情防控中的矛盾問題并提出解決這些矛盾問題的應(yīng)對意見。具體的,通過監(jiān)控網(wǎng)絡(luò)上主流媒體、微博微信等社會化媒體平臺信息流,以輿情事件為切入點,構(gòu)建新冠疫情條件下網(wǎng)絡(luò)輿情知識圖譜,跟蹤和發(fā)現(xiàn)新的輿情事件,解析事件背后利益訴求,在符合政策法規(guī)、行業(yè)規(guī)程以及一定情理條件下給出解決問題的意見。
3.1.2網(wǎng)絡(luò)輿情研判事件解析
事件是在時間和空間中發(fā)生的事情,具有一定的時序特征和發(fā)展規(guī)律。在傳統(tǒng)的研究中,通常運用“5W1H”分析法,即何事(What)、何人(Who)、何時(When)、何地(Where)、何故(Why)和如何(How)6個要素的有機組合表示事件。將“5W1H”描述為事情、對象(人物、機構(gòu)或物體等對象)、時間、地點、動機、動作等要素,圖3為事件要素解析示例。
“事情”可以理解為事件的發(fā)生情況、發(fā)展情況、結(jié)果影響等;“對象”指事件參與或涉及的主體或客體,能反映事件涉及群體范圍及相互關(guān)系;“時間”指事件發(fā)生的時間,能反映事件影響時間;“地點”指事件發(fā)生的地域或行政區(qū)劃,能反映事件影響空間;“動機”指對象采取動作的原因或考慮,可以借此考察事件因果或順承關(guān)系;“動作”指事件發(fā)生的方式,一般為動詞或名詞,一定程度上能夠反映事件本體特征;主題事件是由一系列元事件組成,元事件一般由觸發(fā)詞區(qū)分,同一主題下元事件具有關(guān)聯(lián)性,其關(guān)系一般包括因果、順承、并發(fā)、組成等關(guān)系。為便于元事件分類,ACE評測會議定義了8種事件類型和33種子類型。本文借鑒“5W1H”分析法和ACE評測,認(rèn)為輿情事件可以表示為事件要素的組合Event=(類型,{觸發(fā)詞},{屬性:屬性值},{關(guān)系}),其中類型、觸發(fā)詞、屬性及屬性值等都是事件要素的存在方式。
3.1.3網(wǎng)絡(luò)輿情研判數(shù)據(jù)獲取
對于新冠疫情條件下涉政網(wǎng)絡(luò)輿情應(yīng)對,需要實時跟隨疫情的發(fā)展,包括國內(nèi)外新冠肺炎確診和疑似病例數(shù)、臨床醫(yī)療研究進(jìn)展情況、可用的防護指南、各地現(xiàn)行的防控政策、網(wǎng)民在各媒體平臺的討論話題等,這些數(shù)據(jù)網(wǎng)絡(luò)上基本得到很好的公開,目前借助在用系統(tǒng),初步具備系統(tǒng)采集功能。網(wǎng)民熱議的政策問題、熱點事件均應(yīng)成為輿情發(fā)現(xiàn)和應(yīng)對的關(guān)鍵點,并且相對應(yīng)的涉及政府工作的政策及后續(xù)、民間問題反映應(yīng)列入知識圖譜中,以便后期查詢和推理。
3.1.4網(wǎng)絡(luò)輿情研判知識圖譜構(gòu)建
本文以《國家突發(fā)公共事件總體應(yīng)急預(yù)案》《國家突發(fā)公共衛(wèi)生事件應(yīng)急預(yù)案》提出的突發(fā)公共事件、突發(fā)公共衛(wèi)生事件所屬關(guān)系,并結(jié)合當(dāng)前普遍關(guān)注的疫情防控情況,依次定義事件、突發(fā)公共事件等6個上層概念。結(jié)合網(wǎng)絡(luò)輿情領(lǐng)域普遍關(guān)注的國際關(guān)系層面、國家政策層面、政府機關(guān)行政層面、基層工作層面等相關(guān)事件設(shè)計新冠肺炎疫情通報及防控的下層概念,包括國際疫情通報、國內(nèi)疫情通報、國際疫情防控、國內(nèi)疫情防控等,如圖4所示。
3.2新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判系統(tǒng)應(yīng)用啟示
面對重大疫情輿情,輿情研判和應(yīng)對需要切實找準(zhǔn)業(yè)務(wù)問題,直指疫情防控矛盾焦點。重大疫情背景下,要以解決實際問題為基礎(chǔ),將風(fēng)險防控的關(guān)口前移,同時亟需在疫情認(rèn)知的維度研判網(wǎng)絡(luò)輿情風(fēng)險,提出針對疫情輿情風(fēng)險的防范化解之策。新冠疫情爆發(fā)后,網(wǎng)絡(luò)成為最大的信息集散地,重大疫情表現(xiàn)為全國性的,各地區(qū)疫情輿情在網(wǎng)絡(luò)空間都會集中呈現(xiàn),這首先考驗各地應(yīng)急處置能力,輿情事件的發(fā)展走向,很大取決于官方的處置措施。
面對重大疫情輿情,輿情研判和應(yīng)對需要切實找準(zhǔn)“時度效”。輿情研判和應(yīng)對,首先要在“時”上下功夫,網(wǎng)絡(luò)輿情信息發(fā)布門檻不高、傳播快速、網(wǎng)民接收信息又容易先入為主,因此輿情研判和應(yīng)對的窗口期十分有限,必須基于正確的輿情態(tài)勢的研判,理清頭緒,第一時間發(fā)聲,闡明事實要緊扣群眾訴求、開誠布公地做好信息公開;把握好宣傳的“度”,同時跟進(jìn)后續(xù)報道,梳理群眾意見、社會呼聲,提高輿情應(yīng)對“效能”,同時防止片面或負(fù)面信息出現(xiàn)。
面對重大疫情輿情,輿情研判和應(yīng)對需要切實找準(zhǔn)疫情應(yīng)急響應(yīng)與輿情研判風(fēng)險應(yīng)對的契合點。高等級的輿情研判風(fēng)險一般會與高等級的疫情應(yīng)急響應(yīng)對應(yīng),包括輿情主體、區(qū)域、話題等都有趨同性,尤其在疫情爆發(fā)之初尤為明顯。當(dāng)前,國內(nèi)已進(jìn)入常態(tài)化疫情防控的后疫情時期,各地均有降低疫情應(yīng)急響應(yīng)等級,但這不能代表網(wǎng)絡(luò)空間輿情風(fēng)險的減少,相反,應(yīng)急響應(yīng)等級的降低容易使得社會一定程度上放松警惕,之前嚴(yán)禁聚餐等人員的聚集活動開始出現(xiàn),甚至聚眾賭博等高風(fēng)險事件也在網(wǎng)上爆出,增加了輿情燃點爆點,也引起了輿論擔(dān)憂。因此,疫情應(yīng)急響應(yīng)與輿情研判風(fēng)險應(yīng)對并不是同步的,隨著疫情防控呈現(xiàn)“總體平穩(wěn)”態(tài)勢,先前網(wǎng)絡(luò)空間不斷積累的未完全化解的矛盾問題和風(fēng)險因素有可能再次爆發(fā),后疫情時代網(wǎng)絡(luò)疫情輿情仍可能帶來一系列波次的輿情破壞事件。
4結(jié)束語
本文在分析網(wǎng)絡(luò)輿情研判和知識圖譜及其在輿情研究中應(yīng)用等相關(guān)工作后,提出基于知識圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型,針對知識圖譜在系統(tǒng)中融合路徑進(jìn)行了討論,對網(wǎng)絡(luò)輿情研判系統(tǒng)構(gòu)建實踐和應(yīng)用進(jìn)行了探討。本文認(rèn)為,基于知識圖譜的應(yīng)用,有利于網(wǎng)絡(luò)輿情大數(shù)據(jù)的精準(zhǔn)獲取和智能化計算,有利于統(tǒng)一網(wǎng)絡(luò)輿情信息資源,有利于準(zhǔn)確分析研判網(wǎng)絡(luò)輿情的風(fēng)險點、矛盾點,有利于做到自動編報、精準(zhǔn)推薦和決策支持。知識圖譜等人工智能技術(shù)在網(wǎng)絡(luò)輿情研判中的基礎(chǔ)性應(yīng)用,可以提升網(wǎng)絡(luò)空間的輿情安全態(tài)勢分析管控能力,是提高國家政府部門突發(fā)應(yīng)急響應(yīng)能力的關(guān)鍵路徑和重要體現(xiàn),也是響應(yīng)國家戰(zhàn)略切實提高執(zhí)政能力的必然要求。
參考文獻(xiàn)
[1]劉健,畢強,李瑞.微博輿情信息傳播效果評價指標(biāo)體系構(gòu)建研究——基于模糊數(shù)據(jù)包絡(luò)分析法[J].情報理論與實踐,2016,39(12):31-38.
[2]陳建敏,余遵成.涉軍網(wǎng)絡(luò)輿情安全評估指標(biāo)體系研究[J].圖書情報研究,2018,(1):29-36.
[3]王高飛,李明.基于AHP-模糊綜合分析的移動社交網(wǎng)絡(luò)輿情預(yù)警模型研究[J].現(xiàn)代情報,2017,37(1):41-44.
[4]劉繼,李磊.大數(shù)據(jù)背景下網(wǎng)絡(luò)輿情智能預(yù)警機制分析[J].情報雜志,2019,38(12):92-97,183.
[5]彭程,祁凱,黎冰雪.基于SIR-EGM模型的復(fù)雜網(wǎng)絡(luò)輿情傳播與預(yù)警機制研究[J].情報科學(xué),2020,38(3):145-153.
[6]馬哲坤,涂艷.基于知識圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測研究[J].情報科學(xué),2019,37(2):33-39.
[7]Gottschalk S,Demidova E.Event KG:A Multilingual Event-centric Temporal Knowledge Graph[C]//European Semantic Web Conference,2018:272-287.
[8]彭立發(fā).網(wǎng)絡(luò)社區(qū)事件知識圖譜構(gòu)建[D].武漢:華中科技大學(xué),2019.
[9]Li Z,Ding X,Liu T.Constructing Narrative Event Evolutionary Graph for Script Event Extraction[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence,2018:4201-4207.
[10]周京艷,劉如,李佳娛,等.情報事理圖譜的概念界定與價值分析[J].情報雜志,2018,37(5):31-36,42.
[11]單曉紅,龐世紅,劉曉燕,等.基于事理圖譜的網(wǎng)絡(luò)輿情演化路徑分析——以醫(yī)療輿情為例[J].情報理論與實踐,2019,42(9):85,99-103.
[12]王晰巍,張柳,韋雅楠,等.社交網(wǎng)絡(luò)輿情中意見領(lǐng)袖主題圖譜構(gòu)建及關(guān)系路徑研究——基于網(wǎng)絡(luò)謠言話題的分析[J].情報資料工作,2020,41(2):47-55.
[13]徐海玲,張海濤,魏明珠,等.社交媒體用戶畫像的構(gòu)建及資源聚合模型研究[J].圖書情報工作,2019,63(9):109-115.
[14]麻友,岳昆,張子辰,等.基于知識圖譜和LDA模型的社會媒體數(shù)據(jù)抽取[J].華東師范大學(xué)學(xué)報:自然科學(xué)版,2018,(5):183-194.
[15]王杰.基于公安知識圖譜的用戶畫像研究[D].武漢:武漢理工大學(xué),2019.
[16]張興宇.基于知識圖譜構(gòu)建的微博話題推薦研究[D].淮南:安徽理工大學(xué),2019.
[17]侯位昭,張欣海,宋凱磊,等.融合知識圖譜及貝葉斯網(wǎng)絡(luò)的智能推薦方法[J].中國電子科學(xué)研究院學(xué)報,2020,15(5):488-494.
[18]牟冬梅,邵琦,韓楠楠,等.微博輿情多維度社會屬性分析與可視化研究——以某疫苗事件為例[J].圖書情報工作,2020,64(3):111-118.
[19]王丹,張祥合,趙浩宇.基于元數(shù)據(jù)的信息知識組織智能檢索系統(tǒng)設(shè)計[J].情報科學(xué),2019,37(9):113-116.
(責(zé)任編輯:郭沫含)