于凱 楊富義
摘要:通過構(gòu)建突發(fā)事件網(wǎng)絡(luò)輿情事理圖譜,揭示輿情事件之間的邏輯關(guān)聯(lián)與演化路徑,為突發(fā)事件的分析與應(yīng)對提供參考。首先,基于規(guī)則模板提取突發(fā)事件網(wǎng)絡(luò)輿情中的事件邏輯關(guān)系,構(gòu)建事理圖譜。其次,將事件向量化表示后進(jìn)行泛化處理,采用 K-Means++算法對相似事件進(jìn)行聚類和抽象以構(gòu)建網(wǎng)絡(luò)輿情抽象事理圖譜,最后在此基礎(chǔ)上對目標(biāo)事件進(jìn)行推演和預(yù)測。結(jié)果表明:突發(fā)事件事理圖譜中的事件關(guān)系類型主要為因果、并列和順承關(guān)系,大部分事件的邏輯鏈條較短,且與其他事件無明顯關(guān)聯(lián);構(gòu)建突發(fā)事件事理圖譜有利于分析事件的演化脈絡(luò)、把握關(guān)鍵事件節(jié)點(diǎn)并預(yù)測事件發(fā)展方向。
關(guān)鍵詞:突發(fā)事件;網(wǎng)絡(luò)輿情;事理圖譜;演化路徑;規(guī)則模板
中圖分類號:G 35; TP 391??????????? 文獻(xiàn)標(biāo)志碼:A
Construction of an evolution model of emergency network public opinion based on event knowledge graph
YU Kai1,2, YANG Fuyi1
(1. School ofInformation Management, Xinjiang University ofFinance and Economics, Urumqi 830012, China;2. School ofPublicAdministration, Xinjiang University ofFinance and Economics, Urumqi 830012, China)
Abstract: The? event? knowledge? graph? of? emergency? was? constructed? to? reveal? the? logical? correlationand? evolution? path? between? public? opinion? events,? and? provide? reference? for? emergency? analysis? andresponse.? Firstly,? based? on? the? rule? template,? the? logical? relationship? of? events? in? the? network? publicopinion of emergencies was extracted, and the event knowledge graph was constructed. Secondly, theevents were vectorized and generalized, and the K-Means++ algorithm was used to cluster and abstractsimilar events to build an abstract event knowledge graph of network public opinion. Finally, the targetevents were deduced and predicted on this basis. The results show that the types of event relations in theemergency? event? knowledge? graph? are? mainly? causality,? coordination? and? sequence,? and? most? of? theevents have short logical chains and no obvious correlation with other events; The construction of theemergency event knowledge graph is conducive to analyzing the evolution of the emergency, graspingthe key event nodes and predicting the development direction of the events.
Keywords: emergency; network public opinion; event knowledge graph; evolutionary path; ruletemplate
突發(fā)公共事件是突然發(fā)生,造成或可能造成嚴(yán)重社會危害,需要采取應(yīng)急處置措施予以應(yīng)對的事件,具有突發(fā)性、嚴(yán)重危害性等特點(diǎn)。黨的二十大報(bào)告指出,提高公共安全治理水平,必須堅(jiān)持安全第一、預(yù)防為主,建立大安全大應(yīng)急框架,完善公共安全體系,推動公共安全治理模式向事前預(yù)防轉(zhuǎn)型。當(dāng)前我國正處于社會轉(zhuǎn)型期和改革攻堅(jiān)期,面對錯(cuò)綜復(fù)雜的社會環(huán)境中發(fā)生的各類突發(fā)公共事件,如何實(shí)現(xiàn)事件的科學(xué)分析及預(yù)測,并及時(shí)采取妥善的應(yīng)急管理措施,已成為新時(shí)代的重大議題。
事件是人類社會的核心概念之一,人們的社會活動往往是事件驅(qū)動的[1]。1978年,錢學(xué)森、許國志等首次提出“相當(dāng)于處理物質(zhì)運(yùn)動的物理,運(yùn)籌學(xué)也可以叫做“事理”[2]。2011年,顧基發(fā)提出了“物理–事理–人理”系統(tǒng)方法論[3]。2018年,哈工大劉挺團(tuán)隊(duì)提出事理圖譜的概念,并用于金融領(lǐng)域事件預(yù)測[4]。事理圖譜是以事件為中心的知識圖譜,其聚焦事件間的動態(tài)演變關(guān)系,在挖掘事件潛在關(guān)聯(lián)、揭示輿情傳播演變規(guī)律方面具有很大優(yōu)勢。伴隨著互聯(lián)網(wǎng)時(shí)代的到來和信息傳播方式的變革,線下發(fā)生的突發(fā)公共事件經(jīng)互聯(lián)網(wǎng)的傳播發(fā)酵多表現(xiàn)為復(fù)雜多變的網(wǎng)絡(luò)輿情。要實(shí)現(xiàn)網(wǎng)絡(luò)輿情的科學(xué)管控,除把握其傳播特征和演化規(guī)律外,還需分析事件的前后關(guān)聯(lián)與發(fā)展路徑。
1相關(guān)研究
1.1知識圖譜與事理圖譜
知識圖譜最初是由谷歌公司為優(yōu)化搜索質(zhì)量而提出的語義知識庫,傳統(tǒng)模式的知識圖譜大多以實(shí)體為中心,無法滿足對復(fù)雜事件多樣化進(jìn)行描述的需求。因此,需要將事件作為中心,并且結(jié)合事件相關(guān)語義特征去構(gòu)建知識圖譜。事理圖譜可以為揭示和發(fā)現(xiàn)事件演化規(guī)律提供支持,對推動人工智能的發(fā)展具有非常重要的意義[5]。
相比于國內(nèi),國外提出事理圖譜的時(shí)間更早,目前國外研究主要關(guān)注事件及事件關(guān)系抽取模型、算法的創(chuàng)新及金融、航空、災(zāi)害等領(lǐng)域事理圖譜的構(gòu)建。如Rospocher等[6]提出了一種從新聞文章中自動抽取知識生成事件知識圖譜的方法。 Gottschalk 等[7]提出了一個(gè)多語言的以事件為中心的時(shí)序知識圖譜。 Deng 等[8]利用知識圖譜技術(shù)來輔助機(jī)器人傳動系統(tǒng)進(jìn)行高效有序的故障診斷。 Yang 等[9]將歷史金融事件鏈作為神經(jīng)網(wǎng)絡(luò)模型的輸入,預(yù)測未來事件。
國內(nèi)研究側(cè)重于將事理圖譜與大數(shù)據(jù)、人工智能與機(jī)器學(xué)習(xí)等技術(shù)融合應(yīng)用,以實(shí)現(xiàn)事理圖譜的自動構(gòu)建、事件的分析與預(yù)測等。王慕華等[10]以通用事件表示模型(simple event model ,SEM)為基礎(chǔ),構(gòu)建了暴雨預(yù)警事件圖譜模型,實(shí)現(xiàn)了以事件影響為目的的智能推理服務(wù)。陳越等[11]構(gòu)建了一個(gè)面向高中地理因果簡答題的抽象事理圖譜,實(shí)現(xiàn)了多源知識集成和多跳因果推理。劉政昊等[12]基于知識驅(qū)動的事件關(guān)聯(lián)與演化視角,構(gòu)建具有雙層結(jié)構(gòu)的事理知識圖譜,并結(jié)合案例分析了突發(fā)事件的演變邏輯。此外,學(xué)者們還探索了事理圖譜在政治、歷史、旅游等領(lǐng)域的應(yīng)用[13-15]。
1.2事理圖譜構(gòu)建技術(shù)
事理圖譜的構(gòu)建過程主要分為事件表示、事件抽取和關(guān)系抽取3部分。事件表示方法主要包括結(jié)構(gòu)元組表示、框架模板表示、本體表示及分布式表示方法。當(dāng)前研究者多使用本體在領(lǐng)域中共享信息并采用自上而下的方法構(gòu)建事理圖譜。Ehrlinger等[16]從理論和實(shí)踐中總結(jié)出7條功能性要求和兩條指導(dǎo)準(zhǔn)則,描述了事件本體構(gòu)建和選擇的標(biāo)準(zhǔn)。 Van Hage等[17]提出的 SEM 模型因具有良好的事件表示和泛化能力,常被作為事件建模的基礎(chǔ)。
事件抽取是構(gòu)建事理圖譜的關(guān)鍵環(huán)節(jié),目前廣泛應(yīng)用的事件抽取方法主要有基于規(guī)則、基于特征學(xué)習(xí)以及基于神經(jīng)網(wǎng)絡(luò)3種[18]。事件關(guān)系的抽取任務(wù)主要有時(shí)序關(guān)系抽取、事件因果關(guān)系抽取和共指關(guān)系抽取。其中事件時(shí)序關(guān)系抽取可追溯到 Chambers等[19]的研究,即從新聞數(shù)據(jù)中自動抽取統(tǒng)計(jì)腳本,并用“挖詞填空”方法來評估模型。關(guān)于事件間因果關(guān)系的抽取與應(yīng)用的研究成果則比較豐富。單曉紅等[20]通過構(gòu)建事理圖譜并進(jìn)行抽象,實(shí)現(xiàn)了對網(wǎng)絡(luò)輿情事件的演化路徑分析和預(yù)測。 Ning 等[21]構(gòu)建了基于整數(shù)線性規(guī)劃的時(shí)序和因果關(guān)系聯(lián)合抽取模型。
1.3網(wǎng)絡(luò)輿情演化與預(yù)測研究
針對網(wǎng)絡(luò)輿情演化的現(xiàn)有研究主要從演化階段、演化規(guī)律及演化動因3個(gè)方面展開。李志鵬等[22]從事件預(yù)測的形式化模型與性能度量指標(biāo)出發(fā), 將數(shù)據(jù)驅(qū)動的事件預(yù)測技術(shù)分為8類,對事件預(yù)測關(guān)鍵技術(shù)的研究和發(fā)展進(jìn)行了分析與總結(jié)。網(wǎng)絡(luò)輿情的預(yù)測研究集中于輿情風(fēng)險(xiǎn)等級、網(wǎng)民情緒及輿情發(fā)展趨勢的預(yù)測。連芷萱等[23]通過構(gòu)建多維指標(biāo)體系,預(yù)測輿情的風(fēng)險(xiǎn)級別。蘭月新等[24]對網(wǎng)絡(luò)輿情中網(wǎng)民情緒演化機(jī)理和趨勢進(jìn)行了預(yù)測,得到不同類型情緒的網(wǎng)民數(shù)量變化。Jin等[25]將事件預(yù)測問題轉(zhuǎn)化為時(shí)序事件圖譜上的鏈接預(yù)測問題, 提出了一種自回歸的循環(huán)事件網(wǎng)絡(luò)架構(gòu)模型。
綜上所述,針對網(wǎng)絡(luò)輿情的現(xiàn)有研究更多集中于事件某方面的屬性,而非事件本身的演化路徑。事理圖譜在網(wǎng)絡(luò)輿情領(lǐng)域的應(yīng)用還不成熟,研究涉及到的關(guān)系類型主要是因果和順承關(guān)系,其他事件關(guān)系類型較少。此外,由于大規(guī)模標(biāo)注的突發(fā)事件關(guān)系數(shù)據(jù)集稀缺,在該領(lǐng)域上的關(guān)系推理及事件預(yù)測研究適用范圍較為有限。本文聚焦于突發(fā)事件網(wǎng)絡(luò)輿情的演化路徑分析及事件預(yù)測,試圖在大量的突發(fā)事件中尋找出更具代表性的事理邏輯,分析不同類型事件間的發(fā)展規(guī)律與演化特征,為管理部門對網(wǎng)絡(luò)輿情的分析和管控提供依據(jù)。
2模型方法介紹
首先,提取突發(fā)事件網(wǎng)絡(luò)輿情中事件的因果、順承等關(guān)系,構(gòu)建事理圖譜以揭示事件的發(fā)展脈絡(luò)。其次,將事件向量化表示后進(jìn)行泛化處理,以構(gòu)建網(wǎng)絡(luò)輿情抽象事理圖譜,利用抽象事理圖譜中的方向和概率大小對新事件進(jìn)行推演和預(yù)測。具體研究模型如圖1所示。
2.1網(wǎng)絡(luò)輿情事理圖譜構(gòu)建
事理圖譜的構(gòu)建包括事件抽取、事件關(guān)系抽取兩部分。其中,事件抽取主要借助哈工大語言技術(shù)平臺( Language Technology Platform , LTP )進(jìn)行處理,事件關(guān)系抽取則采用規(guī)則模板匹配的方式提取事件三元組,具體步驟如圖2所示。
構(gòu)建中文規(guī)則模板進(jìn)行事件關(guān)系判定,提取網(wǎng)絡(luò)輿情中的事件關(guān)系三元組用于構(gòu)建事理圖譜。其中,事件關(guān)系包括轉(zhuǎn)折、順承、并列、條件和因果關(guān)系,部分規(guī)則模板如表1所示。
2.2網(wǎng)絡(luò)輿情抽象事理圖譜構(gòu)建
抽象事理圖譜中揭示了領(lǐng)域內(nèi)較為核心的事件知識,事理圖譜泛化為抽象事理圖譜的過程是對事理知識的凝練[26]。本文在構(gòu)建抽象事理圖譜時(shí)主要包括事件向量化、事件泛化及抽象等過程,具體步驟如圖3所示。
2.2.1事件向量化
研究采用騰訊 AI Lab 中文預(yù)訓(xùn)練詞向量對事件文本數(shù)據(jù)進(jìn)行向量化表示。該數(shù)據(jù)集包含800多萬中文詞匯,其中,每個(gè)詞對應(yīng)一個(gè)200維的向量。它通過 Directional Skip-Gram 方法訓(xùn)練而成,可使用gensim模塊調(diào)用,相比于現(xiàn)有中文詞向量數(shù)據(jù),其覆蓋率和準(zhǔn)確性有較大提升。事件的向量由各詞向量平均得到。
2.2.2事件泛化
運(yùn)用 K-Means++算法對事理圖譜中的具體事件進(jìn)行泛化,即先對事件進(jìn)行歸并處理,將同類事件用一個(gè)抽象事件來表示。該算法確定初始質(zhì)心原則是聚類中心之間的距離盡可能大,具體步驟如下:
a.將事件進(jìn)行向量化表示,每一個(gè)向量作為聚類的一個(gè)樣本點(diǎn);
b.隨機(jī)選擇一個(gè)點(diǎn)作為第一個(gè)聚類中心;
c.對于數(shù)據(jù)集中任意點(diǎn) x ,用歐式距離計(jì)算它與最近聚類中心的距離 D(x);
d.選擇與原聚類中心 D(x)較大的點(diǎn)作為新的聚類中心;
e.重復(fù) c 和 d 直到確定 k 個(gè)聚類中心;
f.利用這 k 個(gè)初始的聚類中心來運(yùn)行標(biāo)準(zhǔn)的 K-Means 算法。
3實(shí)證分析
3.1數(shù)據(jù)來源與處理
由于突發(fā)事件語料庫較少,本研究在復(fù)用上海大學(xué)構(gòu)建的 CEC(Chinese Emergency Corpus)語料庫[27]和武漢理工大學(xué)構(gòu)建的突發(fā)事件公共數(shù)據(jù)集[28]的基礎(chǔ)上,再爬取部分熱點(diǎn)事件數(shù)據(jù)作為補(bǔ)充,最終數(shù)據(jù)量為10349條。爬取的熱點(diǎn)事件來自于互聯(lián)網(wǎng)社會熱點(diǎn)聚合平臺?“知微事見”,針對輿情事件庫中影響力指數(shù)較高的突發(fā)事件,采用八爪魚數(shù)據(jù)采集軟件對該網(wǎng)站頁面內(nèi)容進(jìn)行爬取,爬取時(shí)間為2022年9月30日,事件時(shí)間跨度為2017年1月至2022年9月。共爬取數(shù)據(jù)17332條,經(jīng)篩選后保留有效數(shù)據(jù)8735條。采集字段包括事件分類、時(shí)間、事件名稱、內(nèi)容、影響力指數(shù)和標(biāo)簽,如表2所示。
3.2網(wǎng)絡(luò)輿情事理圖譜構(gòu)建
為了進(jìn)行事件抽取,需要對數(shù)據(jù)進(jìn)行標(biāo)注處理,采用哈工大 LTP 平臺對數(shù)據(jù)進(jìn)行預(yù)處理,具體包括句子切分、分詞、詞性標(biāo)注、命名實(shí)體識別、語義角色標(biāo)注和依存句法分析。研究用到的依存關(guān)系類型如表3所示。
根據(jù)圖2所示的事件抽取步驟,對所有事件數(shù)據(jù)進(jìn)行處理后得到事件三元組共7654條。在事件抽取的基礎(chǔ)上,結(jié)合上文構(gòu)建的規(guī)則模板對事件間關(guān)系進(jìn)行抽取,將抽取到的結(jié)果以( pre_ event, relation, post_event)三元組的形式存入 Mongo- DB 數(shù)據(jù)庫中。其中:“pre_event”代表前序事件;“post_event”代表后序事件;“relation ”代表事件間的邏輯關(guān)系類型。關(guān)系抽取結(jié)果如表4所示。
3.3基于事理圖譜的網(wǎng)絡(luò)輿情演化與預(yù)測
3.3.1突發(fā)事件網(wǎng)絡(luò)輿情演化路徑分析
通過構(gòu)建網(wǎng)絡(luò)輿情事理圖譜,有利于剖析具體輿情事件的演化路徑,總結(jié)某一領(lǐng)域網(wǎng)絡(luò)輿情的演化規(guī)律。根據(jù)上文得到的事件三元組構(gòu)建事理圖譜,結(jié)果如圖4所示。
從事件發(fā)展角度來看,事理圖譜可以明晰事件各要素之間的關(guān)聯(lián)與邏輯特征。由圖4可知,突發(fā)事件事理圖譜中除少數(shù)事件邏輯關(guān)系復(fù)雜且形成較長邏輯鏈條外,大部分事件傳播鏈較短,且與其他事件之間關(guān)聯(lián)較少。其原因可能是研究所爬取的事件數(shù)據(jù)不夠完整,造成數(shù)據(jù)稀疏,或不同事件類型之間無明顯關(guān)聯(lián)。除鏈狀結(jié)構(gòu)外,圖譜中還有大量環(huán)狀結(jié)構(gòu)和中心發(fā)散的結(jié)構(gòu),這類結(jié)構(gòu)中往往有度較大的節(jié)點(diǎn),即具有代表性的關(guān)鍵事件。重點(diǎn)關(guān)注這些事件的關(guān)聯(lián)關(guān)系和演化特征,可以更容易定位熱點(diǎn)和焦點(diǎn)問題,有利于把握事件的未來發(fā)展方向。如圖4中部分關(guān)鍵節(jié)點(diǎn)分別表示“交通事故”、“媒體報(bào)道”、“人員傷亡”、“氣候影響”等內(nèi)容,其對于突發(fā)事件的應(yīng)對和處理具有導(dǎo)向性作用,在關(guān)鍵節(jié)點(diǎn)處進(jìn)行把控,有助于引導(dǎo)事件的后續(xù)走向,避免造成不良影響。
突發(fā)事件事理圖譜共包含事件關(guān)系三元組共20115條,各類關(guān)系的數(shù)量及占比情況如表5所示。
若以事件類型進(jìn)行區(qū)分,事理圖譜能刻畫出特定類型事件的演化路徑,有助于對比分析各類事件演變規(guī)律的異同。以社會安全事件為例進(jìn)行分析,如圖5所示為“唐山燒烤店打人事件”事理圖譜。
由圖5可以看出事件的邏輯關(guān)聯(lián)與演化路徑,該事件主要產(chǎn)生了4個(gè)邏輯鏈條: a.事件的緣起及發(fā)展過程。事件施事者因暴力毆打他人導(dǎo)致受害者受傷送醫(yī),警方介入調(diào)查后發(fā)現(xiàn)嫌疑人團(tuán)伙存在惡勢力組織,最后7人均被逮捕拘留。 b.事件的處置結(jié)果。嫌疑人因數(shù)罪并罰被法院判處罰款和有期徒刑。 c.事件造成的不良影響。該事件觸碰了法律底線,危害了公共安全,引發(fā)了社會廣泛的討論。 d.事件產(chǎn)生的其他影響。唐山市開展社會治安整治專項(xiàng)行動,通過多種方式發(fā)動群眾舉報(bào)各類違法犯罪線索。除以上4個(gè)主要鏈條外,事件的演化方向還存在分化現(xiàn)象,如對該案件保護(hù)傘問題的質(zhì)疑、對公共安全和社會道德的討論。這些事件在一定程度上也會造成民眾安全感的缺失和社會情緒的極端化,潛在危害難以預(yù)估。在實(shí)踐中,有關(guān)部門應(yīng)結(jié)合事理圖譜,梳理出事件關(guān)鍵路徑,重點(diǎn)關(guān)注演化過程中涉及的關(guān)鍵對象;并且可以采取一些防范措施,預(yù)防潛在風(fēng)險(xiǎn)事件的發(fā)生。
3.3.2抽象事理圖譜構(gòu)建
按照上文的步驟構(gòu)建抽象事理圖譜。首先,使用 python 軟件調(diào)用gensim模塊中的KeyedVectors函數(shù),使用騰訊 AI Lab 中文詞向量對事件三元組進(jìn)行向量化表示,取詞向量的平均值作為事件向量,將事件向量存入 MongoDB 數(shù)據(jù)庫用于后續(xù)聚類處理。
其次,對事件進(jìn)行泛化,將相似度較高的事件進(jìn)行歸并處理。由于泛化后無法自動為每一事件類生成標(biāo)簽,因此,通過 Embedding Projector 應(yīng)用程序進(jìn)行高維數(shù)據(jù)的可視化,輔助尋找聚類后具有代表性的標(biāo)簽。Embedding Projector 是2016年谷歌開源的用于交互式可視化和高維數(shù)據(jù)分析的網(wǎng)頁工具,它提供 PCA ( principal component analysis)、 T-SNE ( T-distributedstochastic neighbor embedding)和自定義線性投影3種常用的數(shù)據(jù)降維方法,輔助用戶實(shí)現(xiàn)復(fù)雜數(shù)據(jù)的可視化[29]。本文采用 T-SNE 對向量數(shù)據(jù)進(jìn)行處理和聚類,該方法用于探索局部近鄰值和尋找聚類,可以確保一個(gè)嵌入保留了數(shù)據(jù)中的所有含義,結(jié)果如圖6所示。
由圖6可見,運(yùn)行 T-SNE 方法后,向量形成了一些聚簇,聚簇表示事件向量間的余弦距離較為接近,即簇內(nèi)事件大致屬于同一類別。
如圖7所示,左側(cè)每個(gè)圓點(diǎn)表示一個(gè)事件向量。選中任意事件,右側(cè)部分是查找出的與之最接近的100個(gè)鄰居節(jié)點(diǎn)。節(jié)點(diǎn)顏色越接近源節(jié)點(diǎn),表示兩個(gè)向量相似度越高。將這些相似節(jié)點(diǎn)的標(biāo)簽中的高頻詞作為事件聚簇整體的標(biāo)簽,則可以得到一個(gè)抽象化描述。
結(jié)合前文構(gòu)建的事理圖譜和事件向量聚類可視化結(jié)果,可以梳理出不同類型事件的演化路徑,即抽象事理圖譜。抽象事理圖譜展現(xiàn)了事件之間的關(guān)聯(lián)關(guān)系,暗含了事件未來可能演化的方向,事件間轉(zhuǎn)移的概率則代表某事件未來發(fā)生的可能性。以自然災(zāi)害事件中的地震為例,如圖8所示,可以得到“地震”這一原因事件可能造成房屋受損、人員傷亡等結(jié)果事件,事件間連邊概率大小是根據(jù)每一事件占“地震”后序事件的比重來確定的,概率越大,說明該事件越可能出現(xiàn)。圖中:與“地震”直接相連的事件表示該事件為直接結(jié)果,如“應(yīng)急救援”、“人員傷亡”;而與“地震”間接相連的事件則為其次生結(jié)果,如“經(jīng)濟(jì)損失”、“傳染病”。在實(shí)際應(yīng)用中,當(dāng)收到某地的地震預(yù)警信息,應(yīng)首先針對可能發(fā)生概率最大的直接結(jié)果事件迅速采取應(yīng)急舉措,同時(shí)還應(yīng)該預(yù)防一些潛在危機(jī)的發(fā)生,如傳染病的預(yù)防和交通秩序的維護(hù),盡可能減少災(zāi)害造成的各種損失。由此可見,抽象事理圖譜的構(gòu)建有助于識別一般性事件中的一些關(guān)鍵節(jié)點(diǎn),為有關(guān)部門抓住重點(diǎn)問題、有的放矢地進(jìn)行突發(fā)事件應(yīng)對提供有效的決策參考。
3.3.3網(wǎng)絡(luò)輿情事件預(yù)測
在得到抽象事理圖譜的基礎(chǔ)上,可以對突發(fā)事件領(lǐng)域內(nèi)任意一個(gè)新發(fā)生的網(wǎng)絡(luò)輿情事件進(jìn)行預(yù)測,具體步驟為:首先,將該事件進(jìn)行向量化表示,計(jì)算該事件與事理圖譜中各事件之間的相似度值,選擇相似度最高的事件作為預(yù)測的起點(diǎn)事件;其次,在突發(fā)事件抽象事理圖譜中找到起點(diǎn)事件的泛化事件;最后,遍歷抽象事理圖譜,找到泛化事件的后續(xù)事件節(jié)點(diǎn)及其權(quán)重,根據(jù)權(quán)重判斷哪些是最有可能發(fā)生的事件。
4結(jié)束語
互聯(lián)網(wǎng)時(shí)代,由社交網(wǎng)絡(luò)產(chǎn)生的大量輿情信息存儲在無結(jié)構(gòu)化數(shù)據(jù)中,傳統(tǒng)的以專家經(jīng)驗(yàn)為主的輿情治理模式已經(jīng)無法滿足多樣化和精細(xì)化的管理需求,亟需一種先進(jìn)的知識組織方式來對復(fù)雜事件進(jìn)行描述與處理,提升應(yīng)急管理水平。本文通過構(gòu)建突發(fā)事件事理圖譜來揭示事件演化規(guī)律并預(yù)測后續(xù)事件。研究發(fā)現(xiàn),利用事理圖譜輔助突發(fā)事件的分析和管控,有利于揭示該領(lǐng)域事件的演化規(guī)律與特征、識別關(guān)鍵事件并挖掘潛在事件關(guān)聯(lián)。在實(shí)際應(yīng)用中,構(gòu)建抽象事理圖譜可以基于大量以往案例預(yù)測后續(xù)事件,優(yōu)化管理部門的應(yīng)急處置和預(yù)防工作,減輕突發(fā)事件給人們帶來的損失。本文通過對突發(fā)事件領(lǐng)域事理圖譜構(gòu)建及應(yīng)用的研究,豐富了知識圖譜在突發(fā)事件領(lǐng)域的應(yīng)用場景。不足之處在于: a.本文的數(shù)據(jù)來源為各平臺上關(guān)于事件的報(bào)道信息,并未爬取完整事件文本及評論內(nèi)容,丟失了部分關(guān)聯(lián)事件; b.對于事件間關(guān)系的抽取,采用基于規(guī)則模板的方式進(jìn)行匹配,準(zhǔn)確率和有效性有待提高。下一步將重點(diǎn)提升知識抽取及泛化算法的準(zhǔn)確性和有效性,以優(yōu)化事件預(yù)測效果。
參考文獻(xiàn):
[1]李忠陽.面向文本事件預(yù)測的事理圖譜構(gòu)建及應(yīng)用方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué), 2021.
[2]錢學(xué)森, 許國志, 王壽云.組織管理的技術(shù)——系統(tǒng)工程[J].上海理工大學(xué)學(xué)報(bào), 2011, 33(6):520–525.
[3]顧基發(fā).物理事理人理系統(tǒng)方法論的實(shí)踐[J].管理學(xué)報(bào),2011, 8(3):317–322,355.
[4] DINGX,LIZY,LIUT,etal. ELG: aneventlogic graph[EB/OL].(2019-08-07)[2023-01-02]. https://arxiv. org/abs/1907.08015
[5]王蘭成, 張思龍, 許和旭.網(wǎng)絡(luò)輿情事理圖譜構(gòu)建及應(yīng)用[J].中華醫(yī)學(xué)圖書情報(bào)雜志, 2021, 30(5):17–23.
[6] ROSPOCHERM,VANERPM,VOSSENP,etal. Buildingevent-centricknowledgegraphsfromnews[J]. Journal of Web Semantics, 2016, 37–38:132–151.
[7] GOTTSCHALKS,DEMIDOVAE. EventKG: a multilingual event-centric temporal knowledge graph[C]// Proceedingsofthe 15thEuropeanSemanticWeb Conference. Heraklion: Springer, 2018.
[8] DENG J, WANG T, WANG Z W, et al. Research on eventlogicknowledgegraphconstructionmethodofrobottransmission system fault diagnosis[J]. IEEE Access, 2022,10:17656–17673.
[9] YANG Y Y, WEI Z Y, CHEN Q, et al. Using external knowledge for financial event prediction based on graph neuralnetworks[C]//Proceedingsofthe 28thACM InternationalConferenceonInformationand Knowledge Management. Beijing: ACM, 2019.
[10]王慕華 , 王天岳 , 李雁鵬 , 等.基于通用事件表示模型(SEM)的暴雨預(yù)警事件圖譜研究[J].災(zāi)害學(xué) , 2021, 36(4):74–78.
[11]陳越, 何宇豪, 孫亞偉, 等.基于抽象事理圖譜的因果簡答題求解方法[J].中文信息學(xué)報(bào), 2022, 36(4):124–136.
[12]劉政昊, 曾曦, 張志劍.面向應(yīng)急管理的金融突發(fā)事件事理知識圖譜構(gòu)建與分析研究[J].信息資源管理學(xué)報(bào) , 2022, 12(3):137–151.
[13]白璐, 周子雅, 李斌陽, 等.面向政治領(lǐng)域的事理圖譜構(gòu)建[J].中文信息學(xué)報(bào), 2021, 35(4):66–74.
[14]劉忠寶, 黨建飛, 張志劍.《史記》歷史事件自動抽取與事理圖譜構(gòu)建研究[J].圖書情報(bào)工作 , 2020, 64(11):116–124.
[15]鄧君, 彭珺, 孫紹丹, 等.基于事理圖譜的游記文本知識發(fā)現(xiàn)——以康養(yǎng)旅游為例[J].現(xiàn)代情報(bào) , 2022, 42(7):105–113.
[16] EHRLINGERL,W??W. Towardsadefinitionof knowledge graphs[C]//Joint Proceedings of the Posters and DemosTrackofthe 12thInternationalConferenceon SemanticSystems - SEMANTiCS2016 andthe 1st International Workshop on Semantic Change & Evolving Semantics (SuCCESS'16) Co-Locatedwiththe 12thnternationalConferenceonSemanticSystems(SEMANTiCS 2016). Leipzig: CEUR-WS. org, 2016.
[17] VAN HAGE W R, MALAIS? V, SEGERS R, et al. Designand use of the simple event model (SEM)[J]. Journal of Web Semantics, 2011, 9(2):128–136.
[18]王毅, 沈喆, 姚毅凡, 等.領(lǐng)域事件圖譜構(gòu)建方法綜述[J].數(shù)據(jù)分析與知識發(fā)現(xiàn), 2020, 4(10):1–13.
[19] CHAMBERS N, JURAFSKY D. Unsupervised learning of narrative event chains[C]//Proceedings of ACL-08: HLT. Columbus: ACL, 2008.
[20]單曉紅, 龐世紅, 劉曉燕, 等.基于事理圖譜的網(wǎng)絡(luò)輿情事件預(yù)測方法研究[J].情報(bào)理論與實(shí)踐 , 2020, 43(10):165–170.
[21] NING Q, FENG Z L, WU H, et al. Joint reasoningfor temporal and causal relations[C]//Proceedings of the 56thAnnualMeetingoftheAssociationforComputational Linguistics. Melbourne: ACL, 2018.
[22]李志鵬, 楊陽朝, 廖勇, 等.數(shù)據(jù)驅(qū)動的事件預(yù)測技術(shù)最新研究進(jìn)展[J].信息安全學(xué)報(bào), 2022, 7(1):40–55.
[23]連芷萱, 蘭月新, 夏一雪, 等.面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動態(tài)分類與預(yù)測模型研究[J].情報(bào)雜志, 2018, 37(5):123–133,140.
[24]蘭月新, 夏一雪, 劉冰月, 等.面向輿情大數(shù)據(jù)的網(wǎng)民情緒演化機(jī)理及趨勢預(yù)測研究[J].情報(bào)雜志, 2017, 36(11):134–140.
[25] JIN W, QU M, JIN X S, et al. Recurrent event network: autoregressive structure inferenceover temporal knowledge graphs[C]//Proceedings of 2020 Conference on Empirical MethodsinNaturalLanguageProcessing. Stroudsburg PA: Association for Computational Linguistics, 2020.
[26]劉雅姝, 欒宇, 周紅磊, 等.基于事理圖譜的重大突發(fā)事件動態(tài)演變研究[J].圖書情報(bào)工作 , 2022, 66(10):143–151.
[27]劉煒, 王旭, 張雨嘉, 等.一種面向突發(fā)事件的文本語料自動標(biāo)注方法[J].中文信息學(xué)報(bào), 2017, 31(2):76–85.
[28]邱奇志, 周三三, 劉長發(fā), .等基于文體和詞表的突發(fā)事件信息抽取研究[J].中文信息學(xué)報(bào), 2018, 32(9):56–65.
[29] SMILKOVD,THORATN,NICHOLSONC,etal. Embeddingprojector: interactivevisualizationand interpretationembeddings[EB/OL].of(2016-11-16)[2023-01-02]. https://arxiv.org/abs/1611.05469
(編輯:丁紅藝)