李陽 張詩瑩 盛東方
摘? ?要:分析情報與事理圖譜的關聯(lián)邏輯并對其未來發(fā)展提出若干思考,旨在為事理圖譜發(fā)展、基于事理圖譜的情報服務創(chuàng)新等提供借鑒和啟發(fā)。文章從信息鏈知識要素、復雜關系辨識、面向重大事件的服務等角度分析了情報與事理圖譜的關聯(lián)邏輯;提出事理圖譜之于情報領域在組織風險管理、事件態(tài)勢預測、用戶行為挖掘等方面的賦能作用;分析了基于事理圖譜的情報支持關鍵流程和方法;從事理圖譜技術體系完善與情報應用、開源信息世界的“假關系”與數(shù)據(jù)治理、基于多模態(tài)數(shù)據(jù)的事理大圖與情報圖景構建等方面提出若干思考。目前,情報與事理圖譜的碰撞已經(jīng)取得了一定的進展,但仍然存在刻畫深度不夠、“工程化”等不足,兩者應互為支撐、互相促進,進而面向領域搭建出全情報圖景。
關鍵詞:情報;事理圖譜;知識圖譜;情報學;突發(fā)事件;事件預測
中圖分類號:G350? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023030
Abstract The paper analyzes the associative logic between intelligence and eventic graph, and proposes some thoughts on its future development, aiming to provide reference and inspiration for the development of eventic graph as well as the innovation of intelligence services based on eventic graph. In this paper, the associative logic of intelligence and eventic graph is analyzed in terms of information chain knowledge elements, complex relationship exploration, and services for major events. Besides the empowering role of eventic graph for intelligence field in organizational risk management, event prediction, and user behavior mining is also explored. Whats more, the key processes and methods of intelligence support based on eventic graph are analyzed. At last, the paper proposes some thoughts on the improvement of eventic graph technical system and intelligence application, data governance for “fake relationships” in open source information world, the construction of eventic graph and intelligence picture based on multimodal data. At present, some progress has been made in the collision of intelligence and eventic graph, but there are also some shortcomings such as insufficient depth of characterization and “engineering”. The two should support and promote each other to build a full intelligence picture oriented to the field.
Key words intelligence; eventic graph; knowledge graph; information science; emergency; event forecasting
1? ?問題的提出
事理圖譜是近幾年學術界、工業(yè)界等興起的一個新方向。2022年底,中國計算機學會微信公眾號發(fā)布術語熱詞“事理圖譜”,將事理圖譜(Eventic Graph,EG)定義為一個事理邏輯知識庫,旨在描述事件之間的演化規(guī)律和模式[1]。實際上,早在2017年,事理圖譜的概念就由國內哈爾濱工程大學劉挺教授在中國計算機大會上首次提出,而后事理圖譜在各個領域、行業(yè)、學科等輻射開來,并掀起一股熱潮。
與事理圖譜相關的是知識圖譜,自2012年谷歌公司將知識圖譜用于搜索引擎優(yōu)化以來,知識圖譜領域已經(jīng)取得了快速的發(fā)展,并向各類知識密集型方向延伸。然而,知識圖譜主要描述的是實體及其屬性和關系,偏向于一種靜態(tài)型的知識抽取與展現(xiàn)。而事理圖譜聚焦的是事理邏輯知識的挖掘,從圖結構的角度看,其節(jié)點是抽象的事件,有向邊表示事件之間的演化關系。事理圖譜的主要目的是找出事件之間的因果、順承、條件等演化關系,進而支持下游的任務和服務,如知識問答、重要信息判別、認知推理、事件預測、知識管理等[2-3]??梢哉f,事理圖譜是一種全新的知識表示形式。
作為對信息技術高度敏感的情報學學科,長期在知識組織、知識管理等領域鉆研、扎根和沉淀,自然對知識圖譜相關領域發(fā)展有著更強的感知意識。近幾年來情報學學科開始關注事理圖譜這一新技術、新思維對情報分析、情報服務等的影響。從近年來情報學領域相關科研課題就可以看出學科對事理圖譜的關注。如國家社科基金方面,有2019年的“基于事理圖譜的社會化問答知識組織與服務研究”、2020年的“基于事理圖譜的重大突發(fā)事件演變機制研究”、2021年的“面向風險治理的突發(fā)事件事理圖譜構建研究”、2022年的“基于事理圖譜的應急情報感知推理與智慧決策研究”以及本研究團隊的課題“數(shù)智賦能的重大突發(fā)事件預測型情報服務機制研究”等。安全情報領域對事理圖譜也有關注,如2019年公安部課題“基于事理圖譜的案線情報分析技術”等??傮w來看,情報學領域已經(jīng)將事理圖譜作為一個重要的技術支點和應用前景,也催生了一些探索性的研究成果,包括知識組織領域[4]、輿情分析領域[5]、突發(fā)事件應急情報領域[6]等。當然,事理圖譜是一個復雜的系統(tǒng)工程,作為一個“新事物”,其理論基礎、技術路徑與技術體系等仍然處于發(fā)展和完善之中。有鑒于此,本文從情報學角度出發(fā),探討情報與事理圖譜的碰撞、相互影響和互促關系,并對其相關發(fā)展提出思考,旨在為事理圖譜發(fā)展、情報支持與情報服務創(chuàng)新等提供借鑒和啟發(fā)。
2? ?情報與事理圖譜關聯(lián)的基本分析
情報與事理圖譜之間具有天然的關聯(lián)和共通性,可以從以下三個方面解釋:
首先,事理邏輯知識是信息鏈中知識要素研究的重要內容。早在1980年,著名情報學家布魯克斯就提出了“知識地圖”的構想,并指出情報學的真正任務應該是組織、加工和整理客觀知識[7]。從情報的定義看,情報也被認為是針對特定需求被激活了的知識。一直以來,情報學致力于信息序化、知識組織以及基于信息知識的情報服務;從知識視角看,過去情報學所探索的知識主要來源于文獻空間,其中,文獻計量范式下的科學知識圖譜也一直是情報學研究的重心,在NLP快速發(fā)展的影響下,近年來情報學界也逐漸涉獵自然語言處理范式下的知識圖譜問題[8]。但總體來看,這種知識主要聚焦于實體、實體屬性及其關系的挖掘與分析。而在社會化發(fā)展過程中,事件是社會活動的重要表征形式,往往是很多實體的“上維”,在此背景下,圍繞事件、事件屬性及其關系的事理邏輯知識探究成為傳統(tǒng)靜態(tài)實體知識的有效補充;從情報學的角度看,事理邏輯知識屬于信息鏈知識要素的一部分,是人類社會活動中非常普遍且十分有價值的知識,是認知智能和認知推理的重要因子。作為一種新的知識概念和內容以及一種新的信息組織和知識組織形式,事理圖譜自然也就被納入到情報學的相關研究視野之中。而且,對事件在時間、空間維度上的演化信息進行加工分析,進而形成特定的知識和情報,本身也是情報分析的基本需求以及情報學的重要任務之一。
其次,事理圖譜關注事件之間的演化關系和脈絡,而對復雜關系的關注和辨識是情報分析與研究的核心關切。從研究維度來看,基于數(shù)據(jù)的情報分析可以概括為描述性分析、相關性分析、因果性分析、復雜關系分析等,其總體上是一種遞進的關系。過去,情報學一直以統(tǒng)計性內容分析、深度性內容分析、影響因素與相關分析、關聯(lián)分析等為主,隨著因果革命的崛起,情報學也開始重視各種因果分析、因果推斷的闡釋和探索。但從高階情報的角度來看,優(yōu)質的情報產品一般需要通過系統(tǒng)性的分析、辨析和論證才能挖掘而出,這就離不開對各種動態(tài)復雜關系的梳理、剝離、關聯(lián)和抽取。在社會運轉過程中,事物的發(fā)展總是具有聯(lián)系性,人類命題記憶通過事件來表征,而事件又通過數(shù)據(jù)或網(wǎng)絡信息世界來記錄和反映,由此進一步表征出事物發(fā)展的內在聯(lián)系。而對這種全局關系、復合關系、隱性關系、“蛛絲馬跡”關系等的探索一直也是情報學在(弱)信號發(fā)現(xiàn)、情報預警分析等領域的重要關切。事理圖譜所關注的因果關系、順承關系、轉折關系、并發(fā)關系、反轉關系等及其推理恰恰可以支持情報分析對于復雜關系的探索,拓展了情報學對復雜系統(tǒng)情境下“關系世界”的探索,從邏輯規(guī)則角度支持情報推理和“關系情報”的生成,進而有效輔助情報綜合研判與決策。
最后,情報學向來關注重大事件和活動,致力于為重大事件的管理決策、預警預測等提供“耳目、尖兵、參謀”服務,這與事理圖譜這種以事件為核心的技術體系與“落地服務”不謀而合。著名情報學家包昌火曾指出了情報學界在決策支持層面的“黎明靜悄悄”景象,認為“鮮有情報學家對重大事件、威脅和危機的研判、警示、呼喚和謀劃”[9]。而后的一段時間,情報學界加大了對重大事件、重大戰(zhàn)略的關注度,在《國家安全法》、“南京共識”、“華山情報論壇”等一系列政策和學術會議的影響下,情報學逐漸在國家安全事件、公共安全與突發(fā)事件、(網(wǎng)絡)輿情事件等領域積極建構話語權。尤其是在新冠肺炎疫情的影響下,情報學繼續(xù)深化應急情報、健康信息學等相關前沿方向,并取得了不錯的學術成就。事理圖譜關注到了事件是人類命題記憶的基本存儲單位,認為以事件作為知識基本單元來反映客觀世界更符合人類的理解和思維習慣[10]。從這個角度看,事理圖譜對于事件的重視本質上為情報學更好關注重大事件情報服務提供了一種新路徑。事理圖譜可以在事件的“過去”與“未來”、“前因”和“后果”之間架起一座橋梁,從厘清事件本質、傳導路徑等角度實現(xiàn)情報監(jiān)測、識別、預測和決策支持,這種技術功能和領域快速配置的優(yōu)勢也促使了兩者的有機結合。
3? ?事理圖譜在情報領域的應用
基于情報任務以及事理圖譜本身的技術特點,促進情報與事理圖譜的融合,能夠進一步拓展面向領域的知識系統(tǒng)和情報系統(tǒng)建構,進而促進情報服務功能的升級,開拓更多的情報應用空間。
第一,更好支持組織風險管理。VUCA環(huán)境和風險社會背景下,組織的發(fā)展需要時刻保持危機意識,因此開展風險管理是組織保持可持續(xù)發(fā)展的必備課。任何風險都表征出一定的風險信號,情報研究的任務之一就是揭示這些信號,為組織提供風險監(jiān)控與預警。事理圖譜與情報分析流程和方法的融合,可以更好刻畫出事件發(fā)展過程中的可能性異常點、未知風險和潛在危機,支持熱點事件或負面風險事件的檢測和發(fā)現(xiàn),并厘清相關利益共同體邏輯關系,推動基于風險情報的智能匹配與警示、觸發(fā)式預警等的實現(xiàn),由此可以更好服務于組織風險管理。如針對企業(yè)輿情風險問題,基于歷史數(shù)據(jù)建構相關企業(yè)網(wǎng)絡輿情事理圖譜,通過一定的事理圖譜沉淀和積累,就可以做到系統(tǒng)性的企業(yè)網(wǎng)絡輿情風險隱患排查。具體而言,就是在企業(yè)危機事件發(fā)生時能夠基于相關的實時數(shù)據(jù)刻畫出相關輿情的風險等級、次生衍生輿情、負面情緒關注主題等內容,以支持企業(yè)及時開展風險處置并規(guī)避風險,其本質上是一種增強型風險情報服務。
第二,更好支持事件態(tài)勢預測。預測一直是情報研究的核心任務,當前的預測情報研究正在從定性、定性定量結合向數(shù)智化轉向。事理圖譜著眼于事件的演化邏輯、規(guī)律和模式,這種事件傳導驅動路徑可為事件發(fā)展態(tài)勢提供有效預測。事理圖譜與預測情報研究進行融合,可以更好地獲悉事件在時間和空間上的可能性演進邏輯。具體而言就是基于三元世界大數(shù)據(jù)的協(xié)同感知獲悉事件總體態(tài)勢情況[11],在此基礎上融合事理圖譜和知識推理、情報推演相關技術,最終做出相關事件態(tài)勢預測。如在“平時”構建出某類突發(fā)事件的事件本體以及過往事件活動的事理圖譜架構體系,在“戰(zhàn)時”一旦新事件發(fā)生,就可以基于相似度計算、關聯(lián)推理、情報專家研判等方法進行相關事件趨勢的推演和概率預測。需要指出,預測情報研究本身就是融合不確定性環(huán)境和具體情境進行的推理,因此,事件態(tài)勢預測本質上需要結合具體事件的特征以及具體領域、地區(qū)等情境特點。如結合普遍性事件傳播路徑的規(guī)律以及特定城市區(qū)域特點和季節(jié),就可以計算出相關事件偏向概率,進而做出精準性態(tài)勢預測。同時,鑒于目前復雜情境下的黑天鵝事件、重大突發(fā)事件的鏈式反應等問題(如新冠肺炎疫情對行業(yè)鏈、產業(yè)鏈以及公眾等的影響),基于事理圖譜的相關探索能夠更好刻畫出重大事件的連鎖影響,進而從全局角度開展態(tài)勢預測。
第三,更好支持用戶行為挖掘。信息用戶一直是情報學關注的焦點,以用戶(信息)行為為中心的事理圖譜探索是一個可挖掘的新興方向。一直以來,情報學對用戶(信息)行為的關注主要聚焦于問卷數(shù)據(jù)、訪談數(shù)據(jù)、眼動追蹤數(shù)據(jù)以及網(wǎng)絡數(shù)據(jù)的挖掘等,解析的多是用戶的單一靜態(tài)行為。事理圖譜與用戶(信息)行為的結合,本質上就是要從事理角度反應出用戶的心理、痕跡、軌跡等的變化,進而基于這種變化來刻畫用戶(信息)行為。如對用戶過往信息行為活動相關數(shù)字信息進行事件抽取和復雜關系刻畫,可以凝練出其時間序列視角下的行為偏好和行為結構體系,以更好生成融合邏輯層與事實層的用戶畫像[12],進而識別和預測用戶在某一主題事件情境下的可能性行為傾向或路徑。不僅僅如此,基于普遍性事件的發(fā)展邏輯以及用戶自身的行為習慣,再結合相關拓展知識庫,可以更好了解用戶信息需求和實際需要,為用戶在具體事件的行動選擇和最終決策推薦相關有用信息和知識。另外,在反恐領域基于事理圖譜的用戶行為挖掘也可以得到一定的應用,如基于恐怖分子并發(fā)、順承等行為事件的發(fā)生(如采購與恐怖活動相關的商品、可疑恐怖分子資金鏈的非正常流動、網(wǎng)絡言論的負面情緒等),就可以提前感知和察覺其行為異?;蛐袨橐鈭D,進而有效實施行動干預。
4? ?基于事理圖譜的情報支持關鍵流程與方法
將情報思維、情報流程與事理圖譜進行融合,可構建出基于事理圖譜的情報支持路徑。需要指出,事理與知識的融合能夠更好豐富情報選擇路徑,即從事件維和實體維雙向刻畫復雜的知識單元和關系網(wǎng)絡,進而實現(xiàn)多維度、多觸角的信息關聯(lián)和知識深度表示。從實踐來看,基于事理圖譜的情報支持路徑也有必要聯(lián)合知識圖譜等相關內容,而不是單一的事件關系展示。其關鍵流程與方法主要涉及三個模塊:描述層、分析層、應用層。
(1)描述層主要定位于多階段、多主體、多業(yè)務情境下的情報對象、情報目標的明確,涉及情報需求建模、不一致性調解、場景解析等。描述層是基礎支撐,需要獲悉和解析多元主體的情報需求,建立相關情報需求尤其是事理情報需求的識別與表達體系,厘清服務對象的具體業(yè)務流程,搭建業(yè)務體系與情報信息之間的映射關系,進而基于情報需求和情報業(yè)務展開具體的事理圖譜構建。
(2)分析層定位于事理圖譜模塊的建構以及相關知識內容、情報內容的抽取與分析。分析層是整個情報支持路徑的核心,其本質上就是要構建出事件維和實體維的知識表示雙層邏輯。其中,事件維聚焦事件因果關系、順承關系、轉折關系等事理演化邏輯,實體維聚焦與事件關聯(lián)的各類實體及其屬性,并基于情報任務實現(xiàn)事理圖譜和知識圖譜的智慧融合。主要內容包括:
①多源數(shù)據(jù)采集與集成。以物理世界、人類社會、信息空間三元世界大數(shù)據(jù)為基本理念,運用大數(shù)據(jù)協(xié)同感知、數(shù)據(jù)探針采集以及相關數(shù)據(jù)集成技術,匯聚業(yè)務數(shù)據(jù)、網(wǎng)絡數(shù)據(jù)、人際交流數(shù)據(jù)、學術成果數(shù)據(jù)、調查報告數(shù)據(jù)等多源異構數(shù)據(jù)資源,獲悉事件的全情景信息,以支持更廣義視角的事理知識圖譜構建以及更復雜的社會網(wǎng)絡關系描繪和刻畫。
②事件抽取與泛化。運用事件抽取、事件關系識別等技術,借用已有或自建語料庫進行模型訓練,建立起以事件為基本單位的關系網(wǎng)絡。同時,考慮以事件作為邏輯基點,運用實體抽取、實體關系識別等技術實現(xiàn)關鍵實體信息的抽取,并將其融入事件關系網(wǎng),構建起知識粒度更加豐富的事理知識圖譜。有學者提出情報事理圖譜的想法,認為可以更多關注具體事件以及事件發(fā)生的時間等,以更好地輔助情報判讀[13]。從事件泛化的角度看,需要先對重復的事件描述采用共指融合技術實現(xiàn)事件實例的歸并,再采用抽象化的、語義完備的謂詞短語來泛化融合后的具體事件,以表達更高層次的事件關系。同時,對相關相似的實體知識采用實體對齊、實體鏈接等技術實現(xiàn)實體實例的融合。這一過程本質上是凝練事件關鍵信息和知識,實現(xiàn)相似信息的聚斂,發(fā)現(xiàn)更高層次的演化規(guī)律和路徑,同時也可以避免圖譜稀疏化。
③情報驗證與分析?;谏鲜鍪吕韴D譜的基礎搭建和關聯(lián)化的數(shù)據(jù)信息基礎,需要進一步對圖譜進行信息穿透、深度解讀和評估,面向具體的情報任務,通過協(xié)同其它情報分析技術和方法開展情報計算、分析與研判。從情報分析視角看,涉及基于事件關聯(lián)權重或概率的預測分析、基于相似度計算的事件情報推送、基于事理圖譜的全相關關系體系構建、基于時序數(shù)據(jù)的事件脈絡整合與刻畫、融入主題和情感分析的事件(網(wǎng)絡輿情)內容分析、融合事理圖譜與敵人意圖的關鍵情報提取、基于弱信號關聯(lián)的風險預警、基于事件關系的反事實分析等。需要指出,基于事理圖譜的高級情報研判離不開人腦的支持,在上述基礎上,考慮融入情報工程思維,將專家智慧納入到事理圖譜的最終分析之中[14],推動數(shù)據(jù)驅動型事理圖譜與專家領域知識的相互印證,最終提升情報服務的科學性。
(3)應用層定位于基于事理圖譜的知識發(fā)現(xiàn)服務、知識推薦服務、情報監(jiān)測服務、情報預測服務等場景體系構建與應用,涉及面向不同場景、服務不同用戶的各類情報服務產品的生產、傳遞、評估與反饋等。從情報服務思維出發(fā),著眼于從過去預測未來以及從現(xiàn)在預測未來,推動事理圖譜嵌入到大情報系統(tǒng)之中,同時注重相關情報服務機制、情報服務模式的創(chuàng)新。特別指出,隨著決策劇場的崛起,事理圖譜可考慮與決策劇場進行融合,凸顯一體化、沉浸式的事件演化和因果事件鏈分析和展現(xiàn),以更好地把控事件發(fā)展態(tài)勢和趨勢。
5? ?情報與事理圖譜碰撞的發(fā)展思考
5.1? ? 事理圖譜有待進一步探索并達成共識,以更好應用于情報領域
事理圖譜作為一種新思維、新技術,在學術界、產業(yè)界等產生了一定的影響,也開拓了情報事理邏輯的分析維度[15]。同時,事理圖譜是一個復雜的系統(tǒng)工程,其理論基礎和技術體系目前未能形成廣泛共識,基于事理圖譜的情報分析機制與數(shù)據(jù)挖掘效果等也就受到牽連性的影響。
首先,事理圖譜的事件是具有一定抽象程度的事件,但目前對于事件定義、事件抽象粒度等方面仍然缺乏共識。如很多事理圖譜的事件抽取主要基于“自下而上”方式,強調通過開源大數(shù)據(jù)、大眾事件表達等進行新事件檢測和抽取,以獲取更多的事件指向,提高事件覆蓋率。然而,由于事件界定不明確、事件抽象粒度無法有效控制,后續(xù)的事件泛化往往存在混亂,或者被迫加入過多的人工校正因素,其最終的情報生成在全面性、準確性、自動化、可靠性等方面就顯得不足。因此,對于事件、抽象事件、事件知識的定義以及動態(tài)事件層級體系的構建是未來需要考慮的關鍵問題。
其次,在事件關系抽取上,目前主要存在基于模式匹配、基于機器學習和深度學習兩種路徑。前者對于顯性關系的抽取具有很好的效果,但過于依賴顯性觸發(fā)詞的出現(xiàn);后者則可拓展到隱性關系的抽取,但比較依賴于訓練語料的質量,而目前相關開放性的語料較少,領域標注語料又比較耗時耗力。因此,事件關系抽取語料庫的建設,以及事理圖譜相關開放數(shù)據(jù)文化的培育是未來的發(fā)展方向。另外,目前事理圖譜的構建多聚焦于因果關系和順承關系,忽視了對條件、上下位等其他關系的探索,且事件關系抽取多局限于句內關系,對跨句、跨篇章的關系抽取把握不夠。因此,拓展事件關系的抽取范圍以及抽取粒度,以促進更大規(guī)模的“關系情報”網(wǎng)構建,是未來需要進一步探索的方向。
最后,針對應用環(huán)節(jié)的預測情報分析等問題,基于事理圖譜的事件預測在關系可信性、因果解釋性評估、情境轉化上也存在不足。誠然,作為趨勢預測,事理圖譜所提供的事件之間的邏輯演化關系的確具有一定的指向性參考意義,目前這方面的相關研究主要是通過事件轉移概率或權重作為預測特征。而實際上這種特征會受到信息發(fā)布者的傾向性、愛好興趣、議程設置、領域特殊性等因素影響,因此這種預測可能已經(jīng)受到“前端”干擾,或者未充分考慮領域情境特點,也就難以提供有效且有解釋性的預測型情報服務。因此,如何挖掘更多能夠有效支持情報分析與預測的事理特征信息,是未來需要考慮的方向。
5.2? ? 開源信息世界中的“假關系”帶來情報噪音,數(shù)據(jù)治理迫在眉睫
在開源信息世界下,事理圖譜絕大部分抽取的是一種“常識性”的因果關系、順承關系等,其數(shù)據(jù)多源于個體或機構的經(jīng)驗和知識表達,即群體智慧的涌現(xiàn)。目前,群體智慧的重要性已經(jīng)得到廣泛認同[16],與之相關的大眾情報思維也反映出這一趨勢和理念。如在應急情境下,民眾既可能是突發(fā)事件現(xiàn)場信息的第一見證人和分享者,也可能是對事件提出相關需求的利益相關者,無論何種情況,通過民眾參與的尋求、分享、討論的交互網(wǎng)絡,大眾情報也就由此形成,其中蘊含的各種“關系情報”則具有重要的決策支持價值。然而,由于自然語言文本、社交媒體數(shù)據(jù)發(fā)布、網(wǎng)絡新詞等的自由性、隨意性問題,事理圖譜數(shù)據(jù)世界中的真假關系問題有待商榷。換句話說,數(shù)據(jù)世界中廣泛存在的信息失真、數(shù)據(jù)可信度低、虛假信息、謠言信息等問題,導致事理圖譜抽取出的關系存在不確定性、錯誤性或模糊性,這就影響到了事理圖譜的可建模性,從而制造出情報噪音,也就進一步影響到后續(xù)的分析和預測準確率。盡管海量數(shù)據(jù)中不乏存在一些本質性、客觀性、事實性的邏輯關系(如官方事故調查報告中的因果語句等),但與海量用戶輿情數(shù)據(jù)相比,“真關系”似乎顯得微乎其微。因此,目前的一種方案是在數(shù)據(jù)源選擇中建議采集官方或組織正式發(fā)布的新聞、報告等,以保障數(shù)據(jù)集中可能存在的關系的權威性,而對于與用戶、大眾層面相關的事理邏輯語句源,則需要保持慎重態(tài)度,或在操作中對相關數(shù)據(jù)集進行深度化的清洗。
特別指出,隨著社交機器人的廣泛應用,如最新的ChatGPT可能引發(fā)的新一輪“信息營銷”、虛假信息等[17]問題,開源信息世界中的“真假孫悟空”必然成為一個新的挑戰(zhàn),這種事理圖譜中的情報噪音需要通過系統(tǒng)性的數(shù)據(jù)治理策略和處置方案來予以消解,以建構出真實性的“關系情報”。
5.3? ? 基于多模態(tài)數(shù)據(jù)構建事理大圖,推動情報圖景構建
目前的事理圖譜構建所依托的數(shù)據(jù)類型主要是文本數(shù)據(jù),而隨著移動互聯(lián)網(wǎng)、數(shù)據(jù)可視化等的發(fā)展,事件數(shù)據(jù)呈現(xiàn)多模態(tài)化趨勢。從事件刻畫的角度看,綜合文本、圖片、音頻、視頻等多模態(tài)數(shù)據(jù),對于全面描繪和分析事件整體態(tài)勢,進而支持全面化的情報圖景構建具有重要意義。如目前新聞網(wǎng)等平臺擁有大量的文本型數(shù)據(jù)和結構化數(shù)據(jù),可以支撐相關事理圖譜的構建與分析,這也是過去事理圖譜主要關注的研究路徑,但由于其忽視了多模態(tài)數(shù)據(jù)的信號提示、依賴關系、消岐支持作用等,這種“數(shù)據(jù)不充分”可能會催生后續(xù)情報分析的“盲區(qū)”。以短視頻為例,隨著用戶消費內容多樣化、快捷化,目前短視頻成為最具熱度的閱讀和傳播形態(tài)。最新的數(shù)據(jù)也表明,我國短視頻已經(jīng)成為全民化應用,2022年首次突破10億,用戶使用率高達94.8%[18]。短視頻中蘊含著文字、音頻、影像等多模態(tài)信息,隱藏著大量的公眾輿情輿論、事件闡釋等信息,具有非常高的開發(fā)和研究價值。因此,如何做好事件相關短視頻的語音識別、視頻分類、長信息片段處理[19],以抽取出更多表征事件演化模式和規(guī)律的信息,進而提煉出更多有價值的情報信息,是一個可探索的方向。如對涉外、海外短視頻資源的主流輿情事件、觀點等進行挖掘與分析,就能夠更“貼近式”地獲悉相關意識形態(tài)、政治、安全等方向的情報信息。除了日常生活情境下的短視頻外,從應用領域看,隨著監(jiān)控系統(tǒng)的普及化,各類監(jiān)控視頻記錄成為公安視頻偵查的重要數(shù)據(jù)來源,而將事理圖譜與監(jiān)控視頻內容解析進行結合,可支持相關刑事案件信息和演化模式的挖掘,為公安偵查辦案提供系統(tǒng)且有效的線索、證據(jù)和情報支持[20]等。
總體來看,將多(媒體)渠道的多模態(tài)數(shù)據(jù)納入到事理圖譜體系之中,可以構建出更加全面系統(tǒng)的事理大圖,進而支持情報圖景構建。而情報圖景就是可以洞察出對象元問題、本質以及演化規(guī)律的東西。當然,相關事理大圖的構建需要面對多模態(tài)數(shù)據(jù)分散無序、關聯(lián)復雜、標準無序、事件定義不確定、表示寬泛等挑戰(zhàn),因此從細粒度角度對其進行解構就顯得尤為重要。如確保在多模態(tài)數(shù)據(jù)知識單元的抽取、描述、關聯(lián)和組織過程中不喪失和打亂原本的事件邏輯關系信息就是一個極大挑戰(zhàn)。同時,為了更好實現(xiàn)事件分析的“一網(wǎng)打盡”,應注重從事件背景、事件情感等元素融入豐富多模態(tài)數(shù)據(jù)的語義表示,同時注重深網(wǎng)、暗網(wǎng)的多模態(tài)數(shù)據(jù)資源挖掘與情報分析。而且,多主體之間的資源、數(shù)據(jù)和情報協(xié)同機制,也是“事理大圖”與情報圖景生成的重要保障。
6? ?結語
事物的發(fā)展總是變化和相互聯(lián)系的,事件及其關系則是人們認識事物、認知世界的重要途徑。本文針對近幾年來事理圖譜技術的發(fā)展以及情報學領域對事理圖譜的關注,從關聯(lián)邏輯、應用拓展、流程方法、發(fā)展思考等角度對情報與事理圖譜相關問題進行了探究。
正如文章所言,事理圖譜本身仍然在發(fā)展和完善之中,由此,事理知識是否可以作為更高層次的知識結構進而支持情報服務也有待進一步的探索。而從情報學的角度來看,學科應充分利用自身在數(shù)據(jù)資源建設、數(shù)據(jù)治理、情報分析、信息情報行為分析等方面的優(yōu)勢,借事理圖譜之刃做好決策主體的“耳目、尖兵、參謀”。同時也可基于相關研究不斷豐富學科研究新概念、新范式,推動智能情報分析的實現(xiàn)。唯有兩者相互支撐、相互促進,才能相得益彰。尤其是對于持續(xù)性事件挖掘、未來事件預測、復雜事件分析之類的話題,有望成為相關方向的突破點。當然,也需要指出,純粹的基于事理圖譜的“工程化”情報服務并不是我們的初心,相關方向仍然面臨著諸多挑戰(zhàn)和爭議,未來仍然長路漫漫!期待更多跨學科之間的學術交流和交叉創(chuàng)新。
*本文系國家社會科學基金一般項目“數(shù)智賦能的重大突發(fā)公共事件預測型情報服務機制研究”(項目編號:22BTQ051)研究成果之一。
參考文獻:
[1]? 中國計算機學會.“事理圖譜”術語發(fā)布[EB/OL].[2023-02-15].https://mp.weixin.qq.com/s/WIFY3sFyIm2RWtSTCks8Bg.
[2]? Li Z,Zhao S,Ding X,et al.EEG:Knowledge Base for Event Evolutionary Principles and Patterns[J].Communications in Computer and Information Science,2017(774):40-52.
[3]? Li Z,Ding X,Liu T.Constructing narrative event evolutionary graph for Script event prediction[A].IJCAI International Joint Conference on Artificial Intelligence[C].2018:4201-4207.
[4]? 張紫祥.基于事理圖譜的社會化問答平臺知識組織研究[D].武漢:華中師范大學,2020.
[5]? 徐海玲.基于事理圖譜的多維特征網(wǎng)絡輿情演化路徑研究[J].情報科學,2022,40(7):48-54.
[6]? 張海濤,周紅磊,李佳瑋,等.信息不完全狀態(tài)下重大突發(fā)事件態(tài)勢感知研究[J].情報學報,2021,40(9):903-913.
[7]? Brookes B C.The foundations of information science:Part I.Philosophical aspects[J].Journal of Information Science,1980(5):125-133.
[8]? 中國國防科學技術信息學會.情報學進展2018-2019年度評論(第十三卷)[M].北京:航空工業(yè)出版社,2020.
[9]? 包昌火.這里的黎明靜悄悄——再談Intelligence與中國情報學[J].圖書情報工作,2009,53(8):5-6.
[10]? 劉煥勇,薛云志.事理圖譜,下一代知識圖譜[EB/OL].[2023-02-15].https://mp.weixin.qq.com/s/iLfXeVeWE5CCs_sM_NAOSw.
[11]? 李綱,王施運,毛進,等.面向態(tài)勢感知的國家安全事件圖譜構建研究[J].情報學報,2021,40(11):1164-1175.
[12]? 鄧君,彭琣,孫紹丹,等.基于事理圖譜的游記文本知識發(fā)現(xiàn)——以康養(yǎng)旅游為例[J].現(xiàn)代情報,2022,42(7):105-113.
[13]? 周京艷,劉如,李佳娛,等.情報事理圖譜的概念界定與價值分析[J].情報雜志,2018,37(5):31-36,42.
[14]? 李陽.面向應急管理的情報工程服務機制建設研究[M].北京:科學出版社,2022.
[15]? 劉如,周京艷,李佳娛,等.基于數(shù)據(jù)科學思維的情報事理邏輯揭示與科學解讀[J].情報理論與實踐,2018,41(8):22-27.
[16]? 安寧,安璐.突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧涌現(xiàn)研究[J].情報學報,2022,41(1):96-106.
[17]? 韓博.ChatGPT引發(fā)的人工智能內容生產傳播風險[N].中國社會科學報,2023-02-16(3).
[18]? 央視新聞.我國短視頻用戶已突破10億[EB/OL].[2023-03-10].https://wap.bjd.com.cn/news/2023/03/02/10353548.shtml.
[19]? 陳瓂浩,王有峰,聶卉梓.突發(fā)事件短視頻輿情演化分析模型研究[J].信息資源管理學報,2022,12(3):152-164,180.
[20]? 樊舒.事理圖譜型視頻偵查案例庫的構建及應用[J].中國刑警學院報,2022(5):122-128.
作者簡介:李陽,男,南京大學信息管理學院副教授,研究方向:應急情報、數(shù)據(jù)治理;張詩瑩,女,南京大學信息管理學院博士研究生,研究方向:事理圖譜、數(shù)據(jù)挖掘;盛東方,女,山東大學管理學院副教授,研究方向:應急信息行為、信息資源管理。