郭 翔
(南京信息工程大學(xué) 公共管理學(xué)院,江蘇 南京 210044)
基于灰色關(guān)聯(lián)分析的突發(fā)事件案例檢索研究*
郭 翔
(南京信息工程大學(xué) 公共管理學(xué)院,江蘇 南京 210044)
突發(fā)事件的案例檢索是將案例推理技術(shù)應(yīng)用于應(yīng)急管理領(lǐng)域的關(guān)鍵環(huán)節(jié)。通過對案例表達結(jié)構(gòu)體系的重新設(shè)計,建立了包括自然社會屬性、事件屬性、管理屬性等三個方面的突發(fā)事件案例表達的框架體系,并進一步規(guī)范了每一類屬性的描述規(guī)則以及屬性的數(shù)據(jù)形態(tài),最后應(yīng)用灰色關(guān)聯(lián)分析方法進行了基于案例屬性的案例檢索,最終的案例檢索實證驗證了該案例表達框架體系的合理性以及灰色關(guān)聯(lián)分析的分辨力。這對于突發(fā)事件案例檢索的應(yīng)用以及應(yīng)急管理能力的提升具有借鑒意義。
案例檢索;案例表達;屬性;灰色關(guān)聯(lián)分析
近年來,各類突發(fā)事件出現(xiàn)頻率明顯增加,探索更好的應(yīng)急管理手段與技術(shù)已成為無論學(xué)界、政府部門乃至社會公眾都極其關(guān)注的問題。案例推理的基本思想是通過歷史案例來解決現(xiàn)實問題。就突發(fā)事件應(yīng)急管理而言,案例推理技術(shù)使得利用以往處置突發(fā)事件的歷史經(jīng)驗與措施來應(yīng)對當(dāng)前的突發(fā)事件成為可能。因此,將案例推理技術(shù)來進行應(yīng)急決策與應(yīng)急指揮是當(dāng)前學(xué)界推動突發(fā)事件應(yīng)急管理研究的一個重要方向。
在案例推理過程中,首先需要將突發(fā)事件案例表達為計算機可識別的形式,其次需要進行一定的算法實現(xiàn)案例的檢索。對此,需要迫切回答的問題就是:如何將突發(fā)事件案例分解為計算機可識別的結(jié)構(gòu)化的形式?以及通過何種方式能夠更好地實現(xiàn)案例檢索?本研究嘗試在建立突發(fā)事件案例結(jié)構(gòu)化表達的框架的基礎(chǔ)上,提出基于灰色關(guān)聯(lián)分析的突發(fā)事件案例檢索模型,以期為突發(fā)事件應(yīng)急管理提供借鑒。
案例推理包含四個環(huán)節(jié)——案例檢索(retrieve)、案例重用(reuse)、案例修正(revise)、案例保存(retain)。其中,案例檢索則是整個案例推理系統(tǒng)關(guān)鍵的環(huán)節(jié),其質(zhì)量直接關(guān)系到案例推理應(yīng)用的實際效果。圍繞案例檢索在突發(fā)事件應(yīng)急管理的應(yīng)用,目前學(xué)界大致從兩個方向來展開。
首先是通過對案例的結(jié)構(gòu)化表達,將案例結(jié)構(gòu)化為計算機能識別的符號,然后在此基礎(chǔ)上進行案例檢索。其通常采用的檢索方法有最近相鄰法、歸納推理法和知識引導(dǎo)法[1]。具體而言,研究者多圍繞案例的屬性值來展開研究,試圖在案例結(jié)構(gòu)化的過程中,建立案例的屬性值體系,然后通過屬性值的相似度來判斷案例整體的相似度。如,劉雙印和徐龍琴提出了案例屬性權(quán)值自適應(yīng)算法和改進的灰色關(guān)聯(lián)度案例相似度算法[2],錢靜等人提出了基于多維情景空間表達的二階檢索算法以提升突發(fā)事件案例的檢索效率[3],梁曼等人提出了基于粗糙集的航路飛行沖突智能解脫系統(tǒng)的案例檢索方法[4],宋英華等人提出了結(jié)合歸納索引法和基于證據(jù)推理的置信規(guī)則庫推理方法(RIMER)的應(yīng)急案例索引技術(shù)[5],董憲元等人則是應(yīng)用二階聚類算法建立案例檢索庫并開發(fā)出交通事故案例檢索系統(tǒng)[6],王寧等人則提出了基于知識元的應(yīng)急案例檢索方法[7],在更早些時候,周凱波等人也提出了基于案例屬性特征的相似度計算模型[8]。
其次是直接對突發(fā)事件的案例文本進行語義分析,通過計算語義相似度來實現(xiàn)案例檢索。目前已有大量的文獻涉及對文本的語義相似度計算,但是用于突發(fā)事件案例文本的語義分析卻不多,其中,Lenz等人提出了基礎(chǔ)性的文本案例推理的案例匹配網(wǎng)絡(luò)模型[9],張琪等人則提出了基于本體的中文案例相似度計算方法[10],沙勇忠和史忠賢也從語義相似度的角度對文本案例的檢索進行了研究[11],黃超和佘廉則利用潛在語義索引和奇異值分解的方法建立了文本案例推理的方法[12]。
根據(jù)上述的突發(fā)事件案例檢索的兩大研究方向,對案例進行結(jié)構(gòu)化表達是案例檢索過程中的關(guān)鍵環(huán)節(jié)。由于突發(fā)事件的不可重復(fù)性,每一次突發(fā)事件都會在不同程度上表現(xiàn)出自身的獨特性,且同類型突發(fā)事件案例樣本缺乏,這無疑加大了案例檢索的難度。對此,本研究嘗試利用灰色關(guān)聯(lián)分析方法來進行突發(fā)事件案例檢索的研究,該方法相對于其他分析方法來說,優(yōu)勢在于對數(shù)據(jù)的要求比較低,可以很大程度上減少信息缺乏帶來的損失,非常符合突發(fā)事件應(yīng)急管理中信息相對缺乏的現(xiàn)實特點,同時卻又無損研究的精度。
在本研究中,重點關(guān)注突發(fā)事件案例結(jié)構(gòu)化表達,提出了案例結(jié)構(gòu)化表達中的屬性描述準則,然后應(yīng)用灰色關(guān)聯(lián)分析來實現(xiàn)突發(fā)事件的案例檢索,最后以相關(guān)突發(fā)事件案例來進行驗證,以期為突發(fā)事件應(yīng)急管理提供借鑒。
(一)突發(fā)事件案例表達的屬性描述準則
在案例的表現(xiàn)形式上,突發(fā)事件案例具有三種形式:匯編案例、結(jié)構(gòu)案例和網(wǎng)絡(luò)輿情案例[13]。最初是Gilboa提出了問題描述—解描述—效果描述的案例表達結(jié)構(gòu)[14];仲秋雁等人提出了基于知識元的突發(fā)事件情景模型,利用對知識元的抽取及其屬性的取值來實現(xiàn)對突發(fā)事件情景的描述[15];張英菊等人則提出了用于案例推理的突發(fā)事件案例通用表示與存儲模式[16],該模式包括應(yīng)急概念樹—突發(fā)事件本體模型—事件元模型的三層架構(gòu);李勇建等人也從案例屬性的角度出發(fā)提出了事件類型、關(guān)鍵屬性、從屬屬性、環(huán)境屬性和危害評估屬性的案例集合形式[17];佘廉等人也提出了基于“情景—事件—管理”三維度的案例結(jié)構(gòu)化框架[18]。
根據(jù)佘廉等人的案例結(jié)構(gòu)化模式,突發(fā)事件案例可以分為情景維度、事件維度和管理維度,每個維度下又包括不同的屬性。
情景維度主要涉及突發(fā)事件的發(fā)生地的誘發(fā)或觸發(fā)環(huán)境信息,可能承載損害后果的社會環(huán)境等。情景維度以描述案例發(fā)生環(huán)境的性質(zhì)及特征為主,主要目標是界定案例性質(zhì)類型、外在表面特征等。其主要描述內(nèi)容包括地理、水文、氣象等自然屬性,也包括人口、交通、經(jīng)濟等社會屬性,還包括危險源、承災(zāi)體等風(fēng)險屬性。
事件維度主要闡述的是事件起止的全過程的客觀信息,包括其發(fā)生、演化、應(yīng)急響應(yīng)過程、次生衍生事件、損失及結(jié)束等。事件維度涵蓋時間屬性、空間屬性和類型屬性三大部分。其中,時間屬性包括事件鏈分段、應(yīng)急響應(yīng)階段劃分等;空間屬性包括地域范圍、實體以及虛擬傷害等;類型屬性包括事件類型、級別等。
管理維度主要表現(xiàn)應(yīng)對突發(fā)事件的管理主體的決策行為、應(yīng)急響應(yīng)活動及其應(yīng)急響應(yīng)活動產(chǎn)生的結(jié)果。就實際操作而言,在應(yīng)急管理過程中,行政主體作出的應(yīng)急決策及其行政行為將直接影響到事件的演化。因而,管理維度主要的描述內(nèi)容包括行政行為、事件處置、社會穩(wěn)控等處置任務(wù)以及管理主體的構(gòu)成、類型、角色,還包括應(yīng)急人員構(gòu)成、應(yīng)急物資構(gòu)成等資源配置屬性。
各維度的屬性體系形成了突發(fā)事件案例的基本框架結(jié)構(gòu)。在對案例進行檢索匹配過程中,針對不同的屬性,需要應(yīng)用具體的屬性描述準則予以規(guī)范。
情景維度的屬性描述準則。情景維度的屬性描述主要是借助于已有的專業(yè)術(shù)語及科學(xué)定義,對事件的自然、社會、風(fēng)險等屬性進行描述。
事件維度的屬性描述準則。此維度的案例表達以實現(xiàn)對事件客觀信息的完整、詳細描述為目標。對于時間屬性的表達準則是要以時間鏈為基準,按照事件發(fā)生的時間—情景—應(yīng)急響應(yīng)的順序,對案例進行表達,重點突出不同時間段下事件的演化過程;空間屬性的表達準則是以數(shù)據(jù)為依據(jù),通過定量的方式來描述,如刻畫造成的影響范圍及損失等;類型屬性的表達準則是以定性描述為基礎(chǔ)。
管理維度的屬性描述準則。此維度的屬性描述目的在于能夠清晰地表達出突發(fā)事件應(yīng)急主體的行為以及行為結(jié)果。對于應(yīng)急行為主體的類型描述,基本準則是依據(jù)當(dāng)前對各類組織的界定進行劃分和描述。對于資源配置屬性的描述,其基本準則是以數(shù)據(jù)形式進行最直觀的表達。
(二)突發(fā)事件案例屬性的屬性數(shù)據(jù)形態(tài)
在突發(fā)事件案例屬性的描述準則之下,應(yīng)確定每一屬性的數(shù)據(jù)形態(tài)。根據(jù)對文獻歷史案例的分析以及文獻查閱的結(jié)果,突發(fā)事件案例屬性的數(shù)據(jù)形態(tài)可以分為兩類:數(shù)值型和符號型。其中,數(shù)值型數(shù)據(jù)又可以分為確定數(shù)值型與模糊數(shù)字型;符號型數(shù)據(jù)也可以分為確定符號型與模糊符號型。
其中,模糊數(shù)值型數(shù)據(jù)是指其取值為一個不確定的數(shù)值或者是其取值為一個不確定的區(qū)間,如風(fēng)力3-4級,溫度3-4℃等等。確定數(shù)值型數(shù)據(jù)的取值是確定的數(shù)值,其取值可通過直接的方式獲取,如水位為12m,海拔為3200m等等。
模糊符號型數(shù)據(jù)是指數(shù)據(jù)的取值是一個不確定的描述性解釋;同理,確定符號型數(shù)據(jù)也是其不同的取值之間無關(guān)聯(lián),每個不同的取值只是一個符號型的描述,不具有數(shù)值意義。如,突發(fā)事件事發(fā)地的地貌為山區(qū)、丘陵、平原等等。其取值方式可在窮舉該屬性所有取值之后,通過編碼的方式得到該屬性的無量綱化的數(shù)值。
(三)突發(fā)事件案例的屬性結(jié)構(gòu)體系
如前所述,對任何突發(fā)事件的描述都會涉及到突發(fā)事件的事件背景環(huán)境、處理過程、處理行為等三個方面的內(nèi)容,相應(yīng)地構(gòu)成了情景、事件、管理三大維度,故而,進行突發(fā)事件案例檢索也可以在此案例屬性結(jié)構(gòu)體系下進行。通常實證研究需要較為精細的數(shù)據(jù)和指標體系,考慮到本研究的探索性以及征求專家意見的基礎(chǔ)上,我們稍許降低研究精度,只選取了具有代表性的案例屬性進行實證性的算例分析。所選取的代表性案例屬性主要由自然社會屬性、事件屬性和管理屬性組成,詳見表1。
該突發(fā)事件案例屬性結(jié)構(gòu)體系設(shè)計的原則是,通過詳盡的自然地理數(shù)據(jù)、經(jīng)濟社會數(shù)據(jù)、風(fēng)險數(shù)據(jù)以及事件自身的描述性數(shù)據(jù)來刻畫事件的特征,然后建立其與管理屬性數(shù)據(jù)的映射關(guān)系,最后實現(xiàn)對突發(fā)事件案例的表達。
表1 突發(fā)事件案例屬性結(jié)構(gòu)表
灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線的幾何形狀的相似程度來判斷不同序列之間的聯(lián)系緊密情況[19],亦即,如果序列曲線的幾何形狀越相似,變化的趨向越接近,其關(guān)聯(lián)度則越大;反之,其關(guān)聯(lián)度就越小。根據(jù)這一思想,在進行突發(fā)事件案例檢索研究過程中,可以通過對突發(fā)事件案例進行結(jié)構(gòu)化的表達,建立案例的屬性結(jié)構(gòu)體系,分析其屬性特征,建立突發(fā)事件案例屬性的數(shù)據(jù)序列,從而計算案例之間的相似性,實現(xiàn)突發(fā)事件的案例檢索。
應(yīng)用灰色關(guān)聯(lián)分析方法進行突發(fā)事件案例檢索研究,則需對案例進行數(shù)學(xué)描述。由于突發(fā)事件的發(fā)生發(fā)展演化是按照時間序列來展開的,其各屬性的取值也隨時間變化而發(fā)生相應(yīng)的變化,所以,由前述突發(fā)事件案例屬性結(jié)構(gòu)而構(gòu)建的案例屬性序列應(yīng)為行為時間序列。
設(shè)Xi為突發(fā)事件案例庫中的案例,其屬性序列xi(k)為行為時間序列,xi(k)表示對于第i個案例的第k個屬性的觀測數(shù)據(jù)。相應(yīng)地,歷史案例可以表示為Xi={xi(k)|k=1,2,3,…,n}。目標案例則表示為X0={x0(k)|k=1,2,3,…,n}
運用初值化算子對序列數(shù)據(jù)作無量綱處理后可以進行案例的灰色關(guān)聯(lián)系數(shù)的計算,灰色關(guān)聯(lián)系數(shù)計算公式如下:
(1)
其中,ξ為分辨力系數(shù),用來調(diào)節(jié)比較的環(huán)境,其取值范圍為ξ∈(0,1]。通過該計算公式,得到的是歷史案例的第k個屬性與目標案例的第k個屬性之間的關(guān)聯(lián)系數(shù)??紤]到突發(fā)事件包括的屬性眾多,以及伴隨著突發(fā)事件的發(fā)展演化過程,其屬性取值也是在不斷變化的,需要通過求解各屬性關(guān)聯(lián)系數(shù)的算術(shù)平均值得到歷史案例與目標案例的關(guān)聯(lián)系數(shù),其計算公式如下:
(2)
最后可以通過比較目標案例X0與其它眾多歷史案例Xi的關(guān)聯(lián)系數(shù)即可判斷目標案例X0與歷史案例Xi之間的相似度,亦即,如果γ(X0,Xi)的值越高,則表明兩者間的匹配程度越高。
本文選取近年來我國的一系列爆炸類的突發(fā)事件進行實證分析。相關(guān)爆炸類事故包括:天津港“8·12”瑞海公司危險品倉庫特別重大火災(zāi)爆炸事故,江蘇省蘇州昆山市中榮金屬制品有限公司“8.2”特別重大爆炸事故,山東省青島市“11·22”中石化東黃輸油管道泄漏爆炸特別重大事故,滬昆高速湖南邵陽段“7·19”特別重大道路交通危化品燃爆事故。其中,設(shè)天津港瑞海公司危險品倉庫特別重大火災(zāi)爆炸事件為目標案例。相關(guān)事故數(shù)據(jù)來源為國家安監(jiān)總局官方網(wǎng)站所公布的事故調(diào)查報告(見網(wǎng)址:http://www.chinasafety.gov.cn/),以及相關(guān)事故處理過程中的政府公告等。
所獲取數(shù)據(jù)按照前述屬性序列排列后求取其初值像如下:
表2 突發(fā)事件案例屬性初值像表
設(shè)分辨力系數(shù)為ξ=0.5,則可計算得到不同案例的同一屬性的關(guān)聯(lián)系數(shù),最后可計算得到目標案例與歷史案例的匹配度(表3)。
表3 目標案例與歷史案例的關(guān)聯(lián)系數(shù)表
為了驗證灰色關(guān)聯(lián)分析方法的分辨力,在確定分析案例時特意選取了四個等級同為特別重大的爆炸類突發(fā)事件,計算結(jié)果表明,天津港爆炸事件與青島東黃輸油管爆炸事件最為相似,此結(jié)果與之前的預(yù)估判斷相似。在案例檢索計算過程中可以發(fā)現(xiàn),盡管從事件層面上看,目標案例X0與歷史案例X3都同為?;繁ㄊ录?歷史案例X3實為交通事故引發(fā)的?;奋囕v爆炸事故),兩者具有諸多相似之處,但是由于其災(zāi)損及后期應(yīng)對與處置的巨大差異,導(dǎo)致二者之間的相似度較低。這體現(xiàn)出灰色關(guān)聯(lián)分析方法在檢索案例時的優(yōu)越性。
考慮到突發(fā)事件案例檢索的最終目的是取歷史相似案例為己所用,故而,單純地從事件層面上考慮突發(fā)事件案例的相似度是存在缺陷的,容易出現(xiàn)檢索到事件相似而處置方法及結(jié)果千差萬別的情形。本研究從自然社會屬性、事件屬性、管理屬性等三個方面構(gòu)建了突發(fā)事件案例表達的框架體系,并進一步規(guī)范了每一屬性的描述規(guī)則以及屬性數(shù)據(jù)的形式,最終的案例檢索實證驗證了該案例表達框架體系的合理性以及灰色關(guān)聯(lián)分析的分辨力。
本研究實際上是靜態(tài)的案例檢索分析,在實際應(yīng)用中可根據(jù)所獲得的實時數(shù)據(jù)進行即時的動態(tài)案例檢索分析。作為進一步研究的方向,案例表達中的社會屬性與管理屬性的進一步結(jié)構(gòu)化表達是一個亟需解決的問題;同時,對于案例屬性權(quán)重的計算問題也是需要在后續(xù)的研究中開展。
[1] 劉小龍,唐葆君,邱菀華.基于灰色關(guān)聯(lián)的企業(yè)危機預(yù)警案例檢索模型[J].中國軟科學(xué),2007(8):152-156.
[2] 劉雙印,徐龍琴.基于改進覆蓋算法和灰色關(guān)聯(lián)度的案例檢索[J].計算機工程,2011,37(13):169-171.
[3] 錢 靜,劉 藝,劉 呈,等.基于多維情景空間表達的兩層案例檢索算法研究[J].管理評論,2016(8):37-42.
[4] 梁 曼,徐肖豪,周 建,等.基于粗糙集的航路飛行沖突智能解脫系統(tǒng)案例檢索方法[J].科學(xué)技術(shù)與工程,2015(3):289-294.
[5] 宋英華,李旭彥,高維義,等.城市洪災(zāi)應(yīng)急案例檢索中的RIMER方法研究[J].中國安全科學(xué)學(xué)報,2015(7):153-158.
[6] 董憲元,方守恩,王俊驊.交通事故案例檢索優(yōu)化方法[J].同濟大學(xué)學(xué)報:自然科學(xué)版,2012(5):707-710,750.
[7] 王 寧,黃紅雨,仲秋雁,等.基于知識元的應(yīng)急案例檢索方法[J].系統(tǒng)工程,2014(1):124-132.
[8] 周凱波,馮 珊,李 鋒.基于案例屬性特征的相似度計算模型研究[J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2003,25(1):24-27.
[9] LENZ M,BURKHARD H D. Case retrieval nets: basic ideas and extensions[J]. Knowledge and Information Systems, 1996,1137:227-239.
[10] 張 騏,等.基于本體的中文案例相似度計算方法[J].情報科學(xué),2014,32(11):77-80.
[11] 沙勇忠,史忠賢.基于語義相似度的公共危機事件案例檢索方法[J].情報資料工作,2014(6):6-11.
[12] 黃 超,佘 廉.文本案例推理技術(shù)在應(yīng)急決策中的應(yīng)用研究[J].情報理論與實踐,2015,38(12):111-114.
[13] 佘 廉,黃 超.我國突發(fā)事件案例庫建設(shè)評價分析[J].電子科技大學(xué)學(xué)報:社科版,2015(6):24-31.
[14] Gilboa I,Schmeidler D.Case-based Decision Theory[J].Quarterly Journal of Economics, 1995,110:605-639.
[15] 仲秋雁,郭艷敏,王 寧,等.基于知識元的非常規(guī)突發(fā)事件情景模型研究[J].情報科學(xué),2012(1):115-120.
[16] 張英菊,仲秋雁,葉 鑫,等.CBR的應(yīng)急案例通用表示與存儲模式[J].計算機工程,2009,17:28-30.
[17] 李勇建,喬曉嬌,孫曉晨.突發(fā)事件結(jié)構(gòu)化描述框架研究[J].電子科技大學(xué)學(xué)報:社科版,2013(1):28-33.
[18] 佘 廉,張明紅,黃 超.公共突發(fā)事件案例表達結(jié)構(gòu)化模式探討[J].華南理工大學(xué)學(xué)報:社會科學(xué)版,2015(6):69-75.
[19] 劉思峰,楊英杰,吳利豐.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2014.
(責(zé)任編輯 王婷婷)
Abstract:Case retrieval is a key in the application of case based reasoning (CBR) in the field of emergency management. By redesigning the structure of case expression, the paper establishes the framework system including natural attribute, event attribute and management attribute in 3 aspects of emergencies, and further standardizes every kind of attribute description rules and data attributes. Then the application of grey relational analysis method is used to match case retrieval based on the case attribute. Finally, the case study indicates that the grey relational evaluation and the case retrieval frame system is effective. It is possible to apply emergency case retrieval and improve the emergency management ability.
Keywords:case retrieval; case expression; attribute; grey relational analysis
CaseRetrievalBasedonGreyRelationalAnalysis
GUOXiang
(CollegeofPublicAdministration,NanjingUniversityofInformationScienceandTechnology,Nanjing210044,Jiangsu,China)
C931;D63-3
A
10.3963/j.issn.1671-6477.2017.05.0002
2017-03-06
郭 翔(1977-),男,湖北省武漢市人,南京信息工程大學(xué)公共管理學(xué)院副教授,管理學(xué)博士,在站博士后,主要從事行政管理、公共安全預(yù)警與應(yīng)急管理研究。
國家自然科學(xué)基金青年科學(xué)基金項目(71103092);中國博士后科學(xué)基金項目(2014M560066)