張振海,王曉明,張雁鵬,王海涌
(蘭州交通大學(xué)自動化與電氣工程學(xué)院,蘭州730070)
當前,隨著鐵路運輸?shù)目焖侔l(fā)展,鐵路突發(fā)事件時有發(fā)生,鐵路應(yīng)急救援決策已經(jīng)成為鐵路運輸管理領(lǐng)域的研究熱點問題[1,2].在國外,德國、日本等國家開發(fā)了相應(yīng)的運營管理系統(tǒng),對各種應(yīng)急救援問題進行仿真分析,提出了基于綜合調(diào)度指揮的事故應(yīng)急處理體系結(jié)構(gòu)模型.在鐵路應(yīng)急救援中如何根據(jù)當前的現(xiàn)場環(huán)境、應(yīng)急人員、應(yīng)急資源和列車狀態(tài)等態(tài)勢信息,快速準確地做出決策對最后的救援效果起著重要的決定作用.基于多Agent的協(xié)同決策方法在決策理論中已有應(yīng)用,但都針對特定的領(lǐng)域,無法適應(yīng)鐵路應(yīng)急決策過程中復(fù)雜多變的要求,無法滿足其協(xié)同性需求[3,4].
本文以鐵路應(yīng)急救援為應(yīng)用背景,采用基于分層Agent的建模思想,建立基于分層Agent的鐵路應(yīng)急救援指揮控制結(jié)構(gòu),根據(jù)事故處置規(guī)則為每個Agent在應(yīng)急救援過程中設(shè)定不同角色,并在最高層Agent中采用基于模糊決策的方法,實現(xiàn)應(yīng)急救援的決策過程.
當有鐵路行車事故發(fā)生時,現(xiàn)場工作人員通過專用通訊網(wǎng)絡(luò)將事故報告發(fā)送到應(yīng)急決策支持系統(tǒng),系統(tǒng)根據(jù)事故態(tài)勢信息進行推理決策,從方法數(shù)據(jù)庫中選擇出最有效的方法[5].指揮部門根據(jù)決策結(jié)果調(diào)度車務(wù)、機務(wù)、工務(wù)、電務(wù)、車輛等相關(guān)部門人員組織現(xiàn)場救援,并根據(jù)實際情況對決策進行修正,以保證救援工作能夠最大限度地減少人員傷亡和財產(chǎn)損失,盡快恢復(fù)鐵路運輸秩序.因此,鐵路應(yīng)急救援行動具有如下特點:
(1)組織結(jié)構(gòu)的層次性.
鐵路應(yīng)急救援的過程由應(yīng)急指揮部門統(tǒng)一安排和部署,具有嚴格的層次指揮結(jié)構(gòu).
(2)任務(wù)執(zhí)行的從屬性.
下級主體必須服從上級主體的命令,下級主體的自主性受到一定的削弱.
(3)角色之間的協(xié)同性.
應(yīng)急救援中,上下級主體間主要是一種服從關(guān)系,但是在不同工種、救援隊伍的指揮主體間存在著協(xié)調(diào)工作關(guān)系,底層主體之間也需具備協(xié)同能力.
MAS(Multi-Agent System)是由多個 Agent形成的松散耦合的網(wǎng)絡(luò)系統(tǒng).MAS通過自治的智能主體之間智能行為的協(xié)調(diào)來完成共同的任務(wù).MAS具有自主性、分布性和協(xié)調(diào)性的特點,并具有自組織能力、學(xué)習能力和推理能力,因此,可以通過各Agent之間的通訊、合作、互解、協(xié)調(diào)、調(diào)度、管理及控制來表達系統(tǒng)的結(jié)構(gòu)、功能及行為特性.由于在MAS中各Agent之間可以異構(gòu),因此,MAS技術(shù)對于復(fù)雜系統(tǒng)具有無可比擬的表達力,為各種復(fù)雜的決策系統(tǒng)提供了一種統(tǒng)一的模型和框架,利用MAS技術(shù)來表達鐵路應(yīng)急救援組織的模式是可行的,但是需要選擇好MAS的組成方式,才能滿足層次性、從屬性和協(xié)同性的需求.
MAS的組成方式主要有分布式、集中式和混合式結(jié)構(gòu).雖然MAS的分布式結(jié)構(gòu)具有穩(wěn)定性好、并行計算能力強的優(yōu)點,但是卻無法很好地滿足鐵路應(yīng)急決策體制下現(xiàn)場復(fù)雜多變的應(yīng)急需求.面對復(fù)雜的現(xiàn)場環(huán)境,各底層救援人員是在管理決策者和行動指揮者的統(tǒng)一指揮和協(xié)調(diào)下,為有序地實施救援工作分別完成不同的任務(wù).在借鑒MAS的分布式和集中式結(jié)構(gòu)思想的基礎(chǔ)上,結(jié)合Agent的自身特點,根據(jù)救援人員在鐵路應(yīng)急救援中擔任角色和功能的不同,本文提出一種基于分層Agent的鐵路應(yīng)急救援指揮控制結(jié)構(gòu),將應(yīng)急救援指揮體系中的實體抽象為功能Agent,不同功能的Agent成員之間相互協(xié)調(diào)與配合形成MAS系統(tǒng),共同完成應(yīng)急任務(wù)要求的目標.根據(jù)每個Agent在應(yīng)急救援中的作用、功能的不同將整個控制結(jié)構(gòu)分為三層的邏輯結(jié)構(gòu).具體結(jié)構(gòu)如圖1所示.該結(jié)構(gòu)主要包括行動執(zhí)行層、指揮控制層和管理決策層,各層由若干個相應(yīng)的功能 Agent組成,分別為救援人員 Agent、指揮Agent和管理Agent.各Agent根據(jù)所在的層次不同,完成不同的功能.
(1)救援人員Agent.
它是救援任務(wù)的底層執(zhí)行單元.在每個決策周期內(nèi),人員Agent的行為包括認知行為和物理行為.認知行為負責感知環(huán)境模型在當前時刻的輸出,并基于決策知識庫進行決策推理.感知到的態(tài)勢信息以短期知識的形式進行描述和存儲,并支持長期知識庫實現(xiàn)數(shù)據(jù)驅(qū)動的推理決策[6].決策結(jié)果再通過接口以行為命令的形式提交給對應(yīng)的物理行為模型執(zhí)行.
圖1 應(yīng)急救援指揮控制結(jié)構(gòu)Fig.1 Control architecture of emergency rescue
(2)指揮Agent.
它需要具備比救援人員Agent更多的知識和數(shù)據(jù),更強的協(xié)調(diào)和通信能力.完成管理Agent下達的任務(wù)的再劃分和資源再分配;收集下層救援人員Agent上報的相關(guān)態(tài)勢信息,融合處理后提供給管理Agent進行決策;指揮Agent負責溝通上層管理Agent和下層人員Agent之間的關(guān)系,保證系統(tǒng)能夠穩(wěn)定可靠地運行.
(3)管理Agent.
它是整個鐵路應(yīng)急救援的總體決策者與方案制定者,位于整個結(jié)構(gòu)的最上層,具有全局的知識和全部數(shù)據(jù)資源,負責實現(xiàn)鐵路應(yīng)急救援方案的制定和決策,任務(wù)的粗粒度劃分和資源的分配.
在基于分層Agent的鐵路應(yīng)急救援指揮控制結(jié)構(gòu)中,不同層的Agent因其所處的位置不同,具有不同的功能、決策機制和推理方法.對于救援人員Agent,需要根據(jù)具體態(tài)勢信息的變化執(zhí)行相應(yīng)的行動,可以采用基于規(guī)則的推理方法完成自主決策[7].但對于管理 Agent,需要綜合考慮當前現(xiàn)場中的人員配備、列車狀態(tài)以及現(xiàn)場環(huán)境信息,科學(xué)地做出決策,形成合理的鐵路應(yīng)急救援方案.因此,管理Agent的決策過程具有不確定性、模糊性和復(fù)雜性等特點.模糊評價是目前應(yīng)用非常廣泛的決策方法,以模糊數(shù)學(xué)理論和方法為基礎(chǔ),通過建立隸屬度函數(shù)和考慮不可量化的影響因素,較好地解決了對決策中的模糊性、不確定性和復(fù)雜性信息的處理.模糊評價技術(shù)已經(jīng)在鐵路運輸管理方面得到了一定的應(yīng)用[8,9].因此,采用模糊評價的方法來實現(xiàn)最高層管理Agent的決策機制是可行的.
根據(jù)鐵路應(yīng)急指揮決策部門的決策流程及處理規(guī)則,建立基于模糊評價的管理Agent決策模型,如圖2所示.管理Agent由感知接口、模糊處理器和推理機,以及輸出接口組成.與管理Agent進行交互的數(shù)據(jù)資源包括態(tài)勢信息數(shù)據(jù)、指標、算法、規(guī)則和救援方案.其中,有的態(tài)勢信息是可以直接獲取的,如列車的位置、損壞程度和通信狀態(tài)等.有的則難以直接獲取,如對運營的影響程度,需要由相應(yīng)算法間接計算來確定.決策步驟如下:
圖2 管理Agent決策模型Fig.2 Decision model of management Agent
(1)管理Agent決策模型負責收集指揮Agent上報的態(tài)勢信息,而自身也需要獲取一定的態(tài)勢信息,這都要通過態(tài)勢感知接口來完成.
(2)模糊處理器負責對數(shù)據(jù)庫中的態(tài)勢信息進行分析和模糊處理,依據(jù)決策指標體系提取出相關(guān)信息,提交給模糊推理機進行推理決策.
(3)模糊推理機根據(jù)處理后的態(tài)勢信息,結(jié)合決策規(guī)則、算法等數(shù)據(jù)資源,采用基于模糊評價的方法完成決策推理過程,生成決策結(jié)果.
(4)將決策生成的救援方案通過輸出接口提供給決策管理部門.
模糊綜合評價決策的求解過程如下:
(1)確定評價指標集.
建立影響評價對象的各因素所組成的集合U={u1,u2,…,un},ui表示應(yīng)急資源配置信息、列車運營狀態(tài)信息和現(xiàn)場環(huán)境等.集合ui={ui1,ui2,…,uij}表示對各指標ui進行再劃分后的具體指標集.
(2)建立指標權(quán)重集.
在決策中,各指標的影響程度有所不同,需要為各指標建立相應(yīng)的權(quán)重 W={w1,w2,…,wn}.W反映指標集U的權(quán)重集,wi表示指標ui的權(quán)重集,其中,
(3)建立備選方案集.
即評價集 V={v1,v2,…,vm},各個元素代表可以供選擇的m種方案,需從備選方案集中選出一個最佳的實施方案.
(4)構(gòu)造隸屬度矩陣.
隸屬函數(shù)需根據(jù)實際情況,通過與領(lǐng)域?qū)<业慕涣鱽泶_定,選取三角形或梯形.對于元素ui,根據(jù)隸屬度函數(shù)逐一計算其要素uik(uik∈ui,1≤k≤j)對備選集{v1,v2,…,vm}中的元素的隸屬度 Rik={rk1,rk2,…,rkm},按單個要素 ui評價集的隸屬度組成模糊評價矩陣:
(5)單個要素評價集.
(6)合成運算決策集.
對于要素集U中的每一個要素,依據(jù)步驟(5)的方法分別計算每個因素的評價集,得到整體的模糊評價矩陣 R={B1,B2,…,Bn},則整體的綜合評價集為
(7)確定最優(yōu)結(jié)果.
案例背景描述如下:
應(yīng)急救援時間:2011年2月15日12時30分.
列車情況:列車經(jīng)過隧道時,隧道內(nèi)發(fā)生火災(zāi),列車緊急制動,機車脫軌.
應(yīng)急資源情況:具備軌道救援車以及比較完善的救援設(shè)備和人員.
現(xiàn)場環(huán)境:天氣情況不是很好,隧道內(nèi)能見度低.
救援要求:以最小的代價盡快恢復(fù)線路的運營.
同時根據(jù)以往的救援經(jīng)驗和實例分析,在鐵路應(yīng)急救援方案庫中選擇了4種救援方案.最終要采取哪個方案需要由管理Agent決策決定.
決策指標體系是進行模糊評價的基礎(chǔ),是在鐵路應(yīng)急救援中管理Agent進行救援方案選擇時需要考慮的各種指標.本文依據(jù)大量的鐵路運營現(xiàn)場調(diào)研資料,結(jié)合對實際救援案例的分析,提取影響鐵路應(yīng)急救援決策的要素,建立三層決策指標體系,如圖3所示.最上層為整體的應(yīng)急態(tài)勢評估結(jié)果;中間層包含三個一級指標,即應(yīng)急資源配置信息、列車運營狀態(tài)信息和現(xiàn)場環(huán)境;底層是對一級指標進行再劃分后確定的更詳細的決策指標.
圖3 指標體系結(jié)構(gòu)Fig.3 Index system structure
在模糊綜合評價中,各評價指標的權(quán)重如何分配將直接影響評價的效果.權(quán)重的確定方法主要有專家調(diào)查法、兩兩指標比較法和層次分析法等.在實際運用中,本文結(jié)合鐵路應(yīng)急領(lǐng)域?qū)<业闹R和經(jīng)驗,根據(jù)應(yīng)急救援決策的特點,采用層次分析法對同層次決策指標進行重要度相互比較,通過構(gòu)建判斷矩陣和完成一致性檢查,最后計算出各級指標的權(quán)重值,計算結(jié)果如表1所示.
根據(jù)表1的結(jié)果,可以確定各級指標權(quán)重集為W={0.40,0.40,0.20},w1={0.34,0.36,0.30},w2={0.40,0.35,0.25},w3={0.55,0.45}.
根據(jù)當前的列車狀態(tài)、應(yīng)急資源和現(xiàn)場環(huán)境信息,以及方案庫中存儲的4種不同救援方案,采用上述模糊綜合評價的基本步驟,首先針對不同的要素進行單要素評價,獲得單要素評價矩陣為
然后根據(jù)步驟(5)計算單個要素評價集分別為
最后根據(jù)步驟(6),計算各方案的綜合評價集為
根據(jù)隸屬度最大原則,第3種方案的隸屬度最大,為0.745 4,因此管理Agent將從方案備選集中選擇第3種方案作為當前鐵路應(yīng)急救援的最優(yōu)決策方案.這與實際救援過程中,在當前應(yīng)急態(tài)勢背景下,應(yīng)急指揮部門綜合考慮應(yīng)急資源、列車狀態(tài)和現(xiàn)場環(huán)境信息后選取的救援方案相吻合.
本文以鐵路應(yīng)急救援指揮為應(yīng)用背景,依據(jù)MAS理論,設(shè)計了基于分層Agent的鐵路應(yīng)急救援指揮控制結(jié)構(gòu)模型,根據(jù)模型擔任的角色不同,為不同層次Agent分配了不同的功能,然后提出了基于模糊評價的上層管理Agent決策模型,并闡述了具體的決策過程及算法.通過實際案例分析,驗證了該方法的可行性與適應(yīng)性.將模糊評價的方法與MAS理論相結(jié)合,為研究鐵路應(yīng)急的智能決策提供了新的思路,也為鐵路應(yīng)急救援中科學(xué)的指揮決策提供了重要依據(jù).后期將基于上述模型針對應(yīng)急救援任務(wù)的分解和分配機制進行深入的研究.
[1]陸海洲,王富章,王英杰,等.鐵路應(yīng)急平臺框架體系研究[J].中國鐵路,2007(6):41-44.[LU H Z,WANG F Z,WANG Y J,et al.Research on railway emergency platform frame system [J].China Railways,2007(6):41-44.]
[2]程曉卿,賈利民,秦勇,等.鐵路應(yīng)急管理研究[J].鐵道學(xué)報,2012,34(3):7-13.[CHENG X Q,JIA L M,QING Y,etal. Research on railwayemergency management[J].Journal of the China Railway Society,2012,34(3):7-13.]
[3]Massaguer D,Balasubramanian V,Mehrotra S,et al.Multi-agent simulation of disaster response[J].U.S.Information Proceeding and Management,2006:35-42.
[4]Filippoupplitis A,Gelenbe E,Gianni D,et al.Distributed Agent-based building evacuation simulator[J].U.S.Oxford Journals,Mathematics & Physical Science,Computer Journal,2011,53(9):1384-1400.
[5]王富章,張莉艷,李平,等.城市軌道交通智能綜合監(jiān)控系統(tǒng)體系結(jié)構(gòu)[J].中國鐵道科學(xué),2006,27(1):126-132.[WANG F Z,ZHANG L Y,LI P,et al.The framework of urban mass transit intelligent integration supervision and control system [J].China Railway Science,2006,27(1):126-132.]
[6]尹全軍,秦龍,陳偉,等.災(zāi)害應(yīng)急反應(yīng)建模與仿真[J].國防科技大學(xué)學(xué)報,2012,34(1):43-47.[YIN Q J,QIN L,CHEN W,et al.Disaster emergency response modeling and simulation[J].Journal of National University of Defense Technology,2012,34(1):43-47.]
[7]吳揚波,賈全,王文廣,等.基于規(guī)則推理的海戰(zhàn)仿真實體決策方法[J].火力與指揮控制,2009,34(8):30-33.[WU Y B,JIA Q,WANG W G,et al.The research on decision-making of the dombat entity of naval tactical simulation based on rule reasoning[J].Fire Control and Command Control,2009,34(1):30-33.]
[8]裘杭萍,管留,潘曉東,等.基于分層Agent的戰(zhàn)術(shù)行動仿真決策機制研究[J].計算機應(yīng)用研究,2011,28(7):2455-2461.[QIU H P,GUAN L,PAN X D,et al.Research on decision-making mechanism of tactical action simulation based on layered agent[J].Application Research of Computers,2011,28(7):2455-2461.]
[9]秦智,張仕斌.基于模糊理論的安全控制測評模型的研究[J].計算機應(yīng)用研究,2009,26(12):4771-4773.[QIN Z,ZHANG S B.Research of security control testing and evaluation model based on fuzzy theory[J].Application Research of Computers,2009,26(12):4771-4773.]