韓志軍,孫少斌,張仁友,閆家傳
(裝甲兵學院,安徽蚌埠233050)
裝甲兵作戰(zhàn)多智能體建模技術及其應用*
韓志軍,孫少斌,張仁友,閆家傳
(裝甲兵學院,安徽蚌埠233050)
利用作戰(zhàn)領域啟發(fā)知識,綜合傳統(tǒng)建模技術和智能體優(yōu)點,首先按照分層結構化組合思想建立了裝甲兵兵力智能體模型,并基于層次任務網的決策規(guī)劃機制和基于軍事命令控制結構構建了多智能體模型,然后采用VRMS平臺開發(fā)了裝甲兵作戰(zhàn)多智能體應用驗證演示系統(tǒng),最后結合實例探索了多智能體系統(tǒng)在模擬訓練、作戰(zhàn)實驗、輔助決策等領域的仿真應用,其研究有效地提高了裝甲兵作戰(zhàn)行為仿真的智能性、自主性和逼真性。
裝甲兵作戰(zhàn),兵力行為建模,多智能體技術,仿真應用
多智能體建模技術是復雜適應系統(tǒng)建模的有效方法,能夠深刻描述作戰(zhàn)系統(tǒng)的涌現(xiàn)行為和自組織性,為裝甲兵作戰(zhàn)系統(tǒng)建模與仿真提供了一種有效的解決方案。但由于多智能體系統(tǒng)的固有復雜性,目前還沒有形成統(tǒng)一的理論與技術框架,而且由于智能體的認知、決策、規(guī)劃調度、協(xié)作的復雜度,導致在實時性和動態(tài)反應性等方面的不足,限制了其實際應用[1]。
本文是以復雜適應系統(tǒng)理論為指導,利用軍事領域對兵力行為模擬的有利知識,結合傳統(tǒng)建模仿真方法的優(yōu)點,研究基于多智能體系統(tǒng)的作戰(zhàn)仿真及其應用技術,將作戰(zhàn)領域知識、傳統(tǒng)建模方法和多智能體系統(tǒng)優(yōu)勢有機結合起來,探索利用智能體模擬參與裝甲兵作戰(zhàn)的實際兵力,實現(xiàn)其角色的作戰(zhàn)行為,對于提高裝甲兵作戰(zhàn)仿真的客觀性、真實性和應用水平,促進我軍模擬化建設水平具有重要的意義和實際應用價值。
通過軍事專家對裝甲兵的作戰(zhàn)環(huán)境、武器裝備、技戰(zhàn)術特點、體制編制、作戰(zhàn)思想、原則等的認真分析和抽象,建立裝甲兵作戰(zhàn)系統(tǒng)的軍事概念模型,抽象出作戰(zhàn)描述的關鍵要素、關鍵過程以及它們之間的聯(lián)系和邏輯關系,建立裝甲兵作戰(zhàn)EATI(Entities,Actions,Tasks,Interactions)概念模型,準確描述出兵力行為關鍵要素、過程及其邏輯關系,為完整、精確的仿真建模和設計奠定基礎。
1.1裝甲兵作戰(zhàn)過程分析
通過對裝甲兵(部)分隊作戰(zhàn)的分析研究,無論作戰(zhàn)使命和作戰(zhàn)樣式如何,裝甲兵(部)分隊作戰(zhàn)實體都是在接受上級命令后,通過分析和領會上級意圖,結合實際戰(zhàn)場態(tài)勢情況確定自身的使命任務,然后制定任務的行動計劃并付諸實施。其作戰(zhàn)過程可以抽象概括為判斷情況(態(tài)勢理解)、確定使命任務、制定方案計劃、組織實施計劃4個階段。
1.2裝甲兵作戰(zhàn)行為關鍵描述要素
經過對作戰(zhàn)過程的抽象,從使命、任務、行動3個層次來理解描述作戰(zhàn)行為。作戰(zhàn)行動的有序組合可以完成特定任務,作戰(zhàn)兵力通過一定協(xié)調方式完成各自任務實現(xiàn)分隊的作戰(zhàn)使命任務。反之,作戰(zhàn)使命任務可以分解為個體任務,個體任務可以規(guī)劃為基本行動序列實現(xiàn)[2]。首先實現(xiàn)裝甲兵兵力所能執(zhí)行的基本作戰(zhàn)動作(取決于裝甲裝備技戰(zhàn)性能),通過基本作戰(zhàn)動作有機組合完成裝甲兵力個體任務,然后按照一定規(guī)則協(xié)調完成各兵力任務進而實現(xiàn)分隊使命任務。兵力的決策行為過程通過將分隊使命任務分解,分配給單個個體兵力,個體兵力在一定的約束條件下規(guī)劃并協(xié)同執(zhí)行實現(xiàn)任務的行動步驟。
基于對裝甲兵作戰(zhàn)概念模型的準確理解和認識,以及基于多智能體建模技術作戰(zhàn)建模方法的分析研究,以CAS(Complex Adaptive System)理論為指導,按照面向對象思想,通過對裝甲兵作戰(zhàn)系統(tǒng)各構成要素的層次模塊化抽象封裝,設計裝甲兵作戰(zhàn)仿真多智能體系統(tǒng),從環(huán)境、對象、兵力、實體操作、關系和約束描述裝甲兵作戰(zhàn)系統(tǒng)。裝甲兵作戰(zhàn)仿真多智能體系統(tǒng)(MAS)形式化描述如下:
MAS={E,O,A,R,Op,Rules}
E-戰(zhàn)場環(huán)境;
O-戰(zhàn)場環(huán)境中的對象;
A-兵力智能體(A屬于O);
R-關系;
Op-操作;
Rules-系統(tǒng)制約規(guī)則。
基于多智能體的建模方法采用組織的觀點,描述作戰(zhàn)實體的兵力組織結構和控制關系,通過智能體之間的交互,模擬戰(zhàn)場環(huán)境中實體的指揮控制、通信、協(xié)同等復雜的作戰(zhàn)行為。
為了準確描述裝甲兵兵力模型特點,真實模擬裝甲兵分隊兵力作戰(zhàn)行為,同時提高系統(tǒng)的模塊性和可實現(xiàn)性,綜合慎思型智能體和反應式智能體優(yōu)勢,采用層次模塊化組合方法設計了裝甲兵兵力智能體的復合結構。
模型主要由分層的兵力知識庫和多狀態(tài)的控制單元組成。在模型結構的設計上清晰地分離了兵力的知識庫和功能控制部分,并層次化組織各功能模塊。通過分離知識庫和功能控制,方便各自獨立實現(xiàn),提高了系統(tǒng)的模塊性和靈活性,使各部分能采用最適宜的技術相對獨立地加以解決,有利于軍事領域知識的應用,增強了系統(tǒng)的可擴展性[3]。兵力知識庫設計按照裝甲兵分隊作戰(zhàn)原則和戰(zhàn)術規(guī)則(分隊戰(zhàn)術、單車戰(zhàn)術)等領域知識的關系,根據(jù)包含知識的復雜度進行層次化的組織構造。一方面底層知識是上層知識的構造和描述單元,另一方面上層知識可以直接調用和觸發(fā)下層知識,既方便了知識庫的建立,又方便了作戰(zhàn)領域知識的應用。
在控制單元設計上,根據(jù)戰(zhàn)場環(huán)境下兵力作戰(zhàn)運用的特點,對傳統(tǒng)智能體模型進行了適當?shù)牟眉簦凑昭b甲兵分隊作戰(zhàn)使命、任務、行動的層次分解/組合關系進行組織。智能體按照“認知環(huán)境—決策—規(guī)劃—行動”的方式進行動作,與實際兵力作戰(zhàn)行動相一致。行動層通過物理行為實現(xiàn),智能行為根據(jù)一般兵力和指揮型兵力角色的不同將兵力智能行為分為局部規(guī)劃和協(xié)作規(guī)劃,分別對應任務和使命層。局部規(guī)劃通過有機組合作戰(zhàn)行動實現(xiàn)兵力個體任務,協(xié)作規(guī)劃協(xié)調各兵力任務完成作戰(zhàn)使命。
實際作戰(zhàn)中各部兵力不是獨自行動,而是根據(jù)戰(zhàn)斗編成有組織的協(xié)調行動。單個兵力實現(xiàn)特定作戰(zhàn)實體的個體自主行為模擬,但受其資源和能力的限制,無法實現(xiàn)作戰(zhàn)編成的整體行為,需要在個體兵力模型基礎上建立一定數(shù)量兵力組成的多智能體系統(tǒng),使它們在一致的環(huán)境中按照規(guī)定的作戰(zhàn)編成控制規(guī)則進行交互協(xié)作,共同實現(xiàn)分隊作戰(zhàn)行為的模擬。
4.1裝甲兵兵力智能體組織模型
在作戰(zhàn)環(huán)境中兵力實體必須以建制為單元協(xié)調行動,不同角色的兵力具有不同程度上的自主性,各種角色的兵力之間有一定的隸屬和控制關系,下級兵力必須按照其上級的命令和指揮執(zhí)行作戰(zhàn)任務。為了更好地模擬兵力實體間的作戰(zhàn)和控制關系,需要按照作戰(zhàn)實體編制控制關系的層次結構對兵力智能體進行組織和控制。
采用基于軍事命令控制結構對兵力智能體進行組織和控制,為兵力作戰(zhàn)單元間的控制及通信聯(lián)絡提供了與實際作戰(zhàn)環(huán)境相似的框架,可以方便地模擬實際作戰(zhàn)兵力的指揮協(xié)同關系。將兵力智能體按照作戰(zhàn)編成組織成相應的單元,一方面其兵力實體就可以根據(jù)作戰(zhàn)原則成建制地協(xié)調行動,確保了仿真的真實性;另一方面層次化的兵力角色組織結構,能夠方便地將復雜的作戰(zhàn)任務分解成幾個較小的任務,提高了兵力智能體規(guī)劃的效率。
在層次化的兵力智能體組織結構中上層的智能體控制下層的智能體,實現(xiàn)比其下級更大規(guī)模和更長時間的作戰(zhàn)目標的規(guī)劃,負責向下級分配任務并監(jiān)控所屬單位完成任務的情況。下層的兵力智能體隸屬于上層兵力智能體,接受上級兵力的命令和任務并規(guī)劃執(zhí)行,在執(zhí)行上級分配任務的同時對戰(zhàn)場環(huán)境變化作出自主反應。命令的傳送直接按層次結構由上而下,而情報信息在同層間共享和上報。
4.2裝甲兵兵力智能體團體協(xié)作模型
兵力的編成組織結構為協(xié)作提供了有效的框架,參與協(xié)作的各智能體按照一定的協(xié)作約束要求,協(xié)同執(zhí)行各自承擔的子任務便可實現(xiàn)組織任務的協(xié)作[4]。但由于戰(zhàn)場環(huán)境的動態(tài)變化性和不確定性,各智能體可能同時擁有多個目標,只有參與協(xié)作的所有智能體都承諾實現(xiàn)各自的協(xié)作子任務,組織任務的協(xié)作完成才能有效實施。
采用基于HTN(Hierarchical Task Networks)的協(xié)作規(guī)劃結合聯(lián)合意圖的方法實現(xiàn)智能體的團體協(xié)作。HTN決策規(guī)劃機制實現(xiàn)協(xié)作的規(guī)劃,協(xié)作規(guī)劃屬于部分全局規(guī)劃(Partial Global Planning,PGP),即指揮員智能體根據(jù)協(xié)作任務的性質,通過協(xié)作規(guī)劃機制規(guī)劃協(xié)作方式、約束條件,將任務分解為子任務并分配給參與協(xié)作的各智能體;子任務實現(xiàn)計劃則由各智能體按照要求的協(xié)作方式和約束條件獨立規(guī)劃,并調整自己的行為以達到協(xié)作的目標。聯(lián)合意圖則使各智能體都同步承諾實現(xiàn)其子任務,保證協(xié)作的有效可靠實施。智能體的協(xié)作通過建立協(xié)作和實現(xiàn)協(xié)作兩步完成,協(xié)作之前建立協(xié)作的聯(lián)合意圖,然后由各智能體根據(jù)約束條件規(guī)劃實現(xiàn)具體的協(xié)作動作,以保證協(xié)作可靠實施以及協(xié)作失敗后的重新規(guī)劃。
驗證系統(tǒng)充分展現(xiàn)了虛擬環(huán)境中裝甲兵作戰(zhàn)實體個體屬性和作戰(zhàn)行為表現(xiàn),以及成建制的團體行為屬性確定和協(xié)作運行控制行為表現(xiàn),并重點展現(xiàn)了多智能體建模技術在裝甲兵模擬訓練、實驗分析等方面中的具體應用。其驗證系統(tǒng)主界面如圖1所示。
圖1 驗證系統(tǒng)主界面
5.1單智能體智能行為實現(xiàn)與技術驗證
在系統(tǒng)主界面,單擊“單智能體”,選擇“單智能體行為驗證”,可以實現(xiàn)裝甲兵兵力單智能體慎思式行為與反應式行為驗證。
5.1.1任務部署
為驗證裝甲裝備單智能體的慎思和反應式行為,首先設置了坦克和輸送車兩種典型的裝甲裝備智能體,以一輛主戰(zhàn)坦克和一輛兵力輸送車為例,將其部署在居民地外側,在居民地的另外兩側分別部署一個組的敵步兵,分別賦予這兩個智能體打擊敵小組步兵的任務,然后在輸送車與其打擊的小組步兵之間設置一個觸發(fā)器,當輸送車行至附近時觸發(fā),最后設置一個觀看席位。任務部署如下頁圖2所示。
5.1.2單智能體慎思行為
為坦克和輸送車兩個智能體賦予了打擊敵小組步兵任務,并沒有為其賦予一定的路線和打擊方法。任務開始后,兩個智能體會自動啟動車輛,向各自的任務區(qū)搜索前進,在前進過程中,兩個智能體會自動規(guī)避障礙。在沒有感知到敵情威脅的情況下,兩個智能體能夠自動尋找道路,并沿道路搜索前進;在坦克搜索到敵步兵小組以后,會智能地選擇相應的武器和彈藥,自動開火,消滅敵人。由于敵步兵小組也設置了智能行為,所以會發(fā)生雙方交火的情況。
圖2 單智能體行為驗證任務部署圖
5.1.3單智能體反應式行為
在任務部署時,輸送車及其任務目標之間事先設置了一個觸發(fā)器,輸送車一旦到達就會觸發(fā)。此時輸送車會暫時停止執(zhí)行之前賦予的打擊敵步兵小組的任務,首先將當前的敵人消滅,在消滅當前的敵人或者敵人逃退后,輸送車會繼續(xù)執(zhí)行之前賦予的打擊敵步兵的任務。
5.2多智能體智能行為實現(xiàn)與技術驗證
在系統(tǒng)主界面,單擊“多智能體”,進入后首先建立訓練服務器端,一般由訓練的組織者,即導演席位負責新建訓練服務器,也可以由其他受訓者建立服務器環(huán)境,當網絡上有人建立服務器環(huán)境后,在“主機登錄”下面將會出現(xiàn)登錄的服務主機,一次訓練只能有一個人建立服務器端,其他受訓者加入服務器。選擇“導演”席位的終端為導調終端。此終端主要實現(xiàn)導控的相關功能,以及可以從不同的視角觀察智能體的智能行為等。
圖3 智能體角色賦予界面
指揮智能體是通過裝甲裝備和對裝甲裝備的人員賦予相應的角色實現(xiàn)的,如圖3所示,可為坦克智能體賦予戰(zhàn)士、班長、排長、連長等多種角色,指揮級別的高低通過智能體的角色來體現(xiàn)。確定指揮關系后,便可以賦予指揮智能體相應的作戰(zhàn)任務,并可設置指揮智能體之間的協(xié)同事項。在系統(tǒng)運行過程中,指揮智能體能夠指揮并規(guī)劃其下屬智能體行動。如果兩個指揮坦克智能體之間是平級關系,不構成指揮關系,那么兩個平級指揮智能體之間只有協(xié)同關系。
6.1在裝甲兵模擬訓練系統(tǒng)中的應用
在裝甲兵專業(yè)技術模擬訓練中,多智能體系統(tǒng)主要用于自主設置和調整訓練條件,構設復雜逼真的戰(zhàn)斗環(huán)境,適時地產生相應的“劇情”,并增強“人機對抗”功能等。
利用多智能體系統(tǒng)構設的模擬訓練系統(tǒng)就可以有針對性地加強受訓人員的相關專業(yè)技術弱項內容的強化訓練。它可以根據(jù)弱項內容訓練需要,自主設置訓練過程和調整訓練條件,減少受訓人員已經掌握的相關專業(yè)技術內容的訓練時間,加強專業(yè)技術弱項內容的訓練強度。多智能體模擬訓練系統(tǒng)的開發(fā)與應用,大大增加了訓練過程和訓練內容的靈活性。模擬訓練系統(tǒng)可以根據(jù)訓練進程,緊貼訓練目的,適時生成訓練劇情,讓訓練為戰(zhàn)而訓,去除程序化、模式化,讓訓練更真更實用,讓訓練人員由訓練熟手變成訓練能手、戰(zhàn)爭高手。
6.2在裝甲兵作戰(zhàn)實驗分析中的應用
裝甲兵實驗分析中仿真對象繁多,仿真對象的層次、粒度要求各不相同,仿真對象動作與交互具有復雜性和不確定性,仿真任務十分復雜,因此,分析實驗仿真需要一個綜合的裝甲兵軍事仿真模型體系提供支撐[5]。
當系統(tǒng)加載目標方案后,仿真系統(tǒng)可以對作戰(zhàn)方案實施動態(tài)推演,并可根據(jù)需要自動調用各類模型算法,以實現(xiàn)對裝甲兵兵力兵器性能的仿真、各類作戰(zhàn)效果的仿真。兵力實體可根據(jù)行動規(guī)則仿真具體的行動過程,也可接受人工干預,實現(xiàn)人不在回路的作戰(zhàn)實驗,主要通過控制兵力實體的自主和半自主智能行為實現(xiàn)。當所有乘員的智能行為都由智能體代替時,將所用裝甲車輛設置為完全自主的智能體。在整個作戰(zhàn)仿真實驗過程中,系統(tǒng)能夠推演生成各類仿真數(shù)據(jù),比如作戰(zhàn)兵力實體行動數(shù)據(jù)、指揮實體指揮報告數(shù)據(jù)、雙方交戰(zhàn)毀傷數(shù)據(jù)等信息,通過系統(tǒng)實時生成并提交給作戰(zhàn)實驗分析人員,實驗人員便可以很方便地實現(xiàn)對整個作戰(zhàn)過程的把握以及進程控制。
6.3在裝甲兵作戰(zhàn)輔助決策中的應用
現(xiàn)代作戰(zhàn)是在一種信息化、強度高、節(jié)奏快的條件下的作戰(zhàn),瞬息萬變的戰(zhàn)場環(huán)境使得任何一個局部戰(zhàn)況的疏忽或延誤都有可能導致整個作戰(zhàn)態(tài)勢的改變,為此裝甲兵作戰(zhàn)輔助決策必須快速實時地對戰(zhàn)場的變化作出反應,輔助裝甲兵部(分)隊指揮員進行快速決策,搶占有力先機。智能體具有智能性、實時性、社會性和主動性,非常適合構建面對動態(tài)復雜環(huán)境的系統(tǒng)。將多智能體建模技術用于裝甲兵作戰(zhàn)輔助決策中,增強了輔助決策系統(tǒng)的智能性、實時性以及對動態(tài)復雜的戰(zhàn)場環(huán)境的適應性。
裝甲兵作戰(zhàn)系統(tǒng)是一類典型的CAS系統(tǒng),其作戰(zhàn)過程是一個動態(tài)的自適應過程,具有自學習、自組織的能力。多智能體技術是復雜適應系統(tǒng)建模的有效方法,能夠深刻描述裝甲兵作戰(zhàn)系統(tǒng)的涌現(xiàn)行為和自組織性,為裝甲兵作戰(zhàn)系統(tǒng)建模與仿真應用提供了一種切實可行的解決方案。
本研究在對基于信息系統(tǒng)體系作戰(zhàn)中的裝甲兵作戰(zhàn)系統(tǒng)進行全面分析的基礎上,面向裝甲兵作戰(zhàn)系統(tǒng)建模與仿真應用兩類人員,分別探索了單智能體實體及其團體組織行為模型,以及多智能體之間的交互關系和協(xié)作機制,并探討了基于多智能體建模技術在裝甲兵模擬訓練、作戰(zhàn)實驗分析、作戰(zhàn)指揮輔助決策支持等軍事仿真中的應用,對裝甲兵作戰(zhàn)系統(tǒng)建模與仿真應用具有直接的指導意義和重要的參考價值。
[1]遲妍.基于復雜適應系統(tǒng)理論的作戰(zhàn)模型研究[D].長沙:國防科學技術大學,2004.
[2]孫少斌,張仁友.基于智能體技術的CGF行為模擬研究[J].火力與指揮控制,2009,34(3):79-83.
[3]郭齊勝,楊立功.計算機生成兵力導論[M].北京:國防工業(yè)出版社,2006.
[4]SUN S B,PAN J.Behavior modeling of computer generated forces[C]//IEEE EEESYM,2012.
[5]劉笑軍,張仁友.裝甲兵戰(zhàn)斗概念建模[M].北京:軍事科學出版社,2006.
Research on Modeling Technology and Application of Multi-agent in Armored Force Warfare Simulation
HAN Zhi-jun,SUN Shao-bin,ZHANG Ren-you,YAN Jia-chuan
(Armored Force Institute,Bengbu 233050,China)
Through utilizing heuristic knowledge in armored force operation domain,integrating advantages of traditional warfare modeling with the benefits of agent technology,firstly the agent model of armored force is established according to the hierarchically structured assembling principle,and the multi-agent’s models are constructed which based on decision-making and planning mechanism with HTN and military command control structure.Then the validate system of multi-agent in armored force is developed based on the VRMS.Finally the application of armored force simulation MAS in simulation training,warfare experimentation,and decision support etc are discussed.There is to promote effectively intelligentized,independence and authenticity of armored force warfare behavior simulation.
armored force warfare,force behavior modeling,multi-agents technology,simulation application
TP391.9;E923.1
A
1002-0640(2016)06-0001-04
2015-05-05
2015-06-07
軍內武器裝備科研基金資助項目(CX2012001)
韓志軍(1976-),男,河南漯河人,博士,講師。研究方向:計算機仿真。