韓月敏,李衛(wèi)平,劉玉濤,劉永鋒
(石家莊陸軍指揮學院,河北 石家莊 050084)
陸軍作戰(zhàn)是典型的復雜系統(tǒng)[1]。陸戰(zhàn) Agent是陸軍作戰(zhàn)復雜系統(tǒng) ABMS核心的基礎要素。友方陸戰(zhàn)Agent之間的協(xié)作機制是陸軍作戰(zhàn)復雜系統(tǒng)演化運行的關(guān)鍵支撐之一。陸戰(zhàn)Agent之間的協(xié)作可歸納為自主協(xié)作和上級統(tǒng)一組織協(xié)作兩種模式。文獻[2]對上級統(tǒng)一組織的協(xié)作機制模型進行了研究,而對陸戰(zhàn)Agent自主協(xié)作機制模型的專門研究還很鮮見。陸戰(zhàn)Agent自主協(xié)作,雖與一般 Agent系統(tǒng)中的協(xié)作模式相同,但由于陸軍作戰(zhàn)的特殊性,必須研究符合陸軍作戰(zhàn)特點的陸戰(zhàn)Agent自主協(xié)作機制模型。
陸戰(zhàn)Agent自主協(xié)作是同級的陸戰(zhàn)Agent在自身沒有能力完成任務時,發(fā)出臨時協(xié)作請求,再根據(jù)對方陸戰(zhàn)Agent的回應情況,進行協(xié)作任務的分配。其自主協(xié)作過程可抽象簡化為“分析作戰(zhàn)任務—形成協(xié)作團隊—生成任務計劃—執(zhí)行監(jiān)控任務”等四個階段。其中,形成協(xié)作團隊是關(guān)鍵環(huán)節(jié),并且陸戰(zhàn)Agent自主協(xié)作的雙方是一種對等關(guān)系。因此,其協(xié)作方法應該采用合同網(wǎng)協(xié)議[3]。
合同網(wǎng)協(xié)議作為一個基于市場運行機制的協(xié)作方法,可以成功地解決一個任務在多個Agent之間的分配問題,但將其應用于陸戰(zhàn)Agent自主協(xié)作,還存在以下5個問題:
1)合同網(wǎng)協(xié)議不符合陸戰(zhàn)高時效、近實時的作戰(zhàn)特點。合同網(wǎng)協(xié)議采用廣播通信方式進行任務招標,一方面會造成系統(tǒng)的通信量過大,另一方面會加重管理Agent對每個投標評價擇優(yōu)的決策負擔。因此,難以滿足陸軍作戰(zhàn)高時效、近實時的要求。
2)合同網(wǎng)協(xié)議不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動性。合同網(wǎng)協(xié)議中的合同Agent只能被動地接受管理 Agent發(fā)布的任務信息,不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動性。
3)合同網(wǎng)協(xié)議基于市場協(xié)作的描述方式及運行機制不適用于作戰(zhàn)領(lǐng)域。合同網(wǎng)協(xié)議的任務分配過程是運用經(jīng)濟行為中的“招標-投標-中標-簽約”機制,以標值為紐帶的Agent之間的協(xié)商過程。這種基于市場協(xié)作的描述方式及運行機制,不符合作戰(zhàn)領(lǐng)域的實際。
4)合同網(wǎng)協(xié)議缺乏對陸戰(zhàn)Agent作戰(zhàn)能力動態(tài)變化的考慮。合同網(wǎng)協(xié)議只考慮了Agent的靜態(tài)能力,很難反映作戰(zhàn)過程中陸戰(zhàn) Agent作戰(zhàn)能力的動態(tài)變化。
5)合同網(wǎng)協(xié)議對協(xié)作任務失效的處置不符合戰(zhàn)場實際。合同網(wǎng)協(xié)議對任務失效情況的處置方法是重新發(fā)布任務,以尋求新的合作者。這種方法不符合陸戰(zhàn)場作戰(zhàn)任務不可重復及高時效性的實際。
針對以上問題,本文提出以下5條改進思路:
1)針對合同網(wǎng)協(xié)議信息交互量大的問題,用黑板代替廣播的通信模式,作戰(zhàn)任務信息由協(xié)作請求者發(fā)布到黑板上,系統(tǒng)中的協(xié)作參與者自行感知相關(guān)任務信息。
2)針對合同網(wǎng)協(xié)議不能反映陸戰(zhàn)Agent協(xié)作配合主動性的問題,引入陸戰(zhàn)Agent主動感知特性,用能力參數(shù)值來衡量協(xié)作參與者當前的負載和資源狀況。協(xié)作參與者通過計算自身的感知系數(shù)來確定是否響應協(xié)作請求者的作戰(zhàn)任務信息。
3)針對合同網(wǎng)協(xié)議基于市場協(xié)作的描述方式及運行機制不適用于作戰(zhàn)領(lǐng)域的問題,對合同網(wǎng)協(xié)議進行重新描述,使其符合作戰(zhàn)領(lǐng)域的特殊要求,具體描述如表1和表2所示。
表1 合同網(wǎng)協(xié)議作戰(zhàn)應用階段描述
表2 合同網(wǎng)協(xié)議作戰(zhàn)應用角色描述
4)針對合同網(wǎng)協(xié)議缺乏對陸戰(zhàn)Agent作戰(zhàn)能力動態(tài)變化考慮的問題,引入評估模型,定期對各陸戰(zhàn)Agent進行評估,及時更新其作戰(zhàn)能力狀況,以作為參與作戰(zhàn)協(xié)作的依據(jù)。
5)針對合同網(wǎng)協(xié)議對協(xié)作任務失效處置不符合戰(zhàn)場實際的問題,為防止作戰(zhàn)任務分配過程中出現(xiàn)任務失效情況,在陸戰(zhàn)Agent執(zhí)行作戰(zhàn)任務過程中,如果出現(xiàn)突發(fā)情況需要調(diào)整甚至放棄協(xié)作任務時,不能簡單地中止或調(diào)整其正在執(zhí)行的作戰(zhàn)任務,必須制定相應的規(guī)則,指導陸戰(zhàn)Agent處置突發(fā)情況。
根據(jù)合同網(wǎng)協(xié)議的改進思路,引入心智參數(shù)的概念,對其協(xié)作準備、協(xié)作請求、發(fā)送任務承諾、協(xié)作成員優(yōu)選等各個階段進行改進。
1.3.1陸戰(zhàn)Agent心智參數(shù)
1)感知度
定義1 感知度:協(xié)作參與陸戰(zhàn)Agentj對于協(xié)作請求者發(fā)布作戰(zhàn)任務的響應程度,稱為陸戰(zhàn)Agentj的感知度,記為Prej。
協(xié)作參與者的感知度由其自身可用資源狀況,以及其當前的忙閑程度決定:
其中,Resj表示陸戰(zhàn)Agentj本身所具有的可用資源量;Idlej表示陸戰(zhàn)Agentj的忙閑度,以衡量自身任務量的繁重程度。P1、P2是資源和忙閑度的權(quán)值,可根據(jù)實際情況設置。
定義2 感知閾:允許協(xié)作參與者陸戰(zhàn)Agentj獲取作戰(zhàn)任務感知度的最小值,稱為陸戰(zhàn)Agentj的感知閾,記為PreThj。
當Prej≤PreThj時,則禁止協(xié)作陸戰(zhàn)Agentj響應任何作戰(zhàn)任務信息。
2)能力度
定義3 能力度:協(xié)作參與陸戰(zhàn)Agentj能夠順利完成任務的作戰(zhàn)能力,稱為陸戰(zhàn)Agentj的能力度,記為Capj。
協(xié)作參與陸戰(zhàn)Agentj的能力度主要由主觀能力度R1和客觀能力度R2兩部分組成。
主觀能力度R1是依據(jù)協(xié)作參與陸戰(zhàn)Agentj主觀條件所建立的能力度,主要取決于對協(xié)作參與陸戰(zhàn)Agentj的指揮控制能力 C、訓練水平 L、士氣狀態(tài) S的分析和評價。
客觀能力度R2是依據(jù)協(xié)作參與陸戰(zhàn)Agentj客觀條件所建立的能力度,主要取決于對協(xié)作參與陸戰(zhàn)Agentj的武器裝備性能W、綜合能力F及作戰(zhàn)環(huán)境條件 E(表示作戰(zhàn)環(huán)境對于作戰(zhàn)效能的影響)的分析和評估。
能力度Capj可表示如下:
其中,Capj、R1、R2、C、L、S、、W、F、α、β、ω1、ω2、ω3、μ1、μ2、μ3的取值范圍均為[0,1]之間的實數(shù),表示權(quán)重系數(shù),并且α+β=1,ω1+ω2+ω3=1,μ1+μ2+μ3=1 。
陸戰(zhàn)Agent的能力度是協(xié)作請求者選擇協(xié)作伙伴的主要指標之一,是一個動態(tài)變量,受多個因素影響。在協(xié)作參與者完成一個任務后,需要對其能力度重新進行評估。
3)能力度修正值ξ
為了體現(xiàn)陸戰(zhàn)Agent執(zhí)行不同任務時所表現(xiàn)出的不同作戰(zhàn)能力,可依據(jù)任務類型,定義相應的修正值,以保證能力度較好地刻畫其相應的作戰(zhàn)能力。ξ的值域范圍為[0,1]。
4)熟悉度
定義4 陸戰(zhàn)Agentj成功完成陸戰(zhàn)Agenti交給作戰(zhàn)任務的次數(shù)與陸戰(zhàn)Agenti委托作戰(zhàn)任務的總次數(shù)之比,稱為陸戰(zhàn)Agenti對陸戰(zhàn)Agentj的熟悉度,記為Fri(i,j)。
其中,Nij表示陸戰(zhàn) Agentj成功完成陸戰(zhàn) Agenti交給任務的次數(shù);Ni表示陸戰(zhàn)Agenti委托任務的總次數(shù)。
熟悉度也是協(xié)作請求者選擇協(xié)作伙伴的重要指標之一。對于同一作戰(zhàn)任務,在能力度相當?shù)那闆r下,協(xié)作請求陸戰(zhàn)Agent更傾向于選擇熟悉度較高的協(xié)作參與陸戰(zhàn)Agent。
5)協(xié)作承諾閾
定義5 協(xié)作參與陸戰(zhàn)Agentj在同一時刻能夠發(fā)送的最多作戰(zhàn)任務承諾數(shù),稱為陸戰(zhàn)Agentj的協(xié)作承諾閾,記為Thdj。
設置協(xié)作承諾閾的目的是為了限制協(xié)作參與者對作戰(zhàn)任務的盲目參與,保證協(xié)作參與者的每個承諾都是有效的。承諾閾的大小與協(xié)作參與者的感知度相關(guān),并隨著感知度的變化而變化。
6)協(xié)作承諾數(shù)
定義6 協(xié)作參與陸戰(zhàn)Agentj當前發(fā)送的所有作戰(zhàn)任務承諾總數(shù),稱為協(xié)作承諾數(shù),記為Tamj。
當Tamj<Thdj時,協(xié)作參與者可響應黑板上的協(xié)作任務信息。
1.3.2協(xié)作準備
協(xié)作準備包括對待分配任務的分析與分解、制定作戰(zhàn)任務信息表等工作。作戰(zhàn)任務信息表主要包括協(xié)作請求者、作戰(zhàn)任務描述、作戰(zhàn)任務約束條件以及作戰(zhàn)任務參與、完成時限等信息。
1.3.3協(xié)作請求
協(xié)作請求的方法是協(xié)作請求者將作戰(zhàn)任務信息發(fā)布到黑板上,并且在作戰(zhàn)任務信息中設置截止時間參數(shù)。當?shù)竭_截止時間時,任務信息失效,黑板系統(tǒng)自動刪除作戰(zhàn)任務信息。同時協(xié)作參與陸戰(zhàn)Agent根據(jù)自身感知度的大小,判斷能否從黑板獲取作戰(zhàn)任務信息,從而參與協(xié)作。
協(xié)作請求的工作流程如圖1所示。
圖1 協(xié)作請求工作流程
1.3.4任務承諾
協(xié)作參與陸戰(zhàn)Agent接收到黑板上的作戰(zhàn)任務信息后,即進入了任務承諾階段。任務承諾的主要工作包括協(xié)作參與陸戰(zhàn)Agent對協(xié)作子任務的評估及向協(xié)作請求者發(fā)出任務承諾。
為了限制陸戰(zhàn)Agent象傳統(tǒng)合同網(wǎng)協(xié)議中的合同者那樣盲目參與,避免由于協(xié)作參與者自身能力不足,而造成承諾失敗的問題,從節(jié)約系統(tǒng)資源,減輕陸戰(zhàn)Agent負擔,加快系統(tǒng)執(zhí)行效率的角度出發(fā),對合同網(wǎng)協(xié)議作如下改進:
1)為每個協(xié)作參與者設置一個協(xié)作參與閾值,即每個協(xié)作參與者能夠進行任務承諾的最大值,其大小與陸戰(zhàn)Agent的感知度相關(guān)聯(lián)。當感知度降低時,協(xié)作參與閾值也同時降低,表示陸戰(zhàn)Agent并行執(zhí)行任務的能力降低,反之亦然。
2)當協(xié)作參與者有能力執(zhí)行作戰(zhàn)任務時,設置評估函數(shù)對作戰(zhàn)任務進行排序,從中選出自己最有把握的作戰(zhàn)任務,按照一定的規(guī)則形成任務承諾信息發(fā)送給協(xié)作請求者。
1.3.5優(yōu)選最佳協(xié)作參與者
優(yōu)選最佳協(xié)作參與者就是按照某種策略,從眾多參與者中選擇合適的協(xié)作伙伴??偟脑瓌t是能更好地完成作戰(zhàn)任務的各個子目標,在對協(xié)作參與陸戰(zhàn)Agent優(yōu)選時,需要考察其綜合能力,如完成作戰(zhàn)任務的質(zhì)量、能力度、熟悉度、感知度等,以保證作戰(zhàn)任務總體效果能達到最佳。這些因素有些是無法準確量化的,因此,應該采用基于模糊綜合評判的優(yōu)選策略。
根據(jù)陸戰(zhàn)Agent的內(nèi)部結(jié)構(gòu)[4]和合同網(wǎng)協(xié)議的改進思路,可得到陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu),主要由任務處理器、知識庫、協(xié)作處理器和通信處理器等組成,如圖2所示。
圖2 陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu)
在改進的合同網(wǎng)協(xié)議中,協(xié)作請求陸戰(zhàn)Agent和協(xié)作參與陸戰(zhàn)Agent分別承擔合同網(wǎng)協(xié)議中管理者和合同者的角色。在陸軍作戰(zhàn)過程中,上級陸戰(zhàn) Agent主要負責管理所有陸戰(zhàn)Agent的相關(guān)信息,并在作戰(zhàn)的不同階段向陸戰(zhàn)Agent分配作戰(zhàn)任務或打擊目標,其所關(guān)注的重點是對戰(zhàn)場的整體協(xié)調(diào)和控制,不參與具體的自主協(xié)作控制;而協(xié)作請求陸戰(zhàn)Agent依據(jù)上級陸戰(zhàn)Agent下達的作戰(zhàn)任務或戰(zhàn)場空間臨時出現(xiàn)的突發(fā)情況,利用改進合同網(wǎng)協(xié)議,自主向其他陸戰(zhàn)Agent發(fā)出作戰(zhàn)任務協(xié)作請求,尋求協(xié)作伙伴;協(xié)作參與陸戰(zhàn)Agent則負責響應作戰(zhàn)任務請求信息,以及作戰(zhàn)任務的協(xié)作執(zhí)行。
因此,陸戰(zhàn)Agent自主協(xié)作框架可由兩個層次構(gòu)成。第一個層次是從上級陸戰(zhàn)Agent獲取本級任務,如果陸戰(zhàn)Agent不能獨立完成則轉(zhuǎn)到第二個層次。在第二個層次上,本級陸戰(zhàn)Agent是任務的分配方,并自動成為協(xié)作請求者,通過黑板向其他陸戰(zhàn)Agent發(fā)出協(xié)作請求。得到協(xié)作請求信息的其他陸戰(zhàn)Agent都可成為作戰(zhàn)任務的接受方,并自動成為協(xié)作參與者,如圖3所示。
圖3 陸戰(zhàn)Agent自主協(xié)作框架
陸戰(zhàn)Agent自主協(xié)作請求策略是以黑板作為中間媒介,協(xié)作參與者根據(jù)自身類型、資源及負載狀況而參與作戰(zhàn)任務的協(xié)作。通過設置感知度Pre與感知閾值PreTh兩個參數(shù)來限制協(xié)作參與者的協(xié)作參與,即當Pre>PreTh時,允許協(xié)作參與者從黑板獲取請求協(xié)作任務信息,以此減少任務的發(fā)送范圍,提高效率。
陸戰(zhàn)Agent的自主協(xié)作承諾策略,依據(jù)其自身的負載和資源狀況,為每個協(xié)作參與陸戰(zhàn)Agent設置一個協(xié)作參與閾值Thd,表示每個陸戰(zhàn)Agent能同時參與協(xié)作任務的個數(shù),以保證協(xié)作參與者每次的任務承諾都有效。而參與協(xié)作閾值與陸戰(zhàn)Agent自身感知度相關(guān)。
1)當協(xié)作參與陸戰(zhàn)Agent接到協(xié)作任務后,將此時協(xié)作參與陸戰(zhàn)Agent已經(jīng)發(fā)送的任務承諾值TAm與其當前感知度下的協(xié)作參與閾值Thd進行比較,如果TAm<Thd,則禁止響應協(xié)作請求。
2)協(xié)作承諾值的調(diào)整
①向協(xié)作請求者發(fā)送任務承諾后:TAm=TAm+1
②承諾被拒絕時:TAm=TAm-1
③承諾被選中的陸戰(zhàn)Agent成為子任務的執(zhí)行者時:TAm=TAm-1,Pre=Pre-Δpre,Thd=Thd-ΔThd;
④任務完成時:Pre=Pre+Δpre,Thd=Thd+ΔThd。
基于模糊綜合評判的評估策略,協(xié)作請求者根據(jù)作戰(zhàn)任務分配的特征和協(xié)商目標確定影響協(xié)作團隊優(yōu)選的因素評價集,利用模糊綜合評判的結(jié)果對潛在的協(xié)作參與者做出評價,進而挑選出最佳的協(xié)作任務執(zhí)行者。
模糊綜合評判是應用模糊關(guān)系合成的原理,由多個因素來綜合評判事物隸屬等級的方法。通常包含確定因素集、確定評價集、確定各因素的權(quán)重、單因素模糊評判和模糊綜合評判等5個基本步驟。
各因素的權(quán)重用來反映其對評判對象影響的重要程度,因素ui的權(quán)重記為iη,且有
單因素模糊評判旨在建立因素集與評價集之間的一種模糊關(guān)系,如第i個因素的評價結(jié)果可記為:
其中,rij為因素iu產(chǎn)生結(jié)果vj的隸屬度。
陸戰(zhàn)Agent自主協(xié)作流程如圖4所示。
圖4 陸戰(zhàn)Agent自主協(xié)作流程
作戰(zhàn)任務識別的主要工作是對上級陸戰(zhàn)Agent授予的作戰(zhàn)任務按一定的規(guī)則或需求,分解成多個協(xié)作子任務,并將這些協(xié)作子任務按照一定的格式生成作戰(zhàn)任務信息表,發(fā)送到黑板上,以尋求協(xié)作。
其協(xié)作子任務信息表中每個子任務的內(nèi)容為:
其中:
AgentID表示協(xié)作請求陸戰(zhàn)Agent標識。
TaskID表示子任務標識。
TaskType表示協(xié)作子任務類型,參與者按任務類型修正自身能力度,用于對任務的期望評估。
Priority表示任務優(yōu)先度,用于標識當前任務的重要程度。
TaskDescription表示對子任務的簡要描述。
ExpireTime表示協(xié)作請求者接收協(xié)作參與者發(fā)出任務承諾的截止時限。
Address表示協(xié)作請求陸戰(zhàn)Agent物理地址,用以實現(xiàn)與協(xié)作陸戰(zhàn)Agent之間的通信交互。
TaskRestriction表示協(xié)作請求陸戰(zhàn) Agent提出完成任務的約束條件,包括對協(xié)作參與者完成任務的代價約束、資源約束和質(zhì)量約束等。TaskRestriction={Cost、ξCap、Quality、Pre},其中 Cost表示完成任務的代價;ξCap表示協(xié)作參與陸戰(zhàn)Agent依據(jù)作戰(zhàn)任務類型修正后的作戰(zhàn)能力參數(shù);Quality表示任務預計能達到的效果;Pre表示協(xié)作參與陸戰(zhàn)Agent的感知度。
形成協(xié)作團隊的過程是基于改進合同網(wǎng)協(xié)議,陸戰(zhàn)Agent之間進行交互協(xié)商的過程,其工作流程如下:
1)協(xié)作參與者從黑板感知協(xié)作任務信息
當滿足以下條件時,允許陸戰(zhàn)Agent參與協(xié)作:
① 感知度大于感知閾值:Pre>PreTh
② 已發(fā)出的任務承諾數(shù)小于協(xié)作參與閾值:TAm<Thd。
這兩種情況表示陸戰(zhàn)Agent當前有能力參與到作戰(zhàn)任務的協(xié)作之中,允許其感知黑板的協(xié)作任務信息。
2)協(xié)作期望評估
為保證陸戰(zhàn)Agent所承諾的任務都是最有把握完成的作戰(zhàn)任務,設置一個協(xié)作參與評估函數(shù)Par(i,j,t),表示協(xié)作參與陸戰(zhàn)Agentj對于協(xié)作請求陸戰(zhàn)Agenti發(fā)布的任務t進行的協(xié)作期望評估。期望值越高,表示完成的可能性就越大。
其中,1λ、2λ和3λ是能力度、感知度、熟悉度在協(xié)作參與評估函數(shù)中所占的權(quán)值,并且λ1+λ2+λ3= 1 。
同時,根據(jù)任務t的類型參數(shù)及其對應的能力修正參數(shù) ξ,修正陸戰(zhàn) Agent的作戰(zhàn)能力,用于對每個子任務的評估。多個子任務按照評估值進行排序,陸戰(zhàn)Agent依據(jù)排序后任務序列,選擇最能勝任的任務。
最后協(xié)作參與陸戰(zhàn)Agent根據(jù)協(xié)作任務信息,結(jié)合知識庫中的戰(zhàn)斗規(guī)則、戰(zhàn)斗范例以及各種評估方法模型,對協(xié)作任務進行解算,按TaskRestriction規(guī)定的格式,生成任務承諾信息,在截止時限前提交給協(xié)作請求者。
3)協(xié)作團隊優(yōu)選
在基于改進合同網(wǎng)協(xié)議的自主協(xié)作中,最佳協(xié)作參與陸戰(zhàn)Agent的選擇,依賴于對其完成協(xié)作任務質(zhì)量的承諾、所付出的代價、自身能力、感知度及其他陸戰(zhàn)Agent的信任度等因素的評估。
利用模糊綜合評判法選擇協(xié)作參與陸戰(zhàn)Agent的影響因素集為{承諾值,完成代價,能力度,感知度},這些因素對應的權(quán)重可依據(jù)經(jīng)驗數(shù)據(jù)設定,例如可設為{0.4,0.2,0.2,0.2},評價值集為[0,1]。
由此可對所有協(xié)作參與陸戰(zhàn)Agent進行評判,通過對評判結(jié)果排序,選出最大值所對應的陸戰(zhàn)Agent,作為協(xié)作伙伴。
4)形成協(xié)作團隊
協(xié)作請求陸戰(zhàn)Agent在達到任務截止時限后,確定所有子任務的協(xié)作伙伴,形成協(xié)作團隊。并且將協(xié)作團隊所有陸戰(zhàn)Agent的相關(guān)信息,按照一定的格式,發(fā)送給協(xié)作團隊中的每個成員,以方便協(xié)作參與陸戰(zhàn)Agent之間的通信交互,以及在出現(xiàn)突發(fā)事件時,能及時通知其他成員。其協(xié)作團隊成員信息的格式如表3所示。
表3 協(xié)作團隊成員信息表
協(xié)作團隊生成后,可采用一種節(jié)點規(guī)劃和通用部分全局規(guī)劃(GPGP:Generalized Partial Global Planning)[5]的方法形成一個全局決心方案。協(xié)作團隊中的所有成員均按照此決心方案,執(zhí)行相關(guān)的作戰(zhàn)任務。
節(jié)點規(guī)劃是協(xié)作問題求解的重要思想,可以看作是多個規(guī)劃問題的復合。首先,各陸戰(zhàn)Agent建立其內(nèi)部規(guī)劃和決策模塊共同作用,形成各自任務計劃。然后,陸戰(zhàn) Agent相互交換各自的本地規(guī)劃,利用GPGP協(xié)調(diào)機理建立全局的具有時間、空間等約束關(guān)系的決心方案。
在形成作戰(zhàn)任務計劃后,各陸戰(zhàn)Agent按總體計劃執(zhí)行任務。在協(xié)作任務執(zhí)行過程中,一方面,由于戰(zhàn)場態(tài)勢瞬息萬變,如果出現(xiàn)突發(fā)情況,導致必須中止當前的作戰(zhàn)任務;另一方面,由于陸戰(zhàn)Agent權(quán)威性和受控性的特點,如果陸戰(zhàn)Agent接到上級命令,要求其立刻執(zhí)行某項任務,則陸戰(zhàn)Agent會立即放棄正在進行的所有任務,而去執(zhí)行上級新的命令。這兩種情況都會造成協(xié)作關(guān)系的失效。因此,需要定義相應的規(guī)則,以方便團隊內(nèi)的所有協(xié)作伙伴能及時處理,避免不必要的損失。
表4中列舉了一些簡單的事件規(guī)則,由于戰(zhàn)場的復雜性,需要對規(guī)則進行不斷的補充和修改。
任務執(zhí)行完成后,需要綜合考慮陸戰(zhàn)Agent在作戰(zhàn)任務執(zhí)行期間的戰(zhàn)損情況、士氣、指揮等因素,從而實現(xiàn)對所有協(xié)作成員能力的動態(tài)評估,具體可根據(jù)實際能力情況更新模型。
首先假設:
陸戰(zhàn)Agentq:為協(xié)作請求者;
P:為所有協(xié)作參與者的集合,P={陸戰(zhàn)Agent1,陸戰(zhàn)Agent2,…,陸戰(zhàn)Agentm};
T:為協(xié)作請求者陸戰(zhàn) Agentq提交的所有協(xié)作任務集,T={T1,T2,…,Tn};
表4 陸戰(zhàn)Agent事件處理規(guī)則
TIDk:為協(xié)作任務Tk的標識;
PIDj:為協(xié)作參與者陸戰(zhàn)Agentj的標識;
Prej:為協(xié)作參與者陸戰(zhàn)Agentj的感知度;
PreThj:為協(xié)作參與者陸戰(zhàn)Agentj的感知閾值;
Tamj:為協(xié)作參與者陸戰(zhàn)Agentj當前發(fā)送參與協(xié)作任務承諾數(shù);
Thdj:為協(xié)作參與者陸戰(zhàn)Agentj的參與閾值;
Parjk:為協(xié)作參與者陸戰(zhàn)Agentj關(guān)于協(xié)作任務Tk的協(xié)作期望值;
Qjk:為協(xié)作參與者陸戰(zhàn)Agentj承諾完成協(xié)作任務Tk的效果;
Costjk:為協(xié)作參與者陸戰(zhàn) Agentj完成協(xié)作任務Tk的戰(zhàn)損和消耗;
Resjk:為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務Tk的可用資源;
Capjk:為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務Tk的作戰(zhàn)能力度;
CadTIDk:為協(xié)作任務Tk的候選參與協(xié)作者集,CadTIDk={ cadk1,cadk2,…,cadkv};
Bestk:為協(xié)作任務Tk的最佳協(xié)作者;
BestTeam:為最后形成的協(xié)作團隊;
ExpireTime:為協(xié)作請求者陸戰(zhàn)Agentq接收協(xié)作任務承諾的截止時刻;
SendPromises:為協(xié)作參與者陸戰(zhàn) Agentj向協(xié)作請求者陸戰(zhàn)Agentq發(fā)送關(guān)于協(xié)作任務Tk的承諾函數(shù),SendPromises(Qjk,Costjk,Resjk,Capjk,TIDk,PIDj);
ReceivePromises:為協(xié)作請求者陸戰(zhàn)Agentq接收協(xié)作任務承諾函數(shù),ReceivePromises(Qjk,Costjk,Resjk,Capjk,TIDk,PIDj);
Selectbest(CadTIDk):根據(jù)模糊綜合評判法為協(xié)作任務Tk選擇最優(yōu)協(xié)作參與者函數(shù);
SendMember:為協(xié)作請求者陸戰(zhàn) Agentq向協(xié)作參與者陸戰(zhàn)Agentj發(fā)送關(guān)于其成為Tk的協(xié)作成員信息函數(shù),SendMember(PIDj,TIDk)。
那么,陸戰(zhàn)Agent自主協(xié)作實施步驟如下:
1)陸戰(zhàn) Agentq向黑板提交任務集合 T={T1,T2,…,Tn}
2)所有協(xié)作參與者陸戰(zhàn) Agentjj=1,2,…,m 同時對協(xié)作任務進行評估,對自身最能勝任的協(xié)作任務進行承諾:
①判斷感知度和協(xié)作參與閾值是否滿足任務讀取條件:
3)陸戰(zhàn)Agentq為每一個協(xié)作任務接收承諾信息,形成候選參與協(xié)作者集:
4)根據(jù)模糊綜合評判法為每個協(xié)作任務優(yōu)選協(xié)作者,形成團隊:
5)發(fā)布協(xié)作團隊成員信息:
6)協(xié)作團隊修正感知度,協(xié)作成員按照內(nèi)部規(guī)劃,形成協(xié)作任務計劃。
7)按GPGP方法生成任務總體計劃。
8)按任務總體計劃執(zhí)行,任務執(zhí)行中按事件規(guī)則處理突發(fā)事件。
9)如果 異常執(zhí)行步驟(10),否則執(zhí)行步驟11)。
10)按異常處理規(guī)則處理。
11)任務結(jié)束,修正能力度、感知度。
12)結(jié)束。
本文通過對合同網(wǎng)協(xié)議應用于陸戰(zhàn)Agent自主協(xié)作所存在問題的分析,提出了改進合同網(wǎng)協(xié)議的思路和方法,在此基礎上,探討了陸戰(zhàn)Agent自主協(xié)作機制模型的功能結(jié)構(gòu)、框架、策略、流程和實施步驟,為陸軍作戰(zhàn)復雜系統(tǒng)的ABMS奠定了基礎。
[1]Andrew Ilachinski.Land Warfare and Complexity.Part I:MathematicalBackgorundandTechnicalSourcebook[DB/OL].CenterforNavalAnalyses,1996[2009-03-10].http://w ww.cna.org.
[2]韓月敏,劉非平,劉麗巧,等. 陸戰(zhàn)Agent協(xié)作機制模型研究[J].指揮控制與仿真, 2009,31(6):6-10.
[3]Smith R.G. The Contract Net Protocol: High-Level Conation Communication and Control in distributed problem solver [J]. IEEE Transactions on Computer, 1980,29(12):1104-1113.
[4]韓月敏,彭海,張金榮,等. 陸軍作戰(zhàn)復雜系統(tǒng) ABMS機理研究[J].指揮控制與仿真, 2011,33(2):1-4.
[5]韓祥蘭,張剛,劉仰光.通用模糊綜合評判工具的研究與應用[J].計算機應用與軟件,2010,27(2):187-190.