陸戰(zhàn)Agent自主協(xié)作機制模型研究

2011-07-16 07:38韓月敏李衛(wèi)平劉玉濤劉永鋒

指揮控制與仿真 2011年4期

韓月敏，李衛(wèi)平，劉玉濤，劉永鋒

（石家莊陸軍指揮學院，河北石家莊 050084）

陸軍作戰(zhàn)是典型的復雜系統(tǒng)[1]。陸戰(zhàn) Agent是陸軍作戰(zhàn)復雜系統(tǒng) ABMS核心的基礎要素。友方陸戰(zhàn)Agent之間的協(xié)作機制是陸軍作戰(zhàn)復雜系統(tǒng)演化運行的關(guān)鍵支撐之一。陸戰(zhàn)Agent之間的協(xié)作可歸納為自主協(xié)作和上級統(tǒng)一組織協(xié)作兩種模式。文獻[2]對上級統(tǒng)一組織的協(xié)作機制模型進行了研究，而對陸戰(zhàn)Agent自主協(xié)作機制模型的專門研究還很鮮見。陸戰(zhàn)Agent自主協(xié)作，雖與一般 Agent系統(tǒng)中的協(xié)作模式相同，但由于陸軍作戰(zhàn)的特殊性，必須研究符合陸軍作戰(zhàn)特點的陸戰(zhàn)Agent自主協(xié)作機制模型。

1 陸戰(zhàn)Agent自主協(xié)作方法

陸戰(zhàn)Agent自主協(xié)作是同級的陸戰(zhàn)Agent在自身沒有能力完成任務時，發(fā)出臨時協(xié)作請求，再根據(jù)對方陸戰(zhàn)Agent的回應情況，進行協(xié)作任務的分配。其自主協(xié)作過程可抽象簡化為“分析作戰(zhàn)任務—形成協(xié)作團隊—生成任務計劃—執(zhí)行監(jiān)控任務”等四個階段。其中，形成協(xié)作團隊是關(guān)鍵環(huán)節(jié)，并且陸戰(zhàn)Agent自主協(xié)作的雙方是一種對等關(guān)系。因此，其協(xié)作方法應該采用合同網(wǎng)協(xié)議[3]。

1.1 合同網(wǎng)協(xié)議的作戰(zhàn)應用分析

合同網(wǎng)協(xié)議作為一個基于市場運行機制的協(xié)作方法，可以成功地解決一個任務在多個Agent之間的分配問題，但將其應用于陸戰(zhàn)Agent自主協(xié)作，還存在以下5個問題：

1）合同網(wǎng)協(xié)議不符合陸戰(zhàn)高時效、近實時的作戰(zhàn)特點。合同網(wǎng)協(xié)議采用廣播通信方式進行任務招標，一方面會造成系統(tǒng)的通信量過大，另一方面會加重管理Agent對每個投標評價擇優(yōu)的決策負擔。因此，難以滿足陸軍作戰(zhàn)高時效、近實時的要求。

2）合同網(wǎng)協(xié)議不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動性。合同網(wǎng)協(xié)議中的合同Agent只能被動地接受管理 Agent發(fā)布的任務信息，不能完全反映陸戰(zhàn)Agent協(xié)作配合的主動性。

3）合同網(wǎng)協(xié)議基于市場協(xié)作的描述方式及運行機制不適用于作戰(zhàn)領(lǐng)域。合同網(wǎng)協(xié)議的任務分配過程是運用經(jīng)濟行為中的“招標－投標－中標－簽約”機制，以標值為紐帶的Agent之間的協(xié)商過程。這種基于市場協(xié)作的描述方式及運行機制，不符合作戰(zhàn)領(lǐng)域的實際。

4）合同網(wǎng)協(xié)議缺乏對陸戰(zhàn)Agent作戰(zhàn)能力動態(tài)變化的考慮。合同網(wǎng)協(xié)議只考慮了Agent的靜態(tài)能力，很難反映作戰(zhàn)過程中陸戰(zhàn) Agent作戰(zhàn)能力的動態(tài)變化。

5）合同網(wǎng)協(xié)議對協(xié)作任務失效的處置不符合戰(zhàn)場實際。合同網(wǎng)協(xié)議對任務失效情況的處置方法是重新發(fā)布任務，以尋求新的合作者。這種方法不符合陸戰(zhàn)場作戰(zhàn)任務不可重復及高時效性的實際。

1.2 合同網(wǎng)協(xié)議的改進思路

針對以上問題，本文提出以下5條改進思路：

1）針對合同網(wǎng)協(xié)議信息交互量大的問題，用黑板代替廣播的通信模式，作戰(zhàn)任務信息由協(xié)作請求者發(fā)布到黑板上，系統(tǒng)中的協(xié)作參與者自行感知相關(guān)任務信息。

2）針對合同網(wǎng)協(xié)議不能反映陸戰(zhàn)Agent協(xié)作配合主動性的問題，引入陸戰(zhàn)Agent主動感知特性，用能力參數(shù)值來衡量協(xié)作參與者當前的負載和資源狀況。協(xié)作參與者通過計算自身的感知系數(shù)來確定是否響應協(xié)作請求者的作戰(zhàn)任務信息。

3）針對合同網(wǎng)協(xié)議基于市場協(xié)作的描述方式及運行機制不適用于作戰(zhàn)領(lǐng)域的問題，對合同網(wǎng)協(xié)議進行重新描述，使其符合作戰(zhàn)領(lǐng)域的特殊要求，具體描述如表1和表2所示。

表1 合同網(wǎng)協(xié)議作戰(zhàn)應用階段描述

表2 合同網(wǎng)協(xié)議作戰(zhàn)應用角色描述

4）針對合同網(wǎng)協(xié)議缺乏對陸戰(zhàn)Agent作戰(zhàn)能力動態(tài)變化考慮的問題，引入評估模型，定期對各陸戰(zhàn)Agent進行評估，及時更新其作戰(zhàn)能力狀況，以作為參與作戰(zhàn)協(xié)作的依據(jù)。

5）針對合同網(wǎng)協(xié)議對協(xié)作任務失效處置不符合戰(zhàn)場實際的問題，為防止作戰(zhàn)任務分配過程中出現(xiàn)任務失效情況，在陸戰(zhàn)Agent執(zhí)行作戰(zhàn)任務過程中，如果出現(xiàn)突發(fā)情況需要調(diào)整甚至放棄協(xié)作任務時，不能簡單地中止或調(diào)整其正在執(zhí)行的作戰(zhàn)任務，必須制定相應的規(guī)則，指導陸戰(zhàn)Agent處置突發(fā)情況。

1.3 改進合同網(wǎng)協(xié)議的實現(xiàn)方法

根據(jù)合同網(wǎng)協(xié)議的改進思路，引入心智參數(shù)的概念，對其協(xié)作準備、協(xié)作請求、發(fā)送任務承諾、協(xié)作成員優(yōu)選等各個階段進行改進。

1.3.1陸戰(zhàn)Agent心智參數(shù)

1）感知度

定義1 感知度：協(xié)作參與陸戰(zhàn)Agentj對于協(xié)作請求者發(fā)布作戰(zhàn)任務的響應程度，稱為陸戰(zhàn)Agentj的感知度，記為Prej。

協(xié)作參與者的感知度由其自身可用資源狀況，以及其當前的忙閑程度決定：

其中，Resj表示陸戰(zhàn)Agentj本身所具有的可用資源量；Idlej表示陸戰(zhàn)Agentj的忙閑度，以衡量自身任務量的繁重程度。P1、P2是資源和忙閑度的權(quán)值，可根據(jù)實際情況設置。

定義2 感知閾：允許協(xié)作參與者陸戰(zhàn)Agentj獲取作戰(zhàn)任務感知度的最小值，稱為陸戰(zhàn)Agentj的感知閾，記為PreThj。

當Prej≤PreThj時，則禁止協(xié)作陸戰(zhàn)Agentj響應任何作戰(zhàn)任務信息。

2）能力度

定義3 能力度：協(xié)作參與陸戰(zhàn)Agentj能夠順利完成任務的作戰(zhàn)能力，稱為陸戰(zhàn)Agentj的能力度，記為Capj。

協(xié)作參與陸戰(zhàn)Agentj的能力度主要由主觀能力度R1和客觀能力度R2兩部分組成。

主觀能力度R1是依據(jù)協(xié)作參與陸戰(zhàn)Agentj主觀條件所建立的能力度，主要取決于對協(xié)作參與陸戰(zhàn)Agentj的指揮控制能力 C、訓練水平 L、士氣狀態(tài) S的分析和評價。

客觀能力度R2是依據(jù)協(xié)作參與陸戰(zhàn)Agentj客觀條件所建立的能力度，主要取決于對協(xié)作參與陸戰(zhàn)Agentj的武器裝備性能W、綜合能力F及作戰(zhàn)環(huán)境條件 E（表示作戰(zhàn)環(huán)境對于作戰(zhàn)效能的影響）的分析和評估。

能力度Capj可表示如下：

其中，Capj、R1、R2、C、L、S、、W、F、α、β、ω1、ω2、ω3、μ1、μ2、μ3的取值范圍均為[0，1]之間的實數(shù)，表示權(quán)重系數(shù)，并且α+β＝1，ω1+ω2+ω3＝1，μ1+μ2+μ3＝1 。

陸戰(zhàn)Agent的能力度是協(xié)作請求者選擇協(xié)作伙伴的主要指標之一，是一個動態(tài)變量，受多個因素影響。在協(xié)作參與者完成一個任務后，需要對其能力度重新進行評估。

3）能力度修正值ξ

為了體現(xiàn)陸戰(zhàn)Agent執(zhí)行不同任務時所表現(xiàn)出的不同作戰(zhàn)能力，可依據(jù)任務類型，定義相應的修正值，以保證能力度較好地刻畫其相應的作戰(zhàn)能力。ξ的值域范圍為[0，1]。

4）熟悉度

定義4 陸戰(zhàn)Agentj成功完成陸戰(zhàn)Agenti交給作戰(zhàn)任務的次數(shù)與陸戰(zhàn)Agenti委托作戰(zhàn)任務的總次數(shù)之比，稱為陸戰(zhàn)Agenti對陸戰(zhàn)Agentj的熟悉度，記為Fri（i,j）。

其中，Nij表示陸戰(zhàn) Agentj成功完成陸戰(zhàn) Agenti交給任務的次數(shù)；Ni表示陸戰(zhàn)Agenti委托任務的總次數(shù)。

熟悉度也是協(xié)作請求者選擇協(xié)作伙伴的重要指標之一。對于同一作戰(zhàn)任務，在能力度相當?shù)那闆r下，協(xié)作請求陸戰(zhàn)Agent更傾向于選擇熟悉度較高的協(xié)作參與陸戰(zhàn)Agent。

5）協(xié)作承諾閾

定義5 協(xié)作參與陸戰(zhàn)Agentj在同一時刻能夠發(fā)送的最多作戰(zhàn)任務承諾數(shù)，稱為陸戰(zhàn)Agentj的協(xié)作承諾閾，記為Thdj。

設置協(xié)作承諾閾的目的是為了限制協(xié)作參與者對作戰(zhàn)任務的盲目參與，保證協(xié)作參與者的每個承諾都是有效的。承諾閾的大小與協(xié)作參與者的感知度相關(guān)，并隨著感知度的變化而變化。

6）協(xié)作承諾數(shù)

定義6 協(xié)作參與陸戰(zhàn)Agentj當前發(fā)送的所有作戰(zhàn)任務承諾總數(shù)，稱為協(xié)作承諾數(shù)，記為Tamj。

當Tamj＜Thdj時，協(xié)作參與者可響應黑板上的協(xié)作任務信息。

1.3.2協(xié)作準備

協(xié)作準備包括對待分配任務的分析與分解、制定作戰(zhàn)任務信息表等工作。作戰(zhàn)任務信息表主要包括協(xié)作請求者、作戰(zhàn)任務描述、作戰(zhàn)任務約束條件以及作戰(zhàn)任務參與、完成時限等信息。

1.3.3協(xié)作請求

協(xié)作請求的方法是協(xié)作請求者將作戰(zhàn)任務信息發(fā)布到黑板上，并且在作戰(zhàn)任務信息中設置截止時間參數(shù)。當?shù)竭_截止時間時，任務信息失效，黑板系統(tǒng)自動刪除作戰(zhàn)任務信息。同時協(xié)作參與陸戰(zhàn)Agent根據(jù)自身感知度的大小，判斷能否從黑板獲取作戰(zhàn)任務信息，從而參與協(xié)作。

協(xié)作請求的工作流程如圖1所示。

圖1 協(xié)作請求工作流程

1.3.4任務承諾

協(xié)作參與陸戰(zhàn)Agent接收到黑板上的作戰(zhàn)任務信息后，即進入了任務承諾階段。任務承諾的主要工作包括協(xié)作參與陸戰(zhàn)Agent對協(xié)作子任務的評估及向協(xié)作請求者發(fā)出任務承諾。

為了限制陸戰(zhàn)Agent象傳統(tǒng)合同網(wǎng)協(xié)議中的合同者那樣盲目參與，避免由于協(xié)作參與者自身能力不足，而造成承諾失敗的問題，從節(jié)約系統(tǒng)資源，減輕陸戰(zhàn)Agent負擔，加快系統(tǒng)執(zhí)行效率的角度出發(fā)，對合同網(wǎng)協(xié)議作如下改進：

1）為每個協(xié)作參與者設置一個協(xié)作參與閾值，即每個協(xié)作參與者能夠進行任務承諾的最大值，其大小與陸戰(zhàn)Agent的感知度相關(guān)聯(lián)。當感知度降低時，協(xié)作參與閾值也同時降低，表示陸戰(zhàn)Agent并行執(zhí)行任務的能力降低，反之亦然。

2）當協(xié)作參與者有能力執(zhí)行作戰(zhàn)任務時，設置評估函數(shù)對作戰(zhàn)任務進行排序，從中選出自己最有把握的作戰(zhàn)任務，按照一定的規(guī)則形成任務承諾信息發(fā)送給協(xié)作請求者。

1.3.5優(yōu)選最佳協(xié)作參與者

優(yōu)選最佳協(xié)作參與者就是按照某種策略，從眾多參與者中選擇合適的協(xié)作伙伴?？偟脑瓌t是能更好地完成作戰(zhàn)任務的各個子目標，在對協(xié)作參與陸戰(zhàn)Agent優(yōu)選時，需要考察其綜合能力，如完成作戰(zhàn)任務的質(zhì)量、能力度、熟悉度、感知度等，以保證作戰(zhàn)任務總體效果能達到最佳。這些因素有些是無法準確量化的，因此，應該采用基于模糊綜合評判的優(yōu)選策略。

2 陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu)

根據(jù)陸戰(zhàn)Agent的內(nèi)部結(jié)構(gòu)[4]和合同網(wǎng)協(xié)議的改進思路，可得到陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu)，主要由任務處理器、知識庫、協(xié)作處理器和通信處理器等組成，如圖2所示。

圖2 陸戰(zhàn)Agent自主協(xié)作功能結(jié)構(gòu)

3 陸戰(zhàn)Agent自主協(xié)作框架

在改進的合同網(wǎng)協(xié)議中，協(xié)作請求陸戰(zhàn)Agent和協(xié)作參與陸戰(zhàn)Agent分別承擔合同網(wǎng)協(xié)議中管理者和合同者的角色。在陸軍作戰(zhàn)過程中，上級陸戰(zhàn) Agent主要負責管理所有陸戰(zhàn)Agent的相關(guān)信息，并在作戰(zhàn)的不同階段向陸戰(zhàn)Agent分配作戰(zhàn)任務或打擊目標，其所關(guān)注的重點是對戰(zhàn)場的整體協(xié)調(diào)和控制，不參與具體的自主協(xié)作控制；而協(xié)作請求陸戰(zhàn)Agent依據(jù)上級陸戰(zhàn)Agent下達的作戰(zhàn)任務或戰(zhàn)場空間臨時出現(xiàn)的突發(fā)情況，利用改進合同網(wǎng)協(xié)議，自主向其他陸戰(zhàn)Agent發(fā)出作戰(zhàn)任務協(xié)作請求，尋求協(xié)作伙伴；協(xié)作參與陸戰(zhàn)Agent則負責響應作戰(zhàn)任務請求信息，以及作戰(zhàn)任務的協(xié)作執(zhí)行。

因此，陸戰(zhàn)Agent自主協(xié)作框架可由兩個層次構(gòu)成。第一個層次是從上級陸戰(zhàn)Agent獲取本級任務，如果陸戰(zhàn)Agent不能獨立完成則轉(zhuǎn)到第二個層次。在第二個層次上，本級陸戰(zhàn)Agent是任務的分配方，并自動成為協(xié)作請求者，通過黑板向其他陸戰(zhàn)Agent發(fā)出協(xié)作請求。得到協(xié)作請求信息的其他陸戰(zhàn)Agent都可成為作戰(zhàn)任務的接受方，并自動成為協(xié)作參與者，如圖3所示。

圖3 陸戰(zhàn)Agent自主協(xié)作框架

4 陸戰(zhàn)Agent自主協(xié)作策略

4.1 自主協(xié)作請求策略

陸戰(zhàn)Agent自主協(xié)作請求策略是以黑板作為中間媒介，協(xié)作參與者根據(jù)自身類型、資源及負載狀況而參與作戰(zhàn)任務的協(xié)作。通過設置感知度Pre與感知閾值PreTh兩個參數(shù)來限制協(xié)作參與者的協(xié)作參與，即當Pre＞PreTh時，允許協(xié)作參與者從黑板獲取請求協(xié)作任務信息，以此減少任務的發(fā)送范圍，提高效率。

4.2 自主協(xié)作承諾策略

陸戰(zhàn)Agent的自主協(xié)作承諾策略，依據(jù)其自身的負載和資源狀況，為每個協(xié)作參與陸戰(zhàn)Agent設置一個協(xié)作參與閾值Thd，表示每個陸戰(zhàn)Agent能同時參與協(xié)作任務的個數(shù)，以保證協(xié)作參與者每次的任務承諾都有效。而參與協(xié)作閾值與陸戰(zhàn)Agent自身感知度相關(guān)。

1）當協(xié)作參與陸戰(zhàn)Agent接到協(xié)作任務后，將此時協(xié)作參與陸戰(zhàn)Agent已經(jīng)發(fā)送的任務承諾值TAm與其當前感知度下的協(xié)作參與閾值Thd進行比較，如果TAm＜Thd，則禁止響應協(xié)作請求。

2）協(xié)作承諾值的調(diào)整

①向協(xié)作請求者發(fā)送任務承諾后：TAm＝TAm+1

②承諾被拒絕時：TAm＝TAm-1

③承諾被選中的陸戰(zhàn)Agent成為子任務的執(zhí)行者時：TAm＝TAm-1，Pre＝Pre-Δpre，Thd=Thd-ΔThd；

④任務完成時：Pre＝Pre+Δpre，Thd=Thd+ΔThd。

4.3 自主協(xié)作團隊優(yōu)選策略

基于模糊綜合評判的評估策略，協(xié)作請求者根據(jù)作戰(zhàn)任務分配的特征和協(xié)商目標確定影響協(xié)作團隊優(yōu)選的因素評價集，利用模糊綜合評判的結(jié)果對潛在的協(xié)作參與者做出評價，進而挑選出最佳的協(xié)作任務執(zhí)行者。

模糊綜合評判是應用模糊關(guān)系合成的原理，由多個因素來綜合評判事物隸屬等級的方法。通常包含確定因素集、確定評價集、確定各因素的權(quán)重、單因素模糊評判和模糊綜合評判等5個基本步驟。

各因素的權(quán)重用來反映其對評判對象影響的重要程度，因素ui的權(quán)重記為iη，且有

單因素模糊評判旨在建立因素集與評價集之間的一種模糊關(guān)系，如第i個因素的評價結(jié)果可記為：

其中，rij為因素iu產(chǎn)生結(jié)果vj的隸屬度。

5 陸戰(zhàn)Agent自主協(xié)作流程

陸戰(zhàn)Agent自主協(xié)作流程如圖4所示。

圖4 陸戰(zhàn)Agent自主協(xié)作流程

5.1 作戰(zhàn)任務識別

作戰(zhàn)任務識別的主要工作是對上級陸戰(zhàn)Agent授予的作戰(zhàn)任務按一定的規(guī)則或需求，分解成多個協(xié)作子任務，并將這些協(xié)作子任務按照一定的格式生成作戰(zhàn)任務信息表，發(fā)送到黑板上，以尋求協(xié)作。

其協(xié)作子任務信息表中每個子任務的內(nèi)容為：

其中：

AgentID表示協(xié)作請求陸戰(zhàn)Agent標識。

TaskID表示子任務標識。

TaskType表示協(xié)作子任務類型，參與者按任務類型修正自身能力度，用于對任務的期望評估。

Priority表示任務優(yōu)先度，用于標識當前任務的重要程度。

TaskDescription表示對子任務的簡要描述。

ExpireTime表示協(xié)作請求者接收協(xié)作參與者發(fā)出任務承諾的截止時限。

Address表示協(xié)作請求陸戰(zhàn)Agent物理地址，用以實現(xiàn)與協(xié)作陸戰(zhàn)Agent之間的通信交互。

TaskRestriction表示協(xié)作請求陸戰(zhàn) Agent提出完成任務的約束條件，包括對協(xié)作參與者完成任務的代價約束、資源約束和質(zhì)量約束等。TaskRestriction={Cost、ξCap、Quality、Pre}，其中 Cost表示完成任務的代價；ξCap表示協(xié)作參與陸戰(zhàn)Agent依據(jù)作戰(zhàn)任務類型修正后的作戰(zhàn)能力參數(shù)；Quality表示任務預計能達到的效果；Pre表示協(xié)作參與陸戰(zhàn)Agent的感知度。

5.2 形成協(xié)作團隊

形成協(xié)作團隊的過程是基于改進合同網(wǎng)協(xié)議，陸戰(zhàn)Agent之間進行交互協(xié)商的過程，其工作流程如下：

1）協(xié)作參與者從黑板感知協(xié)作任務信息

當滿足以下條件時，允許陸戰(zhàn)Agent參與協(xié)作：

① 感知度大于感知閾值：Pre＞PreTh

② 已發(fā)出的任務承諾數(shù)小于協(xié)作參與閾值：TAm＜Thd。

這兩種情況表示陸戰(zhàn)Agent當前有能力參與到作戰(zhàn)任務的協(xié)作之中，允許其感知黑板的協(xié)作任務信息。

2）協(xié)作期望評估

為保證陸戰(zhàn)Agent所承諾的任務都是最有把握完成的作戰(zhàn)任務，設置一個協(xié)作參與評估函數(shù)Par(i,j,t)，表示協(xié)作參與陸戰(zhàn)Agentj對于協(xié)作請求陸戰(zhàn)Agenti發(fā)布的任務t進行的協(xié)作期望評估。期望值越高，表示完成的可能性就越大。

其中，1λ、2λ和3λ是能力度、感知度、熟悉度在協(xié)作參與評估函數(shù)中所占的權(quán)值，并且λ1+λ2+λ3＝ 1 。

同時，根據(jù)任務t的類型參數(shù)及其對應的能力修正參數(shù) ξ，修正陸戰(zhàn) Agent的作戰(zhàn)能力，用于對每個子任務的評估。多個子任務按照評估值進行排序，陸戰(zhàn)Agent依據(jù)排序后任務序列，選擇最能勝任的任務。

最后協(xié)作參與陸戰(zhàn)Agent根據(jù)協(xié)作任務信息，結(jié)合知識庫中的戰(zhàn)斗規(guī)則、戰(zhàn)斗范例以及各種評估方法模型，對協(xié)作任務進行解算，按TaskRestriction規(guī)定的格式，生成任務承諾信息，在截止時限前提交給協(xié)作請求者。

3）協(xié)作團隊優(yōu)選

在基于改進合同網(wǎng)協(xié)議的自主協(xié)作中，最佳協(xié)作參與陸戰(zhàn)Agent的選擇，依賴于對其完成協(xié)作任務質(zhì)量的承諾、所付出的代價、自身能力、感知度及其他陸戰(zhàn)Agent的信任度等因素的評估。

利用模糊綜合評判法選擇協(xié)作參與陸戰(zhàn)Agent的影響因素集為{承諾值，完成代價，能力度，感知度}，這些因素對應的權(quán)重可依據(jù)經(jīng)驗數(shù)據(jù)設定，例如可設為{0.4，0.2，0.2，0.2}，評價值集為[0，1]。

由此可對所有協(xié)作參與陸戰(zhàn)Agent進行評判，通過對評判結(jié)果排序，選出最大值所對應的陸戰(zhàn)Agent，作為協(xié)作伙伴。

4）形成協(xié)作團隊

協(xié)作請求陸戰(zhàn)Agent在達到任務截止時限后，確定所有子任務的協(xié)作伙伴，形成協(xié)作團隊。并且將協(xié)作團隊所有陸戰(zhàn)Agent的相關(guān)信息，按照一定的格式，發(fā)送給協(xié)作團隊中的每個成員，以方便協(xié)作參與陸戰(zhàn)Agent之間的通信交互，以及在出現(xiàn)突發(fā)事件時，能及時通知其他成員。其協(xié)作團隊成員信息的格式如表3所示。

表3 協(xié)作團隊成員信息表

5.3 形成任務計劃

協(xié)作團隊生成后，可采用一種節(jié)點規(guī)劃和通用部分全局規(guī)劃（GPGP：Generalized Partial Global Planning）[5]的方法形成一個全局決心方案。協(xié)作團隊中的所有成員均按照此決心方案，執(zhí)行相關(guān)的作戰(zhàn)任務。

節(jié)點規(guī)劃是協(xié)作問題求解的重要思想，可以看作是多個規(guī)劃問題的復合。首先，各陸戰(zhàn)Agent建立其內(nèi)部規(guī)劃和決策模塊共同作用，形成各自任務計劃。然后，陸戰(zhàn) Agent相互交換各自的本地規(guī)劃，利用GPGP協(xié)調(diào)機理建立全局的具有時間、空間等約束關(guān)系的決心方案。

5.4 任務執(zhí)行與監(jiān)控

在形成作戰(zhàn)任務計劃后，各陸戰(zhàn)Agent按總體計劃執(zhí)行任務。在協(xié)作任務執(zhí)行過程中，一方面，由于戰(zhàn)場態(tài)勢瞬息萬變，如果出現(xiàn)突發(fā)情況，導致必須中止當前的作戰(zhàn)任務；另一方面，由于陸戰(zhàn)Agent權(quán)威性和受控性的特點，如果陸戰(zhàn)Agent接到上級命令，要求其立刻執(zhí)行某項任務，則陸戰(zhàn)Agent會立即放棄正在進行的所有任務，而去執(zhí)行上級新的命令。這兩種情況都會造成協(xié)作關(guān)系的失效。因此，需要定義相應的規(guī)則，以方便團隊內(nèi)的所有協(xié)作伙伴能及時處理，避免不必要的損失。

表4中列舉了一些簡單的事件規(guī)則，由于戰(zhàn)場的復雜性，需要對規(guī)則進行不斷的補充和修改。

任務執(zhí)行完成后，需要綜合考慮陸戰(zhàn)Agent在作戰(zhàn)任務執(zhí)行期間的戰(zhàn)損情況、士氣、指揮等因素，從而實現(xiàn)對所有協(xié)作成員能力的動態(tài)評估，具體可根據(jù)實際能力情況更新模型。

6 陸戰(zhàn)Agent自主協(xié)作實施步驟

首先假設：

陸戰(zhàn)Agentq：為協(xié)作請求者；

P：為所有協(xié)作參與者的集合，P={陸戰(zhàn)Agent1，陸戰(zhàn)Agent2，…，陸戰(zhàn)Agentm}；

T：為協(xié)作請求者陸戰(zhàn) Agentq提交的所有協(xié)作任務集，T={T1，T2，…，Tn}；

表4 陸戰(zhàn)Agent事件處理規(guī)則

TIDk：為協(xié)作任務Tk的標識；

PIDj：為協(xié)作參與者陸戰(zhàn)Agentj的標識；

Prej：為協(xié)作參與者陸戰(zhàn)Agentj的感知度；

PreThj：為協(xié)作參與者陸戰(zhàn)Agentj的感知閾值；

Tamj：為協(xié)作參與者陸戰(zhàn)Agentj當前發(fā)送參與協(xié)作任務承諾數(shù)；

Thdj：為協(xié)作參與者陸戰(zhàn)Agentj的參與閾值；

Parjk：為協(xié)作參與者陸戰(zhàn)Agentj關(guān)于協(xié)作任務Tk的協(xié)作期望值；

Qjk：為協(xié)作參與者陸戰(zhàn)Agentj承諾完成協(xié)作任務Tk的效果；

Costjk：為協(xié)作參與者陸戰(zhàn) Agentj完成協(xié)作任務Tk的戰(zhàn)損和消耗；

Resjk：為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務Tk的可用資源；

Capjk：為協(xié)作參與者陸戰(zhàn)Agentj完成協(xié)作任務Tk的作戰(zhàn)能力度；

CadTIDk：為協(xié)作任務Tk的候選參與協(xié)作者集，CadTIDk={ cadk1，cadk2，…，cadkv}；

Bestk：為協(xié)作任務Tk的最佳協(xié)作者；

BestTeam：為最后形成的協(xié)作團隊；

ExpireTime：為協(xié)作請求者陸戰(zhàn)Agentq接收協(xié)作任務承諾的截止時刻；

SendPromises：為協(xié)作參與者陸戰(zhàn) Agentj向協(xié)作請求者陸戰(zhàn)Agentq發(fā)送關(guān)于協(xié)作任務Tk的承諾函數(shù)，SendPromises（Qjk，Costjk，Resjk，Capjk，TIDk，PIDj）；

ReceivePromises：為協(xié)作請求者陸戰(zhàn)Agentq接收協(xié)作任務承諾函數(shù)，ReceivePromises（Qjk，Costjk，Resjk，Capjk，TIDk，PIDj）；

Selectbest（CadTIDk）：根據(jù)模糊綜合評判法為協(xié)作任務Tk選擇最優(yōu)協(xié)作參與者函數(shù)；

SendMember：為協(xié)作請求者陸戰(zhàn) Agentq向協(xié)作參與者陸戰(zhàn)Agentj發(fā)送關(guān)于其成為Tk的協(xié)作成員信息函數(shù)，SendMember（PIDj，TIDk）。

那么，陸戰(zhàn)Agent自主協(xié)作實施步驟如下：

1）陸戰(zhàn) Agentq向黑板提交任務集合 T={T1，T2，…，Tn}

2）所有協(xié)作參與者陸戰(zhàn) Agentjj=1,2,…，m 同時對協(xié)作任務進行評估，對自身最能勝任的協(xié)作任務進行承諾：

①判斷感知度和協(xié)作參與閾值是否滿足任務讀取條件：

3）陸戰(zhàn)Agentq為每一個協(xié)作任務接收承諾信息，形成候選參與協(xié)作者集：

4）根據(jù)模糊綜合評判法為每個協(xié)作任務優(yōu)選協(xié)作者，形成團隊：

5）發(fā)布協(xié)作團隊成員信息：

6）協(xié)作團隊修正感知度，協(xié)作成員按照內(nèi)部規(guī)劃，形成協(xié)作任務計劃。

7）按GPGP方法生成任務總體計劃。

8）按任務總體計劃執(zhí)行，任務執(zhí)行中按事件規(guī)則處理突發(fā)事件。

9）如果異常執(zhí)行步驟（10），否則執(zhí)行步驟11）。

10）按異常處理規(guī)則處理。

11）任務結(jié)束，修正能力度、感知度。

12）結(jié)束。

7 結(jié)束語

本文通過對合同網(wǎng)協(xié)議應用于陸戰(zhàn)Agent自主協(xié)作所存在問題的分析，提出了改進合同網(wǎng)協(xié)議的思路和方法，在此基礎上，探討了陸戰(zhàn)Agent自主協(xié)作機制模型的功能結(jié)構(gòu)、框架、策略、流程和實施步驟，為陸軍作戰(zhàn)復雜系統(tǒng)的ABMS奠定了基礎。

[1]Andrew Ilachinski.Land Warfare and Complexity.Part I:MathematicalBackgorundandTechnicalSourcebook[DB/OL].CenterforNavalAnalyses,1996[2009-03-10].http://w ww.cna.org.

[2]韓月敏,劉非平,劉麗巧,等. 陸戰(zhàn)Agent協(xié)作機制模型研究[J].指揮控制與仿真, 2009,31(6):6-10.

[3]Smith R.G. The Contract Net Protocol: High-Level Conation Communication and Control in distributed problem solver [J]. IEEE Transactions on Computer, 1980,29(12):1104-1113.

[4]韓月敏,彭海,張金榮,等. 陸軍作戰(zhàn)復雜系統(tǒng) ABMS機理研究[J].指揮控制與仿真, 2011,33(2):1-4.

[5]韓祥蘭,張剛,劉仰光.通用模糊綜合評判工具的研究與應用[J].計算機應用與軟件,2010,27(2):187-190.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡