滕哲 姜寧
復(fù)雜對抗環(huán)境、體系對抗特征的反導(dǎo)作戰(zhàn)需求決定了反導(dǎo)作戰(zhàn)必須要求高精確性和強(qiáng)實(shí)時性。在多源異構(gòu)的傳感器網(wǎng)中通過多傳感器任務(wù)規(guī)劃實(shí)現(xiàn)對TBM快速搜索發(fā)現(xiàn)、連續(xù)穩(wěn)定跟蹤識別是反導(dǎo)作戰(zhàn)首要解決的關(guān)鍵技術(shù)?,F(xiàn)階段對于多傳感器任務(wù)規(guī)劃的研究,大多關(guān)注于探測能力的分配、傳感器目標(biāo)分配的內(nèi)部機(jī)理、分配算法以及分配效果等[1~5],但對于作戰(zhàn)背景和作戰(zhàn)體系結(jié)構(gòu)的改變下的任務(wù)規(guī)劃問題涉及較少。針對反導(dǎo)作戰(zhàn)背景下的多傳感器任務(wù)規(guī)劃,對其內(nèi)部機(jī)理、認(rèn)識、任務(wù)還不夠清晰。研究成果一部分可直接適用于反導(dǎo)作戰(zhàn),一部分無法適用。
實(shí)際上,反導(dǎo)傳感器體系構(gòu)成了一個多層次多結(jié)構(gòu)的網(wǎng)絡(luò),而多維異構(gòu)的反導(dǎo)傳感器平臺則構(gòu)成了該網(wǎng)絡(luò)中的節(jié)點(diǎn),這是一個混合大尺度異構(gòu)無線傳感器網(wǎng)絡(luò)(Hybrid Large-scale Heterogeneous Wireless Sensor Network,HLSH-WSN)。因此,傳感器任務(wù)規(guī)劃首先需要在合理的反導(dǎo)多傳感器任務(wù)規(guī)劃體系構(gòu)建的基礎(chǔ)上和網(wǎng)絡(luò)配置最優(yōu)的總體要求下進(jìn)行。有必要對反導(dǎo)作戰(zhàn)傳感器任務(wù)規(guī)劃技術(shù)框架展開研究,對其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及數(shù)據(jù)分發(fā)模式進(jìn)行合理設(shè)計,重點(diǎn)在信息處理層對多維平臺之間的目標(biāo)交接和指示過程進(jìn)行優(yōu)化;在規(guī)劃層針對有限的傳感器資源限制和可視化窗口的約束下,動態(tài)地確定傳感器對每個TBM目標(biāo)的探測序列、探測時間窗口以及工作模式,從而使整體的效能達(dá)到最優(yōu)。
MAS 是 目 前 DAI(Distributed Artificial Intelli?gence,DAI)領(lǐng)域研究的熱點(diǎn),在供應(yīng)鏈、無人機(jī)任務(wù)規(guī)劃、車間調(diào)度等領(lǐng)域有著廣泛的應(yīng)用[6~8]。文獻(xiàn)[1]中指出觀測資源的異構(gòu)性以及觀測任務(wù)的多維性、階段性和動態(tài)性,導(dǎo)致了集中式聯(lián)合任務(wù)規(guī)劃方法建模難、求解負(fù)責(zé)度高、系統(tǒng)魯棒性較差以及可擴(kuò)展性不足,應(yīng)當(dāng)采用基于MAS的分布式協(xié)同規(guī)劃方法。文獻(xiàn)[9]中針對NADMS中ICF形成問題,從系統(tǒng)組成、個體行為、協(xié)作能力等方面將MAS與NADMS進(jìn)行了分析比較,指出MAS中Agent的協(xié)同決策方法是實(shí)現(xiàn)IFC的有效途徑。文獻(xiàn)[10]利用MAS分析、構(gòu)建了一個有限集中統(tǒng)籌、分布式協(xié)同調(diào)整的規(guī)劃機(jī)制,采用分布式動態(tài)規(guī)劃算驗(yàn)證了機(jī)制的有效性。因此,構(gòu)建的基于MAS的反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃體系架構(gòu)[10~12],見圖1。
圖1 反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃體系
彈道導(dǎo)彈飛行空間區(qū)域一般較長,會不斷地脫離一個衛(wèi)星或雷達(dá)的視野而進(jìn)入另一個衛(wèi)星或雷達(dá)的視野范圍。那么對于某個特定的目標(biāo)而言,只需整個反導(dǎo)傳感網(wǎng)中的部分傳感器節(jié)點(diǎn)對其進(jìn)行探測,而無需網(wǎng)絡(luò)中所有節(jié)點(diǎn)的參與。此外多傳感器任務(wù)規(guī)劃技術(shù)涉及要素多、協(xié)同關(guān)系復(fù)雜,若直接進(jìn)行全局優(yōu)化配置,問題的維數(shù)和復(fù)雜度很高,并且受多階段觀測任務(wù)動態(tài)調(diào)整的影響大,系統(tǒng)魯棒性差。
因此,在圖1構(gòu)建的體系架構(gòu)的基礎(chǔ)上引入任務(wù)共同體概念,建立一種新的異構(gòu)MAS多傳感器任務(wù)規(guī)劃結(jié)構(gòu)和相應(yīng)的任務(wù)規(guī)劃機(jī)制。這里先引入一個任務(wù)共同體概念。
任務(wù)共同體(Community of Interest,COI)是指由具有相同知識背景的成員組成,為共同的目標(biāo)、利益、任務(wù)或業(yè)務(wù)處理過程進(jìn)行信息交換的協(xié)作組織或團(tuán)體,分為制度性和利益性兩種。前者為事先約定的配置,后者是分布式網(wǎng)絡(luò)結(jié)構(gòu)下臨時組成的作戰(zhàn)聯(lián)盟。
在反導(dǎo)作戰(zhàn)中,COI為某種傳感器根據(jù)任務(wù)的動態(tài)組成的聚群——由網(wǎng)絡(luò)中處于對目標(biāo)探測的所有傳感器節(jié)點(diǎn)組成,聚群集合來自于C2BMC為每個威脅目標(biāo)制定的STPs。即假設(shè)對于威脅目標(biāo)ti,C2BMC根據(jù)掌握的戰(zhàn)場態(tài)勢制定的ESG中為威脅目標(biāo) ti確定的傳感器任務(wù)計劃則 T 時刻,COI定義為:,其 中 1<j<k<t<n ,
如圖2所示,相應(yīng)隨著作戰(zhàn)過程的推進(jìn),STPs下的傳感器節(jié)點(diǎn)組成的COI的屬性也會不斷變化(預(yù)警—探測—跟蹤—識別—制導(dǎo))。同樣,由于傳感器探測范圍和部署位置不同,目標(biāo)飛行過程中,COI中的成員可分為兩類:探測狀態(tài)、待機(jī)接力狀態(tài),并且隨著時間而不斷變化。
圖2 反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃過程中COI示意圖
基于任務(wù)共同體的思想,對反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃問題進(jìn)行分析和研究,需要為共同體開發(fā)各自的行為準(zhǔn)則來形式化描述它們的任務(wù)范圍,構(gòu)造任務(wù)共同體目錄。下面基于任務(wù)共同體的思想,對反導(dǎo)作戰(zhàn)中的新型一體化作戰(zhàn)能力進(jìn)行描述和分析,部分作戰(zhàn)能力的遂行需調(diào)整體系中的各任務(wù)共同體構(gòu)成,因此反導(dǎo)作戰(zhàn)多傳感器中任務(wù)共同體執(zhí)行的能力在一定程度上可作為調(diào)整任務(wù)規(guī)劃方案的動機(jī)和需求。下面分別對三種任務(wù)共同體能力進(jìn)行形式化描述。
1)預(yù)警Agent任務(wù)共同體
假設(shè) Tracking(ti,Sk,T)=1 表示 T 時刻傳感器節(jié)點(diǎn)Sk已經(jīng)發(fā)現(xiàn)目標(biāo)ti并實(shí)現(xiàn)跟蹤,Tracking(ti,Sk,T)=0 表示未發(fā)現(xiàn)或者尚未穩(wěn)定跟蹤。
定義1 預(yù)警Agent任務(wù)共同體
對于預(yù)警 COIi(T)={ti,Sj,Sk,…,St},根據(jù)第一收到預(yù)警信息后,若 Tracking(ti,Sk,T)=0 ,且有Tracking(ti,Sl,T)=1,其中l(wèi)≠ k,Sk,Sl∈{Sj,Sk,…,St} ,基于信息共享,Sk接收到目標(biāo)信息,使得Tracking(ti,Sk,T+Δ)=1,Δ<σ ,σ 為 Sk自主搜索跟蹤目標(biāo)的時間間隔;
預(yù)警Agent任務(wù)共同體示例如圖3所示。
2)跟蹤Agent任務(wù)共同體
圖3 預(yù)警Agent任務(wù)共同體示例
假設(shè)Tr_t(ti,T)=Sk表示T時刻跟蹤目標(biāo)ti的傳感器為 Sk,Tr_a(ti,Sk,T)表示T時刻 Sk對目標(biāo) ti的跟蹤精度。
定義2 跟蹤Agent任務(wù)共同體
若 ?Tr_t(ti,T+ΔT)=Sl, l≠k , 使 得Tr_a(ti,Sl,T+ΔT)>Tr_a(ti,Sk,T+ΔT) ,則 由 Sl進(jìn)行目標(biāo)跟蹤。
對 Tr_t(ti,T)=Sk,?Tr_t(ti,T+1)=Sl,k≠ l,則由Sl進(jìn)行接力跟蹤,Sk為Sl提供高精度引導(dǎo)信息。
跟蹤Agent任務(wù)共同體示例如圖4所示。
3)識別制導(dǎo)Agent任務(wù)共同體
假設(shè)Tr_r(ti,T)=Sk表示T時刻Sk進(jìn)行目標(biāo)識別,Tr_g(ti,wj,T)=Sl表示T時刻由 Sl對 wj發(fā)射的攔截彈實(shí)施制導(dǎo),Sk對目標(biāo)ti的可視化窗口為[Tik1,Tik2],根據(jù)火力規(guī)劃給出的目標(biāo)ti識別時間窗口為
圖4 跟蹤Agent任務(wù)共同體示例
定義3 識別制導(dǎo)Agent任務(wù)共同體
對 于 Tr_g(ti,wj,T)=Sk,若 Tracking(ti,Sk,T)=0 ,且 Tracking(ti,Sl,T)=1,l≠k ,則 wj可根據(jù) Sl提供的目標(biāo)信息進(jìn)行攔截決策解算,wj發(fā)射攔截彈后,Tr_g(ti,wj,T')=Sl,T'為攔截彈中段或末制導(dǎo)的任意時刻;
若 Tr_g(ti,wj,T)=Sl,?Tr_g(ti,wj,T+1)=St,l≠t,則攔截的控制權(quán)移交給St。
特別要指出的是,由于跟蹤精度的限制,目前針對彈道目標(biāo)的目標(biāo)識別主要是依靠地基X波段雷達(dá)和低軌道SBIRS的跟蹤和識別探測器來完成,而其他類型的傳感器(如有需要)主要是以輔助信息支援的形式來參與。制導(dǎo)識別Agent任務(wù)共同體示例如圖5所示。
圖5 識別制導(dǎo)Agent任務(wù)共同體示例
反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃是指對任意來襲目標(biāo),在有限的傳感器資源限制和可視化窗口的約束下,如何動態(tài)地確定傳感器對目標(biāo)的探測跟蹤序列,進(jìn)而確定探測時機(jī)和工作模式,以實(shí)現(xiàn)對多目標(biāo)的探測、跟蹤和識別。其實(shí)質(zhì)是一類非線性組合優(yōu)化決策問題。其作為作戰(zhàn)決策中的關(guān)鍵問題,方案及時效性的優(yōu)劣直接影響武器系統(tǒng)作戰(zhàn)效能的發(fā)揮,已成為軍事運(yùn)籌領(lǐng)域中的一個研究熱點(diǎn)[13~16]。對此,基于周期-事件的綜合策略能夠同時兼顧調(diào)度方案的魯棒性和適應(yīng)性問題,是解決此類問題的基本策略。
多傳感器任務(wù)規(guī)劃的制定到最終被執(zhí)行是一個不斷迭代、更新的過程。因此,根據(jù)反導(dǎo)作戰(zhàn)一體化的方式和特點(diǎn):多源異類傳感器、多種攔截器、多個可變中心的指控節(jié)點(diǎn)分布式的網(wǎng)絡(luò)連接、采用集中指揮與分布式相結(jié)合的指控方式,相應(yīng)地將反導(dǎo)作戰(zhàn)中的多傳感器任務(wù)規(guī)劃問題分解為兩個層次:集中式?jīng)Q策和分布式調(diào)整。集中式?jīng)Q策對應(yīng)于所構(gòu)建MAS架構(gòu)的規(guī)劃層,而分布式調(diào)整則在處理層與實(shí)體層之間展開。
如圖6所示,在集中式?jīng)Q策生成預(yù)規(guī)劃,確保解的質(zhì)量的基礎(chǔ)上,將部分權(quán)力下放,對任務(wù)規(guī)劃涉及到的相關(guān)各傳感器節(jié)點(diǎn)能夠協(xié)同決策,實(shí)現(xiàn)動態(tài)自同步更新,把不同的組成部分集成到一起,形成適合于當(dāng)前戰(zhàn)場態(tài)勢的多種組合的傳感網(wǎng)。
圖6 問題求解組成框架
任務(wù)規(guī)劃序列生成是動態(tài)的,既要考慮到空間維度上的延伸性,又要考慮到時間維度上的時效性。一方面,周期性的以集中式方法生成整體的任務(wù)序列方案,確保當(dāng)前全局最優(yōu)解;另一方面,動態(tài)事件觸發(fā)執(zhí)行層傳感器進(jìn)行分布式調(diào)整,確保對戰(zhàn)場任務(wù)動態(tài)變化的自適應(yīng)。如果序列生成的周期過長,隨著對目標(biāo)探測跟蹤誤差的增加,將使規(guī)劃失敗的可能性不斷增大;周期選取頻繁,將顯著增加任務(wù)共同體內(nèi)部具體方案求解的工作量。因此,對周期的選取應(yīng)根據(jù)對目標(biāo)的量測結(jié)果和任務(wù)的變化趨勢進(jìn)行自適應(yīng)調(diào)整。具體如圖7所示。
1)周期的確定
周期性序列生成是集中式產(chǎn)生全新序列方案,周期長短的選擇對整個序列方案生成的魯棒性的影響是根本性的。根據(jù)任務(wù)共同體的劃分,在各彈道段內(nèi)目標(biāo)的運(yùn)動軌跡一般具有可預(yù)測性,相對穩(wěn)定。因此,考慮以任務(wù)共同體為依據(jù)作為一個選取周期。
2)基于任務(wù)共同體的周期調(diào)整
周期的調(diào)整需要根據(jù)前一次周期內(nèi)對目標(biāo)的執(zhí)行情況來進(jìn)行調(diào)整,考慮問題的求解復(fù)雜度以及要符合實(shí)際情況的客觀要求,以跟蹤精度和攔截區(qū)確定分別作為探測跟蹤任務(wù)共同體和識別制導(dǎo)任務(wù)共同體周期調(diào)整的兩個主要因素:
(1)探測跟蹤任務(wù)共同體
對于探測跟蹤任務(wù)共同體而言,就是要最優(yōu)化目標(biāo)的跟蹤性能,因此選擇以探測跟蹤誤差作為確定探測跟蹤任務(wù)共同體下周期序列生成的時機(jī)。假設(shè)預(yù)警任務(wù)共同體序列生成初始周期為T0,周期終止時刻為et,對目標(biāo)跟蹤誤差的閾值為εmax,當(dāng)前任務(wù)共同體下t時刻對目標(biāo)的跟蹤協(xié)方差為P。那么探測跟蹤任務(wù)共同體周期T′開始時刻,以跟蹤精度比閾值高一個數(shù)量級為依據(jù)來確定,具體見式(1)。
(2)識別制導(dǎo)任務(wù)共同體
識別制導(dǎo)是在線控制整個反導(dǎo)作戰(zhàn)過程的關(guān)鍵點(diǎn),是整體傳感器任務(wù)規(guī)劃的落腳點(diǎn)。其與攔截的耦合關(guān)系,必然要求以攔截成功為最終目標(biāo)進(jìn)行優(yōu)化。因此,選擇以攔截區(qū)作為確定識別制導(dǎo)任務(wù)共同體下周期序列生成的時機(jī)。首先跟蹤任務(wù)共同體給出的信息可以確定目標(biāo)的攔截點(diǎn),進(jìn)而來倒推目標(biāo)識別窗口達(dá)到優(yōu)化序列的目的。
只有在這段時間內(nèi)成功識別目標(biāo),才能達(dá)到目標(biāo)的發(fā)射條件。
3)分布式更新
分布式更新問題,要設(shè)計與問題匹配的協(xié)同機(jī)制,各分配節(jié)點(diǎn)以該協(xié)同機(jī)制作為行為規(guī)則,對分配方案進(jìn)行動態(tài)分布式調(diào)整。這一部分將在3.4節(jié)進(jìn)行詳細(xì)敘述。
集中式反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃是指對任意來襲目標(biāo),在有限的傳感器資源限制和可視化窗口的約束下,如何確定傳感器對目標(biāo)的探測跟蹤序列、探測時機(jī)和工作模式,以實(shí)現(xiàn)對多目標(biāo)的探測、跟蹤和識別。影響反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃的因素主要包括:傳感器資源的性能、任務(wù)的特性與規(guī)劃目標(biāo)。體現(xiàn)為不同傳感器對不同類型任務(wù)的處理能力各不相同,即使針對同一任務(wù)各傳感器間也有所差異。同時,規(guī)劃的目標(biāo)對規(guī)劃結(jié)果的影響是根本性的,不同的目標(biāo)會有不同的規(guī)劃結(jié)果,它決定了資源與任務(wù)按什么原則去匹配。
因此,集中式反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃可歸結(jié)為:任務(wù)分配規(guī)劃(mission allocation program?ming,MAP)和任務(wù)分配調(diào)度(mission allocation scheduling,MAS)兩個問題。在任務(wù)規(guī)劃過程中,MAP和MAS有各自的決策變量和目標(biāo)函數(shù)。在給定MAP方案后才能進(jìn)一步確定MAS方案。一方面,MAS方案對其目標(biāo)函數(shù)的優(yōu)化決策具有決定性的作用;另一方面MAS方案又將對MAP的目標(biāo)函數(shù)產(chǎn)生影響。綜上所述,反導(dǎo)作戰(zhàn)傳感器任務(wù)規(guī)劃實(shí)際上是一個以MAP為上層規(guī)劃,MAS為下層規(guī)劃的雙層規(guī)劃模型。
1)MAP上層規(guī)劃
在反導(dǎo)作戰(zhàn)中,傳感器從預(yù)警到攔截制導(dǎo)的“任務(wù)-時間-空間”線中涉及任務(wù)主要包括預(yù)警任務(wù)、探測跟蹤任務(wù)、識別制導(dǎo)任務(wù)。進(jìn)而,MAP的目的是通過優(yōu)化任務(wù)分配,以最大化作戰(zhàn)效能、平衡任務(wù)契合度為目標(biāo),合理匹配各個異構(gòu)多源傳感器的能力,以獲得最佳任務(wù)效益的傳感器集合。
2)MAS下層規(guī)劃
MAS的目的是在任務(wù)匹配的基礎(chǔ)上,各傳感器間以最大化探測有利度、最小化傳感器節(jié)點(diǎn)數(shù)、平衡全局資源負(fù)載為目標(biāo),尋求執(zhí)行任務(wù)最佳的傳感器節(jié)點(diǎn)時間序列組合,并將規(guī)劃結(jié)果反饋到上層,由上層進(jìn)行總體權(quán)衡,從而得到最終決策結(jié)果。
可以看出,MAP和MAS都是組合優(yōu)化問題,存在“維數(shù)災(zāi)難”的問題。因此這是一個包含復(fù)雜約束條件、上下層規(guī)劃問題的非線性雙層規(guī)劃問題。求解該類問題就需要設(shè)計一種搜索能力強(qiáng)、收斂速度快的分層遞階的求解算法。而在求解算法研究方面,隨著計算機(jī)技術(shù)的發(fā)展,智能優(yōu)化算法被大量應(yīng)用于傳統(tǒng)優(yōu)化算法難以解決的NP問題中,由此發(fā)展起來的swarm intelligence(SI)是目前研究的熱點(diǎn)。典型的有遺傳算法、差分優(yōu)化算法、粒子群算法、蟻群算法、狼群算法以及混合智能算法等等[17~22],這類算法在計算復(fù)雜度上相對于傳統(tǒng)算法表現(xiàn)出的極大優(yōu)勢,使得它們在各個領(lǐng)域都得到了廣泛的應(yīng)用。
分布式反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃在本質(zhì)上屬于分布式任務(wù)分配問題范疇。求解該類問題的核心是設(shè)計任務(wù)執(zhí)行者之間的協(xié)同機(jī)制,各執(zhí)行者以該協(xié)同機(jī)制作為行為規(guī)則,實(shí)現(xiàn)作戰(zhàn)過程中的動態(tài)更新。主要包括確定問題的目標(biāo)函數(shù)和約束條件;分析分布式調(diào)整的觸發(fā)時機(jī);根據(jù)問題背景和作戰(zhàn)需求,設(shè)計合理的協(xié)同機(jī)制,以實(shí)現(xiàn)交戰(zhàn)過程中任務(wù)規(guī)劃方案分布式調(diào)整后的作戰(zhàn)效能最大化。
1)執(zhí)行時機(jī)分析
在作戰(zhàn)過程中可能由于后續(xù)約束條件滿足、戰(zhàn)場節(jié)點(diǎn)損耗/失效等情況的改變而使得某個周期內(nèi)的集中式方案變得不再是最優(yōu)解,甚至變?yōu)椴豢尚薪?。此時,就需要根據(jù)戰(zhàn)場的實(shí)時態(tài)勢進(jìn)行動態(tài)的分布式調(diào)整。具體執(zhí)行條件如下。
執(zhí)行條件1:當(dāng)T時刻,目標(biāo)尚未到達(dá)傳感器節(jié)點(diǎn)有效威力范圍時,融合Agent(處理層Agent)根據(jù)體系內(nèi)的目標(biāo)綜合信息,發(fā)現(xiàn)目標(biāo)實(shí)際航跡偏離之前規(guī)劃時采用的預(yù)測彈道,使得處理層Agent根據(jù)所轄實(shí)體層Agent的部署位置、武器性能、剩余資源等因素的掌握程度,判定“之前由于作戰(zhàn)區(qū)域、系統(tǒng)資源或不滿足其他等原因未能分配到該目標(biāo)”的傳感器節(jié)點(diǎn)可對其提前作戰(zhàn),則發(fā)出協(xié)同交戰(zhàn)請求,對相應(yīng)任務(wù)規(guī)劃方案進(jìn)行調(diào)整。這樣做是為了有機(jī)會選擇更加有效的傳感器節(jié)點(diǎn)對目標(biāo)實(shí)施作戰(zhàn),提高作戰(zhàn)效能。
執(zhí)行條件2:當(dāng)T時刻,實(shí)體層Agent判定無法成功完成任務(wù)(失跟、傳感器節(jié)點(diǎn)失效、無剩余資源等)或者目標(biāo)強(qiáng)機(jī)動飛出當(dāng)前傳感器節(jié)點(diǎn)有效范圍,處理層Agent根據(jù)當(dāng)前其他節(jié)點(diǎn)的部署位置、武器性能等因素判定其它傳感器節(jié)點(diǎn)可對目標(biāo)繼續(xù)實(shí)施作戰(zhàn),則發(fā)出協(xié)同交戰(zhàn)請求,重新調(diào)整任務(wù)規(guī)劃序列,盡可能減小目標(biāo)突防概率。
2)分布式協(xié)同決策方法分析
不同類型的任務(wù)共同體共同構(gòu)成了傳感器任務(wù)規(guī)劃,彼此間既存在區(qū)別、又存在耦合,因此相對應(yīng)的求解方法也應(yīng)當(dāng)是不盡相同的。具體體現(xiàn)為問題解決的目的、分配對象、任務(wù)執(zhí)行能力需求,如表1所示。
一方面,目的和分配對象這兩個因素決定了分配問題的建模方式、約束條件和求解的粒度;另一方面,任務(wù)執(zhí)行能力需求決定了協(xié)同決策的依據(jù)、機(jī)理和過程。從表1中,可以看出預(yù)警與探測跟蹤主要關(guān)注目標(biāo)跟蹤性能上的穩(wěn)定和優(yōu)化,可以用某個或某些具體特性的最優(yōu)度量值(檢測概率、截獲概率、跟蹤精度等)作為目標(biāo)函數(shù),是實(shí)現(xiàn)目標(biāo)-傳感器之間的動態(tài)調(diào)整;而識別制導(dǎo)任務(wù)共同體是要在攔截點(diǎn)規(guī)劃的基礎(chǔ)上對目標(biāo)-制導(dǎo)節(jié)點(diǎn)-火力節(jié)點(diǎn)的進(jìn)一步動態(tài)調(diào)整。與前兩者相比,在識別制導(dǎo)任務(wù)共同體階段,資源沖突高,約束復(fù)雜,實(shí)時性要求高。因此,有必要將分布式反導(dǎo)作戰(zhàn)多傳感器任務(wù)規(guī)劃問題分為預(yù)警探測跟蹤協(xié)同規(guī)劃和識別制導(dǎo)協(xié)同規(guī)劃分別進(jìn)行研究。
表1 不同類型任務(wù)體下的求解問題比較
在求解算法方面,目前對于分布式分配問題的研究可分為以Brown算法為代表的通用算法求解方法和以人工智能為基礎(chǔ)的協(xié)同機(jī)制求解方法。前者可實(shí)現(xiàn)全局最優(yōu),一致性好,但是對作戰(zhàn)計算資源、數(shù)據(jù)要求以及指控能力的要求極高。一旦對抗體系發(fā)生變化(體系中有節(jié)點(diǎn)加入或者退出),就需要全局進(jìn)行重新優(yōu)化。而基于人工智能的求解方法,由于其計算復(fù)雜度低、體系結(jié)構(gòu)動態(tài)調(diào)整速度快,可擴(kuò)展性好,局部優(yōu)化能力強(qiáng)等特點(diǎn),成為了目前研究的熱點(diǎn)。主要包括了基于行為的方法[23],基于拍賣和市場機(jī)制的方法[24~25],基于空閑鏈的方法[26]以及如蟻群、狼群等基于群智能[20~21]的方法。
異構(gòu)MAS下的反導(dǎo)作戰(zhàn)傳感器任務(wù)規(guī)劃框架通過將反導(dǎo)作戰(zhàn)傳感器任務(wù)規(guī)劃依據(jù)任務(wù)性質(zhì)進(jìn)行分割,不但是為了平衡各傳感器的任務(wù)執(zhí)行量,也是為了區(qū)分多源異類傳感器能力帶來的區(qū)域性差異問題。在此基礎(chǔ)上,構(gòu)建了一種基于任務(wù)共同體的分層決策框架。最后,探討了基于雙層規(guī)劃的傳感器任務(wù)規(guī)劃序列生成模型,以及分布式協(xié)同決策下的動態(tài)更新問題。為反導(dǎo)作戰(zhàn)傳感器任務(wù)規(guī)劃問題提供了一個新的思路。
下一步的工作包括兩個方面:一是考慮更符合戰(zhàn)場環(huán)境的目標(biāo)和約束條件,構(gòu)建多目標(biāo)規(guī)劃模型,使得模型更貼近作戰(zhàn)應(yīng)用特點(diǎn)及決策需求;二是構(gòu)建能夠動態(tài)適應(yīng)戰(zhàn)場攻防對抗態(tài)勢變化的面向多任務(wù)分布式智能協(xié)同任務(wù)規(guī)劃理論與算法,以進(jìn)一步提高不確定戰(zhàn)場環(huán)境下,算法求解效率及解的精度。
[1]李軍,鐘志良,景寧,胡衛(wèi)東.異構(gòu)MAS結(jié)構(gòu)下的空天資源多階段協(xié)同任務(wù)規(guī)劃方法[J].航空學(xué)報,2013,34(7):1682-1697.
[2]Br?ring A,Echterhoff J,Jirka S,et al.New generation sensor web enablement[J].Sensors,2011,11(3):2652-2699.
[3]劉欽,劉崢.一種基于Rényi信息增量的機(jī)動目標(biāo)協(xié)同跟蹤方法[J].控制與決策,2012,27(9):1437-1440.
[4]王一川,單甘霖,童俊.基于協(xié)同memetic PSO算法的傳感器-目標(biāo)分配問題求解[J].系統(tǒng)工程與電子技術(shù),,2013,35(5):1000-1007.
[5]aheswararajah S,Halgamuge S.Sensor scheduling for tar?get tracking using particle swarm optimization[C]//Proc.of the IEEE 63rdVehicular Technology conference,2006:573-577.
[6]Badawy R,Hirsch B,Albayrak S.Agent-based coordina?tion techniques for matching supply and demand in energy networks[J].Integrated Computer-Aided Engineering,2010,17(4):373-382.
[7]de Jong S,Tuyls K,Verbeeck K.Fairness in multi-agent systems[J].Knowledge Engineering Review,2008,23(2):153-180
[8]Confessore G,Giordani S,Rismondo S.A market-based multi-agent system model for decetrlized multi-project scheduling[J].Annals of Operations Research,2003:27-38.
[9]唐蘇妍.網(wǎng)絡(luò)化防空導(dǎo)彈體系動態(tài)攔截聯(lián)盟形成機(jī)制與方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2011:40-48.
[10]Peng Ni,Jin-Mang Liu,Yong-lan Liu,Qiang Fu.Re?search on mission planning for distributed multi-sensors in anti-TBM combat based on multi-agent system[J].Sensor Letters.2014,12(2):325-331.
[11]吳林鋒,王剛,劉昌云,楊少春.基于多智能體的反導(dǎo)傳感器任務(wù)規(guī)劃算法[J].現(xiàn)代防御技術(shù),2012,40(2):88-93.
[12]王剛,何晶.基于Agent的網(wǎng)絡(luò)化防空作戰(zhàn)多傳感器集成研究[J].火力指揮與控制,2009,34(1):19-22.
[13]Bogdanowicz Z R.A new efficient algorithm for optimal assignment of smart weapons to targets[J].Computers and Mathematics with Applications,2009,58(4):1965-1969.
[14]陳英武,蔡懷平,邢立寧.動態(tài)武器目標(biāo)分配問題中策略優(yōu)化的改進(jìn)算法[J].系統(tǒng)工程理論與實(shí)踐,2007,27(7):160-165.
[15]Karasakal O.Air defense missile-target allocation mod?els for a naval task group[J].Computers&Operations Research,2008,35(2):1759-1770.
[16]劉曉,劉忠,侯文姝.火力分配多目標(biāo)規(guī)劃模型的改進(jìn)MOPSO算法[J].系統(tǒng)工程與電子技術(shù),2013,35(2):326-330.
[17]王瑋,程樹昌,張玉芝.基于遺傳算法的一類武器目標(biāo)分配方法研究[J].系統(tǒng)工程與電子技術(shù),2008,30(9):1708-1711.
[18]黃仁全,靳聰,賀筱軍,等.自適應(yīng)局部增強(qiáng)微分進(jìn)化改進(jìn)算法[J].空軍工程大學(xué)學(xué)報(自然科學(xué)版),2011,12(3):84-89.
[19]范成禮,邢清華,范海雄.帶審斂因子的變鄰域粒子群算法[J].控制與決策,2014,29(4):696-700.
[20]李猛,王道波,盛守照.采用多重啟發(fā)蟻群優(yōu)化算法的無人機(jī)航跡規(guī)劃[J].華南理工大學(xué)學(xué)報(自然科學(xué)版),2011,39(10):37-43.
[21]吳虎勝,張鳳鳴,吳廬山.一種新的群體智能算法——狼群算法[J].系統(tǒng)工程與電子技術(shù),2013,35(11):2430-2438.
[22]劉朝華,李小花,章兢.精英免疫克隆選擇的協(xié)同進(jìn)化粒子群算法[J]. 電子學(xué)報,2013,41(11):2167-2173.
[23]Gage Aaron.Multi-Robot Task Allocation Using Affect[D]. Tampa: University of South Florida, 2004:15-20.
[24]Jones E.Gil,Dias M.Bernardine,Stentz Anthony.Learn?ing-Enhanced Market-based Task Allocation for Disas?ter Response[A].CMU-RI-TR-06-48.Pittsburgh:Carnegie Mellon University,2006:88-96.
[25]Dobzinski Shahar,Nisan Noam,Schapira Michael.Ap?proximation Algorithms for Combinatorial Auctions with Complement-Free Bidders[J].Mathematics of Opera?tions Research,2010,35(1):1-13.
[26]I.D.Chase,Weissburg M.,Dewitt T.H.The Vacancy Chain Process:A New Mechanism of Resource Distribu?tion in Animals with Application to Hermit Crabs[J].Animal Behavior,1998(36):1265-1274.