劉子豪,董寶良,王寶寶,廉蘭平,程燦
(華北計(jì)算技術(shù)研究所系統(tǒng)四部,北京 100083)
常規(guī)導(dǎo)彈作戰(zhàn)方案評估主要是對常規(guī)導(dǎo)彈部隊(duì)作戰(zhàn)方案的可行性、風(fēng)險(xiǎn)度、作戰(zhàn)效益等進(jìn)行的評價(jià)和估量[1]。如何提升作戰(zhàn)方案的可行性、作戰(zhàn)效益,降低風(fēng)險(xiǎn)度是研究重點(diǎn)和難點(diǎn)。
文獻(xiàn)[2]提出綜合考慮目標(biāo)重要度、毀傷要求以及生存狀態(tài)等因素建立了輔助決策模型,文獻(xiàn)[3]提出建立了針對防御場景下的動(dòng)態(tài)武器協(xié)同火力分配模型,該文在其基礎(chǔ)上考慮了某型號導(dǎo)彈存在調(diào)度轉(zhuǎn)移[4]和發(fā)射前準(zhǔn)備時(shí)間等情況,在普通武器-目標(biāo)模型[5]的基礎(chǔ)上,引入了導(dǎo)彈發(fā)射準(zhǔn)備時(shí)間(時(shí)間成本)這一目標(biāo),輔助決策者選擇評估價(jià)值更高的方案。
武器-目標(biāo)分配問題主要使用多目標(biāo)進(jìn)化算法進(jìn)行求解,這類算法需要利用帕累托(Pareto)前沿找到相對優(yōu)解或者最優(yōu)解。非支配排序遺傳算法(NSGA-III)就是其中的典型代表,在處理多目標(biāo)優(yōu)化問題上具有較為廣泛的應(yīng)用。但在輔助決策中,決策者并不需要得到全部Pareto 前沿,而只關(guān)心部分Pareto 前沿,或者只需要在特定區(qū)域獲得更多解?;诖?,該文提出基于偏好點(diǎn)的NSGA-III 算法(R-NSGA-III)的常規(guī)導(dǎo)彈火力分配輔助決策模型,并通過實(shí)驗(yàn)仿真驗(yàn)證了模型可以得到最優(yōu)打擊方案,能夠達(dá)到輔助決策作用。
該文提出基于R-NSGA-III 的常規(guī)導(dǎo)彈火力分配模型,優(yōu)化目標(biāo)包括最大化敵人的預(yù)期損失、最小化方案導(dǎo)彈的成本和最小化導(dǎo)彈發(fā)射任務(wù)準(zhǔn)備的時(shí)間成本。模型主要針對的場景是在打擊目標(biāo)給定條件下,對現(xiàn)有進(jìn)入發(fā)射狀態(tài)和未進(jìn)發(fā)射狀態(tài)的導(dǎo)彈進(jìn)行任務(wù)分配。模型需要決策者輸入對三個(gè)目標(biāo)的若干偏好,然后可生成多種近似并相對最優(yōu)的打擊方案,并可以通過三維散點(diǎn)圖的方式對生成方案,并直觀地展示給決策者,以更好地輔助決策。
該文求解模型的算法是基于NSGA-III 算法進(jìn)行改進(jìn)的。當(dāng)前主流用于解決火力分配的多目標(biāo)優(yōu)化算法還有MOEA/D[6]、粒子群[7]、NSGA-II[8]等。其中NSGA-III 算法在處理多目標(biāo)優(yōu)化問題上具有較為廣泛的研究[8,10-11]與應(yīng)用[11-12],但是該算法生成的完整Pareto 前沿并不全部是用戶關(guān)心的。實(shí)際上決策者偏好方案一般只集中在Pareto 前沿的部分區(qū)域,或者在偏好的區(qū)域獲得更多的方案等。所以該文采用了R-NSGA-III 算法[13],該算法在NSGA-III 程序的基礎(chǔ)上,引入一種新的參考點(diǎn)生成方法,同時(shí)使用遺傳算子和生存選擇過程。
假設(shè)某次作戰(zhàn)行動(dòng)中有M種可用導(dǎo)彈武器裝備,設(shè)武器集合為W,其中,wi表示第i類武器裝備,且第i類武器裝備有Mi個(gè),則第i類武器裝備集合wi表示為Wi。有N個(gè)潛在打擊目標(biāo),目標(biāo)集合為T,其中tk表示第k個(gè)潛在打擊目標(biāo)。
文獻(xiàn)[14]圍繞導(dǎo)彈戰(zhàn)斗部打擊目標(biāo)過程所涉及的毀傷評估研究進(jìn)行總結(jié)概述,分別從目標(biāo)毀傷評估模型、毀傷過程主體、分類目標(biāo)毀傷、毀傷評估手段四方面進(jìn)行闡述,梳理現(xiàn)有的主要成果。可抽象計(jì)算出第i類武器裝備打擊第k個(gè)打擊目標(biāo)時(shí)的毀傷概率為pik,毀傷收益為vi,使用一個(gè)第i類導(dǎo)彈裝備所需要的成本為uj。參考文獻(xiàn)[15]和文獻(xiàn)[17]模型設(shè)導(dǎo)彈wij進(jìn)入發(fā)射狀態(tài)所需時(shí)間為sij。
M類武器聯(lián)合打擊所有潛在的目標(biāo)時(shí),對目標(biāo)的毀傷效果如式(1)所示:
M類武器聯(lián)合打擊所有目標(biāo)時(shí),成本為使用的所有武器的成本之和,如式(2)所示:
方案的導(dǎo)彈準(zhǔn)備時(shí)間取導(dǎo)彈進(jìn)入發(fā)射前的平均等待時(shí)間,如式(3)所示:
確定武器裝備目標(biāo)分配方案時(shí)需要滿足一些約束條件,建立優(yōu)化模型的約束條件如下:
約束a:對于任意一個(gè)武器裝備,最多只能打擊一個(gè)目標(biāo),即一個(gè)武器裝備可以用于打擊某個(gè)目標(biāo),也可以閑置不打擊某個(gè)目標(biāo),如式(4)所示:
約束b:用于打擊同一目標(biāo)的武器裝備種類數(shù)不超過某一閾值(假設(shè)預(yù)先設(shè)置的閾值為T),如式(5)所示:
綜上,根據(jù)給出的目標(biāo)函數(shù)和約束條件,確定武器裝備目標(biāo)分配方案時(shí)以最大化單位成本上的毀傷效果為目標(biāo)的優(yōu)化模型,如式(6)所示:
2014年,有文獻(xiàn)提出了NSGA-III算法,該程序通過引入一系列預(yù)定義的參考方向,彌補(bǔ)了NSGA-II無法擴(kuò)展到三個(gè)以上目標(biāo)的不足。該算法根據(jù)當(dāng)前種群獲得覆蓋整個(gè)目標(biāo)空間的超平面,并在超平面上生成一系列分布均勻的參考點(diǎn)。也有一些文獻(xiàn)[19]對該算法進(jìn)行了改進(jìn),為該文提供了思路。由于該文提出的基于偏好點(diǎn)的NSGA-III 方法就是基于這種方法,所以,文中簡要描述其過程,算法流程圖如圖1 所示。
圖1 NSGA-III算法流程圖
NSGA-III 算法與NSGA-II 算法在父代、子代合并前的操作都是相同的。NSGA-III 算法首先利用Das-Dennis 方法在單位超平面上選取H個(gè)分布均勻的參考點(diǎn),然后將每個(gè)參考點(diǎn)與原點(diǎn)相連接,參考方向?yàn)槟繕?biāo)點(diǎn)方向。在每一代合并后的種群中,所有個(gè)體都根據(jù)系統(tǒng)的最大、最小值進(jìn)行歸一化。然后,根據(jù)個(gè)體到參考方向的正交距離,將每個(gè)個(gè)體關(guān)聯(lián)到一個(gè)特定的參考方向,用一種小生境方法來選擇合適的個(gè)體加入新種群。這種方法不需要額外的選擇操作,因?yàn)榭傮w大小幾乎保持與參考方向的數(shù)量相同。NSGA-III 算法在3-15 個(gè)目標(biāo)的優(yōu)化問題上進(jìn)行了測試,在每種情況下,它都能夠在約束和無約束問題上找到一個(gè)收斂良好、分布良好的近Pareto最優(yōu)解集。
R-NSGA-III 在NSGA-III 的基礎(chǔ)上進(jìn)行了擴(kuò)展,將決策者提供的偏好點(diǎn)作為參考,引入了一種新的參考點(diǎn)生成方法,同時(shí)使用與后者相同的遺傳算子和生存選擇過程。假設(shè)決策者提供了K個(gè)三目標(biāo)模型的偏好點(diǎn)r(k)。
每個(gè)偏好點(diǎn)首先采用NSGA-III 的歸一化方法進(jìn)行歸一化。根據(jù)每個(gè)目標(biāo)的最大值fmax和最小值fmin,得到歸一化的偏好點(diǎn)如下:
然后,計(jì)算單位超平面的截距和從理想點(diǎn)到每個(gè)標(biāo)準(zhǔn)化參考點(diǎn)的向量如下:
然后,利用Das-Dennis 參考點(diǎn)的質(zhì)心g和形成的向量,將縮小后的Das-Dennis 參考點(diǎn)平移到單位超平面上,結(jié)果如下:
其中,gi為縮小的Das-Dennis 點(diǎn)的質(zhì)心。
在完成上述操作之后,所有的Das-Dennis 參考點(diǎn)都位于以投影點(diǎn)為中心的三角小區(qū)域上。對K個(gè)偏好點(diǎn)逐一重復(fù)上述步驟。因此,將一共有K×H個(gè)參考點(diǎn)存儲(chǔ)在Za中。然后將三個(gè)由單位向量表示的極值點(diǎn)添加到集合Za上。
這使得Za的大小為(K·H+3)×3。為了后續(xù)可以更好地進(jìn)行歸一化,添加極值點(diǎn)來創(chuàng)建極值的Pareto 最優(yōu)解,并將這些點(diǎn)作為NSGA-III 算法中的參考點(diǎn)。因?yàn)闃?biāo)準(zhǔn)化因子(fmax,fmin)在每一代中都會(huì)發(fā)生變化,所以要在每一代中都執(zhí)行上述操作。在NSGA-III 運(yùn)行結(jié)束時(shí),除了極端參考方向?qū)?yīng)的解外,只考慮原始參考點(diǎn)產(chǎn)生的每個(gè)參考方向的最接近解。
假設(shè)我方本次進(jìn)攻,擁有5 種導(dǎo)彈類型,每種類型的彈量平均為9 個(gè),期望打擊的目標(biāo)數(shù)量為7 個(gè),算法人口為183。該文的初始數(shù)據(jù)為0 到1 之間隨機(jī)數(shù)。為貼合戰(zhàn)場實(shí)際情況,在此基礎(chǔ)上進(jìn)行了修改。如選擇部分武器進(jìn)入備戰(zhàn)狀態(tài),準(zhǔn)備的時(shí)間成本為0。部分毀傷能力強(qiáng)的武器未進(jìn)入熱待機(jī)狀態(tài),則準(zhǔn)備時(shí)間會(huì)更長等。
對照組采用了NSGA-III 算法,并采用了相同的種群規(guī)模,生成兩組實(shí)例。決策者根據(jù)對三個(gè)目標(biāo)的權(quán)衡給出偏好點(diǎn),如表1 所示。
表1 偏好點(diǎn)
為了更直觀地進(jìn)行展示,作圖時(shí)用點(diǎn)的大小表示時(shí)間開銷的大小。實(shí)例1 兩種算法的運(yùn)行結(jié)果如圖2-3 所示。
實(shí)例2 兩種算法的運(yùn)行結(jié)果如圖4-5 所示。
如圖2-5 所示,該模型可以輔助決策者通過散點(diǎn)圖更直觀地了解到方案成本與收益的關(guān)系,快速地根據(jù)戰(zhàn)場情況篩選出符合當(dāng)前時(shí)間要求的方案。
圖2 NSGA-III
圖3 R-NSGA-III
圖4 NSGA-III
圖5 R-NSGA-III
橫向?qū)Ρ葓D2-3和圖4-5可以看出,R-NSGA-III算法一方面可以根據(jù)決策者的偏好在相近區(qū)域提供更多解,而不是展示整個(gè)Pareto 最優(yōu)前沿。另一方面偏好方案的區(qū)域是否有解也一目了然,可以讓決策者對我方裝備情況有額外的了解。
在上述實(shí)驗(yàn)的基礎(chǔ)上,該文又按照少打擊目標(biāo)、少武器型號、多武器數(shù)量這三種情況,額外進(jìn)行了三組不同的實(shí)驗(yàn)來比較運(yùn)算的時(shí)間開銷,每組實(shí)驗(yàn)運(yùn)行6 次取平均值。時(shí)間花費(fèi)如表2 所示。
表2 運(yùn)行時(shí)間對比
如表2所示,R-NSGA-III算法所花費(fèi)的時(shí)間約為NSGA-III算法的52.05%。因此,可以驗(yàn)證R-NSGAIII 算法時(shí)間開銷少,能夠更快地輔助決策。
針對常規(guī)導(dǎo)彈的特點(diǎn),引入時(shí)間成本可以讓決策者更詳細(xì)地了解方案情況,直觀地了解到偏好的指標(biāo)是否有方案滿足。有利于決策者選出適宜的方案,更好地達(dá)到輔助決策目的。并且R-NAGA-III 算法運(yùn)行時(shí)間開銷小,使得整體效率有大幅度的提升。綜上,基于R-NSGA-III 的常規(guī)導(dǎo)彈火力分配輔助決策模型貼近實(shí)際作戰(zhàn),為智能決策提供有效的輔助支持,在對戰(zhàn)決策場景具有重要的實(shí)際應(yīng)用價(jià)值。