朱 卓,劉琦妍,張 策
(1.中國電子科技集團(tuán)公司第五十三研究所機載產(chǎn)品事業(yè)部,天津 300308;2.西北工業(yè)大學(xué)a.無人系統(tǒng)技術(shù)研究院;b.航天學(xué)院,西安 710072)
目前,察打一體無人機的主要威脅為紅外地空導(dǎo)彈[1-2],其主要包括便攜式紅外地空導(dǎo)彈和車載式紅外地空導(dǎo)彈,并具有抗人工干擾能力較強,射程較遠(yuǎn)等特點[3-4],無人機基本無法擺脫其攻擊,因此,研究用于無人機自主規(guī)避紅外地空導(dǎo)彈的決策技術(shù)是十分必要的。當(dāng)無人機遭受紅外地空導(dǎo)彈攻擊威脅時,能通過對自身獲得的各項信息進(jìn)行分析決策,做出最合理的自主規(guī)避對抗舉措,可以提高其生存能力。
文獻(xiàn)[5]研究了導(dǎo)彈迎頭攻擊時,飛機的最佳防御策略,即做非常規(guī)機動并同時發(fā)射干擾彈;文獻(xiàn)[6]深入研究紅外成像導(dǎo)彈的抗干擾機理,建立了目標(biāo)機的運動和輻射模型以及面源紅外誘餌的運動擴散模型和紅外圖像模型,并選擇導(dǎo)彈的戰(zhàn)術(shù)參數(shù)以制定干擾效能評估指標(biāo),仿真結(jié)果表明,面源紅外誘餌可有效干擾二代彈,但針對三代彈和四代彈的干擾成功率較低;文獻(xiàn)[7]針對具有一定自主空戰(zhàn)能力的無人機,建立了以過載為輸入的飛行動力學(xué)模型和采用三維比例導(dǎo)引法的導(dǎo)引彈道模型,并結(jié)合神經(jīng)網(wǎng)絡(luò)為無人機設(shè)計了一種規(guī)避來襲導(dǎo)彈的機動策略,但其樣本庫的計算非常耗時,且神經(jīng)網(wǎng)絡(luò)只適用于設(shè)定好的導(dǎo)彈系統(tǒng);文獻(xiàn)[8]構(gòu)建了超視距空中對抗訓(xùn)練環(huán)境,提出了一種融合專家經(jīng)驗的啟發(fā)式Q 網(wǎng)絡(luò)方法,實現(xiàn)了空中對抗機動策略的自主學(xué)習(xí);文獻(xiàn)[9]利用神經(jīng)網(wǎng)絡(luò)直接從無人機與導(dǎo)彈的位置關(guān)系預(yù)測規(guī)避結(jié)果,為無人機實時提供規(guī)避策略,但其需要大量數(shù)據(jù)支持;文獻(xiàn)[10]提出了一種基于蟻群和Q 學(xué)習(xí)的融合算法,以提高認(rèn)知雷達(dá)干擾決策的效率和適應(yīng)性,從而適應(yīng)未來戰(zhàn)場上的集群對抗環(huán)境,但其在復(fù)雜戰(zhàn)場環(huán)境下效果不佳。
上述研究從不同方面給出了無人機的作戰(zhàn)策略,但在復(fù)雜紅外對抗情況下,仍需進(jìn)一步提高無人機對抗決策的質(zhì)量,使其適應(yīng)力更強,覆蓋面更廣。本文提出一種面向典型對抗態(tài)勢的自主干擾決策模型,首先,基于紅外干擾彈投放策略集及典型紅外對抗態(tài)勢建立紅外對抗樣本庫;其次,利用遺傳算法及匹配決策模型得到最優(yōu)典型對抗態(tài)勢決策集;最后,結(jié)合線性插值思想得到一般對抗態(tài)勢下的干擾彈投放策略,找出針對不同對抗態(tài)勢的近乎最優(yōu)的對抗策略方案,創(chuàng)建決策模型,并通過仿真實驗驗證了本文自主決策模型的有效性。
干擾彈投放策略集包含以下因素:投放干擾彈總數(shù)、投放組數(shù)、組間間隔、每組投放強點源干擾彈數(shù)、每組投放多點源干擾彈數(shù)、彈間隔、投放方向、投放速度等。
為同時應(yīng)對紅外制導(dǎo)導(dǎo)彈和雷達(dá)制導(dǎo)導(dǎo)彈,無人機需裝載相同數(shù)量的紅外干擾彈和箔條彈。本文設(shè)定目標(biāo)無人機單次可攜帶的紅外干擾彈總量為60 枚,包括強點源干擾彈與多點源干擾彈。為避免一次投放全部干擾彈造成無人機多次遇襲時無干擾彈可用的危險處境,限定一次性投放干擾彈的數(shù)量不多于12枚,最多投放3 組。投放組數(shù)n=1,2,3,每組強點源干擾彈數(shù)m=1,2,每組多點源干擾彈數(shù)d=1,2,組間隔tn=0,1,1.5 s,彈間隔tm=0.1,0.2,0.3 s。干擾彈投放速度為30 m/s,投放傾角與偏角為[-120°,-60°](以30°為間隔),本文取-60°,按照先投放強點源干擾彈后投放多點源干擾彈的原則,上述參數(shù)組成的紅外干擾彈投放策略集(部分)如表1 所示。
表1 紅外干擾彈投放策略集(部分)Tab.1 Delivery strategy set of infrared decoy(partial)
每一個干擾投放策略確定后,會有一個對應(yīng)的投放持續(xù)時間T,即完成該策略的投放所需要的時長,可表示為
式中k 為每組彈數(shù)。
針對任一對抗態(tài)勢,每次投放都應(yīng)包含強點源干擾彈與多點源干擾彈,強點源干擾彈可以有效遮蔽無人機目標(biāo)并使紅外制導(dǎo)導(dǎo)彈根據(jù)質(zhì)心跟蹤原理偏向強點源干擾彈的方位;如果強點源干擾彈未能成功誘導(dǎo)紅外制導(dǎo)導(dǎo)彈偏離目標(biāo),多點源干擾彈可以形成多個類目標(biāo)紅外干擾,混淆導(dǎo)引頭對目標(biāo)的判斷,致使導(dǎo)彈需要從多個點源目標(biāo)中選擇跟蹤目標(biāo),從而有效降低選中目標(biāo)的概率。
不同類型導(dǎo)彈的射程、射高、飛行速度等參數(shù)不同,故對應(yīng)的干擾對抗策略也不盡相同。
紅外制導(dǎo)導(dǎo)彈與目標(biāo)無人機構(gòu)成的典型對抗態(tài)勢由導(dǎo)彈和無人機的初始參量構(gòu)成,包括:飛機高度、彈目距離、導(dǎo)彈運動速度、導(dǎo)彈發(fā)射方位角、無人機飛行高度、無人機飛行速度。設(shè)置典型便攜式導(dǎo)彈對抗態(tài)勢,無人機飛行高度分別設(shè)置為1.0、2.0、3.5 km,無人機飛行速度為0.2 Ma,彈目距離分別為2.0、4.0、6.0 km,導(dǎo)彈發(fā)射方位角根據(jù)導(dǎo)彈攻擊包線分別設(shè)置為0°、12°、27°、50°、77°、90°、120°、138°、165°、180°,排除不合理的對抗態(tài)勢,共組成典型對抗態(tài)勢80 種,部分態(tài)勢如表2 所示。
表2 典型對抗態(tài)勢(部分)Tab.2 Typical confrontation situation(partial)
通過建立具有典型性和覆蓋性的紅外對抗樣本庫,可為仿真實驗和干擾彈投放策略的選擇提供數(shù)據(jù)支撐,是后續(xù)評估干擾策略效果的基礎(chǔ)。紅外對抗樣本庫的構(gòu)成如圖1 所示。
圖1 紅外對抗樣本庫Fig.1 Sample library of infrared countermeasures
隨著導(dǎo)彈發(fā)射距離的增加,對應(yīng)的理想彈道平均時長增加;當(dāng)水平進(jìn)入角從0°逐漸轉(zhuǎn)到180°,即導(dǎo)彈從尾后攻擊逐漸轉(zhuǎn)向迎頭攻擊,對應(yīng)的理想彈道平均時長減?。徊煌母蓴_投放策略對應(yīng)的投放持續(xù)時間不同。因此,在構(gòu)建紅外對抗樣本庫時,需要考慮干擾彈投放持續(xù)時間和導(dǎo)彈完成攻擊的理想時間的匹配,以保證紅外干擾彈可以全部投放出去,且其在整個對抗過程的大部分時間內(nèi)均能發(fā)揮效用。經(jīng)實驗發(fā)現(xiàn),T應(yīng)滿足以下條件
式中:S 為彈目距離;v彈為導(dǎo)彈飛行平均速度;v無為無人機飛行平均速度。
基于上述分析,可以從紅外干擾彈投放策略集中為每種對抗態(tài)勢選擇可行策略集,以貼合實際情況,避免浪費紅外干擾彈,并減少紅外對抗樣本庫的樣本數(shù)量,方便后續(xù)計算。
遺傳算法[11](GA,genetic algorithm)是模擬達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機理生物進(jìn)化過程的計算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法[12]。遺傳算法過程如圖2 所示,種群像自然進(jìn)化一樣,后生代種群比前代更加適應(yīng)于環(huán)境,末代種群中的最優(yōu)個體經(jīng)過解碼,可作為問題近似最優(yōu)解[13]。
圖2 遺傳算法過程Fig.2 Process of genetic algorithm
本文針對典型態(tài)勢的最優(yōu)干擾彈投放策略,結(jié)合遺傳算法的基本思想,對傳統(tǒng)遺傳算法進(jìn)行一定的改進(jìn)。其核心內(nèi)容包括以下方面。
(1)參數(shù)編碼。采用實數(shù)編碼,減少一般二進(jìn)制編碼最后解碼的步驟。
(2)初始群體的設(shè)定。初始種群選取參數(shù)范圍為紅外對抗樣本庫中參數(shù)。在獲得的初始種群選取范圍內(nèi),以隨機方式獲取初始種群,其規(guī)模設(shè)為40。
(3)適應(yīng)度函數(shù)的設(shè)計。以綜合復(fù)雜度[14]作為適應(yīng)度函數(shù)。
(4)遺傳操作設(shè)計過程如下。
a 選擇算子。計算初始種群的適應(yīng)值,保留適應(yīng)值最高的前10 個組合并遺傳至下一代,淘汰最低的10 個組合。
b 交叉算子。本文無人機干擾彈投放策略采用實數(shù)編碼的方式,每個個體的染色體記為干擾彈決策各因素的值,采用單點交叉,示意圖如圖3 所示。將適應(yīng)度排名前30 的個體分為奇數(shù)與偶數(shù)排列的兩組,每組共15 個,各選10 個個體分別進(jìn)行交叉操作,遺傳至下一代。
圖3 單點交叉示意圖Fig.3 Diagram of single point crossing
c 變異算子。優(yōu)質(zhì)的典型態(tài)勢對抗決策已經(jīng)接近最優(yōu),采取的變異范圍較小,本文將使用變異算子產(chǎn)生的高斯隨機數(shù)替換組合染色體后6 位中任一位作為一次變異操作。
(5)控制參數(shù)設(shè)定。設(shè)置初始種群數(shù)量為40,迭代次數(shù)設(shè)置為5 次,交叉概率和變異概率設(shè)定為1。交叉概率設(shè)置為1,可以加速搜索過程,提高算法效率;變異概率設(shè)為1,以保證最優(yōu)策略的全局性。
迭代結(jié)束后,將迭代所得的適應(yīng)度值最高的策略作為當(dāng)前典型態(tài)勢的干擾彈投放策略。擇優(yōu)步驟如圖4 所示。
圖4 基于遺傳算法的擇優(yōu)步驟Fig.4 Optimal steps based on genetic algorithm
針對紅外對抗樣本庫中的每個樣本,生成其紅外仿真圖像序列,計算這些序列的綜合復(fù)雜度值,利用建立的紅外對抗樣本庫以及計算出的綜合復(fù)雜度值來進(jìn)行簡單的決策匹配。針對每一種基礎(chǔ)對抗態(tài)勢給出最優(yōu)干擾彈投放策略的評價準(zhǔn)則:①策略符合干擾與混淆的基本思想;②綜合復(fù)雜度作為評判指標(biāo);③每次對抗干擾總數(shù)滿足全程干擾規(guī)劃。針對任意一種典型對抗態(tài)勢選擇干擾彈投放策略流程如圖5 所示。
圖5 策略流程圖Fig.5 Strategy flow chart
根據(jù)實驗分析,與最優(yōu)策略綜合復(fù)雜度值差值在0.05 以內(nèi)的策略均可作為備選策略,選取其中投放干擾彈最少的策略作為當(dāng)前對抗態(tài)勢的最優(yōu)干擾彈投放策略。
計算得到匹配典型紅外對抗態(tài)勢的最佳紅外干擾彈投放策略,需要將其擴展到針對任一態(tài)勢,構(gòu)建基于典型紅外對抗態(tài)勢的遷移決策模型。本文根據(jù)典型對抗態(tài)勢得出的有效策略,使用插值法得到非典型對抗態(tài)勢的策略提案,再根據(jù)仿真實驗,并結(jié)合綜合復(fù)雜度來評判策略的有效性。三線性插值思想[15]如圖6 所示。
圖6 三線性插值圖Fig.6 Tri-linear interpolation graph
已知C 點坐標(biāo)(x,y,z),設(shè)C000點坐標(biāo)為(x0,y0,z0),C001點坐標(biāo)為(x0,y0,z1),C100點坐標(biāo)為(x1,y0,z0),C110點坐標(biāo)為(x1,y1,z0),C101點坐標(biāo)為(x1,y0,z1),C011點坐標(biāo)為(x0,y1,z1),C010點坐標(biāo)為(x0,y1,z0),C111點坐標(biāo)為(x1,y1,z1)。C 點的插值計算形式如下
典型對抗態(tài)勢通過組合共構(gòu)成36 個區(qū)間,示意圖如圖7 所示。通過判斷當(dāng)前對抗態(tài)勢處于哪個區(qū)間內(nèi),即可通過線性插值思想計算得出對應(yīng)態(tài)勢的遷移干擾彈投放策略。
圖7 典型對抗態(tài)勢示意圖Fig.7 Typical confrontation situation diagram
為了測算通過插值方法計算得到的隨機態(tài)勢的干擾彈投放策略是否為當(dāng)前態(tài)勢的優(yōu)質(zhì)策略,同樣使用遺傳算法進(jìn)行尋優(yōu)設(shè)計。紅外對抗決策模型由典型對抗態(tài)勢策略經(jīng)過線性插值法與基于遺傳算法思想的改進(jìn)算法組成,流程如圖8 所示。
圖8 一般對抗態(tài)勢決策分析流程Fig.8 Decision analysis process of general confrontation situation
上文的干擾彈投放策略只能取整,但通過線性插值思想計算得出的當(dāng)前態(tài)勢干擾彈投放策略參數(shù)值一般不取整,需結(jié)合典型態(tài)勢投放策略設(shè)計參數(shù)值,將當(dāng)前態(tài)勢計算參數(shù)就近取整,作為當(dāng)前態(tài)勢干擾彈投放策略。設(shè)投放組數(shù)n={n1,n2},每組強點源干擾彈數(shù)m={m1,m2},每組多點源干擾彈數(shù)d={d1,d2},其計算公式如下
其余投放策略因素設(shè)置與前文針對典型對抗態(tài)勢的投放策略相同。與最優(yōu)策略綜合復(fù)雜度值差值在0.05以內(nèi)的干擾彈投放策略作為備選策略,再進(jìn)一步選取最優(yōu)策略。
基于紅外干擾彈投放策略集和典型對抗態(tài)勢計算綜合復(fù)雜度得到80 組典型對抗態(tài)勢優(yōu)質(zhì)策略集,通過遺傳算法思想對優(yōu)質(zhì)策略集進(jìn)行進(jìn)一步優(yōu)化,計算得到的最優(yōu)策略集綜合復(fù)雜度與優(yōu)質(zhì)策略集綜合復(fù)雜度對比圖如圖9(a)所示,其中,紅點表示經(jīng)過遺傳算法迭代后得到的最優(yōu)策略綜合復(fù)雜度值,藍(lán)點表示優(yōu)質(zhì)策略的綜合復(fù)雜度值。兩者差值如圖9(b)所示。
圖9 典型態(tài)勢綜合復(fù)雜度對比圖與差值圖Fig.9 Comparison of synthetic complexity and difference graph of typical situation
從圖9 可知,經(jīng)過遺傳算法迭代后得到的最優(yōu)策略綜合復(fù)雜度值明顯高于未迭代之前的優(yōu)質(zhì)策略綜合復(fù)雜度值,綜合復(fù)雜度差值均值接近0.2。
故無人機紅外對抗自主決策模型以面向典型對抗態(tài)勢的自主干擾決策模型為基礎(chǔ),結(jié)合插值與遺傳算法尋優(yōu)思想,得到面向一般態(tài)勢的自主干擾決策模型。取36 個典型對抗態(tài)勢區(qū)間,每個區(qū)間有20 個隨機態(tài)勢,結(jié)合插值思想計算其干擾彈投放策略,并計算相關(guān)策略的綜合復(fù)雜度。隨機態(tài)勢分布圖如圖10所示。
圖10 隨機態(tài)勢分布圖Fig.10 Distribution of random situation
計算720 個隨機態(tài)勢的插值遷移策略綜合復(fù)雜度與通過遺傳算法迭代后得到的最優(yōu)策略綜合復(fù)雜度,綜合復(fù)雜度對比圖如圖11(a)所示,其中,紅點表示經(jīng)過遺傳算法迭代后得到的最優(yōu)策略綜合復(fù)雜度值,藍(lán)點表示插值遷移策略綜合復(fù)雜度值。隨機態(tài)勢最優(yōu)策略綜合復(fù)雜度與插值遷移策略綜合復(fù)雜度的差值圖如圖11(b)所示。
圖11 隨機態(tài)勢綜合復(fù)雜度對比圖與差值圖Fig.11 Comparison of synthetic complexity and difference graph of random situation
從圖11(b)可知,綜合復(fù)雜度差值大于0.05 的策略約占測試策略總數(shù)的10%,其中綜合復(fù)雜度差值介于0.05 與0.06 之間的策略約占測試策略總數(shù)的44%,本文認(rèn)為綜合復(fù)雜度差值在0.05 以內(nèi)的對抗策略均可作為備選策略,所以插值遷移策略與經(jīng)過遺傳算法思想尋優(yōu)后的策略相比有近90%都可作為備選策略,且計算量小,具有應(yīng)用可行性。
為驗證本文決策模型的可行性和有效性,進(jìn)行紅外對抗場景仿真實驗。導(dǎo)彈發(fā)射距離分為近距、中距、遠(yuǎn)距3 種情況,分別對應(yīng)2~3 km、3~5 km、5~6 km;將導(dǎo)彈水平進(jìn)入角劃分為尾后、側(cè)向、迎頭3 種情況,分別對應(yīng)0°~45°、45°~135°和135°~180°;無人機飛行高度設(shè)為中低空、中高空2 種情況,分別對應(yīng)1.0~2.0 km、2.0~3.5 km。設(shè)計驗證實驗條件時,使近距、中距、遠(yuǎn)距對應(yīng)的實驗樣本數(shù)之比為1 ∶3 ∶1,使尾后、側(cè)向、迎頭對應(yīng)的實驗樣本數(shù)之比為2 ∶2 ∶1,使中低空和中高空對應(yīng)的實驗樣本數(shù)之比為2 ∶3。通過生成隨機數(shù)的方式,得到100 條對抗實驗條件,這些條件在空間中的分布情況如圖12 所示。
圖12 實驗態(tài)勢分布圖Fig.12 Distribution of experimental situation
針對100 條隨機對抗實驗態(tài)勢,通過典型態(tài)勢最優(yōu)策略集與插值計算方法計算出當(dāng)前態(tài)勢的對抗策略,并與傳統(tǒng)干擾彈投放策略進(jìn)行對比,當(dāng)來襲導(dǎo)彈從尾后攻擊時,遠(yuǎn)距時采用多點源干擾彈,中近距時采用強點源干擾彈;側(cè)向攻擊時,采用強點源干擾彈;迎頭攻擊時,采用多點源和強點源干擾彈組合使用。
對傳統(tǒng)干擾策略采用同一態(tài)勢下同一投放干擾彈數(shù)量進(jìn)行仿真實驗,部分仿真數(shù)據(jù)如表3 所示,以實驗結(jié)束時脫靶量大于導(dǎo)彈殺傷半徑作為干擾成功標(biāo)準(zhǔn),統(tǒng)計100 條實驗態(tài)勢與其對應(yīng)策略仿真結(jié)果,傳統(tǒng)策略的干擾成功率為59%,本文決策模型的干擾成功率為87%,驗證了決策包的有效性。
表3 仿真數(shù)據(jù)(部分)Tab.3 Simulation data(partial)
本文提出一種面向典型對抗態(tài)勢的自主干擾決策模型,設(shè)計紅外對抗樣本庫,并結(jié)合遺傳算法進(jìn)行尋優(yōu),得到最優(yōu)典型態(tài)勢策略集;通過線性插值、綜合復(fù)雜度與對抗態(tài)勢和對抗決策之間的映射模型,得到針對不同對抗態(tài)勢近乎最優(yōu)的對抗策略方案,并創(chuàng)建決策模型。通過仿真實驗,驗證了本文決策模型的可行性和有效性。
本文通過非典型態(tài)勢的策略遷移模型計算發(fā)現(xiàn)決策與對應(yīng)態(tài)勢最優(yōu)對抗決策有一定的偏差,后續(xù)工作中,將尋找更為優(yōu)秀有效的計算模型,使一般態(tài)勢可以得到更優(yōu)秀的決策模型。