王宇航,董寶良,公 超,尚真真,姚康寧
(華北計算技術(shù)研究所,北京 100083)
隨著信息技術(shù)和軍事能力的不斷提升,現(xiàn)代空中作戰(zhàn)的主要方式已逐漸演變?yōu)槎鄦卧幗M、多機型編隊的群組式作戰(zhàn),在戰(zhàn)術(shù)級作戰(zhàn)行動中,飛行器編隊往往以同類型多數(shù)量或者多類型多數(shù)量的形式出現(xiàn)??罩心繕?biāo)威脅評估[1-6]是戰(zhàn)場態(tài)勢的重要組成部分,是指揮決策的重要組成因素,也是奪取制空勝利的重要保障。
目前威脅評估的主要方法包括:灰色主成分分析[7]、優(yōu)劣解距離(TOPSIS)[8]、直覺模糊證據(jù)理論[9-11]、貝葉斯網(wǎng)絡(luò)[12]、深度學(xué)習(xí)[13]等方法。上述的評估方法只考慮了當(dāng)前時刻的態(tài)勢要素,忽略了目標(biāo)歷史連續(xù)時刻的態(tài)勢要素。有相關(guān)文獻針對此問題進行了改進,例如,對灰色主成分分析法進行多態(tài)、多時刻的威脅評估[14],對TOPSIS 進行改進的多態(tài)融合直覺模糊威脅評估[15]等,上述對于非動態(tài)威脅評估方法的改進雖然達到了動態(tài)評估的基本要求,但是僅通過修改相關(guān)數(shù)學(xué)算法中的權(quán)值,或?qū)v史多時刻態(tài)勢量化為具體數(shù)值進行計算,會增加計算復(fù)雜度和數(shù)據(jù)處理難度。本文提出基于意圖識別[16-19]的空中群目標(biāo)動態(tài)威脅評估[20-22],利用智能化算法對傳統(tǒng)威脅評估方法進行改進,將意圖識別作為威脅評估的重要參考要素之一,利用動態(tài)態(tài)勢要素作為意圖識別的輸入。將獲取的態(tài)勢數(shù)據(jù)進行預(yù)處理,采用LSTM[23]對數(shù)據(jù)進行訓(xùn)練,并結(jié)合Attention[24-27]對提取到的特征進行權(quán)值分配,利用Softmax 進行意圖的分類識別,最后運用多層感知機(MLP)實現(xiàn)動態(tài)威脅評估。
將動態(tài)威脅評估分為意圖識別和威脅評估2 個模塊。首先需要進行態(tài)勢的提取,在復(fù)雜的戰(zhàn)場環(huán)境中需要對所得到的態(tài)勢進行分類并提取有用的信息作為威脅評估的重要態(tài)勢要素。
在意圖識別模塊中需要對相關(guān)群目標(biāo)進行連續(xù)時間的態(tài)勢提取,將歷史監(jiān)測的多時刻數(shù)據(jù)作為意圖識別的態(tài)勢輸入;威脅評估模塊是需要將當(dāng)前時刻的動態(tài)態(tài)勢要素、相關(guān)靜態(tài)態(tài)勢要素和意圖識別的輸出結(jié)果作為威脅評估的態(tài)勢輸入。具體流程如圖1所示。
圖1 結(jié)構(gòu)框架圖
在圖1 中,空中群目標(biāo)的意圖識別是通過提取多個歷史時刻的速度、高度、機動性等動態(tài)態(tài)勢要素的變化,將類型、干擾能力、打擊能力等作為靜態(tài)態(tài)勢要素。由于目標(biāo)的類型復(fù)雜、數(shù)量繁多,所以對于意圖識別模塊將采用分類識別方法,將不同類型的目標(biāo)分開進行意圖識別,這樣可以解決目標(biāo)識別不準(zhǔn)確的問題。因此將多個歷史時刻的態(tài)勢要素的變化作為意圖識別的輸入,利用意圖作為威脅評估的重要輸入,并將其和其他相關(guān)態(tài)勢要素相結(jié)合進行動態(tài)威脅評估。
目標(biāo)的意圖識別是在復(fù)雜的作戰(zhàn)環(huán)境下進行的,被識別的目標(biāo)在單一時刻的目標(biāo)信息往往是不準(zhǔn)確的,所以意圖識別需要依靠歷史多時刻的連續(xù)信息進行分析識別。因此在多時刻的態(tài)勢要素中,分析、推理、挖掘其中的意圖能夠有效地增加識別準(zhǔn)確率。在意圖識別中首先要構(gòu)建意圖空間,并將其作為意圖分類的標(biāo)準(zhǔn)。意圖空間如圖2所示。
圖2 意圖空間結(jié)構(gòu)圖
2.1.1 利用LSTM 進行意圖識別的原理
LSTM 是一種常用的門控循環(huán)網(wǎng)絡(luò),是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個變體。LSTM 中引入了3 個門。其結(jié)構(gòu)如圖3所示。
圖3 LSTM結(jié)構(gòu)圖
如圖3 所示,其中,xt是輸入單元,ct為記憶單元,ht為隱狀態(tài),ct與ht具有相同的形狀,其目的是為了記錄附加信息,為了控制記憶單元ct在LSTM中引入了3個門ft、it、ot。ft為遺忘門,其目的是為了控制上一時間中記憶單元ct是否傳入到下一時間中;it為輸入門,其目的是為了控制當(dāng)前時間內(nèi)的輸入如何更新到當(dāng)前時間的記憶單元中;ot為輸出單元,其目的是為了決定下一時間隱藏狀態(tài)的值。3 個門計算步驟和記憶單元、隱藏狀態(tài)更新機制如下所示,其中c?t是候選記憶單元。
其中,Wxi、Wxf、Wxo、Wxc、Whi、Whf、Who、Whc為權(quán)重參數(shù),bi、bf、bo、bc為偏置參數(shù),σ和tanh為激活函數(shù)。
2.1.2 注意力機制
注意力機制早在20 世紀(jì)90 年代就被提出過,在2014 年Mnih 等[26]提出了關(guān)于在視覺方面應(yīng)用注意力機制的想法,后來在2017 年Vaswani 等[27]提出在Transformer結(jié)構(gòu)中應(yīng)用,此后注意力機制在近些年開始深受深度學(xué)習(xí)領(lǐng)域?qū)W習(xí)者的關(guān)注。其結(jié)構(gòu)如圖4所示。
圖4 注意力機制運算框架圖
在圖4中,注意力機制的運算步驟為:
Step1利用LSTM網(wǎng)絡(luò)進行特征提取,將每個特征的中間隱藏狀態(tài)提取出來,以此來作為計算特征之間的相關(guān)性參數(shù),將提取的隱藏狀態(tài)向量設(shè)為H:
Step2利用深度神經(jīng)網(wǎng)絡(luò)來計算隱藏狀態(tài)之間的相關(guān)性,將相關(guān)性設(shè)為S:
Step3利用Softmax 對計算的相關(guān)性S進行歸一化處理,使得相關(guān)性參數(shù)的區(qū)間范圍落到[0,1]之間,得到每個特征被賦予的相關(guān)性權(quán)值:
Step4將得到的注意力權(quán)值s(i)加權(quán)給每個特征:
多層感知機MLP 是一種特殊的全連接神經(jīng)網(wǎng)絡(luò),它由輸入層、若干個隱藏層、輸出層構(gòu)成,它與神經(jīng)網(wǎng)絡(luò)的區(qū)別在于多了隱藏層,有了隱藏層可以提高神經(jīng)網(wǎng)絡(luò)的表達能力,更好地解決復(fù)雜的問題。其結(jié)構(gòu)如圖5所示。
圖5 單隱藏層感知機結(jié)構(gòu)圖
在圖5 中一共有3 層網(wǎng)絡(luò),其中x表示輸入節(jié)點、h表示隱藏節(jié)點、o表示輸出節(jié)點,共包含輸入層4 個節(jié)點、輸出層3 個節(jié)點、1 個隱藏層5 個節(jié)點。對單隱藏層的感知機的輸出O計算:
將式(11)和式(12)聯(lián)立得到:
需要在每個隱藏層后加入激活函數(shù)來達到非線性變換。本文采用sigmoid 激活函數(shù)來解決非線性問題,其計算方法如下:
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)與訓(xùn)練主要采取反向傳播(Back Propagation,BP)算法,其目的是為了通過反向傳播算法,對各個參數(shù)求偏導(dǎo),并利用損失函數(shù)來更新MLP中的相關(guān)參數(shù)。由于本文是通過對威脅度進行預(yù)測來實現(xiàn)威脅評估,所以采用均方差損失函數(shù):
其中,y?表示預(yù)測值,yi表示真實值,N代表批量大小。
威脅評估體系的設(shè)計是對目標(biāo)進行威脅評估的重要前提。本文選取意圖、速度、高度、機動性、目標(biāo)類型、干擾能力、打擊能力7 個威脅指標(biāo)作為威脅評估的輸入。對于MLP的相關(guān)參數(shù)設(shè)置如表1所示。
表1 MLP模型相關(guān)參數(shù)設(shè)置
表1 中,輸入層有7 個節(jié)點,隱藏層有5 層,分別是32、64、128、64、32個節(jié)點,輸出層為1個節(jié)點。
由于威脅評估指標(biāo)可以是定量的也可以是定性的,所以具有不同量綱和不同數(shù)量級會造成不同的結(jié)果,這會導(dǎo)致評估結(jié)果不準(zhǔn)確。所以在進行模型訓(xùn)練前,應(yīng)進行數(shù)據(jù)規(guī)范化處理,將其量化并映射到[0,1]區(qū)間。
1)意圖。
意圖作為威脅評估的重要因素,其包含了群目標(biāo)多時刻的歷史數(shù)據(jù),所以意圖對威脅評估起到了很重要的影響作用。在本文的意圖空間中共設(shè)置了5 個類型,其分別為攻擊、監(jiān)視、偵察、誘敵、撤退。其中攻擊具有較高的威脅而撤退具有較低的威脅;監(jiān)視的威脅程度要大于偵察;偵察是敵方獲取我方的情報,但監(jiān)視卻是帶有攻擊性的意圖;誘敵是敵方迷惑我方的手段,所以其威脅程度要小于偵察和監(jiān)視。意圖的量化值如表2所示。
表2 意圖量化值
2)速度。
在最后一刻,我看見了康美娜,她充滿了憐惜和愛意的目光讓我沉醉,在死神來臨的瞬間,我真實地擁有了母親的懷抱。
目標(biāo)的速度對于我方的雷達跟蹤和數(shù)據(jù)采集有較大的影響。如果敵方的速度過快會影響相關(guān)的數(shù)據(jù)參數(shù)的準(zhǔn)確性,并且目標(biāo)的靈活性也會增強。這導(dǎo)致我方不能實時跟蹤,所以目標(biāo)的威脅度會增加。目標(biāo)的速度威脅度量化值按照如下公式進行計算:
對于空中目標(biāo)速度一般選取單位為Ma。當(dāng)速度大于5 Ma 為超高音速飛行物,在1.2~5 Ma 為超音速飛行物。其中kv為增益系數(shù),一般選取-0.8 Ma-2。
3)高度。
目標(biāo)的飛行高度對我方的威脅程度影響不同,當(dāng)目標(biāo)的飛行高度較低時,對我方威脅度較大,相反高空飛行對我方威脅度較小。高度的量化值按照如下公式計算:
高度單位為km,其中hd為低空飛行參考指標(biāo),低空飛行指1 km 以下,所以hd取值為1 km。kh為衰減參數(shù),取值為1 km-2。
4)機動性。
目標(biāo)的機動性是指目標(biāo)的飛行狀態(tài),包括俯沖、盤旋、爬升和平穩(wěn)飛行。其中威脅度較高的是俯沖。對于飛行目標(biāo)是導(dǎo)彈一類的話,其俯沖狀態(tài)就代表要對我方目標(biāo)進行攻擊,并且其他飛行目標(biāo)在俯沖狀態(tài)下也具有攻擊性。相對來說平穩(wěn)飛行是威脅度最低的狀態(tài)。根據(jù)飛行狀態(tài)的不同威脅度也就不同。機動性的量化值如表3所示。
表3 機動性量化值
5)目標(biāo)類型。
表4 目標(biāo)類型量化值
6)干擾能力。
干擾能力是雷達等相關(guān)監(jiān)測設(shè)備對目標(biāo)進行偵察時的反應(yīng),干擾能力越強威脅度越高。干擾能力分為4 個等級:很強、較強、一般、弱,其威脅度依次降低。干擾能力的量化值如表5所示。
表5 干擾能力量化值
7)打擊能力。
打擊能力是目標(biāo)的攻擊能力。打擊能力越強,威脅度越高。打擊能力分為4 個等級:很強、較強、一般、弱,其威脅度依次降低。打擊能力的量化值如表6所示。
表6 打擊能力量化值
從對抗演習(xí)中,抽取不同意圖數(shù)據(jù)的時序序列作為模型的輸入,根據(jù)本文實驗要求只選取8 個態(tài)勢作為實驗特征,共有5760個數(shù)據(jù),包含3840個訓(xùn)練數(shù)據(jù)和1920 個測試數(shù)據(jù)。其中數(shù)據(jù)是分類別進行存放的,適用于意圖模型分類預(yù)測的要求,有利于減少數(shù)據(jù)處理難度。動態(tài)態(tài)勢要素包括:速度、高度、機動性,靜態(tài)態(tài)勢要素包括:目標(biāo)類型、干擾能力、打擊能力、意圖。相關(guān)數(shù)據(jù)參數(shù)設(shè)定如表7所示。
表7 數(shù)據(jù)參數(shù)設(shè)定
本文選擇4 個模型進行對比測試,分別為LSTM、LSTM-Attention、門控循環(huán)單元(GRU)、支持向量機(SVM)。進行模型訓(xùn)練和測試后分別得到損失函數(shù)對比,如圖6、圖7所示。
圖6 訓(xùn)練數(shù)據(jù)損失函數(shù)對比圖
圖7 測試數(shù)據(jù)損失函數(shù)對比圖
LSTM 和GRU 相對于SVM 在本文實驗中具有優(yōu)勢。由于本文實驗是基于歷史序列數(shù)據(jù)作為數(shù)據(jù)支持,并且LSTM 和GRU 都屬于門控循環(huán)神經(jīng)網(wǎng)絡(luò),通過門控單元能夠更好地捕捉時間序列中時間步較大的依賴關(guān)系,而SVM 缺少了對時間記憶控制的優(yōu)點,所以LSTM 和GRU 的實驗結(jié)果要優(yōu)于SVM。如圖所示在訓(xùn)練和測試中,意圖識別算法模型都表現(xiàn)出了不同的效果,但總體來看取得了不錯的訓(xùn)練效果,即識別精度隨迭代周期的增加而增加。從圖中可以看出加入注意力機制的LSTM 算法模型具有更好的識別準(zhǔn)確度、魯棒性和平穩(wěn)性,對于SVM 來說效果不是很好,其波動范圍較大。綜上所述,利用注意力機制可以更加準(zhǔn)確地分析特征的重要程度,提高識別精度。
在防空演習(xí)作戰(zhàn)中,有7 個敵方目標(biāo)出現(xiàn)在我方領(lǐng)空,并被我方雷達等傳感器跟蹤、記錄相關(guān)數(shù)據(jù),如表8 所示。根據(jù)專家意見和相關(guān)態(tài)勢要素隸屬度得到對應(yīng)的威脅度大小,利用表8 作為驗證數(shù)據(jù),用來衡量本文模型的好壞。利用2 個模型A 和B 進行測試,A 是包含意圖識別的模型,也就是本文所研究的模型,B 是不包含意圖識別的其他模型。將2 個模型的輸出結(jié)果與表8 中的威脅度作差值運算進行對比驗證,結(jié)果如圖8所示。
圖8 威脅評估威脅度差值對比圖
在圖8 中,模型A 和B 對于目標(biāo)3 的差值不同,其中B 相對于真實威脅度差值較高。由于目標(biāo)3 的真實威脅度值偏小,所以波動范圍對其影響較高,在未加入意圖時的模型B對于威脅度的預(yù)測偏高,其認為目標(biāo)對我方威脅較高。模型A加入了撤退意圖,通過意圖的加入降低了目標(biāo)3 的威脅度大小,使其輸出威脅等級更為準(zhǔn)確,如果沒有加入意圖進行判斷,會很難對其計算威脅度大小。
對于目標(biāo)1和目標(biāo)4,其類型是相同的,速度和高度的隸屬度也較相近,如果利用模型B進行威脅判斷的話很難區(qū)分2 個目標(biāo)的威脅度大小,在圖8 中模型B 的差值對于目標(biāo)1 和目標(biāo)4 的變化相近,但是通過加入意圖進行判斷,就可以分別提高和降低相關(guān)威脅度大小,圖中的模型A 相對于目標(biāo)1 和目標(biāo)4 的變化較為明顯。這說明通過加入意圖可以較為準(zhǔn)確地區(qū)分相近目標(biāo)的威脅等級。
綜上所屬,基于意圖識別的群目標(biāo)威脅評估方法相比較于未加入意圖的方法更為準(zhǔn)確。
本文提出了一種基于意圖識別的空中群目標(biāo)威脅評估方法。該方法利用意圖識別來融合歷史連續(xù)時刻的態(tài)勢要素,并將其作為威脅評估的重要影響因素,利用注意力機制解決了權(quán)重分配不均的問題,使得意圖識別結(jié)果更為準(zhǔn)確。通過意圖的輸入并結(jié)合其他態(tài)勢要素,利用多層感知機進行動態(tài)威脅評估。仿真實驗表明,本文所研究的方法既可以降低計算復(fù)雜度,也可以得到更準(zhǔn)確的評估結(jié)果。