張百川,畢文豪,張安,毛澤銘,楊咪
西北工業(yè)大學(xué) 航空學(xué)院,西安 710072
空戰(zhàn)中的軌跡預(yù)測(cè)是根據(jù)目標(biāo)飛行器的運(yùn)動(dòng)特性和歷史運(yùn)動(dòng)軌跡,對(duì)未來時(shí)刻飛行器可能到達(dá)的位置進(jìn)行合理計(jì)算的過程。在信息化戰(zhàn)場(chǎng)環(huán)境下的空戰(zhàn)中,準(zhǔn)確的軌跡預(yù)測(cè)結(jié)果能夠?yàn)閼?zhàn)術(shù)決策提供可靠的數(shù)據(jù)支撐。由包以德(Observation, Orientation, Decision and Action,OODA)循環(huán)理論可知,空戰(zhàn)中取得優(yōu)勢(shì)的關(guān)鍵在于比對(duì)手更快地形成連續(xù)的OODA 循環(huán)[1],從而達(dá)到“料敵于先,先發(fā)制人”的目的。優(yōu)秀的軌跡預(yù)測(cè)能力能夠使攻擊機(jī)更快地完成“觀察”過程,提前進(jìn)入“判斷”階段,在空戰(zhàn)中迅速建立優(yōu)勢(shì)。因此,研究目標(biāo)飛行器的軌跡預(yù)測(cè)算法對(duì)取得空中優(yōu)勢(shì)具有重要意義。
為了提高目標(biāo)飛行器的飛行軌跡預(yù)測(cè)精度,國(guó)內(nèi)外學(xué)者針對(duì)上述問題進(jìn)行了大量研究。一部分學(xué)者對(duì)軌跡預(yù)測(cè)算法進(jìn)行了深入優(yōu)化,其研究成果可大致分為2 類[2]。
第1 類是知識(shí)驅(qū)動(dòng)的預(yù)測(cè)算法,這類算法需要結(jié)合預(yù)測(cè)目標(biāo)的運(yùn)動(dòng)模型,對(duì)未來時(shí)刻目標(biāo)的運(yùn)動(dòng)狀態(tài)進(jìn)行最優(yōu)估計(jì),適用于有限維度的線性和非線性的目標(biāo)時(shí)空運(yùn)動(dòng)軌跡[3-5]。例如,文獻(xiàn)[6]針對(duì)長(zhǎng)時(shí)預(yù)測(cè)問題,提出了一種基于高斯混合模型(Gaussian Mixture Models,GMMs)的車輛軌跡預(yù)測(cè)算法。文獻(xiàn)[7]通過分析臨近空間高超聲速目標(biāo)的機(jī)動(dòng)特性,建立了參數(shù)化的目標(biāo)機(jī)動(dòng)模型,并基于機(jī)動(dòng)模型提出了可學(xué)習(xí)卡爾曼濾波軌跡預(yù)測(cè)方法。然而,上述知識(shí)驅(qū)動(dòng)的軌跡預(yù)測(cè)算法在實(shí)際應(yīng)用中仍存在一定的局限性。首先,目標(biāo)飛行器的動(dòng)力學(xué)方程或運(yùn)動(dòng)方程參數(shù)通常需要結(jié)合計(jì)算流體力學(xué)或風(fēng)洞實(shí)驗(yàn)獲得,而上述參數(shù)在實(shí)際的空戰(zhàn)場(chǎng)景中難以獲取。其次,機(jī)載雷達(dá)難以準(zhǔn)確地捕獲到目標(biāo)飛行器的姿態(tài)信息,在飛行器運(yùn)動(dòng)模型的基礎(chǔ)上所計(jì)算出的未來軌跡信息的可信度較低。
第2 類是以深度學(xué)習(xí)算法為代表的數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)算法研究[8-10]。這類算法擺脫了飛行器運(yùn)動(dòng)模型的局限,能夠結(jié)合大量歷史數(shù)據(jù)建立目標(biāo)機(jī)的軌跡預(yù)測(cè)模型。在更多情況下,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)及其衍生模型能夠更好地處理序列型預(yù)測(cè)任務(wù)。文獻(xiàn)[8]在戰(zhàn)場(chǎng)空間柵格中添加了模糊機(jī)制,并結(jié)合長(zhǎng)短時(shí)記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)提出了一種飛行器軌跡預(yù)測(cè)方法,一定程度上解決了柵格預(yù)測(cè)模式中邊界突變的問題,并同時(shí)對(duì)飛行器的運(yùn)動(dòng)模式加以考慮。文獻(xiàn)[9]將軌跡預(yù)測(cè)問題視為序列對(duì)序列的生成問題,通過結(jié)合RNN 和混合密度神經(jīng)網(wǎng)絡(luò)(Mixture Density Network,MDN)對(duì)駕駛員進(jìn)行分析,對(duì)未來時(shí)刻軌跡的概率分布進(jìn)行了計(jì)算。文獻(xiàn)[11]結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN) 與LSTM 網(wǎng)絡(luò)實(shí)現(xiàn)了民航飛行器的4-D 軌跡預(yù)測(cè)。盡管基于RNN 及其衍生模型的方法在軌跡預(yù)測(cè)任務(wù)中取得了較為優(yōu)秀的表現(xiàn),但依然存在計(jì)算資源消耗大、數(shù)據(jù)特征損耗嚴(yán)重等問題。除此之外,上述端到端(End To End)的方法由于過于依賴完備的數(shù)據(jù)集和訓(xùn)練技巧,難以應(yīng)對(duì)序列預(yù)測(cè)任務(wù)中的復(fù)雜多變的場(chǎng)景。
基于上述原因,另一部分學(xué)者將預(yù)測(cè)任務(wù)拆分成基準(zhǔn)值預(yù)測(cè)和誤差補(bǔ)償2 個(gè)階段。例如文獻(xiàn)[12]采用反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)對(duì)粒子群算法預(yù)測(cè)的原油價(jià)格進(jìn)行補(bǔ)償,文獻(xiàn)[13]采用基于門控循環(huán)單元(Gated Recurrent Unit,GRU)的誤差補(bǔ)償算法實(shí)現(xiàn)了對(duì)電網(wǎng)中短期電力負(fù)荷的預(yù)測(cè)。文獻(xiàn)[14]提出了一種以小波變換為基準(zhǔn),結(jié)合超限學(xué)習(xí)機(jī)誤差補(bǔ)償?shù)膬呻A段風(fēng)力預(yù)測(cè)方法。文獻(xiàn)[15]提出了一種改進(jìn)廣義誤差分布模型,用于計(jì)算風(fēng)電功率預(yù)測(cè)誤差,并通過序列化數(shù)據(jù)的分析,對(duì)誤差變化趨勢(shì)進(jìn)行描述。上述算法均將誤差補(bǔ)償問題作為序列型數(shù)據(jù)預(yù)測(cè)問題進(jìn)行處理,并利用數(shù)據(jù)驅(qū)動(dòng)的算法對(duì)誤差值進(jìn)行求解。然而隨著應(yīng)用場(chǎng)景逐漸復(fù)雜,模型輸入的序列數(shù)據(jù)維度日漸增大,現(xiàn)有的算法暴露出通用性差、特征提取能力弱、補(bǔ)償精度不足的問題。
Transformer 模型[16]以其強(qiáng)大的特征提取能力,自提出以來便在機(jī)器翻譯、閱讀理解、文本摘要等序列型數(shù)據(jù)場(chǎng)景中展現(xiàn)出了良好的應(yīng)用效果。國(guó)內(nèi)外學(xué)者也逐步探索Transformer 模型在序列數(shù)據(jù)預(yù)測(cè)方面的應(yīng)用,例如文獻(xiàn)[17]在提出了一種基于Transformer 模型的滾動(dòng)軸承剩余使用壽命預(yù)測(cè)方法,并在PHM2012 和XJTU-SY數(shù)據(jù)集上測(cè)試了其有效性。文獻(xiàn)[18]提出了一種LSTM-Transformer 結(jié)構(gòu)的洋流預(yù)測(cè)模型,并在NOAA 發(fā)布的洋流數(shù)據(jù)集中進(jìn)行了驗(yàn)證。文獻(xiàn)[19]將多衛(wèi)星任務(wù)規(guī)劃過程描述為序列生成任務(wù),并提出了基于Transformer 的任務(wù)初始方案規(guī)劃方法,并利用基于隨機(jī)爬山的約束修正算法對(duì)方案進(jìn)行優(yōu)化調(diào)整。
因此,本文在對(duì)現(xiàn)有的軌跡預(yù)測(cè)算法分析的基礎(chǔ)上,結(jié)合Transformer 中自注意力機(jī)制特征提取能力強(qiáng)、計(jì)算復(fù)雜度低的特點(diǎn),提出了一種基于Transformer 模型的預(yù)測(cè)誤差補(bǔ)償(Transformerbased Prediction Error Compensation,TFPEC)
方法,能夠針對(duì)現(xiàn)有的各類軌跡預(yù)測(cè)算法的預(yù)測(cè)結(jié)果,計(jì)算出相應(yīng)的補(bǔ)償值,以提高軌跡預(yù)測(cè)精度。本文的主要?jiǎng)?chuàng)新點(diǎn)包括:
1)基于Transformer 結(jié)構(gòu)建立了預(yù)測(cè)誤差補(bǔ)償模型。針對(duì)空戰(zhàn)環(huán)境中具有高機(jī)動(dòng)運(yùn)動(dòng)特性的目標(biāo)飛行器,結(jié)合現(xiàn)有的飛行器軌跡預(yù)測(cè)算法的特點(diǎn),建立預(yù)測(cè)誤差補(bǔ)償模型,以提高現(xiàn)有軌跡預(yù)測(cè)算法的預(yù)測(cè)精度。
2)提出了誤差補(bǔ)償系數(shù)計(jì)算方法。針對(duì)目標(biāo)飛行器的歷史軌跡序列,利用傅里葉變換求解其復(fù)指數(shù)形式的頻域表達(dá),對(duì)軌跡的高頻分量模值特性進(jìn)行分析,面向目標(biāo)飛行器的不同運(yùn)動(dòng)狀態(tài)計(jì)算誤差補(bǔ)償系數(shù),進(jìn)一步提高誤差補(bǔ)償方法的性能。
論文組織如下:第1 節(jié)構(gòu)建了目標(biāo)飛行器軌跡預(yù)測(cè)誤差補(bǔ)償問題的數(shù)學(xué)模型;第2 節(jié)設(shè)計(jì)了基于Transformer 的軌跡預(yù)測(cè)誤差補(bǔ)償方法;第3節(jié)在所提出的模型的基礎(chǔ)上給出了仿真結(jié)果對(duì)比和分析;第4 節(jié)為本文的總結(jié),并提出下一步的研究方向。
在空戰(zhàn)過程中,定義目標(biāo)飛行器在t時(shí)刻的軌跡序列為P(t),同時(shí)給定軌跡預(yù)測(cè)算法F(P(t)),求取預(yù)測(cè)誤差補(bǔ)償模型G(P(t);θf(wàn)),使軌跡預(yù)測(cè)點(diǎn)與誤差補(bǔ)償值的矢量和與目標(biāo)下一時(shí)刻真實(shí)位置的歐式距離最小,即滿足下述目標(biāo)
式中:θf(wàn)代表誤差補(bǔ)償模型的參數(shù)集合;σ(t+1)代表誤差補(bǔ)償系數(shù);p(t+1)代表目標(biāo)下一時(shí)刻的真實(shí)位置。定義為給定的軌跡預(yù)測(cè)算法所計(jì)算出的t+1 時(shí)刻目標(biāo)飛行器可能出現(xiàn)的位置基準(zhǔn)預(yù)測(cè)值;為t+1 時(shí)刻位置基準(zhǔn)預(yù)測(cè)值所對(duì)應(yīng)的誤差補(bǔ)償值,則目標(biāo)飛行器軌跡預(yù)測(cè)問題如圖1 所示。
圖1 軌跡預(yù)測(cè)誤差補(bǔ)償問題示意圖Fig. 1 Diagram of trajectory prediction error compensation problem
為便于后續(xù)研究,本文中對(duì)軌跡預(yù)測(cè)誤差補(bǔ)償問題進(jìn)行如下假設(shè):
1)目標(biāo)飛行器軌跡序列中僅包含位置和速度信息,而不包含姿態(tài)、推力等機(jī)載雷達(dá)無(wú)法獲取的信息。
2)所獲取的目標(biāo)飛行器軌跡為等間隔時(shí)間序列,且軌跡中間無(wú)丟拍、錯(cuò)拍等問題。
3)在針對(duì)目標(biāo)飛行器的預(yù)測(cè)過程中,不考慮飛行器與其所在集群中其他單位的交互。
1)p(t)=[x(t),y(t),z(t)]T代表目標(biāo)飛行器在t時(shí)刻北天東坐標(biāo)系Oxyz下的位置。
3)P(t)=<t,p(t),v(t)>代表目標(biāo)飛行器在空戰(zhàn)過程中t時(shí)刻的軌跡點(diǎn)。
7)θf(wàn)={θTF,θMLP,θFFT}代表軌跡預(yù)測(cè)算法F(P(t))所對(duì)應(yīng)的誤差補(bǔ)償模型的參數(shù)集合,其中θTF、θMLP和θFFT分別代表誤差補(bǔ)償模型中Transformer 參數(shù)、多層感知機(jī)(Multiple Layer Perceptron,MLP)參數(shù)以及誤差補(bǔ)償系數(shù)相關(guān)參數(shù)。
8)Δt代表輸入序列的采樣間隔,δ代表預(yù)測(cè)步長(zhǎng)。代表預(yù)測(cè)的飛行器下一時(shí)刻位置。
本文基于Transformer 模型和離散傅里葉級(jí)數(shù)設(shè)計(jì)了軌跡預(yù)測(cè)誤差補(bǔ)償方法,首先對(duì)軌跡序列進(jìn)行塊分割處理,其次利用Transformer編碼器捕獲序列特征,然后引入MLP 結(jié)構(gòu)計(jì)算誤差補(bǔ)償值,最后根據(jù)軌跡序列頻域上的模值特性來計(jì)算誤差補(bǔ)償系數(shù)。基于Transformer模型的預(yù)測(cè)誤差補(bǔ)償方法的具體計(jì)算步驟如圖2 所示。
圖2 基于Transformer模型的預(yù)測(cè)誤差補(bǔ)償方法示意圖Fig. 2 Diagram of Transformer-based prediction error compensation method
步驟1給定軌跡預(yù)測(cè)算法以及預(yù)測(cè)時(shí)間間隔,并輸入指定長(zhǎng)度的目標(biāo)飛行器軌跡序列,計(jì)算目標(biāo)飛行器下一時(shí)刻的軌跡的基準(zhǔn)預(yù)測(cè)值。
步驟2基于Transformer 的誤差補(bǔ)償模型對(duì)軌跡預(yù)測(cè)算法可能產(chǎn)生的誤差進(jìn)行計(jì)算,得到基準(zhǔn)預(yù)測(cè)值的誤差補(bǔ)償值。
步驟3針對(duì)飛行器軌跡序列的傅里葉級(jí)數(shù)的模值特性進(jìn)行研究,求解誤差補(bǔ)償系數(shù),以修正飛行器在平穩(wěn)機(jī)動(dòng)的過程中所產(chǎn)生的誤差補(bǔ)償過剩的問題。
步驟4綜合計(jì)算基準(zhǔn)預(yù)測(cè)值、誤差補(bǔ)償值以及誤差補(bǔ)償系數(shù),輸出目標(biāo)飛行器下一時(shí)刻可能出現(xiàn)的位置的預(yù)測(cè)結(jié)果。
本文選取Transformer 模型作為目標(biāo)飛行器的歷史軌跡特征提取器。該模型具有前向傳播速度快、結(jié)構(gòu)復(fù)雜度低、特征提取效率高的特點(diǎn),在自然語(yǔ)言等序列型數(shù)據(jù)處理任務(wù)中取得了良好的效果。放縮點(diǎn)積注意力[16]是構(gòu)建Transformer 模型的基礎(chǔ),其計(jì)算公式為
式中:Q代表查詢(Query)矩陣;K代表鍵值(Key)矩陣;V代表值(Value)矩陣;dk代表矩陣Q與K的維度,用于控制點(diǎn)積值的范圍。進(jìn)一步地,由多組放縮點(diǎn)積注意力機(jī)制所組成的多頭注意力機(jī)制如圖3 所示。
圖3 多頭注意力機(jī)制示意圖Fig. 3 Diagram of multi-head attention mechanism
在多頭注意力機(jī)制中,h組不同的Query、Key 和Value 矩陣被分別計(jì)算放縮點(diǎn)積注意力(Scaled Dot-Product Attention)后,通過矩陣拼接和線性變換獲得最終的輸出。每一組矩陣所關(guān)注的軌跡塊均有所不同,通過多次的注意力處理,能夠?qū)崿F(xiàn)對(duì)P(t)的特征提取和表達(dá)。在計(jì)算過程中,第i個(gè)注意力頭headi可表示為
式中:Qi、Ki和Vi分別代表注意力頭headi所對(duì)應(yīng)的Query、Key 和Value 矩陣。則多頭注意力機(jī)制可表示為
式中:WO代表線性變換系數(shù)矩陣。
Transformer 模型是在多頭注意力的基礎(chǔ)上添加了求和、歸一化、多層感知機(jī)等結(jié)構(gòu),如圖4所示。該結(jié)構(gòu)的編碼器由N層網(wǎng)絡(luò)堆疊而成,每層網(wǎng)絡(luò)包含編碼器與解碼器結(jié)構(gòu)。其中編碼器中包含有多頭注意力機(jī)制和前饋神經(jīng)網(wǎng)絡(luò)2 個(gè)子層,而解碼器中的每一層包含帶遮罩的多頭注意力機(jī)制、編碼-解碼多頭注意力機(jī)制和前饋神經(jīng)網(wǎng)絡(luò)。
圖4 Transformer 模型結(jié)構(gòu)示意圖Fig. 4 Structure diagram of Transformer model
編碼器的輸入嵌入為軌跡序列經(jīng)過塊分割處理后的輸入矩陣I(t),而解碼器的輸出嵌入為軌跡預(yù)測(cè)算法輸出與目標(biāo)下一時(shí)刻真實(shí)位置p(t+1)的矢量差。該模型的優(yōu)勢(shì)在于能夠最大限度地減少對(duì)于外部信息的依賴,將算力聚焦于序列數(shù)據(jù)自身的關(guān)聯(lián)信息中。
本文所提出的預(yù)測(cè)誤差補(bǔ)償模型在Transformer 模型的基礎(chǔ)上進(jìn)行設(shè)計(jì),主要包括軌跡序列的塊分割、Transformer 模型特征提取、多層感知機(jī)回歸等步驟,結(jié)構(gòu)框圖如圖5 所示。
圖5 軌跡預(yù)測(cè)誤差補(bǔ)償模型結(jié)構(gòu)圖Fig. 5 Structural diagram of trajectory prediction error compensation model
預(yù)測(cè)誤差補(bǔ)償模型首先對(duì)態(tài)勢(shì)序列P(t)中的每一幀軌跡進(jìn)行塊分割處理后,變換成Transformer 編碼器的輸入矩陣I(t),具體表示為
式中:δ表示預(yù)測(cè)步長(zhǎng)。
輸入矩陣I(t)被傳入至Transformer 編碼器中,設(shè)定矩陣通道數(shù)為1,寬和高分別為1 和9。編碼器中共有12 個(gè)注意力頭,能夠?qū)π蛄兄械膲K特征進(jìn)行有效提取,其結(jié)果被6 層全連接神經(jīng)網(wǎng)絡(luò)所構(gòu)成的多層感知機(jī)所處理。多層感知機(jī)為3輸出神經(jīng)網(wǎng)絡(luò),分別對(duì)應(yīng)Oxyz坐標(biāo)系下3 個(gè)分方向歸一化后的補(bǔ)償值,即
多層感知機(jī)的輸出為歸一化后3 個(gè)方向的補(bǔ)償值,其實(shí)際誤差補(bǔ)償值的求取方法為
式中:ct代表目標(biāo)飛行器所在位置的聲速。
在對(duì)目標(biāo)飛行器的軌跡預(yù)測(cè)過程中,大過載機(jī)動(dòng)通常會(huì)帶來更大的基準(zhǔn)預(yù)測(cè)值誤差。同理,在目標(biāo)飛行器處于平穩(wěn)飛行的階段,基準(zhǔn)預(yù)測(cè)值則更為準(zhǔn)確,甚至幾乎沒有誤差。因此,在對(duì)基準(zhǔn)預(yù)測(cè)值可能產(chǎn)生的誤差補(bǔ)償過程中,需要根據(jù)目標(biāo)飛行器的機(jī)動(dòng)狀態(tài),對(duì)誤差補(bǔ)償值進(jìn)行動(dòng)態(tài)調(diào)整。本文在目標(biāo)飛行器的位置序列的基礎(chǔ)上,提出頻域空間下誤差補(bǔ)償系數(shù)計(jì)算方法,以區(qū)分大過載機(jī)動(dòng)階段與平穩(wěn)飛行階段,進(jìn)一步提升目標(biāo)飛行器軌跡預(yù)測(cè)誤差補(bǔ)償精度。
目標(biāo)飛行器的軌跡序列能夠通過離散傅里葉變換(Discrete Fourier Transform,DFT)方法,從時(shí)域表達(dá)轉(zhuǎn)換為復(fù)指數(shù)形式的頻域表達(dá)??紤]到DFT 的實(shí)時(shí)性限制,本文選用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)方法求取飛行器軌跡序列的頻域表達(dá)形式。針對(duì)t時(shí)刻目標(biāo)飛行器在Oxyz坐標(biāo)系下3 個(gè)分方向的位置序列,其中ξ∈{x,y,z},通過FFT 處理,其在頻域空間上的復(fù)指數(shù)形式可表示為
由于FFT 的結(jié)果具有對(duì)稱性,式(10)中僅取結(jié)果的前半部分進(jìn)行計(jì)算。在最大模值的基礎(chǔ)上,誤差補(bǔ)償系數(shù)σ(t+1)的計(jì)算方法可表示為
式中:η代表放縮系數(shù)。式(11)可以求取t時(shí)刻下所有分方向位置序列中頻率大于κ的分量的最大模值,并通過線性放縮獲得誤差補(bǔ)償系數(shù)σ(t)。誤差補(bǔ)償后的軌跡預(yù)測(cè)值可表示為
為驗(yàn)證所提出的軌跡預(yù)測(cè)誤差算法的有效性和先進(jìn)性,本文采用飛行員在模擬器上一對(duì)一格斗所產(chǎn)生的數(shù)據(jù)集上對(duì)算法進(jìn)行測(cè)試??諔?zhàn)數(shù)據(jù)集由2 種類型的數(shù)據(jù)組成:低速數(shù)據(jù)集(數(shù)據(jù)集編號(hào)Ⅰ)和高速數(shù)據(jù)集(數(shù)據(jù)集編號(hào)Ⅱ),其詳細(xì)信息如表1 所示。
表1 空戰(zhàn)數(shù)據(jù)集信息Table 1 Information of air combat dataset
試驗(yàn)所采用的2 種數(shù)據(jù)集分別由2 種不同型號(hào)的飛行器所生成,其中低速數(shù)據(jù)集對(duì)應(yīng)螺旋槳式飛行器,而高速數(shù)據(jù)集對(duì)應(yīng)噴氣式飛行器。實(shí)驗(yàn)計(jì)算機(jī)的配置為 Intel i7-9700F CPU,NVIDIA RTX 2070S GPU,32 GB 運(yùn)行內(nèi)存。仿真試驗(yàn)的系統(tǒng)環(huán)境為Windows 10,利用Python 語(yǔ)言在Pytorch 框架下實(shí)現(xiàn)。
試驗(yàn)過程中,設(shè)置預(yù)測(cè)所用軌跡序列長(zhǎng)度Ts=128,采樣間隔Δt=100 ms,目標(biāo)飛行器所在位置聲速ct≡340 m/s,誤差補(bǔ)償系數(shù)頻率閾值κ=1 Hz,放縮系數(shù)η=0.02。模型訓(xùn)練過程中選取L2 損失函數(shù)和Adam 優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001。試驗(yàn)中用于模型訓(xùn)練(包括軌跡預(yù)測(cè)模型及誤差補(bǔ)償模型)的數(shù)據(jù)占比85%,驗(yàn)證數(shù)據(jù)占比10%,測(cè)試數(shù)據(jù)占比5%。由于本文重點(diǎn)研究飛行器軌跡預(yù)測(cè)誤差補(bǔ)償方法,除3.1 節(jié)外均采用勻加速(Constant Acceleration,CA)運(yùn)動(dòng)模型作為基準(zhǔn)預(yù)測(cè)值生成策略,即
為更客觀地驗(yàn)證本文所提出的TFPEC 方法的通用性,本節(jié)中選用不同飛行器軌跡預(yù)測(cè)算法作為基準(zhǔn)預(yù)測(cè)值生成策略,分別對(duì)不同數(shù)據(jù)集下不同預(yù)測(cè)步長(zhǎng)的場(chǎng)景進(jìn)行測(cè)試。所選用的軌跡預(yù)測(cè)算法包括基于CA 運(yùn)動(dòng)模型的預(yù)測(cè)算法(Constant Acceleration Prediction Method CAPM)、基于卡爾曼濾波的軌跡預(yù)測(cè)(Kalman Filter-based Trajectory Prediction,KFTP)算法[20]、基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的戰(zhàn)場(chǎng)目標(biāo)軌跡預(yù)測(cè)(Prediction of Battle Target Trajectory based on LSTM,PBTT-LSTM)算法[21]以及輸出-輸入反饋艾爾曼(Output-Input Feedback Elman,OIF-Elman)網(wǎng)絡(luò)預(yù)測(cè)算法[22],結(jié)果如表2 所示。表中預(yù)測(cè)精度提升百分比指引入誤差補(bǔ)償模型后,預(yù)測(cè)結(jié)果降低的平均絕對(duì)誤差(Mean Absolute Error,MAE)與基準(zhǔn)預(yù)測(cè)值MAE 的比值。
表2 基于Transformer 模型的預(yù)測(cè)誤差補(bǔ)償方法性能總體評(píng)估Table 2 Overall evaluation of performance of Transformer-based prediction error compensation method
對(duì)表2 進(jìn)行分析,可得到如下結(jié)論:
1)從基準(zhǔn)預(yù)測(cè)值和誤差補(bǔ)償后結(jié)果的比較中可以得出,本文所提出的誤差補(bǔ)償模型能夠有效地提升各類軌跡預(yù)測(cè)算法的預(yù)測(cè)精度,且能夠應(yīng)用于不同飛行速度、不同預(yù)測(cè)步長(zhǎng)的場(chǎng)景中。
2)通過分析不同預(yù)測(cè)步長(zhǎng)的結(jié)果可以得出,誤差補(bǔ)償模型的作用效果隨著預(yù)測(cè)步長(zhǎng)的增大而增加,其中對(duì)OIF-Elman 軌跡預(yù)測(cè)算法在預(yù)測(cè)步長(zhǎng)為5 000 ms 時(shí)的作用效果最為明顯,在數(shù)據(jù)集Ⅱ中的預(yù)測(cè)精度提升46.061 1%。
3)通過分析運(yùn)行時(shí)間增加的毫秒數(shù)可以得出,軌跡預(yù)測(cè)過程在引入誤差補(bǔ)償模型后,平均運(yùn)行時(shí)間增加了8.731 7 ms。 其中PBTTLSTM 軌跡預(yù)測(cè)算法對(duì)應(yīng)的軌跡預(yù)測(cè)過程平均耗時(shí)最久,為10.235 7 ms。因此,在引入誤差補(bǔ)償模型后,針對(duì)目標(biāo)軌跡預(yù)測(cè)的頻率仍然能夠在50 Hz 以上。
為測(cè)試本文所提TFPEC 方法的性能,本節(jié)中選取若干已有的誤差補(bǔ)償算法作為比較對(duì)象,測(cè)試對(duì)比的誤差補(bǔ)償算法包括文獻(xiàn)[12]中所述的BPNN 算法以及文獻(xiàn)[13]中所述的基于GRU的誤差補(bǔ)償算法,并記錄其平均絕對(duì)誤差、精度提升百分比以及運(yùn)行時(shí)間,對(duì)比結(jié)果如表3 所示。
表3 誤差補(bǔ)償方法性能對(duì)比Table 3 Comparison of performance of error compensation methods
表3 中的所有數(shù)據(jù)均采用CAPM 作為基準(zhǔn)預(yù)測(cè)值生成策略,對(duì)其進(jìn)行分析可得出以下結(jié)論:
1)3 種誤差補(bǔ)償方法運(yùn)行所消耗的時(shí)間較為接近,其中BPNN 方法平均消耗時(shí)間最短,為4.684 1 ms,而本文所提出的TFPEC 方法平均消耗時(shí)間最長(zhǎng),為9.039 4 ms。
2)在本文所涉及的2 類軌跡數(shù)據(jù)集中的5 種不同的預(yù)測(cè)步長(zhǎng)下,3 種方法的引入均能有效提高軌跡預(yù)測(cè)結(jié)果的精度。在高速數(shù)據(jù)集中5 000 ms步長(zhǎng)的預(yù)測(cè)任務(wù)中,TFPEC 方法能夠?qū)㈩A(yù)測(cè)精度提升43.004 2%,遠(yuǎn)高于BPNN 和GRU 誤差補(bǔ)償算法。
3)本文所提出的TFPEC 方法能夠在消耗時(shí)間可控的前提下,顯著提高目標(biāo)飛行器軌跡預(yù)測(cè)結(jié)果的精度。
為驗(yàn)證所提出的誤差補(bǔ)償系數(shù)的有效性和必要性,本節(jié)中首先對(duì)不同誤差補(bǔ)償系數(shù)下的預(yù)測(cè)結(jié)果MAE 進(jìn)行測(cè)試,其結(jié)果如圖6所示。
圖6 各誤差補(bǔ)償系數(shù)下的預(yù)測(cè)結(jié)果MAEFig. 6 Mean absolute error of prediction result for each error compensation coefficient
由圖6 可以看出,由Transformer 模型直接計(jì)算得出的誤差補(bǔ)償值并不能取得最優(yōu)補(bǔ)償效果。因此,需要在TFPEC 方法中引入動(dòng)態(tài)誤差補(bǔ)償系數(shù),以提高目標(biāo)飛行器軌跡預(yù)測(cè)誤差補(bǔ)償?shù)男Ч?/p>
為進(jìn)一步驗(yàn)證本文提出的誤差補(bǔ)償系數(shù)計(jì)算方法的合理性,在高速數(shù)據(jù)集中取100 s軌跡,繪制預(yù)測(cè)步長(zhǎng)為5 000 ms 時(shí)未引入誤差補(bǔ)償系數(shù)時(shí)的MAE,以及其對(duì)應(yīng)軌跡點(diǎn)頻域上>1 Hz 的各個(gè)分量的最大模值,如圖7 所示。圖中,實(shí)線為未引入TFPEC 方法時(shí)的MAE 變化曲線,而虛線為模值變化曲線。對(duì)2 條曲線進(jìn)行相關(guān)性計(jì)算,其Pearson 相關(guān)系數(shù)為0.198 421,Spearman 相關(guān)系數(shù)為0.172 85。因此可以認(rèn)為,軌跡預(yù)測(cè)的MAE 精度與軌跡頻域上的最大模值具有一定程度的相關(guān)性,利用軌跡頻域的最大模值求取出的誤差補(bǔ)償系數(shù)能夠幫助算法進(jìn)一步地提高精度。
圖7 預(yù)測(cè)誤差與軌跡高頻分量最大模值曲線圖Fig. 7 Curves of prediction error and trajectory highfrequency component maximum modulus
頻率閾值κ也顯著地影響著TFPEC 方法的補(bǔ)償效果。為驗(yàn)證本文所提方法中閾值選取的必要性和最優(yōu)性,對(duì)不同頻率閾值條件下的TFPEC方法所獲得的軌跡預(yù)測(cè)值MAE 進(jìn)行測(cè)試,結(jié)果如表4 所示。由表中數(shù)據(jù)可知,在頻率閾值κ=1 Hz時(shí),TFPEC 方法能夠獲得最優(yōu)軌跡的補(bǔ)償效果。
表4 各頻率閾值下的預(yù)測(cè)結(jié)果MAETable 4 MAE of prediction result for each frequency threshold
本節(jié)試驗(yàn)中,分別在數(shù)據(jù)集Ⅰ和數(shù)據(jù)集Ⅱ上,利用CAPM 基準(zhǔn)預(yù)測(cè)值生成方法,在預(yù)測(cè)步長(zhǎng)為1 000 ms、2 000 ms、3 000 ms、4 000 ms、5 000 ms 的場(chǎng)景下進(jìn)行仿真,并繪制預(yù)測(cè)結(jié)果,如圖8~圖11 所示。
圖8 數(shù)據(jù)集I 預(yù)測(cè)結(jié)果三維示意圖Fig. 8 3D schematic diagram of prediction results of dataset I
圖9 數(shù)據(jù)集Ⅱ預(yù)測(cè)結(jié)果三維示意圖Fig. 9 3D schematic diagram of prediction results of dataset Ⅱ
CAPM 基準(zhǔn)預(yù)測(cè)值生成方法的特點(diǎn)是:飛行器在平穩(wěn)機(jī)動(dòng)時(shí)能夠獲得較為準(zhǔn)確的預(yù)測(cè)值,而在大過載機(jī)動(dòng)時(shí)則會(huì)出現(xiàn)預(yù)測(cè)誤差較大的情況。由圖10、圖11 可知,TFPEC 方法能夠維持CAPM 方法在目標(biāo)飛行器平穩(wěn)機(jī)動(dòng)時(shí)的預(yù)測(cè)準(zhǔn)確性,同時(shí)顯著降低在大過載機(jī)動(dòng)時(shí)的預(yù)測(cè)誤差。這是由于動(dòng)態(tài)誤差補(bǔ)償系數(shù)的引入,能夠在平穩(wěn)機(jī)動(dòng)時(shí)對(duì)過大的誤差補(bǔ)償值進(jìn)行抑制,優(yōu)化了TFPEC 方法的性能。因此,本文所提TFPEC 方法能夠廣泛適用于多種運(yùn)動(dòng)特性的目標(biāo)飛行器,且均能取得較好的預(yù)測(cè)效果。
圖10 數(shù)據(jù)集Ⅰ預(yù)測(cè)結(jié)果二維示意圖Fig. 10 2D schematic diagram of prediction results of dataset I
圖11 數(shù)據(jù)集Ⅱ預(yù)測(cè)結(jié)果二維示意圖Fig. 11 2D schematic diagram of prediction results of dataset Ⅱ
本文針對(duì)空戰(zhàn)環(huán)境中的軌跡預(yù)測(cè)問題,提出了一種基于Transformer 模型的預(yù)測(cè)誤差補(bǔ)償方法。首先將飛行器的歷史軌跡序列進(jìn)行塊分割處理,然后基于Transformer 設(shè)計(jì)了誤差補(bǔ)償模型,最后根據(jù)求取的誤差補(bǔ)償值特點(diǎn),提出了誤差補(bǔ)償系數(shù)計(jì)算方法。通過實(shí)驗(yàn)驗(yàn)證得出以下結(jié)論:
1)相較于其他誤差補(bǔ)償方法,自注意力機(jī)制的引入使TFPEC 方法具有更高效的軌跡特征提取能力,與基于BPNN 和GRU 的方法相比,能夠在消耗時(shí)間可控的條件下獲得更為可信的軌跡預(yù)測(cè)誤差補(bǔ)償值。
2)目標(biāo)飛行器歷史軌跡序列中,頻率>1 Hz 的高頻分量最大模值與預(yù)測(cè)誤差值具有相關(guān)性。本文所提出的基于傅里葉變換的動(dòng)態(tài)誤差補(bǔ)償系數(shù)能夠一定程度上描述目標(biāo)飛行器的機(jī)動(dòng)特性,從而進(jìn)一步提升軌跡預(yù)測(cè)誤差補(bǔ)償?shù)臏?zhǔn)確性。
3)本文所提出的TFPEC 方法具有較強(qiáng)的通用性,能夠針對(duì)各類軌跡預(yù)測(cè)算法的誤差進(jìn)行有效修正。實(shí)驗(yàn)證明,在引入TFPEC 方法后,預(yù)測(cè)結(jié)果的精度相比原有算法至少提高了4.923 7%。在預(yù)測(cè)步長(zhǎng)為5 000 ms 的高速數(shù)據(jù)集中,在OIFElman 預(yù)測(cè)算法的基礎(chǔ)上,TFPEC 方法的引入能使預(yù)測(cè)結(jié)果精度提高至46.061 1%。
隨著無(wú)人機(jī)技術(shù)的不斷發(fā)展,其高性能、大過載的特點(diǎn)將對(duì)現(xiàn)有方法的準(zhǔn)確性和泛化性帶來更大的挑戰(zhàn)。在接下來的工作中,需要結(jié)合作戰(zhàn)樣式、空戰(zhàn)戰(zhàn)術(shù)決策等相關(guān)理論進(jìn)行研究,以縮小軌跡預(yù)測(cè)的解空間的方式,進(jìn)一步提高預(yù)測(cè)結(jié)果的精度和可信性。