任濟(jì)寰, 吳祥, 薄煜明, 吳盤(pán)龍, 何山
(南京理工大學(xué) 自動(dòng)化學(xué)院, 江蘇 南京 210094)
根據(jù)己方的觀測(cè)數(shù)據(jù)進(jìn)行彈道軌跡預(yù)測(cè),是提升現(xiàn)代陸軍反應(yīng)速度和打擊精度的重要手段。在陸軍的進(jìn)攻及防御反制措施中,對(duì)來(lái)襲彈進(jìn)行攔截時(shí),要求對(duì)彈道軌跡進(jìn)行精準(zhǔn)且高效的預(yù)測(cè)。
現(xiàn)役火控系統(tǒng)對(duì)彈道預(yù)測(cè)主要采用解算時(shí)間較短的射表函數(shù)逼近方法,通過(guò)建立運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)模型,利用函數(shù)逼近法等進(jìn)行軌跡預(yù)報(bào)[1]。該方法設(shè)計(jì)過(guò)程繁瑣、精度有限,且不同彈種的具體彈道和修正量需要分別解算,不利于火控系統(tǒng)的通用性發(fā)展[2]。為克服上述問(wèn)題,基于數(shù)值積分法求解彈道微分方程組的方法被逐漸應(yīng)用起來(lái)。該方法利用雷達(dá)獲得來(lái)襲彈現(xiàn)在點(diǎn)位置、速度矢量及彈道參數(shù),通過(guò)彈道解算來(lái)確定炮彈的未來(lái)運(yùn)動(dòng)軌跡[3]。彈道方程預(yù)測(cè)法雖然通用性較好,但需要多次彈道迭代才能得到較高精度的結(jié)果,實(shí)時(shí)性不強(qiáng)。
除以上彈道軌跡預(yù)測(cè)方法外,考慮到彈道軌跡是時(shí)序數(shù)據(jù),可采用時(shí)序預(yù)測(cè)的方法對(duì)雷達(dá)采樣數(shù)據(jù)進(jìn)行處理、分析并進(jìn)行預(yù)測(cè)。近年來(lái),在機(jī)器學(xué)習(xí)領(lǐng)域涌現(xiàn)了一批優(yōu)秀的時(shí)序預(yù)測(cè)方法,其中包括經(jīng)典結(jié)合隨機(jī)過(guò)程的高斯過(guò)程回歸(GPR)[4-6]及高斯混合模型(GMM)[7]??紤]到彈道軌跡是一段復(fù)雜的非線性曲線,可將炮彈的軌跡視為一個(gè)隨機(jī)過(guò)程,而隨機(jī)過(guò)程可以表達(dá)為基于某一核函數(shù)的高斯過(guò)程(GP)。GP作為一個(gè)特殊的隨機(jī)過(guò)程,它結(jié)合了貝葉斯后驗(yàn)概率和核方法,提供了一個(gè)有效的概率方法用于回歸問(wèn)題。當(dāng)GP用于處理回歸問(wèn)題時(shí),被稱為GPR,而GMM使用不同類型的核函數(shù)分別做GPR建模,最后對(duì)各自輸出結(jié)果進(jìn)行加權(quán)線性組合,進(jìn)一步提高了預(yù)測(cè)精度。GMM預(yù)測(cè)法中,核函數(shù)直接決定了GPR的預(yù)測(cè)精度,它用于捕捉不同輸入點(diǎn)之間的關(guān)系,從輸入的訓(xùn)練數(shù)據(jù)預(yù)測(cè)未知點(diǎn)的值。文獻(xiàn)[8]使用GMM,通過(guò)所收集的傳感器數(shù)據(jù)和操作監(jiān)控信息對(duì)復(fù)雜工業(yè)系統(tǒng)組件的剩余壽命進(jìn)行預(yù)測(cè)。文獻(xiàn)[9]利用GMM預(yù)測(cè)新冠疫情在全球的預(yù)期病例、死亡總數(shù)、結(jié)束日期。GMM具有容易實(shí)現(xiàn)、超參數(shù)自適應(yīng)獲取的優(yōu)點(diǎn),但其存在因?yàn)榉菂?shù)性質(zhì)導(dǎo)致計(jì)算量大的問(wèn)題,在面對(duì)大數(shù)據(jù)集時(shí)存在應(yīng)用瓶頸[10]。
近年來(lái),受人腦工作原理啟發(fā)而設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)迅猛發(fā)展,其旨在模擬人腦的學(xué)習(xí)過(guò)程,實(shí)現(xiàn)對(duì)信息的智能處理及進(jìn)一步?jīng)Q策。時(shí)序預(yù)測(cè)是神經(jīng)網(wǎng)絡(luò)研究的一個(gè)重要領(lǐng)域,在處理時(shí)序信息的過(guò)程中,記憶是學(xué)習(xí)的核心環(huán)節(jié)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)[11]主要具有空間記憶能力。文獻(xiàn)[12]使用CNN對(duì)飛機(jī)的三維飛行軌跡進(jìn)行預(yù)測(cè),但受限于CNN有限的時(shí)序記憶能力,只能將飛行軌跡拆為3個(gè)坐標(biāo)軸上的分量分別預(yù)測(cè),其應(yīng)用前景有限。
為更好地形成時(shí)空記憶,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[13]通過(guò)隱狀態(tài)傳遞時(shí)序信息。RNN中每個(gè)隱狀態(tài)都會(huì)在下一時(shí)刻被更新,對(duì)短期內(nèi)的信息更為敏感。在一些復(fù)雜場(chǎng)景,如軍用、戰(zhàn)場(chǎng)等環(huán)境中,往往需要處理較大規(guī)模的時(shí)序數(shù)據(jù),要求神經(jīng)網(wǎng)絡(luò)必須具備長(zhǎng)期記憶能力,RNN就顯得力不從心。同時(shí),RNN還存在難以訓(xùn)練、收斂速度緩慢,并時(shí)常伴有致命的梯度消失與梯度爆炸等問(wèn)題。長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)[14-16]克服了傳統(tǒng)RNN網(wǎng)絡(luò)存在的大部分問(wèn)題,能夠從時(shí)空特征中提取出有效的信息。文獻(xiàn)[17]提出使用LSTM網(wǎng)絡(luò)對(duì)戰(zhàn)場(chǎng)目標(biāo)進(jìn)行建模,通過(guò)對(duì)其軌跡的預(yù)測(cè)來(lái)感知和預(yù)測(cè)戰(zhàn)場(chǎng)態(tài)勢(shì),體現(xiàn)出了LSTM網(wǎng)絡(luò)在時(shí)序數(shù)據(jù)處理領(lǐng)域的優(yōu)勢(shì)。但目前將LSTM網(wǎng)絡(luò)用于炮彈軌跡預(yù)測(cè)在國(guó)內(nèi)外公開(kāi)發(fā)表的文獻(xiàn)中未見(jiàn)報(bào)道。
針對(duì)彈道軌跡預(yù)測(cè)問(wèn)題,本文提出了上下文增強(qiáng)的長(zhǎng)短期記憶(CE-LSTM)網(wǎng)絡(luò),進(jìn)一步加強(qiáng)短期時(shí)序特征之間的關(guān)聯(lián)性,以模擬炮彈在飛行過(guò)程中的運(yùn)動(dòng)狀態(tài)。用實(shí)際彈丸參數(shù)建立包含13 500條不同口徑及氣象條件的彈道軌跡樣本數(shù)據(jù)集,以保證仿真結(jié)果的真實(shí)性。利用數(shù)據(jù)集中樣本的最后20 s軌跡的空間坐標(biāo),對(duì)CE-LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練、驗(yàn)證及測(cè)試。通過(guò)對(duì)比外彈道數(shù)值解法及GMM等方法,表明CE-LSTM網(wǎng)絡(luò)在有效保證實(shí)時(shí)性的同時(shí)提高了預(yù)測(cè)精度。
LSTM網(wǎng)絡(luò)是一種應(yīng)用在深度學(xué)習(xí)特殊領(lǐng)域中的循環(huán)神經(jīng)網(wǎng)絡(luò),它克服了RNN訓(xùn)練過(guò)程中的梯度爆炸和梯度消失問(wèn)題,并針對(duì)短期記憶的問(wèn)題進(jìn)行了優(yōu)化,能夠建立較長(zhǎng)距離的時(shí)間依賴關(guān)系,在1997年由Sepp等首次提出[18]。LSTM網(wǎng)絡(luò)的核心在于引入了用于循環(huán)傳遞信息的LSTM單元(LSTM Cell),能夠建立有效的時(shí)序依賴關(guān)系,適用于軍用場(chǎng)景中復(fù)雜時(shí)序數(shù)據(jù)的處理。同時(shí),它也通過(guò)LSTM單元緩解了RNN訓(xùn)練過(guò)程中存在的梯度爆炸和梯度消失等問(wèn)題。
圖1 LSTM單元Fig.1 LSTM unit
LSTM單元中門(mén)控單元的工作機(jī)制和流程依次為:遺忘門(mén)以Xt和ht-1為輸入,經(jīng)sigmoid函數(shù)壓縮至(0,1)區(qū)間后與Ct-1數(shù)乘,其中1表示全部保留,0表示全部丟棄,從而決定將要從Ct-1中丟棄哪些信息,其表達(dá)式如下:
ft=σ(Wf[ht-1,Xt]+bf)
(1)
式中:Wf、bf分別為遺忘門(mén)的權(quán)值與線性偏置。
并非所有的新信息都會(huì)被存入Ct,輸入門(mén)的輸入與遺忘門(mén)相同,其作用是過(guò)濾。輸入門(mén)決定了哪些新信息可以存入Ct,其表達(dá)式如下:
it=σ(Wi[ht-1,Xt]+bi)
(2)
(3)
式中:Wi、bi分別為輸入門(mén)的權(quán)值與線性偏置;Wc、bc分別為L(zhǎng)STM單元的權(quán)值與線性偏置。
(4)
最后由輸出門(mén)對(duì)網(wǎng)絡(luò)單元最終的輸出進(jìn)行控制,其表達(dá)式如下:
ot=σ(Wo[ht-1,Xt]+bo)
(5)
ht=ot·tanh(Ct)
(6)
式中:Wo、bo分別為輸出門(mén)的權(quán)值與線性偏置。該單元的輸出ht分為隱藏層向更深層網(wǎng)絡(luò)的輸出以及橫向上對(duì)該層中其他神經(jīng)元的輸出。
考慮到陸軍常規(guī)火炮的彈藥在發(fā)射后不具備主動(dòng)改變軌跡的能力,氣象等條件在局部范圍內(nèi)對(duì)其軌跡影響有限,因此彈道軌跡本質(zhì)上是一條連續(xù)的、短時(shí)段內(nèi)有一定規(guī)律的復(fù)雜且光滑曲線,具有時(shí)序關(guān)聯(lián)性強(qiáng)的特點(diǎn)。與尋常時(shí)序數(shù)據(jù)不同,彈道軌跡中當(dāng)前時(shí)刻炮彈位置與上一時(shí)刻數(shù)據(jù)的聯(lián)系非常密切,在使用LSTM網(wǎng)絡(luò)對(duì)炮彈軌跡進(jìn)行預(yù)測(cè)時(shí)對(duì)其進(jìn)行相應(yīng)的改進(jìn),在不丟失長(zhǎng)期記憶的前提下進(jìn)一步加強(qiáng)短期記憶,以獲得更佳的性能表現(xiàn)。
圖2 CE-LSTM單元Fig.2 CE-LSTM unit
由式(6)可見(jiàn),循環(huán)結(jié)構(gòu)單元在當(dāng)前時(shí)刻隱藏層的輸出ht僅取決于當(dāng)前時(shí)刻的ot與Ct,沒(méi)有著重考慮炮彈當(dāng)前時(shí)刻位置信息對(duì)下一時(shí)刻的影響。針對(duì)該問(wèn)題,CE-LSTM在原有LSTM循環(huán)結(jié)構(gòu)單元的基礎(chǔ)上,充分考慮計(jì)算效率以及相鄰幀短時(shí)上下文信息利用效率,構(gòu)建隱藏層輸出混合單元,對(duì)當(dāng)前時(shí)刻隱藏層上輸出ht的形式進(jìn)行改進(jìn)。具體地,引入一個(gè)超參數(shù)α作為隱藏層輸出的權(quán)值,將當(dāng)前時(shí)刻隱藏層輸出與前一時(shí)刻LSTM單元的隱藏層輸出進(jìn)行線性加權(quán)組合,作為當(dāng)前時(shí)刻的最終隱藏層輸出。CE-LSTM循環(huán)結(jié)構(gòu)單元的結(jié)構(gòu)如圖2所示,其中h′t為隱藏層輸出混合單元的輸出,α取值為0.9,
h′t=α·ht-1+(1-α)·ht
(7)
通過(guò)構(gòu)建隱藏層輸出混合單元,任意兩個(gè)連續(xù)時(shí)刻之間產(chǎn)生了更緊密的聯(lián)系。在不損失長(zhǎng)期記憶信息的情況下,大大增強(qiáng)了短期記憶能力以及短期記憶之間的相關(guān)性,使網(wǎng)絡(luò)結(jié)構(gòu)更適用于炮彈軌跡預(yù)測(cè)場(chǎng)景。
彈道軌跡預(yù)測(cè)是利用火控雷達(dá)所獲得的一定幀數(shù)炮彈在三維空間中連續(xù)的坐標(biāo),對(duì)該彈體之后的彈道軌跡進(jìn)行預(yù)測(cè)。
在彈道軌跡預(yù)測(cè)問(wèn)題中,每一條樣本軌跡都存在多個(gè)潛在特征,這些特征往往存在量綱和數(shù)值量級(jí)上的差異,若使用原始樣本軌跡數(shù)據(jù)而不加處理,則會(huì)使神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練,無(wú)法收斂。標(biāo)準(zhǔn)化可以克服以上問(wèn)題,它為不同潛在特征提供統(tǒng)一的尺度,使不同的特征具有可比性。在神經(jīng)網(wǎng)絡(luò)利用梯度進(jìn)行訓(xùn)練和學(xué)習(xí)參數(shù)時(shí),標(biāo)準(zhǔn)化后的數(shù)據(jù)可使不同特征對(duì)同一參數(shù)的影響程度一致,從而加快訓(xùn)練時(shí)梯度下降的速度,提高模型在迭代過(guò)程中的收斂速度,故應(yīng)該對(duì)數(shù)據(jù)集做標(biāo)準(zhǔn)化處理。在不改變樣本數(shù)據(jù)原有概率分布的情況下,標(biāo)準(zhǔn)化使每條軌跡樣本數(shù)據(jù)均值為0、標(biāo)準(zhǔn)差為1,其公式如下:
(8)
式中:x′為經(jīng)過(guò)標(biāo)準(zhǔn)化后的樣本;x為原始樣本;μ為全體樣本的均值;ρ為全體樣本的標(biāo)準(zhǔn)差。
外彈道學(xué)的研究表明,影響彈道的因素眾多,除溫度、濕度、氣壓等較穩(wěn)定的基本氣象條件之外,還有橫風(fēng)、縱風(fēng)等不確定性強(qiáng)、波動(dòng)幅度較大的干擾因素。因此對(duì)彈道軌跡的預(yù)測(cè)需要一個(gè)強(qiáng)時(shí)空相關(guān)性且高度復(fù)雜的非線性模型。LSTM理論上具有可以擬合任意非線性函數(shù)的優(yōu)秀特質(zhì),而CE-LSTM在此基礎(chǔ)上進(jìn)一步加強(qiáng)了模型對(duì)相鄰幀相關(guān)性特征的提取。
本文利用CE-LSTM進(jìn)行彈道軌跡預(yù)測(cè),其過(guò)程遵循以下步驟:
步驟1處理各型火炮的彈道數(shù)據(jù),取彈丸命中目標(biāo)前20 s的末段數(shù)據(jù)。
步驟2標(biāo)準(zhǔn)化數(shù)據(jù)。
步驟3由標(biāo)準(zhǔn)化后的彈道數(shù)據(jù)建立彈道軌跡的時(shí)序數(shù)據(jù)集,包括訓(xùn)練集、驗(yàn)證集和測(cè)試集。
步驟4構(gòu)建CE-LSTM模型,設(shè)置參數(shù)和超參數(shù)后利用訓(xùn)練集訓(xùn)練CE-LSTM預(yù)測(cè)模型,并使用驗(yàn)證集驗(yàn)證模型的表現(xiàn),直到模型達(dá)標(biāo)。
步驟5將測(cè)試集中每個(gè)樣本一定幀數(shù)的炮彈在三維坐標(biāo)信息輸入CE-LSTM模型,由模型進(jìn)行預(yù)測(cè)并輸出炮彈后續(xù)20 s的軌跡。
詳細(xì)的彈道軌跡預(yù)測(cè)模型的訓(xùn)練及預(yù)測(cè)流程如圖3所示。
圖3 模型訓(xùn)練及預(yù)測(cè)流程Fig.3 Model training & prediction flowchart
3.1.1 構(gòu)建訓(xùn)練集與測(cè)試集
為讓模型得到有效訓(xùn)練,本文通過(guò)采樣不同氣象條件、不同彈道條件、不同射擊諸元等不同條件下的各種彈道軌跡,構(gòu)建軌跡樣本共13 500條,其中包含155 mm榴彈炮、122 mm榴彈炮、35 mm高射炮等3種不同口徑的陸軍常規(guī)火炮各4 500條樣本,它們分別以700 m/s、690 m/s、1 050 m/s的初速發(fā)射彈丸,武器高低角除35 mm高炮為30°~80°外,其他均為25°~65°。選擇使用多種不同類型彈道訓(xùn)練同一個(gè)預(yù)測(cè)模型的目的,是因?yàn)樵趯?shí)戰(zhàn)中同時(shí)來(lái)襲的炮彈種類可能較多,若針對(duì)每一種彈道單獨(dú)訓(xùn)練一個(gè)預(yù)測(cè)模型,則雖然精度會(huì)更高,但是會(huì)因?yàn)楸孀R(shí)彈道產(chǎn)生額外的計(jì)算開(kāi)銷而影響實(shí)時(shí)性。此外,彈道辨識(shí)的準(zhǔn)確性難以保證,存在錯(cuò)誤辨識(shí)彈道類型并使用錯(cuò)誤模型預(yù)測(cè)的“誤判”風(fēng)險(xiǎn),大大犧牲預(yù)測(cè)模型的魯棒性。
為使預(yù)測(cè)模型更貼近實(shí)戰(zhàn)情況,在構(gòu)建數(shù)據(jù)集時(shí)為3種火炮的彈頭初速均加上-30~30 m/s的隨機(jī)誤差,以模擬火炮發(fā)射過(guò)程中強(qiáng)烈沖擊與震蕩對(duì)彈頭初速造成的波動(dòng);為武器高低角加上-1°~1°的隨機(jī)誤差,以模擬跳角的誤差。為武器高低角加上隨機(jī)誤差的意義除模擬誤差外,還在于模擬敵方多次開(kāi)火時(shí)重新瞄準(zhǔn)所造成的武器線變動(dòng)。隨機(jī)誤差的加入不僅貼近實(shí)戰(zhàn),還讓預(yù)測(cè)模型具備了更強(qiáng)的魯棒性和泛化能力,使模型在面對(duì)未知軌跡時(shí)也能做出準(zhǔn)確預(yù)測(cè)。
火炮發(fā)射過(guò)程中除武器線的變化之外,風(fēng)速是影響外彈道的另一個(gè)極不穩(wěn)定且重要的因素,其中橫風(fēng)和縱風(fēng)影響最大。為此,在同一口徑火炮的4 500條軌跡中,包含以下3種風(fēng)況各1 500條:隨機(jī)選取8~12 m/s的恒定風(fēng)力;每0.1 s隨機(jī)選取8~12 m/s的時(shí)變風(fēng)力;每0.1 s增加0.02 m/s的線性時(shí)變風(fēng)力。不同風(fēng)況的引入進(jìn)一步增強(qiáng)了外彈道的不確定性和非線性,雖然會(huì)增加模型訓(xùn)練難度但同樣有利于增強(qiáng)模型的魯棒性和泛化能力。數(shù)據(jù)集構(gòu)成如表1所示。
表1 數(shù)據(jù)集構(gòu)成Table 1 Composition of datasets
將3種口徑火炮每種風(fēng)況的1 500條軌跡中取出1 450條軌跡作為訓(xùn)練集,40條軌跡作為測(cè)試集,剩余10條作為驗(yàn)證集。
3.1.2 CE-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)結(jié)構(gòu)是影響神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率的另一個(gè)決定性因素,在固定超參數(shù)的條件下,不同網(wǎng)絡(luò)結(jié)構(gòu)的性能表現(xiàn)天差地別,為獲得高預(yù)測(cè)準(zhǔn)確率,選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)非常重要。本文采用的CE-LSTM網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱藏層、回歸層三部分,其中輸入層和回歸層形式固定,故確定網(wǎng)絡(luò)結(jié)構(gòu)主要是對(duì)隱藏層進(jìn)行設(shè)計(jì)。CE-LSTM炮彈軌跡預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 CE-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Schematic diagram of the CE-LSTM network
網(wǎng)絡(luò)在獲得輸入后共使用4層隱藏層:包括2層CE-LSTM和2層全連接層。其中2層CE-LSTM層再搭配適當(dāng)?shù)募せ詈瘮?shù)即可表示足夠精度的決策邊界,并可以擬合足夠精度的平滑映射。隱藏層內(nèi)部的設(shè)計(jì)主要是選擇數(shù)量合適的神經(jīng)元。在神經(jīng)元數(shù)量選擇時(shí),一方面,全連接層分別選擇6個(gè)和3個(gè)神經(jīng)元,是為了數(shù)據(jù)傳遞時(shí)呈倒三角型逐層壓縮,最后形成3維輸出。另一方面,在其他參數(shù)、超參數(shù)和結(jié)構(gòu)固定的條件下,為每層CE-LSTM分別選擇16、32、64、128、256、384、512個(gè)神經(jīng)元,并在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),每50次迭代采樣一次當(dāng)前網(wǎng)絡(luò)模型在驗(yàn)證集上的均方根誤差(RMSE),以確定最優(yōu)神經(jīng)元數(shù)量。不同數(shù)量神經(jīng)元設(shè)定下預(yù)測(cè)的均方根誤差如圖5所示。
圖5 不同數(shù)量神經(jīng)元對(duì)應(yīng)RMSEFig.5 RMSE with different number of neurons
由圖5可知,神經(jīng)網(wǎng)絡(luò)在測(cè)試集上由RMSE度量的預(yù)測(cè)準(zhǔn)確率隨神經(jīng)元數(shù)量的增加呈先減小后增大的趨勢(shì),且在256個(gè)神經(jīng)元時(shí)RMSE最小。此外,神經(jīng)元數(shù)量應(yīng)盡量選擇2的整數(shù)次冪,最大限度利用GPU的并行計(jì)算資源,提高計(jì)算速度,故每層CE-LSTM使用256個(gè)神經(jīng)元。此外,包括隱藏層層數(shù)在內(nèi)的其他參數(shù)調(diào)節(jié)均采用同樣方法,通過(guò)重復(fù)探索來(lái)進(jìn)行局部?jī)?yōu)化,以獲得一組使模型預(yù)測(cè)精度令人滿意的參數(shù)組合。
對(duì)輸入權(quán)重及循環(huán)權(quán)重引入L2正則化以降低過(guò)擬合風(fēng)險(xiǎn),訓(xùn)練CE-LSTM網(wǎng)絡(luò)時(shí)初始學(xué)習(xí)率經(jīng)過(guò)多次試驗(yàn)后選擇0.001,且每訓(xùn)練10輪便將學(xué)習(xí)率減半,既能保證收斂速度,又可在多輪迭代后使學(xué)習(xí)率盡量小,以逼近損失函數(shù)的全局最優(yōu)值。
3.1.3 對(duì)比方法
3.1.3.1 彈道方程預(yù)測(cè)法
(9)
式中:vd、vz、vh分別為炮彈速度矢量在三坐標(biāo)軸上的分量;C為彈道系數(shù);Hτ(hq)為虛擬氣壓函數(shù);G(vrτ)為虛擬阻力函數(shù);wd、wz、wh分別為縱風(fēng)、橫風(fēng)、垂直風(fēng)的風(fēng)速;az(t)為偏流加速度。
彈道方程預(yù)測(cè)法的實(shí)施分為三步,首先根據(jù)雷達(dá)探測(cè)到的炮彈軌跡,濾波估計(jì)出其坐標(biāo)位置與速度矢量;其次將濾波估計(jì)的結(jié)果作為輸入量代入彈道方程,得到關(guān)于彈道系數(shù)的方程,解方程得到彈道系數(shù);最后將濾波估計(jì)的最新結(jié)果作為彈道起始條件,利用上一步得到的彈道系數(shù),代入彈道方程組,使用4階龍格- 庫(kù)塔法[20]解算炮彈的未來(lái)軌跡。
3.1.3.2 GMM預(yù)測(cè)法
在確定核函數(shù)時(shí),為符合炮彈軌跡的特點(diǎn),本文選擇平方指數(shù)函數(shù)(SE)與有理二次函數(shù)(RQ)作為核函數(shù),分別用kSE(r)、kRQ(r)表示,它們對(duì)應(yīng)的GP均有光滑、平穩(wěn)且無(wú)限可微的優(yōu)秀性質(zhì),其一般表達(dá)式如下:
(10)
(11)
式中:β、l>0為待確定的超參數(shù),l表征特征長(zhǎng)度尺度;r為任意兩個(gè)隨機(jī)變量之間的距離。
GMM預(yù)測(cè)過(guò)程為:首先,將炮彈軌跡拆分為3個(gè)坐標(biāo)軸上的獨(dú)立運(yùn)動(dòng)軌跡,并分別用GP表示;其次,將3條軌跡代入GPR回歸模型進(jìn)行預(yù)測(cè);最后,將預(yù)測(cè)結(jié)果重新整合為3D空間上炮彈的預(yù)測(cè)軌跡。t時(shí)刻單一坐標(biāo)軸上的預(yù)測(cè)數(shù)據(jù)點(diǎn)Xt可表示為
Xt=ξxt,SE+ηxt,RQ
(12)
Pt={Dt,Zt,Ht}
(13)
3.2.1 訓(xùn)練結(jié)果評(píng)估
使用訓(xùn)練集中的12 900條軌跡數(shù)據(jù),訓(xùn)練CE-LSTM網(wǎng)絡(luò)模型,記錄訓(xùn)練過(guò)程中訓(xùn)練集的損失變化情況,如圖6所示。
圖6 不同數(shù)量神經(jīng)元對(duì)應(yīng)損失Fig.6 Loss with different number of neurons
設(shè)定訓(xùn)練400輪作為停止優(yōu)化損失函數(shù)的停止條件。將擬合誤差邊界定義為:驗(yàn)證集損失小于0.000 05,且最后10輪訓(xùn)練時(shí),驗(yàn)證集損失的均值與訓(xùn)練集損失的均值之比小于1.15。通過(guò)400輪訓(xùn)練中損失函數(shù)值的變換情況可知,CE-LSTM網(wǎng)絡(luò)損失下降非常迅速,可在短短幾輪后降到0.1%左右,并在第50輪左右趨于零,在此之后雖然驗(yàn)證集的損失會(huì)有所波動(dòng),但始終與訓(xùn)練集的損失接近。在第150輪左右將圖6藍(lán)色矩形框中曲線放大,可見(jiàn)損失降至十萬(wàn)分位水平,測(cè)試集損失曲線平穩(wěn),小于上述擬合誤差邊界,因此認(rèn)為網(wǎng)絡(luò)已收斂。
3.2.2 彈道預(yù)測(cè)結(jié)果分析
使用訓(xùn)練好的CE-LSTM網(wǎng)絡(luò)對(duì)測(cè)試集中的軌跡進(jìn)行預(yù)測(cè),隨機(jī)挑選具有代表性的4條軌跡,展示預(yù)測(cè)結(jié)果。在給定前1 s共100個(gè)坐標(biāo)值和前0.5 s共50個(gè)坐標(biāo)值的情況下,CE-LSTM和對(duì)比方法的預(yù)測(cè)結(jié)果分別如圖7和圖8所示。為進(jìn)一步分析各種模型在預(yù)測(cè)軌跡時(shí)的特點(diǎn),選擇圖8(a)中155 mm榴彈炮彈丸在全程恒定8~12 m/s隨機(jī)風(fēng)力情況下的軌跡,分別作出3種預(yù)測(cè)模型在3個(gè)方向上預(yù)測(cè)值的絕對(duì)誤差隨時(shí)間變化的曲線,如圖9所示。
圖7 基于前100個(gè)坐標(biāo)值的預(yù)測(cè)結(jié)果Fig.7 Prediction results based on the first 100 coordinate values
圖8 基于前50個(gè)坐標(biāo)值的預(yù)測(cè)結(jié)果Fig.8 Prediction results based on the first 50 coordinate values
結(jié)合圖7與圖8的8組預(yù)測(cè)表現(xiàn)來(lái)看,CE-LSTM網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果精度最高,整體表現(xiàn)平穩(wěn),該網(wǎng)絡(luò)在預(yù)測(cè)軌跡時(shí)幾乎不受外界不確定因素影響,可以對(duì)各型火炮在不同氣象條件下的炮彈軌跡進(jìn)行精確預(yù)測(cè)。GMM模型的表現(xiàn)在軌跡初始段良好,但其精度隨時(shí)間推移整體呈逐漸下降的趨勢(shì),誤差不斷累積,導(dǎo)致在軌跡末端的表現(xiàn)不佳。彈道方程解算模型的表現(xiàn)雖然整體較為平穩(wěn),但精度較低,同樣存在誤差隨時(shí)間積累的問(wèn)題,并在軌跡初始段表現(xiàn)也不如其他兩種模型。
圖9 不同坐標(biāo)軸上的絕對(duì)誤差Fig.9 Absolute errors for different coordinate axises
由圖7(c)與圖8(c)可知,無(wú)論是GMM方法還是彈道方程解算法,預(yù)測(cè)精度均明顯低于其他組,其原因是35 mm高炮彈丸自重僅0.685 kg,遠(yuǎn)低于155 mm榴彈炮彈丸52.8 kg及122 mm榴彈炮彈丸21.76 kg,因此外彈道受氣象條件,諸如橫風(fēng)與縱風(fēng)的擾動(dòng)所造成的影響被放大,導(dǎo)致其彈道非線性程度增大,軌跡復(fù)雜、更難預(yù)測(cè),而CE-LSTM網(wǎng)絡(luò)表現(xiàn)依然良好,可見(jiàn)該模型在高擾動(dòng)下的魯棒性優(yōu)于其他兩種,得益于神經(jīng)網(wǎng)絡(luò)能夠擬合任意非線性曲線的良好性質(zhì)。
以圖7(a)與圖8(a)為例,橫向?qū)Ρ雀髂P驮谙嗤瑲庀髼l件下,在給定不同時(shí)長(zhǎng)坐標(biāo)值時(shí)的表現(xiàn),并以預(yù)測(cè)值的均方根誤差度量,結(jié)果如表2所示。
由表2可知,提供給模型的觀測(cè)值數(shù)量越多,其預(yù)測(cè)精度越高,這一趨勢(shì)在彈道方程解算模型中表現(xiàn)尤為突出。
圖9形象地刻畫(huà)了各種模型的特點(diǎn),可見(jiàn)CE-LSTM網(wǎng)絡(luò)的表現(xiàn)在全時(shí)段良好且平穩(wěn);GMM模型受累積誤差影響嚴(yán)重,逐漸發(fā)散;彈道方程模型精度低,且呈接近線性的趨勢(shì)發(fā)散,注意到圖9(c)雖然誤差看似逐漸降低,但其末段有重新上升趨勢(shì),可以預(yù)估其隨時(shí)間推移,依然會(huì)發(fā)散。
綜上,可認(rèn)為CE-LSTM網(wǎng)絡(luò)能夠在全時(shí)段精確地進(jìn)行炮彈軌跡預(yù)測(cè),GMM模型的預(yù)測(cè)結(jié)果在初始的2~3 s內(nèi)可用,其在3個(gè)方向上的平均RMSE略大是因?yàn)檐壽E中末段發(fā)散導(dǎo)致,而彈道方程解算模型所預(yù)測(cè)結(jié)果的可用區(qū)間則更窄。
表2 不同時(shí)長(zhǎng)坐標(biāo)值下均方根誤差表Table 2 RMSE with different time-length coordinate values
3.2.3 模型泛化能力測(cè)試
為進(jìn)一步測(cè)試本文所提方法的魯棒性并驗(yàn)證其泛化能力,在去掉原數(shù)據(jù)集中橫風(fēng)、縱風(fēng)等氣象條件的影響,保持原有射擊諸元、彈道條件不變的情況下,重新構(gòu)建一個(gè)不含橫風(fēng)與縱風(fēng)影響的數(shù)據(jù)集,按照2.2節(jié)方法,訓(xùn)練一個(gè)CE-LSTM預(yù)測(cè)模型,簡(jiǎn)稱無(wú)風(fēng)模型。之后,使用無(wú)風(fēng)模型預(yù)測(cè)有橫風(fēng)、縱風(fēng)影響的軌跡數(shù)據(jù),隨機(jī)選取兩條預(yù)測(cè)軌跡如圖10所示。
圖10 泛化能力交叉驗(yàn)證Fig.10 Cross-validation for generalization capability
由圖10可知,CE-LSTM預(yù)測(cè)模型的表現(xiàn)在有一定相關(guān)性的全新數(shù)據(jù)集上雖然有所下降,但整體預(yù)測(cè)精度依然較高。通過(guò)這種交叉驗(yàn)證的方式,證明了本文所提方法的魯棒性和泛化性較強(qiáng),可以對(duì)一些未經(jīng)訓(xùn)練的彈道軌跡進(jìn)行較為準(zhǔn)確的預(yù)測(cè)。
3.2.4 預(yù)測(cè)用時(shí)分析
本文通過(guò)對(duì)測(cè)試集中所有彈道軌跡進(jìn)行預(yù)測(cè),并求取各種模型預(yù)測(cè)用時(shí)的平均值方式,有效地說(shuō)明CE-LSTM網(wǎng)絡(luò)在實(shí)時(shí)性上的優(yōu)勢(shì)。在MATLAB2020環(huán)境下(Windows 10,R7-4800H CPU,2.9 GHz 主頻,Nvidia RTX2060-MaxQ GPU,16GB RAM)其結(jié)果如圖11所示。由圖11可以看出,本文所提方法在預(yù)測(cè)階段的平均用時(shí)遠(yuǎn)低于GMM方法與彈道方程方法:比GMM快約3倍,比彈道方程方法快約10倍。
圖11 預(yù)測(cè)平均用時(shí)Fig.11 Average prediction duration
本文在LSTM網(wǎng)絡(luò)的基礎(chǔ)上提出了基于新型CE-LSTM網(wǎng)絡(luò)的彈道軌跡預(yù)測(cè)方法,構(gòu)建隱藏層輸出混合單元,更適合彈道軌跡預(yù)測(cè)場(chǎng)景。通過(guò)仿真實(shí)驗(yàn)證明了該方法相比GMM方法和彈道方程解算方法,在預(yù)測(cè)精度和實(shí)時(shí)性上均有大幅提升,而且泛化能力測(cè)試證明了本文所提方法有能力預(yù)測(cè)一些有相關(guān)性的全新彈道軌跡。
目前本文方法暫停留在仿真階段,在工程實(shí)際中面臨的難點(diǎn)是如何獲取足量的敵方數(shù)據(jù)以訓(xùn)練預(yù)測(cè)模型,可行的方案是先用仿真數(shù)據(jù)和我方數(shù)據(jù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,再用有限的真實(shí)彈道數(shù)據(jù)進(jìn)行微調(diào),通過(guò)在線學(xué)習(xí)的方式提高模型的實(shí)戰(zhàn)精度。
在后續(xù)工作中,將實(shí)彈軌跡數(shù)據(jù)加入訓(xùn)練集,并在靶場(chǎng)驗(yàn)證模型的實(shí)戰(zhàn)精度。此外,彈道軌跡預(yù)測(cè)是順著來(lái)襲彈的軌跡進(jìn)行的,后續(xù)工作可以考慮利用CE-LSTM模型逆軌跡而行,對(duì)來(lái)襲彈軌跡進(jìn)行反向推演和坐標(biāo)轉(zhuǎn)換,從而準(zhǔn)確得出敵方火炮位置,進(jìn)行反制和相關(guān)反火炮應(yīng)用的研究。