李旭輝,郭曉輝,程 帥,李 斌
(中國船舶集團(tuán)有限公司 第705 研究所,陜西 西安,710077)
在水下作戰(zhàn)指揮控制系統(tǒng)中,預(yù)測不同魚雷攻擊方式的命中概率能夠輔助指揮員快速、直觀地預(yù)估多種魚雷打擊方案的作戰(zhàn)效能,從而優(yōu)化魚雷打擊方案,提高水面艦艇的水下作戰(zhàn)能力。
在水下作戰(zhàn)中,對魚雷的作戰(zhàn)效能評(píng)估通常使用解析計(jì)算法和仿真模擬法。武志東等[1]建立了直航魚雷、聲自導(dǎo)魚雷和尾流自導(dǎo)魚雷命中概率的解析計(jì)算通式,但對魚雷命中偏差的解算模型進(jìn)行了線性化處理,且未考慮魚雷開機(jī)時(shí)機(jī)和魚雷再搜索,因此與仿真計(jì)算結(jié)果存在一定的誤差。丁光強(qiáng)[2]提出一種基于靜態(tài)命中概率表的火箭助飛魚雷命中概率實(shí)時(shí)評(píng)估模型,根據(jù)蒙特卡洛仿真方法計(jì)算出靜態(tài)命中概率表,將射擊誤差子區(qū)域的落入概率乘以每個(gè)射擊誤差子區(qū)域的平均命中概率,得到火箭助飛魚雷的實(shí)時(shí)命中概率。這種方法依賴于數(shù)字仿真模型的準(zhǔn)確性,而火箭助飛魚雷在任意入水點(diǎn)的命中概率受到魚雷性能、水聲環(huán)境、目標(biāo)規(guī)避機(jī)動(dòng)假設(shè)等多種因素的影響。謝超等[3]采用基于蒙特卡洛方法對超空泡命中概率進(jìn)行評(píng)估,通過仿真實(shí)驗(yàn)分析了初始雷目距離、初始目標(biāo)舷角和目標(biāo)航速對命中概率的影響。吳寶奇等[4]建立了多級(jí)電磁線圈炮發(fā)射模型、本艦運(yùn)動(dòng)模型和來襲魚雷彈道模型等,采用Matlab 軟件對電磁發(fā)射反魚雷魚雷作戰(zhàn)的攔截概率進(jìn)行了仿真及定量分析。袁富宇等[5]針對魚雷一次轉(zhuǎn)角射擊效果在線評(píng)估及射擊諸元實(shí)時(shí)優(yōu)化計(jì)算的需要,基于誤差折算思想提出一種魚雷一次轉(zhuǎn)角射擊命中、發(fā)現(xiàn)概率的解析計(jì)算模型。
近幾年,隨著深度學(xué)習(xí)的廣泛應(yīng)用,智能化作戰(zhàn)被廣泛提及。智能化作戰(zhàn)指揮是以人機(jī)協(xié)作為基本方式的腦機(jī)融合決策模式,智能算法為該模式的核心。智能化算法利用大數(shù)據(jù),高效率地將海量數(shù)據(jù)轉(zhuǎn)化為作戰(zhàn)有用的情報(bào),突破人類分析事物的局限性。在深度學(xué)習(xí)領(lǐng)域,魚雷作戰(zhàn)效能評(píng)估本質(zhì)上是一個(gè)監(jiān)督學(xué)習(xí)的分類問題。通過預(yù)先分配標(biāo)簽的大樣本仿真數(shù)據(jù)訓(xùn)練模型,將多維的戰(zhàn)場目標(biāo)態(tài)勢輸入分類模型,分析預(yù)估魚雷是否能夠有效命中目標(biāo)。解決監(jiān)督學(xué)習(xí)分類問題的智能算法主要包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹和貝葉斯方法等。杜毅等[6]提出了一種基于貝葉斯網(wǎng)絡(luò)的潛艇攻擊決策模型,簡化了模型的影響因素,構(gòu)建了命中概率分析的貝葉斯網(wǎng)絡(luò)模型,實(shí)現(xiàn)了攻擊決策的推理分析。唐克等[7]探討了基于神經(jīng)網(wǎng)絡(luò)的末敏彈命中概率預(yù)報(bào)模型的建模方法,利用matlab 軟件對影響末敏彈系統(tǒng)效能的因素進(jìn)行了靈敏度仿真分析,為末敏彈系統(tǒng)效能研究提供了依據(jù)。
在此基礎(chǔ)上,文中結(jié)合了深度學(xué)習(xí)和魚雷作戰(zhàn)效能評(píng)估問題,基于構(gòu)建的魚雷作戰(zhàn)數(shù)學(xué)仿真平臺(tái)大樣本,建立了基于深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)的魚雷作戰(zhàn)效能評(píng)估模型,研究了模型對作戰(zhàn)效能評(píng)估和輔助決策方案的應(yīng)用性;最后,通過實(shí)例驗(yàn)證了模型的正確性和可信性。
DNN 包含多層隱藏層,按不同層的位置可分為輸入層、隱藏層和輸出層。第1 層一般是輸入層,最后一層是輸出層,中間層數(shù)都是隱藏層。層與層之間全連接,即第i層任意1 個(gè)神經(jīng)元一定與第i+1 層任意1 個(gè)神經(jīng)元相連,如圖1 所示[8]。
圖1 深度神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.1 DNN model structure
魚雷作戰(zhàn)效能評(píng)估模型分為如圖2 所示3 個(gè)部分。
圖2 DNN 預(yù)測模型Fig.2 DNN prediction model
模型的輸入為目標(biāo)態(tài)勢與魚雷打擊方式,包括目標(biāo)距離、目標(biāo)方位、目標(biāo)速度、目標(biāo)航向、魚雷發(fā)射數(shù)量和魚雷射擊方法等6 個(gè)維度。在實(shí)際作戰(zhàn)中,由于水面艦艇傳感器存在一定的系統(tǒng)誤差,因此目標(biāo)距離、方位、速度和航向都應(yīng)為估計(jì)值。模型的輸出為魚雷的命中概率,通過輸出層分類器 Sigmoid函數(shù)將概率調(diào)整至(0,1)區(qū)間。Sigmoid函數(shù)表達(dá)式為
Sigmoid函數(shù)曲線見圖3,由圖可知x∈(-∞,+∞)而P(x)∈(0,1)。模型輸入輸出的狀態(tài)空間見表1。
表1 網(wǎng)絡(luò)輸入輸出的狀態(tài)空間Table 1 State space of network inputs and outputs
圖3 Sigmoid 函數(shù)圖像Fig.3 Sigmoid function graph
模型的核心為DNN。對于DNN 而言,較少的隱藏層層數(shù)訓(xùn)練復(fù)雜度低但難以表達(dá)復(fù)雜的高維特征,學(xué)習(xí)能力差;較多的隱藏層層數(shù)可以提高網(wǎng)絡(luò)的學(xué)習(xí)能力,但也意味著更大的學(xué)習(xí)量??紤]到戰(zhàn)場環(huán)境復(fù)雜,命中概率預(yù)測問題沒有明顯的特征表達(dá),因此將模型的隱藏層數(shù)設(shè)置為35 層。
DNN 的誤差損失函數(shù)選擇交叉熵?fù)p失函數(shù)
式中: “·”表示向量內(nèi)積;W為權(quán)重;b為偏置;a為模型預(yù)測的概率值;y為真實(shí)的標(biāo)簽值。
與均方誤差損失函數(shù)相比,交叉熵?fù)p失函數(shù)的梯度表達(dá)式 δL不包含 σ′(z),梯度為預(yù)測值和真實(shí)值之間的差距,這樣求得的Wl與bl也不包含 σ′(z),因此使用交叉熵?fù)p失函數(shù)能夠避免反向傳播收斂速度慢的問題,提高DNN 算法的訓(xùn)練速度[9]。
DNN 的優(yōu)化算法選擇Levenberg-Marquardt(L-M)方法。L-M 算法是一種利用標(biāo)準(zhǔn)的數(shù)值優(yōu)化技術(shù)的快速算法,它結(jié)合了梯度下降法和高斯-牛頓法的優(yōu)點(diǎn),既具有梯度法的全局特性,又有高斯-牛頓法的局部收斂性[10]。L-M 算法的優(yōu)化模型公式為
由于L-M 算法利用了近似的2 階導(dǎo)數(shù)信息,所以L-M 算法比梯度法快很多。
DNN 超參數(shù)設(shè)定如表2 所示。
表2 DNN 超參數(shù)設(shè)定Table 2 Hyper-parameter settings of DNN
為了驗(yàn)證模型的有效性,文中仿真了1 280 種不同態(tài)勢,具體態(tài)勢想定示意圖如圖4 所示。本艦以9 kn 的速度向正北方向航行,T時(shí)刻發(fā)現(xiàn)敵潛艇目標(biāo),目標(biāo)距離3、5、7、9 km;方位角為30°、0°、90°、120°、150°;目標(biāo)航速6、12、18、24 kn;目標(biāo)航向?yàn)?°、90°、180°、-90°。在整個(gè)仿真過程中,敵潛艇目標(biāo)運(yùn)動(dòng)狀態(tài)始終保持勻速直航,魚雷航速設(shè)定為50 kn,魚雷最大航程設(shè)定為15 km,魚雷發(fā)射方式包括現(xiàn)在點(diǎn)和有利提前角2 種。
圖4 作戰(zhàn)仿真態(tài)勢想定示意圖Fig.4 Desired situation of operation simulation
為了仿真真實(shí)作戰(zhàn)場景中本艦對敵潛艇目標(biāo)的觀測誤差,同時(shí)泛化樣本數(shù)據(jù),在仿真實(shí)驗(yàn)中對目標(biāo)距離增加2.5%×目標(biāo)距離+50 m、對目標(biāo)方位增加3.5°的高斯分布白噪聲。對每種增加高斯白噪聲的態(tài)勢仿真1 000 次,統(tǒng)計(jì)成功概率,用于對應(yīng)此態(tài)勢的訓(xùn)練、驗(yàn)證或測試樣本的輸出,最終得到共計(jì)128 萬組樣本數(shù)據(jù)。為了初始訓(xùn)練權(quán)重相同,樣本數(shù)據(jù)的多維數(shù)據(jù)保持均勻分布。為了測試模型的有效性,對樣本數(shù)據(jù)以0.6∶0.2∶0.2 的比例分割為訓(xùn)練集、驗(yàn)證集和測試集。部分訓(xùn)練樣本數(shù)據(jù)如表3 所示。在仿真中,魚雷運(yùn)動(dòng)彈道依次為入水下潛彈道、直航搜索彈道和跟蹤導(dǎo)引彈道,直到與目標(biāo)距離小于一定數(shù)值時(shí)視為命中目標(biāo)。仿真的結(jié)果被認(rèn)為是客觀的,可以用于作戰(zhàn)效能評(píng)估。
表3 部分訓(xùn)練樣本數(shù)據(jù)Table 3 Partial training sample data
對訓(xùn)練數(shù)據(jù)統(tǒng)一做歸一化處理后,通過528 輪的DNN 迭代訓(xùn)練,訓(xùn)練過程中訓(xùn)練集、驗(yàn)證集和測試集的誤差損失函數(shù)變化曲線如圖5 所示。由圖可發(fā)現(xiàn),通過迭代次數(shù)的增加,訓(xùn)練集、驗(yàn)證集和測試集的誤差損失函數(shù)都呈現(xiàn)明顯的下降趨勢并且在200 步以后趨于穩(wěn)定,522 步以后各數(shù)據(jù)集誤差損失函數(shù)不再明顯變化并趨于0.244 左右,證明網(wǎng)絡(luò)訓(xùn)練效果優(yōu)秀,不存在欠擬合和過擬合情況。
圖5 訓(xùn)練過程誤差損失函數(shù)變化曲線Fig.5 Curves of error loss function during training
網(wǎng)絡(luò)訓(xùn)練完成后對各數(shù)據(jù)集進(jìn)行測試,圖6 和圖7 分別表示訓(xùn)練集、驗(yàn)證集、測試集及數(shù)據(jù)全集的混淆矩陣和接受者操作特征曲線(receiver operating characteristic curve,ROC)。由圖6 可發(fā)現(xiàn),在包含高斯分布估計(jì)誤差的訓(xùn)練集、驗(yàn)證集、測試集及數(shù)據(jù)全集上的模型預(yù)測準(zhǔn)確率統(tǒng)一達(dá)到了89.5%,進(jìn)一步佐證了網(wǎng)絡(luò)的有效性。由圖7 可發(fā)現(xiàn),在各數(shù)據(jù)集上的ROC曲線面積接近于1,說明模型的識(shí)別能力較強(qiáng)。
圖6 訓(xùn)練集、驗(yàn)證集、測試集及數(shù)據(jù)全集混淆矩陣Fig.6 Confusion matrix of training set,validation set,test set,and data set
圖7 訓(xùn)練集、驗(yàn)證集、測試集及數(shù)據(jù)全集ROC 曲線Fig.7 ROC curves of training set,validation set,test set,and data set
為了驗(yàn)證DNN 在模型準(zhǔn)確率上的優(yōu)越性,文中實(shí)現(xiàn)了其他幾種常見機(jī)器學(xué)習(xí)算法并統(tǒng)計(jì)了測試樣本的預(yù)測成功率,如表4 所示。
表4 其他機(jī)器學(xué)習(xí)方法統(tǒng)計(jì)結(jié)果Table 4 Statistical results of other machine learning methods
從表4 可以看出,其他幾種機(jī)器學(xué)習(xí)方法的預(yù)測成功率在80%~88%之間,相比之下,DNN 89.5%的預(yù)測成功率更為優(yōu)秀。其中BP 神經(jīng)網(wǎng)絡(luò)預(yù)測成功率達(dá)到85.5%,說明提高神經(jīng)網(wǎng)絡(luò)深度對魚雷效能評(píng)估問題能有更好的特征表達(dá)。
假設(shè)在T時(shí)刻本艦探測到敵潛目標(biāo),在T+1時(shí)刻對指揮員下發(fā)單雷現(xiàn)在點(diǎn)打擊方式的作戰(zhàn)方案對敵潛艇進(jìn)行打擊。此時(shí)目標(biāo)估計(jì)距離7 540 m、估計(jì)方位-0.6 rad、估計(jì)速度3.5 m/s、估計(jì)航向6.1 rad。
以上述方法訓(xùn)練的DNN 預(yù)測模型對上述態(tài)勢場景進(jìn)行效能預(yù)估,得到魚雷的命中概率為28.09%。指揮員可以根據(jù)此命中概率制定下一步作戰(zhàn)方案。
假設(shè)在T時(shí)刻本艦探測到敵潛艇目標(biāo),在T+1時(shí)刻艦長下令對敵潛艇進(jìn)行打擊。此時(shí)目標(biāo)估計(jì)距離7 540 m、估計(jì)方位-0.6 rad、估計(jì)速度3.5 m/s、估計(jì)航向6.1 rad。
以上述方法訓(xùn)練的DNN 預(yù)測模型對上述態(tài)勢場景下的多種打擊方案進(jìn)行預(yù)估,得到單雷現(xiàn)在點(diǎn)、雙雷現(xiàn)在點(diǎn)、單雷提前角以及雙雷提前角4 種打擊方式的魚雷命中概率依次為28.09%、53.89%、47.95%和79.08%。對水下作戰(zhàn)指揮員評(píng)估4 種打擊方案的魚雷命中概率后,優(yōu)化目前作戰(zhàn)方案,選擇使用雙雷提前角方式打擊。
采用DNN 方法對魚雷的作戰(zhàn)效能進(jìn)行智能評(píng)估,提高了水下作戰(zhàn)平臺(tái)的智能化水平,對水下指揮控制系統(tǒng)的智能化發(fā)展有著重大意義。
文中針對魚雷命中概率預(yù)測不準(zhǔn)確、智能化水平低的問題,提出了基于DNN 的模型方法,并實(shí)驗(yàn)驗(yàn)證了該方法的可行性和有效性,但是提出的方法準(zhǔn)確率仍存在一定的提升空間,如何提升預(yù)測魚雷命中概率的準(zhǔn)確率,也是未來研究的主要目標(biāo)。因?yàn)榉抡娣椒ㄊ强陀^的,若不考慮計(jì)算速度,就應(yīng)選擇仿真方法,所以還應(yīng)將上述方法與現(xiàn)場仿真方法的計(jì)算速度進(jìn)行比較。