吳 鵬,諸德放,劉子易
(1.空軍勤務(wù)學(xué)院,江蘇 徐州 221000;2.解放軍94865部隊(duì),杭州 310000)
目標(biāo)價(jià)值是指戰(zhàn)場(chǎng)目標(biāo)打擊價(jià)值,用來描述和衡量在一定戰(zhàn)斗條件下,對(duì)戰(zhàn)場(chǎng)目標(biāo)實(shí)施打擊必要性的一個(gè)綜合性指標(biāo)[1],目標(biāo)價(jià)值評(píng)估即量化分析目標(biāo)價(jià)值??盏刂茖?dǎo)彈藥作為高價(jià)值、大威力武器,合理安排其打擊目標(biāo)具有重要意義。目前,我軍對(duì)炮兵打擊目標(biāo)價(jià)值的研究較多,很少涉及空地制導(dǎo)彈藥打擊目標(biāo),且多采用層次分析法、多屬性決策法或模糊分析法進(jìn)行分析,此類方法處理特征信息的方式粗糙,誤差較大。BP神經(jīng)網(wǎng)絡(luò)具有儲(chǔ)存和應(yīng)用經(jīng)驗(yàn)知識(shí)的自然特性,自學(xué)習(xí)能力強(qiáng),善于聯(lián)想、概括、類比和推廣,將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標(biāo)價(jià)值評(píng)估具有良好的前景。同時(shí),BP神經(jīng)網(wǎng)絡(luò)的缺點(diǎn)也很明顯,網(wǎng)絡(luò)的泛化能力差、容易陷入局部最小值,因此,需要對(duì)網(wǎng)絡(luò)進(jìn)行改進(jìn)才能保證評(píng)估效果。
本文提出了一種改進(jìn)BP神經(jīng)網(wǎng)絡(luò),使用貝葉斯正則化方法和遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)。結(jié)論表明,該方法有效改善了網(wǎng)絡(luò)的性能,保證了預(yù)測(cè)精度。
目標(biāo)價(jià)值評(píng)估指標(biāo)的選取直接影響著評(píng)估結(jié)論的準(zhǔn)確性和客觀性。選取指標(biāo)時(shí),要充分考慮空地制導(dǎo)彈藥性能特點(diǎn)、作戰(zhàn)任務(wù)規(guī)劃和目標(biāo)屬性。
空地制導(dǎo)彈藥打擊目標(biāo)的過程可描述為3個(gè)階段:突防階段、制導(dǎo)階段和末端打擊階段。突防階段,彈藥突破敵方電磁干擾、地導(dǎo)高炮反擊等手段的封鎖,受目標(biāo)的反擊能力的影響;制導(dǎo)階段,彈藥通過制導(dǎo)系統(tǒng)導(dǎo)引抵達(dá)目標(biāo)上空并鎖定目標(biāo),受目標(biāo)偽裝程度、信息可靠程度等因素影響;末端打擊階段,彈藥抵達(dá)目標(biāo)并通過戰(zhàn)斗部毀傷目標(biāo),受彈藥毀傷特性、目標(biāo)易毀性等因素影響。只有順利完成3個(gè)階段的任務(wù),制導(dǎo)彈藥才能充分發(fā)揮自身的毀傷特性。綜合考慮打擊的3個(gè)階段和作戰(zhàn)任務(wù)規(guī)劃,并結(jié)合相關(guān)文獻(xiàn),選取如下目標(biāo)價(jià)值評(píng)估指標(biāo):
1)任務(wù)一致性:指目標(biāo)對(duì)主要作戰(zhàn)行動(dòng)的影響程度[2],體現(xiàn)在對(duì)我方戰(zhàn)術(shù)目標(biāo)的影響和對(duì)敵方企圖的影響兩方面。與主要作戰(zhàn)任務(wù)方向越一致,目標(biāo)價(jià)值越大。
2)打擊緊迫性:指對(duì)目標(biāo)進(jìn)行打擊的時(shí)限要求。體現(xiàn)在目標(biāo)對(duì)我方部隊(duì)產(chǎn)生危害所需時(shí)間和不對(duì)目標(biāo)進(jìn)行射擊目標(biāo)逃匿的可能性兩個(gè)方面,由目標(biāo)所處狀態(tài)和機(jī)動(dòng)性兩個(gè)因素決定[3]。對(duì)目標(biāo)進(jìn)行打擊的緊迫程度越高,目標(biāo)價(jià)值越大。
3)信息可靠性:指目標(biāo)信息的可靠程度。體現(xiàn)在情報(bào)信息的準(zhǔn)確性和目標(biāo)的偽裝程度兩個(gè)方面,情報(bào)越準(zhǔn)確、偽裝程度越低,目標(biāo)信息越可靠。信息可靠性越高,目標(biāo)價(jià)值越大。
4)目標(biāo)威脅性:指目標(biāo)火力強(qiáng)弱和作戰(zhàn)企圖對(duì)我方載機(jī)、指揮機(jī)構(gòu)乃至整個(gè)作戰(zhàn)意圖構(gòu)成威脅的大小。威脅程度越大,目標(biāo)價(jià)值越高。
5)目標(biāo)反擊能力:指目標(biāo)對(duì)彈藥打擊的抗擊強(qiáng)度以及可能對(duì)我造成的火力損傷程度[4]。主要體現(xiàn)在目標(biāo)對(duì)彈藥進(jìn)行封鎖和干擾的能力。目標(biāo)反擊能力越高,價(jià)值越高。
6)目標(biāo)易毀性:指受到相同程度的打擊后目標(biāo)的毀傷程度。體現(xiàn)在目標(biāo)被摧毀的難易程度和快速恢復(fù)能力兩個(gè)方面[5-6]。易毀性越高,目標(biāo)價(jià)值越大。
這6個(gè)指標(biāo)構(gòu)成了目標(biāo)價(jià)值的特征集,通過對(duì)6個(gè)指標(biāo)賦分,可完成對(duì)目標(biāo)價(jià)值的基本描述。
BP神經(jīng)網(wǎng)絡(luò)是指基于誤差反向傳播算法的多層前向神經(jīng)網(wǎng)絡(luò),由輸入層、輸出層和若干個(gè)隱含層組成,一個(gè)3輸入2輸出的三層BP網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 3輸入2輸出的三層BP網(wǎng)絡(luò)結(jié)構(gòu)
其學(xué)習(xí)過程可以描述為兩個(gè)過程:1)工作信號(hào)的正向傳播:輸入信號(hào)從輸入層經(jīng)隱單元,傳向輸出層,在輸出端輸出產(chǎn)生輸出信號(hào)。2)誤差信號(hào)反向傳播:網(wǎng)絡(luò)的實(shí)際輸出與期望輸出之間的差值即為誤差信號(hào),誤差信號(hào)由輸入端開始逐層向前傳播。當(dāng)誤差小于設(shè)定值、權(quán)值的變化很小或達(dá)到最大迭代次數(shù)時(shí),學(xué)習(xí)停止,神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成。
由于選取了6個(gè)評(píng)價(jià)指標(biāo),故本模型采用6輸入1輸出的BP網(wǎng)絡(luò)結(jié)構(gòu)。
傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)一般采用LM算法,將網(wǎng)絡(luò)的訓(xùn)練誤差平方和作為性能函數(shù),該算法的泛化能力較差。故采用貝葉斯正則化方法對(duì)BP網(wǎng)絡(luò)進(jìn)行改進(jìn),將神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值的均方差引入性能函數(shù),通過正則化系數(shù)的調(diào)整使小作用的連接權(quán)趨于零,在保證網(wǎng)絡(luò)精度的前提下,剪除冗余的連接權(quán)和神經(jīng)元,從而提高網(wǎng)絡(luò)的泛化能力[7]。
改進(jìn)后的性能函數(shù)如下:
網(wǎng)絡(luò)中的權(quán)值修正如下:
式中:E為修正后的性能函數(shù),EW為權(quán)衰減項(xiàng),ED為誤差函數(shù),α,β為正則化系數(shù),n為樣本數(shù)量,m為權(quán)值和閾值的數(shù)量,yi為第i個(gè)樣本的實(shí)際輸出,ti為第i個(gè)樣本的期望輸出,ωj為第j個(gè)權(quán)值(包含閾值),η為學(xué)習(xí)步長(zhǎng),vi為前一層的輸出。
貝葉斯正則化方法中,正則化系數(shù)決定著神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目標(biāo),α<<β時(shí),重點(diǎn)訓(xùn)練誤差函數(shù),可能出現(xiàn)過擬合現(xiàn)象;α>>β時(shí),重點(diǎn)訓(xùn)練權(quán)衰減項(xiàng),可能出現(xiàn)誤差較大的問題[8]。因此,正則化系數(shù)的確定十分關(guān)鍵。該方法將系數(shù)設(shè)為隨機(jī)變量,系數(shù)的概率密度最大時(shí)即為最優(yōu)正則化系數(shù),最優(yōu)解為:
式中:WP為E取最小值時(shí)所對(duì)應(yīng)的權(quán)值(包含閾值)矩陣,γ為有效參數(shù)個(gè)數(shù),為E在WP處的海森矩陣。
遺傳算法是一種借鑒生物界自然選擇和基因分離組合定律的全局優(yōu)化搜索算法。遺傳算法對(duì)參數(shù)的編碼從多點(diǎn)進(jìn)行操作,可以有效防止搜索過程陷于局部最優(yōu)解。BP網(wǎng)絡(luò)沿著誤差減小的最大梯度方向調(diào)整網(wǎng)絡(luò)權(quán)值,容易陷入局部最小值,采用遺傳算法優(yōu)化BP網(wǎng)絡(luò)的初始權(quán)值,可以有效改善此問題,優(yōu)化步驟如下[9]:
1)對(duì)BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行隨機(jī)種群初始化實(shí)數(shù)編碼;
2)計(jì)算種群適應(yīng)度,尋找最優(yōu)個(gè)體;將誤差函數(shù)絕對(duì)值作為適應(yīng)度函數(shù)F:
其中y為樣本的預(yù)測(cè)值,t為樣本的實(shí)際值。
3)進(jìn)行遺傳算子操作(選擇、交叉、變異),產(chǎn)生新一代個(gè)體。
選擇操作選用基于適應(yīng)度比例的輪盤賭法,個(gè)體i的選擇概率為pi:
交叉操作采用實(shí)數(shù)交叉法,第k個(gè)染色體ak和第l個(gè)染色體al在j位的交叉操作方法如下:
第i個(gè)染色體的第j個(gè)基因的變異操作方法如下:
其中 N 為種群數(shù),b、r為[0,1]間的隨機(jī)數(shù),amax為基因aij的上界,amin為基因aij的上界,r2為一個(gè)隨機(jī)數(shù),g為當(dāng)前迭代次數(shù),Gmax為最大進(jìn)化次數(shù)[10]。
4)判斷進(jìn)化是否結(jié)束,若是,則輸出最優(yōu)解,若否,則返回2)繼續(xù)操作。
5)對(duì)最優(yōu)個(gè)體解碼,確定BP網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值。
使用貝葉斯正則化方法和遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)具體流程如圖2所示:
圖2 貝葉斯正則化方法和遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程
根據(jù)Kolmogorow定理,一個(gè)三層的BP神經(jīng)網(wǎng)絡(luò)能夠逼近任意復(fù)雜的非線性映射,故采用三層BP神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)隱層數(shù)的確定沒有具體的理論依據(jù),可按公式來確定,n為輸入單元數(shù),m為輸出神經(jīng)元數(shù),k為[1,10]之間的常數(shù)。經(jīng)過多次測(cè)試,當(dāng)k取6時(shí),取得最佳預(yù)測(cè)精度,故隱含層取9個(gè)節(jié)點(diǎn)。BP神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置如下頁(yè)表1所示。
遺傳算法的參數(shù)設(shè)置如下頁(yè)表2所示。
訓(xùn)練樣本的質(zhì)量直接決定著網(wǎng)絡(luò)評(píng)估結(jié)果的準(zhǔn)確性,選擇樣本數(shù)據(jù)時(shí)應(yīng)當(dāng)注意樣本的代表性和數(shù)據(jù)的準(zhǔn)確性。假定我方遂行登島作戰(zhàn)任務(wù),計(jì)劃使用空地制導(dǎo)彈藥對(duì)敵進(jìn)行打擊,天氣狀況良好,彈藥性能正常。在此背景下,將專家評(píng)定的12類典型目標(biāo)的經(jīng)驗(yàn)數(shù)據(jù)作為樣本,標(biāo)準(zhǔn)化處理后,數(shù)據(jù)如表3所示,其中X1~X6為前述6個(gè)指標(biāo)得分,Y為目標(biāo)經(jīng)驗(yàn)價(jià)值。
表1 BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置
表2 遺傳算法參數(shù)設(shè)置
表3 典型目標(biāo)的指標(biāo)經(jīng)驗(yàn)數(shù)據(jù)
利用MATLAB軟件建立上文所述的改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型,將前9組數(shù)據(jù)用于訓(xùn)練,達(dá)到設(shè)定的精度要求后,利用后3組數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)試,測(cè)試結(jié)果與主成分分析法[11]和傳統(tǒng)BP網(wǎng)絡(luò)模型計(jì)算結(jié)果進(jìn)行對(duì)比。4種模型的仿真結(jié)果如表4所示。
表4 4種模型測(cè)試結(jié)果
兩種BP網(wǎng)絡(luò)評(píng)估結(jié)果與實(shí)際值的擬合曲線如圖3所示。
3種模型評(píng)估結(jié)果的誤差曲線如圖4所示。
圖3 兩種BP網(wǎng)絡(luò)評(píng)估結(jié)果與實(shí)際值擬合曲線
圖4 3種模型評(píng)估結(jié)果誤差曲線
由圖3、圖4可見,經(jīng)過貝葉斯正則化方法和遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)際值誤差最小,較改進(jìn)之前泛化能力更佳,建模精度優(yōu)越。
空地制導(dǎo)彈藥作為我空軍實(shí)施空中精確打擊的重要手段,研究其打擊目標(biāo)價(jià)值,對(duì)于提高其作戰(zhàn)效能,具有重要的現(xiàn)實(shí)意義和軍事價(jià)值。本文結(jié)合空地制導(dǎo)彈藥性能特點(diǎn)、作戰(zhàn)任務(wù)規(guī)劃和目標(biāo)屬性,選取了6個(gè)目標(biāo)價(jià)值評(píng)估指標(biāo)。此外,利用貝葉斯正則化方法和遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),建立了目標(biāo)價(jià)值評(píng)估模型,測(cè)試結(jié)果表明,優(yōu)化后模型性能優(yōu)異,在空地彈藥打擊目標(biāo)價(jià)值評(píng)估中具有實(shí)用意義,能夠?yàn)橹笓]機(jī)關(guān)決策提供依據(jù)或參考。