傅蔚陽,劉以安,薛松
嚴(yán)格來講,目標(biāo)威脅估計(jì)是一個(gè)NP困難問題[1]。在進(jìn)行威脅估計(jì)時(shí),給出一個(gè)各種因素與威脅程度的函數(shù)關(guān)系困難很大。文獻(xiàn)[2]使用BP神經(jīng)網(wǎng)絡(luò)處理目標(biāo)威脅估計(jì)問題獲得了不錯(cuò)的結(jié)果,但BP神經(jīng)網(wǎng)絡(luò)也有著明顯缺點(diǎn),比如訓(xùn)練時(shí)間長(zhǎng)、易陷入局部極值、學(xué)習(xí)率η選擇敏感等。所以本文提出了改進(jìn)的磷蝦群算法(oppositionbased learning Krill Herd optimization, OKH)優(yōu)化極限學(xué)習(xí)機(jī)的目標(biāo)威脅估計(jì)模型。磷蝦群算法是2012年由Gandomi等[3]提出的一種新的仿生優(yōu)化算法。由于其參數(shù)少、模型簡(jiǎn)單、算法性能好而獲得大量運(yùn)用。但是在處理復(fù)雜的優(yōu)化問題時(shí),其易陷入局部極值和出現(xiàn)算法后期收斂速度變慢的問題[4]。極限學(xué)習(xí)機(jī)[5-6]是一種針對(duì)單隱含層前饋神經(jīng)網(wǎng)絡(luò)(single-hidden layer feedforward neural netwark, SLFN)的算法。該算法與傳統(tǒng)訓(xùn)練方法相比,具有學(xué)習(xí)速度快、泛化性能好的優(yōu)點(diǎn),但對(duì)初始權(quán)值與閾值過度依賴[7]。為解決上述缺點(diǎn),本文提出了OKH算法,利用收集到的目標(biāo)威脅度數(shù)據(jù)建立了目標(biāo)威脅估計(jì)模型 (extrem learning machine,ELM) ,并使用反向磷蝦群算法優(yōu)化ELM模型的初始參數(shù)。為了驗(yàn)證本模型的可靠性,將本模型與其他幾種神經(jīng)網(wǎng)絡(luò)模型作了對(duì)比研究。
KH算法是基于自然界磷蝦群尋找食物和相互通信的模擬,采用拉格朗日模型模擬磷蝦的移動(dòng)且引入了遺傳算子來提高物種多樣性[8-9]。在KH算法中,每個(gè)磷蝦都代表了n維解空間中的一個(gè)潛在解,磷蝦食物代表了算法尋優(yōu)需要找到的全局最優(yōu)解。與其他仿生算法相比,磷蝦群算法實(shí)現(xiàn)起來較為容易,除了時(shí)間間隔依據(jù)需求人為設(shè)定,剩余參數(shù)都取自真實(shí)生態(tài)的研究結(jié)果,所以有效避免了因參數(shù)設(shè)置不當(dāng)而導(dǎo)致的算法性能下降問題[10]。該算法具體流程如下。
1)磷蝦個(gè)體的速度更新公式為
式中:Xi為磷蝦的狀態(tài);Ni為受誘導(dǎo)運(yùn)動(dòng)的速度矢量;Fi為覓食行為的速度矢量;Di為隨機(jī)擾動(dòng)的速度矢量;下標(biāo)i表示第i只磷蝦。
2)受誘導(dǎo)運(yùn)動(dòng):
3)覓食行為:
式中:Finew表示覓食行為產(chǎn)生的速度矢量;Vf是覓食速度,一般取0.02 m/s;ωf(0,1)是覓食行為的慣性權(quán)重;βifood是食物的吸引力;βibest是從迭代開始到當(dāng)前時(shí)刻個(gè)體i的最優(yōu)狀態(tài);Fiold是上一次覓食行為產(chǎn)生的速度矢量。
4)隨機(jī)擾動(dòng):
式中:Dmax∈[0.002,0.010] m/s是最大擾動(dòng)速度;δ為每個(gè)變量服從(–1,1)均勻分布的方向矢量。
5)狀態(tài)更新:
式中: Δ t為時(shí)間間隔,必須根據(jù)實(shí)際問題進(jìn)行選擇。
最后,重復(fù)進(jìn)行受誘導(dǎo)運(yùn)動(dòng)、覓食行為、隨機(jī)擾動(dòng),直到滿足最大迭代次數(shù)后尋優(yōu)停止。
研究可以發(fā)現(xiàn),對(duì)于標(biāo)準(zhǔn)磷蝦群算法,隨著迭代次數(shù)的不斷增加,所有磷蝦個(gè)體都朝同方向運(yùn)動(dòng),使得磷蝦群趨同性變得嚴(yán)重[11-12]。本文采用反向?qū)W習(xí)策略[13-14]對(duì)標(biāo)準(zhǔn)磷蝦群算法的初始種群與迭代后的種群進(jìn)行改進(jìn),成功改善了磷蝦個(gè)體的分布特性和算法的尋優(yōu)范圍,使得算法精度和收斂速度得到較大提高。本算法主要有以下兩點(diǎn)改進(jìn)。
1)優(yōu)化初始種群位置
即使沒有先驗(yàn)知識(shí)的情況下,利用反向點(diǎn),也能獲得一組較好的初始候選解(初始種群)。過程如下:
①隨機(jī)初始化種群P。②計(jì)算反向種群OP,即
式 中 : a =1,2,···,Np; b =1,2,···,n ; O Pa,b和 Pa,b分 別表示反向種群位置與種群位置中a維第b個(gè)變量的值;分別表示第a維元素的最大值和最小值。
③分別計(jì)算P與OP中個(gè)體的適應(yīng)度,從中取適應(yīng)度值較好的n個(gè)體生成新的初始種群NP。
2)優(yōu)化迭代過程中的種群位置
同理,如果在迭代的過程中也使用類似的反向?qū)W習(xí)方法,就能夠提高算法的全局搜索能力。算法迭代開始前,設(shè)置反向?qū)W習(xí)優(yōu)化選擇概率p。每當(dāng)完成一次迭代,計(jì)算出新的種群位置后,依據(jù)p來決定是否對(duì)種群進(jìn)行反向?qū)W習(xí)優(yōu)化(p的大小根據(jù)實(shí)際需要決定)。過程如下:
①生成一個(gè)隨機(jī)數(shù)rand(0,1)。如果rand(0,1)<p,則轉(zhuǎn)入②,否則,直接進(jìn)入算法下一輪迭代。
②計(jì)算動(dòng)態(tài)反向種群OP:
式中, M inta與 M axta分別表示第t次迭代第a維元素的最小值與最大值。
③使用適應(yīng)度評(píng)價(jià)函數(shù)計(jì)算P和與其對(duì)應(yīng)的OP中個(gè)體的適應(yīng)度值。如果,則用OPi替代Pi,全部比較、替換后的種群P就是新的種群。其中,、分別表示第i個(gè)個(gè)體和與其對(duì)應(yīng)的反向個(gè)體的適應(yīng)度值,OPi表示第i個(gè)反向個(gè)體。
④進(jìn)入下一輪OKH迭代。
隨著搜索進(jìn)程的深入,當(dāng)前迭代的搜索區(qū)間遠(yuǎn)小于最初的搜索區(qū)間,使得種群快速逼近最優(yōu)解。
OKH算法流程:①參數(shù)初始化,即最大迭代次數(shù)I、種群規(guī)模N、最大擾動(dòng)速度Dmax、時(shí)間間隔以及優(yōu)化選擇概率p;②初始化種群位置并利用反向?qū)W習(xí)優(yōu)化初始種群位置;③計(jì)算此時(shí)每個(gè)磷蝦個(gè)體對(duì)應(yīng)的適應(yīng)度值;④分別計(jì)算受誘導(dǎo)運(yùn)動(dòng)、覓食行為、隨機(jī)擾動(dòng)所產(chǎn)生的個(gè)體位置變化量;⑤使用公式(5)更新磷蝦位置;⑥生成rand(0,1),如果 rand (0,1) < p,根據(jù)公式 (7)計(jì)算動(dòng)態(tài)反向種群并計(jì)算P與OP中個(gè)體的適應(yīng)度值。如果,則用OPi替代Pi,生成新的種群,否則直接進(jìn)入⑦;⑦計(jì)算磷蝦個(gè)體新位置矢量的適應(yīng)度,然后重復(fù)④~⑦,直到達(dá)到最大迭代次數(shù),算法結(jié)束;⑧輸出最終的迭代結(jié)果,即最優(yōu)解。
為了驗(yàn)證OKH算法,選擇6個(gè)基準(zhǔn)測(cè)試函數(shù)進(jìn)行仿真分析并與標(biāo)準(zhǔn)KH算法、PSO算法作比較。測(cè)試函數(shù)見表1。
表1 測(cè)試函數(shù)Table 1 Test functions
OKH算法和KH算法的參數(shù)設(shè)置一致:最大擾動(dòng)速度Dmax=0.005 m/s,覓食速度Vf=0.02 m/s,最大誘導(dǎo)速度Nmax=0.01 m/s。特別的,OKH中反向?qū)W習(xí)優(yōu)化選擇概率p=0.5。PSO參數(shù)設(shè)置為學(xué)習(xí)因子c1=c2= 1.5。為保證公平性,3種算法的其他參數(shù)一致:初始種群規(guī)模為30,最大迭代次數(shù)為200,維數(shù)為10,運(yùn)行次數(shù)為10。將10次尋優(yōu)的最優(yōu)值、最差值、平均值以及均方差記錄下來。實(shí)驗(yàn)結(jié)果如表2所示。
表2 3種算法的性能比較Table 2 Comparison of three algorithms
由表2可以發(fā)現(xiàn),相較于KH算法、PSO算法,OKH算法具有更好的尋優(yōu)效果。尤其在多峰函數(shù)中表現(xiàn)更為優(yōu)異,不僅搜索精度更高而且跳出局部最優(yōu)的能力更強(qiáng)。從均方差可知,OKH算法的魯棒性也優(yōu)于另外兩種算法。
目標(biāo)威脅估計(jì)問題需要統(tǒng)籌的因素很多,比如天氣、地形、敵、我、鄰軍的戰(zhàn)斗力及兵力部署和指戰(zhàn)員作戰(zhàn)風(fēng)格等[15-16]。進(jìn)行威脅估計(jì)時(shí),通常需考慮以下的因素:
1)目標(biāo)類型:大型目標(biāo)(強(qiáng)擊機(jī)、轟炸機(jī)等)、小型目標(biāo)(隱身飛機(jī)、空地導(dǎo)彈等)、武裝直升機(jī)。
2)目標(biāo)速度:如 30 m/s、44 m/s、120 m/s等。
3)目標(biāo)方位角:如 3°、6°、9°等。
4)目標(biāo)高度:如低空、中空、高空。
5)目標(biāo)抗干擾能力:如無、弱、中、強(qiáng)。
6)目標(biāo)距離:如50 km、100 km、150 km等。
對(duì)于隨機(jī)產(chǎn)生初始輸入權(quán)值和閾值的極限學(xué)習(xí)機(jī),很難保證訓(xùn)練的ELM模型擁有較好的泛化能力和較高的預(yù)測(cè)精度[17-18]。針對(duì)以上不足,本文在采用極限學(xué)習(xí)機(jī)建立目標(biāo)威脅估計(jì)模型的基礎(chǔ)上,利用OKH算法優(yōu)化ELM初始輸入權(quán)重和偏置,提出了基于OKH-ELM的目標(biāo)威脅估計(jì)模型。模型優(yōu)化過程如圖1所示。
1)數(shù)據(jù)預(yù)處理
收集105組數(shù)據(jù),大型目標(biāo)、小型目標(biāo)和武裝直升機(jī)各35組。隨機(jī)選擇大型目標(biāo)、小型目標(biāo)和武裝直升機(jī)各30組,共90組,做訓(xùn)練集,剩余15組做測(cè)試集。部分?jǐn)?shù)據(jù)如表3所示。
使用9級(jí)量化理論對(duì)威脅屬性量化[19]。對(duì)定性屬性做如下預(yù)處理。
①目標(biāo)高度:超低、低、中、高,依次量化為2、4、6、8。
②目標(biāo)抗干擾能力:強(qiáng)、中、弱、無,依次量化為 2、4、6、8。
③目標(biāo)類型:大型目標(biāo)、小型目標(biāo)、武裝直升機(jī)依次量化為 3、5、8。
對(duì)于目標(biāo)距離、目標(biāo)方向角和目標(biāo)速度則直接進(jìn)行歸一化操作。
2)確定ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
ELM隱含層神經(jīng)元個(gè)數(shù)與訓(xùn)練集樣本個(gè)數(shù)有關(guān),經(jīng)多次實(shí)驗(yàn),設(shè)置20個(gè)神經(jīng)元預(yù)測(cè)結(jié)果較好。ELM三層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為6-20-1,輸入層與隱含層間連接權(quán)值及隱含層神經(jīng)元閾值的尋優(yōu)范圍均為[-1,1],隱含層激活函數(shù)為Sigmoid。
圖1 基于OKH-ELM的目標(biāo)威脅估計(jì)模型Fig. 1 Model of target threat assessment using OKH-ELM
表3 部分?jǐn)?shù)據(jù)Table 3 Parts of data
3)OKH參數(shù)初始化
OKH算法的參數(shù)設(shè)置與1.3節(jié)的OKH參數(shù)設(shè)置相同。
4)OKH初始化種群
個(gè)體編碼方法采用實(shí)數(shù)編碼,用實(shí)數(shù)串表示每個(gè)個(gè)體。該實(shí)數(shù)串由ELM輸入層與隱含層之間的權(quán)值和隱含層的閾值兩部分組成。因?yàn)镋LM網(wǎng)絡(luò)結(jié)構(gòu)為6-20-1,所以磷蝦個(gè)體的編碼長(zhǎng)度為 6×20+20=140。
5)目標(biāo)適應(yīng)度函數(shù)
式中:n為測(cè)試樣本數(shù),yi為模型的訓(xùn)練輸出威脅度,oi為實(shí)際威脅度,k為常數(shù)。
6)執(zhí)行OKH算法
OKH算法流程與1.2節(jié)的OKH算法流程相同。
7)預(yù)測(cè)輸出
利用OKH算法優(yōu)化好的初始權(quán)值與閾值來構(gòu)造ELM。將測(cè)試集數(shù)據(jù)輸入已經(jīng)訓(xùn)練過的ELM,預(yù)測(cè)目標(biāo)威脅度。
為測(cè)試OKH-ELM目標(biāo)威脅估計(jì)模型的有效性,將測(cè)試數(shù)據(jù)分別輸入OKH-ELM、ELM、KHELM、KH-BP、PSO-ELM模型比較預(yù)測(cè)輸出。
KH-ELM模型、PSO-ELM模型的建立與OKH-ELM相似,僅將優(yōu)化函數(shù)分別改成標(biāo)準(zhǔn)KH算法和PSO算法。KH-BP模型利用KH算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)初始的全部權(quán)值和閾值[20],采用6-11-1的網(wǎng)絡(luò)結(jié)構(gòu),磷蝦個(gè)體編碼長(zhǎng)度為6×11+11+11+1=89。采用訓(xùn)練好的上述5種模型分別對(duì)相同的威脅度測(cè)試集進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果如圖2、圖3和表4所示。
圖2 OKH-ELM的預(yù)測(cè)威脅值與真實(shí)威脅值對(duì)比Fig. 2 Comparison between forecasting values and real threat values based on OKH-ELM
圖3 5種模型的預(yù)測(cè)誤差絕對(duì)值Fig. 3 Absolute predictive error for five models
表4 5種優(yōu)化方法的絕對(duì)預(yù)測(cè)誤差平均值Table 4 Average of absolute predictive errors of five optimization methods
由圖2可知,OKH-ELM模型輸出的預(yù)測(cè)威脅值與真實(shí)威脅值擬合度很高。由圖3、表4可知,OKH-ELM威脅估計(jì)模型的預(yù)測(cè)誤差平均值小于其他4種威脅估計(jì)模型,預(yù)測(cè)結(jié)果最接近真實(shí)值。除了在第4、5、15個(gè)樣本處,OKH-ELM模型預(yù)測(cè)誤差不是最小(但也十分接近最小誤差),其余樣本點(diǎn)預(yù)測(cè)誤差均最小。5種模型的優(yōu)異度排序?yàn)椋篛KH-ELM>KH-ELM>KH-BP>PSOELM>ELM。實(shí)驗(yàn)結(jié)果顯示,本文構(gòu)造的OKHELM目標(biāo)威脅估計(jì)模型能夠較好地應(yīng)對(duì)目標(biāo)威脅估計(jì)問題,模型性能優(yōu)于另外4種模型。
本文針對(duì)多源信息融合中目標(biāo)威脅估計(jì)的特點(diǎn),利用改進(jìn)磷蝦群算法與極限學(xué)習(xí)機(jī),建立了一種基于改進(jìn)磷蝦群算法優(yōu)化極限學(xué)習(xí)機(jī)的目標(biāo)威脅估計(jì)模型,并提出了該模型的算法。文中選取影響目標(biāo)威脅估計(jì)的6個(gè)典型指標(biāo),采集了105組數(shù)據(jù)用于仿真實(shí)驗(yàn)。結(jié)果表明,相比于ELM、PSO-ELM、KH-BP、KH-ELM,OKH-ELM模型能夠更加準(zhǔn)確、有效地預(yù)測(cè)目標(biāo)威脅值,為目標(biāo)威脅估計(jì)提供了一種新的方法。