白黃琴,胡紅萍,白艷萍,王 鵬
(中北大學(xué)理學(xué)院,山西太原 030051)
在水聲領(lǐng)域中,矢量水聽器可測量聲場中的矢量參數(shù),它的應(yīng)用有助于獲得聲場的矢量信息,其發(fā)展可以推動聲納系統(tǒng)的技術(shù)水平。在矢量水聽器的研究中,波達方向也是重要研究方向之一。波達方向估計(Direction of Arrival Estimation,DOA)運用陣列信號處理的相關(guān)知識,確定同時處在空間某一區(qū)域內(nèi)多個人們所感興趣信號的空間位置。
針對來波到達角的估計問題,傳統(tǒng)的高分辨率算法有很多種,如多重信號分類(Multiple Signal Classification,MUSIC)算法[1]、旋轉(zhuǎn)不變子空間(Estimating Signal Parameters via Rotational Invariance Techniques,ESPRIT)算法[2]等。在某些情況下這些的確是一種解決問題的方法,但是大量的計算需要消耗很長的時間,對環(huán)境的要求很高,卻不一定能達到實際的精度要求。然而神經(jīng)網(wǎng)絡(luò)因其非線性映射及泛化能力的特點,優(yōu)點在于其建模過程采用訓(xùn)練樣本來構(gòu)造神經(jīng)網(wǎng)絡(luò)[3],在實際情況下采集到的訓(xùn)練樣本,可以將外界的環(huán)境、接收機噪聲、信號模型、傳輸通道等因素考慮進去,而無需進行特征值分解以及譜峰搜索[4],且計算使用時間也大大降低,從而有望應(yīng)用到實際工程。
但是BP 神經(jīng)網(wǎng)絡(luò)對初始權(quán)值的選擇非常敏感,由于參數(shù)選擇不當(dāng),往往陷入局部極小,收斂速度慢。作為一種智能優(yōu)化算法,灰狼優(yōu)化算法具有全局搜索能力、收斂速度快、收斂精度高等特點,彌補了神經(jīng)網(wǎng)絡(luò)算法的不足[5]。本文提出差分進化算法和灰狼算法相結(jié)合的混合差分灰狼算法,用來優(yōu)化BP 網(wǎng)絡(luò)并對矢量水聽器陣列信號進行DOA 估計。
2014 年Seyedali Mirjalili[6]提出模擬灰狼狩獵機制的灰狼優(yōu)化器(Grey Wolf Optimizer,GWO)?;依堑纳鐣燃壏譃棣?β,δ,ω四個等級,其中,α是領(lǐng)導(dǎo)者,β幫助α做出決定,δ必須服從α和β,保護和保障團隊的安全,ω扮演替罪羊的角色?;依谦C殺的主要階段有搜索獵物、包圍獵物、獵捕、攻擊獵物。
在GWO 中,創(chuàng)建一個隨機的灰狼群X(候選解),根據(jù)α,β,δ的位置估計獵物Xp的可能位置,每個候選解更新其與獵物的距離。引入矢量A,當(dāng)|A|<1 時,候選解趨向于向獵物靠近,以進行下一階段追趕,包圍獵物。參數(shù)a分別從2 降到0,以強調(diào)勘探和開發(fā)。參數(shù)r1,r2是取值為[0,1]中的隨機向量。
1)搜尋獵物
2)包圍獵物
3)獵捕(假設(shè)α(最佳候選解),β和δ對獵物的潛在位置有更好的認識)
4) 攻擊獵物
當(dāng)A的值在[-1,1]中隨機變化時,搜索代理的下一個位置是在它當(dāng)前的位置和獵物的位置之間進行變化的。當(dāng)|A|<1 時,狼群做出攻擊獵物的選擇,找到了最優(yōu)解。當(dāng)|A|>1 時,狼群往往會解散,遠離獵物,從而失去了最佳的解決方案。
差分進化(Differential Evolution,DE)算法是通過模擬生物進化機制提出的一種啟發(fā)式群智能搜索算法[7],存在類似于進化算法的計算步驟,包括變異、交叉和選擇三種操作[8]。
設(shè)種群大小為N,xi=[xi1,xi2,…,xin],i=1,2,…,N為第i個個體,為種群個體的下界,為種群個體的上界,xp1,xp2,xp3為父代種群中隨機選擇的三個不同矢量,并且p1≠p2≠p3|≠i,rand(0,1)是[0,1]上服從均勻分布的隨機數(shù),F(xiàn)為[0,1]之間的縮放比例因子,CR 為取值在[0,1]之間的交叉概率。
1)初始化種群個體
2)變異操作
3)交叉操作
4)選擇操作
在GWO 中,群體根據(jù)α,β,δ的位置信息來更新自身位置,迅速向最優(yōu)解集合[9],從而使得算法優(yōu)化精度高,收斂速度快,但容易致使整個狼群過早聚集于群體當(dāng)前最優(yōu)位置的某一鄰域內(nèi),種群的多樣性得不到有效保持,容易陷入局部最優(yōu);DE 算法采用DE/rand/1 的變異操作有利于保持種群的多樣性,但搜索效率偏低[10]。因此,本文提出GWO 與DE 相結(jié)合的差分灰狼算法(DEGWO)。
DEGWO 算法的具體步驟如下:
1)參數(shù)初始化,N,tmax,D,ub,lb,CR,F(xiàn),a,A和C。
2)對種群個體按式(9)實施DE 變異操作,得到中間體;然后按式(11)實施DE 選擇操作,產(chǎn)生初始化種群個體,設(shè)置迭代次數(shù)t=1。
3)計算灰狼種群中每個個體的目標函數(shù)值,按照目標函數(shù)值的大小進行排序,選出最優(yōu)的前三個個體分別記為Xα,Xβ和Xδ。
4)按式(5)計算種群中其他灰狼個體與最優(yōu)的Xα,Xβ和Xδ的距離,并依據(jù)式(6)和式(7)更新當(dāng)前每個灰狼個體的位置。
5)按式(1)和式(2)更新算法中a,A和C的值,按式(10)對種群個體的位置進行交叉操作,保留較優(yōu)良的成分,然后執(zhí)行式(11)進行選擇操作產(chǎn)生新的個體,計算所有灰狼個體的目標函數(shù)值。
6)更新最優(yōu)值前三的灰狼個體Xα,Xβ和Xδ的位置。
7)判定t是否達到tmax,若是,則算法結(jié)束,同時輸出Xα的值和Xα的目標函數(shù)值;若不是,令t=t+1,轉(zhuǎn)向步驟3)繼續(xù)執(zhí)行。
矢量水聽器陣列信號DOA 估計算法流程如圖1所示。
圖1 矢量水聽器陣列信號DOA 估計算法流程Fig.1 Flow chart of DOA estimation algorithm for vector hydrophone array signal
2.2.1 兩個信號源的DOA 估計
本文選用均勻的5 元天線陣列,信號源選用兩個非相干的正弦信號,信噪比為10 dB,快拍數(shù)為1 000,陣元間距為半波長。信號源之間的間隔分別取12°和18°,從-90°~90°每隔0.5°取1 個樣本,總共產(chǎn)生722 個樣本,作為訓(xùn)練樣本。信號源之間的間隔取15°,從-90°~90°每隔1°取一個樣本,共產(chǎn)生181 個樣本,作為測試樣本。以間隔取12°為例,當(dāng)?shù)谝粋€信號源為-90°時,第二個信號源為-78°;第一個信號源為-89.5°時,第二個信號源為-77.5°,按照這種間隔方式,覆蓋整個[-90°,90°]的范圍,進行200 次Monte-Carlo 仿真實驗。
本文分別利用BP 神經(jīng)網(wǎng)絡(luò),GWO-BP 網(wǎng)絡(luò),DEGWO-BP 網(wǎng)絡(luò)對兩信號源的DOA 方向進行估計,得到兩信號的DOA 估計時輸出預(yù)測曲線和估計誤差曲線圖,分別如圖2~圖5 所示。
圖2 和圖3 分別是第1 個信號和第2 個信號在3 種模型下的DOA 估計值和實際值。通過圖2,圖3 可以看出:用DEGWO-BP 網(wǎng)絡(luò)算法的預(yù)測值更接近實際值,而BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測值與實際值的差距最大,并且還有信息突變,誤差較大,而GWO-BP 網(wǎng)絡(luò)的算法預(yù)測值與實際值情況居中。圖4和圖5分別是第1個信號和第2個信號在3種模型下DOA 估計的誤差曲線。從圖4,圖5 可以看出:DEGWO-BP 網(wǎng)絡(luò)估計DOA 的誤差曲線基本上都在另外兩種算法的誤差曲線范圍之內(nèi),所以利用DEGWO-BP 網(wǎng)絡(luò)算法得到的誤差最小,而BP 神經(jīng)網(wǎng)絡(luò)估計DOA 得到的誤差最大。通過DOA 輸出曲線和誤差曲線可以看出,本文提出DEGWO-BP 方法用于DOA 估計有更高的精度。
圖2 信號1 的輸出預(yù)測曲線Fig.2 Curve of output prediction of signal 1
圖3 信號2 的輸出預(yù)測曲線Fig.3 Curve of output prediction of signal 2
圖4 信號1 的估計誤差曲線Fig.4 Curves of estimation error of signal 1
2.2.2 算法比較
在兩個信號源DOA 估計的仿真條件基礎(chǔ)上,選用平均絕對誤差(Mean Absolute Error,MAE)、均方誤差(Mean Square Error,MSE)和均方根誤差(Root Mean Square Error,RMSE)作為衡量算法的指標,得到表1,其中MAE1,MAE2 分別為第1 個信源和第2 個信源的指標。從表中兩個信號各個指標的反饋,得到DEGWO-BP算法和GWO-BP 算法不僅對BP 網(wǎng)絡(luò)用于DOA 估計有優(yōu)勢,對于文獻[11-12]中所提的PSO-BP 和SAPSO-BP算法更是達到了優(yōu)化的效果。所以本文提出的DEGWO-BP 算法用于DOA 估計具有一定的優(yōu)勢。
圖5 信號2 的估計誤差曲線Fig.5 Curves of estimation error of signal 2
表1 五種算法的DOA 估計誤差統(tǒng)計Table 1 Error statistics for DOA estimation of five algorithms
2.2.3 不同信噪比下的RMSE
仿真條件與上文相同,利用DEGWO-BP算法,GWOBP 算法,BP 算法依次估計在信噪比為-10 dB,-5 dB,0 dB,5 dB,10 dB,15 dB 的RMSE,并且與PSO-BP 算法和SAPSO-BP 算法的RMSE 進行比較。結(jié)果如表2 所示,表2 中的RMSE 為兩個信號源RMSE 的均值。
表2 五種算法在不同的信噪比下的RMSETable 2 RMSE of five algorithms at different SNR
從表2 的仿真結(jié)果可以看出:隨著信噪比的不斷增大,信源的RMSE 不斷減小,而且在低信噪比的情況下,GWO-BP 算法和DEGWO-BP 算法的均方誤差不僅比BP 網(wǎng)絡(luò)的效果要好,而且比PSO-BP 算法和SAPSOBP 算法好,并且要更加穩(wěn)定,還達到了優(yōu)化效果。所以本文提出的算法具有更好的估計精度,且算法運行的時間很快,具有更好的應(yīng)用前景。
本文提出差分進化算法與灰狼算法相結(jié)合的差分灰狼算法(DEGWO)優(yōu)化BP 神經(jīng)網(wǎng)絡(luò),用于實現(xiàn)矢量水聽器陣列信號的波達方向估計以及在不同信噪比下的誤差估計。仿真實驗結(jié)果表明,DEGWO-BP 網(wǎng)絡(luò)優(yōu)于BP,GWO-BP,PSO-BP 和SAPSO-BP 網(wǎng)絡(luò),不僅有更好的估計精度,更好的收斂速度和優(yōu)化性能,而且具有更好的普遍適用性以及良好的應(yīng)用前景。