岳智彬 盧建斌 萬 露
(海軍工程大學(xué)電子工程學(xué)院 武漢 430033)
雷達(dá)高分辨距離像(HRRP)是目標(biāo)散射點子回波在雷達(dá)視線方向投影的矢量和,它包含了目標(biāo)尺寸和散射點分布等重要結(jié)構(gòu)信息,并且相比于圖像數(shù)據(jù),HRRP 易于獲取、存儲和快速處理[1]。因此,利用艦船HRRP進行目標(biāo)識別已經(jīng)成為了雷達(dá)自動目標(biāo)識別的重要研究領(lǐng)域[2~7]。文獻[8]將RNN 應(yīng)用到了HRRP 識別中,取得了較好的效果,文獻[9]將RNN 于注意力機制相結(jié)合,細(xì)化每一段數(shù)據(jù)識別中所起的作用,提取更為有效的特征,文獻[10]采用雙向的LSTM 模型,并引入截斷的機制選擇對于平移敏感性穩(wěn)健的特征,提高了模型對于平移敏感性的魯棒性。為了提取對識別更為顯著的特征,同時降低運算的復(fù)雜度,本文提出了SRU-Atten 艦船目標(biāo)HRRP 識別方法。該模型將SRU[11]與Transformer[12]中的自注意力模塊相結(jié)合,通過SRU對HRRP數(shù)據(jù)進行編碼,得到含有局部特征的隱藏狀態(tài)向量。將得到的隱藏狀態(tài)向量輸入自注意力模塊中計算注意力數(shù)值,量化HRRP樣本中不同距離單元在識別中的作用大小,從而使模型更關(guān)注對識別有效的目標(biāo)區(qū)域,提高模型的識別性能。通過堆疊有SRU單元,自注意力機制和前饋神經(jīng)網(wǎng)絡(luò)組成的模塊構(gòu)建深層網(wǎng)絡(luò),提取深層特征,進一步提高識別效果。
雷達(dá)目標(biāo)的原始HRRP 數(shù)據(jù)存在姿態(tài)敏感性,幅度敏感性和平移敏感性[13]等問題,這些敏感性對模型的識別性能有很大的影響。所以在使用模型進行識別之前,本文對原始的艦船目標(biāo)HRRP進行了2 范數(shù)歸一化來消除幅度敏感性。假設(shè)經(jīng)過幅度歸一化之后的HRRP 數(shù)據(jù)為p=[p1,p2,…,pL]T。其中L為距離單元的個數(shù),pi(i=1,2,…,L)為第i個距離單元的幅度歸一化后的數(shù)值。在使用對艦船目標(biāo)HRRP 數(shù)據(jù)進行目標(biāo)識別時,要將時域HRRP轉(zhuǎn)化為序列數(shù)據(jù)之后,輸入模型中進行目標(biāo)的分類識別。
采用文獻[9]滑窗方法,將經(jīng)過幅度歸一化之后的HRRP數(shù)據(jù)轉(zhuǎn)化為序列數(shù)據(jù)。設(shè)定一個滑窗,寬度為d,滑動距離為c:
其中,xl∈?d?1為時刻l的輸入,長度為d。矩陣X∈?d*T對應(yīng)的是T 個時間步,每個時間步下的數(shù)據(jù)維度為d。
圖1 為一個時間步下的SRU 單元的運算過程。xt代表t 時刻的輸入,xt∈?d*1,d 為輸入數(shù)據(jù)的維度。ht和ct分別代表SRU 單元t 時刻的輸出和單元狀態(tài),ht∈?m*1,ct∈?n*1,n 是隱藏層單元的維度,m 是艦船目標(biāo)的類別個數(shù)。ft和rt代表t時刻的遺忘門和重置門,其中的σ和g分別代表著sigmoid 激活函數(shù)和tanh 激活函數(shù),函數(shù)表達(dá)式分別為σ(x)=1/(1+exp(-x)),g(x)=(exp(x)-exp(-x))/(exp(x)+exp(?x)),W*表示線性變換。圖中的乘法和加法運算都代表著矩陣對應(yīng)元素之間的相乘。
圖1 SRU結(jié)構(gòu)單元圖
t時刻的輸入xt經(jīng)過一個線性變換得到,同時xt經(jīng)過遺忘門得到遺忘門的輸出ft:
其中Wf是遺忘門的權(quán)值矩陣,W為線性層的權(quán)值矩陣。遺忘門決定保留數(shù)據(jù)中對艦船目標(biāo)識別的重要信息,“忘記”數(shù)據(jù)中不重要的信息。
遺忘門的輸出ft用來調(diào)制單元的內(nèi)部狀態(tài)ct,結(jié)合前一時刻的單元內(nèi)部狀態(tài)ct?1和線性層的輸出,將保留的重要信息傳入ct中,根據(jù)ct求出當(dāng)前的輸出結(jié)果:
本文提出了一種適用于艦船目標(biāo)HRRP 識別的注意力模型,3 層的模型結(jié)構(gòu)如圖2 所示。模型在SRU 網(wǎng)絡(luò)的基礎(chǔ)上,增加了Transformer 中的自注意力模塊來衡量每一個時間步的數(shù)據(jù)在目標(biāo)識別中重要性,從而使得網(wǎng)絡(luò)可以自適應(yīng)對重要的數(shù)據(jù)部分施加更大的權(quán)重。模型的關(guān)鍵部分是由SRU 單元,自注意力單元和前饋神經(jīng)單元組成SRU-Atten 模塊。通過堆疊SRU-Atten 模塊,提取易于識別的深層特征。輸入序列由N 層SRU-At?ten模塊編碼,得到最終的特征向量,輸入到識別網(wǎng)絡(luò)進行目標(biāo)分類識別。
圖2 SRU-Atten模型
假設(shè)將SRU模塊運算過程簡化為
將得到的h1,h2,…,ht作為自注意力模塊的輸入,進行注意力的運算。自注意力模塊如圖3 所示。
圖3 自注意力模塊
自注意力模塊的表達(dá)式如下:
其中Q,K,V 是三個鍵值向量。dk是K 向量的維數(shù),Q,K,V 是對前一層的輸出進行線性變換而得到。通過計算Q 與K 之間的注意力分布,并附加在V 上得到最終注意力值。為了梯度在反向傳播過程中的穩(wěn)定,式(8)中對運算結(jié)果先進行了縮放歸一化,即除以了
前饋神經(jīng)網(wǎng)絡(luò)層主要是利用非線性的激活函數(shù)對輸出的結(jié)果進行特征轉(zhuǎn)化,增強網(wǎng)絡(luò)的擬合效果,包括兩個線性層和一個ReLU 激活函數(shù)的非線性層:
所有的單元之間使用了層歸一化和殘差連接。通過歸一化和殘差連接處理后,可以有效的緩解訓(xùn)練過程中出現(xiàn)的梯度消失,使網(wǎng)絡(luò)以更快的速度收斂。以SRU 單元為例,假設(shè)輸入序列為X,則表達(dá)式如(10)所示:
假設(shè)SRU-Atten 模塊有M 層,將經(jīng)過最后一層得到的輸出結(jié)果x1M+1,x2M+1,…,xTM+1經(jīng)過一個包含單個線性層的網(wǎng)絡(luò),最后通過Softmax 函數(shù)得到樣本屬于每一類的概率矩陣:
其中y'表示樣本屬于每一類艦船目標(biāo)的概率向量。
識別網(wǎng)絡(luò)使用交叉熵?fù)p失函數(shù),其公式為
其中M 是類別數(shù),是符號函數(shù),如果樣本i 的真是類別等于c 是取1,否則取0.pic是樣本i 屬于類別c的概率。
艦船目標(biāo)多為非合作目標(biāo),很難通過實測數(shù)據(jù)建立目標(biāo)的HRRP 數(shù)據(jù)庫。本文利用CAD3D 軟件建立10種1:1的艦船目標(biāo)模型,導(dǎo)入CST電磁仿真軟件,10 種艦船目標(biāo)的結(jié)構(gòu)參數(shù)如表1 所示。CST仿真參數(shù)設(shè)置如下:方位角為0°~360°,俯仰角為90°,角度步長為1°;雷達(dá)的中心頻率為3GHz,帶寬為150MHz,極化方式包括垂直極化和水平極化,頻率采樣點數(shù)為360,采用軟件默認(rèn)的最優(yōu)網(wǎng)格剖析尺寸,選擇射線追蹤算法進行求解。最終,仿真10種艦船目標(biāo)的360個方位角的HRRP數(shù)據(jù)。
表1 10種艦船目標(biāo)的結(jié)構(gòu)參數(shù)
訓(xùn)練樣本匱乏會導(dǎo)致模型的過擬合,用CST仿真的HRRP數(shù)量對所提模型來說遠(yuǎn)遠(yuǎn)不夠,需要對其進行擴充。本文按信雜比大小為10dB,對原始數(shù)據(jù)分3 次加入符合K 分布的雜波對數(shù)據(jù)進行擴充,在每個信雜比下將數(shù)據(jù)擴充3倍。
模型參數(shù)設(shè)置:訓(xùn)練的總輪數(shù)為300,初始學(xué)習(xí)率為0.03,在訓(xùn)練的過程中每80 輪學(xué)習(xí)率變?yōu)樵瓉淼乃姆种?,隱藏層的維度均設(shè)置為128。Transformer 中的多頭注意力中自注意力模塊的個數(shù)為4,優(yōu)化器選擇的是隨機梯度下降法(SGD),批大小為32。預(yù)處理的滑窗長度d=48,平移距離l=24。
為了探求堆疊層數(shù)對識別性能的影響,取層數(shù)1~8,識別準(zhǔn)確率與層數(shù)之間的關(guān)系如圖4 所示。除了LSTM 模型外,其余模型隨著模型深度的增加,模型能夠?qū)W習(xí)到更深層的特征,模型的識別性能也得到了提升。相比于其他模型,本文所提的SRU-Atten 模型,能夠在不同深度下都保持較好的識別性能。為了檢驗?zāi)P偷淖罴研阅?,本文所使用的模型均?層。
圖4 5種模型層數(shù)與識別準(zhǔn)確率的關(guān)系
為了驗證SRU-Atten 模型對艦船目標(biāo)HRRP識別的有效性,將SRU-Atten 模型同RNN,LSTM,SRU和Transformer模型進行了比較,識別結(jié)果如表2 所示。從表2 中可以看出,相對于經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN 與LSTM 來說,SRU,Transformer 和SRU-Atten 模型可以更有效地識別目標(biāo)。SRU 模型改變輸入數(shù)據(jù)流的處理方式,通過構(gòu)建深層網(wǎng)絡(luò)提取HRRP 的深層特征。而Transformer 中則是通過多頭注意力機制,通過位置匹配,尋找對于檢測重要的特征區(qū)域。SRU-Atten 模型兼顧了SRU 和Transformer的優(yōu)點,采用SRU 模型提取HRRP 數(shù)據(jù)的時序特性,放大每個時間步中易于識別的特征,同時使用自注意力模塊來尋找對于識別重要的時間步,得到一組注意力分布函數(shù),對重要特征進行加權(quán)放大,更好地識別目標(biāo)。實驗結(jié)果證明,SRU-Atten 模型取得了最好的識別效果,相比SRU和Transformer模型,準(zhǔn)確率提高了2%~2.5%。
表2 各模型對10類艦船目標(biāo)的識別結(jié)果(%)
為了直觀體現(xiàn)模型提取特征能力,本節(jié)將經(jīng)5類模型提取到的頂層特征和原始HRRP 降維可視化,其二維ISOMAP 可視化投影如圖5 所示。十種顏色的散點代表十類艦船目標(biāo)通過對比,原始艦船目標(biāo)的HRRP數(shù)據(jù)不同類別樣本重疊在一起,而經(jīng)過模型提取特征后,相同類別的樣本聚集在一起,不同類別樣本間的距離在增大,重疊區(qū)域在減小,可分性更好。經(jīng)過RNN 和LSTM 模型提取的特征,相同類別樣本聚集不明顯,不同類別樣本邊界重疊,而經(jīng)過SRU 模型提取的特征,相同類別的樣本聚集效果有了極大的提升,更有利于區(qū)分目標(biāo),但不同類別樣本仍有較大的重疊部分,隨著模型的改進,Transformer 和SRU-Atten 模型提取特征后,相同類別樣本聚集效果越來越好,不同類別樣本間的重疊區(qū)域越來越小,具有更好的可分性,其中SRU-Atten 模型,通過結(jié)合SRU 和Transformer 自注意力模塊后提取的目標(biāo)特征具有最好的可視化效果。
圖5 2維ISOMAP投影
本文提出的SRU-Atten 模型將SRU 和自注意力機制相結(jié)合,利用SRU提取HRRP內(nèi)部的時序特性,通過自注意力機制提取對HRRP識別有明顯作用的重要特征,同時堆疊有SRU,自注意力和前饋神經(jīng)網(wǎng)絡(luò)組成的模塊提取HRRP是深層抽象特征,并將其運用于目標(biāo)的識別過程中。實驗表明該模型能夠提取易于區(qū)分的深層特征,有效識別艦船目標(biāo)。