郭 帥 陳 婷 王鵬輝 丁 軍 嚴(yán)俊坤 王英華 劉宏偉
(西安電子科技大學(xué)雷達(dá)信號(hào)處理全國(guó)重點(diǎn)實(shí)驗(yàn)室 西安 710071)
雷達(dá)高分辨距離像(High-Resolution Range Profile,HRRP)是基于寬帶雷達(dá)信號(hào)獲取的目標(biāo)散射點(diǎn)子回波在雷達(dá)射線方向上投影的向量和,包含了大量與目標(biāo)尺寸、目標(biāo)物理結(jié)構(gòu)、散射點(diǎn)分布相關(guān)的信息。其中,HRRP的起伏反映了目標(biāo)散射結(jié)構(gòu)沿雷達(dá)視線方向的分布情況,HRRP的峰值反映了散射結(jié)構(gòu)的強(qiáng)弱。此外,相較于二維的合成孔徑雷達(dá)圖像,一維HRRP數(shù)據(jù)具有獲取容易、需要的存儲(chǔ)資源少等特點(diǎn)。這使得HRRP在雷達(dá)自動(dòng)目標(biāo)識(shí)別(Radar Automatic Target Recognition,RATR)領(lǐng)域有著廣泛的應(yīng)用。
現(xiàn)階段,基于HRRP的雷達(dá)目標(biāo)識(shí)別技術(shù)主要以單雷達(dá)獲取的回波作為主要數(shù)據(jù)來(lái)源,以深度網(wǎng)絡(luò)等方法作為主要特征提取模塊,配合分類(lèi)器實(shí)現(xiàn)對(duì)未知目標(biāo)的類(lèi)別判斷[1–3]。但是,隨著應(yīng)用場(chǎng)景不斷趨于復(fù)雜,基于單雷達(dá)的HRRP目標(biāo)識(shí)別系統(tǒng)逐漸無(wú)法滿足復(fù)雜場(chǎng)景的性能需求,識(shí)別準(zhǔn)確性和可靠性難以保證。針對(duì)這一問(wèn)題,多站協(xié)同目標(biāo)識(shí)別技術(shù)提供一種解決思路。其通過(guò)多部雷達(dá)在相同時(shí)刻對(duì)同一目標(biāo)從不同距離、不同視角進(jìn)行觀測(cè),利用多站數(shù)據(jù)之間的信息互補(bǔ)特性,能夠?qū)崿F(xiàn)更加準(zhǔn)確、穩(wěn)健的目標(biāo)識(shí)別[4–7]。
多站協(xié)同目標(biāo)識(shí)別主要涉及雷達(dá)信息融合處理技術(shù),根據(jù)融合模塊在信息流中所處的位置,可進(jìn)一步劃分為數(shù)據(jù)融合、特征融合、決策融合。如圖1所示,上述3種融合方式分別通過(guò)輸入數(shù)據(jù)維度拼接、中間隱層特征拼接、輸出識(shí)別概率加權(quán)的方式實(shí)現(xiàn)了多站雷達(dá)協(xié)同識(shí)別。
圖1 融合網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Schematic of different fusion network structures
近些年,復(fù)雜場(chǎng)景下的多站協(xié)同目標(biāo)識(shí)別方法逐漸成為RATR領(lǐng)域的研究重點(diǎn)[8–12]。文獻(xiàn)[13]提出了一種基于特征拼接的雙雷達(dá)微動(dòng)特征融合識(shí)別方法,該方法將兩個(gè)不同角度的雷達(dá)傳感器獲得的雷達(dá)數(shù)據(jù)分別進(jìn)行特征提取,將提取到的雙雷達(dá)微動(dòng)特征進(jìn)行融合,最后利用支持向量機(jī)進(jìn)行分類(lèi)。文獻(xiàn)[14]提出了一種基于多雷達(dá)傳感器融合行人識(shí)別方法,該方法首先對(duì)多雷達(dá)接收到的回波進(jìn)行時(shí)空對(duì)齊和數(shù)據(jù)關(guān)聯(lián),實(shí)現(xiàn)對(duì)行人和騎行者進(jìn)行自動(dòng)檢測(cè)、跟蹤和分類(lèi)。文獻(xiàn)[15]研究了多雷達(dá)傳感器網(wǎng)絡(luò)中目標(biāo)決策融合問(wèn)題,該研究將決策融合問(wèn)題建模為一個(gè)多輸入多輸出(Multi-Input Multi-Output,MIMO)系統(tǒng),提出了MIMO融合規(guī)則。上述研究結(jié)果表明:利用多角度或者多站點(diǎn)的雷達(dá)觀測(cè)的回波信號(hào)協(xié)同識(shí)別,有助于提高目標(biāo)識(shí)別的準(zhǔn)確性與穩(wěn)健性。然而,現(xiàn)階段的多站協(xié)同目標(biāo)識(shí)別方法缺乏對(duì)站間數(shù)據(jù)關(guān)聯(lián)性和差異性的建模,在站間數(shù)據(jù)差異大時(shí),往往難以取得較好的識(shí)別性能。此外,現(xiàn)有方法的融合策略較為簡(jiǎn)單,多采用數(shù)據(jù)拼接、特征拼接、加權(quán)決策等方法,難以實(shí)現(xiàn)多站信息的充分利用,一定程度上限制了現(xiàn)有多站協(xié)同目標(biāo)識(shí)別方法的性能提升。
針對(duì)上述問(wèn)題,本文提出了一種基于角度引導(dǎo)Transformer融合網(wǎng)絡(luò)的多站HRRP協(xié)同識(shí)別方法。首先,該方法采用Transformer結(jié)構(gòu)作為特征提取器,利用其突出的長(zhǎng)距離依賴關(guān)系提取能力,提取HRRP數(shù)據(jù)自身的時(shí)序特性和空間結(jié)構(gòu)相關(guān)性,獲得表征目標(biāo)結(jié)構(gòu)特性的回波特征。其次,針對(duì)多站數(shù)據(jù)差異大的問(wèn)題,本文設(shè)計(jì)了角度引導(dǎo)模塊。該模塊以目標(biāo)方位角度作為輔助信息,對(duì)多站數(shù)據(jù)差異進(jìn)行建模,一方面強(qiáng)化了所提特征與目標(biāo)方位的關(guān)系,提升了模型抵抗擾動(dòng)的能力,使得提取到的特征更加穩(wěn)健;另一方面,利用方位角度在多站隱層特征間構(gòu)建非線性映射,使經(jīng)角度引導(dǎo)模塊修正后的各站特征在隱空間內(nèi)具有較好的一致性,緩解了由多站數(shù)據(jù)差異性大引起的融合識(shí)別性能不足的問(wèn)題。然后,針對(duì)現(xiàn)有方法融合策略簡(jiǎn)單、難以實(shí)現(xiàn)多站信息充分利用的問(wèn)題,本文從多階段特征融合的角度,設(shè)計(jì)了前級(jí)特征交互模塊和深層注意力特征融合模塊,實(shí)現(xiàn)了對(duì)各站特征在特征提取各個(gè)階段的層次化融合。最后,基于實(shí)測(cè)數(shù)據(jù)設(shè)計(jì)了多站仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:本文方法可以有效實(shí)現(xiàn)多站HRRP特征融合,獲得優(yōu)于單站以及常規(guī)融合方法的識(shí)別性能。
本文提出了一種基于角度引導(dǎo)Transformer融合網(wǎng)絡(luò)的多站HRRP協(xié)同識(shí)別方法,整體結(jié)構(gòu)如圖2所示。模型可分為單支路特征提取部分與多支路特征融合部分。在單支路特征提取部分,首先對(duì)每一部雷達(dá)獲取的HRRP進(jìn)行數(shù)據(jù)預(yù)處理,將輸入HRRP進(jìn)行模2范數(shù)歸一、對(duì)齊消除幅度敏感性和平移敏感性。其次,將預(yù)處理后的單個(gè)HRRP樣本進(jìn)行子序列劃分、映射并添加位置編碼。然后,利用級(jí)聯(lián)的兩個(gè)Transformer層提取HRRP特征。最后,使用角度引導(dǎo)模塊對(duì)各支路中與目標(biāo)方位相對(duì)應(yīng)的特征進(jìn)行增強(qiáng)。在多支路特征融合部分,首先使用前級(jí)特征交互模塊對(duì)各站HRRP特征進(jìn)行特征學(xué)習(xí)階段的融合。這種早期融合策略使每一支路提早獲得其余支路的信息,降低后續(xù)融合任務(wù)的難度。然后,利用深層注意力特征融合模塊的自注意力機(jī)制對(duì)多站特征進(jìn)行交互,獲取各站特征間的相互依賴關(guān)系,然后根據(jù)依賴關(guān)系的強(qiáng)弱進(jìn)行自適應(yīng)的多站特征融合。最后,使用分類(lèi)層對(duì)融合特征進(jìn)行分類(lèi),獲得預(yù)測(cè)的目標(biāo)類(lèi)別。
圖2 角度引導(dǎo)Transformer融合網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Angle guided Transformer fusion network framework
由于HRRP的方位敏感性、幅度敏感性和平移敏感性會(huì)對(duì)模型提取穩(wěn)健的目標(biāo)特征產(chǎn)生一定影響[16],因此,需對(duì)HRRP進(jìn)行歸一和對(duì)齊預(yù)處理,減弱HRRP敏感性造成的影響。以單支路為例,復(fù)HRRP數(shù)據(jù)用r=[r1,r2,...,rL]T表示,其中ri表示第i個(gè)距離單元的子回波,L表示距離單元總數(shù)。對(duì)復(fù)HRRP 數(shù)據(jù)取幅值,得到實(shí)HRRP 數(shù)據(jù)x=|r|=[x1,x2,...,xL]T。針對(duì)幅度敏感性,本文采取模2范數(shù)歸一對(duì)實(shí)HRRP數(shù)據(jù)x進(jìn)行處理,得到幅度歸一化后的HRRP樣本xnorm∈R1×L,即
本文使用重心對(duì)齊方法克服平移敏感性。對(duì)xnorm進(jìn)行循環(huán)移位操作,使其重心位于距離窗的中心位置,得到重心對(duì)齊后的HRRP樣本xalign∈R1×L。xnorm的重心G可通過(guò)式(2)進(jìn)行計(jì)算:
為了使用Transformer模塊捕獲目標(biāo)局部子結(jié)構(gòu)的特征,還需要對(duì)xalign進(jìn)行切分映射并添加位置編碼,如圖3所示。xalign的劃分方式需要綜合考慮雷達(dá)距離分辨率、目標(biāo)子結(jié)構(gòu)描述粒度以及模型計(jì)算復(fù)雜度的影響。設(shè)P為每個(gè)HRRP子序列的長(zhǎng)度,N=L/P為劃分的HRRP子序列個(gè)數(shù),將xalign劃分為多個(gè)子序列后可表示為:
圖3 切分映射及位置編碼Fig.3 Patch embedding and positional embedding
其中,E∈RP×D表示輸入編碼器,表示子序列編碼,xemb∈RN×D表示編碼后的HRRP。本文用一個(gè)線性全連接層實(shí)現(xiàn)輸入編碼器,且所有子序列共享一個(gè)輸入編碼器。
同時(shí),為了無(wú)偏向性地對(duì)HRRP的每個(gè)子序列上的信息進(jìn)行聚合,在HRRP子序列前添加一個(gè)聚合向量xcls∈R1×D,用于在深層注意力特征融合模塊中聚合各站HRRP的特征。其次,為了充分利用HRRP子序列的空間位置關(guān)系,本文為聚合向量和xemb中每一個(gè)HRRP子序列添加可學(xué)習(xí)的時(shí)序位置編碼,即
其中,Epos∈R(N+1)×D表示位置編碼矩陣,xin∈R(N+1)×D表示預(yù)處理模塊的輸出,同時(shí)也作為第1個(gè)Transformer層的輸入。
HRRP子序列是對(duì)目標(biāo)局部子結(jié)構(gòu)的描述,本文使用Transformer提取目標(biāo)局部子結(jié)構(gòu)內(nèi)部以及子結(jié)構(gòu)之間的特征。Transformer是一種具有注意力機(jī)制的模型,近年來(lái)已經(jīng)在多個(gè)領(lǐng)域展現(xiàn)出了卓越的性能,并在序列建模問(wèn)題中逐漸取代了現(xiàn)有的CNN,RNN等模型[17,18]。相比之下,CNN結(jié)構(gòu)難以在淺層堆疊時(shí)獲取全局相關(guān)性,RNN結(jié)構(gòu)難以建模長(zhǎng)序列的遠(yuǎn)距離依賴關(guān)系。而Transformer結(jié)構(gòu)具有較優(yōu)的長(zhǎng)程依賴關(guān)系表征能力,可以利用自注意機(jī)制捕捉各個(gè)HRRP子序列的局部相關(guān)性和全局相關(guān)性。Transformer模塊由層歸一化、多頭自注意力層以及前饋層構(gòu)成,如圖4所示。下面詳細(xì)介紹每一層的功能與作用。
圖4 Transformer模塊Fig.4 The Transformer module
Transformer模塊中層歸一化的位置會(huì)影響訓(xùn)練時(shí)的穩(wěn)定性,pre-norm[19]將層歸一化操作放在殘差連接操作之前進(jìn)行,能在網(wǎng)絡(luò)層數(shù)較深時(shí)更好地防止模型的梯度爆炸或者梯度消失。因此,在這里采用pre-norm對(duì)輸入序列xin進(jìn)行層歸一化,即
Transformer模塊中多頭自注意力層用于對(duì)各輸入序列局部與全局關(guān)系的捕捉,提取長(zhǎng)距離依賴特征,增強(qiáng)了模型捕獲HRRP回波的復(fù)雜起伏變化、HRRP子序列間結(jié)構(gòu)相關(guān)性的能力。多頭注意力層的具體實(shí)現(xiàn)如下:首先將分別進(jìn)行3次線性映射,得到dq維的查詢矩陣Q,dk維的鍵矩陣K和dv維的值矩陣V,通過(guò)計(jì)算查詢矩陣Q和鍵矩陣K的乘積,并除以縮放因子,然后應(yīng)用softmax函數(shù)獲得注意力權(quán)重,依注意力權(quán)重對(duì)值矩陣V進(jìn)行加權(quán)即可得到自注意力輸出,如式(7):
Transformer模塊中前饋層包含一個(gè)多層感知器,能夠?qū)⑤斎胗成涞揭粋€(gè)高維隱空間,再?gòu)母呔S隱空間映射回原空間,對(duì)輸入在隱空間進(jìn)行了特征提取及篩選。前饋層的輸出表示如式(9):
其中,Transformer(·)表示一個(gè)Transformer層。
多站融合是為了充分利用多站在不同視角對(duì)目標(biāo)進(jìn)行觀測(cè)的信息多樣性,從而提升識(shí)別性能。然而,不同的觀測(cè)視角使得多站接收的數(shù)據(jù)間差異通常較大,直接融合往往難以取得較好的效果。目標(biāo)方位角度為目標(biāo)運(yùn)動(dòng)方向與雷達(dá)視線的夾角,各站的觀測(cè)視角對(duì)應(yīng)不同的目標(biāo)方位角度,故可以使用目標(biāo)方位角度描述多站數(shù)據(jù)的差異。因此,本文針對(duì)各站數(shù)據(jù)差異較大這一問(wèn)題,設(shè)計(jì)了角度引導(dǎo)模塊。一方面,通過(guò)對(duì)每個(gè)雷達(dá)站的HRRP特征提取過(guò)程引入與之對(duì)應(yīng)的目標(biāo)方位角度,能強(qiáng)化所提特征與目標(biāo)方位角度的對(duì)應(yīng)關(guān)系,提升了模型抵抗擾動(dòng)的能力,有利于提取相對(duì)穩(wěn)健的目標(biāo)特征。另一方面,根據(jù)之前的研究[20,21],不同視角下的目標(biāo)回波之間存在映射關(guān)系,利用方位角度編碼在多站隱層特征構(gòu)建非線性映射,提升了各站特征在隱空間的一致性,能夠緩解數(shù)據(jù)差異性引起的融合困難的問(wèn)題。
角度引導(dǎo)模塊的輸入由多層Transformer模塊的輸出特征f和目標(biāo)HRRP對(duì)應(yīng)的方位角度a兩部分構(gòu)成,其結(jié)構(gòu)如圖5所示。首先,通過(guò)角度編碼模塊對(duì)a進(jìn)行線性編碼,編碼模塊由兩個(gè)全連接層構(gòu)成,輸出γ(a)表示為
圖5 角度引導(dǎo)模塊Fig.5 The angle guided module
其中,W1,W2,b1和b2分別表示兩次線性變換的權(quán)重和偏置。然后,基于卷積模塊的映射函數(shù)?將Transformer層輸出特征進(jìn)行特征映射。映射函數(shù)?包括兩個(gè)卷積層,一個(gè)批歸一化層,一個(gè)GELU激活層。第1個(gè)卷積層將輸入特征f的特征通道數(shù)增大到原先的兩倍,第2個(gè)卷積層的輸出通道數(shù)與輸入特征f保持一致。特征映射過(guò)程表示為
其中,BN 表示批歸一化,1 D-Conv(·)表示一維卷積操作,非線性激活 GELU 的表達(dá)式為GELU(x)=x·Φ(x),其中Φ(x)為高斯分布的累積概率分布。最后,將經(jīng)過(guò)映射的特征與角度編碼相乘并使用殘差連接將其與輸入特征f求和。角度引導(dǎo)層輸出特征fout可表示為
傳統(tǒng)特征融合方法是將單站HRRP特征提取模塊輸出的特征進(jìn)行融合,這種融合方法僅對(duì)深層特征進(jìn)行了融合,未考慮各輸入淺層特征之間的關(guān)系。如果在特征提取的較早階段加入特征交互,則能提前對(duì)目標(biāo)進(jìn)行多方面描述,降低后續(xù)特征融合任務(wù)的難度。因此,本文方法從模型多階段特征融合的角度,設(shè)計(jì)了前級(jí)特征交互模塊和深層注意力特征融合模塊,實(shí)現(xiàn)了對(duì)多站特征在特征提取過(guò)程中多階段層次化的融合。前級(jí)特征交互模塊如圖6所示,通過(guò)將特征融合的時(shí)機(jī)前移,使得模型在淺層特征提取時(shí)就可以與來(lái)自其他雷達(dá)的淺層特征進(jìn)行關(guān)聯(lián)學(xué)習(xí)。
圖6 前級(jí)特征交互模塊Fig.6 The pre-feature interaction module
此處以三站交互為例,介紹前級(jí)特征交互模塊的具體流程。前級(jí)特征交互模塊的輸入特征為各站角度引導(dǎo)層的輸出,其中,上標(biāo)代表站序號(hào)。前級(jí)特征交互模塊的輸出可表示為
在多站協(xié)同目標(biāo)場(chǎng)景下,多站特征融合是實(shí)現(xiàn)穩(wěn)健、準(zhǔn)確識(shí)別的關(guān)鍵。本文設(shè)計(jì)的多階段特征融合除了對(duì)多站特征進(jìn)行加權(quán)的前級(jí)特征交互外,還設(shè)計(jì)了深層注意力特征融合模塊,模塊具體結(jié)構(gòu)如圖7所示。該模塊主要利用站間多視角特征的互補(bǔ)性,通過(guò)自注意力機(jī)制對(duì)站間特征的相關(guān)性建模,根據(jù)獲取的站間特征的相互依賴關(guān)系強(qiáng)弱,實(shí)現(xiàn)模型深層階段的自適應(yīng)特征融合,獲得更加準(zhǔn)確的識(shí)別結(jié)果。
深層注意力特征融合模塊的輸入為第2個(gè)前級(jí)特征交互模塊輸出的交互特征,。首先,經(jīng)特征提取獲得的多站特征處于各自的特征空間,在注意力特征融合前需要將各站特征經(jīng)過(guò)一個(gè)共享的深層映射層映射到同一高維特征空間,即
然后,利用Transformer層的自注意力機(jī)制對(duì)多站特征fin1∈R1×B,fin2∈R1×B,fin3∈R1×B間的相關(guān)性進(jìn)行建模,B為深層映射后高維特征空間的維度。由于多站特征融合的輸出應(yīng)與輸入次序無(wú)關(guān),所以此處沒(méi)有對(duì)多站特征添加位置編碼,使得特征融合所用的Transformer具有置換不變性。接著利用平均池化對(duì)交互后的特征進(jìn)行處理,獲得最終的融合特征。深層注意力特征融合層的輸出out可表示為
其中,[fin1,fin2,fin3]∈R3×B表示將多站拼接后作為輸入,Transformernp(·)表示置換不變Transformer層,Avgpooling(·)表示平均池化操作。最后,使用分類(lèi)頭對(duì)融合特征out進(jìn)行目標(biāo)類(lèi)別的預(yù)測(cè),得到識(shí)別結(jié)果。
考慮到多站協(xié)同場(chǎng)景下的融合識(shí)別,提出模型應(yīng)具備對(duì)站間輸入順序變化不敏感的特性,即模型應(yīng)需要具備置換不變性。傳統(tǒng)的序列神經(jīng)網(wǎng)絡(luò),如RNN對(duì)輸入序列的順序比較敏感,難以實(shí)現(xiàn)輸入數(shù)據(jù)無(wú)序性的相關(guān)性建模。然而,本文所用的置換不變Transformer則可以很好地符合這一特性。置換不變Transformer與用于特征提取的Transformer層的對(duì)比如圖8所示。特征提取階段利用Transformer進(jìn)行HRRP特征提取時(shí),對(duì)HRRP子序列引入了額外的位置編碼,這些位置編碼記錄了HRRP子序列間的相互位置關(guān)系,使得Transformer能夠建模這種時(shí)序相關(guān)性,實(shí)現(xiàn)局部與全局的特征提取,如圖8(a)所示。然而,置換不變Transformer通過(guò)舍棄位置編碼操作,實(shí)現(xiàn)無(wú)序數(shù)據(jù)間的相關(guān)性建模,使得多站融合輸出結(jié)果與輸入的各站HRRP特征順序無(wú)關(guān),如圖8(b)所示。
圖8 置換不變Transformer與Transformer特征提取層對(duì)比圖Fig.8 Comparison of permutation invariant Transformer in feature fusion and Transformer in feature extraction
實(shí)驗(yàn)中所用實(shí)測(cè)數(shù)據(jù)來(lái)自單部雷達(dá)采集的某一航線的5型目標(biāo)回波,雷達(dá)參數(shù)如表1所示。數(shù)據(jù)采集過(guò)程中,目標(biāo)的徑向距離變化范圍為40~100 km,方位角變化范圍為2°~50°。然后,將測(cè)量到的數(shù)據(jù)依目標(biāo)距離、方位角的變化劃分為3段,分別用每段數(shù)據(jù)作為各雷達(dá)站的觀測(cè)數(shù)據(jù)。其中,各站觀測(cè)數(shù)據(jù)中目標(biāo)的距離變化范圍約為20 km,方位角變化范圍約為16°。本文通過(guò)以上方式模擬三站場(chǎng)景進(jìn)行協(xié)同識(shí)別實(shí)驗(yàn)。
表1 雷達(dá)參數(shù)Tab.1 Parameters of radar
實(shí)驗(yàn)中所觀測(cè)的目標(biāo)共包含5型民航客機(jī),各類(lèi)目標(biāo)的物理參數(shù)如表2所示。圖9展示了模擬三站場(chǎng)景對(duì)應(yīng)的HRRP,圖中每一行分別代表不同型號(hào)的飛機(jī),每一列分別代表不同的雷達(dá)站點(diǎn)??梢钥闯鐾荒繕?biāo)在不同視角下觀測(cè)到的HRRP之間存在明顯差異,因此在多站協(xié)同條件下可以獲得更多與目標(biāo)相關(guān)的信息。
表2 目標(biāo)物理參數(shù)Tab.2 Parameters of targets
圖9 模擬多站場(chǎng)景的目標(biāo)HRRPFig.9 Target HRRP examples for simulating multistation scenarios
實(shí)驗(yàn)中,對(duì)每類(lèi)目標(biāo)分別采集不同架次的多批次數(shù)據(jù),并按采集批次劃分訓(xùn)練集和測(cè)試集。每個(gè)站點(diǎn)的訓(xùn)練集包含13349個(gè)樣本,測(cè)試集包含12314個(gè)樣本,每個(gè)HRRP樣本維度為256維,各型目標(biāo)的訓(xùn)練與測(cè)試樣本數(shù)如表3所示。
表3 數(shù)據(jù)集樣本分布Tab.3 Dataset samples distribution
實(shí)驗(yàn)中的所有方法均在單張RTX 3090顯卡上使用Pytorch實(shí)現(xiàn),訓(xùn)練損失函數(shù)采用交叉熵?fù)p失,優(yōu)化器采用AdamW[22],初始學(xué)習(xí)率設(shè)置為1E–3,訓(xùn)練輪次設(shè)置為200,訓(xùn)練批量大小設(shè)置為64,子序列長(zhǎng)度P為32,輸入編碼維度D設(shè)置為128,前級(jí)特征交互模塊中主支路權(quán)重w11,w22,w33均設(shè)置為0.6,其余支路權(quán)重設(shè)置為0.2,實(shí)驗(yàn)中的相關(guān)參數(shù)配置如表4所示。
表4 實(shí)驗(yàn)參數(shù)配置Tab.4 Experimental parameters configuration
為了評(píng)估所提方法在多站協(xié)同識(shí)別場(chǎng)景下的有效性,本文選取了多種方法進(jìn)行了識(shí)別性能對(duì)比。對(duì)比方法包括基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型的單站識(shí)別方法、基于CNN的數(shù)據(jù)融合方法[23]、基于CNN的特征融合方法[24]、基于CNN的決策融合方法[25]、基于Transformer的單站識(shí)別方法、基于Transformer的特征融合方法。其中,CNN單站識(shí)別方法由3層卷積層和兩層全連接層構(gòu)成,3層卷積層的通道數(shù)分別為8,16,32,卷積核大小均為1×5,步長(zhǎng)為1,全連接層神經(jīng)元數(shù)目分別是512和5?;贑NN模型的多站協(xié)同識(shí)別方法在單站CNN模型的基礎(chǔ)上分別構(gòu)建以數(shù)據(jù)拼接為輸入的數(shù)據(jù)融合識(shí)別方法、以特征拼接的特征融合識(shí)別方法和以單站預(yù)測(cè)概率加權(quán)的決策融合識(shí)別方法。基于Transformer模型的單站識(shí)別方法使用3層Transformer層提取特征,兩層全連接層用于最終識(shí)別。基于Transformer模型的特征融合方法將每個(gè)站的第3層Transformer層的輸出特征進(jìn)行拼接,作為本文基線方法。所有方法均在同一設(shè)備、相同超參數(shù)設(shè)置下完成。表5為所提方法與其他方法的識(shí)別結(jié)果對(duì)比。
表5 實(shí)驗(yàn)結(jié)果Tab.5 Experimental results
從表5可以看出,本文方法能夠提取高質(zhì)量的表征目標(biāo)特性的特征,并通過(guò)前級(jí)特征交互和深層注意力特征融合模塊有效利用各站觀測(cè)數(shù)據(jù)的互補(bǔ)性,從而在所有方法中獲得了最優(yōu)的識(shí)別性能,識(shí)別率達(dá)到96.90%。在單站識(shí)別方法中,基于CNN模型的單站識(shí)別方法的最優(yōu)識(shí)別率為90.71%,基于Transformer的單站識(shí)別方法的最優(yōu)識(shí)別率為93.21%。本文方法相較二者分別提升了6.19%和3.69%。對(duì)比各單站識(shí)別方法,由于Transformer模型能夠在關(guān)注HRRP局部結(jié)構(gòu)信息的同時(shí)關(guān)注HRRP的全局結(jié)構(gòu)信息,具有優(yōu)于CNN模型的特征表達(dá)能力,所以基于Transformer的單站方法的識(shí)別率全面優(yōu)于對(duì)應(yīng)的基于CNN的單站方法的識(shí)別率。在多站協(xié)同識(shí)別方法中,基于CNN模型的多站協(xié)同識(shí)別方法在使用決策融合時(shí)取得最優(yōu)90.96%的識(shí)別率,基于Transformer模型的特征融合方法的識(shí)別率為93.60%,本文方法相較二者分別提升了5.94%和3.30%。通過(guò)對(duì)比多站協(xié)同識(shí)別結(jié)果和單站識(shí)別結(jié)果,可以看出多站協(xié)同識(shí)別方法可以從額外的數(shù)據(jù)中獲得更多的關(guān)于目標(biāo)的信息,有效提升識(shí)別性能。本文方法進(jìn)一步通過(guò)使用多階段融合策略改善了傳統(tǒng)融合方法融合能力不足的問(wèn)題,獲得了顯著的識(shí)別性能提升。
表5還給出了各方法的參數(shù)量及計(jì)算量的對(duì)比。本文方法的參數(shù)量低于基于CNN模型的多站融合方法,計(jì)算量與其相當(dāng),而識(shí)別性能卻有著明顯提升,進(jìn)一步表明了本文方法的優(yōu)越性。
圖10為本文方法對(duì)應(yīng)的測(cè)試混淆矩陣。可以看出,本文方法對(duì)A320,A321的識(shí)別性能最好,識(shí)別率分別為99.77%和99.79%。對(duì)于A350,識(shí)別率為97.96%。對(duì)于A330-2,識(shí)別率為95.68%。A330-3的識(shí)別性能最差,識(shí)別率為91.64%。進(jìn)一步觀察類(lèi)間誤判情況,A330-2,A330-3和A350之間存在部分誤判,從表2可以看出:這3類(lèi)目標(biāo)的各項(xiàng)物理參數(shù)均比較接近。因此,這部分誤判主要是由目標(biāo)的物理特性相近造成的。
圖10 測(cè)試集識(shí)別率混淆矩陣(%)Fig.10 Confusion matrix of the recognition accuracy in test set (%)
為進(jìn)一步分析本文方法所提特征的可分性,使用t-SNE對(duì)歸一對(duì)齊后的測(cè)試集HRRP數(shù)據(jù)和經(jīng)本文方法處理所提取得到的特征進(jìn)行二維可視化[26,27],如圖11所示。圖中不同顏色、不同符號(hào)分別代表不同類(lèi)型的目標(biāo)??梢钥闯?,本文方法所提取到的隱層特征在二維可視化圖中呈現(xiàn)出類(lèi)內(nèi)分布緊致,類(lèi)間邊界清晰的特點(diǎn),各類(lèi)可分性較模型處理前有著明顯提升。
圖11 測(cè)試集數(shù)據(jù)與本文方法所提特征的二維t-SNE可視化Fig.11 Visualization of test data and feature via two-dimensional t-SNE
在基于角度引導(dǎo)Transformer融合網(wǎng)絡(luò)預(yù)處理過(guò)程中,需要確定劃分的HRRP子序列的個(gè)數(shù)N。N越大,劃分的HRRP子序列越多,對(duì)目標(biāo)局部結(jié)構(gòu)的關(guān)注粒度更精細(xì),但輸入序列數(shù)增多同時(shí)增加了模型學(xué)習(xí)的難度和計(jì)算量。相反,N越小,劃分的HRRP子序列越少,模型計(jì)算時(shí)所需的計(jì)算量也較少,但對(duì)目標(biāo)HRRP局部結(jié)構(gòu)的關(guān)注粒度更粗,影響模型的表征能力。在實(shí)際應(yīng)用中可根據(jù)實(shí)驗(yàn)數(shù)據(jù)選擇合適的N。為分析模型對(duì)N的依賴程度,設(shè)計(jì)從2到128不等的HRRP子序列個(gè)數(shù)作為輸入,測(cè)試其對(duì)識(shí)別率和計(jì)算量的影響。圖12給出了識(shí)別率以及計(jì)算量隨著N變化的曲線圖。當(dāng)N過(guò)大或過(guò)小時(shí),都會(huì)引起識(shí)別性能的顯著下降。當(dāng)N=8時(shí),模型取得最優(yōu)的識(shí)別性能,并具有相對(duì)較小的計(jì)算量。
圖12 識(shí)別率和計(jì)算量隨著HRRP子序列個(gè)數(shù)變化的曲線圖Fig.12 Accuracy and calculation amount changing with the number of HRRP subsequences
為了評(píng)估所提方法中各個(gè)模塊對(duì)識(shí)別性能的貢獻(xiàn),本文將上述Transformer特征融合方法作為基線方法,通過(guò)對(duì)基線方法中逐步添加各個(gè)模塊進(jìn)行消融實(shí)驗(yàn)。消融實(shí)驗(yàn)結(jié)果如表6所示?;€方法的識(shí)別率為93.60%。當(dāng)在基線方法中添加角度引導(dǎo)模塊時(shí),識(shí)別性能提升0.90%,表明所提出的角度引導(dǎo)模塊能有效地將目標(biāo)的角度先驗(yàn)融入到特征提取過(guò)程中,引導(dǎo)模型提取與目標(biāo)方位角匹配的特征。當(dāng)只添加前級(jí)特征交互模塊時(shí),識(shí)別性能下降0.40%,這是因?yàn)閮H進(jìn)行前級(jí)特征交互而未進(jìn)行深層特征融合時(shí),模型較難學(xué)習(xí)到多輸入之間的互補(bǔ)信息。當(dāng)只添加深層注意力特征融合模塊時(shí),識(shí)別性能提升0.10%,說(shuō)明注意力機(jī)制能改善特征融合的性能。當(dāng)同時(shí)添加角度引導(dǎo)和前級(jí)特征交互模塊時(shí),識(shí)別性能提升0.17%,由于缺乏深度特征融合,識(shí)別性能提升有限。當(dāng)同時(shí)添加前級(jí)特征交互和深層注意力特征融合模塊時(shí),識(shí)別性能提升0.87%,表明通過(guò)前級(jí)特征交互提前將其他雷達(dá)回波的信息與自身回波的信息進(jìn)行關(guān)聯(lián)學(xué)習(xí)對(duì)協(xié)同識(shí)別有益。當(dāng)同時(shí)添加角度引導(dǎo)和深層注意力特征融合模塊時(shí),識(shí)別性能提升2.08%,表明角度引導(dǎo)與深層注意力特征融合組合效果較好。最后,完整的基于角度引導(dǎo)Transformer融合網(wǎng)絡(luò)的平均識(shí)別率為96.90%,識(shí)別性能較基線提升3.30%,說(shuō)明所提出的3個(gè)模塊之間可以有效協(xié)作,獲得最大的識(shí)別性能提升。
表6 消融實(shí)驗(yàn)結(jié)果Tab.6 Results of ablation experiment
針對(duì)多站HRRP協(xié)同目標(biāo)識(shí)別問(wèn)題,本文提出了一種基于角度引導(dǎo)Transformer融合網(wǎng)絡(luò)的多站HRRP協(xié)同識(shí)別方法。首先,各站的HRRP回波經(jīng)預(yù)處理消除幅度敏感性和平移敏感性。然后,使用Transformer模塊提取單站回波特征,并利用角度引導(dǎo)模塊對(duì)單站特征進(jìn)行增強(qiáng)。接著,通過(guò)前級(jí)特征交互模塊和深層注意力特征融合模塊對(duì)多站特征進(jìn)行多階段層次化融合。最后經(jīng)分類(lèi)頭輸出多站協(xié)同目標(biāo)識(shí)別結(jié)果。在實(shí)測(cè)數(shù)據(jù)上的仿真實(shí)驗(yàn)結(jié)果表明,本文方法可以有效地對(duì)多站HRRP回波特征進(jìn)行融合,通過(guò)角度引導(dǎo)模塊、前級(jí)特征交互模塊和深層注意力特征融合模塊的有機(jī)結(jié)合,可以獲得優(yōu)于單雷達(dá)以及常規(guī)融合方法的識(shí)別性能。最后需要說(shuō)明的是,本文僅在雷達(dá)信號(hào)融合處理層面對(duì)多站協(xié)同目標(biāo)識(shí)別進(jìn)行了簡(jiǎn)要分析,在實(shí)際應(yīng)用中,多站協(xié)同目標(biāo)識(shí)別系統(tǒng)還面臨多雷達(dá)布站設(shè)置、參數(shù)配置、回波配準(zhǔn)等問(wèn)題。此外,當(dāng)部分回波因干擾等出現(xiàn)缺損時(shí),如何進(jìn)行雷達(dá)信號(hào)融合處理也是未來(lái)需要關(guān)注的問(wèn)題。