徐 彬,陳 渤,劉家麒,王鵬輝,劉宏偉
(1.西安電子科技大學(xué) 雷達(dá)信號(hào)處理國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710071; 2.西安電子科技大學(xué) 信息感知技術(shù)協(xié)同創(chuàng)新中心, 陜西 西安 710071)
雷達(dá)高分辨距離像(High Resolution Range Profile, HRRP)是雷達(dá)寬帶信號(hào)獲取的目標(biāo)散射點(diǎn)子回波在雷達(dá)射線投影的向量和幅度波形,它包含了目標(biāo)的尺寸、散射點(diǎn)分布、物體結(jié)構(gòu)等重要信息,易于獲取和處理,因此被廣泛地應(yīng)用于雷達(dá)自動(dòng)目標(biāo)識(shí)別(Radar Automatic Target Recognition, RATR)領(lǐng)域[1-7]。在目標(biāo)識(shí)別中,如何提取有效的特征是核心問題。有效的特征不僅可以充分地表達(dá)數(shù)據(jù),并且能夠區(qū)分不同類別的差異性,從而提高識(shí)別的精度。
針對(duì)這一問題,很多學(xué)者對(duì)特征提取進(jìn)行了廣泛的研究。文獻(xiàn)[1]從數(shù)據(jù)的包絡(luò)信息中提取了平移穩(wěn)健的雙譜特征來減少噪聲的影響。文獻(xiàn)[2]進(jìn)一步提取了高階譜特征,并利用模板匹配方法對(duì)該特征進(jìn)行識(shí)別。這些方法均得到了不錯(cuò)的性能。然而這些特征均為人工設(shè)計(jì)的特征,依賴于研究人員對(duì)于數(shù)據(jù)的認(rèn)知和經(jīng)驗(yàn)的積累,在缺乏先驗(yàn)知識(shí)的情況下難以保證性能。近年來,神經(jīng)網(wǎng)絡(luò)方法被應(yīng)用于雷達(dá)目標(biāo)識(shí)別中。文獻(xiàn)[3]提出了一種多層穩(wěn)健自動(dòng)編碼器(Stacked Corrective AutoEncoders, SCAE),該方法在多層編碼器的基礎(chǔ)上加入分類器聯(lián)合地提取樣本的特征,使得所提取的特征不僅可以保留數(shù)據(jù)的原始信息,而且具有可分性。為了解決小樣本問題,文獻(xiàn)[4]將樣本根據(jù)雷達(dá)方位角進(jìn)行分幀,然后采用深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)提取幀間共享的特征,輸出類別。這些模型通過構(gòu)造目標(biāo)函數(shù),能夠自動(dòng)地提取樣本的可分性特征,都取得了不錯(cuò)的效果。但是,前面的這些方法僅僅考慮了樣本的包絡(luò)信息,而沒有考慮高分辨距離像樣本距離單元之間的相關(guān)性。文獻(xiàn)[5]將高分辨距離像樣本轉(zhuǎn)化為序列的形式,然后采用隱馬爾科夫模型(Hidden Markov Model, HMM)對(duì)序列進(jìn)行建模來提取樣本內(nèi)部的時(shí)序關(guān)系。為了同時(shí)考慮樣本間的變化和樣本內(nèi)部的時(shí)序相關(guān)性,文獻(xiàn)[6]根據(jù)相鄰高分辨距離像樣本服從同一分布的假設(shè),采用隱馬爾科夫結(jié)構(gòu)對(duì)樣本內(nèi)部的結(jié)構(gòu)進(jìn)行建模的同時(shí),加入了狀態(tài)轉(zhuǎn)移概率的時(shí)序變化來描述樣本間的變化。
相比于隱馬爾科夫模型,循環(huán)神經(jīng)網(wǎng)絡(luò)模型(Recurrent Neural Network, RNN)的非線性和分布式狀態(tài)使得其表達(dá)能力更強(qiáng)。長短時(shí)記憶網(wǎng)絡(luò)模型(Long-Short Term Memory, LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)模型中的一種,其通過構(gòu)造3個(gè)門來控制信息的傳遞,從而解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)模型中存在的梯度消失問題,因此它被廣泛地應(yīng)用在序列識(shí)別領(lǐng)域,并取得了不錯(cuò)的效果[8-9]。
為了提取高分辨距離像的時(shí)序特征,筆者提出了一種雙向長短時(shí)記憶(Bidirectional Long Short Term Memory, BLSTM)模型來進(jìn)行高分辨距離像目標(biāo)識(shí)別。該模型首先根據(jù)樣本的目標(biāo)區(qū)域提取高分辨距離像數(shù)據(jù)的平移穩(wěn)健的序列特征;為了考慮高分辨距離像數(shù)據(jù)雙向時(shí)序相關(guān)性,將特征轉(zhuǎn)化為雙向序列數(shù)據(jù),采用雙向的長短時(shí)記憶網(wǎng)絡(luò)模型對(duì)序列數(shù)據(jù)進(jìn)行處理;最后采用一種投票的策略將雙向信息進(jìn)行融合,輸出樣本類別。在實(shí)測(cè)數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明,該方法不僅提高了識(shí)別性能,并且對(duì)于平移敏感性非常穩(wěn)健。
傳統(tǒng)的高分辨距離像識(shí)別方法,如自適應(yīng)高斯分類器(Automatic Gaussian Classifier, AGC),最大相關(guān)系數(shù)法(Maximum Correlation Coefficient, MCC)等,在建模時(shí)假設(shè)高分辨距離像樣本的各距離單元回波是相互獨(dú)立的。事實(shí)上,根據(jù)散射點(diǎn)模型,高分辨距離像的各距離單元的散射點(diǎn)在目標(biāo)轉(zhuǎn)動(dòng)時(shí)的轉(zhuǎn)動(dòng)形式完全相同,這必然造成高分辨距離像樣本的距離單元的回波幅度具有一定的相關(guān)性。為了去噪,在得到高分辨距離像樣本之前會(huì)對(duì)雷達(dá)回波加窗處理,使得距離分辨率下降,相鄰的距離單元是肯定相關(guān)的;而且實(shí)測(cè)數(shù)據(jù)存在多次散射現(xiàn)象,某距離單元內(nèi)的散射點(diǎn)子回波會(huì)散射到其他距離單元內(nèi),使得兩個(gè)距離單元回波相關(guān)。因此,各距離單元之間存在一定的時(shí)序相關(guān)性[10]。為了充分考慮各距離單元間的前向相關(guān)性和后向相關(guān)性,筆者采用雙向長短時(shí)記憶模型對(duì)數(shù)據(jù)進(jìn)行建模。
圖1展示了雙向長短時(shí)記憶模型處理高分辨距離像樣本的過程,主要包括3部分:將原始數(shù)據(jù)轉(zhuǎn)化為穩(wěn)健的序列數(shù)據(jù),采用BLSTM模型提取樣本特征以及通過投票策略融合雙向信息輸出樣本類別。下面詳細(xì)地介紹具體的識(shí)別過程。
對(duì)于輸入樣本x∈RD×1,首先根據(jù)高分辨距離像樣本的能量選取出樣本的目標(biāo)區(qū)域xs1∶s2,其中s1代表目標(biāo)區(qū)域的起始點(diǎn),s2表示目標(biāo)區(qū)域的終止點(diǎn)。由于高分辨距離像樣本存在平移敏感性,即高分辨距離像樣本的目標(biāo)區(qū)域在實(shí)際數(shù)據(jù)處理中會(huì)存在一定的平移,傳統(tǒng)的解決平移敏感性的方法會(huì)提取平移不變特征,將時(shí)域數(shù)據(jù)轉(zhuǎn)化為其他域空間,改變了數(shù)據(jù)的結(jié)構(gòu),失去了時(shí)域高分辨距離像數(shù)據(jù)的時(shí)序特性[2]。筆者選取xs1∶D和x1∶s2作為特征來進(jìn)行處理,保留了其時(shí)序相關(guān)特性。但是,不同的樣本對(duì)應(yīng)的目標(biāo)區(qū)域不同,這就意味著xs1∶D和x1∶s2的維度也會(huì)隨著樣本的變化而發(fā)生變化。為了解決這一問題,模型采用滑窗的方式將樣本轉(zhuǎn)化為序列的形式,同時(shí)采用長短時(shí)記憶模型來處理這種序列特征。由于長短時(shí)記憶模型的所有時(shí)刻的參數(shù)均是共享的,可以對(duì)任意長度的序列進(jìn)行處理,因此,長短時(shí)記憶模型可以對(duì)當(dāng)前的不同維度的輸入特征進(jìn)行建模。
圖1 雙向長短時(shí)記憶模型進(jìn)行高分辨距離像識(shí)別過程
(1)
(2)
圖2 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模塊結(jié)構(gòu)
將長短時(shí)記憶模型應(yīng)用到高分辨距離像序列,則輸入門、忘記門、輸出門和記憶單元分別計(jì)算如下:
it=σ(W(i)xt+U(i)ht-1+b(i)) ,
(3)
ft=σ(W(f)xt+U(f)ht-1+b(f)) ,
(4)
ot=σ(W(o)xt+U(o)ht-1+b(o)) ,
(5)
ct=it·tanh(W(c)xt+U(c)ht-1+b(c))+ft·ct-1,
(6)
其中,σ(x)=1/(1+exp(-x)),tanh(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x)),為非線性映射函數(shù),其作用在每一個(gè)元素上。xt∈Rd×1,為第t個(gè)時(shí)刻的輸入;W(·)∈Rm×d和U(·)∈Rm×m,為模型的權(quán)值矩陣;b(·)∈Rm×1,為模型的偏置。如式(3)~式(6)所示,該模型在提取t時(shí)刻的特征時(shí)不僅考慮當(dāng)前的高分辨距離像輸入xt,也考慮了前面時(shí)刻的信息ht-1,使得該模型可以充分利用高分辨距離像時(shí)序特性,提取更具有可分性的特征。
接下來,通過長短時(shí)記憶模型提取高分辨距離像隱層序列特征h1:
ht=ot·tanh(ct) 。
(7)
在得到隱層序列特征ht后,采用分類器輸出樣本的類別:
(8)
不同于傳統(tǒng)的序列識(shí)別在每一個(gè)時(shí)刻輸出一個(gè)類別,高分辨距離像目標(biāo)識(shí)別是每一個(gè)樣本序列對(duì)應(yīng)于一個(gè)類別。因此,模型采用了一種投票的策略來融合雙向的信息,輸出樣本x對(duì)應(yīng)的類別:
(9)
(10)
(11)
實(shí)驗(yàn)所用的數(shù)據(jù)是雷達(dá)實(shí)測(cè)飛機(jī)數(shù)據(jù)。該雷達(dá)的中心頻率約為5.5 GHz,信號(hào)帶寬為400 MHz。安-26、獎(jiǎng)狀、雅克-42型飛機(jī)的航跡在地面的投影如圖3所示,圖中雷達(dá)位于坐標(biāo)原點(diǎn)處。從圖3中可以看出,飛行航跡被劃分為不同數(shù)據(jù)段。為了驗(yàn)證模型的普適性,在選取訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)時(shí)有兩個(gè)準(zhǔn)則:(1)訓(xùn)練數(shù)據(jù)基本上可以覆蓋測(cè)試數(shù)據(jù)的方位角信息;(2)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)從不同的飛行數(shù)據(jù)段中選取。因此,筆者選取安-26的5及6段,獎(jiǎng)狀的6及7段,雅克-42的2及5段數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余段作為測(cè)試數(shù)據(jù)。其中訓(xùn)練樣本個(gè)數(shù)為7 800,測(cè)試樣本個(gè)數(shù)為5 124,樣本維度為256。將樣本轉(zhuǎn)化為序列數(shù)據(jù),每一個(gè)時(shí)刻輸入數(shù)據(jù)的長度d=32,重疊長度b=16。
圖3 飛行軌跡在地面的投影
為了驗(yàn)證筆者提出的算法(BLSTM模型)的有效性,將該模型同多個(gè)模型進(jìn)行了比較:最大相關(guān)系數(shù)法[5],自適應(yīng)高斯分類器[3],隱馬爾科夫模型[6],全連接神經(jīng)網(wǎng)絡(luò)(Fully-connected Neural Network, FNN),深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[3]。除此之外,還展示了長短時(shí)記憶模型分別只考慮前向序列或后向序列時(shí)的性能。對(duì)于長短時(shí)記憶模型,所有的參數(shù)均通過標(biāo)準(zhǔn)差為0.1的高斯分布進(jìn)行初始化。筆者采用隨機(jī)梯度下降法(Stochastic Gradient Descent, SGD)對(duì)參數(shù)進(jìn)行更新,學(xué)習(xí)率為0.1/(1+i),其中i為循環(huán)的次數(shù)。長短時(shí)記憶模型僅僅考慮前向序列和后向序列的方法,被稱為LSTM-for和LSTM-back。
圖4 識(shí)別性能隨參數(shù)的變化曲線
為了分析模型中的參數(shù)對(duì)于識(shí)別性能的影響,圖4展示了BLSTM,LSTM-for和LSTM-back的識(shí)別性能隨隱層維度m和序列窗長d的變化情況。從圖4(a)中可以看出,BLSTM和LSTM-for在隱層維度為30時(shí)性能最優(yōu)。這是因?yàn)楫?dāng)隱層維度較低時(shí),模型參數(shù)較少,難以較好地表達(dá)數(shù)據(jù);而隱層維度過高容易出現(xiàn)過擬合。因此,固定隱層維度為30,然后分析不同的窗長對(duì)于長短時(shí)記憶模型性能的影響。從圖4(b)中可以看出,識(shí)別性能隨著窗長的增大而逐漸上升,在窗長達(dá)到32單元時(shí)性能開始逐漸下降。這是由于窗長過小會(huì)使得序列的長度變長,對(duì)模型的表達(dá)能力要求較高;而窗長過長則會(huì)降低相鄰輸入之間的相關(guān)性,使得識(shí)別性能下降。在接下來的實(shí)驗(yàn)中,固定隱層維度為30,窗長為32單元。
表1 雙向長短時(shí)記憶模型同傳統(tǒng)方法的識(shí)別結(jié)果對(duì)比
表1展示了筆者提出的高分辨距離像算法同對(duì)比方法的實(shí)驗(yàn)結(jié)果。從表1中可以看出,相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,LSTM-for模型通過考慮高分辨距離像的時(shí)序相關(guān)性,性能要比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)DBN模型和時(shí)序模型隱馬爾科夫高大約2個(gè)百分點(diǎn)。而通過結(jié)合了前向和后向的信息,雙向長短時(shí)記憶模型比LSTM-for和LSTM-back的識(shí)別率更高。這也說明了考慮雙向時(shí)序相關(guān)性的有效性。
圖5 原始數(shù)據(jù)和雙向長短時(shí)記憶模型提取特征的主成分分析法二維投影
圖5展示了原始數(shù)據(jù)和雙向長短時(shí)記憶模型提取的特征的主成分分析(Principal Component Analysis, PCA)二維投影圖。從圖5中可以看出,原始數(shù)據(jù)的3類樣本投影點(diǎn)重疊在一起,而雙向長短時(shí)記憶模型提取的特征的投影點(diǎn)重疊部分明顯較少。這說明了當(dāng)前模型提取的特征比原始數(shù)據(jù)更具有可分性。
圖6 測(cè)試樣本平移的識(shí)別結(jié)果和目標(biāo)區(qū)域
為了進(jìn)一步驗(yàn)證筆者提出的算法對(duì)于平移敏感性的魯棒性,本實(shí)驗(yàn)中對(duì)訓(xùn)練樣本進(jìn)行了平移對(duì)齊,對(duì)測(cè)試數(shù)據(jù)在對(duì)齊之后進(jìn)行平移。圖6展示了DBN,F(xiàn)NN,LSTM-for,LSTM-back和雙向長短時(shí)記憶模型方法對(duì)于平移測(cè)試樣本的識(shí)別性能,其中橫坐標(biāo)負(fù)值代表向左平移,正值對(duì)應(yīng)于向右平移。從圖6中可以看出,DBN和FNN模型在測(cè)試數(shù)據(jù)平移情況下下降得比較嚴(yán)重。通過提取平移相對(duì)穩(wěn)健的序列特征,并且采用可以傳遞信息的長短時(shí)記憶模型來處理序列特征,BLSTM,LSTM-for和LSTM-back的識(shí)別性能在目標(biāo)區(qū)域平移時(shí)基本保持不變。這說明筆者提出的算法對(duì)于平移敏感性是魯棒的。
為了充分考慮高分辨距離像樣本距離單元間的時(shí)序相關(guān)特性,筆者提出了采用雙向長短時(shí)記憶模型(BLSTM)的高分辨距離像目標(biāo)識(shí)別算法。該算法首先根據(jù)高分辨距離像樣本中的目標(biāo)區(qū)域提取平移穩(wěn)健的序列特征,然后采用雙向長短時(shí)記憶模型處理序列特征來考慮前向和后向的時(shí)序相關(guān)性,最后結(jié)合softmax分類器和投票策略融合雙向信息,輸出樣本的類別。采用實(shí)測(cè)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法不僅提高了高分辨距離像識(shí)別性能,而且對(duì)于平移敏感性是魯棒的。值得注意的是,筆者提出算法處理的數(shù)據(jù)錄取環(huán)境良好,因此,在復(fù)雜或者惡劣環(huán)境下的目標(biāo)識(shí)別將會(huì)在后續(xù)進(jìn)一步地研究。