国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于注意力機制和雙向GRU模型的雷達HRRP目標(biāo)識別

2019-11-02 03:40劉家麒
雷達學(xué)報 2019年5期
關(guān)鍵詞:隱層權(quán)值時刻

劉家麒 陳 渤* 介 茜

①(西安電子科技大學(xué)雷達信號處理國家重點實驗室 西安 710071)

②(西安電子科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院 西安 710071)

1 引言

雷達高分辨距離像(High-Resolution Range Profile,HRRP)是基于雷達寬帶信號獲取的目標(biāo)散射點子回波在雷達射線方向(Radar line of sight,RLOS)上投影的向量和,它含有大量的目標(biāo)結(jié)構(gòu)、散射點分布和目標(biāo)尺寸等可判別信息。相比2維的合成孔徑雷達圖像,1維的HRRP數(shù)據(jù)存儲量較低,更易保存和計算,如今在雷達自動目標(biāo)識別(Radar Automatic Target Recognition,RATR)領(lǐng)域中廣泛應(yīng)用。

HRRP具有方位敏感性、幅度敏感性和平移敏感性[1],這對目標(biāo)特征的提取造成了困難,而特征提取的好壞又直接影響了目標(biāo)的識別性能。針對以上問題,大量學(xué)者進行了廣泛的研究。文獻[2]提取了HRRP數(shù)據(jù)的高階譜特征,對所得譜特征使用模板匹配法進行識別。但這需要專業(yè)人員的經(jīng)驗,同時將時序數(shù)據(jù)映射到了其他域,破壞了HRRP距離單元之間的時序相關(guān)性。文獻[3]基于字典學(xué)習(xí)的方式得到了噪聲環(huán)境中HRRP的稀疏表示,并在此基礎(chǔ)上進一步進行處理。文獻[4]使用PPCA對HRRP數(shù)據(jù)進行特征的提取,用MPPCA按照方位角的不同進行了聚類,從而減少待匹配模板的數(shù)量。文獻[5]認(rèn)為HRRP數(shù)據(jù)服從混合Gamma分布,將HRRP的識別問題轉(zhuǎn)化為概率統(tǒng)計模型。文獻[6]使用了原始的復(fù)數(shù)HRRP數(shù)據(jù),充分利用了相位角信息。雖然以上方法都取得了不錯的識別性能,但是這些方法都將HRRP數(shù)據(jù)視為一個整體,僅關(guān)注了樣本的包絡(luò)信息,而忽略了HRRP數(shù)據(jù)內(nèi)部不同距離單元之間的時序相關(guān)性。文獻[7,8]考慮到不同距離單元之間的時序相關(guān)性,將HRRP轉(zhuǎn)化為序列的形式并使用隱馬爾科夫模型(Hidden Markov Models,HMM)建模。但由于方位敏感性的原因,需要對不同幀的數(shù)據(jù)分幀建模,具有較大的計算量。相比于HMM模型,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)由于其具有非線性的激活函數(shù)以及較大的隱空間范圍,具有更強的表示能力。通過其獨特的自循環(huán)機制,輸入數(shù)據(jù)的隱層特征可以在不同時刻的隱狀態(tài)間傳遞,可以有效的提取完整的樣本特征。通過梯度下降算法(gradient descent)可以自動學(xué)習(xí)循環(huán)神經(jīng)網(wǎng)絡(luò)模型權(quán)矩陣的值,可以在不需要相關(guān)人員的先驗經(jīng)驗的條件下完成數(shù)據(jù)的特征提取與分類。因此,被廣泛應(yīng)用于時序數(shù)據(jù)的建模[9,10]。由于平移敏感性問題的存在,HRRP樣本目標(biāo)區(qū)域兩側(cè)均會有一段數(shù)據(jù)冗余,而冗余數(shù)據(jù)對目標(biāo)識別沒有幫助。另一方面,傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)是單向的,分類時僅能利用當(dāng)前及之前時刻的數(shù)據(jù)信息。另外由于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)存在著梯度消失[11]等問題,使其對歷史數(shù)據(jù)的記憶能力較差。

針對上述問題,本文提出一種基于注意力機制的雙向門控循環(huán)單元(Attention-based Bidirectional Gated Recurrent Unit,ABi-GRU)模型。門控循環(huán)單元(Gated Recurrent Unit,GRU)是一種對于循環(huán)神經(jīng)網(wǎng)絡(luò)的改進[12],通過在傳統(tǒng)RNN基礎(chǔ)上額外增加“重置門”和“更新門”操作,可以有效的保證可分性信息在網(wǎng)絡(luò)自循環(huán)中的傳遞,從而緩解梯度消失帶來的性能損失,相比于傳統(tǒng)的循環(huán)網(wǎng)絡(luò)模型,其記憶性更強。該模型首先使用雙向GRU網(wǎng)絡(luò)對HRRP數(shù)據(jù)的正向序列和反向序列分別建模,得到其正反向序列的隱層特征。再對正反向得到的隱層特征進行拼接,拼接后的隱層特征可以同時利用正反向的內(nèi)容,有利于目標(biāo)的識別與分類。最后考慮到不同時刻的樣本數(shù)據(jù)對識別所起的作用是不同的,使用注意力機制對不同時刻的隱層特征進行加權(quán)處理得到最終的隱層,從而使模型可以自動關(guān)注并計算對識別有效的目標(biāo)區(qū)域部分,更有利于目標(biāo)的識別與分類。

最后,通過實測數(shù)據(jù)進行相關(guān)實驗,驗證本文模型的正確性。實驗結(jié)果表明,本文模型有效解決了HRRP的平移敏感性問題,具有較高的識別性能。

2 門控循環(huán)單元及注意力機制

2.1 門控循環(huán)單元

門控循環(huán)單元是一種帶有自循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),它可以自動對多個時間的輸入進行特征提取,而不同時刻的數(shù)據(jù)共享同一組權(quán)值矩陣。由于其獨特的自循環(huán)機制,隱層特征可以在不同時刻間單向傳遞,從而記錄下先前時刻的“歷史數(shù)據(jù)”,再通過歷史數(shù)據(jù)與新數(shù)據(jù)的融合得到當(dāng)前時刻的隱層特征值。由于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)存在著梯度消失問題[11],進而對識別的性能造成了影響。GRU模型在RNN的基礎(chǔ)上增加了2個控制門結(jié)構(gòu),使得信息有選擇性的在隱層中傳遞,在記憶重要信息的同時有效的減輕了梯度消失的問題。

圖1 GRU網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 GRU network architecture

2.2 注意力模型

注意力機制(attention mechanism)源自人類大腦對新事物認(rèn)知的特點,即對于重要的內(nèi)容分配較多注意力,而對于不重要的部分分配較少的注意力[13]。對目標(biāo)識別問題來講,目標(biāo)區(qū)域的價值遠(yuǎn)遠(yuǎn)大于兩側(cè)的冗余數(shù)據(jù)。在GRU模型中,樣本通過滑窗操作后得到多個時刻的樣本序列,不同時刻的序列進行類別預(yù)測的重要程度是不同的。這需要通過一種特殊的計算手段自動獲得目標(biāo)區(qū)域的范圍,并對此范圍賦予較大的權(quán)值。最后將不同時刻的隱層狀態(tài)與權(quán)重進行加權(quán)求和,從而得到經(jīng)過注意力模型處理后的隱層狀態(tài)

3 基于注意力機制和雙向GRU模型的HRRP目標(biāo)識別方法

3.1 HRRP數(shù)據(jù)的預(yù)處理

如圖2所示,雷達HRRP數(shù)據(jù)反映了在一定的雷達視線方向上,目標(biāo)散射點子回波的分布情況,其中每個距離單元等于所有散射點目標(biāo)在這個距離單元內(nèi)的回波疊加。HRRP數(shù)據(jù)包含了豐富的目標(biāo)尺寸和相對結(jié)構(gòu)等信息,可用來目標(biāo)的識別與分類[14]。記HRRP數(shù)據(jù)為,其中表示第個距離單元的子回波;表示距離單元總個數(shù)。對復(fù)向量取幅值,得到其幅值向量。

圖2 高分辨距離像生成示意圖Fig.2 Illustration of an HRRP sample

本文使用能量歸一化方法消除HRRP數(shù)據(jù)的強度敏感性問題,即限制不同HRRP數(shù)據(jù)的總能量相同。使用重心對齊法消除平移敏感性,將HRRP數(shù)據(jù)的重心位置平移到距離像的中心位置處。HRRP數(shù)據(jù)的重心位置可由式(11)計算出。

3.2 基于注意力機制和雙向GRU模型的HRRP目標(biāo)識別方法

傳統(tǒng)的GRU模型是單向的,即數(shù)據(jù)只能沿著一個方向進行處理。網(wǎng)絡(luò)只能結(jié)合當(dāng)前時刻的輸入數(shù)據(jù)及之前時刻的隱狀態(tài)信息計算新的隱狀態(tài),而之后的信息無法有效的利用。而HRRP本身并無特定的順序,因此只考慮單向信息并不利于HRRP數(shù)據(jù)的識別。針對此問題,本文提出將雙向GRU模型應(yīng)用在HRRP序列的識別問題上,即將HRRP數(shù)據(jù)分正反雙向分別輸入2個獨立的GRU模型,從而得到正反序列的隱層特征分別為和[15],其中表示序列的時刻數(shù)。將同時刻的隱層進行拼接,則拼接之后的隱層可以充分利用前后兩個方向上所有時刻的HRRP信息,有利于特征提取的進行。

圖3 基于注意力機制的雙向門控循環(huán)單元(ABi-GRU)模型結(jié)構(gòu)Fig.3 Structure of ABi-GRU model

4 實驗

實驗數(shù)據(jù)為國內(nèi)某研究所雷達實測飛行數(shù)據(jù),其中雷達和飛機的參數(shù)如表1所示。所測數(shù)據(jù)共含有3類目標(biāo)飛機,其時域特征如圖4所示。其中“安26”為中型螺旋槳飛機,“獎狀”為小型噴氣式飛機,“雅克42”為中型噴氣式飛機。其飛行軌跡圖如圖5所示。為了考慮盡可能完備的方位角數(shù)據(jù),本文將飛機飛行軌跡分為數(shù)段,其中“安26”和“獎狀”分為7段,“雅克42”分為5段。為了驗證模型的普適性,本文選取方位角變化較大的幾段作為訓(xùn)練數(shù)據(jù),其他數(shù)據(jù)段作為測試數(shù)據(jù)。因此本文使用“安26”的第5,6段數(shù)據(jù),“獎狀”的第6,7段數(shù)據(jù),“雅克42”的第2,5段數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),其它段作為測試數(shù)據(jù)。以上訓(xùn)練數(shù)據(jù)段基本覆蓋了測試數(shù)據(jù)可能的方位角信息,而且與測試數(shù)據(jù)段無重復(fù)數(shù)據(jù),可以有效驗證模型的性能。共得到7800個訓(xùn)練樣本數(shù)據(jù),5124個測試樣本,每個距離像維度D為256維。

表2展示了本文提出的模型與多個現(xiàn)有模型對測試數(shù)據(jù)的識別性能,識別性能指分類正確的樣本占全體測試樣本的比例?,F(xiàn)有模型包括:最大相關(guān)系數(shù)法[7](Maximum Cross Correlation,MCC),全連接神經(jīng)網(wǎng)絡(luò)(Full Connected Neural Network,FCNN),自適應(yīng)高斯分類器[16](Adaptive Gaussian Classifier,AGC),隱馬爾科夫模型。除此之外,為了驗證雙向網(wǎng)絡(luò)和注意力機制的有效性,還加入了融合注意力機制和僅用正向或反向數(shù)據(jù)的單向GRU模型(AGRU-for,AGRU-back)和無注意力機制的雙向GRU模型(Bi-GRU)作為對比。在實驗中,設(shè)置滑窗的窗長d為32,每次滑動的距離為16,經(jīng)過預(yù)處理后的高分辨距離像的維度為256,可計算得到總的序列數(shù)為15。GRU網(wǎng)絡(luò)的隱層狀態(tài)的維度大小為20,注意力權(quán)值的長度l為12。待訓(xùn)練的參數(shù)包括,其中帶方向箭頭的變量表示正向或反向GRU網(wǎng)絡(luò)的相關(guān)權(quán)值,是注意力機制的相關(guān)參數(shù),是最終融合注意力機制和雙向信息的隱層狀態(tài)所經(jīng)過分類器的相關(guān)參數(shù)。初始化時,所有待訓(xùn)練參數(shù)均從分布中采樣。學(xué)習(xí)率設(shè)置為,表示迭代次數(shù)。使用交叉熵作為模型的損失函數(shù),其定義為L=其中是第i個樣本真實的類別向量(one-hot編碼),是第i個樣本網(wǎng)絡(luò)預(yù)測的輸出分布向量。采用隨機梯度下降法對網(wǎng)絡(luò)進行權(quán)值的訓(xùn)練,每次使用的mini-batch樣本數(shù)設(shè)置為30。

表1 雷達和飛機相關(guān)參數(shù)Tab.1 Parameters of planes and radar

圖5 實驗數(shù)據(jù)飛行軌跡投影圖Fig.5 Projections of target trajectories onto the ground plane

表2 不同方法實驗識別性能對比Tab.2 Performance comparison with different methods

從表2中可以看出,相比于傳統(tǒng)的全連接神經(jīng)網(wǎng)絡(luò)模型,基于循環(huán)結(jié)構(gòu)的GRU模型考慮到了高分辨距離像內(nèi)部不同距離單元之間的時序相關(guān)性,從而有效的提高識別性能。而結(jié)合了雙向信息的Bi-GRU由于在任一時刻考慮到了樣本的整體信息,比僅僅使用部分正向或反向序列的AGRU-for和AGRU-back模型性能更好。基于注意力機制的ABi-GRU模型則在考慮到雙向時序性的前提下,又引入了注意力機制。在考慮樣本整體信息的情況下,數(shù)據(jù)的目標(biāo)區(qū)域含有最為豐富的可判別信息,因此是模型識別的重點區(qū)域。而引入注意力機制后的模型可以自動的對目標(biāo)區(qū)域賦予較大的權(quán)值,增加了目標(biāo)區(qū)域的權(quán)值比重。識別性能相比無注意力機制的Bi-GRU模型又提高了0.7%,取得了最佳的識別性能。

圖6給出了經(jīng)預(yù)處理后的時域HRRP數(shù)據(jù)和經(jīng)本模型(ABi-GRU)所提取得到的隱層特征的主成分分析(Principal Component Analysis,PCA)2維投影圖。從中可知,ABi-GRU模型所提取到的隱層狀態(tài)具有很高的可分性,所提特征整體可分性較好,投影圖中只有部分紅色星號(安26)與綠色圓圈(獎狀)有重疊現(xiàn)象。

表3 ABi-GRU模型對時域HRRP數(shù)據(jù)的混淆矩陣Tab.3 Confusion matrix of ABi-GRU model for time domain HRRP data

圖7展示了不同樣本不同時刻的注意力系數(shù)分配圖。其中橫軸表示不同的時刻,縱軸表示不同的樣本,不同顏色代表著不同的注意力數(shù)值。對經(jīng)過重心對齊處理的HRRP數(shù)據(jù)來說,1~5時刻和12~15時刻對應(yīng)時域HRRP數(shù)據(jù)目標(biāo)區(qū)域兩側(cè)的噪聲區(qū)域,這部分?jǐn)?shù)據(jù)不具備目標(biāo)識別能力,因此其對應(yīng)的注意力權(quán)值較低。而6~11時刻為數(shù)據(jù)的目標(biāo)區(qū)域,這部分區(qū)域包含有大量目標(biāo)結(jié)構(gòu)信息,因此是目標(biāo)識別的重點。圖7(a)是已經(jīng)經(jīng)過重心對齊處理后樣本的注意力系數(shù)圖,可見較大的權(quán)值基本分布在中間時刻(時刻7~9)附近,這與實際情況相符。注意力機制可以自動找出目標(biāo)區(qū)域,有效提高了識別性能。

平移敏感性問題會對模型性能造成一定影響,但是注意力機制是數(shù)據(jù)相關(guān)的。當(dāng)輸入數(shù)據(jù)發(fā)生平移移動時,注意力系數(shù)會自動修正相應(yīng)的權(quán)值。在模型已經(jīng)訓(xùn)練完成的情況下,將測試數(shù)據(jù)整體平移一定的距離單元,此時HRRP數(shù)據(jù)的目標(biāo)區(qū)域?qū)⒉辉谖挥?~11時刻所框定的范圍內(nèi)。如若將經(jīng)過重心對齊后的HRRP數(shù)據(jù)整體向前平移50個距離單元并將其輸入已訓(xùn)練好的模型中,可得此時的注意力系數(shù)如圖7(b)所示??梢婋m然距離像平移了一定單位,但是相對應(yīng)的注意力權(quán)值也發(fā)生了變化,且此時注意力權(quán)值較大的區(qū)域與目標(biāo)區(qū)域的位置依然吻合,模型依然可以有效從整個HRRP數(shù)據(jù)中提取目標(biāo)區(qū)域并得到其隱層特征,可見基于注意力機制的雙向GRU模型對于HRRP的目標(biāo)識別非常穩(wěn)健。

圖7 測試數(shù)據(jù)注意力權(quán)值系數(shù)Fig.7 Attention coefficients of test data

5 結(jié)論

本文針對雷達高分辨距離像的自動目標(biāo)識別問題,提出了一種基于注意力機制的雙向GRU網(wǎng)絡(luò)的識別模型?;贕RU模型的循環(huán)機制,充分利用了高分辨距離像內(nèi)部距離單元之間的時序相關(guān)性,有效捕捉了HRRP數(shù)據(jù)深層的隱含特征,提高了特征提取的效率與質(zhì)量。并在此基礎(chǔ)上引入了注意力機制,有效地從距離像中獲取得到目標(biāo)區(qū)域,降低了特征提取的難度。實驗結(jié)果表明,本文模型可以有效地捕獲HRRP數(shù)據(jù)的可分性信息,以及處理高分辨距離像的平移問題,而且不需要專業(yè)人員的先驗經(jīng)驗,取得了較好的識別性能。

猜你喜歡
隱層權(quán)值時刻
基于RTD可編程邏輯門的n變量函數(shù)實現(xiàn)算法
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
一種自適應(yīng)確定隱層節(jié)點數(shù)的增量半監(jiān)督超限學(xué)習(xí)機算法
冬“傲”時刻
捕獵時刻
卷積神經(jīng)網(wǎng)絡(luò)模型信息的深層安全控制方法及其優(yōu)化
基于5G MR實現(xiàn)Massive MIMO權(quán)值智能尋優(yōu)的技術(shù)方案研究
基于改進煙花算法的ELM 分類模型*
一種基于互連測試的綜合優(yōu)化算法?
財務(wù)風(fēng)險跟蹤評價方法初探
鄢陵县| 晋城| 内乡县| 揭西县| 抚州市| 广德县| 土默特右旗| 浦东新区| 宣武区| 梓潼县| 东乌| 灯塔市| 沁阳市| 大埔县| 青川县| 新竹县| 隆化县| 长治县| 舟山市| 晋江市| 饶河县| 株洲县| 新宁县| 万载县| 宝山区| 芷江| 米脂县| 凌云县| 郑州市| 无锡市| 苏尼特左旗| 平定县| 永福县| 海伦市| 渝北区| 稷山县| 邓州市| 雷波县| 马尔康县| 理塘县| 惠水县|