劉 旗, 張新禹, 劉永祥
(國防科技大學(xué)電子科學(xué)學(xué)院, 湖南 長沙 410073)
合成孔徑雷達(dá)(synthetic aperture radar, SAR)系統(tǒng)通過對被測目標(biāo)發(fā)射電磁波,得到被測目標(biāo)的散射點(diǎn)回波,進(jìn)而對被測目標(biāo)的雷達(dá)回波進(jìn)行相干處理,得到目標(biāo)的高分辨率圖像。與紅外和光學(xué)成像系統(tǒng)相比,由于雷達(dá)電磁波的穿透性,使得SAR系統(tǒng)相較于紅外和光學(xué)系統(tǒng)而言具有在極端條件下工作、不受天氣等自然條件的影響的優(yōu)勢。而且,SAR系統(tǒng)便于搭載,在軍用和民用領(lǐng)域都發(fā)揮了重要的作用。例如,地形測繪、海洋觀測以及自動目標(biāo)識別(automatic target recognition, ATR)。
SAR圖像能夠反映目標(biāo)散射點(diǎn)的距離向和橫向信息,因此基于SAR圖像的雷達(dá)自ATR(radar ATR, RATR)技術(shù)一直是近年雷達(dá)目標(biāo)識別領(lǐng)域的研究熱點(diǎn)。常見的目標(biāo)識別方法大致由3部分構(gòu)成,分別是數(shù)據(jù)預(yù)處理、提取特征和設(shè)計分類器。傳統(tǒng)的SAR目標(biāo)識別方法通過人類手工提取或設(shè)計特征,并根據(jù)特征設(shè)計合適的分類器來實(shí)現(xiàn)對SAR圖像的自動識別。傳統(tǒng)SAR圖像目標(biāo)識別方法雖然在一定程度上取得了一些成果,但是上述方法需要人類進(jìn)行手工提取或者設(shè)計特征,需要花費(fèi)大量的人力、物力和財力,而且特征的表征能力成為了上述方法性能提升的瓶頸。因此,近年來,研究者們?yōu)榱说玫礁弑碚髂芰Φ奶卣髯隽舜罅康墓ぷ?但是低級的視覺特征和高級的語義表示之間的語義鴻溝使得傳統(tǒng)的SAR圖像目標(biāo)識別方法往往不能取得令人滿意的結(jié)果。
近年來,深度學(xué)習(xí)方法發(fā)展迅速,在很多領(lǐng)域都表現(xiàn)出一定的先進(jìn)性。在SAR目標(biāo)識別領(lǐng)域,深度學(xué)習(xí)方法因其良好的泛化能力和較強(qiáng)的類內(nèi)表征能力被研究者們廣泛應(yīng)用到SAR圖像的識別任務(wù)中,并取得了一定成果。文獻(xiàn)[24]的作者提出了一種復(fù)數(shù)卷積神經(jīng)網(wǎng)絡(luò)(complex-valued convolutional neural network, CVCNN),該方法能夠同時利用目標(biāo)的幅度和相位信息進(jìn)行目標(biāo)識別。文獻(xiàn)[25]提出了一種斑點(diǎn)噪聲魯棒的SAR圖像目標(biāo)識別方法,該方法設(shè)計了一種雙階段組合卷積神經(jīng)網(wǎng)絡(luò)來對地面目標(biāo)的SAR圖像進(jìn)行識別。在該方法中,SAR圖像目標(biāo)在第一階段會經(jīng)過基于卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的去斑點(diǎn)噪聲子網(wǎng)絡(luò)的處理,從而去除SAR圖像中的斑點(diǎn)噪聲,然后去除噪聲的SAR圖像在第二個階段會經(jīng)過基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計的識別子網(wǎng)絡(luò)的處理,從而實(shí)現(xiàn)對地面目標(biāo)的魯棒識別。文獻(xiàn)[26]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的特征融合SAR目標(biāo)識別方法,該方法可以大致分為3個部分,分別是特征提取模塊、特征融合模塊和識別模塊。在該方法中,作者提出了一種可以保留不同特征之間空間關(guān)系的特征融合方法,在一定程度上提高了目標(biāo)識別的準(zhǔn)確率。上述基于深度學(xué)習(xí)的SAR目標(biāo)識別方法,在一定程度上實(shí)現(xiàn)了自動提取特征的功能,與傳統(tǒng)SAR目標(biāo)識別方法相比避免了繁瑣的人工提取特征的過程,并在識別性能上具有一定的提升。然而,上述基于深度學(xué)習(xí)的方法需要大量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,一旦訓(xùn)練數(shù)據(jù)不足,上述方法往往會產(chǎn)生嚴(yán)重的過擬合現(xiàn)象,導(dǎo)致其泛化能力下降,識別性能降低。
實(shí)際上,小樣本問題在SAR目標(biāo)識別領(lǐng)域普遍存在。SAR目標(biāo)識別領(lǐng)域的小樣本問題是指在只有少量SAR訓(xùn)練樣本的條件下,要求模型利用獲取的少量SAR訓(xùn)練樣本快速地學(xué)習(xí)并且表現(xiàn)出較強(qiáng)的泛化性能。由于以下幾個方面的原因,導(dǎo)致了SAR目標(biāo)識別領(lǐng)域產(chǎn)生了小樣本問題:① 在軍事領(lǐng)域,尤其是非合作目標(biāo),能夠探測得到的SAR圖像很少,而且在特殊情況下,往往要求模型在獲取少量樣本的條件下就能夠?qū)Ρ粶y目標(biāo)做出準(zhǔn)確的識別。② SAR圖像的標(biāo)注工作需要一定的先驗(yàn)知識作為基礎(chǔ),這造成了標(biāo)注工作的緩慢以及需要花費(fèi)更多的財力。因此,提升小樣本條件下SAR目標(biāo)識別模型的泛化能力、提高目標(biāo)識別準(zhǔn)確率具有重要意義。
在光學(xué)圖像識別領(lǐng)域,小樣本問題很早就受到了諸多研究者的持續(xù)關(guān)注,發(fā)展到現(xiàn)在,光學(xué)圖像識別領(lǐng)域的研究者們已經(jīng)提出了一系列能有效解決小樣本條件下模型泛化能力下降、識別準(zhǔn)確率低問題的方法。文獻(xiàn)[32]提出了一種模型無關(guān)的元學(xué)習(xí)方法(model-agnostic meta-learning, MAML),在該方法中,作者設(shè)計了特定的模型結(jié)構(gòu),并且使得模型的參數(shù)經(jīng)過文章中介紹的訓(xùn)練方法訓(xùn)練以后,模型在面對新的學(xué)習(xí)任務(wù)時,只需要少量的學(xué)習(xí)樣本并且少次優(yōu)化迭代就可以表現(xiàn)出較好的泛化性能。文獻(xiàn)[33]提出了一種新的基于長短時記憶神經(jīng)單元的元學(xué)習(xí)器(meta long short-term memory, Meta-LSTM),具體而言,作者利用長短時記憶網(wǎng)絡(luò)的長時間狀態(tài)轉(zhuǎn)移矩陣的更新公式代替?zhèn)鹘y(tǒng)的基于梯度下降的優(yōu)化方式,經(jīng)過大量學(xué)習(xí)任務(wù)的訓(xùn)練,元學(xué)習(xí)器可以在少量樣本的條件下優(yōu)化學(xué)習(xí)器,使得學(xué)習(xí)器在小樣本條件下能夠表現(xiàn)出較好的性能。文獻(xiàn)[34]提出了匹配網(wǎng)絡(luò)的模型,匹配網(wǎng)絡(luò)能夠形成沒有標(biāo)簽的待測目標(biāo)樣本與帶有標(biāo)簽的訓(xùn)練樣本之間的映射,避免了模型在適應(yīng)新類型目標(biāo)時的微調(diào)過程。
近年來,在SAR圖像目標(biāo)識別領(lǐng)域,也有一部分研究者針對如何提高小樣本條件下SAR圖像目標(biāo)的識別率以及識別模型的泛化能力,提出了一些小樣本條件下的SAR圖像目標(biāo)識別方法。文獻(xiàn)[35]提出了一種基于度量學(xué)習(xí)的小樣本SAR目標(biāo)識別方法,結(jié)合小樣本學(xué)習(xí)的訓(xùn)練方式,在一定程度上降低了訓(xùn)練所需的樣本數(shù)。文獻(xiàn)[36]提出了一種基于自注意力機(jī)制和多尺度特征融合的SAR圖像目標(biāo)識別方法,雖然該方法在一定程度上降低了SAR圖像目標(biāo)識別時需要的訓(xùn)練數(shù)據(jù)量,但是該方法在MSTAR數(shù)據(jù)集上目標(biāo)識別準(zhǔn)確率達(dá)到90%以上需要至少50%的訓(xùn)練數(shù)據(jù),獲取這50%數(shù)據(jù)量仍然存在一定難度。文獻(xiàn)[37]基于高速公路單元提出了一種卷積高速公路網(wǎng)絡(luò)架構(gòu),用于訓(xùn)練數(shù)據(jù)有限情況下對SAR圖像目標(biāo)進(jìn)行準(zhǔn)確識別,該方法在MSTAR數(shù)據(jù)集上識別準(zhǔn)確率達(dá)到90%以上,但需要的訓(xùn)練數(shù)據(jù)量降低到了30%左右,然而獲取這30%數(shù)據(jù)量仍然存在一定難度,而且該方法在識別率達(dá)到90%以上以后,增加訓(xùn)練數(shù)據(jù)量對提升識別準(zhǔn)確率效果不如未達(dá)到90%以前明顯。文獻(xiàn)[38]提出了一種基于小樣本學(xué)習(xí)的SAR圖像目標(biāo)識別方法,該方法利用2D Gabor濾波器對圖像進(jìn)行增強(qiáng),利用卷積自編碼器提取特征并識別,該方法在MSTAR數(shù)據(jù)集上只用了10%的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練就可以實(shí)現(xiàn)對SAR圖像目標(biāo)的有效識別,但是該方法的識別準(zhǔn)確率不高,很難滿足人們的識別需求。
受上述光學(xué)圖像識別領(lǐng)域解決小樣本問題的方法的啟發(fā),針對目前現(xiàn)存的SAR圖像目標(biāo)識別模型在小樣本條件下存在的模型泛化能力差、識別準(zhǔn)確率低的問題,本文提出了一種小樣本SAR圖像目標(biāo)識別方法,叫做基于權(quán)重門控多尺度特征融合匹配網(wǎng)絡(luò)SAR目標(biāo)識別方法。具體而言,所提方法引入了多尺度特征提取模塊,用以提取匹配網(wǎng)絡(luò)不同卷積層的多尺度特征,門控單元根據(jù)不同識別任務(wù)對不同卷積層的特征設(shè)置不同的權(quán)重,從而實(shí)現(xiàn)根據(jù)特定任務(wù)以不同卷積層的特征為主導(dǎo)進(jìn)行SAR圖像目標(biāo)識別的效果,最終提升模型的泛化能力以及目標(biāo)識別準(zhǔn)確率。
在本文中,匹配網(wǎng)絡(luò)中的卷積網(wǎng)絡(luò)、多尺度特征提取網(wǎng)絡(luò)和權(quán)重門控單元都是由深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。然而,在小樣本條件下,由于訓(xùn)練數(shù)據(jù)的不足,經(jīng)常會導(dǎo)致深度神經(jīng)網(wǎng)絡(luò)模型出現(xiàn)過擬合現(xiàn)象,導(dǎo)致模型泛化能力下降,識別準(zhǔn)確率低。因此,采用由文獻(xiàn)[33]和文獻(xiàn)[35]啟發(fā)得到的episode訓(xùn)練策略,對所設(shè)計的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。episode訓(xùn)練策略是元學(xué)習(xí)領(lǐng)域經(jīng)常采用的訓(xùn)練方法。具體而言,episode訓(xùn)練策略需要兩種類型的數(shù)據(jù)集,分別是元訓(xùn)練集和元測試集。和中由很多episode數(shù)據(jù)集構(gòu)成,每一個episode數(shù)據(jù)集都是從目標(biāo)數(shù)據(jù)集中采樣得到的“類樣本”的任務(wù),“類樣本”是指分別從類不同目標(biāo)的數(shù)據(jù)集中采樣,每種目標(biāo)取個樣本。每一個episode由兩部分構(gòu)成,分別是支撐集和質(zhì)詢集。支撐集中包含了類目標(biāo)的樣本,每類目標(biāo)具有個樣本,質(zhì)詢集包含了與支撐集相同類別的類目標(biāo)的樣本,其中質(zhì)詢集中的樣本沒有在支撐集中出現(xiàn)過。元訓(xùn)練集中的支撐集和質(zhì)詢集記為和,元測試集中的支撐集和質(zhì)詢集記為和。
本文設(shè)計的方法之所以能夠適用小樣本條件下對SAR圖像目標(biāo)的識別,可以大致總結(jié)為以下幾個原因。首先,采用的episode訓(xùn)練策略遵循了一個簡單的機(jī)器學(xué)習(xí)原則,即訓(xùn)練和測試條件必須匹配。具體而言,在訓(xùn)練時,只將每類目標(biāo)的幾個樣本輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練,就像在測試時,只能得到新任務(wù)每類目標(biāo)的幾個樣本一樣,這就能夠使網(wǎng)絡(luò)進(jìn)行快速學(xué)習(xí),滿足小樣本學(xué)習(xí)的要求。其次,匹配網(wǎng)絡(luò)成功將參數(shù)模型和非參數(shù)模型進(jìn)行結(jié)合,同時利用了參數(shù)模型提取的特征表征能力強(qiáng)和非參數(shù)模型不需要訓(xùn)練、沒有災(zāi)難性遺忘的優(yōu)點(diǎn),降低了訓(xùn)練需要的數(shù)據(jù)量,并使其具有能夠從少量訓(xùn)練樣本中提取出表征能力強(qiáng)的特征從而快速泛化到新樣本上的能力,有利于小樣本條件下提取SAR圖像目標(biāo)的特征并應(yīng)用到新樣本的準(zhǔn)確識別上。再次,匹配網(wǎng)絡(luò)具有一定的記憶功能,能夠記住支撐集中每類目標(biāo)的特征,通過將質(zhì)詢集中樣本的特征與支撐集中每類樣本的特征進(jìn)行匹配,完成對質(zhì)詢集樣本的識別,匹配網(wǎng)絡(luò)的這種記憶功能和匹配識別方法,在一定程度上降低了訓(xùn)練所需的樣本數(shù)。最后,在匹配網(wǎng)絡(luò)的基礎(chǔ)上,加入了多尺度特征提取模塊和權(quán)重門控單元。多尺度特征提取模塊能夠提取出匹配網(wǎng)絡(luò)不同卷積層的特征,權(quán)重門控單元能夠根據(jù)不同的識別任務(wù)對不同卷積層的特征賦予不同的權(quán)重值,從而達(dá)到根據(jù)不同識別任務(wù)選擇不同特征進(jìn)行識別的目的,有利于小樣本條件下針對不同的識別任務(wù),快速提取適合且表征能力強(qiáng)的特征,有助于提高小樣本條件下對SAR圖像目標(biāo)的識別準(zhǔn)確率。
圖1為門控多尺度匹配網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)示意圖。提出的權(quán)重門控多尺度特征融合匹配網(wǎng)絡(luò)旨在根據(jù)特定的識別任務(wù),提取對當(dāng)前識別任務(wù)最有幫助的特征,匹配網(wǎng)絡(luò)根據(jù)提取出的特征對不同目標(biāo)做出識別,從而達(dá)到提升模型泛化能力、提高模型識別準(zhǔn)確率的目的。
圖1 門控多尺度匹配網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the network structure of gated multiscals matching network
輸入的圖像會首先經(jīng)過4層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,不同層的卷積特征代表著目標(biāo)不同深度的特征而且具有不同的感受野,不同層的卷積特征會經(jīng)過特征壓縮模塊和感興趣區(qū)域(region of interest, RoI)模塊進(jìn)行處理,特征壓縮模塊通過1×1卷積運(yùn)算減少了特征圖的大小,提高了運(yùn)算效率,降低了對計算資源的需求,RoI池化將不同層的卷積特征由不同的空間形狀變?yōu)橄嗤目臻g形狀以便于后續(xù)處理。權(quán)重門控單元對多尺度RoI池化特征圖進(jìn)行權(quán)重分配,對有利于當(dāng)前識別任務(wù)的特征圖賦予更高的權(quán)重,對不利于當(dāng)前任務(wù)目標(biāo)識別或冗余的特征圖賦予更低的權(quán)重。最后,不同層的特征通過拼接融合到一起,參與到最終的識別任務(wù)中。用于測試的圖像樣本的融合特征會與用于訓(xùn)練的每類目標(biāo)的樣本特征進(jìn)行余弦相似度比較,最終預(yù)測出測試樣本的類別。
(1)
(2)
式中:,表示嵌入函數(shù),在本文中,=,由卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),用以提取特征;表示兩個向量之間的余弦相似度,表示為
(3)
式中:,表示維向量;,表示向量中的元素。
匹配網(wǎng)絡(luò)的結(jié)構(gòu)示意圖如圖1(a)所示,如上文描述,=表示嵌入函數(shù),用以提取特征,由4個相同的卷積模塊構(gòu)成,每個卷積模塊由一個3×3的卷積層、一個批歸一化層,一個修正線性單元(rectified linear unit, ReLU)非線性激活函數(shù)層和一個2×2的最大池化層構(gòu)成。
多尺度特征提取網(wǎng)絡(luò)可以大致分為兩部分,分別是特征壓縮模塊和RoI池化模塊。設(shè)計特征壓縮模塊的目的在于其能夠壓縮匹配網(wǎng)絡(luò)各個卷積層得到的卷積圖,從而達(dá)到減少數(shù)據(jù)量、提高識別速度的作用。RoI池化模塊的設(shè)計初衷在于其能夠提取對SAR目標(biāo)識別感興趣的特征,并將不同卷積層提取出的特征的形狀進(jìn)行統(tǒng)一,便于后續(xù)處理,而且RoI池化模塊能夠進(jìn)一步減少數(shù)據(jù)量,提高運(yùn)算效率。圖2展示了多尺度特征提取網(wǎng)絡(luò)的結(jié)構(gòu)及操作流程。
圖2 多尺度特征提取網(wǎng)絡(luò)結(jié)構(gòu)及運(yùn)算流程Fig.2 Structure and operation flow of multiscale feature extraction network
(4)
式中:*表示卷積操作;表示特征壓縮模塊第個壓縮因子。圖2展示了式(4)表示的1×1卷積運(yùn)算過程。1×1卷積運(yùn)算通過對不同通道的數(shù)據(jù)進(jìn)行加權(quán)求和實(shí)現(xiàn)跨通道的信息交互,實(shí)現(xiàn)在不改變特征圖二維形狀大小(,)的前提下對其進(jìn)行降維操作,減少了網(wǎng)絡(luò)的參數(shù),降低了網(wǎng)絡(luò)優(yōu)化的復(fù)雜度。同時,1×1卷積層后接的ReLU激活函數(shù)可以增加網(wǎng)絡(luò)的非線性特性,提高網(wǎng)絡(luò)的表征能力。1×1卷積操作跨通道的信息交互、減少網(wǎng)絡(luò)的參數(shù)量、提高網(wǎng)絡(luò)的表征能力等優(yōu)點(diǎn)都有利于提高小樣本條件下SAR圖像目標(biāo)識別的準(zhǔn)確率和網(wǎng)絡(luò)模型的泛化能力。
權(quán)重門控單元能夠根據(jù)不同的SAR目標(biāo)識別任務(wù)對不同尺度的RoI池化特征圖學(xué)習(xí)到不同的權(quán)重大小,從而實(shí)現(xiàn)根據(jù)不同的SAR目標(biāo)識別任務(wù)提取不同的目標(biāo)特征,以該特征為主要信息完成SAR目標(biāo)識別任務(wù)。權(quán)重門控單元的結(jié)構(gòu)很簡單,包括1×1卷積層,2個全連接層和Sigmoid激活函數(shù),權(quán)重門控單元的網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖3所示。
圖3 權(quán)重門控單元的網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Network structure of weight gated unit
權(quán)重門控單元∈××的定義式如下所示:
(5)
式中:,分別表示第二個和第一個全連接層的權(quán)重;是卷積層的權(quán)重;,表示激活函數(shù),分別是Sigmoid和ReLU。
權(quán)重門控單元通過與RoI池化特征圖做元素對應(yīng)位置相乘實(shí)現(xiàn)對多尺度特征設(shè)置不同的權(quán)重。上述過程表示為
(6)
權(quán)重門控單元本質(zhì)上是一種注意力機(jī)制,與文獻(xiàn)[40]中提出的注意力機(jī)制有所不同,文獻(xiàn)[40]中提出的注意力機(jī)制是基于通道級的注意力機(jī)制,主要負(fù)責(zé)將不同通道的特征圖賦予不同的權(quán)重大小,而權(quán)重門控單元是一種基于空間結(jié)構(gòu)級,經(jīng)過權(quán)重門控單元處理后的特征圖,會將特征圖中對識別比較重要的空間位置的特征賦予更大的權(quán)重,通過對重要位置的特征賦予更大的權(quán)重使得網(wǎng)絡(luò)學(xué)習(xí)到的特征更加具有代表性,表征能力更強(qiáng),可以在一定程度上減少訓(xùn)練所需的樣本數(shù)量。
為了驗(yàn)證本文所提方法的有效性,本節(jié)介紹了所提方法在公開SAR圖像數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,包括數(shù)據(jù)集介紹和實(shí)驗(yàn)的具體實(shí)施細(xì)節(jié)。為了更直觀地體現(xiàn)所提方法的優(yōu)越性,將所提方法與3種目前光學(xué)圖像識別領(lǐng)域表現(xiàn)良好的小樣本學(xué)習(xí)方法進(jìn)行了對比,3種方法分別是:MAML、Meta-LSTM、Matching Net。同時,將所提方法與兩種小樣本SAR目標(biāo)識別方法進(jìn)行了對比。而且,本文嘗試了兩種不同的度量函數(shù),進(jìn)行了小樣本條件下的SAR圖像目標(biāo)識別實(shí)驗(yàn)。最后,對原始的數(shù)據(jù)集加入不同分貝的噪聲,分別驗(yàn)證了所提方法在-10 dB,-5 dB,0 dB,5 dB和10 dB的噪聲條件下,對小樣本目標(biāo)的識別效果。所有的實(shí)驗(yàn)都是在帶有一塊NVIDIA GeForce GTX 1650顯卡的筆記本上基于Pytorch庫進(jìn)行的。
實(shí)驗(yàn)所采用的數(shù)據(jù)集是由美國空軍研究室提供的運(yùn)動和靜止目標(biāo)獲取與識別(moving and stationary target acquisition and recognition, MSTAR)數(shù)據(jù)集。該數(shù)據(jù)集中包含了10類前蘇聯(lián)軍事車輛目標(biāo)的SAR圖像,被很多研究者廣泛應(yīng)用在SAR目標(biāo)識別中。
MSTAR數(shù)據(jù)集中的10類軍事車輛目標(biāo)分別是:ZSU234,ZIL131,T72,T62,D7,BTR70,BTR60,BRDM2,BMP2,2S1。每張SAR圖像在距離向和方位向的分辨率是0.3 m,大小為128×128,通常是在0°~360°方位角下,每隔1°~2°獲取到的一次SAR目標(biāo)切片圖像。圖4展示了10類軍事車輛目標(biāo)的光學(xué)圖像(第一行)和相應(yīng)的SAR圖像(第三行)。
圖4 MSTAR數(shù)據(jù)集10類雷達(dá)目標(biāo)的光學(xué)圖像和相應(yīng)的SAR圖像Fig.4 Optical images and the corresponding SAR images of 10 types of radar target in MSTAR dataset
實(shí)驗(yàn)選取了俯仰角為17°的數(shù)據(jù)集作為元訓(xùn)練集,俯仰角為15°的數(shù)據(jù)集作為元測試集。元訓(xùn)練集中的支撐集和質(zhì)詢集是從元訓(xùn)練集中通過“類樣本”的方式產(chǎn)生的。具體而言,首先從10類軍事車輛目標(biāo)中隨機(jī)選取類,然后從這類的0°~180°方位角樣本中每一類隨機(jī)選出個樣本,組成支撐集,再從這類的181°~360°方位角的樣本中每類隨機(jī)挑選出一部分樣本組成,經(jīng)過一次“類樣本”過程,得到的支撐集和質(zhì)詢集組成元訓(xùn)練集的一個episode,然后重復(fù)進(jìn)行“類樣本”過程次,就得到個episode,這m個episode用來對所提方法進(jìn)行訓(xùn)練。同樣地,對元測試集進(jìn)行相同的操作,用以驗(yàn)證所提方法。值得一提的是,文中的取值為5,分別在取1,2,5和10的條件下進(jìn)行了小樣本SAR目標(biāo)識別實(shí)驗(yàn)。在取1,2,5和10的條件下,的取值分別是100,50,20,10。數(shù)據(jù)集的設(shè)置形式如圖5所示。這樣劃分支撐集和質(zhì)詢集的目的是驗(yàn)證所提方法的泛化性能,探究利用一部分方位角的SAR圖像對學(xué)習(xí)器進(jìn)行訓(xùn)練,學(xué)習(xí)器能否將這種識別能力泛化到對另一部分方位角的SAR圖像的識別中。實(shí)際上,很難得到目標(biāo)全方位(0°~360°)的SAR圖像,尤其是針對非合作目標(biāo)甚至是對方目標(biāo)。因此,對于小樣本條件下識別模型的泛化能力,其中一種表現(xiàn)形式可以是利用方位角范圍盡可能小的SAR圖像進(jìn)行訓(xùn)練,得到的模型能夠?qū)Ψ轿唤欠秶M可能大的SAR圖像進(jìn)行有效識別。極端情況下,如果只利用一個角度的SAR圖像進(jìn)行訓(xùn)練得到的模型,能夠?qū)崿F(xiàn)對360°的SAR圖像的有效識別,那么可以認(rèn)為該模型具有較強(qiáng)的泛化能力。本文中利用0°~180°范圍的SAR圖像作為支撐集進(jìn)行訓(xùn)練,而利用180°~360°范圍的SAR圖像作為質(zhì)詢集進(jìn)行測試的目的就是為了驗(yàn)證所提模型對不同方位角SAR圖像識別的泛化性能。
圖5 數(shù)據(jù)集的設(shè)置形式Fig.5 Dataset setting of the proposed method
對于匹配網(wǎng)絡(luò)中卷積神經(jīng)網(wǎng)絡(luò)特征提取模塊,采用經(jīng)典的4個卷積模塊構(gòu)成,具體而言,每個卷積模塊包含一個3×3的卷積層、一個ReLU、一個批歸一化層和一個2×2的池化層。多尺度特征提取模塊由一個1×1的卷積層和一個RoI池化模塊構(gòu)成。1×1卷積層用于減少數(shù)據(jù)量,RoI池化模塊由一層9×9的池化層構(gòu)成,用于改變特征圖的空間形狀。權(quán)重門控單元由一個1×1卷積層、一個全連接層和一個Sigmoid激活函數(shù)層構(gòu)成。
為了驗(yàn)證所提方法的有效性,通過設(shè)置實(shí)驗(yàn),將所提方法與3種經(jīng)典的小樣本學(xué)習(xí)方法進(jìn)行了對比。值得一提的是,3種經(jīng)典的小樣本學(xué)習(xí)方法在光學(xué)圖像領(lǐng)域小樣本條件下都表現(xiàn)出了良好的識別性能,3種方法分別是:MAML,Meta-LSTM和Matching Net。為了能夠更好地反映3種方法在SAR圖像目標(biāo)識別中的表現(xiàn),沒有對上述方法的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改動。
在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”的條件下,分別利用所提方法和上述3種方法,對SAR圖像目標(biāo)進(jìn)行了識別實(shí)驗(yàn)。值得一提的是,“類樣本”表示對類目標(biāo)進(jìn)行識別,每次訓(xùn)練每類目標(biāo)只提供個樣本。在本節(jié)中,設(shè)計了針對5類雷達(dá)目標(biāo)在小樣本條件下的識別實(shí)驗(yàn),具體而言,首先將MSTAR數(shù)據(jù)集劃分成了元訓(xùn)練集和元測試集,將MSTAR數(shù)據(jù)集中俯仰角為17°的數(shù)據(jù)作為了元訓(xùn)練集,將俯仰角為15°的數(shù)據(jù)作為了元測試集。然后,利用“類樣本”方法將元訓(xùn)練集和元測試集劃分成了若干支撐集和質(zhì)詢集。在本文中,恒等于5,有4種不同的取值,分別是1,2,5和10。下面以=5,=10為例簡單介紹一下支撐集和質(zhì)詢集的劃分過程。首先,從MSTAR數(shù)據(jù)集10類不同雷達(dá)目標(biāo)中隨機(jī)選取5類目標(biāo),然后從選出的這5類雷達(dá)目標(biāo)中每類目標(biāo)0°~180°的方位角樣本中隨機(jī)挑選10個樣本,選出的這×=5×10=50個樣本構(gòu)成元訓(xùn)練集的一個支撐集;在這之后,從選出的這5類雷達(dá)目標(biāo)180°~360°的方位角樣本中隨機(jī)挑選一部分樣本數(shù)據(jù)構(gòu)成與支撐集相對應(yīng)的質(zhì)詢集,重復(fù)上述過程,就可以得到多對支撐集和質(zhì)詢集用以對模型進(jìn)行訓(xùn)練。而對元測試集進(jìn)行上述相同的操作,就可以將元測試集劃分成若干支撐集和質(zhì)詢集的形式,用來對模型的性能進(jìn)行測試驗(yàn)證。
表1給出了在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”的條件下,訓(xùn)練迭代100次,所提方法和上述3種方法達(dá)到的最高識別準(zhǔn)確率。如表1所示,盡管在光學(xué)圖像領(lǐng)域,上述3種方法表現(xiàn)出了一定的先進(jìn)性,但是針對小樣本條件下SAR圖像的目標(biāo)識別任務(wù),上述方法性能普通,識別準(zhǔn)確率還有提升的空間。所提方法在提到的4種小樣本條件下均實(shí)現(xiàn)了最高的識別準(zhǔn)確率。尤其是在“5類1樣本”和“5類2樣本”條件下,所提方法較其他方法識別準(zhǔn)確率提高接近10%,這表明多尺度特征提取網(wǎng)絡(luò)提取的不同尺度的特征蘊(yùn)含了SAR圖像目標(biāo)的不同信息,通過將蘊(yùn)含不同信息的特征融合在一起進(jìn)行融合識別,有利于小樣本條件下提升SAR圖像目標(biāo)的識別準(zhǔn)確率。為了更加直觀地展示網(wǎng)絡(luò)訓(xùn)練過程中的細(xì)節(jié)信息,圖6給出了4種小樣本條件下,所提方法和上述3種小樣本學(xué)習(xí)方法訓(xùn)練迭代100次的識別準(zhǔn)確率變化曲線,其中圖6(a)~圖6(d)分別展示了“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”條件下訓(xùn)練迭代100次的識別準(zhǔn)確率變化曲線。
表1 小樣本條件下所提方法與其他小樣本學(xué)習(xí)方法 識別準(zhǔn)確率的結(jié)果比較Table 1 Comparison results of recognition accuracy of the proposed method and other few-shot learning methods in few-shot conditions
圖6 不同小樣本條件下所提方法與其他3種小樣本學(xué)習(xí)方法的識別準(zhǔn)確率曲線對比圖Fig.6 Recognition accuracy curve comparison chart of the proposed method and other three few-shot learning methods in different few-shot conditions
觀察圖6可知,相比于其他3種方法,所提方法在4種小樣本條件下均表現(xiàn)出了最好的識別結(jié)果,尤其是在“5類1樣本”和“5類2樣本”的條件下,所提方法的識別準(zhǔn)確率較其他3種方法有較大的提高。觀察圖6不難發(fā)現(xiàn),所提方法和其他3種小樣本學(xué)習(xí)方法的識別準(zhǔn)確率曲線均存在不同程度的震蕩,一種可能的原因是,在實(shí)驗(yàn)中,每次訓(xùn)練都會重新從MSTAR 10類不同雷達(dá)目標(biāo)中隨機(jī)選擇5類不同的雷達(dá)目標(biāo)進(jìn)行識別,增加了識別目標(biāo)的不確定性,導(dǎo)致了4種方法的識別準(zhǔn)確率都出現(xiàn)了不同程度的震蕩。但是,所提方法識別準(zhǔn)確率曲線局部震蕩的程度要明顯小于其他3種小樣本學(xué)習(xí)方法識別準(zhǔn)確率局部震蕩的程度。通過分析所提方法和其他3種方法的網(wǎng)絡(luò)結(jié)構(gòu),造成上述現(xiàn)象的原因可能是所提方法中的權(quán)重門控單元賦予了多尺度特征提取網(wǎng)絡(luò)提取出的不同尺度特征不同的權(quán)重大小,從而實(shí)現(xiàn)了根據(jù)具體的識別任務(wù)選擇出最具代表性的目標(biāo)特征,從而以該層特征為主導(dǎo)完成目標(biāo)識別任務(wù)。正是因?yàn)闄?quán)重門控單元的這種特性,使得所提方法在每次訓(xùn)練迭代時都會根據(jù)重新選擇的5類不同雷達(dá)目標(biāo)決定不同尺度特征的權(quán)重大小,從而實(shí)現(xiàn)根據(jù)具體的識別任務(wù)選出最適合當(dāng)前任務(wù)的目標(biāo)特征,進(jìn)而以該層特征為主導(dǎo)完成識別任務(wù),提升了模型的穩(wěn)定性和泛化性能。
為驗(yàn)證所提方法的有效性,設(shè)置實(shí)驗(yàn)將兩種小樣本SAR圖像目標(biāo)識別方法進(jìn)行了對比,兩種方法分別是基于度量學(xué)習(xí)的小樣本SAR目標(biāo)識別和基于小樣本學(xué)習(xí)的SAR目標(biāo)識別,為了更好地體現(xiàn)對比方法的實(shí)際效果,沒有對對比方法中的網(wǎng)絡(luò)結(jié)構(gòu)做任何調(diào)整。在“5類1樣本”“5類2樣本”“5類-5樣本”和“5類10樣本”4種不同小樣本條件下,分別利用所提方法和上述兩種小樣本SAR目標(biāo)識別方法對SAR圖像目標(biāo)進(jìn)行了識別實(shí)驗(yàn),實(shí)驗(yàn)環(huán)境包括支撐集和質(zhì)詢集的劃分方式都與第2.3小節(jié)相同。
表2給出了在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”4種不同的小樣本條件下,訓(xùn)練迭代100次,所提方法與上述兩種小樣本SAR目標(biāo)識別方法達(dá)到的最高識別準(zhǔn)確率。如表2所示,所提方法在上述4種小樣本條件下均實(shí)現(xiàn)了最高的識別準(zhǔn)確率,尤其是在“5類1樣本”和“5類2樣本”的條件下,所提方法比兩種小樣本SAR目標(biāo)識別方法識別準(zhǔn)確率高10%以上;在“5類5樣本”的條件下,所提方法比文獻(xiàn)[38]中的方法識別準(zhǔn)確率高10%以上;在“5類10樣本”的條件下,所提方法比文獻(xiàn)[35]中的方法識別準(zhǔn)確率高10%以上??赡艿脑蚴牵岱椒ㄖ械钠ヅ渚W(wǎng)絡(luò)結(jié)構(gòu)同時利用了參數(shù)模型能夠提取表征能力強(qiáng)的特征和非參數(shù)模型不需要訓(xùn)練、沒有災(zāi)難性遺忘的優(yōu)點(diǎn),在一定程度上減少了所需的訓(xùn)練樣本數(shù),以及多尺度特征提取模塊能夠提取不同層特征,權(quán)重門控單元能夠根據(jù)不同識別任務(wù)選擇不同特征進(jìn)行識別的特點(diǎn),有利于提高小樣本條件下對SAR圖像目標(biāo)的識別準(zhǔn)確率。
表2 小樣本條件下所提方法與其他小樣本SAR目標(biāo)識別方法 識別準(zhǔn)確率的結(jié)果比較Table 2 Comparison results of recognition accuracy of the proposed method and other few-shot SAR target recognition methods in few-shot conditions
第2.3節(jié)的實(shí)驗(yàn)將所提方法與其他3種小樣本學(xué)習(xí)方法進(jìn)行了對比,通過對比實(shí)驗(yàn)結(jié)果,不難發(fā)現(xiàn)所提方法在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”4種小樣本條件下,無論是在識別準(zhǔn)確率方面還是在性能穩(wěn)定性方面,所提方法都取得了最好的結(jié)果。
對所提方法中的度量函數(shù)進(jìn)行了進(jìn)一步的探討實(shí)驗(yàn)。在所提方法中,采用了余弦相似度度量函數(shù)來匹配質(zhì)詢集中的樣本特征與支撐集中每種類型雷達(dá)目標(biāo)的特征之間的相似度。第2.3節(jié)的實(shí)驗(yàn)結(jié)果表明,采用余弦相似度度量函數(shù)取得了較好的結(jié)果,本節(jié)利用歐式距離替換了原有的余弦相似度度量函數(shù),采用歐式距離來匹配質(zhì)詢集中的樣本特征與支撐集中每種類型雷達(dá)目標(biāo)特征之間的相似度。實(shí)驗(yàn)結(jié)果如表3所示,其中“采用余弦相似度”指的是所提方法采用余弦相似度來度量質(zhì)詢集中樣本特征與支撐集中每種類型雷達(dá)目標(biāo)特征之間的相似度,而“采用歐式距離”是指所提方法采用歐式距離來度量質(zhì)詢集中樣本的特征與支撐集中每種類型雷達(dá)目標(biāo)特征之間的相似度。為了更好地體現(xiàn)不同度量函數(shù)對實(shí)驗(yàn)結(jié)果帶來的影響,上述兩種方法除了度量函數(shù)不同之外,其余實(shí)驗(yàn)環(huán)境、網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)參數(shù)等實(shí)驗(yàn)條件均保持一致。
表3 小樣本條件下所提方法采用不同度量函數(shù)識別準(zhǔn)確率的 結(jié)果比較Table 3 Comparison of the recognition accuracy results of the proposed method using different metric functions
表3展示了所提方法分別在采用余弦相似度作為度量函數(shù)和采用歐式距離作為度量函數(shù)的情況下,訓(xùn)練迭代100次過程中,采用兩種不同度量函數(shù)的方法分別在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”4種小樣本條件下取得的最高識別準(zhǔn)確率。通過觀察表3可以發(fā)現(xiàn),雖然在上述4種小樣本條件下采用余弦相似度的最高識別準(zhǔn)確率要高于采用歐氏距離的最高識別準(zhǔn)確率,但是兩者的差距始終在2%以內(nèi)。因此,采用余弦相似度和采用歐式距離作為所提方法的度量函數(shù),對最終識別結(jié)果準(zhǔn)確率影響不是很大,不能憑借識別準(zhǔn)確率來判斷兩種方法的優(yōu)劣。
為了更加直觀地展現(xiàn)在采用兩種不同度量函數(shù)的條件下,所提方法訓(xùn)練迭代過程中的細(xì)節(jié)信息,圖7展示了在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”4種小樣本條件下,所提方法分別采用余弦相似度和歐氏距離作為度量函數(shù)時,在訓(xùn)練迭代100次過程中對元測試集質(zhì)詢集中待測目標(biāo)的識別準(zhǔn)確率變化曲線,其中圖7(a)~圖7(d)分別展示了在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”條件下的識別準(zhǔn)確率變化曲線。
圖7 所提方法分別采用余弦相似度和歐氏距離作為度量函數(shù)的識別準(zhǔn)確率變化曲線Fig.7 Recognition accuracy variation curves of the proposed method using cosine similarity and Euclidean distance as the metric function respectively
通過觀察圖7不難發(fā)現(xiàn),所提方法在分別采用余弦相似度和歐式距離作為度量函數(shù)時,識別準(zhǔn)確率變化曲線比較相近。而且,由于權(quán)重門控單元能夠通過對多尺度特征提取模塊提取出的不同尺度的特征賦予不同大小的權(quán)重,從而實(shí)現(xiàn)根據(jù)具體識別任務(wù)選擇出最具代表的目標(biāo)特征,以該層特征為主導(dǎo)完成目標(biāo)識別任務(wù)的效果,因此在分別采用余弦相似度和歐式距離作為度量函數(shù)時,所提方法的識別性能都表現(xiàn)出了較好的穩(wěn)定性。
作者進(jìn)行了加有噪聲的SAR圖像目標(biāo)識別實(shí)驗(yàn)來驗(yàn)證所提方法在噪聲環(huán)境下的魯棒性。本文分別將信噪比(signal to noise ratio, SNR)為-10 dB, -5 dB, -0 dB, 5 dB和10 dB的高斯白噪聲加到了原始的MSTAR數(shù)據(jù)集中,并分別在“5類1樣本”“5類2樣本”“5類5樣本”和“5類10樣本”4種小樣本條件下進(jìn)行了SAR圖像目標(biāo)識別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果展示在表4中。
表4 所提方法對加有噪聲的SAR圖像的識別結(jié)果Table 4 Recognition results of the proposed method for SAR images with added noise
本文提出了一種新的小樣本條件下針對SAR目標(biāo)進(jìn)行識別的方法,叫做基于門控多尺度匹配網(wǎng)絡(luò)的小樣本SAR目標(biāo)識別方法。在本方法中,通過引入多尺度特征提取模塊,用以提取匹配網(wǎng)絡(luò)不同卷積層的多尺度特征,門控單元根據(jù)不同識別任務(wù)對不同卷積層的特征設(shè)置不同的權(quán)重,從而實(shí)現(xiàn)根據(jù)具體的識別任務(wù)選出最適合當(dāng)前任務(wù)的目標(biāo)特征,進(jìn)而以該特征為主導(dǎo)完成識別任務(wù)。利用MSTAR數(shù)據(jù)集對所提方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,通過與3種光學(xué)圖像目標(biāo)識別領(lǐng)域表現(xiàn)良好的小樣本學(xué)習(xí)方法和兩種小樣本SAR目標(biāo)識別方法的比較,所提方法表現(xiàn)出了令人滿意的結(jié)果,在識別準(zhǔn)確率和識別穩(wěn)定性方面都要優(yōu)于其他方法。在此基礎(chǔ)上,嘗試了利用兩種不同度量函數(shù)作為所提方法中用來度量質(zhì)詢集中樣本特征與支撐集中每類目標(biāo)特征的相似度的探索性實(shí)驗(yàn)。最后,分別在4種小樣本條件下和5種噪聲條件下,驗(yàn)證了所提方法的噪聲魯棒性,實(shí)驗(yàn)結(jié)果表明本文方法在上述條件下具有良好的魯棒性。