陳 婕,廖志平
(桂林電子科技大學(xué)信息科技學(xué)院, 廣西 桂林 541004)
合成孔徑雷達(SAR)可實現(xiàn)距離向和方位向的二維高分辨率成像,為對地觀測提供了有力的工具。戰(zhàn)時,通過對SAR圖像進行有效解譯獲取戰(zhàn)場目標(biāo)信息具有巨大的情報價值。為此,研究SAR目標(biāo)識別技術(shù)具有廣闊的應(yīng)用前景[1-2]。從具體的分類識別算法角度,SAR目標(biāo)識別方法一般按照特征提取和分類決策兩個階段序慣進行。特征提取實現(xiàn)對SAR圖像中目標(biāo)特性的描述,以剔除噪聲、背景雜波等帶來的干擾。主成分分析(PCA),線性鑒別分析(LDA)等投影變換特征被廣泛用于SAR圖像特征提取[3-5]。其他用于SAR目標(biāo)識別的特征還包括目標(biāo)輪廓[6]、目標(biāo)區(qū)域[7]、散射中心[8-9]等。分類決策階段,常用的分類器包括K近鄰(KNN)[3]、支持向量機(SVM)[10-11]、稀疏表示分類器(SRC)[11-12]以及卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13-14]等。Mishra將PCA和LDA用于SAR圖像特征提取并采用KNN進行分類對比了兩種特征在SAR目標(biāo)識別中的性能[3]。文獻[6]基于SAR目標(biāo)輪廓提取橢圓傅里葉系數(shù)進而采用SVM分類器進行目標(biāo)識別。文獻[7]基于目標(biāo)二值區(qū)域設(shè)計匹配算法并根據(jù)區(qū)域殘差進行分類算法設(shè)計。文獻[12]首次將SRC引入SAR目標(biāo)識別并取得了良好的識別性能。文獻[13]等針對SAR目標(biāo)識別的特定應(yīng)用設(shè)計了全卷積神經(jīng)網(wǎng)絡(luò),相比傳統(tǒng)方法顯著提高了識別性能。文獻[8]以屬性散射中心為基本特征,提出了一種基于Hungarian算法的散射中心匹配方法并將其應(yīng)用于SAR目標(biāo)識別。
本文針對現(xiàn)有SAR目標(biāo)識別中分類決策中存在的不足,提出一種基于增強字典稀疏表示的SAR識別方法。首先通過添加噪聲、多分辨率表示的方法豐富訓(xùn)練樣本并以此構(gòu)建增強的字典。所構(gòu)建的增強字典涵蓋了部分?jǐn)U展操作條件(即噪聲污染、分辨率變化)并且字典中樣本規(guī)模的擴大也有效提高了其基礎(chǔ)描述能力。因此,基于增強字典對待識別的樣本進行分類,可以得到更可靠的識別結(jié)果。
基于壓縮感知的基本原理,稀疏表示通過線性表示和稀疏重構(gòu)的方式尋找測試樣本的最佳匹配類別,完成分類任務(wù)。記C類目標(biāo)的訓(xùn)練樣本構(gòu)建的全局字典為A=[A1,A2,…,AC]∈Rd×N,其中Ai∈Rd×Ni(i=1,2,…,C)為第i類的Ni個樣本?;谠撟值鋵y試樣本y進行稀疏重構(gòu)如下:
(1)
(2)
從稀疏表示分類的基本原理和流程不難看出,目標(biāo)類別的判斷依賴于其對應(yīng)類別訓(xùn)練樣本的線性表示能力。若訓(xùn)練樣本規(guī)模較小,則線性表示的精度較低,難以可靠進行識別。即使在訓(xùn)練樣本規(guī)模較大的情況下,其覆蓋條件應(yīng)當(dāng)貼近實際情況,考察到實際可能出現(xiàn)的各種干擾。因此,為提高稀疏表示分類的性能,有必要在已有的有限訓(xùn)練樣本基礎(chǔ)上進行提升,提高最終構(gòu)建的字典的有效性。
如前文分析,字典的完備性是稀疏表示分類中一個關(guān)鍵的問題,決定字典能否可以有效重構(gòu)測試樣本以及適應(yīng)復(fù)雜多變的樣本變化(如噪聲添加、分辨率變化等)。因此,提高字典的描述能力及其對擴展操作條件的適應(yīng)性具有重要的意義。傳統(tǒng)的基于稀疏表示分類的SAR目標(biāo)識別算法大多是針對稀疏系數(shù)的求解以及最終的判決規(guī)則等問題進行優(yōu)化改進。如文獻[16]根據(jù)稀疏表示系數(shù)的能量進行決策而不是采用經(jīng)典的最小重構(gòu)誤差準(zhǔn)則。本文則是通過增強字典的完備性進而提高稀疏表示分類器在SAR目標(biāo)識別上的性能。通過對原始訓(xùn)練樣本添加高斯噪聲以及進行多分辨率表示達到增強原始字典的目的。
噪聲干擾是SAR目標(biāo)識別中一種常見的擴展操作條件。用于分類器訓(xùn)練的樣本往往通過合作途徑獲取(如仿真計算),噪聲水平一般較低。此時,利用這些樣本對低信噪比(SNR)SAR圖像進行識別存在較大的困難。為此,本文采用添加高斯噪聲的方式模擬噪聲污染的訓(xùn)練樣本。定義信噪比如式(3)所示。
(3)
式(3)中,H和W分別為圖像的高和寬,r(i,l)表示SAR圖像的頻域數(shù)據(jù),σ2代表噪聲方差。
圖1給出了將SAR圖像變換到頻域數(shù)據(jù)的基本過程。經(jīng)過二維逆傅里葉變換、去除成像過程中的頻域補零以及加窗效應(yīng)從而獲得相應(yīng)頻域數(shù)據(jù),然后,對頻域數(shù)據(jù)添加噪聲獲得噪聲干擾圖像。通過改變添加噪聲的方差就可以得到不同信噪比的SAR圖像。圖2給出了同一目標(biāo)在不同信噪比下的SAR圖像。
圖1 SAR圖像的頻域變換Fig. 1 Procedure of transforming SAR images to the frequency domain
圖2 不同信噪比下的SAR圖像Fig.2 SAR images at different SNRs
由于傳感器的差異,待識別SAR圖像可能與訓(xùn)練樣本采集自不同分辨率。此時,依托原始訓(xùn)練樣本往往難以對測試樣本進行可靠分類。為此,本文通過對原始訓(xùn)練樣本進行多分辨率表示豐富分辨率成分,為不同分辨率下的識別任務(wù)提供支撐。根據(jù)SAR成像機理,其距離和方位向的分辨率分別由雷達帶寬和合成孔徑大小決定。為此,通過對SAR圖像的原始回波數(shù)據(jù)進行適當(dāng)分割,可以得到不同分辨率下的成像數(shù)據(jù)。圖3給出了實施多分辨率表示的基本流程。首先,根據(jù)預(yù)設(shè)的分辨率需求對SAR圖像頻域數(shù)據(jù)進行部分分割。然后,按照一般的SAR成像流程進行頻域補零并加窗,從而保證重建圖像與原始圖像具有相同的像素分辨率。最后,通過二維傅里葉變換將處理后的頻域數(shù)據(jù)變換到圖像域獲得相應(yīng)分辨率的SAR圖像。通過調(diào)整頻域分割的比例可以獲得目標(biāo)在不同分辨率下的表示。圖4顯示了同一目標(biāo)在不同分辨率的SAR圖像。多分辨的表示可以增強原始訓(xùn)練樣本的描述能力。一方面,多分辨率的訓(xùn)練樣本可以描述更多分辨率的SAR圖像;另一方面,即使對于某一固定分辨率的測試樣本,多分辨的訓(xùn)練樣本也可以提高對其重構(gòu)的精度。這些都有利于提高稀疏表示分類器的性能。
圖3 多分辨率表示的流程Fig. 3 Procedure of producing multi-resolution representations
圖4 SAR圖像在不同分辨率的表示Fig.4 SAR images at different resolutions
本文提出的基于增強字典稀疏表示的SAR目標(biāo)識別方法,通過對原始訓(xùn)練樣本的多信噪比、多分辨率表示,大大提高了字典的表述能力以及對于擴展操作條件的適應(yīng)性。本文設(shè)計的基本識別流程如圖5所示,具體按照以下步驟實施:
步驟1 對原始訓(xùn)練樣本添加高斯噪聲構(gòu)造多信噪比的SAR圖像;
步驟2 對原始訓(xùn)練樣本進行多分辨率表示,得到多分辨率的SAR圖像;
步驟3 利用原始訓(xùn)練樣本及構(gòu)造的多信噪比、多分辨率的SAR圖像共同構(gòu)建增強字典;
步驟4 基于增強字典采用稀疏表示分類器對測試樣本進行識別。
圖5 基于增強字典稀疏表示的識別流程Fig.5 Recognition procedure of sparse representation-based classification based on augmented dictionary
實施中,為了降低原始SAR數(shù)據(jù)的維度,首先采用PCA對原始SAR圖像及其多信噪比、多分辨率表示進行特征提取,獲得100維的特征矢量。然后,基于增強訓(xùn)練樣本的PCA特征矢量構(gòu)建全局進而進行稀疏表示分類。本文采用SparseLab開源工具包中的正交匹配追蹤算法(OMP)求解稀疏表示系數(shù),其中稀疏度和重構(gòu)誤差上限分別設(shè)置為60和10-4。圖6給出了一幅T72測試樣本在增強字典上的稀疏表示系數(shù)分布,其中,增強字典由BMP2、BTR70和T72 3類目標(biāo)的698個訓(xùn)練樣本構(gòu)成(詳見實驗章節(jié))。采用本文方法增強后,字典規(guī)模達到6 980個原子,按照BMP2、BTR70和T72的順序依次排列。從圖6中可以看出測試樣本的稀疏表示系數(shù)在同類別的字典上的值相對較高并且具有較大系數(shù)的原子多集中與T72字典上。這說明T72類別中存在較多與測試樣本相似度較高的原子?;谠鰪娮值渲蠺72類別字典對測試樣本的重構(gòu)誤差顯著小于其他類別,因此可以獲得正確的識別結(jié)果。
圖6 基于增強字典的稀疏表示系數(shù)求解示意Fig.6 Illustration of solution of sparse coefficients based on augmented dictionary
MSTAR數(shù)據(jù)集是由美國DARPA/AFRL提供的地面靜止車輛目標(biāo)實測SAR數(shù)據(jù),采集了X波段HH極化下多類地面車輛目標(biāo)的SAR圖像,圖像大小128×128像素,分辨率0.3 m×0.3 m,是目前國際上用于SAR目標(biāo)識別算法驗證的常用數(shù)據(jù)集。本文針對MSTAR數(shù)據(jù)集中的10類目標(biāo)(見圖7)進行分類實驗,部分訓(xùn)練和測試樣本如表1所示,其中訓(xùn)練樣本來自17°俯仰角,待識別測試樣本來自15°俯仰角。實驗實施中,選用現(xiàn)有幾類SAR目標(biāo)識別方法進行同步對比實驗,包括SVM方法[10]、傳統(tǒng)SRC方法[12]以及CNN方法[13]。為保持與提出方法特征的一致性,SVM和SRC均對100維的PCA特征矢量進行分類。CNN則是采用文獻[13]設(shè)計的全卷積神經(jīng)網(wǎng)絡(luò)(包含5個卷積層和3個最大值池化層直接基于原始SAR圖像進行訓(xùn)練和分類。對比方法均不進行訓(xùn)練本的增強。
1) 3類目標(biāo)識別問題
首先,基于表1中BMP2、BTR70和T72 3類目標(biāo)的訓(xùn)練和測試樣本開展實驗。3類目標(biāo)識別問題是SAR目標(biāo)識別中的基本問題之一,能夠反映識別算法對于多類目標(biāo)的基本分類能力。對于BMP2和T72,兩者的測試集與訓(xùn)練集具有一定的型號差異。表2統(tǒng)計了本文方法對3類目標(biāo)的識別結(jié)果,各類目標(biāo)(型號)的識別率均高于97%,平均識別率達到98.61%。表3比較了不同方法在當(dāng)前條件下的平均識別率。本文方法識別率最高,CNN方法與本文方法的識別率接近,體現(xiàn)了深度模型較強的分類能力。然而,由于訓(xùn)練樣本與測試樣本之間存在的一定型號差異,CNN的整體分類性能仍受到一定影響。與傳統(tǒng)SRC方法對比,本文通過字典增強有效提升了的整體識別性能,證明了增強字典的有效性。
圖7 十類目標(biāo)的光學(xué)圖像Fig.7 Optical images of the ten targets
表1 實驗訓(xùn)練和測試集
表2 三類目標(biāo)的識別結(jié)果統(tǒng)計
表3 三類目標(biāo)識別問題性能對比
2) 10類目標(biāo)識別問題
為進一步考察提出方法對于多類目標(biāo)的分類能力,基于表1中全部10類目標(biāo)的訓(xùn)練和測試樣本進行測試,獲得本文方法的分類混淆矩陣如圖8所示。從對角線元素可以看出,本文方法對于各類目標(biāo)的正確識別率均可達到97%以上。經(jīng)過總體計算,10類目標(biāo)平均識別率為98.12%,表明其對于10類目標(biāo)識別問題的有效性。表4列舉了各類方法在當(dāng)前條件下的平均識別率。對比其他三類方法,本文方法性能更優(yōu)。同樣,與傳統(tǒng)SRC相比,本文方法的性能得到顯著提升。這表明在增強字典下多信噪比、分辨率表示的樣本有利于提高對測試樣本的表示能力,進而根據(jù)重構(gòu)誤差進行更為精確的目標(biāo)分類。
圖8 10類目標(biāo)識別的混淆矩陣Fig. 8 Confusion matrix on 10-class recognition
表4 10類目標(biāo)識別問題性能對比
3) 噪聲干擾
為測試增強字典下識別方法的噪聲穩(wěn)健性,本實驗中首先按照2.1節(jié)中噪聲添加方法對表1中的10類測試樣本添加不同程度的噪聲。然后,采用各方法對不同信噪比的噪聲樣本進行分類,得到它們的識別結(jié)果如圖9所示。隨著信噪比的不斷降低,各方法的性能均表現(xiàn)出不同程度的下降。本文方法在各個信噪比下都能保持優(yōu)勢性能,尤其在低信噪比下,增強字典的方法性能優(yōu)勢更為顯著。這一結(jié)果驗證了本方法具有更為優(yōu)越的噪聲穩(wěn)健性。一方面,增強字典包含了多個信噪比的噪聲樣本,因而對于噪聲干擾樣本的描述能力大大增強;另一方面,稀疏表示分類自身對于噪聲干擾具有一定的穩(wěn)健性[15](從圖中也可以看出傳統(tǒng)SRC的總體穩(wěn)健性優(yōu)于SVM和CNN)。因此,通過增強字典下的稀疏表示進行識別,其抗噪聲干擾能力較強。
4) 分辨率變化
為測試增強字典下識別方法對于分辨率變化的穩(wěn)健性,本實驗中首先按照2.2節(jié)中的多分辨率表示方法對表1中的10類測試樣本進行多分辨率構(gòu)造。然后,基于不同分辨率的測試樣本對各方法進行測試,得到它們的識別結(jié)果如圖10所示。通過多分辨率表示的引入,增強字典下的稀疏表示相比其他方法性能更優(yōu),在各個分辨率下均保持最高的識別率。通過對訓(xùn)練樣本進行多分辨率重構(gòu),增強后的字典本身就具有了其所覆蓋的分辨率的描述能力。此外,由于包含較多的分辨率,通過稀疏表示的優(yōu)化求解,分類器也具有了一定的外推功能,對更多的分辨率具有適應(yīng)性。
圖9 各方法在噪聲干擾下的識別性能Fig.9 Recognition performance of different methods under noise corruption
圖10 各方法在分辨率變化下的識別性能Fig.10 Recognition performance of different methods under resolution variance
本文提出了基于增強字典稀疏表示的SAR目標(biāo)識別方法。該方法通過對原始訓(xùn)練樣本進行多信噪比、多分辨率樣本構(gòu)造,進而構(gòu)建描述能力更強、對于擴展操作條件更穩(wěn)健的增強字典。采用基于增強字典的稀疏表示分類器可有效提高目標(biāo)識別的整體性能?;贛STAR數(shù)據(jù)集的實驗表明,本文方法在對于3類和10類目標(biāo)的平均識別率可分別達到98.61%和98.12%,驗證其區(qū)分多類目標(biāo)的能力;通過測試本文方法在不同信噪比、不同分辨率下的識別性能,驗證了方法對于噪聲干擾、分辨率變化具有較強的穩(wěn)健性。后續(xù)研究中,將針對增強后的字典規(guī)模過大的問題進行優(yōu)化,采用字典學(xué)習(xí)、去冗余等多種手段進一步提升識別性能。