雷磊,楊秋,李開明
(1.空軍工程大學訓練部,西安710051;2.空軍工程大學信息與導航學院,西安710077)
基于多尺度稀疏字典的SAR圖像目標識別方法*
雷磊1,楊秋2,李開明2
(1.空軍工程大學訓練部,西安710051;2.空軍工程大學信息與導航學院,西安710077)
針對合成孔徑雷達目標識別問題,提出一種基于多尺度稀疏字典的SAR圖像目標識別方法。稀疏字典選擇是稀疏表示中的關(guān)鍵問題之一,該方法利用小波多尺度分析構(gòu)造過完備稀疏字典,將訓練樣本圖像在小波解析域中進行小波多層分解,充分利用小波多尺度分析突出圖像局部特征的特點,并和過完備稀疏表示有效結(jié)合組成級聯(lián)字典。通過求解測試樣本相應的稀疏系數(shù)矢量并根據(jù)系數(shù)矢量中對應訓練樣本類別的重構(gòu)誤差判定目標類型。實驗結(jié)果表明,該方法在識別前無需對SAR圖像進行預處理,具有良好的識別效果。
SAR目標識別,稀疏表示,小波多尺度分析,稀疏字典
當前,SAR(Synthetic Aperture Radar)圖像自動目標識別(Automatic Target Recognition,ATR)成為目標識別研究的熱點之一。傳統(tǒng)的SAR目標識別先進行去噪、分割、方位角估計等預處理,再進行分類識別。典型方法有基于模板匹配的方法[1],基于非線性分類的方法(神經(jīng)網(wǎng)絡[2]、支持向量機[3]),基于特征提取的方法[4]等,但這些方法的識別結(jié)果受預處理算法的影響較大。近年來稀疏表示在模式識別領(lǐng)域得到廣泛應用[5-8],Wright等人[9]首先將基于稀疏表示的識別方法(Sparse Representation-based Classification,SRC)用于人臉識別,文獻[10]將稀疏表示用于SAR目標識別,直接利用訓練樣本構(gòu)造字典,通過測試數(shù)據(jù)在該字典下的稀疏表示進行識別,取得了較好的識別效果。文獻[11]聯(lián)合陰影和目標區(qū)域共同構(gòu)造級聯(lián)字典,提升了稀疏表示模型的識別率。上述基于稀疏表示的SAR圖像識別方法中,字典構(gòu)造是稀疏表示的關(guān)鍵問題之一,上述方法均是源于樣本信息的字典構(gòu)造法[12],這類字典包含大量冗余信息,且無法得到目標深層次特征,導致識別率無法進一步提高,特別是面對變體較多的地面目標時識別率一般。
針對上述問題,本文采用小波多尺度分析構(gòu)造多尺度的過完備級聯(lián)字典。該方法無需任何預處理步驟,直接將原始訓練樣本圖像在小波解析域中進行小波多層分解,利用小波多尺度分析獲得訓練圖像在不同尺度下的特征,將這些特征組成級聯(lián)的過完備字典,識別階段通過求解測試樣本相應的稀疏系數(shù)矢量,并根據(jù)系數(shù)矢量中對應訓練樣本類別的重構(gòu)誤差判定目標類型。本文方法既利用了稀疏表示的穩(wěn)健性,又利用了同一目標在小波域多尺度條件下不同特征之間的關(guān)聯(lián)性,能夠?qū)AR圖像目標特別是目標變體取得較好的識別效果。
假設已知k個類別共n幅帶標簽的訓練圖像,將第i類訓練樣本共ni個變?yōu)榫仃嚨男问?,將每幅w×h的訓練圖像表示為列向量的形式。根據(jù)稀疏表示理論,同一類別數(shù)據(jù)位于同一低維線性子空間上,即屬于第i類的測試圖像y0將位于與其類標相同的訓練圖像張成的線性子空間上,記為:
式中‖·‖0表示L0范數(shù),ε表示重構(gòu)誤差。由于L0范數(shù)求解困難,求解時可采用貪婪策略的算法(如匹配追蹤算法、正交匹配追蹤算法等)或使用L1范數(shù)代替式L0范數(shù)進行近似求解(如基追蹤算法、同倫算法等)。其中IRn是一個稀疏向量,只有與該測試圖像對應的第i類對應的系數(shù)不為0。對于類別i,設定特征函數(shù)i為表示只在第i類上的系數(shù)非零的一個矢量。用該矢量可以對一個給定的測試樣本y進行估計:
2.1 小波多尺度分解
小波分解可將原始圖像分解為對應的高頻及低頻成分。對于SAR圖像而言,高頻部分對應相當一部分的相干斑噪聲,低頻部分則含有大量有用的特征信息。利用小波多尺度分解分離SAR圖像的不同特征信息,再利用不同成分的分解圖像構(gòu)造多尺度字典,可以有效提高字典的完備性。根據(jù)不同小波基在正交性、平滑性以及對稱性上表現(xiàn)出的不同特性,首先需要選擇適合待分解SAR圖像的小波基。本文選擇能夠較好保留空間細節(jié)信息和集中低頻能量的Daubechies-2小波基進行小波分解[13],并采用Mallat算法[14]進行3層分解,因為SAR圖像的輪廓、紋理等重要特征均體現(xiàn)在低頻部分,分解層數(shù)過多將導致圖像低頻部分包含的有用信息減少,從而無法有效體現(xiàn)這些特征。
設L(低通)和G(高通)為兩個濾波算子,則小波分解公式為:
2.2 基于多尺度稀疏字典構(gòu)造的目標識別
本文采用學習字典的方式構(gòu)造稀疏字典,它是從樣本數(shù)據(jù)中訓練一個精確的矩陣,常用的字典訓練法主要有最優(yōu)方向法(Method of Optimal Directions,MOD)和K-SVD[15]法。本文構(gòu)造的多尺度字典是將解析字典和學習字典的有利條件結(jié)合起來,通過小波多尺度變換在小波變換域中提取訓練樣本的多尺度特征,然后通過K-SVD訓練得到最終字典。對式(5)中的誤差函數(shù)修改如下:
其中,WA表示不同尺度和方向下的小波系數(shù)矩陣。訓練樣本經(jīng)小波分解后得到3個子帶Bs,各子帶對應的子字典訓練方式如下:
圖1給出本文方法的流程圖。
圖1 基于多尺度稀疏字典的SAR圖像目標識別流程圖
為了驗證本文方法識別性能,采用MSTAR實測數(shù)據(jù)進行實驗,將本文識別方法(記為SRC-MS)與直接采用稀疏表示的SAR圖像目標識別方法(SRC)以及基于SVM的識別方法進行性能比較。文中選用3類目標,分別為BMP2、BTR70和T72,分別選用SAR在俯視角為17°和15°時的數(shù)據(jù)作為目標的訓練樣本和測試樣本。這些數(shù)據(jù)是SAR在0°~360°方位角下的成像數(shù)據(jù)。表1給出樣本集的詳細情況,其中BMP2和T72的測試樣本分別包含3種變體,以測試算法性能。
本文方法SRC-MS參數(shù)設定為對訓練圖像進行小波3層分解得到10個子帶,然后統(tǒng)一采用隨機投影降維構(gòu)成過完備字典。SRC方法直接利用訓練樣本構(gòu)造過完備字典,對式(2)的求解采用同倫算法[16]進行優(yōu)化求解,算法最大迭代次數(shù)設為5 000,參數(shù)λ=0.01,=0.5。表2分別給出不同方法對三種目標的識別結(jié)果。
表1 數(shù)據(jù)集各類目標和型號圖像個數(shù)統(tǒng)計
表2 不同方法識別率對比
由表2可以看出,本文方法對三類目標均具有最好的識別效果,基于SVM的方法受特征提取算法的影響較大,同時可以發(fā)現(xiàn),由于目標BTR70訓練樣本與測試樣本型號完全相同,而BMP2和T72都只有一個型號的訓練樣本,測試樣本都有3個型號,因此,SVM、SRC以及本文SRC-MS 3種方法對BTR70的識別率都明顯高于BMP2和T72。實驗結(jié)果表明,本文方法能夠在不進行任何預處理的情況下以較高的識別率識別SAR圖像目標。
下面對比不同大小的訓練樣本集以及不同樣本維數(shù)對算法識別性能的影響。樣本集大小范圍設定為[600,800,1 000,1 200,1 400]。實驗結(jié)果如下頁圖2(a)所示。圖2(b)給出了進行不同維數(shù)降維后的算法識別結(jié)果??梢钥闯?,本文提出的SRC-MS算法無論在不同的樣本數(shù)量下還是降維后的樣本維數(shù)下,均取得了最高的識別率,進一步證明了算法的有效性。
本文提出基于多尺度稀疏字典的SAR圖像目標識別方法,利用小波多尺度分析將訓練樣本圖像在小波解析域中進行小波多層分解,然后利用K-SVD訓練各子帶的子字典級聯(lián)形成過完備字典,通過求解訓練樣本類別的重構(gòu)誤差判定目標類型。該方法充分利用了小波多尺度分析突出圖像局部特征的特點,能夠在對輸入圖像不進行任何預處理的情況下實現(xiàn)對MSTAR數(shù)據(jù)庫中SAR圖像的精確識別,對SAR圖像的解譯提供了參考和借鑒。
圖23 種識別方法在不同大小訓練樣本集和樣本維數(shù)下的識別率對比
[1]張紅,王超,張波,等.高分辨率SAR圖像目標識別[M].北京:科學出版社,2009.
[2]NI J C,XU Y L.SAR automatic target recognition based on a visual cortical system[C]//The 6th International Congress on Signal and Processing(CISP2013),2013,12:755-759.
[3]ZHAO Q,PRINCIPE J C.Support vector machines for SAR automatic target recognition[J].IEEE Transactions on Aerospace and Electronic Systems,2001,37(2):643-655.
[4]韓萍,吳仁彪,王兆華,等.基于KPCA準則的SAR目標特征提取與識別[J].電子與信息學報,2003,25(10): 1297-1301.
[5]DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[6]MAURER A,PONTIL M,ROMERA-PAREDES B.Sparse coding for multitask and transfer learning[C]//Proceedings of the International Conference on Machine Learning,Atlanta,2013:343-351.
[7]GU H T,WARD R K.Learning sparse representations for human action recognition[J].IEEE Transactions on Pattern AnalysisandMachineIntelligence,2012,34(8): 1576-1588.
[8]WANG Z W,YANG J C.A max-margin perspective on sparse representation-based classification[C]//Proceedings of the IEEE International Conference on Computer Vision,Sydney,2013:1217-1224.
[9]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2): 210-227.
[10]THIAGARAJAN J J,RAMAMURTHY K N,KNEE P. Sparse representations for automatic target classification in SAR images[C]//Proceedings of the 4th International Symposium on Communications,Control and Signal Processing,Limassol,2010:1-4.
[11]丁軍,劉宏偉,王英華,等.一種聯(lián)合陰影和目標區(qū)域圖像的SAR目標識別方法[J].電子與信息學報,2015,37(3):594-600.
[12]程建,黎蘭,王海旭.稀疏表示框架下的SAR目標識別[J].電子科技大學學報,2014,43(4):524-529.
[13]柯麗,黃廉卿.適于遙感圖像實時壓縮的小波基的選擇[J].光學技術(shù),2005,31(1):77-83.
[14]MALLAT S G.A wavelet tour of signal processing[M].San Diego:Academic Press,1998:302-310.
[15]齊會嬌,王英華,丁軍,等.基于多信息字典學習及稀疏表示的SAR目標識別[J].系統(tǒng)工程與電子技術(shù),2015,37(6):1280-1287.
[16]王振宇,秦立龍,黃振和.基于稀疏表示的數(shù)字調(diào)制模式識別[J].火力與指揮控制,2014,39(4):10-13.
[17]王則柯,高堂安.同倫方法引論[M].重慶:重慶出版社,1990:84-104.
SAR ATR Based on Multi-scale Sparse Dictionary
LEI Lei1,YANG Qiu2,LI Kai-ming2
(1.Training Department,Air Force Engineering University,Xi’an 710051,China;2.School of Information and Navigation,Air Force Engineering University,Xi’an 710077,China)
A new approach is developed for Synthetic Aperture Radar(SAR)Automatic Target Recognition(ATR)based on multi-scale sparse dictionary.The construction of the dictionary is a crucial issue in SAR ATR under the framework of sparse representation.The wavelet multi-scale analysis is used to construct the sparse dictionary so that local characteristics can be better studied. The training images are decomposed by using wavelet multi-scale analysis in wavelet domain,and the sparse coding for characteristics of each scale is represented by using multi-scale sparse dictionary. The class that the testing sample belonged to is determined by the minimum reconstruction error from the sparse parameter vectors under the framework of the cascade dictionary.The effectiveness of the method is proved by the experimental results.
SAR ATR,sparse representation,wavelet multi-scale analysis,sparse dictionary
TN957
A
1002-0640(2017)04-0010-04
2016-02-10
2016-04-19
國家自然科學基金(61471386);陜西省統(tǒng)籌創(chuàng)新工程-特色產(chǎn)業(yè)創(chuàng)新鏈基金資助項目(S2015TDGY0045)
雷磊(1981-),男,四川遂寧人,碩士,講師。研究方向:雷達信號處理、雷達通信一體化。