王彩云, 吳釔達, 王佳寧, 馬 璐, 趙煥玥
(1. 南京航空航天大學航天學院, 江蘇 南京 210016; 2. 北京電子工程總體研究所, 北京 100854)
合成孔徑雷達(synthetic aperture radar, SAR)具有較好的穿透特性,并且能全天時、全天候工作,在軍事領(lǐng)域被廣泛使用。通過自動目標識別(automatic target recognition, ATR)技術(shù),可以有效獲取目標信息,識別感興趣的目標。主流的ATR方法包括基于模板的方法、基于模型的方法和基于大數(shù)據(jù)深度學習的方法。在諸多深度學習方法中,卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network, CNN)能有效解決傳統(tǒng)方法中人工特征提取效率低下的問題,并且提高識別準確率,已成功應(yīng)用于許多領(lǐng)域。由于CNN的優(yōu)異性能,一大批學者將其引入SAR圖像目標識別。
文獻[3]在誤差代價函數(shù)中引入類別可分性度量,提高了網(wǎng)絡(luò)的類別區(qū)分能力,并利用改進的CNN對SAR圖像進行特征提取,采用支持向量機對特征進行分類,實現(xiàn)了基于CNN的SAR圖像目標識別;文獻[4]采用卷積稀疏編碼進行特征提取和數(shù)據(jù)壓縮,融合隨機森林、樸素貝葉斯和最小值分類器進行識別,提高了識別精確度,并且對噪聲具有魯棒性;文獻[5]使用了CNN及其擴展模型Fast RCNN和Faster RCNN實現(xiàn)了SAR圖像的檢測與識別;文獻[6]提出了一種ZCA白化與主成分分析相結(jié)合的方法對SAR圖像進行預(yù)處理,并對CNN的結(jié)構(gòu)參數(shù)進行調(diào)整,提高了網(wǎng)絡(luò)訓練速度和目標分類的準確率;文獻[7]提出多尺度分解結(jié)合CNN的SAR圖像識別,解決SAR圖像相干斑造成的識別率低、耗時長等問題;文獻[8]引入遷移學習,結(jié)合CNN進行SAR目標識別,獲得了較好的識別性能。
然而,在采用CNN進行SAR圖像目標識別時,由于SAR圖像存在相干斑點噪聲,可標記樣本數(shù)量少,難以采集,對方位和姿態(tài)的變化較為敏感,因此容易出現(xiàn)過擬合的問題。針對該問題,主流方法主要分為對SAR樣本進行數(shù)據(jù)擴充和對神經(jīng)網(wǎng)絡(luò)進行優(yōu)化兩種。在數(shù)據(jù)增強方面,文獻[9]通過裁剪和翻轉(zhuǎn)進行數(shù)據(jù)擴充,采用比率分批處理使模型收斂更快更好;文獻[10]通過添加噪聲、多分辨率分析、模擬部分遮擋構(gòu)造了噪聲樣本、多分辨率樣本和不同程度的遮擋樣本,提高了網(wǎng)絡(luò)對其他擴展操作條件的適用性,增強了網(wǎng)絡(luò)的泛化能力。在網(wǎng)絡(luò)優(yōu)化方面,文獻[11]在CNN訓練階段引入了Dropout正則化,獲得了更好的識別率的同時有效抑制了過擬合問題;文獻[12]設(shè)計了基于度量學習和深度學習的孿生CNN,采用多任務(wù)聯(lián)合學習的方法訓練模型,有效緩解了相干斑噪聲對SAR圖像的影響,降低了噪聲過多引起的過擬合風險。
上述方法僅考慮數(shù)據(jù)和網(wǎng)絡(luò)優(yōu)化中某個方面,難以滿足更高的識別要求。本文提出了基于優(yōu)化CNN和數(shù)據(jù)增強的SAR圖像目標識別方法,為解決SAR樣本不足的問題,采用旋轉(zhuǎn)的數(shù)據(jù)增強方法擴充數(shù)據(jù)集,為解決模型泛化性的不足,在訓練階段引入Dropout和L2正則化,為解決模型收斂效率低的問題,采用Adam對網(wǎng)絡(luò)進行優(yōu)化。實驗結(jié)果表明,本文方法識別準確率高,且具有較好的泛化性。
CNN是一種多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、卷積層、池化層、全連接層和輸出層。其中,卷積層主要用來提取圖像特征,池化層主要用于特征選擇和信息過濾,全連接層則是對提取的特征進行非線性組合以得到輸出。在一個CNN中,一般會采取多個卷積層和下采樣層交替設(shè)置,靠近輸出層的最后幾層通常是全連接層。
除了卷積、池化和全連接之外,非線性激活也是CNN的主要操作之一。通過非線性激活,賦予了網(wǎng)絡(luò)非線性的性質(zhì),從而可避免線性模型表達不夠的問題。CNN中常用的激勵函數(shù)包括飽和非線性函數(shù),如Sigmoid函數(shù)和正切函數(shù)等,非飽和非線性函數(shù)如整流線性單元(rectified linear unit, ReLU)和Softplus函數(shù)等,其中ReLU避免了梯度消失問題,收斂快、易于學習。不僅如此,它使得網(wǎng)絡(luò)具有稀疏性,能有效緩解過擬合的問題,因此得到了廣泛的應(yīng)用。
本節(jié)設(shè)計了一個7層的神經(jīng)網(wǎng)絡(luò)架構(gòu)并對其進行改進,引入Dropout結(jié)構(gòu)并在目標優(yōu)化函數(shù)中添加正則化項,同時采用Adam作為梯度下降算法,以此構(gòu)建了一個改進的SAR目標識別網(wǎng)絡(luò)。采用數(shù)據(jù)增強方法擴充SAR圖像數(shù)據(jù)集后,輸入網(wǎng)絡(luò)進行訓練。算法框架如圖1所示。
圖1 基于改進CNN和數(shù)據(jù)增強的SAR圖像識別算法Fig.1 SAR image recognition algorithm based on improved CNN and data augmentation
由于SAR圖像數(shù)據(jù)集樣本不足,網(wǎng)絡(luò)模型過大會導致過擬合,故設(shè)計了7層神經(jīng)網(wǎng)絡(luò)架構(gòu),結(jié)構(gòu)如圖2所示。其中,C1、C3、C4層卷積核大小為5×5,激活函數(shù)為ReLu,C1通道數(shù)為32,C3、C4通道數(shù)為64。S2、S5采樣最大池化,采樣區(qū)域為2×2。F6采用ReLu作為激活函數(shù),共有512個節(jié)點,F7采用Softmax作為分類函數(shù),共有10個節(jié)點。
圖2 CNN框架Fig.2 CNN framework
Dropout能夠在一定程度上達到正則化的效果,有效緩解過擬合的現(xiàn)象。其思想在于通過以一定概率將部分神經(jīng)元激活值置為0,從而避免對局部特征的過擬合,增強模型的泛化性。有Dropout的神經(jīng)網(wǎng)絡(luò)如圖3所示。
圖3 Dropout CNNFig.3 CNN with Dropout
在運動和靜止目標獲取與識別(moving and stationary target acquisition and recognition, MSATR)標準工作條件(standard operating condition, SOC)下采集的10類目標上,分別用不使用Dropout、Dropout概率為0.3和Dropout概率為0.5進行實驗,結(jié)果如表1所示。
表1 不同Dropout概率下識別準確率
從表1可以看出,當Dropout概率為0.3時,SAR圖像識別準確率最高,故本文采用Dropout概率為0.3。
正則化方法也稱為貝葉斯正則化,假設(shè)目標優(yōu)化函數(shù)為(,),正則化即在目標函數(shù)中添加一個正則化項:
(1)
式中:為樣本數(shù)量;為控制正則化程度的超參數(shù)。
采用32×32尺寸圖像下,MSTAR的SOC下采集的10類樣本作為數(shù)據(jù)集,選用不同正則化方法進行比較,結(jié)果如表2所示。
表2 不同正則化方案識別準確率
從表2可以看出,L2正則化下=0.005的識別率最高,實現(xiàn)了抑制過擬合的效果。
傳統(tǒng)的數(shù)據(jù)增強方法有高斯模糊、圖像裁剪和縮放、圖像鏡面翻轉(zhuǎn)等。
在MSTAR的SOC下采集的10類目標上,分別采用5種數(shù)據(jù)增強方法進行比較,結(jié)果如表3所示。
表3 不同數(shù)據(jù)增強方法的識別準確率
從表3可以看出,采用旋轉(zhuǎn)數(shù)據(jù)增強方法的效果最優(yōu),其識別率達到了99%,其旋轉(zhuǎn)角度為-25°~25°。
采用MSTAR的SOC下采集的10類目標作為實驗數(shù)據(jù)集,訓練集和測試集的俯仰角分別為17°和15°。設(shè)置Dropout概率為0.3,采用L2正則化,權(quán)重衰減為0.005,采用Adam作為梯度下降算法,選擇旋轉(zhuǎn)-25°~25°進行數(shù)據(jù)增強,識別結(jié)果的混淆矩陣如表4所示。
表4 10類目標識別結(jié)果
從表4可以看出,本文設(shè)計的網(wǎng)絡(luò)在10類目標下的最低識別率為97.95%,平均識別率為99.2%,有效抑制了過擬合,取得了較好的識別效果。
在MSTAR的SOC下采集的10類目標上,與其他幾類現(xiàn)有的識別方法進行對比,分別記為自適應(yīng)CNN法、多分辨率表示法、自注意力多尺度特征融合法,對比結(jié)果如表5所示。可以看出,本文提出的方法平均識別率高于其他方法。
表5 SOC下結(jié)果對比
本文提出了一種基于改進的CNN和數(shù)據(jù)增強的SAR目標識別方法。針對SAR圖像樣本不足的問題,采用旋轉(zhuǎn)方法進行數(shù)據(jù)增強;為了優(yōu)化網(wǎng)絡(luò),引入了Dropout和L2正則化,并采用Adam作為梯度下降算法,有效抑制了過擬合,增強了網(wǎng)絡(luò)的泛化能力。在MSTAR SOC下的10類目標的實驗結(jié)果表明,該方法的平均識別準確率達到了99%以上,有效抑制了過擬合,識別性能較好。