崔福彬,張茜,雷俞承志,尹偉石
(長春理工大學(xué) 理學(xué)院,長春 130022)
合成孔徑雷達(SAR)利用相干成像原理,具有全天候、全天時的觀測能力以及穿透地表植被和云層的能力,是一種重要的觀測設(shè)備。在軍事偵查和遙感領(lǐng)域有著重要的應(yīng)用。近年來,隨著合成孔徑雷達圖像分辨率的逐漸提高,對合成孔徑雷達圖像的解析成為了研究熱點。
已經(jīng)有一些較為傳統(tǒng)的SAR-ATR(合成孔徑雷達圖像自動目標識別)系統(tǒng)被開發(fā),例如美國陸軍實驗室(ARL)的SAR-ATR系統(tǒng)。近年來,隨著機器學(xué)習算法的發(fā)展,一些機器學(xué)習的算法被應(yīng)用于SAR圖像識別的研究[1]。文獻[2]提出了基于Gabor濾波器以及局部紋理特征的算法,文獻[3]提出了基于多信息字典及稀疏表示的SAR圖像識別方法。以上算法提取的特征由人工設(shè)定,需要相當?shù)南闰炛R,而且識別效果不佳,泛化性較差。而基于仿生學(xué)理論的的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)則能夠自動提取圖像中的深層特征,且與傳統(tǒng)的深層神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)具有稀疏連接,權(quán)值共享等特點,有效地減少了模型的復(fù)雜程度。文獻[4]提出了一種應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像識別算法,并將類別可分性度量引入了神經(jīng)網(wǎng)絡(luò)的代價函數(shù),提高了分類效率,神經(jīng)網(wǎng)絡(luò)采用Sigmoid函數(shù)作為激活函數(shù),而該函數(shù)在訓(xùn)練時容易產(chǎn)生“梯度彌散”現(xiàn)象,另外沒有對SAR圖像做任何預(yù)處理。針對上述特點,本文提出了一種基于改進的卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像識別算法:首先利用布特沃斯濾波算法對SAR圖像進行濾波處理,減少圖像的相干噪聲;然后構(gòu)建多層卷積網(wǎng)絡(luò),并在網(wǎng)絡(luò)中采用改進的的線性修正單元[5],采取Dropout[6]增強網(wǎng)絡(luò)的的泛化性,使用Adam優(yōu)化算法對網(wǎng)絡(luò)參數(shù)進行更新,以更高效地訓(xùn)練網(wǎng)絡(luò)。
合成孔徑雷達作為一種高分辨率的對地成像觀測設(shè)備,因其基于相干成像的成像機理,圖像不可避免地會包含噪聲,嚴重地影響到了對圖像的解析。因此對圖像進行濾波預(yù)處理也就成為了SAR圖像預(yù)處理的關(guān)鍵步驟,濾波效果的好壞對后期圖像處理的影響很大。因此本文利用布特沃斯低通濾波器來實現(xiàn)對SAR圖像的濾波。截止頻率位于距原點D0處的n階布特沃斯低通濾波器的傳遞函數(shù)定義為:
其中,D(u,v)是頻率域中點與頻率矩形中心的距離。即:
布特沃斯低通濾波器的通頻帶內(nèi)頻率響應(yīng)曲線十分平坦,起伏較小。作為一種頻域濾波算法,布特沃斯低通濾波濾波能提取本質(zhì)特征。
本文利用美國國防部支持的MSTAR計劃所公布的數(shù)據(jù)集進行了圖像濾波實驗,濾波算法的實際處理效果如圖1所示。
圖1 布斯沃特濾波算法效果
由圖1可以看出,經(jīng)過濾波算法處理之后,圖像的質(zhì)量得到了較大的提高,特征更加明顯圖片中目標區(qū)域的對比度得到了增強,目標的邊緣輪廓更加的清晰,有利于下一步的圖像處理。
卷積神經(jīng)網(wǎng)絡(luò)是一種特殊的前饋網(wǎng)絡(luò)。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層、池化層及全連接層組成。卷積層和池化層交替連接以提取圖像的深層特征,再由分類器根據(jù)提取的特征進行分類。原始圖像經(jīng)過多個卷積核卷積后形成多張?zhí)卣鲌D,特征圖的長與寬基本不變,但深度增加,隨后經(jīng)過下采樣減少特征數(shù)量。經(jīng)過多次卷積與下采樣后形成高維度的特征圖,再進入分類器進行分類。卷積核對圖像進行卷積運算的公式為:
隨著數(shù)據(jù)量的增加,神經(jīng)網(wǎng)絡(luò)的深度也在不斷增大,以獲取更好的分類能力。但神經(jīng)網(wǎng)絡(luò)加深后就容易出現(xiàn)過擬合現(xiàn)象,也就是模型在訓(xùn)練中表現(xiàn)較好,但在驗證數(shù)據(jù)集上表現(xiàn)有所降低。為了避免過擬合,提高卷積神經(jīng)網(wǎng)絡(luò)的泛化性。Hinton提出了Dropout策略,即以一定的概率P隨機使某些神經(jīng)元失效,被失效的神經(jīng)元可暫時認為不在網(wǎng)絡(luò)的內(nèi)部,但其權(quán)重仍將保留,當該節(jié)點重新參與運算時將繼續(xù)更新參數(shù)。Dropout方法可以理解為將一個大的神經(jīng)網(wǎng)絡(luò)分成多個獨立的子網(wǎng)進行訓(xùn)練,最后多個網(wǎng)絡(luò)進行平均。從而有效減小過擬合現(xiàn)象,提高了網(wǎng)絡(luò)的泛化性。
為了提高網(wǎng)絡(luò)對抽象特征的提取能力。在卷積與池化操作之后,需要引入激活函數(shù)。針對Sigmoid函數(shù)會導(dǎo)致所謂的“梯度彌散”現(xiàn)象的缺點,可以采用線性修正單元(RELU)作為激活函數(shù)。
RELU函數(shù)相較于Sigmoid函數(shù)有以下的幾個優(yōu)點。首先,使用RELU函數(shù)不會發(fā)生梯度彌散的現(xiàn)象,而且Sigmoid函數(shù)包含了除法以及指數(shù)運算,求微分較為復(fù)雜,增大了訓(xùn)練時的計算量,而RELU函數(shù)求導(dǎo)簡單,并且由于RELU函數(shù)將小于零的輸入置零,在神經(jīng)網(wǎng)絡(luò)不斷循環(huán)計算的條件下,可以理解為RELU增強了數(shù)據(jù)的稀疏性,但這也體現(xiàn)了RELU函數(shù)的缺點,即輸入小于零時神經(jīng)元處于‘死亡’狀態(tài)。當學(xué)習率較大時,可能會導(dǎo)致大量的數(shù)據(jù)節(jié)點不被激活,梯度也永遠為零。所以,本文引入了Leaky ReLU函數(shù):
在輸入值大于零時,Leaky ReLU函數(shù)與RELU函數(shù)相同,但修改了輸入值小于零的部分,α是一個極小的常數(shù)。這樣梯度便能繼續(xù)傳播。
Adam(Adaptive Momentum Estimation)本質(zhì)上是帶有動量項的RMSprop,它利用梯度的一階矩估計和二階矩估計動態(tài)調(diào)整每個參數(shù)的學(xué)習率。Adam的優(yōu)點主要在于經(jīng)過偏置校正后,每一次迭代學(xué)習率都有個確定范圍,使得參數(shù)比較平穩(wěn)。公式如下:
Adam優(yōu)化器的特點是:能夠針對不同的參數(shù)調(diào)整學(xué)習率,同時對內(nèi)存的占用較小。文獻[7]表明,在眾多神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法中,Adam優(yōu)化器具有較好的效果。
本文使用了美國國防高等研究計劃署(DARPA)支持的MSTAR計劃所公布的實測SAR地面靜止目標數(shù)據(jù)進行試驗。該數(shù)據(jù)大多是靜止車輛的SAR切片圖像,包含多種靜止車輛目標在各個方位角下獲取到的目標圖像。本文選取了數(shù)據(jù)集中T72(坦克)、BTR70(裝甲運兵車)、BMP2(步兵戰(zhàn)車)、ZILI131(卡車)、ZSU234(自行防空炮)五類目標作為訓(xùn)練數(shù)據(jù)集進行模型訓(xùn)練。其中T72、BTR70數(shù)據(jù)集中包含了同一種類圖像的不同變體。對應(yīng)著不同的目標狀態(tài)(如天線是否展開等),訓(xùn)練時只采用部分(在表格中標注)。訓(xùn)練后采用包含變體數(shù)據(jù)的T72、BTR70、BMP2、三類目標數(shù)據(jù)進行測試。
本文首先對圖片進行截取,獲得其中央部分,隨后對圖像進行濾波處理。濾波處理后的圖像即可生成訓(xùn)練數(shù)據(jù)集進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。網(wǎng)絡(luò)共有五次卷積層進行卷積運算,并在其中的第一、三、五卷積層后添加池化層進行下采樣操作。通過卷積運算提取特征之后,構(gòu)建一個三層的全連接神經(jīng)網(wǎng)絡(luò)。使用softmax分類器進行目標分類。
圖2 模型流程圖
圖3 算法整體流程
各層具體參數(shù)如下:
(1)卷積層,96個卷積核,卷積核大小為11×11,步長為4,激活函數(shù)為Leaky ReLU。
(2)池化層,窗口大小為2,步長為4。
(3)卷積層,256個卷積核,卷積核大小為5×5,步長為1。采用Leaky ReLU函數(shù)進行激活。
(4)池化層,窗口大小為3,步長為1。
(5)卷積層,384個卷積核,卷積核大小為3×3,步長為1。采用Leaky ReLU函數(shù)進行激活。
(6)卷積層,384個卷積核,卷積核大小為3×3、步長為1。采用Leaky ReLU函數(shù)進行激活
(7)卷積層,256個卷積核,卷積核大小為3×3,步長為1。采用Leaky ReLU函數(shù)進行激活。
(8)池化層,窗口大小為3×3,步長為1。
(9)全連接層,4096個神經(jīng)元節(jié)點。
(10)全連接層,4096個神經(jīng)元節(jié)點。
(11)輸出層,softmax進行分類,五個神經(jīng)元節(jié)點。
本文采用包含 T72、BTR70、BMP2 ZILI131 ZSU23五類目標的數(shù)據(jù)集進行訓(xùn)練,訓(xùn)練后用包含變體數(shù)據(jù)的T72、BMP2、BTR70圖片進行測試。結(jié)果如表1和表2所示。
表1 MSATR數(shù)據(jù)集三類(含變體)目標的測試結(jié)果
表2 平均識別率對比
從表1-2可以看出本文提出的算法具有較好的識別效果,對于訓(xùn)練數(shù)據(jù)集中的同型目標識別率較高,而對不同類型的目標的識別率略有降低。但總體的識別率仍然較高,高于文獻[3]的96.60%,以及文獻[2]的92.90%。
卷積神經(jīng)網(wǎng)絡(luò)能夠自動提取圖像中的深層抽象特征,從而避免了人工設(shè)置分類標準。為了能夠更好地進行SAR圖像的目標識別,本文構(gòu)建了基于改進的卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像目標識別算法。SAR圖像因其特殊的成像機理不可避免地會在圖像中引入相干噪聲,對后續(xù)處理造成了不利影響,故通過布特沃斯濾波算法濾除相干噪聲。并在卷積神經(jīng)網(wǎng)絡(luò)中引入了修正的線性修正單元以及Dropout方法,增加了網(wǎng)絡(luò)的泛化能力。使用Adam優(yōu)化器對模型參數(shù)進行優(yōu)化,取得了較好的訓(xùn)練結(jié)果。在MSATR數(shù)據(jù)集上的實驗表明,通過對SAR圖像進行濾波處理,并且構(gòu)建改進的卷積神經(jīng)網(wǎng)絡(luò)對SAR圖像進行識別,實驗取得了較好的效果,對同型目標的識別率可達98%-99%,對三類(含變體)目標的綜合識別率達到了97%以上。表明深度學(xué)習方法在圖像處理方面有著較強的特征提取能力和較好的應(yīng)用前景。