周 易
(綿陽(yáng)職業(yè)技術(shù)學(xué)院,四川 綿陽(yáng) 621000)
合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)遙感圖像[1]具有抗干擾能力強(qiáng)、可實(shí)時(shí)工作的特點(diǎn)。然而,圖像中大量的圖像噪聲[2]或前景冗余使場(chǎng)景變得復(fù)雜。此外,SAR 圖像中物體類別的相似性和非局部相關(guān)結(jié)構(gòu)使場(chǎng)景分類比光學(xué)圖像更難。
目前,國(guó)內(nèi)外學(xué)者就神經(jīng)網(wǎng)絡(luò)用于SAR 遙感場(chǎng)景圖像分類進(jìn)行研究,很多方法采用平均池化、最大池化等技術(shù)。Zhang Y 等[3]提出一種無(wú)標(biāo)度卷積神經(jīng)網(wǎng)絡(luò)(SF-CNN),并用于遙感場(chǎng)景分類。其中,全球平均池化(Global Average Pooling,GAP)層可完成最后的特征輸出;Elawady I 等[4]將局域性約束的仿射子空間編碼(Localityconstrained Affifine Subspace Coding, LASC)池化到神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)SAR 遙感場(chǎng)景圖像分類,該方法僅考慮單一特征,缺乏更全面的特征表示;董張玉等[5]提出了多層疊加協(xié)方差網(wǎng)絡(luò)(Multilayer Stacked Covariance Pooling,MSCP)用于SAR 遙感場(chǎng)景分類,并結(jié)合殘差網(wǎng)絡(luò),但是該方法忽視空間之間的相互依存關(guān)系以及其卷積特征的通道維數(shù)。
該文采用1 種多視圖交叉注意網(wǎng)絡(luò),對(duì)SAR 遙感圖像[6]進(jìn)行場(chǎng)景分類。由于該文提出的方法融入了自注意力模塊、全局協(xié)方差池化層和AlexNet 的基本結(jié)構(gòu),因此,其在SAR 數(shù)據(jù)集上的遙感圖像場(chǎng)景分類效果比其他模型更好。
1.1.1 SAR 圖像的統(tǒng)計(jì)分布
SAR 圖像與光學(xué)圖像中常見(jiàn)的加性噪聲不同[7],該類圖像的噪聲受固有成像機(jī)制的影響,SAR 圖像通常采用乘性模型進(jìn)行建模[8]。假設(shè)SAR 系統(tǒng)返回值為γ,該值代表2 個(gè)獨(dú)立隨機(jī)場(chǎng)的乘積,即γ=X·Y(X為SAR 圖像攜帶的所有有用信息,并經(jīng)過(guò)被標(biāo)定的地形后向映射區(qū)域散射后的數(shù)據(jù);Y為散斑噪聲)。
1.1.2 SAR 圖像的成像弱點(diǎn)
由于拍攝設(shè)置設(shè)備不同,例如四軸的飛航穩(wěn)定程度、航軌改變與成像裝置的差別,使各時(shí)刻所獲得的SAR 遙感圖像位于相同坐標(biāo)的地表數(shù)據(jù)存在差別[9]。因此很多算法都需要采用多時(shí)刻各相位的SAR 圖像完成精準(zhǔn)匹配[10]。事實(shí)上,如果無(wú)法獲得精度較優(yōu)的圖像匹配結(jié)果,就會(huì)出現(xiàn)很多偽變化的圖像區(qū)域,而這類變化是由SAR 圖像錯(cuò)位形成的。
1.2.1 SAR 遙感圖像校準(zhǔn)的流程
SAR 遙感圖像多采用特征點(diǎn)的獲取、校準(zhǔn)以及分析進(jìn)行處理[11]。其中,SAR 遙感圖像的校準(zhǔn)主要利用空間位置的轉(zhuǎn)變映射到坐標(biāo)系,以獲得參數(shù)。SAR 遙感圖像的校準(zhǔn)主要是基于特征獲取的,因此選擇算法性能優(yōu)秀的特征提取方法是實(shí)現(xiàn)該功能的重點(diǎn)。
1.2.2 SAR 遙感圖像的差異子圖
SAR 遙感圖像的差異子圖多是在圖像變化檢測(cè)中所采用的重要策略。將初始SAR 遙感圖像S1={S1(m,n),1≤m≤M, 1≤n≤N}與S2={S2(m,n),1≤m≤M, 1≤n≤N}完成各種運(yùn)算,從而獲得與初始SAR 遙感圖像大小相近的SAR圖像,該圖就是SAR 遙感圖像的差異子圖。獲得SAR 遙感圖像主要目標(biāo)完成像素的初始區(qū)分,但是基于斑點(diǎn)圖像噪聲的作用,所獲圖像的結(jié)果存在一定的差別[12]。因此,有些方法最終能識(shí)別不同SAR 遙感圖像的關(guān)鍵是獲得圖像質(zhì)量?jī)?yōu)良的差異圖。
1.3.1 傳統(tǒng)SAR 遙感圖像場(chǎng)景分類方法
顏色直方圖、紋理提取、等比例調(diào)整、尺度不變特征匹配和定向梯度直方圖都是很經(jīng)典的特征提取方法,這些方法都可以直接完成SAR 遙感圖像場(chǎng)景分類。但是SAR 遙感圖像場(chǎng)景的背景通常比較復(fù)雜,其原因是同一個(gè)場(chǎng)景可能包括不同的目標(biāo)。為了彌補(bǔ)傳統(tǒng)特征提取方法的不足,采用經(jīng)典的特征提取方法表示圖像的局部特征,并通過(guò)自編碼方法進(jìn)一步處理這些特征。
此外,無(wú)監(jiān)督特征學(xué)習(xí)方法也被廣泛應(yīng)用于場(chǎng)景分類。然而,這種方法只通過(guò)底層功能無(wú)法捕獲到SAR 遙感圖像場(chǎng)景豐富的特征信息。
1.3.2 基于深度學(xué)習(xí)的SAR 遙感圖像場(chǎng)景分類方法
隨著技術(shù)和硬件的成熟,在圖像處理設(shè)備方面,深度學(xué)習(xí)已經(jīng)迅速發(fā)展,并成功地應(yīng)用于圖像處理的各個(gè)領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)可以有效地處理復(fù)雜的圖像,完成模式識(shí)別的相關(guān)任務(wù)。為獲得整幅圖像的高質(zhì)量特征細(xì)節(jié),SAR 遙感圖像場(chǎng)景分類精度得到顯著改善,這里以深度學(xué)習(xí)為基礎(chǔ)的方法也越來(lái)越受歡迎。例如端到端的SAR 遙感圖像場(chǎng)景分類方法依賴于高級(jí)抽象特性。當(dāng)面對(duì)復(fù)雜場(chǎng)景分類問(wèn)題時(shí),通過(guò)感受野與權(quán)重的共享策略獲得參數(shù),從而具有較高的精度和較好的魯棒性。
第1 節(jié)主要介紹了基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類的研究基礎(chǔ),首先介紹SAR 圖像的統(tǒng)計(jì)分布機(jī)理,并分析了SAR 圖像的成像弱點(diǎn),從而介紹SAR 圖像的基本處理策略,包括SAR 遙感圖像校準(zhǔn)的流程,SAR 遙感圖像大多數(shù)是通過(guò)特征點(diǎn)的獲取、校準(zhǔn)和分析實(shí)現(xiàn)的。利用空間位置的位置轉(zhuǎn)變映射到坐標(biāo)參數(shù),以完成SAR 遙感圖像的校準(zhǔn)工作。
該文所提出的基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法包括2 個(gè)分支,即空間分支和通道分支。每個(gè)分支都包括1 個(gè)全局的自注意力模塊、協(xié)方差池化層以及快速歸一化層。可將這2 個(gè)分支的輸出連接,從而將其歸于損失函數(shù)中。該文方法的整體模型如圖1 所示。
圖1 該文方法的整體模型
2.1.1 自注意力模塊
該文提出的方法的自注意力模塊包括空間自注意力模塊和通道式自注意力模塊,如圖1 所示。深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法可以根據(jù)2 個(gè)模塊之間的相互依賴性進(jìn)行建模,并分別設(shè)定在卷積特征的空間維度和通道維度之間。可給定深度卷積特征X∈RH×W×C,并將該特征輸入GAP 中,以生成參數(shù)。通過(guò)壓縮操作,局部卷積操作具有全局感受域。而激勵(lì)操作包括2 個(gè)全連接層、整流線性單元層和一個(gè)分類層,該模塊可以利用簡(jiǎn)單的門(mén)控機(jī)制統(tǒng)計(jì)各通道之間的相關(guān)性。其中,第一個(gè)全連接層主要完成SAR 遙感圖像的降維工作,第二個(gè)全連接層主要使SAR 遙感圖像的維數(shù)增加。
2.1.2 全局協(xié)方差池化層
該文方法的全局協(xié)方差矩陣作為二階特征量,說(shuō)明了全局特征表示的相互關(guān)系。針對(duì)空間全局協(xié)方差池化層,可以進(jìn)行重構(gòu),并通過(guò)計(jì)算獲得較好的空間輸出。其中,空間和信道上的協(xié)方差矩陣都可以通過(guò)矩陣更新和推導(dǎo)。
2.1.3 歸一化層
該文提出的方法的迭代矩陣平方根歸一化層可以證明矩陣平方根歸一化的正確性,并改進(jìn)SAR 遙感圖像的分類任務(wù)。空間信道協(xié)方差矩陣為對(duì)稱正定型,通過(guò)特征分解或使用奇異值分解算法可以求解平方根。
該文提出的方法是由許多隱藏層組成的,這些隱藏層學(xué)習(xí)特征均可分層表示。具體來(lái)說(shuō),這類隱藏層主要包括3種結(jié)構(gòu),即卷積、池化和完全連接的層。輸入數(shù)據(jù)先被輸入卷積層,卷積層就會(huì)通過(guò)不同大小的卷積核提取特征。該模塊被稱為特征映射層,可通過(guò)非線性激活函數(shù)完成轉(zhuǎn)換。池化層通過(guò)該操作降低特征映射的維數(shù),實(shí)現(xiàn)最大或平均運(yùn)算。一種密集的特征向量是將最終的特征圖進(jìn)行扁平化而產(chǎn)生的,這是多次卷積和池化的過(guò)程。密集連接可將矢量送入全連接層來(lái)生成預(yù)測(cè)結(jié)果并且在訓(xùn)練過(guò)程中反向傳播,這種過(guò)程多通過(guò)最小損失值完成參數(shù)更新,并根據(jù)預(yù)測(cè)和參考標(biāo)簽計(jì)算結(jié)果。
AlexNet 作為公認(rèn)的卷積網(wǎng)路先驅(qū),該網(wǎng)絡(luò)也兼具良好的分類功能。相同的模型對(duì)不同類型的數(shù)據(jù)有不同的性能。由于該模型沒(méi)有統(tǒng)一標(biāo)準(zhǔn)的分類性能,模型之間的關(guān)系架構(gòu)和數(shù)據(jù)類似于一個(gè)黑盒子。該文所采用的數(shù)據(jù)集包括多種類型的遙感圖像場(chǎng)景。其分類結(jié)果是由DNN 模型生成的,所得數(shù)據(jù)也有助于分析模型之間的相互作用。該文的研究主要考慮2 個(gè)主要因素來(lái)定義特征信息。第一個(gè)因素是網(wǎng)絡(luò)的前饋過(guò)程。當(dāng)圖像是模型的輸入時(shí),對(duì)該文設(shè)定的模型來(lái)說(shuō),其維度來(lái)自分辨率和數(shù)字圖像的通道??梢詫D像輸入的每個(gè)像素都視為一個(gè)維度。此外,該文選用隨機(jī)參量分析法訓(xùn)練網(wǎng)絡(luò)參數(shù)。
該文提出的方法可根據(jù)2 個(gè)模塊之間的相互依賴性進(jìn)行建模,并分別設(shè)定在卷積特征的空間維度和通道維度之間。該文提出的方法還采用激勵(lì)操作模塊,該模塊包括2個(gè)全連接層、整流線性單元層和1 個(gè)分類層,該模塊可利用簡(jiǎn)單的門(mén)控機(jī)制統(tǒng)計(jì)各通道之間的相關(guān)性。其中,第一個(gè)全連接層主要完成SAR 遙感圖像的降維工作,第二個(gè)全連接層主要增加SAR 遙感圖像的維數(shù)。該文提出的方法由許多的隱藏層組成,這些隱藏層學(xué)習(xí)特征均可分層表示。該文提出的方法表現(xiàn)出強(qiáng)大的學(xué)習(xí)能力,可有效地對(duì)像素進(jìn)行分類。
在該文的研究中,以6 個(gè)RSI 數(shù)據(jù)集作為分類基準(zhǔn)數(shù)據(jù),其主要原因如下:1)RSI 數(shù)據(jù)集具有不同的數(shù)據(jù)類型。該分類基準(zhǔn)數(shù)據(jù)集是使用不同的傳感器從不同的區(qū)域采集的,例如光學(xué)、多光譜和SAR 圖像,其具有不同的分辨率和補(bǔ)丁。2)各類地物。該文的分類基準(zhǔn)數(shù)據(jù)集中包括各種常見(jiàn)的地面對(duì)象,例如群山、海灘、河流、建筑物和跑道。這些地面物體是也是遙感分類中的主要對(duì)象。
該數(shù)據(jù)集至少包括10 000 張SAR 遙感圖像,在原始光學(xué)航空?qǐng)D像的各個(gè)類別中,所有的圖像都是來(lái)自不同的遠(yuǎn)程成像傳感器。每個(gè)SAR 遙感圖像類中均有100 張以上的256×256 的圖像,這些圖像均來(lái)自于美國(guó)地質(zhì)調(diào)查局國(guó)家地圖城市區(qū)域的大圖圖像集合,SAR 遙感圖像場(chǎng)景示例如圖2 所示。
圖2 SAR 遙感圖像場(chǎng)景示例
3.2.1 試驗(yàn)基礎(chǔ)
該文所構(gòu)建的SAR 遙感圖像分類場(chǎng)景在圖像數(shù)據(jù)集主要使用有代表性的卷積網(wǎng)絡(luò)模型進(jìn)行對(duì)比。該文的訓(xùn)練模型將學(xué)習(xí)率設(shè)置為0.000 1,其批大小設(shè)置為32。該文對(duì)訓(xùn)練模型的學(xué)習(xí)率是0.0001,其批大小是32。該文該模型訓(xùn)練了50 輪。
由表1 可知,基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法在不同類型的RSI 數(shù)據(jù)集上均有不同的表現(xiàn)。其平均準(zhǔn)確度達(dá)到82.48%。在32 類光學(xué)數(shù)據(jù)中,27 個(gè)模型的準(zhǔn)確率達(dá)到90%或以上,其余場(chǎng)景的準(zhǔn)確率在80%以上。
表1 SAR 遙感圖像場(chǎng)景群山、海灘、河流、建筑物和跑道的分類準(zhǔn)確率(單位:%)
一般來(lái)說(shuō),基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法在光學(xué)數(shù)據(jù)集上的整體精度比SAR遙感圖像高。由于AlexNet被公認(rèn)為卷積神經(jīng)的先驅(qū),因此直接采用AlexNet作為SAR場(chǎng)景分類模型,在所有的RSI 數(shù)據(jù)集產(chǎn)生60%或以上的平均精度。此外,通過(guò)分析光學(xué)集和SAR 數(shù)據(jù)集的不同適應(yīng)關(guān)系,文獻(xiàn)[3]在2 個(gè)SAR 數(shù)據(jù)集上的精度分別為78.11%和63.61%?;谏疃葘W(xué)習(xí)方法的SAR 場(chǎng)景分類方法在光學(xué)數(shù)據(jù)的準(zhǔn)確性高于SAR 圖像。EuroSAR MS、MSRAT 以及NWPU- RESISC45 等數(shù)據(jù)集,與RSI 數(shù)據(jù)集相比,在應(yīng)用前須進(jìn)行預(yù)處理。因此,該文選用RSI 數(shù)據(jù)集進(jìn)行分析和處理。
3.2.2 SAR 遙感圖像場(chǎng)景分類分析
為探討SAR 遙感圖像特征信息之間的關(guān)系,可以分別計(jì)算光學(xué)數(shù)據(jù)集和SAR 數(shù)據(jù)集的Pearson 相關(guān)系數(shù)。對(duì)光學(xué)數(shù)據(jù)集來(lái)說(shuō),Pearson 系數(shù)為-0.36、-0.80、-0.75 以及-0.86 的算法。因此,L2 攝動(dòng)距離與特征信息的豐富度是呈負(fù)相關(guān)性光學(xué)數(shù)據(jù)集,這個(gè)特征也與攻擊算法有統(tǒng)計(jì)學(xué)意義。對(duì)文獻(xiàn)[3]提出的方法來(lái)說(shuō),特征信息間相關(guān)性的攝動(dòng)距離不可靠。該文FGSM 是較優(yōu)的攻擊算法,但是該方法卻產(chǎn)生了更多的對(duì)抗性擾動(dòng)。因此,文獻(xiàn)[3]需要改變更多的SAR 遙感圖像像素,并在大多數(shù)像素性級(jí)別的功能信息基礎(chǔ)上實(shí)現(xiàn)。相比之下,該文對(duì)比該文方法和文獻(xiàn)[3]方法用于RSI 數(shù)據(jù)集下的場(chǎng)景分類,該文方法的分類準(zhǔn)確率越高,以SAR 遙感圖像場(chǎng)景的群山、海灘、河流、建筑物和跑道見(jiàn)表1。
對(duì)SAR 數(shù)據(jù)集來(lái)說(shuō),Pearson 系數(shù)為0.22、0.97、0.92以及-0.80。與一貫在光學(xué)圖像的相關(guān)性方面不同,SAR數(shù)據(jù)集與特征信息的豐富性和相關(guān)性不一致。
3.2.3 SAR 遙感圖像場(chǎng)景分類準(zhǔn)確率分析
通過(guò)以上的研究結(jié)果可知,由于該文方法融入了自注意力模塊、全局協(xié)方差池化層和AlexNet 的基本結(jié)構(gòu)。因此,該文提出的方法在光學(xué)數(shù)據(jù)集中比其他模型的遙感圖像場(chǎng)景分類結(jié)果要好。SAR 遙感圖像場(chǎng)景中,文獻(xiàn)[3]與該文方法相比,其分類效果不佳,其原因是SAR 遙感圖像數(shù)據(jù)集的場(chǎng)景更復(fù)雜,所產(chǎn)生的遙感圖像場(chǎng)景分類的誤判率較高。相比之下,通過(guò)AlexNet 的場(chǎng)景分類示例可知,在相同條件下,該文方法的誤判率為17.52%,這說(shuō)明針對(duì)SAR遙感圖像的場(chǎng)景具有可轉(zhuǎn)移性,而文獻(xiàn)[3]在很大程度上受所使用的模型的影響。具體來(lái)說(shuō),圖2 展示的SAR 遙感圖像場(chǎng)景(例如群山、海灘、河流、跑道以及建筑物)來(lái)自不同的RSI 數(shù)據(jù)集。針對(duì)上述SAR 遙感圖像場(chǎng)景,所采用的分類模型使用不同卷積結(jié)構(gòu)。由此,給出在RSI 數(shù)據(jù)集中該文提出的方法的SAR 遙感圖像場(chǎng)景分類混淆矩陣,如圖3 所示。
圖3 在RSI 數(shù)據(jù)集下的該文方法SAR 遙感圖像場(chǎng)景分類混淆矩陣
第3節(jié)主要完成基于深度學(xué)習(xí)方法的SAR場(chǎng)景分類試驗(yàn)分析,首先,研究分類基準(zhǔn)數(shù)據(jù),并選擇6 個(gè)RSI 數(shù)據(jù)集作為分類基準(zhǔn)數(shù)據(jù),RSI 數(shù)據(jù)集具有不同的數(shù)據(jù)類型:該分類基準(zhǔn)數(shù)據(jù)集是使用不同的傳感器從不同的區(qū)域采集的,從而完成試驗(yàn)分析,其原因是該文所構(gòu)建的SAR遙感圖像分類場(chǎng)景在圖像數(shù)據(jù)集主要使用有代表性的卷積網(wǎng)絡(luò)模型進(jìn)行對(duì)比。由表1 可知,基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法在不同類型的RSI 數(shù)據(jù)集上均有不同的表現(xiàn)。其平均準(zhǔn)確度達(dá)到82.48%。而文獻(xiàn)[3]在2 個(gè)SAR 數(shù)據(jù)集上的精度約為63.61%。該文提出的方法可以根據(jù)每層擾動(dòng)距離的分布對(duì)原始數(shù)據(jù)進(jìn)行計(jì)算。
該文提出的方法和文獻(xiàn)[3]所采用的模型和算法思路不同,在不同的SAR 遙感圖像場(chǎng)景中,很多所采用的地貌實(shí)例具有很高的相似性,這些均為遙感圖像場(chǎng)景分類帶來(lái)了挑戰(zhàn)。
在SAR 遙感圖像場(chǎng)景分類領(lǐng)域中是否有類似的場(chǎng)景會(huì)成為影響場(chǎng)景分類準(zhǔn)確度的問(wèn)題,例如作為宮殿和教堂。因此,在訓(xùn)練過(guò)程中,該文提出的方法完成了測(cè)試組SAR 遙感圖像場(chǎng)景的算法性能觀察,不同卷積網(wǎng)絡(luò)結(jié)構(gòu)在識(shí)別SAR 遙感圖像場(chǎng)景的過(guò)程中,針對(duì)不同的SAR 遙感圖像場(chǎng)景類型均有較優(yōu)的識(shí)別結(jié)果。該文采用一種基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類方法,該方法由特征提取模型、特征映射模型和分類模型3 個(gè)部分構(gòu)成。特征提取模型的自注意力模塊包括2 個(gè)分支,即空間分支和通道分支。每個(gè)分支都包括1 個(gè)全局的自注意力模塊、協(xié)方差池化層以及快速歸一化層。此外,該文提出的方法還包括許多隱藏層,這些隱藏層學(xué)習(xí)特征均可分層表示。該文提出的方法所表現(xiàn)出的強(qiáng)大學(xué)習(xí)能力可以有效地完成像素分類和場(chǎng)景理解。該文在RSI 數(shù)據(jù)集的基礎(chǔ)上完成基于深度學(xué)習(xí)方法的SAR 場(chǎng)景分類試驗(yàn)分析,結(jié)果表明,不同類型的RSI 數(shù)據(jù)集有不同的表現(xiàn),其平均準(zhǔn)確度達(dá)到82.48%,比對(duì)比方法高,其原因是該文提出的方法融入了自注意力模塊、全局協(xié)方差池化層和AlexNet 的基本結(jié)構(gòu)。因此,該文提出的方法在RSI 數(shù)據(jù)集上比其他模型的遙感圖像場(chǎng)景分類結(jié)果好。
該文下一步將主要針對(duì)高階特征的組合和表示,并進(jìn)一步提高SAR 遙感圖像場(chǎng)景分類的準(zhǔn)確率。