国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像目標(biāo)檢測綜述

2021-04-09 11:00朱衛(wèi)綱
兵器裝備工程學(xué)報 2021年3期
關(guān)鍵詞:卷積圖像特征

劉 暢,朱衛(wèi)綱

(航天工程大學(xué) 電子與光學(xué)工程系, 北京 101416)

合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)作為一種主動式微波成像傳感器,相比于光學(xué)遙感手段,不受氣候、天氣、光照等因素的制約,可以實(shí)現(xiàn)全天候、全天時的對地觀測。

SAR圖像目標(biāo)檢測旨在從復(fù)雜的場景中快速有效地提取感興趣的目標(biāo)位置,是SAR自動目標(biāo)識別(SAR-automatic target recognition,SAR-ATR)的重要組成部分。

隨著SAR的迅速發(fā)展,現(xiàn)有的SAR圖像檢測技術(shù)難以滿足實(shí)際數(shù)據(jù)處理的需求。一方面,SAR系統(tǒng)的廣泛應(yīng)用以及成像分辨率的提高,對SAR圖像目標(biāo)的檢測效率提出了更高的要求;另一方面,SAR在不同工作模式下具有不同的極化方式、分辨率以及照射角度,導(dǎo)致目標(biāo)圖像特征變化較大,這也給SAR圖像目標(biāo)的檢測帶來了更大的挑戰(zhàn)。因此如何從海量數(shù)據(jù)中挖掘有用信息,準(zhǔn)確、高效、智能地完成SAR圖像目標(biāo)檢測任務(wù),是當(dāng)前亟待解決的問題。近年來,隨著人工智能技術(shù)的迅速發(fā)展,深度學(xué)習(xí)的方法開始應(yīng)用于SAR圖像檢測任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)可以實(shí)現(xiàn)對圖像高層特征的主動提取,避免了人工選取特征的復(fù)雜工作,具有良好的分類準(zhǔn)確度和魯棒性,為SAR圖像目標(biāo)的檢測提供了新的途徑。

本文在總結(jié)SAR圖像目標(biāo)檢測算法基礎(chǔ)上,梳理了基于CNN的目標(biāo)檢測框架及其在SAR圖像檢測中的應(yīng)用,分析了SAR圖像目標(biāo)檢測的難點(diǎn)問題與下一步研究趨勢。

1 傳統(tǒng)檢測算法的研究現(xiàn)狀

傳統(tǒng)的SAR圖像目標(biāo)檢測算法主要有基于背景雜波統(tǒng)計(jì)分布的恒虛警率(constant false-alarm rate,CFAR)檢測算法和人工提取圖像紋理特征的檢測算法。

1.1 恒虛警率檢測算法

CFAR檢測算法利用目標(biāo)周圍的背景單元,選擇恒定的虛警概率確定檢測閾值。利用CFAR算法檢測SAR圖像目標(biāo)的一般流程如圖1所示[1]。

圖1 CFAR算法的檢測流程框圖

CFAR算法需要預(yù)先確定背景雜波分布的統(tǒng)計(jì)模型,由于傳統(tǒng)雙參數(shù)CFAR與基于K分布的CFAR檢測算法在處理寬幅圖像時,對所有滑窗內(nèi)的雜波都使用同一種統(tǒng)計(jì)模型,這種處理方式容易導(dǎo)致統(tǒng)計(jì)模型在不適應(yīng)區(qū)失配。針對這個問題,林旭等[2]提出了一種基于自適應(yīng)背景雜波模型的CFAR寬幅SAR圖像艦船檢測算法。通過背景窗口的多尺度統(tǒng)計(jì)方差判斷目標(biāo)所處的雜波環(huán)境,自適應(yīng)選擇對應(yīng)的背景雜波分布模型。

導(dǎo)致CFAR檢測效果差的另一原因是算法沒有充分利用圖像中的特征信息,僅僅利用了圖像灰度的統(tǒng)計(jì)分布特征。Huang Y[3]提出了一種結(jié)合目標(biāo)語義特征的CFAR算法,在檢測高分辨率SAR圖像目標(biāo)時具有更低的虛警率。艾加秋[4-5]利用SAR圖像目標(biāo)內(nèi)部相鄰像素的強(qiáng)相關(guān)性特征,提出了基于灰度相關(guān)性的聯(lián)合CFAR的檢測算法。曲岳晗[6]利用似物性判斷方法,使用二值化賦范梯度特征來提取CFAR檢測窗口。

CFAR算法容易實(shí)現(xiàn),計(jì)算量相對較小,在簡單背景雜波下具有較好的檢測效果。但是算法只考慮灰度對比度,忽略了目標(biāo)的結(jié)構(gòu)信息,魯棒性與抗干擾能力差,在復(fù)雜背景雜波下檢測性能較差。

1.2 基于圖像紋理特征的檢測算法

紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺特征,通??煞譃樗念悾航y(tǒng)計(jì)型紋理特征(如灰度共生矩陣、灰度—梯度共生矩陣),模型型紋理特征(如分形模型、隨機(jī)場模型),信號處理型紋理特征(如小波變換),結(jié)構(gòu)型紋理特征(如局部二值模式)。

目前在SAR圖像目標(biāo)檢測的研究中,分形特征的應(yīng)用最為廣泛。L M Kaplan[7]利用擴(kuò)展分形(Extended Fractal,EF)特征檢測SAR圖像中的車輛目標(biāo),該特征不僅對目標(biāo)背景的對比度敏感,同時也對目標(biāo)尺寸敏感,與CFAR算法相比,降低了檢測虛警率。D Charalampidis[8-9]提出了小波分形(Wavelet Fractal,WF)特征,可以有效地對圖像中的不同紋理進(jìn)行分割與分類。劉冬等[10]利用指數(shù)小波分形特征檢測SAR圖像目標(biāo),該方法對目標(biāo)對比度和尺寸敏感,且考慮了目標(biāo)邊緣特征與區(qū)域內(nèi)部平滑性特征。袁湛等[11]提出了改進(jìn)擴(kuò)展分形特征,在強(qiáng)雜波、多目標(biāo)環(huán)境下具有更好的檢測性能。

相比于CFAR檢測算法,基于紋理特征的算法利用了更多的圖像信息,具有更高的檢測精度。但是紋理特征需要人工設(shè)計(jì)提取,設(shè)計(jì)過程復(fù)雜耗時,難以保證檢測的時效性。

2 基于卷積神經(jīng)網(wǎng)絡(luò)的檢測算法

近年來,隨著深度學(xué)習(xí)方法的迅速發(fā)展,深度學(xué)習(xí)模型開始應(yīng)用于圖像檢測任務(wù)。

深度學(xué)習(xí)方法的突出優(yōu)勢在于:① 可以實(shí)現(xiàn)對高層特征的主動提取,避免了人工選取特征的復(fù)雜工作;② 利用深層的網(wǎng)絡(luò)結(jié)構(gòu)逐層進(jìn)行非線性變換,對復(fù)雜函數(shù)有良好的逼近效果,具有較高的分類準(zhǔn)確度;③ 在訓(xùn)練數(shù)據(jù)集較為完善的情況下,深度學(xué)習(xí)方法具有較強(qiáng)的魯棒性和泛化性,能夠適應(yīng)復(fù)雜多變的應(yīng)用環(huán)境。

卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是一種針對二維圖像數(shù)據(jù)特征提取而設(shè)計(jì)的深度學(xué)習(xí)模型,通過多個卷積層擬合復(fù)雜函數(shù),每個卷積層的特征都由前一層的局部特征通過共享的權(quán)重得到,有效地減少了網(wǎng)絡(luò)的參數(shù)個數(shù),緩解了模型的過擬合問題,是目標(biāo)檢測、識別等圖像處理領(lǐng)域廣泛采用的深度學(xué)習(xí)模型。

2.1 基于CNN的目標(biāo)檢測框架

基于CNN的圖像目標(biāo)檢測框架主要有兩類,分別是基于候選區(qū)域的目標(biāo)檢測框架和基于回歸的目標(biāo)檢測框架。

2.1.1基于候選區(qū)域的目標(biāo)檢測算法

如圖2所示,基于候選區(qū)域的目標(biāo)檢測框架先通過算法產(chǎn)生目標(biāo)候選框,再對候選框內(nèi)的區(qū)域做目標(biāo)分類與邊框回歸,由于需要分為兩階段進(jìn)行檢測,因此也稱為雙階段(two-stage)檢測算法。此類算法的特點(diǎn)是檢測精度高,但速度較慢,代表性算法有R-CNN[12]、SPP-net[13]、Fast R-CNN[14]、Faster R-CNN[15]、R-FCN[16]等。

圖2 雙階段算法的檢測框架示意圖

R-CNN算法通過selective search從輸入圖像中提取約2 000個候選區(qū)域,并將每個候選區(qū)域縮放為固定大小送入CNN網(wǎng)絡(luò)進(jìn)行特征提取,然后將得到的特征向量用線性SVM分類器預(yù)測出候選區(qū)域中所含每個類別的概率值。最后為了提升定位的準(zhǔn)確性,采用邊界框回歸(bounding box regression)對預(yù)測邊框進(jìn)行調(diào)整。

SPP-net在產(chǎn)生候選區(qū)域之后將整張圖片送入CNN網(wǎng)絡(luò),再將候選區(qū)域映射到特征圖得到對應(yīng)的特征區(qū)域,從而避免了R-CNN中對每個候選區(qū)域單獨(dú)提取特征。在卷積層和全連接層之間加入空間金字塔池化(Spatial Pyramid Pooling,SPP)結(jié)構(gòu)用于將不同大小的特征區(qū)域轉(zhuǎn)換為固定維度的特征向量,代替了R-CNN算法在輸入卷積神經(jīng)網(wǎng)絡(luò)前對各個候選區(qū)域進(jìn)行剪裁、縮放操作,使其圖像子塊尺寸一致的做法,避免了因此產(chǎn)生的目標(biāo)變形。

Fast R-CNN借鑒了SPP-net的思想,對于每個候選區(qū)域,使用感興趣區(qū)域池化(ROI pooling)層來從CNN特征圖中提取固定長度的特征向量,通過全連接層之后,特征向量進(jìn)入2個輸出層,分別進(jìn)行分類和邊界框回歸。

Faster R-CNN采用RPN (Region Proposal Network)直接產(chǎn)生候選區(qū)域,取代了R-CNN以及Fast R-CNN中選擇性搜索(selective search)過程,提高了檢測速度。產(chǎn)生的候選區(qū)域送入Fast R-CNN網(wǎng)絡(luò)進(jìn)行分類以及邊界框回歸。

R-FCN將Faster R-CNN最后的全連接層換成了位置敏感的卷積網(wǎng)絡(luò),從而讓所有計(jì)算可以共享。

2.1.2基于回歸的目標(biāo)檢測算法

基于回歸的目標(biāo)檢測框架將檢測任務(wù)作為回歸問題,無需產(chǎn)生先驗(yàn)框,直接利用神經(jīng)網(wǎng)絡(luò)進(jìn)行端到端的檢測,因此也稱為單階段(one-stage)檢測算法。此類算法的特點(diǎn)是速度很快,同時具有較高的檢測精度。其代表算法有YOLO[17-19]、SSD[20]、Retina-net[21]、RFB-net[22]等。

YOLO[17]算法將圖像縮放為固定大小并劃分為S×S的網(wǎng)格,每個網(wǎng)格預(yù)測B個邊界框以及邊界框置信度。YOLOv2[18]采用錨框(anchor boxes)進(jìn)行邊界框預(yù)測,并通過K-means聚類對錨框進(jìn)行初始化。YOLOv3[19]通過引入特征金字塔網(wǎng)絡(luò)(feature pyramid networks,F(xiàn)PN),將不同分辨率和不同語義強(qiáng)度的特征進(jìn)行融合,解決了多尺度目標(biāo)檢測的問題。

SSD算法結(jié)合Faster R-CNN的錨框機(jī)制和YOLO的回歸思想進(jìn)行目標(biāo)檢測,相比于早期版本的YOLO,提高了定位精度與分類精度。

Retina-net算法提出了聚焦損失(focal loss)函數(shù),解決了訓(xùn)練過程中正負(fù)樣本類別不平衡的問題,這也是制約單階段算法檢測效果的核心問題。

RFB-net算法在SSD網(wǎng)絡(luò)中引入感受野模塊(receptive field block,RFB),通過模擬人類視覺的感受野,加強(qiáng)網(wǎng)絡(luò)的特征提取能力。相比于SSD算法具有更高的檢測精度。

2.1.3主要檢測算法的性能對比

各主要算法的性能參數(shù)如表1所示。從表1可以看出,雙階段檢測算法的檢測精度普遍較高,但檢測速度很慢;單階段算法的檢測速度較快,且檢測精度接近雙階段算法,實(shí)時性強(qiáng),效率高。

表1 主要目標(biāo)檢測算法的檢測性能參數(shù)

2.2 CNN在SAR圖像目標(biāo)檢測中的應(yīng)用

SAR圖像與光學(xué)圖像相比,在包含信息、分辨率、成像機(jī)制方面都有較大區(qū)別:① 從包含信息方面來看,光學(xué)圖像通常含有多個顏色通道的灰度信息,而SAR圖像只記錄單一波段的回波信息,以二進(jìn)制復(fù)數(shù)形式記錄下來,但基于每個像素的復(fù)數(shù)數(shù)據(jù)可變換提取相應(yīng)的振幅和相位信息;② 從分辨率方面看,SAR圖像的分辨率相對較低,由于存在斑點(diǎn)噪聲,信噪比也較低;③ 從成像機(jī)制方面看,光學(xué)圖像采用中心投影或推帚式掃描的方式進(jìn)行成像,而SAR的成像方式是主動發(fā)射與接收電磁波,成像幾何為斜距投影,會產(chǎn)生疊掩、透視收縮、多路徑假目標(biāo)等幾何畸變,目標(biāo)特征具有姿態(tài)敏感性。上述的差異性為SAR圖像目標(biāo)檢測帶來了新的難題。

將CNN應(yīng)用于SAR圖像目標(biāo)檢測中,目前的研究主要集中在以下幾個方面:① 在復(fù)雜場景下檢測目標(biāo),降低虛警率;② 多尺度小目標(biāo)檢測;③ 小樣本學(xué)習(xí)的方法;④ 結(jié)合傳統(tǒng)算法提高算法檢測性能。

下面介紹CNN應(yīng)用于SAR圖像目標(biāo)檢測的研究進(jìn)展。

2.2.1復(fù)雜場景下的目標(biāo)檢測

在復(fù)雜背景環(huán)境下,由于訓(xùn)練數(shù)據(jù)不足或者網(wǎng)絡(luò)提取特征的性能不強(qiáng),背景雜波中可能存在與目標(biāo)相似的特征,導(dǎo)致網(wǎng)絡(luò)誤檢。

目標(biāo)周圍的背景通??梢蕴峁┯杏玫纳舷挛男畔?,例如檢測海面航行的艦船,若周圍背景為海雜波,則目標(biāo)為艦船的可能性較大,若周圍背景為陸地,則可將待檢測目標(biāo)排除。文獻(xiàn)[23]提出了結(jié)合上下文的檢測方法檢測SAR圖像艦船目標(biāo),利用目標(biāo)周圍的背景信息提高檢測結(jié)果的可靠性,減少了虛警。

目標(biāo)檢測網(wǎng)絡(luò)在給出最終的邊界框和分類分?jǐn)?shù)之后,得分高于閾值的邊界框被直接視為目標(biāo)。但對于復(fù)雜場景下的目標(biāo)檢測,基于該準(zhǔn)則的檢測結(jié)果往往存在較多的錯誤。文獻(xiàn)[24]使用最大穩(wěn)定極值區(qū)域(maximum stability extremal region,MSER)準(zhǔn)則進(jìn)一步約束目標(biāo)區(qū)域的判定。目標(biāo)得分需要高于檢測閾值的條件下,只有目標(biāo)區(qū)域?yàn)榉€(wěn)定的高灰度值,區(qū)域面積與長寬比符合條件時,才能最終判定為目標(biāo)。

由于目前基于神經(jīng)網(wǎng)絡(luò)的圖像檢測任務(wù)通常采用矩形框來標(biāo)記目標(biāo)位置,這種方式在框選目標(biāo)時通常也會將一部分背景雜波引入,這樣提取的目標(biāo)特征與背景特征的差異就會弱化,導(dǎo)致檢測性能下降。文獻(xiàn)[25]用DRBox-v2(一種旋轉(zhuǎn)邊界框)取代傳統(tǒng)矩形框標(biāo)記目標(biāo),使得標(biāo)記選框可以適應(yīng)不同的目標(biāo)朝向。這種標(biāo)記方法在框選目標(biāo)時幾乎不會引入背景雜波,提高了網(wǎng)絡(luò)在復(fù)雜環(huán)境下的檢測效果。文獻(xiàn)[26]將目標(biāo)檢測任務(wù)轉(zhuǎn)化為像素分類問題,利用全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional neural network,F(xiàn)CN)對圖像進(jìn)行像素級的分類,有效避免了背景雜波的干擾,降低了虛警率。同時提出目標(biāo)及陰影區(qū)域聯(lián)合檢測的方法,提高了檢測率。文獻(xiàn)[27]認(rèn)為簡單樣本與困難樣本的不平衡是復(fù)雜背景下檢測效果較差的主要原因。因此,文獻(xiàn)[27]借鑒了focal loss[21]的思想,使用新的二分類損失函數(shù),解決簡單樣本與困難樣本的不平衡問題,使訓(xùn)練出的模型更好地區(qū)分目標(biāo)與復(fù)雜背景。

2.2.2多尺度條件下小目標(biāo)的檢測

在目標(biāo)檢測中,由于分辨率較低或者自身真實(shí)尺寸較小,可能會出現(xiàn)目標(biāo)在圖像中所占像素較少而導(dǎo)致漏檢的情況,這一類目標(biāo)通常稱為“小目標(biāo)”。

小目標(biāo)在檢測中易漏檢的原因在于:① 目標(biāo)圖像的像素過少,網(wǎng)絡(luò)難以提取特征;② 為了分類準(zhǔn)確,檢測網(wǎng)絡(luò)利用高層特征生成區(qū)域與分類得分,而小目標(biāo)在高層網(wǎng)絡(luò)中特征圖較小,喪失了較多信息。

目前的研究中,大多采用多尺度特征融合的方法解決小目標(biāo)在高層特征中信息丟失的問題。由于低層特征具有較多的位置信息,適合小目標(biāo)的檢測,因此將底層特征與高層特征進(jìn)行融合,既能充分利用高層特征的語義信息,也能利用低層特征的位置信息,從而使得檢測網(wǎng)絡(luò)具有多尺度檢測的能力。多尺度特征融合的兩種方法如圖3所示。

圖3 多尺度特征融合的兩種方法示意圖

特征金字塔網(wǎng)絡(luò)(feature pyramid networks,F(xiàn)PN) 是具有代表性的一種多尺度特征融合方法,如圖3(a)所示,F(xiàn)PN的方法自頂向下,將高層特征上采樣與低層特征進(jìn)行融合,再在不同尺度上分別預(yù)測結(jié)果。文獻(xiàn)[28-30]都采用了FPN的特征融合方式,提高了對小目標(biāo)的檢測能力。文獻(xiàn)[31]采用了另一種融合方法,如圖3(b)所示,在各層特征之間采用密集連接的方式進(jìn)行融合,相比于FPN的非密集連接方式,漏警率明顯降低。文獻(xiàn)[32]采用一種改進(jìn)的高分辨率特征金字塔網(wǎng)絡(luò)(HRFPN),充分利用高分辨率和低分辨率卷積的特征圖來進(jìn)行SAR圖像艦船檢測,其不僅可并行連接高至低分辨率子網(wǎng),還可以保持圖像高分辨率。

文獻(xiàn)[29]不僅對多尺度特征進(jìn)行了融合,還在損失函數(shù)中引入了目標(biāo)尺寸的平衡項(xiàng),使小目標(biāo)具有更低的損失函數(shù)值,從而更容易被檢測到。

在檢測網(wǎng)絡(luò)中,較多的下采樣次數(shù)會減小特征圖分辨率,這對小目標(biāo)的檢測是不利的。因此文獻(xiàn)[33]在網(wǎng)絡(luò)設(shè)計(jì)中僅采用2次下采樣操作,保證了輸出特征圖的高分辨率。但是減少下采樣操作會引起特征的感受野變小的問題,因此在網(wǎng)絡(luò)中加入空洞卷積,擴(kuò)大特征感受野。

文獻(xiàn)[34]基于inception模塊和空洞卷積擴(kuò)大感受野的原理,在網(wǎng)絡(luò)中加入了淺層特征增強(qiáng)結(jié)構(gòu),增強(qiáng)了模型對小尺寸目標(biāo)的適應(yīng)能力。

2.2.3小樣本學(xué)習(xí)方法

深度學(xué)習(xí)方法需要大量訓(xùn)練數(shù)據(jù)作為驅(qū)動,訓(xùn)練數(shù)據(jù)集是否完備直接影響訓(xùn)練出的模型的泛化能力,而收集數(shù)據(jù)、制作標(biāo)簽的過程則需要消耗大量的人力物力。因此如何充分利用有限的樣本訓(xùn)練出較好的模型是值得研究的問題。

文獻(xiàn)[35]采用遷移學(xué)習(xí)中微調(diào)(fine-tuning)的方法,不僅調(diào)整預(yù)訓(xùn)練網(wǎng)絡(luò)模型以適應(yīng)數(shù)據(jù)集,而且通過反向傳播調(diào)整網(wǎng)絡(luò)參數(shù)。文獻(xiàn)[36]利用了遷移學(xué)習(xí)的思想解決SAR目標(biāo)分類問題中各類別數(shù)據(jù)不平衡的問題。采用批內(nèi)平衡采樣和模型微調(diào)兩階段的遷移學(xué)習(xí),提高了少數(shù)類目標(biāo)的識別精度。

通過數(shù)據(jù)增強(qiáng)擴(kuò)充數(shù)據(jù)集,可以一定程度上提高模型的泛化性。文獻(xiàn)[29,37-39]均通過平移、旋轉(zhuǎn)、加噪等方式進(jìn)行數(shù)據(jù)增強(qiáng)。但由于SAR圖像具有姿態(tài)敏感性,簡單地對圖像進(jìn)行旋轉(zhuǎn)變換并不能反映目標(biāo)姿態(tài)角的變化特征。文獻(xiàn)[40]利用區(qū)域生長算法對切片數(shù)據(jù)進(jìn)行圖像分割,并按照一定分布規(guī)律替換目標(biāo)背景中的部分像素點(diǎn),擴(kuò)充的圖像背景具有多樣性,但沒有引入新的目標(biāo)圖像。

生成式對抗網(wǎng)絡(luò)(generative adversarial network,GAN)是另一種擴(kuò)充數(shù)據(jù)集的有效手段,其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,在訓(xùn)練過程中,生成網(wǎng)絡(luò)的目標(biāo)是盡量生成真實(shí)的圖像去欺騙判別網(wǎng)絡(luò),而判別網(wǎng)絡(luò)的目標(biāo)就是盡量把生成的圖像與真實(shí)圖像區(qū)分開來,這樣就構(gòu)成了一個動態(tài)的博弈過程。相比于傳統(tǒng)方法,利用GAN擴(kuò)充數(shù)據(jù)能夠更好地模擬真實(shí)數(shù)據(jù)的分布特征。文獻(xiàn)[41]使用WGAN (wasserstain GAN)對MSTAR數(shù)據(jù)集進(jìn)行擴(kuò)充,并利用擴(kuò)充后的數(shù)據(jù)集訓(xùn)練識別網(wǎng)絡(luò)。實(shí)驗(yàn)結(jié)果將識別的準(zhǔn)確率從79%提升到91.6%,證明了這種數(shù)據(jù)擴(kuò)充方法的有效性。文獻(xiàn)[42]基于GAN與空間變換網(wǎng)絡(luò)(STN)的思想引入了對抗空間變換網(wǎng)絡(luò),同時在隨機(jī)梯度下降過程中引入線上難例挖掘(OHEM)。對抗空間變換網(wǎng)絡(luò)在特征圖上產(chǎn)生新的訓(xùn)練樣本,并且能夠適應(yīng)目標(biāo)各種角度變化和尺度變換。在網(wǎng)絡(luò)后向傳播過程中引入OHEM技術(shù),能夠自動選擇損失函數(shù)較大的難例樣本進(jìn)行回傳梯度,使檢測器能夠更充分地利用難例樣本。

圖4 生成式對抗網(wǎng)絡(luò)的模型結(jié)構(gòu)框圖

對SAR圖像進(jìn)行切片標(biāo)記需要耗費(fèi)大量人力,文獻(xiàn)[43]利用少數(shù)切片級標(biāo)記的樣本和多數(shù)圖像級標(biāo)記的樣本,提出了一種半監(jiān)督學(xué)習(xí)的訓(xùn)練方法。圖像級標(biāo)記的樣本僅需標(biāo)記圖像中是否含有目標(biāo),能夠減少圖像標(biāo)注所需的時間人力。實(shí)驗(yàn)表明,該方法的性能與全監(jiān)督方法的性能相差不大。

2.2.4CNN與傳統(tǒng)算法的結(jié)合

作為最早出現(xiàn)的SAR圖像檢測算法,CFAR檢測算法發(fā)展成熟,且計(jì)算量相比于深度學(xué)習(xí)方法較少,文獻(xiàn)[38]利用CFAR提取ROI對圖像區(qū)域進(jìn)行預(yù)篩選,再利用CNN對篩選出的區(qū)域進(jìn)行精細(xì)檢測,提高了檢測精度和效率。文獻(xiàn)[39]利用范數(shù)梯度圖(norm gradient map)提取圖像顯著區(qū)域,再利用CNN進(jìn)一步對區(qū)域內(nèi)目標(biāo)定位。

人工提取的特征可以作為CNN特征圖的補(bǔ)充,將兩種特征進(jìn)行融合,可以提高檢測模型的可靠性。文獻(xiàn)[44]通過支持向量機(jī)(SVM)融合了SAR圖像目標(biāo)電磁特征和幾何特征,最后與卷積神經(jīng)網(wǎng)絡(luò)的特征圖進(jìn)行融合,實(shí)驗(yàn)表明了該方法的有效性和可行性。文獻(xiàn)[45]提出了聯(lián)合使用強(qiáng)度和邊緣信息的目標(biāo)識別框架,分別從強(qiáng)度圖像與梯度幅值圖像中提取兩類特征,并將兩種特征進(jìn)行融合,同時保持對應(yīng)的空間關(guān)系。此方法對于小數(shù)據(jù)集高分辨率SAR圖像的檢測效果較好,尤其在復(fù)雜場景下,也有較好的性能。

3 下一步的研究方向

結(jié)合研究現(xiàn)狀,對CNN在SAR圖像目標(biāo)檢測算法研究的發(fā)展方向進(jìn)行展望:

1) 復(fù)雜背景下的干擾以及不同分辨率、入射角等參數(shù)的影響,都對模型的泛化性提出了更高的要求,目前檢測算法的精度仍然難以達(dá)到實(shí)際應(yīng)用的需求。針對檢測任務(wù)特點(diǎn)進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)與訓(xùn)練策略,將有助于提高算法的魯棒性與檢測精度。

2) 目前研究的CNN檢測框架是一種有監(jiān)督學(xué)習(xí)的方式,需要制作訓(xùn)練數(shù)據(jù)標(biāo)簽,通常耗費(fèi)較多時間和人力。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,可以將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、生成對抗模型等學(xué)習(xí)模型中,減少對標(biāo)簽數(shù)據(jù)的依賴。

3) 由于深度學(xué)習(xí)方法需要大量的訓(xùn)練數(shù)據(jù)作為驅(qū)動,目前用于目標(biāo)檢測的公開數(shù)據(jù)集有SSDD[46]、OpenSAR[47]、Air-SARShip[48]等,但未來對檢測算法的深入研究仍需要大量數(shù)據(jù)作為研究支撐。生成式對抗網(wǎng)絡(luò)作為一種生成模型,具有很強(qiáng)的數(shù)據(jù)擴(kuò)充能力,研究基于生成式對抗網(wǎng)絡(luò)的數(shù)據(jù)增強(qiáng)方法,能夠提高數(shù)據(jù)集的完備性,使模型具有更好的泛化性。

4) 傳統(tǒng)的檢測算法可以作為深度學(xué)習(xí)方法的補(bǔ)充,綜合利用人工提取的特征以及網(wǎng)絡(luò)自動提取的特征有助于更準(zhǔn)確地檢測目標(biāo),多種算法的融合將為SAR圖像目標(biāo)檢測提供更多的渠道。

4 結(jié)論

深度學(xué)習(xí)方法在SAR圖像目標(biāo)檢測領(lǐng)域的應(yīng)用具有巨大的價值和潛力。本文在對SAR圖像目標(biāo)檢測方法綜述基礎(chǔ)上,結(jié)合了基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法的應(yīng)用,為下一步的研究指明了方向。卷積神經(jīng)網(wǎng)絡(luò)方法為SAR圖像的特征提取提供了自動化、智能化途徑,隨著對深度學(xué)習(xí)方法的研究更加深入,SAR圖像目標(biāo)檢測技術(shù)也將取得更大的突破。

猜你喜歡
卷積圖像特征
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測定
離散型隨機(jī)變量的分布列與數(shù)字特征
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
一種并行不對稱空洞卷積模塊①
淺析p-V圖像中的兩個疑難問題
巧用圖像中的點(diǎn)、線、面解題
抓特征解方程組
不忠誠的四個特征
名人語錄的極簡圖像表達(dá)
德江县| 泰安市| 绵竹市| 达尔| 郴州市| 深水埗区| 洛南县| 泰安市| 凤冈县| 沙田区| 襄垣县| 镇江市| 盐边县| 吴川市| 南昌市| 伊春市| 兴和县| 阿克陶县| 奉新县| 海盐县| 嘉荫县| 威远县| 玉环县| 会东县| 霍邱县| 察雅县| 淮滨县| 高尔夫| 淮阳县| 留坝县| 磴口县| 宜丰县| 三穗县| 河津市| 尚志市| 周宁县| 连江县| 郯城县| 临沂市| 应用必备| 且末县|