周 幸,陳立福
(長沙理工大學(xué)電氣與信息工程學(xué)院,湖南 長沙 410114)
近年來,隨著遙感技術(shù)的快速發(fā)展,各種類型的遙感圖像數(shù)據(jù)不斷豐富,如何實現(xiàn)對遙感圖像進(jìn)行快速、準(zhǔn)確的目標(biāo)檢測成為遙感技術(shù)應(yīng)用的關(guān)鍵。與普通圖像相比,遙感圖像有背景比較復(fù)雜[1]、目標(biāo)特征不完整等問題,容易對檢測造成干擾。因此,要實現(xiàn)遙感圖像的高精度檢測,需要提高算法的特征提取能力。
基于深度學(xué)習(xí)的目標(biāo)檢測算法在圖像特征提取等方面具有較大的優(yōu)勢[2-3],在遙感圖像目標(biāo)檢測領(lǐng)域,王金傳等[4]在Faster R-CNN基礎(chǔ)上引入多層特征融合模型對遙感圖像目標(biāo)實現(xiàn)快速、準(zhǔn)確的檢測;YAO等[5]提出基于多架構(gòu)的神經(jīng)網(wǎng)絡(luò)(MSCNN),不同架構(gòu)分別針對遙感圖像的大中小3類目標(biāo)進(jìn)行檢測;徐逸之等[6]利用全卷積網(wǎng)絡(luò)并引入平移池化,抵消全卷積網(wǎng)絡(luò)造成的不變性問題,使得高分辨遙感圖像目標(biāo)檢測的精度和效率明顯提升。Zou等[7]提出SVDNet網(wǎng)絡(luò),將DCNN與支持向量機(jī)相結(jié)合,對遙感圖像中的船只有較好的檢測效果;Li等[8]利用多尺度檢測方法,將各尺度特征圖都使用特征重標(biāo)定策略,可以有效地消除遙感圖像背景噪聲的影響,但極大地增加了網(wǎng)絡(luò)的參數(shù)量;Xie等[9]使用R-FCN網(wǎng)絡(luò)結(jié)合RPN結(jié)構(gòu),消除了背景的影響,但對于相似的背景,容易出現(xiàn)誤判,對復(fù)雜背景的判斷能力不夠。而Zhang等[10]在Faster R-CNN的區(qū)域推薦結(jié)構(gòu)后引入反卷積層,恢復(fù)小目標(biāo)尺寸,改善了小目標(biāo)檢測結(jié)果;該方法對于已損失的小目標(biāo)像素特征無法起到恢復(fù)作用,對于不同尺寸的目標(biāo)檢測魯棒性較差。Fu等[11]利用不同尺寸的特征圖進(jìn)行特征融合,該方法不僅引入不同特征圖的語義信息,兼顧不同尺寸目標(biāo)的檢測,但同時低層網(wǎng)絡(luò)也給小目標(biāo)引入較多的背景噪聲,影響小目標(biāo)的檢測。
針對遙感圖像目標(biāo)檢測中背景復(fù)雜、尺寸較小的目標(biāo)檢測精度較低的問題,本文設(shè)計一種改進(jìn)SSD算法。該方法以SSD算法為基礎(chǔ),通過改進(jìn)低層特征提取網(wǎng)絡(luò),實現(xiàn)自適應(yīng)特征學(xué)習(xí),在低層特征提取階段獲得更多待檢測小目標(biāo)的語義信息并強化目標(biāo)特征信息;改進(jìn)網(wǎng)絡(luò)的損失函數(shù),改善在訓(xùn)練階段樣本失衡的問題,訓(xùn)練過程中增加難樣本的訓(xùn)練數(shù)量,使目標(biāo)特征較少、特征不完整的難樣本得到充分訓(xùn)練。改進(jìn)算法在保證檢測速度的前提下,有效地提升了檢測精度。
遙感圖像目標(biāo)檢測是一項遙感圖像處理中最基本且極具挑戰(zhàn)性的技術(shù),針對遙感圖像目標(biāo)檢測問題,研究人員提出了一系列算法與解決方案。姚遠(yuǎn)等[12]提出基于層次化分類器的遙感圖像飛機(jī)檢測方法,利用基于Haar特征的底層AdaBoost分類器快速去除非目標(biāo)區(qū)域,用基于梯度方向直方圖(Histogram of Oriented Gradient, HOG)特征的支持向量機(jī)進(jìn)行檢測,可降低檢測的虛警率。張宇等[13]提出一種逐層特征選擇的多層部件模型檢測遙感圖像中的飛機(jī)目標(biāo),將提取到的目標(biāo)特征采用多核學(xué)習(xí)的方法,經(jīng)過核函數(shù)激活后再進(jìn)行組合,構(gòu)造目標(biāo)的分層結(jié)構(gòu)特征,通過分層特征選擇有效地降低了特征計算的復(fù)雜度。利用模型方法進(jìn)行目標(biāo)檢測也是研究的熱點,通過構(gòu)建更加復(fù)雜的檢測模型獲取更多的目標(biāo)特征信息[14-15],如外觀特征信息、尺度不變性特征、方向梯度直方圖特征等,此類方法獲取的信息都來源于待檢測目標(biāo),對于獲取更有代表性、區(qū)分性的語義信息有所不足。近年來,可變形模型[16-17]在目標(biāo)檢測領(lǐng)域應(yīng)用廣泛,但這類算法的檢測速度較慢,算法比較復(fù)雜,而且過度依賴初始模型,泛化性能不強。
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,利用深度學(xué)習(xí)方法進(jìn)行遙感圖像目標(biāo)檢測已成為一個熱門研究領(lǐng)域,基于深度學(xué)習(xí)的目標(biāo)檢測方法被陸續(xù)提出,如二階檢測算法R-CNN[18]、Fast R-CNN[19]、Faster R-CNN[20]等,一階算法如YOLO[21]、SSD[22]等。二階算法的檢測過程可劃分為2個階段,首先生成可能有待檢測目標(biāo)的候選區(qū)域,然后對候選區(qū)域進(jìn)行分類回歸,進(jìn)而實現(xiàn)目標(biāo)檢測。R-CNN算法利用候選區(qū)域獲取和卷積神經(jīng)網(wǎng)絡(luò)(CNN)結(jié)合,利用支持向量機(jī)(SVM)進(jìn)行分類。而針對R-CNN算法中重復(fù)運算的問題,在卷積層和全連接層之間引入金字塔結(jié)構(gòu),提出了SPP-Net[23]算法。借鑒SPP-Net算法結(jié)構(gòu),F(xiàn)ast R-CNN設(shè)計一種ROI Pooling結(jié)構(gòu),并提出多任務(wù)損失函數(shù)思想,統(tǒng)一訓(xùn)練學(xué)習(xí)分類損失和回歸損失,并輸出相應(yīng)坐標(biāo)和對應(yīng)分類。而Faster R-CNN設(shè)計RPN(Region Proposal Networks)網(wǎng)絡(luò)替代上述算法中的選擇性搜索(Selective Search)方法,RPN網(wǎng)絡(luò)先判斷候選框是否為待測目標(biāo),再判定目標(biāo)類型,該方法計算量較少,同時也可避免因候選框提取過多而導(dǎo)致的檢測精度下降等問題。二階算法因生成候選區(qū)域的過程較為復(fù)雜,計算量大,導(dǎo)致訓(xùn)練時間長,在時效性方面稍顯不足。一階算法不須產(chǎn)生候選區(qū)域,可直接生成目標(biāo)的類別概率和位置坐標(biāo)進(jìn)行端到端訓(xùn)練,訓(xùn)練速度更快,且較容易訓(xùn)練,但檢測精度要稍低于二階算法。這2類算法在現(xiàn)有的公共數(shù)據(jù)集上都有較好的檢測效果,一階算法和二階算法都具有自身的優(yōu)勢,可針對不同目標(biāo)選擇不同算法。本文針對遙感圖像目標(biāo)檢測選擇一階算法中的SSD檢測算法進(jìn)行相關(guān)研究。
SSD檢測算法是采用VGG16[24]作為特征提取網(wǎng)絡(luò)的前饋卷積網(wǎng)絡(luò),VGG16對圖像特征具有較好的表征能力,可以提取圖像中較為復(fù)雜的特征。SSD采用anchors機(jī)制[25]和回歸方法,利用多尺度特征圖進(jìn)行目標(biāo)檢測,不同卷積層得到的特征圖尺寸不同,包含不同的語義信息,其中VGG16的Conv4_3層將作為用于檢測的第一個特征圖,此特征圖大小為38×38,從卷積層Conv7(10×10)、Conv8_2(5×5)、Conv9_2(3×3)、Conv10_2(2×2)、Conv11_2(1×1)分別提取一個特征圖,共獲得6個不同尺寸的特征圖。在獲取的不同尺寸的特征圖中設(shè)置了一系列固定大小的先驗框,只有少量的先驗框包含較完整的目標(biāo)信息,這類框定義為正樣本,相反則為負(fù)樣本,而在訓(xùn)練過程中正負(fù)樣本的選取比例是1:3。SSD算法基本框架如圖1所示。
圖1 SSD基本網(wǎng)絡(luò)框架
在確定訓(xùn)練樣本后,SSD損失函數(shù)的計算采用位置誤差(Locatization loss)與置信度誤差(Confidence loss)的加權(quán)和,此函數(shù)用于目標(biāo)框的分類與回歸,其公式為:
(1)
其中,N是匹配先驗框的數(shù)量,c為類別置信度預(yù)測值,l為先驗框所對應(yīng)邊界框的位置預(yù)測值,g為真實目標(biāo)的位置參數(shù)。位置誤差(Lloc)采用Smooth L1 loss,定義如下:
(2)
其中:
(3)
(4)
其中:
(5)
圖2為SSD目標(biāo)檢測算法流程,將預(yù)訓(xùn)練模型作為初始參數(shù),采用本文改進(jìn)SSD算法對網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),極大地減少了訓(xùn)練時間。網(wǎng)絡(luò)將輸入特征圖進(jìn)行卷積,經(jīng)過最大池化與非線性激活,得到輸出特征圖,利用Softmax回歸模型,得到最終的目標(biāo)類型。最后采用誤差反向傳播方式調(diào)整網(wǎng)絡(luò)的權(quán)值與參數(shù),隨著迭代次數(shù)的增加,loss值逐漸減小,直到誤差收斂。
圖2 算法流程
使用雙注意力機(jī)制模型的CBAM[26](Convolutional Block Attention Module)是用于前饋卷積神經(jīng)網(wǎng)絡(luò)的注意力模型。雙注意力模型分為通道注意力模型和空間注意力模型,通道注意力模型利用特征的通道關(guān)系,提高特征提取網(wǎng)絡(luò)的表征能力;而空間注意力模型利用特征圖的空間關(guān)系,搜集待測目標(biāo)特征的語義信息。通道注意力模型使用最大池化和平均池化[27]操作聚集圖像的目標(biāo)語義信息,通過共享網(wǎng)絡(luò)(一個隱藏層和多層感知機(jī)MLP組成)得到通道注意力特征圖Mc,其運算公式如式(6)所示:
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
(6)
其中,F(xiàn)為輸入圖像,σ表示Sigmoid函數(shù),w0與w1是多層感知機(jī)的權(quán)重,w0也是輸入圖像和激活函數(shù)共享權(quán)重系數(shù),w0∈RC/r×C,w1∈RC×C/r,r是壓縮率。通道注意力模型的工作機(jī)制如圖3所示。
圖3 通道注意力模型
將Mc與輸入圖像F逐元素相乘,得到的特征圖F′作為空間注意力模塊的輸入,先做基于空間最大池化和平均池化,將得到的特征圖進(jìn)行特征融合,再經(jīng)過卷積操作后生成一個二維特征圖,最后經(jīng)過Sigmoid函數(shù)生成空間注意力特征圖Ms。其運算公式如式(7)所示:
Ms(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))
(7)
其中,σ表示Sigmoid函數(shù),7×7表示卷積核大小??臻g注意力模型的工作機(jī)制如圖4所示。
圖4 空間注意力模型
在CBAM網(wǎng)絡(luò)中,將Mc與Ms進(jìn)行特征加權(quán),公式如(8)所示:
F′=F?Mc,F″=F′?Ms
(8)
其中?表示逐元素相乘,CBAM網(wǎng)絡(luò)將輸入圖像F與Mc逐元素相乘到特征加權(quán)后的特征圖F′,F(xiàn)′作為空間注意力模型的輸入與Ms逐元素相乘得到最終的加權(quán)特征圖F″,F(xiàn)″即經(jīng)過自適應(yīng)特征學(xué)習(xí)后的特征圖,特征圖中的目標(biāo)特征得到充分學(xué)習(xí)與強化。工作原理如圖5所示。
圖5 CBAM模型原理流程圖
在空間注意力模型中,要利用卷積操作進(jìn)行特征融合,在傳統(tǒng)的空間注意力模型中,卷積操作采用窗口大小為7×7的卷積核。相比于3×3的卷積核,7×7的卷積核擁有更大的感受野,提取到的目標(biāo)特征比較完整,但大窗口的卷積核增加了網(wǎng)絡(luò)的參數(shù),加大了網(wǎng)絡(luò)的計算量。為了有效地減少計算量,本文引入空洞卷積(Dilated Convolutions)[28]代替空間注意力模型中傳統(tǒng)的7×7卷積核,構(gòu)建全新的CBAM模型,即DC-CBAM模型。
本文改進(jìn)算法采用的空洞卷積的卷積核大小為3×3,空洞率為3,此空洞卷積雖然是3×3的卷積核,卻有7×7卷積核的感受野,而參數(shù)也由原來的49個減少為9個。采用此空洞卷積核,既保證了原卷積核的感受野,在一定程度上可以提高特征提取能力,又減少改進(jìn)網(wǎng)絡(luò)的計算量,提升網(wǎng)絡(luò)的實時性??斩淳矸e示意圖如圖6所示。
圖6 空洞卷積示意圖
因SSD算法原理的局限性,導(dǎo)致檢測網(wǎng)絡(luò)在訓(xùn)練時正負(fù)樣本的比例達(dá)到1:3,訓(xùn)練中負(fù)樣本的比例偏大,負(fù)樣本過多在一定程度上主導(dǎo)了loss的梯度更新方向,使得網(wǎng)絡(luò)在訓(xùn)練中過早擬合而導(dǎo)致訓(xùn)練效果不佳。本文引入Focal loss[29]損失函數(shù),對SSD算法的損失函數(shù)進(jìn)行相應(yīng)的改進(jìn),改進(jìn)算法的損失函數(shù)采用Focal loss損失函數(shù)代替原Softmax loss損失函數(shù)(Lconf)。通過改進(jìn)分類損失函數(shù)改善SSD算法樣本失衡的問題,保證訓(xùn)練中有足量的正樣本與難樣本,讓正樣本與難樣本主導(dǎo)loss的梯度更新方向,使網(wǎng)絡(luò)得到充分的訓(xùn)練。Focal loss計算方法如式(9)所示:
FL(pt)=-αt(1-pt)γlog (pt)
(9)
式(9)中,F(xiàn)L是一個尺度動態(tài)可調(diào)節(jié)的交叉熵?fù)p失函數(shù),pt表示不同類別的分類概率,αt和γ是常量參數(shù),其中αt的主要作用是解決正負(fù)樣本不平衡的問題,α∈[0,1],正樣本取1,負(fù)樣本取1-αt;而γ是一個大于0的值,解決難易樣本不平衡問題,減少易分樣本的訓(xùn)練比重。該損失函數(shù)給每一個樣本乘以一個調(diào)制系數(shù)(1-pt)γ,當(dāng)樣本被錯誤分類且pt較小時,調(diào)制系數(shù)接近于1,此時網(wǎng)絡(luò)中的難分樣本主導(dǎo)loss的梯度更新;若樣本的pt趨近于1時,調(diào)制系數(shù)趨向于0,此時易分樣本loss的權(quán)重減小,對梯度更新貢獻(xiàn)很少。在改進(jìn)SSD算法中,γ的取值為3,αt的取值為0.4。
SSD檢測算法是多尺度檢測,對利用不同卷積層獲得的不同尺度特征圖進(jìn)行檢測,而小目標(biāo)的檢測有效特征信息大部分在低層特征圖,因此加強低層特征圖的目標(biāo)特征提取能力,可以改善小目標(biāo)的檢測效果。通過大量的對比實驗,選擇最優(yōu)的改進(jìn)算法結(jié)構(gòu),最終在SSD算法的前端低層網(wǎng)絡(luò)Conv3_3和Conv4_3這2個卷積層分別加1個DC-CBAM模型,將2個卷積層得到的特征圖進(jìn)行自適應(yīng)特征學(xué)習(xí),強化突出該層特征圖的目標(biāo)特征。DC-CBAM模型的加入,可以最大程度地提取該層待測目標(biāo)的語義信息,有效地提高SSD低層特征提取網(wǎng)絡(luò)的表征能力。而在分類器中引入Focal loss損失函數(shù),有效地改善樣本失衡問題,使網(wǎng)絡(luò)側(cè)重于訓(xùn)練正樣本與難樣本,提升網(wǎng)絡(luò)的檢測精度。
通過上述方法構(gòu)建新的SSD網(wǎng)絡(luò),使低層特征圖具備更全面、更突出的目標(biāo)特征信息,并保證網(wǎng)絡(luò)的計算速度;改善樣本失衡問題,提升檢測精度。改進(jìn)SSD算法的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。
圖7 改進(jìn)SSD算法網(wǎng)絡(luò)結(jié)構(gòu)示意圖
仿真實驗采用航天遙感數(shù)據(jù)集NWPU VHR-10數(shù)據(jù)集進(jìn)行驗證,選擇其中8類目標(biāo)作為檢測對象,制作原始數(shù)據(jù)圖1045幅,對原始數(shù)據(jù)集做數(shù)據(jù)增強(旋轉(zhuǎn)90°、飽和度、曝光度變化及鏡像翻轉(zhuǎn)等),將數(shù)據(jù)圖集擴(kuò)增到5225幅,采用Labelimg對數(shù)據(jù)圖集進(jìn)行人工標(biāo)注,將數(shù)據(jù)圖制作為VOC數(shù)據(jù)格式,其中4625幅圖片作為訓(xùn)練集,其余的為測試集,制作的數(shù)據(jù)圖集樣例如圖8所示。
圖8 遙感圖像VOC數(shù)據(jù)集制作樣例
實驗采用TensorFlow框架,采用隨機(jī)梯度下降算法(Stochastic Gradient Descent, SGD)對模型進(jìn)行訓(xùn)練,訓(xùn)練集數(shù)據(jù)訓(xùn)練迭代5萬次,batch_size設(shè)為32,采用衰減學(xué)習(xí)率,初始學(xué)習(xí)率設(shè)置為0.001,沖量為0.94,權(quán)重衰減至0.0001。實驗平臺為Ubuntu16.04操作系統(tǒng),Inter Core i7-6800K CPU,英偉達(dá)GTX TITAN Xp GPU。
loss曲線能在一定程度上顯示算法的訓(xùn)練效果,loss值越小,說明網(wǎng)絡(luò)訓(xùn)練得越好。圖9所示為傳統(tǒng)SSD算法和引入Focal loss損失函數(shù)的改進(jìn)SSD算法的loss函數(shù)值對比。由圖可以看出,改進(jìn)SSD算法的loss值收斂速度更快,在迭代次數(shù)達(dá)到1萬次的時候網(wǎng)絡(luò)就基本收斂,而傳統(tǒng)SSD算法要迭代1.5萬次才收斂,而且收斂后loss值要小于傳統(tǒng)SSD算法的loss值,驗證了引入Focal loss損失函數(shù)的有效性。
圖9 loss函數(shù)值變化趨勢
在目標(biāo)檢測中,主要使用mAP(mean Average Precision)[30]、檢測速度與召回率Recall來衡量一個檢測網(wǎng)絡(luò)的性能。計算mAP的前提是得到每一類的AP值,如式(10)所示:
(10)
式(10)中,N為數(shù)據(jù)集中待檢測目標(biāo)的所有圖像數(shù)量,j表示待檢測目標(biāo)對象的總數(shù)量;若第n個目標(biāo)檢測正確,則Mn為1,相反則為0。Ni表示前n幅圖片中含有檢測目標(biāo)的數(shù)量。求得每一個類別的AP,最后計算mAP的值。
召回率Recall是測試集中所有正樣本樣例中,被正確識別為正樣本的比例,即被正確識別出來的目標(biāo)個數(shù)與測試集中所有真實目標(biāo)的個數(shù)的比值。其計算公式為:
(11)
其中,TP(True Positives):預(yù)測為Positive,實際為Positive的樣本的數(shù)量,即,被正確識別的正樣本的數(shù)量。FN(False Negatives):預(yù)測為Negative,實際為Positive的樣本的數(shù)量,即,被錯誤識別為負(fù)樣本的正樣本的數(shù)量。
各算法指標(biāo)如表1所示。通過表1的對比分析,改進(jìn)SSD算法在檢測精度方面與Recall均具有一定的優(yōu)勢,改進(jìn)SSD(DC版,CBAM+FL+空洞卷積)算法的檢測精度與檢測速度分別能達(dá)到79.65%、43.5幀/s,召回率能達(dá)到96.8%,檢測精度與召回率均高于表1中其余目標(biāo)檢測算法,與傳統(tǒng)SSD算法相比提高了2.25個百分點,檢測精度提升明顯。而檢測速度與傳統(tǒng)SSD算法差距極小,SSD(FL)和改進(jìn)SSD(CBAM+FL)的mAP和Recall相比于傳統(tǒng)SSD算法也都有一定程度的提高,驗證了引入Focal loss損失函數(shù)和CBAM模型的有效性。在本文改進(jìn)算法中,改進(jìn)SSD(DC版,CBAM+FL+空洞卷積)比改進(jìn)SSD檢測速度快3幀/s,引入空洞卷積后使改進(jìn)算法在精度與實時性方面達(dá)到更大的平衡。
表1 各類檢測算法檢測指標(biāo)
圖10是各類目標(biāo)檢測算法與本文改進(jìn)SSD算法的檢測結(jié)果對比圖,從測試集中選取部分具有代表性的檢測結(jié)果圖進(jìn)行對比,通過直觀的目標(biāo)檢測結(jié)果對比各種算法的檢測效果。
針對本文遙感圖像數(shù)據(jù)集,由圖10可以看出,本文改進(jìn)SSD算法和Faster R-CNN、YOLOv3、SSD(FL)、傳統(tǒng)SSD算法的檢測效果相比,雖然某些目標(biāo)的檢測效果差異不大,但本文改進(jìn)SSD算法的整體檢測效果要更好,主要體現(xiàn)在復(fù)雜背景下的目標(biāo)檢測和對小目標(biāo)的檢測更全面、精準(zhǔn)。下面主要對比傳統(tǒng)SSD算法與本文改進(jìn)SSD算法的檢測性能差異,圖10中,(a)列中對飛機(jī)場面靜態(tài)飛機(jī)的姿態(tài)、顏色、尺寸等本文改進(jìn)SSD算法有良好的魯棒性,小目標(biāo)檢測效果較好;(b)列中目標(biāo)很密集,而背景比較復(fù)雜,要檢測圖像中的目標(biāo)比較困難,與傳統(tǒng)SSD算法相比,改進(jìn)SSD算法對密集目標(biāo)檢測的效果有一定程度的改善,將傳統(tǒng)SSD算法漏檢的棒球場成功檢測出;(c)列中的田徑場雖然是大目標(biāo),但因目標(biāo)特征與背景相似,跑道可以認(rèn)為是田徑場與背景之間的唯一區(qū)分,導(dǎo)致目標(biāo)特征與背景區(qū)分度較小,進(jìn)行此類目標(biāo)檢測時,突出目標(biāo)的特征尤為重要,而改進(jìn)算法引入了雙注意力機(jī)制,可以解決此問題。
圖10 檢測結(jié)果對比圖
為了提高遙感圖像檢測精度,本文提出了一種基于雙注意力機(jī)制模型的改進(jìn)SSD算法。該算法以SSD算法為基礎(chǔ)網(wǎng)絡(luò),設(shè)計了具有自適應(yīng)特征學(xué)習(xí)的低層特征提取網(wǎng)絡(luò)。改進(jìn)網(wǎng)絡(luò)在低層特征提取網(wǎng)絡(luò)中引入DC-CBAM模型,構(gòu)建一個優(yōu)化的特征提取網(wǎng)絡(luò),對目標(biāo)特征進(jìn)行特征強化學(xué)習(xí),突出有效的目標(biāo)特征。在CBAM模型組中引入空洞卷積,保證卷積核感受野,減少網(wǎng)絡(luò)參數(shù)和計算量。引入Focal loss損失函數(shù),利用調(diào)制系數(shù)控制難樣本與易分樣本在訓(xùn)練時的權(quán)重比例,改善loss函數(shù)的梯度更新方向,增加一定量難樣本的權(quán)重,讓難樣本對loss梯度更新作主要貢獻(xiàn)。改進(jìn)SSD算法在不增加計算量并且保證檢測速度的前提下,檢測精度有較大的提升,并且具有較好的魯棒性。筆者后續(xù)研究將考慮如何有效地提高SSD算法的訓(xùn)練與檢測速度,提升該算法的實時性。