馬 躍,趙志浩,2,尹震宇,樊 超,2,柴安穎,2,李成蒙,2
1(中國(guó)科學(xué)院 沈陽(yáng)計(jì)算技術(shù)研究所,沈陽(yáng) 110168)2(中國(guó)科學(xué)院大學(xué),北京 100049)
目前,目標(biāo)檢測(cè)技術(shù)已經(jīng)應(yīng)用于安全領(lǐng)域、軍事領(lǐng)域、交通領(lǐng)域、醫(yī)療領(lǐng)域以及生活領(lǐng)域等.目標(biāo)檢測(cè)主要是檢測(cè)特定類別的目標(biāo)是否在圖像中,并尋找特定類別的目標(biāo)在圖像中的位置.如何提高目標(biāo)檢測(cè)預(yù)測(cè)的精度成為研究的熱點(diǎn),在目標(biāo)檢測(cè)中,小目標(biāo)由于尺寸小,分辨率低,容易受噪聲的影響,容易造成漏檢和誤檢,所以如何提高小目標(biāo)檢測(cè)的精度一直是目標(biāo)檢測(cè)整體精度提高的重要環(huán)節(jié).
早期的目標(biāo)檢測(cè)主要有Haar特征[1]、方向梯度直方圖HOG(Histogram of Oriented Gradient)[2]、局部二值模式LBP[3](Local Binary Pattern)和分類器(SVM[4]、Adaboost[5]).由于目標(biāo)種類繁多,姿態(tài)千變?nèi)f化,以及各種目標(biāo)之間的遮擋和光照問題,所以傳統(tǒng)的目標(biāo)檢測(cè)方法的魯棒性和實(shí)時(shí)性都很差.隨著計(jì)算資源的發(fā)展,2012年AlexNet[6]嶄露頭角,其運(yùn)用的深度學(xué)習(xí)技術(shù)也因?yàn)槠渌惴z測(cè)精度高開始進(jìn)入人們的視野.
目標(biāo)檢測(cè)算法基于深度學(xué)習(xí)大致分為兩類,分別是雙階段目標(biāo)檢測(cè)算法和單階段目標(biāo)檢測(cè)算法.雙階段目標(biāo)檢測(cè)算法在進(jìn)行分類和定位前,先生成候選框,再將候選框通過神經(jīng)網(wǎng)絡(luò)算法進(jìn)行預(yù)測(cè).當(dāng)前雙階段目標(biāo)檢測(cè)算法主要有RCNN系列,包括RCNN[7],F(xiàn)ast-RCNN[8],F(xiàn)aster-RCNN[9],Mask-RCNN[10]等.雙階段目標(biāo)檢測(cè)算法由于先生成候選框再進(jìn)行預(yù)測(cè),所以其檢測(cè)精度高,但其需要兩步策略,導(dǎo)致模型的復(fù)雜度大幅增加,從而降低了算法模型的預(yù)測(cè)速度.單階段目標(biāo)檢測(cè)算法主要以SSD[11]系列和YOLO[12]系列為主.YOLO算法采用一個(gè)單獨(dú)的CNN模型實(shí)現(xiàn)end-to-end的目標(biāo)檢測(cè),在速度上具有很大優(yōu)勢(shì),但檢測(cè)圖像中如果多于一個(gè)目標(biāo)出現(xiàn)在其劃分的同一個(gè)網(wǎng)格中,就會(huì)出現(xiàn)目標(biāo)的漏檢,所以其對(duì)目標(biāo)的檢測(cè)精度不高.隨后SSD目標(biāo)檢測(cè)算法被提出,其主要運(yùn)用anchor機(jī)制在不同尺度特征圖上檢測(cè),卷積次數(shù)較少的淺層特征圖用于檢測(cè)小占比目標(biāo),提取語(yǔ)義信息較多的高層特征圖用于檢測(cè)大占比目標(biāo),充分運(yùn)用了不同尺度特征圖所包含的信息檢測(cè)不同大小的目標(biāo),這樣做的優(yōu)點(diǎn)是即使在低分辨率的圖像上也能有比較好的檢測(cè)效果,但SSD模型并未解決對(duì)小目標(biāo)檢測(cè)的不友好.YOLO v2[13]算法去掉了全連接層,加入了新的卷積結(jié)構(gòu),每一個(gè)卷積層后添加batch normalization,在此基礎(chǔ)上又加入了級(jí)聯(lián)和Anchor Box,YOLO v2算法相比YOLO算法在檢測(cè)更快速的同時(shí),增強(qiáng)了檢測(cè)精度.YOLO v3[14]算法在YOLO v2的基礎(chǔ)上又進(jìn)行了優(yōu)化,借鑒了SSD算法的優(yōu)點(diǎn),利用了多個(gè)尺度的特征圖對(duì)目標(biāo)進(jìn)行檢測(cè),所以YOLO v3相對(duì)YOLO v2檢測(cè)精度有明顯提升,但由于使用了全新更深層次的網(wǎng)絡(luò)結(jié)構(gòu),其檢測(cè)速度稍有不足.針對(duì)小占比目標(biāo)的檢測(cè),相比之前的算法,YOLO v3算法有了明顯提升.
針對(duì)SSD算法,研究者們也從不同方面對(duì)其進(jìn)行了大量改進(jìn).Liu W等在2017年針對(duì)SSD網(wǎng)絡(luò)進(jìn)行改進(jìn),提出了基于特征融合的DSSD[15]模型,利用高層特征和低層特征所提取的特征不同,使融合后的特征層具有更多的語(yǔ)義信息和細(xì)節(jié)信息,但融合后的特征層計(jì)算量大幅增加,所以檢測(cè)速度有所下降.同時(shí)期,RSSD[16]、FSSD[17]和DSOD[18]也分別利用特征融合改進(jìn)了SSD,在檢測(cè)效果上都有不同程度的提升.RetinaNet[19]算法和RefineDet[20]算法在2018年被提出,F(xiàn)PN[21]結(jié)構(gòu)被應(yīng)用在RetinaNet結(jié)構(gòu)中,構(gòu)建了新型網(wǎng)絡(luò)結(jié)構(gòu),RetinaNet基于特征金字塔結(jié)構(gòu)提出了新的損失函數(shù)進(jìn)行優(yōu)化,利用多尺度特征對(duì)目標(biāo)進(jìn)行檢測(cè).同時(shí)期的RefineDet為了提高對(duì)小目標(biāo)的檢測(cè)能力,也引入了特征金字塔結(jié)構(gòu)對(duì)目標(biāo)進(jìn)行檢測(cè).隨后RFB[22]算法提出使用空洞卷積和多分支卷積增強(qiáng)模型對(duì)特征的提取能力,由于其主干網(wǎng)絡(luò)使用相對(duì)較簡(jiǎn)單的VGG16,RFB算法不僅有較好的檢測(cè)精度,也具有較快的檢測(cè)速度.最近幾年,針對(duì)不同領(lǐng)域特定目標(biāo)的檢測(cè),國(guó)內(nèi)也有部分算法[23]在各個(gè)領(lǐng)域開始應(yīng)用,并具有很好的效果.閱讀綜述[24,25],本文基于SSD算法進(jìn)行改進(jìn),選取了Pascal VOC2007測(cè)試集做驗(yàn)證,對(duì)比了輸入尺度相差不大的SSD算法和DSSD算法各類別目標(biāo)檢測(cè)精度,選取了近年最新的單階段經(jīng)典目標(biāo)檢測(cè)算法比較了mAP值和FPS值,實(shí)驗(yàn)結(jié)果表明,相比SSD算法和DSSD算法,本文模型對(duì)小目標(biāo)檢測(cè)提升明顯,相較近年經(jīng)典的單階段檢測(cè)算法,在具備實(shí)時(shí)性的同時(shí),也具備很高的檢測(cè)精度.
SSD是一種主流單階段目標(biāo)檢測(cè)算法,算法的主干網(wǎng)絡(luò)為VGG16,是一種多尺度特征圖目標(biāo)檢測(cè)算法.SSD(本文提到的SSD和SSD300,輸入尺度全為300×300)模型利用多尺度檢測(cè)特征圖檢測(cè)不同尺度的目標(biāo),用于檢測(cè)小目標(biāo)的為主干網(wǎng)絡(luò)中的Conv4_3,加上新增卷積層中提取的Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2共同組成檢測(cè)特征圖對(duì)目標(biāo)進(jìn)行檢測(cè).充分利用多尺度特征圖的優(yōu)勢(shì),經(jīng)過卷積次數(shù)較少的淺層特征圖檢測(cè)小目標(biāo),經(jīng)過卷積次數(shù)多的深層特征圖具有更多的語(yǔ)義信息檢測(cè)大目標(biāo).
SSD模型經(jīng)過層層卷積池化,低層特征圖包含較多的細(xì)節(jié)邊緣信息,但語(yǔ)義信息不足,高層特征圖包含更多的語(yǔ)義信息,但細(xì)節(jié)信息丟失嚴(yán)重.因此,SSD模型利用多尺度檢測(cè),低層特征層檢測(cè)小目標(biāo),高層特征層檢測(cè)大占比目標(biāo),克服逐層抽樣時(shí)特征的丟失.但是SSD模型僅利用主干網(wǎng)絡(luò)中的Conv4_3層檢測(cè)小目標(biāo),其雖然保留了細(xì)節(jié)信息,但語(yǔ)義信息卻不充分,表征能力也不足,高層特征層有5層,但是由于層級(jí)高,對(duì)中等目標(biāo)的部分特征丟失,這導(dǎo)致了SSD模型對(duì)中等占比目標(biāo)和小占比目標(biāo)的檢測(cè)效果弱于大占比目標(biāo).本文通過分析SSD模型對(duì)于中小目標(biāo)檢測(cè)的缺點(diǎn),提出基于分段反卷積改進(jìn)SSD的SD-SSD模型.
反卷積也叫做轉(zhuǎn)置卷積,反卷積操作的主要目的是放大特征圖,反卷積后的特征圖與卷積前特征圖不完全相同.小尺度特征圖經(jīng)過過多反卷積操作,細(xì)節(jié)信息丟失嚴(yán)重,噪聲信息也增加的更多.卷積中丟失的特征圖信息不能通過反卷積操作進(jìn)行完全恢復(fù).本文提出了分段反卷積的思想,在盡量少的增加噪聲信息的同時(shí),使特征圖的特征信息更充分.
本文SD-SSD模型基于SSD模型進(jìn)行改進(jìn),主干網(wǎng)絡(luò)利用相對(duì)簡(jiǎn)單的VGG16,VGG16在計(jì)算速度上和特征提取上都具有較好的效果.本文提出分段反卷積的思想,又在此基礎(chǔ)上設(shè)計(jì)了新的融合結(jié)構(gòu),避免了反卷積次數(shù)過多噪聲信息加入的同時(shí),又彌補(bǔ)了低層特征層語(yǔ)義信息不足,高層特征層細(xì)節(jié)信息丟失過多.
針對(duì)SSD模型僅有主干網(wǎng)絡(luò)中Conv4_3特征層檢測(cè)中小占比目標(biāo),本文采用的多尺度檢測(cè)提出了在不改變?cè)蠸SD檢測(cè)尺度的情況下,加入更低層次的特征融合層Fusion_conv3_3對(duì)中小占比目標(biāo)增強(qiáng)檢測(cè),以解決SSD對(duì)小目標(biāo)檢測(cè)的不足.為增強(qiáng)本文模型的泛化能力和魯棒性,本文在SD-SSD模型中添加了Batch Normalization.本文提出的模型利用融合后的Fusion_conv3_3、Fusion_conv4_3、Fusion_conv7、Fusion_conv8_2、Fusion_conv9_2、Fusion_conv10_2、Conv11_2多尺度特征層進(jìn)行檢測(cè)多尺度目標(biāo),為充分利用SSD模型多尺度檢測(cè)的優(yōu)點(diǎn),本文提出的模型除了新增加的Fusion_conv3_3,其它檢測(cè)特征層尺度與SSD保持一致.本文模型結(jié)構(gòu)如圖1所示(其中?代表特征融合模塊).
圖1 SD-SSD模型結(jié)構(gòu)圖Fig.1 SD-SSD model structure diagram
SSD在檢測(cè)階段首創(chuàng)了多尺度特征圖檢測(cè),在不同尺度的特征圖上實(shí)現(xiàn)了對(duì)不同尺度的目標(biāo)進(jìn)行檢測(cè),但由于單一特征層包含的信息相對(duì)較少,高層特征圖經(jīng)過層層卷積丟失了過多的細(xì)節(jié)信息,低層特征圖經(jīng)過的卷積次數(shù)較少,語(yǔ)義信息不充分.若只經(jīng)過反卷積,雖然語(yǔ)義信息得到了保留,但也增加了部分噪聲信息,特征層中的細(xì)節(jié)信息并不能恢復(fù),其對(duì)中小占比目標(biāo)的檢測(cè)依舊不足.
本文提出的特征融合借鑒了DSSD模型融合結(jié)構(gòu),為降低參數(shù)量減少計(jì)算,又能實(shí)現(xiàn)特征檢測(cè)層包含更多的特征信息,構(gòu)建了新的融合結(jié)構(gòu),如圖2中,A部分代表是反卷積部分,B部分代表正向卷積部分.A部分先經(jīng)過反卷積進(jìn)行維度的變換,再通過卷積核維度為1的卷積計(jì)算進(jìn)行通道數(shù)的變換減少參數(shù)的計(jì)算量,然后經(jīng)過BN和激活函數(shù),再經(jīng)過一層反卷積和BN、Relu,得到與B部分維度和通道數(shù)相同的特征層與B部分輸出的特征層進(jìn)行融合.圖2中C代表融合模塊,本文通過實(shí)驗(yàn)對(duì)比了3種融合方式,分別是特征值各元素相加求和、特征值各元素相乘求積和通道級(jí)聯(lián)融合,最后選擇了可提供更高精度的通道級(jí)聯(lián)融合方式.特征級(jí)聯(lián)融合完成后,利用卷積核維度為1的卷積計(jì)算進(jìn)行通道數(shù)的轉(zhuǎn)換,將通道數(shù)轉(zhuǎn)化成與步驟B中正向卷積生成的特征層通道數(shù)目相同,最終生成新的融合后的特征層.為增強(qiáng)網(wǎng)絡(luò)的泛化能力和魯棒性,避免模型中權(quán)重偏置溢出,在網(wǎng)絡(luò)中增加了BN層,模型中激活函數(shù)使用的是Relu非線性激活函數(shù).
圖2 特征融合結(jié)構(gòu)圖Fig.2 Feature fusion structure diagram
DSSD模型為了克服SSD對(duì)小目標(biāo)檢測(cè)的不足,利用反卷積進(jìn)行上采樣,又引入殘差結(jié)構(gòu)與正向卷積特征層融合避免低層特征圖卷積次數(shù)較少,特征提取不充分,高層特征層雖然提取到更多的語(yǔ)義特征,但邊緣信息丟失過多的缺點(diǎn).但由于DSSD網(wǎng)絡(luò)模型中反卷積都起源于最末層特征層,其經(jīng)過的層層反卷積,雖然能提取語(yǔ)義特征,也會(huì)造成細(xì)節(jié)特征丟失和過多噪聲信息的加入,這也導(dǎo)致DSSD算法對(duì)目標(biāo)檢測(cè)的效果相對(duì)提升有限.本文提出的改進(jìn)思想是將反卷積的過程分成3段,充分發(fā)揮反卷積的優(yōu)勢(shì),避免反卷積的缺點(diǎn),每段反卷積進(jìn)行后與淺層特征層進(jìn)行融合,融合后的特征層增加了特征的細(xì)節(jié)信息和語(yǔ)義信息,同時(shí)避免了反卷積次數(shù)過多導(dǎo)致噪聲信息加入的問題.
分段反卷積具體實(shí)現(xiàn)如圖1所示,反卷積操作的特征圖從Conv11_2、Conv9_2、Conv7分別進(jìn)行反卷積操作,生成新的特征圖與其低兩層特征圖進(jìn)行圖2方式融合.3個(gè)分段反卷積后,融合生成了6個(gè)新的特征圖與Conv11_2共同進(jìn)行特征檢測(cè).
反卷積操作可以增大感受野,對(duì)特征圖進(jìn)行上采樣,提取更多的語(yǔ)義信息用于圖2中的特征融合.反卷積的計(jì)算公式如式(1).
d=s×(i-1)+k
(1)
在公式(1)中,k為卷積核的大小尺度,i為輸入特征圖分辨率的大小,s為卷積核每次移動(dòng)的步長(zhǎng),d為輸出特征圖分辨率的大小.本文根據(jù)反卷積計(jì)算公式,為級(jí)聯(lián)融合提供條件,將反卷積得到的特征圖尺度與融合前特征圖尺度保持一致.
SSD模型應(yīng)用多尺度特征圖預(yù)測(cè),得益于不同尺度的特征圖對(duì)不同尺度的目標(biāo)具有比較好的效果,SSD算法準(zhǔn)確度和速度都要比之前的算法好很多,但SSD算法對(duì)小目標(biāo)的檢測(cè)不友好,主要原因是用于檢測(cè)小占比目標(biāo)的特征圖僅有主干網(wǎng)絡(luò)中的Conv4_3.如圖3所示,(a)圖為原始圖像,(b)圖是Conv3_3輸出特征圖,(c)圖是Conv4_3輸出特征圖,從特征圖對(duì)比可以明顯看出,經(jīng)過卷積和池化較少的(b)圖保留的邊緣信息更加完整,但由于其經(jīng)過的特征提取層較少,提取到的語(yǔ)義信息也不足.本文模型為解決對(duì)小目標(biāo)檢測(cè)的不足,新增加了保留細(xì)節(jié)信息更多的Conv3_3層與反卷積后的特征層融合作為新的檢測(cè)特征層加強(qiáng)檢測(cè)小目標(biāo),融合后的特征層既具有多次卷積提取到的語(yǔ)義信息,又融合了淺層特征圖的邊緣信息,所以其特征信息更加豐富.
圖3 特征對(duì)比圖Fig.3 Feature comparison chart
增加的Conv3_3層與反卷積融合后的特征層尺度大小為75×75,Conv4_3層與反卷積融合后的特征圖尺度大小為38×38,因?yàn)檫@兩層檢測(cè)特征圖都是由主干網(wǎng)絡(luò)中的特征圖融合而成,為減小特征檢測(cè)層本身差異的影響,這兩層融合后的特征層分別進(jìn)行L2 Normalization[26]做通道歸一化.
為最大程度的保留SSD模型多尺度特征圖檢測(cè)的優(yōu)勢(shì),如表1中結(jié)構(gòu)參數(shù),F(xiàn)usion_conv4_3、Fusion_conv7、Fusion_conv8_2、Fusion_conv9_2、Fusion_conv10_2、Conv11_2特征圖保持檢測(cè)尺度、長(zhǎng)寬比和數(shù)目與SSD模型相同,對(duì)先驗(yàn)框的計(jì)算依舊采用同樣的線性計(jì)算公式:
表1 多尺度特征圖先驗(yàn)框Table 1 Multiscale feature map prior box
(2)
min_sizek=sk×input_size
(3)
max_sizek=sk+1×input_size
(4)
實(shí)驗(yàn)所用數(shù)據(jù)集為 PASCAL VOC 數(shù)據(jù)集,本文使用訓(xùn)練數(shù)據(jù)集共有20個(gè)類別,16551張圖片,包含 VOC2007 和 VOC2012的訓(xùn)練集數(shù)據(jù).利用VOC2007 數(shù)據(jù)集進(jìn)行測(cè)試驗(yàn)證.實(shí)驗(yàn)使用深度學(xué)習(xí)框架為Caffe,顯卡為 Nvidia GeForce GTX 1080Ti,運(yùn)行環(huán)境為linux服務(wù)器.
實(shí)驗(yàn)訓(xùn)練使用預(yù)訓(xùn)練模型為VGG16模型,將圖像輸入尺度設(shè)置為300×300(以下提到的SD-SSD模型輸入圖像尺度都為300×300),模型共迭代訓(xùn)練16萬(wàn)次.模型訓(xùn)練Batch size設(shè)為25,初始學(xué)習(xí)率lr設(shè)為0.01,lr的衰減因子gamma為0.5,衰減策略為lr=lr×gamma,訓(xùn)練6萬(wàn)次、8萬(wàn)次、10萬(wàn)次、12萬(wàn)次、14萬(wàn)次分別對(duì)lr進(jìn)行衰減策略生成新的學(xué)習(xí)率,模型優(yōu)化方法為隨機(jī)梯度下降法.
mAP(mean average precision)作為目標(biāo)檢測(cè)中常用衡量精度的指標(biāo),計(jì)算方法如公式(5)、公式(6)所示.
(5)
mAP=sum(AP)/N
(6)
其中r表示選取回歸的閾值,P表示各個(gè)閾值下精度的數(shù)值,N表示類別的總數(shù)目.在本文模型下,經(jīng)過對(duì)比各置信度閾值下的實(shí)驗(yàn)結(jié)果,當(dāng)閾值為0.4,得到對(duì)各類別目標(biāo)的檢測(cè)效果最優(yōu),本文模型mAP值為81.60%,比SSD(輸入尺度大小為300×300,本文也稱其為SSD300)算法平均檢測(cè)精度提高了4.30%,比DSSD(輸入尺度大小為321×321,本文也稱其為DSSD321)算法平均檢測(cè)精度提高了3.0%.如表2所示,分別展示了本文算法SD-SSD模型在各個(gè)類別上與SSD300和DSSD321的對(duì)比.
表2 不同算法各個(gè)類別目標(biāo)檢測(cè)精度對(duì)比結(jié)果Table 2 Comparison results of object detection accuracy in different categories of different algorithms
對(duì)比各個(gè)類別目標(biāo)檢測(cè)精度,在VOC2007測(cè)試集上,本文提出的算法在輸入圖像尺度差異不大的情況下,相對(duì)SSD和DSSD模型各個(gè)類別的檢測(cè)精度都有不同程度的提升,能夠看出本文算法模型分段進(jìn)行反卷積再做融合操作,融合后的特征圖包含了經(jīng)過多次卷積提取到的語(yǔ)義信息和低層特征圖保留的細(xì)節(jié)信息,對(duì)目標(biāo)檢測(cè)起到了非常積極的作用,解決了SSD算法檢測(cè)特征圖信息不豐富的問題,避免了DSSD算法單一特征圖反卷積次數(shù)過多導(dǎo)致噪聲信息加入過多的問題.如圖4所示,本文選取了7個(gè)小目標(biāo)占比較多的類別作為對(duì)比展示,圓圈代表本文SD-SSD算法對(duì)7類目標(biāo)的檢測(cè)精度,相對(duì)于三角代表的SSD300算法和方框代表的DSSD321算法精度有明顯提高,證明了本文加入不同長(zhǎng)寬比例和更低層次的特征圖進(jìn)行融合后重復(fù)檢測(cè)小目標(biāo)具有顯著效果.
圖4 7類小目標(biāo)classes-mAP對(duì)比圖Fig.4 Comparison chart of 7 small object classes-mAP
目標(biāo)檢測(cè)算法整體性能的評(píng)估除了檢測(cè)精度外,F(xiàn)PS值表示檢測(cè)速度,通常也作為一種衡量標(biāo)準(zhǔn).如表3所示,在本文介紹的實(shí)驗(yàn)環(huán)境下,選取了近年來(lái)部分整體性能較好且輸入尺寸相差不大的單階段目標(biāo)檢測(cè)算法模型與本文模型比較.
表3 VOC2007 測(cè)試集上測(cè)試結(jié)果Table 3 Test results on VOC2007 test dataset
圖5是當(dāng)前主流的單階段目標(biāo)檢測(cè)算法整體性能對(duì)比圖.圖中橫坐標(biāo)是每秒算法檢測(cè)的圖片幀數(shù),縱坐標(biāo)是各算法的檢測(cè)精度mAP值.從圖中可以看出,DSSD(輸入尺度為321×321)模型由于采用了輔助卷積、反卷積,又引入了殘差模塊進(jìn)行特征融合,其檢測(cè)精度明顯高于未采用融合結(jié)構(gòu)的SSD(輸入尺度為300×300)模型,但由于其采用了更深層次的主干網(wǎng)絡(luò),又加入了殘差模型融合,所以其檢測(cè)速度大幅弱于SSD模型.由于本文模型采用的主干網(wǎng)絡(luò)為卷積層數(shù)較少且特征提取效果較好的VGG16網(wǎng)絡(luò),從圖5可以明顯看出,本文模型檢測(cè)速度大幅度領(lǐng)先于同樣引入了融合的DSSD模型;由于采用了分段反卷積和新的融合結(jié)構(gòu)豐富了檢測(cè)特征層的信息,利用改進(jìn)的多尺度特征檢測(cè)層增強(qiáng)對(duì)小占比目標(biāo)的檢測(cè),本文模型的檢測(cè)精度要優(yōu)于SSD模型.本文模型增強(qiáng)了對(duì)小目標(biāo)的檢測(cè),豐富了檢測(cè)特征層的信息,在本文用到的測(cè)試集上,本文模型在檢測(cè)精度上高于最近提出的YOLOv3(輸入尺度為320×320)模型、RefineDet模型和RFB(輸入尺度為300×300)模型,相比新提出的Retinanet模型也具有速度上的領(lǐng)先.
圖5 算法速度精度對(duì)比圖Fig.5 Algorithm FPS and mAP comparison chart
圖6是部分圖片在SSD300算法模型和本文提出的SD-SSD算法模型效果對(duì)比圖.
圖6 檢測(cè)結(jié)果對(duì)比Fig.6 Comparison of test results
從圖6(a)和圖6(b)中的檢測(cè)結(jié)果可以看出,本文提出的SD-SSD目標(biāo)檢測(cè)算法基于SSD300算法進(jìn)行改進(jìn),相對(duì)SSD300目標(biāo)檢測(cè)算法對(duì)小目標(biāo)檢測(cè)更友好,基本不會(huì)出現(xiàn)漏檢和誤檢情況,在很大程度上提高了對(duì)小目標(biāo)的檢測(cè),并且在復(fù)雜場(chǎng)景下不僅對(duì)小目標(biāo)檢測(cè)更友好,對(duì)大目標(biāo)和中等目標(biāo)的識(shí)別準(zhǔn)確率也更高,對(duì)目標(biāo)的定位也更準(zhǔn)確.
基于當(dāng)前SSD目標(biāo)檢測(cè)算法,為進(jìn)一步提升目標(biāo)檢測(cè)的效果,本文算法提出了分段反卷積結(jié)構(gòu)降低了噪聲信息加入,又采用了新的融合結(jié)構(gòu)對(duì)高層特征圖和低層特征圖進(jìn)行融合,豐富了檢測(cè)特征層的信息,為減小了小占比目標(biāo)的誤檢和漏檢,加入了不同長(zhǎng)寬比例的候選框和多尺度特征圖對(duì)小占比目標(biāo)增強(qiáng)檢測(cè).在本文用到的公開測(cè)試集上進(jìn)行測(cè)試驗(yàn)證,改進(jìn)的算法模型對(duì)小占比目標(biāo)的檢測(cè)效果提升尤為顯著,整體檢測(cè)mAP值也達(dá)到了81.60%,檢測(cè)速度也優(yōu)于當(dāng)前大部分主流算法.
在本文算法模型的基礎(chǔ)上,下一步可以在一些特定場(chǎng)景下應(yīng)用此算法檢測(cè)特定的目標(biāo)做輕微的改動(dòng),也可就如何進(jìn)行輕量化網(wǎng)絡(luò),實(shí)現(xiàn)終端設(shè)備的運(yùn)行做深入研究.