分段反卷積改進(jìn)SSD的目標(biāo)檢測(cè)算法

2021-07-08 08:27趙志浩尹震宇柴安穎李成蒙

小型微型計(jì)算機(jī)系統(tǒng) 2021年7期

馬躍，趙志浩，2，尹震宇，樊超，2，柴安穎，2，李成蒙，2

1(中國(guó)科學(xué)院沈陽(yáng)計(jì)算技術(shù)研究所，沈陽(yáng) 110168)2(中國(guó)科學(xué)院大學(xué)，北京 100049)

1 引言

目前，目標(biāo)檢測(cè)技術(shù)已經(jīng)應(yīng)用于安全領(lǐng)域、軍事領(lǐng)域、交通領(lǐng)域、醫(yī)療領(lǐng)域以及生活領(lǐng)域等.目標(biāo)檢測(cè)主要是檢測(cè)特定類別的目標(biāo)是否在圖像中，并尋找特定類別的目標(biāo)在圖像中的位置.如何提高目標(biāo)檢測(cè)預(yù)測(cè)的精度成為研究的熱點(diǎn)，在目標(biāo)檢測(cè)中，小目標(biāo)由于尺寸小，分辨率低，容易受噪聲的影響，容易造成漏檢和誤檢，所以如何提高小目標(biāo)檢測(cè)的精度一直是目標(biāo)檢測(cè)整體精度提高的重要環(huán)節(jié).

早期的目標(biāo)檢測(cè)主要有Haar特征[1]、方向梯度直方圖HOG(Histogram of Oriented Gradient)[2]、局部二值模式LBP[3](Local Binary Pattern)和分類器(SVM[4]、Adaboost[5]).由于目標(biāo)種類繁多，姿態(tài)千變?nèi)f化，以及各種目標(biāo)之間的遮擋和光照問題，所以傳統(tǒng)的目標(biāo)檢測(cè)方法的魯棒性和實(shí)時(shí)性都很差.隨著計(jì)算資源的發(fā)展，2012年AlexNet[6]嶄露頭角，其運(yùn)用的深度學(xué)習(xí)技術(shù)也因?yàn)槠渌惴z測(cè)精度高開始進(jìn)入人們的視野.

目標(biāo)檢測(cè)算法基于深度學(xué)習(xí)大致分為兩類，分別是雙階段目標(biāo)檢測(cè)算法和單階段目標(biāo)檢測(cè)算法.雙階段目標(biāo)檢測(cè)算法在進(jìn)行分類和定位前，先生成候選框，再將候選框通過神經(jīng)網(wǎng)絡(luò)算法進(jìn)行預(yù)測(cè).當(dāng)前雙階段目標(biāo)檢測(cè)算法主要有RCNN系列，包括RCNN[7]，F(xiàn)ast-RCNN[8]，F(xiàn)aster-RCNN[9]，Mask-RCNN[10]等.雙階段目標(biāo)檢測(cè)算法由于先生成候選框再進(jìn)行預(yù)測(cè)，所以其檢測(cè)精度高，但其需要兩步策略，導(dǎo)致模型的復(fù)雜度大幅增加，從而降低了算法模型的預(yù)測(cè)速度.單階段目標(biāo)檢測(cè)算法主要以SSD[11]系列和YOLO[12]系列為主.YOLO算法采用一個(gè)單獨(dú)的CNN模型實(shí)現(xiàn)end-to-end的目標(biāo)檢測(cè)，在速度上具有很大優(yōu)勢(shì)，但檢測(cè)圖像中如果多于一個(gè)目標(biāo)出現(xiàn)在其劃分的同一個(gè)網(wǎng)格中，就會(huì)出現(xiàn)目標(biāo)的漏檢，所以其對(duì)目標(biāo)的檢測(cè)精度不高.隨后SSD目標(biāo)檢測(cè)算法被提出，其主要運(yùn)用anchor機(jī)制在不同尺度特征圖上檢測(cè)，卷積次數(shù)較少的淺層特征圖用于檢測(cè)小占比目標(biāo)，提取語(yǔ)義信息較多的高層特征圖用于檢測(cè)大占比目標(biāo)，充分運(yùn)用了不同尺度特征圖所包含的信息檢測(cè)不同大小的目標(biāo)，這樣做的優(yōu)點(diǎn)是即使在低分辨率的圖像上也能有比較好的檢測(cè)效果，但SSD模型并未解決對(duì)小目標(biāo)檢測(cè)的不友好.YOLO v2[13]算法去掉了全連接層，加入了新的卷積結(jié)構(gòu)，每一個(gè)卷積層后添加batch normalization，在此基礎(chǔ)上又加入了級(jí)聯(lián)和Anchor Box，YOLO v2算法相比YOLO算法在檢測(cè)更快速的同時(shí)，增強(qiáng)了檢測(cè)精度.YOLO v3[14]算法在YOLO v2的基礎(chǔ)上又進(jìn)行了優(yōu)化，借鑒了SSD算法的優(yōu)點(diǎn)，利用了多個(gè)尺度的特征圖對(duì)目標(biāo)進(jìn)行檢測(cè)，所以YOLO v3相對(duì)YOLO v2檢測(cè)精度有明顯提升，但由于使用了全新更深層次的網(wǎng)絡(luò)結(jié)構(gòu)，其檢測(cè)速度稍有不足.針對(duì)小占比目標(biāo)的檢測(cè)，相比之前的算法，YOLO v3算法有了明顯提升.

針對(duì)SSD算法，研究者們也從不同方面對(duì)其進(jìn)行了大量改進(jìn).Liu W等在2017年針對(duì)SSD網(wǎng)絡(luò)進(jìn)行改進(jìn)，提出了基于特征融合的DSSD[15]模型，利用高層特征和低層特征所提取的特征不同，使融合后的特征層具有更多的語(yǔ)義信息和細(xì)節(jié)信息，但融合后的特征層計(jì)算量大幅增加，所以檢測(cè)速度有所下降.同時(shí)期，RSSD[16]、FSSD[17]和DSOD[18]也分別利用特征融合改進(jìn)了SSD，在檢測(cè)效果上都有不同程度的提升.RetinaNet[19]算法和RefineDet[20]算法在2018年被提出，F(xiàn)PN[21]結(jié)構(gòu)被應(yīng)用在RetinaNet結(jié)構(gòu)中，構(gòu)建了新型網(wǎng)絡(luò)結(jié)構(gòu)，RetinaNet基于特征金字塔結(jié)構(gòu)提出了新的損失函數(shù)進(jìn)行優(yōu)化，利用多尺度特征對(duì)目標(biāo)進(jìn)行檢測(cè).同時(shí)期的RefineDet為了提高對(duì)小目標(biāo)的檢測(cè)能力，也引入了特征金字塔結(jié)構(gòu)對(duì)目標(biāo)進(jìn)行檢測(cè).隨后RFB[22]算法提出使用空洞卷積和多分支卷積增強(qiáng)模型對(duì)特征的提取能力，由于其主干網(wǎng)絡(luò)使用相對(duì)較簡(jiǎn)單的VGG16，RFB算法不僅有較好的檢測(cè)精度，也具有較快的檢測(cè)速度.最近幾年，針對(duì)不同領(lǐng)域特定目標(biāo)的檢測(cè)，國(guó)內(nèi)也有部分算法[23]在各個(gè)領(lǐng)域開始應(yīng)用，并具有很好的效果.閱讀綜述[24，25]，本文基于SSD算法進(jìn)行改進(jìn)，選取了Pascal VOC2007測(cè)試集做驗(yàn)證，對(duì)比了輸入尺度相差不大的SSD算法和DSSD算法各類別目標(biāo)檢測(cè)精度，選取了近年最新的單階段經(jīng)典目標(biāo)檢測(cè)算法比較了mAP值和FPS值，實(shí)驗(yàn)結(jié)果表明，相比SSD算法和DSSD算法，本文模型對(duì)小目標(biāo)檢測(cè)提升明顯，相較近年經(jīng)典的單階段檢測(cè)算法，在具備實(shí)時(shí)性的同時(shí)，也具備很高的檢測(cè)精度.

2 相關(guān)工作

2.1 SSD模型結(jié)構(gòu)

SSD是一種主流單階段目標(biāo)檢測(cè)算法，算法的主干網(wǎng)絡(luò)為VGG16，是一種多尺度特征圖目標(biāo)檢測(cè)算法.SSD(本文提到的SSD和SSD300，輸入尺度全為300×300)模型利用多尺度檢測(cè)特征圖檢測(cè)不同尺度的目標(biāo)，用于檢測(cè)小目標(biāo)的為主干網(wǎng)絡(luò)中的Conv4_3，加上新增卷積層中提取的Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2共同組成檢測(cè)特征圖對(duì)目標(biāo)進(jìn)行檢測(cè).充分利用多尺度特征圖的優(yōu)勢(shì)，經(jīng)過卷積次數(shù)較少的淺層特征圖檢測(cè)小目標(biāo)，經(jīng)過卷積次數(shù)多的深層特征圖具有更多的語(yǔ)義信息檢測(cè)大目標(biāo).

2.2 SSD模型的缺點(diǎn)分析

SSD模型經(jīng)過層層卷積池化，低層特征圖包含較多的細(xì)節(jié)邊緣信息，但語(yǔ)義信息不足，高層特征圖包含更多的語(yǔ)義信息，但細(xì)節(jié)信息丟失嚴(yán)重.因此，SSD模型利用多尺度檢測(cè)，低層特征層檢測(cè)小目標(biāo)，高層特征層檢測(cè)大占比目標(biāo)，克服逐層抽樣時(shí)特征的丟失.但是SSD模型僅利用主干網(wǎng)絡(luò)中的Conv4_3層檢測(cè)小目標(biāo)，其雖然保留了細(xì)節(jié)信息，但語(yǔ)義信息卻不充分，表征能力也不足，高層特征層有5層，但是由于層級(jí)高，對(duì)中等目標(biāo)的部分特征丟失，這導(dǎo)致了SSD模型對(duì)中等占比目標(biāo)和小占比目標(biāo)的檢測(cè)效果弱于大占比目標(biāo).本文通過分析SSD模型對(duì)于中小目標(biāo)檢測(cè)的缺點(diǎn)，提出基于分段反卷積改進(jìn)SSD的SD-SSD模型.

2.3 反卷積

反卷積也叫做轉(zhuǎn)置卷積，反卷積操作的主要目的是放大特征圖，反卷積后的特征圖與卷積前特征圖不完全相同.小尺度特征圖經(jīng)過過多反卷積操作，細(xì)節(jié)信息丟失嚴(yán)重，噪聲信息也增加的更多.卷積中丟失的特征圖信息不能通過反卷積操作進(jìn)行完全恢復(fù).本文提出了分段反卷積的思想，在盡量少的增加噪聲信息的同時(shí)，使特征圖的特征信息更充分.

3 基于SSD模型改進(jìn)的SD-SSD模型具體實(shí)現(xiàn)

本文SD-SSD模型基于SSD模型進(jìn)行改進(jìn)，主干網(wǎng)絡(luò)利用相對(duì)簡(jiǎn)單的VGG16，VGG16在計(jì)算速度上和特征提取上都具有較好的效果.本文提出分段反卷積的思想，又在此基礎(chǔ)上設(shè)計(jì)了新的融合結(jié)構(gòu)，避免了反卷積次數(shù)過多噪聲信息加入的同時(shí)，又彌補(bǔ)了低層特征層語(yǔ)義信息不足，高層特征層細(xì)節(jié)信息丟失過多.

針對(duì)SSD模型僅有主干網(wǎng)絡(luò)中Conv4_3特征層檢測(cè)中小占比目標(biāo)，本文采用的多尺度檢測(cè)提出了在不改變?cè)蠸SD檢測(cè)尺度的情況下，加入更低層次的特征融合層Fusion_conv3_3對(duì)中小占比目標(biāo)增強(qiáng)檢測(cè)，以解決SSD對(duì)小目標(biāo)檢測(cè)的不足.為增強(qiáng)本文模型的泛化能力和魯棒性，本文在SD-SSD模型中添加了Batch Normalization.本文提出的模型利用融合后的Fusion_conv3_3、Fusion_conv4_3、Fusion_conv7、Fusion_conv8_2、Fusion_conv9_2、Fusion_conv10_2、Conv11_2多尺度特征層進(jìn)行檢測(cè)多尺度目標(biāo)，為充分利用SSD模型多尺度檢測(cè)的優(yōu)點(diǎn)，本文提出的模型除了新增加的Fusion_conv3_3，其它檢測(cè)特征層尺度與SSD保持一致.本文模型結(jié)構(gòu)如圖1所示(其中?代表特征融合模塊).

圖1 SD-SSD模型結(jié)構(gòu)圖Fig.1 SD-SSD model structure diagram

3.1 特征融合結(jié)構(gòu)

SSD在檢測(cè)階段首創(chuàng)了多尺度特征圖檢測(cè)，在不同尺度的特征圖上實(shí)現(xiàn)了對(duì)不同尺度的目標(biāo)進(jìn)行檢測(cè)，但由于單一特征層包含的信息相對(duì)較少，高層特征圖經(jīng)過層層卷積丟失了過多的細(xì)節(jié)信息，低層特征圖經(jīng)過的卷積次數(shù)較少，語(yǔ)義信息不充分.若只經(jīng)過反卷積，雖然語(yǔ)義信息得到了保留，但也增加了部分噪聲信息，特征層中的細(xì)節(jié)信息并不能恢復(fù)，其對(duì)中小占比目標(biāo)的檢測(cè)依舊不足.

本文提出的特征融合借鑒了DSSD模型融合結(jié)構(gòu)，為降低參數(shù)量減少計(jì)算，又能實(shí)現(xiàn)特征檢測(cè)層包含更多的特征信息，構(gòu)建了新的融合結(jié)構(gòu)，如圖2中，A部分代表是反卷積部分，B部分代表正向卷積部分.A部分先經(jīng)過反卷積進(jìn)行維度的變換，再通過卷積核維度為1的卷積計(jì)算進(jìn)行通道數(shù)的變換減少參數(shù)的計(jì)算量，然后經(jīng)過BN和激活函數(shù)，再經(jīng)過一層反卷積和BN、Relu，得到與B部分維度和通道數(shù)相同的特征層與B部分輸出的特征層進(jìn)行融合.圖2中C代表融合模塊，本文通過實(shí)驗(yàn)對(duì)比了3種融合方式，分別是特征值各元素相加求和、特征值各元素相乘求積和通道級(jí)聯(lián)融合，最后選擇了可提供更高精度的通道級(jí)聯(lián)融合方式.特征級(jí)聯(lián)融合完成后，利用卷積核維度為1的卷積計(jì)算進(jìn)行通道數(shù)的轉(zhuǎn)換，將通道數(shù)轉(zhuǎn)化成與步驟B中正向卷積生成的特征層通道數(shù)目相同，最終生成新的融合后的特征層.為增強(qiáng)網(wǎng)絡(luò)的泛化能力和魯棒性，避免模型中權(quán)重偏置溢出，在網(wǎng)絡(luò)中增加了BN層，模型中激活函數(shù)使用的是Relu非線性激活函數(shù).

圖2 特征融合結(jié)構(gòu)圖Fig.2 Feature fusion structure diagram

3.2 分段反卷積

DSSD模型為了克服SSD對(duì)小目標(biāo)檢測(cè)的不足，利用反卷積進(jìn)行上采樣，又引入殘差結(jié)構(gòu)與正向卷積特征層融合避免低層特征圖卷積次數(shù)較少，特征提取不充分，高層特征層雖然提取到更多的語(yǔ)義特征，但邊緣信息丟失過多的缺點(diǎn).但由于DSSD網(wǎng)絡(luò)模型中反卷積都起源于最末層特征層，其經(jīng)過的層層反卷積，雖然能提取語(yǔ)義特征，也會(huì)造成細(xì)節(jié)特征丟失和過多噪聲信息的加入，這也導(dǎo)致DSSD算法對(duì)目標(biāo)檢測(cè)的效果相對(duì)提升有限.本文提出的改進(jìn)思想是將反卷積的過程分成3段，充分發(fā)揮反卷積的優(yōu)勢(shì)，避免反卷積的缺點(diǎn)，每段反卷積進(jìn)行后與淺層特征層進(jìn)行融合，融合后的特征層增加了特征的細(xì)節(jié)信息和語(yǔ)義信息，同時(shí)避免了反卷積次數(shù)過多導(dǎo)致噪聲信息加入的問題.

分段反卷積具體實(shí)現(xiàn)如圖1所示，反卷積操作的特征圖從Conv11_2、Conv9_2、Conv7分別進(jìn)行反卷積操作，生成新的特征圖與其低兩層特征圖進(jìn)行圖2方式融合.3個(gè)分段反卷積后，融合生成了6個(gè)新的特征圖與Conv11_2共同進(jìn)行特征檢測(cè).

反卷積操作可以增大感受野，對(duì)特征圖進(jìn)行上采樣，提取更多的語(yǔ)義信息用于圖2中的特征融合.反卷積的計(jì)算公式如式(1).

d=s×(i-1)+k

(1)

在公式(1)中，k為卷積核的大小尺度，i為輸入特征圖分辨率的大小，s為卷積核每次移動(dòng)的步長(zhǎng)，d為輸出特征圖分辨率的大小.本文根據(jù)反卷積計(jì)算公式，為級(jí)聯(lián)融合提供條件，將反卷積得到的特征圖尺度與融合前特征圖尺度保持一致.

3.3 改進(jìn)的多尺度特征圖檢測(cè)

SSD模型應(yīng)用多尺度特征圖預(yù)測(cè)，得益于不同尺度的特征圖對(duì)不同尺度的目標(biāo)具有比較好的效果，SSD算法準(zhǔn)確度和速度都要比之前的算法好很多，但SSD算法對(duì)小目標(biāo)的檢測(cè)不友好，主要原因是用于檢測(cè)小占比目標(biāo)的特征圖僅有主干網(wǎng)絡(luò)中的Conv4_3.如圖3所示，(a)圖為原始圖像，(b)圖是Conv3_3輸出特征圖，(c)圖是Conv4_3輸出特征圖，從特征圖對(duì)比可以明顯看出，經(jīng)過卷積和池化較少的(b)圖保留的邊緣信息更加完整，但由于其經(jīng)過的特征提取層較少，提取到的語(yǔ)義信息也不足.本文模型為解決對(duì)小目標(biāo)檢測(cè)的不足，新增加了保留細(xì)節(jié)信息更多的Conv3_3層與反卷積后的特征層融合作為新的檢測(cè)特征層加強(qiáng)檢測(cè)小目標(biāo)，融合后的特征層既具有多次卷積提取到的語(yǔ)義信息，又融合了淺層特征圖的邊緣信息，所以其特征信息更加豐富.

圖3 特征對(duì)比圖Fig.3 Feature comparison chart

增加的Conv3_3層與反卷積融合后的特征層尺度大小為75×75，Conv4_3層與反卷積融合后的特征圖尺度大小為38×38，因?yàn)檫@兩層檢測(cè)特征圖都是由主干網(wǎng)絡(luò)中的特征圖融合而成，為減小特征檢測(cè)層本身差異的影響，這兩層融合后的特征層分別進(jìn)行L2 Normalization[26]做通道歸一化.

為最大程度的保留SSD模型多尺度特征圖檢測(cè)的優(yōu)勢(shì)，如表1中結(jié)構(gòu)參數(shù)，F(xiàn)usion_conv4_3、Fusion_conv7、Fusion_conv8_2、Fusion_conv9_2、Fusion_conv10_2、Conv11_2特征圖保持檢測(cè)尺度、長(zhǎng)寬比和數(shù)目與SSD模型相同，對(duì)先驗(yàn)框的計(jì)算依舊采用同樣的線性計(jì)算公式：

表1 多尺度特征圖先驗(yàn)框Table 1 Multiscale feature map prior box

(2)

min_sizek=sk×input_size

(3)

max_sizek=sk+1×input_size

(4)

4 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)所用數(shù)據(jù)集為 PASCAL VOC 數(shù)據(jù)集，本文使用訓(xùn)練數(shù)據(jù)集共有20個(gè)類別，16551張圖片，包含 VOC2007 和 VOC2012的訓(xùn)練集數(shù)據(jù).利用VOC2007 數(shù)據(jù)集進(jìn)行測(cè)試驗(yàn)證.實(shí)驗(yàn)使用深度學(xué)習(xí)框架為Caffe，顯卡為 Nvidia GeForce GTX 1080Ti，運(yùn)行環(huán)境為linux服務(wù)器.

4.1 訓(xùn)練與實(shí)驗(yàn)分析

實(shí)驗(yàn)訓(xùn)練使用預(yù)訓(xùn)練模型為VGG16模型，將圖像輸入尺度設(shè)置為300×300(以下提到的SD-SSD模型輸入圖像尺度都為300×300)，模型共迭代訓(xùn)練16萬(wàn)次.模型訓(xùn)練Batch size設(shè)為25，初始學(xué)習(xí)率lr設(shè)為0.01，lr的衰減因子gamma為0.5，衰減策略為lr=lr×gamma，訓(xùn)練6萬(wàn)次、8萬(wàn)次、10萬(wàn)次、12萬(wàn)次、14萬(wàn)次分別對(duì)lr進(jìn)行衰減策略生成新的學(xué)習(xí)率，模型優(yōu)化方法為隨機(jī)梯度下降法.

mAP(mean average precision)作為目標(biāo)檢測(cè)中常用衡量精度的指標(biāo)，計(jì)算方法如公式(5)、公式(6)所示.

(5)

mAP=sum(AP)/N

(6)

其中r表示選取回歸的閾值，P表示各個(gè)閾值下精度的數(shù)值，N表示類別的總數(shù)目.在本文模型下，經(jīng)過對(duì)比各置信度閾值下的實(shí)驗(yàn)結(jié)果，當(dāng)閾值為0.4，得到對(duì)各類別目標(biāo)的檢測(cè)效果最優(yōu)，本文模型mAP值為81.60%，比SSD(輸入尺度大小為300×300，本文也稱其為SSD300)算法平均檢測(cè)精度提高了4.30%，比DSSD(輸入尺度大小為321×321，本文也稱其為DSSD321)算法平均檢測(cè)精度提高了3.0%.如表2所示，分別展示了本文算法SD-SSD模型在各個(gè)類別上與SSD300和DSSD321的對(duì)比.

表2 不同算法各個(gè)類別目標(biāo)檢測(cè)精度對(duì)比結(jié)果Table 2 Comparison results of object detection accuracy in different categories of different algorithms

對(duì)比各個(gè)類別目標(biāo)檢測(cè)精度，在VOC2007測(cè)試集上，本文提出的算法在輸入圖像尺度差異不大的情況下，相對(duì)SSD和DSSD模型各個(gè)類別的檢測(cè)精度都有不同程度的提升，能夠看出本文算法模型分段進(jìn)行反卷積再做融合操作，融合后的特征圖包含了經(jīng)過多次卷積提取到的語(yǔ)義信息和低層特征圖保留的細(xì)節(jié)信息，對(duì)目標(biāo)檢測(cè)起到了非常積極的作用，解決了SSD算法檢測(cè)特征圖信息不豐富的問題，避免了DSSD算法單一特征圖反卷積次數(shù)過多導(dǎo)致噪聲信息加入過多的問題.如圖4所示，本文選取了7個(gè)小目標(biāo)占比較多的類別作為對(duì)比展示，圓圈代表本文SD-SSD算法對(duì)7類目標(biāo)的檢測(cè)精度，相對(duì)于三角代表的SSD300算法和方框代表的DSSD321算法精度有明顯提高，證明了本文加入不同長(zhǎng)寬比例和更低層次的特征圖進(jìn)行融合后重復(fù)檢測(cè)小目標(biāo)具有顯著效果.

圖4 7類小目標(biāo)classes-mAP對(duì)比圖Fig.4 Comparison chart of 7 small object classes-mAP

目標(biāo)檢測(cè)算法整體性能的評(píng)估除了檢測(cè)精度外，F(xiàn)PS值表示檢測(cè)速度，通常也作為一種衡量標(biāo)準(zhǔn).如表3所示，在本文介紹的實(shí)驗(yàn)環(huán)境下，選取了近年來(lái)部分整體性能較好且輸入尺寸相差不大的單階段目標(biāo)檢測(cè)算法模型與本文模型比較.

表3 VOC2007 測(cè)試集上測(cè)試結(jié)果Table 3 Test results on VOC2007 test dataset

圖5是當(dāng)前主流的單階段目標(biāo)檢測(cè)算法整體性能對(duì)比圖.圖中橫坐標(biāo)是每秒算法檢測(cè)的圖片幀數(shù)，縱坐標(biāo)是各算法的檢測(cè)精度mAP值.從圖中可以看出，DSSD(輸入尺度為321×321)模型由于采用了輔助卷積、反卷積，又引入了殘差模塊進(jìn)行特征融合，其檢測(cè)精度明顯高于未采用融合結(jié)構(gòu)的SSD(輸入尺度為300×300)模型，但由于其采用了更深層次的主干網(wǎng)絡(luò)，又加入了殘差模型融合，所以其檢測(cè)速度大幅弱于SSD模型.由于本文模型采用的主干網(wǎng)絡(luò)為卷積層數(shù)較少且特征提取效果較好的VGG16網(wǎng)絡(luò)，從圖5可以明顯看出，本文模型檢測(cè)速度大幅度領(lǐng)先于同樣引入了融合的DSSD模型；由于采用了分段反卷積和新的融合結(jié)構(gòu)豐富了檢測(cè)特征層的信息，利用改進(jìn)的多尺度特征檢測(cè)層增強(qiáng)對(duì)小占比目標(biāo)的檢測(cè)，本文模型的檢測(cè)精度要優(yōu)于SSD模型.本文模型增強(qiáng)了對(duì)小目標(biāo)的檢測(cè)，豐富了檢測(cè)特征層的信息，在本文用到的測(cè)試集上，本文模型在檢測(cè)精度上高于最近提出的YOLOv3(輸入尺度為320×320)模型、RefineDet模型和RFB(輸入尺度為300×300)模型，相比新提出的Retinanet模型也具有速度上的領(lǐng)先.

圖5 算法速度精度對(duì)比圖Fig.5 Algorithm FPS and mAP comparison chart

4.2 檢測(cè)效果對(duì)比展示

圖6是部分圖片在SSD300算法模型和本文提出的SD-SSD算法模型效果對(duì)比圖.

圖6 檢測(cè)結(jié)果對(duì)比Fig.6 Comparison of test results

從圖6(a)和圖6(b)中的檢測(cè)結(jié)果可以看出，本文提出的SD-SSD目標(biāo)檢測(cè)算法基于SSD300算法進(jìn)行改進(jìn)，相對(duì)SSD300目標(biāo)檢測(cè)算法對(duì)小目標(biāo)檢測(cè)更友好，基本不會(huì)出現(xiàn)漏檢和誤檢情況，在很大程度上提高了對(duì)小目標(biāo)的檢測(cè)，并且在復(fù)雜場(chǎng)景下不僅對(duì)小目標(biāo)檢測(cè)更友好，對(duì)大目標(biāo)和中等目標(biāo)的識(shí)別準(zhǔn)確率也更高，對(duì)目標(biāo)的定位也更準(zhǔn)確.

5 結(jié)束語(yǔ)

基于當(dāng)前SSD目標(biāo)檢測(cè)算法，為進(jìn)一步提升目標(biāo)檢測(cè)的效果，本文算法提出了分段反卷積結(jié)構(gòu)降低了噪聲信息加入，又采用了新的融合結(jié)構(gòu)對(duì)高層特征圖和低層特征圖進(jìn)行融合，豐富了檢測(cè)特征層的信息，為減小了小占比目標(biāo)的誤檢和漏檢，加入了不同長(zhǎng)寬比例的候選框和多尺度特征圖對(duì)小占比目標(biāo)增強(qiáng)檢測(cè).在本文用到的公開測(cè)試集上進(jìn)行測(cè)試驗(yàn)證，改進(jìn)的算法模型對(duì)小占比目標(biāo)的檢測(cè)效果提升尤為顯著，整體檢測(cè)mAP值也達(dá)到了81.60%，檢測(cè)速度也優(yōu)于當(dāng)前大部分主流算法.

在本文算法模型的基礎(chǔ)上，下一步可以在一些特定場(chǎng)景下應(yīng)用此算法檢測(cè)特定的目標(biāo)做輕微的改動(dòng)，也可就如何進(jìn)行輕量化網(wǎng)絡(luò)，實(shí)現(xiàn)終端設(shè)備的運(yùn)行做深入研究.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡