基于改進(jìn)的SSD電梯轎廂內(nèi)人頭檢測(cè)

2021-12-27 11:05李光國鄭克龍吳燕梅

制造業(yè)自動(dòng)化 2021年11期

李光國，鄭克龍，吳燕梅

（西南科技大學(xué) 理學(xué)院，綿陽 621000）

0 引言

電梯內(nèi)人頭的檢測(cè)，在人流量統(tǒng)計(jì)、電梯的安全預(yù)警方面都起著至關(guān)重要的作用。通過對(duì)電梯人頭的檢測(cè)統(tǒng)計(jì)，可以合理安排電梯的檢修，有效避免安全事故的發(fā)生。

人頭檢測(cè)的方法大體上分為兩類，一類是基于傳統(tǒng)機(jī)器學(xué)習(xí)的目標(biāo)檢測(cè)方法，如戴曙光[1]提出了一種基于人頭特征和區(qū)域輪廓特征的人頭識(shí)別方法，牛勝石[2]基于Adaboost與Haar特征的人頭檢測(cè)算法等。隨著社會(huì)的發(fā)展，傳統(tǒng)的機(jī)器學(xué)習(xí)方法局限性越來越明顯，已經(jīng)無法滿足一些現(xiàn)代工業(yè)的需求。第二類是基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法，如鄭國書[3]使用改進(jìn)后的BING算法實(shí)現(xiàn)實(shí)時(shí)視頻中人頭檢測(cè)，李繼秀[4]通過使用SSD模型直接檢測(cè)人頭，Aditya Vora[5]的快速人頭檢測(cè)模型。相比于傳統(tǒng)的機(jī)器學(xué)習(xí)算法，基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法速度快，檢測(cè)精度高。

近年來隨著卷積神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)計(jì)算能力的快速發(fā)展，基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)效果得到很大提升[5]?；谏疃葘W(xué)習(xí)的目標(biāo)檢測(cè)算法主要有兩類，一種是基于區(qū)域候選模型算法，如R-CNN[6～8]系列模型、SPP-net[9]和R-FCN[10]。這類算法精度高，但是速度慢，對(duì)計(jì)算機(jī)硬件要求高。另一種是基于回歸模型的算法，如YOLO[11]（You Only Look Once）和SSD[12]（Single Shot MulitiBox Detector）。這類算法運(yùn)行速度快，對(duì)系統(tǒng)要求低，能夠做到實(shí)時(shí)檢測(cè)。

本文選擇以SSD模型為基礎(chǔ)對(duì)其進(jìn)行改進(jìn)。采用輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNetV2[13]來優(yōu)化SSD的特征提取層，使用反向殘差結(jié)構(gòu)替換預(yù)測(cè)層中的標(biāo)準(zhǔn)卷積運(yùn)算；將輸入圖像大小調(diào)整為512×512，并選擇最大特征圖32×32來進(jìn)行檢測(cè)；調(diào)整Anchor的寬高比例，進(jìn)一步提升模型對(duì)人頭的檢測(cè)精度。改進(jìn)后的SSD模型在減少網(wǎng)絡(luò)參數(shù)的同時(shí)，降低對(duì)硬件資源的消耗，提升模型的速度和精度。

圖3 反向殘差模塊

1 SSD模型

SSD模型相比于Faster-RCNN和YOLO等算法，SSD模型在檢測(cè)精度和速度上有著不錯(cuò)的性能。具體網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示，在VGG-16[14]的基礎(chǔ)上，添加了六層卷積層，并采用六個(gè)不同特征圖檢測(cè)不同尺度的目標(biāo)，其中低層（Conv4_3）預(yù)測(cè)小目標(biāo)，高層（Conv7、Conv8、Conv9、Conv10、Conv11）預(yù)測(cè)大目標(biāo)。

圖1 SSD模型結(jié)構(gòu)

SSD算法屬于single-stage（單次）檢測(cè)算法，它結(jié)構(gòu)簡(jiǎn)潔，檢測(cè)過程簡(jiǎn)單，檢測(cè)步驟大致也分為三步。第一步，輸入圖片到卷積神經(jīng)網(wǎng)絡(luò)VGG-16中進(jìn)行特征提取；第二步，采用多尺度特征圖用于檢測(cè)不同大小的物體；第三步，使用非極大值抑制（Non-Maximum Suppression，NMS）來去掉重復(fù)的預(yù)測(cè)框，得到正確的的預(yù)測(cè)框。

2 輕量化網(wǎng)絡(luò)MobileNetV2

MobileNetV2在MobileNetV1[15]的基礎(chǔ)上，引入了反向殘差模塊（Inverted Residuals）和線性瓶頸（Linear Bottlenecks）兩個(gè)結(jié)構(gòu)。在保證模型速度的同時(shí)，增加模型特征提取的能力，提高模型的檢測(cè)精度。

2.1 深度可分離卷積

在MobileNetV2中，沿用了MobileNetV1的深度可分離卷積。深度可分離卷積是把標(biāo)準(zhǔn)卷積分解成深度卷積（Depthwise convolution）和逐點(diǎn)卷積（Pointwise convolution）。分解過程示意圖如圖2所示。

圖2 深度可分離卷積

假設(shè)輸入的特征圖大小為DF×DF×M，輸出特征圖大小為DF×DF×N，卷積核為Dk×Dk×M，其中DF是特征圖的寬度和高度。對(duì)于標(biāo)準(zhǔn)的卷積，其計(jì)算量為：

而對(duì)于深度可分離卷積，卷積核被分為兩個(gè)和，其計(jì)算量為：

逐點(diǎn)卷積計(jì)算量為：

所以深度可分離卷積總計(jì)算量是：

因此可以得到深度可分離卷積與標(biāo)準(zhǔn)卷積的參數(shù)量對(duì)比，計(jì)算公式如下：

通常情況下輸出通道數(shù)N比較大，因此可以忽略第一項(xiàng)1/N，假設(shè)采用3×3大小的卷積核，深度可分離卷積相比于標(biāo)準(zhǔn)卷積減少大約8/9的參數(shù)量。

綜上，深度可分離卷積能對(duì)一般卷積神經(jīng)網(wǎng)絡(luò)模型完成了較好的裁剪。

2.2 反向殘差模塊

反向殘差模塊是借鑒了ResNet中殘差塊而來，操作與殘差模塊相反，是先經(jīng)過1×1的卷積進(jìn)行升維，緊接著使用3×3的深度可分離卷積進(jìn)行圖像特征提取，最后使用1×1的點(diǎn)卷積降維。整個(gè)過程是先升維，然后進(jìn)行卷積操作，再降維。但是，由于在高維度的空間里，激活函數(shù)能夠增加網(wǎng)絡(luò)模型的非線性能力，在低維度空間里會(huì)破壞掉網(wǎng)絡(luò)模型的非線性能力。因此在反向殘差結(jié)構(gòu)中引入了線性瓶頸，去掉了第二個(gè)1×1卷積后的激活函數(shù)，轉(zhuǎn)而使用線性激活函數(shù)來保留提取到的圖像特征。

3 SSD模型的改進(jìn)

3.1 結(jié)構(gòu)優(yōu)化

SSD模型存在一個(gè)不足之處就是使用的標(biāo)準(zhǔn)卷積來進(jìn)行特征提取，使得模型參數(shù)量巨大，增加了模型的訓(xùn)練時(shí)間成本和計(jì)算機(jī)硬件成本。針對(duì)這一問題，本文通過采用輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNetV2與SSD模型相結(jié)合來減少網(wǎng)絡(luò)參數(shù)，降低對(duì)硬件資源的消耗，提升模型的速度和精度。

首先通過使用MobileNetV2替換傳統(tǒng)SSD模型的特征提取網(wǎng)絡(luò)VGG-16，然后將預(yù)測(cè)層中所有的標(biāo)準(zhǔn)卷積替換為反向殘差卷積。改進(jìn)后的SSD網(wǎng)絡(luò)參數(shù)如表1，先去掉MobileNetV2中的下采樣層和全連接層，然后加入反向殘差卷積組合的另外四層卷積層（Inverted Residual_1～4），最后模型通過對(duì)檢測(cè)目標(biāo)的坐標(biāo)和置信度進(jìn)行回歸計(jì)算（抽取的特征層包括Inverted Residual 32×32，Inverted Residual 16×16，Inverted Residual_18×8，Inverted Residual_24×4，Inverted Residual_32×2，Inverted Residual_41×1），并通過非極大值抑制模塊過濾重復(fù)性目標(biāo)，得到最終的檢測(cè)結(jié)果。

表1 改進(jìn)后SSD網(wǎng)絡(luò)參數(shù)

(續(xù))

同時(shí)，將改進(jìn)后的SSD輸入圖像大小調(diào)整為512×512，檢測(cè)時(shí)使用的最大特征圖大小為32×32；傳統(tǒng)SSD模型的圖像輸入大小為300×300，在進(jìn)行檢測(cè)時(shí)使用的最大特征圖大小為38×38。根據(jù)文獻(xiàn)[16]結(jié)果，可以通過引入更大的特征圖來提高模型的檢測(cè)精度，但這樣會(huì)大大降低檢測(cè)的速度，因此本文選擇大小為32×32的最大特征圖來進(jìn)行檢測(cè)。另一方面，雖然與傳統(tǒng)的SSD相比，改進(jìn)后的SSD采用的最大特征圖變小，但是輸入圖像分辨率變大了，增加了特征圖的語義信息，從而填補(bǔ)了因?yàn)榫W(wǎng)絡(luò)縮減而造成語義信息的丟失[17]。改進(jìn)后的SSD結(jié)構(gòu)如圖4所示。

圖4 改進(jìn)后的SSD結(jié)構(gòu)

3.2 Anchor比例的調(diào)整

對(duì)于單一目標(biāo)檢測(cè)的數(shù)據(jù)集，根據(jù)數(shù)據(jù)集中識(shí)別目標(biāo)物體的大小和真實(shí)框的寬高比來合理的設(shè)置Anchor，不僅能更好的檢測(cè)目標(biāo)所在位置，還能夠提升網(wǎng)絡(luò)模型的檢測(cè)速度和提高網(wǎng)絡(luò)模型的檢測(cè)精度。為了獲取實(shí)驗(yàn)樣本人頭的具體寬高比，先從樣本數(shù)據(jù)集中隨機(jī)抽取50張圖像，然后進(jìn)行人工截取獲得約200張單個(gè)人頭圖像，并同時(shí)記錄單個(gè)人頭圖像的寬和高。

從圖5中可以看出人頭的寬高散點(diǎn)圖比較集中，大致上是呈線性分布的，這是因?yàn)樵陔娞蒉I廂中，人頭的寬高比差異不大，所以比較集中。初始的輕量化SSD的Anchor寬高比設(shè)置為1/3、1/2、1、2、3，通過在寬高散點(diǎn)圖中畫出這五條直線，可以更加直觀的了解Anchor寬高比設(shè)置。如圖6，其中1/3、1/2、1、2、3分別對(duì)應(yīng)圖上的紅色、黑色、粉色、藍(lán)色和綠色直線。

圖5 人頭寬高散點(diǎn)圖

圖6 原始輕量化SSD的Anchor設(shè)置

可以看出，原始的Anchor寬高比設(shè)置并不合理，因此本文重新設(shè)置Anchor的寬高比參數(shù)。首先計(jì)算出所有從樣本數(shù)據(jù)庫中獲得的單個(gè)人頭圖像寬高比例，然后進(jìn)行分析獲得新的寬高比參數(shù)。

從表2中可以得到，寬高比接近于1的人頭數(shù)量很多，其次是0.9與1.2，此外人頭寬高比的最大值和最小值分別為0.77與2。因此，以這5個(gè)比例為基準(zhǔn)，分別畫出0.77、0.9、1、1.2、2在人頭寬高散點(diǎn)圖上的直線。其中0.77、0.9、1、1.2、2分別對(duì)應(yīng)圖上的紅色、黑色、藍(lán)色、粉色和綠色直線。

表2 人頭寬高比例范圍數(shù)據(jù)

從圖7可以看到經(jīng)過改進(jìn)后的Anchor寬高比相比于原始的寬高比設(shè)置更加合理，這樣有助于網(wǎng)絡(luò)模型更準(zhǔn)確的定位人頭和識(shí)別人頭。表3為數(shù)據(jù)分析后設(shè)定的模型寬高比。

圖7 改進(jìn)后輕量化SSD的Anchor設(shè)置

表3 模型寬高比調(diào)整

4 實(shí)驗(yàn)結(jié)果與分析

4.1 數(shù)據(jù)集

1）圖像的采集

本文研究的是在電梯橋廂內(nèi)人頭的檢測(cè)，從四川省綿陽市某醫(yī)院獲取電梯的監(jiān)控錄像視頻，然后通過使用視頻軟件Potplayer（版本1.7.18344）每隔一秒鐘截取一張圖片，最終留下大約6000張512×512大小的圖片。

2）數(shù)據(jù)集的擴(kuò)張

由于深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練需要大量的訓(xùn)練樣本才能達(dá)到較好的訓(xùn)練效果，而本文獲取的訓(xùn)練樣本有限，容易造成過擬合和普適性不好的影響，因此使用Python對(duì)獲取的原始圖像進(jìn)行旋轉(zhuǎn)操作，增加樣本數(shù)量，提高模型對(duì)人頭識(shí)別的效果。同時(shí)，對(duì)圖片進(jìn)行隨機(jī)分配，通過人工篩選，最終留下大約訓(xùn)練集13000張圖片，測(cè)試集3250張圖片。訓(xùn)練集與測(cè)試集的比例約為4∶1。

4.2 模型性能評(píng)價(jià)指標(biāo)

在目標(biāo)識(shí)別方面，評(píng)價(jià)一個(gè)網(wǎng)絡(luò)模型算法的識(shí)別效果常用的標(biāo)準(zhǔn)有精確率（Precision，P）、準(zhǔn)確率（Accuracy，A）、召回率（Recall，R）、檢測(cè)速率FPS（Frames Per Second）調(diào)和均值等。本文選擇檢測(cè)精確率、檢測(cè)速率FPS和模型大小來對(duì)模型進(jìn)行評(píng)估。

其中，TP為正確檢測(cè)到的正樣本數(shù)量；TN為正確檢測(cè)到的負(fù)樣本數(shù)量；FP為把負(fù)樣本檢測(cè)為正樣本的數(shù)量。

4.3 實(shí)驗(yàn)環(huán)境

實(shí)驗(yàn)所使用的操作系統(tǒng)為Windows10?；赼naconda安裝Python 3.6和TensorFlow-gpu 1.13.1。設(shè)備參數(shù)如表4所示。

表4 實(shí)驗(yàn)設(shè)備參數(shù)表

4.4 參數(shù)設(shè)置

優(yōu)化算法使用AdamOptimizer；初始學(xué)習(xí)率設(shè)置為0.004，衰減率為0.95，每一萬次迭代后衰減一次；目標(biāo)點(diǎn)生成預(yù)測(cè)框數(shù)目為6個(gè)；dropout設(shè)置為0.8；網(wǎng)絡(luò)初始化標(biāo)準(zhǔn)差為0.03，均值為0；IOU閾值為0.5；batch_size設(shè)置為8。

4.5 實(shí)驗(yàn)結(jié)果及分析

圖8為SSD、MobileNetV2_SSD與改進(jìn)后的SSD人頭檢測(cè)結(jié)果比較。從圖中可以看出，改進(jìn)后的SSD相比于原來的MobileNetV2_SSD模型和傳統(tǒng)的SSD模型人頭檢測(cè)情況，檢測(cè)效果有所提升，減輕了漏檢的情況。另一方面通過各個(gè)模型的精度和對(duì)比（表6），可以看出在電梯轎廂監(jiān)控圖像數(shù)據(jù)集上，在檢測(cè)精度方面，改進(jìn)后的SSD模型相比于MobileNetV2_SSD模型準(zhǔn)確率提高了2.3%，比原始的SSD模型準(zhǔn)確率提高了1.6%；在檢測(cè)速度方面，則從原始SSD的22FPS提升到了63FPS；在模型大小方面，改進(jìn)后的SSD最小。因此實(shí)驗(yàn)證明了改進(jìn)后的SSD在人頭檢測(cè)方面是具有可行性的。

圖8 基于SSD的三種模型人頭檢測(cè)效果比較

表5 基于SSD的三種模型性能比較

由于IOU初始值設(shè)置的是0.5，當(dāng)預(yù)測(cè)框與真實(shí)框的IOU大于0.5時(shí)，才判斷為人頭，反之則沒有檢測(cè)出人頭。因此，可能存在其他IOU值能有更好的效果，通過重新設(shè)置IOU值從0.3到0.7之間后，得到的不同IOU值模型的檢測(cè)結(jié)果對(duì)比如表6所示。

表6 不同IOU值模型的檢測(cè)結(jié)果對(duì)比

(續(xù))

從表中可以看到在不同的IOU值，各個(gè)模型的精度有所變化。其中0.3到0.5變化不大，而到了0.6、0.7時(shí)，三個(gè)模型的準(zhǔn)確率就會(huì)影響很大，這是因?yàn)镮OU變大之后，要求真實(shí)框和預(yù)測(cè)框的重復(fù)率高，所以會(huì)造成很多漏檢的情況。經(jīng)過不同IOU值模型精度的比較，可以看到模型在IOU為0.5時(shí)最合適。

最后，為了與其他輕量化模型相比較，本文通過使用自制數(shù)據(jù)集對(duì)當(dāng)前較為常用的三種模型進(jìn)行訓(xùn)練，包括MobileNetV1_SSDLite[18]、Tiny YOLO[19]和Tiny SSD[20]。不同輕量化模型與改進(jìn)的SSD性能對(duì)比如表7所示。

表7 不同輕量化模型對(duì)比

從實(shí)驗(yàn)結(jié)果可以看出改進(jìn)后的SSD與MobileNetV1_SSDLite、Tiny YOLO相比，不僅在模型大小方面有明顯的優(yōu)勢(shì)，且在檢測(cè)精度上也高于MobileNetV1_SSDLite 和Tiny YOLO。雖然Tiny SSD的模型最小，但是在精度方面比改進(jìn)后的SSD低了18.1%。綜合檢測(cè)精度和模型大小這兩個(gè)方面，改進(jìn)后的SSD性能是最優(yōu)的。

5 結(jié)語

本文利用深度學(xué)習(xí)框架TensorFlow，在SSD的基礎(chǔ)上，提出一種結(jié)合輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNetV2人頭檢測(cè)模型，實(shí)現(xiàn)對(duì)電梯中人頭的智能檢測(cè)。實(shí)驗(yàn)表明，本文的模型精度和速度明顯優(yōu)于傳統(tǒng)的SSD模型，且對(duì)實(shí)驗(yàn)設(shè)備硬件配置要求不高，能滿足目標(biāo)檢測(cè)要求。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于改進(jìn)的SSD電梯轎廂內(nèi)人頭檢測(cè)

0 引言

1 SSD模型

2 輕量化網(wǎng)絡(luò)MobileNetV2

2.1 深度可分離卷積

2.2 反向殘差模塊

3 SSD模型的改進(jìn)

3.1 結(jié)構(gòu)優(yōu)化

3.2 Anchor比例的調(diào)整

4 實(shí)驗(yàn)結(jié)果與分析

4.1 數(shù)據(jù)集

4.2 模型性能評(píng)價(jià)指標(biāo)

4.3 實(shí)驗(yàn)環(huán)境

4.4 參數(shù)設(shè)置

4.5 實(shí)驗(yàn)結(jié)果及分析

5 結(jié)語