張 燁,樊一超,許 艇,郭藝玲
(浙江工業(yè)大學(xué) 機(jī)械工程學(xué)院,浙江 杭州 310023)
近年來(lái)隨著交通物流的發(fā)展,物流園區(qū)的規(guī)模越來(lái)越大,物流車輛停放的智能化管理成為一個(gè)重要課題[1]。目前物流車輛管理主要存在車牌識(shí)別率低、車型分類難度大、車長(zhǎng)測(cè)量不準(zhǔn)確、空車位識(shí)別成本高,車輛狀態(tài)和行為監(jiān)測(cè)統(tǒng)計(jì)困難等問題。物流園區(qū)和物流企業(yè)因物流車輛識(shí)別不準(zhǔn)確,每年有可能對(duì)物流經(jīng)濟(jì)活動(dòng)造成巨大的損失。例如,德國(guó)在這一問題上造成的經(jīng)濟(jì)損失達(dá)1 100 億歐元;而美國(guó),已達(dá)到了1 300 億美元;我國(guó)物流企業(yè)也存在上述問題,給物流企業(yè)造成災(zāi)難性的損失[2]。
現(xiàn)有的車輛檢測(cè)系統(tǒng)大多針對(duì)的是小區(qū)中的轎車車牌識(shí)別,對(duì)物流車輛的特征提取方面的系統(tǒng)研究較少,理論體系較不完善。因此,筆者研究意義重大,通過(guò)對(duì)物流車輛分割定位獲取的特征識(shí)別信息可以有效解決物流工程車輛方面的管理問題,特別是車輛精確定位問題。
傳統(tǒng)車輛特征檢測(cè)提取可歸結(jié)為電子標(biāo)簽法、電磁線圈法、雷達(dá)檢測(cè)法等。其中,電子標(biāo)簽法是將儲(chǔ)存在電子標(biāo)簽里的產(chǎn)品信息通過(guò)閱讀器產(chǎn)生的感應(yīng)電流轉(zhuǎn)換為相應(yīng)的數(shù)據(jù),由中央信息系統(tǒng)對(duì)接收到的信息進(jìn)行讀取和解碼,它的缺點(diǎn)是需要提前存儲(chǔ)目標(biāo)信息、運(yùn)作上存在較大的繁瑣操作、讀取距離有限;電磁線圈法是通過(guò)電流變化引起的磁場(chǎng)變化來(lái)區(qū)分不同類型的車輛,它的缺點(diǎn)是需要埋設(shè)地感線圈導(dǎo)致施工破壞路面結(jié)構(gòu),維修成本高和精度低等;雷達(dá)檢測(cè)法是利用雷達(dá)發(fā)射出固定頻率的微波信號(hào),這些信號(hào)在遇到移動(dòng)車輛之后反射回有頻率偏移的微波,根據(jù)不同的微波信號(hào),運(yùn)用普勒原理判斷車輛的大小、材料和結(jié)構(gòu)等,這種方法易受到雨雪等惡劣天氣的干擾。
近幾年來(lái),隨著神經(jīng)元網(wǎng)絡(luò)的再度興起,基于卷積神經(jīng)元網(wǎng)絡(luò)的視頻圖像法成為圖像分割和識(shí)別的主流技術(shù)。通過(guò)分析布置在車道旁的攝像機(jī)拍攝的視頻或圖像,采用模板匹配、邊緣特征提取、梯度直方圖等手段,實(shí)現(xiàn)對(duì)車輛的準(zhǔn)確識(shí)別。針對(duì)車輛的車牌特征識(shí)別問題,王忠飛等[3]提出了一種基于字符凹凸輪廓的檢測(cè)方法,計(jì)算效率高,但對(duì)噪聲抗干擾性較弱;陳波等[4]改進(jìn)了卷積神經(jīng)網(wǎng)絡(luò)模型和參數(shù),加入了Dropout方法解決過(guò)擬合問題,減少了參數(shù)量,但精度上略有下降;劉震等[5]引入了可變型卷積與可分離卷積結(jié)構(gòu),提高了模型的泛化性,增強(qiáng)了網(wǎng)絡(luò)模型特征提取能力,但對(duì)復(fù)雜場(chǎng)景的目標(biāo)識(shí)別表現(xiàn)欠佳;Long等[6]提出了一種End-to-End的圖像分割方法,直接預(yù)測(cè)圖像像素分類信息,做到目標(biāo)物體的像素定位,但模型存在參數(shù)量大、效率慢、分割粗糙等問題。
上述傳統(tǒng)的檢測(cè)方法和視頻圖像法均存在著操作繁瑣、識(shí)別精度不高、識(shí)別效率慢和分割粗糙等問題。針對(duì)上述方法存在的不足,筆者主要基于一種全卷積的圖像分割方法,采用深度學(xué)習(xí)框架,并對(duì)基本網(wǎng)絡(luò)提出了一些優(yōu)化和改進(jìn)的措施。改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)能夠滿足實(shí)時(shí)檢測(cè)的要求,并且采用空洞卷積的方法擴(kuò)大了感受野,同時(shí)采用通道卷積的方法大大減少了參數(shù)量,再通過(guò)聯(lián)通區(qū)域和條件隨機(jī)場(chǎng)的方法,從像素點(diǎn)語(yǔ)義角度對(duì)目標(biāo)對(duì)象進(jìn)行分割,使物流車輛達(dá)到精確定位和識(shí)別的效果。
空洞卷積[7-8]是針對(duì)傳統(tǒng)卷積網(wǎng)絡(luò)在采樣過(guò)程會(huì)降低圖像分辨率、丟失信息而提出的一種增大感受野的卷積思路。增大感受野的好處是在深網(wǎng)絡(luò)中,單位點(diǎn)包含的圖像信息越多,感受野越大,若采用傳統(tǒng)的卷積和最大池化方法,面臨如下難題:
1) 保證信息不丟失情況下,不采用最大池化層,使用較小傳統(tǒng)卷積核,則感受野卻很小。
2) 增大感受野采用最大池化,則最后的網(wǎng)絡(luò)層將丟失原始圖像信息,圖像語(yǔ)義分割精度降低。
3) 增大感受野采用多個(gè)較大傳統(tǒng)卷積核操作,會(huì)使卷積的參數(shù)量劇增,內(nèi)存不足,檢測(cè)效率減低。
為此,采用的空洞卷積核解決了上述難題,其在基于傳統(tǒng)的卷積核上增大了采樣率rate,將原始卷積核變得“蓬松”,如圖1,2所示。圖1為3×3,步長(zhǎng)為2的傳統(tǒng)卷積核,圖2為3×3,步長(zhǎng)為2,rate=2的空洞卷積核。
圖1 傳統(tǒng)卷積核的卷積操作示意圖Fig.1 Schematic diagram of convolution operation of traditional convolution kernel
圖2 空洞卷積核的卷積操作示意圖Fig.2 Schematic diagram of convolution operation of a cavity convolution kernel
這樣在保持原有計(jì)算量的同時(shí),增大了感受野,使得圖像分割的信息足夠精確,則基于空洞卷積核的感受野大小計(jì)算公式為
(1)
式中:F為當(dāng)前層感受野大?。籸ate為空洞卷積核的采樣率,即間距數(shù),在圖1中可將傳統(tǒng)卷積核的rate視為1,而空洞卷積的采樣率rate視為2。傳統(tǒng)的卷積感受野計(jì)算公式為
(2)
同時(shí),空洞卷積還可以借鑒多尺度圖像變化的思想,對(duì)采樣率、卷積核大小進(jìn)行多樣化的處理,以此來(lái)適應(yīng)不同大小目標(biāo)的特征提取過(guò)程。采用多尺度空洞卷積[7]的變體形式,如圖3所示。
圖3 多尺度空洞卷積核Fig.3 Multiscale cavity convolution kernel
圖3中的多尺度空洞卷積[7]的采樣率rate分別取1,2,3,卷積的計(jì)算方式為
(3)
式中:y[i]為第i個(gè)步長(zhǎng)位置對(duì)應(yīng)的卷積求和結(jié)果;K為卷積核;k為卷積核內(nèi)參數(shù)坐標(biāo)位置,k∈K;w[k]為卷積核權(quán)重;rate為上述1,2,3的對(duì)應(yīng)值。
除了空洞卷積外,采用一種通道卷積的方式對(duì)網(wǎng)絡(luò)進(jìn)行輕量化操作。由于傳統(tǒng)的卷積方式[6]都是一種升維操作,因此可以考慮一開始采用通道卷積[9]的方式來(lái)達(dá)到特征卷積降維的作用。首先將傳統(tǒng)的卷積改成兩層卷積,類似于ResNet中的group操作,這種新結(jié)構(gòu)在不影響準(zhǔn)確率的前提下縮短計(jì)算時(shí)間約為原來(lái)的1/8,減少參數(shù)量約為原來(lái)的1/9,并且能夠很好地應(yīng)用于移動(dòng)端,實(shí)現(xiàn)目標(biāo)的實(shí)時(shí)檢測(cè),模型壓縮效果明顯,如圖4,5所示。
圖4 傳統(tǒng)卷積方式Fig.4 Traditional convolution method
圖5 通道卷積方式Fig.5 Channel convolution
在圖4中,對(duì)于傳統(tǒng)的卷積而言,假設(shè)輸入的特征通道數(shù)為M;卷積核的寬或高分別為Dk或Dk;卷積核的數(shù)量為N。則卷積每滑動(dòng)一次某一位置就有N個(gè)M·Dk·Dk的參數(shù)量,滑動(dòng)的步長(zhǎng)設(shè)置為s,滑動(dòng)后的圖像尺寸大小計(jì)算公式為
(4)
(5)
式中:h′,w′分別為卷積后的高和寬;pad為寬高填充的邊界。因此,h′·w′卷積后尺寸某一點(diǎn)對(duì)應(yīng)N個(gè)M·Dk·Dk的參數(shù)量,則可得到總的參數(shù)量大小為
N·M·Dk·Dk·h′·w′
(6)
而采用改進(jìn)后的通道卷積方式,如圖5所示,其卷積步驟分為兩步:
1) 采用Dk·Dk·M的卷積分別對(duì)M個(gè)通道進(jìn)行卷積。采用同樣的步長(zhǎng)s進(jìn)行滑動(dòng),卷積后的尺寸大小為h′,w′,則該步驟產(chǎn)生的參數(shù)量為
Dk·Dk·M·h′·w′
(7)
2) 設(shè)置1·1·N的卷積核進(jìn)行升維特征提取。此時(shí)采用步長(zhǎng)為1的方式對(duì)上述的特征圖進(jìn)行再次特征提取,原有M個(gè)通道特征,每一個(gè)采用N個(gè)卷積核進(jìn)行特征提取,則計(jì)算的總參數(shù)量大小為
M·N·h′·w′·1·1
(8)
綜合這兩個(gè)步驟的卷積結(jié)構(gòu),得到通道卷積最后的參數(shù)量大小為
Dk·Dk·M·h′·w′+M·N·h′·w′
(9)
如前所述,傳統(tǒng)卷積核的參數(shù)量和改進(jìn)后的通道卷積參數(shù)量比較大小為
(10)
從式(10)分析可得:如果采用卷積核大小為3×3,那么通道卷積操作可將參數(shù)量降低為原來(lái)的1/9,采用的通道卷積方式結(jié)構(gòu)如圖6所示。圖6中:DW為通道卷積組,表示通道卷積核組成的固定搭配;BN為批量歸一化操作,解決在訓(xùn)練過(guò)程中,中間層數(shù)據(jù)分布發(fā)生改變的問題;Conv為卷積層操作;RelU為修正線性單元,是一個(gè)激活函數(shù)。
圖6 通道卷積結(jié)構(gòu)Fig.6 Channel convolution structure
此外,傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)最后層采用固定的尺寸大小,以至于輸入的圖片需事先轉(zhuǎn)化為固定尺寸,不利于物流車輛車長(zhǎng)坐標(biāo)的獲?。徊⑶覀鹘y(tǒng)全連接層網(wǎng)絡(luò)存在確定的位數(shù)空間坐標(biāo)丟失,導(dǎo)致圖像空間信息失真,未能有效對(duì)目標(biāo)進(jìn)行精確定位。為解決信息丟失問題,采用如圖7所示的全卷積連接方式[10]進(jìn)行物流車輛的坐標(biāo)位置精確定位。
圖7 全卷積網(wǎng)絡(luò)Fig.7 Full convolutional network
由圖7可知:傳統(tǒng)網(wǎng)絡(luò)的全連接將前部分的卷積網(wǎng)絡(luò)[b,c,h,w]轉(zhuǎn)為[b,c·h·w],即[b,4 096],再轉(zhuǎn)為[b,cls],其中b表示批次batch size大小,cls表示類別數(shù)。而采用全卷積網(wǎng)絡(luò)是相對(duì)于后接1×1的卷積網(wǎng)絡(luò),沒有全連接層。因此,稱為全卷積網(wǎng)絡(luò)。全卷積的計(jì)算方法為
yn[i][j]=fkns(x[si+δi][sj+δj])
(11)
式中:1≤n≤N;yn[i][j]為第n個(gè)卷積核的第(i,j)位置卷積后的數(shù)值;si為橫向的卷積步長(zhǎng);sj為縱向的卷積步長(zhǎng);kn為第n個(gè)卷積核;Dk為卷積核寬和高,卷積核大小對(duì)應(yīng)2.2節(jié)中的Dk·Dk;δi,δj為該卷積核中的位置,該層總共有N個(gè)不同類型的卷積核,0≤δi,δj≤Dk,而卷積核的滑動(dòng)卷積操作可轉(zhuǎn)為兩個(gè)矩陣相乘操作,如圖8所示。
圖8 全卷積矩陣計(jì)算Fig.8 Full convolution matrix calculation
(12)
其中:左邊的矩陣維度為[N,M·Dk·Dk];右邊的矩陣維度為[M·Dk·Dk,w′·h′];卷積后的維度為[N,w′·h′]。右邊的矩陣中I為img,其下標(biāo)依次為像寬和像高,即Iw h。
最后通過(guò)反卷積操作,將[N,w′·h′]轉(zhuǎn)為輸入時(shí)的圖像大小,這樣可以精確地識(shí)別每一像素代表的具體語(yǔ)義信息,且避免了空間信息損失。反卷積的具體操作,相當(dāng)于卷積的逆運(yùn)算,即
(13)
因此,通過(guò)反卷積和全卷積操作的網(wǎng)絡(luò)能夠適用于任意圖像大小尺寸,且能夠?qū)D像的每一像素點(diǎn)進(jìn)行語(yǔ)義分析,達(dá)到物流車輛的精確定位識(shí)別。
傳統(tǒng)的圖像分割方法有從FCNs[10]的角度出發(fā)的“shift-and-stitch”密集輸出以及采用插值的方法進(jìn)行上采樣操作,但是這些方法得到的結(jié)果比較粗糙。即使采用傳統(tǒng)的膨脹、腐蝕處理,像素點(diǎn)的分類結(jié)果依然不精確,如圖9所示。
圖9 傳統(tǒng)圖像分割的缺陷Fig.9 Defects in traditional image segmentation
為解決該問題,采用一種條件隨機(jī)場(chǎng)的后處理手段對(duì)像素分類的后訓(xùn)練階段進(jìn)行干預(yù),使其分類得到更加準(zhǔn)確的像素概率值,從而達(dá)到對(duì)目標(biāo)像素分類進(jìn)行精確化定位的目的。
條件隨機(jī)場(chǎng)[11-13]是一種判別式無(wú)向圖模型,對(duì)于多個(gè)變量或者觀測(cè)序列x={x1,x2,…,xn},即給定目標(biāo)像素值序列,在給定觀測(cè)值或標(biāo)記序列y={y1,y2,…,yn},即類別標(biāo)簽,構(gòu)建條件概率模型P(y|x)。令G=[V,E]表示結(jié)點(diǎn)與標(biāo)記y一一對(duì)應(yīng)的無(wú)向圖,yv表示與結(jié)點(diǎn)v對(duì)應(yīng)的標(biāo)記變量,n(v)表示結(jié)點(diǎn)v的鄰接結(jié)點(diǎn),每個(gè)變量yv都滿足馬爾可夫性,即
P(yv|x,yv)=P(yv|x,yn(v))
(14)
則(y,x)構(gòu)成一個(gè)條件隨機(jī)場(chǎng),對(duì)其進(jìn)行建模,使用勢(shì)函數(shù)和團(tuán)來(lái)定義條件概率P(y|x),使得標(biāo)記變量{yi}以及相鄰的標(biāo)記變量{yi-1,yi}所組成的團(tuán)勢(shì)函數(shù)最大,通過(guò)選用指數(shù)勢(shì)函數(shù),目標(biāo)函數(shù)定義為
(15)
(16)
式中:tj(yi+1,yi,x,i)為兩個(gè)相鄰變量標(biāo)記位置的轉(zhuǎn)移特征函數(shù),用于刻畫相鄰標(biāo)記變量的相關(guān)關(guān)系以及觀測(cè)序列對(duì)其的影響;sk(yi,x,i)為觀測(cè)序列在標(biāo)記位置i上的狀態(tài)特征函數(shù),用于刻畫觀測(cè)序列對(duì)標(biāo)記變量的影響;λj和μk為參數(shù);Z為規(guī)范化因子,用于準(zhǔn)確定義概率。
針對(duì)上述條件隨機(jī)場(chǎng)[12],結(jié)合物流車輛分類模型,采用的能量勢(shì)函數(shù)為
(17)
式中:θi(xi)為一元?jiǎng)莺瘮?shù);xi為觀測(cè)序列中的像素i的分類標(biāo)簽,即屬于物流車輛中的某一類別,則有類別概率P(xi),轉(zhuǎn)化θi(xi)=-logP(xi)。而第二項(xiàng)的成對(duì)勢(shì)函數(shù)θij(xi,xj)擴(kuò)展為
(18)
式中:μ(xi,xj)為標(biāo)簽對(duì)比函數(shù),當(dāng)xi≠xj時(shí),μ(xi,xj)=1,否則μ(xi,xj)=0,用于判斷相鄰像素點(diǎn)間的距離;wm·km(fi,fj)為高斯卷積核特征函數(shù),用wm權(quán)衡相鄰像素點(diǎn)特征關(guān)系,具體關(guān)系函數(shù)為
(19)
圖10 使用條件隨機(jī)場(chǎng)前后對(duì)比Fig.10 Use conditions before and after the airport comparison
圖像聯(lián)通區(qū)域[14-16]查找方法較多,有像素點(diǎn)標(biāo)記法、線段標(biāo)記法等。其中像素點(diǎn)標(biāo)記法又分為區(qū)域增長(zhǎng)法、順序掃描法、遞歸標(biāo)記法。線段標(biāo)記法主要為游程標(biāo)記法。而像素點(diǎn)標(biāo)記法最常見,將每一類別的物流車輛的預(yù)測(cè)結(jié)果轉(zhuǎn)化為二值圖,通過(guò)聯(lián)通區(qū)域標(biāo)號(hào)進(jìn)行查找。設(shè)像素點(diǎn)f(x,y)其左右上下坐標(biāo)分別為f(x-1,y),f(x+1,y),f(x,y-1),f(x,y+1),則聯(lián)通區(qū)域標(biāo)號(hào)merge(x,y)在4 領(lǐng)域掃描,經(jīng)過(guò)f(x,y)點(diǎn)時(shí)已掃描左、上位置f(x-1,y)和f(x,y-1),因此可通過(guò)判斷merge(x-1,y)和merge(x,y-1)來(lái)確定f(x,y)的聯(lián)通性,具體的判別式為
1) 表明與左領(lǐng)域相聯(lián)通的判斷條件:當(dāng)f(x,y)=f(x-1,y)且f(x,y)≠f(x,y-1)時(shí),merge(x,y)=merge(x-1,y)。
2) 表明與上領(lǐng)域相聯(lián)通的判斷條件:當(dāng)f(x,y)=f(x,y-1)且f(x,y)≠f(x-1,y)時(shí),merge(x,y)=merge(x,y-1)。
3) 表明與左、上領(lǐng)域相聯(lián)通的判斷條件:當(dāng)f(x,y)=f(x-1,y)且f(x,y)=f(x,y-1)時(shí),merge(x,y)=merge(x-1,y)=merge(x,y-1)。
4) 表明與左、上領(lǐng)域不聯(lián)通的判斷條件:當(dāng)f(x,y)≠f(x-1,y)且f(x,y)≠f(x,y-1)時(shí),merge(x,y)=NewLabel新的聯(lián)通標(biāo)號(hào)。
設(shè)立一個(gè)一維數(shù)組common,其下標(biāo)為臨時(shí)聯(lián)通區(qū)域標(biāo)號(hào)merge(x,y)的值,merge(x,y)的值代表某個(gè)共同聯(lián)通區(qū)域標(biāo)號(hào),即像素點(diǎn)f(x,y)的共同聯(lián)通區(qū)域標(biāo)號(hào)common(merge(x,y))。掃描二值圖類別圖像,具體流程為
1) 當(dāng)出現(xiàn)當(dāng)前坐標(biāo)點(diǎn)f(x,y)≠f(x-1,y)以及f(x,y)≠f(x,y-1)時(shí),表明像素點(diǎn)f(x,y)屬于新的聯(lián)通區(qū)域,數(shù)組common新增一個(gè),并且記錄common(merge(x,y))=merge(x,y)。
2) 當(dāng)出現(xiàn)當(dāng)前坐標(biāo)點(diǎn)f(x,y)=f(x,y-1)以及f(x,y)=f(x-1,y),還需要比較臨時(shí)聯(lián)通區(qū)域標(biāo)號(hào)merge(x-1,y)和merge(x,y-1)的值:(1) 若出現(xiàn)merge(x-1,y)=merge(x,y-1)情況,則merge(x,y)=merge(x,y-1);(2) 若出現(xiàn)merge(x-1,y)≠merge(x,y-1)情況,則當(dāng)common(i)=common(merge(x-1,y))時(shí),有common(i)=common(merge(x,y-1))。
3) 當(dāng)出現(xiàn)當(dāng)前坐標(biāo)點(diǎn)f(x,y)=f(x,y-1)以及f(x,y)≠f(x-1,y),則表明與上領(lǐng)域聯(lián)通,記錄merge(x,y)=merge(x,y-1)。
4) 當(dāng)出現(xiàn)當(dāng)前坐標(biāo)點(diǎn)f(x,y)=f(x-1,y)以及f(x,y)≠f(x,y-1),則表明與左領(lǐng)域聯(lián)通,記錄merge(x,y)=merge(x-1,y)。
經(jīng)以上步驟后,合并所有聯(lián)通區(qū)域,得到每一類別的聯(lián)通區(qū)域,可對(duì)目標(biāo)物流車輛作像素點(diǎn)分割定位。
在分割基礎(chǔ)上,采用了最小外接四邊形的方法[17-18]將目標(biāo)進(jìn)行框定,這樣有利于計(jì)算物流車輛相應(yīng)的寬高像素信息。其中物流車輛定位的最小外接四邊形計(jì)算流程為
1) 將上述分割圖像每一類別轉(zhuǎn)為二值圖像,尋找其近似多邊形輪廓。
2) 多邊形輪廓由每一系列點(diǎn)組成,找到離散點(diǎn)中y坐標(biāo)最大,x坐標(biāo)最小的點(diǎn)記為A點(diǎn)。
5) 以此類推,直到找到A點(diǎn),從而得到多邊形P。
6) 以P為凸邊以旋轉(zhuǎn)法計(jì)算每一次旋轉(zhuǎn)的面積,得到最小面積,即最小外接四邊形,記錄最小外接四邊形的高度和寬度。
從物流園區(qū)采集了廂式貨車、牽引式貨車、自卸車、罐式車四種類型的物流車輛,將其劃分為訓(xùn)練集8 000 張,每一類別2 000 張,測(cè)試集4 000 張,每一類別1 000 張。搭建的輕量化和條件隨機(jī)場(chǎng)模型網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。表1中:k為卷積核大?。籹為步長(zhǎng);p為填充的尺寸;DW為通道卷積組,表示通道卷積核組成的固定搭配;使用了殘差求和有利于大網(wǎng)絡(luò)的梯度傳遞;各層的激活和批量標(biāo)準(zhǔn)化[17]操作(Batch normalization,BN)有利于加快網(wǎng)絡(luò)的訓(xùn)練;ReLU為修正線性單元,是一個(gè)激活函數(shù)。
表1 輕量化網(wǎng)絡(luò)模型結(jié)構(gòu)Table 1 Lightweight network model structure
采用的計(jì)算機(jī)配置為技嘉NVIDIA英偉達(dá)GTX1080Ti顯存11 G,1 607 MHz的顯卡,對(duì)比了優(yōu)化前和采取筆者結(jié)構(gòu)優(yōu)化后的模型測(cè)試性能,結(jié)果如表2所示。表2中的評(píng)價(jià)指標(biāo)MPA表示平均像素點(diǎn)準(zhǔn)確率(Mean pixel accuracy);MA表示前景面積占標(biāo)簽面積的比值(Mean accuracy);而MIOU表示平均交并與面積覆蓋率比值(Mean intersection over union),即預(yù)測(cè)正確的區(qū)域占預(yù)測(cè)面積和標(biāo)簽面積并集的比值;單位M·pic-1表示訓(xùn)練一張圖片所占用的內(nèi)存,內(nèi)存單位兆(M);單位ms·iter-1表示每迭代一次需要的時(shí)間,時(shí)間單位毫秒(ms);采用通道卷積后,占用的顯存減少了51%,訓(xùn)練速度提升了78%,測(cè)試速度提高了79%,分割定位的各項(xiàng)評(píng)價(jià)指標(biāo)中都獲得大幅提升,其中MIOU的提升幅度最大。
表2 輕量化分割模型性能對(duì)比
此外針對(duì)分割粗糙問題,引進(jìn)了條件隨機(jī)場(chǎng)優(yōu)化,提升了分割定位效果。使用條件隨機(jī)場(chǎng)分割前與使用條件隨機(jī)場(chǎng)分割后的結(jié)果對(duì)比,如圖10所示。
針對(duì)分割圖像無(wú)明顯邊框問題,采用了最小外接四邊形算法,對(duì)二值化后的聯(lián)通區(qū)域進(jìn)行查找和最小邊框限定。得到完美的邊框限定結(jié)果,如圖11所示。無(wú)論物流車輛朝向如何,分割定位后的邊框位置都能限定在最小矩形框內(nèi)。
圖11 最小外接四邊形定位Fig.11 Minimum external quadrilateral positioning
基于輕量化的網(wǎng)絡(luò)模型結(jié)構(gòu),最突出的特點(diǎn)是在保證分割精度的情況下,提升模型的分割效率,通過(guò)通道卷積的方式減少了模型的參數(shù)量;又設(shè)置了多尺度的空洞卷積核,合理而簡(jiǎn)便地提高模型的感受野,增強(qiáng)模型的泛化性;對(duì)傳統(tǒng)分割方法的粗糙問題進(jìn)行了條件隨機(jī)場(chǎng)優(yōu)化處理,能夠滿足更精細(xì)化的目標(biāo)邊緣分割和內(nèi)部空洞填補(bǔ)。其次針對(duì)分割邊界測(cè)量問題,通過(guò)最小外接四邊形進(jìn)行框定,解決了物流車輛邊界框定問題,有利于進(jìn)一步通過(guò)比例方法獲取車輛車長(zhǎng)和車高等信息。