陳 政,李良榮,李 震,顧 平
(貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽(yáng) 550025)
據(jù)《2018年交通運(yùn)輸行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)》顯示,全國(guó)公路總里程達(dá)到484.65萬(wàn)公里,其中高速公路里程已經(jīng)達(dá)到14.26萬(wàn)公里,全國(guó)公路隧道為17 738處、1 723.61萬(wàn)米,其中特長(zhǎng)隧道1 058處,470.66萬(wàn)米,長(zhǎng)隧道4 315處、742.18萬(wàn)米[1]。目前,雖然隧道照明燈的配置僅限于隧道內(nèi)及其引導(dǎo)路段,但由于國(guó)內(nèi)隧道的基數(shù)較大,普遍采用的是常明燈模式,在無(wú)車(chē)通行時(shí)段浪費(fèi)了大量的能源,同時(shí)也給高速公路運(yùn)營(yíng)管理部門(mén)帶來(lái)了沉重的經(jīng)濟(jì)負(fù)擔(dān)。文中依托國(guó)家基金課題“高速公路隧道節(jié)能照明關(guān)鍵技術(shù)研究”,獲取隧道內(nèi)的行車(chē)視頻來(lái)對(duì)車(chē)牌信息展開(kāi)技術(shù)研究,獲取信息是實(shí)施隧道“車(chē)近燈亮、車(chē)過(guò)燈滅”節(jié)能照明控制、隧道運(yùn)行信息化管理的重要信息。然而,隧道中無(wú)自然光,不僅行車(chē)的速度快,而且車(chē)型多樣、行駛無(wú)規(guī)律、車(chē)牌位置不同、車(chē)燈照明不一致;車(chē)道多,可能出現(xiàn)并行、緊隨、超車(chē)變道、超速行駛等情況,導(dǎo)致了隧道行車(chē)車(chē)牌信息獲取算法面臨嚴(yán)峻挑戰(zhàn)。因此,針對(duì)隧道內(nèi)高速行駛車(chē)輛的車(chē)牌識(shí)別問(wèn)題進(jìn)行研究。
一個(gè)完整的車(chē)牌識(shí)別系統(tǒng)大致由車(chē)牌圖像獲取、圖像預(yù)處理、車(chē)牌定位、字符分割和字符識(shí)別這五部分組成[2]。主要流程如圖1所示。
圖1 車(chē)牌識(shí)別系統(tǒng)主要流程
針對(duì)行車(chē)目標(biāo)檢測(cè)中的圖像背景獲取,文中采用彩色視頻背景選擇更新法:即分別對(duì)前后兩幀的相應(yīng)像素的紅色、綠色和藍(lán)色分量相減以獲得三個(gè)差值。當(dāng)三個(gè)差的平均值小于檢測(cè)閾值T,就將其視為背景區(qū)域,大于則視為目標(biāo)區(qū)域[3]。其中平均值為:
average|Mj+1(x,y,RGB)-Mj(x,y,RGB)|=
(1)
再用式(2)可得到完整的目標(biāo)彩色背景圖像:
(2)
其中,Mi(i=1,2,…,n)表示圖像序列,Sj(j=1,2,…,n-1)表示背景序列,(x,y)為像素坐標(biāo),c為色彩坐標(biāo),即c=(R,G,B),m(x,y,c)為(x,y)處Sj(x,y,c)值不為0的次數(shù),m(x,y,c)>1。
傳統(tǒng)的車(chē)牌定位方法有很多,如基于邊緣特征的定位算法、基于模板匹配的定位算法、基于顏色特征的定位算法等[4]。這些方法的優(yōu)缺點(diǎn)不同,主要通過(guò)運(yùn)行速度和準(zhǔn)確性?xún)蓚€(gè)方面表現(xiàn)。一般來(lái)說(shuō)這兩個(gè)方面很難同時(shí)滿(mǎn)足,計(jì)算量小的算法精度普遍較低,而高精度算法的計(jì)算量自然就很大。
文中在車(chē)牌定位中選用邊緣檢測(cè)與形態(tài)學(xué)相結(jié)合的算法,因?yàn)檫吘墮z測(cè)的定位速度快,符合現(xiàn)代多車(chē)輛需要進(jìn)行實(shí)時(shí)處理的情況。而車(chē)牌污染等因素會(huì)對(duì)其定位產(chǎn)生影響,且在隧道交通中由車(chē)燈照明引起的復(fù)雜環(huán)境背景會(huì)讓邊緣檢測(cè)定位到的車(chē)牌出現(xiàn)較大的誤差,所以選擇將邊緣檢測(cè)與形態(tài)學(xué)處理結(jié)合起來(lái)確定候選車(chē)牌的輪廓,利用形態(tài)腐蝕和膨脹來(lái)消除污染和模糊區(qū)域來(lái)克服這些影響[5]。
圖像預(yù)處理的步驟中包含了許多算法,其目的是使后續(xù)算法具有更快的處理速度或得到更符合所需信息的圖像,因此圖像預(yù)處理是影響整個(gè)系統(tǒng)性能的重要因素之一。在獲取目標(biāo)圖像的過(guò)程中,除車(chē)牌本身之外,還夾帶了一些其他的干擾因素,如復(fù)雜的背景信息、環(huán)境因素等。首先對(duì)獲取的車(chē)牌圖像進(jìn)行灰度化處理以減少數(shù)據(jù)處理量[6],其灰度化值:
Y=x×R+y×G+z×B
(3)
其中,x、y、z是灰度化處理系數(shù),取值為x=2.97、y=0.581、z=0.124時(shí)灰度化效果最好,處理效果如圖2所示。
圖2 灰度化效果
考慮到干擾因素所帶來(lái)的噪聲影響,需要對(duì)灰度化后的圖像進(jìn)行濾波以消除噪聲,因?yàn)橹兄禐V波可以較好地處理脈沖噪聲、椒鹽噪聲,且邊緣細(xì)節(jié)保存良好[7]。所以文中采用中值濾波的方法對(duì)灰度化后的圖像進(jìn)行濾波,效果如圖3所示。
圖3 中值濾波效果
圖像邊緣是圖像的基本特征,可以顯示圖像灰度信息的變化情況,反映圖像局部特征的不連續(xù)性[8]。常用的邊緣檢測(cè)算子有:Sobel算子、Roberts算子、Canny算子、Laplacian算子。因?yàn)镽oberts算子簡(jiǎn)單直觀,且邊緣定位準(zhǔn)確,所以首選其進(jìn)行邊緣檢測(cè),效果如圖4所示。
圖4 Roberts算子效果
形態(tài)學(xué)的基本運(yùn)算有膨脹、腐蝕、開(kāi)運(yùn)算和閉運(yùn)算。其處理方法是利用一個(gè)稱(chēng)為元素結(jié)構(gòu)的“探針”來(lái)收集圖像信息,在邊緣檢測(cè)之后采用形態(tài)學(xué)處理將圖像內(nèi)的字符區(qū)域連成一片,消除圖像中存在的干擾邊緣點(diǎn),以提高定位車(chē)牌的準(zhǔn)確率。圖5為對(duì)車(chē)牌圖像進(jìn)行腐蝕后的效果圖,形態(tài)學(xué)基本運(yùn)算:
膨脹:
A⊕B={x,y|(B)xy∩A≠?}
(4)
腐蝕:
AΘB={x,y|(B)xy?A}
(5)
開(kāi)運(yùn)算:
A°B=(A?B)⊕B
(6)
閉運(yùn)算:
A?B=(A⊕B)?B
(7)
其中,A為待處理的圖像,B為結(jié)構(gòu)元素集合,x,y表示平移元素。
圖5 腐蝕后的車(chē)牌圖像
經(jīng)邊緣檢測(cè)和形態(tài)學(xué)處理之后,車(chē)牌圖像已大致可以顯示出車(chē)牌區(qū)域的輪廓,但還是會(huì)受到一些噪聲和其他因素的影響,因此車(chē)牌區(qū)域還不能完全被計(jì)算提取得到[9]。文中采用imclose()函數(shù)對(duì)圖像進(jìn)行平滑處理,去除一些孤立而無(wú)意義的噪點(diǎn),以此來(lái)消除噪聲帶來(lái)的影響。
在圖像進(jìn)行平滑處理之后會(huì)有許多閉合區(qū)域,比如一些噪點(diǎn)和車(chē)標(biāo),這些不屬于車(chē)牌部分的要盡量刪除。文中采用bwareaopen()函數(shù),從圖像中刪除小于設(shè)定面積值的部分,最后確定車(chē)牌圖像的位置,處理效果如圖6所示。
圖6 定位剪切后的彩色車(chē)牌圖像
中國(guó)車(chē)牌的第一個(gè)字符是中文省名的縮寫(xiě),第二個(gè)字符是英文字母,其他五個(gè)字符是數(shù)字或英文字母,英文字母不超過(guò)兩個(gè)。為了準(zhǔn)確識(shí)別到車(chē)牌上的漢字、英文字母和數(shù)字,識(shí)別的過(guò)程中每個(gè)字符必須分段。所以車(chē)牌字符的分割結(jié)果是字符識(shí)別的前提和準(zhǔn)備,而字符識(shí)別通過(guò)提取字符特征來(lái)識(shí)別字符分割,因此字符識(shí)別直接決定了車(chē)牌識(shí)別系統(tǒng)性能的好壞。傳統(tǒng)的字符識(shí)別方法有模板匹配法[10]:首先,對(duì)樣本進(jìn)行分類(lèi)并建立樣本數(shù)據(jù)庫(kù),然后將識(shí)別出的字符進(jìn)行二值化處理,并通過(guò)字符數(shù)據(jù)庫(kù)中的模板大小進(jìn)行標(biāo)準(zhǔn)化,與所有模板匹配并計(jì)算它們的相似度,最后選擇最佳匹配作為結(jié)果。但計(jì)算量大是一個(gè)明顯的缺點(diǎn),并且對(duì)傾斜或環(huán)境干擾的圖像很敏感。所以文中采用了基于SVM(支持向量機(jī))的字符識(shí)別來(lái)完成車(chē)牌識(shí)別系統(tǒng)最后的過(guò)程[11]。
車(chē)牌的字符分割將車(chē)牌區(qū)域劃分為單個(gè)字符區(qū)域,每個(gè)字符區(qū)域必須是包含單個(gè)字符的最小矩形區(qū)域,分割越精確識(shí)別效果越好。傳統(tǒng)的垂直投影劃分字符的分割方法相對(duì)簡(jiǎn)單準(zhǔn)確,但分割效果容易受到噪聲和平板傾斜度的影響。文中對(duì)定位后的字符圖像首先進(jìn)行灰度化、二值化、濾波、形態(tài)學(xué)處理的預(yù)處理。因?yàn)檐?chē)牌字符之間的間距較大,所以在分割時(shí)不會(huì)出現(xiàn)字符粘連等情況,然后去尋找?guī)в羞B續(xù)文本的模塊,如果長(zhǎng)度大于設(shè)定閾值I,則認(rèn)為該塊具有兩個(gè)字符需要進(jìn)行分割,小于則不需要。這種方法可以較好地解決在分割的過(guò)程中出現(xiàn)字符斷節(jié)等問(wèn)題,字符分割效果如圖7所示。
圖7 分割后的字符圖塊
字符歸一化可在字符識(shí)別中消除字符大小的影響,字符像素由字符在水平和垂直方向上的分布來(lái)進(jìn)行大小歸一,其算法步驟為[12]:
(1)設(shè)GI為水平方向的質(zhì)心,GJ為垂直方向的質(zhì)心:
(8)
其中,s(i,j)=1表示目標(biāo)像素,s(i,j)=0表示背景像素,E、F、G、H分別代表字符的上下左右邊界。
(2)設(shè)σI為水平方向的散度,σJ為垂直方向的散度:
(11)
計(jì)算出質(zhì)心和散度之后,對(duì)進(jìn)行預(yù)處理之后的字符圖塊統(tǒng)一進(jìn)行40*32的縮放處理,方便后續(xù)的字符特征提取。
無(wú)論是字符樣本還是待識(shí)別的字符,都需要經(jīng)過(guò)特征提取后才能夠輸入到相應(yīng)的識(shí)別算法中。文中采用基于HOG的特征提取,將提取到的字符黑白像素的特征參數(shù)用作SVM的分類(lèi)標(biāo)準(zhǔn),HOG特征關(guān)注目標(biāo)形狀信息分布,在抗目標(biāo)表觀信息變化方面具有明顯的優(yōu)勢(shì),可由字符的形狀信息來(lái)更好地識(shí)別字符。該方法首先將圖像分成較小的連通區(qū)域,在此區(qū)域上采集各像素點(diǎn)邊緣方向上的直方圖并統(tǒng)計(jì)它們的方向特性,最后將這些直方圖組成特征描述器傳送到SVM算法識(shí)別模塊。文中將HOG參數(shù)Cell的大小設(shè)置為[4 4],既可滿(mǎn)足空間信息編碼的大小,又限制了HOG特征向量的維數(shù),從而加快訓(xùn)練[13]。
中國(guó)車(chē)牌的字符種類(lèi)一共分四類(lèi),第一類(lèi)是車(chē)牌最左邊的漢字,第二類(lèi)是緊跟著首部漢字的字母,第三類(lèi)是車(chē)牌中圓點(diǎn)右側(cè)的字母和數(shù)字的組合,第四類(lèi)則是一些專(zhuān)用車(chē)牌的字符。字符樣本的種類(lèi)繁多,其中漢字包含50個(gè)、英文字符24個(gè)、阿拉伯?dāng)?shù)字10個(gè),一共是84個(gè)種類(lèi),如果構(gòu)建一個(gè)多分類(lèi)SVM分類(lèi)器,則84個(gè)種類(lèi)就構(gòu)成15 312個(gè)分類(lèi)器,這個(gè)計(jì)算量是非常大的。因此,文中采用一對(duì)多分類(lèi)器將樣本的第M類(lèi)和樣本中其他M-1類(lèi)分開(kāi)來(lái)構(gòu)成二分類(lèi)器,以降低計(jì)算量,減少執(zhí)行訓(xùn)練樣本和識(shí)別的時(shí)間。
在SVM識(shí)別字符的過(guò)程中,核參數(shù)的選取對(duì)最后識(shí)別的性能至關(guān)重要,文中選用粒子群算法來(lái)對(duì)核參數(shù)進(jìn)行優(yōu)化。
支持向量機(jī)(SVM)是一種在高維特征空間中也可以進(jìn)行良好分離超平面計(jì)算的有效方法,使用線性超平面來(lái)創(chuàng)建具有最大余量的分類(lèi)器,該算法旨在通過(guò)在高維特征空間中使用核函數(shù)來(lái)找到支持向量及相應(yīng)的系數(shù),以構(gòu)建最佳分離面[14]。首先可設(shè)數(shù)據(jù)集L(x1,y1),(x2,y2),…,(xd,yd),其中xi是具有關(guān)聯(lián)類(lèi)標(biāo)簽yi的訓(xùn)練元組集合。每個(gè)yi都可以取兩個(gè)值中的一個(gè)(+1或-1)。在對(duì)數(shù)據(jù)元組進(jìn)行分類(lèi)時(shí),最大邊際超平面將比較小邊距更準(zhǔn)確,分離超平面可以寫(xiě)成:
f(x)=w·x+b
(12)
yif(xi)=yi(w·x+b)≥1,i=1,2,…,M
(13)
引入松弛變量ξi來(lái)測(cè)量邊距與位于邊距另一邊的向量xi之間的距離,然后可以通過(guò)公式獲得分離數(shù)據(jù)的最佳超平面:
(14)
其中,ξi≥0,i=1,2,…,M,C為懲罰因子。通過(guò)引入拉格朗日系數(shù)i,可將上述優(yōu)化問(wèn)題轉(zhuǎn)化為雙二次優(yōu)化問(wèn)題,即
(15)
因此,線性決策函數(shù)是通過(guò)求解產(chǎn)生的雙優(yōu)化問(wèn)題,定義為:
(16)
SVM算法核函數(shù)提高了模型對(duì)非線性樣本的分類(lèi)能力。選擇不同核函數(shù)來(lái)代替原始分類(lèi)方程的內(nèi)積的過(guò)程是將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題的過(guò)程。它們都影響著系統(tǒng)的分類(lèi)能力和泛化能力,因此選擇合適的核函數(shù)和懲罰因子是SVM算法的核心。對(duì)于車(chē)牌樣本的非線性不可分割的情況,常用的核函數(shù)如下:
(1)多項(xiàng)式核函數(shù)。
k(x,xi)=[(x?xi)+1]d
(17)
(2)RBF核函數(shù)。
(18)
(3)Sigmod核函數(shù)。
k(x,xi)=tanh(k(x?y)+c)
(19)
線性核函數(shù)主要是用于線性可分的情況,對(duì)于線性可分問(wèn)題分類(lèi)效果較好,但是對(duì)于車(chē)牌樣本而言,其類(lèi)別和特征向量是非線性的,而且樣本需要映射到高維空間。為此選擇RBF核作為支持向量機(jī)的核函數(shù)。
PSO算法是一種基于種群的隨機(jī)優(yōu)化的方法,受鳥(niǎo)類(lèi)群體活動(dòng)的規(guī)律性啟發(fā),進(jìn)而利用群體智能建立一個(gè)簡(jiǎn)化的模型[15]。在PSO的描述中,種群是由問(wèn)題超空間中移動(dòng)一定數(shù)量的粒子構(gòu)成,通過(guò)迭代尋找全局最優(yōu)解。每個(gè)粒子都有一個(gè)位置矢量和一個(gè)速度矢量來(lái)指導(dǎo)它的運(yùn)動(dòng)。PSO算法的原理在迭代過(guò)程中主要通過(guò)以下方式來(lái)實(shí)現(xiàn)[16]:
(1)在問(wèn)題空間中對(duì)具有隨機(jī)位置和速度的粒子群進(jìn)行初始化;
(2)評(píng)估每個(gè)粒子的適應(yīng)度函數(shù);
(3)將每個(gè)粒子的適應(yīng)值與其先前的最佳適應(yīng)值pbesti進(jìn)行比較,如果當(dāng)前值優(yōu)于pbesti,則將此值設(shè)置為pbesti,并將粒子的當(dāng)前位置xi設(shè)置為pi[17-18];
(4)識(shí)別具有最佳適應(yīng)值gbest的鄰域中的粒子,將粒子的位置設(shè)置為pg;
(5)每一代粒子根據(jù)以下公式更新自己的速度和位置:
vi(k)=ω·vi(k-1)+c1r1[pi-xi(k-1)]+
c2r2[pg-xi(k-1)]
(20)
xi(k)=xi(k-1)+vi(k)
(21)
(6)重復(fù)步驟(2)至(5)直到求得粒子的最優(yōu)函數(shù)適應(yīng)值后停止更新,得到的粒子位置pg即是最佳的解決方案。
上式中i=1,2,…,M,ω是非負(fù)常數(shù),稱(chēng)為慣性權(quán)重,隨迭代而線性變小,vi表示每個(gè)粒子的飛行速度,c1,c2表示學(xué)習(xí)因子,r1,r2是介于[0,1]之間的隨機(jī)數(shù)。在更新過(guò)程中,每個(gè)粒子通過(guò)上述兩個(gè)極值連續(xù)更新自身,從而產(chǎn)生新一代的群體,將粒子的位置、速度限制在允許的條件之下。
表1 PSO參數(shù)設(shè)置
在多類(lèi)SVM分類(lèi)器中,懲罰因子C和內(nèi)核寬度γ始終為正值。所以在PSO算法中選擇合適的邊緣條件x和速度v非常重要,一般C處于[0.1,100]之間,γ處于[0.1,1 000]之間,為了使粒子在邊界內(nèi)可以充分搜索到最佳位置,文中對(duì)粒子的速度進(jìn)行了以下約束:
Vc max=k1Cmax
Vγ max=k2γmax
k1=k2=0.5
通過(guò)PSO算法對(duì)多類(lèi)SVM分類(lèi)器的優(yōu)化設(shè)置,經(jīng)實(shí)驗(yàn)選出最優(yōu)懲罰因子C和核參數(shù)σ,車(chē)牌分類(lèi)器、漢字字符分類(lèi)器、數(shù)字和字母分類(lèi)器C的取值分別為2、10和20,σ的取值分別為0.8、0.6和0.3。
文中的實(shí)驗(yàn)樣本采取實(shí)拍的500幅車(chē)牌圖像,對(duì)圖像進(jìn)行預(yù)處理之后,選取300張用于SVM樣本訓(xùn)練,100張用于樣本測(cè)試。
實(shí)驗(yàn)環(huán)境:英特爾酷睿i74GHz處理器;8GB RAM;Windows 7操作系統(tǒng);用Matlab實(shí)現(xiàn)。分別對(duì)參數(shù)優(yōu)化前和優(yōu)化后的樣本進(jìn)行訓(xùn)練與識(shí)別,并統(tǒng)計(jì)最后得到的訓(xùn)練時(shí)間,字符識(shí)別的速度以及識(shí)別的準(zhǔn)確率,結(jié)果如表2所示。
表2 實(shí)驗(yàn)數(shù)據(jù)對(duì)比
從表中的對(duì)比可知,參數(shù)優(yōu)化后的SVM字符識(shí)別過(guò)程中在各個(gè)方面上都有顯著的提高,最終字符識(shí)別的結(jié)果如圖8所示。
圖8 字符識(shí)別的效果
研究了基于機(jī)器學(xué)習(xí)SVM算法的車(chē)牌識(shí)別系統(tǒng),項(xiàng)目組通過(guò)對(duì)視頻中高速行車(chē)的車(chē)牌檢測(cè)實(shí)驗(yàn),改進(jìn)了傳統(tǒng)的車(chē)牌定位方法與字符分割方法,采用PSO算法對(duì)SVM中懲罰因子C與內(nèi)核寬度γ進(jìn)行優(yōu)化,并利用MATLAB對(duì)算法進(jìn)行仿真,通過(guò)實(shí)驗(yàn)分析確定C和γ的取值,最后利用車(chē)牌識(shí)別的效果比較來(lái)說(shuō)明參數(shù)優(yōu)化后的SVM算法,能夠更有效地進(jìn)行車(chē)牌分類(lèi)、字符識(shí)別,可以用于實(shí)施“高速公路隧道照明智能化控制方案”,以提高隧道運(yùn)行的能源利用率,降低運(yùn)行成本,具有一定的現(xiàn)實(shí)意義。