楊昌熙 張著洪
摘 要:針對(duì)環(huán)境噪聲嚴(yán)重影響車牌的識(shí)別問題,基于字符特征向量和粒子群優(yōu)化設(shè)計(jì)一種車牌識(shí)別算法。借助垂直投影法、自適應(yīng)閾值方案、方向梯度直方圖法等,對(duì)車牌字符進(jìn)行分割和提取字符的特征向量。依據(jù)字符特征向量樣本和支持向量機(jī)建立字符識(shí)別準(zhǔn)確率模型,并基于粒子群優(yōu)化算法建立求解該模型的車牌識(shí)別算法。比較性的數(shù)值實(shí)驗(yàn)顯示,該算法能有效提升車牌識(shí)別的準(zhǔn)確率,且字符特征向量對(duì)車牌識(shí)別有極大影響。
關(guān)鍵詞:車牌識(shí)別;方向梯度直方圖;支持向量機(jī);粒子群優(yōu)化算法
中圖分類號(hào):TN391
文獻(xiàn)標(biāo)識(shí)碼: A
隨著我國(guó)經(jīng)濟(jì)水平的不斷提高,機(jī)動(dòng)車擁有量的增長(zhǎng)速度較快,道路交通擁擠現(xiàn)象日益突顯,給交通管理帶來了極大挑戰(zhàn)。車牌識(shí)別作為交通管理的重要組成,被廣泛應(yīng)用于停車場(chǎng)、ETC、交通違章等場(chǎng)景,為道路交通的管理發(fā)揮著重要作用[1-2]。它涉及圖像預(yù)處理、車牌提取、字符分割和字符識(shí)別[3]。車牌提取方法通常包括邊緣檢測(cè)[4]、顏色空間法[5]、人工神經(jīng)網(wǎng)絡(luò)[6]等,其通過提取車牌顏色與邊緣信息,降低噪聲對(duì)車牌信息提取的影響,但車牌邊緣信息模糊、附近紋理豐富及車身顏色干擾,導(dǎo)致定位車牌所在區(qū)域的難度加大,且高精度鎖定車牌位置的研究有待深入開展。車牌字符識(shí)別方法主要包括模板匹配法[7]、支持向量機(jī)[2]、神經(jīng)網(wǎng)絡(luò)[8]等。前者[7]是將待識(shí)別車牌與模板進(jìn)行匹配,但匹配效果易受光照強(qiáng)度的影響,而后二者是利用訓(xùn)練樣本和標(biāo)簽對(duì)分類模型進(jìn)行訓(xùn)練,但分類效果受參數(shù)設(shè)置的影響較為明顯。近來,智能優(yōu)化算法與支持向量機(jī)(SVM)結(jié)合,并用于車牌識(shí)別的研究已得到足夠重視;一些學(xué)者[2, 9-10]利用字符的灰度值作為樣本,將粒子群優(yōu)化(PSO)、混沌粒子群優(yōu)化、人工蜂群優(yōu)化等分別與SVM結(jié)合,獲得求解SVM的最佳參數(shù)設(shè)置的車牌識(shí)別算法,提高車牌識(shí)別的準(zhǔn)確率,但尚未考慮字符特征對(duì)字符識(shí)別效果的影響。
盡管車牌識(shí)別已有較多研究,但識(shí)別效果極大依賴于分類模型與模型參數(shù)的選擇以及光照強(qiáng)度等因素,高效且有效的車牌識(shí)別算法仍較為匱乏。為此,本文通過利用自適應(yīng)閾值方案、方向梯度直方圖法(HOG)[11]及SVM建立字符識(shí)別準(zhǔn)確率模型,進(jìn)而利用PSO優(yōu)化模型的參數(shù),獲得基于PSO的車牌識(shí)別方法PSOBLPR (PSO-Based License Plate Recognition Approach)。實(shí)驗(yàn)表明,該算法能有效提升車牌識(shí)別的準(zhǔn)確率。
1??車牌字符的特征向量
車牌提取是車牌識(shí)別的基礎(chǔ)性環(huán)節(jié),其需從車輛圖像中確定車牌所在區(qū)域,且通常利用Sobel算子[4]提取圖像的紋理特征并作形態(tài)學(xué)處理,進(jìn)而利用圖像在HSV色彩空間中的色調(diào)(H)、飽和度(S)、明度(V)、藍(lán)色像素的灰度取值范圍及圖像二值化[5],確定車牌所在區(qū)域,并據(jù)此對(duì)車牌字符進(jìn)行分割。文獻(xiàn)[7]首先對(duì)車牌區(qū)域的傾斜矯正,進(jìn)而利用給定的閾值將此區(qū)域二值化,然后利用垂直投影法進(jìn)行字符分割??墒牵摲椒ɡ渺o態(tài)閾值對(duì)車牌區(qū)域二值化,尚未考慮光照強(qiáng)度對(duì)字符分割的影響,從而導(dǎo)致字符分割的準(zhǔn)確率下降。在此,設(shè)計(jì)如下自適應(yīng)閾值方案并以此代替該方法中靜態(tài)閾值方案
σ=160t<0.4s,1800.4s<t<0.5s,2000.5s<t<0.6s,220t>0.6s(1)
其中,t表示車牌圖像中灰度值大于125的像素點(diǎn)總數(shù),s表示車牌區(qū)域的像素總數(shù)。
通常,車牌包含7個(gè)字符,假定每字符的大小為p×p。在此,利用HOG獲取字符的方向梯度特征向量。具體而言,將字符按大小為q×q劃分為n0子塊;對(duì)子塊j,以其中心為坐標(biāo)原點(diǎn),將其等分為m個(gè)對(duì)稱區(qū)域(即m個(gè)通道,m稱為通道數(shù)),然后計(jì)算通道k的方向梯度值。由此,字符的子塊j中通道k對(duì)應(yīng)一個(gè)梯度值αjk,1≤j≤n0,1≤k≤m,進(jìn)而字符對(duì)應(yīng)的特征
向量為T=(α11,…,αn01,…,α1m,…,αn0m)。
2?字符識(shí)別準(zhǔn)確率模型與算法
2.1?識(shí)別準(zhǔn)確率模型
經(jīng)典的SVM模型[12]作為一種線性可分的二分類器,通過構(gòu)建超平面f(x)=wTx+b,可使兩類樣本到該平面的距離d=w-1最大化,于是有,
min12w2s.t.yi(wTxi+b)≥1,1≤i≤n(2)
其中,xi是給定規(guī)模為n的樣本中第i個(gè)樣例(維數(shù)與以上特征向量的維數(shù)相同),w是權(quán)值向量,yi是xi的標(biāo)簽, 取值1或-1。引入非負(fù)松弛變量ξi和懲罰因子C,可獲得解決非線性可分的SVM模型:
minw22+C∑ni=1ζi,
s.t.yi(wTxi+b)≥1-ζi,ζi≥0,i=1,2,…,n(3)
在給定的C和δ下,求解模型(3)的w等價(jià)于求解該模型的如下對(duì)偶問題。
maxL(α)=∑ni=1αi-12∑ni,j=1αiαjyiyjexpxi-xj22δ2s.t.∑ni,j=1αiyi=0,0≤αi≤C,i=1,2,…,n (4)
進(jìn)而,利用SMO求解此模型,可得到最優(yōu)權(quán)值向量w=∑ni=1α*iyixi。
經(jīng)由第1節(jié)及以上模型的描述獲知,當(dāng)利用字符的特征向量和SVM對(duì)字符進(jìn)行分類時(shí),字符的通道數(shù)m,懲罰因子C及模型(4) 的核函數(shù)因子δ直接影響字符識(shí)別的效果。于是,在給定的特征向量訓(xùn)練集P和測(cè)試集Q下,建立如下字符識(shí)別準(zhǔn)確率模型:
maxg(m,C,δ)=r(m,C,δ)Q(5)
其中,r(m,C,δ)是以上SVM在給定的m、C及δ下,利用SMO和P得到的分類器作用于Q得到的識(shí)別準(zhǔn)確率。
2.2?PSOBLPR的算法描述
由于通道數(shù)m取值為整數(shù),在此將其視為連續(xù)變量,進(jìn)而利用PSO求解上述模型(5)中的三個(gè)參數(shù)值,得到車牌識(shí)別算法PSOBLPR,其描述如下:
步1?字符識(shí)別:
步1.1?設(shè)定變量的取值范圍:m∈[1,36],C,δ∈[10-3,10];
步1.2?輸入字符圖像訓(xùn)練集P及測(cè)試集Q;
步1.3?T← 1; 隨機(jī)生成N個(gè)粒子:Xi=(mi,Ci,δi),1≤i≤N;
步1.4?對(duì)每個(gè)粒子Xi, 計(jì)算適應(yīng)度;
步1.4.1?通過取整mi并借助第1節(jié),獲得P、Q對(duì)應(yīng)的特征向量樣本S和T;
步1.4.2?利用Ci、δi和樣本S訓(xùn)練SVM,得到的字符識(shí)別模型Mi作用于測(cè)試集T,并由此獲得的識(shí)別準(zhǔn)確率作為粒子Xi的適應(yīng)度F(Xi);
步1.5?將此N個(gè)粒子中適應(yīng)度最高的粒子更新全局最優(yōu)粒子gb;Xi更新局部最優(yōu)粒子pbi, 1≤i≤N;
步1.6?對(duì)每個(gè)粒子Xi,執(zhí)行粒子更新,
x′ij←xij+v′ij,1≤j≤3,v′ij←vij+c1r1j(pbij-xij)+c2r2j(gbj-xij)(6)
其中c1和c2為學(xué)習(xí)率,r1j和r2j為0~1之間的隨機(jī)數(shù);
步1.7?T←T+ 1;若T<Gmax,則返回步1.4;否則, 輸出gb, 即最優(yōu)粒子(m*,C*,δ*);
步2?車牌識(shí)別:
步2.1?輸入車牌圖像Mk, k=1,2,…;
步2.1?計(jì)算Mk中7個(gè)字符的特征向量;
步2.3?利用m*、C*、δ*及SVM執(zhí)行車牌匹配;
步2.4?輸出車牌號(hào)。
3?數(shù)值實(shí)驗(yàn)分析
本文在Windows7(CPU/i3 4170 3.70 GHz,RAM/ 4GB)/ Visual Studio 2013/ OpenCV 3.4.1環(huán)境下展開實(shí)驗(yàn)。參與PSOBLPR比較的算法包括SVM[13]、BP[14]及KNN[15]。另外,為檢測(cè)果蠅優(yōu)化是否能有效處理車牌識(shí)別問題,在此將一種果蠅優(yōu)化算法[16]取代以上算法的粒子進(jìn)化過程,獲得的算法(FOABLPR)也參與比較。選取5890張車牌字符圖片作為字符訓(xùn)練集和756張字符圖片作為字符測(cè)試集,以及借助760張車輛圖片檢測(cè)各算法的車牌識(shí)別效果。各算法的最大迭代數(shù)為100,其參數(shù)設(shè)置如下表1所示。
3.1?數(shù)值實(shí)驗(yàn)結(jié)果與分析
在參數(shù)設(shè)置下,各算法解決車牌識(shí)別問題之后,獲得的字符訓(xùn)練集和測(cè)試集的識(shí)別率及車牌識(shí)別率如表1所示。
由表1可知,PSOBLPR及FOABLPR獲得m、C、SymboldA@
的最優(yōu)參數(shù)值集合分別是{4,1.37, 1.5}及{20,1.14,0.41}。它們?cè)诖藚?shù)值及其它參數(shù)設(shè)置下,得到的字符識(shí)別效果和車牌識(shí)別準(zhǔn)確率均高且非常相近,由此表明,果蠅優(yōu)化與粒子群優(yōu)化應(yīng)用于車牌識(shí)別得到的識(shí)別效果具有高度相似性;相對(duì)而言,PSOBLPR對(duì)字符和車牌的識(shí)別有微弱的優(yōu)勢(shì)。其次,比較于未進(jìn)行參數(shù)優(yōu)化的KNN、BP和SVM,此兩種算法明顯比BP和SVM獲得的效果好,且車牌識(shí)別準(zhǔn)確率至少比KNN高1.5%。盡管BP和SVM作用于訓(xùn)練集和測(cè)試集均能得到較高的識(shí)別準(zhǔn)確率,但應(yīng)用于車牌識(shí)別得到的識(shí)別準(zhǔn)確率卻較低,原因在于車牌識(shí)別源自多個(gè)字符識(shí)別的組合。值得指出,KNN作為k近鄰分類算法比較于SVM和BP,無論是作用于字符集還是車牌集合,均能獲得較高的準(zhǔn)確識(shí)別率,因此該算法應(yīng)用于車牌識(shí)別也是一種可選算法,但KNN的計(jì)算量大且受到訓(xùn)練樣本的影響較大。
4?總結(jié)
車牌識(shí)別是一種既傳統(tǒng)又有挑戰(zhàn)性的工程和學(xué)術(shù)性問題,如何對(duì)噪聲污染較重的車牌進(jìn)行精準(zhǔn)識(shí)別,對(duì)車輛管理具有重要的現(xiàn)實(shí)意義。為此,本文通過設(shè)計(jì)自適應(yīng)閾值方案并借助相關(guān)的圖像預(yù)處理方法,提取字符的特征向量,進(jìn)而依據(jù)SVM獲得字符識(shí)別準(zhǔn)確率模型,并利用粒子群優(yōu)化獲得該模型的解。比較性的實(shí)驗(yàn)結(jié)果顯示,粒子群優(yōu)化和果蠅優(yōu)化算法在車牌識(shí)別方面具有較好的應(yīng)用潛力;BP和未進(jìn)行參數(shù)優(yōu)化的SVM的車牌識(shí)別準(zhǔn)確率較低;比較于BP和SVM,KNN雖然能獲得較高的準(zhǔn)確識(shí)別率,但其計(jì)算量大,且其車牌的識(shí)別能力受訓(xùn)練樣本的影響較大。
參考文獻(xiàn):
[1]CHAO G. License plate recognition using ?MSER and HOG based on ELM[C]//Proc. of 2014 IEEE International Conference on Service Operations and Logistics, and Informatics, 2014, 217- 221.
[2]劉雪陽. 基于ABC-SVM算法的車牌識(shí)別系統(tǒng)設(shè)計(jì)[J]. 電子測(cè)量技術(shù), 2018, 41(24): 94-98.
[3]朱克佳, 郝慶華, 李世勇,等. 車牌識(shí)別綜述[J]. 現(xiàn)代信息科技, 2018, 2(05): 4-6.
[4]王文章. 基于邊緣點(diǎn)檢測(cè)的車牌定位技術(shù)的研究[D]. 上海:上海師范大學(xué), 2016.
[5]田原嫄, 郭海濤, 劉思陽. 基于HSV色彩空間同態(tài)濾波的行進(jìn)中車牌定位研究[J]. 拖拉機(jī)與農(nóng)用運(yùn)輸車, 2016, 43(01):24-26.
[6]岳兆新,曾黃麟. 一種改進(jìn)的基于邊緣特征提取BP網(wǎng)絡(luò)車牌定位的新方法[J].計(jì)算機(jī)應(yīng)用與軟件, 2011, 28(12): 86-87.
[7]瞿國(guó)慶, 李汪佩. 渣土車車牌字符智能識(shí)別研究[J]. 電子測(cè)量與儀器學(xué)報(bào), 2016, 30(12):1853 -1860.
[8]柴偉佳, 王連明. 一種基于混合神經(jīng)網(wǎng)絡(luò)的車牌字符識(shí)別方法[J]. 東北師大學(xué)報(bào)(自然科學(xué)版), 2018, 50(01): 63-67.
[9]何婕. SVM及其在車牌字符識(shí)別中的運(yùn)用[D]. 成都:四川大學(xué), 2005.
[10]馬杰, 蔡延光. 基于改進(jìn)SVM方法的車牌識(shí)別研究[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版), 2012(14): 23-27.
[11]高聰, 王福龍. 局部HOG和分層LBP特征融合的車牌字符識(shí)別[J].計(jì)算機(jī)系統(tǒng)應(yīng)用, 2017, 26(04): 116-123.
[12]鄭奇. 支持向量機(jī)SMO算法的改進(jìn)研究[D]. 濟(jì)南:山東師范大學(xué), 2017.
[13]殷羽, 鄭宏, 高婷婷,等. 基于聯(lián)合HOG特征的車牌識(shí)別算法[J].計(jì)算機(jī)工程與設(shè)計(jì), 2015, 36(02): 476-481.
[14]魯揚(yáng). 基于BP神經(jīng)網(wǎng)絡(luò)的車牌識(shí)別算法研究[D]. 大慶:東北石油大學(xué), 2018.
[15]陳晨. 智能交通系統(tǒng)中車牌識(shí)別的關(guān)鍵技術(shù)研究[D]. ?南京:南京理工大學(xué), 2014.
[16]李少波, 趙輝, 張成龍,等. 果蠅優(yōu)化算法研究綜述[J]. 科學(xué)技術(shù)與工程, 2018, 18(01): 163-171.
(責(zé)任編輯:于慧梅)
Study on License Plate Recognition Approach Based on Particle Swarm Optimization
YANG Changxi, ZHU Hongzhang*
(College of Big Data and Information Engineering, Guizhou University, ?Guiyang 550025, China)
Abstract:
This work, based on particle swarm optimization designs a license plate recognition algorithm. License plates’ character segmentation and feature extraction are executed in terms of the methods of vertical projection, adaptive threshold, directional gradient histogram and so forth. A character recognition accuracy model is developed by means of a character feature vector sample and support vector machine, solved by a novel license plate recognition algorithm. Numerically comparative experiments show that the approach can effectively enhance the accuracy of license plate recognition while license plate recognition’ effect depends greatly on character features.
Key words:
license plate recognition; directional gradient histogram; support vector machine; particle swarm optimization