史 燕 呂永戰(zhàn) 張 帆
摘 要:根據(jù)車牌幾何形狀和紋理的特點(diǎn),提出了基于圖像的特征線確定二值化閾值的方法。為了解決車牌圖像傾斜對字符分割與識(shí)別帶來的不良影響,對一種基于字符間投影距離的傾斜校正方法做了研究。在該方法中,根據(jù)傾斜車牌與非傾斜車牌字符的投影距離大小比較來確定車牌圖像的傾斜角度,再用基于雙線性插值的旋轉(zhuǎn)方法進(jìn)行矯正。針對該方法的不足之處,提出了該算法的改進(jìn)算法。試驗(yàn)結(jié)果表明,該算法是快速而有效的。
關(guān)鍵詞:車牌識(shí)別;特征線;二值化;投影間距;傾斜校正
中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1004-373X(2009)05-149-04
Binary Conversion and Slant Correction Algorithm in Preprocessing of
License Plate Recognition
SHI Yan,LV Yongzhan,ZHANG Fan
(China Airborne Missile Academy,Luoyang,471009,China)
Abstract:According to plate shape and char texture,an algorithm applied to license plate binary conversion of vehicle image based on feature line is introduced.In order to resolve the difficulties in character segmentation and adverse impact to the final recognition rate,a new method is presented based on characters vertical projection distance.The method first analyses the change of distance between two characters which comes from the vertical projection towards lean image and horizontal image,the lean angle of image is found out,and then,a horizontal image is gained by the rotation based on bilinear interpolation.Considering the defects of this method,an optimum algorithm is introduced.Experimental results are provided to demonstrate the performance of the proposed algorithm.
Keywords:license plate recognition;feature line;binary conversion;vertical projection distance;slant correction
0 引 言
車牌識(shí)別技術(shù)(License Plate Recognition,LPR)是計(jì)算機(jī)視覺與模式識(shí)別技術(shù)在智能交通領(lǐng)域應(yīng)用的重要研究課題,是實(shí)現(xiàn)交通管理智能化的重要環(huán)節(jié)。車牌自動(dòng)識(shí)別系統(tǒng)是對經(jīng)攝像頭拍攝的圖片利用圖像處理的分析方法,提取出車牌區(qū)域,進(jìn)而對車牌區(qū)域進(jìn)行字符分割和識(shí)別。車牌圖像的傾斜校正是車牌定位和字符分割間的一個(gè)重要處理過程。在圖像采集系統(tǒng)中,由于拍攝條件的多樣性和實(shí)際情況的差異性,采集到的圖像質(zhì)量差別很大,難免會(huì)造成了圖像的傾斜,這種傾斜會(huì)給字符分割帶來困難,進(jìn)而影響到字符識(shí)別的準(zhǔn)確率。因此為確保系統(tǒng)的識(shí)別率,有必要在字符分割前對圖像進(jìn)行傾斜校正。
目前,針對機(jī)動(dòng)車牌圖像進(jìn)行校正的研究已經(jīng)取得了一定的成果,比如Hough變換法和旋轉(zhuǎn)投影法。Hough變換法是先采用輪廓跟蹤的方法去除牌照圖像中和校正無關(guān)的所有冗余信息,然后對圖像進(jìn)行Hough變換檢測出邊框直線的傾斜角度,最后對圖像進(jìn)行旋轉(zhuǎn)校正。此方法對于圖像中車牌的邊框受噪聲,污跡等干擾影響較大,又或者由于二值化等原因造成粘連和斷裂現(xiàn)象的車牌圖像校正效果并不理想。通過旋轉(zhuǎn)車牌圖像在坐標(biāo)軸上的投影求取傾斜角度是一種抗干擾能力較強(qiáng)的方法。但是該方法中的最佳傾斜角的求取是一個(gè)尋優(yōu)過程,要進(jìn)行多次投影逐步搜尋最佳傾斜角,計(jì)算復(fù)雜度高。
由于字符是車牌圖像中最為明顯的特征,因此本文把基于字符間的垂直投影距離比較的方法引入圖像傾斜校正中,并且提出了該算法的改進(jìn)算法。該方法不僅避免了Hough變換法對圖像邊框的特殊要求,而且減少了Hough變換法和旋轉(zhuǎn)投影法的計(jì)算量。實(shí)驗(yàn)表明,該算法是快速而有效的。
1 車牌圖像的預(yù)處理
1.1 圖像的二值化
二值化算法又稱為閾值算法,其目的就是找出一個(gè)合適的閾值,將待研究的區(qū)域劃分為前景和背景兩部分。本文中將字符像素稱為目標(biāo)像素,將非字符像素稱為背景像素。針對灰度圖像,其二值化過程用公式表示為:
B(i,j)=1,if G(i,j)≥T
0,else
(1)
式中:T為閾值,G(i,j)表示坐標(biāo)值為(i,j)像素點(diǎn)的灰度值。
圖像的二值化關(guān)鍵是閾值的選取。常用的閾值法分為全局閾值法和局部閾值法。全局閾值法是指在二值化過程中只使用一個(gè)閾值T的方法,從整個(gè)灰度圖像的像素分布出發(fā)尋找一個(gè)最佳的門限值。局部閾值法具體就是首先將圖像分解為一系列子圖像,然后對每一個(gè)子圖像計(jì)算一個(gè)閾值,通過對這些子圖像所得的閾值的插值即可得到對整幅圖像目標(biāo)和背景進(jìn)行分割所需的閾值。全局閾值法優(yōu)點(diǎn)在于算法簡單,但對輸入圖像存在量化噪聲或在不均勻光照等情況下抵抗能力差。局部閾值法相對來說可以獲得較好效果,但存在實(shí)現(xiàn)速度慢、不能保證圖像連通性、以及容易出現(xiàn)偽影現(xiàn)象(即在背景區(qū)域受噪聲干擾得到圖像結(jié)果)等問題。
基于車牌圖像的幾何形狀和字符紋理的特點(diǎn),可以通過提取一條穿過車牌中所有字符的水平線作為特征線,統(tǒng)計(jì)該線上的像素點(diǎn)的灰度平均值作為閾值。圖1(a)和圖1(b)分別為整幅圖像的灰度統(tǒng)計(jì)直方圖和一條特征線上的灰度直方圖。通過對比可以看出,在特征線的統(tǒng)計(jì)直方圖中,目標(biāo)背景的雙峰分布相對平均,且波峰波谷值更為平穩(wěn),整幅圖像的灰度直方圖中波谷值的毛刺現(xiàn)象比較嚴(yán)重。因此可以利用該原理簡單的統(tǒng)計(jì)平均值方法來確定閾值進(jìn)行二值化。由于車牌圖像的傾斜,特征線有時(shí)不能確保穿過所有的字符,為了提高閾值的準(zhǔn)確性,可以取多根特征線求取平均值來減小誤差。
T=1n∑np=11N∑Nk=1G(J-N,k)
(2)
式中:T為閾值,M,N分別表示圖像的行數(shù)和列數(shù),G(J-N,k)表示該點(diǎn)的灰度值,n為特征線的數(shù)目,通常取J=M/2,圍繞J上下取3~5根特征線。其結(jié)果見圖1(d)。
可見基于特征線的二值化方法相對傳統(tǒng)的方法更簡單,運(yùn)算量小且易行可靠,其效果也很好,能夠滿足后繼處理的要求。
1.2 數(shù)學(xué)形態(tài)學(xué)處理
由于光照影響、攝像機(jī)曝光不足、車牌污損等客觀原因的干擾,使所獲得的圖像在二值化后會(huì)有一些缺損或模糊,在圖像進(jìn)行分割識(shí)別前需要進(jìn)行處理。數(shù)學(xué)形態(tài)學(xué)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成,利用形態(tài)學(xué)進(jìn)行圖像處理的基本思想是:兩個(gè)運(yùn)算對象都是集合,假設(shè)A為圖像集合,B為結(jié)構(gòu)元素,則兩個(gè)集合不是互相對等的,而是利用結(jié)構(gòu)元素B去探測圖像A,看能否將這個(gè)結(jié)構(gòu)元素很好地填放到圖像內(nèi)部,同時(shí)驗(yàn)證填放結(jié)構(gòu)元素的方法是否有效。數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算有四個(gè):膨脹(或擴(kuò)大dilation)、腐蝕(或侵蝕erosion)、開啟(open)和閉合(close)。由這四種基本運(yùn)算可以推導(dǎo)和組成各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法。用這些運(yùn)算子及其組合來進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理,包括圖像分割、特征抽取、邊界檢測、圖像濾波、圖像增強(qiáng)和恢復(fù)等方面的工作。
圖1 基于特征線的車牌圖像二值化
在對圖像進(jìn)行形態(tài)學(xué)處理時(shí),通過選擇適當(dāng)?shù)慕Y(jié)構(gòu)元素,開運(yùn)算具有平滑功能,能夠清除毛刺,切斷細(xì)長搭接而起到分離作用;閉合運(yùn)算具有過濾功能,可以填平缺口、孔洞和裂縫,搭接短的間斷而起到連通作用。在實(shí)際應(yīng)用中,對二值化后的圖像采用了開運(yùn)算,可以根據(jù)需求進(jìn)行多次重復(fù)運(yùn)算,運(yùn)算后圖像的位置和大小形狀不變。
2 車牌圖像的傾斜校正
2.1 基本原理及算法過程
通常圖像的旋轉(zhuǎn)是以圖像的中心為原點(diǎn),旋轉(zhuǎn)一定的角度,若要保持原有圖像的大小需要將轉(zhuǎn)出顯示區(qū)域的圖像截除。假設(shè)圖像圍繞坐標(biāo)軸原點(diǎn)旋轉(zhuǎn),旋轉(zhuǎn)前坐標(biāo)表示為:
x=rcos αy=rsin α
(3)
旋轉(zhuǎn)θ后其坐標(biāo)表示為:
x′=rcos(α-θ)
y′=rsin(α-θ)
(4)
對經(jīng)過預(yù)處理的車牌圖像,對其作垂直方向上的投影,對圖像上的任意一列白色像素的投影值,如果小于一個(gè)自然數(shù),則判斷該列屬于字符間的距離??梢詫γ恳涣械耐队爸刀寂c該自然數(shù)比較,即可計(jì)算出相鄰字符的間距。 圖2,圖3所示分別為無傾斜,有傾斜車牌圖像及垂直投影圖。通過比較分析可以發(fā)現(xiàn):對于沒有傾斜的車牌圖像,字符間的投影距離是最大的;而對于傾斜的車牌圖像,由于字符傾斜使得其投影寬度變大,導(dǎo)致字符間得距離變小。所以對于同一車牌的不同傾斜角度的圖像而言,用L1和L2表示兩個(gè)圖像的字符間的投影距離,如果L1>L2,那么圖像1的傾斜角度要比圖像2的傾斜角度小。
圖2 無傾斜車牌圖像及其投影
圖3 傾斜車牌圖像及其投影
在我國,最常見的標(biāo)準(zhǔn)的汽車牌照的長度和寬度是固定的,牌照上的字符個(gè)數(shù),單個(gè)字符的寬度、高度及字符間的間隔都是統(tǒng)一規(guī)定的。因此,對于同一系統(tǒng)采集到的車牌圖像中,雖然車牌的大小、位置不固定,但是牌照大小的變化比例是一定的。對于大量的無傾斜車牌圖像作歸一化處理后,進(jìn)行垂直投影,可以統(tǒng)計(jì)平均出一個(gè)字符間的距離作為待識(shí)別圖像中的最大字符間投影距離。
根據(jù)上述原理,可以給出圖像傾斜校正的算法過程:
(1) 計(jì)算二值圖像初始時(shí)字符間的投影距離L璳,k=0;
(2) 如果L璳-L<ε,結(jié)束;否則將圖像順時(shí)針旋轉(zhuǎn)θ角,計(jì)算旋轉(zhuǎn)后的圖像的字符間投影距離L璳+1;
(3) 如果L璳+1>L璳,k=k+1,θ=θ/2,則返回(2),否則繼續(xù)執(zhí)行(4);
(4) 將圖像逆時(shí)針旋轉(zhuǎn)θ角,計(jì)算旋轉(zhuǎn)后的圖像的字符間投影距離L璳+1,如果L璳-L<ε,結(jié)束;
(5) 如果L璳+1>L璳,k=k+1,θ=θ/2,則返回(4)。
其中:L為統(tǒng)計(jì)平均出的最大字符間投影距離,θ角為一個(gè)固定較小的角度,ε為一極小的正數(shù)。θ,ε都可以根據(jù)實(shí)際的要求來確定。
2.2 改進(jìn)算法
從上述的算法可以看出,需要對車牌圖像進(jìn)行多次的旋轉(zhuǎn)。圖像的旋轉(zhuǎn)過程實(shí)際是坐標(biāo)變換后進(jìn)行插值操作的過程。有插值操作就會(huì)有一定程度的失真,旋轉(zhuǎn)的次數(shù)越多,圖像的失真度越大,而且圖像旋轉(zhuǎn)時(shí)系統(tǒng)花銷較大,耗時(shí)較長。
通過對上述算法的分析,采用了坐標(biāo)軸旋轉(zhuǎn)的方法進(jìn)行改進(jìn)。該方法不直接旋轉(zhuǎn)圖像,而是旋轉(zhuǎn)坐標(biāo)軸θ角后再進(jìn)行車牌圖像在坐標(biāo)軸上的投影,然后計(jì)算字符間的投影距離,接下來作和上述算法同樣的處理,并記錄下所有旋轉(zhuǎn)角度的總和,最后對原圖旋轉(zhuǎn)一次即可校正角度。
如圖4所示,坐標(biāo)軸x逆時(shí)針旋轉(zhuǎn)θ角后為x′。此時(shí)圖像f(x,y)在x′上的投影通過下式計(jì)算:
Rθ(x′)=∫∞-∞f(x′cos θ-y′sin θ,x′sin θ-y′cos θ)dy′
(5)
其中:
x′y′=cos θsin θ
-sin θcos θxy。
采用改進(jìn)算法后,圖像只需旋轉(zhuǎn)一次就可以完成校正,在最大程度上降低了圖像的失真度,算法花費(fèi)的時(shí)間也明顯減少,為車牌字符的準(zhǔn)確分割和識(shí)別打下了良好的基礎(chǔ)。
圖4 坐標(biāo)軸旋轉(zhuǎn)及圖像投影
3 試驗(yàn)仿真
實(shí)驗(yàn)算法在Matlab 6.5平臺(tái)下實(shí)現(xiàn),所用的機(jī)器為賽揚(yáng)1.0 GHz,256 MB SDRAM配置。首
先對現(xiàn)場采集到的100多幅具有不同傾斜角度的車牌圖像進(jìn)行定位,然后對定位后的車牌圖像進(jìn)行圖像增強(qiáng),二值化,形態(tài)學(xué)運(yùn)算處理,歸一化后再按照上述算法進(jìn)行校正,均收到了良好的效果。如圖5所示。
對圖5所示的圖像,采用未改進(jìn)的算法校正的圖像整體比較模糊,失真程度比較嚴(yán)重,而采用改進(jìn)后的算法較之原圖像變化不大,失真情況得到很大的改善。
圖5 傾斜車牌圖像校正結(jié)果
4 結(jié) 語
本文給出了基于車牌圖像特征線的二值化閾值確定的方法和針對車牌圖像字符間的投影距離的傾斜校正改進(jìn)算法。無論從理論上還是試驗(yàn)結(jié)果,均表明該方法是行之有效的。與傳統(tǒng)的Hough變換法及投影法相
比較,該算法原理簡單,計(jì)算速度也得到一定程度的提高,為圖像的快速傾斜校正提供了一種新方法,新思路。但是該算法對于傾斜角度過大,受噪聲污染嚴(yán)重或畸變的車牌圖像的校正效果不明顯,有待進(jìn)一步的研究。
參考文獻(xiàn)
[1]龔聲蓉,劉純平,王強(qiáng).數(shù)字圖像處理與分析[M].北京:清華大學(xué)出版社,2006.
[2]張永宜.智能交通系統(tǒng)中多目標(biāo)檢測、識(shí)別有關(guān)問題的研究.西安:西北大學(xué),2006.
[3]萵挺,沈春林,張金林.車牌識(shí)別中傾斜牌照的快速矯正算法[J].計(jì)算機(jī)工程,2004(7):122-124.
[4]李文舉,梁德群.一種新的車牌傾斜校正方法[J].信息與控制,2004,33(2):231-235.
[5]Randen T,Husoy J H.Filtering for Texture Classification:A Comparative Study.IEEE Trans.on Pattern Analysis and Machine Intelligence,1999,21(4):291-310.
[6]張昆,顧國慶.二值圖像的一種傾斜調(diào)整算法[J].計(jì)算機(jī)與現(xiàn)代化,1999(2):24-27.
[7]路小波,包明,黃衛(wèi).基于投影的車牌傾斜檢測方法[J].交通運(yùn)輸工程與信息學(xué)報(bào),2004,2(4):10-15.
[8]李碩明,付仲良,彭彬惠.基于字符行特征的車牌傾斜矯正算法[J].江漢大學(xué)學(xué)報(bào):自然科學(xué)版,2006,34(1):35-37.
[9]楊俊,戚飛虎.一種基于形狀和紋理特征的車牌定位方法.計(jì)算機(jī)工程,2006,32(2):200-202.
作者簡介 史 燕 1977年出生,碩士研究生。主要研究方向?yàn)閳D像處理與模式識(shí)別。