張潔 方厚加
摘要:本文主要探討車牌識別過程中圖像處理技術的應用,主要包括圖像預處理中灰度化處理、二值化處理、直方圖處理以及濾波。車牌檢測中的常用算子,如prewitt算子,roberts算子,sober算子和拉普拉斯算子。最后給出車牌字符分割與識別的步驟和結果。
關鍵詞: 灰度化; 濾波; 邊緣檢測; 圖像分割; 字符識別
中圖分類號:TP391 文獻標識碼:A 文章編號:2095-2163(2016)01-
Abstract:This paper discusses the application of license plate recognition during image processing technology,including image preprocessing gray processing, binarization processing, histogram processing and filtering. After that, the paper presents commonly used operators of license plate detection, such as prewitt operator, roberts operator, sober operator and Laplacian. Finally, the paper puts forwardsteps and results of character segmentation and recognition .
keywords:Grayscale; Filtering; Edge Detection; Image Segmentation, Character Recognition
作者簡介:張潔,碩士,講師,主要研究方向:數(shù)據(jù)挖掘 人工智能。
0 引言
當今汽車行業(yè)正呈現(xiàn)迅猛增長勢頭。隨之而來地,諸多的汽車管理領域也逐漸獲得了發(fā)展重視,同時研究者們則開始更多地關注于高速公路、停車場出入口監(jiān)管,公共安全監(jiān)控和犯罪分子追蹤等現(xiàn)實攸關的重點方向領域內容。在此背景下,自動化識別即已日益突顯其在該應用領域內容研發(fā)處理中的關鍵重要地位。而與之對應的主流分支、即車牌識別研究中,在經(jīng)過多方系統(tǒng)論證后可知,圖像的處理與分析則是其達到最終目標的關鍵決定性環(huán)節(jié)。具體來說,由于在不同場合,受光線、天氣、距離、拍攝角度等多種因素影響,拍攝得到的車牌效果差別很大,因此,就需要將多種圖像處理和分析技術,例如將直方圖均衡化、灰度化、圖像邊緣檢測技術、圖像分割技術、字符識別技術等技術相結合以實現(xiàn)最佳圖像處理效果。本文即對此一內容展開研究論述,主要給出了車牌識別技術的原理和完整實現(xiàn)過程。
1 車牌圖像的預處理
車牌原始圖像通常受光線、天氣、車牌污損、拍攝角度等原因造成圖像畫面底質不佳,因此在車牌識別前,則需要對車牌進行預處理,使得處理后的圖像便于識別。在預處理技術中,主要使用的有灰度化處理、二值化處理、直方圖處理、濾波等。
1.1 圖像灰度化處理
未處理車牌圖像多會帶有顏色,而彩色圖像包涵信息容量較大,因而不易處理。在車牌識別中,具體設定任務是識別車牌號碼,所以色彩一般來說并不重要。故而通常先將彩色圖像轉換成灰度圖像。圖1展示了一幅未處理車牌圖像轉換為灰度圖像的效果對比。
1.2 二值化處理
二值化處理是將圖像由彩色或灰度圖像轉換為黑白二值圖像的過程。二值化處理后,圖像只有黑白兩個色度的圖像,使圖像的對比度明顯提高,易于辨認識別。但其缺點是丟失圖像的大量細節(jié)。圖2是未處理彩色圖像轉化為二值圖像的效果呈現(xiàn),圖3是將灰度圖像轉化為二值圖像的效果展示。
由上圖可知,在二值化過程中,由于車牌藍底、白字的對比度并不清晰,使得在二值化過程中可能會造成邊緣不易分辨,而灰度圖像的二值化效果卻更顯優(yōu)勢,因此研究將在灰度圖像的基礎上進行二值化圖像的處理。
1.3 直方圖處理
直方圖是灰度圖各像素灰度分布的圖表。可以由直方圖有效推理而得到圖像的灰度構成及分布。反過來,通過人為將直方圖均衡化或者匹配化往往可以取得很好的處理效果。圖4中(a)為原始圖像的灰度圖像,(b)為其直方圖,從直方圖中可以看出,直方圖整體呈現(xiàn)偏左,且密集,代表圖像灰暗部分多,明亮部分少?;谥狈綀D的理論分析,如果直方圖發(fā)生了偏左,表明圖像偏暗;若出現(xiàn)了偏右,表明圖像太亮;而若集中于中段,明亮度適合,但對比度稍差。綜上可知,如果想得到亮度適中、對比度良好的直方圖,即應使得直方圖分布均勻。相迎地,圖4中(c)和(d)就是直方圖均衡化后的效果圖像,整個圖像的亮度明顯提高。
1.4 濾波
車牌圖像在拍攝過程中,容易受到自然因素、濕度、泥污殘留等各種因素的干擾,因此拍出的圖片經(jīng)常出現(xiàn)各種噪聲。因為噪聲產(chǎn)生的原因復雜、形式多樣,在圖像處理領域已經(jīng)設計各種手段以降低或消除噪聲。通常采用方法就是濾波,借助其來消除圖像噪聲,即通過對圖像區(qū)域進行轉換,再替代未處理的圖像。當下比較成熟的濾波技術有均值濾波、中值濾波等。
具體來說,均值濾波的實現(xiàn)過程是將中心在(x,y)點,尺寸為m*n的矩形子圖像窗口進行計算,求得被噪聲污染圖像g(x,y)的平均值;而中值濾波則是屬于統(tǒng)計排序的濾波器,并將結果中相鄰像素的灰度中值來代替原像素值。
2圖像邊緣檢測
車牌圖像的識別通常僅需要識別車牌區(qū)域即可,如何在整張圖片中提取獲得車牌區(qū)域,此時就要用到圖像分割。時下流行的方法是邊緣檢測,因為車牌邊緣與背景圖像之間往往存在較大的亮度差,基于此將可以采用一定的算法提取出所需圖像邊緣部分的信息。常見的邊緣檢測算子有prewitt算子、roberts算子、sober算子和拉普拉斯算子[1]。
目前,車牌字符識別的主要算法分別有如下兩種:基于模板匹配的算法及基于人工神經(jīng)網(wǎng)絡的算法。在此,可對其分述如下。
首先,基于模板匹配的實現(xiàn)過程可概述為:對被識別的字符進行二值化處理,再將字符尺寸縮放成字符數(shù)據(jù)庫中模板的尺寸進行匹配,由此選取最佳的匹配作為識別結果。
其次,基于人工神經(jīng)網(wǎng)絡的字符識別有兩種技術實現(xiàn)方式:其一是先對被識別字符提取特征,再用所獲得的特征集來訓練神經(jīng)網(wǎng)絡分類器,最后進行匹配。其二是直接利用神經(jīng)網(wǎng)絡將被識別的圖像輸入網(wǎng)絡,由網(wǎng)絡自動實現(xiàn)特征提取直至識別[3]。
模板匹配法實現(xiàn)上更為簡單,并且車牌的字符也比較規(guī)則,因此對字符圖像的缺損、污跡等干擾的適應力較強且識別率較高。而神經(jīng)網(wǎng)絡法算法識別效果卻與字符特征提取密切相關,字符特征提取將消耗較大的資源。故而研究選用模板匹配法作為車牌字符識別的主要方法。
模板匹配的實施步驟如圖8所示。
由圖8了自己哦搭配,模板匹配的實現(xiàn)過程是將從被識別車牌的圖像區(qū)域f(i,j)中提取的若干特征量與模板T(i,j)相應的特征量進行逐項比對,計算二者間規(guī)格化的互相關量,互相關量最大的則表示二者相似程度最高,可將被識別的圖像歸于其所屬分類。也可以用最小距離法判定所屬類,即通過計算圖像與模板特征量之間的距離來給出判定,距離最小的就表示二者最接近。然而,由于成像條件存在差異,會產(chǎn)生有較大的噪聲干擾,或未處理的圖像經(jīng)預處理和規(guī)格化處理后,可能使得圖像的灰度或像素點的位置發(fā)生改變,故而在實際構建模板時,應當注意考慮各類似區(qū)域之間差別,及容易由處理過程引起的噪聲和位移等因素,再基于圖像不變特性來進行優(yōu)良設計,就可以有效解決上述問題[2-4]。
本文采用相減的方法來求得字符與模板中哪一個字符最相似,由此找到相似度最大的輸出。我國汽車牌照標準統(tǒng)一,少量特殊車輛不一致,字符一般為七個,車牌第一位規(guī)定是漢字,代表車輛所屬省份;其后為字母或數(shù)字組合。車牌字符識別由于字符數(shù)有限(漢字共約50多個,大寫英文字母26個,數(shù)字10個),就使得建立字符模板庫比較方便。
4 結束語
本文對車牌識別過程中涉及到的關鍵圖像處理技術進行研究,從前期的圖像預處理,到圖像的定位與檢測,到最終的字符識別進行了詳細的介紹。車牌圖像因為受光線、天氣、泥污、拍攝角度等多方面影響,造成原始圖像差異很大,圖像噪聲嚴重。另外,車牌圖像具有藍底白字(少量其他特殊車輛具有其他顏色)等通用特征,決定了在車牌分割中必將具有一定的規(guī)范性。因此,通過圖像的前期處理和圖像分割的方法,可以將車牌字符定位出來。且車牌字符具有不連貫性,為字符識別帶來方便。本文給出了車牌圖像識別常用技術和方法,并通過Matlab實現(xiàn),為車牌識別領域的研究提供一定的幫助和借鑒。
參考文獻
[1]劉超. 實時無縫全景圖像拼接技術研究與實現(xiàn)[D].長沙:中南大學,2011.
[2]王立強. 車牌自動識別技術的算法與實踐[J].廊坊師范學院學報(自然科學版),2010,10(4):39~41.
[3]甘英??;胡天翔;沈海濤;陳睿. 基于機器視覺的汽車牌照識別[J]. 機械制造與自動化,2009(2):97-101.
[4] 董然. 基于J2ME的車牌識別系統(tǒng)的研究[D].太原:太原理工大學,2010
[5]林蘇映.基于計算機視覺的人臉跟蹤[D]. 杭州:浙江大學,2010..