張?chǎng)?李浩進(jìn)
摘 要:本文主要介紹字符識(shí)別的基本原理,并且利用MATLAB工具軟件實(shí)現(xiàn)圖片中字符的分割和識(shí)別,對(duì)于滿足一定要求的圖片可以實(shí)現(xiàn)字符的分割與識(shí)別 ,通過(guò)圖像讀取,圖像預(yù)處理,圖像投影,字符分割,字符識(shí)別五個(gè)步驟實(shí)現(xiàn).
關(guān)鍵詞:圖像預(yù)處理;字符分割;字符識(shí)別
Abstract:this paper mainly introduces the basic principle of character recognition, and using MATLAB tool software to realize the image segmentation and recognition of the characters, pictures to meet certain requirements to achieve character segmentation and recognition, image reading, image preprocessing, image projection, character segmentation and character recognition five steps.
Keywords:Image preprocessing;Character segmentation;Character recognition
0.引言
近年來(lái),字符分割和識(shí)別的技術(shù)發(fā)展,其中最廣泛的應(yīng)用是停車(chē)場(chǎng)出入口車(chē)輛牌照的識(shí)別結(jié)合計(jì)算系統(tǒng)自動(dòng)確定車(chē)輛在停車(chē)場(chǎng)中停留的時(shí)間,付費(fèi)金額.大大提高了停車(chē)場(chǎng)的運(yùn)行效率和信息的準(zhǔn)確性.以及在公路上實(shí)現(xiàn)取證拍照,監(jiān)控道路違規(guī)行為,已經(jīng)發(fā)展成為智能交通中不可或缺的一部分, 通過(guò)引入數(shù)字?jǐn)z像技術(shù)和計(jì)算機(jī)信息管理技術(shù),采用先進(jìn)的圖像處理 模式識(shí)別和人工智能技術(shù),通過(guò)對(duì)圖像的采集和處理,獲得更多的信息,從而達(dá)到更高的智能化管理程度。
1.字符識(shí)別原理
目前用于字符識(shí)別(OCR)中的算法主要有基于模板匹配的OCR算法以及基于人工神經(jīng)網(wǎng)絡(luò)的OCR算法。
1.1 基于模板匹配的OCR的基本過(guò)程是:首先對(duì)待識(shí)別字符進(jìn)行二值化并將其尺寸大小縮放為字符數(shù)據(jù)庫(kù)中模板的大小,然后與字符庫(kù)中的所有的模板進(jìn)行匹配,選最佳匹配作為識(shí)別結(jié)果。
1.2用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行字符識(shí)別主要有兩種方法:一種方法是先對(duì)待識(shí)別字符進(jìn)行特征提取,然后用所獲得的特征來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類器。識(shí)別效果與字符特征的提取有關(guān),而字符特征提取往往比較耗時(shí)。字符特征的提取主要方法是充分利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn),直接把待處理圖像輸入網(wǎng)絡(luò),由網(wǎng)絡(luò)自動(dòng)實(shí)現(xiàn)特征提取直至識(shí)別。本文主要研究基于模版匹 配的字符識(shí)別技術(shù)。
2.字符識(shí)別流程
2.1圖像預(yù)處理
在讀取到圖像后進(jìn)行灰度化,二值化,對(duì)比度增強(qiáng),腐蝕,膨脹,濾波等處理增強(qiáng)圖象。
2.2字符分割和識(shí)別
由于灰度圖像只有0和1兩種取值,先進(jìn)行像素點(diǎn)的差分運(yùn)算,尋找突變位置,截取第一行字符,再截取后面各行字符拼接到第一行字符上,橫向連接圖像塊,以第一行字符為基準(zhǔn),對(duì)其余的字符進(jìn)行歸一化大小,進(jìn)而和字符模版庫(kù)中的字符大小相匹配。
3.效果圖
4.結(jié)語(yǔ)
利用MATLAB軟件,對(duì)圖片中文字進(jìn)行識(shí)別,為了提升檢測(cè)結(jié)果的準(zhǔn)確率,通過(guò)大量的數(shù)據(jù)進(jìn)行試驗(yàn),并且對(duì)出現(xiàn)的錯(cuò)誤檢測(cè)分析圖片中字符的結(jié)構(gòu),進(jìn)行代碼優(yōu)化,單一背景的圖片背景的處理過(guò)程簡(jiǎn)單,僅僅需要圖片灰度化處理,二值化處理,然后進(jìn)行水平方向上整行文字的分割,再進(jìn)行垂直方向上的分割,特殊字體上下結(jié)構(gòu),左右結(jié)構(gòu),左中右結(jié)構(gòu),上 中下結(jié)構(gòu)如“非”,“船”,“品”通過(guò)正向延拓尋找小于 3 的點(diǎn),再反向延拓尋找小于 3 的點(diǎn),可以實(shí)現(xiàn)該類字體的切割。但是沒(méi)有加入對(duì)斜體字的矯正,因此對(duì)于該類字體的檢測(cè)結(jié)果錯(cuò)誤率比較高。
參考文獻(xiàn)
[1]朱小燕,史一凡,馬少平.手寫(xiě)體字符識(shí)別研究[J].模式識(shí)別與人工智能.2000.
[2]張圻中.漢字識(shí)別技術(shù)[M].北京:清華大學(xué)出版社,1992.
[3]王 勇,吳立德.圖像恢復(fù)和邊緣提取的后驗(yàn)均值方法.電子學(xué)報(bào),1994,22(2):70-75.
[4]阮秋琦.數(shù)字圖像處理學(xué).北京:電子工業(yè)出版社,2001.317-320.
[5]T, Kasar, Font and Background Color Independent Text Binarization. ICDAR 2005.