張玉葉 王尚強 王淑娟 王春歆
摘要:針對目前常見的脫機手寫數(shù)字識別技術(shù)進行分析比較,并模擬人工智能識別字符的過程,提出一種分層識別方法。對于結(jié)構(gòu)差異較大的數(shù)字字符,根據(jù)數(shù)字字符圖像的統(tǒng)計特征進行粗略識別;然后進一步利用結(jié)構(gòu)特征細致區(qū)分形狀相近的數(shù)字字符。通過自制樣本庫進行識別測試,結(jié)果表明該方法能夠有效提高識別準確率。
關(guān)鍵詞:脫機手寫數(shù)字識別;統(tǒng)計特征;結(jié)構(gòu)特征
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1009-3044(2016)29-0195-03
脫機手寫數(shù)字識別,就是利用數(shù)字化設(shè)備將紙質(zhì)或其他介質(zhì)上手寫的數(shù)字字符掃描為數(shù)字圖像信息,然后利用計算機進行一系列的數(shù)字圖像處理步驟進行數(shù)字識別處理的技術(shù)。相對于目前比較成熟的聯(lián)機手寫字符識別,由于缺少聯(lián)機能夠獲取的字符筆順等重要信息,其技術(shù)實現(xiàn)難度要大。另外,脫機手寫數(shù)字識別在郵政、銀行、交易等領(lǐng)域應(yīng)用需求廣泛,所以是近年來圖像處理領(lǐng)域研究的熱點。
本文在分析目前常見的脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上,提出一種分層次的識別方法。該方法模擬人類識別字符的一般規(guī)律,首先抽取數(shù)字字符樣本的統(tǒng)計特征,通過對主分量重建模型的誤差分析進行字符的粗略識別;然后加入寬高比結(jié)構(gòu)特征進行字符比對,進行第二層次的細致識別。
1常見的脫機手寫數(shù)字識別技術(shù)
脫機手寫數(shù)字識別最重要的環(huán)節(jié)是字符的特征提取,根據(jù)采用的特征提取方法的不同,可以將目前常見的脫機手寫數(shù)字識別大致分為兩類:基于統(tǒng)計特征和基于結(jié)構(gòu)特征的方法。
基于統(tǒng)計特征的識別方法主要有兩個過程:分類器學習訓練過程和利用分類器識別過程。學習訓練是將獲取的樣本信息經(jīng)過預處理和特征提取之后給分類器學習,以此為識別的基礎(chǔ),讓分類器獲得識別的能力。識別過程將待識別的信息經(jīng)過同樣的預處理與特征提取后讓分類器分類識別。統(tǒng)計方法的優(yōu)點是能較好地描述一類模式的本質(zhì)特征,對干擾信息不敏感,對與訓練樣本一致的信息識別正確率很高,缺點是對一些不穩(wěn)定的字符形態(tài)容易誤判。所以該方法類似于人類識別字符的粗略宏觀過程。
基于結(jié)構(gòu)特征的方法是分析字符筆畫的構(gòu)造如圈、端點、交叉點、輪廓等識別特征,結(jié)合字符間互斥的特征進行識別。方法能夠精確地描述字符的細節(jié)特征,比較直觀,對字符圖像畸變的抗干擾能力較強,可靠性較高;缺點對噪聲、斷線等干擾較敏感,另外字符骨架提取等過程實現(xiàn)復雜度高。該類方法類似于人類識別字符的細致區(qū)分過程。
由于不同人的書寫習慣和書寫風格不同,使手寫數(shù)字字符的形態(tài)極不穩(wěn)定。根據(jù)人工智能識別字符的規(guī)律,可以將兩類方法結(jié)合起來,分層進行識別,從而克服各自的不足,提高字符識別的準確度。
2脫機手寫數(shù)字的分層識別方法
脫機手寫數(shù)字識別,首要任務(wù)就是利用掃描設(shè)備將紙質(zhì)載體掃描為圖像信息以便計算機處理。得到的數(shù)字圖像在進行識別之前需要進行圖像的預處理,以消除圖像中無關(guān)的信息,增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù),從而改進特征抽取、圖像分割、匹配和識別的可靠性。預處理過程一般有幾何變換、平滑、復原和增強、提取邊緣、細化等步驟。這些圖像預處理技術(shù)比較成熟,可以直接應(yīng)用。
2.1主分量分析法提取統(tǒng)計特征及識別
3.1主分量分析法識別數(shù)字實驗
步驟一:學習階段
利用主分量分析法對0到9十個數(shù)字的訓練樣本提取統(tǒng)計特征,得到0到9十個模式類的前d個主分量重建得到的數(shù)字模型。以數(shù)字“6”為例,給出前d個主分量的重建模型圖如圖l所示,主分量個數(shù)d分別取3、5、7、10。從圖中可以看出d越大,模型圖像中包含的信息越多。
圖1樣本“6”前d個主分量的重建模型圖
步驟二:識別階段
將測試樣本分別在各模式的特征空間估計對應(yīng)于各模式的重建模型,再與各模式的重建模型相減得到重建誤差,比較誤差大小,誤差越小,與對應(yīng)的數(shù)字模式類越相似。
任意給出測試樣本中經(jīng)過預處理的0-9十個數(shù)字的圖像如圖2所示。
0-9十個手寫數(shù)字字符(下表中用“”中的數(shù)字代表),在數(shù)字6的特征空間,分別構(gòu)建的重建模型圖像如圖3所示:
根據(jù)公式(2),對任意選取的這十個數(shù)(測試樣本)的重建模型與訓練樣本的重建模型相減求模,得到模型誤差值進行識別。
這里,我們只針對“6”的樣本集進行分析。當d=10的時候,任意十個數(shù)的測試樣本與“6”樣本集的重建模型相減,得到如圖4中所示的十個誤差圖像。
對圖4中圖像求模得到誤差值,誤差值越小,說明測試樣本數(shù)字的形態(tài)與數(shù)字“6”越相似。發(fā)現(xiàn)測試樣本數(shù)字“6”的重建模型誤差值最低,說明本方法是合理的。
其次誤差值最小的是“4”,然后是“5”,其余的數(shù)字的誤差較大。究其原因,我們分析表2中測試樣本的圖像不難發(fā)現(xiàn),書寫的數(shù)字4和5有與數(shù)字6最相近的筆畫弧度部分。
步驟三:分析結(jié)果
100個測試樣本經(jīng)過主分量分析識別,得到的實驗結(jié)果如表1所示:
表1中反映出,各數(shù)字字符的識別率也不同,其中以取7個主分量時得到的實驗結(jié)果為例,發(fā)現(xiàn),數(shù)字“1”的識別率最低(η=70%),其次是數(shù)字“7”“9”(η=80%)。分析其中的原因,主要是因為字符“1”的筆畫過于簡單,只有一豎,因此它筆畫結(jié)構(gòu)的特征不明顯,通過PCA能夠提取的結(jié)構(gòu)特征也就很有限。而“7”和“1”、“9”兩個數(shù)字結(jié)構(gòu)特征類似,也導致它的識別率比較低。為此,加入字符的寬高比結(jié)構(gòu)特征進行識別。
3.2結(jié)合寬高比結(jié)構(gòu)特征識別實驗
針對統(tǒng)計法識別數(shù)字出現(xiàn)的問題,提取寬高比特征進行數(shù)字識別,得到結(jié)果如表2。
發(fā)現(xiàn)數(shù)字識別率由91%提高到了96%,其中數(shù)字“1”被全數(shù)識別,原因在于它的高寬比特征最顯著?!?”和“9”識別率也顯著提高,這是因為其結(jié)構(gòu)特征與“1”區(qū)別開來,另外,結(jié)構(gòu)特征使“9”與“6”區(qū)別更顯著了。
4結(jié)論
本文在分析現(xiàn)有脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上,根據(jù)人工智能識別字符的規(guī)律,結(jié)合統(tǒng)計特征和結(jié)構(gòu)特征設(shè)計了分層識別步驟。自制訓練樣本及測試樣本庫,利用Matlab軟件進行識別實驗,分析實驗結(jié)果發(fā)現(xiàn)本方法能夠在一定程度上提高數(shù)字識別率,但是未對算法實時性作出要求,要形成工程實用的算法,還需要進一步的研究。