脫機手寫數(shù)字識別技術(shù)研究

2017-04-27 11:41張玉葉王尚強王淑娟王春歆

電腦知識與技術(shù) 2016年29期

張玉葉　王尚強　王淑娟　王春歆

摘要：針對目前常見的脫機手寫數(shù)字識別技術(shù)進行分析比較，并模擬人工智能識別字符的過程，提出一種分層識別方法。對于結(jié)構(gòu)差異較大的數(shù)字字符，根據(jù)數(shù)字字符圖像的統(tǒng)計特征進行粗略識別；然后進一步利用結(jié)構(gòu)特征細致區(qū)分形狀相近的數(shù)字字符。通過自制樣本庫進行識別測試，結(jié)果表明該方法能夠有效提高識別準確率。

關(guān)鍵詞：脫機手寫數(shù)字識別；統(tǒng)計特征；結(jié)構(gòu)特征

中圖分類號：TP391.41 文獻標識碼：A 文章編號：1009-3044（2016）29-0195-03

脫機手寫數(shù)字識別，就是利用數(shù)字化設(shè)備將紙質(zhì)或其他介質(zhì)上手寫的數(shù)字字符掃描為數(shù)字圖像信息，然后利用計算機進行一系列的數(shù)字圖像處理步驟進行數(shù)字識別處理的技術(shù)。相對于目前比較成熟的聯(lián)機手寫字符識別，由于缺少聯(lián)機能夠獲取的字符筆順等重要信息，其技術(shù)實現(xiàn)難度要大。另外，脫機手寫數(shù)字識別在郵政、銀行、交易等領(lǐng)域應(yīng)用需求廣泛，所以是近年來圖像處理領(lǐng)域研究的熱點。

本文在分析目前常見的脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上，提出一種分層次的識別方法。該方法模擬人類識別字符的一般規(guī)律，首先抽取數(shù)字字符樣本的統(tǒng)計特征，通過對主分量重建模型的誤差分析進行字符的粗略識別；然后加入寬高比結(jié)構(gòu)特征進行字符比對，進行第二層次的細致識別。

1常見的脫機手寫數(shù)字識別技術(shù)

脫機手寫數(shù)字識別最重要的環(huán)節(jié)是字符的特征提取，根據(jù)采用的特征提取方法的不同，可以將目前常見的脫機手寫數(shù)字識別大致分為兩類：基于統(tǒng)計特征和基于結(jié)構(gòu)特征的方法。

基于統(tǒng)計特征的識別方法主要有兩個過程：分類器學習訓練過程和利用分類器識別過程。學習訓練是將獲取的樣本信息經(jīng)過預處理和特征提取之后給分類器學習，以此為識別的基礎(chǔ)，讓分類器獲得識別的能力。識別過程將待識別的信息經(jīng)過同樣的預處理與特征提取后讓分類器分類識別。統(tǒng)計方法的優(yōu)點是能較好地描述一類模式的本質(zhì)特征，對干擾信息不敏感，對與訓練樣本一致的信息識別正確率很高，缺點是對一些不穩(wěn)定的字符形態(tài)容易誤判。所以該方法類似于人類識別字符的粗略宏觀過程。

基于結(jié)構(gòu)特征的方法是分析字符筆畫的構(gòu)造如圈、端點、交叉點、輪廓等識別特征，結(jié)合字符間互斥的特征進行識別。方法能夠精確地描述字符的細節(jié)特征，比較直觀，對字符圖像畸變的抗干擾能力較強，可靠性較高；缺點對噪聲、斷線等干擾較敏感，另外字符骨架提取等過程實現(xiàn)復雜度高。該類方法類似于人類識別字符的細致區(qū)分過程。

由于不同人的書寫習慣和書寫風格不同，使手寫數(shù)字字符的形態(tài)極不穩(wěn)定。根據(jù)人工智能識別字符的規(guī)律，可以將兩類方法結(jié)合起來，分層進行識別，從而克服各自的不足，提高字符識別的準確度。

2脫機手寫數(shù)字的分層識別方法

脫機手寫數(shù)字識別，首要任務(wù)就是利用掃描設(shè)備將紙質(zhì)載體掃描為圖像信息以便計算機處理。得到的數(shù)字圖像在進行識別之前需要進行圖像的預處理，以消除圖像中無關(guān)的信息，增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù)，從而改進特征抽取、圖像分割、匹配和識別的可靠性。預處理過程一般有幾何變換、平滑、復原和增強、提取邊緣、細化等步驟。這些圖像預處理技術(shù)比較成熟，可以直接應(yīng)用。

2.1主分量分析法提取統(tǒng)計特征及識別

3.1主分量分析法識別數(shù)字實驗

步驟一：學習階段

利用主分量分析法對0到9十個數(shù)字的訓練樣本提取統(tǒng)計特征，得到0到9十個模式類的前d個主分量重建得到的數(shù)字模型。以數(shù)字“6”為例，給出前d個主分量的重建模型圖如圖l所示，主分量個數(shù)d分別取3、5、7、10。從圖中可以看出d越大，模型圖像中包含的信息越多。

圖1樣本“6”前d個主分量的重建模型圖

步驟二：識別階段

將測試樣本分別在各模式的特征空間估計對應(yīng)于各模式的重建模型，再與各模式的重建模型相減得到重建誤差，比較誤差大小，誤差越小，與對應(yīng)的數(shù)字模式類越相似。

任意給出測試樣本中經(jīng)過預處理的0-9十個數(shù)字的圖像如圖2所示。

0-9十個手寫數(shù)字字符（下表中用“”中的數(shù)字代表），在數(shù)字6的特征空間，分別構(gòu)建的重建模型圖像如圖3所示：

根據(jù)公式（2），對任意選取的這十個數(shù)（測試樣本）的重建模型與訓練樣本的重建模型相減求模，得到模型誤差值進行識別。

這里，我們只針對“6”的樣本集進行分析。當d=10的時候，任意十個數(shù)的測試樣本與“6”樣本集的重建模型相減，得到如圖4中所示的十個誤差圖像。

對圖4中圖像求模得到誤差值，誤差值越小，說明測試樣本數(shù)字的形態(tài)與數(shù)字“6”越相似。發(fā)現(xiàn)測試樣本數(shù)字“6”的重建模型誤差值最低，說明本方法是合理的。

其次誤差值最小的是“4”，然后是“5”，其余的數(shù)字的誤差較大。究其原因，我們分析表2中測試樣本的圖像不難發(fā)現(xiàn)，書寫的數(shù)字4和5有與數(shù)字6最相近的筆畫弧度部分。

步驟三：分析結(jié)果

100個測試樣本經(jīng)過主分量分析識別，得到的實驗結(jié)果如表1所示：

表1中反映出，各數(shù)字字符的識別率也不同，其中以取7個主分量時得到的實驗結(jié)果為例，發(fā)現(xiàn)，數(shù)字“1”的識別率最低（η=70%），其次是數(shù)字“7”“9”（η=80%）。分析其中的原因，主要是因為字符“1”的筆畫過于簡單，只有一豎，因此它筆畫結(jié)構(gòu)的特征不明顯，通過PCA能夠提取的結(jié)構(gòu)特征也就很有限。而“7”和“1”、“9”兩個數(shù)字結(jié)構(gòu)特征類似，也導致它的識別率比較低。為此，加入字符的寬高比結(jié)構(gòu)特征進行識別。

3.2結(jié)合寬高比結(jié)構(gòu)特征識別實驗

針對統(tǒng)計法識別數(shù)字出現(xiàn)的問題，提取寬高比特征進行數(shù)字識別，得到結(jié)果如表2。

發(fā)現(xiàn)數(shù)字識別率由91%提高到了96%，其中數(shù)字“1”被全數(shù)識別，原因在于它的高寬比特征最顯著?！?”和“9”識別率也顯著提高，這是因為其結(jié)構(gòu)特征與“1”區(qū)別開來，另外，結(jié)構(gòu)特征使“9”與“6”區(qū)別更顯著了。

4結(jié)論

本文在分析現(xiàn)有脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上，根據(jù)人工智能識別字符的規(guī)律，結(jié)合統(tǒng)計特征和結(jié)構(gòu)特征設(shè)計了分層識別步驟。自制訓練樣本及測試樣本庫，利用Matlab軟件進行識別實驗，分析實驗結(jié)果發(fā)現(xiàn)本方法能夠在一定程度上提高數(shù)字識別率，但是未對算法實時性作出要求，要形成工程實用的算法，還需要進一步的研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

脫機手寫數(shù)字識別技術(shù)研究