国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

脫機手寫數(shù)字識別技術(shù)研究

2017-04-27 11:41張玉葉王尚強王淑娟王春歆
電腦知識與技術(shù) 2016年29期
關(guān)鍵詞:結(jié)構(gòu)特征

張玉葉 王尚強 王淑娟 王春歆

摘要:針對目前常見的脫機手寫數(shù)字識別技術(shù)進行分析比較,并模擬人工智能識別字符的過程,提出一種分層識別方法。對于結(jié)構(gòu)差異較大的數(shù)字字符,根據(jù)數(shù)字字符圖像的統(tǒng)計特征進行粗略識別;然后進一步利用結(jié)構(gòu)特征細致區(qū)分形狀相近的數(shù)字字符。通過自制樣本庫進行識別測試,結(jié)果表明該方法能夠有效提高識別準確率。

關(guān)鍵詞:脫機手寫數(shù)字識別;統(tǒng)計特征;結(jié)構(gòu)特征

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1009-3044(2016)29-0195-03

脫機手寫數(shù)字識別,就是利用數(shù)字化設(shè)備將紙質(zhì)或其他介質(zhì)上手寫的數(shù)字字符掃描為數(shù)字圖像信息,然后利用計算機進行一系列的數(shù)字圖像處理步驟進行數(shù)字識別處理的技術(shù)。相對于目前比較成熟的聯(lián)機手寫字符識別,由于缺少聯(lián)機能夠獲取的字符筆順等重要信息,其技術(shù)實現(xiàn)難度要大。另外,脫機手寫數(shù)字識別在郵政、銀行、交易等領(lǐng)域應(yīng)用需求廣泛,所以是近年來圖像處理領(lǐng)域研究的熱點。

本文在分析目前常見的脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上,提出一種分層次的識別方法。該方法模擬人類識別字符的一般規(guī)律,首先抽取數(shù)字字符樣本的統(tǒng)計特征,通過對主分量重建模型的誤差分析進行字符的粗略識別;然后加入寬高比結(jié)構(gòu)特征進行字符比對,進行第二層次的細致識別。

1常見的脫機手寫數(shù)字識別技術(shù)

脫機手寫數(shù)字識別最重要的環(huán)節(jié)是字符的特征提取,根據(jù)采用的特征提取方法的不同,可以將目前常見的脫機手寫數(shù)字識別大致分為兩類:基于統(tǒng)計特征和基于結(jié)構(gòu)特征的方法。

基于統(tǒng)計特征的識別方法主要有兩個過程:分類器學習訓練過程和利用分類器識別過程。學習訓練是將獲取的樣本信息經(jīng)過預處理和特征提取之后給分類器學習,以此為識別的基礎(chǔ),讓分類器獲得識別的能力。識別過程將待識別的信息經(jīng)過同樣的預處理與特征提取后讓分類器分類識別。統(tǒng)計方法的優(yōu)點是能較好地描述一類模式的本質(zhì)特征,對干擾信息不敏感,對與訓練樣本一致的信息識別正確率很高,缺點是對一些不穩(wěn)定的字符形態(tài)容易誤判。所以該方法類似于人類識別字符的粗略宏觀過程。

基于結(jié)構(gòu)特征的方法是分析字符筆畫的構(gòu)造如圈、端點、交叉點、輪廓等識別特征,結(jié)合字符間互斥的特征進行識別。方法能夠精確地描述字符的細節(jié)特征,比較直觀,對字符圖像畸變的抗干擾能力較強,可靠性較高;缺點對噪聲、斷線等干擾較敏感,另外字符骨架提取等過程實現(xiàn)復雜度高。該類方法類似于人類識別字符的細致區(qū)分過程。

由于不同人的書寫習慣和書寫風格不同,使手寫數(shù)字字符的形態(tài)極不穩(wěn)定。根據(jù)人工智能識別字符的規(guī)律,可以將兩類方法結(jié)合起來,分層進行識別,從而克服各自的不足,提高字符識別的準確度。

2脫機手寫數(shù)字的分層識別方法

脫機手寫數(shù)字識別,首要任務(wù)就是利用掃描設(shè)備將紙質(zhì)載體掃描為圖像信息以便計算機處理。得到的數(shù)字圖像在進行識別之前需要進行圖像的預處理,以消除圖像中無關(guān)的信息,增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù),從而改進特征抽取、圖像分割、匹配和識別的可靠性。預處理過程一般有幾何變換、平滑、復原和增強、提取邊緣、細化等步驟。這些圖像預處理技術(shù)比較成熟,可以直接應(yīng)用。

2.1主分量分析法提取統(tǒng)計特征及識別

3.1主分量分析法識別數(shù)字實驗

步驟一:學習階段

利用主分量分析法對0到9十個數(shù)字的訓練樣本提取統(tǒng)計特征,得到0到9十個模式類的前d個主分量重建得到的數(shù)字模型。以數(shù)字“6”為例,給出前d個主分量的重建模型圖如圖l所示,主分量個數(shù)d分別取3、5、7、10。從圖中可以看出d越大,模型圖像中包含的信息越多。

圖1樣本“6”前d個主分量的重建模型圖

步驟二:識別階段

將測試樣本分別在各模式的特征空間估計對應(yīng)于各模式的重建模型,再與各模式的重建模型相減得到重建誤差,比較誤差大小,誤差越小,與對應(yīng)的數(shù)字模式類越相似。

任意給出測試樣本中經(jīng)過預處理的0-9十個數(shù)字的圖像如圖2所示。

0-9十個手寫數(shù)字字符(下表中用“”中的數(shù)字代表),在數(shù)字6的特征空間,分別構(gòu)建的重建模型圖像如圖3所示:

根據(jù)公式(2),對任意選取的這十個數(shù)(測試樣本)的重建模型與訓練樣本的重建模型相減求模,得到模型誤差值進行識別。

這里,我們只針對“6”的樣本集進行分析。當d=10的時候,任意十個數(shù)的測試樣本與“6”樣本集的重建模型相減,得到如圖4中所示的十個誤差圖像。

對圖4中圖像求模得到誤差值,誤差值越小,說明測試樣本數(shù)字的形態(tài)與數(shù)字“6”越相似。發(fā)現(xiàn)測試樣本數(shù)字“6”的重建模型誤差值最低,說明本方法是合理的。

其次誤差值最小的是“4”,然后是“5”,其余的數(shù)字的誤差較大。究其原因,我們分析表2中測試樣本的圖像不難發(fā)現(xiàn),書寫的數(shù)字4和5有與數(shù)字6最相近的筆畫弧度部分。

步驟三:分析結(jié)果

100個測試樣本經(jīng)過主分量分析識別,得到的實驗結(jié)果如表1所示:

表1中反映出,各數(shù)字字符的識別率也不同,其中以取7個主分量時得到的實驗結(jié)果為例,發(fā)現(xiàn),數(shù)字“1”的識別率最低(η=70%),其次是數(shù)字“7”“9”(η=80%)。分析其中的原因,主要是因為字符“1”的筆畫過于簡單,只有一豎,因此它筆畫結(jié)構(gòu)的特征不明顯,通過PCA能夠提取的結(jié)構(gòu)特征也就很有限。而“7”和“1”、“9”兩個數(shù)字結(jié)構(gòu)特征類似,也導致它的識別率比較低。為此,加入字符的寬高比結(jié)構(gòu)特征進行識別。

3.2結(jié)合寬高比結(jié)構(gòu)特征識別實驗

針對統(tǒng)計法識別數(shù)字出現(xiàn)的問題,提取寬高比特征進行數(shù)字識別,得到結(jié)果如表2。

發(fā)現(xiàn)數(shù)字識別率由91%提高到了96%,其中數(shù)字“1”被全數(shù)識別,原因在于它的高寬比特征最顯著?!?”和“9”識別率也顯著提高,這是因為其結(jié)構(gòu)特征與“1”區(qū)別開來,另外,結(jié)構(gòu)特征使“9”與“6”區(qū)別更顯著了。

4結(jié)論

本文在分析現(xiàn)有脫機手寫數(shù)字識別技術(shù)的基礎(chǔ)上,根據(jù)人工智能識別字符的規(guī)律,結(jié)合統(tǒng)計特征和結(jié)構(gòu)特征設(shè)計了分層識別步驟。自制訓練樣本及測試樣本庫,利用Matlab軟件進行識別實驗,分析實驗結(jié)果發(fā)現(xiàn)本方法能夠在一定程度上提高數(shù)字識別率,但是未對算法實時性作出要求,要形成工程實用的算法,還需要進一步的研究。

猜你喜歡
結(jié)構(gòu)特征
論莫言小說的復線式結(jié)構(gòu)特征
藥物與輔料相互作用差異與結(jié)構(gòu)特征的相關(guān)性研究
論東巴文對稱型字組的結(jié)構(gòu)特征及音義功能
賦格段概念界定與結(jié)構(gòu)特征辨析
結(jié)構(gòu)特征的交互作用對注塑齒輪翹曲變形的影響
特殊環(huán)境下雙駝峰的肺組織結(jié)構(gòu)特征
2012年冬季南海西北部營養(yǎng)鹽分布及結(jié)構(gòu)特征
橡膠相結(jié)構(gòu)特征對ABS樹脂力學性能的影響
基于測井響應(yīng)評價煤巖結(jié)構(gòu)特征
基于結(jié)構(gòu)特征的身份證號碼基數(shù)排序算法研究
宁海县| 陕西省| 玉林市| 尼玛县| 札达县| 隆回县| 锡林郭勒盟| 孙吴县| 夏河县| 阜阳市| 清水县| 泌阳县| 图片| 乐平市| 班戈县| 西和县| 广灵县| 富裕县| 襄汾县| 阜南县| 明溪县| 内黄县| 鹿邑县| 宁海县| 南平市| 滨州市| 芜湖县| 彭水| 蕉岭县| 南漳县| 盘锦市| 久治县| 铜陵市| 沾益县| 桓台县| 灵台县| 乌兰浩特市| 临沧市| 巩留县| 汾西县| 明水县|