国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于QNN的圖像特征提取字符識別系統(tǒng)設計

2018-04-25 07:36:02,
計算機測量與控制 2018年4期
關鍵詞:字符識別隱層字符

,

(西安培華學院,西安 710125)

0 引言

近年來,字符識別一直是圖像處理及模式識別領域的研究熱點[1-5],其實用性強,尤其在大規(guī)模數(shù)據(jù)統(tǒng)計上,其應用前景更是廣闊。伴隨著計算機的快速發(fā)展,在圖像處理及模式識別研究中,許多人類難以解決的相對復雜的問題,都可以借助計算機的高速運算來解決[6-9]。在字符識別領域里,是否能夠選取合適的特征提取算法,其將直接影響到識別率的高低,鑒于粗網(wǎng)格特征法具有反映字符的整體特征又能縮減網(wǎng)絡的規(guī)模的優(yōu)點,為了更好地提高字符識別的正確率,本文提出了一種基于粗網(wǎng)格特征法對圖像特征量進行提取的字符識別系統(tǒng)。同時,由于量子神經(jīng)網(wǎng)絡具有高速并行處理能力、良好的容錯能力、自學習能力及較強的分類能力等特點[10-11],且QNN克服了傳統(tǒng)神經(jīng)網(wǎng)絡所具有的識別精度低、學習速率慢等的缺陷。所以在識別階段,對于識別字符來說,本文采用神經(jīng)網(wǎng)絡分類器是非常有效的手段。

1 字符識別系統(tǒng)設計

1.1 圖像特征提取字符識別系統(tǒng)

本文以數(shù)字型字符為研究對象,針對數(shù)字,設計了基于粗網(wǎng)格特征提取及QNN的字符識別系統(tǒng),系統(tǒng)大致可分為數(shù)字輸入、預處理、 特征提取、QNN識別 4 個部分。其工作過程為:首先利用樣品進行訓練,確定QNN識別器的具體參數(shù),完成分類器的設計。然后再把待識別數(shù)字樣本集的樣品輸入到網(wǎng)絡中,用經(jīng)二值化、行字切分、平滑 、 去噪、細化等預處理后,再特征提取的特征量來作為量子神經(jīng)網(wǎng)絡的輸入來識別待識別數(shù)字,并輸出識別結果。

1.2 字符預處理

由于現(xiàn)實環(huán)境的影響難以避免,實際獲得的數(shù)字圖像可能受到嚴重的噪聲干擾,所以進行特征提取前要先對數(shù)字圖像進行二值化、平滑、去噪聲等預處理,然后對其進行特征提取。而且當數(shù)字圖像出現(xiàn)偏移時,將導致對應網(wǎng)格之間的錯位,從而降低識別率,所以逐個識別前,還要進行歸一化處理,必須把它們的位置和大小歸一化到一個標準尺寸上,為數(shù)字識別做準備。

由于數(shù)字經(jīng)二值化、平滑、去噪聲等預處理后,可能還存在大小不一的現(xiàn)象,因此需進行歸一化過程。歸一化又分為大小及位置歸一化。

位置歸一化是把整個字符點陣圖移到規(guī)定位置上,從而消除其位置偏差。以質心為基礎的位置歸一化比基于字符外邊框的位置歸一化方法抗干擾能力強,所以本文選用基于質心的位置歸一化方法。

質心計算:

(1)

(2)

式中,x,y分別為橫、縱坐標,f(x,y)為字符二值點陣,T,B,L,R分別表示字符的上下左右邊界。

字符大小歸一化原理:假設f(x,y)為原字符圖像,大小為m×n,g(u,v)為歸一化后字符圖像,大小為M×N。f(x,y)中的任意一點(x0,y0)對應于g(u,v)中的點(u0,v0)。(u0,v0)和(x0,y0)

之間的映射關系為:

(3)

若映射的(x0,y0)是整點坐標,可直接令:g(u0,v0)=f(x0,y0)。若不是整點坐標,再經(jīng)差值運算確定將f(x,y)中哪一個點映射到g(u,v)中。本文選用鄰近插值算法,即是取(x0,y0)相鄰的上下左右4個點中,距離和(x0,y0)最近的點作為插值結果,將此點的f(x,y)值賦給g(u0,v0)。將字符大小歸一為16*16像素。

1.3 字符特征提取

常用的特征提取方法如:逐像素特征提取法的算法簡單,運算快,可以使網(wǎng)絡很快地收斂,但適應性不強;骨架特征提取法對于線條粗細不同的數(shù)字有一定的適應性,但難以識別偏移圖像 ;垂直方向數(shù)據(jù)統(tǒng)計特征提取法效果不是很理想,適應性不強[12]。本文采用粗網(wǎng)格特征法進行特征量提取。由于粗網(wǎng)格特征法具有抗位置變化能力差的缺陷,所以將其進一步改善,即是在特征提取步驟的前面,先對字符圖像定位,找到其中心,并平移到模板中心,再提取粗網(wǎng)格特征[13]。 本文將已歸一化為16*16像素的數(shù)字字符劃分為大小為2*2的8*8個網(wǎng)格,并將每個網(wǎng)格內的黑像素數(shù)量作為特征,因而共抽取64個特征。

2 識別模型

由于QNN具有容錯性、自學習、并行處理和分類識別能力強的優(yōu)點,且字符識別普遍存在相近字符數(shù)據(jù)交叉問題,所以本文的識別系統(tǒng),采用基于多層激勵函數(shù)的QNN模型,進行數(shù)字字符識別[14-15]。

2.1 QNN模型

本文采用基于多層激勵函數(shù)的QNN進行識別工作,網(wǎng)絡結構分為輸入層、隱含層和輸出層。隱含層激勵為多個S型函數(shù)的疊加,相鄰函數(shù)間有著不同的量子間隔,因而一個隱層神經(jīng)元能表示的量級和狀態(tài)增多,網(wǎng)絡模糊性增加,網(wǎng)絡模式識別的準確率提高。線性疊加的S型函數(shù)如圖1所示。

圖1 量子神經(jīng)網(wǎng)絡激勵函數(shù)

量子神經(jīng)網(wǎng)絡結構如圖2所示,LA、LB、LC分別為輸入層、隱層、輸出層,其各層對應節(jié)點數(shù)m、u、n。激勵函數(shù)f(x)=(1+e-x)-1,Wij、Vij分別為輸入層神經(jīng)元到隱層神經(jīng)元、隱含層神經(jīng)元到輸出層神經(jīng)元的連接權,θs為隱層量子間隔,(s=1,2,...,ns),φ表示輸出層單元的閾值,X是網(wǎng)絡的輸入向量。

圖2 量子神經(jīng)網(wǎng)絡結構

則可得隱含層節(jié)點輸出函數(shù)表達式為:

輸出層節(jié)點輸出函數(shù)表達式為:

Cj=f(VTB-φ)

式中,β是斜率因子,W為權向量,

X為輸入向量。r=1,2,....,u,j=1,...,n。

2.2 訓練算法

對QNN的訓練主要分為對權值和對隱層神經(jīng)元的量子間隔調整。量子間隔調整使數(shù)據(jù)不確定性合理化,權值調整可以對輸入數(shù)據(jù)更好地分類。

具體過程為:

1)令輸入特征向量:

Xk=[x1,k,x2,k,...,xm,k],則對第k個輸入,隱層第j個單元的輸出為:

(4)

輸出層第i個單元的輸出為:

(5)

2)權值調整采用誤差梯度下降算法:

設第k個輸入向量對應實際目標輸出:

(6)

期望輸出:

Yk=[y1,k,y2,k,...,ym,k]

(7)

輸出誤差:

(8)

對輸出誤差求偏導,并結合式(4)、(5)、(8)得權值調整公式:

(9)

(10)

η為學習速率,在0~1內取值,wpj,k-1,wpj,k為輸入層第p個節(jié)點與隱層第j個節(jié)點間調整前后的權值。wsq,k-1wsq,k為隱層第s個節(jié)點與輸出層第q個節(jié)點間調整前后的權值。

3)量子間隔調整仍采用梯度下降法,輸入同一類樣本,對應輸出會映射到同一量級上;輸入不同類樣本,對應輸出會映射到不同量級上。

設對第m個類Cm的所有樣本計算其隱層第P個單元的輸出變化:

(11)

(12)

其中:|Cm|代表類Cm數(shù)集系數(shù)。

則:

(13)

(14)

(15)

2.3 樣本庫建立

對于數(shù)字值0,1,...,9,本文通過Windows自帶的畫圖工具分別構造了50個粗細不一樣的相等的數(shù)字值,共500個樣本作為訓練樣本庫,計算出他們各自的128個特征量,訓練神經(jīng)網(wǎng)絡。由用戶手寫0,1,...,9,共10個數(shù)字值各50個做為待識別樣本庫。

3 系統(tǒng)測試與分析

經(jīng)預處理及特征提取后,得到64個特征量,又網(wǎng)絡輸出采用8421編碼,故網(wǎng)絡神經(jīng)元個數(shù)輸入為64,輸出為4,隱層采用3層激勵函數(shù),神經(jīng)元個數(shù)為 15,輸出層激勵為S型函數(shù),訓練誤差平方和不大于0.005、學習率為0.005。

圖3為采集圖像原始圖,二值化處理效果如圖4所示。

圖3 采集圖像原始圖 圖4 采集圖像二值化結果

為驗證算法有效性,本文首先將訓練樣本庫中的數(shù)字樣本數(shù)據(jù)分別輸入到量子神經(jīng)網(wǎng)絡中進行訓練,以得到合適的權值及量子間隔,再將測試樣本經(jīng)預處理、特征提取后送入到網(wǎng)絡中識別,并得出識別結果。本文采用Matlab做仿真實驗,例如對其中數(shù)字2,4,6進行測試的實驗結果及誤差分別如圖5~7所示,由此可見,誤差范圍的確在合理范圍0.005內。例如對數(shù)字2識別的均方誤差為2.631189e-03,對數(shù)字2識別的均方誤差為1.307583e-03。式(16)為正確識別率的公式:

(16)

圖5 數(shù)字2識別結果

圖6 數(shù)字4識別結果

圖7 數(shù)字6識別結果

對實驗結果進行統(tǒng)計得表1,表2為采用傳統(tǒng)BP神經(jīng)網(wǎng)絡的識別結果。由表1可以看出本方案的識別準確率一般都在92%以上,甚至對數(shù)字1和6的識別準確率達到了100%。而從表2中可以看出,采用傳統(tǒng)神經(jīng)網(wǎng)絡的對數(shù)字的識別準確率有不少都是在90%以下,例如,對數(shù)字3和8的識別準確率才達到88%,并且沒有一個數(shù)字的識別準確率可以達到100%。這表明本文將圖像處理技術與QNN相結合確實達到提高識別準確率的目的,并且采用QNN進行數(shù)字字符識別的方法比傳統(tǒng)神經(jīng)網(wǎng)絡具有更高的識別效率,更好的適用性。仔細觀察表1,表2還可以發(fā)現(xiàn),這兩個方法對數(shù)字3,4,5,8的識別準確率一般都偏低,這是由于這些數(shù)字的結構比其他數(shù)字復雜些,而訓練樣本的數(shù)目有限致使不能達到足夠高的訓練精度,所以會識別率會比較低。

表1 QNN識別結果統(tǒng)計表

表3為對數(shù)字1在不同的噪聲級別下進行測試得到的正確識別率的統(tǒng)計結果,從中可以發(fā)現(xiàn),在噪聲級別相同時,QNN的識別正確率比BPNN的識別正確率明顯大得多,尤其是噪聲級別較高時,其效果更為明顯,例如當噪聲級別為0.50時,QNN比BPNN的識別正確率高20%。 這表明量子神經(jīng)網(wǎng)絡比傳統(tǒng)神經(jīng)網(wǎng)絡具有更高的抗噪能力及可靠性。同時可以看出,無論是BPNN還是BPNN,他們的識別正確率都隨著噪聲級別的增大而減小,只是QNN減小的比較緩慢,所以抗噪能力強。

表2 BPNN識別結果統(tǒng)計表

表3 BPNN和QNN在不同噪聲級

4 結論

傳統(tǒng)識別方法一般都是單純依靠圖像處理技術,其普遍存在識別率低的問題。為了能夠有效地提高字符的識別率和可靠性,本文將粗特征提取法與基于多層激勵函數(shù)的QNN相結合,并引入模式識別之中,提出一種基于粗特征提取和QNN的數(shù)字字符識別算法。用粗網(wǎng)格特征法提取圖像的特征量,既能夠反映字符的整體特征,又能夠在一定程度上使網(wǎng)絡規(guī)模減小,具有一定的優(yōu)越性,QNN作為一種模糊系統(tǒng),能合理分配決策的不確定性數(shù)據(jù)到各模式中,從而提高識別的準確率。本文以數(shù)字字符為例,結合圖像處理技術,采用Matlab編程進行進行字符識別仿真實驗,通過比較發(fā)現(xiàn),QNN比傳統(tǒng)的BPNN的有更高的識別效率,抗噪能力強,可以更好地分類,隱層多層激勵函數(shù)的使用使得相近字符的數(shù)據(jù)交叉問題得到有效解決。

參考文獻:

[1] 陳園園,袁煥麗,室齊雙.基于神經(jīng)網(wǎng)絡的手寫體數(shù)字識別[J].智能計算機與應用,2016.

[2] 趙 偉,王俊宏,李 娟,等. BP網(wǎng)絡在手寫體數(shù)字識別中的應用[J].林業(yè)勞動安全2005,20(9):1073-1076.

[3] 蔡自興,成 浩. 一種基于骨架特征和神經(jīng)網(wǎng)絡的手寫字符識別技術[J]. 計算技術與自動化,2001,20(3):59-65.

[4] Qing W, Zhen C, Feng D D, et al. Match between normalization schemes and feature sets for handwritten Chinese character recognition[A].Document Analysis and Recognition,Proceedings six International Conference[C].2001:551-555.

[5] 胡鐘山,樓 震,楊靜宇,等. 基于多分類器組合的手寫體數(shù)字識別[J].計算機學報,1999,22(14):369-374.

[6] 高津京.計算機測量與控制[M].2002.

[7] 張光建,申時全.基于Windows的計算機測量與控制軟件設計[J].貴州大學學報:自然科學版, 2003, 20(4):411-413.

[8] 茍永明. 《計算機測量與控制》發(fā)展之路[J]. 今傳媒, 2011, 19(6):78-79.

[9] 馬智峰.淺析計算機測量控制系統(tǒng)的自我診斷[J].無線互聯(lián)科技, 2015(17):93-94.

[10] Kak S C. On quantum neural computing [J]. Information Sciences, 1995, 83: 143-160.

[11] Behman E C, Chandrashkar V G, Wang C K. A quantum neural network computes entanglement [J]. Physical Review Letters, 2002, 16(1): 152-150.

[12] 楊淑瑩.模式識別與智能計算— Matlab 技術實現(xiàn)[M].北京:電子工業(yè)出版社,2008.

[13] 陳艷平,趙 磊.基于8鄰域編碼逐像素跟 蹤法的指紋細節(jié)特征提取算法[J].電腦知識 與技術:學術交流,2008,3(11):932-934.

[14] 李政廣,吳黎明,等.骨架提取在IC晶片 缺陷機器視覺識別中的研究[J] .半導體技 術,2007,32(4):53-56,86.

[15] 劉春麗,呂淑靜.基于混合特征的孟加拉手寫體數(shù)字識別[J].計算機工程與應用, 2007,43(20):214-215.

猜你喜歡
字符識別隱層字符
尋找更強的字符映射管理器
字符代表幾
一種USB接口字符液晶控制器設計
電子制作(2019年19期)2019-11-23 08:41:50
基于RDPSO結構優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡水質預測模型及應用
人民珠江(2019年4期)2019-04-20 02:32:00
消失的殖民村莊和神秘字符
一種改進深度學習網(wǎng)絡結構的英文字符識別
儀表字符識別中的圖像處理算法研究
基于CUDA和深度置信網(wǎng)絡的手寫字符識別
基于近似結構風險的ELM隱層節(jié)點數(shù)優(yōu)化
計算機工程(2014年9期)2014-06-06 10:46:47
最優(yōu)隱層BP神經(jīng)網(wǎng)絡的滾動軸承故障診斷
民丰县| 鱼台县| 东光县| 北安市| 铜川市| 衢州市| 贵定县| 天镇县| 峡江县| 吉木萨尔县| 永丰县| 英山县| 西昌市| 武鸣县| 岑巩县| 璧山县| 黔江区| 南江县| 西昌市| 绥宁县| 安庆市| 河间市| 黔江区| 桦南县| 渝北区| 宜兰县| 胶南市| 定结县| 瓦房店市| 云阳县| 民丰县| 牙克石市| 澄江县| 麻阳| 额尔古纳市| 清新县| 太保市| 新竹县| 雅江县| 鹤峰县| 平塘县|