林 青,周俊鵬,王連明
(1.電子科技大學圖書館,四川 成都 611731;2.國家電網(wǎng)四川樂山供電公司,四川 樂山 614000;3.東北師范大學應用電子技術(shù)研究所,吉林 長春 130024)
基于NDRAM算法的聯(lián)想記憶網(wǎng)絡在車牌漢字識別中的應用
林 青1,周俊鵬2,王連明3
(1.電子科技大學圖書館,四川 成都 611731;2.國家電網(wǎng)四川樂山供電公司,四川 樂山 614000;3.東北師范大學應用電子技術(shù)研究所,吉林 長春 130024)
提出了一種基于NDRAM算法的車牌漢字識別方法.分別采用基于外積法和偽逆法的Hopfield網(wǎng)絡和NDRAM算法對加有不同噪聲水平的椒鹽噪聲的車牌漢字和具有不同程度缺失的車牌漢字進行了仿真識別.結(jié)果表明,NDRAM方法具有更高的識別率和更強的自適應性.
NDRAM;聯(lián)想記憶;模式識別;漢字;車牌
車牌識別在交通領(lǐng)域具有廣泛的應用需求.目前我國使用的車牌由漢字、字母、數(shù)字組成,由于漢字結(jié)構(gòu)復雜,因此是車牌識別中的難點與重點.在實際應用中,由于污損或光照等因素影響,待識別車牌漢字通常帶有一定的缺損或噪聲,要求識別系統(tǒng)具有一定的容噪能力.傳統(tǒng)的漢字識別的方法主要有人工神經(jīng)網(wǎng)絡、模板匹配、特征識別、支持向量機等[1].
人工神經(jīng)網(wǎng)絡在模式識別應用中屬于比較成熟、有效的工具,除了最為廣泛使用的BP神經(jīng)網(wǎng)絡外[2],還有SOM神經(jīng)網(wǎng)絡、MLP網(wǎng)絡、RBF神經(jīng)網(wǎng)絡等也被用于模式識別.BP神經(jīng)網(wǎng)絡通常采用多層結(jié)構(gòu),所使用的神經(jīng)元數(shù)量較多,[3]它用于漢字識別時,首先需要提取漢字特征對神經(jīng)網(wǎng)絡進行訓練,因此處理過程相對復雜,識別效果也主要取決于所提取的特征是否合理,同時BP神經(jīng)網(wǎng)絡對干擾比較敏感,容易陷入局部極小值.
NDRAM是近年來提出的遞歸人工神經(jīng)網(wǎng)絡算法[4],它具有無監(jiān)督學習、容噪能力強、容量大等特點[5].根據(jù)車牌識別中對容噪能力的要求,本文應用NDRAM算法具有聯(lián)想記憶的特性對車牌漢字進行識別.此外,使用NDRAM算法進行處理,還具有無須對字符進行特征提取,生成的吸引子位于全局最小值等優(yōu)點[6],克服了人工神經(jīng)網(wǎng)絡容易陷入局部極小值的缺陷.
NDRAM(Nonlinear Dynamic Recurrent Associative Memory)是2005年由Sylvain Chartier提出的算法[7],其作用函數(shù)為非線性的S型函數(shù),并可記憶雙極型{-1,1}和非雙極型吸引子.在網(wǎng)絡結(jié)構(gòu)上,作為全互聯(lián)的單層神經(jīng)網(wǎng)絡,通過權(quán)值的連接,所有神經(jīng)元的輸出都將反饋用做下一次的輸入,網(wǎng)絡迭代直至收斂,形成一個動態(tài)的遞歸網(wǎng)絡.
該算法可實現(xiàn)聯(lián)想記憶,對加噪或缺失的模式進行恢復,從而達到識別的目的.網(wǎng)絡的輸出由輸入、權(quán)值、作用函數(shù)、迭代次數(shù)共同決定.該算法實現(xiàn)分為學習、回憶兩大階段.學習階段根據(jù)記憶模式生成權(quán)值,回憶階段對輸入進行識別.
圖1為NDRAM網(wǎng)絡的結(jié)構(gòu),其中W為n×n對稱矩陣,代表權(quán)值矩陣,n為神經(jīng)元個數(shù),W的對角線不為零,具有自反饋.Xi(i=1,2,…,n)代表第i個神經(jīng)元;X(t)代表t時刻神經(jīng)元的狀態(tài).
圖2為NDRAM神經(jīng)元結(jié)構(gòu),第i個神經(jīng)元第t+1時刻的狀態(tài)Xi(t+1)由權(quán)值、其他神經(jīng)元的上一時刻狀態(tài)Xi(t)、作用函數(shù)、權(quán)值共同決定.Wij代表第i個、第j個神經(jīng)元之間的連接權(quán)值,是權(quán)值矩陣W中第i行第j列的分量.網(wǎng)絡運行中,神經(jīng)元采用并行更新的方式.
圖1 NDRAM網(wǎng)絡拓撲結(jié)構(gòu)
圖2 NDRAM神經(jīng)元結(jié)構(gòu)
NDRAM神經(jīng)元的作用函數(shù)如公式(1)所示,其函數(shù)曲線如圖3所示,NDRAM神經(jīng)元作用函數(shù)的域值范圍為[-1,1].其中,當自變量為[-1,1]時,對應的映射部分為非線性.作用函數(shù)在網(wǎng)絡的學習階段與回憶階段均需使用,δ為傳遞參數(shù),通常δ=0.1.該作用函數(shù)保證了算法的收斂,使其生成的吸引子為漸進穩(wěn)定點[8].
(1)
NDRAM神經(jīng)網(wǎng)絡的學習過程如圖4所示.在學習階段,輸入記憶模式,初始權(quán)值為0,根據(jù)記憶模式與神經(jīng)元迭代后狀態(tài)的差值進行學習并更新權(quán)值.
圖3 NDRAM作用函數(shù)
圖4 NDRAM學習過程
最終權(quán)值大小由記憶模式、迭代次數(shù)共同決定,如公式(2)和(3)所示.
(2)
X(p)=f(W×X(p-1)).
(3)
其中:X(0)表示神經(jīng)元的初始狀態(tài),即需要記憶的模式;X(p)代表通過作用函數(shù)的p次迭代后的神經(jīng)元狀態(tài);η為學習參數(shù),通常η=0.01,控制權(quán)值對差值的學習速率.
在回憶階段,輸入為待識別對象,將輸入送入網(wǎng)絡,各神經(jīng)元狀態(tài)將隨時間變化,經(jīng)過數(shù)次迭代后收斂到該動態(tài)系統(tǒng)的吸引子,網(wǎng)絡將輸出相應的記憶模式,完成模式的識別.
噪聲定義:類比實際應用的噪聲情況,我們使用隨機位置的椒鹽噪聲.噪聲水平?jīng)Q定了噪聲像素點的總量.在確定噪聲水平后,隨機地將相應數(shù)量的像素取相反值.
本文使用我國車牌中常用的37個漢字作為記憶模式,記憶模式全部取自實際車牌的截圖.圖片大小為32像素×16像素,使用{-1,1}作為神經(jīng)元狀態(tài).將模式由矩陣變換為向量,向量的每個分量對應一個神經(jīng)元,共512個神經(jīng)元.
類比實際應用的缺損情況,以不同邊長的方陣作為缺損噪聲,邊長代表噪聲水平,方陣中所有像素值為1,噪聲隨機分布于待識別對象中.
記憶的標準模式、加不同噪聲水平的椒鹽噪聲后的待識別車牌和帶缺損噪聲后的待識別車牌見圖5—7,圖片上方的數(shù)字代表了相應的缺損噪聲邊長.
圖5 記憶的標準模式
圖6 帶椒鹽噪聲的待識別對象
圖7 帶缺損噪聲的待識別對象
相同噪聲水平下,為去除隨機性的影響,共進行20次實驗,取錯誤率代表當前噪聲下的網(wǎng)絡識別水平.當輸出與相應記憶模式完全相同時視作正確識別.錯誤率定義為
(4)
其中:ep為錯誤率,取值范圍為[0,1];xerrors為當前噪聲水平下所有模式進行加噪實驗中未正確識別的次數(shù);ysum為當前噪聲水平下所有模式進行加噪實驗的總次數(shù).
離散Hopfield網(wǎng)絡是遞歸神經(jīng)的典型代表,其權(quán)值可利用外積法、偽逆法等生成,輸出的作用函數(shù)使用符號函數(shù).因此,將NDRAM結(jié)果與離散Hopfield網(wǎng)絡的識別結(jié)果進行對比,其結(jié)果見圖8—9.
圖8中橫軸代表椒鹽噪聲的像素總量,縱軸代表相應算法時的網(wǎng)絡識別錯誤率.圖9中橫軸代表缺損噪聲邊長,縱軸與圖8相同.
圖8 加椒鹽噪聲時3種算法識別的錯誤率
圖9 加缺損噪聲時3種算法識別的錯誤率
基于外積法的傳統(tǒng)離散Hopfield網(wǎng)絡運算簡單,然而,樣本間是否兩兩正交,每個樣本中各分量取(1,-1)的概率、各樣本間差異等因素與網(wǎng)絡表現(xiàn)密切相關(guān)[9].在實際應用中,由于樣本不能完全滿足以上要求,導致網(wǎng)絡容量與吸引域大大減小,因此,外積法設計的網(wǎng)絡不適于大容量的聯(lián)想記憶網(wǎng)絡[10].
基于偽逆法的傳統(tǒng)離散Hopfield網(wǎng)絡,權(quán)值非對稱,當記憶模式線性相關(guān)時,外積法存在的問題用偽逆法依然無法解決.由于存在求逆運算,過程較繁瑣.當神經(jīng)元個數(shù)、記憶模式數(shù)較多時,計算有困難.此外,該算法的權(quán)值不能由網(wǎng)絡學習生成,識別過程中容噪能力不高.
由圖8和9可知,NDRAM在識別過程中的容噪能力明顯高于基于外積法和偽逆法的傳統(tǒng)離散Hopfield網(wǎng)絡,當椒鹽噪聲總量低于181像素、缺損噪聲邊長小于11像素(總量低于121像素)時,網(wǎng)絡能完全正確地進行識別.NDRAM具有自適應性、識別率高、運算較為簡單等優(yōu)點.
NDRAM是近年來針對遞歸神經(jīng)網(wǎng)絡提出的識別效果較好的算法,具有無監(jiān)督、容噪能力強的特點.為了改進車牌漢字的識別效果,本文應用NDRAM算法進行識別,對該系統(tǒng)進行了深入的分析,通過仿真實驗驗證了該算法的容噪能力,充分說明了其優(yōu)越性.
在后續(xù)的研究中,將嘗試采用NDRAM對傾斜字符進行識別,并通過改進算法,進一步提高識別率.
[1] 陳海霞,崔茜.基于Gabor小波和PCA的人臉識別[J].東北師大學報(自然科學版),2014,46(4):77-80.
[2] 孟繁靜,王連明.視頻人臉識別系統(tǒng)中的最佳人臉捕獲[J].東北師大學報(自然科學版),2015,47(3):90-95.
[3] 石偉,孫永榮.BP神經(jīng)網(wǎng)絡在車牌識別技術(shù)中的應用[J].工業(yè)控制計算機,2010,23(4):17-19.
[4] 叢爽. 面向MATLAB工具箱的神經(jīng)網(wǎng)絡理論與應用[M].合肥:中國科學技術(shù)大學出版社,2009:118-158.
[5] 閻平凡,張長水.人工神經(jīng)網(wǎng)絡與模擬進化計算[M].北京:清華大學出版社,2005:360-381.
[6] HéLIE S. Energy minimization in the nonlinear dynamic recurrent associative memory[J]. Neural Networks,2008,21(7):1041-1044.
[7] CHARTIER S,PROULX R. NDRAM nonlinear dynamic recurrent associative memory for learning bipolar and nonbipolar correlated patterns[J]. Neural Networks,IEEE Transactions on,2005,16(6):1393-1400.
[8] HéLIE S,CHARTIER S,PROULX R. Are unsupervised neural networks ignorant? sizing the effect of environmental distributions on unsupervised learning[J]. Cognitive Systems Research,2006,7(4):357-371.
[9] SUN R,HéLIE S. Psychologically realistic cognitive agents taking human cognition seriously[J]. Journal of Experimental & Theoretical Artificial Intelligence,2013,25(1):65-92.
[10] HENRI COHEN,CLARIE LEFEBVRE. Handbook of categorization in cognitive science[M].Netherlands:Elsevier,2005:794-814.
(責任編輯:石紹慶)
Recognition of license plate Chinese character based on associative memory of the NDRAM algorithm
LIN Qing1,ZHOU Jun-peng2,WANG Lian-ming3
(1.Library of University of Electronic Science and Technology of China,Chengdu 611731,China;2.Power Supply Company of Leshan,State Grid Corporation of China,Leshan 614000,China;3.Institute of Applied Electronics,Northeast Normal University,Changchun 130024,China)
This paper proposes a method based on the NDRAM algorithm to recognize the Chinese characters on the license plates. After adding different levels of salt and pepper noise and different levels of partial loss on the Chinese characters,Hopfield neural network using Hebb rule,pseudo-inverse method and NDRAM are applied to recognize respectively.Simulation results show that comparing with the other two methods,NDRAM exhibits higher recognition rate and greater adaptability.
NDRAM;associative memory;pattern recognition;Chinese character;license plate
1000-1832(2015)04-0064-05
10.16163/j.cnki.22-1123/n.2015.04.014
2013-12-06
吉林省科技發(fā)展計劃項目(20130103028JC).
林青(1989—),女,碩士研究生;通訊作者:王連明(1972—),男,博士,教授,主要從事智能信息處理及嵌入式系統(tǒng)研究.
TP 391.1 [學科代碼] 520·6040
A