柴偉佳,王連明
(東北師范大學(xué)物理學(xué)院,吉林 長春 130024)
隨著交通運(yùn)輸產(chǎn)業(yè)的迅猛發(fā)展,對智能交通系統(tǒng)的研究提出了更高的要求,而車牌識別正是智能交通系統(tǒng)的重要組成部分,其關(guān)鍵是車牌字符識別子系統(tǒng).
我國目前的車牌由漢字、阿拉伯?dāng)?shù)字和英文大寫字母組合構(gòu)成,因?yàn)槠渲械臐h字結(jié)構(gòu)復(fù)雜,因此我國車牌較國外有更高的識別難度.在實(shí)際應(yīng)用中,采集到的字符樣本往往存在不同程度的噪聲污染,或者是變形和部分缺失,因此要求識別系統(tǒng)具有較強(qiáng)的容噪能力.目前針對車牌字符識別最常用的方法是模板匹配法和神經(jīng)網(wǎng)絡(luò)法.葉晨洲等人[1]采用基于模板匹配技術(shù)的多識別器融合方法,對漢字、數(shù)字和字母的識別率可達(dá)96%;馬俊莉等人[2]提出一種基于改進(jìn)模板匹配的車牌字符識別方法,平均識別率達(dá)97%;吳進(jìn)軍[3]采用支持向量機(jī)方法,對車牌字符的整體識別率可達(dá)98%.模板匹配法最大的不足是對相似字符的區(qū)分能力較差,當(dāng)樣本維數(shù)較大時效率很低.并且利用模板匹配法通常需要對樣本進(jìn)行特征提取,這一過程往往難以分析和操作.隨著計算機(jī)及相關(guān)技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)開始廣泛應(yīng)用于車牌的識別問題.我國目前針對車牌字符識別一般采用的是BP神經(jīng)網(wǎng)絡(luò).周科偉[4]采用改進(jìn)的BP算法,對漢字、數(shù)字和字母的識別率分別為86%,98%和96%;孟濤[5]采用3個BP神經(jīng)網(wǎng)絡(luò)并聯(lián),將其結(jié)果組合輸出的方法,識別率高達(dá)98%;咼潤華等人[6]將BP神經(jīng)網(wǎng)絡(luò)與模板匹配法相結(jié)合,識別率為97%.但這些方法針對的識別對象都是從實(shí)際車牌中獲取的字符,樣本數(shù)量有限,且不能體現(xiàn)實(shí)際應(yīng)用中出現(xiàn)的所有可能情況.
聯(lián)想記憶是生物系統(tǒng)的一個重要功能,可以使人類由事物的部分信息聯(lián)想到該事物的完整模式,因此將聯(lián)想記憶網(wǎng)絡(luò)應(yīng)用于車牌字符識別中,可有效辨認(rèn)模糊、形變或不完整的字符樣本.[7]本文基于聯(lián)想記憶網(wǎng)絡(luò)的這種特性,同時將其與BP神經(jīng)網(wǎng)絡(luò)具有高容錯性和不存在偽狀態(tài)的優(yōu)勢相結(jié)合,提出了一種混合神經(jīng)網(wǎng)絡(luò),實(shí)驗(yàn)證明該網(wǎng)絡(luò)性能優(yōu)于單純的聯(lián)想記憶網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò).
圖1 聯(lián)想記憶+BP混合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
最典型的聯(lián)想記憶網(wǎng)絡(luò)是Hopfield網(wǎng)絡(luò).本文設(shè)計的混合神經(jīng)網(wǎng)絡(luò)是將Hopfield網(wǎng)絡(luò)的輸出作為BP神經(jīng)網(wǎng)絡(luò)的輸入,將BP神經(jīng)網(wǎng)絡(luò)的輸出作為最終識別結(jié)果.該混合網(wǎng)絡(luò)的具體結(jié)構(gòu)如圖1所示.
Hopfield聯(lián)想記憶網(wǎng)絡(luò)是一種單層反饋神經(jīng)網(wǎng)絡(luò).它是一種動態(tài)網(wǎng)絡(luò),網(wǎng)絡(luò)的工作過程為狀態(tài)的演化過程,它按照“能量”減小的方式演化,最終達(dá)到穩(wěn)定狀態(tài),這些穩(wěn)定的狀態(tài)叫做網(wǎng)絡(luò)的吸引子.[8]在本文中這些吸引子就是需要記憶的模式,由于每個吸引子都存在一定的吸引域,處在吸引域內(nèi)的狀態(tài)最終都可以演化為對應(yīng)的吸引子,因此聯(lián)想記憶網(wǎng)絡(luò)有較強(qiáng)的容錯能力,可實(shí)際應(yīng)用于對畸變字符的識別.
設(shè)計一個聯(lián)想記憶網(wǎng)絡(luò)需要2個過程:在記憶階段,通過輸入標(biāo)準(zhǔn)樣本數(shù)據(jù),調(diào)整權(quán)值,使網(wǎng)絡(luò)達(dá)到穩(wěn)定;在聯(lián)想階段,輸入待識別樣本,系統(tǒng)經(jīng)過演化,最終收斂于某個吸引子.完成聯(lián)想記憶的關(guān)鍵在于采用有效的學(xué)習(xí)算法設(shè)計網(wǎng)絡(luò)權(quán)值,常用的算法有外積法、偽逆法、NDRAM(Nonlinear Dynamic Recurrent Associative Memory)算法及LSSM(Linear Systems in a Saturated Mode)算法.由于外積法要求樣本相互正交,且容量小,不適用于大量樣本的記憶,故本文實(shí)驗(yàn)中將采用另外3種算法.
偽逆法:利用偽逆法時權(quán)值計算公式為
W=ΣΣI,
(1)
其中Σ表示由全部記憶模式組成的矩陣,ΣI表示Σ的偽逆矩陣.由于偽逆法生成的權(quán)值是投影到記憶模式形成的線性子空間上,所以也被稱為投影法.[9]
NDRAM算法:該算法采用非線性的S型函數(shù)作為作用函數(shù),表達(dá)式為
(2)
式中δ表示傳遞參數(shù),通常取δ=0.1.NDRAM算法的權(quán)值更新方式是在Hebb學(xué)習(xí)律的基礎(chǔ)上疊加一個反Hebb學(xué)習(xí)律,計算公式為
(3)
其中:x[0]表示神經(jīng)元的初始狀態(tài),即需要記憶的模式;x[p]代表通過作用函數(shù)的p次迭代后的神經(jīng)元狀態(tài);η表示學(xué)習(xí)速率,通常取η=0.01.[10]
LSSM算法:該算法的權(quán)值和閾值的設(shè)計流程如下[11]:
(1) 輸入K個N維的記憶模式x={x1,x2,…,xk}及參數(shù)τ(通常取τ=10).
(2) 由記憶模式生成一個線性子空間A,A={x1-xk,x2-xk,…,xk-1-xk}.
(3) 對A做奇異值分解,A=USVT,U={u1,u2,…,un-1,un},計算A的秩m=rank(A).
(5) 計算Tτ=T+-τT-,Iτ=XK-TτxK,其中Tτ可視為權(quán)值,Iτ可視為閾值.
BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播算法訓(xùn)練的多級前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層、輸出層構(gòu)成.由于它能學(xué)習(xí)和存儲大量的輸入-輸出模式映射關(guān)系,因此在模式識別領(lǐng)域有相當(dāng)廣泛的應(yīng)用.
圖2 全部標(biāo)準(zhǔn)樣本圖
采用了31個省、自治區(qū)和直轄市以及5個特殊領(lǐng)域共計36個漢字車牌字符作為標(biāo)準(zhǔn)樣本,此外還包括數(shù)字0~9及除“I”和“O”以外的全部英文大寫字母,基本涵蓋了車牌中所有可能出現(xiàn)的字符.這70個標(biāo)準(zhǔn)樣本樣如圖2所示.
每個標(biāo)準(zhǔn)樣本為二值圖像,用“0”代表黑色、“1”代表白色.圖像尺寸大小為32像素×16像素,將每個標(biāo)準(zhǔn)樣本轉(zhuǎn)化為一列向量,可得到一個512×70的原始圖像矩陣,該矩陣將分別用于聯(lián)想記憶網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí).
圖3 混合網(wǎng)絡(luò)的運(yùn)行流程
以往的車牌字符識別實(shí)驗(yàn),針對的識別對象一般都是實(shí)拍的車牌,很難囊括全部漢字及英文數(shù)字字符,并且前期經(jīng)過了一定預(yù)處理,因此無法量化、真實(shí)地體現(xiàn)識別算法的性能.本文則是基于實(shí)驗(yàn)室條件下,通過對標(biāo)準(zhǔn)樣本進(jìn)行加噪、旋轉(zhuǎn)、切割,全面量化地模擬了實(shí)際情況中樣本的污損情況.為了考察本文提出的混合網(wǎng)絡(luò)的識別能力,將對5種算法組合情況進(jìn)行實(shí)驗(yàn),即偽逆法+BP算法,NDRAM算法+BP算法,LSSM算法+BP算法,單獨(dú)BP算法及單獨(dú)LSSM算法.在識別過程中,選取圖2中偶數(shù)位置上的35個樣本進(jìn)行實(shí)驗(yàn),用平均錯誤率來表征各網(wǎng)絡(luò)的識別水平.平均錯誤率定義為
(4)
其中:errorrate為35個樣本的平均識別錯誤率;errors為當(dāng)前噪聲條件下網(wǎng)絡(luò)未能正確識別的總次數(shù);sum為當(dāng)前噪聲條件下網(wǎng)絡(luò)進(jìn)行識別實(shí)驗(yàn)的總次數(shù).
在回憶階段采用的待識別對象為加入不同程度的椒鹽噪聲的字符樣本.該實(shí)驗(yàn)主要模擬實(shí)際應(yīng)用中由于污漬、磨損、光照不均等情況對車牌識別系統(tǒng)的干擾.為去除隨機(jī)性的影響,對每個待識別樣本進(jìn)行10次實(shí)驗(yàn),因此(4)式中sum取值為350.記錄每種算法在噪聲密度0~1區(qū)間的平均錯誤率,最終得到如圖4所示的錯誤率曲線.
由圖4可以看出,基于LSSM+BP算法的混合網(wǎng)絡(luò)的性能是最佳的,在噪聲密度不大于0.7時對樣本可達(dá)100%正確識別.其性能不僅遠(yuǎn)優(yōu)于其他混合網(wǎng)絡(luò)和單獨(dú)的BP神經(jīng)網(wǎng)絡(luò),相對于單獨(dú)的LSSM網(wǎng)絡(luò)也有了進(jìn)一步提升.
主要研究5種網(wǎng)絡(luò)對不同旋轉(zhuǎn)角度下的車牌字符樣本的識別情況.與加入隨機(jī)噪聲不同,由于每次實(shí)驗(yàn)輸出的結(jié)果是確定的,所以對每個樣本只需進(jìn)行一次識別實(shí)驗(yàn),即(4)式中sum值取為35.對35個標(biāo)準(zhǔn)樣本進(jìn)行1°~18°的旋轉(zhuǎn),記錄每種網(wǎng)絡(luò)在樣本旋轉(zhuǎn)不同角度時的平均識別錯誤率,得到實(shí)驗(yàn)結(jié)果見圖5.由圖5可以看出,基于LSSM+BP算法的混合網(wǎng)絡(luò)在樣本旋轉(zhuǎn)角度不大于7°時錯誤率依然是最低的.由于在實(shí)際應(yīng)用中,進(jìn)行最終的字符識別之前通常會對車牌進(jìn)行傾斜校正[12],因此小角度旋轉(zhuǎn)的樣本的識別率才是關(guān)注重點(diǎn).從這個角度來說,基于LSSM+BP算法的混合網(wǎng)絡(luò)的性能仍然是最佳的.
圖4 不同噪聲密度下幾種算法的錯誤率比較 圖5 旋轉(zhuǎn)不同角度時幾種算法的錯誤率比較
圖6 切割掉不同尺寸時幾種算法的錯誤率比較
針對5種算法對不完整的車牌字符的識別率問題,對35個樣本進(jìn)行1~20行的橫向切割,割除掉的部分補(bǔ)0后送入網(wǎng)絡(luò)進(jìn)行識別.錯誤率計算方法與旋轉(zhuǎn)的車牌字符識別完全相同.實(shí)驗(yàn)得到的錯誤率曲線如圖6所示.
由圖6可以看出,基于LSSM+BP算法的混合網(wǎng)絡(luò)在水平切割尺寸小于9像素時均可輸出正確結(jié)果,遠(yuǎn)優(yōu)于另外2種混合網(wǎng)絡(luò)和單獨(dú)的BP神經(jīng)網(wǎng)絡(luò).
綜合上述實(shí)驗(yàn)可以得到:基于聯(lián)想記憶+BP算法的混合網(wǎng)絡(luò)性能優(yōu)于單獨(dú)的聯(lián)想記憶網(wǎng)絡(luò)和單獨(dú)的BP神經(jīng)網(wǎng)絡(luò);在3種混合網(wǎng)絡(luò)中,尤以基于LSSM+BP算法的混合網(wǎng)絡(luò)是最優(yōu)的.在聯(lián)想記憶網(wǎng)絡(luò)識別錯誤的結(jié)果中,一種是誤判成其他標(biāo)準(zhǔn)模式,另一種則是進(jìn)入偽狀態(tài).這是由于Hopfield聯(lián)想記憶網(wǎng)絡(luò)是一種動態(tài)網(wǎng)絡(luò),存在較多的偽吸引子,所以輸出的結(jié)果會呈現(xiàn)諸多不確定狀態(tài),而BP神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果只能是70個標(biāo)準(zhǔn)樣本中的一個,不存在偽狀態(tài).因此,將聯(lián)想記憶算法和BP算法結(jié)合起來,可利用BP算法的容錯能力,將聯(lián)想記憶網(wǎng)絡(luò)輸出的接近標(biāo)準(zhǔn)樣本的偽狀態(tài)“糾正”回標(biāo)準(zhǔn)模式,進(jìn)一步提高網(wǎng)絡(luò)識別率.為了直觀展示該混合網(wǎng)絡(luò)的優(yōu)越性,圖7給出了基于LSSM+BP算法的混合網(wǎng)絡(luò)的部分輸出結(jié)果.
圖7 LSSM+BP混合網(wǎng)絡(luò)的部分輸出結(jié)果
本文提出了一種基于聯(lián)想記憶算法與BP算法相結(jié)合的混合神經(jīng)網(wǎng)絡(luò),并將該網(wǎng)絡(luò)用于對加噪、旋轉(zhuǎn)和切割3種情況下的車牌字符樣本的識別.該方法充分利用了聯(lián)想記憶網(wǎng)絡(luò)對形變、模糊和不完整樣本的識別能力以及BP神經(jīng)網(wǎng)絡(luò)的糾錯能力.通過大量對比實(shí)驗(yàn),證明混合網(wǎng)絡(luò)在使用LSSM+BP算法時性能最佳,可糾正LSSM網(wǎng)絡(luò)輸出的部分偽狀態(tài),進(jìn)一步降低誤識率.由于目前單一神經(jīng)網(wǎng)絡(luò)很難滿足對復(fù)雜條件下樣本的高識別率的要求,本文提出的混合神經(jīng)網(wǎng)絡(luò)的方法為車牌識別等模式識別領(lǐng)域的研究和方法的改進(jìn)提供了一種新的思路.在后續(xù)的研究中,將進(jìn)一步探討該方法在現(xiàn)實(shí)交通環(huán)境中對車牌字符的識別效果,并對網(wǎng)絡(luò)的算法進(jìn)行改進(jìn),以便應(yīng)對更加復(fù)雜的實(shí)際環(huán)境.
[參考文獻(xiàn)]
[1]葉晨洲,楊杰,宣國榮.車輛牌照字符識別[J].上海交通大學(xué)學(xué)報,2000,34(5):672-675.
[2]馬俊莉,莫玉龍,王明祥.一種基于改進(jìn)模板匹配的車牌字符識別方法[J].小型微型計算機(jī)系統(tǒng),2003,24(9):1670-1672.
[3]吳進(jìn)軍.車牌識別技術(shù)的研究[D].杭州:浙江大學(xué),2006.
[4]周科偉.Matlab環(huán)境下基于神經(jīng)網(wǎng)絡(luò)的車牌識別[D].西安:西安電子科技大學(xué),2009.
[5]孟濤.車牌識別關(guān)鍵技術(shù)的實(shí)現(xiàn)和研究[D].武漢:華中科技大學(xué),2006.
[6]咼潤華,蘇婷婷,馬曉偉.BP神經(jīng)網(wǎng)絡(luò)聯(lián)合模板匹配的車牌識別系統(tǒng)[J].清華大學(xué)學(xué)報(自然科學(xué)版),2013,53(9):1221-1226.
[7]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)編程[M].北京:化學(xué)工業(yè)出版社,2011:194-199.
[8]陳明.MATLAB神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精解[M].北京:清華大學(xué)出版社,2015:282-284.
[9]PERSONNAZ L,GUYON I,DREFUS G.Collective computational properties of neural networks:new learning mechanisms[J].Physical Review A,1986,34(5):4217-4228.
[10]CHARTIER S,PROULX R.NDRAM:nonlinear dynamic recurrent associative memory for learningbipolar and nonbipolar correlated patterns[J].Neural Networks,IEEE Transactions on,2005,16(6):1393-1400.
[11]LI J H,MICHEL A N,POROD W.Analysis and synthesis of a class of neural networks:linear systems operating on a closed hypercube[J].Circuits and Systems,IEEE Transactions on,1989,36(11):1405-1422.
[12]文祝青,羅威,杜華英.基于BP神經(jīng)網(wǎng)絡(luò)的車牌號碼識別[J].現(xiàn)代計算機(jī),2015,12(35):64-68.