張鑫+孫勇
摘 要:文章采用基于L-M算法的BP神經(jīng)網(wǎng)絡(luò),并在圖像特征提取量的選擇中,結(jié)合了不變矩特征值和灰度共生矩陣導(dǎo)出的基于紋理的特征量,以車牌識別為例進行圖像識別。經(jīng)過訓(xùn)練和測試,得到L-M及特征量優(yōu)化的神經(jīng)網(wǎng)絡(luò),在精度和識別速度上都優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
關(guān)鍵詞:圖像識別;不變矩特征值;L-M算法;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP183 文獻標(biāo)志碼:A 文章編號:2095-2945(2017)19-0001-03
引言
隨著圖像識別技術(shù)的不斷發(fā)展,應(yīng)用于圖像識別技術(shù)領(lǐng)域的算法也在不斷優(yōu)化升級,人工神經(jīng)網(wǎng)絡(luò)算法作為一種高度非線性的智能自適應(yīng)算法,在圖像識別領(lǐng)域中的應(yīng)用越來越廣泛?;谌斯ど窠?jīng)網(wǎng)絡(luò)實現(xiàn)圖像識別的主要特點是構(gòu)建分類器,將預(yù)處理后圖像樣本中提取出來的特征量輸入神經(jīng)網(wǎng)絡(luò),經(jīng)過自學(xué)習(xí)和自組織,不斷地訓(xùn)練,最終達到能夠穩(wěn)定正確識別圖像的狀態(tài)。[1]本文識別車牌號為例,對基于L-M算法及不變矩特征值優(yōu)化的神經(jīng)網(wǎng)絡(luò)進行研究和實驗。
1 圖像預(yù)處理
1.1 傾斜校正及灰度處理
實際圖像實時采集系統(tǒng)得到的圖像質(zhì)量參差不齊,本文采用方差公式推導(dǎo)法進行圖像校正。該方法基于正置圖像的投影圖像邊緣點的方差最小的原則來確定傾斜角度,具有較好的校正效果[2]。通?;叶忍幚矸椒ㄓ衅骄捣?,最大值法和加權(quán)平均值法。平均值法和最大值法一定程度上淡化了圖像中目標(biāo)物與背景分界,對后續(xù)邊緣檢測會產(chǎn)生影響,本文選用加權(quán)平均值法,通過最優(yōu)權(quán)值的選擇,能夠獲得較好的處理效果。計算公式為:
式中,WR=0.59,WG=0.30,WB=0.11,此權(quán)值設(shè)置能獲得最佳灰度圖像。[3]
1.2 圖像分割及卡爾曼濾波
獲得灰度圖像后,通過Ostu算法確定合適的分割閾值,當(dāng)像素點灰度值超過閾值,將該像素點灰度值賦值為255,否則賦值該像素點灰度值為0,由此得到二值圖像。在分割過程中會產(chǎn)生高斯白噪聲,采用卡爾曼濾波的方法進行濾波。[4]
2 圖像特征提取
2.1 不變矩特征值提取
圖像特征提取可以從基于圖像顏色的統(tǒng)計特性、圖像形狀和圖像紋理特征這些方面入手。為了克服圖像旋轉(zhuǎn)、平移導(dǎo)致的圖像特征提取誤差較大的情況,本文采用形狀不變矩來提取圖像熵矩陣的特征,作為神經(jīng)網(wǎng)絡(luò)的輸入層參數(shù)。
根據(jù)不變矩理論,定義圖像f(x,y)的p+q階中心矩為:
由計算得到的單元熵組成熵矩陣,n表示網(wǎng)格分辨率。熵矩陣中包含著局部和全局的圖像信息,從熵矩陣中提取不變矩特征值。[5]
2.2 灰度共生矩陣特征提取
在圖像f(x,y)任取一點組點對,偏移量為(a,b),點(x,y)處灰度值為i,點(x+a,y+b)處灰度值為j,固定(a,b),通過點對在圖像上的移動獲得不同的點對的灰度值(i,j),由于經(jīng)過二值化以后灰度等級為{0,255},故得到的(i,j)組合共有4組,統(tǒng)計整幅圖中每一種點對灰度出現(xiàn)的頻數(shù),歸一化后得到[Pij]灰度共生矩陣。由此獲得對比度,相關(guān)性,能量,逆差矩,分別為Con,Cor,Ene,Hom。[6]
綜合從熵矩陣中提取的7個不變矩特征值和依據(jù)灰度共生矩陣得出的4個參數(shù),構(gòu)成用于進行識別的圖像特征向量,作為神經(jīng)網(wǎng)絡(luò)輸入層參數(shù)。表示為
3基于L-M算法的BP神經(jīng)網(wǎng)絡(luò)
3.1 L-M算法概述
BP神經(jīng)網(wǎng)絡(luò)算法基于誤差梯度下降標(biāo)準(zhǔn),通過實際輸出與期望輸出的誤差來調(diào)整連接權(quán)值使之達到最優(yōu)。但通常情況下,BP神經(jīng)網(wǎng)絡(luò)存在學(xué)習(xí)速率慢,容易陷入局部最小值等問題[7]。作為優(yōu)化算法之一的L-M算法是梯度下降法與高斯-牛頓法的結(jié)合,利用了近似的二階導(dǎo)數(shù)信息,具有快速收斂,準(zhǔn)確度高的優(yōu)點,本文嘗試將其與神經(jīng)網(wǎng)絡(luò)算法結(jié)和用于圖像識別。
3.2 原理及實現(xiàn)步驟
4 實驗仿真及結(jié)果分析
本文以車牌識別為例。在試驗中,選取了數(shù)字0-9、英文字母A-Z及車牌上常見的30個漢字共66個字符,每個字符50張訓(xùn)練樣本圖片進行訓(xùn)練。由于車牌號由不同字符組合而成,在圖像處理過程中,進行了字符分割和圖像增強,為具體字符的識別提供分類基礎(chǔ)。經(jīng)過訓(xùn)練后,將50張測試圖片輸入神經(jīng)網(wǎng)絡(luò)進行測試。經(jīng)過測試,識別率能達到98%以上,且識別速度快,性能明顯優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)。
4.1 圖像預(yù)處理
灰度處理選擇的標(biāo)準(zhǔn)是經(jīng)過灰度變換后,像素的動態(tài)范圍增加,圖像的對比度擴展,使圖像變得更加清晰、細(xì)膩、容易識別,處理結(jié)果如圖2。圖像二值化處理,結(jié)果如圖3。
可以通過求梯度局部最大值對應(yīng)的點,并認(rèn)定為邊緣點,去除非局部最大值,可以檢測出精確的邊緣。一階導(dǎo)數(shù)的局部最大值對應(yīng)二階導(dǎo)數(shù)的零交叉點,這樣通過找圖像強度的二階導(dǎo)數(shù)的零交叉點就能找到精確邊緣點,如圖4。
對圖像做了開運算和閉運算,閉運算可以使圖像的輪廓線更為光滑,它通常用來消掉狹窄的間斷和長細(xì)的鴻溝,消除小的孔洞,并彌補輪廓線中的斷裂,如圖5。
對水平投影進行峰谷分析,計算出車牌上邊框、車牌字符投影、車牌下邊框的波形峰上升點、峰下降點、峰寬、谷寬、峰間距離、峰中心位置參數(shù),如圖6。
通過以上水平投影、垂直投影分析計算,獲得了車牌字符高度、字符頂行與尾行、字符寬度、每個字符的中心位置,為提取分割字符具備了條件。
4.2 訓(xùn)練庫的準(zhǔn)備
通過預(yù)先的圖像識別提取,得到部分?jǐn)?shù)字與漢字的訓(xùn)練庫,如圖7。
在車牌識別的過程中數(shù)字庫的建立很重要,切割出來的數(shù)據(jù)要與數(shù)據(jù)庫的數(shù)據(jù)作比較,只有數(shù)字庫準(zhǔn)確才能保證檢測出來的數(shù)據(jù)正確。
4.3 車牌的識別
進行車牌識別前需要使用樣本對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,然后使用訓(xùn)練好的網(wǎng)絡(luò)對車牌進行識別。其具體流程為:使用漢字、字母、字母數(shù)字、數(shù)字四個樣本分別對四個子網(wǎng)絡(luò)進行訓(xùn)練,得到相應(yīng)的節(jié)點數(shù)和權(quán)值。對已經(jīng)定位好的車牌進行圖像預(yù)處理,逐個的特征提取,然后從相應(yīng)的文件中讀取相應(yīng)的節(jié)點數(shù)和權(quán)值,把車牌字符分別送入相應(yīng)的網(wǎng)絡(luò)進行識別,輸出識別結(jié)果,如圖8。
5 結(jié)束語
基于神經(jīng)網(wǎng)絡(luò)的圖像識別具有廣闊的前景,隨著對識別質(zhì)量和識別效率要求的不斷提高,用于識別的算法也在不斷更新和優(yōu)化?;贚-M算法的BP神經(jīng)網(wǎng)絡(luò)在識別速率和精度方面有著巨大的優(yōu)勢,但是限于計算量較大這一問題,在一些特征向量較多或內(nèi)存較小的設(shè)備中難以適用,而圖像識別所需要的特征量往往又較多,為此進一步研究特征量提取方法的優(yōu)化和高性能運行設(shè)備是圖像識別進一步發(fā)展的關(guān)鍵。[8]
參考文獻:
[1]牛博雅,黃琳琳,胡健.自然場景下的車牌檢測與識別算法[J].信號處理,2016(07):787-794.
[2]曾曉娟.一種基于神經(jīng)網(wǎng)絡(luò)的圖像識別算法[J].電腦知識與技術(shù),2015(17):171-174.
[3]江偉.機器視覺圖像中目標(biāo)識別及處理方法研究[D].華北電力大學(xué),2015.
[4]李康順,李凱,張文生.一種基于改進BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識別算法[J].計算機應(yīng)用與軟件,2014(01):158-161.
[5]張澤琳,楊建國,王羽玲,等.煤粒圖像識別系統(tǒng)的設(shè)計與實現(xiàn)[J].煤炭工程,2011(02):17-19.
[6]孫君頂,毋小省.基于熵及不變矩特征的圖像檢索[J].光電工程,2007(06):102-106+115.
[7]王建梅,覃文忠.基于L-M算法的BP神經(jīng)網(wǎng)絡(luò)分類器[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2005(10):928-931.
[8]韓思奇,王蕾.圖像分割的閾值法綜述[J].系統(tǒng)工程與電子技術(shù),2002(06):91-94+102.