魏艷艷
摘要:在交通標志實時識別過程中,由于參考圖像與實測圖像不是同時獲取的,因此攝像機與被攝交通標志之間的位置難以保證完全相同。于是,所獲取的參考交通標志圖像與實測交通標志圖像之間就可能產生幾何失真。幾何失真將對于圖像識別的結果帶來很大的影響。因此,需要尋找一種具有旋轉和比例不變性的圖像識別方法,以滿足實際應用中的需要。針對上述問題,提出了一種基于幅值譜和神經網絡的交通標志識別算法。實驗結果表明,所提出的識別算法具有很好地識別能力。
關鍵詞:交通標志識別;神經網絡;幅值譜
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)27-0156-03
Abstract: in the process of real time recognition of traffic signs, the reference image and real image are not acquired simultaneously, so the position of the camera and the traffic signs are difficult to be guaranteed. Thus, the obtained reference traffic signs and traffic signs can produce geometric distortion. Geometric distortion will have great influence on the result of image recognition. Therefore, it is needed to find a method of image recognition with rotation and scale invariance to meet the needs of practical application. In view of the above problems, a traffic sign recognition algorithm based on amplitude spectrum and neural network is proposed. Experimental results show that the proposed algorithm has good recognition ability.
Key words: traffic sign recognition; neural network; amplitude spectrum
道路交通符號識別是利用計算機視覺技術自動地從圖像中檢測出交通符號并對交通符號進行識別的研究領域。為了安全駕駛和高效運輸,交通部門在公路道路上設置了各類重要的交通符號,作為道路交通的有關信息提供給司機。在智能運輸系統(tǒng)(ITS)中,如何實現(xiàn)交通符號的自動識別,對于自動駕駛或駕駛輔助系統(tǒng)來說,都是非常重要的。
自主導航系統(tǒng)要識別的交通標志圖像是車輛在運動過程中通過車載攝像機獲取,致使所獲取的標志圖像與實際交通標志之間可能產生幾何失真,這種失真將對圖像識別的結果帶來很大的影響。因此,需要尋找一種具有平移、旋轉及比例變換不變性的圖像識別方法,以滿足實際應用的需要。針對上述問題,本文提出了一種基于幅值譜和神經網絡的交通標志識別算法。
1 基于幅值譜和不變矩的圖像特征提取
對圖象特征提取的算法進行研究分析后得知,常用的圖象特片提取算法有四種,分別是灰度共生矩陣征提取算法、主分量分析用于特征提取算法、Hu不變矩特征提取算法、幅值譜二次特征提取算法,在本次實驗中使用這四種方法做了結果對比,最終將采用基于幅值譜和不變矩的圖像二次特征提取的算法。
矩在文字識別或其他圖像識別中作為有效的統(tǒng)計特征而被廣泛使用。它之所以能被用來表征一幅二維圖像是基于帕普里斯(Papoulis)唯一性定理。不變矩法最初由Hu提出,后又被許多學者加以改進,使不變矩特征的描述能力得到不斷的提高。Hu矩組是圖像中心矩[ηpq]前7個矩的函數,它們分別為:
上述7個Hu不變矩可被用作圖像特征向量,Hu矩組反映了圖像的本質屬性,并且具有平移、旋轉、鏡像和尺度不變性。此方法的主要缺點是高階矩對噪聲敏感。一般情況下,噪聲被認為是高頻分量,而圖像的低中頻區(qū)域反映了圖像的整體輪廓,所以可以首先對圖像進行傅立葉變換,將圖像從空域變換到頻域,從而得到能量主要集中在低頻區(qū)域的圖像的幅值譜。但是幅值譜不具有旋轉和尺度不變性,于是就需要對幅值譜進行二次特征提取。由上文可知,Hu矩組提取出的7個特征具有平移、旋轉和尺度不變性,所以選擇通過Hu矩組對圖像的幅值譜進行第二次特征提取。這樣經過兩次特征提取,從理論上分析,提取出的特征向量應該不僅具有平移、旋轉和尺度不變性,同時還具有抗噪和抑制圖像光照不均的優(yōu)點。
基于幅值譜的二次圖像特征提取算法流程如下:
本次實驗選擇理想的交通符號圖像及其經過變形或添加適量噪聲后的圖像作為實驗樣本,驗證上述4種圖像定位算法的幾何不變性和抗噪干擾能力。實驗結果如表1所示。
由上面實驗數據發(fā)現(xiàn),基于Hu不變矩的特征提取以及基于幅值譜的二次特征提取所提取出的特征向量基本滿足旋轉、尺度不變性,同時對于添加噪聲的圖像也基本可以實現(xiàn)正確辨識。鑒于基于幅值譜的二次特征提取對噪聲的抑制能力好一點,所以最終確定通過對圖像幅值譜進行二次特征提取來提取圖像特征。
2 交通符號的預處理
本次實驗選取標準交通符號圖庫中的4種指示標志、5種禁止標志和4種警告標志13幅不同的真彩色指示交通標志圖像,如圖2所示。首先將真彩色的指示交通標志圖像樣本進行數字化處理,將其轉換為256級的灰度圖像,并以BMP文件格式存儲,圖像大小以32×32像素為例。
3 網絡訓練及結果分析
對上面三類交通符號圖像經二值化處理后,分別采用基于幅值譜的特征提取算法提取其特征向量,并以此作為BP網絡的訓練集。本文選擇的是雙層識別網絡結構,這種雙層識別網絡結構中有4個BP網絡,即1個粗分BP網絡和3個細分BP網絡。BP網絡部分完成公路交通符號的粗分,將公路交通符號分為指示標志(01)、禁止標志(10)和警告標志(11),接下來的BP網絡1、BP網絡2和BP網絡3分別完成對三種粗分結果的細分。
3.1 粗分BP網絡
此時網絡輸入為經過圖像特征提取后的7個圖像特征,所以確定輸入層神經元個數為7,網絡輸出是三種粗分類別,指示標志、禁止指標和警告標志分別對應二進制編碼01、10和11,所以確定輸出層神經元個數為2。由于隱含層神經元個數的確定沒有理論指導,根據經驗公式,隱含層神經元個數應在[4~17]個之間,所以此處采用隱含層神經元個數可變的BP網絡,通過對比網絡誤差,選擇最優(yōu)的隱含層神經元個數。網絡訓練誤差如表2所示。
表2表明,經過6000次訓練后,隱含層神經元個數為8的BP網絡誤差res=0.065403最小,而且經過11次訓練就達到了目標誤差。
3.2 細分BP網絡
細分網絡完成交通符號的細分,包括三個子網絡:指示標志細分網絡、禁止標志細分網絡和警告標志細分網絡。三個子網絡網絡結構類似,輸入層神經元個數均為7,由于細分網絡輸入圖像最多是5個,二進制編碼即101,所以此處選擇輸出層神經元個數為3,同樣采用隱含層神經元個數可變的BP網絡,選擇使最終網絡誤差最小的最優(yōu)隱含層經元個數。這里以指示標志為例說明細分網絡的組成和工作原理。
對于指示標志細分網絡,輸入神經元個數仍然為7個,輸出神經元個數為3個,所以通過經驗公式確定隱含層數目應該在[4~17]個之間。通過隱含層神經元個數可變的BP網絡訓練后,網絡誤差如表3所示。
觀察表3,發(fā)現(xiàn)隱含層神經元個數為7的BP網絡誤差最小,且只需要訓練2次就達到目標誤差要求。同樣對于禁止標志和警告標志也進行和上面類似的訓練后,就能夠確定解決此交通符號分類問題的4個BP網絡結構。
3.3 網絡測試
網絡測試的目的是為了確定網絡是否滿足實際應用的要求。這里測試數據與訓練用的樣本數據應該不一致,否則,測試出的結果永遠都是滿意的。
本次網絡測試選擇標準交通符號圖像庫中的4幅理想指示標志圖像、5幅禁止標志圖像和3幅警告標志圖像,如圖3所示,將測試樣本同樣規(guī)格化為32×32大小,對它們進行二值化處理后提取特征,并把特征向量送入識別網絡進行識別。
將上述的12幅已二值化處理的標準交通符號圖像的特征向量作為粗分BP分類器的測試集輸入到輸入層,網絡測試結果如表4所示。
觀察上表發(fā)現(xiàn),網絡共有測試樣本12個,經過適當的閾值處理,正確識別12個,錯誤識別0個,網絡識別率為100%。
4 結論
1)實驗結果表明,采用幅值譜提取Hu不變矩,可以有效地抑制噪聲和光照不均的影響。
2)和傳統(tǒng)BP神經網絡識別方法相比,本文采用的雙層識別網絡結構,由于消除了重復訓練的缺陷,這種網絡結構在訓練速度上明顯提高,同時識別率更高。
參考文獻:
[1] 朱雙東,陸曉峰.道路交通標志識別的研究現(xiàn)狀及展望[J].計算機工程與科學,2006(12).
[2] 呂瑾文.基于不變矩和小波神經網絡交通標志識別研究[D].武漢:武漢理工大學,2009.
[3] 徐科,李文峰,楊朝霖. 基于幅值譜與不變矩的特征提取方法及應用[J].北京科技大學自動化學報. 2006(3).
[4] 秦香英,黃亞飛,劉偉銘.基于不變矩和小波神經網絡的標志識別方法[J].長沙交通學院學報,2005(2).