何誠剛
西安交通大學城市學院,陜西 西安 710018
基于支持向量機的交通標志人工智能檢測與識別
何誠剛
西安交通大學城市學院,陜西 西安 710018
針對人工智能檢測與識別交通標志準確率不高的問題,本文提出了一種以支持向量機(SVM)為基礎的多方法相融合的交通標志檢測與識別方法。該方法首先采用方向梯度直方圖進行交通標志的特征數(shù)據(jù)提取,然后利用網(wǎng)格搜索法和交叉驗證方法對支持向量機模型最優(yōu)化參數(shù)組合(懲罰因子C和核參數(shù)r)進行搜索,最后利用優(yōu)化的支持向量機模型現(xiàn)實交通標志識別。實驗仿真結(jié)果表明:基于支持向量機的最優(yōu)化交通標志識別的準確率可達98%。
支持向量機;交通標志;智能檢測;識別
目前伴隨無人車以及輔助駕駛系統(tǒng)技術(shù)的快速發(fā)展,交通標志智能檢測與識別已成為無人駕駛控制系統(tǒng)的重要組成部分,而目前由于道路交通的復雜性以及交通標志識別技術(shù)的研究尚不夠完善,該問題已成為制約無人駕駛汽車發(fā)展的一個瓶頸[1,2]。因此針對交通標志人工智能檢測與識別的研究具有重要的研究意義。目前國內(nèi)外針對交通標志的識別主要研究包括SIRF、SURF算法以及神經(jīng)網(wǎng)格、支持向量機和Adaboost等機器學習方法[3-6]。其中支持向量機具有快速建立識別模型以及更適合于小樣本數(shù)據(jù)下的模型建立,因此本文采用支持向量機算法為基礎相與方向梯度直方圖(HOG)法、網(wǎng)格搜索法和交叉驗證法相結(jié)合的方式進行交通標志人工智能檢測與識別研究。
支持向量機(Support Vector Machine,SVM)為近年來新興起的一種優(yōu)秀的人工智能識別方法,于1995年由貝爾實驗室的Vapnik提出來的,該方法主要用來解決樣本的分類和回歸兩大問題[7,8]。支持向量機方法理論是建立在基于統(tǒng)計學的VC維理論和結(jié)構(gòu)風險最小化理論的基礎上發(fā)展起來了,其能夠結(jié)合樣本信息進行學習精度以及無錯誤識別樣本能力之間獲得最佳折衷,從而獲取最優(yōu)的推廣能力。
支持向量機算法是一種基于分類邊界的方法,其基本原理可以通過二分類問題來進行描述,如圖1所示。圖中實心點和空心點分別代表了在高維空間中的兩類樣本數(shù)據(jù),其中H代表了兩類數(shù)據(jù)間的分類的超平面,而另外兩個H1和H2則分別是過各類中離分類面最近的樣本且平行于分類面的超平面,H1和H2之間的距離稱之為分類間隔,圖中落在H1和H2樣本數(shù)據(jù)則被稱為支持向量(Support Vectors)。假設線性可分樣本集為(xi,yi),i=1,…,n,x∈Rd,y∈{+1,-1}是類別符號,在d維空間中線性判別函數(shù)的一般形式可以表示為:g(x)=w·x+b,分類間隔等于2/∥w∥,因此使間隔最大等價于使∥w∥最小。要求分類線對所有樣本正確分類,就是要求它滿足yi[(w·x)+b]-1≥0,i=1,2,…,n,上述問題可轉(zhuǎn)換為約束優(yōu)化問題,即求函數(shù)的最小值。根據(jù)拉格朗日函數(shù)可以定義如下:其中, ai> 0代表拉格朗日系數(shù),解決最優(yōu)化問題則可轉(zhuǎn)變成計算w和b的拉格朗日函數(shù)極小值,根據(jù)Kuhn-Tucker條件,可將上述優(yōu)化問題整理為:其中sgn(·)為符號函數(shù)。對于分析非線性劃分問題可以通過采用非線性變換中 實現(xiàn)向高維空間H中線性的轉(zhuǎn)換,即采用的形式。如果存在一個“核函數(shù)”K滿足:原空間中的函數(shù)則可以用來進行變換空間中的點積,進而避免映射Φ的具體形式。按照泛函分析的理論,核函數(shù)只要能夠滿足Mercer條件,它即可與某一變換空間中的點積相對應,即存在映射成立。常見的滿足Mercer條件的核函數(shù)有:
線性核函數(shù): K( x,y)=x· y;
支持向量機不僅能解決二分類問題,同時還可以采用“一對一”和“一對其余”方法來解決多分類問題,本文進行基于支持向量機的交通標志識別則應用了“一對一”的多分類問題解決方法,具體方法不再贅述。同時本文采用了臺灣大學林智仁教授研究設計的SVM模式識別與回歸的軟件包(LIBSVM)進行模型的建立,LIBSVM是一個簡單的,易于使用的并且快速有效的SVM分類器,同時還提供了相應的源代碼,因此經(jīng)常被用于模式識別方程中。
2.1 數(shù)據(jù)選取和預處理
圖1 線性二分類示意圖Fig.1 Sketch of linear two classification
目前世界各國之間針對交通標志還沒有形成國際性的規(guī)范,各國差異性較大,因此用于通用性研究的交通標志圖像庫并不多,而比較有代表性的圖像庫有GRSRB交通標志圖像庫、LinkopingUniversity交通標志圖像庫、ITOWNS交通標志圖像庫,其中GRSRB交通標志圖像庫具有較多的交通標志類別(如圖2所示),且涵蓋了多場景下交通標志。GRSRB交通標志圖像庫共涵蓋了43種不同交通標志,總數(shù)超有50000張之多,本文選取了GRSRB標志庫中6種共400張標志圖片進行模型的訓練和檢測,其中選取300張標志用于模型的訓練,另外100張照片用于模型的測試。對選取的400張交通標志圖片需要進行特征提取,本文采用傅里葉描述子算法對交通標志進行處理獲得含有交通標志的感興趣區(qū)域(ROI),對于感興趣區(qū)域進行域歸一化處理為40×40大小格式圖片,對處理后的圖片采用方向梯度直方圖(HOG)方法進行感興趣區(qū)域的特征參數(shù)提取,此處采用HOG進行特征參數(shù)提取時,設定細胞單元cell像素大小為8×8,區(qū)域塊block大小為16×16,每個block包含4個cell,區(qū)間bin為9,每個block的HOG特征為36維,對于本文中40×40的標志圖片block步長為8,由此最終獲得HOG描述子的特征共計576維(4×4×36)用于基于支持向量機的交通標志人工智能訓練和識別。
圖2 交通標志圖集Fig.2 Traffic signs
2.2 人工智能識別流程
本文進行基于支持向量機的交通標志識別模型的建立流程如圖3所示,具體流程如下:
(1)收集不同類別交通標志樣本并進行特征數(shù)據(jù)提??;
(2)對原始樣本特征數(shù)據(jù)分成訓練集和測試集兩部分;
(3)對影響支持向量機模型性能的核心參數(shù)(核函數(shù)、懲罰因子C、核參數(shù)r)采用交叉驗證方法進行最優(yōu)化計算;
(4)根據(jù)不同核函數(shù)下獲取的最優(yōu)化懲罰因子C和核參數(shù)r組合分別通過訓練樣本來建立交通標志智能識別模型;
(5)對建立好的交通標志識別模型采用測試樣本進行測試,通過相關(guān)評價指標進行模型評價,評價指標包括準確率(Precision)、支持向量個數(shù)(N)和訓練時間(T)三種,若評價結(jié)果滿足要求則確定為最終交通標志識別模型,若不滿足將返回第(3)級從新建立模型直至滿足要求為止;
(6)待模型滿足實際要求后則可對交通標志進行檢測識別應用。
圖3 交通標志識別模型建立流程Fig.3 The establishment process of traffic sign recognition model
2.3 識別結(jié)果
基于支持向量機建立的識別模型性能的優(yōu)越性主要由核函數(shù)和懲罰因子C、核參數(shù)r來決定。本文采用的LIBSVM工具箱可提供常見的4種核函數(shù),分別為線性核函數(shù)、多項式核函數(shù)、RBF核函數(shù)和Sigmoid核函數(shù)。實驗中分別對每種核函數(shù)采用網(wǎng)格搜索和交叉驗證相結(jié)合的方式進行處理。
網(wǎng)格搜索法是通過讓懲罰因子C、核參數(shù)r分別在[2-10,2-9,…29,210]范圍的網(wǎng)格節(jié)點上進行搜索,在每個節(jié)點將訓練樣本采用交叉驗證方法進行驗證,此處將訓練樣本分解成5組,每組又分解成兩部分,一部分用于訓練、另外一部分用于測試分類性能。交叉驗證過程中每次從兩組參數(shù)中任選一種用于測試,通過循環(huán)迭代方式對每種參數(shù)組合進行測試(總計15×15=255組參數(shù)值),每次迭代計算中會求取5組所對應的精度值,再求取這5組精度值的平均值作為本次迭代兩組參數(shù)組合所對應的精度值,最后根據(jù)每次所計算的精度值進行模型懲罰因子C和核參數(shù)r組合策略評價。
圖4 不同核函數(shù)下交叉驗證結(jié)果Fig.4 Cross validation results under different kernel functions
本文中對4種核函數(shù)分別應用交叉驗證方法獲得的懲罰因子C和核參數(shù)r最優(yōu)化組合如圖4所示,圖中X軸為懲罰因子C取以2為底的對數(shù)后的數(shù)值,Y軸為核參數(shù)r取以2為底的對數(shù)后的數(shù)值,圖中在同一顏色的線上為獲得測試結(jié)果均方誤差相同,對于多組懲罰因子C和核函數(shù)r對應同一均方誤差,本文選取懲罰因子C最小的那組作為最佳模型構(gòu)建參數(shù),其原因為:懲罰因子C過高的話會降低模型的泛化能力,雖然訓練集分類識別的準確率很高,但是測試集的分類識別的準確率卻會很低。從圖中可以看出針對不同核函數(shù)采用交叉驗證方法獲得懲罰因子C和核函數(shù)r組合各不相同,圖(a)中采用線性核函數(shù)下獲得的最優(yōu)懲罰因子C=0.435,核參數(shù)r=0.001。圖(b)中對于多項式核函數(shù)下獲得的最優(yōu)懲罰因子C=0.001,核參數(shù)r=6.964。圖(c)中RBF核函數(shù)下獲得的最優(yōu)懲罰因子C=1.319,核函數(shù)r=0.250。圖(d)Sigmoid核函數(shù)下獲得的最優(yōu)懲罰因子C=36.758,核參數(shù)r=0.0156。
本文分別針對4種最優(yōu)參數(shù)組合進行了交通標志人工智能檢測識別模型建立,對所建立的模型采用剩下的100組測試樣本進行測試,測試結(jié)果采用準確率(Precision)、模型支持向量個數(shù)(N)和訓練時間(T)進行評價,評價結(jié)果如表1所示。
表1 模型測試評價結(jié)果Table 1 Evaluation results of model test
從表1中可知,采用RBF核函數(shù)以及懲罰因子C=1.319和核參數(shù)r=0.250的組合下交通標志識別效果最好,其測試樣本識別的準確率為98%,支持向量個數(shù)為65個,此處需要說明,支持量個數(shù)直接反應了模型的復雜化程度,模型建立過程的支持向量個數(shù)越多,其模型的訓練時間長度越長,由于采用RBF核函數(shù)模型建立所需核函數(shù)較少,因此該模型建立所需時間則較短僅需9.97秒。采用多項式核函數(shù)所建立模型測試結(jié)果準確率為92%,再后為采用線性核函數(shù),準確率為90%,最后為采用Sigmoid核函數(shù)測試結(jié)果準確率最低為89%。對比四種核函數(shù)獲得不同測試結(jié)果的主要原因為RBF核函數(shù)可以很好的將一個樣本映射到更高維數(shù)空間,同時對比多項式核函數(shù),RBF需要確定的參數(shù)要少,降低了模型建立的復雜程度,Sigmoid函數(shù)部分功能與RBF核函數(shù)相似,但是其常用于神經(jīng)網(wǎng)格的閾值函數(shù),線性核函數(shù)主要用于線性可分的情形,核參數(shù)自身結(jié)構(gòu)簡單,運算速度快,但是對非線性問題適用性較差,因此采用RBF核函數(shù)更適合建立基于支持向量機的交通標志識別模型。表1中同樣給出了采用支持向量機和BP神經(jīng)網(wǎng)格兩種方法測試的對比結(jié)果,通過對比可知采用BP神經(jīng)網(wǎng)格建立交通標志識別模型測試結(jié)果的準確度僅為83%,同時訓練時間確需要89.26 s,通過對比進一步證明了采用支持向量機更適合于交通標志的人工智能檢測與識別。
本文提取出的采用基于支持向量機方法進行交通標志的人工智能識別具有較高的準確度,同時本文中采用的網(wǎng)格搜索法和交叉驗證相結(jié)合的方法可以更加有效的獲得模型建立所需最優(yōu)參數(shù)組合,通過實驗研究表明:采用RBF核函數(shù)以及懲罰因子C=1.319和核參數(shù)r=0.250的最優(yōu)組合所建立的交通標志識別的準確率可達到98%。綜上所述,本文提出的基于支持向量機方法可為交通標志的人工智能檢測和識別提供一種有效的技術(shù)方法。
[1]陳 龍,潘志敏,李清泉,等.利用ASIFT算法實現(xiàn)多視角靜態(tài)交通標志識別[J].武漢大學學報:信息科學版,2013,38(5):553-556
[2]谷明琴,蔡自興,李 儀,等.基于多模型表示的交通標志識別算法設計[J].控制與決策,2013,28(6):844-848
[3]楊 恒,劉肖琳.基于SURF的車載實時交通標志識別系統(tǒng)[J].微計算機信息,2011,27(6):101-102
[4]黃 琳,張尤賽.應用深層卷積神經(jīng)網(wǎng)絡的交通標志識別[J].現(xiàn)代電子技術(shù),2015,38(13):101-106
[5]吳 峰,陳后金,姚 暢,等.基于網(wǎng)格搜索的PCA-SVM道路交通標志識別[J].鐵道學報,2014(11):60-64
[6]王改革,郭立紅,段 紅,等.基于Elman_AdaBoost強預測器的目標威脅評估模型及算法[J].電子學報,2012,40(5):901-906
[7]Cortes C,Vapnik V.Support-vector networks[J].Machine learning,1995,20(3):273-297
[8]Vapnik VN,Vapnik V.Statistical learning theory[M].New York:Wiley,1998
The Intelligent Detection and Recognition for Traffic Signs Based on Support Vector Machine
HE Cheng-gang
Xi’an Jiaotong University City College,Xi’an 710018,China
To solve the problem of low accuracy of intelligent detection and recognition for traffic signs,a fused multi-phase method based on support vector machine theory was put forward for traffic signs detection and identification.Firstly,the histogram of oriented gradient(HOG)was used to extract the feature data of traffic signs.Then the grid search method and cross validation method were applied to search the optimal parameters combination(penalty factor C and kernel parameter r) of the support vector machine model.Finally,the optimal method of support vector machine was applied to identify the traffic signs.Experimental results indicated that the proposed method went up to accuracy 98%of the recognition for traffic signs.
Support vector machine;traffic signs;intelligent detection;recognition
TP39
:A
:1000-2324(2017)03-0400-05
2016-02-15
:2016-03-16
何誠剛(1968-),男,碩士,副教授.主要研究方向為通信工程及電子測量儀器.E-mail:cghe68@126.com