王慧斌,蘆蓉
車型識別作為 ITS中的一個重要分支,在打擊盜竊車輛、規(guī)范交通秩序、大型停車場管理、高速公路自動計費、交通流量統(tǒng)計等方面具有廣闊的應用前景[1] 。由于視頻圖像中包含的信息內(nèi)容豐富,因此,基于視頻圖像而進行的車型識別技術相較于其他監(jiān)測技術而言更具有應用優(yōu)勢。同時,也還存在一些問題迫切需要解決。一方面是計算的復雜性問題。這是由于車型識別包含諸多的處理環(huán)節(jié)(如,車輛檢測、車型特征提取等)流程,且在處理的各個環(huán)節(jié)采用了多種方法,因此如何簡化使得處理更加高效非常重要;另一方面是識別對象的復雜性問題。由于交通場景多變,車輛類型多樣,以及車輛移動造成的變化等,增加了車型識別難度。因此,如何解決這些問題已成為車型識別研究的重要內(nèi)容。
目前主流的車型識別技術主要是基于統(tǒng)計模式識別的方法[2] ,該方法的流程見圖1所示:
統(tǒng)計模式識別就是在已知訓練樣本集的基礎上設計分類算法,并進而對未知樣本進行辨別分類。分類算法是基于對訓練樣本向量學習的,因此其計算的復雜度和樣本特征的維數(shù)密切相關,其分類的準確度和樣本特征的鑒別性能密切相關??梢?,基于統(tǒng)計模式識別的方法中,特征選取是其關鍵問題
圖1 基于統(tǒng)計模式識別的車型識別流程
本文的車型識別方法選擇車輛圖像的灰度矩陣作為初級描述特征,并采用基于子空間分析的特征提取優(yōu)化方法PCA-LDA,對初級特征進行優(yōu)化處理。在此基礎上進一步設計了一種1-V-1 SVMs車型分類器,并結(jié)合KNN方法來進一步提高識別的準確率。
目前大部分的車型識別所選擇的識別特征都是如車體的輪廓、車長、車高、面積和軸距等幾何數(shù)據(jù)[3,4] 。而在實際應用中,車輛直觀性特征的準確提取依賴于對運動車輛檢測的精度,然而,車輛精確檢測本身就是較為復雜的問題。同時,直觀性特征又較難反映車型的細節(jié)變化??紤]到車輛的灰度圖像較易獲得且含有較多有效信息的。因此,本文采用車輛圖像灰度矩陣作為車型的初級描述特征。然而灰度特征的維數(shù)很高,特征數(shù)據(jù)之間的冗余大,不利于計算,因此需要進行“二次特征”的提取,從而獲得一組有利于學習和分類的“少而精”的目標特征用于識別。
“二次特征”提取的實質(zhì)是通過空間變換得到車輛的識別特征。這些特征要能夠滿足有效、冗余減少以及降維等要求。因此,本文設計了一種基于PCA-LDA的二次特征提取優(yōu)化方法,以提取更加有利于學習和分類的車型識別特征。
PCA(Principle Component Analysis)[5,7] 是一種多元統(tǒng)計數(shù)據(jù)分析方法,其基本思想是通過線性變換,將高維空間的問題轉(zhuǎn)換到低維空間進行處理。它能夠去除原始特征間的相關性,同時保持原始空間數(shù)據(jù)所提供的大部分信息,該方法具有很好的降維性能且丟失的數(shù)據(jù)信息最少,得到的特征能夠很好的代表原始數(shù)據(jù)但并不具有鑒別能力;LDA(Linear Discriminant Analysis)[6,7] 是一種用于判別樣本所屬類型的統(tǒng)計分析方法,它把高維數(shù)據(jù)投影到一個低維空間中,并且盡量使得在此低維空間中,同類樣本點聚集在一起,而不同類的樣本點分開。它能在降維的同時考慮到原始數(shù)據(jù)不同類別間的分類特征,從高維特征空間中提取出最具有鑒別能力的低維特征,但是對在實際中普遍存在的小樣本問題,其類內(nèi)散布矩陣經(jīng)常是奇異的。
本文設計的 PCA-LDA特征提取優(yōu)化方法結(jié)合了 PCA和LDA各自的優(yōu)點,首先通過PCA方法將高維圖像空間壓縮至主成分向量張成的低維PCA子空間從而消除特征數(shù)據(jù)的奇異性,然后在此空間中再通過加權LDA方法提取最佳鑒別特征。通過該方法獲得的車型識別特征維數(shù)低、鑒別性能高,因此分類器的計算快速、準確率高,取得了較好的識別效果。
PCA-LDA方法的特征提取流程如圖2所示:
圖2 PCA-LDA方法的特征提取流程
其具體實現(xiàn)過程如下:
(1)把每幅圖像對應的灰度矩陣按照行或者列的形式展開成一個向量。這些向量構成一個矩陣X,每一行代表一個樣本,每一列代表一個特征值。
計算矩陣X的協(xié)方差矩陣R:
式中的μ是樣本的總體均值向量,R是通過求矩陣的期望得到的。通過解特征方程,得到R的p個按照降序排列的特征值iλ及相應的正交歸一特征向量取累計貢獻率達到的前k1個主成分,得到k1個主成分張成的特征空間W1。
(2)將所有訓練圖像都投影到W1空間中,得到投影后的最佳描述特征。然后利用加權LDA方法計算圖像最佳描述特征的類內(nèi)散布矩陣Sw和類間散布矩陣sb。
假設共有c類樣本,Pi是每類樣本的先驗概率(實際中,先驗概率Pi往往等于類ωi的樣本數(shù)與總體樣本個數(shù)的比率),μi是第Ci類樣本的均值,μ是所有樣本的均值,Xi是屬于第i類的樣本。類內(nèi)散布矩陣Sw和類間散布矩陣Sb見式(2)和式(3):
(4)求出W=W1*W2,W就是圖像的最佳投影矩陣;
(5)通過最佳投影矩陣,獲得所有訓練圖像的最佳分類特征。
支持向量機(Support Vector Machine, SVM)方法[8] 是一種基于統(tǒng)計學習理論的模式識別方法,其主要思想可以概括為兩點:(1)它是針對線性可分情況進行分析,對于線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分;(2)它是基于結(jié)構風險最小化理論在特征空間中建構最優(yōu)分類超平面,使得學習器得到全局最優(yōu)化,并且在整個樣本空間的期望風險以某個概率滿足一定上界。
設有樣本xi和它的分類yi,表示成是輸入空間的維數(shù)。對標準化SVM,它的分界面是其最優(yōu)化問題可以用下面的二次規(guī)劃問題表示:
ξi≥0(i=1,…N)是一個松弛變量,用來保證對線性不可分數(shù)據(jù)的有效分類。參數(shù)C是一個正常數(shù),稱為懲罰參數(shù),是對經(jīng)驗風險和表達能力的一個裁決。C越大表明對錯誤分類的懲罰越大。函數(shù) ф是一個非線性映射函數(shù),用于把數(shù)據(jù)映射到高維空間,但是它并不是顯性結(jié)構函數(shù)。通過轉(zhuǎn)換空間,我們得到最優(yōu)超平面。
在構造最優(yōu)超平面時,訓練算法只涉及到空間中的內(nèi)積運算,即可以采用滿足Mercer條件的核函數(shù)來代替該內(nèi)積運算,目前主要的核函數(shù)有:
(3)RBF(徑向基)核函數(shù):
由于在實際中所獲得的車輛訓練樣本有限,因此本文采用在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出了很多特有的優(yōu)勢的SVM方法來進行分類識別。
假設對小轎車、卡車和客車三類車型進行分類。這是一個多類分類問題。在SVM的分類策略中[9] ,利用“一對一”方法構造的組合分類器泛化能力較強,在實際應用中能夠獲得比較高的分類精度,因此本文就采用這種構造策略來構造車型識別分類器1-V-1 SVMs。
設三種車型分別為ω1、ω2、ω3,類別數(shù)N=3。每類的樣本數(shù)為n1,n2,n3,總樣本數(shù)=n1+n2+n3。第i類和第j類之間的子分類器SVMt對應的訓練樣本是ωi和ωi(i≠j,i=1,2,3,j=1,2,3,t=1,2,…,N(N-1)/2),每個子分類器采用SVM算法對訓練樣本集進行學習,其最優(yōu)化問題如式所示。通過學習,求出每個子分類器對應的支持向量、最優(yōu)分類面的系數(shù)及常數(shù)b等。
SVM子分類器可以看做每類只有一個代表點的1NN分類器[10] ,它對每類只取一個代表點,如果該代表點無法很好的代表該類,那么分類結(jié)果就會出現(xiàn)錯誤。而KNN方法將每類所有的支持向量都作為代表點,對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。
對SVM分類時錯分樣本的分布進行分析發(fā)現(xiàn),其出錯樣本都在分界面附近。針對這種現(xiàn)象,為了進一步提高識別率,本文在子分類器中結(jié)合使用了SVM和KNN兩種方法進行分類決策。KNN-SVM 方法的分類思想是:當樣本距SVM 最優(yōu)超平面的距離大于一定閾值ε即樣本離分界面較遠時,用SVM方法進行分類;反之即樣本離分界面較近時,用KNN方法對樣本進行分類。ε一般設定為0~1之間的常數(shù),可以看出當ε=0時,就僅用SVM算法進行分類。具體分類過程如圖5所示:
引入KNN算法不會增加SVM算法的時間復雜度,而且能減少SVM分類超平面附近樣本點的錯分率,從而提高分類器的準確率。
圖3 KNN-SVM方法的分類過程
設測試樣本集為T,由訓練得到的支持向量集為Tsv,k是KNN算法中最近鄰的個數(shù)。KNN-SVM分類算法偽代碼如下:
Step1: 如果Φ≠T,取Tx∈;否則,停止;
Step4: 從測試樣本集中減去樣本x即TxT→?,回到步驟1繼續(xù)。
其中,Step3中使用的KNN算法是將支持向量集Tsv作為分類算法的代表點集合的,且其計算測試樣本和每個支持向量的距離都是在特征空間中而不是原始空間中進行的,因此其使用的距離公式不能采用歐式距離公式,而是采用如下公式:
基于KNN-SVM的分類決策過程如圖4所示:
圖4 KNN-SVMs的決策過程
對所有子分類器的輸出結(jié)果利用投票法進行統(tǒng)計。投票統(tǒng)計的過程是:計算關于i類的子分類器分類結(jié)果,判斷測試樣本x是否在第i類:若在,則給第i類的票數(shù)加1。用同樣的方法遍歷所有類最后比較每個類所得的票數(shù),把測試樣本x歸類到票數(shù)最多的那類去。
實驗中,所采集數(shù)據(jù)是車道上的車輛的側(cè)面影像。然后通過運動車輛檢測算法從交通視頻序列中定位分割出車輛目標。最后將所分割出的車輛目標圖像的大小全部轉(zhuǎn)化為160*50(長*寬),就是本文所使用的標準車輛圖片。選取30幅車輛圖片(共 3類,每類 10幅)作為訓練樣本,15幅車輛圖片(共3類,每類5幅)作為測試樣本集1,將此測試樣本中的車輛圖片分別作旋轉(zhuǎn)、顏色調(diào)整、放大以及加入噪聲等變換,擴充測試樣本集的樣本數(shù)目到 30,得到測試樣本集 2、3、4、5。車輛圖像四種變換的效果如圖5所示:
圖5 車輛圖片四種變換效果圖
分別提取30幅訓練樣本集的PCA、PCA-LDA特征,其維數(shù)變化如表1所示:
表1 特征的維數(shù)變化
原始特征是車輛的灰度矩陣,轉(zhuǎn)換成向量形式后其特征維數(shù)為160*50=80000。分別用PCA方法和PCA-LDA方法進行二次特征提取,獲得的特征維數(shù)都大大降低,且PCA-LDA的特征維數(shù)僅為2。因此,在二維坐標系中用橫、縱坐標分別表示特征的第一、第二維數(shù)據(jù),30幅訓練樣本的分布情況如圖6所示:
圖6 訓練集樣本分布圖
從圖6中可以觀察到,訓練樣本集的分布符合不同類樣本點之間遠離,同類樣本點之間靠近的規(guī)律,可見PCA-LDA特征有很好的鑒別性能。
本文的子分類器使用C-SVM算法,核函數(shù)選取相對比較穩(wěn)定的高斯核函數(shù)懲罰因子 C和高斯核函數(shù)參數(shù)σ的選擇采用交叉驗證的思想,在 [2-10,210] 范圍內(nèi)進行參數(shù)尋優(yōu)。分別對測試集1、2、3、4、5進行分類,結(jié)果如表2所示。
表2 車型識別結(jié)果
從表2可以看出,經(jīng)過PCA-LDA特征提取優(yōu)化方法所提取的車型識別特征對車輛的變形、顏色變化、噪聲干擾都有較好的魯棒性,且識別率較高。
表3是車型識別速度。從表3中可以看出,經(jīng)過二次特征提取后獲得的識別特征,無論是PCA特征還是PCA-LDA特征,由于其維數(shù)大大降低,因此其分類識別的速度也有了大大提高。特別是PCA-LDA特征在分類識別率和識別速度方面都有很好的表現(xiàn)。
表3 車型識別速度
本文采用了基于統(tǒng)計模式識別的車型識別方法,在車型特征提取時,充分利用了LDA方法能夠獲得最佳鑒別特征的優(yōu)勢,提出了一種基于PCA-LDA的特征提取方法。同時,采用“一對一”策略構造了車型分類器1-V-1 SVMs,并基于KNN方法提高SVM子分類器分類準確率。實驗仿真結(jié)果證明了本文方法的有效性。
[1] Broggi A, Vehicles S. Intelligent Transportation Systems[C] . Citeseer, 2008: 2-7.
[2] Clady X, Negri P, Milgram M. Multi-class vehicle type recognition system[J] . Artificial Neural Networks in Pattern Recognition, 2008, 228-239.
[3] Fujiyoshi H,Kanade T. Algorithms for cooperative multisensor surveillance[J] . Proceedings of the IEEE,2001, 89(10):1456-1477.
[4] 袁志勇,查桂峰,陳綿云,張仁宏.基于反對稱小波的車型識別研究.武漢大學學報,2005,30(6):560-563.
[5] Chengcui Zhang, Xin Chen,Wei-bang Chen.A PCA-based Vehicle Classification Framework [J] . IEEE International Conference on Data Engineering Workshops, 2006:17-26.
[6] 郭娟,林冬,戚文芽.基于加權Fisher準則的線性鑒別分析及人臉識別.計算機應用,2006,26(5):1037-1039.
[7] Peter N, Belhumeur, Joao P. Hespanha, and David J.Kriegman. Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997,19(7):711-720.
[8] Cui B,Xue T,Yang K. Vehicle Recognition Based on Support Vector Machine[C] . International Symposium on Intelligent Information Technology Application Workshops, 2008:443-446.
[9] Gou B,Huang X.SVM multi-class classification [J] . Shuju Caiji yu Chuli(Journal of Data Acquisition & Processing,2006, 21(3):334-339.
[10] 李蓉,葉世偉,史忠植. SVM—KNN分類器:一種提高SVM分類精度的新方法[J] .電子學報,2002,30(5) :745-748.