于 榮,王國祥,鄭繼媛,王海燕
(1.南京財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,南京210046;2.江蘇省質(zhì)量安全工程研究院,南京210046; 3.東南大學(xué)交通學(xué)院,南京210002)
基于支持向量機(jī)的城市道路交通狀態(tài)模式識別研究
于 榮1,王國祥1,鄭繼媛2,3,王海燕*2
(1.南京財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,南京210046;2.江蘇省質(zhì)量安全工程研究院,南京210046; 3.東南大學(xué)交通學(xué)院,南京210002)
城市道路交通狀態(tài)識別是現(xiàn)代智能交通系統(tǒng)的重要組成部分,是交通智能控制、誘導(dǎo)和協(xié)同系統(tǒng)的基礎(chǔ).基于支持向量機(jī)建立車流量、平均速度和占有率的三維反映空間,以堵塞流、擁擠流、平穩(wěn)流和順暢流為標(biāo)簽對道路交通狀態(tài)進(jìn)行分類;并在MATLAB平臺下利用LiBSVM工具包進(jìn)行實驗分析,對SVM各種核函數(shù)的分類效果進(jìn)行比較研究,實現(xiàn)了支持向量機(jī)技術(shù)的交通狀態(tài)模式識別.結(jié)果表明:選擇的指標(biāo)能很好地反映交通狀態(tài)的特征,SVM核函數(shù)可以以較高的分類精度區(qū)分開交通流的狀態(tài)識別,數(shù)據(jù)的歸一化對分類的結(jié)果具有重要的影響.
城市道路交通;交通狀態(tài);模式識別;支持向量機(jī);LiBSVM
城市道路交通狀態(tài)識別是現(xiàn)代智能交通系統(tǒng)(Intelligent Transportation System,ITS)的重要組成部分,通常是在道路交通數(shù)據(jù)實時采集的基礎(chǔ)上,通過各種判別算法實現(xiàn)對各類交通數(shù)據(jù)的分析,與先驗的交通狀態(tài)標(biāo)準(zhǔn)進(jìn)行比較,得到目前交通系統(tǒng)處于何種運行狀態(tài),并依據(jù)這個判別結(jié)果實現(xiàn)交通系統(tǒng)的智能控制、管理和誘導(dǎo)[1].實現(xiàn)快速有效的交通狀態(tài)識別,是實現(xiàn)城市交通實時智能、有效控制的重要保證.現(xiàn)階段對城市道路交通狀態(tài)分類識別的研究主要集中在兩個方面:一是道路交通狀態(tài)的分類研究,側(cè)重于面向交通實時數(shù)據(jù)的分類分析;二是基于先驗分類的交通狀態(tài)識別的研究,側(cè)重在對交通狀態(tài)識別方法的研究.
Adel W.Sadek[2]等學(xué)者將不同類型的交通網(wǎng)絡(luò)狀態(tài)定義為25個不同的案例,亦即25種模式. Francesco Palmieri[3]等學(xué)者針對交通網(wǎng)絡(luò)狀態(tài),提出了一種非線性、基于循環(huán)的交通分類方法,這種非線性的方法不容易受到動態(tài)的交通端口變化的影響,具有較好的穩(wěn)定性.Angélica Lozano[4]等基于K-means聚類分析算法,面向交通流實時數(shù)據(jù)分析,提出了一種在道路交通問題研究中的擁擠水平的識別算法.M.Montazeri-Gh[5]等面向駕駛環(huán)境狀態(tài)識別問題,基于K-means聚類分析提出了一種交通狀態(tài)識別的數(shù)學(xué)方法.Mohamed Abdel-Aty[6]等分析實時交通流參數(shù)和交通事故的相關(guān)關(guān)系,為識別事故車速和非事故車速,設(shè)計了一種基于神經(jīng)網(wǎng)絡(luò)的BAYES分類器.Andrzej Ruta[7]等針對實時交通信號識別問題,通過錄像分析圖像特定識別指標(biāo)的方法對交通狀態(tài)進(jìn)行識別和分析.美國道路通行能力手冊[8]中采用道路交通服務(wù)水平來描述車輛之間的運行條件及其駕駛員和乘客主觀感覺,分為A~F級,前三級交通一般認(rèn)為處于順暢的運行狀態(tài),E、F級處于擁擠狀態(tài).
同濟(jì)大學(xué)交通工程系ITS研究中心基于聚類分析方法對交通檢測器所采集的道路上的交通流基礎(chǔ)數(shù)據(jù)進(jìn)行分析,選擇的分類特征量為車流量、平均速度和占有率,將道路狀態(tài)分為四個類別:堵塞流、擁擠流、穩(wěn)定流、順暢流.并給出了具體的流量—密度關(guān)系曲線.李清泉等[9]運用模糊支持向量機(jī)的方法對城市交通狀態(tài)進(jìn)行了分類.主要對交通流狀態(tài)進(jìn)行分類,但其僅僅以道路交通車輛運行速度為特征參數(shù),將交通狀態(tài)劃分為暢通、基本暢通、擁擠、擁堵、堵塞五個層級.多數(shù)學(xué)者[10,11]在研究交通狀態(tài)分類識別過程中對交通流的分類研究取得了較為成熟的成果,通過案例推理、聚類分析等分析手段,將交通狀態(tài)分為不同等級進(jìn)行研究,為本文提供了良好的研究基礎(chǔ)和理論支撐.然而,在交通狀態(tài)的識別和模擬仿真方面,雖然有各種算法在交通領(lǐng)域應(yīng)用,但多數(shù)指標(biāo)體系選擇較為單一,在某種程度上并不能反映道路交通狀態(tài)的實際情況,為本文的進(jìn)一步研究提供了廣泛的空間.
在現(xiàn)代智能交通管理系統(tǒng)中,各種判別算法經(jīng)常被用來進(jìn)行交通狀態(tài)實時判斷.現(xiàn)有的檢測分類算法主要有四類,包括直接比較算法、時空預(yù)測算法、模式識別算法、人工智能算法等.本文將在前人狀態(tài)分類的基礎(chǔ)上,考慮交通多維特征進(jìn)行交通狀態(tài)定義和反映,基于模式識別算法中的支持向量機(jī)(Support Vector Machine,SVM)方法,實現(xiàn)對城市道路交通狀態(tài)的識別,并在MATALB下進(jìn)行數(shù)據(jù)實驗分析.
2.1 道路交通狀態(tài)特征參數(shù)的提取
在交通工程學(xué)的研究中,平均行駛速度、路段占有率、平均流量是反映交通流特征的重要參數(shù),城市路段、路口及路網(wǎng)等不同區(qū)域內(nèi),特定時段交通流在這些參數(shù)方面表現(xiàn)出不同的特性[12].綜合國內(nèi)外研究成果,本文選取道路交通參數(shù)中的車流量、平均速度和占有率3個特征參數(shù)[13],對相應(yīng)計算公式進(jìn)行適當(dāng)修訂,以符合仿真系統(tǒng)參數(shù)設(shè)置,據(jù)此構(gòu)建三維樣本空間,相關(guān)指標(biāo)定義如下:
(1)車流量:單車道2 min內(nèi)為各車型的車輛數(shù)目乘上相應(yīng)的車型比重后之和.計算公式為
式中 ni為t時段內(nèi)通過的第i類車的車輛數(shù);ωi為該類車輛折算系數(shù);本文定義t為2 min.為實現(xiàn)進(jìn)一步分析,并與既往研究成果相對應(yīng),將單位轉(zhuǎn)換為pcu/h.
(2)平均速度:單車道2 min內(nèi)所有機(jī)動車的平均速度,單位為mile/h.計算公式為
式中 v1——表示第1分鐘內(nèi)的平均速度;
v2——表示第2分鐘內(nèi)的平均速度;
f1——第1分鐘內(nèi)的流量;
f2——第2分鐘內(nèi)的流量.
(3)占有率:單車道2 min內(nèi)車輛在某點檢測器上的時間比例,單位為百分率.計算公式為
式中 ft——t時間段內(nèi)的流量;
lt——t時間段內(nèi)所有機(jī)動車量的車身長度;
vt——表示t時間段內(nèi)的平均速度;
t——時間間隔,此處為2 min.
2.2 城市道路交通狀態(tài)的定義
根據(jù)上述指標(biāo),結(jié)合現(xiàn)有理論研究成果,對城市道路交通狀態(tài)進(jìn)行聚類分析,相關(guān)聚類中心矩陣為
該矩陣第1行代表流量,單位為pcu/h,第2行代表速度,單位為mile/h,第3行代表占有率,單位百分率.
v1,v2,v3,v4分別代表堵塞流、擁擠流、平穩(wěn)流和暢通流聚類中心.
支持向量機(jī)(support vector machine)是Vapnik等人根據(jù)統(tǒng)計學(xué)理論提出的一種新的通用學(xué)習(xí)方法,它是建立在統(tǒng)計學(xué)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理的基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力,能夠較好地解決小樣本、非線性、高維數(shù)和局部極小點等實際問題[14].近年來SVM在理論研究和算法實現(xiàn)方面都取得了突破性進(jìn)展,并成功地應(yīng)用于分類、函數(shù)逼近和時間序列預(yù)測等方面[15].
在城市交通狀態(tài)識別中,結(jié)合交通的實際情況,定義觀測矩陣x=[流量,速度,占有率],選取適當(dāng)?shù)暮撕瘮?shù),并將觀測矩陣x帶入SVM判別函數(shù),實現(xiàn)狀態(tài)分類.
SVM方法是從線性可分情況下的最優(yōu)分類面提出的,它的求解分類器為
其中的 ai,i=1,2,…,n,是下列二次優(yōu)化問題的解
其中的b可通過使如下方程成立的樣本(即支持向量)求得:
對于線性不可分情況,SVM通過滿足Mercer條件的核函數(shù)代替原模式空間的向量數(shù)積運算以實現(xiàn)非線性變換,而不是顯式地使用非線性變換的具體形式,其實質(zhì)是將原模式空間變換為一個高維甚至無限維的Hilbert空間[16,17].如果對x進(jìn)行非線性變換,記新特征為z=φ(x),可以證明,無論變換的具體形式如何,變換對支持向量機(jī)的影響是把兩個在元特征空間中的內(nèi)積(xi·xj)變成了在新空間中的內(nèi)積(φ(xi)·φ(xj))[18].
記K(xi,xj)=(φ(xi)·φ(xj)),稱之為核函數(shù),則變換空間里的支持向量機(jī)可以寫成:
其中的系數(shù)α是下列優(yōu)化問題的解:
系數(shù)b通過使如下方程成立的樣本(即支持向量)求得:
目前常用的核函數(shù)有3類,分別是:
(1)多項式核函數(shù).
(2)徑向基(RBF)核函數(shù).
(3)sigmoid核函數(shù).
本文構(gòu)建的道路交通狀態(tài)識別體系是一個多類分類問題,由于傳統(tǒng)的支持向量機(jī)方法只考慮了二值分類的問題,所以需要對SVM模型進(jìn)行擴(kuò)展,建立多個支持向量機(jī)分類器.目前,構(gòu)造SVM多類分類器主要有兩類方法:一是直接法,直接在目標(biāo)函數(shù)上進(jìn)行修改,將多個分類面的參數(shù)求解合并到一個最優(yōu)化問題中,通過求解該最優(yōu)化問題一次性實現(xiàn)多類分類.這種方法計算復(fù)雜度比較高,實現(xiàn)起來比較困難,只適合用于小型問題中;另一類是間接法,主要是通過組合多個二分類器來實現(xiàn)多類分類器的構(gòu)造,本文利用LIBSVM工具箱,采用一對一方法進(jìn)行多類分類器的構(gòu)建.
本文設(shè)定交通流的堵塞流、擁擠流、平穩(wěn)流和順暢流,通過模擬的方法生成有關(guān)流量、平均速度和占有率數(shù)據(jù).每一種交通狀態(tài)生成50個樣本,共200組觀測數(shù)據(jù).并取每種狀態(tài)40個樣本作為訓(xùn)練數(shù)據(jù),10個數(shù)據(jù)作為檢測數(shù)據(jù).利用MATLAB的LIBSVM 工 具 箱[14,19],利 用 matlab 自 帶 的MAPMINMAX函數(shù)數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi),選取不同的核函數(shù)進(jìn)行訓(xùn)練和分類,具體結(jié)果如下:
圖1給出了樣本在各維度的分布情況,由box圖可見,數(shù)據(jù)中無異常點.
圖2給出了樣本在特征空間的分布情況,可見,在特征空間內(nèi),樣本分布呈現(xiàn)較好的聚類效果,說明該特征空間對樣本類別具有較好的區(qū)分效果.
圖1 樣本數(shù)據(jù)的可視化box圖Fig.1 Visualization box diagram of sample data
圖2 樣本在特征空間的分布情況Fig.2 Sample distribution in the feature space
圖3為利用多項式核函數(shù),采用歸一化的分類結(jié)果.由圖可見,測試集分類效果不甚理想.40個測試樣本中有12個被錯分,正確率為70%.
圖3 多項式核函數(shù)下歸一化數(shù)據(jù)分類結(jié)果Fig.3 Normalized data classification results under polynomial kernel function
圖4為利用多項式核函數(shù),不采用歸一化的分類結(jié)果,由圖可見,測試集分類效果很好.所有樣本均能正確分類,正確率為100%.
圖4 多項式核函數(shù)下未經(jīng)歸一化數(shù)據(jù)分類結(jié)果Fig.4 Unnormalized data classification results under polynomial kernel function
比較多項式核函數(shù)在歸一化和未歸一化的處理結(jié)果可見,數(shù)據(jù)歸一化對提高多項式核函數(shù)的分類效果無益,相比之下未歸一化的數(shù)據(jù)分類效果更為理想.
圖5為利用RBF核函數(shù),采用歸一化的分類結(jié)果,c=2,g=1,由圖可見,測試集分類效果很好.所有樣本均能正確分類,正確率為100%.
圖5 RBF核函數(shù)下歸一化數(shù)據(jù)分類結(jié)果Fig.5 Normalized data classification results under RBF kernel function
圖6為利用RBF核函數(shù),不采用歸一化的分類結(jié)果,其中c=2,g=1,由圖可見,測試集分類效果很不好.只有10個樣本被正確分類,分類正確率25%.
圖7為利用Sigmoid核函數(shù),采用歸一化的分類結(jié)果,由圖可見,測試集分類效果很好.所有樣本均能正確分類,正確率為100%.
圖6 RBF核函數(shù)下未經(jīng)歸一化數(shù)據(jù)分類結(jié)果Fig.6 Unnormalized data classification results under RBF kernel function
圖7 Sigmoid核函數(shù)下歸一化數(shù)據(jù)分類結(jié)果Fig.7 Normalized data classification results undersigmoid kernel function
圖8 Sigmoid核函數(shù)下未經(jīng)歸一化數(shù)據(jù)分類結(jié)果Fig.8 Unnormalized data classification results undersigmoid kernel function
圖8為利用Sigmoid核函數(shù),不采用歸一化的分類結(jié)果,由圖可見,測試集分類效果很不好.只有10個樣本被正確分類,分類正確率25%.
比較上述結(jié)果,可見,RBF和函數(shù)和Sigmoid核函數(shù)對歸一化之后的數(shù)據(jù)具有良好的分類效果,而對未進(jìn)行歸一化的數(shù)據(jù)分類效果不理想.從以上結(jié)果我們可以看出不同SVM核函數(shù)的參數(shù)設(shè)置及分類結(jié)果的不同,具體的比較如表1所示.
表1 不同SVM核函數(shù)參數(shù)設(shè)置及分類結(jié)果的比較Table1 Parameters setting and classification results comparison among different SVM kernel functions
本文通過文獻(xiàn)研究和仿真實際,構(gòu)建了城市道路交通單車道流量、平均速度、占有率的三維參數(shù)體系,并根據(jù)該指標(biāo)將道路交通劃分為堵塞流、擁擠流、平穩(wěn)流和順暢流,在MATLAB平臺下進(jìn)行SVM算法實驗分析,完成交通狀態(tài)分類識別,得到的主要結(jié)論如下:
(1)選取城市道路交通單車道流量、平均速度、占有率來反映交通運行狀態(tài),并根據(jù)該指標(biāo)將道路交通劃分為堵塞流、擁擠流、平穩(wěn)流和順暢流,不僅反映了交通流中的重要參數(shù),同時可以作為交通狀態(tài)有效識別的特征參數(shù).
(2)通過比較各種類型的SVM核函數(shù),發(fā)現(xiàn)在利用單車道流量、平均速度、占有率三個指標(biāo)及堵塞流、擁擠流、平穩(wěn)流和順暢流四類分類標(biāo)簽下,是否進(jìn)行數(shù)據(jù)與處理及使用SVM各種核函數(shù)的分類結(jié)果可見,使用各種核函數(shù)均可以具有較高的分類精度,說明利用該分類標(biāo)簽及指標(biāo)進(jìn)行分類具有很好的應(yīng)用效果.
(3)數(shù)據(jù)的歸一化對SVM分類具有重要影響.通過比較歸一化數(shù)據(jù)與未經(jīng)歸一化數(shù)據(jù)在不同核函數(shù)下的分類結(jié)果可見,相同參數(shù)設(shè)置條件下, RBF核函數(shù)和Sigmoid核函數(shù)對歸一化數(shù)據(jù)具有良好的分類效果,而多項式核函數(shù)則對未經(jīng)歸一化數(shù)據(jù)分類效果明顯.
[1]皮曉亮,楊曉光,孫亞.基于環(huán)形線圈檢測器采集信息的交通狀態(tài)分類方法應(yīng)用研究[J].華東公路, 2006(1):33-38.[PI X L,YANG X G,SUN Y. Application research oftraffic state classification method based on collected Information from loop detector[J].East China Highway,2006(1):33-38.]
[2]Adel W Sadek,Michael J Demetsky,Brain L Smith. Case-based reasoning for real time traffic flow management[J]. Computer-Aided Civil and Infrastructure Engineering,1999,14:347-356.
[3]Francesco Palmieri,Ugo Fiore.A nonlinear recurrencebased approach to traffic classification[J].Computer Networks,2009,53(6):761-773.
[4]Angélica Lozano,Giuseppe Manfredi,Luciano Nieddu. An algorithm for the recognition of levels of congestion in road traffic problems[J].Matherematics and computers in simulation,2009,76(6):1926-1934.
[5]M.Montazeri-Gh,A Fotouhi. Trafficcondition recognition using the k-means clustering method[J]. Transportation Research B:Mechanical Engineering, 2011,18(4):930-937.
[6]Mohamed Abdel-Aty,Anurag Pande.Identifying crash propensity using specific traffic speed conditions[J]. Journal of Safety Research,2005,36(1):91-108.
[7]Andrzej Ruta,Yongmin Li,Xiaohui Liu.Real-time traffic sign recognition from video by class-specific discriminative features[J]. Pattern Recognition, 2010,43(1):416-430.
[8]美國交通研究委員會.道路通行能力手冊[M].人民交通出版社,2007.[U S Transportation Research Board.Highway capacity manual[M].China Communications Press,2007.]
[9]李清泉,高德荃,楊必勝.基于模糊支持向量機(jī)的城市道路交通狀態(tài)分類[J].吉林大學(xué)學(xué)報(工學(xué)版), 2009,39:131-134.[LI Q Q,GAO D Q,YANG B S. Urban road traffic status classification based on fuzzy support vector machines[J].Journal of Jilin University (Engineering and Technology Edition),2009,39:131-134.]
[10]李志恒,孫東,靳雪翔,等.基于模式的城市交通狀態(tài)分類與性質(zhì)研究[J].交通運輸系統(tǒng)工程與信息, 2008,8(5):83-87.[LI Z H,SUN D,JIN X X et,al. Pattern-Based study on urban transportation system states and properties with fuzzy reasoning methods[J]. Journal of Transportation Systems Engineering and Information Technology,2008,8(5):83-87.]
[11]任江濤,歐曉凌,張毅,等.交通狀態(tài)模式識別研究[J].公路交通科技,2003,20(2):63-67.[REN J T, OU X L,ZHANG Y,et al.Pattern recognition of traffic states[J].Journal of Highway and Transportation Research and Development,2003,20(2):63-67.]
[12]Kannal L.Patterns in pattern recognition:1968-1974 [J].IEEE Trans.on Information Theory,1974,20 (6).
[13]李作敏.交通工程學(xué)[M].人民交通出版社,2000. [LI Z M. Traffic engineering[M]. China Communications Press,2000.]
[14]楊淑瑩.模式識別與智能計算——MATLAB技術(shù)實現(xiàn)[M].電子工業(yè)出版社,2011.[YANG S Y.Pattern recognition and intelligentcomputing——MATLAB technologyrealization[M].Publishing House of Electronics Industry,2011.]
[15]JP Marques de Sá著,吳逸飛譯.模式識別——原理方法及應(yīng)用[M].清華大學(xué)出版社,2002.[JP Marques de Sá,WU Y F.Pattern recognition——Principle,method and application[M].Tsinghua University Press,2002.]
[16]孫即祥.現(xiàn)代模式識別[M].高等教育出版社, 2008.[SUN J X.Modern pattern recognition[M]. Higher Education Press,2008.]
[17]Richard O Duda,Peter E Hart,David G Stork著,李宏東等譯.模式分類[M].電子工業(yè)出版社,2010. [Richard O Duda,Peter E Hart,David G Stork,LI H D.Pattern classification[M].Publishing House of Electronics Industry,China CITIC Press,2010.]
[18]張學(xué)工.模式識別(第三版)[M].清華大學(xué)出版社, 2010.[ZHANG X G.Pattern recognition(Third edition)[M].Tsinghua University Press,2010.]
[19]Chih-Wei Hsu,Chih-Chung Chang,Chih-Jen Lin.A practical guide to support vector classification[EB/ OL].http://www.csie.ntu.edu.tw/~cjlin.
Urban Road Traffic Condition Pattern Recognition Based on Support Vector Machine
YU Rong1,WANG Guo-xiang1,ZHENG Ji-yuan2,3,WANG Hai-yan2
(1.School of Management Science and Engineering,Nanjing University of Finance and Economics,Nanjing 210046,China; 2.Jiangsu Province Institute of Quality and Safety Engineering,Nanjing 210046,China; 3.School of Transportation,Southeast University,Nanjing 210002,China)
As an important part of the modern intelligent transportation system,urban transport condition recognition is the base of intelligent control,guidance and synergy system.This paper establishes a threedimensional space with traffic volume,average speed and occupation ratio.It then classifies transportation condition patterns in terms of blocking flow,crowded flow,steady flow and unhindered flow based on wide literature review.Furthermore,this paper presents the algorithm with the MATALB LiBSVM toolbox.To process the data,this paper compares the classification result of different SVM kernel functions and thus realizes the transport condition pattern recognition via the support vector machine(SVM).The results reveal that the selected indexes effectively reflect the characteristics of the traffic conditions.The SVM kernelfunction can separate different patterns from traffic flows with high classification accuracy,and the data normalization has a significant influence on the result of classification.
urban road traffic; traffic state; pattern recognition; supportvectormachine (SVM);LiBSVM
U491
A
U491
A
1009-6744(2013)01-0130-07
2012-09-25
2012-11-09錄用日期:2012-11-30
美國能源基金會資助項目(G-1208-16658).
于榮(1985-),女,江蘇東海人,講師,博士.
*通訊作者:njue2010@163.com