唐世星
(承德石油高等??茖W校人事處,河北承德 067000)
改進的支持向量機算法在短時交通流預測中的應用
唐世星
(承德石油高等??茖W校人事處,河北承德 067000)
把交叉驗證和網(wǎng)格搜索算法引入支持向量機預測算法,建立了改進的支持向量機預測模型,并將其應用于短時交通流預測進行實證分析。以某城市道路的實時數(shù)據(jù)來對模型進行驗證,預測結果表明了該模型的有效性。
短時交通流預測;交叉驗證;網(wǎng)格搜索;懲罰因子
支持向量機是一種建立在統(tǒng)計學習理論的基礎之上發(fā)展起來的一種較好的機器學習方法,它根據(jù)有限的樣本信息在模型的復雜性和學習能力之間尋求最佳方案,以期獲得最好的泛化能力。同時,支持向量機將優(yōu)化問題轉化為凸規(guī)劃問題,所得局部最優(yōu)解即為全局最優(yōu)解。支持向量機已成為機器學習的新熱點,已被廣泛應用于模式識別、分類、回歸估計、聚類等領域,但在核函數(shù)參數(shù)、懲罰因子的選擇等問題上沒有統(tǒng)一的認識,仍需進一步研究。
交通流短時預測是實現(xiàn)智能交通控制和誘導系統(tǒng)的重要環(huán)節(jié),由于交通流量受諸多因素影響,使其具有非線性和不確定性[1-2]。本文在支持向量機預測模型中引入交叉驗證和網(wǎng)格搜索算法,優(yōu)化懲罰因子和核函數(shù)的參數(shù),建立了改進的支持向量機預測模型,并將其應用于短時交通流預測進行實證分析。通過與經(jīng)典的GM(1,1)模型和改進的GM(1,1)模型比較,表明該預測模型具有較高的預測精度,可用于短時交通流預測。
考慮l個獨立同分布的樣本數(shù)據(jù)點{xi,yi},其中xi∈Rm為輸入,yi∈R為輸出,i=1,2,…,l。支持向量回歸機是將樣本數(shù)據(jù){xi,yi}通過非線性函數(shù)φ(x)映射到高維特征空間{φ(xi),yi},然后在特征空間進行線性回歸,即構造最優(yōu)線性函數(shù):
其中,w為權重向量,b為偏置項,均為待定系數(shù)。
構造并求解如下優(yōu)化問題:
由于實際問題往往是非線性的,所以必須對線性情況進行拓廣,引入核函數(shù)K(w,x),通過求解其對偶問題來求解,即
上式(2)、(3)中的C為懲罰因子,是模型泛化能力和精度之間的一個參數(shù),ε為不敏感損失值(精度參數(shù))。求解可得最優(yōu)解,選擇的正分量,可得:
構造估計函數(shù):
即可對未知樣本進行回歸分析。
支持向量機常用的核函數(shù)有線性、多項式、徑向基RBF和Sigmoid核函數(shù)。核函數(shù)的選擇及其參數(shù)的確定決定了回歸分析的效果和復雜程度,由于核函數(shù)目前只有上述幾種,所以比較有效的一種方法是:選定核函數(shù),通過交叉驗證[4]搜索算法優(yōu)化懲罰因子和核函數(shù)的參數(shù),進而訓練支持向量機進行回歸預測,通過回歸的均方誤差(MSE)和相關系數(shù)來評價回歸效果,從而選擇最優(yōu)的懲罰因子和核函數(shù)及其參數(shù)。
本文以文獻[5]中的常熟市某無檢測器交叉口每5 min測得的交通流量為研究對象,利用建立的模型預測其短時交通流。該交通流量數(shù)據(jù)為{11,10,11,13,15,16,16,15},取前7個數(shù)據(jù)訓練模型,用第8個數(shù)據(jù)做模型交通流量預測;使用Matlab平臺和LibSVM做模型的算法實現(xiàn)。通過選擇不同的核函數(shù),并使用交叉驗證獲得優(yōu)化的懲罰因子和核函數(shù)參數(shù),可得到對應的回歸模型均方誤差和相關系數(shù)。比較可得,當核函數(shù)為RBF核函數(shù),核函數(shù)參數(shù)值為0.0625,懲罰因子值為90.509 7時,短時交通流預測效果最優(yōu);把文獻[4]和[5]的預測與本模型預測結果相比較,結果見表1。
由表1可知,改進的支持向量機模型擬合精度非常高,可以用于短期預測,并且得到第8個時間點的預測交通流量為15.0313,與實際交通流量相比其相對誤差僅為-0.21% <1%,顯然預測效果比較理想。短時交通流量的原始數(shù)據(jù)與本模型及文獻[6]的預測值對比圖見圖1。
表1 預測結果比較
本文結合交叉驗證和網(wǎng)格搜索算法,優(yōu)化懲罰因子和核函數(shù)參數(shù),建立了改進的支持向量機預測模型。通過Matlab軟件編程實現(xiàn)該模型,編寫了通用算法程序,計算過程簡單。通過對某無檢測器交叉口測得的短時交通流量進行實證分析和比較,證明本文所提出的預測模型是合格的,并且擬合精度較高,預測效果良好,可用于短時交通流量預測。但是,本模型的預測方案是完全數(shù)據(jù)驅動的,是定量的,具有一定的局限性。如何在該方法的基礎上附加一定的定性分析,彌補完全數(shù)據(jù)驅動的不足是需要繼續(xù)研究的課題。
[1] 劉靜,關偉.交通流預測方法綜述[J].公路交通科技,2004(3):82-85.
[2] 張孝利,陸化普.短時交通流預測特性及實例分析[J].公路交通科技,2009(26):62-68.
[3] 徐啟華,楊瑞.支持向量機在交通流量實時預測中的應用[J].公路交通科技,2005(22):131-134.
[4] 李鋒.基于舍一交叉驗證優(yōu)化最小二乘支持向量機的故障診斷模型[J].振動與沖擊,2010(29):170-174.
[5] 孫燕,陳森發(fā),周振國.灰色系統(tǒng)理論在無檢測器交叉口交通量預測中的應用[J].東南大學學報,2002,32(2):256-258.
[6] 柯鳳琴.一種改進的GM(1,1)模型在交通量預測中的應用[J].承德石油高等??茖W校學報,2010(12):44-47.
Application of Improved Support Vector Machine Algorithm in Short-term Traffic Flow Forecast
TANG Shi-xing
(Personnel Department,Chengde Petroleum College,Chengde 067000,Hebei,China)
The paper introduces cross-validation and grid-search method to optimize the prediction accuracy of Support Vector Machine models,the establishment of an improved Support Vector Machine prediction model,and applied to short-term traffic flow forecasting empirical analysis.The paper also uses the real time data of certain urban road to test the efficiency of the proposed model and the result is satisfactory.
short-term traffic flow forecasting;cross-validation;grid-search method;penalty factor
U495
A
1008-9446(2012)01-0034-03
河北省高等學校科學技術研究指導項目:Z2 010210
2011-10-19
唐世星(1981-),男,安徽碭山人,承德石油高等??茖W校人事處,講師,研究方向:數(shù)據(jù)挖掘和建模。