姚衛(wèi)紅,方仁孝,張旭東
(大連理工大學 計算機科學與技術(shù)學院,遼寧 大連 116024)
準確、可靠的道路交通流量信息是智能交通系統(tǒng)中交通控制和信息管理的重要組成部分.在每天的車輛出行高峰時段,不準確的交通流量信息會增加出行者時間,造成道路擁堵、能源消耗和環(huán)境污染,所以高峰時段準確的交通流量預測就顯得尤為重要[1-3].
傳統(tǒng)的交通流量預測模型有基于數(shù)學測定方法的自回歸移動平均方法(ARIMA)模型、卡爾曼濾波模型和非線性回歸模型[4].這些模型有計算簡單、速度快的優(yōu)點,但是它們不能處理交通流量信息的不確定性和非線性的復雜特征.目前常用的交通流量預測模型有基于知識發(fā)現(xiàn)的智能模型,如模糊理論、小波理論和ANN 人工神經(jīng)網(wǎng)絡[5].ANN 模型由于其無先驗性地解決高復雜度問題的良好性能在交通流量預測領(lǐng)域取得了一定的成果.但ANN 是基于經(jīng)驗風險最小化的,存在收斂速度慢和訓練誤差非凸的問題,難以求得最優(yōu)解[3].
支持向量機(SVM)最早是為了解決模式識別和分類問題的,隨著Vapnik的ε不敏感損失函數(shù)的引入,SVM 開始用于解決非線性回歸估值問題,稱之為支持向量回歸(SVR).SVR 能很好地解決小樣本、非線性和高維的問題,已經(jīng)成功地用于交通系統(tǒng)領(lǐng)域的預測[2-3].然而,SVR 模型不能得到準確的預測結(jié)果是因為SVR 模型中參數(shù)組合C、ε和σ的值設置得不準確.傳統(tǒng)的人工選擇和網(wǎng)格遍歷的方法存在主觀經(jīng)驗判斷和尋優(yōu)時間長的缺點,并不能得到好的效果,但是運用智能的選擇進化算法(如ACO、PSO 和AFS 等)優(yōu)化SVR參數(shù)能選擇到合適的回歸參數(shù)[6-7].每 種 智能進化算法都有各自的優(yōu)缺點.研究表明,采用混合優(yōu)化算法比采用單一優(yōu)化算法能取得更好的預測結(jié)果[8-9].
本文針對AFS算法的初始參數(shù)設置較多和步長因子的設置對尋優(yōu)性能的影響的缺點,提出采用PSO 算法公式改進AFS算法,減小步長因子對AFS算法的影響,并且引入混沌機制初始化魚群位置,來進行SVR 的參數(shù)選擇,建立混沌粒子群人工魚群混合優(yōu)化SVR 的CPSOAFS-SVR交通流量預測模型.
SVR 的核心思想是基于結(jié)構(gòu)風險最小化原則,通過定義一個非線性映射將輸入數(shù)據(jù)集映射到高維特征空間,在這個高維特征空間存在一個線性函數(shù)f能夠明確地表示輸入數(shù)據(jù)集和輸出數(shù)據(jù)集之間的非線性關(guān)系.SVR 函數(shù)定義如下:
式中:f決定預測值,φ(·)為映射函數(shù),x為輸入數(shù)據(jù)向量,w和b分別為高維特征空間中的向量和常數(shù),兩者的值可以通過下式求得:
式中:C為懲罰系數(shù),ε為不敏感損失函數(shù)的最大誤差系數(shù),ζ+i和ζ-i為松弛系數(shù),n為輸入數(shù)據(jù)的樣本個數(shù).SVR 致力于求解高維特征空間的最優(yōu)超平面,使得輸入輸出數(shù)據(jù)集之間的整體誤差最小.
通過求解上述帶不等式約束的二次優(yōu)化問題,可以得到式(1)中的參數(shù)向量w的值:
其中β*i和βi分別為運用拉格朗日乘子法求解二次優(yōu)化問題的拉格朗日系數(shù).最后SVR 問題就得到如下方程:
其中K(·)為計算高維特征空間中的兩個輸入向量內(nèi)積的核函數(shù).本文采用Gauss函數(shù)K(xi,xj)=exp(-xi-xj2/2σ2)作為模型的核函數(shù).
SVR 模型中參數(shù)組合C、ε和σ的值的選擇影響預測的精度,所以建立優(yōu)化的交通流量預測模型就需要選取最優(yōu)的參數(shù)組合來最小化實際值和預測值之間的誤差[7].
人工魚群(AFS)算法是由李曉磊于2003年提出的通過模擬自然界中魚群的行為得到的一種群智能優(yōu)化算法[10].每條人工魚代表D維空間中的一個點xi,人工魚個體所在位置的適應度為Fi,本文的交通流量預測致力于Fi最小化.兩條人工魚之間的距離為xi-xj,其他的參數(shù)包含魚群個數(shù)n、視野v、步長s和擁擠度δ.每條人工魚通過模擬魚的覓食、聚群、追尾和隨機行為尋找最優(yōu)適應度來進行搜索優(yōu)化過程.
(1)覓食行為
覓食行為是人工魚趨向較優(yōu)適應度的基本行為.其計算公式為
式中:r1和r2分別代表隨機變量區(qū)間[0,1]和[-1,1],xi代表第i條人工魚位置信息,F(xiàn)j為xi在視野范圍內(nèi)隨機移動到另一位置xj的適應度.若反復嘗試若干次后,仍不滿足前進條件,則隨機移動一步.
(2)聚群行為
聚群行為是人工魚個體在游動過程中為了趨利避害,自然地聚集成群向鄰居中心移動的行為.其計算公式為
其中ns為當前視野范圍內(nèi)的鄰居數(shù)目,xc代表所有鄰居的聚集群體的中心位置.當xc的適應度優(yōu)于當前xi位置的適應度,并且魚群不太擁擠時,xi就向中心位置移動.否則,執(zhí)行覓食行為.
(3)追尾行為
追尾行為是一種向著附近的有更優(yōu)適應度的人工魚移動的行為.其計算公式為
其中xmin代表視野范圍內(nèi)的最優(yōu)適應度的人工魚所在位置.當xmin的適應度優(yōu)于當前xi位置的適應度,并且魚群不太擁擠時,xi就向最優(yōu)適應度位置移動.否則,執(zhí)行覓食行為.
另外,AFS算法設置了公告牌來記錄最優(yōu)狀態(tài)和當前迭代的最優(yōu)人工魚位置信息.
PSO 算法是一種廣泛用于解決數(shù)值優(yōu)化問題的群智能優(yōu)化算法.PSO 算法假設解空間內(nèi)的每個位置為一個粒子,每個粒子具有由被優(yōu)化函數(shù)確定的適應度,同時每個粒子按照一定的搜索規(guī)則和較優(yōu)適應度方向?qū)ψ陨淼乃俣燃拔恢眠M行調(diào)整來求得最優(yōu)解.PSO 算法的速度和位置更新公式為
式中:vj為粒子當前速度,vj+1為更新后的粒子速度,ω為 速 度 慣 性 權(quán) 重,c1和c2為 加 速 系 數(shù),r1和r2為區(qū)間(0,1)內(nèi)的隨機數(shù),xj和xj+1分別為粒子的當前位置和更新后的位置,pbj為粒子當前自身最優(yōu)位置,gbj為粒子當前全局最優(yōu)位置.
AFS算法初始參數(shù)的設置對算法性能有一定的影響.AFS算法的步長因子限制了人工魚個體的移動步長,如果步長太小就將個體魚限制在較小搜索空間,增大了尋優(yōu)時間;如果步長太大,則可能找不到最優(yōu)值.并且步長因子依賴于人工魚之間距離的計算,對算法性能影響較大[10-11].
針對上述步長因子對AFS算法性能影響的問題,本文使用PSO 算法公式改進AFS算法,以減小步長因子對AFS 算法性能的影響.AFS 算法中魚的覓食、聚群和追尾行為的式(5)、(6)和(7)修改為如下新的公式:
這樣AFS算法中的人工魚個體就可以像PSO算法中的粒子一樣,只依賴于視野因子而不依賴于步長因子進行游動行為的選擇,尋求最優(yōu)解.
混沌(chaotic)是非線性系統(tǒng)中普遍存在的現(xiàn)象,具有確定性和遍歷性的特點.在群智能算法中,混沌機制的運用能夠提高種群的多樣性,進而避免算法出現(xiàn)過早收斂現(xiàn)象,增大搜索到全局最優(yōu)的性能[7,12].本文選取Logistic映射方法混沌初始化人工魚群位置,從而尋求SVR 參數(shù)全局最優(yōu)組合.選取的混沌初始化映射方法公式為
其中μ為控制參數(shù),對系統(tǒng)狀態(tài)起關(guān)鍵作用.當μ=4時,系統(tǒng)處于完全混沌狀態(tài).
本文運用PSO 公式機制優(yōu)化AFS的混合優(yōu)化算法優(yōu)化SVR,建立了混沌粒子群人工魚群混合優(yōu)化SVR 的CPSOAFS-SVR 交通流量預測模型.模型具體流程如圖1所示.具體實現(xiàn)步驟如下:
圖1 CPSOAFS-SVR 交通流量預測模型Fig.1 CPSOAFS-SVR traffic flow forecasting model
步驟1 數(shù)據(jù)集設置和參數(shù)初始化.將交通流量數(shù)據(jù)分為訓練集和測試集,進行數(shù)據(jù)預處理.設置SVR 的參數(shù)C、ε和σ的取值范圍以及PSO和AFS算法的初始參數(shù).混沌初始化人工魚群位置.
步驟2 計算魚群的初始適應度.根據(jù)訓練集訓練SVR 模型,選出當前最優(yōu)并記錄初始全局最優(yōu)的人工魚的狀態(tài),即參數(shù)組合(C,ε,σ).
步驟3 人工魚行為選擇.每條人工魚分別執(zhí)行混合魚群算法的覓食、聚群、追尾和隨機行為,更新人工魚個體的位置信息,保存全局最優(yōu)值以及對應的SVR 參數(shù)組合.
步驟4 算法的終止判斷.判斷是否達到魚群的最大迭代次數(shù),若不滿足則迭代次數(shù)加1,跳轉(zhuǎn)至步驟3繼續(xù)執(zhí)行;若滿足則輸出魚群的最優(yōu)適應度和最優(yōu)值對應的SVR 參數(shù)組合,建立CPSOAFS-SVR交通流量預測模型,并用于測試集的回歸測試,檢驗測試性能.
本文分別采用混沌PSO 優(yōu)化SVR(CPSOSVR)模型和混沌AFS 優(yōu)化SVR(CAFS-SVR)模型作為參考模型,進行對比仿真實驗.
本文采用加利福尼亞高速公路性能評估系統(tǒng)(PeMS)采集的實際交通流量數(shù)據(jù)作為實驗數(shù)據(jù)來源,數(shù)據(jù)樣本時間間隔為5 min.實驗選取1d中的早6:00~10:00 的交通流量作為實驗數(shù)據(jù)集.實驗數(shù)據(jù)采用工作日情境下的5個站點數(shù)據(jù),每個站點的訓練集有576個數(shù)據(jù),預測第25d的48個數(shù)據(jù).
實驗采用歷史時間序列的交通流量數(shù)據(jù)預測未來時刻的交通流量.設xi(t)為路段i上t時刻的交通流量,實驗采用前5個時間段的交通流量xi(t-5)、xi(t-4)、xi(t-3)、xi(t-2)和xi(t-1)作為輸入,xi(t)作為模型的預測輸出[3].
為綜合比較各模型的仿真實驗結(jié)果和預測性能,實驗采用均方誤差ems、平均絕對百分誤差emap和均方根誤差erms共3個評價指標:
其中yi表示實際值,y*i表示預測值,n為測試樣本個數(shù).評價指標值越小,預測性能越好.
實驗的初始參數(shù)設置如表1所示.混合PSOAFS優(yōu)化算法中參數(shù)與PSO 和AFS算法中的相同.
表1 初始參數(shù)設置Tab.1 Initial parameter settings
本實驗 利 用libsvm-3.17 Matlab工具箱[13]實現(xiàn)了基于上述各算法優(yōu)化支持向量回歸的交通流量預測模型.表2給出了站點1各個模型下選取的SVR 的參數(shù)C、ε和σ的最優(yōu)組合.
表2 站點1各個模型的參數(shù)優(yōu)化結(jié)果Tab.2 Parameter optimization results for each model on site 1
圖2顯示了站點1 的測試樣本在CPSOSVR、CAFS-SVR 和CPSOAFS-SVR模型下的預測值與實際值,表3給出了3個對比模型的評價結(jié)果.如圖2和表3所示,CPSO-SVR 和CAFS-SVR 模型預測結(jié)果相近,而本文提出的CPSOAFS-SVR 模 型 比CPSO-SVR 和CAFSSVR 模型的emap分別減小了8.9%和8.1%,提高了預測精度,證明了CPSOAFS-SVR 模型的準確性.
更一般的,分別對5個站點的數(shù)據(jù)集進行實驗,因為emap最能反映預測性能,所以表4給出了5個站點的emap.結(jié)果顯示,在不同站點的測試數(shù)據(jù)集情況下,CPSOAFS-SVR 模型都有最優(yōu)的預測結(jié)果,其emap平均值為4.108%,比CPSO-SVR模型(emap平均值為4.312%)和CAFS-SVR 模型(emap平均值為4.274%)分別 減小了5.0%和4.0%,從而證明了CPSOAFS-SVR 模型的健壯性.
圖2 站點1各個模型的實際值與預測值Fig.2 Actual and predicted values for each model on site 1
表3 站點1各個模型的評價結(jié)果Tab.3 Evaluation results for each model on site 1
表4 5個站點的emap結(jié)果對比Tab.4 Comparison of 5sites′emapresults
準確的交通流量預測對交通控制系統(tǒng)是至關(guān)重要的,特別是在針對車流高峰期避免碰撞和提高交通效率方面.本文提出將基于混沌初始化機制的混合人工魚群算法優(yōu)化SVR 的預測方法,應用到交通流量預測領(lǐng)域來研究模型的可行性.仿真結(jié)果表明,提出的CPSOAFS-SVR 交通流量預測模型比單一的PSO 和AFS 優(yōu)化SVR 模型有更好的預測性能.模型良好的預測結(jié)果歸功于用PSO 算法減小了AFS 算法中步長因子的影響,從而選出更優(yōu)的SVR 參數(shù)組合,并且混沌初始化機制的運用能夠更好地搜索解空間,取得最優(yōu)預測值.未來將研究一些其他的混合群智能優(yōu)化算法來更有效地解決交通流量預測問題.
[1] Vlahogianni E I,Karlaftis M G,Golias J C.Shortterm traffic forecasting:Where we are and where we′re going[J].Transportation Research Part C :Emerging Technologies,2014,43:3-19.
[2] 姚智勝,邵春福,高永亮.基于支持向量回歸機的交通狀態(tài)短時預測方法研究[J].北京交通大學學報,2006,30(3):19-22.YAO Zhi-sheng,SHAO Chun-fu,GAO Yongliang.Research on methods of short-term traffic forecasting based on support vector regression[J].Journal of Beijing Jiaotong University,2006,30(3):19-22.(in Chinese)
[3] Castro-Neto M,Jeong Y S,Jeong M K,etal.Online-SVR for short-term traffic flow prediction under typical and atypical traffic conditions [J].Expert Systems with Applications,2009,36(3Part 2):6164-6173.
[4] Smith B L,Williams B M,Keith Oswald R.Comparison of parametric and nonparametric models for traffic flow forecasting [J].Transportation Research Part C:Emerging Technologies,2002,10(4):303-321.
[5] Vlahogianni E I,Karlaftis M G,Golias J C.Optimized and meta-optimized neural networks for short-term traffic flow prediction:A genetic approach[J].Transportation Research Part C :Emerging Technologies,2005,13(3):211-234.
[6] Hong W C,Dong Y,Zheng F,etal.Forecasting urban traffic flow by SVR with continuous ACO[J].Applied Mathematical Modelling,2011,35(3):1282-1291.
[7] Hong W C.Traffic flow forecasting by seasonal SVR with chaotic simulated annealing algorithm[J].Neurocomputing,2011,74(12-13):2096-2107.
[8] Fang N,Zhou J,Zhang R,etal.A hybrid of real coded genetic algorithm and artificial fish swarm algorithm for short-term optimal hydrothermal scheduling[J].International Journal of Electrical Power and Energy Systems,2014,62:617-629.
[9] 姚祥光,周永權(quán),李詠梅.人工魚群與微粒群混合優(yōu)化算法[J].計算機應用研究,2010,27(6):2084-2086,2102.YAO Xiang-guang,ZHOU Yong-quan,LI Yongmei.Hybrid algorithm with artificial fish swarm algorithm and PSO [J].Application Research of Computers,2010,27(6):2084-2086,2102.(in Chinese)
[10] 李曉磊.一種新型的智能優(yōu)化方法——人工魚群算法[D].杭州:浙江大學,2003.LI Xiao-lei.A new intelligent optimization method—artificial fish school algorithm [D].Hangzhou:Zhejiang University,2003.(in Chinese)
[11] Tsai H C,Lin Y H.Modification of the fish swarm algorithm with particle swarm optimization formulation and communication behavior [J].Applied Soft Computing Journal,2011,11(8):5367-5374.
[12] LI Ming-wei,Hong Wei-chiang,KANG Hai-gui.Urban traffic flow forecasting using Gauss-SVR with cat mapping,cloud model and PSO hybrid algorithm[J].Neurocomputing,2013,99:230-240.
[13] Chang C C,Lin C J.LIBSVM:A library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology,2011,2(3):27.