楊鑫 趙靜 孫雨晴
摘要:文章根據(jù)交通流特性對采集到的交通流數(shù)據(jù)進行錯誤數(shù)據(jù)的鑒別、缺失數(shù)據(jù)的補充、以及遴選數(shù)據(jù)的歸一化等預處理操作,構(gòu)建基于支持向量機的短時交通流預測模型。通過對數(shù)據(jù)進行預測,并與實際測試數(shù)據(jù)進行對比發(fā)現(xiàn),支持向量機回歸模型在短時交通流預測方面是可行的。
關鍵詞:交通流;數(shù)據(jù)預測;支持向量機
一、交通流基本特征參數(shù)
研究交通流狀態(tài)需對實時交通流進行評價,即選取一些定性和定量指標,對交通流的基本特征參數(shù)進行比較全面的描述。
(一)速度
速度是指單位時間內(nèi)所行駛的距離,通常用 v表示,單位是距離/單位時間。在交通流的狀態(tài)描述中,速度通常有兩種方法:一種是指在特定觀測地點的速度,一般使用地點平均車速;另一種是指特定路段的車速情況,用于表現(xiàn)空間運行狀態(tài)的為路段的區(qū)間平均車速。地點平均車速是指具體道路上的某一個特定斷面在單位時間段內(nèi)所通過的所有車輛的瞬時速度的平均值;路段的區(qū)間平均車速是指該路段的長度與在該路段所通過所有車輛的平均行駛時間之比
(二)密度
密度是指在單位長度的道路上某一時間瞬時所行駛的車輛的總數(shù),通常用k表示,單位是輛/單位長度。由于密度是瞬時值,使用電子檢測相關設備并不容易獲得,同時也存在許多檢測困難。因此,密度一般會用車輛道路占有率替換。車輛道路占有率主要包括空間上的占有率與時間上的占有率。
(三)交通量
交通量是指在單位時間內(nèi)通過道路上的某一個路段截面的實際車輛數(shù),單位為輛/單位時間,通常用q表示,用來衡量城市道路交通狀態(tài)。
(四)宏觀上交通流的三個基本參數(shù)模型
交通流的三個基本參數(shù)是指流量、速度和密度。它們之間的關系反映為交通流的速度-密度模型、速度-流量模型與流量-密度模型。道路交通流基本參數(shù)關系模型是指流量q、速度v和密度k之間的關系,也可以通過以下的關系表達式來說明:
二、支持向量機理論基礎
(一)機器學習
機器學習是指專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以逐步完善自身的知識結(jié)構(gòu)體系。該模型通過研究與挖掘數(shù)據(jù)之間的內(nèi)在關系,找出其內(nèi)部規(guī)律,并利用這種規(guī)律對未來的數(shù)據(jù)進行有效預測。
(二)經(jīng)驗風險最小化
機器學習的根本目的是實現(xiàn)期望風險最小化。回歸估計解決問題的實質(zhì)是通過構(gòu)造可行的最優(yōu)函數(shù)的機器學習過程。由于事先并不知道數(shù)據(jù)集的真實聯(lián)合概率分布 F(x,y),因此測試樣本與預產(chǎn)生兩者之間的偏差即經(jīng)驗風險最小化準則的經(jīng)驗風險:
經(jīng)驗風險是指根據(jù)訓練樣本的數(shù)據(jù)和經(jīng)驗來確定的值,經(jīng)驗風險最小化原則是指用經(jīng)驗風險 Remp(w)最小化代替期望風險R(w)最小化來進行計算。
(三)支持向量機原理
支持向量機的基本思想是在高維空間中尋找超平面,從而達到樣本分類的目的,并使分類的間隔達到最大。因而應滿足:
利用對偶原理將拉格朗日函數(shù)轉(zhuǎn)化為求解如下泛函數(shù)的優(yōu)化問題:
三、支持向量機短時交通流建模
根據(jù)需要選擇及補充相應數(shù)據(jù),確定試驗的數(shù)據(jù)源。文章采用的是早高峰時段的流量數(shù)據(jù)以及對應的時段。
(二)通過對數(shù)據(jù)的分析來確定核函數(shù)以及懲罰因子和損失函數(shù)等相關系數(shù)。
(三)通過構(gòu)造最優(yōu)化問題,并輸入樣本值和預測值進行求解:
(四)由最優(yōu)解建立決策函數(shù),并使用測試集數(shù)據(jù)對未來時刻的交通量進行有效預測。
(五)應用MATLABl軟件中的LIBSVM工具進行訓練求解,得出短時交通流預測結(jié)果。
四、仿真結(jié)果分析
結(jié)合文章使用的支持向量機的短時交通流預測模型,對某段路早高峰實測數(shù)據(jù)進行預測,預測結(jié)果如圖1所示。
從上圖可以看出,整個回歸模型實現(xiàn)了良好預測,預測序列與原序列具有較好的擬合程度,并達到了一定的精度,這說明該模型具有可行性,并且在實際工程中具有良好的適用性。文章在探討核函數(shù)對短時交通流的預測效果時,對預測有影響的滯后時段d控制不變,同時實驗的數(shù)據(jù)選取的是早高峰階段即6:00—8:00的五分鐘流量數(shù)據(jù),控制了其他影響因素后來說明核函數(shù)的變化對預測效果的影響。
參考文獻
[1]姚智勝,邵春福.基于狀態(tài)空間模型的道路交通狀態(tài)多點時間序列預測[J].中國公路學報,2007(7):113-117.
[2]張學工.關于統(tǒng)計學習理論與支持向量機[J].自動化學報,2000(1):11.
[3]劉靜,關偉.交通流預測方法綜述[J].公路交通科技,2004(3):82-85.