辜麗瓊 宋祖康 楊陽
摘要:隨著機動車數(shù)量的迅猛增加,城市交通擁堵狀況日益嚴峻,城市道路擁堵嚴重影響著居民的日常工作和生活,因此研究道路擁堵程度,以及對道路擁堵變化進行預測則顯得尤為重要。為此,構(gòu)建一個基于擁堵指標的MM-SVR模型,在考慮下一時段可能到達路段的潛在車流量情況下,對道路擁堵情況進行深入探究。首先,融合速度、區(qū)域內(nèi)交通流量構(gòu)建道路擁堵程度指標,然后基于歷史數(shù)據(jù)構(gòu)建將馬爾科夫鏈與支持向量機預測相結(jié)合的MM-SVR模型對道路擁堵進行預測,以向前"階狀態(tài)的交通流量和速度作為輸入量,將道路擁堵程度指標作為輸出量。在實例驗證中,使用廣州市某片區(qū)的實時交通流數(shù)據(jù)對模型效果進行評測,并且使用SVR以及Adaboosting模型進行對比實驗。實驗結(jié)果表明,該模型無論是在擬合優(yōu)度還是預測誤差上均優(yōu)于對比模型,在實時反映交通流擁堵情況方面有著良好表現(xiàn)。
關(guān)鍵詞:MM-SVR;時間序列;交通流;交通擁堵預測
DOI:10.11907/rjd k.191224
中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2019)012-0061-04
0引言
如今,日益擁堵的交通已經(jīng)嚴重影響到人們的工作與生活,因此如何改善交通問題,加快城市現(xiàn)代化建設(shè)已成為一個亟待解決的問題。作為大數(shù)據(jù)時代解決交通問題的重要手段,智能交通系統(tǒng)開始得到越來越多人的重視。在智能交通系統(tǒng)中,交通指標構(gòu)建以及交通流的描述與預測是一個關(guān)鍵組成部分。如王妍穎等融合速度與車流量指標,構(gòu)建北京擁堵指標體系,并對北京交通的真實情況進行指標分析;鄭淑鑒等列舉國內(nèi)外交通擁堵評價指標計算方法,系統(tǒng)梳理了交通流指標現(xiàn)有研究成果,并對眾多指標進行對比分析,搭建了一個比較完整的指標體系。在交通流預測方面的主要研究方向是短時間交通流預測,作為大密度、短間隔的時間序列,短時交通流具有非平穩(wěn)與非線性特征。當前,對于交通流的預測方法主要有馬爾科夫鏈、ARIMA、灰色系統(tǒng)與元胞自動機等傳統(tǒng)模型,以及基于機器學習的SVM、Adaboosting等模型。其中,梁經(jīng)韻等在經(jīng)典單路段元胞自動機交通流模型基礎(chǔ)上,將多個路段視為一個道路系統(tǒng),發(fā)現(xiàn)擁堵路段與非擁堵路段之間存在明顯界限的現(xiàn)象;唐毅等根據(jù)高速公路車流量數(shù)據(jù),提出一種改進時間序列模型,克服了傳統(tǒng)時間序列模型的不足;黃何列等針對常用聚類算法效果不理想的情況,提出一種新的交通流相似性度量準則——最大偏差相似性準則,并通過實驗證明該算法明顯優(yōu)于常用聚類算法;傅貴等利用支持向量機回歸理論對廣州市交通流監(jiān)測系統(tǒng)進行實驗,實驗結(jié)果的預測誤差小于基于卡爾曼濾波的預測方法;王珂等提出一種基于灰色遺傳支持向量機的短時交通流預測模型,首先運用灰色模型對交通流時間序列進行加工處理,以弱化噪聲影響,之后通過支持向量機進行預測;康軍等提出一種在線短時交通流預測方法,通過線性運算完成Lagrange乘子的更新,將在線LS-SVM模型的更新時間減少了約62.64%。以上研究證明了SVM模型在交通流預測方面的優(yōu)良性能。
綜上,大部分學者利用車流速度以及當前道路車流量研究道路擁堵情況,并取得了一定成果。但是交通流數(shù)據(jù)具有數(shù)量大、密度高且非平穩(wěn)的特征,僅用傳統(tǒng)時間序列理論進行計算,時間復雜度較高,而基于機器學習的擁堵情況預測研究,雖然改善了時間復雜度,但大都基于交通流這一基本面預測交通擁堵情況。在實際情況中,交通擁堵問題不僅取決于交通流大小,也與道路容納力、車流速度以及每個時間段的潛在到達車流量有著密不可分的關(guān)系。因此,本文綜合考慮區(qū)域內(nèi)車流量與實時車流速度構(gòu)建模型預測道路擁堵情況,結(jié)合該區(qū)域互聯(lián)網(wǎng)道路評測情況,根據(jù)實時車流速度、車流量構(gòu)建指標,充分考慮未來時間段有可能出現(xiàn)在道路中的潛在車流量,建立MM-SVR模型,并對所構(gòu)建的擁堵指標進行模型訓練,對下一時段的擁堵系數(shù)進行擬合預測,最后根據(jù)廣州市某區(qū)域卡口與電警的真實數(shù)據(jù)驗證模型的有效性。
1模型構(gòu)建
1.1道路擁堵評價系數(shù)構(gòu)建
鑒于道路擁堵程度不僅受通過該道路路段的實時交通流影響,而且還與該道路車流實際速度有關(guān),比如不同道路等級的公路,在相同車流量的情況下,道路狀況好的公路未出現(xiàn)擁堵,而道路狀況較差的公路可能已處于擁堵狀態(tài)。為了直觀描述道路擁堵程度,本文融合速度與交通流量,對王妍穎等的研究進行改進。在王妍穎等的研究中,擁堵系數(shù)指標包含速度指標與車流量指標,其速度指標為:
首先構(gòu)建H中的速度指標。本文數(shù)據(jù)包括深圳市局部地區(qū)道路的交通卡口監(jiān)測數(shù)據(jù)、道路實時通行速度數(shù)據(jù)以及互聯(lián)網(wǎng)導航平臺數(shù)據(jù)。在道路路況表中,將該道路對應(yīng)時段的行駛速度數(shù)據(jù)作為道路通行速度,對于某些時段數(shù)據(jù)的缺失,則用缺失時段前后5個滑口數(shù)據(jù)的平均數(shù)作為替代值。
依據(jù)上述數(shù)據(jù)構(gòu)建道路路段速度指標,本文使用路段當日最大通行速度減去當時實際通行速度,再除以最大通行速度作為速度指標,具體如下:
其中,s表示該道路路段速度指標,Vmax表示在監(jiān)測器上記錄的通過該路段的最大通行速度,Vt表示監(jiān)測器監(jiān)測的該路段當前車流通行速度。
然后,構(gòu)建路段的交通流量指標。利用統(tǒng)計的一天內(nèi)某區(qū)域卡口的交通流量數(shù)據(jù)構(gòu)建交通流量指標,以每2分鐘為時間段對區(qū)域段交通流量進行統(tǒng)計。根據(jù)對區(qū)域交通流量的統(tǒng)計結(jié)果,以區(qū)域?qū)嶋H交通流量與區(qū)域最大交通流量之比作為流量指標,以反映潛在交通流量,具體指標如下:
1.2MM-SVR預測模型
由于道路擁堵狀況變化過程為狀態(tài)連續(xù)、參數(shù)離散的馬爾科夫過程,因此本文基于歷史數(shù)據(jù)構(gòu)建馬爾科夫鏈預測模型。然而,在連續(xù)狀態(tài)的馬爾科夫過程中一步轉(zhuǎn)移概率難以獲得,因此本文引入支持向量回歸機方法對連續(xù)狀態(tài)進行預測,并構(gòu)建具有馬氏鏈預測狀態(tài)的MM-SVR模型。
1.2.1道路擁堵馬氏描述
此時回歸問題轉(zhuǎn)化為線性二分類問題,因此本文將道路周一~周四的擁堵系數(shù)作為訓練集,按照時間順序,以n個狀態(tài)作為一組輸入變量,將下一狀態(tài)的真實值作為預測標簽,進行滾動訓練。
在訓練過程中,考慮到數(shù)據(jù)在樣本空間內(nèi)線性不可分,因此引入核函數(shù)與懲罰因子,并使用網(wǎng)格尋優(yōu)法尋找最優(yōu)參數(shù),其基本原理如下:當構(gòu)造的兩類樣本D+、D-線性不可分時,通過對硬間隔的軟化以及引入罰參數(shù),同樣可以考慮在高維空間構(gòu)造超曲面,以達到回歸目的。
在上述模型基礎(chǔ)上,根據(jù)所給道路的當前交通流狀態(tài),對新增車輛進行通行擁堵預測,即測算當通行車輛數(shù)量增加時,各路段擁堵程度所受影響。
1.2.3模型檢驗
均方誤差(Mean Squared Error,MSE)是衡量“平均誤差”一種較方便的方法,可以評價數(shù)據(jù)變化程度,越趨向于0說明預測精度越好。平方相關(guān)系數(shù)(squared CorrelationCoefficient,SCC)是用于反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計指標。兩種指標計算公式如下:
2實證分析
本文數(shù)據(jù)包含深圳市局部地區(qū)道路的交通卡口監(jiān)測數(shù)據(jù)與互聯(lián)網(wǎng)導航平臺數(shù)據(jù),具體如下:
(1)該區(qū)域內(nèi)10個卡口所在位置信息(包括檢測點名稱、方向、所屬道路),以及2018年3月25日~31日卡口的過車記錄數(shù)據(jù)。數(shù)據(jù)包括通過該卡口的車輛車牌號碼(車牌號已作脫敏處理)、車牌顏色、時間、車道ID。
(2)浮動車軌跡數(shù)據(jù)。采集2018年3月25日~31日(7天)途經(jīng)研究片區(qū)內(nèi)的所有深圳市出租車、公交、“兩客一?!避囕v、泥頭車、重型半掛車、教練車的車輛GPS軌跡數(shù)據(jù)。該數(shù)據(jù)包含定位時間、車牌(已作脫敏處理,與卡口數(shù)據(jù)不關(guān)聯(lián))、經(jīng)度、緯度、行駛記錄速度、衛(wèi)星速度。
(3)道路ID屬性表。提供了道路ID、道路等級與道路形狀坐標。
為驗證該預測模型的有效性,對福龍路橫龍山路段數(shù)據(jù)進行整理。以2分鐘作為時間間隔,統(tǒng)計整理該路段2018年3月25日~31日內(nèi)道路交通流的車流量和速度,并根據(jù)上文提出的道路指標計算方法對相關(guān)數(shù)據(jù)進行處理,選取工作日(3月27日)與周日(3月25日)進行道路擁堵系數(shù)預測如圖1、圖2所示。
從圖中可以看出,3月27日從8:00開始擁堵指數(shù)上升,直到2l:00左右才開始下降,且在9:00~10:00,18:00~19:30達到日內(nèi)峰值,而3月27日的擁堵指數(shù)則在白天全天都保持很高的值,這與工作日的早晚高峰以及周末的出游高峰相對應(yīng),表明本文構(gòu)建指標能夠很好地反映道路實際擁堵狀況。
將獲得的道路狀態(tài)變量作為基于SVR的預測模型訓練樣本集,并使用訓練所得模型預測當天接下來的道路狀態(tài)及其趨勢。訓練集分別使用3月26日~3月29日共2716個狀態(tài)指標,測試集時間段為3月30日。
從表1中可以發(fā)現(xiàn),在以上兩個檢驗指標中,選擇四階MM-SVR模型時,其MSE與R方系數(shù)均為最佳,因此選用四階MM-SVR模型。
圖3為3月30日全天的預測數(shù)據(jù)與真實數(shù)據(jù)圖,通過圖像對比發(fā)現(xiàn),文中模型的預測結(jié)果與實際數(shù)據(jù)吻合良好,能夠準確預測道路狀態(tài)趨勢。
預測的交通流絕對誤差如圖4所示,絕對誤差量為真實數(shù)據(jù)與預測數(shù)據(jù)之差。從圖4中可知預測的整體誤差較小,93%的誤差都在[-0.05,0.05]之間,只出現(xiàn)了某些相對較大的誤差,使用Adaboosting、SVR模型對相同數(shù)據(jù)進行預測,預測精度比較如表2所示。
由表2可以看出,無論是在擬合系數(shù)還是預測誤差上,本文模型均優(yōu)于單獨使用的其它機器學習模型。
3結(jié)語
本文使用馬爾科夫鏈與支持向量機相結(jié)合的MM-SVR模型,構(gòu)建一個針對道路擁堵情況評價的預測模型,即通過構(gòu)建交通擁堵系數(shù)指標,根據(jù)已有歷史數(shù)據(jù),對某段時間的交通擁堵情況進行預測。實驗證明該模型可以實時反映出當前道路的交通擁堵情況,并可根據(jù)預計新增車輛數(shù)量給出較為精準的擁堵情況預測,從而為交通部門實時監(jiān)控交通狀況,并實施及時的交通管制措施提供參考。
本文在實例驗證中使用其它機器學習算法進行對比實驗,實驗結(jié)果證明,本文模型在無論在擬合程度還是預測誤差上,均優(yōu)于其它單獨使用的機器學習算法。當然,本文也有許多不足,例如本文假設(shè)車牌類型相同的車輛車型也相同,而在實際生活中,不同車型也會對道路擁堵情況造成影響,這些有待今后進一步研究。