国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)空信息的高速公路出入口交通車流量預(yù)測(cè)

2020-04-18 08:30石文婷
西部交通科技 2020年11期

石文婷

摘要:文章提出一種結(jié)合時(shí)間與空間信息,使用梯度提升決策樹的車流量預(yù)測(cè)方法,對(duì)廣西高速公路某特定出口的車流量進(jìn)行數(shù)據(jù)分析,并將其與其他常用的預(yù)測(cè)方法進(jìn)行了比較。結(jié)果表明,該方法可以更準(zhǔn)確高效地預(yù)測(cè)高速公路出入口流量,具有更好的預(yù)測(cè)性能。

關(guān)鍵詞:車流量預(yù)測(cè);時(shí)空信息;梯度提升決策樹

中圖分類號(hào):U491.1+13 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.13282/j.cnki.wccst.2020.11.048

文章編號(hào):1673-4874(2020)11-0175-05

0引言

高速出入口作為交通路網(wǎng)的敏感點(diǎn),經(jīng)常在重要節(jié)假日承受著巨大的車流壓力。對(duì)高速公路出入口做車流量的預(yù)測(cè)有助于幫助出行民眾做出明智的決策,以決定出行時(shí)間與出行路線,分散出入口壓力,降低交通動(dòng)脈的強(qiáng)度。準(zhǔn)確的預(yù)測(cè)也為交管部門分擔(dān)部分壓力,為其高效地做好交管部署措施提供依據(jù)。

由歷史交通數(shù)據(jù),對(duì)下一個(gè)時(shí)隙的交通量進(jìn)行預(yù)測(cè)(比如使用前幾個(gè)月某節(jié)點(diǎn)的車流量數(shù)據(jù)預(yù)測(cè)未來一段時(shí)間此節(jié)點(diǎn)的車流量趨勢(shì))是業(yè)界一直研究的比較經(jīng)典的交通量預(yù)測(cè)問題。數(shù)十年來,許多研究調(diào)查了流量預(yù)測(cè)。博克思(Box)和詹金斯(Jenkins)于70年代初提出的著名時(shí)間序列預(yù)測(cè)方法自回歸積分移動(dòng)平均(ARIMA)算法和卡爾曼濾波是比較早期被廣泛應(yīng)用于交通預(yù)測(cè)問題中的研究方法,這些比較早期的研究方法只關(guān)注于個(gè)體交通節(jié)點(diǎn)交通信息的時(shí)間特征。近年來,空間特征也逐漸被考慮進(jìn)入有關(guān)交通的相關(guān)研究。但是,多數(shù)方法仍基于傳統(tǒng)的時(shí)間序列模型或機(jī)器學(xué)習(xí)模型,無法很好地抓住非線性時(shí)空關(guān)系。

廣西境內(nèi)有約360個(gè)高速出入口,高速公路每日的車流量(注:本文研究是基于經(jīng)過出口收費(fèi)站有收費(fèi)數(shù)據(jù)的車輛數(shù)據(jù),未將通過ETC通道的車輛算入本文所統(tǒng)計(jì)的車流量數(shù)據(jù)內(nèi))可達(dá)幾十萬輛。由此,對(duì)高速出入口做車流量預(yù)測(cè)是一項(xiàng)非常必要的研究方向。本文將會(huì)對(duì)廣西高速公路某特定出口的車流量進(jìn)行數(shù)據(jù)分析,并基于時(shí)間與空間特征以及原始車流量數(shù)據(jù),提出一種結(jié)合時(shí)間與空間特征的經(jīng)過優(yōu)化的梯度提升的決策預(yù)測(cè)方法,對(duì)此高速出口車流量進(jìn)行預(yù)測(cè)與分析,以驗(yàn)證本文方法的準(zhǔn)確性。

1高速公路出入口車流量數(shù)據(jù)分析

1.1車流量數(shù)據(jù)分析

為更好地對(duì)高速公路車流量進(jìn)行特征篩選,首先應(yīng)對(duì)車流量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析以進(jìn)行較為直觀的查閱,尤其是對(duì)于此類時(shí)序性數(shù)據(jù),可視化的方法可以提供較為全面的參考和對(duì)比,為后續(xù)模型的搭建提供先決有利參考。

根據(jù)道路運(yùn)輸數(shù)據(jù)的特性,為了驗(yàn)證同期車流量整體趨勢(shì)是否上升或下降的猜想,以及選取合適的粗細(xì)粒度來設(shè)計(jì)統(tǒng)計(jì)特征,本文先對(duì)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)探索,比如同月不同站點(diǎn)車流量情況、不同星期同日同站等時(shí)序數(shù)據(jù)進(jìn)行對(duì)比,結(jié)果如圖1、圖2所示。不難發(fā)現(xiàn),不同地點(diǎn)的車流量數(shù)據(jù)會(huì)與時(shí)間成一定關(guān)系,每周不同日期也對(duì)車流量有一定影響。

1.2天氣數(shù)據(jù)分析

天氣數(shù)據(jù)是時(shí)序數(shù)據(jù),根據(jù)天氣數(shù)據(jù)與車流量關(guān)系,我們將天氣好易于出行的天氣賦予高權(quán)值,將不易于出行的天氣賦予低權(quán)值。如圖3為11月份每日桂林南出口車流量與天氣的趨勢(shì)對(duì)比圖。天氣曲線權(quán)值高的點(diǎn)代表天氣晴好利于出行,權(quán)值低的點(diǎn)代表天氣不利于出行(天氣曲線對(duì)應(yīng)的數(shù)值無實(shí)際意義,只代表天氣狀態(tài))??梢园l(fā)現(xiàn),天氣與交通量曲線變化趨勢(shì)大致相同,證明天氣的變化與交通量的變化有著相關(guān)聯(lián)系,天氣的時(shí)間序列變化可作為交通量預(yù)測(cè)的重要依據(jù)。

2基于時(shí)空信息的梯度提升的決策樹預(yù)測(cè)模型

2.1特征工程

根據(jù)前期工作已對(duì)高速出入口交通量與可能影響車流量的時(shí)間、空間等相關(guān)信息做的數(shù)據(jù)分析,不難發(fā)現(xiàn),相關(guān)因素的時(shí)序差異會(huì)對(duì)車流量產(chǎn)生明顯的影響。如果可以將這些影響因素納入算法特征,則增加了算法的魯棒性,預(yù)測(cè)準(zhǔn)確率也會(huì)相應(yīng)提升。

2.1.1時(shí)間特征

經(jīng)過對(duì)一定時(shí)間段內(nèi)出入口的車流量進(jìn)行相關(guān)分析,可計(jì)算得各出入口之間的相關(guān)系數(shù),如圖4所示,并把其與出入口站點(diǎn)地理位置進(jìn)行對(duì)比,易發(fā)現(xiàn),皮爾遜相關(guān)系數(shù)可以滿足地理相關(guān)性特征的表述。

除了地理相關(guān)性特征,還有各地常住人口、景區(qū)數(shù)量、與其他高速出入口連通情況等特征可以表示該出入口地理環(huán)境的因素也可進(jìn)行處理納入訓(xùn)練特征。

2.1.3異常值處理

在交通流量的時(shí)間序列里,交通流量可能會(huì)隨著某些特殊日子的時(shí)間點(diǎn)產(chǎn)生較大的浮動(dòng)。例如,交通流量在國(guó)慶假期前三天的數(shù)值遠(yuǎn)高于其前后兩天的數(shù)值,此類數(shù)據(jù)可以當(dāng)成異常值進(jìn)行處理。如果不對(duì)數(shù)據(jù)中的突變值(異常值)進(jìn)行處理,可能會(huì)影響最終模型回歸預(yù)測(cè)的結(jié)果。本文通過變換變量法以減少由異常值引起的回歸變化,將數(shù)值進(jìn)行對(duì)數(shù)轉(zhuǎn)換,減少異常值帶來的模型敏感。

2.2基于優(yōu)化的梯度提升的決策樹模型

本文選用LightGBM模型作為訓(xùn)練模型。LightGBM是一個(gè)基于學(xué)習(xí)算法的決策樹的梯度提升框架。微軟團(tuán)隊(duì)在2017年的NIPS中提出了LightGBME41,它也是一種基于優(yōu)化的梯度提升決策樹(GBDT)進(jìn)行提升的方法。對(duì)于此類型的決策樹模型,最耗時(shí)的部分是在執(zhí)行特征選擇節(jié)點(diǎn)分割時(shí),遍歷所有可能的分割點(diǎn)并計(jì)算信息增益以找到最佳分割點(diǎn)。LightGBM有兩種樹的生成方式,一種是Level—wise,另一種是leaf-wise。Level-wise策略逐級(jí)數(shù)據(jù)可以同時(shí)分割同一層葉子,是一種更有效的策略,每次從所有葉子中尋找具有最大分裂增益的葉子,然后分裂并循環(huán)。leaf-wise策略可以減少更多錯(cuò)誤,并在分割數(shù)相同時(shí)獲得更高的精度,本文采用的是基于leaf-wise的LightGBM模型進(jìn)行訓(xùn)練。

2.3基于時(shí)空信息與其他相關(guān)影響因素的預(yù)測(cè)模型

本文基于特征工程選擇及相關(guān)統(tǒng)計(jì)因素創(chuàng)建的54個(gè)基于時(shí)間和空間及相關(guān)影響因素的特征,通過使用具有深度限制的葉子生長(zhǎng)策略并調(diào)整放入直方圖策略來優(yōu)化LightGBM模型。將統(tǒng)計(jì)數(shù)據(jù)以離散值作為指標(biāo)存儲(chǔ)在直方圖中。遍歷數(shù)據(jù)后,直方圖會(huì)累積所需的統(tǒng)計(jì)量,然后根據(jù)直方圖的離散值找到最佳分割點(diǎn)。

在Leaf-wise算法中,可以把該算法看成一個(gè)強(qiáng)模型由多個(gè)決策樹經(jīng)過訓(xùn)練,更新參數(shù)提升而成。本文模型訓(xùn)練方法先初始化了64棵決策樹,訓(xùn)練權(quán)重為1/64,在訓(xùn)練各決策樹時(shí)更新改樹權(quán)值,直至誤差降到范圍之內(nèi)則停止訓(xùn)練,最終得到經(jīng)過提升的強(qiáng)模型,見式3。

3仿真及結(jié)果

3.1數(shù)據(jù)集

本文的基礎(chǔ)車流量數(shù)據(jù)為廣西部分高速出口經(jīng)過人工收費(fèi)通道車流量數(shù)據(jù),數(shù)據(jù)為每日每小時(shí)車流量總數(shù)。在實(shí)驗(yàn)中的訓(xùn)練數(shù)據(jù)(訓(xùn)練集+驗(yàn)證集)采用的是2019年10月、11月的相關(guān)出入口的車流量數(shù)據(jù),以桂林南出入口的2019年12月的數(shù)據(jù)為預(yù)測(cè)對(duì)象(測(cè)試集)。訓(xùn)練集用于模型的訓(xùn)練以擬合數(shù)據(jù)樣本,使模型損失降低。驗(yàn)證集主要作用為調(diào)整模型的超參數(shù)和用于對(duì)模型的能力進(jìn)行初步評(píng)估,最終的測(cè)試集(算法的預(yù)測(cè)任務(wù))用來評(píng)估最終模型的泛化能力。在本實(shí)驗(yàn)中采用各數(shù)據(jù)集的配比為:訓(xùn)練集:驗(yàn)證集:測(cè)試集=4:2:3。天氣數(shù)據(jù)、地理位置等其他相關(guān)數(shù)據(jù)用于構(gòu)造并優(yōu)化特征。

在RMSE的表達(dá)式(4)中,yi為預(yù)測(cè)值,yi為真實(shí)值。均方根誤差RMSE用來衡量觀測(cè)值與真實(shí)值之間的偏差,常用作機(jī)器學(xué)習(xí)模型預(yù)測(cè)結(jié)果衡量的標(biāo)準(zhǔn)。本文采用RMSE作為算法誤差的評(píng)價(jià)指標(biāo),依次對(duì)比本文模型與其他常用預(yù)測(cè)模型的表現(xiàn)。

3.3結(jié)果與對(duì)比

經(jīng)過運(yùn)用本文基于時(shí)空信息的梯度提升決策樹模型,對(duì)目標(biāo)站點(diǎn)2019年12月每天12:00的出口方向車流量進(jìn)行的預(yù)測(cè)結(jié)果與車流量的真實(shí)值進(jìn)行對(duì)比,如圖6所示,發(fā)現(xiàn)針對(duì)周末的預(yù)測(cè)值普遍高于實(shí)際值,且周末的實(shí)際車流量不太穩(wěn)定,預(yù)測(cè)誤差較于工作日較大。經(jīng)過對(duì)工作日以及周末的車流量數(shù)據(jù)分別進(jìn)行統(tǒng)計(jì)特征提取并輸入訓(xùn)練模型后,模型的預(yù)測(cè)能力均有所提升,優(yōu)化后的預(yù)測(cè)結(jié)果如圖7、圖8所示。

將本文方法的預(yù)測(cè)誤差RMSE與其他常見用于預(yù)測(cè)的模型做本預(yù)測(cè)任務(wù)產(chǎn)生的RMSE作對(duì)比(如表1所示),不難發(fā)現(xiàn)本模型在做本次預(yù)測(cè)任務(wù)時(shí)所產(chǎn)生的RMSE低于其他模型,這表明本算法模型具有更優(yōu)的預(yù)測(cè)交通車流量的能力。

綜上,本文方法對(duì)選定出入口的預(yù)測(cè)結(jié)果與實(shí)際車流量趨勢(shì)與數(shù)值吻合度較高,可以用于預(yù)測(cè)車流量的變化趨勢(shì),為交管部門提供較為有利的決策依據(jù)。

4結(jié)語

本文提出了一種基于時(shí)空信息的使用梯度提升決策樹的車流量預(yù)測(cè)方法,主要將多種時(shí)序信息與空間信息映射成相應(yīng)特征輸入訓(xùn)練模型,使用一種經(jīng)過調(diào)優(yōu)的梯度提升的訓(xùn)練方法進(jìn)行訓(xùn)練并完成相應(yīng)的預(yù)測(cè)任務(wù)。實(shí)驗(yàn)結(jié)果表明,本文方法的預(yù)測(cè)結(jié)果較為理想,在預(yù)測(cè)準(zhǔn)確率與完成效率上均略高于其他常用預(yù)測(cè)方法,也高于只單一考慮時(shí)間信息的預(yù)測(cè)方法,所以本文方法可為車流量預(yù)測(cè)提供參考。