国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市軌道交通短時客流預(yù)測研究

2024-12-31 00:00:00張明嬌肖為周胥露李奇峰伍子卿胡新源
交通科技與管理 2024年13期

摘要 文章旨在研究城市軌道交通短時客流預(yù)測。針對單站點(diǎn)數(shù)據(jù),通過LSTM模型進(jìn)行客流預(yù)測;針對海量線網(wǎng)數(shù)據(jù),選擇LightGBM、XGBoost、RF和Ridge四種不同的算法調(diào)參配以權(quán)重建立集成預(yù)測模型。通過對2020年7月蘇州地鐵5號線的AFC數(shù)據(jù)進(jìn)行處理挖掘,并結(jié)合天氣數(shù)據(jù)、空氣質(zhì)量數(shù)據(jù)等多種信息特征,對訓(xùn)練集和驗證集進(jìn)行了劃分,使用構(gòu)建的集成模型加以預(yù)測并進(jìn)行了驗證,精確度達(dá)到了0.89,論證了該集成模型的可行性。

關(guān)鍵詞 集成模型;短時客流預(yù)測;LSTM;線網(wǎng)OD客流

中圖分類號 U293.13 文獻(xiàn)標(biāo)識碼 A 文章編號 2096-8949(2024)13-0018-04

0 引言

城市地鐵作為一種高效的公共交通方式,能夠有效緩解交通壓力。軌道交通運(yùn)營部門可以通過短時客流預(yù)測結(jié)果制定運(yùn)輸組織策略和發(fā)布行車調(diào)度命令,乘客可以根據(jù)短時客流預(yù)測結(jié)果判斷是否選擇軌道交通方式出行以及選擇合理的換乘路徑,以規(guī)避區(qū)間擁堵。

城市軌道交通短時客流預(yù)測具有一定的復(fù)雜性和挑戰(zhàn)性,一方面,地鐵系統(tǒng)存在如上下班高峰期、節(jié)假日等復(fù)雜的時空特征,這些特征的變化使得預(yù)測任務(wù)更加困難;另一方面,傳統(tǒng)的軌道交通短時客流預(yù)測方法在捕捉非線性關(guān)系和時空依賴性方面,存在一定的局限性。為了克服這些挑戰(zhàn),基于集成模型的城市軌道交通短時客流預(yù)測方法逐漸成為研究熱點(diǎn)。劉杰[1]采用集成算法Adaboost將多個子模型集成為一個預(yù)測模型,證明了在鐵路車站間OD客流預(yù)測方面,集成模型在預(yù)測精度和泛化能力上高于單個模型;Chen E等[2]將四個不同的廣義自回歸條件異方差模型與自回歸移動平均模型集成為一個預(yù)測模型,得出集成模型預(yù)測效果高于單一模型的結(jié)論。集成模型綜合了多個機(jī)器學(xué)習(xí)算法的優(yōu)勢,能夠更好地捕捉大規(guī)模數(shù)據(jù)中的非線性關(guān)系和時空特征,從而提高預(yù)測精度和穩(wěn)定性。

1 基于LSTM的單站點(diǎn)客流預(yù)測模型

LSTM(Long Short-Term Memory)神經(jīng)網(wǎng)絡(luò)是一種用于處理長時間序列的特殊時間遞歸神經(jīng)網(wǎng)絡(luò)(RNN)。傳統(tǒng)的RNN網(wǎng)絡(luò)隨著所需處理時間序列長度的增加,將在模型訓(xùn)練時出現(xiàn)梯度消失和梯度爆炸的問題,從而影響預(yù)測的準(zhǔn)確度。為完善RNN網(wǎng)絡(luò),LSTM網(wǎng)絡(luò)引入了門控機(jī)制,在RNN網(wǎng)絡(luò)的基礎(chǔ)上增加了輸入門、遺忘門和輸出門[3],LSTM網(wǎng)絡(luò)可通過對這些門的開關(guān)選擇性地遺忘、存儲或讀取時間序列信息,從長序列數(shù)據(jù)中提取長期依賴信息,更好地處理長期依賴關(guān)系,從而解決了傳統(tǒng)RNN網(wǎng)絡(luò)在長序列預(yù)測中存在的梯度消失和梯度爆炸的問題。

作為RNN網(wǎng)絡(luò)的變體,LSTM網(wǎng)絡(luò)的基本構(gòu)架包括輸入門it、遺忘門ft、輸出門ot以及內(nèi)部記憶細(xì)胞的單元狀態(tài)ct等四個部分,LSTM網(wǎng)絡(luò)單元結(jié)構(gòu)如圖1所示:

2 基于集成模型的線網(wǎng)OD預(yù)測模型

在使用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測時,使用單一的弱分類器存在一定缺點(diǎn),而集成學(xué)習(xí)能夠平衡各個分類器的優(yōu)缺點(diǎn),使得預(yù)測更加準(zhǔn)確。集成學(xué)習(xí)的基本思想是通過組合多個模型的預(yù)測結(jié)果減小預(yù)測誤差,同時提高模型的穩(wěn)定性和泛化能力。集成模型能夠充分利用各個基礎(chǔ)模型的優(yōu)勢,彌補(bǔ)它們的不足之處,從而獲得更好的預(yù)測效果。該文選擇LightGBM、XGBoost、RF和Ridge四種不同的算法,調(diào)參配以權(quán)重建立集成預(yù)測模型,充分利用每個模型的優(yōu)勢,提高線網(wǎng)OD預(yù)測模型的性能,使得線網(wǎng)OD預(yù)測更加精準(zhǔn)和可靠,從而幫助軌道交通運(yùn)營商做出更明智的決策,提高系統(tǒng)運(yùn)行效率,同時為乘客提供更好的出行體驗。

在選擇集成方式時,該文對Boosting串行式、Bagging并行式和Stacking堆疊式等三種集成方式進(jìn)行了改進(jìn),即首先選擇基于串行式集成和并行式集成的不同子模型進(jìn)行二層的Stacking集成,然后在此基礎(chǔ)上添加第三層優(yōu)化集成,示意圖如圖2所示。

(1)將LightGBM、XGBoost、RF、Ridge分別作為模型1、模型2、模型3、模型4,以雙層的Stacking集成模型作為模型5。

(2)對這5個子模型的預(yù)測結(jié)果賦予損失函數(shù)權(quán)重,形成子模型損失函數(shù)的權(quán)重矩陣,同時應(yīng)滿足。

(3)通過五層循環(huán)遍歷找出使得集成模型損失函數(shù)最小的子模型損失函數(shù)權(quán)重矩陣,這便是最優(yōu)的集成模型組合。

3 實例分析

3.1 數(shù)據(jù)預(yù)處理

該研究數(shù)據(jù)集來源于蘇州市地鐵AFC系統(tǒng)采集的刷卡數(shù)據(jù),包含2020年7月6日—2020年7月31日期間剔除周末后共計20天的刷卡記錄。每條記錄包括乘客卡號、票卡類型、進(jìn)站車站編號、進(jìn)站日期時間、出站車站編號、出站日期時間,AFC初始數(shù)據(jù)集如表1所示。

由于工作維修、乘客進(jìn)錯站、AFC系統(tǒng)出錯等原因,初始數(shù)據(jù)集存在一些異常記錄,主要包括:①缺少某些字段信息;②重復(fù)記錄;③進(jìn)出站刷卡時間不在地鐵運(yùn)營時間范圍內(nèi);④進(jìn)站車站編號與出站車站編號相同;⑤進(jìn)站時間比出站時間晚。因此,應(yīng)對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,剔除上述異常記錄。

3.2 客流特征分析

地鐵短時客流受不同因素影響,該文研究在30 min時間粒度下,考慮工作日、天氣、平均溫度、空氣質(zhì)量四因素對地鐵客流的影響,預(yù)測地鐵的短時客流。

對訓(xùn)練數(shù)據(jù)進(jìn)行時間序列平穩(wěn)性檢驗,平穩(wěn)性檢驗參數(shù)值如表2所示。由表2可知,p值小于0.05,則該研究所使用的案例數(shù)據(jù)具有平穩(wěn)性,基于此數(shù)據(jù)集進(jìn)行訓(xùn)練得到的模型準(zhǔn)確有效。

抽取連續(xù)的周一至周五數(shù)據(jù),基于30 min時間粒度,使用Pearson系數(shù)分析工作日地鐵客流的相似性,Pearson系數(shù)熱力圖如圖3所示。Pearson系數(shù)越接近1,說明變量之間的相關(guān)性越強(qiáng)。由圖3可知,在30 min時間粒度下,工作日與工作日之間的客流時間序列具有較強(qiáng)的相關(guān)性。

3.3 影響因素

地鐵短時客流受天氣影響,如雨天會造成地鐵客流下降,該文在清洗后的AFC數(shù)據(jù)基礎(chǔ)上添加天氣字段,并進(jìn)行特征編碼。其中,數(shù)字“0”代表晴、“1”代表多云、“2”代表陰、“3”代表雨。地鐵短時客流也受溫度影響,高溫和低溫都會引起地鐵短時客流的波動,由于一天的氣溫是動態(tài)的,該文取平均溫度進(jìn)行研究,在清洗后的AFC數(shù)據(jù)基礎(chǔ)上添加平均溫度字段。此外,空氣質(zhì)量也影響著地鐵短時客流,該文根據(jù)空氣質(zhì)量指數(shù)AQI進(jìn)行空氣質(zhì)量的等級劃分:20~50為優(yōu),以數(shù)字“1”表示;50~60為良,以數(shù)字“0”表示。

蘇州地鐵運(yùn)營時間大致為5:00—24:00,根據(jù)30 min的時間間隔將處于5:00—24:00運(yùn)營時段的1 140 min劃分為38個時段[4],將一天的所有時刻與不同時間粒度的時段及日期進(jìn)行匹配,如該月6日9:00—9:30時間表示為0609,最終訓(xùn)練數(shù)據(jù)集如表3所示。

3.4 模型對比

該研究以2020年7月6日—2020年7月24日期間剔除周六周日后的三周數(shù)據(jù)為訓(xùn)練集,以2020年7月27日—2020年7月31日為測試集。

將基于LightGBM、XGBoost、RF和Ridge子模型的集成模型與LightGBM模型、LSTM模型進(jìn)行對比,對比三者的預(yù)測效果,各模型預(yù)測結(jié)果評價如表4所示。由表4可知,針對地鐵客流海量線網(wǎng)數(shù)據(jù),集成模型的預(yù)測誤差更小。

分析各子模型和集成模型的損失,如圖4所示。由圖4可知,集成模型的損失最低,比原四個子模型的預(yù)測精度都高,因此集成模型的構(gòu)建具有意義。

3.5 結(jié)果分析

根據(jù)模型對比分析,選擇預(yù)測效果最好的集成模型,在30 min時間粒度下進(jìn)行地鐵短時客流預(yù)測。由于線網(wǎng)數(shù)據(jù)巨大,取獨(dú)墅湖南站-桑田島站、鐘南街站-臨頓路站兩個OD對,則客流預(yù)測結(jié)果的擬合圖如圖5~6所示,工作日每日客流預(yù)測結(jié)果的擬合圖如圖7~8所示。

4 結(jié)語

該文基于30 min時間粒度,綜合考慮天氣、平均溫度、空氣質(zhì)量三個因素對客流的影響,研究預(yù)測工作日的地鐵短時客流。構(gòu)建以LightGBM、XGBoost、RF和Ridge為子模型的集成模型,對比其與LSTM模型、LightGBM模型的預(yù)測效果。針對海量線網(wǎng)數(shù)據(jù),該研究的集成模型具有意義且預(yù)測效果最優(yōu)。

基于蘇州市2020年7月的AFC刷卡數(shù)據(jù),融合天氣、平均溫度、空氣質(zhì)量三個外部數(shù)據(jù),使用該文構(gòu)建的集成模型進(jìn)行客流預(yù)測擬合分析,隨機(jī)選取兩個OD對進(jìn)行驗證。結(jié)果表明,模型預(yù)測值與實際值誤差在20%以內(nèi),線網(wǎng)整體預(yù)測準(zhǔn)確率為89%,模型預(yù)測精度較高。該文研究可為地鐵公司提供精確及時的軌道交通短期客流預(yù)測模型,方便運(yùn)營單位主動規(guī)劃并采取合適的客流控制疏導(dǎo)措施,從而緩解車站客流壓力,實現(xiàn)地鐵安全、高效運(yùn)營。

該文提出的方法主要適用于工作日的地鐵短時客流預(yù)測,考慮節(jié)假日、突發(fā)事件的地鐵短時客流預(yù)測仍需進(jìn)一步研究。

參考文獻(xiàn)

[1]劉杰. 基于集成算法的鐵路客流短期預(yù)測模型研究[J]. 重慶交通大學(xué)學(xué)報(自然科學(xué)版), 2022(5): 20-

25.

[2]Chen E, Ye Z, Wang C, et al. Subway Passenger Flow Prediction for Special Events Using Smart Card Data[J]. Ieee Transactions on Intelligent Transportation Systems, 2019.

[3]龔飄怡, 羅云峰, 方哲梅, 等. 基于Attention-BiLSTM-LSTM神經(jīng)網(wǎng)絡(luò)的短期電力負(fù)荷預(yù)測方法[J]. 計算機(jī)應(yīng)用, 2021(S1): 81-86.

[4]張恒, 秦振華, 肖為周, 等. 基于決策樹模型的地鐵線網(wǎng)短時OD客流預(yù)測[J]. 河北工業(yè)科技, 2023(2): 146-154.

收稿日期:2024-01-23

作者簡介:張明嬌(2002—),女,本科,研究方向:交通運(yùn)輸規(guī)劃與管理。

基金項目:蘇州大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃“基于深度學(xué)習(xí)的軌道交通短期客流預(yù)測模型設(shè)計與實現(xiàn)”(202210285164Y)。

芷江| 昭平县| 宝坻区| 永吉县| 九龙城区| 科技| 张家界市| 邳州市| 星座| 郯城县| 逊克县| 修文县| 杭锦后旗| 武山县| 朝阳县| 开封县| 新泰市| 大埔县| 榆中县| 黄陵县| 阿克陶县| 柳河县| 通化县| 昌图县| 奈曼旗| 山东省| 隆德县| 北碚区| 克东县| 织金县| 和林格尔县| 宝清县| 蓬安县| 天镇县| 临桂县| 乐清市| 昌宁县| 礼泉县| 松桃| 肃宁县| 威宁|