張含笑 劉宇然 劉媛 牛子辰
摘要:為了精準預(yù)測軌道交通的短時客流量,有效緩解城市交通擁堵,提出了一種基于多任務(wù)學(xué)習(xí)的軌道交通短時客流預(yù)測模型,該模型采用殘差卷積神經(jīng)網(wǎng)絡(luò)和嵌套式長短期記憶神經(jīng)網(wǎng)絡(luò)提取客流的時空相關(guān)性,引入注意力機制加強模塊對特征的提取效果??紤]軌道交通運營的特點,模型進一步選取列車運行特征、軌道交通站點周邊公交站點以及興趣點數(shù)據(jù)作為外部特征,以提高軌道交通短時客流預(yù)測精度。基于北京地鐵歷史客流數(shù)據(jù),在10、30、60 min等多時間粒度場景下進行實驗。結(jié)果顯示,該方法通過多任務(wù)學(xué)習(xí)的方式建模分析站點進出站客流之間的相互影響,提高了模型的預(yù)測性能和泛化能力,為城市軌道交通短時客流預(yù)測問題提供了新的思路。
關(guān)鍵詞:軌道交通;客流預(yù)測;多任務(wù)學(xué)習(xí);注意力機制; 深度神經(jīng)網(wǎng)絡(luò)
中圖分類號:U239.5?? 文獻標志碼:A?? 文章編號:1002-4026(2024)01-0095-12
A multitask learning model for the prediction of short-term subway passenger flow
Abstract∶An accurate prediction of short-term subway passenger flowscan effectively alleviate traffic congestion and improve the quality of travel services for urban residents. Herein, we propose a multitask learning-based model for the prediction of short-term subway passenger flows, which uses a residual convolutional neural network (NN) and a nested long short-term memory NN to extract the spatio-temporal correlation of traffic patterns, and introduces an attention mechanism to enhance the feature extraction performance of the NNs. Considering the characteristics of subway operations, the model selects train operation features, bus stops around subway stations, and point of interest data as external features to improve the accuracy of the prediction. Based on the historical data of the Beijing Subway, experiments were conducted in multiple time granularity scenarios, such as 10, 30, and 60 min. The results showed that the methodsuccessfully modeled and analyzed the inflow-outflow interaction through multitask learning, improved the prediction performance and generalization ability of the model, and providednovel approaches for the prediction of short-term subway passenger flows.
Key words∶subway; passenger flow prediction; multitask learning; attention mechanism; deep neural network
城市軌道交通充分利用了地下和地上空間的開發(fā),緩解了城市地面交通壓力,提高了市民的出行效率。截至2021年年底,中國大陸地區(qū)共有50個城市開通城市軌道交通運營線路283條,運營線路總長度9 206.8 km,全年累計完成客運量236.9億人次,占公共交通客運總量的分擔(dān)比率為43.40%[1]。短時客流量是軌道交通運營單位開展運力配置、列車運營計劃編制和站點工作人員配備的基礎(chǔ)。因此對客流量進行準確和實時的預(yù)測,在軌道交通運營部門制定合理的列車行車計劃、保障市民的出行需求方面起著至關(guān)重要的作用[2]。
城市軌道交通系統(tǒng)具有獨特的運行特性,與道路公共交通不同,軌道交通運營遵循更精確的時間表,該特征需要融入到客流預(yù)測中[3]。乘客為了節(jié)約時間成本,會更傾向于在列車快要到站時進站到達站臺等待上車,此時進站客流會出現(xiàn)一定的小高峰。同時,運營商為了運力運量的良好匹配,在編制列車行車計劃時便會充分考慮該時段客流量的大小。在出行方面,考慮到軌道交通更多的在人們通勤出行中扮演與公交車進行接駁出行的角色,軌道交通站點周邊公交站點的數(shù)量和分布特征,對于軌道交通短時客流預(yù)測有重要影響。一般情況下,周邊公交站點數(shù)目越多,該軌道交通站點客流量也會越大。軌道交通站點的客流情況與該站點周邊的設(shè)施息息相關(guān),興趣點(point of interest,POI)數(shù)據(jù)可以表征軌道交通站點周邊的土地使用情況與城市功能區(qū)分布。例如,周邊住宅小區(qū)以及企業(yè)公司較多的站點,其客流通常會以通勤客流為主。此外,乘客在工作日與非工作日的出行特征也會有所不同。因此,在對軌道交通短時客流預(yù)測進行研究時,需要考慮這些外部變量對模型預(yù)測精度的影響。隨著移動互聯(lián)網(wǎng)技術(shù)、信息通信技術(shù)及云計算等技術(shù)快速發(fā)展,城市軌道交通系統(tǒng)每天都會產(chǎn)生包含交易信息在內(nèi)的大規(guī)模高質(zhì)量的軌跡數(shù)據(jù)[4-5]。海量、多源、異構(gòu)的交通大數(shù)據(jù)及個性化、多樣化的出行需求,對現(xiàn)有基于抽樣數(shù)據(jù)的客流預(yù)測方法提出了挑戰(zhàn)[6]。近年來,隨著計算力和數(shù)據(jù)量的大幅提升,智能預(yù)測技術(shù)得到了進一步發(fā)展,深度學(xué)習(xí)成為智能交通系統(tǒng)中諸多問題的解決方案。深度學(xué)習(xí)方法由多個神經(jīng)網(wǎng)絡(luò)層組成,這些神經(jīng)網(wǎng)絡(luò)層通過模擬人腦的學(xué)習(xí)行為,實現(xiàn)對復(fù)雜特征的學(xué)習(xí)過程[7-10]。
對于軌道交通的短時客流量預(yù)測,當(dāng)前研究的方法主要分為3類:傳統(tǒng)的基于數(shù)理統(tǒng)計的模型、基于機器學(xué)習(xí)的模型以及基于深度學(xué)習(xí)的模型。傳統(tǒng)的基于數(shù)理統(tǒng)計的模型,通過研究歷史出行需求遵循的統(tǒng)計規(guī)律,來預(yù)測未來短時的出行需求,例如,移動平均模型(moving average, MA)、自回歸移動平均模型(autoregression and moving average model ,ARMA)、自回歸差分移動平均模型(autoregressive integrated moving average model,ARIMA)、邏輯回歸等[11]。由于軌道交通客流具有顯著的非線性特征,這些方法對于復(fù)雜的交通流量預(yù)測效果不佳。基于非線性模型和機器學(xué)習(xí)的方法可以有效提取不同類型日期的地鐵客流量的周期性及非線性特征,從而提高軌道交通客流的預(yù)測精度[12-13]。邵必林[12]提出融合季節(jié)差分自回歸移動平均模型(seasonal autoregressive integrated moving average model,SARIMA)和支持向量機(support vector machine,SVM)的優(yōu)化模型,采用SARIMA對地鐵客流量的時間序列數(shù)據(jù)進行線性建模,使用SVM對SARIMA模型輸入的殘差值進行非線性建模?;趯嶋H數(shù)據(jù)的實驗結(jié)果表明,SARIMA-SVM模型的預(yù)測精度高于單一模型,精度提高了12.24%。Roos[14]提出了一種基于動態(tài)貝葉斯網(wǎng)絡(luò)來預(yù)測城市軌道網(wǎng)絡(luò)短期客流的方法,該方法在即使數(shù)據(jù)不完整的情況下也可進行推演,模型在預(yù)測精度、泛化能力方面都表現(xiàn)良好。深度學(xué)習(xí)作為機器學(xué)習(xí)的一個分支,通過端到端的學(xué)習(xí)框架,可以有效提取高層次特征,其良好的預(yù)測性能促進了交通預(yù)測領(lǐng)域的革新。深度學(xué)習(xí)算法被應(yīng)用到城市軌道交通出行需求預(yù)測的研究中,通過設(shè)計不同的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提取時空出行需求特征[15-18]。
城市軌道交通站點的出行需求預(yù)測包括進站量和出站量的預(yù)測。傳統(tǒng)的方法都是基于提出的模型對站點的短時進站量和出站量分別進行預(yù)測,將出行需求預(yù)測當(dāng)作單個的預(yù)測任務(wù),忽略了出行進出站量預(yù)測之間的內(nèi)在聯(lián)系。此外,缺乏對交通數(shù)據(jù)的時空特征和動態(tài)相關(guān)性進行建模以及外部變量的有效利用,使得預(yù)測模型效果的提升達到瓶頸。針對上述問題,本研究基于歷史進站客流刷卡數(shù)據(jù),提出了基于多任務(wù)學(xué)習(xí)的軌道交通短時客流預(yù)測模型,以提取乘客出行數(shù)據(jù)中的時空出行規(guī)律,挖掘出行數(shù)據(jù)中包含的隱藏特征。模型使用殘差卷積神經(jīng)網(wǎng)絡(luò)(residual convolutional neural network,ResCNN)處理地鐵網(wǎng)絡(luò)拓撲結(jié)構(gòu)和空間出行特征,采用嵌套式長短期記憶神經(jīng)網(wǎng)絡(luò)(nested long short-term memory,NLSTM)和注意力機制捕捉前后關(guān)聯(lián)和復(fù)雜時變的時間特征。同時引入列車時刻表數(shù)據(jù)、公交站點分布數(shù)據(jù)、POI數(shù)據(jù),以預(yù)測軌道交通短時進出站客流需求。
1 模型與方法
1.1 問題描述
多任務(wù)學(xué)習(xí)(multi-task learning,MTL)是機器學(xué)習(xí)中的一種學(xué)習(xí)范式,是解決聯(lián)合預(yù)測問題的一個很好的方案。本文采用多任務(wù)學(xué)習(xí)的方法,以北京地鐵為例,提取軌道交通站點短時進站客流和出站客流預(yù)測任務(wù)之間的相關(guān)性。假設(shè)xti,m表示時間間隔t內(nèi)站點i的短時進出站客流量,這里的m可以表示預(yù)測任務(wù),即進站客流量預(yù)測任務(wù)或者出站客流量預(yù)測任務(wù),Xtm表示時間間隔t內(nèi)地鐵站點的客流出行量集合。因此,基于多任務(wù)學(xué)習(xí)的軌道交通短時客流預(yù)測問題可以定義為,考慮到當(dāng)前時間間隔t之前的站點進出站客流量即[Xt-Pm,…,Xtm]和外部特征Et,預(yù)測下一個或者未來多個時間間隔Xt+Tm的進站和出站客流量,見公式1。
Xt+1m,…,Xt+Tm=FXt-Pm,…,Xtm,Et,(1)
其中P表示用于預(yù)測的歷史時間步長,T表示預(yù)測的時間步長。
1.2 空間特征提取
為了學(xué)習(xí)軌道交通客流數(shù)據(jù)所蘊含的時空特性,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)可以用來捕捉不同站點客流之間潛在的空間關(guān)系。然而,隨著CNN深度的增加,網(wǎng)絡(luò)模型出現(xiàn)了“退化現(xiàn)象”。訓(xùn)練集的誤差在下降到一定程度會出現(xiàn)反彈,空間特征的提取效果反而越差,這是由于網(wǎng)絡(luò)的加深而造成的梯度爆炸和梯度消失的問題。構(gòu)建殘差卷積神經(jīng)網(wǎng)絡(luò)(residual convolutional neural network,ResCNN),將殘差單元(residual unit)嵌入到網(wǎng)絡(luò)結(jié)構(gòu)中,借鑒了跨層連接的思想,具體方法是在每層網(wǎng)絡(luò)的輸入和輸出之間添加一條跳躍連接,將底層的部分特征直接映射到高層網(wǎng)絡(luò)中,有效緩解了多層神經(jīng)網(wǎng)絡(luò)出現(xiàn)的訓(xùn)練退化現(xiàn)象,如圖1所示,殘差網(wǎng)絡(luò)的計算見公式2。
Xl+1=RXl,θl+Xl,? (2)
其中,Xl+1和Xl分別表示殘差單元的輸入和輸出,R為殘差函數(shù)。θl包含了殘差單元所有的可學(xué)習(xí)參數(shù)。采用批處理歸一化層(batch normalization,BN)對輸入數(shù)據(jù)進行標準化處理,在殘差單元中加入卷積層(convolutionlayer,Conv)來提取站點間乘客出行需求的空間特征。ResCNN的應(yīng)用有效緩解了深度網(wǎng)絡(luò)存在的梯度消失和爆炸的問題,增強了訓(xùn)練過程中的穩(wěn)定性,進而提升網(wǎng)絡(luò)的學(xué)習(xí)能力。
1.3 時間特征提取
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是一種處理時序型輸入的神經(jīng)網(wǎng)絡(luò)。RNN在捕獲時間特征方面表現(xiàn)出很強的能力,但RNN在誤差梯度經(jīng)過多個時間步的反向傳播后,容易發(fā)生梯度消失或梯度爆炸現(xiàn)象,即無法對長期記憶的信息進行有效的提取和儲存。對于軌道交通短時客流預(yù)測任務(wù)中時間特征的提取,長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)通過門控制結(jié)構(gòu),調(diào)節(jié)記憶單元內(nèi)部狀態(tài)與其輸入輸出的相互作用,可以實現(xiàn)對關(guān)鍵信息的長期記憶。
本研究采用嵌套式LSTM神經(jīng)網(wǎng)絡(luò)(Nested LSTM,NLSTM)結(jié)構(gòu)來捕獲乘客出行需求的時間特征。與通過堆疊結(jié)構(gòu)來增加LSTM神經(jīng)網(wǎng)絡(luò)深度的結(jié)構(gòu)不同,NLSTM的嵌套式結(jié)構(gòu)如圖2所示。NLSTM神經(jīng)網(wǎng)絡(luò)通過引入多層LSTM結(jié)構(gòu)和共享參數(shù)的方式,提高了神經(jīng)網(wǎng)絡(luò)建模的能力,加快了訓(xùn)練速度,同時降低了過擬合的風(fēng)險。如圖2所示,NLSTM神經(jīng)網(wǎng)絡(luò)使用了LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),取代了傳統(tǒng)LSTM神經(jīng)網(wǎng)絡(luò)中的記憶單元,實現(xiàn)了在LSTM神經(jīng)網(wǎng)絡(luò)中嵌套一個LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。在NLSTM中,內(nèi)部記憶單元的訪問和信息的傳遞同樣被輸入門、遺忘門等單元所控制,以便長期信息只在有相關(guān)條件的情況下才選擇性的通過,可以更有效地捕捉對時間特征的長期依賴性。
內(nèi)部LSTM結(jié)構(gòu)的記憶單元狀態(tài)和門控制單元的公式與標準LSTM神經(jīng)網(wǎng)絡(luò)類似,如公式3~7所示。其中帶上標“~”的參數(shù)屬于內(nèi)部LSTM單元。
由于內(nèi)部存儲單元的存在,外部LSTM神經(jīng)網(wǎng)絡(luò)的記憶單元ct狀態(tài)信息更新過程見公式(10)。外部LSTM神經(jīng)網(wǎng)絡(luò)其他門控單元的更新方式與傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡(luò)一致。
引入注意力機制(attention mechanism)從歷史時間步中提取重要的時間特征。在基于注意力的NLSTM神經(jīng)網(wǎng)絡(luò)(Attention NLSTM)的結(jié)構(gòu)中,L(·)是個可學(xué)習(xí)函數(shù),對于輸入的不同歷史時間步出行需求分配不同的注意力權(quán)重,WA和bA分別是可訓(xùn)練的權(quán)重和偏置項。對于NSLTM神經(jīng)網(wǎng)絡(luò)的輸出γN,采用訓(xùn)練的注意力權(quán)重α進行加權(quán),使得模型的訓(xùn)練更專注于輸入數(shù)據(jù)中與當(dāng)前預(yù)測輸出相關(guān)的信息,計算方法見公式(11)~(12),其中⊙表示矩陣元素乘積。
1.4 外部特征提取
軌道交通運營具有鮮明的特點,例如,與公共汽車相比,列車按照精確的時刻表運行。對于乘客來說,乘客會在列車快要到站時,陸續(xù)進站到達站臺準備上車,此時進站客流會出現(xiàn)一定的小高峰波動。同時,為了運力和運量的良好匹配,在編制列車運行時刻表時便會充分考慮時段客流量多少,在一定時間窗內(nèi)列車排班到站數(shù)目越多,該時間窗內(nèi)進站客流量就會相對越大。因此,本文將單位小時內(nèi)上行方向和下行方向到站列車數(shù)目作為外部變量加入預(yù)測模型中。Ns,t表示站點s在時段t的列車到站數(shù)目,其中Nus,t表示站點s在時段t的上行方向列車到站數(shù)目,Nds,t表示站點s在時段t的下行方向列車到站數(shù)目,見公式13。
Ns,t=Nus,t,Nds,t。(13)
軌道交通因其具有運量大、正點率高、速度快等優(yōu)勢,在一定程度上滿足了城市居民的日常出行需求,但在站點位置和乘車線路方面具有一定的局限性,在人們通勤出行中,通常與公交、共享單車等進行接駁。因此,軌道交通站點周邊公交站點的分布和數(shù)量對地鐵客流有著一定的影響。本研究引入軌道交通站點周圍公交站點數(shù)目作為外部變量,其中Bs,1、Bs,2、Bs,3表示軌道交通站點s周邊500、1 000、1 500 m范圍內(nèi)公交站點數(shù)目,見公式14。
Bs=Bs,1,Bs,2,Bs,3。(14)
POI興趣點是地理信息系統(tǒng)范疇中的一個概念,指一些與人們生活密切相關(guān)的地理實體,如學(xué)校、銀行、餐館、醫(yī)院、超市等。區(qū)域中POI興趣點的分布可以在一定程度上反映出區(qū)域的土地利用特征。軌道交通站點的客流情況與該站點周邊的設(shè)施息息相關(guān)。如果某地鐵站點周邊居民小區(qū)分布較多,那么該地鐵站點的客流會以早晚通勤客流為主;如果該地鐵站點周邊餐飲行業(yè)較多,那么該地鐵站點會在用餐時間段內(nèi)客流量較大。本研究采用爬蟲技術(shù)獲取高德地圖開放平臺的POI數(shù)據(jù),來表示軌道交通站點周邊的土地使用情況,以提高軌道交通客流預(yù)測的精度。Ps表示站點s周圍POI類別數(shù)量,其中,交通設(shè)施\汽車服務(wù)類用Ps,tra表示,餐飲服務(wù)類用Ps,din表示,商業(yè)類用Ps,biz表示,風(fēng)景名勝類用Ps,int表示,住宅服務(wù)類用Ps,res表示,政府\金融類用Ps,gov表示,見公式15。
Ps=Ps,tra,Ps,din,Ps,biz,Ps,int,Ps,res,Ps,gov。(15)
1.5 多任務(wù)學(xué)習(xí)與模型融合
對于軌道交通短時客流預(yù)測,絕大多數(shù)的研究都是通過單任務(wù)學(xué)習(xí)的方式,對于單個不同的學(xué)習(xí)任務(wù),建立深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型。參考人類感知和學(xué)習(xí)模式的特點,研究者們提出了多任務(wù)學(xué)習(xí)的概念,如圖3所示。多任務(wù)學(xué)習(xí)采用并行訓(xùn)練多個相關(guān)任務(wù)的方式對子問題進行建模,在網(wǎng)絡(luò)結(jié)構(gòu)、輸入數(shù)據(jù)、訓(xùn)練方式等方面存在差異,需要采用更復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)和聯(lián)合訓(xùn)練的方式,以便共享知識和信息,提高模型的泛化能力。同時,由于多任務(wù)學(xué)習(xí)在相關(guān)任務(wù)間共享網(wǎng)絡(luò)參數(shù),因此采用多任務(wù)學(xué)習(xí)方式構(gòu)建的模型訓(xùn)練參數(shù)較少,模型的訓(xùn)練過程更加高效。
本節(jié)提出了基于多任務(wù)學(xué)習(xí)的時空神經(jīng)網(wǎng)絡(luò)模型(multi-task learningbased spatiotemporal neural network,MLT-STNN),來預(yù)測軌道交通短時進站客流和出站客流,模型的框架如圖4所示。MLT-STNN模型采用編碼器-解碼器結(jié)構(gòu)建立一種端到端的學(xué)習(xí)框架,在編碼過程中采用ResCNN模塊對站點的進站客流[Xt-Tinflow,…,Xtinflow]和出站客流[Xt-Toutflow,…,Xtoutflow]的空間特征進行提取,采用LSTM神經(jīng)網(wǎng)絡(luò)對外部特征包括時刻表特征Ns,t、周邊公交站分布特征Bs和區(qū)域的土地利用特征Ps進行提取。在解碼過程中,使用特征融合層對提取的特征進行連接,采用基于注意力的NLSTM神經(jīng)網(wǎng)絡(luò)對融合的特征變量進行解碼,使得預(yù)測模型在不同預(yù)測任務(wù)之間的信息相互共享,以預(yù)測地鐵網(wǎng)格中各個站點的進站量X︿t+1inflow和出站量X︿t+1outflow。在模型的訓(xùn)練過程中,采用Adam優(yōu)化器對提出的MLT-STNN模型進行優(yōu)化,模型的損失函數(shù)為平均絕對誤差(mean absolute error,MAE)。
2 客流時空特征分析
采用北京市一個月的地鐵刷卡數(shù)據(jù)集,對提出的MLT-STNN預(yù)測模型的性能進行測試,每條記錄包含乘客ID、刷卡進站時間、進站站點編號、刷卡出站時間、出站站點編號等。在數(shù)據(jù)處理的過程中,將該數(shù)據(jù)進一步分為兩組:前24 d的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,后7 d的數(shù)據(jù)作為測試數(shù)據(jù)集。在數(shù)據(jù)實驗過程中,測試了多個預(yù)測時間粒度下,所提出MLT-STNN模型的預(yù)測性能,例如10、30、60 min。對于歷史出行需求等連續(xù)型變量,采用min-max歸一化方法,處理后數(shù)據(jù)范圍為0,1。對于分類變量,如站點周邊土地利用類型,需要將其轉(zhuǎn)換為獨熱編碼(one-hot encoding)處理。
對歷史乘客刷卡出行數(shù)據(jù)進行分析,圖5顯示了不同功能區(qū)站點的進站客流時間分布??傮w來說,在住宅區(qū)和餐飲區(qū)的客流出行量較大,在風(fēng)景名勝區(qū)的客流出行量較小。在住宅區(qū),工作日(周一至周五)早上7點到9點之間出現(xiàn)進站的高峰,這種規(guī)律很符合乘客乘坐地鐵進行通勤的出行行為,然而在周末這種出行特征消失。在餐飲區(qū),休息日(周六至周天)11點起進站量開始逐漸增多,大部分市民在周末到餐飲區(qū)進行休閑活動,相較于工作日出行量明顯增大。不同功能區(qū)站點進站客流的出行特征不同,因此,短時客流預(yù)測需要考慮站點周邊的土地利用特征。圖6反映了地鐵站點的進站客流的空間分布,其中包括工作日的高峰和平峰、休息日高峰和平峰??梢钥闯?,在工作日的高峰,地鐵客流進站量較大,其中在大望路、國貿(mào)、西單等地鐵換乘站,客流量較大。因此,需要對大客流站點的短時出行需求進行準確預(yù)測,有利優(yōu)化行車組織和客流管控,以尋求運力、運量的最優(yōu)匹配。
3 實驗結(jié)果分析
3.1 算法預(yù)測精度對比
在不同時間粒度上,例如10、30、60 min,模型預(yù)測精度的對比見表1~3。
實驗結(jié)果表明,機器學(xué)習(xí)和深度學(xué)習(xí)算法具有更強的非線性擬合能力,在短時出行需求預(yù)測任務(wù)上表現(xiàn)的更好。例如,在10 min時間間隔的進站客流預(yù)測任務(wù)中,Ridge模型的δRMSE為47.66,SGD模型的δRMSE為49.52,SVR模型的δRMSE為42.46,GBDT模型的δRMSE為39.76。機器學(xué)習(xí)SVR模型和GBDT模型可以處理預(yù)測任務(wù)中的時空非線性關(guān)系,預(yù)測性能相較于統(tǒng)計學(xué)模型有所提升。深度學(xué)習(xí)LSTM模型通過引入了門控單元結(jié)構(gòu)來有選擇性地提取歷史時間步的出行需求信息,δRMSE降低為38.49,δMAE降低為20.00。LSTMAtt在LSTM模型中引入了注意力機制,使得模型更好的提取時間特征的相關(guān)性,預(yù)測誤差δRMSE為33.79,R2指標為0.92。CNN-LSTM 模型采用CNN和LSTM對客流的時空特征進行提取,預(yù)測誤差δRMSE為29.81。STNN模型考慮對時空出行特征的提取,預(yù)測誤差δRMSE降低為24.02,R2指標提升為0.96,這表明時空相關(guān)性的提取在地鐵短時出行需求預(yù)測中發(fā)揮重要作用,其中ResCNN結(jié)構(gòu)和基于注意力的NLSTM結(jié)構(gòu)可以更好地對預(yù)測任務(wù)的空間相關(guān)性和時間相關(guān)性進行提取。
本文所提出的STNN模型,在不同時間粒度下的客流預(yù)測都有較高的預(yù)測精度。例如,在10、30、60 min的進站客流預(yù)測任務(wù)中, LSTM模型的預(yù)測誤差δMAE指標為20.00、59.13和112.07。LSTMAtt模型的預(yù)測誤差δMAE指標為16.99、43.46和75.13,預(yù)測誤差分別減少15.05%、26.50%和32.96%。STNN模型通過殘差單元嵌入到網(wǎng)絡(luò)結(jié)構(gòu)中,實現(xiàn)了CNN網(wǎng)絡(luò)的跨層連接,預(yù)測誤差δMAE指標降低為13.56、36.92、64.33,相比于LSTMAtt模型預(yù)測誤差減少20.18%、15.04%和14.37%。在預(yù)測模型的時間復(fù)雜性上,Ridge模型和SGD模型預(yù)測所需的時間最短,但預(yù)測誤差較大。機器學(xué)習(xí)模型SVR模型和GBDT模型,預(yù)測時間比傳統(tǒng)的統(tǒng)計學(xué)模型的預(yù)測時間要長。由于需要提取時空特征和外部特征,所提出的STNN模型比LSTM模型和CNN模型需要更長的訓(xùn)練時間,但融合了較為豐富的時空特征以及外部環(huán)境特征,STNN模型表現(xiàn)出了良好的預(yù)測精度和魯棒性。因此,STNN模型可以在預(yù)定的時間內(nèi),準確預(yù)測軌道交通客流短時進出站量。
3.2 多任務(wù)學(xué)習(xí)算法預(yù)測結(jié)果
在多任務(wù)學(xué)習(xí)的實驗中,通過對MTL-LSTM模型、MTL-CNN-LSTM模型和MTL-STNN模型預(yù)測性能的比較(表4),發(fā)現(xiàn)多任務(wù)學(xué)習(xí)結(jié)構(gòu)可以進一步提高軌道交通短時進出站客流預(yù)測任務(wù)的精度。軌道交通進站客流和出站客流之間確實具有顯著的依賴性,這可以通過多任務(wù)學(xué)習(xí)方法來提取相關(guān)任務(wù)之間的內(nèi)在關(guān)聯(lián)關(guān)系。例如,在30 min的地鐵進站客流預(yù)測任務(wù)中,采用LSTM模型,預(yù)測誤差δRMSE和δMAE的值為91.27和59.13。多任務(wù)學(xué)習(xí)MTL-LSTM模型通過考慮進出站客流預(yù)測任務(wù)的相關(guān)性,預(yù)測誤差δRMSE和δMAE降低為88.44和49.86。MTL-STNN模型在多任務(wù)學(xué)習(xí)框架下,考慮對乘客出行時空特征的提取。例如,在30 min的需求預(yù)測中,對于進站客流的預(yù)測任務(wù),MTL-STNN模型預(yù)測誤差δRMSE和δMAE為56.79和28.14,與STNN模型相比,預(yù)測誤差降低24.79%和23.78%。在測試集上,多任務(wù)學(xué)習(xí)模型預(yù)測精度對比如圖7所示,可以看出基于多任務(wù)的深度學(xué)習(xí)模型可以更加準確地預(yù)測軌道交通乘客短時出行需求。
4 結(jié)論
本文主要研究了軌道交通短時客流預(yù)測任務(wù),提出了一種基于多任務(wù)學(xué)習(xí)的時空神經(jīng)網(wǎng)絡(luò)模型。該模型采用殘差卷積神經(jīng)網(wǎng)絡(luò)和嵌套式長短期記憶神經(jīng)網(wǎng)絡(luò)提取地鐵客流的時空相關(guān)性,引入注意力機制加強模塊對特征的提取效果。考慮到地鐵運營的特點,選取列車運行特征、軌道交通站點周邊公交站點以及興趣點數(shù)據(jù)作為外部特征,以提高模型的預(yù)測精度?;诒本┑罔F的乘客刷卡數(shù)據(jù),本文首先分析了用戶出行需求的時間特征和空間特征,以及在工作日和周末不同功能區(qū)域的乘客出行模式?;诔丝退⒖〝?shù)據(jù),在不同時間粒度的預(yù)測任務(wù)上進行實驗,融合多源數(shù)據(jù)以提高不同時段客流預(yù)測的準確度。與基準模型包括數(shù)理統(tǒng)計的模型和機器學(xué)習(xí)模型的預(yù)測性能相比,本文提出的MTL-STNN模型,采用定制化的神經(jīng)網(wǎng)絡(luò)提取模塊,同時考慮了對時空出行特征的提取,并通過多任務(wù)學(xué)習(xí)方法刻畫進站客流和出站客流之間的相關(guān)性,模型表現(xiàn)出了良好的預(yù)測精度和魯棒性。未來將進一步研究面向大規(guī)模城市軌道交通網(wǎng)絡(luò)以及多場景的短時客流預(yù)測,為客流管控和行車調(diào)度提供更豐富的數(shù)據(jù)基礎(chǔ)。
參考文獻:
[1]中國城市軌道交通協(xié)會. 城市軌道交通2021年度統(tǒng)計和分析報告. [EB/OL]. [2022-04-22]. https://www.camet.org.cn/tjxx/9944
[2]李梅, 李靜, 魏子健, 等. 基于深度學(xué)習(xí)長短期記憶網(wǎng)絡(luò)結(jié)構(gòu)的地鐵站短時客流量預(yù)測[J]. 城市軌道交通研究, 2018, 21(11): 42-46. DOI: 10.16037/j.1007-869x.2018.11.009.
[3]LIU Y, LIU Z Y, JIA R. DeepPF: A deep learning based architecture for metro passenger flow prediction[J]. Transportation Research Part C: Emerging Technologies, 2019, 101: 18-34. DOI: 10.1016/j.trc.2019.01.027.
[4]施俊慶, 李睿, 程明慧, 等. 基于動態(tài)時空神經(jīng)網(wǎng)絡(luò)模型的地鐵客流預(yù)測[J]. 交通運輸系統(tǒng)工程與信息, 2023, 23(2): 139-147. DOI: 10.16097/j.cnki.1009-6744.2023.02.015.
[5]趙陽陽, 夏亮, 江欣國. 基于經(jīng)驗?zāi)B(tài)分解與長短時記憶神經(jīng)網(wǎng)絡(luò)的短時地鐵客流預(yù)測模型[J]. 交通運輸工程學(xué)報, 2020, 20(4): 194-204. DOI: 10.19818/j.cnki.1671-1637.2020.04.016.
[6]LI Y, WANG X D, SUN S, et al. Forecasting short-term subway passenger flow under special events scenarios using multiscale radial basis function networks[J]. Transportation Research Part C: Emerging Technologies, 2017, 77: 306-328. DOI: 10.1016/j.trc.2017.02.005.
[7]XUE G, LIU S F, REN L, et al. Forecasting the subway passenger flow under event occurrences with multivariate disturbances[J]. Expert Systems With Applications, 2022, 188: 116057. DOI: 10.1016/j.eswa.2021.116057.
[8]趙建東, 朱丹, 劉佳欣. 基于時間序列分解與門控循環(huán)單元的地鐵換乘客流預(yù)測[J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版), 2022, 50(5): 22-31. DOI: 10.12141/j.issn.1000-565X.210559.
[9]惠陽, 王永崗, 彭輝, 等. 基于優(yōu)化PSO-BP算法的耦合時空特征下地鐵客流預(yù)測[J]. 交通運輸工程學(xué)報, 2021, 21(4): 210-222. DOI: 10.19818/j.cnki.1671-1637.2021.04.016.
[10]LI C, BAI L, LIU W, et al. A multi-task memory network with knowledge adaptation for multimodal demand forecasting[J]. Transportation Research Part C: Emerging Technologies, 2021, 131: 103352. DOI: 10.1016/j.trc.2021.103352.
[11]李德奎, 杜書波, 張鵬. 基于ARIMA和LSTM的城市軌道交通延時客流預(yù)測方法比較[J]. 青島理工大學(xué)學(xué)報, 2021, 42(4): 135-142. DOI: 10.3969/j.issn.1673-4602.2021.04.020.
[12]邵必林, 饒媛, 何欣. 基于SARIMA-SVM組合模型的地鐵客流量預(yù)測研究[J]. 軟件導(dǎo)刊, 2022, 21(11): 24-30. DOI: 10.11907/rjdk.212729.
[13]韓皓, 徐圣安, 趙蒙. 考慮線網(wǎng)結(jié)構(gòu)的LightGBM軌道交通短時客流預(yù)測模型[J]. 鐵道運輸與經(jīng)濟, 2021, 43(10): 109-117. DOI: 10.16668/j.cnki.issn.1003-1421.2021.10.17.
[14]ROOS J, GAVIN G, BONNEVAY S. A dynamic Bayesian network approach to forecast short-term urban rail passenger flows with incomplete data[J]. Transportation Research Procedia, 2017, 26: 53-61. DOI: 10.1016/j.trpro.2017.07.008.
[15]CHEN P F, FU X D, WANG X. A graph convolutional stacked bidirectional unidirectional-LSTM neural network for metro ridership prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(7): 6950-6962. DOI: 10.1109/TITS.2021.3065404.
[16]沈永發(fā), 鄭煜, 劉輝冉, 等. 基于歷史數(shù)據(jù)的軌道交通站內(nèi)客流預(yù)測模型[J]. 武漢理工大學(xué)學(xué)報(信息與管理工程版), 2022, 44(6): 887-893. DOI: 10.3963/j.issn.2095-3852.2022.06.003.
[17]王金水, 歐雪雯, 陳俊巖, 等. 基于組合模型的城市軌道站點短時客流分類預(yù)測[J]. 鐵道科學(xué)與工程學(xué)報, 2023, 20(6): 2004-2012. DOI: 10.19713/j.cnki.43-1423/u.t20221280.
[18]張金雷, 陳奕潔, Panchamy Krishnakumari, 等. 基于注意力機制的城市軌道交通網(wǎng)絡(luò)級多步短時客流時空綜合預(yù)測模型[J]. 地球信息科學(xué)學(xué)報, 2023, 25(4): 698-713.