崔洪濤 陳曉旭 楊 超,3 項(xiàng) 煜 段紅勇
(1.河南省高速公路聯(lián)網(wǎng)監(jiān)控收費(fèi)通信服務(wù)有限公司,450018,鄭州;2.同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,201804,上海;3.同濟(jì)大學(xué)城市交通研究院,200092,上海;4.河南省交通一卡通有限責(zé)任公司,450018,鄭州//第一作者,高級(jí)工程師)
客流預(yù)測(cè)對(duì)于地鐵線路設(shè)計(jì)規(guī)劃、運(yùn)營管理以及預(yù)警都有著重要意義。當(dāng)前地鐵客流預(yù)測(cè)方法主要包括基于線性理論預(yù)測(cè)、基于非線性理論預(yù)測(cè)和基于組合模型預(yù)測(cè)的3種方法。線性預(yù)測(cè)模型主要包括時(shí)間序列法[1-3]和卡爾曼濾波模型[4]等。線性預(yù)測(cè)模型理論簡單,但是當(dāng)預(yù)測(cè)時(shí)間變短(小于15 min,甚至更短)時(shí),隨著客流量的非線性與不確定性增強(qiáng),基于線性理論的預(yù)測(cè)模型預(yù)測(cè)性能就會(huì)變差。
地鐵客流具有非線性、隨機(jī)性、周期性的特點(diǎn),短時(shí)客流波動(dòng)性與隨機(jī)性尤其較大,因此短時(shí)客流預(yù)測(cè)應(yīng)采用非線性模型進(jìn)行分析。常用的基于非線性理論的預(yù)測(cè)模型主要有非參數(shù)回歸模型[5]、馬爾可夫鏈[6]、神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)[8]等?;诜蔷€性理論的預(yù)測(cè)方法更加符合地鐵客流的非線性特點(diǎn),該方法只需根據(jù)歷史數(shù)據(jù)訓(xùn)練,從數(shù)據(jù)本身尋找演變規(guī)律,因此該方法需要大量的數(shù)據(jù)做支持,相應(yīng)的運(yùn)算量也會(huì)增大。
單一的線性或非線性預(yù)測(cè)模型往往存在一定的不足與缺陷。多種模型結(jié)合預(yù)測(cè)方法利用兩種或者兩種以上的預(yù)測(cè)方法進(jìn)行預(yù)測(cè),既避免了每種方法的缺陷,同時(shí)又很好地繼承了各種方法的優(yōu)點(diǎn),預(yù)測(cè)精度也較單一預(yù)測(cè)模型有所提高。文獻(xiàn)[9]利用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行城市軌道交通線路流量的預(yù)測(cè),構(gòu)建了基于混合核函數(shù)的支持向量機(jī)模型進(jìn)行進(jìn)站客流量預(yù)測(cè),最后融合兩種預(yù)測(cè)方法構(gòu)建了基于灰色關(guān)聯(lián)度最大化的組合預(yù)測(cè)模型來預(yù)測(cè)重大節(jié)假日線路客流量。文獻(xiàn)[10]提出的城市軌道交通短時(shí)客流預(yù)測(cè)模型(EMD-BPN),包含經(jīng)驗(yàn)?zāi)B(tài)分解和反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的組合。文獻(xiàn)[11]提出了基于聚類搜索的改進(jìn)遺傳算法和小波神經(jīng)網(wǎng)絡(luò)(IGA-WNN)客流預(yù)測(cè)模型。
近年來深度學(xué)習(xí)有了充分的發(fā)展,當(dāng)前使用比較多的是深度神經(jīng)網(wǎng)絡(luò)。文獻(xiàn)[12]設(shè)計(jì)了深度長短期記憶網(wǎng)絡(luò)(DLSTM)模型,并利用DLSTM模型對(duì)石油產(chǎn)量進(jìn)行預(yù)測(cè)。本文首先對(duì)多源數(shù)據(jù)(地鐵IC卡數(shù)據(jù)、氣候數(shù)據(jù)和節(jié)假日數(shù)據(jù))進(jìn)行特征構(gòu)造,然后利用DLSTM模型進(jìn)行地鐵客流預(yù)測(cè)。本次研究選取深圳市2014年1—3月的地鐵刷卡數(shù)據(jù)進(jìn)行研究。選取前兩個(gè)月的數(shù)據(jù)為訓(xùn)練集,后一個(gè)月的數(shù)據(jù)為測(cè)試集。采用不同的DLSTM來預(yù)測(cè)地鐵客流,并與差分自回歸移動(dòng)平均(ARIMA)模型、BP神經(jīng)網(wǎng)絡(luò)(BPNN)模型、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型和支持向量機(jī)(SVR)模型進(jìn)行比較。試驗(yàn)結(jié)果表明,DLSTM模型在準(zhǔn)確性方面優(yōu)于其他模型。
本次研究使用的數(shù)據(jù)來自深圳地鐵,包括2014年1—3月的地鐵IC卡數(shù)據(jù)、節(jié)假日數(shù)據(jù)和氣象數(shù)據(jù)。截至2014年底,深圳地鐵網(wǎng)由5條線路和118個(gè)站點(diǎn)組成,運(yùn)營里程為178 km,年度客流量為8.6億人次。地鐵IC卡數(shù)據(jù)格式如表1所示。
表1 2014年深圳市地鐵IC卡數(shù)據(jù)格式
首先對(duì)地鐵數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行處理。異常數(shù)據(jù)包括完全相同的記錄、刷卡時(shí)間字段有缺失的記錄。完成數(shù)據(jù)清理后,選取深圳北站地鐵站刷卡時(shí)間在6:00—23:00的地鐵IC卡數(shù)據(jù)記錄。此次研究對(duì)象為深圳北站地鐵站,因?yàn)樯钲诒闭臼侵匾慕煌屑~,客流量較大。前兩個(gè)月的數(shù)據(jù)用于訓(xùn)練模型,后一個(gè)月的數(shù)據(jù)用于測(cè)試驗(yàn)證。深圳北站地鐵站一周的進(jìn)出站客流量如圖1所示。
圖1 深圳北站地鐵站一周進(jìn)出站客流量
從圖1中可以看出:進(jìn)出站客流量都呈現(xiàn)出了一定的周期性,并且進(jìn)站客流量和出站客流量存在明顯的潮汐現(xiàn)象;早高峰的進(jìn)站客流量遠(yuǎn)遠(yuǎn)高于出站客流量,晚高峰的進(jìn)站客流量則遠(yuǎn)遠(yuǎn)低于出站客流量;工作日的客流量存在明顯的早晚高峰,周末的客流量變化相對(duì)平緩,不同的工作日之間又有一定的差異。
乘客選擇地鐵出行與天氣狀況以及是否是節(jié)假日有密切關(guān)系。文獻(xiàn)[13]對(duì)站點(diǎn)進(jìn)站客流量與天氣情況進(jìn)行了相關(guān)性分析,結(jié)果顯示相關(guān)性顯著。而客流量還與當(dāng)天是否是節(jié)假日也有很強(qiáng)的相關(guān)性。因此氣候數(shù)據(jù)集與節(jié)假日數(shù)據(jù)集也被用于構(gòu)造輸入特征。氣候數(shù)據(jù)集如表2所示,節(jié)假日數(shù)據(jù)集如表3所示。
表2 深圳市氣候數(shù)據(jù)格式
表3 節(jié)假日數(shù)據(jù)格式
在本次研究中,對(duì)地鐵IC卡數(shù)據(jù)、節(jié)假日數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行融合。選取客流量所在星期、小時(shí)、5 min間隔編號(hào)、是否節(jié)假日、平均氣溫、最高氣溫、最低氣溫、降雨量、大氣壓、風(fēng)速、云量、預(yù)測(cè)時(shí)刻的前6個(gè)時(shí)間間隔的客流量(例如預(yù)測(cè)9:00—9:05的客流量,用8:30—8:35、8:35—8:40、8:40—8:45、8:45—8:50、8:50—8:55、8:55—9:00的客流量來構(gòu)造特征)。因此,特征變量可以構(gòu)造訓(xùn)練數(shù)據(jù)集。
LSTM模型最初由文獻(xiàn)[14]作者提出,LSTM模型的主要目標(biāo)是解決RNN梯度消失且很難處理長序列數(shù)據(jù)的問題。LSTM模型由輸入層、循環(huán)隱藏層和輸出層組成。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,LSTM模型隱藏層的基本單元是記憶模塊。記憶模塊包含細(xì)胞狀態(tài)單元(CEC)和3個(gè)稱為門的特殊運(yùn)算單元。CEC在整個(gè)鏈中直接向下運(yùn)行而沒有任何激活功能,因此當(dāng)運(yùn)用反向傳播算法訓(xùn)練LSTM模型時(shí)梯度不會(huì)消失。記憶模塊包含輸入門、遺忘門和輸出門3個(gè)門結(jié)構(gòu),它們可以控制記憶模塊內(nèi)的信息流。LSTM模型記憶模塊的原理如圖2所示。遺忘門確定單元狀態(tài)拋出哪些信息,輸入門決定哪些新信息存儲(chǔ)在單元狀態(tài)中,輸出門決定單元狀態(tài)的哪些信息作為輸出。
圖2 LSTM記憶模塊原理圖
模型輸入為:X=(X1,X2,…,XT),隱藏層狀態(tài)可以通過以下循環(huán)訓(xùn)練得到:
ft=σ(XtUf+St-1Wf+bf)
(1)
it=σ(XtUi+St-1Wi+bi)
(2)
Ct=Ct-1?ft⊕it?tanh(XtUc+St-1Wc+bc)
(3)
ot=σ(XtUo+St-1Wo+bo)
(4)
St=ot?tanh(Ct)
(5)
式中:
Wf、Wi、Wo、Wc——分別為遺忘門、輸入門、輸出門和CEC的輸入權(quán)重矩陣;
Uf、Ui、Uo、Uc——分別為遺忘門、輸入門、輸出門和CEC的循環(huán)權(quán)重矩陣;
bf、bi、bo、bc——分別為忘記門、輸入門、輸出門和CEC的偏差向量;
Xt——第一層LSTM模型記憶模塊的輸入;
ft、it、ot、Ct、St———分別為t時(shí)刻忘記門、輸入門、輸出門、CEC和單元的輸出;
St-1——t-1時(shí)刻單元的輸出;
Ct-1——t-1時(shí)刻CEC的輸出;
⊕和?——分別代表向量求和與向量點(diǎn)積運(yùn)算;
σ(·)——標(biāo)準(zhǔn)sigmoid函數(shù);
tanh(·)——雙曲正切激活函數(shù)。
在DLSTM模型中,將多個(gè)LSTM模型塊進(jìn)行連接,如圖3所示。DLSTM模型可以結(jié)合每個(gè)LSTM模型層的優(yōu)點(diǎn)。在分層體系結(jié)構(gòu)中,堆疊多個(gè)LSTM模型可以在較低層構(gòu)建特征。這些特征可以將輸入數(shù)據(jù)中的變化因素,利用非線性轉(zhuǎn)化在較高層映射輸出。文獻(xiàn)[15]認(rèn)為在大型或復(fù)雜數(shù)據(jù)情況下,深層次的架構(gòu)將比淺層架構(gòu)更能反映出數(shù)據(jù)的內(nèi)在聯(lián)系。
圖3 DLSTM 模型結(jié)構(gòu)
St-1,1為上一個(gè)狀態(tài)的第一層的輸出,St為現(xiàn)在狀態(tài)的第一層輸出且是下一個(gè)LSTM模型記憶模塊的輸入。對(duì)于第二個(gè)LSTM模型記憶模塊,由上一個(gè)狀態(tài)的St-1,2和現(xiàn)在狀態(tài)上一層的輸出St,1就可以計(jì)算得到該記憶模塊的輸出St,2。后面各層的計(jì)算原理都是相同。
為了全面地評(píng)價(jià)模型的預(yù)測(cè)效果,本文選取平均絕對(duì)誤差(EMA)、均方根誤差(ERMS)、平均絕對(duì)百分比誤差(EMAP)作為模型評(píng)價(jià)指標(biāo)。這3個(gè)指標(biāo)可以反映預(yù)測(cè)值與實(shí)際值之間的誤差大小,其定義分別為:
(6)
(7)
(8)
式中:
h(i)——預(yù)測(cè)值;
f(i)——真實(shí)值。
利用DLSTM模型分別對(duì)深圳北站地鐵站的進(jìn)站客流量和出站客流量進(jìn)行預(yù)測(cè)。并且與其它模型預(yù)測(cè)結(jié)果進(jìn)行比較,比較模型分別為差分自回歸移動(dòng)平均模型(ARIMA)、BP神經(jīng)網(wǎng)絡(luò)(BPNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、支持向量機(jī)(SVR)。
設(shè)計(jì)了3種不同層數(shù)的DLSTM模型,分別對(duì)進(jìn)站客流量進(jìn)行預(yù)測(cè)。不同結(jié)構(gòu)的DLSTM模型參數(shù)以及預(yù)測(cè)評(píng)價(jià)指標(biāo)結(jié)果如表4所示,不同DLSTM模型結(jié)構(gòu)的客流量預(yù)測(cè)結(jié)果如圖4所示。
表4 不同DLSTM模型的進(jìn)站客流量預(yù)測(cè)評(píng)價(jià)指標(biāo)
由表4可知,隨著DLSTM模型的深度增加,預(yù)測(cè)精度變高。DLSTM3模型的精度為:EMA=32.33,ERMS=45.74,EMAP=13.90%。
圖4 不同DLSTM模型的進(jìn)站客流量預(yù)測(cè)結(jié)果
從圖4中可以看出,DLSTM模型具有較好的預(yù)測(cè)效果,并且DLSTM3模型的預(yù)測(cè)值曲線和真實(shí)值曲線差異最小。
不同預(yù)測(cè)模型的進(jìn)站客流量預(yù)測(cè)評(píng)價(jià)指標(biāo)如表5所示,不同預(yù)測(cè)模型的進(jìn)站客流預(yù)測(cè)結(jié)果如圖5所示。
表5 不同預(yù)測(cè)模型的進(jìn)站客流量預(yù)測(cè)評(píng)價(jià)指標(biāo)
由表5可知,DLSTM3模型的預(yù)測(cè)精度最高。在所有的比較模型中,RNN模型預(yù)測(cè)效果最好,而SVR模型的預(yù)測(cè)效果最差。DLSTM3模型與SVR模型相比較,EMA降低了30.14,ERMS降低了25.62,ERMS降低了20.88%。DLSTM3模型與RNN模型相比較,EMA降低了10.05,ERMS降低了12.84,ERMS降低了2.29%。
圖5 不同預(yù)測(cè)模型的進(jìn)站客流量預(yù)測(cè)結(jié)果
由圖5可見,DLSTM3模型的預(yù)測(cè)值曲線和真實(shí)值曲線差異性最小,而SVR模型的預(yù)測(cè)值曲線和真實(shí)值曲線差異最大。
本文提出利用深度長短期記憶網(wǎng)絡(luò)(DLSTM)方法預(yù)測(cè)地鐵進(jìn)站客流量。首先,對(duì)地鐵刷卡數(shù)據(jù)、氣候數(shù)據(jù)和節(jié)假日數(shù)據(jù)進(jìn)行預(yù)處理并完成特征構(gòu)造。對(duì)深圳北站地鐵站進(jìn)站客流量進(jìn)行試驗(yàn)驗(yàn)證,設(shè)計(jì)了不同的DLSTM模型,對(duì)各模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明,DLSTM模型預(yù)測(cè)準(zhǔn)確度隨著DLSTM模型深度的增加而提高。然后,將DLSTM模型預(yù)測(cè)結(jié)果與其它4種模型(ARIMA、BPNN、RNN、SVR)的預(yù)測(cè)結(jié)果進(jìn)行比較,結(jié)果表明,DLSTM 的預(yù)測(cè)精度更高。充分驗(yàn)證了深度長短期記憶網(wǎng)絡(luò)方法在地鐵客流預(yù)測(cè)中的適用性和準(zhǔn)確性。在下一步的研究中,將考慮DLSTM模型與其他模型結(jié)合起來建立組合模型。