吳 娟,何躍齊,張 寧,吳海峰
(1. 南京地鐵建設(shè)有限責(zé)任公司,南京 210017;2. 北京城建設(shè)計發(fā)展集團股份有限公司,北京 100037; 3. 東南大學(xué)ITS 研究中心軌道交通研究所,南京 210018;4. 浙江浙大網(wǎng)新眾合軌道交通工程有限公司,杭州 310012)
隨著我國軌道交通行業(yè)的快速發(fā)展,許多城市(如北京、廣州、上海、南京等)的軌道交通網(wǎng)絡(luò)已基本成型。軌道交通因其運量大、準時性、低能耗、綠色環(huán)保等特點,已逐漸成為人們出行的主要交通方式之一。截至2020 年12 月底,我國內(nèi)地45 個城市累計開通軌道交通運營線路總里程超過7 900 km,完成客運量175.9 億人次[1]。
不斷增長的客流需求對軌道交通系統(tǒng)運營組織提出了更高的要求,而精準的客流預(yù)測則成為應(yīng)對日益增長的軌道交通客流的關(guān)鍵所在。根據(jù)預(yù)測時間的跨度,將客流預(yù)測分為短時預(yù)測和中長期預(yù)測。其中,中長期客流預(yù)測主要用于城市軌道交通的線網(wǎng)規(guī)劃,預(yù)測時間一般以年、季、月為粒度;短時客流預(yù)測對于城市軌道交通相關(guān)部門的運營管理、組織優(yōu)化、人員配備等具有重要的意義,預(yù)測時間一般以15 min、30 min、1 h 為粒度。
軌道交通運營管理單位在發(fā)車間隔的確定、短時運營調(diào)節(jié)策略的制訂、客流的動態(tài)管理以及車站應(yīng)急指揮管理等多個方面,都依賴于短時客流預(yù)測的數(shù)據(jù)支持。因此,準確地把握城市軌道交通的中短時客流動態(tài)變化規(guī)律,進而預(yù)測未來的客流趨勢,是提高軌道交通運營管理水平的重要前提。
現(xiàn)有客流預(yù)測方法可分為基于統(tǒng)計分析及數(shù)值分析的理論模型、基于人工智能的模型,以及各種組合模型[2]。
基于統(tǒng)計分析的參數(shù)方法假設(shè)地鐵客流數(shù)據(jù)服從某種數(shù)學(xué)分布,利用歷史數(shù)據(jù)對模型進行標定,代表方法有自回歸滑動平均模型(ARIMA)、高斯過程等[3]。參數(shù)模型的建立較依賴于對研究問題的先驗認知,具有一定的主觀性。例如,NI 等[4]經(jīng)過分析發(fā)現(xiàn),社交媒體發(fā)帖率與地鐵客流量存在適度的正相關(guān)關(guān)系,為此提出了一種將線性回歸和季節(jié)性差分自回歸滑動平均的模型(SARIMA),對紐約地鐵的短期客流進行預(yù)測。李明敏等[5]針對重大展會影響范圍下的地鐵客流特征和預(yù)測問題,以及6 種常規(guī)的客流預(yù)測算法存在的缺陷,提出了一種修正的ARIMA 模型;經(jīng)數(shù)據(jù)驗證,該模型具有較高的適用性和精確性。
基于人工智能的模型包括支持向量機模型[6]、神經(jīng)網(wǎng)絡(luò)模型[7-10]等。Zhang 等[7]提出了一種混合時空深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(HSTDL-net),用來預(yù)測短期地鐵客流,將其應(yīng)用于南京地鐵2 號線進出站的客流預(yù)測中,結(jié)果證明該HSTDL 網(wǎng)絡(luò)的預(yù)測性能優(yōu)于ARIMA、MLP、CNN、LSTM 和GBRT 等的預(yù)測模型,能更有效、更充分地發(fā)現(xiàn)客流數(shù)據(jù)中的隱藏規(guī)律。崔洪濤等[8]結(jié)合AFC 刷卡數(shù)據(jù)、節(jié)假日數(shù)據(jù)、氣象數(shù)據(jù)進行數(shù)據(jù)特征構(gòu)造,采用DLSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測地鐵進站客流。
近年來,國內(nèi)外學(xué)者考慮到單一預(yù)測模型的片面性和實際客流的復(fù)雜性,針對客流狀況存在的差異,嘗試利用組合模型來預(yù)測短期客流[9-11]。通過兩種或兩種以上預(yù)測模型的組合,實現(xiàn)優(yōu)勢互補,進而提高總體的預(yù)測精度。潘杰等[12]將優(yōu)化后的模型與馬爾可夫模型進行組合,使用組合模型對西安地鐵客流量進行預(yù)測,結(jié)果表明組合模型相比單一模型預(yù)測精度有顯著提高。傅晨琳等[13]將集合經(jīng)驗?zāi)B(tài)分解算法與BP神經(jīng)網(wǎng)絡(luò)結(jié)合,對地鐵客流進行了預(yù)測。馬曉旦等[14]提出了卡爾曼濾波與KNN 算法的融合模型,對公交站點的短期客流進行了有效預(yù)測。李應(yīng)兵等[15]以BP神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機構(gòu)建基準模型,再結(jié)合變分模態(tài)分解算法,預(yù)測了蘭州西站的月度客流發(fā)送量。鳳少偉等[16]提出了一種基于K-means 與GRU 神經(jīng)網(wǎng)絡(luò)的組合模型,用于短時交通流預(yù)測。王德廣等[17]提出了一種改進的PSO 算法,并將其與GRU 神經(jīng)網(wǎng)絡(luò)結(jié)合,應(yīng)用于城市道路的短時交通流預(yù)測。李得偉等[18]提出了一種將加權(quán)歷史平均自回歸、小波神經(jīng)網(wǎng)絡(luò)及ARIMA 等3 種方法組合的軌道交通短時客流預(yù)測模型。
綜上可知,組合預(yù)測模型的預(yù)測精度一般高于單一客流預(yù)測模型的預(yù)測精度。因此,針對城市軌道交通客流的非線性和非平穩(wěn)性等特征,筆者提出了變分模態(tài)分解(variational mode decomposition,VMD)與門控遞歸單元神經(jīng)網(wǎng)絡(luò)(gate recurrent unit,GRU)相結(jié)合的模型VMD-GRU,用于預(yù)測軌道交通中的短時客流。VMD 將軌道交通站點客流的時間序列數(shù)據(jù)分解為若干個模態(tài)分量,然后將分解得到的模態(tài)分量通過優(yōu)化后的GRU 神經(jīng)網(wǎng)絡(luò)進行短期客流的預(yù)測。通過與其他神經(jīng)網(wǎng)絡(luò)預(yù)測模型的對比分析,證明本研究提出模型的可靠性和準確性。
Dragomiretskiy 等[19]于2014 年提出了VMD 的概念,它指的是一種自適應(yīng)的、完全非遞歸的模態(tài)變分和對信號進行處理的方法。VMD 算法將任意信號f(t)分解成k 個圍繞在中心頻率ωk周圍的模態(tài)分量,擬定每個信號分量都有其中心頻率和帶寬,所以變分問題即可表示為尋求k 個使模態(tài)帶寬總和最小的模態(tài)分量。VMD 問題主要是求解以下變分約束模型,即
式中:uk為信號的第k 個分解模態(tài),ωk為每個模態(tài)信號的第k 個中心頻率。
在城市軌道交通客流預(yù)測中,客流分解后的多個模態(tài)分量表達的可能是客流在不同周期下的趨勢,如年趨勢、季度趨勢、月趨勢等。
為了求解上述變分約束模型,引入懲罰因子與拉格朗日懲罰算子,構(gòu)造拉格朗日增廣函數(shù),即
式中:α 為二次懲罰因子,用于保證輸入信號f(t)在高斯噪聲影響下信號的重構(gòu)精度;λt為拉格朗日乘法算子,目的是保持約束條件的嚴格性。
采用交替方向乘子算法(altemate direction method of multipliers,ADMM)計算出最優(yōu)解,具體步驟如下:
4) 更新中心頻率,有
5) 更新拉格朗日乘子,有
式中,τ 為拉格朗日乘子更新參數(shù)。
6) 重復(fù)步驟2)~5),對于給定判別精度ε >0,直到滿足迭代條件
得到k 個窄帶本征模態(tài)函數(shù)分量,迭代過程結(jié)束。若未滿足迭代精度條件,返回步驟2)。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種多應(yīng)用于處理序列數(shù)據(jù)問題的具有短期記憶能力的神經(jīng)網(wǎng)絡(luò),其隱藏層引入了帶自反饋功能的結(jié)構(gòu),使其各個神經(jīng)元之間的信息傳遞成為可能。RNN 主要由輸入層、隱藏層、輸出層3 個部分組成,其隱藏層結(jié)構(gòu)如圖1 所示。
圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) Figure 1 Structure of cyclic neural network
規(guī)定一條時間序列數(shù)據(jù)為x={x1,x2,…,xn},則在t 時刻有
式中,ht表示t 時刻隱藏層內(nèi)的值,yt表示t 時刻輸出層內(nèi)的值,bh和by分別表示隱藏層與輸出層的偏置項,f ( )、g( )分別表示隱藏層和輸出層的激活函數(shù)。
信息傳遞過程一般包括如下3 個步驟:
1) 前向傳播:根據(jù)輸入x 得到輸出y;
2) 反向傳播:計算每個位置的損失函數(shù)和最終損失L;
3) 優(yōu)化過程:優(yōu)化減小誤差項,并計算每個權(quán)重。
盡管RNN 具有參數(shù)共享、短時記憶等優(yōu)點,但在處理依賴性強、時間跨度較長的問題時,會出現(xiàn)梯度爆炸、梯度消失的問題,從而導(dǎo)致學(xué)習(xí)效率降低,模型結(jié)果與實際數(shù)據(jù)偏差較大。
長短期記憶模型(LSTM)解決了RNN 的長期依賴性問題,但其需要設(shè)置較多的參數(shù),收斂速度較慢,降低了訓(xùn)練效率。GRU 神經(jīng)網(wǎng)絡(luò)是LSTM 的改進版本,更新門代替了LSTM 中的輸入門和遺忘門;此外GRU 還引入了一個重置門,用以控制遺忘信息長度。GRU 網(wǎng)絡(luò)隱藏層的結(jié)構(gòu)如圖2 所示。
圖2 GRU 網(wǎng)絡(luò)隱藏層結(jié)構(gòu) Figure 2 Structure of the hidden layer of GRU network
更新門用于確定上一隱藏層傳遞給當前隱藏層的信息量,重置門則確定忘掉狀態(tài)信息量的多少[15]。門結(jié)構(gòu)工作原理可用公式表示如下:
式中:W 和b 分別表示其對應(yīng)門的權(quán)重矩陣和偏置項;σ 表示sigmod 激活函數(shù),它能夠?qū)?shù)據(jù)值映射到[0,1]區(qū)間內(nèi),從而實現(xiàn)門控的目的。
將時間序列數(shù)據(jù)輸入GRU 神經(jīng)網(wǎng)絡(luò),通過前向計算得到輸出值后,再計算每個神經(jīng)元的誤差。
VMD 分解具有堅實的理論基礎(chǔ),是一種基于數(shù)學(xué)中泛函分析變分理論的分解方法,可極大地降低時間序列數(shù)據(jù)中的噪聲,從而避免數(shù)據(jù)中的噪聲對預(yù)測結(jié)果產(chǎn)生影響。地鐵車站客流原始數(shù)據(jù)具有明顯的非線性、非平穩(wěn)特征,利用VMD 分解對客流數(shù)據(jù)進行處理,可以消除數(shù)據(jù)波動,提高車站短期客流預(yù)測的精度[20-21]。
LSTM 是一種在時間序列建模問題上優(yōu)勢明顯的神經(jīng)網(wǎng)絡(luò)模型,它具有長時記憶功能,并解決了長序列訓(xùn)練過程中存在的梯度消失和梯度爆炸的問題,且實現(xiàn)過程相對簡單。GRU 是基于LSTM 的一種升級版變體,簡化了網(wǎng)絡(luò)的結(jié)構(gòu),效果也更加卓越,它可以解決RNN 網(wǎng)絡(luò)中的長期依賴問題,且相對于LSTM少了一個門函數(shù),因此其參數(shù)數(shù)量較LSTM 的少,在模型整體訓(xùn)練速度上要快于LSTM。
本研究將VMD 分解算法與GRU 神經(jīng)網(wǎng)絡(luò)進行組合,構(gòu)建VMD-GRU 短期客流預(yù)測模型,在降低數(shù)據(jù)噪聲的基礎(chǔ)上實現(xiàn)高精度的客流預(yù)測,具體步驟如下:
1) 對地鐵AFC 刷卡數(shù)據(jù)進行預(yù)處理,剔除同站進出、進出站有誤等異常數(shù)據(jù),然后按不同的時間粒度提取車站短時進出站的客流數(shù)據(jù);
2) 客流數(shù)據(jù)分為工作日與非工作日數(shù)據(jù),將這兩類時間序列客流數(shù)據(jù)轉(zhuǎn)化為有標簽的可用于監(jiān)督學(xué)習(xí)的數(shù)據(jù);
3) 利用VMD 方法分解客流數(shù)據(jù),通過計算中心頻率、皮爾遜相關(guān)系數(shù),確定VMD 模態(tài)分量uk;
4) 將所有序列的VMD 模態(tài)分量作為模型的輸入,構(gòu)建GRU 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,進行模型的訓(xùn)練和預(yù)測。
為了驗證VMD-GRU 預(yù)測模型的科學(xué)有效性,本次實驗選取了南京地鐵1 號線中間站中華門站2019 年3 月13 日—6 月28 日之間所有的工作日7:00—23:00 進出站的客流量數(shù)據(jù),對模型的預(yù)測性能進行檢驗。在進出站的客流數(shù)據(jù)集中,訓(xùn)練集和測試集的劃分比例為70%和30%。
為驗證VMD-GRU組合預(yù)測模型的有效性和優(yōu)越性,選取原始GRU 神經(jīng)網(wǎng)絡(luò)模型作為基準模型,分別構(gòu)建粒度為15、30、60 min 的客流預(yù)測模型,再與VMD-GRU 模型進行對比。
如圖3 所示,VMD 分解過程中的參數(shù)K 的取值對最終的預(yù)測結(jié)果是有影響的。經(jīng)過多次實驗,在15、30、60 min 粒度的預(yù)測模型中,K 的最佳取值為9、8、6。
圖4所示的客流序列分解結(jié)果的預(yù)測粒度為60 min,帶寬因子為1 000,K=6。由圖4(b)可知,VMD 能準確地分離出原始客流序列中位于不同頻段內(nèi)的客流特征信號分量。
圖3 不同K 值下的預(yù)測效果 Figure 3 Results of prediction under different K values
圖4 客流量數(shù)據(jù)的VMD 分解結(jié)果 Figure 4 VMD decomposition results of passenger flow sequence
以南京地鐵1 號線中華門站點的軌道交通進站客流量作為原始數(shù)據(jù)進行分解,分別運用原始的GRU神經(jīng)網(wǎng)絡(luò)模型以及與VMD 進行組合后的 VMD-GRU的模型,進行軌道交通進出站客流量的預(yù)測。
為了驗證預(yù)測模型的準確性,采用4 項指標來衡量模型的預(yù)測效果,分別是平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)、均方根誤差(RMSE)、均方誤差(MSE),其計算公式如下:
式中:n 為預(yù)測值樣本數(shù)量,Yi為真實的地鐵客流值,為預(yù)測的客流值。
基準模型以及組合模型的預(yù)測結(jié)果如圖5 所示,各誤差評價指標如表1~3 所示。由圖5 和表1~3 可知:
1) 相較于基準模型,使用降噪后數(shù)據(jù)進行預(yù)測,模型的預(yù)測精度有一定程度的提升,這證明使用VMD算法對客流數(shù)據(jù)進行降噪處理,能有效提高模型的預(yù)測精度。
2) 在15、30、60 min 的預(yù)測時間粒度下,VMD- GRU 模型的MAPE 指標分別比單一的GRU 模型降低了7.57%、16.93%和18.47%,預(yù)測精確度有較大提升。
綜上所述,本研究提出的VMD-GRU 神經(jīng)網(wǎng)絡(luò)模型應(yīng)用在軌道交通車站短時進出站客流量的預(yù)測中,效果良好。
本研究針對軌道交通系統(tǒng)中短期客流預(yù)測精度不足的問題,提出一種組合模型預(yù)測方法。利用VMD算法對客流時間序列數(shù)據(jù)進行降噪,將降噪后的客流數(shù)據(jù)作為GRU 神經(jīng)網(wǎng)絡(luò)的輸入,從而完成對短期客流的預(yù)測,形成VMD-GRU 神經(jīng)網(wǎng)絡(luò)預(yù)測模型。該模型在地鐵短時客流預(yù)測方面效果良好,可為地鐵運營管理部門對車站客流的動態(tài)管理、車站事件的應(yīng)急管理、日常行車計劃的制定、短時運營策略的調(diào)整等, 提供有效的數(shù)據(jù)支撐,從而提升線網(wǎng)總體運營效率以及軌道交通系統(tǒng)的服務(wù)水平。
圖5 各模型預(yù)測效果對比 Figure 5 Comparison of prediction results of each model
表1 各模型15 min 客流預(yù)測指標對比 Table 1 Performance comparison of prediction models
表2 各模型30 min 客流預(yù)測指標對比 Table 2 Performance comparison of prediction models
表3 各模型60 min 客流預(yù)測指標對比 Table 3 Performance comparison of prediction models
影響軌道交通車站進站客流需求的因素眾多,僅從歷史客流的角度對車站的短期客流進行預(yù)測存在一定的片面性,會忽略其他因素可能對客流產(chǎn)生的影響,如站點之間的時空關(guān)聯(lián)性、特殊事件及節(jié)假日的影響等。下一步的研究將側(cè)重于考慮時空特征、特殊事件等多因素條件下的車站短期客流預(yù)測。