黃海超,陳景雅,孫 睿
(河海大學(xué)土木與交通學(xué)院,江蘇 南京210098)
由于軌道交通安全、準(zhǔn)時和環(huán)保等特點,已逐漸成為人們出行的首選交通方式,基于數(shù)據(jù)挖掘技術(shù)的客流量預(yù)測是城市智能交通系統(tǒng)的重要組成部分,不僅對人們出行和智能交通管控有著重要的指導(dǎo)意義,也有助于相關(guān)部門提前進行運營規(guī)劃和調(diào)度。
客流量預(yù)測模型主要分為以差分自回歸移動平均模型[1](ARIMA)和灰色模型(GM)為代表的參數(shù)模型與以支持向量機[2](SVM)和神經(jīng)網(wǎng)絡(luò)[3]為代表的非參數(shù)模型。 但傳統(tǒng)模型收斂慢,時效性低,很難滿足交通大數(shù)據(jù)情況下智能管控需求[4]。 基于深度學(xué)習(xí)的長短時記憶神經(jīng)網(wǎng)絡(luò)LSTM (long shortterm memory)不僅預(yù)測性能、收斂時間優(yōu)于傳統(tǒng)參數(shù)[5]與非參數(shù)[6]預(yù)測模型,偏差分布波動與預(yù)測魯棒性也明顯優(yōu)于傳統(tǒng)預(yù)測模型[7];針對非平穩(wěn)的客流量數(shù)據(jù),經(jīng)驗?zāi)B(tài)分解[8](EMD)、集成經(jīng)驗?zāi)B(tài)分解[9](EEMD) 被用于降低樣本噪聲干擾并有效提高預(yù)測精度。 變分模態(tài)分解(variational mode decomposition,VMD)作為最新提出的分解算法,雖然在交通領(lǐng)域應(yīng)用較少,但在電力荷載[10]、期貨[11]等領(lǐng)域已證明其對非平穩(wěn)信號良好的處理能力。
目前研究大多集中于短時客流量預(yù)測[12](15 min內(nèi)),然而過短時間的預(yù)測不能為人們出行規(guī)劃預(yù)留充足時間,提供有價值的出行指導(dǎo)。 為此,文章創(chuàng)新性地將VMD 引入客流量預(yù)測領(lǐng)域,降低客流量信號的非平穩(wěn)性,結(jié)合深度學(xué)習(xí)的LSTM 進行預(yù)測,提出VMD-LSTM 預(yù)測模型,實現(xiàn)對每小時軌道交通客流量的準(zhǔn)確預(yù)測,提高LSTM 神經(jīng)網(wǎng)絡(luò)的預(yù)測性能。
VMD 是一種全新的自適應(yīng)、完全非遞歸時頻信號分解算法,通過構(gòu)建變分模型,將原始時間序列s(t)分解為不同的具有有限帶寬的分量uk(t),對應(yīng)的中心頻率為ωk,交替迭代更新尋找約束變分模型的最優(yōu)解,在此過程中實現(xiàn)本征模態(tài)函數(shù)IMF 的有效分離,克服了EMD 存在端點效應(yīng)和模態(tài)分量混疊的問題,其算法可表示為[13]
1) 對每一個uk(t)進行Hilbert 變換得到單側(cè)頻譜
式中:δ(t)表示Dirac 分布函數(shù);*表示卷積運算。
2) 通過將每個模式的分析信號乘以估計的中心頻率e-jωkt,將頻譜移到基帶
3) 通過對解調(diào)信號梯度的L2 正則化進行高斯平滑估計,得到各模態(tài)函數(shù)的帶寬,約束變分模型可表示為
式中:?t表示求偏導(dǎo);k 為分量的個數(shù)。
LSTM 是深度循環(huán)神經(jīng)網(wǎng)絡(luò)的代表,通過門的開關(guān)實現(xiàn)時空記憶功能,能有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和爆炸問題。 通過引入一個門控單元系統(tǒng),可以控制何時忘記歷史信息或使用新信息更新單元狀態(tài), 使LSTM 在解決非線性時間序列問題時效果極佳[14],其過程可表達(dá)為
VMD-LSTM 預(yù)測模型建立主要分為兩部分。 第一部分為數(shù)據(jù)預(yù)處理,首先將對原始數(shù)據(jù)中的重復(fù)、異常、 缺省值進行清洗獲得時序客流量數(shù)據(jù)。 基于VMD 分解原理,設(shè)定合適的超參數(shù),將非平穩(wěn)的每小時客流量數(shù)據(jù)分解為本征模態(tài)函數(shù)IMF 和余量信號R(t),弱化樣本噪聲干擾;第二部分為分量預(yù)測,首先選擇LSTM 神經(jīng)網(wǎng)絡(luò)時間步長、 輸入層隱藏層神經(jīng)元個數(shù)等基本參數(shù),確定神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式與代價函數(shù),獲得網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。 建立與分解分量個數(shù)相同的LSTM 神經(jīng)網(wǎng)絡(luò),對分量分別進行預(yù)測,獲得仿真本征模態(tài)函數(shù)(SimIMF)最后將各預(yù)測值進行重構(gòu)獲得最終客流量預(yù)測值, 并與真實客流量進行比較,評價模型性能。 模型建立流程如圖1 所示。
圖1 VMD-LSTM 神經(jīng)網(wǎng)絡(luò)模型流程圖Fig.1 VMD-LSTM neural network model flow chart
采集明尼蘇達(dá)州明尼阿波利斯至圣保羅301站臺2017 年每小時軌道交通客流量,明尼阿波利斯與圣保羅分別是明尼蘇達(dá)州第一、 二大城市,旅客往來頻繁,客流規(guī)模大;301 站臺為圣保羅通往明尼阿波利斯及其他城市的主要站臺,人員出行規(guī)律復(fù)雜,因此采用該站臺作為研究對象。 對軌道交通數(shù)據(jù)中的異常數(shù)據(jù)進行預(yù)處理。 包括完全相同的記錄、明顯異常的記錄及缺失的記錄,數(shù)據(jù)清洗后共獲得10 605 條時間數(shù)據(jù)。 由于數(shù)據(jù)樣本較大,有效避免了機器學(xué)習(xí)過程中預(yù)測模型對個別樣本的偏好,無需對樣本進行抽樣訓(xùn)練。
采用VMD 算法對非平穩(wěn)交通量時間序列數(shù)據(jù)進行分解時,由于VMD 在軌道交通客流量預(yù)測領(lǐng)域應(yīng)用較少,缺乏先驗知識確定超參數(shù)。 綜合考慮重構(gòu)誤差與中心頻率分布,二次罰因子α 取1 000,分解模態(tài)數(shù)K 取11。分解得到10 個IMF 分量以及一個余量信號R(t),分解結(jié)果如圖2 所示。 分量頻率由高到低進行排列,更加清晰的呈現(xiàn)原始客流量數(shù)據(jù)在不同時間尺度下的變化規(guī)律,其中高頻信號表示客流量變化的細(xì)節(jié),含有大量樣本噪聲;低頻部分則表征客流量的趨勢,頻率最低的余量信號R(t)也稱為趨勢項,表征全年軌道交通客流量的波動趨勢。
選擇前10 個月(8 880 條時間數(shù)據(jù))作為訓(xùn)練集,最后兩個月(1 725 條時間數(shù)據(jù))用于測試模型性能。 時間步長取4,隱含層數(shù)取1,隱含層神經(jīng)元個數(shù)取200;迭代次數(shù)取250。初始學(xué)習(xí)率設(shè)為0.01,同時為防止學(xué)習(xí)率過大,模型來回震蕩,采用衰減法動態(tài)調(diào)整學(xué)習(xí)率,每迭代50 次學(xué)習(xí)率衰減50%。損失函數(shù)采用均方根誤差,通過AdamOptimizer 優(yōu)化器對模型進行優(yōu)化, 得到LSTM 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
根據(jù)以上參數(shù),建立11 個LSTM 神經(jīng)網(wǎng)絡(luò),對分解獲得的分量分別進行訓(xùn)練、預(yù)測,根據(jù)VMD 算法對預(yù)測結(jié)果進行重構(gòu),得到最終每小時客流量預(yù)測值。 并繪制總體預(yù)測殘差,如圖3 所示,可以看出LSTM 神經(jīng)網(wǎng)絡(luò)僅在初期前1%數(shù)據(jù)范圍內(nèi)預(yù)測誤差較大,隨后殘差迅速變小并趨于穩(wěn)定,表現(xiàn)出良好的魯棒性。
同時為驗證VMD-LSTM 神經(jīng)網(wǎng)絡(luò)模型的性能,分別與LSTM 神經(jīng)網(wǎng)絡(luò)、隨機森林(RF)、支持向量機(SVM)進行對比。 對比模型與原模型采用相同的參數(shù)設(shè)置,RF 預(yù)測模型利用經(jīng)驗公式確定子樹數(shù)目為103,SVM 預(yù)測模型采用自適應(yīng)算法搜索最佳超參數(shù)c,g,預(yù)測結(jié)果如圖4 所示。
圖2 客流量數(shù)據(jù)VMD 分解結(jié)果Fig.2 VMD decomposition results of passenger flow sequence
圖3 預(yù)測殘差Fig.3 Predicting residual
圖4 神經(jīng)網(wǎng)絡(luò)模型對比Fig.4 Comparison of neural network models
平均絕對百分誤差(MAPE)體現(xiàn)了真實值與預(yù)測值的相對偏差,可直接衡量預(yù)測結(jié)果的好壞,常被用于評價預(yù)測模型的優(yōu)劣,但不能直觀反映真實值與預(yù)測值的差值。 均方根誤差(RMSE)可直接體現(xiàn)真實值與預(yù)測值的絕對差值,且特大或特小誤差對指標(biāo)影響明顯,可有效彌補MAPE 的不足,相關(guān)系數(shù)(R)可用于表征真實值與預(yù)測值變化趨勢的相似程度。 分別采取以上指標(biāo)對各預(yù)測模型性能進行評價,結(jié)果如表1 所示。
表1 經(jīng)典預(yù)測模型性能對比Tab.1 Performance comparison of classical prediction models
結(jié)合圖4 和表1 可以看出,在軌道交通客流量數(shù)據(jù)樣本足夠大的情況下,所有預(yù)測模型均有極高的預(yù)測精度。傳統(tǒng)的時間序列預(yù)測模型RF,SVM 與基于深度學(xué)習(xí)的LSTM 預(yù)測誤差相差不大。 但LSTM 神經(jīng)網(wǎng)絡(luò)克服傳統(tǒng)預(yù)測模型每次加入新數(shù)據(jù),需要重新訓(xùn)練的缺陷,收斂速度也有較大提高,體現(xiàn)神經(jīng)網(wǎng)絡(luò)良好的綜合性能。
當(dāng)采用VMD 優(yōu)化LSTM 后,預(yù)測誤差顯著降低,VMD-LSTM 模型的預(yù)測精度相對三種對比模型總體有了較大提高。 對比傳統(tǒng)時間序列預(yù)測模型RF,SVM,MAPE 分別減小了8.58%,6.64%,RMSE分別減小了271.05,246.99; 相比LSTM 神經(jīng)網(wǎng)絡(luò),MAPE 減小了8.38%,RMSE 減小了256.99,R 值也有一定的提高。 這是因為VMD 將含噪聲的客流量數(shù)據(jù)分解成模態(tài)分量與余量信號,將含噪聲的高頻信號單獨分離出來,從而弱化樣本噪聲對總體預(yù)測精度的干擾,有效提高神經(jīng)網(wǎng)絡(luò)的預(yù)測精度;同時使非平穩(wěn)客流量數(shù)據(jù)轉(zhuǎn)換為多個平穩(wěn)時間序列,LSTM 神經(jīng)網(wǎng)絡(luò)對這些平穩(wěn)信號進行預(yù)測,進一步提高模型的魯棒性。
1) 采用VMD 將含噪聲的軌道交通客流量數(shù)據(jù)分解成具有原始數(shù)據(jù)局部特征的不同頻率信號,降低噪聲對模型的干擾,提出VMD-LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
2) 采用明尼蘇達(dá)州軌道交通數(shù)據(jù)驗證VMDLSTM 預(yù)測模型性能,結(jié)果表明VMD 改進LSTM 能顯著提高神經(jīng)網(wǎng)絡(luò)的預(yù)測精度與魯棒性,預(yù)測誤差相對傳統(tǒng)預(yù)測模型更小。