李世杰, 王景升, 牛帥
(中國人民公安大學(xué)交通管理學(xué)院, 北京 100038)
城市交通問題是城市發(fā)展過程中不可回避的問題,隨著汽車保有量逐漸增加,城市道路交通流量進而逐漸增長。行程時間作為反映道路運行狀況的重要指標,可以衡量道路的通行效率[1]。行程時間在城市交通出行誘導(dǎo)起著關(guān)鍵作用,通過預(yù)測未來道路行程時間,可以為交通參與者提供路徑選擇。如何對行程時間進行預(yù)測是研究緩解城市交通壓力的主要熱點和難點,因此精準預(yù)測行程時間對于道路交通誘導(dǎo)至關(guān)重要[2]。
近年來,隨著智能交通系統(tǒng)和人工智能技術(shù)的迅速發(fā)展,交通預(yù)測成為城市交通領(lǐng)域的熱點之一。中外學(xué)者提出的預(yù)測方法可以從以下角度進行分類。分別為基于統(tǒng)計模型、基于機器學(xué)習(xí)模型和基于深度學(xué)習(xí)模型等預(yù)測方法?;诮y(tǒng)計的預(yù)測方法主要有線性回歸、ARIMA(auto-regressive integrated moving-average model)模型[3-4]、 Kalman(Kalman filter) 濾波[5]等方法,由于實際交通具有非線性和混沌特性,此類模型通常依賴于數(shù)據(jù)平穩(wěn)的假設(shè),且不適應(yīng)大規(guī)模數(shù)據(jù)處理。機器學(xué)習(xí)模型的預(yù)測方法主要有支持向量機[6]、貝葉斯網(wǎng)絡(luò)[7]、XGBoost(extreme gradient boosting)[8]、K近鄰算法[9]等。Long等[10]使用人工魚群算法對SVM(support vector machine)模型進行優(yōu)化,將優(yōu)化后的SVM模型用于高速公路行程時間預(yù)測,能夠獲得較高的準確率。Meng等[11]將KNN(k-nearest neighbors)與SVM模型結(jié)合對高速公路行程時間進行預(yù)測,能夠在加速訓(xùn)練的同時保證預(yù)測的準確性。基于深度學(xué)習(xí)模型的預(yù)測方法如長短期記憶(long shot-term memory, LSTM)[12]、門控循環(huán)單元(gated recurrent unit, GRU)[13]等。Li等[14]使用基于LSTM的卷積神經(jīng)網(wǎng)絡(luò)對時空特征進行學(xué)習(xí)以準確預(yù)測道路行程時間;張明等[15]將改進注意力機制與GRU模型結(jié)合預(yù)測城市道路行程時間,預(yù)測精度相較于僅使用GRU模型有較大提高;雖然深度神經(jīng)網(wǎng)絡(luò)模型與機器學(xué)習(xí)模型相比,在處理大規(guī)模數(shù)據(jù)時具有顯著優(yōu)勢,但由于行程時間序列具有較強的非線性和非平穩(wěn)性,單一神經(jīng)網(wǎng)絡(luò)在預(yù)測精度越來越難以滿足出行者與交通管理著日益增長的精度需求。與單個模型相比,組合模型[16]能夠提供更加準確的預(yù)測結(jié)果。
因此,現(xiàn)借鑒金融學(xué)和地理學(xué)等領(lǐng)域中廣泛應(yīng)用的自適應(yīng)信號分解方法(variational mode decomposition,VMD)[17],將原始行程時間序列進行分解,以降低原始時間序列的非穩(wěn)態(tài)性。考慮到GRU模型在時間序列預(yù)測中具有較高的精度,提出一種新的組合預(yù)測模型,簡稱VMD-GRU,以實現(xiàn)對非平穩(wěn)性較強的行程時間進行預(yù)測。
變分模態(tài)分解(VMD)是一種能夠有效處理波動信號的自適應(yīng)信號分解算法,可以有效降低復(fù)雜度高和非線性較強的時間序列非平穩(wěn)性[18]。VMD將原始時間序列進行分解為若干個相對平穩(wěn)且不同頻率的時間子序列,以減少模態(tài)混疊現(xiàn)象的發(fā)生。VMD算法流程如下。
步驟1構(gòu)造變分模型。將原始序列分解為K個分量,構(gòu)造其約束變分函數(shù)為
(1)
式(1)中:K為模態(tài)數(shù)目,即分解信號的個數(shù);uk(t)為第t個模態(tài)分量;ωk為中心頻率;k為第k個分解信號;?t為隨著時間變化的偏導(dǎo)數(shù);δ(t)為狄克拉分布函數(shù);f(t)為原始序列信號;*為卷積;j為虛數(shù)單位;t為時間參數(shù)。
步驟2利用其約束變分模型引入拉格朗日乘子和二次懲罰因子來降低干擾,同時將上述問題轉(zhuǎn)化為非約束變分問題。
(2)
式(2)中:L為增廣Lagrange函數(shù)表達式;α為二次懲罰因子;λ為拉格朗日因子。
步驟3使用交替方向乘子法進行求解,中心頻率ωk與模態(tài)uk的求解公式為
(3)
門控循環(huán)網(wǎng)絡(luò)(GRU)是應(yīng)用最為廣泛的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)變種之一,同時作為LSTM的改進版,使用“門”結(jié)構(gòu)選擇性地丟棄或保留一些信息,在某些情況下能產(chǎn)生較為優(yōu)異的效果。GRU包含更新門和重置門兩個門結(jié)構(gòu),它將LSTM模型中的3個門合并成更新門和重置門,其更新門相當于LSTM的輸入門和遺忘門,結(jié)構(gòu)變得更加簡單,從而相對于LSTM提高了模型整體的訓(xùn)練速度。
GRU模型結(jié)構(gòu)如圖1所示。更新門幫助模型決定要將多少前一時刻的信息傳遞到當前時刻中,更新門的值越小,代表更少的前一時刻信息被傳遞到當前時刻;重置門用于控制遺忘前一時刻信息的程度,重置門的值越小,代表忽視前一時刻的信息越多。
圖1 GRU內(nèi)部結(jié)構(gòu)Fig.1 Internal structure of GRU
zt=σ(Wz[ht-1,xt]+bz)
(4)
rt=σ(Wr[ht-1,xt]+br)
(5)
(6)
(7)
式中:zt和rt分別為GRU的更新門和重置門;xt為t
行程時間序列具有非平穩(wěn)性與波動性等特點,使用單一的預(yù)測模型難以得到較精準的預(yù)測結(jié)果??紤]到VMD分解算法在處理非線性數(shù)據(jù)方面的優(yōu)勢以及GRU模型能夠較好地捕獲時間序列的特征。文本使用VMD-GRU組合模型對行程時間進行預(yù)測。VMD-GRU組合預(yù)測模型首先將原始行程時間序列分解為若干相對平穩(wěn)且不同頻率的時間子序列,實現(xiàn)行程時間序列的降噪,有效緩解原始序列的非平穩(wěn)性與波動性,其次針對其子序列建立預(yù)測模型,通過使用GRU模型獨立預(yù)測若干時間子序列使預(yù)測風險分散,最后將各個時間子序列的預(yù)測結(jié)果進行融合。為了更好地捕獲城市道路行程時間序列的非線性和非平穩(wěn)特征,通過使用VMD算法將原始行程時間序列分解為若干相對平穩(wěn)的IMF(intrinsic mode function)分量,然后為每個IMF分量構(gòu)建GRU預(yù)測模型,最后將每個IMF分量預(yù)測的結(jié)果進行匯總?cè)诤?以產(chǎn)生最終行程時間預(yù)測結(jié)果。設(shè)計城市道路行程時間VMD-GRU組合預(yù)測模型如圖2所示。VMD-GRU組合算法的具體步驟如表1所示。
表1 VMD-GRU模型的預(yù)測步驟Table 1 The prediction steps of the VMD-GRU model
圖2 VMD-GRU模型流程圖Fig.2 VMD-GRU model flowchart
本文數(shù)據(jù)來源于河北省唐山市北新西道部分路段電子警察卡口數(shù)據(jù)。該數(shù)據(jù)包含交叉口編號、交叉口名稱、車牌號、采集時間、方向編號等字段屬性。通過提取上下游交叉口電子警察過車記錄,計算15 min時間間隔內(nèi)車輛經(jīng)過上下游交叉口的行程時間,然后對行程時間進行清洗,剔除異常值,最后對15 min時間間隔內(nèi)的行程時間取均值,作為下文行程時間的訓(xùn)練與預(yù)測數(shù)據(jù)集。經(jīng)數(shù)據(jù)處理后,得到行程時間樣本數(shù)據(jù),為連續(xù)12 d的15 min粒度構(gòu)成的時間序列,共計1 152段行程時間數(shù)據(jù),如圖3所示。
圖3 行程時間序列圖Fig.3 Travel time series plot
將行程時間序列采用VMD算法分解為5個IMF時間子序列分量,降低原始時間序列的復(fù)雜程度,分解后的時間子序列圖像如圖4所示。
圖4 行程時間序列分解結(jié)果Fig.4 Travel time series decomposition results
為有效驗證模型的預(yù)測效果,將數(shù)據(jù)集前80%作為訓(xùn)練集,后20%作為測試集。為消除數(shù)據(jù)量綱所帶來的影響,將VMD分解后的時間子序列數(shù)據(jù)分別進行歸一化處理,并分別使用GRU、LSTM模型對其進行預(yù)測。在GRU神經(jīng)網(wǎng)絡(luò)中,GRU層包含80個神經(jīng)元,Dropout層可隨機斷開網(wǎng)絡(luò)層之間的連接,有效防止過擬合,經(jīng)過多次實驗,設(shè)置為0.3時效果較好,滑動時間窗口長度設(shè)置為60,損失函數(shù)選用均方誤差,使用Adam優(yōu)化器對模型參數(shù)進行優(yōu)化,迭代次數(shù)設(shè)置為50,Batch_Size設(shè)置為32。為進行組合模型對比驗證,在LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型中,僅將GRU層改變?yōu)長STM層,其余設(shè)置不變。為檢驗?zāi)P皖A(yù)測效果,采用均方誤差(mean squared error,MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)作為評價指標。
(8)
(9)
(10)
式中:xit為時間序列的真實值;xip為時間序列的預(yù)測值;n為數(shù)據(jù)個數(shù)。
VMD-GRU模型與VMD-LSTM模型的各分量IMF的預(yù)測對比結(jié)果如表2所示。從表2可以看出, GRU模型中各個分量的MSE、RMSE、MAE值均小于LSTM模型中的值,其中MSE降低0.05~0.50,RMSE降低0.10~0.26,MAE降低0.07~0.21。說明GRU模型在預(yù)測時間子序列的預(yù)測精度高于LSTM模型,這是因為GRU模型具有獨特的門結(jié)構(gòu)特征,能夠有效地學(xué)習(xí)各分量的數(shù)據(jù)特征,提高模型訓(xùn)練速度與預(yù)測精度。
表2 各分量IMF預(yù)測評價結(jié)果Table 2 Each component of the IMF predicted evaluation results
為了驗證VMD-GRU組合預(yù)測模型的精確性,將單一的RNN、LSTM、GRU、BiLSTM神經(jīng)網(wǎng)絡(luò)模型以及VMD-LSTM模型作為對照組,對行程時間序列進行預(yù)測,各個預(yù)測模型輸出的測試集擬合結(jié)果如圖5所示,各個模型相應(yīng)的RMSE、MSE、MAE值如表3所示。
表3 各模型評價結(jié)果Table 3 Evaluation results of each model
true表示實際的行程時間數(shù)值圖5 各模型預(yù)測結(jié)果Fig.5 Predicted results of each model
由圖5可知,VMD-GRU組合預(yù)測模型的擬合曲線與真實值的吻合程度較高。由表2可知,組合模型相較于單一模型預(yù)測精度提升較大,說明組合模型能更好地捕獲行程時間的變化,比單一模型適用于波動性較強的城市道路行程時間預(yù)測。主要原因是使用VMD分解算法后,可以有效降低原始行程時間序列較強的非線性特征,使得模型在訓(xùn)練時能夠更容易捕獲其特征,從而提高預(yù)測精度。VMD-GRU組合預(yù)測模型的RMSE、MSE、MAE、MAPE值相較于其他模型均較低,其中MSE降低4.81~79.98,RMSE降低0.34~4.37,MAE降低0.22~3.35。表明VMD-GRU模型在行程時間序列預(yù)測中相較于其他對照模型具有優(yōu)越性。
城市道路行程時間序列具有非線性、非平穩(wěn)性,因此單一預(yù)測模型較難達到滿意的預(yù)測結(jié)果。提出了融合VMD與GRU的行程時間組合預(yù)測模型,將原始時間序列分解,并分別與門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)結(jié)合,最后將各自預(yù)測的結(jié)果進行融合,產(chǎn)成最終的行程時間序列預(yù)測結(jié)果。通過實例得出以下結(jié)論。
(1)通過使用VMD算法將原始行程時間序列分解為5個IMF分量,能夠有效降低了原始時間序列的波動性。
(2)使用VMD-LSTM模型作為對照組,來證明VMD-GRU模型在處理行程時間子序列具有較高的預(yù)測精度。
(3)將RNN、LSTM、GRU單一模型和VMD-LSTM模型的行程時間預(yù)測結(jié)果與本文所提出的VMD-GRU模型進行對比驗證,證明VMD-GRU模型在行程時間預(yù)測中的優(yōu)越性。
但城市道路行程時間仍受交通環(huán)境、天氣、道路狀況等因素的影響,下一步考慮將獲取相關(guān)因素的數(shù)據(jù),在預(yù)測時綜合考慮相關(guān)因素的影響。