陳 丹 尹嘉男 劉 釗 賈 萌 吳金國 鐘玉剛
(南京工程學(xué)院汽車與軌道交通學(xué)院1) 南京 211167) (南京航空航天大學(xué)民航學(xué)院2) 南京 211106)
隨著城市人口規(guī)模的不斷擴(kuò)大,出行人口數(shù)量和交通需求急劇上升,引發(fā)的交通擁堵導(dǎo)致了乘客行程時(shí)間延長、乘客滿意度降低,以及燃油消耗增加、環(huán)境污染程度增大等一系列現(xiàn)實(shí)問題.城市軌道交通具有運(yùn)量大、準(zhǔn)點(diǎn)率高、安全舒適、節(jié)能環(huán)保等特點(diǎn),近年來得到了大力發(fā)展,但城市軌道交通站點(diǎn)客流的快速聚集反過來也加劇了交通擁堵帶來的一系列問題.因此,準(zhǔn)確預(yù)測城市軌道交通短時(shí)客流,對(duì)于城市軌道交通調(diào)度動(dòng)態(tài)優(yōu)化、提前緩解交通擁堵,以及提升城市軌道交通服務(wù)水平具有重要的研究意義和應(yīng)用價(jià)值.
交通客流短時(shí)預(yù)測問題可以將短時(shí)客流預(yù)測模型劃分為三大類,即仿真模型、參數(shù)模型和非參數(shù)模型[1].其中,仿真模型是指借助交通仿真工具來預(yù)測短時(shí)客流,Zhang[2]通過仿真車輛運(yùn)行環(huán)境和天氣環(huán)境來預(yù)測公路交通短時(shí)流量,并實(shí)現(xiàn)了交通運(yùn)行過程的三維顯示.參數(shù)模型是指采用時(shí)間序列分析方法來預(yù)測短時(shí)客流,包括卡爾曼濾波、自回歸移動(dòng)平均及其衍生模型等.Jiao等[3]考慮了歷史客流數(shù)據(jù)的偏差、誤差修正系數(shù)等因素,提出了基于卡爾曼濾波方法的修正模型用于預(yù)測.楊靜等[4]提出了一種基于變點(diǎn)模型、小波變換和自回歸滑動(dòng)平均模型(ARMA)的組合預(yù)測方法,對(duì)北京市某地鐵站的進(jìn)站客流量進(jìn)行了短時(shí)預(yù)測.參數(shù)模型是一種較為成熟的預(yù)測方法,具有輸入數(shù)據(jù)量少、計(jì)算簡單的特點(diǎn),但該模型需要輸入數(shù)據(jù)具有穩(wěn)定性,對(duì)于非平穩(wěn)數(shù)據(jù)則需經(jīng)過預(yù)處理使其平穩(wěn)化后再進(jìn)行預(yù)測,而預(yù)處理過程則可能降低預(yù)測精度[5].非參數(shù)模型沒有嚴(yán)格的數(shù)學(xué)解析形式,主要包括人工神經(jīng)網(wǎng)絡(luò)模型、k近鄰算法模型等.Clark[6]考慮了速度、占用率、流量等因素,采用k近鄰算法模型對(duì)機(jī)動(dòng)車道交通流量進(jìn)行預(yù)測.李科君等[7]針對(duì)城市軌道交通短時(shí)進(jìn)站客流序列的非線性特征,采用非線性自回歸神經(jīng)網(wǎng)絡(luò)模型對(duì)地鐵進(jìn)站客流進(jìn)行預(yù)測,預(yù)測精度優(yōu)于線性模型.
由于非參數(shù)模型不需要輸入數(shù)據(jù)具有平穩(wěn)性假設(shè),適用于處理非線性和波動(dòng)性顯著的城市軌道交通短時(shí)客流時(shí)序數(shù)據(jù),特別是在當(dāng)今大數(shù)據(jù)背景下,深度學(xué)習(xí)作為一種新興的非參數(shù)模型在處理海量復(fù)雜數(shù)據(jù)時(shí)體現(xiàn)出了明顯優(yōu)勢,但由于深度學(xué)習(xí)算法需要學(xué)習(xí)大量輸入數(shù)據(jù)的特征規(guī)律,運(yùn)算速度較慢,鑒于短時(shí)預(yù)測對(duì)運(yùn)算時(shí)間的特別要求,需要考慮預(yù)測模型的運(yùn)算效率.因此,將深度學(xué)習(xí)算法用于短時(shí)預(yù)測,需要同時(shí)關(guān)注預(yù)測準(zhǔn)確性、穩(wěn)定性以及算法效率等問題.文中分析城市軌道交通短時(shí)客流的時(shí)序數(shù)據(jù)特征,構(gòu)建基于LM算法的反向傳播神經(jīng)網(wǎng)絡(luò)(LM-BP)模型和基于長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型,并通過實(shí)際客流數(shù)據(jù)對(duì)所提方法進(jìn)行驗(yàn)證.
選取蘇州地鐵某站點(diǎn)作為研究對(duì)象,根據(jù)地鐵自動(dòng)售檢票(automatic fare collection, AFC)數(shù)據(jù)統(tǒng)計(jì)得到每5 min的短時(shí)客流量,其中,2015年7月1—7日的短時(shí)客流分布見圖1.
圖1 1周客流量的時(shí)間分布
由圖1可知:工作日(7月1—3、6—7日)08:00—10:00及18:00—20:00左右出現(xiàn)了兩個(gè)明顯的進(jìn)站客流高峰期,屬于雙峰型客流;而休息日(7月4—5日)客流量整體表現(xiàn)為單峰特征.1周客流時(shí)序數(shù)據(jù)呈現(xiàn)出工作日和休息日兩種交通分布模式,并且表現(xiàn)出明顯的非線性、非平穩(wěn)性和突變性等特征.接下來分析同種交通分布模式下的客流分布特征,見圖2.
圖2 同種交通模式下的客流分布
由圖2a)可知:雖然2 d客流量整體呈現(xiàn)雙峰型特征,且同屬一種交通模式,但在客流量均值、局部波動(dòng)性等方面仍存在較大差異.為進(jìn)一步量化分析同種交通模式下的客流分布特征,對(duì)全年48組周一客流量的分布特征進(jìn)行了統(tǒng)計(jì)分析.由圖2b)可知:18:00—20:00晚高峰時(shí)段的統(tǒng)計(jì)結(jié)果,其中,第14時(shí)段的客流量在[40,129]之間波動(dòng),均值為62.6,標(biāo)準(zhǔn)偏差為17.7,整個(gè)晚高峰時(shí)段客流量的標(biāo)準(zhǔn)偏差位于區(qū)間(6,18),可以看出,同種交通模式下的客流分布仍具有顯著的非周期性波動(dòng)特征.
BP傳播網(wǎng)絡(luò)是一種應(yīng)用較為廣泛的人工神經(jīng)網(wǎng)絡(luò)模型,通過信息正向傳播與誤差反向傳播來不斷調(diào)整各個(gè)神經(jīng)元權(quán)重,反復(fù)訓(xùn)練直至網(wǎng)絡(luò)輸出誤差降低到可接受范圍內(nèi).BP網(wǎng)絡(luò)模型可以模擬任意非線性輸入-輸出關(guān)系,可借助該模型進(jìn)行城市軌道交通短時(shí)客流預(yù)測,但該模型也存在學(xué)習(xí)效率低、收斂速度慢以及可能出現(xiàn)局部極值點(diǎn)等缺點(diǎn),因此,引入LM算法對(duì)其進(jìn)行優(yōu)化.
令wk、wk+1表示第k次和第k+1次訓(xùn)練的網(wǎng)絡(luò)權(quán)值向量,則權(quán)值調(diào)整量Δwk為
Δw=wk+1-wk
(1)
根據(jù)高斯-牛頓法可知:
Δwk=-[JT(wk)J(wk)]-1J(wk)e(wk)
(2)
式中:e(wk)為權(quán)值誤差向量;J(wk)為誤差對(duì)權(quán)值微分的雅可比矩陣.LM算法在此基礎(chǔ)上引入了調(diào)節(jié)性參數(shù)u,則權(quán)值調(diào)整規(guī)則為
Δwk=-[JT(wk)J(wk)+uI]-1J(wk)e(wk)
(3)
在訓(xùn)練過程中,如果更新權(quán)值后能使輸出誤差減小,則需降低u,反之,則增加u.當(dāng)u較大時(shí),JT(wk)J(wk)項(xiàng)可忽略不計(jì),此時(shí)權(quán)值調(diào)整規(guī)則近似于梯度下降法;當(dāng)u減小趨近于0時(shí),權(quán)值調(diào)整規(guī)則近似于高斯牛頓法.通過參數(shù)u可以實(shí)現(xiàn)權(quán)值向量的自適應(yīng)調(diào)節(jié),使其既有高斯-牛頓法的局部收斂性,又有梯度下降法的全局性,因此,收斂速度和學(xué)習(xí)效率得到了很好的提升.
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)考慮了時(shí)間序列特征,隱含層各神經(jīng)元之間通過鏈?zhǔn)浇Y(jié)構(gòu)相互連接,適用于處理在時(shí)序上存在關(guān)系的數(shù)據(jù).普通的RNN網(wǎng)絡(luò)在處理大量時(shí)序數(shù)據(jù)時(shí)存在記憶快速衰退的長期依賴問題,進(jìn)而引發(fā)梯度消失影響訓(xùn)練效果.為解決長期依賴問題,LSTM模型在RNN結(jié)構(gòu)的基礎(chǔ)上,引入了LSTM細(xì)胞單元,通過遺忘門、輸入門和輸出門等結(jié)構(gòu)來選擇性的遺忘、保留和更新記憶,使其傳遞的記憶信息可控,從而使得LSTM具備長期記憶功能.LSTM的結(jié)構(gòu)示意圖見圖3.
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
xt-t時(shí)刻的輸入,即實(shí)際測量的城市軌道交通客流量;yt-t時(shí)刻的輸出,即LSTM神經(jīng)網(wǎng)絡(luò)模型估計(jì)的客流量;ht-LSTM細(xì)胞單元t時(shí)刻的輸出;Ct-LSTM細(xì)胞單元狀態(tài),用于控制并傳遞記憶信息,捕獲輸入數(shù)據(jù)的時(shí)序特征
圖4為LSTM細(xì)胞單元結(jié)構(gòu).
圖4 LSTM細(xì)胞單元結(jié)構(gòu)圖
由圖4可知:LSTM細(xì)胞單元通過遺忘門、輸入門和輸出門等門限結(jié)構(gòu)實(shí)現(xiàn)記憶的更新與傳遞.根據(jù)當(dāng)前時(shí)刻輸入和上一時(shí)刻LSTM細(xì)胞單元輸入,通過遺忘門忘記沒用的信息,確定上一時(shí)刻的單元狀態(tài)有多少需要被保留到當(dāng)前時(shí)刻:
ft=σ(Wf·[ht-1,xt]+bf)
(4)
式中:Wf為遺忘門對(duì)應(yīng)的權(quán)值向量;bf為偏置量;σ為sigmoid函數(shù),輸出0至1之間的數(shù)字,0為完全遺忘,1為全部保留.然后,通過輸入門和候選門來更新細(xì)胞狀態(tài):
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
(7)
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot×tanh(Ct)
(9)
式中:Wo、bo為輸出門權(quán)值向量和偏置量,細(xì)胞單元的輸出量ht由當(dāng)前時(shí)刻的細(xì)胞狀態(tài)和輸入共同決定.LSTM模型通過各門限結(jié)構(gòu)之間的交互協(xié)作,解決了RNN網(wǎng)絡(luò)的長期依賴問題,細(xì)胞間的鏈?zhǔn)浇Y(jié)構(gòu)使得該模型具有較長時(shí)間的記憶能力,之前的信息在長時(shí)間后的訓(xùn)練中也能得到保留,并結(jié)合模型輸入對(duì)當(dāng)前細(xì)胞狀態(tài)進(jìn)行調(diào)整.
根據(jù)蘇州地鐵中央花園站2015年7月1日06:00—8日00:00的5 min時(shí)段客流量時(shí)序數(shù)據(jù),基于LM-BP神經(jīng)網(wǎng)絡(luò)的客流預(yù)測模型進(jìn)行數(shù)據(jù)訓(xùn)練,并預(yù)測7月8日每5 min時(shí)段客流量變化趨勢,預(yù)測結(jié)果見圖5.
圖5 基于LM-BP神經(jīng)網(wǎng)絡(luò)的客流預(yù)測結(jié)果
由圖5可知:基于LM-BP神經(jīng)網(wǎng)絡(luò)模型的客流預(yù)測結(jié)果與實(shí)際觀測數(shù)據(jù)接近,能較好的反應(yīng)短時(shí)客流量的變化趨勢.為直觀反映預(yù)測結(jié)果的準(zhǔn)確性,圖6為誤差分布及誤差頻數(shù)統(tǒng)計(jì).
圖6 基于LM-BP的預(yù)測結(jié)果誤差和誤差頻數(shù)統(tǒng)計(jì)
由圖6可知:基于LM-BP神經(jīng)網(wǎng)絡(luò)客流預(yù)測模型的預(yù)測結(jié)果在0附近波動(dòng),并且80%時(shí)段的預(yù)測誤差在區(qū)間(-10,10)以內(nèi).接下來,利用2.2建立的基于LSTM神經(jīng)網(wǎng)絡(luò)的客流預(yù)測模型進(jìn)行數(shù)據(jù)訓(xùn)練,預(yù)測結(jié)果見圖7.
圖7 基于LSTM神經(jīng)網(wǎng)絡(luò)的客流預(yù)測結(jié)果
由圖7可知:LSTM神經(jīng)網(wǎng)絡(luò)模型能較好的預(yù)測城市軌道交通短時(shí)客流量變化趨勢,預(yù)測結(jié)果貼近觀測值,為更直觀反映預(yù)測準(zhǔn)確性,圖8為誤差分布及誤差頻數(shù)統(tǒng)計(jì).
圖8 基于LSTM的預(yù)測結(jié)果誤差和誤差頻數(shù)統(tǒng)計(jì)
由圖8可知:基于LSTM神經(jīng)網(wǎng)絡(luò)客流預(yù)測模型的預(yù)測結(jié)果在0附近波動(dòng),并且85%時(shí)段的預(yù)測誤差在區(qū)間(-10,10)以內(nèi).
對(duì)比分析參數(shù)模型與本文所構(gòu)建的基于深度學(xué)習(xí)的非參數(shù)模型預(yù)測結(jié)果,給出了常用的三次指數(shù)平滑模型的預(yù)測結(jié)果,見表1.
表1 城市軌道交通短時(shí)客流預(yù)測性能對(duì)比分析
由表1可知:本文所構(gòu)建的基于深度學(xué)習(xí)的LM-BP和LSTM模型預(yù)測結(jié)果的MAE相較于參數(shù)模型中常用的三次指數(shù)平滑模型而言,分別下降了49%和47%;MAPE則分別下降了54%和59%;STD則分別下降了49%和46%.這說明本文所提預(yù)測方法相較于參數(shù)模型而言,預(yù)測準(zhǔn)確性和穩(wěn)定性方面均得到了較大程度的提升.而深度學(xué)習(xí)模型需要訓(xùn)練網(wǎng)絡(luò),因此,計(jì)算時(shí)間相較于非參數(shù)模型而言顯然會(huì)有所增加.
對(duì)比本文所構(gòu)建的兩種模型預(yù)測結(jié)果可以看出,LSTM模型的預(yù)測準(zhǔn)確性要優(yōu)于LM-BP模型,預(yù)測結(jié)果的MAPE下降了13%,這是因?yàn)長STM模型具有長期記憶功能,能有效捕獲短時(shí)客流數(shù)據(jù)的時(shí)序特征;在預(yù)測穩(wěn)定性方面,兩種模型相差不大;而LM-BP模型的計(jì)算時(shí)間要明顯優(yōu)于LSTM模型,這是由于LM-BP模型采用了梯度優(yōu)化算法,迭代次數(shù)在60次左右就趨于收斂,大大提升了收斂速度和計(jì)算效率.
城市軌道交通系統(tǒng)易受天氣、運(yùn)行設(shè)備、管制保障、人為因素等多方因素影響,其短時(shí)客流具有顯著的非線性、非平穩(wěn)性和非周期性波動(dòng)等特征.本文采用深度學(xué)習(xí)算法,分別構(gòu)建了基于LM-BP和LSTM神經(jīng)網(wǎng)絡(luò)的短時(shí)客流預(yù)測模型,該模型不需要時(shí)序數(shù)據(jù)具有平穩(wěn)性,特別適用于處理非線性、非周期性波動(dòng)的短時(shí)客流時(shí)序數(shù)據(jù).實(shí)例分析表明,本文所建模型相較于現(xiàn)有的參數(shù)模型而言,預(yù)測結(jié)果的準(zhǔn)確性和穩(wěn)定性均得到了大幅提升.LSTM模型相較于LM-BP模型而言預(yù)測準(zhǔn)確性更高,但需要更多的計(jì)算時(shí)間.在后續(xù)研究中,將進(jìn)一步探討如何提升預(yù)測精度和計(jì)算效率.