蔡昌俊
(廣州地鐵集團(tuán)有限公司,510335,廣州/正高級(jí)工程師)
在城市軌道交通網(wǎng)絡(luò)化運(yùn)營(yíng)時(shí)期,客流過(guò)飽和情況時(shí)有發(fā)生,這對(duì)車站運(yùn)營(yíng)組織工作提出了很高的要求。準(zhǔn)確預(yù)測(cè)車站短時(shí)客流量,并據(jù)此制定科學(xué)的客運(yùn)計(jì)劃和組織方案,將有助于實(shí)現(xiàn)車站客流的動(dòng)態(tài)管理,提高車站的運(yùn)營(yíng)效率。
目前,針對(duì)短期交通量預(yù)測(cè)的模型主要包括:數(shù)理統(tǒng)計(jì)模型,如時(shí)間序列模型[1]、卡爾曼濾波模型[2]等;人工智能模型,如支持向量機(jī)(SVM)[3]、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)、徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)等;混合模型,如小波變換(WT)與自回歸滑動(dòng)平均模型(ARMA)的組合模型[8]、完全總體經(jīng)驗(yàn)?zāi)B(tài)分解與LSTM的組合模型[9]、灰狼優(yōu)化算法(GWO)與小波神經(jīng)網(wǎng)絡(luò)(WNN)的組合模型[10]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)與LSTM的組合模型、WT與SVM的組合模型[14]等。以上研究成果對(duì)城市軌道交通客流預(yù)測(cè)具有重要的意義。但短時(shí)客流存在隨機(jī)性、突變性、動(dòng)態(tài)性等難以被精確預(yù)測(cè)的特點(diǎn),對(duì)于短時(shí)客流預(yù)測(cè),現(xiàn)有模型存在預(yù)測(cè)精度不夠高或泛化能力不強(qiáng)等問(wèn)題。數(shù)理統(tǒng)計(jì)模型對(duì)數(shù)據(jù)的隨機(jī)變化不夠敏感,針對(duì)隨機(jī)性較強(qiáng)的短時(shí)客流,其預(yù)測(cè)性能比較有限[11];人工智能模型能夠描述城市軌道交通短時(shí)客流量數(shù)據(jù)的非線性特征,但對(duì)于海量的小粒度短時(shí)客流數(shù)據(jù),其預(yù)測(cè)精度還有待進(jìn)一步提高?;旌夏P途C合了各種單一預(yù)測(cè)模型的優(yōu)勢(shì),在一定程度上能夠提高預(yù)測(cè)精度。但是,組合模型的組合方式及組合內(nèi)容對(duì)預(yù)測(cè)精度的影響較大,因此需根據(jù)數(shù)據(jù)特點(diǎn)選擇合適的組合模型。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種強(qiáng)大的深度學(xué)習(xí)方法,可以將數(shù)據(jù)傳遞到先前的或同一層的神經(jīng)元。LSTM是一種特殊的RNN,在各種各樣現(xiàn)實(shí)問(wèn)題上的表現(xiàn)都非常好[16]。Adam算法結(jié)合了Momentum和RMSProp兩種算法的優(yōu)點(diǎn),可通過(guò)計(jì)算梯度的一階矩估計(jì)和二階矩估計(jì),為不同參數(shù)設(shè)置自適應(yīng)學(xué)習(xí)率,其學(xué)習(xí)率的取值接近Momentum算法,其收斂速率顯著高于固定學(xué)習(xí)率的算法[17]。小波變換是一種數(shù)據(jù)預(yù)處理方法,在時(shí)域和頻域都有著良好的局部分辨能力,在處理非線性和非穩(wěn)定性數(shù)據(jù)方面具有很大的應(yīng)用價(jià)值[18],可以彌補(bǔ)傳統(tǒng)LSTM模型沒(méi)有考慮數(shù)據(jù)波動(dòng)性的缺陷。因此,本文提出了一種基于小波變換和LSTM(即WT-LSTM)的組合模型,并利用Adam算法作為L(zhǎng)STM的訓(xùn)練算法,使用非飽和激活函數(shù)ReLU函數(shù)替代飽和函數(shù)激活函數(shù)Tanh函數(shù)。
城市軌道交通進(jìn)出站客流量是隨時(shí)間變化的信息,原始數(shù)據(jù)幾乎都會(huì)受復(fù)雜因素的影響而攜帶一定的噪聲,因此,需要采取一些方法提取、消除噪聲。小波變換是目前應(yīng)用最廣泛的去噪方法,可克服傅里葉變換無(wú)法有效分辨時(shí)域信息的缺陷。小波變換分為連續(xù)型變換和離散型變換。本文采用離散型變換,其表達(dá)式為:
(1)
式中:
Ψj,k——離散型小波變換;
t——時(shí)刻;
a0——尺度參數(shù);
b0——平移參數(shù);
y(t)為基本信號(hào)函數(shù);
Ψ(t)——母小波;
Ψ*——復(fù)共軛函數(shù);
m——縮放常數(shù);
n——平移常數(shù)。
常用的小波基函數(shù)包括Symlets、Daubechies、Haar等。
LSTM可使用新的單元格解決通用RNN的長(zhǎng)期依賴問(wèn)題,從而確定信息的實(shí)用性。如圖1所示,一個(gè)邏輯單元包含忘記門(Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate)。
圖1 LSTM結(jié)構(gòu)圖[19]
非飽和激活函數(shù)ReLU函數(shù)相對(duì)飽和激活函數(shù)(如Sigmoid和Tanh函數(shù)),能解決“梯度消失”的問(wèn)題,收斂速度更快。因此,本文利用ReLU函數(shù)來(lái)替代Tanh函數(shù)。 LSTM的工作過(guò)程如下:
步驟1:忘記門ft控制和選擇邏輯單元所需要的信息,其由輸入值xt和t-1時(shí)刻的隱藏層輸出ht-1決定。表達(dá)式如下:
ft=σ(Wf[ht-1,xt]+bf)
(2)
式中:
σ——Sigmoid激活函數(shù);
Wf——權(quán)重矩陣;
bf——偏置項(xiàng)。
it=σ(Wi[ht-1,xt]+bi)
(3)
(4)
(5)
式中:
Wi——權(quán)重矩陣;
bi,bc——偏置項(xiàng);
Wc——權(quán)重矩陣。
步驟3:隱藏層單元輸出值ht由輸出門ot和單元狀態(tài)值ct計(jì)算獲得,表達(dá)式為:
ot=σ(Wo[ht-1,xt]+bo)
(6)
ht=ot*ReLU(ct)
(7)
式中:
Wo——權(quán)重矩陣;
bo——偏置項(xiàng)。
步驟4:根據(jù)ht,進(jìn)而可構(gòu)造計(jì)算模型的均方誤差。通過(guò)Adam算法最小化目標(biāo)函數(shù)、Adam算法優(yōu)化LSTM模型的過(guò)程見(jiàn)文獻(xiàn)[20]。
WT-LSTM組合模型預(yù)測(cè)流程如圖2所示。
圖2 WT-LSTM組合模型預(yù)測(cè)流程圖
WT-LSTM組合模型實(shí)現(xiàn)步驟如下:
步驟1:從車站的AFC(自動(dòng)售檢票)設(shè)備終端獲取歷史客流數(shù)據(jù),預(yù)處理后作為WT-LSTM模型的輸入?yún)?shù)。本文數(shù)據(jù)預(yù)處理主要包括歸一化處理,使原始值歸一化為區(qū)間[0,1]中的值[21]:
(8)
xmid=(xmin+xmax)/2
(9)
式中:
xi——原始數(shù)據(jù);
xmin,xmax——分別為原始數(shù)據(jù)的最小值和最大值。
步驟2:確定小波函數(shù)Ψ(t)和分解層數(shù)N。對(duì)原始信號(hào)采用Mallat算法作N層分解,得高頻子序列D1,D2,…,DN和低頻子序列AN;再利用Mallat算法重構(gòu)公式,得重構(gòu)高頻子序列d1,d2,…,dN和低頻子序列aN。重構(gòu)后的序列與原始序列長(zhǎng)度相同。小波分解和重構(gòu)公式如式(10)和式(11)所示。
Di=GAi-1;Ai=HAi-1,i=1,…,N
(10)
式中:
H,G——分別為低通濾波器和高通濾波器;
i——分解層數(shù);
A0——原始客流數(shù)據(jù)(當(dāng)i=1時(shí))。
ai-1=H*Ai+G*Di,i=N,N-1,…,1
(11)
式中:
H*,G*——分別為低通濾波器和高通濾波器的對(duì)偶算子。
步驟3:將高頻子序列d1,d2,…,dN和低頻子序列aN,分別代入到LSTM模型中進(jìn)行分析及預(yù)測(cè)。通過(guò)變量控制方法確定LSTM模型的隱藏單元數(shù)量和迭代次數(shù),并將Adam算法用于LSTM的短時(shí)客流預(yù)測(cè)中。
步驟4:匯總各子序列的預(yù)測(cè)結(jié)果,得最終預(yù)測(cè)結(jié)果。
步驟5:以廣州塔站進(jìn)出客流為例,評(píng)估基于Adam優(yōu)化的WT-LSTM模型的優(yōu)越性。選取平均絕對(duì)誤差(EMAE)、均方根誤差(ERMSE)、平均絕對(duì)百分比誤差(EMAPE)以及決定系數(shù)(R2)4個(gè)常用指標(biāo)作為本文模型的評(píng)估指標(biāo)。
(12)
(13)
(14)
(15)
式中:
yi——實(shí)際值;
ypi——預(yù)測(cè)值;
yom——實(shí)際值的平均值。
廣州塔站為廣州地鐵3號(hào)線和廣州地鐵APM(旅客自動(dòng)運(yùn)輸系統(tǒng))線的換乘站。本文選取廣州塔站3號(hào)線2021年2月26日至2021年5月8日的進(jìn)出站客流作為WT-LSTM組合模型的數(shù)據(jù)來(lái)源(剔除了清明節(jié)、五一的節(jié)假日數(shù)據(jù)與4月19日的異常數(shù)據(jù))。為保證數(shù)據(jù)的完整性,指定每日記錄時(shí)段為06:00—23:00。本文選取5min的時(shí)間間隔作為短時(shí)客流的統(tǒng)計(jì)時(shí)長(zhǎng),15 min的時(shí)間間隔作為短時(shí)客流的預(yù)測(cè)時(shí)長(zhǎng)。此外,本文客流預(yù)測(cè)的分析長(zhǎng)度為30 d,即采用時(shí)刻t的前30 d歷史客流數(shù)據(jù)來(lái)實(shí)現(xiàn)時(shí)刻t的客流預(yù)測(cè)。以低頻子序列aN為例,自第一個(gè)樣本數(shù)據(jù)塊[(a1.i,a2.i,…,a30.i),a31.i]起,依次下滑數(shù)據(jù)最后得[(aT-30.i,aT-29.i,…,aT-1.i),aT.i],這樣滑動(dòng)共獲得T-30個(gè)數(shù)據(jù)塊。對(duì)于aN的全部數(shù)據(jù),本文以5.0∶2.5∶2.5的比例分成訓(xùn)練集、驗(yàn)證集和測(cè)試集。
為直觀地分析廣州塔站的客流特征,隨機(jī)選取一周的進(jìn)出站客流,如圖3所示。由圖3可見(jiàn),廣州塔站工作日進(jìn)出站客流曲線的整體分布相似,具有周期性特征。其中,工作日出站客流高峰集中在07:30—10:00之間,進(jìn)站客流高峰則集中在17:00—21:00之間;周末的進(jìn)出站高峰都集中在晚高峰,出站客流高峰在17:00—21:30之間,周六的進(jìn)站客流高峰在19:00—22:30之間,周日的進(jìn)站客流高峰在19:00—22:00之間。這說(shuō)明廣州塔站是典型的商業(yè)區(qū)。工作日進(jìn)站客流高峰的進(jìn)站人數(shù)為619人/5 min,出站客流高峰的出戰(zhàn)人數(shù)為571人/5 min;周末進(jìn)站客流高峰的進(jìn)站人數(shù)為580人/5 min,出站客流高峰的出站人數(shù)為512人/5 min。由圖3可知,06:00—07:00及23:30—24:00的客流量較少,因此,本文預(yù)測(cè)數(shù)據(jù)不包括這兩個(gè)時(shí)間段的客流量。
圖3 廣州塔站樣本數(shù)據(jù)中其中一周的進(jìn)出站客流量
2.2.1 小波函數(shù)的選擇
文獻(xiàn)[22]指出,Daubechies(dbN)和Symlets(symN)小波函數(shù)對(duì)城市軌道交通客流數(shù)據(jù)的去噪效果都很好。因此,本文分別利用dbN和symN小波函數(shù)對(duì)車站客流數(shù)據(jù)進(jìn)行分解,并對(duì)出站客流的預(yù)測(cè)結(jié)果進(jìn)行比對(duì)。小波分解深度為2層,LSTM的優(yōu)化采用Adam算法,LSTM最大迭代次數(shù)為90,LSTM隱含層節(jié)點(diǎn)數(shù)為25,試驗(yàn)結(jié)果如表1所示。
表1 不同小波函數(shù)性能對(duì)比
由表1可知:當(dāng)WT-LSTM組合模型的小波函數(shù)為db4時(shí),進(jìn)出站客流數(shù)據(jù)的預(yù)測(cè)精度最高。進(jìn)站客流數(shù)據(jù)的EMAE、ERMSE和EMAPE分別為32.68、51.67和7.35;出站客流數(shù)據(jù)的EMAE、ERMSE和EMAPE分別為63.01、94.28和13.02。
2.2.2 小波分解深度選擇
小波分解層數(shù)選取數(shù)值越大,細(xì)節(jié)分量的低頻信息體現(xiàn)得越明顯,但其自身的高頻信息也會(huì)被漸漸分離開(kāi);同時(shí),高頻子序列也含有一定的低頻信息,這會(huì)增加客流量分析的復(fù)雜程度。因此,本文分別選擇兩層和三層分解深度對(duì)車站的客流數(shù)據(jù)進(jìn)行分解。小波函數(shù)為db4,LSTM的優(yōu)化采用Adam算法,LSTM最大迭代次數(shù)為90,LSTM隱含層節(jié)點(diǎn)數(shù)為25,試驗(yàn)結(jié)果如表2所示。
表2 不同小波分解深度性能對(duì)比
由表2可知,WT-LSTM組合模型的小波分解深度為2時(shí),進(jìn)出站客流數(shù)據(jù)的預(yù)測(cè)精度更高。
2.2.3 LSTM優(yōu)化算法選擇
分別利用RMSProp、SGD和Adam算法對(duì)LSTM進(jìn)行尋優(yōu)。小波函數(shù)為db4,小波分解層數(shù)為2層, LSTM的迭代次數(shù)90,隱含層節(jié)點(diǎn)數(shù)為25,試驗(yàn)結(jié)果如表3所示。由表3可知,Adam算法優(yōu)于RMSProp和SGD算法。
表3 不同算法性能對(duì)比
2.2.4 LSTM節(jié)點(diǎn)數(shù)和迭代次數(shù)選擇
LSTM隱含層節(jié)點(diǎn)數(shù)和迭代次數(shù)對(duì)模型預(yù)測(cè)精度的影響很大,因此,本文首先選取隱含層節(jié)點(diǎn)數(shù)為20、25、30,迭代次數(shù)90,對(duì)出站客流進(jìn)行預(yù)測(cè)比對(duì)。選取迭代次數(shù)為80、85、90、95、100,隱含層節(jié)點(diǎn)數(shù)25,進(jìn)行比對(duì)(出站客流數(shù)據(jù)的迭代次數(shù)為95時(shí),同時(shí)選取30的節(jié)點(diǎn)數(shù)。),以獲取合適的迭代次數(shù)。小波分解層數(shù)為2層,小波函數(shù)位db4,LSTM的優(yōu)化采用Adam算法。試驗(yàn)結(jié)果如表4和表5所示。
表4 不同隱含層節(jié)點(diǎn)數(shù)性能對(duì)比
由表4可知:LSTM隱含層節(jié)點(diǎn)數(shù)取25時(shí),進(jìn)站客流數(shù)據(jù)預(yù)測(cè)精度更高;LSTM隱含層節(jié)點(diǎn)數(shù)取30時(shí),出站客流數(shù)據(jù)預(yù)測(cè)精度更高。由表5可知:LSTM迭代次數(shù)為95時(shí),進(jìn)出站客流數(shù)據(jù)的預(yù)測(cè)精度更高;迭代次數(shù)為95時(shí),隱含層節(jié)點(diǎn)數(shù)為25時(shí),出站客流數(shù)據(jù)的預(yù)測(cè)精度更高。
表5 不同迭代次數(shù)性能對(duì)比
綜合表1~5參數(shù)調(diào)優(yōu)可知:本文 WT-LSTM組合模型的小波函數(shù)為db4、小波分解層數(shù)為2層、LSTM優(yōu)化算法為Adam、LSTM最大迭代次數(shù)為95、LSTM隱含層節(jié)點(diǎn)數(shù)為25時(shí),模型的預(yù)測(cè)效果最佳。此時(shí),進(jìn)站客流數(shù)據(jù)的EMAE、ERMSE和EMAPE分別為30.39、47.30和7.25;出站客流數(shù)據(jù)的EMAE、ERMSE和EMAPE分別為43.20、59.05和10.77。
本文WT-LSTM組合模型選取小波函數(shù)為db4,小波分解層數(shù)為2層,LSTM的優(yōu)化采用Adam算法,LSTM最大迭代次數(shù)為95,LSTM隱含層節(jié)點(diǎn)數(shù)為25,并與傳統(tǒng)LSTM模型進(jìn)行比較。經(jīng)模型計(jì)算,LSTM模型預(yù)測(cè)結(jié)果如圖4所示,WT-LSTM組合模型的預(yù)測(cè)結(jié)果如圖5所示。預(yù)測(cè)性能對(duì)比如表6所示。
圖4 LSTM模型的進(jìn)出站客流預(yù)測(cè)結(jié)果
圖5 WT-LSTM模型的進(jìn)出站客流預(yù)測(cè)結(jié)果
表6 LSTM和WT-LSTM模型的預(yù)測(cè)性能對(duì)比
由圖4和圖5對(duì)比可知,LSTM模型的預(yù)測(cè)結(jié)果能夠在一定程度上預(yù)測(cè)實(shí)際數(shù)據(jù)的變化,但預(yù)測(cè)誤差較大;WT-LSTM組合模型的預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)非常接近。由表6可知:WT-LSTM組合模型相比LSTM模型,在EMAE和EMAPE方面都有較大提升,ERMSE和R2也佐證了WT-LSTM模型的預(yù)測(cè)優(yōu)勢(shì)。
針對(duì)城市軌道交通短時(shí)客流的特征,結(jié)合小波變換理論和LSTM模型設(shè)計(jì)了WT-LSTM組合預(yù)測(cè)模型,并利用Adam算法對(duì)LSTM進(jìn)行優(yōu)化,使用非飽和激活函數(shù)ReLU函數(shù)替代飽和函數(shù)激活函數(shù)Tanh函數(shù)。經(jīng)參數(shù)調(diào)優(yōu)后可得:WT-LSTM組合模型的小波函數(shù)為db4、小波分解層數(shù)為2層、LSTM優(yōu)化算法為Adam、LSTM最大迭代次數(shù)為95、LSTM隱含層節(jié)點(diǎn)數(shù)為25時(shí),組合模型的預(yù)測(cè)效果最佳。
為了驗(yàn)證所建WT-LSTM組合模型的預(yù)測(cè)效果,將組合模型與傳統(tǒng)的LSTM模型進(jìn)行比對(duì)。研究結(jié)果表明,WT-LSTM組合模型在EMAE、ERMSE、EMAPE和R2方面均優(yōu)于LSTM模型。WT-LSTM組合模型的優(yōu)勢(shì)是,僅考慮數(shù)據(jù)本身,不用考慮站外天氣、其他車站客流情況、站外大型活動(dòng)等影響因素。此外,該模型對(duì)于具有時(shí)間序列特征的客流數(shù)據(jù)都具有較高的預(yù)測(cè)精度。