鄭俊鋒 方旭峰 王晨陽(yáng)
(1.合肥市軌道交通集團(tuán)有限公司,230001,合肥; 2.西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,611756,成都∥第一作者,高級(jí)工程師)
體育賽事、演唱會(huì)、音樂(lè)節(jié)及博覽會(huì)等大型活動(dòng)日益增多,活動(dòng)散場(chǎng)后觀眾離場(chǎng)時(shí)間集中,對(duì)于活動(dòng)場(chǎng)館周邊的城市軌道交通車站,易產(chǎn)生大量瞬時(shí)進(jìn)站大客流,使車站作業(yè)、列車運(yùn)營(yíng)面臨極大挑戰(zhàn)。當(dāng)大客流出現(xiàn),原列車運(yùn)行計(jì)劃與變化的客流需求不匹配時(shí),將造成乘客在車站聚集、列車超載、妨礙列車前方車站乘客乘車等影響。提前預(yù)測(cè)大型活動(dòng)引發(fā)大客流的發(fā)生時(shí)間與強(qiáng)度,以便城市軌道交通運(yùn)營(yíng)企業(yè)及時(shí)調(diào)整運(yùn)輸組織方案,有效處置可預(yù)見性大客流,是亟待解決的問(wèn)題。
根據(jù)研究表明,當(dāng)車站站臺(tái)等候的乘客密度達(dá)到甚至超過(guò)2人/m2時(shí),乘客的移動(dòng)速度會(huì)受到極大的阻礙[1],并會(huì)對(duì)乘客的感受造成明顯負(fù)面影響[2]?;谏鲜鰳?biāo)準(zhǔn),本文對(duì)城市軌道交通大客流定義為:在一個(gè)發(fā)車間隔內(nèi),在城市軌道交通車站站臺(tái)某一方向區(qū)域等待的乘客不小于2人/m2,且進(jìn)入該站乘客人數(shù)無(wú)明顯減少趨勢(shì)的情況。
大客流的產(chǎn)生具有多樣性和復(fù)雜性,是外部環(huán)境因素和乘客個(gè)體出行選擇綜合影響的結(jié)果。根據(jù)大客流是否可預(yù)測(cè),將大客流分為可預(yù)測(cè)大客流和不可預(yù)測(cè)的大客流[3]。
可預(yù)測(cè)大客流是由可預(yù)測(cè)的乘客出行行為引發(fā)的大客流。如計(jì)劃舉辦的體育賽事、演唱會(huì)等大型活動(dòng),活動(dòng)散場(chǎng)后,乘客在短時(shí)內(nèi)大量進(jìn)入活動(dòng)場(chǎng)館周邊車站,產(chǎn)生大客流。另因節(jié)假日等乘客出行需求激增,在特定時(shí)段,以及在商業(yè)中心、景區(qū)附近車站也可能產(chǎn)生大客流。該類大客流可以通過(guò)活動(dòng)前的乘客出行OD(起訖點(diǎn))、活動(dòng)時(shí)間、活動(dòng)規(guī)模、活動(dòng)地點(diǎn)進(jìn)行預(yù)測(cè),具有較好的可預(yù)測(cè)性,故將該類客流作為本文的研究對(duì)象。
不可預(yù)測(cè)大客流是由城市軌道交通設(shè)施突發(fā)故障、惡劣天氣等不可預(yù)測(cè)原因引發(fā)的大客流。當(dāng)城市軌道交通設(shè)施突發(fā)故障時(shí),城市軌道交通運(yùn)輸能力下降,造成乘客滯留車站、列車擁擠度上升、車站乘客承載量達(dá)到閾值,產(chǎn)生大客流。當(dāng)天氣惡劣時(shí),道路交通的乘客會(huì)向城市軌道交通轉(zhuǎn)移,極大地提高了城市軌道交通的客流量。該類客流由于引發(fā)原因的突然性和不可預(yù)知性,客流的OD和時(shí)間也很難預(yù)知,因此對(duì)于該類大客流,本文不予考慮。
城市軌道交通可預(yù)測(cè)大客流具有強(qiáng)度大、持續(xù)時(shí)間可預(yù)測(cè)、影響范圍大的特點(diǎn),城市軌道交通運(yùn)營(yíng)企業(yè)若能準(zhǔn)確識(shí)別該特征,就能提前調(diào)整列車運(yùn)行計(jì)劃,以應(yīng)對(duì)該類大客流。
本文從客流結(jié)構(gòu),以及空間和時(shí)間三個(gè)角度分析大客流發(fā)生前后車站進(jìn)出站客流量變化規(guī)律。以合肥市某周六(為當(dāng)月21日)舉辦的一次大型演唱會(huì)為例,以演唱會(huì)舉辦地為中心的1 km范圍內(nèi),有1座城市軌道交通非換乘車站P站。該活動(dòng)舉行時(shí)間為20:00—22:00,活動(dòng)規(guī)模為12 000人。
在大型活動(dòng)舉辦前后,根據(jù)乘客出行目的的可將城市軌道客流劃分為大型活動(dòng)客流、通勤客流、其他出行客流。其中,通勤客流具有較為顯著的周期性,其他客流的隨機(jī)性較強(qiáng),而大型活動(dòng)客流根據(jù)活動(dòng)安排,是可預(yù)見的。
大型活動(dòng)開始前,大量乘客在特定時(shí)段從特定車站出站,短時(shí)內(nèi)出站客流量的大幅提高是大型活動(dòng)客流的顯著表征之一。由于乘客是隨著列車到站而分批次出站的,因此一般情況下,乘客出站過(guò)程不會(huì)產(chǎn)生乘客滯留。大型活動(dòng)結(jié)束后,通過(guò)公共交通聚集的乘客一般會(huì)選擇原交通工具返回,因此舉辦地周邊車站進(jìn)站客流量短時(shí)內(nèi)會(huì)大幅提高,該車站活動(dòng)前出站客流量的提高部分與活動(dòng)后進(jìn)站客流量的提高部分是正相關(guān)的,該部分客流與活動(dòng)舉辦地點(diǎn)、舉辦時(shí)間、活動(dòng)規(guī)模具有高度的相關(guān)性。
P站及其所在線路客流量較大的25座車站大型活動(dòng)前后1 h客流變化情況如圖1所示。
由圖1可知,P站在活動(dòng)前1 h內(nèi)的出站客流量和活動(dòng)后1 h內(nèi)的進(jìn)站客流量均遠(yuǎn)大于其余各站,該特征可用于大型活動(dòng)周邊車站大客流的識(shí)別與預(yù)測(cè)。
為進(jìn)一步驗(yàn)證大型活動(dòng)引發(fā)大客流的特征,選取大型活動(dòng)的當(dāng)天(21日),以及該日的前一周(14日)和前兩周(7日)的客流進(jìn)行對(duì)比,時(shí)間粒度為15 min。
2.3.1 出站客流
圖2為P站及與其相鄰的O站和Q站的出站客流量變化情況。
a) P站
由圖2可知,僅P站活動(dòng)當(dāng)天(21日)19:00—20:00出站客流量激增,其余時(shí)段各站的出站客流量特征基本一致。由此可知:O站與Q站的客流量具有相似的變化規(guī)律;如果忽略P站19:00后的大客流,3座車站客流量的整體變化規(guī)律較為一致,由于這3座車站所在的區(qū)域均為金融中心,發(fā)揮的功能相同。
2.3.2 進(jìn)站客流
圖3為P站及與其相鄰的O站和Q站的進(jìn)站客流量變化情況。
a) P站
由圖3可知,僅P站活動(dòng)當(dāng)天(21日)22:00—23:00進(jìn)站客流量激增,其余時(shí)段各站的進(jìn)站客流量特征基本一致。
根據(jù)上述分析,歸納大型活動(dòng)引發(fā)的大客流規(guī)律為:
1) 大型活動(dòng)開始前,大客流發(fā)生車站的出站客流有別于通勤客流,具有極大的強(qiáng)度,且車站靠近活動(dòng)舉辦地點(diǎn)。
2) 大型活動(dòng)結(jié)束后,大客流產(chǎn)生在靠近活動(dòng)舉辦地點(diǎn)的車站,進(jìn)站客流強(qiáng)度與該站活動(dòng)開始一段時(shí)間的出站客流強(qiáng)度關(guān)聯(lián)性強(qiáng)。
3) 大型活動(dòng)引發(fā)的大客流通常集中于舉辦地附近個(gè)別車站,對(duì)其余車站的影響較小。
4) 大客流產(chǎn)生后將持續(xù)一段時(shí)間,該時(shí)間長(zhǎng)度與車站運(yùn)能、大客流強(qiáng)度、線路運(yùn)能有關(guān),一般可持續(xù)1~2 h。
目前的客流預(yù)測(cè)方法主要有:通過(guò)構(gòu)建基于時(shí)間序列[4-10]的ARIMA、ARIMAX等數(shù)理統(tǒng)計(jì)模型,使用支持向量機(jī)(SVM)[11-12]、長(zhǎng)短期神經(jīng)記憶網(wǎng)絡(luò)(LSTM)[13-15]及其他機(jī)器學(xué)習(xí)方法[16-18]的機(jī)器學(xué)習(xí)模型。
數(shù)理統(tǒng)計(jì)模型對(duì)于趨勢(shì)性強(qiáng)的客流數(shù)據(jù)預(yù)測(cè)精度較高,但存在需要連續(xù)穩(wěn)定客流時(shí)序數(shù)據(jù)、僅能捕捉客流數(shù)據(jù)線性規(guī)律、對(duì)客流非線性特征及隨機(jī)性把握不足等局限性。傳統(tǒng)的機(jī)器學(xué)習(xí)模型對(duì)于單一環(huán)境下的客流預(yù)測(cè)精度較高,例如LSTM模型,其對(duì)未來(lái)客流的預(yù)測(cè)完全基于客流的歷史信息,對(duì)規(guī)律變化客流的預(yù)測(cè)性較好,但在實(shí)際應(yīng)用過(guò)程中,因大型活動(dòng)的規(guī)模、時(shí)間、地點(diǎn),以及當(dāng)天的天氣情況不盡相同,這些因素對(duì)客流的系統(tǒng)性影響也不盡相同,其更高精度的客流特點(diǎn)難以被傳統(tǒng)機(jī)器學(xué)習(xí)模型捕捉。
為進(jìn)一步提高多種因素系統(tǒng)影響下客流預(yù)測(cè)精度,本文在上述兩類預(yù)測(cè)模型的基礎(chǔ)上,擬使用基于STL(Seasonal and Trend decomposition using Loess)的時(shí)間序列分解方法的LightGBM方法(即STL-LightGBM)進(jìn)行大客流預(yù)測(cè)。
時(shí)間序列是按時(shí)間順序索引的一系列數(shù)據(jù)點(diǎn),一個(gè)時(shí)間序列通??梢员徊鸱譃橼厔?shì)量(T)、季節(jié)量(S)、周期量(C)和隨機(jī)量(I)。
在進(jìn)行時(shí)間序列分析時(shí),采用時(shí)間序列分解方法能夠降低噪聲干擾,可提高預(yù)測(cè)的精確度。時(shí)間序列分解方法一般可分為加法模型(見式(1))和乘法模型(見式(2))。
Yt=Tt+St+Ct+It
(1)
Yt=TtStCtIt
(2)
式中:
Yt——原時(shí)間序列在t時(shí)刻的值;
Tt、St、Ct、It——分別為時(shí)間序列在t時(shí)刻的趨勢(shì)量、季節(jié)量、周期量和隨機(jī)量。
本文使用基于STL的時(shí)間序列分解方法,通過(guò)魯棒局部加權(quán)回歸平滑化時(shí)間序列后將其分解得到趨勢(shì)量、季節(jié)量和隨機(jī)量。STL分為外循環(huán)與內(nèi)循環(huán),外循環(huán)計(jì)算魯棒性權(quán)重,內(nèi)循環(huán)計(jì)算時(shí)間序列的分解量,其流程如圖4所示。
注:k—循環(huán)的次數(shù);N—時(shí)間序列樣本數(shù);np—時(shí)間序列的周期(一個(gè)周期有幾個(gè)樣本);ns、nl、nt—在不同步驟中截取的進(jìn)行加權(quán)滑動(dòng)平均的數(shù)據(jù)長(zhǎng)度;Lt—t時(shí)刻,去除周期性差異后的時(shí)間序列;Rt—t時(shí)刻,刪除趨勢(shì)量與季節(jié)量后的時(shí)間序列;LOESS—局部加權(quán)回歸。
如果樣本的趨勢(shì)較強(qiáng),則當(dāng)刪除數(shù)據(jù)中的季節(jié)分量后,變動(dòng)幅度應(yīng)比殘差項(xiàng)大,可以用Rt的方差與Tt+Rt的方差表示。若時(shí)間序列的趨勢(shì)較弱,則兩個(gè)方差大致相等。據(jù)此,趨勢(shì)強(qiáng)度定義如式(3)所示,其給定了趨勢(shì)強(qiáng)度的衡量標(biāo)準(zhǔn),其值在0~1之間。
FT=max[0,1-Var(Rt)/Var(Tt+Rt)]
(3)
式中:
FT——時(shí)間序列的趨勢(shì)強(qiáng)度。
與此相似,季節(jié)性的強(qiáng)度定義如式(4):
FS=max[0,1-Var(Rt)/Var(St+Rt)]
(4)
式中:
FS——時(shí)間序列的季節(jié)性強(qiáng)度。
在時(shí)間序列中季節(jié)性一般呈現(xiàn)周期性變化的規(guī)律,因此季節(jié)性周期中的波峰大體上也是固定的,故只需要找到季節(jié)性周期中的最大值就可以確定波峰期。
以活動(dòng)當(dāng)日P站進(jìn)站客流為例,將研究時(shí)間段平滑參數(shù)設(shè)定為4,將原客流基于SLT的時(shí)間序列分解方法分解后的結(jié)果如圖5所示。
a) 原時(shí)間序列趨勢(shì)量
圖5分別為原始時(shí)間序列趨勢(shì)量,以及分解后的趨勢(shì)量、季節(jié)量和隨機(jī)量,由此可得趨勢(shì)量有兩個(gè)峰值,與上文的P站大客流特征分析一致。當(dāng)研究時(shí)段設(shè)定為1 h時(shí),季節(jié)量具有明顯的周期性;觀察隨機(jī)量發(fā)現(xiàn),在前60個(gè)時(shí)間段,4個(gè)隨機(jī)量為一組呈現(xiàn)周期性變化規(guī)律,在大型活動(dòng)結(jié)束后隨機(jī)量的波動(dòng)較大。
在模型訓(xùn)練前需要對(duì)一些特殊特征進(jìn)行編碼。以大型活動(dòng)產(chǎn)生的大客流為例,其特征值包括但不限于預(yù)測(cè)時(shí)間編碼、活動(dòng)時(shí)段特征編碼、活動(dòng)前t內(nèi)出站客流編碼、天氣編碼和氣溫編碼。
3.2.1 預(yù)測(cè)時(shí)間編碼
以15 min為時(shí)間粒度對(duì)一日內(nèi)的城市軌道交通運(yùn)營(yíng)時(shí)間進(jìn)行編碼時(shí),按照時(shí)間順序進(jìn)行整數(shù)編碼,結(jié)果如表1所示。
表1 預(yù)測(cè)時(shí)間編碼
3.2.2 活動(dòng)時(shí)段特征編碼
對(duì)于大型活動(dòng)時(shí)間的編碼,以其持續(xù)時(shí)間段的時(shí)間編碼差值表示,活動(dòng)持續(xù)中對(duì)應(yīng)編碼為0。如活動(dòng)持續(xù)時(shí)間為19:00—21:45,其對(duì)應(yīng)的時(shí)間編碼為53—63,則對(duì)應(yīng)活動(dòng)編碼如表2所示。
表2 大型活動(dòng)時(shí)間編碼
3.2.3 活動(dòng)前t內(nèi)出站客流編碼
由上文分析可知,大型活動(dòng)前q時(shí)間內(nèi)出站人數(shù)與大型活動(dòng)結(jié)束后進(jìn)站客流量有直接關(guān)系,因此也需作為一個(gè)特征參與進(jìn)站客流量的預(yù)測(cè)。將編號(hào)為i-d-q時(shí)間段的該站出站客流量作為特征,計(jì)算公式為:
pi=pout,i-d-q
(5)
式中:
Pi——編號(hào)為i的時(shí)間段對(duì)應(yīng)的客流特征數(shù)值;
Pout,i-d-q——編號(hào)為i-d-q時(shí)間段對(duì)應(yīng)的出站客流量;
d——活動(dòng)持續(xù)的時(shí)間段數(shù)量。
3.2.4 天氣編碼
天氣對(duì)乘客出行行為具有一定的影響。惡劣天氣下,乘客出行減少,公共交通客流壓力較小。根據(jù)天氣對(duì)乘客出行影響程度的編碼方案如表3所示。按照天氣對(duì)乘客出行的正面影響和負(fù)面影響,分別賦值正數(shù)和負(fù)數(shù),影響程度越大則絕對(duì)值越大。
表3 天氣編碼
3.2.5 氣溫編碼
人體舒適溫度為25 ℃,以此標(biāo)準(zhǔn),對(duì)氣溫進(jìn)行編碼,氣溫偏離25 ℃越多,值越低,如式(6)所示。
Uc,i=-|VT,i-25 ℃|
(6)
式中:
Uc,i——編號(hào)為i的時(shí)間段對(duì)應(yīng)的氣溫特征值;
VT,i——編號(hào)為i的時(shí)間段對(duì)應(yīng)的實(shí)際氣溫。
LightGBM模型的表達(dá)式見文獻(xiàn)[19]。
第z次迭代時(shí)模型目標(biāo)為最小化損失函數(shù):
(7)
式中:
yu——第u個(gè)樣本值,u=1,2,…,N;
Ω(fj)、Ω(f2)——正則項(xiàng);
fz(xu)——第z個(gè)弱學(xué)習(xí)器;
xu——第u個(gè)樣本的特征值。
(8)
Ω(fj)用以表示模型的復(fù)雜度,將其加入目標(biāo)函數(shù)可以避免某一特征對(duì)應(yīng)的參數(shù)(權(quán)重)過(guò)大的問(wèn)題,LightGBM使用L2正則化,即參數(shù)的平方和,如式(9)所示:
(9)
式中:
γ,λ——超參數(shù);
W——葉子節(jié)點(diǎn)數(shù);
wj——節(jié)點(diǎn)j的參數(shù)。
式(7)用二階泰勒公式展開可簡(jiǎn)化為式(10):
(10)
式中:
gu——損失函數(shù)的一階導(dǎo)數(shù);
hu——損失函數(shù)的二階導(dǎo)數(shù);
c——常數(shù)。
將式(8)和式(9)代入式(10)可進(jìn)一步簡(jiǎn)化為下式:
(11)
wj,o=-Gj/(Hj+λ)
(12)
預(yù)測(cè)誤差是檢驗(yàn)預(yù)測(cè)模型效果的最重要評(píng)價(jià)指標(biāo),本文選取平均絕對(duì)誤差(EMAE)、均方誤差(EMSE)作為預(yù)測(cè)模型的評(píng)價(jià)標(biāo)準(zhǔn),這兩個(gè)指標(biāo)能夠反映真實(shí)客流量和預(yù)測(cè)客流量之間的偏差情況,兩者值越大則說(shuō)明誤差越大,值越小則誤差越小。計(jì)算公式為:
(13)
(14)
以合肥市某周六(為當(dāng)月21日)舉辦的一次大型演唱會(huì)為實(shí)例。將大型活動(dòng)的時(shí)間、規(guī)模、開始時(shí)間、結(jié)束時(shí)間,開始前1.0 h和0.5 h內(nèi)出站客流量、鄰站15 min內(nèi)客流量,天氣、平均氣溫,以及本站客流趨勢(shì)量、季節(jié)量、隨機(jī)量作為特征進(jìn)行模型訓(xùn)練。為了防止過(guò)擬合,超參數(shù)設(shè)置如下:最大深度為11,葉子節(jié)點(diǎn)數(shù)量為1 024(≤211)個(gè),最小樣本量為12個(gè)。使用時(shí)間段為大型活動(dòng)當(dāng)月1日至20日的城市軌道交通客流數(shù)據(jù)作為訓(xùn)練集,預(yù)測(cè)時(shí)間間隔為15 min。在運(yùn)營(yíng)時(shí)段內(nèi)一天有72條數(shù)據(jù),共2 160個(gè)樣本數(shù)據(jù)。
在相同超參數(shù)設(shè)定下,STL-LightGBM與LightGBM對(duì)同一數(shù)據(jù)集(大客流出現(xiàn)時(shí)間編碼為64—67)的預(yù)測(cè)結(jié)果如圖6所示。由圖6可見,雖然模擬結(jié)果均較為符合實(shí)際值,但使用STL-LightGBM方法的預(yù)測(cè)數(shù)據(jù)更為貼近實(shí)際值。
a) STL-LightGBM預(yù)測(cè)
進(jìn)一步進(jìn)行性能評(píng)價(jià),將目前短期客流預(yù)測(cè)常用的LSTM與LightGBM方法和本文提出的STL-LightGBM方法對(duì)同一測(cè)試集客流數(shù)據(jù)的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,結(jié)果如表4所示。由表4可見,在相同情況下,本文提出的大客流預(yù)測(cè)方法的EMAE和EMSE在三者中均為最低,表明STL-LightGBM預(yù)測(cè)精度更高,有助于充分掌握大客流的特征與規(guī)律。
表4 不同預(yù)測(cè)方法的客流預(yù)測(cè)結(jié)果對(duì)比
本文在總結(jié)分析大客流特征的基礎(chǔ)上,提出了STL-LightGBM城市軌道交通站點(diǎn)大客流預(yù)測(cè)方法。通過(guò)對(duì)客流時(shí)間序列的分解,獲得其趨勢(shì)量、季節(jié)量和隨機(jī)量,并作為大客流的特征輸入機(jī)器學(xué)習(xí)模型。該大客流預(yù)測(cè)方法的預(yù)測(cè)誤差較小,預(yù)測(cè)效果較好。