劉美琪 焦朋朋 孫 拓
(北京建筑大學(xué)土木與交通工程學(xué)院,100044,北京∥第一作者,碩士研究生)
隨著城市軌道交通實時交通信息系統(tǒng)的日益完善,管理者需要掌握未來短時間內(nèi)客流量的變化趨勢,以制定和實施交通管理計劃,這不僅可以使交通管理逐步走向智能化、動態(tài)化和信息化,還能提高運營效率,同時為出行者提供高效方便的服務(wù)。
在城市軌道交通日客流預(yù)測方面,文獻(xiàn)[1]利用馬爾科夫鏈改進(jìn)了灰色模型;文獻(xiàn)[2]將神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)兩種方法融合在一起,得到了組合預(yù)測模型;文獻(xiàn)[3]則在前人研究的基礎(chǔ)上,建立了基于客流時序特征的神經(jīng)網(wǎng)絡(luò)模型。在城市軌道交通短時客流預(yù)測方面,BP 神經(jīng)網(wǎng)絡(luò)[4-5]與小波神經(jīng)網(wǎng)絡(luò)[6]被引入組合模型。
非參數(shù)回歸模型(Nonparametric Regressive Model)與神經(jīng)網(wǎng)絡(luò)模型同屬于無數(shù)學(xué)模型的預(yù)測方法,但多用于道路交通流短時預(yù)測。文獻(xiàn)[7]最早真正將非參數(shù)回歸的方法應(yīng)用到了交通流量預(yù)測中。文獻(xiàn)[8]對傳統(tǒng)的非參數(shù)回歸進(jìn)行了改進(jìn),運用變K 搜索算法和基于動態(tài)聚類和散列函數(shù)的歷史數(shù)據(jù)組織方式。文獻(xiàn)[9]利用該模型預(yù)測倫敦環(huán)路的交通量;文獻(xiàn)[10]則應(yīng)用到了快速路行程速度的預(yù)測。此外,卡爾曼濾波[11]、目標(biāo)導(dǎo)向的神經(jīng)網(wǎng)絡(luò)算法[12]、模糊神經(jīng)網(wǎng)絡(luò)[13]與貝葉斯組合神經(jīng)網(wǎng)絡(luò)算法[14]均被引入預(yù)測模型中。
非參數(shù)回歸模型適用于非線性和非平穩(wěn)性的數(shù)據(jù)序列,但很少應(yīng)用于軌道交通客流量預(yù)測。因此,本文為預(yù)測每5 min的進(jìn)站客流量,分別建立了K近鄰非參數(shù)回歸(NPR)、基于偏差修正系數(shù)的卡爾曼濾波(KF)以及貝葉斯組合(BCM)模型,通過對比分析各模型在早高峰、晚高峰、平峰時段和全天的預(yù)測誤差指標(biāo),發(fā)現(xiàn)K近鄰非參數(shù)回歸比其他模型的預(yù)測精度更高,對突發(fā)客流的處理能力更強(qiáng)。
如圖1所示,首先應(yīng)用NPR 預(yù)測某站點兩天的短時進(jìn)站客流量,兩天的預(yù)測值是為組合模型做準(zhǔn)備,算法主要分為4步:歷史數(shù)據(jù)準(zhǔn)備及樣本數(shù)據(jù)庫生成、狀態(tài)向量定義、K近鄰搜索、預(yù)測算法。然后應(yīng)用傳統(tǒng)卡爾曼濾波模型預(yù)測前一天的客流量,擬合偏差修正系數(shù),將系數(shù)引入觀測方程并預(yù)測后一天的短時客流量。最后將前一天作為歷史特征天,后一天的各時段作為貝葉斯組合預(yù)測模型中的當(dāng)前時段,分別計算誤差及貝葉斯權(quán)重,代入模型得到預(yù)測結(jié)果。
圖1 算法流程
NPR 是應(yīng)用很廣泛的一種非參數(shù)回歸算法,具有無參數(shù)、可移植、預(yù)測精度高等優(yōu)點,它的誤差比較小,且誤差分布情況良好。
1.1.1 歷史數(shù)據(jù)準(zhǔn)備及樣本數(shù)據(jù)庫生成
樣本數(shù)據(jù)庫由表示系統(tǒng)狀態(tài)的全部歷史觀測資料組成,NPR 預(yù)測的效果和質(zhì)量直接取決于樣本數(shù)據(jù)庫的質(zhì)量。交通系統(tǒng)狀態(tài)的特征蘊(yùn)含在歷史數(shù)據(jù)中,歷史數(shù)據(jù)越多,越有利于非參數(shù)回歸更加真實且完整地表達(dá)系統(tǒng)狀態(tài)的特征,越有利于得到精確的預(yù)測值。樣本數(shù)據(jù)庫是動態(tài)的,它會隨著觀測數(shù)據(jù)的生成而不斷更新,因此這是一個實時庫與歷史庫相結(jié)合的復(fù)合數(shù)據(jù)庫。
1.1.2 狀態(tài)向量的定義
在交通領(lǐng)域,狀態(tài)向量是指與預(yù)測站點當(dāng)前時段的流量相關(guān)聯(lián)的影響因素組成的向量。地鐵站點吸引的客流量與路段交通量不同,它沒有明確的上下游路段,沒有信號燈,但是與預(yù)測站點相鄰的其它站點的布置會影響客流量的分布及到達(dá)規(guī)律。所以在本文中,引入預(yù)測站點與其它站點之間的相關(guān)性分析,以相關(guān)系數(shù)ρAB的大小來確定狀態(tài)向量中的相關(guān)站點數(shù),同時狀態(tài)向量還應(yīng)包括預(yù)測站點前m個時段(t,t-1,t-2,…,t-m)的流量數(shù)據(jù),m的取值可以通過計算m階自相關(guān)系數(shù)ρm來確定。
將站點A連續(xù)n個時間段的客流量看作時間序列{V1,A,…,Vn,A},站點B的客流量時間序列為{V1,B,…,Vn,B},兩站點之間的相關(guān)系數(shù)
式中:
VA——站點A時間序列的平均值;
VB——站點B時間序列的平均值。
計算自相關(guān)系數(shù)時,將預(yù)測站點連續(xù)n個時間段的進(jìn)站流量看作時間序列{V1,…,Vn},把這組時間序列分解成{V1,…,Vm+1},{V2,…,Vm+2}…{Vn-k,…,Vn}共n-m組子序列,設(shè)其m階自相關(guān)系數(shù)
式中:
Vi——第i個子序列的平均值。
1.1.3 K 近鄰搜索
K近鄰法則是一種基于數(shù)據(jù)的非參數(shù)回歸方法,它并非建立一種數(shù)學(xué)預(yù)測模型,而是尋找與當(dāng)前狀態(tài)向量相匹配的K個最近鄰的數(shù)據(jù),并以該K個數(shù)據(jù)的下一時段的數(shù)據(jù)為基礎(chǔ),對站點下一時段的值進(jìn)行預(yù)測。
在樣本數(shù)據(jù)庫中搜索與實時數(shù)據(jù)相匹配的數(shù)據(jù)系列時,主要采用歐氏距離作為主要指標(biāo),即當(dāng)前狀態(tài)向量的各分量與歷史狀態(tài)向量中各分量的離差平方和的開方值,以此作為匹配距離,表達(dá)式如下:
式中:
I——與研究站點相關(guān)的其它站點集合;
m——狀態(tài)向量中研究站點前m個時段;
Vi(t)——站點i在時段t的進(jìn)站流量;
vi(t)——歷史數(shù)據(jù)中站點i在時段t的進(jìn)站流量;
V(t-j)——研究站點當(dāng)前狀態(tài)t-j時段的進(jìn)站流量;
v(t-j)——研究站點歷史數(shù)據(jù)中的進(jìn)站流量。
1.1.4 預(yù)測算法
設(shè)Vi(t)是時段t第i個近鄰的進(jìn)站客流量,di是其與當(dāng)前狀態(tài)向量之間的歐氏距離,則下一時段的客流量
傳統(tǒng)卡爾曼濾波模型盡管遞推效率高,但由于其對歷史信息的利用率較低,導(dǎo)致預(yù)測結(jié)果穩(wěn)定性不強(qiáng),所以為了提高其精度,在改進(jìn)的觀測方程中引入了偏差修正系數(shù)ω。地鐵進(jìn)站客流量隨著時間序列存在平峰和高峰的變化規(guī)律。用傳統(tǒng)卡爾曼濾波模型預(yù)測歷史特征天的短時客流量,發(fā)現(xiàn)預(yù)測偏差(實際值減去預(yù)測值的絕對值)也存在平峰、高峰、先增后減的變化規(guī)律,用二次拋物線來擬合這種趨勢。拋物線通過原點與偏差最大點,令a、b為常數(shù),表達(dá)式為:
在不同條件下,修正系數(shù)的函數(shù)表達(dá)式不同,但是均與偏差的變化規(guī)律有關(guān),所以修正系數(shù)的函數(shù)需要基于歷史數(shù)據(jù)擬合得到。然后建立基于偏差修正系數(shù)的卡爾曼濾波模型,該模型包括狀態(tài)變量、狀態(tài)轉(zhuǎn)移方程和觀測方程3個核心部分。
狀態(tài)變量確定為Q(t),即時段t預(yù)測站點的實際進(jìn)站流量。狀態(tài)轉(zhuǎn)移方程為:
其中W(t)是狀態(tài)方程的高斯白噪聲序列。觀測方程為:
其中H(t)為時段t地鐵站點的歷史平均客流量;e(t)是高斯白噪聲序列。
根據(jù)貝葉斯定理,建立組合模型:
式中:
I——模型的集合;
NPR——K近鄰非參數(shù)回歸模型;
KF——代表基于偏差修正系數(shù)的卡爾曼濾波模型;
Wi,t+1——模型i在t+1時刻的權(quán)重。
基礎(chǔ)數(shù)據(jù)是北京市地鐵13號線2013年11月份的進(jìn)站客流,站點以編號來表示,分別為21、23、25、27、29、33、35、37、39、41、43、45、47、49和51。編號順序按照實際站點順序排列。本文以25號站點為研究對象,5 min為一個時段,從4:45至24:00,共分為231個時段??柭鼮V波模型和貝葉斯組合預(yù)測模型需要歷史偏差數(shù)據(jù),所以將11月21日(星期四)定為歷史特征天,11月28日(星期四)確定為研究天。本節(jié)以NPR 的預(yù)測過程為重點,首先論述狀態(tài)向量及K值的確定過程,然后對比分析28日各模型全天、早晚高峰和平峰時的預(yù)測誤差。
2.1.1 狀態(tài)向量的定義
狀態(tài)向量通常選擇與預(yù)測站點的交通狀態(tài)最為相關(guān)的因素,因此本文選擇相鄰站點當(dāng)前時段和預(yù)測站點前m個時段的進(jìn)站客流量,通過計算相關(guān)系數(shù)ρAB及ρm來確定,相關(guān)系數(shù)取值在-1和1之間,且絕對值越大相關(guān)性越大,如圖2所示。
25站點與21、23、27和49的相關(guān)系數(shù)絕對值都超過了0.9,但是49站距25站比較遠(yuǎn),所以排除這個選擇,以21、23和27站的當(dāng)前時段客流量V21,V23,V27為狀態(tài)分量。此外,狀態(tài)向量還包括預(yù)測站點前m個時段,如圖3所示,通過比較25站點自相關(guān)系數(shù)ρm絕對值的大小,確定m=2。綜上,狀態(tài)向量X(t)={V21(t),V23(t),V27(t),V25(t-1),V25(t-2)}。
圖2 25站點與其它站的相關(guān)性對比
圖3 25站點自相關(guān)系數(shù)
2.1.2K值的選取
狀態(tài)向量確定后,在樣本數(shù)據(jù)庫中尋找和當(dāng)前狀態(tài)特征相似的K個近鄰,然后進(jìn)行預(yù)測。一般是通過逐漸增加K值,觀察其對預(yù)測結(jié)果的影響,來確定最優(yōu)K值。評價指標(biāo)選取均方根誤差ERMS、標(biāo)準(zhǔn)均方根誤差在ENRMS、平均絕對百分誤差EMAP和平均百分比誤差EMP。令時段i的預(yù)測值為Pi,實測值為Ai,表達(dá)式如下:
K取值從1至5,預(yù)測早晨4:45至凌晨24:00的進(jìn)站客流量,并計算誤差指標(biāo)。如表1所示,當(dāng)K=2時ERMS、ENRMS、EMP值最小,EMP的值與最小值只相差1%,即0.01,所以K=2是最優(yōu)值。
2.2.1 誤差指標(biāo)對比
對全天5:00—24:00每5 min的客流量進(jìn)行預(yù)測,誤差指標(biāo)如表2所示。
表1 不同K 值的誤差指標(biāo)
表2 模型誤差指標(biāo)
可以發(fā)現(xiàn)NPR 的預(yù)測精度最高,KF 的預(yù)測精度最低。由于BCM 權(quán)值分配規(guī)則是誤差大的權(quán)值較小,誤差小的權(quán)值較大,所以BCM 各項誤差指標(biāo)值在兩子模型之間,且平穩(wěn)性較好。
一般城市軌道交通的早高峰為7:00—9:00,平峰為11:00—13:00,晚高峰為17:00—19:00。預(yù)測每5 min的客流量,對比三類模型在不同時間段的ERMS,如表3所示。
由表3 可見:早高峰期間,NPR 的ERMS值最小,預(yù)測精度最高;KF 與BCM 的EPMS差值相近。平峰期間,BCM 的EPMS精度最高,說明在客流量小且平穩(wěn)度增高的情況下該模型預(yù)測精度會提高。晚高峰時KF的EPMS值遠(yuǎn)大于早高峰、平峰與全天的EPMS,說明面對客流量的猛增與大幅度震蕩,該模型預(yù)測穩(wěn)定性較差。
表3 不同時間段的ERMS指標(biāo)
2.2.2 流量誤差對比
如圖4所示,早7:00—9:00,KF 和BCM 預(yù)測流量誤差波動性越來越大,BCM 的流量誤差大體上在20以下,NPR 的流量誤差則不超過20,且大多在10以內(nèi),說明了NPR 的適用性。
從圖5可以看出,盡管平峰時客流的到達(dá)率會相對比較平均,KF 的流量誤差仍很不平穩(wěn)。BCM的流量誤差則隨時間趨于平穩(wěn),而且在平峰的后期,其流量誤差是三類模型中最小的,所以BCM 更適用于預(yù)測短時流量少又平穩(wěn)的時段。
圖4 早高峰流量誤差
圖5 平峰流量誤差
如圖6所示:晚高峰KF的誤差明顯大于NPR和BCM,甚至達(dá)到了80;BCM 的流量誤差在NPR 和KF之間,說明BCM 融合了兩個子模型的優(yōu)點和缺點。計算貝葉斯權(quán)重就是為了中和預(yù)測精度,但這也決定了它不會比最優(yōu)的子模型預(yù)測精度更高。
圖6 晚高峰流量誤差
NPR 模型是基于歷史數(shù)據(jù)的預(yù)測方法,沒有固定的數(shù)學(xué)模型,應(yīng)用條件是要有充足的、實時的觀測數(shù)據(jù),一般不少于一個月,其特點是預(yù)測精度依賴于數(shù)據(jù)量的大小。對于換乘站,如果有該線路相鄰各站點的歷史數(shù)據(jù),可以真實且完整地表達(dá)客流狀態(tài)的不同特征,從樣本數(shù)據(jù)庫中能夠搜索到近鄰點,就可以利用該模型得到精確的進(jìn)站客流預(yù)測結(jié)果。而KF模型一般只需要預(yù)測站點一周的歷史數(shù)據(jù),沒有其他的影響因素,所以同樣可用于換乘站。
通過研究發(fā)現(xiàn),NPR 模型的優(yōu)點是應(yīng)對突發(fā)事件的能力很強(qiáng)、預(yù)測準(zhǔn)確性和誤差分布較好,且不需要先驗知識和大量的參數(shù)識別;但是其搜索速度較慢,參數(shù)調(diào)整也需要時間。KF 模型優(yōu)點是算法簡單,計算效率很高,對歷史數(shù)據(jù)的需求量不大且應(yīng)用廣泛,但是其預(yù)測誤差較大。在一天中不同時段的預(yù)測穩(wěn)定性也不高,誤差波動性大。BCM 模型是利用加權(quán)把多個單一預(yù)測模型線性組合起來,權(quán)值是根據(jù)每個子模型前一時期的預(yù)測誤差計算條件概率得出的,其優(yōu)點是提高了模型預(yù)測的穩(wěn)定性。
進(jìn)一步研究應(yīng)嘗試改進(jìn)上述模型,使其精度和穩(wěn)定性可以達(dá)到客流量實時預(yù)測的需求;另外可以探尋進(jìn)站量、出站量、換乘量與斷面客流量等參數(shù)之間的動態(tài)變化關(guān)系,從城市軌道交通客流形成機(jī)理方面構(gòu)建新的預(yù)測模型。
[1]謝輝,董德存,歐冬秀,等.軌道交通短期客流預(yù)測方法及其算法研究[J].現(xiàn)代城市軌道交通,2011(3):96.
[2]毛靜.城市軌道交通客流短期預(yù)測方法及實證研究[D].北京:北京交通大學(xué),2012.
[3]四兵鋒,何九冉,任華玲,等.基于時序特征的城市軌道交通客流預(yù)測[J].北京交通大學(xué)學(xué)報,2014,38(3):1.
[4]董升偉.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的軌道交通短時客流預(yù)測方法研究[D].北京:北京交通大學(xué),2013.
[5]Wei Y,Chen M C.Forecasting the short-term metro passenger flow with empirical mode decomposition and neural networks[J].Transportation Research:Part C,2012,21(1):148.
[6]鄒巍,陸百川,鄧捷,等.基于遺傳算法與小波神經(jīng)網(wǎng)絡(luò)的客流預(yù)測研究[J].武漢理工大學(xué)學(xué)報:交通科學(xué)與工程版,2014,38(5):1148.
[7]Davis G,Nihan N.Nonparametric regression and short-term freeway traffic forecasting[J].Journal of Transportation Engineering,1991,117(2):178.
[8]宮曉燕,湯淑明.基于非參數(shù)回歸的短時交通流量預(yù)測與事件檢測綜合算法[J].中國公路學(xué)報,2003,16(1):28.
[9]Clark S.Traffic prediction using multivariate nonparametric regression[J].Journal of Transportation Engineering,2003,129(2):161.
[10]翁劍成,榮建,任福田,等.基于非參數(shù)回歸的快速路行程速度短期預(yù)測算法[J].公路交通科技,2007,24(3):93.
[11]Okutani I,Seephanedes Y J.Dynamic prediction of traffic volume through Kalman filtering theory[J].Transportation Research Part B:Methodological,1984,18(1):1.
[12]Hussein D.An object-oriented neural network approach to short-term traffic forecasting[J].European Journal of Operational Research,2001(131):253.
[13]Yin H,Wong S C,Xu J,et al.Urban traffic flow prediction using a fuzzy-neural approach[J].Transportation Research C,2002,10(2):85.
[14]Zheng W Z,Lee D,SHI Q X.Short-term freeway traffic flow prediction:Bayesian combined neural network approach[J].Journal of Transportation Engineering,2006,132(2):114.
[15]王奕,徐瑞華.基于周期時變特點的城市軌道交通短期客流預(yù)測研究[J].城市軌道交通研究,2010(1):46.