潘 杰,馬超群
(長安大學(xué) 公路學(xué)院,陜西 西安 710064)
隨著城市軌道交通實(shí)時交通信息系統(tǒng)的日益完善,管理者需要掌握未來短時間內(nèi)客流量的變化趨勢,以制定和實(shí)施運(yùn)營管理計劃,這不僅可以使交通管理逐步走向智能化、動態(tài)化和信息化,還能提高運(yùn)營效率,同時為出行者提供高效方便的服務(wù)。
文獻(xiàn)[1]提出了基于Kalman濾波的短時地鐵換乘客流預(yù)測方法,得到平日早高峰客流預(yù)測結(jié)果評價指標(biāo)均優(yōu)于節(jié)假日的預(yù)測結(jié)果,但存在對突變點(diǎn)預(yù)測不夠準(zhǔn)確。文獻(xiàn)[2]選用SARIMA模型對北京市地鐵進(jìn)站客流量預(yù)測進(jìn)行短時預(yù)測,預(yù)測結(jié)果基本能夠滿足對客流掌握的需求,但該模型對于特殊節(jié)假日的預(yù)測效果甚微;文獻(xiàn)[3]將K近鄰非參數(shù)回歸應(yīng)用于軌道交通客流量預(yù)測中,發(fā)現(xiàn)K近鄰非參數(shù)回歸比其他模型的預(yù)測精度更高、對突發(fā)客流的處理能力更強(qiáng)。文獻(xiàn)[4]將神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)兩種方法融合在一起,得到了組合預(yù)測模型;文獻(xiàn)[5]則在前人研究的基礎(chǔ)上,建立了基于客流時序特征的神經(jīng)網(wǎng)絡(luò)模型。
傳統(tǒng)預(yù)測法和灰色系統(tǒng)理論都可以獨(dú)立完成一定時期內(nèi)地鐵客流量大體趨勢的預(yù)測。但由于地鐵客流量受到很多未知因素影響,導(dǎo)致數(shù)據(jù)波動性較大,因此,傳統(tǒng)方法和灰色模型在短期預(yù)測中預(yù)測精度不高。本文考慮到地鐵客流量的隨機(jī)性和連續(xù)性,提出一種改進(jìn)的灰色馬爾科夫預(yù)測模型。用改進(jìn)后的模型對西安地鐵客流量進(jìn)行了預(yù)測,改進(jìn)后的灰色馬爾科夫模型的準(zhǔn)確度和精度都有所提高。
設(shè)原始數(shù)據(jù)序列為嚴(yán)格的指數(shù)序列,即
x0(k)=Me-η(k-1),k=1,2,…,n.
(1)
其一次累加生成序列為
(2)
用傳統(tǒng)的GM(1,1)建模方法建模,可得
(3)
Yn=[Meη,Meη,…,Me(n-1)η]T.
(4)
經(jīng)推導(dǎo)可得
(5)
最終擬合結(jié)果為
x′(0)(1)=M.
(6a)
(k=2,3,…,n).
(6b)
根據(jù)式(5),可用傳統(tǒng)GM (1,1)模型的參數(shù)a,u來表示原始序列的參數(shù)η,M
假設(shè)指數(shù)序列建立的模型為
x0(k)=M′ea′(k-1),k=1,2,…,n.
(7)
其中,令
式(6a)和式(6b)是一個無偏模型。由此建立無偏GM(1,1)模型,其建模步驟為:
步驟(1)到步驟(3)見本文1.1中傳統(tǒng)GM(1,1)模型建立步驟。
步驟(4):求出無偏GM(1,1)模型的參數(shù)
步驟(5):建立原始數(shù)據(jù)序列模型
x′(0)(1)=x(0)(1),
(8a)
x′(0)(k)=M′ea′(k-1)(k=2,3,…,n).
(8b)
與傳統(tǒng)GM(1,1)模型相比,無偏GM(1,1)模型基本消除了傳統(tǒng)GM(1,1)模型的固有偏差,其應(yīng)用范圍較傳統(tǒng)GM(1,1)模型更為廣泛。此外,無偏GM(1,1)模型無需進(jìn)行累減還原,簡化了建模步驟,提高了模型的計算速度。
考慮數(shù)據(jù)隨著時間變化具有內(nèi)在的連續(xù)性,利用加權(quán)平滑思想對原始數(shù)據(jù)進(jìn)行處理后,再結(jié)合無偏GM(1,1)建模過程建立滑動無偏GM(1,1)模型:
設(shè)原始數(shù)據(jù)序列為
經(jīng)加權(quán)平滑處理得
(9)
(10)
對原始數(shù)據(jù)進(jìn)行加權(quán)處理后,對該組數(shù)據(jù)利用無偏GM(1,1)模型進(jìn)行預(yù)測,得出的結(jié)果即滑動無偏GM(1,1)模型預(yù)測結(jié)果,該模型預(yù)測具有較高的準(zhǔn)確性,但對波動數(shù)據(jù)的適用情況較差。為彌補(bǔ)GM(1,1)模型的不足,引入了馬爾科夫模型。
1.3.1 狀態(tài)劃分
地鐵客流的變化過程是一個隨機(jī)呈現(xiàn)上升或下降趨勢的非穩(wěn)定隨機(jī)過程,地鐵客流量的數(shù)據(jù)序列符合n階馬爾科夫非平穩(wěn)隨機(jī)序列。設(shè)Y為相應(yīng)時間序列的取值區(qū)域,利用M黃金分割法將Y劃分為m個狀態(tài),則有H1,H2,…,Hm。
1.3.2 確定系統(tǒng)狀態(tài)
在有些預(yù)測問題中,系統(tǒng)狀態(tài)是確定的,但有些系統(tǒng)的狀態(tài)經(jīng)常需要人為的事先劃分來確定系統(tǒng)狀態(tài),通常無統(tǒng)一標(biāo)準(zhǔn)。
1.3.3 計算初始概率和一步轉(zhuǎn)移概率矩陣
1.3.4 利用P進(jìn)行系統(tǒng)預(yù)測
若時間序列的觀測值yt落入狀態(tài)Hi,Pij=max(Pi1,Pi2,…,Pim)為P的第i行元素,則可預(yù)測Yt+1時刻將轉(zhuǎn)移到狀態(tài)Hj,這是因?yàn)檗D(zhuǎn)移到狀態(tài)Hj可能性最大。
1.3.5 利用馬爾科夫鏈的遍歷性和平穩(wěn)分布對系統(tǒng)進(jìn)行分析。
本文以2014—2016年西安地鐵二號線各站點(diǎn)的AFC數(shù)據(jù)進(jìn)行統(tǒng)計分析,可得到二號線每個月的總客流量。將每3個月(一個季度)的客流量進(jìn)行一次匯總,得到西安地鐵客流量的樣本數(shù)據(jù)(見表1)。
表1 2014.3—2017.3西安地鐵客流量實(shí)際值
將表1中每個季度的地鐵客流總量作為初始數(shù)據(jù),對這些數(shù)據(jù)建立GM(1,1)模型,對2017年前3個季度的客流量進(jìn)行預(yù)測,從而得出2014.3—2017.3西安地鐵客流量GM(1,1)模型的預(yù)測值(見表2)。
表2 2014.3—2017.3西安地鐵客流量GM(1,1)模型的預(yù)測值
根據(jù)GM(1,1)模型的預(yù)測值計算出殘差ε(1)(K)和殘差的相對值Δ(K),再把Δ(K)與馬爾科夫
模型相結(jié)合[11],由殘差的相對值Δ(K)將它們劃分為3種狀態(tài),分別記為⊕1=(-8%,-2%],⊕2=(-2%,0],⊕3=(0,9]。得出2014.3—2016.4的GM(1,1)模型預(yù)測值、每年的殘差ε(1)(K)、殘差的相對值Δ(K)以及各自所處的狀態(tài)[12],如表3所示。
表3 狀態(tài)分布表
根據(jù)表3中的狀態(tài)劃分,對狀態(tài)轉(zhuǎn)移概率矩陣的分析如下[13-14]:表3中處于狀態(tài)1的情況共出現(xiàn)了3次,經(jīng)過一步轉(zhuǎn)移之后的狀態(tài)分別變?yōu)闋顟B(tài)3和狀態(tài)2,由此可得出由狀態(tài)1經(jīng)過一步轉(zhuǎn)移過后仍然處于狀態(tài)3的概率為2/3,轉(zhuǎn)移后到狀態(tài)2的概率為1/3,依此類推,得到狀態(tài)轉(zhuǎn)移矩陣為
由于2016年第四季度處于狀態(tài)3,那么初始向量為V0=(0,0,1),對2017年第一季度客流量進(jìn)行狀態(tài)預(yù)測,由一步狀態(tài)轉(zhuǎn)移得到
P(1)=V0P=(0,0,1),
則得到2017年第一季度處于第一狀態(tài)的概率為1/2,處于第二狀態(tài)的概率為1/2。通過加權(quán)平均得出2017年第一季度客流量預(yù)測值為6 550萬人。同理,用V0×P2對2017年第二季度客流量進(jìn)行預(yù)測,為7 016萬人,用V0×P3對2017年第三季度客流量進(jìn)行預(yù)測,為7 215萬人。根據(jù)地鐵客流量原始值和灰色馬爾科夫模型預(yù)測值建立對比圖,如圖1所示。
圖1 灰色馬爾科夫模型對客流量的預(yù)測
圖1給出了灰色模型對2號線客流量的預(yù)測,地鐵客流量實(shí)際值圍繞灰色模型預(yù)測值上下波動,整體上看用灰色模型均能夠相對準(zhǔn)確預(yù)測各個季度的客流量,驗(yàn)證了灰色模型的可行性。將2014年第3季度到2016年第4季度的數(shù)據(jù)當(dāng)作己知的數(shù)據(jù),用馬爾科夫預(yù)測模型分別對2017年前3個季度的客流量進(jìn)行預(yù)測,從圖1中得出灰色馬爾科夫模型修正后的灰色GM(1,1)模型,精度進(jìn)一步提高,能夠準(zhǔn)確地預(yù)測,但模型具有可用性之外也存在一定的誤差,需要對灰色馬爾科夫預(yù)測模型結(jié)合實(shí)際情況加以改進(jìn)。
對原始數(shù)據(jù)序列經(jīng)一次加權(quán)滑動平均處理后建立無偏GM (1,1)模型,稱為滑動無偏GM (1,1)模型[15]?;瑒訜o偏GM (1,1)模型對原始數(shù)據(jù)進(jìn)行處理,得出滑動無偏GM(1,1)模型的預(yù)測值(見表4)。
表4 2014.3—2017.3西安地鐵客流量滑動 無偏GM(1,1)模型的預(yù)測值
由殘差的相對值Δ(K)將它們劃分為3種狀態(tài),分別記為⊕1=(-8%,-2%],⊕2=(-2%,0],⊕3=(0,8], 2014.3—2016.4的GM(1,1)模型的預(yù)測值、每年的殘差ε(1)(K)、殘差的相對值Δ(K)、以及各自所處的狀態(tài)(見表5)。
表5 狀態(tài)分布表
通過GM(1,1)模型與滑動無偏GM(1,1)模型預(yù)測結(jié)果的對比分析,發(fā)現(xiàn)滑動無偏GM(1,1)與傳統(tǒng)的GM(1, 1)相比,最大絕對百分誤差從8.48%下降到了7%,平均絕對百分誤差從3.6%下降到了2.99%。故無偏GM(1,1)模型與傳統(tǒng)的GM(1,1)模型相比在精度方面有所提高。
運(yùn)用馬爾科夫模型對滑動無偏GM(1,1)預(yù)測值進(jìn)行修正,通過加權(quán)平均得出2017年第1季度客流量最終的預(yù)測值為6 687萬人。同理,用V0×P2對2017年第2季度客流量進(jìn)行預(yù)測,為6 974萬人,用V0×P3對2017年第3季度客流量進(jìn)行預(yù)測,為7 191萬人。由此繪制滑動無偏灰色模型預(yù)測值和客流量原始值對比圖(見圖2)。
圖2 滑動無偏灰色馬爾科夫模型對客流量的預(yù)測
圖2給出了滑動無偏灰色模型對2號線客流量的預(yù)測,從圖2可知,地鐵客流量實(shí)際值圍繞灰色模型預(yù)測值上下波動,且波動幅度進(jìn)一步縮小。整體上看用滑動無偏灰色模型比傳統(tǒng)灰色預(yù)測模型更為貼近現(xiàn)實(shí)值,驗(yàn)證了滑動無偏灰色模型的優(yōu)越性;將2014年第三季度到2016年第四季度的數(shù)據(jù)當(dāng)作己知數(shù)據(jù),用滑動無偏灰色馬爾科夫預(yù)測模型分別對2017年前3個季度的客流量進(jìn)行預(yù)測,從圖中得出馬爾科夫模型修正后的滑動無偏灰色GM(1,1)模型,精度進(jìn)一步提高,能夠準(zhǔn)確預(yù)測,與實(shí)際值的誤差降到最低。
將地鐵客流量原始值、馬爾科夫模型預(yù)測值和滑動無偏馬爾科夫模型預(yù)測值建立比較圖(見圖3)。
圖3 兩種預(yù)測值與實(shí)際值的比較
從圖3可以看出,利用滑動無偏灰色馬爾科夫模型得到的擬合曲線更接近于原始曲線,比灰色馬爾科夫模型擬合的曲線效果要好,更傾向于實(shí)際數(shù)據(jù)。
對比2017年3個季度的灰色馬爾科夫模型、滑動無偏灰色馬爾科夫模型兩個模型的評定標(biāo)準(zhǔn):最大絕對百分誤差(MaxAPE),平均絕對誤差(MAE),平均絕對百分誤差(MAEP)(見表6)。
表6 預(yù)測方法的誤差對比
從圖3和表6可知,經(jīng)過滑動無偏灰色馬爾科夫模型優(yōu)化后的3種誤差均有所下降,預(yù)測精度提高,驗(yàn)證了滑動無偏灰色馬爾科夫預(yù)測模型在地鐵客流量預(yù)測中的適用性。
本文將滑動平滑法和無偏GM(1,1)方法結(jié)合,對原始的灰色GM(1,1)進(jìn)行改進(jìn),應(yīng)用于地鐵客流量的預(yù)測,構(gòu)建了滑動無偏灰色馬爾科夫預(yù)測模型對地鐵客流量預(yù)測模型,并與原始的灰色馬爾科夫預(yù)測模型進(jìn)行預(yù)測效果比較。利用模型對西安地鐵二號線客流量進(jìn)行預(yù)測,并與原始的灰色馬爾科夫預(yù)測模型進(jìn)行預(yù)測效果比較。實(shí)驗(yàn)結(jié)果表明,滑動無偏灰色馬爾科夫預(yù)測模型的預(yù)測精度均較高,最大絕對百分誤差(MaxAPE)、平均絕對誤差(MAE)、平均絕對百分誤差(MAEP)均比原始的灰色馬爾科夫模型預(yù)測結(jié)果有了一定的提升,驗(yàn)證了滑動無偏灰色馬爾科夫預(yù)測模型在地鐵客流量預(yù)測上的適用性。