徐皓
(合肥職業(yè)技術(shù)學(xué)院,安徽 合肥 230000)
城市軌道交通客流對(duì)地鐵實(shí)際運(yùn)營(yíng)過程中的策略決策有重大影響。現(xiàn)階段,國(guó)內(nèi)各地鐵公司雖有各種大客流的應(yīng)急預(yù)案,但都有明顯的滯后性。所以,近年來,國(guó)內(nèi)各大城市都對(duì)地鐵客流的預(yù)測(cè)展開了研究。其中,杭州地鐵借助阿里云平臺(tái),由達(dá)摩院牽頭,開展了一次“天池全球城市計(jì)算AI挑戰(zhàn)賽-地鐵客流量預(yù)測(cè) 大賽,用于甄選出適合杭州地鐵的客流預(yù)測(cè)模型,為后來的運(yùn)營(yíng)管理提供數(shù)據(jù)支撐,可見客流預(yù)測(cè)越來越被人們所重視。
常見的時(shí)間序列有平穩(wěn)非平穩(wěn)之分。其中,前者是序列的統(tǒng)計(jì)特征[均值E(Xt)、協(xié)方差Cov(Xt,Xs)、相關(guān)性不隨時(shí)間變化而變化。非平穩(wěn)時(shí)間序列,統(tǒng)計(jì)特征隨著時(shí)間的變化而變化。
判斷其是平穩(wěn)還是非平穩(wěn)序列,常用如下:(1)利用散點(diǎn)圖進(jìn)行平穩(wěn)性檢驗(yàn);(2)利用樣本自相關(guān)函數(shù)進(jìn)行平穩(wěn)性判斷;(3)單位根檢驗(yàn)等檢驗(yàn)方法,此處選用最簡(jiǎn)單的曲線圖來直觀判定,實(shí)際效果見圖1。
圖1
對(duì)于平穩(wěn)非白噪聲序列,它的均值和方差是常數(shù)。ARMA模型適用于此種序列。
對(duì)于非平穩(wěn)序列,由于統(tǒng)計(jì)特征不穩(wěn)定,首先轉(zhuǎn)化成平穩(wěn)序列,然后分析,常用ARIMA 模型。
(1)AR(自回歸模型):用變量歷史數(shù)據(jù)對(duì)未來預(yù)測(cè),該模型必須滿足平穩(wěn)性的要求。
如 果{εt} 為 白 噪 聲, 服 從N(0,σ2),a0,a1,...,ap(ap≠0) 為實(shí)數(shù),就稱p 階差分方程:
是一個(gè)p 階自回歸模型,簡(jiǎn)稱AR(p)模型。自回歸方法的優(yōu)點(diǎn)是所需資料不多,可用自身變數(shù)數(shù)列來進(jìn)行預(yù)測(cè)。但是這種方法受到一定的限制:如果自相關(guān)系數(shù)(R)小于0.5,預(yù)測(cè)結(jié)果偏離較大,不適用此類模型。
(2)MA(移動(dòng)平均模型):如果一個(gè)單變量時(shí)序數(shù)據(jù){yt;t=1,2,...},滿足如下關(guān)系,則定義為MA 函數(shù)
(3)ARIMA(p,d,q)差分自回歸移動(dòng)平均模型。AR 的含義為 自回歸 ,p 參數(shù)表示自回歸項(xiàng)數(shù);I 表示差分的含義,d 為差分次數(shù)(階數(shù));MA 為 滑動(dòng)平均 ,q 為滑動(dòng)平均項(xiàng)數(shù)。
其中,L 是滯后算子(Lag operator)。
本次使用ARIMA 模型對(duì)客流量進(jìn)行預(yù)測(cè)。一般情況下,城市軌道交通的客流量數(shù)據(jù){at}是非平穩(wěn)的,需要進(jìn)行差分轉(zhuǎn)化。
將記為差分算子,那么,有:
statsmodels 庫(kù)提供適合ARIMA 模型的功能。可以使用statsmodels 庫(kù)創(chuàng)建ARIMA 模型,如下所示:
通過調(diào)用ARIMA()并傳入p,d 和q 參數(shù)來定義模型。通過調(diào)用fit()函數(shù)在訓(xùn)練數(shù)據(jù)上準(zhǔn)備模型??梢酝ㄟ^調(diào)用predict()函數(shù)并指定要預(yù)測(cè)的時(shí)間或索引的時(shí)間索引來進(jìn)行預(yù)測(cè)。我們將ARIMA 模型與整個(gè)Shampoo Sales 數(shù)據(jù)集相匹配,并檢查殘差。
我們可以使用ARIMAResults 對(duì)象上的predict()函數(shù)進(jìn)行預(yù)測(cè)。如果我們?cè)谟?xùn)練數(shù)據(jù)集中使用前150 個(gè)觀測(cè)值來擬合模型,那么,用于進(jìn)行預(yù)測(cè)的下一個(gè)時(shí)間步驟的索引將被指定給預(yù)測(cè)函數(shù),如start=1,end=150。這將返回一個(gè)包含預(yù)測(cè)的一個(gè)元素的數(shù)組。如果我們執(zhí)行任何差分(在配置模型時(shí)d>0),我們也希望預(yù)測(cè)值在原始比例中。這可以通過將typ 參數(shù)設(shè)置為’levels’值來指定:typ=’levels’。我們可以將訓(xùn)練數(shù)據(jù)集拆分為訓(xùn)練集和測(cè)試集,使用訓(xùn)練集來擬合模型,并為測(cè)試集上的每個(gè)元素生成預(yù)測(cè)??紤]到差異的先前時(shí)間步長(zhǎng)和AR 模型的觀察依賴性,需要滾動(dòng)預(yù)測(cè)。執(zhí)行此滾動(dòng)預(yù)測(cè)的一種粗略方法是在收到每個(gè)新觀察后重新創(chuàng)建ARIMA 模型。
最終的預(yù)測(cè)結(jié)果如圖2。
圖2