江春安 張 寧 邵家玉
(東南大學教育部ITS工程研究中心,210018,南京∥第一作者,碩士研究生)
城市軌道交通可以很好地解決由于城市人口急劇增長、地面空間剩余資源有限所帶來的交通擁堵問題,因此得到迅速發(fā)展[1]。我國城市軌道交通的布局亦日趨復雜,由單線路變?yōu)槎嗑€路,再由多線路連接成為復雜的網(wǎng)絡結(jié)構(gòu)。其管理也從起初的按單線路的垂直管理,到目前的多線路、區(qū)域管理。城市軌道交通票務管理,包含售檢票、結(jié)算、數(shù)據(jù)統(tǒng)計分析等,已成為各軌道運營公司的一項比較繁復的任務,而自動售票檢票(Automatic Fare Collection,簡為AFC)系統(tǒng)的投入運行,極大地減少了管理人員的重復性勞動,提高了軌道交通信息化、自動化水平,也提高了其服務水平[2]。
票卡是AFC 系統(tǒng)的核心,作為記錄乘客信息的媒介和載體,與車站現(xiàn)場設(shè)備共同完成自動售票、檢票的功能。票卡可分為回收類和非回收類票卡。目前,國內(nèi)城市軌道交通運營管理中回收類票卡所占比例仍較大,關(guān)于回收類票卡的管理,主要包括票卡采購、制作、調(diào)配、庫存管理等方面。由于回收類票卡需要在自動售票機、閘機中反復存取,在使用過程中會有損壞、遺失,使用的數(shù)量會隨著乘客數(shù)量的增加而增加,加重了配送人員的負擔,增加了企業(yè)的運營成本。如何基于現(xiàn)有回收類票卡的使用狀況,合理高效地進行回收類票卡管理已經(jīng)引起越來越多的關(guān)注[3-4]。
目前這方面的研究主要集中于票卡的票務管理流程方面,而對回收類票卡的物流,以及對AFC 系統(tǒng)所收集的數(shù)據(jù)的分析研究比較少[5],對于相關(guān)票卡使用情況大量信息的利用還很不充分,對于具體的票卡庫存管理及調(diào)配的優(yōu)化稍顯不足。由于隨時間而變的票卡使用情況信息是典型的時間序列數(shù)據(jù),本文主要根據(jù)現(xiàn)有運營模式,將整個線網(wǎng)在系統(tǒng)層面分為清分中心、線路中心、車站三個層次,以清分中心為例分析回收類票卡出入庫數(shù)量的流動性所帶來的非平衡性問題;利用“ARIMA+RBF”(“自回歸積分滑動平均+徑向基函數(shù)”)組合模型,對回收類與非回收類票卡使用比例趨勢、未來回收類票卡使用數(shù)量和流失數(shù)量進行預測,為票卡的調(diào)配管理奠定基礎(chǔ)。
時間序列預測是根據(jù)時間序列的變化特征,提取與時間屬性有關(guān)的信息,利用歷史時序數(shù)據(jù),預測未來狀態(tài)。時間序列中最常見的非平穩(wěn)模型為ARIMA(p,d,q)模型(其中,p為自回歸階數(shù),d為差分階數(shù),q為滑動平均階數(shù))[6]。ARIMA 模型可以比較準確地確定時間序列的線性規(guī)律。
RBF神經(jīng)網(wǎng)絡是一種三層結(jié)構(gòu)的前饋網(wǎng)絡,分別為輸入層、隱含層、輸出層。利用聚類方法學習RBF神經(jīng)網(wǎng)絡,先用無監(jiān)督學習方法確定RBF 神經(jīng)網(wǎng)絡中隱節(jié)點的數(shù)據(jù)中心,并根據(jù)各數(shù)據(jù)中心之間的距離確定隱節(jié)點的擴展常數(shù),其徑向基函數(shù)采用高斯函數(shù)[7],然后用有監(jiān)督學習訓練各隱節(jié)點的輸出權(quán)值。RBF 神經(jīng)網(wǎng)絡模型可以用于挖掘時間序列的非線性特征。
由于ARIMA 模型只是提取時間序列的線性規(guī)律,然而現(xiàn)實中絕大多數(shù)時間序列均含有非線性特征,單純應用ARIMA 模型進行預測會因忽略掉非線性特征而產(chǎn)生較大的誤差,故利用RBF對誤差中的非線性特征進行挖掘提取。本文首先利用ARIMA 模型對回收類與非回收類票卡的使用比例趨勢、回收類票卡的使用數(shù)量和遺失數(shù)量進行多步預測,并與實際數(shù)據(jù)進行比較,然后再利用RBF 對ARIMA所預測的誤差進行挖掘,整合得出比較準確的預測值?!癆RIMA+RBF”組合模型預測原理如圖1所示。
圖1 “ARIMA+RBF”組合模型預測原理圖
筆者從某城市軌道交通清分中心獲取了近3年的自動售票機、半自動售票機、閘機所記錄的票卡數(shù)據(jù),歸納整理得到每日回收類與非回收類票卡的比例、回收類票卡的使用數(shù)量、回收類票卡的流失數(shù)量,以及每日每車站回收類票卡進、出庫數(shù)量。將3年中的節(jié)假日(中國法定假日,以及西方的情人節(jié)、圣誕節(jié),不含平常周六、周日)數(shù)據(jù)剔除,得到日?;厥疹惼笨〝?shù)據(jù);再將這些數(shù)據(jù)以7天為1個周期進行整合,共得到120個樣本,每個樣本包括1周的數(shù)據(jù)量。由于本文所作的預測主要為清分中心服務,故選擇7天為一周期進行建模分析,至于特殊節(jié)假日票卡的預測,則需另外建模分析。
回收類與非回收類票卡的比例,回收類票卡的使用量,以及回收類票卡的流失量統(tǒng)計如圖2所示。其中,出于部分數(shù)據(jù)的敏感性及建模要求,將票卡使用數(shù)量和流失數(shù)量的數(shù)據(jù)進行了歸一化處理,即票卡使用(流失)量=(每周票卡使用或流失數(shù)量-最小樣本值)/(最大樣本值-最小樣本值)。
圖2 票卡原始數(shù)據(jù)統(tǒng)計圖(已作歸一化處理)
如圖2 a)所示,隨著城市軌道交通的發(fā)展,其乘客群日益穩(wěn)定,回收類與非回收類票卡的使用比例由開通時的1.2∶1,下降到0.7∶1,并一直降到0.5∶1左右,整體呈下降趨勢。在城市軌道交通運行之初,回收類票卡與非回收類票卡的使用比例較大有多方面原因,比如:乘客的固有出行習慣;不熟悉地鐵的運營方式;亦或該AFC 系統(tǒng)尚不能完全兼容該城市的公交一卡通,導致部分乘客因需辦理新卡而放棄使用非回收類票卡等。但隨著時間的推移,非回收類票卡的便捷性和經(jīng)濟性會使回收類票卡所占比例總體呈逐漸下降趨勢,并在整個運營系統(tǒng)穩(wěn)定后,保持平穩(wěn)。
如圖2 b)所示,雖然回收類票卡的使用比例總體呈下降趨勢,但隨著城市軌道交通線路的擴張,對城市交通的覆蓋面增大,將使乘客數(shù)量增加,回收類票卡的使用量總體呈現(xiàn)增長趨勢。準確預測每周回收類票卡的使用數(shù)量,并進行調(diào)配,能夠確保整個運營線路不會出現(xiàn)票卡短缺的情況,有助于提高運營公司的服務水平。
因乘客保管不當,或乘客在自動售票機購買了票卡后并未使用(如由于票卡圖案新穎,被收藏紀念等)或乘客超程后非正常出站,或極少部分乘客惡意地帶走票卡,以及利用檢票設(shè)備漏洞而尾隨出站等,都會造成回收類票卡的流失,導致運營成本的增加。回收類票卡的流失是城市軌道交通運營過程中不可避免的現(xiàn)象,票卡的流失不僅浪費乘客的時間、金錢,亦為運營公司帶來經(jīng)濟負擔。由統(tǒng)計分析還可知,雖然城市軌道交通的票卡管理日趨成熟,流失數(shù)量應該有所下降,但隨著回收類票卡使用數(shù)量的增長,總體上仍然呈增長趨勢。
回收類票卡使用數(shù)量在線路開通初期處于不穩(wěn)定狀況,經(jīng)過一段時間后趨于穩(wěn)定,故本文將此部分數(shù)據(jù)剔除;由于清分中心增加優(yōu)惠等措施,會減少回收類票卡的使用量,但該過程比較緩慢,此類樣本數(shù)據(jù)不剔除,最終得到建模所需的120 個數(shù)據(jù)樣本。利用前90個數(shù)據(jù)樣本建立ARIMA 模型,得出30個預測值;利用RBF 模型對預測出的30個值中的前25個預測數(shù)據(jù)的誤差進行訓練,預測出最后5個預測值的誤差并與相應ARIMA 原始預測值組合,最后利用120個樣本的最后5個數(shù)據(jù)進行驗證。
上述回收類與非回收類票卡使用比例、每周回收類票卡使用數(shù)量、每周回收類票卡流失數(shù)量等3個時間序列都為不穩(wěn)定時間序列,需進行差分,利用AIC(最小信息)準則,分別建立模型為ARIMA(1,1,6)、ARIMA(1,1,2)、ARIMA(2,1,2)。利用“ARIMA+RBF”組合模型進行5 步預測(即每步預測1個值,共預測5個值),得到結(jié)果如圖3所示。實際值與ARIMA 模型預測值、“ARIMA+RBF”模型預測值的比較見表1。
圖3 利用“ARIMA+RBF”組合模型對回收類票卡使用的5步預測
表1 5步預測誤差比較
從表1 可以看出,“ARIMA+RBF”模型與單獨使用ARIMA 模型相比,在相對誤差這一項上,精度有了比較大的提高,使回收類票卡的預測更加符合實際應用。
通過以上分析可以得出:“ARIMA+RBF”模型預測精度要比單純ARIMA 模型高,可應用于清分中心的票卡庫存管理。本文建模所需的樣本數(shù)據(jù)應隨著時間段的不同而進行更新,使模型的參數(shù)也相應地更新,使其能夠比較精確地對各個時段進行預測。
利用上述回收類票卡使用量預測、流失票卡數(shù)量預測、損壞量預測并結(jié)合現(xiàn)有庫存量就可以得出每段時間回收票卡的計劃采購數(shù)量。假設(shè)以季為單位時間段,可得清分中心每季票卡的采購量 = 由乘客數(shù)量增長所需新增回收類票卡數(shù)量+流失回收類票卡數(shù)量 + 回收類票卡損壞數(shù)量。其中,由乘客數(shù)量增長所需新增回收類票卡數(shù)量、流失回收類票卡數(shù)量可分別通過回收類票卡每周使用數(shù)量、流失數(shù)量預測得到,回收類票卡損壞數(shù)量為實際統(tǒng)計值。由此可以比較準確地得知每季所需采購數(shù)量。
由上述分析可知,回收類票卡的使用數(shù)量是呈增長趨勢,并且有部分票卡會不斷流失或出現(xiàn)損壞,造成整個軌道線網(wǎng)的票卡數(shù)量不平衡,需要不斷地購買、制作票卡。
利用本文介紹的方法,只需選擇適當?shù)娜又芷?,就可以依次預測出每條線路中心、每個車站的出入庫流動量,為清分中心、線路中心、車站之間的回收類票卡調(diào)配提供必要的依據(jù)。
本文主要利用回收類票卡的時序數(shù)據(jù),對回收類與非回收類票卡使用比例趨勢、每周回收類票卡的使用量和流失量進行分析,并用“ARIMA+RBF”組合模型進行預測,為今后的回收類票卡的庫存、調(diào)配管理提供了理論依據(jù)。實例驗證的結(jié)果表明,本文建議的方法預測的相對誤差在3%左右,所建模型有比較好的精度和適用性,具有實際應用價值。
[1]鄧先平,陳鳳敏.我國城市軌道交通AFC 系統(tǒng)的現(xiàn)狀及發(fā)展[J].都市快軌交通,2005(3):18.
[2]張寧,高朝暉,王健.軌道交通AFC系統(tǒng)票卡管理分析[J].都市快軌交通,2008(1):24.
[3]Zhang Ning,Yang Liqiang,He Tiejun,et al.The application of distributed computing technique in rail transit automatic fare collection system[C]∥Proceedings of Distributed Computing and Applications to Business,Engineering and Science.Wuhan:Hubei Science and Technology Press,2007:121.
[4]蔡靚.成都地鐵單程票使用比例的線性回歸分析[J].現(xiàn)代城市軌道交通,2012(1):57.
[5]王雨.北京市軌道交通單程票物流方案研究[D].北京:北京交通大學交通運輸學院,2012.
[6]Ahmed M S,Cook A R.Analysis of freeway traffic timeseries data by using Box-Jenkins techniques[J].Transportation Research Record,1979(722):1
[7]吳杰,徐駿善.地鐵自動售檢票系統(tǒng)中票務處理模塊的設(shè)計[J].城市軌道交通研究,2013(11):95.