任望 劉文斌
摘? 要:隨著大數(shù)據(jù)、云計(jì)算的不斷進(jìn)步以及中國公共交通的逐步發(fā)展,大眾迫切需要智能公共交通。通過分析和研究大量的公共交通數(shù)據(jù),在數(shù)據(jù)中挖掘重要信息可以幫助交通管理部門及時(shí)調(diào)整工作,并幫助乘客選擇正確的旅行時(shí)間和路線。在促進(jìn)智慧城市的發(fā)展和建設(shè)中發(fā)揮著重要作用。當(dāng)前在交通運(yùn)輸部門對數(shù)據(jù)挖掘的研究主要集中在傳統(tǒng)技術(shù)的應(yīng)用上,缺乏提高數(shù)據(jù)挖掘效率的研究。本文基于軌道交通客流的特征,提出了針對軌道交通站點(diǎn)的數(shù)據(jù)研究框架,并建立了預(yù)測基本數(shù)據(jù)的一般過程,創(chuàng)建軌道交通旅客運(yùn)輸流量直接預(yù)測模型。
關(guān)鍵詞:大數(shù)據(jù);軌道交通;客流預(yù)測;預(yù)測模型
中圖分類號:TP39? 文獻(xiàn)標(biāo)識碼:A ? ?文章編號:1671-2064(2020)03-0000-00
在互聯(lián)網(wǎng)+城市軌道交通蓬勃發(fā)展的背景下,城市軌道交通進(jìn)入了智能時(shí)代。得益于智能售票系統(tǒng),自動軌道車輛控制系統(tǒng)和基于智能的視頻收集系統(tǒng)的進(jìn)一步發(fā)展,軌道交通信息可以得到更準(zhǔn)確,更全面的記錄。軌道交通數(shù)據(jù)已成為有效城市軌道交通運(yùn)營狀況和特征的重要資源,是軌道交通管理部門決策的關(guān)鍵依據(jù)。尤其是對客運(yùn)量的短期預(yù)測對軌道交通的合理發(fā)展和動態(tài)監(jiān)測具有重要意義,這是協(xié)調(diào)管理軌道交通運(yùn)輸能力的重要基準(zhǔn)。對客流的準(zhǔn)確預(yù)測可以有效減少并避免由于短時(shí)間內(nèi)客流增加而導(dǎo)致的車站事故。本文根據(jù)城市軌道交通站點(diǎn)客流特征對車站的類型進(jìn)行了分類。在此基礎(chǔ)上提出了針對軌道交通站點(diǎn)的數(shù)據(jù)研究框架,并建立了預(yù)測基本數(shù)據(jù)的一般過程,創(chuàng)建軌道交通旅客運(yùn)輸流量直接預(yù)測模型,旨在有效應(yīng)對軌道交通站點(diǎn)客運(yùn)量變化并避免突發(fā)性安全事件[1]。
1軌道交通站點(diǎn)客流數(shù)據(jù)研究思路
這項(xiàng)研究包括兩部分?jǐn)?shù)據(jù)需求:(1)統(tǒng)計(jì)數(shù)據(jù):對軌道交通站點(diǎn)交通卡刷卡數(shù)據(jù)進(jìn)行統(tǒng)計(jì)生成的數(shù)據(jù),用于收集站點(diǎn)現(xiàn)有客流的統(tǒng)計(jì)信息,以獲取預(yù)測站點(diǎn)客運(yùn)量模型中的基本數(shù)據(jù)。(2)收集性數(shù)據(jù):針對土地利用,運(yùn)輸路線、換乘著三個(gè)方面使用開放數(shù)據(jù)源獲取重要的數(shù)據(jù)屬性,以確保軌道站流量預(yù)測模型中的基本數(shù)據(jù)來源。將統(tǒng)計(jì)數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫進(jìn)行數(shù)據(jù)預(yù)處理,并根據(jù)時(shí)間序列的生成進(jìn)行統(tǒng)計(jì)分析。根據(jù)選擇軌道站的客流的時(shí)間特性分析客流畫像。基于對客流特征指標(biāo)的鑒別分析對站點(diǎn)類型進(jìn)行逐級識別,將所獲得的站點(diǎn)客流指標(biāo)引入訓(xùn)練集中,以進(jìn)行后續(xù)軌道站的客流數(shù)據(jù)回歸分析以及客流預(yù)測模型。為了收集和處理收集的數(shù)據(jù),根據(jù)數(shù)據(jù)的維度特性和研究需求選擇關(guān)鍵指標(biāo),并使用數(shù)據(jù)爬取技術(shù)獲得關(guān)鍵指標(biāo),進(jìn)行預(yù)處理。將用于回歸分析訓(xùn)練的關(guān)鍵指標(biāo)放置在回歸分析訓(xùn)練集中,并將客流預(yù)測關(guān)鍵指標(biāo)輸入回歸分析預(yù)測集中以收集和處理收集的數(shù)據(jù)。
2 基于大數(shù)據(jù)的軌道交通站點(diǎn)客流預(yù)測模型
傳統(tǒng)上,軌道交通站點(diǎn)客流預(yù)測通常從城市軌道交通線網(wǎng)出發(fā),在客流初始預(yù)測中應(yīng)采用“四步法”。但“四步法”需要大量的人力物力進(jìn)行研究和基礎(chǔ)數(shù)據(jù)的收集,從初步調(diào)查到預(yù)測客運(yùn)量的結(jié)果需要相當(dāng)長的時(shí)間、經(jīng)濟(jì)和時(shí)間成本較高。而且客運(yùn)量預(yù)測主要用于軌道交通站點(diǎn)的初步評價(jià)和管理。對于部分開通的線路,無法預(yù)測新線開通后全網(wǎng)客運(yùn)量的變化。本文以軌道交通站點(diǎn)(至少一年)為研究對象,從數(shù)據(jù)挖掘的角度出發(fā),針對投資新建線路(車站)后的整個(gè)線路網(wǎng)的直接客流預(yù)測模型進(jìn)行研究。
由于客流進(jìn)出站位置和時(shí)間涉及不同部門之間的利益,因此可以準(zhǔn)確、詳細(xì)地統(tǒng)計(jì)運(yùn)輸中的客流數(shù)據(jù)。網(wǎng)絡(luò)信息平臺、數(shù)據(jù)爬取技術(shù)的發(fā)展提供了大量開放數(shù)據(jù),此外,由于需要對客流進(jìn)行及時(shí)、快速的預(yù)測,通過數(shù)據(jù)挖掘建立了中尺度的客流預(yù)測模型,成為交通運(yùn)輸業(yè)客運(yùn)量預(yù)測發(fā)展的新方向。
在軌道交通運(yùn)輸方面,新線路的開通運(yùn)營對整個(gè)站點(diǎn)客流的影響包括以下兩個(gè)方面:
(1)新開通的線路站增加客流量:新開通的線路站增加了客流,站點(diǎn)服務(wù)覆蓋范圍也會增加,總客流也就不可避免地增加了。由于軌道交通的出現(xiàn),新車站附近的人將從原來的交通方式轉(zhuǎn)移到軌道交通。同時(shí),新車站周圍的公共服務(wù)也將吸引線網(wǎng)上的其他乘客。
(2)來自原有車站的客流:新車站連接到現(xiàn)有的交通網(wǎng)絡(luò),因此使用原有線路完成旅行的人將擁有更多不同的旅行線路選擇。由于新開放的車站周圍的公共服務(wù)具有吸引力,一些人可能會放棄原來的旅行目的地車站,而轉(zhuǎn)而使用新的車站來實(shí)現(xiàn)旅行的目的。例如,新車站開放后,車站建造了一個(gè)更大,更完善的商業(yè)購物中心,人們就會選擇新站點(diǎn)完成購物過程,導(dǎo)致原有車站客流轉(zhuǎn)移。此外,車站數(shù)量的增加會在多個(gè)車站的影響下導(dǎo)致客流腹地的增加,交通換乘條件對人們的出行選擇產(chǎn)生更大的影響。
在這種情況下,本文將軌道站點(diǎn)作為研究對象,從軌道交通客流圖和軌道交通站點(diǎn)的特征中收集數(shù)據(jù),并重點(diǎn)解決在新增軌道交通線路的背景下預(yù)測整個(gè)軌道站客流的問題,包括:預(yù)測車站總客流;預(yù)測車站客流波動[2]。
3 基于大數(shù)據(jù)的軌道交通站點(diǎn)客流預(yù)測模型構(gòu)建思路
從模型基本假設(shè)出發(fā),考慮到本文的模型以回歸分析為基本分析方法,因此在構(gòu)建模型前應(yīng)對模型自變量與應(yīng)變量進(jìn)行相關(guān)性分析,對相關(guān)性過低的自變量進(jìn)行調(diào)整或去除,以保障模型的有效性。在這一前提下,考慮從數(shù)量角度(站點(diǎn)客流總量)與形態(tài)特征角度(站點(diǎn)客流波動指標(biāo))兩方面進(jìn)行站點(diǎn)客流的模型構(gòu)建。
3.1客運(yùn)總量預(yù)測模型
可以通過以下兩種方法來分析軌道站客運(yùn)流量的變化:
(1)客運(yùn)總量的變化趨勢:多項(xiàng)研究表明,考慮到軌道交通運(yùn)輸?shù)慕ㄔO(shè)和城市的經(jīng)濟(jì)發(fā)展,隨著時(shí)間的推移,軌道交通的總體客運(yùn)量呈現(xiàn)一定的上升趨勢。對于這種隨著城市發(fā)展而進(jìn)行的總量增長的預(yù)測,確定增長率是最常用的預(yù)測方法之一。本文涉及的增長率方法,構(gòu)建了以時(shí)間和季節(jié)作為表征總體客流趨勢的自變量的線性回歸模型。同時(shí),季節(jié)因素也對車站客流產(chǎn)生重大影響,部分軌道交通車站的季節(jié)變化明顯,為減少季節(jié)因素對車站客流預(yù)測的干擾,本文采用月度數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集。即預(yù)測目標(biāo)月份的客流數(shù)據(jù),基于與每月數(shù)據(jù)相對應(yīng)的訓(xùn)練數(shù)據(jù)來校準(zhǔn)模型參數(shù)。
(2)客流分布變化:即由于土地使用的改善,交通條件的變化以及通用線路網(wǎng)絡(luò)中車站拓?fù)錀l件的調(diào)整,車站客流量發(fā)生了一些變化,即客運(yùn)流量在站點(diǎn)上的分布發(fā)生了變化。為了描述這種變化,本文構(gòu)建了相應(yīng)的線性回歸模型,以實(shí)現(xiàn)每個(gè)站點(diǎn)總客流量的預(yù)測。最后,為了全面考慮這兩種趨勢,本文使用模型的組合來完成最終模型的構(gòu)建,以預(yù)測站點(diǎn)客流。
3.2車站客流波動特征預(yù)測模型
通常通過對現(xiàn)有客運(yùn)量的統(tǒng)計(jì)分析來獲得站點(diǎn)客流波動的特征,如果使用線性回歸假設(shè)來構(gòu)建模型,則該模型通常無效,并且預(yù)測效果不佳。因此,在這項(xiàng)工作中,非線性回歸被用作預(yù)測車站客流波動特征的主要方式,進(jìn)而建立相應(yīng)的模型。
本文中軌道站客流直接預(yù)測模型的構(gòu)建可以分為三個(gè)部分:
(1)建立基本的回歸模型:在回歸假設(shè)的基礎(chǔ)上,建立現(xiàn)場總客流量的線性回歸模型和現(xiàn)場波動特征的非線性回歸模型;
(2)客流增長率模型構(gòu)建:建立現(xiàn)場客流增長率模型;
(3)模型的最終構(gòu)建:通過將基本回歸模型和客流增長率模型相結(jié)合,構(gòu)建總客流模型和站點(diǎn)波動特征模型。
4基于大數(shù)據(jù)的軌道站客流預(yù)測模型的構(gòu)建
4.1直接預(yù)測車站總客運(yùn)量的模型
針對軌道交通中的客流,考慮到車站的多維變化,季節(jié)性差異,車站總客流主要取決于兩個(gè)方面:
(1) 場地周圍多維因素的變化。本文假定大多數(shù)多維因素服從線性相關(guān),并且不存在多重共線性問題[3]。根據(jù)相關(guān)性分析,由于與限制相對應(yīng)的每個(gè)自變量與因變量都具有線性相關(guān)性,因此考慮到未知因素對“總客流量”的其他影響,由于存在回歸系數(shù)實(shí)現(xiàn)第j個(gè)自變量和因變量之間的擬合,通過截距使該模型的配置與實(shí)際邏輯條件一致,可得用于確定站點(diǎn)總客流量的主要模型如下:
由于各城市居民出行特征的差異以及城市規(guī)劃和建設(shè)的差異,一些自變量會偏離線性相關(guān)或具有多重共線性,導(dǎo)致此類自變量的回歸系數(shù)為零。
(2)軌道站客流總趨勢的變化,城市人口的增長導(dǎo)致鐵路客運(yùn)量的增加表明客運(yùn)總趨勢可以用增長率法來表征,并使用年均GDP增長率作為增長因子,同時(shí)設(shè)置適當(dāng)?shù)男U齾?shù)以提高模型的準(zhǔn)確性。因此,總旅客流量的預(yù)測模型如下:
4.2 客流總量預(yù)測效果評價(jià)
對于廣州地鐵5、13號線的61個(gè)車站,由于使用不同的tr值,將車站的總客運(yùn)量預(yù)測值與實(shí)際值誤差考慮在內(nèi),邊際誤差值為20%時(shí)該模型的預(yù)測效果最佳,對車站的總客流預(yù)測更為合理;由于預(yù)測值與計(jì)算值之間存在顯著相關(guān)性(相關(guān)系數(shù)0.829),可以假設(shè)在基于計(jì)算值進(jìn)行模型評估的條件下,大多數(shù)軌道站的總客流預(yù)測是比較理想的。
5結(jié)語
綜上所述,本文結(jié)合大數(shù)據(jù)背景下的數(shù)據(jù)分析和研究方法,對軌道車站客流進(jìn)行了研究,基于車站總客流和車站客流波動性質(zhì)兩個(gè)方面,在多元線性回歸分析的基礎(chǔ)上進(jìn)行了直接預(yù)測建模。以廣州軌道交通為模型進(jìn)行分析和預(yù)測的主要對象,基于該預(yù)測模型的適用性,采用多元線性回歸模型對車站客流波動的性質(zhì)進(jìn)行了預(yù)測,效果比較理想。
參考文獻(xiàn)
[1]謝英豪,江志彬,徐瑞華.城市軌道交通斷面客流數(shù)據(jù)可視化分析及優(yōu)化[J].城市軌道交通研究,2017(1):78-83
[2]王嘯君.基于大數(shù)據(jù)分析的客流走廊判別方法研究[J].城市道橋與防洪,2018(1):134-136.
[3]李偉,周峰,朱煒.軌道交通網(wǎng)絡(luò)客流大數(shù)據(jù)可視化研究[J].中國鐵路,2015(2):106-110.
收稿日期:2020-01-11
作者簡介:任望(1985—),男,山西忻州人,本科,工程師,研究方向:軌道交通運(yùn)輸行車組織。