黃天印 徐文潔 陸林華 趙時旻
(1.上海申通地鐵集團有限公司,201103,上海; 2.上海久譽軟件系統(tǒng)有限公司,200233,上?!蔚谝蛔髡?高級工程師)
?
基于移動實時位置信令數(shù)據(jù)的軌道交通換乘行為分析
黃天印1徐文潔1陸林華2趙時旻1
(1.上海申通地鐵集團有限公司,201103,上海; 2.上海久譽軟件系統(tǒng)有限公司,200233,上海∥第一作者,高級工程師)
介紹了上海軌道交通清分規(guī)則。在現(xiàn)有上海軌道交通K條最短路徑的清分算法基礎上,融合移動實時位置信令(OIDD)數(shù)據(jù),對換乘行為中的主要換乘路徑選擇比例進行精細化設置,并對次要換乘路徑的換乘比例算法作出補充。通過對乘客行為的分析和應用,實現(xiàn)了對現(xiàn)有上海軌道交通清分規(guī)則中換乘路徑比例的精細化計算。
軌道交通; 移動實時位置信令數(shù)據(jù);K條最短路徑; 清分算法
First-author′s address Shanghai Shentong Metro Group Co., Ltd.,201103,Shanghai,China
2016年,上海城市軌道交通路網(wǎng)總長度達617 km,包括14條線路和366座車站。其中,換乘車站有51座。隨著上海城市軌道交通出行路線選擇的多樣化,客流出行模式從先前的同線出行或一次換乘出行轉變?yōu)橥€出行、一次換乘為主、多次換乘為輔的混合模式。這種模式的轉變使軌道交通運營方對軌道交通換乘客流及票價清分的精細程度提出了更高要求。
上海軌道交通票務的清分模型主要依據(jù)基礎數(shù)據(jù)建立、路網(wǎng)路徑選擇和路徑比例分配等3部分內(nèi)容?;A數(shù)據(jù)主要包括線路與車站名、站間距、區(qū)域表、換乘站設定、換乘步行時間、列車平均行駛速度、收益方及比例、擁擠系數(shù)等[1]。路網(wǎng)路徑選擇采用基于Dijkstra算法的K條最短路徑法(KSP)。首先,通過Dijkstra算法計算K條路徑;然后,結合“換乘權”優(yōu)化處理,剔除大于最小路徑(計算權)1.5倍的路徑,從而得到每對OD記錄(起終點間的出行量)最多K條路徑(包含換乘次數(shù)、總權重、實權、虛權、計算權)。通過使用“正態(tài)分布方式”可得到各路徑比例[2-3]。
現(xiàn)有的上海軌道交通的清分模型是基于經(jīng)驗權重值計算的概率分布模型,其在換乘路徑比例(即選擇某換乘路徑的客流量占總換乘客流量的比例)的精細化程度上有進一步提升的空間。
本文所使用的數(shù)據(jù)資源覆蓋時間范圍從2015年4月1日至2015年4月30日,包括近27萬條電信OIDD (移動實時位置信令)數(shù)據(jù),近4億條檢售票系統(tǒng)交易數(shù)據(jù),以及近340萬條ATS (列車自動監(jiān)視)系統(tǒng)數(shù)據(jù)及軌道交通運營計劃圖數(shù)據(jù)。
理解乘客出行的路徑選擇行為是一個重要的研究方向[5-8],其研究成果可應用于許多場景。
交通領域中很早就有人對這一問題進行了研究。典型的研究模型為UE (單位經(jīng)濟)模型[9]和MPS (物質產(chǎn)品平衡表體系)模型[10]。然而,許多已有工作多是基于經(jīng)驗的模型假設,缺乏數(shù)據(jù)支持[11-12]。隨著智能交通卡廣泛使用而生成的大量數(shù)據(jù)有助于進一步解決這一問題。在城市軌道交通中,智能交通卡數(shù)據(jù)不同于GPS (全球定位系統(tǒng)),某個OD (起訖)對間的乘客換乘選擇是沒有被記錄的,所以不能直接從數(shù)據(jù)中得到的結果。
文獻[13]利用經(jīng)驗模型作為先驗知識,提出了一種基于貝葉斯推理的框架來解決路徑選擇這一問題。文獻[14]利用遺傳算法對路徑選擇問題進行了優(yōu)化處理。這類方法結合了歷史數(shù)據(jù),其模型精度較基于經(jīng)驗的模型有較大提升。但是,不可避免的,這些方法均以經(jīng)驗模型作為先驗知識,故在一定程度上仍會受到經(jīng)驗的影響。
文獻[15]在預先知道特定OD對候選路徑的情況下,通過K-means聚類方法,統(tǒng)計不同路徑上的乘客數(shù)量,從而得到乘客路徑選擇的結果。文獻[16]將乘客的刷卡數(shù)據(jù)與城市軌道交通的營運時刻表相結合,從而識別乘客的換乘行為。這類方法避免了先驗知識的影響,但處理數(shù)據(jù)稀疏的OD對時,其模型的準確度會受到影響。
大量的OIDD數(shù)據(jù)可為城市軌道交通乘客匹配精確的位置信息,為實現(xiàn)乘客換乘行為的識別提供了支持。
3.1 OIDD數(shù)據(jù)
OIDD數(shù)據(jù)涵蓋了用戶手機聯(lián)絡基站的時間、基站號、聯(lián)扇區(qū)號、開關機信息等。在有通信行為時,手機還可通過心跳方式定期與基站聯(lián)絡,產(chǎn)生OIDD數(shù)據(jù)。也就是說,即使用戶沒有任何通信行為,只要開機,就可定期獲得用戶的大致位置。
使用OIDD數(shù)據(jù),可在一定的時間周期內(nèi)估測任意區(qū)域內(nèi)的人數(shù),可估測任意區(qū)域或路線上的人流車流,可用于分析大型活動期間人流的來源、去向及公交換乘鏈等信息,可根據(jù)電話歸屬地和用戶注冊信息來分辨本地用戶或外地游客。
3.2 OIDD數(shù)據(jù)的設備定位方法
目前,根據(jù)OIDD數(shù)據(jù)進行設備定位主要采用COO(cell of origin)方法,即通過單個基站ID(cell ID)定位。該方法計算簡單,速度極快。但定位精度與基站的覆蓋半徑R有關(如圖1所示)。監(jiān)測區(qū)域內(nèi)基站分為宏站、街道站和微站。利用COO方法進行定位時,如數(shù)據(jù)來自宏站,則誤差相對較大;如來自街道站和微站,則精度相對較高。
通過優(yōu)化COO方法可進一步提高了OIDD數(shù)據(jù)定位精度。優(yōu)化方法主要利用了信號跳變,并基于以下三個假設條件:①信號跳變由目標的移動引起,而非干擾;②任何基站的覆蓋范圍及信號發(fā)射強度相同,且不受建筑物和天氣因素的影響;③周邊建筑物、電網(wǎng)及電力電子設備等對電磁波無干擾。
優(yōu)化后,OIDD定位時,設某人的周圍有k個基站,且基站的坐標集為 {P1(x1,y1),P2(x2,y2),…,Pk(xk,yk)}。其中,Pi代表第i個基站,(xi,yi)表示第i個基站的經(jīng)緯度坐標。在某一段時間內(nèi),此人的手機信號在這k個基站間來回跳變。由優(yōu)化方法的假設可得,當信號在2個基站間跳變時,人所在位置在平面上的分布必為對稱分布,且位置的期望必為兩基站連線的中心,從而實現(xiàn)定位(如圖2所示)。
圖1 COO定位方法
圖2 當信號在2個基站間跳變時的定位
3.3 基于OIDD的乘客OD數(shù)據(jù)統(tǒng)計
在OIDD數(shù)據(jù)基礎上,可進一步分析統(tǒng)計乘客換乘出行OD數(shù)據(jù)。具體的計算方法及步驟如下。
步驟1:從OIDD數(shù)據(jù)中抽取在城市軌道交通起始車站及其周圍出現(xiàn)的數(shù)據(jù)集{O1,O2,…,Oi}。
步驟2:按步驟1的方法抽取在目的地車站及其周圍出現(xiàn)的數(shù)據(jù)集{D1,D2,…,Di}。
步驟3:找出步驟1和步驟2所得數(shù)據(jù)的交集σ={O1,O2,…,Oi}∩{D1,D2,…,Di},即可找出從起始站上車和目的地站下車的人。
步驟4:根據(jù)步驟3的數(shù)據(jù)交集σ,分析出現(xiàn)在目的車站及其周圍的時間和出現(xiàn)在起始車站及其周圍的時間,并抽取時間間隔在15~90 min范圍內(nèi)的數(shù)據(jù)集R={σt1,σt2,…,σti},15 min≤ti≤90 min;
步驟5:將一天按5 min刻度劃分為288個等級,將滿足步驟4的數(shù)據(jù)集分別劃分到這288個等級中,并統(tǒng)計各個等級中不同的數(shù)據(jù)集量值。最終即可得到基于OIDD數(shù)據(jù)的分時段OD客流。
其中,步驟3起始站上車和目的站下車的判斷規(guī)則為:如該人從起始車站及其周圍出現(xiàn)前60 min內(nèi)沒有出現(xiàn)在其他車站,則視為該人為從起始車站上車;當該人從目的車站及周圍出現(xiàn)后的60 min內(nèi)沒有出現(xiàn)在其他車站,則視為該人為從目的車站下車。
3.4 OD數(shù)據(jù)的匹配處理
不同年齡的人具有不一樣的移動終端設備使用習慣。小孩、老人與青年人相比較差異性很大。此外,人們使用手機的行為或習慣也不一致。有些人手機常關機或手機通話較少。而且手機數(shù)據(jù)采集技術本身也會漏抓部分數(shù)據(jù)。因此基于手機數(shù)據(jù)的出行行為分析針對的人群并不能表示總體人群。因此,需要將抽樣數(shù)據(jù)擴樣至總體人群的出行數(shù)據(jù),進而反映總體人群的出行特征與出行規(guī)律[4]。
以上海軌道交通九亭站至人民廣場站(以下簡為“九亭—人民廣場”)的路徑為例分析,將在該路徑上涉及的相關換乘車站電信基站作為采樣基站。則詳細統(tǒng)計結果如表1所示。
表1 九亭—人民廣場路徑基站數(shù)量統(tǒng)計
以2015年4月期間九亭—人民廣場的OIDD數(shù)據(jù)作為擴樣樣本數(shù)據(jù)。首先,根據(jù)城市軌道交通的運營時間,將OIDD數(shù)據(jù)整理出OD數(shù)據(jù);然后,將得到的結果與九亭—人民廣場的售檢票系統(tǒng)OD數(shù)據(jù)進行對比。對比結果如圖3所示。
售檢票系統(tǒng)數(shù)據(jù)處理采用多層擴樣模型。以軌道交通售檢票系統(tǒng)數(shù)據(jù)作為基準數(shù)據(jù),先以單日樣本進行擴樣計算,再通過時間序列平滑法得到月平均擴樣值。
時間序列是數(shù)理統(tǒng)計的重要分支,在經(jīng)濟發(fā)展和工業(yè)建設方面有著重要應用。時間序列是指在研究過程中,在一系列時刻(t1,t2,…,tn)對某1個或1組變量進行測量,得到的測量值序列。
圖3 2015年九亭—人民廣場基于售檢票系統(tǒng)OD數(shù)據(jù)與基于OIDD的OD數(shù)據(jù)對比
時間序列平滑法是指用平均的方法,把時間序列中的隨機波動剔除掉,使序列變得比較平滑,以反映出其基本軌跡,并結合一定的模型得到目標計算值。時間序列平滑法所用平均數(shù)可以是簡單平均數(shù),也可以是加權平均數(shù)。在第一次平均計算之后,就局部而言,還可進行第二次、第三次以至更多次的平均計算,以實現(xiàn)多層次的平滑。時間序列平滑法計算如式(1)所示。
F(T+1)=(1/N)×∑X(I)
(1)
式中:
X(I)——時間序列的第I期實際值;
F(T+1)——目標計算值;
T——當前時刻;
T+1——目標時刻;
N——平均個數(shù)。
通過對擴樣值的平滑平均計算,即可得到合適的擴樣比例。以2015年4月期間九亭—人民廣場的OD數(shù)據(jù)為例分析,得到擴樣值序列如表2所示。根據(jù)表2及式(1)可得,平均擴樣比例為1∶6.95。
3.5 融合OIDD數(shù)據(jù)后的換乘路徑比例
以九亭—人民廣場路徑為例,根據(jù)K條最短路徑法計算可得,到九亭—人民廣場可選擇的換乘路徑為9號線換乘1號線(徐家匯站換乘),9號線換乘8號線(陸家浜路站換乘),9號線換乘7號線(肇嘉浜路站換乘)再換乘2號線(靜安寺站換乘),9號線換乘3/4號線(宜山路站)再換乘2號線(中山公園站換乘)。
對九亭—人民廣場的IODD數(shù)據(jù)進行采集分析,得到不同的換乘路徑比例(見圖4)。
表2 基于售檢票系統(tǒng)的數(shù)據(jù)OD和基于OIDD的OD數(shù)據(jù)擴樣值及擴樣比
圖4 2015年4月九亭—人民廣場換乘路徑比例
分別通過現(xiàn)有上海軌道交通清分算法,以及IODD數(shù)據(jù)權重分析后的清分模型,可計算得到九亭—人民廣場的換乘路徑比例(如表3所示)。
表3 通過不同計算依據(jù)得到的換乘路徑比例
由表3可見,按現(xiàn)有清分規(guī)則,選擇在陸家浜路站換乘8號線及在徐家匯站換乘1號線的客流量各占總客流量的50%,而選擇在肇嘉浜路站換乘7號線和在宜山路站換乘3、4號線的比例均為0。這顯然不符合實際情況。
因此,基于OIDD數(shù)據(jù)計算的結果更精細,而且在二次換乘的路徑比例設置上也有補充。
4.1 時段的劃分
由于乘客在不同的時段(如工作日、節(jié)假日,或高峰時段、其他時段等),其出行的目的和對出行的路徑選擇會有差異。因此,軌道交通線路的換乘比例也會變化。根據(jù)工作日和非工作日上海軌道交通各線路的換乘情況,工作日的乘客換乘比例通常比非工作日高出約10% (如圖5所示)。
圖5 工作日及非工作日上海軌道交通各線路換乘比例
在工作日期間,高峰時段(6:30—9:30及17:00—19:00)的出行客流量是低峰時段(除高峰時段外的其他時段)的1.6倍左右。而且,高峰時段的乘客出行目的與低峰時段不同,乘客對于換乘路徑的選擇也可能存在差異。針對這種情況,本文采用融合OIDD數(shù)據(jù)的計算方法,對工作日、非工作日,以及工作日中不同時段的換乘比例進一步研究。
以九亭—人民廣場為OD段,分別統(tǒng)計工作日及非工作日的換乘比例。
分析高低峰客流換乘情況采用的方法是將OIDD客流密度擴樣數(shù)據(jù)根據(jù)0.5 h時間維度進行細分。然后,以6:30—9:30及17:00—19:00作為高峰時段,其余時段作為低峰時段進行分析。
4.2 處理邏輯
對OIDD數(shù)據(jù)處理邏輯查詢包含3層嵌套。
(1) 第1層嵌套。對九亭—人民廣場基于OIDD的OD客流量數(shù)據(jù)表進行處理,獲取記錄中的進站代碼、日期、高低峰標志、進站時間、站點1代碼、站點1經(jīng)過時間、站點2代碼、站點2經(jīng)過時間、出站時間、客流量、換乘標志、30 min進站時間標示ID (將時間折算成以30 min為間隔的進位取整的整數(shù))等字段。
(2) 第2層嵌套將第1層嵌套查詢得到的記錄,以日期、換乘標志及時間ID為維度來統(tǒng)計符合條件記錄的客流總量。
(3) 第3層嵌套將第2層嵌套查詢到的記錄,以起始時間、結束時間、換乘標志及高低峰標志等維度來統(tǒng)計客流總量。
(4) 最外層將第3層嵌套查詢到的記錄,以換乘標志、高低峰標志、起始時間,結束時間及客流量等維度統(tǒng)計客流總量,以及不同換乘線路在高低峰時段的客流量占比情況。得到的數(shù)據(jù)結果(部分)如圖6所示。
注:TYPE_NAME表示換乘線路名稱;PEAK_NAME為高低峰標志;BEGIN_RANGE為起始時間;END_RANGE為結束時間;CUST_CNT為客流量;offpeak為低峰時段peak為高峰時段
根據(jù)圖6所示的數(shù)據(jù),計算換乘路徑比例,得到的結果如表4所示。
表4 基于OIDD數(shù)據(jù)計算得到的九亭—人民廣場高低峰時段乘客換乘路徑比例
同樣,將基于OIDD的客流密度數(shù)據(jù)按工作日及非工作日的時間維度進行劃分,并根據(jù)劃分結果計算,即可得到換乘路徑比例情況(如表5所示)。
表5 基于OIDD數(shù)據(jù)的九亭—人民廣場工作日及非工作日乘客換乘路徑比例
由表5可以看出,乘客的出行選擇會隨著時段的不同而發(fā)生變化。研究換乘路徑比例在不同時段的變化情況,對未來上海軌道交通的清分規(guī)則中換乘比例分配的精細化發(fā)展是有幫助的。
本文將OIDD實測數(shù)據(jù)融入清分算法分配的權重設置中。一方面可驗證現(xiàn)有分配比例的正確性和合理性,對現(xiàn)有的清分算法換乘路徑比例分配算法形成補充,使得現(xiàn)有清分規(guī)則無論在主要換乘路徑還是次要換乘路徑上的比例分配都能更為精細;另一方面也可對不同場景下的換乘路徑比例進行細分,為未來上海清分系統(tǒng)分時段調整換乘路徑比例提供數(shù)據(jù)參考。
未來,還將通過OIDD數(shù)據(jù)計算全路網(wǎng)的換乘比例,并結合現(xiàn)有的軌道交通刷卡的OD數(shù)據(jù)、軌道交通ATS數(shù)據(jù)(包括進站時間、出站時間、上下行方向等)、列車滿載量、車站容積率等數(shù)據(jù),相對精確地計算出城市軌道交通客流的移動情況、客流在站臺的積壓程度及列車的滿載率等數(shù)據(jù)。這些數(shù)據(jù)對于城市軌道交通運營方的客運組織、大客流應對,以及運能效率的規(guī)劃均有較大的參考價值。
[1] 殷錫金.軌道交通網(wǎng)絡客流清分規(guī)則與“鑒識車票乘車路徑”理論[J].軌道交通,2009(12):44.
[2] 韋強,謝宗毅,諸仕榮,等.基于概率模型的軌道交通清分算法[J].城市軌道交通研究,2009(12):43-46.
[3] 顧佳源.城市軌道交通清分算法的介紹與比較[C]//中國土木工程學會城市軌道交通技術推廣委員會.城市軌道交通關鍵技術論壇暨地鐵學術交流會.上海:上海申通地鐵集團有限公司,2010.
[4] 冉江宇,過秀成,何小洲.基于出行鏈的OD擴樣方法研究[J].交通運輸工程與信息學報,2010(6):37.
[5] LIU C,QU Q.Trip fare estimation study from taxi routing behaviors and localizing traces[C]//IEEE International Conference on Data Mining Workshop.Atlantic City,NJ:IEEE,2015:1109-1116.
[6] WU H,MAO J,SUN W,et al.Probabilistic robust route recovery with spatio-temporal dynamics[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco:ACM,2016:1915-1924.
[7] LI M,AHMED A,SMOMLA A J.Inferring movement trajectories from GPS snippets[C]//Eighth ACM International Conference on Web Search and Data Mining.San Francisco:ACM,2015:325-334.
[8] SU H,ZHENG K,HUANG J,et al.Calibrating trajectory data for spatio-temporal similarity analysis[J].The VLDB Journal,2015,24(1):93-116.
[9] WARDROP J G.Some theoretical aspects of road traffic research[J].OR,1952,1(3):325-362.
[10] DIAL R B.A probabilistic multipath traffic assignment model which obviates path enumeration[J].Transportation research,1971,5(2):83-111.
[11] NAKAYAMA S,KITAMURA R.Route choice model with inductive learning[J].Transportation Research Record Journal of the Transportation Research Board,2000(1725):63-70 .
[12] TALAAT H,ABDULHAI B.Modeling driver psychological deliberation during dynamic route selection processes[C]//Intelligent Transportation Systems Conference,2006.Toronto:IEEE,2006:695-700.
[13] SUN L,LU Y,JIN J G,et al.An integrated bayesian approach for passenger flow assignment in metro networks[J].Transportation Research Part C Emerging Technologies,2015,52:116-131.
[14] ZHU H W,HU H,HUANG Z.Calibrating rail transit assignment models with genetic algorithm and automated fare collection data[J].Computer-Aided Civil and Infrastructure Engineering,2014,29(7):518-530.
[15] FU X,LENG B,XIONG Z.Metro traffic route assignment using K-means clustering[C]// International Conference on Electronics,Communications and Control.Ningbo:IEEE,2011:902-905.
[16] ZHAO J,ZHANG F,TU L,et al.Estimation of passenger route choice pattern using smart card data for complex metro systems[J].IEEE Transactions on Intelligent Transportation Systems,2016,(99):1-12.
Analysis of Rail Transit Transfer Behavior Based on Real-time Location of Signaling Data
HUANG Tianyin, XU Wenjie, LU Linhua, ZHAO Shimin
The clearing rules of Shanghai rail transit is introduced.Based on Shanghai metro clearing algorithm——K shortest path,and combined with OIDD data,a better set in the main transfer path selection is made and the ratio of the secondary transfer path selection is replenished.Through analysis of passenger transfer behavior in rail transit,the fine calculation of transfer path selection ratio in Shanghai rail transit clearing rules has been achieved.
rail transit; OIDD;Kshortest path; clearing algorithm
U293.13
10.16037/j.1007-869x.2017.06.011
2016-01-01)