陳 君,楊東援
(1.西安建筑科技大學(xué)土木工程學(xué)院,西安710055;2.同濟(jì)大學(xué)交通運輸工程學(xué)院,上海201804)
基于APTS數(shù)據(jù)的公交卡乘客通勤OD分布估計方法
陳 君*1,楊東援2
(1.西安建筑科技大學(xué)土木工程學(xué)院,西安710055;2.同濟(jì)大學(xué)交通運輸工程學(xué)院,上海201804)
為提高通勤者使用公交出行的比例,有效緩解城市交通擁堵,對應(yīng)用智能公交系統(tǒng)數(shù)據(jù)(Advanced Public Transportation Systems,APTS)獲得公交通勤出行需求的方法進(jìn)行研究.采集APTS數(shù)據(jù),通過對公交IC卡數(shù)據(jù)和智能調(diào)度系統(tǒng)數(shù)據(jù)的關(guān)聯(lián)獲得公交乘客的上車站點信息.根據(jù)早、晚高峰的出行頻率判斷公交通勤乘客,利用通勤出行的時間和空間特征確定居住地點和工作地點.以此基本思路,提出公交卡乘客通勤OD分布估計算法,并應(yīng)用海量APTS系統(tǒng)數(shù)據(jù)對算法進(jìn)行了試驗和分析.最后,通過與基于“出行鏈”的方法進(jìn)行比較,分析了算法的精度.本文提出的方法具有精度高、可操作性強的優(yōu)點,為快速、經(jīng)濟(jì)地獲取公交通勤OD分布提供了一種新的途徑.
交通工程;公共交通;通勤出行;OD;智能公交系統(tǒng);公交IC卡
通勤交通是城市早、晚高峰客流的主要組成部分,吸引通勤者選擇公共交通出行,對于緩解城市交通擁堵具有重要作用.掌握通勤者公交出行需求的特征和規(guī)律,是優(yōu)化公交系統(tǒng)、更高水平地滿足通勤出行需求的基礎(chǔ).傳統(tǒng)的公交出行信息一般是通過大規(guī)模居民出行調(diào)查來獲得,具有費用高、數(shù)據(jù)生命周期短的不足.決策信息的匱乏和滯后造成公交線網(wǎng)規(guī)劃和公交運營計劃難以根據(jù)出行需求的動態(tài)變化來進(jìn)行及時調(diào)整.智能公交系統(tǒng)(Advanced Public Transportation Systems,APTS)除了提供公交系統(tǒng)的控制管理與交通信息服務(wù)外,還產(chǎn)生大量的系統(tǒng)運營數(shù)據(jù),挖掘這些數(shù)據(jù)隱含的信息,為建立成本低廉、動態(tài)連續(xù)的公交出行需求分析方法提供了新的契機.美國東北大學(xué)David S.Navick(2002)[1]應(yīng)用洛杉磯的公交電子售票數(shù)據(jù)分析乘客單條公交線路的站點間OD,這是國際上最早應(yīng)用公交電子售票數(shù)據(jù)進(jìn)行分析的研究之一.麻省理工學(xué)院的Alex Cui(2006)[2]根據(jù)連續(xù)兩次公交乘車的關(guān)系推算公交卡乘客的下車站點.紐約城市公交的Janine M.Farin(2008)[3]對圣保羅市交通小區(qū)間的公交卡乘客的出行OD進(jìn)行推算,并將得到的公交出行模式與居民出行調(diào)查得到的數(shù)據(jù)進(jìn)行了比較.但該研究將每一次乘車作為一次出行,沒有考慮同一次出行可能經(jīng)過兩次或多次公交的換乘來完成.目前公交乘客出行OD的推算,由最初的單條公交線路的站點間OD推算,向公交網(wǎng)絡(luò)層面研究深入.
公交通勤乘客為城市常住居民,一般使用公交卡乘車,獲得公交卡乘客的通勤OD分布,能夠?qū)煌ㄇ诔鲂行枨蟮奶卣骱鸵?guī)律進(jìn)行分析,本文對應(yīng)用APTS數(shù)據(jù)估計公交卡乘客通勤OD分布的方法展開研究.
本文采集了2008年12月南寧市57條智能公交線路的系統(tǒng)運營數(shù)據(jù),包括公交IC卡數(shù)據(jù)、公交GPS數(shù)據(jù)、公交站點坐標(biāo)數(shù)據(jù)和公交運行記錄數(shù)據(jù),公交IC卡數(shù)據(jù)來自公交自動收費系統(tǒng),其他3種數(shù)據(jù)來自公交智能調(diào)度系統(tǒng).在SQL-Server 2005數(shù)據(jù)庫導(dǎo)入原始數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理.將智能調(diào)度系統(tǒng)數(shù)據(jù)與公交IC卡數(shù)據(jù)關(guān)聯(lián)確定公交IC卡乘客的上車站點,計算過程限于篇幅不再贅述.將已知上車站點信息的公交IC卡數(shù)據(jù)作為本文的基礎(chǔ)研究數(shù)據(jù),其字段描述如表1所示.
表1 研究數(shù)據(jù)字段描述Table 1 Fields description of research data
通勤交通是城市公交服務(wù)重點保障的對象,準(zhǔn)確掌握公交乘客通勤出行的起點(Origin)和終點(Destination),即公交通勤OD,對于公交系統(tǒng)的線網(wǎng)規(guī)劃和運營管理具有重要意義.通勤交通是指家與工作地點(或者學(xué)校)之間往返的過程,通常一個工作日至少有兩次出行.采用公交出行方式的通勤交通存在這樣的規(guī)律:對于大部分公交乘客,其通勤出行的上車站點和下車站點總是相互轉(zhuǎn)換的,即回程時的上車站點就是出發(fā)時的下車站點,而出發(fā)時的上車站點又是回程時的下車站點.同濟(jì)大學(xué)的劉靚(2008)[4]利用深圳市IC卡數(shù)據(jù)研究地鐵乘客的站點間OD、站點首達(dá)時間、使用的站點頻率等出行特征,也證實了公交乘客的交通行為具有很強的時空規(guī)律性,即大部分人都是在家和工作單位兩點之間展開出行,而出行時間和地點呈現(xiàn)24小時周期性.因此,通過判別公交乘客早、晚高峰經(jīng)常性乘車的站點,可能判斷通勤乘客的居住地點和工作地點.基于公交通勤出行規(guī)律,提出本文研究的3個基本假定:
假定1工作日早、晚高峰時段經(jīng)常性乘坐公交的乘客為公交通勤乘客.
假定2公交通勤乘客早高峰時段經(jīng)常性的乘車站點為居住地點.
假定3公交通勤乘客晚高峰時段經(jīng)常性的乘車站點為工作地點.
根據(jù)以上分析和假定,本文提出方法的基本思路如下:
Step 1確定早、晚高峰時間范圍及可能的居住地和工作地點.
以每個星期5個工作日的已知上車站點的公交IC卡數(shù)據(jù)作為通勤出行OD分析的基本單元.通過對公交乘客出行時間分布的分析,確定早、晚高峰時段.將通勤乘客早高峰的首次乘車站點作為可能居住地點,晚高峰首次乘車站點作為可能工作地點(包括上學(xué)地點).每個公交卡號5個工作日的高峰時段首次乘車的總次數(shù)表示為K,K最大為10次,早高峰和晚高峰首次乘車總次數(shù)分別表示為M和N,M和N最大為5次.
Step 2通勤乘客判定.
對公交乘客5個工作日高峰時段的出行頻次進(jìn)行統(tǒng)計,大于一定出行次數(shù)的乘客判定為通勤乘客.將公交通勤乘客K、M和N所應(yīng)滿足的最小值,分別表示為Kt、Mt、Nt,這3個參數(shù)的取值越大,通勤OD判斷的準(zhǔn)確性越高.將滿足K≥Kt,M≥Mt,N≥Nt3個條件的公交卡乘客判定為通勤乘客.
Step 3通勤乘客居住地點和工作地點估計.
通勤乘客工作地與居住地之間存在多條公交線路可以乘坐的情況下,每次通勤出行乘坐的公交線路可能不同,即使每次乘坐同一條公交線路,也能選擇在工作地或居住地鄰近的不同站點乘車.因此,需要從早、晚高峰的首次乘車站點中確定出通勤出行的上車站點.本文采用乘車頻次統(tǒng)計和空間聚類2個方法,來確定通勤乘客的居住地和工作地.
(1)乘車頻次統(tǒng)計方法.
以乘客上車站點編號統(tǒng)計出5個工作日早、晚高峰首次乘車的站點中,使用頻次最高的站點,將該站點5個工作日早、晚高峰的首次乘車次數(shù)分別表示為Mmax和Nmax.當(dāng)Mmax大于早高峰首次乘車總次數(shù)M的1/2以上(即Mmax≥Int(M/2)+1),則將該站點確定為居住地站點(如M=5,Mmax≥3時).同理,當(dāng)Nmax≥Int(N/2)+1,將該站點確定為工作地站點.
(2)空間聚類方法.
對于通勤交通有不同公交站點可以選擇乘坐的情況,采用站點乘車頻次統(tǒng)計方法推算通勤OD可能會出現(xiàn)漏判.在具有公交站點坐標(biāo)數(shù)據(jù)條件下,對于站點乘車頻次統(tǒng)計方法未確定出通勤OD的通勤卡號,再應(yīng)用站點坐標(biāo)空間聚類方法對其進(jìn)行通勤OD確定.首先,計算通勤卡號早高峰(或晚高峰)首次乘車站點間的空間直線距離,將站點間距離小于設(shè)定聚類距離(取500 m)的站點劃分為1類.然后,求出站點數(shù)最多的1類,如果該類的站點數(shù)(Mmax(或Nmax))超過早高峰(或晚高峰)首次乘車的站點總數(shù)M(或N)的1/2時,計算該類站點的坐標(biāo)中心點.這個中心點坐標(biāo)被確定為居住地(或工作地)地點坐標(biāo).
Step 4每個工作日早、晚高峰公交通勤OD統(tǒng)計.
將以上得到的5個工作日的通勤乘客卡號及其居住地和工作地信息,與通勤乘客早、晚高峰的上車站點信息進(jìn)行比較,提取每個工作日的公交通勤OD.
根據(jù)以上基本思路,提出基于APTS數(shù)據(jù)的公交卡乘客通勤OD分布估計算法:
Step 0給定Kt、Mt、Nt3個參數(shù)值.
Step 1將1個星期5個工作日已知上車站點的公交卡數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中的新表CommuterOD,保留每個公交卡號早、晚高峰時段內(nèi)刷卡時間最早的一條記錄,其它記錄刪除.
Step 2刪除表CommuterOD中K<Kt、M<Mt及N<Nt的公交卡號的所有記錄.
Step 3從表CommuterOD中提取一個公交卡號的全部記錄,采用乘車頻次統(tǒng)計方法判斷.當(dāng)Mmax≥Int(M/2)+1 and Nmax≥Int(N/2)+1時,得到通勤OD,取下一個卡號進(jìn)行判斷,否則到Step 4.
Step 4采用空間聚類方法進(jìn)行判斷(以居住地站點判斷為例):
Step 4.1取出該卡號5個工作日早高峰首次乘車的所有站點,總數(shù)為M.
Step 4.2從M個站點中,取出一個站點Sj,計算其與所有站點的空間直線距離Lj,距離小于500 m的站點劃分到與Sj同一個類中.
Step 4.3計算距離Lj小于500 m的站點個數(shù)mj(包括Sj).如果mj=M,則跳到Step 5,否則到Step 4.4.(mj=M表示M個站點之間距離全部小于500 m,即mj=M=Mmax)
Step 4.4取出該卡號的下一個站點Sj+1,重復(fù)Step 4.2-Step 4.3,直到M個站點全部計算完畢.
Step 4.5求mj中的最大值Mmax,如果Mmax≥Int(M/2)+1,則計算mj最大的這一類中站點之間的坐標(biāo)中心.坐標(biāo)中心通過計算站點坐標(biāo)的均值得到,這個坐標(biāo)中心點即為居住地點.
Step 4.6如果出現(xiàn)兩個以上mj相同的站點,且同時為最大值Mmax,則再計算mj相同的分組中心點坐標(biāo)的均值,作為居住地點坐標(biāo).
Step 5重復(fù)Step 3-Step 4,直到CommuterOD表中全部卡號計算完畢.
Step 6提取每個工作日的通勤OD.
算法Step 1-Step 2、Step 6在數(shù)據(jù)庫中采用TSQL命令完成,Step 3-Step 5采用VB.NET程序?qū)崿F(xiàn).
以南寧市57條智能調(diào)度線路2008年12月1日(星期一)~12月5日(星期五)5個工作日的182 007個公交卡號,共計899 174條公交IC卡記錄作為算例數(shù)據(jù).算法程序運行的計算機硬件環(huán)境為:雙核2.8 GHz CUP;1 GB內(nèi)存;300 GB硬盤.軟件環(huán)境為:Windows XP操作系統(tǒng);Visual Studio 2008開發(fā)環(huán)境;SQL Server 2005數(shù)據(jù)庫.
由于Kt、Mt、Nt3個參數(shù)的取值越大,通勤OD判斷的準(zhǔn)確性越高,對Kt、Mt和Nt3個參數(shù)取值最小的條件進(jìn)行測試,試驗中設(shè)定Kt=2、Mt= 1、Nt=1.
算法程序Step3-Step5,3個小時完成運算,確定出5個工作日共36 882個通勤者的通勤OD對,其中采用乘車頻次統(tǒng)計方法判斷出23 624個通勤OD,運算結(jié)果如圖1所示,字段描述見表2;采用空間聚類方法判斷出13 258個通勤OD對,運算結(jié)果如圖2所示,字段描述見表3.
圖1 乘車頻次統(tǒng)計方法推算部分結(jié)果Fig.1 Partial results of boarding frequency statistics method
表2 運算結(jié)果字段描述Table 2 Fields description of operation results
圖2 空間聚類方法部分運算結(jié)果Fig.2 Partial results of spatial clustering method
表3 運算結(jié)果字段描述Table 3 Fields description ofoperation results
根據(jù)5個工作日通勤者的居住地和工作地信息,分別提取每個工作日早高峰(06:30~09:30)和晚高峰(16:30~19:30)的通勤卡號,并得到早、晚高峰的通勤出行OD,運算結(jié)果統(tǒng)計見表4.
5個工作日早高峰提取的通勤卡號比例,均在50%左右,晚高峰提取的通勤卡號比例總體低于早高峰,其中12月5日(星期五)最低為40.5%,其它4個工作日均在45%左右.晚高峰有部分市民下班后并非直接回家,所以晚高峰通勤交通所占的比例總體低于早高峰,周末(12月5日)最為顯著.
經(jīng)過統(tǒng)計,本算例中“朝陽廣場”為工作人數(shù)最多的站點,這與朝陽廣場是南寧市的城市中心,與就業(yè)人口最密集的地區(qū)特征相吻合.“朝陽廣場”和“秀廂市場”站為通勤量最大的站點OD對,兩個站點間距2.9公里,途徑7個站點,有6條公交線路可以直達(dá).
表4 運算結(jié)果統(tǒng)計Table 4 Statistics of operation results
6.1 驗證思路
將本文提出方法與國外研究提出的基于“出行鏈”的公交出行OD推算方法[5,6]進(jìn)行比較.國外基于“出行鏈”的推算方法主要基于以下3個假設(shè):
(1)“下一次出行”假設(shè):同一乘客在同一天中公交乘車的下車站點大多接近下一次乘車的上車站點.
(2)“最后一次出行”假設(shè):同一乘客在同一天中最后一次乘車的下車站點接近同一天第一次乘車的上車站點.
(3)“返程出行”假設(shè):同一乘客在同一天中如果連續(xù)兩次乘車的線路相同,方向(上行和下行)相反,則第一次乘車的下車站點為第二次乘車的上車站點,第二次乘車下車站點為第一次乘車的上車站點.
基于“出行鏈”的方法只能應(yīng)用于乘客全天有2次以上公交乘車,對于全天只有1次乘車時,不能推算其OD.本文提出的公交通勤OD分布估計方法不受全天出行次數(shù)的限制.基于“出行鏈”方法的計算步驟,限于篇幅不再贅述.將2種方法共同能夠推算出來OD的公交卡號提取出來,通過計算2種公交出行OD推算結(jié)果的一致比例,確定本文所提出的公交通勤OD推算方法的精度.
6.2 驗證結(jié)果
將第5節(jié)的運算結(jié)果,與采用基于“出行鏈”方法的運算結(jié)果進(jìn)行比較.通過運算,提取用于比較的OD對11 072個,2種方法推算結(jié)果的一致率為75.27%.根據(jù)現(xiàn)有研究結(jié)果,基于“出行鏈”方法所能推算出的公交乘客出行OD的準(zhǔn)確率在90%以上[5,6].假設(shè)基于“出行鏈”方法的精度為90%,則本算例的公交通勤出行OD推算結(jié)果的準(zhǔn)確率為83.63%(75.27/90%).由于Kt、Mt、Nt3個參數(shù)的取值越大,通勤OD判斷的準(zhǔn)確性越高,對Kt、Mt、Nt3個參數(shù)在不同取值條件的精度進(jìn)行了試驗,結(jié)果見表5.
表5 不同參數(shù)條件驗證結(jié)果Table 5 Verification results in different parameter
表5中,當(dāng)Kt=6、Mt=2、Nt=2時,2種方法推算結(jié)果的一致率為88.51%,公交通勤OD推算結(jié)果的準(zhǔn)確率已達(dá)到98.34%(82.0/90%).驗證結(jié)果表明,本文提出的方法其精度能夠滿足城市交通規(guī)劃的數(shù)據(jù)要求.
本文對應(yīng)用APTS數(shù)據(jù)估計公交卡乘客通勤出行OD分布的方法進(jìn)行研究,提出的方法具有以下特點:
(1)可判別公交卡通勤乘客,推算其居住地和工作地位置信息,得到每個工作日早、晚高峰的通勤OD分布.
(2)與傳統(tǒng)居民出行調(diào)查方法相比,具有費用低、樣本量大、數(shù)據(jù)可動態(tài)更新的優(yōu)點.
(3)與基于“出行鏈”推算公交卡乘客出行OD方法相比,其不受公交乘客全天乘車次數(shù)的限制.
(4)算法的精度高、可操作性強,可以應(yīng)用于實際公交通勤出行需求的動態(tài)監(jiān)測和分析.
本文限于數(shù)據(jù)條件,僅采用了部分公交線路的數(shù)據(jù)進(jìn)行了試驗,隨著智能公交系統(tǒng)的廣泛應(yīng)用,當(dāng)使用全部公交線路數(shù)據(jù)計算時,所獲得的公交通勤OD的精度和樣本量還能夠得到進(jìn)一步提高.
[1] Navick DS,Furth PG.Using location-stamped farebox data to estimate passenger-miles,O-D patterns,and loads[C].TRB 2002 Annual Meeting,2002.
[2] Cui A.Bus-passenger origin-destination matrix estimation using automated data collection systems[D].MIT Master Thesis,2006.
[3] M Farin J.Constructing an automated bus origin-destination matrix using farecard and GPS data in Sao Paulo,Brzail [C].TRB 2008 Annual Meeting,2008.
[4] 劉靚.普適計算環(huán)境下居民交通行為特征研究[D].同濟(jì)大學(xué),2008.[LIU L.Research on inhabitant travel behavior under pervasive computing environment [D].Tongji University,2008.]
[5] Barry JJ,Newhouser R,Rahbee A,et al.Origin and destination estimation in new york city using automated fare system data[J].Transportation Research Record, 2002,(1871):183-187.
[6] Zhao J,Rahbee A,Wilson N.Estimation a rail passenger trip origin-destination matrix using automatic data collection systems[J].Computer-Aided Civil and Infrastructure Engineering,2007,(22): 376-387.
Estimating Smart Card Commuters Origin-Destination Distribution Based on APTS Data
CHEN Jun1,YANG Dong-yuan2
(1.School of Civil Engineering,Xi'an University of Architecture&Technology,Xi'an 710055,Shaanxi,China; 2.School of Transportation Engineering,Tongji University,Shanghai 201804,China)
Increasing the proportion of commuters travelling by public transportation can effectively ease urban traffic congestion.This paper addresses the application of Advanced Public Transportation Systems (APTS)data to analyze transit commuters travel demand.This study involved collection of APTS data and boarding stops information by combining smart card data and intelligent dispatching data.Transit commuters were judged according to travel frequency of morning and evening traffic peaks.The residences and work places were identified by spatial-temporal characteristics of commuters travel.Based on this idea,an estimation algorithm was proposed.The algorithm was tested and analyzed using large-scale APTS data. Finally,the method's accuracy was analyzed by comparison with the“Trip-chain”method.The proposed method provides some advantages including,high accuracy and strong operability.The study provides a fast and economic new approach to acquiring transit commuters Origin-Destination(OD)distribution.
traffic engineering;public transportation;commuters travel;OD(Origin-destination); advanced public transportation systems(APTS);smart card
U491.1Document code: A
U491.1
A
1009-6744(2013)04-0047-07
2013-01-23
2013-04-08錄用日期:2013-04-15
國家自然科學(xué)基金項目(51208408);陜西省教育廳科研計劃項目(12JK0797).
陳君(1977-),男,陜西平利人,講師,工學(xué)博士.
*通訊作者:chenjuntom@126.com