王鼎元
上海市交通發(fā)展研究中心
公共交通系統(tǒng)中乘客出行鏈的分析可以客觀反應(yīng)出公交系統(tǒng)的運(yùn)營狀況和城市區(qū)域之間的聯(lián)系,為提高公共交通系統(tǒng)服務(wù)水平,推進(jìn)公交優(yōu)先戰(zhàn)略提供參考依據(jù)。傳統(tǒng)的人工調(diào)查法或四階段法采樣數(shù)據(jù)有限、采樣群體不夠全面,僅能從宏觀角度描述公共交通的出行需求。隨著公交IC卡、手機(jī)二維碼等電子支付手段的推廣,電子支付交易數(shù)據(jù)逐漸成為從微觀層面分析公共交通出行需求的首選數(shù)據(jù)源。
上海市作為國際大都市,是國內(nèi)較早形成公交網(wǎng)絡(luò)的城市之一。截至2021年,有固定公交線路1 600多條,公交企業(yè)有28家。目前,有些城市的交通卡交易記錄可以精確到站點(diǎn),有的需要下車刷卡,這極大簡化了出行鏈識別的工作。但是,上海的公交車載終端與刷卡POS機(jī)之間沒有互相連接,僅根據(jù)交易記錄無法分辨車輛和班次。刷卡POS機(jī)設(shè)備更新?lián)Q代難度大,所以需要充分利用現(xiàn)有數(shù)據(jù)實(shí)現(xiàn)公交上下車站點(diǎn)的推算。
本文嘗試通過利用上海交通卡和乘車碼的交易數(shù)據(jù),結(jié)合在線地圖的公交線路數(shù)據(jù),與公交車定位數(shù)據(jù)、電子路單數(shù)據(jù)作關(guān)聯(lián)匹配,得到公交車輛與刷卡POS機(jī)的綁定關(guān)系,推算出公交上車站點(diǎn);根據(jù)乘客在公交和地鐵的換乘特征,推算下車站點(diǎn),得到乘客的完整出行鏈。
利用交通卡刷卡交易數(shù)據(jù)推算公交客流OD需要采集和處理多種來源數(shù)據(jù),分為相對靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù),其中相對靜態(tài)數(shù)據(jù)包括線路基礎(chǔ)信息表,公交線路、站點(diǎn)GIS數(shù)據(jù)等。本次使用的動態(tài)數(shù)據(jù)包括2021年8月內(nèi)某一周的上海全市交通卡刷卡記錄數(shù)據(jù)、公交乘車碼交易記錄數(shù)據(jù)(字段格式與交通卡刷卡記錄一致)、全市公交車衛(wèi)星定位數(shù)據(jù)、公交電子路單。其中,交通卡包括手機(jī)、手表等設(shè)備上使用NFC技術(shù)的虛擬卡;乘車碼為乘坐公交使用的二維碼乘車憑證(不能用來乘坐地鐵)。
數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸約等,本文主要介紹公交物理站點(diǎn)聚類融合以及公交車輛到離站時(shí)間推算方法。
同一個(gè)公交站牌或站亭,在不同線路上可能記錄到多個(gè)站點(diǎn)坐標(biāo),在統(tǒng)計(jì)時(shí)較為不便。因此對于同一物理站點(diǎn)需要采用聚類的方法,聚集到邏輯上的“物理站點(diǎn)”。觀察到作為同一公交站點(diǎn),名稱應(yīng)該相同,且距離很近。若為中途站,可能在道路兩側(cè)有兩個(gè)站臺;若為首末站,可能有兩個(gè)發(fā)車方向,且可能同時(shí)設(shè)有中途站(中途站在道路兩側(cè),不在場站內(nèi))。所以,對于同名、距離相近的站點(diǎn),最多可聚類為四個(gè)站點(diǎn):作為首末站的兩個(gè)發(fā)車方向,以及作為中途站的兩個(gè)線路走向。如圖1所示,臨近的同名公交站,可以根據(jù)是否為終點(diǎn)站分別聚合,再根據(jù)站點(diǎn)在線路上的方向角進(jìn)一步區(qū)分兩側(cè)不同方向的公交站。
圖1 公交物理站點(diǎn)聚類示意圖
為提高后續(xù)計(jì)算效率,在匹配交通卡數(shù)據(jù)之前,先將衛(wèi)星定位數(shù)據(jù)與電子路單、站點(diǎn)坐標(biāo)匹配,得到每輛車在每個(gè)站點(diǎn)的到站和離站時(shí)間。對每條GPS軌跡,先與電子路單匹配,得到上下行方向;再與對應(yīng)走向的線路上的所有站點(diǎn)計(jì)算距離。為防止因線路彎曲,匹配到的站點(diǎn)順序前后跳躍,先排除300 m范圍之外的站點(diǎn);在候選站點(diǎn)中,若有當(dāng)前站點(diǎn)和下一個(gè)站點(diǎn),選取位置較近的站點(diǎn),否則選取與當(dāng)前站點(diǎn)序號最接近的后續(xù)站點(diǎn)。
上海交通卡交易數(shù)據(jù)中,沒有車牌號或車輛編號信息,只有POS機(jī)編號,該編號與車牌號的對應(yīng)關(guān)系是不確定的。要將交通卡數(shù)據(jù)與公交車到離站時(shí)刻數(shù)據(jù)互相匹配,需要先獲取車輛與POS機(jī)的對應(yīng)關(guān)系。公交車上記錄定位數(shù)據(jù)的車載終端和POS機(jī)均需要實(shí)時(shí)上傳數(shù)據(jù),可以假設(shè)這兩臺設(shè)備會與互聯(lián)網(wǎng)定期同步時(shí)鐘,兩臺設(shè)備的時(shí)鐘誤差可以忽略。
公交POS機(jī)與公交車牌號的匹配可以視作一個(gè)線性規(guī)劃中的指派問題,即將公交POS機(jī)與公交車牌號一一對應(yīng),使匹配誤差最小。假設(shè)各條公交線路相互獨(dú)立,每日每輛公交車上的POS機(jī)為固定一臺,即可按不同日期、不同公交線路分別求解指派問題。該指派問題的目標(biāo)是使匹配誤差最小,匹配誤差由車輛與POS機(jī)之間??繒r(shí)間不匹配數(shù)確定。停靠時(shí)間不匹配數(shù)為某個(gè)POS機(jī)的刷卡記錄時(shí)間不在某輛車??咳我庖徽镜臅r(shí)間段內(nèi)的總數(shù)。
圖2為2021年8月5日43路(虹漕南路至南浦大橋方向)的電子路單和各站??繒r(shí)間;軌跡圖中圓點(diǎn)為使用該方法將POS機(jī)與車輛匹配后,得到的刷卡站點(diǎn)和時(shí)間??梢钥吹?,在繁忙的早高峰時(shí)段,即使有多輛車同時(shí)停靠,該方法也能較為準(zhǔn)確地匹配POS機(jī)與車輛的對應(yīng)關(guān)系。
圖2 2021年8月5日43路(虹漕南路—南浦大橋)車輛運(yùn)行軌跡圖
使用車輛到離站時(shí)間、POS機(jī)與車輛對應(yīng)關(guān)系表,根據(jù)刷卡記錄中的線路名稱、車牌號、POS機(jī)編號、刷卡時(shí)間,可以得出每條刷卡記錄的上車站點(diǎn)。每一站能匹配到的有效刷卡時(shí)間范圍設(shè)為這一站的到站時(shí)間直至下一站的到站時(shí)間;首站的有效刷卡時(shí)間設(shè)為發(fā)車前15 min或該車上一班終點(diǎn)站到站時(shí)間(取較大值),直至第二站的到站時(shí)間。上車站點(diǎn)識別所用數(shù)據(jù)表之間的關(guān)系如圖3所示。
圖3 上車站點(diǎn)匹配方法示意圖
在2021年11月分別對43路、218路、205路、985路做了74個(gè)班次的人工調(diào)查,同時(shí)采集調(diào)查當(dāng)天的原始數(shù)據(jù),使用上述方法,各班次總上客量平均準(zhǔn)確率為95%,站點(diǎn)級別上客量平均準(zhǔn)確率為90%。POS機(jī)與車牌號匹配結(jié)果準(zhǔn)確率為100%。
公交刷卡記錄下車站點(diǎn)的推算根據(jù)原始數(shù)據(jù)特點(diǎn)不同,有多種方法。[1,2,4]交通卡刷卡記錄包括公交和地鐵的刷卡記錄。其中,地鐵的刷卡記錄進(jìn)站和出站各為一條,關(guān)聯(lián)先后的進(jìn)出站刷卡記錄即可得到地鐵的進(jìn)出站點(diǎn)。乘客在公交站下車后,存在三種情況(見圖4):乘客先乘坐公交A,換乘公交B,其中包括公交B為公交A的返程的情況;乘客先乘坐公交A,換乘地鐵;乘客先乘坐公交A,再使用其他交通工具達(dá)到目的地。
圖4 公交下車站點(diǎn)匹配方法示意圖
本文采用一種通用的方式推算公交的下車站點(diǎn)。對于一次乘坐公交的刷卡記錄,其下車站點(diǎn)設(shè)置為同一條線路與下一次上車點(diǎn)1 000 m范圍內(nèi)最近的后續(xù)車站(包括返程),兩次乘車間隔在7日內(nèi)。這種較為寬松的條件,可以盡可能地包括乘客的規(guī)律性出行和往返行程,不論該乘客的出行是否在通常的上下班高峰期。使用這種方法,對2021年8月全市公交刷卡數(shù)據(jù)做下車點(diǎn)匹配,匹配率為所有刷卡記錄的50%左右。
匹配得到每條交易記錄的起訖點(diǎn)已經(jīng)可以反映出公交與地鐵客流的真實(shí)特征。但是,可以推算出OD的數(shù)據(jù)僅覆蓋了總出行量的一部分,為建立較準(zhǔn)確的交通模型,需要根據(jù)統(tǒng)計(jì)報(bào)表中的公交、地鐵總出行量做擴(kuò)樣。[9]公交和地鐵出行量的關(guān)系如圖5所示,其中打勾的部分為可以計(jì)算出OD的客流。
圖5 公交、地鐵出行客流邏輯關(guān)系示意圖
首先,需要計(jì)算原始數(shù)據(jù)覆蓋的客流與全部客流的占比。根據(jù)2021年的客運(yùn)量統(tǒng)計(jì)報(bào)表,與原始交易記錄中的日均客流對比,電子支付方式約占公交出行量的86%,其中交通卡占55%,乘車碼占31%。地鐵乘客還可以使用二維碼、單程票等方式進(jìn)站,使用交通卡的乘客約占地鐵日均客流56%。
對于單程的OD量,即乘坐一次公交,或一次地鐵進(jìn)出站,可以用可識別OD的記錄數(shù)占總記錄數(shù)的比例,乘以使用交通卡、乘車碼乘客的比例,得到可識別OD的記錄數(shù)占總客流的比例,單程的擴(kuò)樣系數(shù)為該比例的倒數(shù)。對于全程的OD量,即乘客在一次出行中,通過多次換乘到達(dá)目的地,需要排除公交乘車碼的數(shù)據(jù)。因?yàn)橹挥薪煌梢赃B通公交和地鐵系統(tǒng),所以其中公交的OD占比及擴(kuò)樣系數(shù)僅使用交通卡的交易記錄推算。一次出行的擴(kuò)樣系數(shù)可設(shè)為各單程的擴(kuò)樣系數(shù)的算術(shù)平均值。例如,乘客在一次出行中先乘坐公交線路A,系數(shù)為2.1,再乘坐地鐵,系數(shù)為1.6,這一次出行的擴(kuò)樣系數(shù)為1.85,即代表1.85人次的出行OD。
獲得了每條刷卡記錄所代表的公交線路、上下車站點(diǎn),計(jì)算出擴(kuò)樣系數(shù)后,即可統(tǒng)計(jì)得到線路站間客流、站點(diǎn)上下客量和換乘量等,精確地分析公交線路、站點(diǎn)、通道的客流特征。
在站點(diǎn)層面,可以按物理站點(diǎn)集計(jì),得到站點(diǎn)日均或高峰時(shí)的上下客量、換乘量。在線路層面,可以計(jì)算線路上主要的OD區(qū)間,觀察斷面客流,優(yōu)化現(xiàn)有公交線路走向,如圖6所示。在網(wǎng)絡(luò)層面,可以按公交線路經(jīng)過的道路,計(jì)算每條道路上的斷面客流,建立更精確的交通模型,如圖7所示。
圖6 218路下行早高峰斷面客流圖
圖7 上海部分區(qū)域公交斷面客流分布圖
本文描述了一種利用交通卡和公交乘車碼交易數(shù)據(jù)、公交電子路單、公交車衛(wèi)星定位數(shù)據(jù),推算公交上下車站點(diǎn),進(jìn)而構(gòu)建多模式公交出行鏈的方法。該方法解決了公交車輛與刷卡POS機(jī)不綁定、公交下車站點(diǎn)推算等問題,實(shí)現(xiàn)了全市規(guī)模的公交出行鏈的復(fù)原,能較為準(zhǔn)確地反映整個(gè)公交系統(tǒng)中的出行特征。
本文所述的方法對于下客量、冷門線路客流推算的準(zhǔn)確性尚需通過人工調(diào)查驗(yàn)證。后續(xù)研究時(shí),應(yīng)根據(jù)實(shí)際情況,將公交出行鏈數(shù)據(jù)與其他數(shù)據(jù)和人工調(diào)查相結(jié)合,為交通規(guī)劃、運(yùn)營調(diào)整等工作提供更真實(shí)細(xì)致的數(shù)據(jù)支撐。