楊宇航 陳國俊 張抒揚(yáng) 劉好德 祁 昊
(武漢理工大學(xué)交通學(xué)院1) 武漢 430063) (交通運(yùn)輸部科學(xué)研究院2) 北京 100029)
公交行程時(shí)間包括站點(diǎn)??繒r(shí)間與站間行駛時(shí)間,是涉及到公交規(guī)劃、運(yùn)營調(diào)度和服務(wù)評價(jià)的重要參數(shù).在以往研究中,停靠時(shí)間與行駛時(shí)間的獲取方法主要分為三類:人工調(diào)查[1-2]、GPS數(shù)據(jù)換算[3-4]和模型估計(jì)[5-6].人工調(diào)查方法需要耗費(fèi)大量人力,且通??色@取的數(shù)據(jù)樣本較少.GPS數(shù)據(jù)換算方法要求必須準(zhǔn)確采集車輛的進(jìn)出站點(diǎn)時(shí)間,對數(shù)據(jù)質(zhì)量要求較高;數(shù)據(jù)缺失、異常以及GPS定位誤差(包括進(jìn)出站的判定機(jī)制),都會影響??繒r(shí)間與行駛時(shí)間的獲取.采用模型估計(jì)方法時(shí),通常需以二者的影響因素為基礎(chǔ)進(jìn)行建模,??繒r(shí)間的影響因素包括上下車人數(shù)、車內(nèi)擁擠程度、臺階數(shù)、時(shí)段、天氣等[7-9],行駛時(shí)間的影響因素包括行程距離、道路等級、車道數(shù)、有無專用道、交叉口間距、交通流狀況、駕駛行為、天氣等[10-13].由于影響因素的差異性與多樣性,以往研究者通常對兩者進(jìn)行獨(dú)立建模分析,缺乏考慮兩者間的相互關(guān)系,而且構(gòu)建的模型多針對單個(gè)站點(diǎn)或路段,不適用多站點(diǎn)或長距離的時(shí)間預(yù)測或估計(jì).
在Tirachini[14]的統(tǒng)計(jì)分析中顯示城市公交線路的總體??繒r(shí)間占行程時(shí)間的比例在20%~30%浮動,因此,本文進(jìn)一步提出假設(shè),城市公交線路運(yùn)營的停靠時(shí)間與行程時(shí)間之間存在特定的比例關(guān)系,且該比例關(guān)系在特定條件下保持穩(wěn)定.如果成立,基于該比例關(guān)系,只需極少量數(shù)據(jù)(路單數(shù)據(jù))即可估計(jì)獲取特定城市公交線路運(yùn)營的??繒r(shí)間.
文中基于濟(jì)南市公交智能調(diào)度數(shù)據(jù),驗(yàn)證公交停靠時(shí)間與行程時(shí)間之間的比例關(guān)系,并分析影響該比例系數(shù)的因素,建立相應(yīng)的數(shù)學(xué)模型,從而得到城市公交線路停靠時(shí)間的簡便計(jì)算方法.
從濟(jì)南公交智能調(diào)度系統(tǒng)中提取各個(gè)運(yùn)營日、各條運(yùn)營線路、各個(gè)運(yùn)營班次在各站點(diǎn)的停靠時(shí)間與各路段(相鄰兩個(gè)站點(diǎn)之間)的行駛時(shí)間.樣本的采集時(shí)間范圍為2019年9月(30 d),公交運(yùn)營線路為306條,總共包含955 812個(gè)運(yùn)營班次.
假定公交站點(diǎn)停靠時(shí)間與班次行程時(shí)間存在穩(wěn)定比例關(guān)系,即二者滿足DT=k×TT.從統(tǒng)計(jì)角度,采用過原點(diǎn)(行程時(shí)間為0時(shí)停靠時(shí)間也為0)的線性回歸方程對數(shù)據(jù)樣本進(jìn)行擬合應(yīng)該具有較好的擬合優(yōu)度.對全樣本班次數(shù)據(jù)進(jìn)行回歸分析,結(jié)果見圖1.
圖1 線性擬合結(jié)果
擬合結(jié)果k=0.285,??繒r(shí)間總體上約占行程時(shí)間的28.5%;擬合R2為0.855,比例模型擬合優(yōu)度較高,能夠基于行程時(shí)間解釋85.5%的??繒r(shí)間變化程度;模型的標(biāo)準(zhǔn)殘差分布近似標(biāo)準(zhǔn)正態(tài)分布,表明擬合結(jié)果具備合理性.因此,對城市公交系統(tǒng),可以判定??繒r(shí)間與總行程時(shí)間存在顯著地比例關(guān)系.
線性擬合驗(yàn)證了??繒r(shí)間與行程時(shí)間存在比例關(guān)系,還需驗(yàn)證比例系數(shù)的穩(wěn)定性.以運(yùn)營班次為統(tǒng)計(jì)單元,計(jì)算停靠時(shí)間與行程時(shí)間的比例系數(shù)k.根據(jù)全樣本比例系數(shù)的分布(見圖2),其集中分布在0.2~0.4(約占92%),不同班次的??繒r(shí)間比例系數(shù)存在一定程度波動,直接采用全樣本擬合的比例系數(shù)去折算班次??繒r(shí)間會導(dǎo)致較大的誤差.
圖2 比例系數(shù)分布
基于上述分析,可能導(dǎo)致站點(diǎn)??繒r(shí)間比例系數(shù)波動的原因包括:
1)時(shí)段差異 不同時(shí)段背景交通流條件不一樣,同時(shí)客流需求也存在差異.
2)日期差異 類似不同時(shí)段,不同日期背景交通流條件與客流需求存在差異.
3)線路差異 不同線路幾何拓?fù)浣Y(jié)構(gòu)不一樣,道路行駛環(huán)境差異較大,且客流需求也存在差異.
4)駕駛行為差異 不同駕駛員的駕駛行為習(xí)慣存在差異.在公交運(yùn)營當(dāng)中,駕駛員與車輛之間通常存在對應(yīng)關(guān)系,本研究采用車輛代表駕駛員.
從比例系數(shù)關(guān)于不同時(shí)段(05:00~23:00)、不同日期(9月份連續(xù)30 d)、不同線路(30條具有代表性的不同類型線路,運(yùn)營班次量均大于1 000)、不同車輛(運(yùn)營班次量最大的K1線路)的分布來看(見圖3),時(shí)段、日期、車輛的差異對比例系數(shù)分布的影響程度非常小,不同時(shí)段、不同日期、不同車輛的??繒r(shí)間比例系數(shù)分布近似相同;而線路差異對比例系數(shù)分布的影響程度非常大,不同線路的??繒r(shí)間比例系數(shù)存在著顯著差異.
圖3 不同條件下比例系數(shù)的分布
因此,文中主要從線路空間差異角度分析停靠時(shí)間比例系數(shù)差異的原因,從而提升??繒r(shí)間估計(jì)的準(zhǔn)確性.
在固定行駛路徑的情況下,每條公交線路的特征是固定的,背景交通條件具有特定的規(guī)律特征;同時(shí)文獻(xiàn)[15]顯示居民的公交需求具有顯著的空間特征,因此每條固定線路的客流需求也將具有規(guī)律性.不同線路比例系數(shù)的分布存在明顯差異,為確定影響比例系數(shù)的具體因素,需要結(jié)合線路差異特征進(jìn)行分析.
站點(diǎn)??繒r(shí)間比例系數(shù)取決于站點(diǎn)??繒r(shí)間與站間行駛時(shí)間,即
(1)
式中:dt為單個(gè)站點(diǎn)的??繒r(shí)間;lt為單個(gè)站間路段的行駛時(shí)間.
影響??繒r(shí)間比例系數(shù)的因素可以概括為兩方面,影響站點(diǎn)??繒r(shí)間的因素與影響站間行駛時(shí)間的因素.
1)站點(diǎn)??繒r(shí)間影響因素 對于??繒r(shí)間,研究表明其主要影響因素為上下車的乘客數(shù),即:
dtn=μbn
(2)
式中:bn為站點(diǎn)上下車乘客數(shù);μ為單個(gè)乘客的平均服務(wù)時(shí)間.
從線路角度而言,影響停靠時(shí)間的潛在因素包括:①線路站點(diǎn)數(shù)站點(diǎn)越多,公交車??看螖?shù)越多,??繒r(shí)間越長.②線路高需求站點(diǎn)數(shù)站點(diǎn)300 m服務(wù)半徑內(nèi)有大型居民出行需求點(diǎn),如居民區(qū)、醫(yī)院、學(xué)校、商業(yè)區(qū)等,定義該類站點(diǎn)為高出行需求站點(diǎn),這類站點(diǎn)乘客上下車需求較高.
2)站間行駛時(shí)間影響因素 行駛時(shí)間由行駛距離與平均行駛速度決定,即:
(3)
式中:ltn,n+1為站點(diǎn)n與n+1之間的行駛時(shí)間;sn,n+1為站間距離;vn,n+1為站間平均行駛速度.
結(jié)合文獻(xiàn)[7-10],從線路角度,影響站間行駛時(shí)間的因素包括:①線路長度 線路越長,行駛時(shí)間越長.②線路所處道路等級 不同等級道路的設(shè)計(jì)行車速度不同,速度越快,路段的行駛時(shí)間越短.城市道路以主干路為主實(shí)現(xiàn)交通功能,故采用線路包含的主干路運(yùn)營長度反應(yīng)公交線路所處道路等級狀況.③線路是否專有路權(quán) 在專有路權(quán)道路上,公交車速穩(wěn)定,路段的行駛時(shí)間更短.由于濟(jì)南市的公交專用道按時(shí)段劃分,而不同時(shí)段比例系數(shù)無明顯差異(見圖3a)),因此不考慮一般的分時(shí)段公交專用道,主要考慮是否為BRT線路(全時(shí)段公交專用道).④線路交叉口數(shù) 交叉口越多,車輛遭遇信號控制次數(shù)可能越多,頻繁制動導(dǎo)致站間行駛時(shí)間越長.
考慮到不同線路的站點(diǎn)數(shù)、高需求站點(diǎn)數(shù)量、交叉口數(shù)、主干路運(yùn)營長度等參數(shù)的絕對值差異很大,不具有可比性.本研究將上述參數(shù)轉(zhuǎn)換成線路之間具有可比性的相對值,即站點(diǎn)密度、高需求站點(diǎn)率,交叉口密度、主干路占比.
文中選取的影響??繒r(shí)間比例系數(shù)的線路因素見表1,并通過百度實(shí)景地圖采集了運(yùn)營班次大于1 000的197條公交線路的特征參數(shù).
表1 潛在影響因素
為確定上述潛在影響因素是否對比例系數(shù)存在顯著影響.基于SPSS對比例系數(shù)與潛在影響因素進(jìn)行相關(guān)性檢驗(yàn),其中連續(xù)型變量采用皮爾遜相關(guān)系數(shù)檢驗(yàn)(見表2),分類變量采用點(diǎn)二列相關(guān)系數(shù)檢驗(yàn),見表3.
表2 皮爾遜相關(guān)系數(shù)表
表3 點(diǎn)二列相關(guān)系數(shù)表
以顯著性水平Sig=0.05為相關(guān)性篩選閾值,結(jié)果發(fā)現(xiàn),站點(diǎn)密度、高需求站點(diǎn)率、線路長度、交叉口密度、是否為BRT線路與停靠時(shí)間比例系數(shù)(k)之間存在顯著相關(guān)性,而主干路占比與停靠時(shí)間比例系數(shù)之間不存在顯著相關(guān)性.在后續(xù)的建模分析中,只考慮站點(diǎn)密度、高需求站點(diǎn)率、線路長度、交叉口密度、是否為BRT線路等五個(gè)線路因素與??繒r(shí)間比例系數(shù)之間的關(guān)系.
將顯著影響因素作為自變量,線路的平均比例系數(shù)作為因變量,分別構(gòu)建多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)回歸和隨機(jī)森林回歸模型(使用matlab自帶的神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林工具箱),并比較3種模型的擬合優(yōu)度(R2)與估計(jì)精度(MAPE),見圖4.
圖4 三種模型的擬合效果
根據(jù)R2和MAPE,相比多元線性回歸模型,其他兩種智能算法在精度上均有提升,但改善效果有限,其中BP神經(jīng)網(wǎng)絡(luò)模型的MAPE提升了0.29%,隨機(jī)森林模型的MAPE提升了1.14%.多元線性回歸模型雖然精度略低,但是其估計(jì)結(jié)果仍然可觀,說明相比復(fù)雜模型,線性回歸模型仍對本研究具備有效性;且多元線性回歸模型更易于理解與實(shí)踐,相比其他兩種方法便于進(jìn)行靈敏度分析,能夠具體分析各因素的影響程度.因此本文選擇多元線性回歸模型作為比例系數(shù)的估計(jì)方法,其模型具體參數(shù)見表4.在該模型中,站點(diǎn)密度、交叉口密度、高需求站點(diǎn)率、是否BRT通過顯著性檢驗(yàn)(Sig<0.05),對比例系數(shù)存在顯著影響,且不存在多重共線性(VIF方差膨脹因子<10).
表4 多元線性回歸模型
得到多元線性回歸方程為
k=0.121+0.072Ps-0.023Pi+
0.094Pf+0.110θ
(4)
為進(jìn)一步驗(yàn)證上述變量對比例系數(shù)的影響作用,比較各變量不同取值情況下線路比例系數(shù)的分布,見圖5.
圖5 各變量不同取值情況下比例系數(shù)的分布
1)站點(diǎn)密度 由圖5a)可知,隨著站點(diǎn)密度的增加,比例系數(shù)分布呈上升趨勢.站點(diǎn)數(shù)量越多,公交運(yùn)營過程中需要停靠的次數(shù)越多,從而導(dǎo)致停靠時(shí)間增加與??繒r(shí)間占比上升.根據(jù)回歸方程結(jié)果,每公里增加一個(gè)站點(diǎn)將導(dǎo)致站點(diǎn)??繒r(shí)間比例上升0.072.
2)交叉口密度 由圖5b)可知,相比0~1個(gè)/km區(qū)間,其他兩個(gè)密度區(qū)間的比例系數(shù)分布上升明顯,這并不符合研究預(yù)期.交叉口越多,公交運(yùn)行過程中在交叉口的延誤損失時(shí)間越高,從而導(dǎo)致站間行程時(shí)間增加與??繒r(shí)間占比下降.檢驗(yàn)數(shù)據(jù)后發(fā)現(xiàn),處于0~1個(gè)/km交叉口密度的線路數(shù)據(jù)極少(低于3%),導(dǎo)致數(shù)據(jù)的信度不足.比較交叉口密度處于1~2個(gè)/km區(qū)間與2~3個(gè)/km區(qū)間,比例系數(shù)分布隨交叉口密度增加有略微下降.根據(jù)回歸方程結(jié)果,每公里增加一個(gè)交叉口將導(dǎo)致站點(diǎn)??繒r(shí)間比例下降0.023.
3)高需求站點(diǎn)率 由圖5c)可知,隨著高需求站點(diǎn)率的增加,比例系數(shù)分布明顯上升.高需求的站點(diǎn)乘客上下車需求增加,??繒r(shí)間增加,導(dǎo)致??繒r(shí)間占比增加.根據(jù)回歸方程結(jié)果,高需求站點(diǎn)率每增加1%將導(dǎo)致??繒r(shí)間比例上升0.000 94.
4)是否BRT 由圖5d)可知,BRT線路的比例系數(shù)分布相比非BRT線路有明顯上升.BRT線路公交在行駛時(shí)不受其他社會車輛的影響,行駛速度穩(wěn)定,在路段間耗費(fèi)的行駛時(shí)間更少,且通常而言,BRT線路的客流需求高于普通公交線路.因此,??繒r(shí)間占比增加.根據(jù)回歸方程結(jié)果,BRT線路相比于非BRT線路,其??繒r(shí)間比例增加0.110.
比較197條公交線路的回歸模型估計(jì)值與相應(yīng)線路運(yùn)營班次(878 521個(gè))的比例系數(shù)實(shí)測值(見圖6),其中相對誤差百分比小于10%的累計(jì)案例數(shù)占比51.6%,相對誤差百分比小于20%的累計(jì)案例數(shù)占比83.5%,全樣本的平均相對誤差百分比為12.2%,因此,通過公交線路的特征參數(shù)計(jì)算其停靠時(shí)間比例系數(shù),再依據(jù)電子表單提供的線路運(yùn)營班次的總行程時(shí)間進(jìn)行折算,可有效估計(jì)所屬運(yùn)營班次的??繒r(shí)間.
圖6 各運(yùn)營班次比例系數(shù)的相對誤差分布
本文驗(yàn)證了城市公交??繒r(shí)間與行程時(shí)間之間的比例關(guān)系,并基于該比例特性提出了一種估計(jì)城市公交線路運(yùn)營??繒r(shí)間的簡易方法.??繒r(shí)間比例系數(shù)隨線路差異而波動,顯著影響因素為站點(diǎn)密度、交叉口密度、高需求站點(diǎn)率以及是否為BRT線路,回歸模型的MAPE約為6.8%,可有效估計(jì)??繒r(shí)間比例系數(shù)與??繒r(shí)間.研究結(jié)果對于指導(dǎo)城市公交線路設(shè)計(jì)與線網(wǎng)規(guī)劃、低密度數(shù)據(jù)質(zhì)量下評價(jià)公交運(yùn)行服務(wù)有重要價(jià)值與意義.本研究僅基于濟(jì)南市公交數(shù)據(jù),比例特性是否具有更強(qiáng)的普適性(任何一個(gè)城市公交系統(tǒng)均成立),以及比例系數(shù)在不同城市之間是否存在差異有待后續(xù)進(jìn)一步研究.