張騰月,翁小雄
(華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)
基于收費數(shù)據(jù)的高速公路行程時間可靠性估計模型
張騰月,翁小雄
(華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)
高速公路收費數(shù)據(jù)易于獲取,且蘊含多種交通信息。本文利用收費數(shù)據(jù)分析高速公路客貨車行程時間分布,提出客貨車行程時間分布的差異,分別構(gòu)建客貨車行程時間可靠性估計模型,并對模型進行試驗分析。利用MATLAB對直接求取的客貨車行程時間和模型求取的客貨車行程時間進行正態(tài)分布和對數(shù)正態(tài)分布曲線擬合,結(jié)果表明:客貨車的行程時間分布均符合正態(tài)分布;利用本文模型求取的行程時間分布比直接使用出入口收費站時間差求取的行程時間分布具有更小的SSE和RMSE以及更大的R-square。最后,對客貨車行程時間的可靠性區(qū)間,即置信區(qū)間進行比較,結(jié)果表明:在同一置信水平下,利用本文模型求解的行程時間具有更小的行程時間區(qū)間分布,即更好的穩(wěn)定性。
高速公路收費數(shù)據(jù);行程時間;可靠性估計;正態(tài)分布;對數(shù)正態(tài)分布
交通擁擠不僅會對經(jīng)濟產(chǎn)生負面影響,同時也會帶來生活質(zhì)量下降、資源浪費、環(huán)境污染等各種問題。隨著我國經(jīng)濟突飛猛進的發(fā)展,全國車輛保有量也呈現(xiàn)持續(xù)上升的趨勢,但由于我國高速公路時空分布的差異性,高速公路常發(fā)性擁擠問題日益突出,因此需要對高速公路行程時間分布特征進行研究,以便為道路決策者和使用者提供可靠的行程時間,合理控制出行,以減少交通擁擠或事故的發(fā)生。
目前,國內(nèi)外學(xué)者對高速公路行程時間的研究主要是利用GPS數(shù)據(jù)[1]、鋪設(shè)線圈檢測器數(shù)據(jù)[2]等設(shè)施。然而,新增檢測設(shè)施成本高、維護不便且維修不及時容易引起信息缺失。高速公路行程時間的研究需要持續(xù)性完整的數(shù)據(jù)作為支撐,而我國高速公路采用封閉式收費,可以在不新增檢測設(shè)施建設(shè)投入的情況下,實現(xiàn)對高速公路行程時間的準確估算,恰恰滿足這一要求,所以利用高速公路收費數(shù)據(jù)對高速公路行程時間進行估計既可行又有現(xiàn)實意義。
國內(nèi)外學(xué)者在行程時間的分布上也做了相關(guān)研究。Arezoumandi[3]通過分別分析伽馬分布、最大極值分布、Log-logistic概率分布、對數(shù)正態(tài)分布及威布爾分布與一天行程時間數(shù)據(jù)的擬合程度,得到了可變限速情形下行程時間的分布服從對數(shù)正態(tài)分布。朱彥等[4]使用浮動車數(shù)據(jù)計算出城市快速路各路段在不同時段的行程時間,再采用統(tǒng)計分析方法得出目標路段在相同時段下行程時間的分布規(guī)律,并對相同時段不同路段、相同路段不同時段的行程時間分布測度進行對比分析。王翔等[5]提出收費數(shù)據(jù)補全算法,解決了當收費站間缺少收費數(shù)據(jù)而無法獲取行程時間的問題。
上述方法在研究高速公路行程時間的時候,按照車型來研究或者不分車型來研究,未考慮客貨類型的差異性。因此,本文以高速公路收費數(shù)據(jù)為依托,利用SPSS統(tǒng)計分析軟件對高速公路客貨車行程時間的時空分布規(guī)律進行研究,提出客貨車行程時間分布的時空差異性,以高速公路MTC和ETC數(shù)據(jù)進行融合[6],構(gòu)建客貨車不同的行程時間估計模型。最后,利用MATLAB對客貨車行程時間進行正態(tài)分布和對數(shù)正態(tài)分布的分布擬合[7],并比較其置信區(qū)間。
我國高速公路采用封閉式收費方式,在高速公路出入口均設(shè)置收費站。早期按照車型和行駛里程收費,但隨著新形勢的變化,國家對現(xiàn)行多年的收費政策做了重大改革和調(diào)整,改為按照計質(zhì)量收費的方式進行,即“標準車型、標準裝載、標準收費;標準車型、超額裝載、超額收費”的原則實施,更加充分地體現(xiàn)了通行費收取的公平性、合理性和科學(xué)性。收費數(shù)據(jù)結(jié)構(gòu)如表1所示,在出入口客貨標識中,0表示啟用計質(zhì)量收費前未加區(qū)分的車輛,1表示客車,2表示貨車。
表1 收費數(shù)據(jù)結(jié)構(gòu)
海量的數(shù)據(jù)蘊含豐富的信息,但由于采集設(shè)備不穩(wěn)定、數(shù)據(jù)傳輸?shù)牟豢煽?、?shù)據(jù)存儲不合理等因素導(dǎo)致數(shù)據(jù)質(zhì)量亦不容樂觀。同時,研究內(nèi)容的不同也會引起數(shù)據(jù)使用者所需數(shù)據(jù)結(jié)構(gòu)的不一致。因此,在分析數(shù)據(jù)前對數(shù)據(jù)進行按需抽取、過濾篩選、數(shù)據(jù)修復(fù)等操作就顯得尤為重要。收費數(shù)據(jù)預(yù)處理流程圖如圖1所示。
圖1 收費數(shù)據(jù)預(yù)處理流程圖Fig.1 The preprocessing flow chart of toll data
本文對廣州某高速公路路段2015年12月15日客貨車行程時間分布進行分析,采用四分位法進行數(shù)據(jù)預(yù)處理,5 185條收費數(shù)據(jù)中有271條數(shù)據(jù)不滿足要求,剩余4 914條數(shù)據(jù)。其中上下四分位點的差值B=M0.75-M0.25=134,數(shù)據(jù)篩選區(qū)間A=[M0.25-1.5B,M0.75+1.5B]=[58,594],客貨車篩選前后行程時間分布圖如圖2和圖3所示,可以看出客貨車行程時間存在時空差異性。
圖2 客貨車行程時間分布圖Fig.2 Travel time distribution for passenger car and freight car
圖3 四分位法處理后的客貨車行程時間分布圖Fig.3 Travel time distribution for passenger car and freight car processed by quartiles
對站間距離3.9 km的某兩個站間數(shù)據(jù)進行四分位法篩選后的客貨車行程時間分布圖如圖3所示。從圖3中可以看出:
(ⅰ)在空間分布上,客車的行程時間普遍低于貨車的行程時間,具體來看00:00:00—06:00:00,客車的行程時間區(qū)間為2.5~4 min,貨車的行程時間區(qū)間為4~5.5 min;06:00:00—15:00:00,客車的行程時間區(qū)間為3.5~5.5 min,貨車的行程時間區(qū)間為4~7 min;15:00:00—19:00:00,客車的行程時間區(qū)間為5.5~7.5 min,貨車的行程時間區(qū)間為7~9.5 min;19:00:00—23:59:59,客車的行程時間區(qū)間為3~5 min,貨車的行程時間區(qū)間為4~7 min。
(ⅱ)在時間分布上,00:00:00—06:00:00,貨車的流量較大,因為貨車通常夜間行車;07:30:00—10:00:00,客貨車的行程時間均呈上升趨勢,早高峰出現(xiàn)在09:00:00—10:30:00;13:00:00—15:00:00客貨車的行程時間持續(xù)呈現(xiàn)上升的趨勢,在15:00:00—19:00:00行程時間趨于穩(wěn)定,迎來了晚高峰,在這段時間內(nèi),客車流量明顯多于貨車流量;19:00:00—23:59:59客貨車的流量較晚高峰明顯下降。
3.1 客貨車行程時間的求取
在求取兩收費站間行程時間的過程中,會出現(xiàn)在統(tǒng)計周期內(nèi)沒有車輛經(jīng)過導(dǎo)致行程時間無法求取或車輛偏少[8]導(dǎo)致行程時間隨機性較大的情況,這些因素都會成為行程時間分布求取的障礙。鑒于此,本文提出進行上下游遞推求取和直接按照所求收費站間經(jīng)過車輛求取并舉,并在同一統(tǒng)計周期內(nèi)利用四分位法對行程時間進行篩選,對滿足條件的行程時間進行平均的方法對兩收費站間的行程時間進行推導(dǎo)。
駛?cè)牒婉傠x高速公路收費站匝道的行程時間不同,故兩收費站間的行程時間可表述為駛?cè)朐训赖男谐虝r間、主線行程時間、駛離匝道的行程時間3個部分組成,即:
對上游而言,推導(dǎo)公式如下:
假設(shè)在第k個統(tǒng)計周期中,收費站上游滿足條件的收費站有m個,則:
(1)
同理,對下游而言,假設(shè)在第k個統(tǒng)計周期中,收費站下游滿足條件的收費站有n個,則:
(2)
則廣義上,兩收費站間行程時間可以表示為:
3.2 客貨行程時間的差異
駛?cè)胧召M站時,由于車輛在駛?cè)朐训罆r有起步加速階段和勻速階段,但起步加速階段時間ta很短,此處忽略不計,將車輛近似看做勻速運動,車速以該收費站限制標牌所示速度Vin(i)計,Lin(i)為收費站i的匝道長度,t表示客貨車類型,其中t=p代表客車,t=c代表貨車,即:
駛離收費站時,行程時間主要包括車輛正常行駛時間和人工收費(MTC)排隊時間,由于ETC車道往往通行時間較少,客車的排隊延誤時間由MTC與ETC車道車輛的行程時間差彌補,而貨車只有MTC數(shù)據(jù),則:
其中在第k個周期內(nèi),客車的TMTC(r,i)和TETC(r,i)應(yīng)符合:tk≤TMTC(r,i)≤tk+1且tk≤TETC(r,i)≤tk+1;且在不同的統(tǒng)計周期內(nèi),求取|TMTC-TETC|的分布以確定其上下閾值[9],對滿足條件的數(shù)據(jù)進行MTC和ETC數(shù)據(jù)融合,對不滿足條件的利用閾值進行修復(fù)即可。
以2015年12月15日廣州某高速公路連續(xù)9個收費站的收費數(shù)據(jù)為依據(jù),分別利用直接計算兩收費站時間差和利用本文第3節(jié)中提到的模型計算相同2個收費站的行程時間,以統(tǒng)計周期15 min求取客貨車行程時間分布,比較分布擬合的優(yōu)劣以及行程時間置信區(qū)間的大小。
利用SPSS直接求取的客車行程時間分布圖和利用模型求取的客車行程時間分布圖,如圖4和圖5所示。
利用MATLAB對直接求取的行程時間和利用模型求取行程時間進行分布擬合,擬合結(jié)果比較如表2所示。從表2中可以看出:
①對客車的行程時間進行分布擬合時,正態(tài)分布的擬合[10]具有更小的SSE和RMSE(即誤差更小),以及更大的R-square[11](即正態(tài)分布擬合的相似度更高);
②在利用真實收費數(shù)據(jù)確定了客車行程時間分布的前提下,對模型求取的方法和直接求取的方法進行對比,結(jié)果表明:模型求取的結(jié)果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的結(jié)果擬合度更高。
對客車行程時間的置信區(qū)間進行求取并比較,如表3所示。從置信區(qū)間可以看出:模型求取的區(qū)間長
圖4 直接求取的客車行程時間Fig.4 Travel time for passenger car calculated directly
圖5 模型求取的客車行程時間Fig.5 Travel time for passenger car calculated by model
擬合方法SSE直接求取模型求取RMSE直接求取模型求取R?square直接求取模型求取正態(tài)分布194.594.53.6013.240.5150.9006對數(shù)正態(tài)分布19698.873.6143.3140.51150.896
表3 客車置信區(qū)間表
度為165.12,直接求取的區(qū)間長度為178.68。模型求取相對于直接求取的置信區(qū)間更小,即模型求取的客車行程時間分布更穩(wěn)定。
正態(tài)分布的置信區(qū)間:
p=[μ-x1-α/2σ,μ+x1-α/2σ]。
查標準正態(tài)分布表可知:置信水平為95%,分位數(shù)x1-α/2為1.96。
利用SPSS直接求取的貨車行程時間分布圖和利用模型求取的客車行程時間分布圖如圖6和圖7所示。
利用MATLAB對直接求取的貨車行程時間和利用模型求取貨車行程時間進行分布擬合,擬合結(jié)果比較如表4所示。從表4中可以看出:
①對貨車的行程時間進行分布擬合時,正態(tài)分布的擬合具有更小的SSE和RMSE(即誤差更小),以及更大的R-square(即正態(tài)分布擬合的相似度更高);
②對貨車直接求取法進行對數(shù)正態(tài)分布擬合時,出現(xiàn)R-square為負的情況,說明直接求取的貨車行程時間不適合使用對數(shù)正態(tài)分布擬合。
③在利用真實收費數(shù)據(jù)確定了貨車行程時間分布的前提下,對模型求取的方法和直接求取的方法進行對比,結(jié)果表明:模型求取的結(jié)果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的結(jié)果擬合度更高。
對貨車行程時間的置信區(qū)間進行求取并比較,如表5所示,模型求取的區(qū)間長度為234.92,直接求取的區(qū)間長度為290.58。模型求取相對于直接求取的置信區(qū)間更小,即模型求取的貨車行程時間分布的置信區(qū)間更穩(wěn)定。
圖6 直接求取的貨車行程時間Fig.6 Travel time for freight car calculated directly
圖7 模型求取的客車行程時間Fig.7 Travel time for freight car calculated by model
擬合方法SSE直接求取模型求取RMSE直接求取模型求取R?square直接求取模型求取正態(tài)分布175.7094.824.4193.2460.55840.8470對數(shù)正態(tài)分布659.50102.108.5613.368-0.65720.8352
表5 貨車置信區(qū)間表
本文依托高速公路收費數(shù)據(jù),分析客貨行程時間的時空差異性,分別構(gòu)建了基于收費數(shù)據(jù)的高速公路客貨行程時間估計模型。本文第3節(jié)模型的提出主要針對在實際道路條件限制下無法通過實驗直接求取路段行程時間的情況,對路段行程時間的估計。在本文第4節(jié)中,分別將客貨車直接求取的行程時間分布和模型求取的行程時間分布進行分布擬合并比較其概率性分布區(qū)間。結(jié)果表明:利用真實車輛收費數(shù)據(jù)對客貨車行程時間分布進行擬合,在確定為正態(tài)分布的前提下,對客車的行程時間進行分布擬合時,利用本文模型求取正態(tài)分布擬合的優(yōu)越性R-square為0.900 6;對貨車的行程時間進行分布擬合時,利用本文模型求取正態(tài)分布也有較好的擬合效果,R-square為0.847 0。正態(tài)分布下的本文模型求取的客車置信區(qū)間長度為165.12; 貨車置信區(qū)間長度為234.92。從數(shù)據(jù)中可以看出正態(tài)分布下本文模型求取的客車行程時間分布相比貨車的行程時間分布具有更好的擬合效果以及更好的穩(wěn)定性。造成這種現(xiàn)象的原因可能是由于貨車數(shù)據(jù)過少,701條貨車收費數(shù)據(jù)經(jīng)過四分位法篩選后的一天數(shù)據(jù)僅有675條,而客車篩選后的數(shù)據(jù)有4 234條。后續(xù)工作進一步將車型考慮在內(nèi),研究不同車型行程時間分布的相似性和差異性,為行程時間分布的研究提供數(shù)據(jù)支撐。
[1] 常安德. 基于GPS浮動車的路段行程時間采集方法研究[D].長春:吉林大學(xué),2009.
[2] 劉克. 高速公路的路段行程時間估計與預(yù)測方法研究[D].北京:北京交通大學(xué),2013.
[3] AREZOUMANDI M. Estimation of travel time reliability for freeways using mean and standard deviation of travel time[J]. Journal of Transportation Systems Engineering and Information Technology, 2011, 11 (6):74-84. DOI:10.16097/j.cnki.1009-6744.2011.06.024.
[4] 朱彥,曹彥榮,杜道生.城市快速路行程時間的統(tǒng)計分析與預(yù)測[J].交通運輸工程與信息學(xué)報,2009,7(1):93-97,103.
[5] 王翔,陳小鴻,楊祥妹. 基于K最近鄰算法的高速公路短時行程時間預(yù)測[J]. 中國公路學(xué)報,2015,28(1):102-111.
[6] 趙建東,王浩,劉文輝. 高速公路旅行時間的自適應(yīng)插值卡爾曼濾波預(yù)測[J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版),2014,42(2):109-115.
[7] 楊曉光,張汝華,儲浩,等. 基于高速公路收費系統(tǒng)的交通信息采集與處理基本問題研究[J]. 系統(tǒng)工程,2004,22(11):4-11.
[8] 楊慶芳,馬明輝,梁士棟,等. 基于收費數(shù)據(jù)的高速公路交通狀態(tài)判別方法[J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版),2014,42(12):51-57,76.
[9] 趙建東,王浩,劉文輝,等. 基于收費數(shù)據(jù)的高速公路站間旅行時間預(yù)測[J]. 同濟大學(xué)學(xué)報(自然科學(xué)版),2013,41(12):1849-1854. DOI:10.3969/j.issn.0253-374x.2013.12.014.
[10] 胡尚瑜,丁九成,李秋勝. 基于Bootstrap方法的近地風剖面參數(shù)分析[J]. 廣西大學(xué)學(xué)報(自然科學(xué)版),2015,40(4):856-861. DOI:10.13624/j.cnki.issn.1001-7445.2015.0856.
[11] 李長城,文濤,劉小明,等. 基于高速公路收費數(shù)據(jù)的行程時間可靠性模型研究[J]. 公路交通科技,2014,31(12):110-115. DOI:10.3969/j.issn.1002-0268.2014.12.018.
(責任編輯 黃 勇)
Reliability Estimation Model of Freeway Travel Time Based on Toll Data
ZHANG Tengyue,WENG Xiaoxiong
(School of Civil Engineering and Transportation, South China University of Technology,Guangzhou Guangdong 510640, China)
Mass freeway toll data contain various traffic information and are readily available. This paper analyzes the difference of travel time distributions of freeway passenger car and freight car and constructs different reliability estimation models for them. Then the paper fit above data with normal and lognormal distributions using MATLAB. The result shows that it’s acceptable to analyze the distributional characteristics of travel time for passenger car and freight car with normal distribution. The SSE, RMSE, and R-square of travel time distribution are better by model method than those by direct method. Finally, the reliability interval of both types of cars are compared and the result shows that it is more stable with model method under the same probability.
freeway toll data; travel time; reliability estimation; normal distribution; lognormal distribution
10.16088/j.issn.1001-6600.2016.04.011
2016-04-21
國家自然科學(xué)基金資助項目(51308227);廣東省交通運輸廳科技項目(科技-2015-02-076)
翁小雄(1958—),女,浙江杭州人,華南理工大學(xué)教授,博導(dǎo)。E-mail: ctxxweng@qq.com
U491
A
1001-6600(2016)04-0070-08