国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于公交運行數據的到站時間填充方法

2020-08-27 11:27:12張可朱遠祺沈潔楊子帆錢慧敏王貝貝
山東科學 2020年4期
關鍵詞:時刻表間隔公交

張可,朱遠祺,沈潔,楊子帆,錢慧敏,王貝貝

(1.北京市運輸管理技術支持中心,北京 100073;2. 北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100044;3. 北京市交通運行監(jiān)測調度中心,北京 100073)

近年來,隨著我國經濟的飛速發(fā)展,城市化進程加快,機動車出行比例提高,為了緩解制約城市擴張和經濟發(fā)展的交通擁堵問題,政府大力發(fā)展公共交通[1-4]。為全面貫徹城市公交優(yōu)先的政策,交通管理者需要掌握動態(tài)公交數據,深入了解公交運行特征,才能把握居民的公交出行行為規(guī)律,評估公交運行狀態(tài),制定科學的管理規(guī)劃政策。目前的公共交通大數據主要包括交通基礎路網數據、公交線網數據、車輛動態(tài)運行數據、用戶刷卡數據、公交運營調度數據等幾大類,這些數據是分析公交客流行為的基礎,尤其是通過公交實時到站數據,可以實現(xiàn)對乘客的刷卡行為分析[5-9],從而有效地鑒別和處理客流數據。

由于每天產生的公交數據眾多,數據缺失的現(xiàn)象并不少見。公交數據缺失直接影響對車輛的有效控制和對客流的細化分析,對規(guī)劃管理和科學決策造成極大的影響,但是目前對于公交缺失數據的填充和處理方法研究仍處于較不成熟階段,因此對公交缺失數據填充方法的進一步探究是有必要的。公交數據的缺失主要由GPS數據的不穩(wěn)定性、GPS設備損壞、車輛狀態(tài)和信號的不穩(wěn)定性導致鑒于此,本文提出通過分析交通狀態(tài)的類型以及駕駛員和車輛的特點,以車輛擁堵具有傳播效應為前提假設[10-11],用其他路段、其他車輛的信息來模擬當前車輛的方法來填充缺失的公交數據。該方法充分考慮缺失站點數據的影響因素,使填充數據可靠性提高。

1 公交到站數據與影響因素

1.1 數據格式

公交到站數據是客流分析的底層數據,主要包括基礎信息(數據記錄日期、到站時間、線路總車站數)、站點信息(線路號、線路方向、站名、站序號)、車輛信息(車輛編號、車輛狀態(tài)),詳見表1。

表1 公交到站數據說明Table 1 Bus arrival data description

1.2 影響因素

公交車輛在道路網絡的運行狀態(tài)會受到車輛、道路、駕駛員、乘客、實時路況等各類因素的影響[5],具體可分為:(1)車輛因素。車輛的大小、能源動力類型、車輛自身特性、GPS設備狀態(tài)等會對車輛的行駛產生影響。(2)道路因素。路面狀況、車道數、道路的等級和通行能力等都會對公交車運行情況產生影響。(3)駕駛員因素。公交司機的駕駛習慣、駕駛熟練程度、加減速特性等原因可能對車輛的駕駛時間產生影響。(4)乘客因素。上下車乘客的數量及類型比例會影響公交的運行。乘客數量較多時,公交停站時間會大大增加;乘客數量較少時,公交停站時間則會略少。當上下車乘客中老年人居多時,公交停站時間也會有所上升。(5)實時路況因素。在同一天的不同時段,公交的運行情況會產生較明顯的規(guī)律性差異。例如在一天的早高峰和晚高峰時段,道路交通的擁堵將會導致運行時間增加;工作日與非工作日,道路狀況也會發(fā)生動態(tài)的變化,從而影響車輛運行時間。

1.3 存在問題

每日產生的公交數據數量大,且未經處理的原始數據中存在一定的數據質量問題,公交 IC 卡刷卡和公交 GPS 數據在傳回的過程中,由于設備故障、信號中斷等問題,傳回的數據存在一定的質量缺陷。另外,原始數據中的噪聲數據、離群數據、重復數據等問題會對數據分析的結果造成影響。公交數據存在的主要問題有數據缺失、數據重復等。

1.3.1 數據部分缺失

由于GPS 信號的接收容易受到高大建筑物、山體的影響,在隧道時還會出現(xiàn)信號中斷的情況,加之車輛狀態(tài)的不穩(wěn)定,易導致部分站點或乘客刷卡數據的缺失。部分數據的缺失可以依靠缺失部分前后的交通狀態(tài)、前后車輛及路段和歷史運行時刻表等進行填充。

1.3.2 數據大量缺失

部分車輛的GPS設備故障或數據導入過程中的數據丟失會導致該車數據的大量缺失。與數據部分缺失不同,數據大量缺失難以依靠后期填充,所以需要重新根據GPS或者AFC(automatic fare collection system)補全。

1.3.3 數據重復

數據重復問題主要由機械原因和人為原因導致。機械原因是由于機械因素導致的數據收集或保存的失敗造成的數據缺失,比如數據存儲的失敗、存儲器損壞、GPS設備故障導致某段時間數據未能收集(對于定時數據采集而言)。人為原因是由于人的主觀失誤、歷史局限或有意隱瞞造成的數據缺失。

2 公交實時到站數據的填充方法

2.1 數據預處理

由于公交實時到站數據由每輛車的按時間排序的到站數據組成,其中不包含班次信息以及車輛運營信息。此外,數據中可能還存在不完整、噪聲、不一致等問題。為了獲取車輛的班次,以及各個站點的到發(fā)時間,需要對原始的到站數據進行數據預處理、數據清理、數據篩選、數據生成等步驟。

(1)數據清理。刪除明顯不合理的運營數據。研究發(fā)現(xiàn),本研究所刪除的不合理的公交實時到站數據中,冗余的數據量約占1.2%;公交運行數據中總運營時間小于平均時間的1/10,或者大于平均時間的10倍的數據,約占0.4%。刪除的數據量較小,不影響后續(xù)的數據分析。

(2) 數據篩選。去除車輛長時間停站,以及重復的到站數據,保證處理后的數據具有唯一性,用于后續(xù)的公交實時到站數據處理。

(3) 數據生成。將不同類型的文件集成到統(tǒng)一的數據庫,并按照到站時間和方向的時間和空間邏輯關系,設定合理規(guī)則生成車輛運營的班次,以及初始化的車輛運行時刻表。對于到站時間不滿足前后時間邏輯的數據進行剔除。這里,前后時間邏輯是指對于某輛公交車,第i個站的到達時間必須大于第i-1個站的到達時間,小于第i+1個站的到達時間。

2.2 實時到站數據填充

針對公交實時到站缺失數據的補充方法,主要以近鄰填充法、線性插值法和均值常量填充法為主。近鄰填充法主要是通過選定缺失點相鄰的3個或多個站點,根據這些相鄰站點所提供的相關信息,對缺失點進行估算。該方法簡單易操作,但當數據量較大時,所得的填充結果準確度會大幅下降。均值常量填充法是采用均值或眾數對缺失點進行填充,所得結果粗糙,且有時甚至會對最終結果產生負面影響。

線性插值是指采用一次多項式(線性函數)的插值方法,如式(1)所示,通過連接兩個已知量來確定未知量的方法。與其他非線性插值方法相比,線性插值具有簡單、易實現(xiàn)的特點。但是,線性插值后的公交實時到站數據可能存在一定的邏輯問題,如車輛運行速度、區(qū)間運行時間相互關聯(lián)關系等。

(1)

為了解決傳統(tǒng)方法出現(xiàn)的問題,本文提出的公交實時到站數據填充方法考慮了與公交數據聯(lián)系密切的三項因素:前后車的影響、前后路段的影響、多天的車輛運行時刻表,使填充的數據更具可靠性與真實性。該方法的主要步驟如下:

(1)查找當日所有運營車輛,循環(huán)查找每一輛車的到站數據,并按照時間排序。

(2)對于每輛車,按照運行方向的發(fā)生變化的情況,生成不同的車次。車次從0開始累計編號。

(3)對于每個車次,記錄第一個和最后一個有到站數據的站序號start_station_index和end_station_index。確定車輛運行站間數量N=(end_station_index - start_station_index + 1),如果20%L≤N≤50%L(L為線路車站總數量),則確定為區(qū)間車;如果N< 20%L,則定義為無效車(需要根據實際進行調整)。

(4)對于首尾數據缺失的區(qū)間,對于前后車數據不足的區(qū)間,按照自由流速度v=25 km/h和站間距計算時間進行補全;對于前后車數據充足的區(qū)間,按照前車和后車的運行時間進行統(tǒng)計分析,采取多項式插值擬合的方法對缺失區(qū)間的數據進行補全。

(2)

3 案例分析

3.1 數據說明

以北京市連接城區(qū)與北部郊區(qū)某大型居住區(qū)的公交骨干線路(線路A)為例研究,2019年1月1日—31日運營時段內,線路A的上行和下行的實時到站數據,該線路總長度約21 km。2019年1月工作日最高運營車輛數40輛,工作日平均實際運營車輛數為36輛,日均運行220車次,其中出城方向109車次,進城方向111車次,工作日日均運行237車次,非工作日均運行179車次。實時到站數據日均4412條,存在一定的缺失問題。

3.2 填補結果

根據本文提出的方法對公交實時到站數據進行填補,得到了線路A上行、下行方向的實時公交到站信息以及時刻表,其中上下行未進行修正補全的時刻表如圖1(a)和圖1(c)所示,修正補全后的時刻表如圖1(b)和圖1(d)所示。圖1中各圖的橫坐標為時間,縱坐標為車輛位置到上行始發(fā)站的距離。從運行圖可以看出,線路A的車輛運行時間基本穩(wěn)定,單程運行時間約為70 min。在14:00—17:00,12 km附近出現(xiàn)了局部的擁堵。在圖1(a)和圖1(c)中未補全的時刻表存在時刻表車輛軌跡交叉、數據缺失等問題,尤其是在首末站處問題較為嚴重。通過本文提出的方法進行數據處理與補全后,如圖1(b)和圖1(d)中以上問題得到處理。

圖1 線路A修正前后時刻表Fig.1 Modifed bus timetable of Line A

根據修正補全的實時到站數據,可以對公交車輛的大間隔區(qū)間進行有效分析。圖2為車站B填充前后的車輛到站數據,橙色線為原始數據,藍色線為補全數據。由圖可知,原始數據只記錄了34條,表明某些車輛到站時間數據缺失,導致計算到站時間間隔變大。將每輛車到站時間補全后(藍色線),數據計算到站時間間隔明顯減小,表明補全結果可信度較高。由于近鄰填充法僅考慮該輛車周圍相鄰站點的運行時間,計算得到運行圖僅考慮了當前車的運行情況,很容易產生車輛密集或者大間隔的情況。由本文提出的方法得到的運行圖考慮了車輛之間的相互影響,因此能夠得到較為穩(wěn)定的運行間隔。

圖2 車站B發(fā)車時間間隔Fig.2 Bus departure time interval at Station B

3.3 運行間隔與串車分析

圖3為線路A下行(進城方向)的跟蹤間隔大于15 min到站時間時空分布圖(站名已省略)。由圖可知,城區(qū)路段易出現(xiàn)大間隔,且大間隔時間較長,公交運行可靠性較低;大間隔多發(fā)生在平峰時段;平峰時段中12:00—15:00之間發(fā)生大間隔變大,導致大間隔次數增多。

圖3 線路A下行運行間隔分析Fig.3 Analysis of the bus running time interval of Line A in the downward direction

圖4為線路A上行(出城方向)的跟蹤間隔大于15 min到站時間時空分布圖。由圖可知,相較進城方向出現(xiàn)大間隔現(xiàn)象的高頻率,出城方向出現(xiàn)大間隔現(xiàn)象明顯較少。其中,大羊坊公交站以北路段發(fā)生大間隔的頻率較高,公交運行可靠性較低。

圖4 線路A上行運行間隔分析Fig.4 Analysis of the bus running time interval of Line A in upward direction

圖5分別為線路A下行(進城方向)與上行(出城方向)跟蹤間隔小于1 min的到站時間時空分布圖。

圖5 到站時間間隔分布Fig.5 Distribution of the arrival time interval

總體而言,進城方向的串車情況易發(fā)生在早晚高峰及后半段路段。14:00—18:00時間段內和22:00之后,公交串車現(xiàn)象減少。早晚高峰的串車現(xiàn)象均是從和平西橋北站開始加劇,說明該路段在高峰時段較為擁堵,站點延誤較大。自地鐵立水橋之后,道路擁堵緩解,串車現(xiàn)象開始減少。

表2分別為線路A上行、下行各運行區(qū)間的車輛平均行駛速度。進城方向的低效運行區(qū)間明顯多于出城方向,進城方向的區(qū)間4、11、24及出城方向的區(qū)間3和8為運行效率較低的站點區(qū)間。

表2 區(qū)間平均運行時間分析Table 2 Intersection average travel time analysis

4 結論

針對國內對公交缺失數據的填充方法研究較少,且現(xiàn)存填充方法精準度與可靠性低的問題,本文提出一種在車輛擁堵具有傳播效應的前提下,綜合考慮前后車輛、路段狀態(tài)模擬當前車輛的方法來填充缺失的公交數據。該方法充分考慮缺失段周圍的影響因素,對缺失數據進行有效填充,數據計算到站時間間隔明顯減小,使補全數據的可靠性更高。最后,以北京某條公交線路的實時到站數據進行算例計算和分析,結果表明,填充后的數據質量較原始數據大幅提升,各到站時間間隔均處于一個較為合理的范圍內,數據分布更為密集,且可靠性更高,有效證明了該填充方法對公交數據分析的實用性。

猜你喜歡
時刻表間隔公交
一元公交開進太行深處
間隔問題
城市軌道交通時刻表調整服務器故障分析及探討
令你誤車的列車時刻表
知識窗(2019年5期)2019-06-03 02:16:14
間隔之謎
等公交
等公交
城市軌道交通ATS系統(tǒng)的時刻表同步機制研究
上樓梯的學問
短文改錯
鲁甸县| 通辽市| 乌拉特中旗| 邹城市| 宜阳县| 广平县| 廉江市| 山阴县| 镇赉县| 木兰县| 洞头县| 潜山县| 饶河县| 伊金霍洛旗| 抚州市| 溧阳市| 陈巴尔虎旗| 富阳市| 翁牛特旗| 玛纳斯县| 武隆县| 孙吴县| 兴安盟| 济源市| 望江县| 成安县| 海口市| 凉山| 长兴县| 林周县| 巴林右旗| 罗甸县| 上饶县| 贡觉县| 广河县| 旅游| 班玛县| 马龙县| 白玉县| 莱西市| 肇州县|