沈向前,余洋,吳偉
(1.中國有色金屬長沙勘察設(shè)計研究院有限公司,湖南 長沙 410117; 2.武漢大學(xué)遙感信息工程學(xué)院,湖北 武漢 430072;3.湖南省礦山安全智能化監(jiān)控技術(shù)與裝備工程技術(shù)研究中心,湖南 長沙 410117)
公交汽車是市民日常外出最常乘坐的交通工具之一,公共交通的快速發(fā)展有效緩解了道路擁堵的城市病,在方便市民出行的同時,也有助于減少碳排放[1]。但是在實際運營中,公交汽車行駛超速、不按線路行駛、進(jìn)站不減速、不靠邊、停靠位置不準(zhǔn)確等現(xiàn)象時有發(fā)生,甚至有到站不停、有客不載等行為。研究分析公交車到站??课恢玫木扔兄诎l(fā)現(xiàn)公交車??坎粶?zhǔn)確發(fā)生概率高的站點和車輛,針對性的進(jìn)行監(jiān)督和整改,以提高公交車服務(wù)的質(zhì)量,減少公交車事故的發(fā)生。
目前,大多數(shù)城市的公交車輛都配備有車載GPS和AFC數(shù)據(jù),積累了海量的公交軌跡數(shù)據(jù)和刷卡數(shù)據(jù)[2,3]。Qin LJ[4]等人基于GPS數(shù)據(jù)和刷卡數(shù)據(jù)對公交車服務(wù)的可靠性進(jìn)行了研究,Cortés[5]等人研究了基于GPS數(shù)據(jù)對商用公交汽車的速度分析,實現(xiàn)了對商業(yè)公交汽車速度的監(jiān)控。Nguyen K等人[6]采用行程時間可靠性、準(zhǔn)點性能和旅行時間等多項指標(biāo)對洛杉磯地鐵GPS數(shù)據(jù)進(jìn)行處理分析以及Web可視化。任慧君[7]等利用車載GPS軌跡數(shù)據(jù),提取駕駛過程中超速、急加速、急減速、急轉(zhuǎn)彎等潛在的不安全駕駛行為,對公交車駕駛安全性分析。霍豪[8]等人根據(jù)公交運行數(shù)據(jù)和天氣數(shù)據(jù)建立了一種公交車站點??繒r間預(yù)測模型,提高公交行程時間預(yù)測的準(zhǔn)確性。劉曉[9]等人采用出行時間鏈識別公交乘客的上、下車站點,通過公交大數(shù)據(jù)進(jìn)行了通勤時空分析。楊世軍[10]等人根據(jù)人工調(diào)查數(shù)據(jù),對城市公交車輛駐站時間進(jìn)行了特征分析和預(yù)測。上述研究主要分為兩類:一是利用公交軌跡數(shù)據(jù)識別公交車的駕駛行為對公交車的運行狀態(tài)、行程時間等進(jìn)行分析和預(yù)測,以提高公交車的服務(wù)質(zhì)量;二是利用公交軌跡和刷卡數(shù)據(jù)預(yù)測乘客通勤時間、出行OD(origin destination,OD),對乘客的出行行為進(jìn)行分析,通過大數(shù)據(jù)分析來合理調(diào)度公交車的運營時間與車次。
公交停靠站點的準(zhǔn)確與否也是影響公交服務(wù)質(zhì)量的因素,本文在前人對公交車大數(shù)據(jù)研究的基礎(chǔ)上,展開對公交車到站??课恢玫姆治?。原理上公交車到站??课恢每梢酝ㄟ^刷卡數(shù)據(jù)與GPS軌跡進(jìn)行時間匹配來推算,但在公交實際運營中,時常會出現(xiàn)行駛期間刷卡,尤其在早晚高峰時間段出現(xiàn)的頻率最高,會增加公交到站??课恢玫墓烙嬚`差,從而影響分析結(jié)果。本文提出利用加速度和刷卡時間語義特征識別公交車輛的到站停靠點,來減少時間匹配方法的誤差。其次使用DBSCAN聚類算法對公交線路的到站??奎c進(jìn)行聚類,降低GPS定位誤差對??奎c識別的影響,以獲取更加精確的公交到站??奎c和??繀^(qū)域。
為了分析公交車在公交站點??康木珳?zhǔn)程度,首先需要根據(jù)公交車GPS和AFC刷卡數(shù)據(jù)計算公交車在各個站點的停車坐標(biāo),然后將計算出來的停車坐標(biāo)與公交站點坐標(biāo)進(jìn)行匹配分析,以公交車在車站停車坐標(biāo)點的空間分布情況來評價公交車在各個站點的??烤?。
本研究使用的數(shù)據(jù)來自深圳大學(xué)空間信息智能感知與服務(wù)深圳市重點實驗室組織的“ISPRS Scientific Initiative——Open Data challenge”大賽項目。數(shù)據(jù)共有3個表,分別為:AFC刷卡數(shù)據(jù)、GPS軌跡數(shù)據(jù)和公交線路數(shù)據(jù),上述數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)及關(guān)聯(lián)關(guān)系如圖1所示:
圖1 數(shù)據(jù)表結(jié)構(gòu)及關(guān)聯(lián)關(guān)系
其中AFC刷卡數(shù)據(jù)、GPS軌跡數(shù)據(jù)中的日期跨度為7天,時間精確至秒。GPS軌跡數(shù)據(jù)的坐標(biāo)為WGS84地心坐標(biāo)系下的經(jīng)緯度,精確至小數(shù)點后6位,運行方向為0或1,分別代表公交車上行和下行。公交線路數(shù)據(jù)中只有線路編號和公交車編號的對應(yīng)關(guān)系,沒有公交站點坐標(biāo)信息,本文通過將GPS軌跡數(shù)據(jù)與百度地圖疊加顯示的方式進(jìn)行展示和相關(guān)的分析。
AFC刷卡數(shù)據(jù)有刷卡時間和公交車編號,可以在GPS軌跡數(shù)據(jù)中查詢對應(yīng)公交車編號的定位數(shù)據(jù),通過設(shè)定時間差半徑△T,可以計算落在刷卡時間TAFC緩沖區(qū)內(nèi),即滿足式(1)的GPS定位點數(shù)據(jù),其中時間差最小的GPS定位點通常認(rèn)定為公交車到站的停靠點[11,12]。
TAFCm-△T≤TGPSi≤TAFCm+△T
(1)
式(1)中TAFCm表示m次刷卡數(shù)據(jù)的時刻,TGPSi表示第i個GPS點的定位時刻,△T為時間緩存區(qū)半徑。
但是公交車日常運營中,經(jīng)常會出現(xiàn)同一個公交站有多名乘客刷卡乘車的情況。此外,在早晚高峰時段公交車內(nèi)乘客擁擠,部門乘客會選擇從后門上車,在公交車離站后一段時間才進(jìn)行刷卡,因此部分刷卡數(shù)據(jù)的時間與公交到站的時間不能完全匹配。
通過觀察分析公交車進(jìn)站前后的過程,可以發(fā)現(xiàn)公交車到站前后有3個步驟:減速進(jìn)站、停靠上下客、加速出站。在此過程中,公交車輛一直保持低速行駛,且公交車輛行駛速度由大變小,又從小變大,即公交車輛行駛的加速度a由“負(fù)值”變?yōu)椤罢怠?。由于同一公交線路的所有公交車輛都會在相同的公交站臺???,因此提取滿足式(2)和式(3)的GPS軌跡點,也可以被識別為公交車到站的??奎c。
VGPSi (2) aGPSi<0∧aGPSi+1>0 (3) 式(2)中VGPSi表示公交車在第i個GPS點位置的速度,V0表示公交車的速度閾值。式(3)中aGPSi、aGPSi+1分別表示公交車在第i個GPS點位置和第i+1個GPS點位置的加速度。 如圖2所示,AFC刷卡數(shù)據(jù)在時間上呈現(xiàn)聚集性,同一公交車站可能會有多次刷卡記錄,在道路擁堵等情況下,公交車在公交站附近可能會有多次停靠、也會出現(xiàn)在公交站外停車的情況,其行駛加速度也會表現(xiàn)由“負(fù)值”變?yōu)椤罢怠钡奶卣?。為了提高公交車到站停靠點識別的準(zhǔn)確率,本文同時使用公交車加速度和AFC刷卡時間兩種語義特征來識別公交車到站??奎c,GPS軌跡點i同時滿足式(1)、式(2)和式(3)時,將被標(biāo)記為公交車到站的??奎c。 圖2 到站??奎c識別示例到站??繀^(qū)域識別 公交車在城市環(huán)境中運行時,受多路徑效應(yīng)影響,其車載GPS定位有所下降[13],其定位精度在±15m左右,車載GPS系統(tǒng)和自動售票刷卡系統(tǒng)記錄的時間也存在基準(zhǔn)差異,導(dǎo)致通過公交車加速度和AFC刷卡時間兩種語義特征識別的公交車到站??奎c,仍然有一定的噪聲。因此,對單輛公交車一次的??奎c進(jìn)行精度評價意義不大。為了更加精準(zhǔn)、科學(xué)的分析評價公交車到站??康木龋疚膶痪€路多天到站??奎c進(jìn)行密度聚類[14],并通過求取聚類各個簇的最小外包凸多邊形表示公交車到站??繀^(qū)域。 DBSCAN是一種有代表性、有效的基于密度的聚類算法,與其他基于密度的聚類方法相比,DBSCAN有以下優(yōu)點[15]:①能夠?qū)г肼暤臄?shù)據(jù)進(jìn)行聚類分析;②不需要對數(shù)據(jù)分布做預(yù)先的假設(shè),即不需要預(yù)先設(shè)定分類(簇)的個數(shù);③能夠發(fā)現(xiàn)不同形狀的聚類簇,如:線狀簇、類圓形簇、凹形簇等。DBSCAN計算時需要輸入3個參數(shù):點數(shù)據(jù)(PtList)、掃描半徑(eps)和最小包含點數(shù)(minPts)。如果一個點的掃描半徑內(nèi)包含(相互之間距離小于eps)點個數(shù)超過minPts,則此點為核心點,落在此掃描半徑的點為邊界點;任意兩個距離小于eps的核心點將放在同一簇中;同樣,任何與核心點距離小于eps的邊界點也要放到與核心點相同的簇中;如果一個點既不是核心點也不是邊界點,則是噪聲點。DBSCAN聚類的效果如圖3所示。 圖3 DBSCAN核心點、邊界的和噪聲點 在DBSCAN聚類后通過Jarvis March算法求取各個簇的最小凸包,以最小外包凸多邊形表示公交車到站??繀^(qū)域。Jarvis March算法的原理是從最左邊的點(X坐標(biāo)值最小的點)開始,并沿逆時針方向不斷包裹點,具體算法如下:(1)初始化p為最左側(cè)的點。(2)循環(huán)執(zhí)行下面的操作,直到再次到達(dá)起點。①將當(dāng)前點p添加至結(jié)果中;②搜索點q,使得p,q對于任意點i的方向(p,q,i)都是逆時針方向,令p=q。Jarvis March算法的執(zhí)行過程如圖4所示。 圖4 Jarvis March算法執(zhí)行過程停靠精度評價 本文通過DBSCAN對同一公交線路多天到站??奎c進(jìn)行聚類分析,刪除噪聲點后,通過計算凸包的算法精確識別公交車到站??繀^(qū)域,識別的到站??繀^(qū)域與對應(yīng)公交站相匹配后,可以直觀的對比公交車在不同公交站到站??康木珳?zhǔn)情況,識別效果如圖5所示。 圖5 到站停靠區(qū)域識別示意圖 為了對公交車到站??烤冗M(jìn)行量化評價,首先將公交到站停靠區(qū)域疊加至百度地圖,與對應(yīng)公交線路的站點進(jìn)行匹配,然后計算公交車站標(biāo)準(zhǔn)停車位面積與對應(yīng)的公交到站??繀^(qū)域面積的比值,以其比值評價公交車在此站??康木?,計算方法見式(4)。通過現(xiàn)場調(diào)查,一般公交車站標(biāo)準(zhǔn)停車位長約 15 m、寬約 3.5 m,同時考慮到公交車車載GPS的定位精度不高(市區(qū)定位精度在 15 m左右),本文計算標(biāo)準(zhǔn)停車位面積時按照長 45 m、寬 33.5 m計算,面積為 1 507.5 m2。 (4) 式(4)中areastation表示公交車站標(biāo)準(zhǔn)停車位面積,areastop表示公交到站??繀^(qū)域面積,score表示公交車在此公交站點的停靠精度評分。 以深圳市337路公交7天共92萬條GPS數(shù)據(jù)和13萬條AFC刷卡數(shù)據(jù)為例,根據(jù)公交車停靠精度分析模型計算337路公交7天上行、下行公交車到站停靠點和??繀^(qū)域。由于公交GPS軌跡數(shù)據(jù)的坐標(biāo)系和百度地圖的坐標(biāo)系不一致,首先需要將公交GPS軌跡數(shù)據(jù)從WGS84坐標(biāo)系轉(zhuǎn)換至bd09ll坐標(biāo)系。然后根據(jù)轉(zhuǎn)換后的GPS點和AFC刷卡數(shù)據(jù)依次求取每條公交線路的到站??奎c和到站??繀^(qū)域。圖6展示了識別出來的337路公交車下行到站??奎c和??繀^(qū)域。通過與百度地圖的公交線路疊加顯示,可以看到識別出來的公交??繀^(qū)域和公交車站的位置吻合程度很高,而且不同站點的??繀^(qū)域面積差異也比較大。在到站??奎c、??繀^(qū)域識別完成后,使用緩沖區(qū)分析的方法將公交車站和對應(yīng)的??繀^(qū)域進(jìn)行匹配,如果公交車站的緩沖區(qū)內(nèi)有多個??繀^(qū)域時,保留??奎c個數(shù)最多的??繀^(qū)域。最后,依次計算公交車在每個站點的停靠位置精度。表1列出了337路公交車7天上行、下行的到站??课恢镁鹊牟糠纸y(tǒng)計結(jié)果。 表1 337路公交車7天上行、下行的到站??课恢镁鹊牟糠纸y(tǒng)計 圖6 337路公交車下行到站停靠點、??繀^(qū)域識別 337路上行經(jīng)停公交站74站、下行經(jīng)停公交站79站,合計153站,識別并匹配成功的上行到站??繀^(qū)域72個、下行到站??繀^(qū)域62個,合計134個,識別成功率達(dá)87.58%,對337路公交車識別出來的134個到站停靠區(qū)域進(jìn)行精度評分,??烤鹊梅秩鐖D7所示。 圖7 337路公交車到站??烤鹊梅址植紙D 通過分析337路的??烤仍u分情況,可以發(fā)現(xiàn)??恳?guī)范(100分)的共有45站、占比33.58%,停靠基本規(guī)范(60分以上)的共有75站、占比55.97%,??坎灰?guī)范的共有59站、占比44.03%。評價數(shù)據(jù)表明公交車到站??坎灰?guī)范的現(xiàn)象發(fā)生的頻率仍然很高,公交運營公司可以對??烤仍u分靠后的公交站點進(jìn)行現(xiàn)場檢測,分析公交車??坎粶?zhǔn)的具體原因,由于公交車司機駕駛習(xí)慣不好造成??坎粶?zhǔn)的應(yīng)該進(jìn)行監(jiān)督和處罰,由于站點設(shè)置不合理造成??坎粶?zhǔn)的應(yīng)該進(jìn)行改造,以提高公交車服務(wù)的質(zhì)量。 采用公交GPS和AFC刷卡數(shù)據(jù)能獲取公交車到站停靠的位置坐標(biāo),為分析評價公交車到站停靠位置精度提供精準(zhǔn)數(shù)據(jù)?;诩铀俣忍卣骱Y選GPS軌跡點能明顯提高DBSCAN聚類的速度,同時使用加速度和刷卡時間雙重語義特征的公交車到站??奎c提取算法精度更高,可準(zhǔn)確篩選出來公交車到站??奎c,識別成功率超過85%。通過對公交車??烤冗M(jìn)行評價能夠發(fā)生不規(guī)范停靠現(xiàn)象多發(fā)的公交站點,可根據(jù)評價結(jié)果對??烤容^差的站點進(jìn)行針對性的現(xiàn)場檢測,為公交車進(jìn)站規(guī)范評價和檢查整改提供了新思路。 由于本文使用的公交GPS和AFC數(shù)據(jù)是歷史存檔數(shù)據(jù),時效性不夠強,因此無法反映當(dāng)前公交車到站??康囊?guī)范程度,有條件的可以結(jié)合當(dāng)前的數(shù)據(jù)進(jìn)行實驗,并可對比分析不同時段、不同地域的公交車到站??烤惹闆r。4 案例分析
5 結(jié) 語