国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市公交GPS數(shù)據(jù)與IC卡數(shù)據(jù)時(shí)空特性融合算法*

2021-06-14 15:54:44左精力王秋平
交通信息與安全 2021年2期
關(guān)鍵詞:平均偏差IC卡刷卡

左精力 王秋平 陳 君

(西安建筑科技大學(xué)土木工程學(xué)院 西安710055)

0 引 言

城市公交系統(tǒng)在運(yùn)行過程中產(chǎn)生大量公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù),其具有采集方便、樣本量大、覆蓋面廣、連續(xù)記錄等優(yōu)點(diǎn)信息[1-2],若能準(zhǔn)確獲得公交IC卡乘客的上車站點(diǎn)信息,可為公交系統(tǒng)的規(guī)劃和管理提供重要的決策信息[3-5]。

對(duì)于公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù)有對(duì)應(yīng)關(guān)系表,且公交時(shí)刻表完整的情況,為了推算IC卡數(shù)據(jù)對(duì)應(yīng)站點(diǎn)信息,Zhao等[6]結(jié)合AFC及AVC數(shù)據(jù)獲取上車站點(diǎn);BARRY等[7]利用GPS數(shù)據(jù)和IC卡數(shù)據(jù)進(jìn)行融合,獲取到公交車行駛?cè)罩荆眯旭側(cè)罩炯叭诤蠑?shù)據(jù)推算上車站點(diǎn);馬曉磊等[8]對(duì)北京公交GPS數(shù)據(jù)和IC卡數(shù)據(jù)通過SIM卡信息進(jìn)行融合,推算上車站點(diǎn);陳君等[9]將公交IC卡數(shù)據(jù)與公交GPS數(shù)據(jù)進(jìn)行關(guān)聯(lián),結(jié)合調(diào)度數(shù)據(jù)推算公交IC卡乘客上車站點(diǎn);秦政[10]通過對(duì)公交IC卡和GPS數(shù)據(jù)的分析,給出了利用IC卡和GPS數(shù)據(jù)推導(dǎo)乘客上下車站點(diǎn)的判別方法。對(duì)于公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù)有對(duì)應(yīng)關(guān)系表,但二者存在系統(tǒng)時(shí)間差的情況,為了推算IC卡數(shù)據(jù)對(duì)應(yīng)站點(diǎn)信息,陳紹輝等[11]對(duì)北京公交GPS數(shù)據(jù)和IC卡數(shù)據(jù)首先推算站點(diǎn)運(yùn)行時(shí)間,進(jìn)行首站匹配獲得時(shí)間偏差后,利用禁忌搜索算法進(jìn)行二次匹配;李海波等[12]為了修正公交IC卡數(shù)據(jù)時(shí)間偏差,提高上車站點(diǎn)識(shí)別的準(zhǔn)確性,在分析公交乘客上車刷卡行為的基礎(chǔ)上,提出了基于AVL數(shù)據(jù)的公交IC卡數(shù)據(jù)時(shí)間修正方法;程曉明等[13]通過密度聚類算法對(duì)IC卡數(shù)據(jù)進(jìn)行聚類,尋找刷卡中值,再結(jié)合公交時(shí)刻表站點(diǎn)匹配求系統(tǒng)時(shí)間差,利用禁忌搜索算法進(jìn)行二次匹配。

但對(duì)于GPS數(shù)據(jù)和IC卡數(shù)據(jù)無直接對(duì)應(yīng)關(guān)系表,且系統(tǒng)存在不規(guī)律時(shí)間差的情況,還沒有較完整的數(shù)據(jù)融合算法。針對(duì)此種情況,以西安市公交數(shù)據(jù)為例,采用位置匹配、時(shí)間最大相似度、時(shí)間平均偏差算法,對(duì)二者的數(shù)據(jù)進(jìn)行融合算法研究,并以南寧市已知對(duì)應(yīng)關(guān)系的公交數(shù)據(jù)進(jìn)行算法驗(yàn)證,讓原本沒有關(guān)聯(lián)的2個(gè)數(shù)據(jù)一一對(duì)應(yīng),從而可以方便的計(jì)算上車刷卡的時(shí)間、線路和位置。

1 數(shù)據(jù)描述

采用西安市2017年某1 d的公交數(shù)據(jù),包括公交GPS數(shù)據(jù)和IC卡數(shù)據(jù),公交GPS數(shù)據(jù)來自公交調(diào)度管理系統(tǒng),公交刷卡數(shù)據(jù)來自公交運(yùn)行收費(fèi)系統(tǒng)。從網(wǎng)絡(luò)爬取公交線路站點(diǎn)數(shù)據(jù)(精度<20 m),基本數(shù)據(jù)結(jié)構(gòu)見表1。

表1 基本數(shù)據(jù)結(jié)構(gòu)Tab.1 Basic data structure

1)GPS數(shù)據(jù)(Data_A)。包含217條線路5 192輛公交車,共計(jì)21 104 785條軌跡記錄。軌跡記錄時(shí)間間隔為1~30 s的不規(guī)則分布,時(shí)間精度為1 s;線路編號(hào)和車輛編號(hào)不能對(duì)應(yīng)實(shí)際線路和車輛;坐標(biāo)采用WGS-84世界坐標(biāo)系。

2)IC卡數(shù)據(jù)(Data_B)。取與GPS軌跡數(shù)據(jù)同時(shí)間段的數(shù)據(jù)集,包含192條線路5 413個(gè)設(shè)備,共2 997 772行記錄。其中刷卡模式為上車刷卡,時(shí)間精確到1 s。線路編號(hào)、車輛編號(hào)不能對(duì)應(yīng)實(shí)際線路、車輛。

3)公交站點(diǎn)坐標(biāo)數(shù)據(jù)(Data_C)。通過Python數(shù)據(jù)爬取全市區(qū)385條公交線路數(shù)據(jù),坐標(biāo)轉(zhuǎn)換為WGS-84世界坐標(biāo)系(原為百度BD-09坐標(biāo)系)。

數(shù)據(jù)特征如下。

1)GPS數(shù)據(jù)、IC卡數(shù)據(jù)沒有標(biāo)明實(shí)際線路名,沒有刷卡站點(diǎn)數(shù)據(jù)。

2)Data_A與Data_B中時(shí)間不同步,有未知時(shí)間差,且每臺(tái)車時(shí)差不等。

3)各數(shù)據(jù)源的線路、車輛、卡號(hào)等無對(duì)應(yīng)關(guān)系表。

2 數(shù)據(jù)融合算法

為了獲得每個(gè)刷卡記錄的實(shí)際上車站點(diǎn)和實(shí)際線路,需要先解決公交GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)融合問題,基于數(shù)據(jù)類型和特點(diǎn),為實(shí)現(xiàn)2個(gè)數(shù)據(jù)庫融合,需要解決以下5個(gè)問題。

1)判斷GPS數(shù)據(jù)(Data_A)中每輛公交實(shí)際對(duì)應(yīng)的公交線路。

2)根據(jù)實(shí)際公交線路站點(diǎn)信息和GPS數(shù)據(jù),判斷每輛公交的運(yùn)行時(shí)刻表。

3)計(jì)算GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)的設(shè)備號(hào)對(duì)應(yīng)關(guān)系。

4)計(jì)算GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)的時(shí)間修正值。

5)計(jì)算IC卡數(shù)據(jù)(Data_B)每條記錄實(shí)際線路、站點(diǎn)名。

2.1 公交車輛GPS數(shù)據(jù)與公交線路匹配

公交車大部分時(shí)間運(yùn)行在固定線路上,且城市中不存在具有完全相同路徑的不同公交線路。常用的4種基于距離的軌跡相似性度量算法,分別為離散弗雷歇距離(DFD)[14]、動(dòng)態(tài)時(shí)間規(guī)整(DTW)[15]、最長(zhǎng)公共序列(LCS)[16]以及實(shí)序列編輯距離(EDR)[17],本研究通過DFD進(jìn)行相似度計(jì)算(見式(1)~(2)),可以求出二者的對(duì)應(yīng)關(guān)系。

式中:gps_A為公交GPS軌跡向量[Lon,Lat];gps_C為公交線路站點(diǎn)坐標(biāo)向量[ZD_Lon,ZD_Lat];A d為軌跡向量gps_A中每個(gè)點(diǎn)到gps_C中最近點(diǎn)組成的距離向量。

式中:num(Ad

K AC越大,則軌跡向量gps_A越相似于軌跡向量gps_C。同理,互換gps_A和gps_C在式(1)中的位置,可求得相似度K CA。對(duì)于Bus_m線路Bus_i公交全天軌跡向量gps_A,和所有線路站點(diǎn)向量遍歷計(jì)算,分別求最大K AC和K CA對(duì)應(yīng)線路,若二者大于判斷閾值且對(duì)應(yīng)的同1條線路,則可判斷Bus_m線路Bus_i公交與此實(shí)際線路高度相似,可以判斷二者具有實(shí)際對(duì)應(yīng)關(guān)系。

2.2 公交運(yùn)行時(shí)刻表判斷

公交車輛一般按計(jì)劃在固定線路上逐個(gè)站點(diǎn)停靠,因此具有固定的停靠點(diǎn)和固定的運(yùn)行方向。車輛運(yùn)動(dòng)狀態(tài)下GPS有慣性方向修正,在車輛停止情況下可能會(huì)出現(xiàn)不同程度的位置漂移,而車輛運(yùn)行時(shí)刻表主要是車輛停車靠站時(shí)間,如果直接采用未經(jīng)處理的GPS數(shù)據(jù)進(jìn)行判斷,會(huì)出現(xiàn)較大的偏差,因此需要先對(duì)原始的GPS數(shù)據(jù)根據(jù)實(shí)際情況進(jìn)行數(shù)據(jù)清洗,然后再進(jìn)行停車靠站判斷。

2.2.1 GPS數(shù)據(jù)(Data_A)清洗

軌跡數(shù)據(jù)清洗旨在去除軌跡中的冗余點(diǎn)和噪音點(diǎn),常采用曲線擬合、特征分析等方法進(jìn)行處理[18]。根據(jù)需要去掉漂移點(diǎn),保留正確的位置記錄,通過大量的數(shù)據(jù)觀察發(fā)現(xiàn)GPS軌跡數(shù)據(jù)是間隔的若干時(shí)間序列位置點(diǎn),前后的時(shí)差、距離、速度、轉(zhuǎn)角數(shù)值都在一定范圍內(nèi),數(shù)據(jù)特征如下。

時(shí)差dt∈[1,1 200],時(shí)差為前后2點(diǎn)記錄的時(shí)間差,s。時(shí)差為0則表明數(shù)據(jù)重復(fù)記錄,時(shí)差較大時(shí)則可能是非行駛狀態(tài)。距離dl∈(0,2 000],為前后2點(diǎn)的直線距離,m。前后距離應(yīng)該大于0,距離過大則可能是信號(hào)中斷。速度dv∈(0,50],前后2點(diǎn)距離和時(shí)間的比值,km/h。前后速度應(yīng)大于0,城市公交運(yùn)營(yíng)車速一般不大于50 km/h。轉(zhuǎn)角dθ∈[100°,180°],車輛實(shí)際軌跡一般不會(huì)出現(xiàn)小轉(zhuǎn)角,小轉(zhuǎn)角一般為漂移點(diǎn)。

根據(jù)以上規(guī)律,對(duì)Data_A進(jìn)行軌跡數(shù)據(jù)清洗流程如下。

步驟1。按時(shí)間排序,計(jì)算前后相鄰2點(diǎn)的dl,dt,dv,dθ。

步驟2。去除dl,dt,dv,dθ閾值外所在行記錄;

步驟3。重復(fù)步驟1~2,計(jì)算2次,完成數(shù)據(jù)清洗,獲得清洗后軌跡數(shù)據(jù)Data_a。

數(shù)據(jù)清洗前后的效果見圖1。

圖1 數(shù)據(jù)清洗Fig.1 Trajectory data cleaning

2.2.2 公交車輛運(yùn)行時(shí)刻表判斷

公交車輛在固定線路上運(yùn)行,遇到計(jì)劃內(nèi)的站點(diǎn)需要減速停車靠站,乘客上下完成后加速離開前往下1站,無乘客上下車時(shí)仍需要進(jìn)站??俊?duì)于已知實(shí)際運(yùn)行線路的某1個(gè)具體公交運(yùn)行軌跡,可以根據(jù)軌跡點(diǎn)與站點(diǎn)的距離判斷是否通過了站點(diǎn)。但因?yàn)镚PS數(shù)據(jù)精度問題,僅采用距離判斷會(huì)將部分對(duì)向站點(diǎn)識(shí)別為??空?,因此需要增加行車方向和線路方向一致性判斷,公交車輛運(yùn)行時(shí)刻表判斷流程如下。

步驟1。對(duì)公交站點(diǎn)坐標(biāo)數(shù)據(jù)(Data_C)按照實(shí)際運(yùn)行排布,計(jì)算每1站到下1站的運(yùn)行方向角dθc(方向角為與正北方向順時(shí)針小于360°的夾角)。

步驟2。對(duì)清洗后軌跡數(shù)據(jù)(Data_a),計(jì)算每1個(gè)點(diǎn)運(yùn)行方向角dθa;計(jì)算每1個(gè)站點(diǎn)距離閾值dlc范圍內(nèi)的軌跡點(diǎn),當(dāng)這些軌跡點(diǎn)對(duì)應(yīng)的方向角dθa與dθc夾角小于10°時(shí),可判斷這些軌跡點(diǎn)對(duì)應(yīng)的時(shí)間段是車輛停車靠站的時(shí)間段,見圖2。

步驟3。某線路上某輛車的軌跡,計(jì)算所有站點(diǎn)對(duì)應(yīng)的到站時(shí)間段,可得到此車輛在當(dāng)天的運(yùn)行時(shí)刻表矩陣Stop_t。

圖2 車輛軌跡與公交站點(diǎn)位置關(guān)系Fig.2 Relationship between vehicle curves and bus stop location

2.3 刷卡數(shù)據(jù)時(shí)間修正與GPS數(shù)據(jù)關(guān)聯(lián)分析

取1輛車1 d的運(yùn)行時(shí)刻表矩陣Stop_t,在IC卡記錄中任取1輛車當(dāng)天的刷卡時(shí)間記錄Card_t,若Card_t中時(shí)間大部分落在Stop_t的記錄范圍內(nèi),則二者大概率是同1輛車產(chǎn)生的數(shù)據(jù)(見圖3),否則二者大概率沒有聯(lián)系,見圖4。

圖3 公交到站時(shí)間與刷卡時(shí)間匹配Fig.3 Bus arrival time matching the time for swiping cards

圖4 公交到站時(shí)間與刷卡時(shí)間不匹配Fig.4 Bus arrival time not matching the time for swiping cards

另外根據(jù)實(shí)際運(yùn)行狀況和數(shù)據(jù)觀察,每輛車的刷卡系統(tǒng)時(shí)間不統(tǒng)一,存在未知時(shí)間偏差,需要對(duì)每輛車的刷卡時(shí)間做修正。對(duì)于某1個(gè)Stop_t和任1個(gè)Card_t,可以計(jì)算二者在dt i修正下的時(shí)間相似度和累計(jì)時(shí)間偏差值,從而判斷二者是否存在對(duì)應(yīng)關(guān)系。

2.3.1 時(shí)間相似度

對(duì)絕大部分車輛,1 d的Card_t數(shù)量足夠大,Card_t在dt i修正下落在Stop_t停車區(qū)間上的數(shù)量與Card_t自身數(shù)量的比值,可以用來表征二者的相似程度,相似度足夠大則可判斷二者可能相似。通過計(jì)算dt i∈[t1,t2]的所有相似度,并繪制曲線,若超過閾值且具有明顯凸峰特征,則可判斷在此極值對(duì)應(yīng)的時(shí)間修正下,二者相似。

對(duì)刷卡時(shí)間進(jìn)行修正。

時(shí)間交集。

時(shí)間分布相似度。

式中:num(Card_t i)為Card_t i的數(shù)量;num(SC_t i)為SC_t i的數(shù)量。

對(duì)dt i∈[t1,t2]間隔為t的所有修正后刷卡時(shí)間進(jìn)行計(jì)算,得到相似度集合:Ρ=[ρ1,ρ2,…,ρn]。以dt i為橫軸,以Ρ為縱軸繪圖,見圖5~6。

圖5 刷卡時(shí)間修正變化與停車靠站時(shí)間相似度曲線——匹配關(guān)系Fig.5 Similarity curve between the correction time of swiping cards and the parking time:matching relationship

圖6 刷卡時(shí)間修正變化與停車靠站時(shí)間相似度曲線——非匹配關(guān)系Fig.6 Similarity curve between the correction time of swiping cards and parking time:mismatched relationship

對(duì)于每組匹配曲線,可求最大相似度ρmax=max(Ρ)和對(duì)應(yīng)修正時(shí)間為tx。若同時(shí)符合以下判斷標(biāo)準(zhǔn),可認(rèn)為Stop_t和Card_t在修正時(shí)間tx下高度相似。

1)最大相似度ρmax>0.6。

2)相似度集合Ρ的圖形分布具有明顯的凸峰特性,見圖6。

在圖5中,時(shí)間修正-156 s位置處,相似度增大到0.85,其他時(shí)間修正下相似度為0.2~0.3,表明刷卡時(shí)間序列在經(jīng)過-156 s修正后,與停車靠站時(shí)間具有高相似性;在圖6中,相似度均小于0.31,且無凸峰特性,則刷卡時(shí)間與停車靠站時(shí)間低相關(guān)。

時(shí)間相似度曲線法特點(diǎn)是時(shí)間計(jì)算簡(jiǎn)單,計(jì)算量小,實(shí)現(xiàn)速度快,對(duì)于dt i∈[-500,500],通過實(shí)列發(fā)現(xiàn)普通計(jì)算機(jī)上1次匹配耗時(shí)約為0.01~0.02 s,適用于大規(guī)模的篩選計(jì)算,但是算法上依賴公交運(yùn)行時(shí)刻表的準(zhǔn)確性,沒有落在停車區(qū)間的數(shù)據(jù)會(huì)被忽略。

2.3.2 時(shí)間平均偏差

公交IC卡站點(diǎn)判斷經(jīng)常采用k-means聚類算法分析上車站點(diǎn)位置[19],本研究對(duì)任意2個(gè)Stop_t和Card_t,計(jì)算Card_t中每次刷卡時(shí)間與Stop_t中最接近時(shí)間的時(shí)間差平均值,當(dāng)二者記錄同1輛車數(shù)據(jù)時(shí),刷卡時(shí)間發(fā)生在停車時(shí)間范圍內(nèi),則時(shí)間差平均值應(yīng)該接近于零,否則會(huì)較大,利用這個(gè)規(guī)律可以用時(shí)間平均偏差法進(jìn)行對(duì)應(yīng)關(guān)系判斷。

利用式(3),刷卡時(shí)間進(jìn)行修正后為Card_t i,求Card_t i中第j個(gè)時(shí)間ct j與Stop_T點(diǎn)的最小差值

遍歷計(jì)算,得最小差值集合為DN=[dn1,dn2,…,dn j]。

時(shí)間平均偏差為

式中:sum(DN)為DN中所有值之和。

對(duì)dt i∈[t1,t2]間隔為t的所有修正后刷卡時(shí)間進(jìn)行計(jì)算,得到時(shí)間平均偏差集合DX=[dx1,dx2,…,dxi],以dt i為橫軸,以DX為縱軸繪圖見圖7~8。

圖7 刷卡時(shí)間修正變化與停車靠站時(shí)間平均偏差曲線——匹配關(guān)系Fig.7 Average deviation curve between the correction time of swiping cards and the parking time:matching relationship

圖8 刷卡時(shí)間修正變化與停車靠站時(shí)間平均偏差曲線——非匹配關(guān)系Fig.8 Average deviation curve between the correction time of swiping cards and the parking time:mismatched relationship

對(duì)每組曲線求最小時(shí)間平均偏差dxmin=min(DX)和對(duì)應(yīng)修正時(shí)間為ty。若同時(shí)符合以下判斷標(biāo)準(zhǔn),可認(rèn)為Stop_t和Card_t在修正時(shí)間ty下高度相似。

1)最小時(shí)間平均偏差dxmin<20。

2)時(shí)間平均偏差集合DX的圖形分布具有明顯的凹峰特性,見圖7。

在圖7中,時(shí)間修正-155 s位置處,時(shí)間平均偏差為2.25 s,其他時(shí)間修正下時(shí)間平均偏差均大于20 s,表明刷卡時(shí)間序列在經(jīng)過-155 s修正后,與停車靠站時(shí)間具有高度相似性;在圖8中,時(shí)間平均偏差均大于250 s,且無凹峰特性,則刷卡時(shí)間與停車靠站時(shí)間低相關(guān)。

時(shí)間平均偏差曲線法的特點(diǎn)是改善了時(shí)間相似度曲線法的缺點(diǎn),可以計(jì)算任何刷卡點(diǎn)與最近停車時(shí)間區(qū)間的關(guān)系,但是相對(duì)來說計(jì)算量較大,本案例中對(duì)于dt i∈[-500,500]通過實(shí)列發(fā)現(xiàn)普通計(jì)算機(jī)上1次匹配耗時(shí)為9~16 s,計(jì)算量是前者的上千倍,對(duì)于大規(guī)模計(jì)算效率較低,適用于通過時(shí)間相似度確定關(guān)系后的數(shù)據(jù)驗(yàn)證計(jì)算。

通過時(shí)間相似度法和時(shí)間平均偏差法的配合使用,可以計(jì)算任意車輛GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)之間的相似程度,再通過多天的數(shù)據(jù)驗(yàn)證,可完全鎖定二者的對(duì)應(yīng)關(guān)系和修正時(shí)間。

3 算法試驗(yàn)

從西安市公交大數(shù)據(jù)中選取5條線路3 d的GPS軌跡數(shù)據(jù)進(jìn)行試算,共包括195輛公交車。從數(shù)據(jù)庫以線路為單位調(diào)取數(shù)據(jù),以GPS軌跡數(shù)據(jù)中線路編號(hào)為第1層循環(huán)單元,車輛編號(hào)為第2層循環(huán)單元,每條線路分3個(gè)步驟步進(jìn)行運(yùn)算。

步驟1。GPS數(shù)據(jù)(Data_A)與公交線路(Data_C)匹配。取經(jīng)緯度柵格化精度d1=0.000 5°(距離精度約為50 m),簡(jiǎn)化化軌跡點(diǎn)數(shù)量,線路距離閾值取200 m,軌跡閾值取500 m,利用式(1)~(2)進(jìn)行公交線路匹配計(jì)算,匹配結(jié)果見表2,共識(shí)別191輛車,線路總識(shí)別率97.3%,可以完全確定每1個(gè)軌跡線路編號(hào)對(duì)應(yīng)的實(shí)際線路名。對(duì)于沒有識(shí)別的4輛車,發(fā)現(xiàn)軌跡數(shù)據(jù)量過少,實(shí)際上可能當(dāng)天沒有參與運(yùn)營(yíng)活動(dòng)。

表2 GPS軌跡數(shù)據(jù)與公交線路匹配統(tǒng)計(jì)Tab.2 Matching statistics of the GPS track data and bus routes

步驟2。公交運(yùn)行時(shí)刻表判斷。取時(shí)差d t小于1 s、距離dl小于1 m、速度dv小于2 km/h或大于50 km/h、轉(zhuǎn)角dθ小于120°為依據(jù),利用軌跡數(shù)據(jù)清洗流程對(duì)原始軌跡點(diǎn)進(jìn)行數(shù)據(jù)清洗;清洗后的軌跡數(shù)據(jù),結(jié)合已經(jīng)匹配的實(shí)際線路,取站點(diǎn)判斷閾值dlc=50 m、方向角dθa與dθc的小夾角小于10°,利用公交車輛運(yùn)行時(shí)刻表判斷流程,判斷經(jīng)過每1站的軌跡時(shí)間段,再轉(zhuǎn)化為公交運(yùn)行時(shí)刻表,191輛可識(shí)別線路車輛可以全部進(jìn)行公交時(shí)刻表判斷計(jì)算,統(tǒng)計(jì)數(shù)據(jù)見表3。

表3 公交運(yùn)行時(shí)刻表判斷結(jié)果統(tǒng)計(jì)Tab.3 Result statistics of judging bus operation timetable

步驟3。GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)匹配。設(shè)置時(shí)間偏差范圍[t1,t2]=[-500,500],步長(zhǎng)t3=10 s。取所選線路中某1條線路上1輛車的時(shí)刻表數(shù)據(jù)和所有刷卡數(shù)據(jù),采用時(shí)間相似度算法式(3)和式(5),進(jìn)行車輛和刷卡設(shè)備的逐一匹配,找到估計(jì)數(shù)據(jù)線路編號(hào)Bus_m和刷卡數(shù)據(jù)線路編號(hào)Card_m的對(duì)應(yīng)關(guān)系,再根據(jù)時(shí)間相似度算法匹配計(jì)算同1條線路下車輛編號(hào)Bus_i和Card_i的對(duì)應(yīng)關(guān)系,初步找到對(duì)應(yīng)關(guān)系后使用時(shí)間平均偏差法式(6)~(7)進(jìn)行關(guān)系驗(yàn)證。根據(jù)實(shí)際計(jì)算條件采用普通電腦,上述參數(shù)下2條軌跡與5 413輛車的刷卡數(shù)據(jù)進(jìn)行相似度曲線數(shù)據(jù)計(jì)算總耗時(shí)95.81 s,平均每次計(jì)算耗時(shí)約為0.017 7 s。通過對(duì)各條軌跡線路進(jìn)行循環(huán)匹配,獲取了對(duì)應(yīng)的刷卡線路編號(hào)和刷卡車輛編號(hào)。進(jìn)一步通過另外2 d的數(shù)據(jù)對(duì)對(duì)應(yīng)關(guān)系進(jìn)行驗(yàn)證性計(jì)算,結(jié)果一致。匹配統(tǒng)計(jì)結(jié)果見表4,對(duì)識(shí)別出具體線路的軌跡達(dá)到了100%的識(shí)別率。

表4 GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)匹配結(jié)果統(tǒng)計(jì)Tab.4 Statistics of matching results between GPS track data and IC data

根據(jù)以上方法求出刷卡數(shù)據(jù)Data_B對(duì)應(yīng)的實(shí)際線路,進(jìn)行時(shí)間修正后可以根據(jù)對(duì)應(yīng)的Data_A軌跡數(shù)據(jù)時(shí)間所在經(jīng)緯度,通過經(jīng)緯度可以獲取具體的線路站點(diǎn)位置,從而獲得刷卡數(shù)據(jù)的線路、站點(diǎn)名、方向等信息。

4 算法驗(yàn)證

以上車輛及設(shè)備編號(hào)為數(shù)據(jù)庫內(nèi)部編號(hào),無法通過實(shí)際調(diào)研來驗(yàn)證算法的可靠性和準(zhǔn)確性。本研究以IC卡數(shù)據(jù)、GPS軌跡數(shù)據(jù)、站點(diǎn)位置數(shù)據(jù)中線路、車輛、時(shí)間相互對(duì)應(yīng)的廣西南寧市2018年12月1日全天16條線路進(jìn)行算法驗(yàn)證,其中包括350個(gè)設(shè)備的IC卡數(shù)據(jù)、359個(gè)設(shè)備的GPS軌跡數(shù)據(jù)、全市線路站點(diǎn)及坐標(biāo)數(shù)據(jù)。

采用本數(shù)據(jù)融合算法,對(duì)以上數(shù)據(jù)進(jìn)行融合計(jì)算,獲得的結(jié)果與實(shí)際對(duì)應(yīng)關(guān)系進(jìn)行對(duì)比,獲得算法的匹配度。

1)GPS數(shù)據(jù)(Data_A)與公交線路(Data_C)匹配驗(yàn)證。對(duì)案例中的每輛車軌跡和對(duì)應(yīng)的實(shí)際公交線路按照坐標(biāo)位置進(jìn)行線路匹配并繪圖,359個(gè)設(shè)備的GPS軌跡數(shù)據(jù)中可計(jì)算出357條對(duì)應(yīng)線路,未匹配出線路的2個(gè)設(shè)備記錄數(shù)據(jù)異常,超出市區(qū)范圍。與數(shù)據(jù)庫中已知對(duì)應(yīng)線路進(jìn)行對(duì)比,有357個(gè)設(shè)備與實(shí)際線路完全相同。結(jié)果顯示,當(dāng)設(shè)備軌跡記錄正常時(shí),本算法具有100%準(zhǔn)確性。

2)軌跡數(shù)據(jù)公交站點(diǎn)??繒r(shí)間判斷驗(yàn)證。通過算法獲取357個(gè)設(shè)備記錄的GPS數(shù)據(jù)與實(shí)際站點(diǎn)的運(yùn)行時(shí)刻表,獲得349個(gè)設(shè)備的有效運(yùn)行時(shí)刻表。存在8個(gè)設(shè)備的運(yùn)行時(shí)刻表數(shù)據(jù)量少于10條,無法用于后續(xù)計(jì)算。

得出的??繒r(shí)間對(duì)應(yīng)的坐標(biāo),與實(shí)際線路上站點(diǎn)位置進(jìn)行繪圖比較,符合大部分公交車輛的運(yùn)行規(guī)律。對(duì)停車靠站時(shí)間與對(duì)應(yīng)的修正后刷卡數(shù)據(jù)數(shù)據(jù)進(jìn)行對(duì)比,發(fā)現(xiàn)絕大部分刷卡記錄落在停車靠站時(shí)間段上,所占比例與實(shí)踐相似度結(jié)果一致。

3)GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)匹配驗(yàn)證。采用時(shí)間相似度法和時(shí)間平均偏差法繪制曲線,對(duì)350個(gè)設(shè)備的IC卡數(shù)據(jù)和349個(gè)設(shè)備的運(yùn)行時(shí)刻表進(jìn)行融合匹配計(jì)算,共獲得336對(duì)具有明顯特征的對(duì)應(yīng)關(guān)系,并與實(shí)際對(duì)應(yīng)數(shù)據(jù)對(duì)比,與真實(shí)關(guān)系完全對(duì)應(yīng)。實(shí)際數(shù)據(jù)中,350個(gè)設(shè)備的IC卡中,存在6個(gè)無GPS設(shè)備對(duì)應(yīng),實(shí)驗(yàn)有效IC設(shè)備為344個(gè)。IC卡系統(tǒng)和GPS系統(tǒng)時(shí)間偏差實(shí)際為0,時(shí)間相似度法中平均時(shí)間偏差為11 s,時(shí)間平均偏差法中平均時(shí)間偏差為22 s,案例驗(yàn)證平均時(shí)間偏差為IC卡時(shí)間需要修正16.5 s。

驗(yàn)證案例中350輛車,獲得336對(duì)對(duì)應(yīng)關(guān)系,融合算法驗(yàn)證效率為96%;考慮實(shí)際情況,只有344輛車存在實(shí)際對(duì)應(yīng)關(guān)系,則算法準(zhǔn)確率為97.67%。

5 結(jié)束語

根據(jù)公交車GPS數(shù)據(jù)和IC卡數(shù)據(jù)的時(shí)空特性,對(duì)無直接關(guān)聯(lián)的2個(gè)數(shù)據(jù)進(jìn)行關(guān)聯(lián)計(jì)算,方法具有以下特點(diǎn)。

1)采用時(shí)間相似度算法快速匹配、時(shí)間平均偏差算法進(jìn)行關(guān)系驗(yàn)證,多天數(shù)據(jù)進(jìn)行關(guān)系固定,可以解決公交GPS與IC卡數(shù)據(jù)分離無法直接關(guān)聯(lián)的問題。

2)采用可修正步進(jìn)時(shí)間修正遍歷算法,可對(duì)不在同一時(shí)間軸,且具有大時(shí)間偏差的GPS數(shù)據(jù)和IC卡數(shù)據(jù)進(jìn)行快速分析,可以節(jié)約大量計(jì)算耗時(shí)。

3)采用低耗時(shí)的時(shí)間相似度算法尋找對(duì)應(yīng)關(guān)系,利用對(duì)運(yùn)行時(shí)刻表精度要求低的時(shí)間平均偏差算法進(jìn)行關(guān)系驗(yàn)證,結(jié)合多天的數(shù)據(jù),可以高精度的確定二者關(guān)系。

國(guó)內(nèi)外公交系統(tǒng)中GPS和IC卡不是1個(gè)系統(tǒng)的情況大量存在,給上下車站點(diǎn)判斷造成了很大的困難,通過數(shù)據(jù)融合計(jì)算,可以高精度的實(shí)現(xiàn)關(guān)系匹配,為原本難以應(yīng)用的數(shù)據(jù)提供了有效的處理方法,可以推進(jìn)公交大數(shù)據(jù)更加廣泛的應(yīng)用。但限于軌跡數(shù)據(jù)的精確度和上車時(shí)間判斷的模糊性,無法實(shí)現(xiàn)完全的關(guān)系識(shí)別判斷;在進(jìn)行時(shí)間糾偏時(shí),采用了修正遍歷計(jì)算法,增加了計(jì)算量,對(duì)于超大規(guī)模城市的公交數(shù)據(jù)匹配計(jì)算,時(shí)間成本較大。另外,本算法假設(shè)前提為乘客在已知固定站點(diǎn)上車,對(duì)于某些運(yùn)行不規(guī)范的線路,計(jì)算參數(shù)設(shè)置還需要更深一步的研究。

猜你喜歡
平均偏差IC卡刷卡
河北地方性震級(jí)量規(guī)函數(shù)與方位角校正值研究1
工商業(yè)IC卡控制器改造為物聯(lián)網(wǎng)控制器實(shí)踐
FY-3C/VIRR西北太平洋區(qū)域海表溫度精度評(píng)估?
在用電梯加裝外接式IC卡運(yùn)行控制系統(tǒng)設(shè)計(jì)改進(jìn)
一種新的無觸點(diǎn)IC卡的檢測(cè)方法
刷卡
成長(zhǎng)日記
脛前動(dòng)脈穿刺可行性及心肺流轉(zhuǎn)下脛前動(dòng)脈與橈動(dòng)脈壓力監(jiān)測(cè)的一致性研究
讀IC卡
黨員文摘(2014年12期)2014-12-05 20:10:56
刷臉就可以購物
奧秘(2014年8期)2014-08-30 06:32:04
鄂托克前旗| 平邑县| 张家口市| 邓州市| 安平县| 新化县| 抚松县| 枣阳市| 当雄县| 逊克县| 黄冈市| 昌宁县| 定襄县| 河曲县| 卫辉市| 新兴县| 禄丰县| 文昌市| 衡山县| 兴和县| 勐海县| 开封县| 新源县| 柳江县| 尚志市| 东城区| 博白县| 峨边| 宜丰县| 轮台县| 海城市| 公安县| 措勤县| 达拉特旗| 紫阳县| 满城县| 肥东县| 安丘市| 烟台市| 大丰市| 阜康市|