国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于IC卡數(shù)據(jù)的地鐵站點識別方法分析與研究

2021-10-31 01:37冷夢甜徐鋒曾燁王振耿薇
大連交通大學(xué)學(xué)報 2021年5期
關(guān)鍵詞:IC卡進站刷卡

冷夢甜,徐鋒,曾燁,王振,耿薇

(廣東嶺南通股份有限公司,廣東 廣州 510000)*

現(xiàn)代城市公共交通包括常規(guī)公交、有軌電車和BRT、地鐵和輕軌三大體系.其中地鐵和輕軌在解決大城市的出行難問題中有顯著的效果,并且由于其在地下運行或郊區(qū)地面運行的特點,使其成為城市發(fā)展的主要方向之一.根據(jù)行業(yè)專家分析預(yù)測全國地鐵通車里程到2020年將達到9226.7km[1].因此為了研究城市公共交通的狀況,分析乘客上下車站點的軌跡是研究的熱點方向[2-4].李思杰、武明超等[5-9]根據(jù)手機移動信號及定位系統(tǒng)研究了乘客的動態(tài)OD,該方法依賴乘客使用手機定位系統(tǒng)的使用率.其中為了獲得終端與站點之間的關(guān)系需通過人工采集的方式[10-11].

人工采集耗時耗財,并難以常規(guī)化,因此本文研究一種可基于極低的采集成本和公開的信息,高效、準確地找出終端與站點的對應(yīng)關(guān)系的方法.

1 數(shù)據(jù)的采集與預(yù)處理

1.1 IC卡數(shù)據(jù)的采集

此次用于研究的IC卡數(shù)據(jù)主要是通過如圖1所示的流程進行采集,具體流程如下:①數(shù)據(jù)產(chǎn)生:乘客將IC卡放置于車載終端上,卡號和交易時間等信息被記錄;②數(shù)據(jù)傳遞:第一步,數(shù)據(jù)通過導(dǎo)入或者無線傳輸?shù)确绞剿椭练止芮逅阒行?;第二步,?shù)據(jù)從分管清算中心傳輸?shù)絀C卡管理中心;第三步,IC卡管理中心將數(shù)據(jù)以通訊方式傳送到數(shù)據(jù)庫[12].

圖1 公交IC卡數(shù)據(jù)采集流程

此次采用的IC卡刷卡數(shù)據(jù)為廣州市地鐵刷卡一年的數(shù)據(jù)(2017年9月1日~2018年8月31日),總共收集了約14億條刷卡數(shù)據(jù),所得的IC卡交易數(shù)據(jù)結(jié)構(gòu)包括邏輯卡號、進站時間、進站終端編號、交易票價、出站時間、出站終端編號等信息,其中此次所用的信息如表1所示.

表1 地鐵IC卡刷卡數(shù)據(jù)(部分字段)

1.2 IC卡數(shù)據(jù)預(yù)處理

為了更好地提高數(shù)據(jù)分析結(jié)果的準確度,本研究方法對采集數(shù)據(jù)進行清洗、融合、變換、歸約等預(yù)處理操作[13].首先,IC卡刷卡數(shù)據(jù)可能因為刷卡動作、終端環(huán)境等造成一定的影響而產(chǎn)生異常數(shù)據(jù),這些數(shù)據(jù)如果不清洗加以排除,可能對分析結(jié)果的準確性造成不可預(yù)知的影響,需對數(shù)據(jù)進行如下的清理[14]:①刪除非CPU卡交易數(shù)據(jù),因為部分非CPU卡交易的入閘終端編號不完整;②刪除進站終端編號與出站終端編號相等,或者進站終端編號為空或非法格式,或者進站終端編號為空或非法字符的交易記錄;③刪除交易金額為0的記錄;④刪除進站終端編號與上次出站終端編號不一致的記錄;⑤刪除無用字段,對交易記錄按進站終端編號、出站終端編號、票價3個字段分組;⑥進站終端與出站終端一般不會是同一編號,為清除臨時調(diào)整少量終端的影響,如果出現(xiàn)既是進站終端又是出站終端,記錄終端編號,比較該終端編號作為進站終端和出站終端的交易記錄數(shù)量,如作為進站終端的交易記錄數(shù)大于作為出站終端的交易記錄數(shù),則刪除所有出站終端編號為該終端編號的交易記錄;⑦理論上交易記錄中只要進站終端編號、出站終端編號一致,票價也就應(yīng)一致.但實際上有時也因數(shù)據(jù)錯誤,也存在進站終端編號、出站終端編號一致但交易票價不同的情況.這種情況下,應(yīng)取信息數(shù)量最大的分組,刪除其他記錄,整理交易記錄后形成終端票價表(TP表),如表2所示.

表2 終端票價表

1.3 終端編號信息整理

通過IC卡刷卡數(shù)據(jù)整理出所有產(chǎn)生過交易的終端編號,將其中日均使用頻率較高的1000個終端繪制成表,如表3(TL表)所示.

表3 終端編號表

1.4 地鐵站點信息整理

在地鐵運營商網(wǎng)站可以很容易獲取當前地鐵線路和站點信息,再通過線路和站點信息很容易查詢到任兩個站點之間的票價信息,將票價信息整理成站點票價表.站點編號規(guī)則為“前兩位數(shù)表示廣州地鐵線路號碼,后兩位表示該線路站點序號”,如站點編號為0116表示“1號線廣州東站”,站點編號為“0613”表示“6號線東湖站”.另外廣佛線編號為“GF”,APM編號為“APM”,具體可參見廣州地鐵官網(wǎng)對各個站點的編號.最后各線路換乘站以前者為準,例如1號線和6號線的換乘站東山口站,按照站點編號規(guī)則其可以為“0112”或者“0614”,這里為了方便分析,采用前者“0112”來表示東山口站,部分結(jié)果如表4(SP表)所示.

表4 站點票價表

其中站點編號和站點名稱一一對應(yīng).如果站點數(shù)量為n,則共有n2條站點票價表記錄,因為互為起止站點的票價是一樣的,故進一步整理,可刪除一半的記錄.

2 關(guān)鍵站點組分析

2.1 關(guān)鍵站點票價分析

所謂關(guān)鍵站點組是指存在一組站點,任何站點(或絕大多數(shù)站點)到這組站點的票價組合都不完全相同,關(guān)鍵站點可表示為KSi(i=1,2,…,n).

關(guān)鍵站點組內(nèi)站點的選擇有幾個要求,一是按地鐵線網(wǎng)情況分出子組,部分城市的地鐵線網(wǎng)可能分割成多于一個的互不相通的網(wǎng)絡(luò),因此站點組也需分出子組;二是組內(nèi)站點要足夠多,使得任何站點到組內(nèi)站點的票價都不完全相同;三是組內(nèi)站點是有效的,如果刪除組內(nèi)某個站點不影響票價組則刪除該站點,使得站點足夠少以提高后續(xù)的處理效率;四是標記特殊站點,如存在一對或多對站點到任何其他站點的票價都一樣,這種情況下需將這類站點標記好,一對站點作為一個站點處理.

然后依據(jù)票價表列出所有站點到關(guān)鍵站點的票價,形成表5關(guān)鍵票價表,按上述確定的關(guān)鍵站點的方法可知,不存在兩行的值會完全相同.

站點Si(i從1到n,n為所有站點數(shù)量)到m個關(guān)鍵站點[KS1,KS2,…,KSm]的票價形成Si到關(guān)鍵站點組的票價組如表5(KSP表).按上述確定的關(guān)鍵站點的方法可知, 不 存 在 兩行的值會完全相同的紀錄, 所有Si到確定的關(guān)鍵站點組的票價組都不完全相同,這個票價組可以認為是Si的指紋信息,也就是說,如果知道某個站點到關(guān)鍵站點的票價信息,也就確定了這個站點的位置.

表5 關(guān)鍵站點票價表

2.2 關(guān)鍵站點內(nèi)的終端編號確認

確定關(guān)鍵站點內(nèi)的終端編號,可以有多種方法,包括數(shù)據(jù)分析的方法和人工采集的方法.因關(guān)鍵站點數(shù)量占站點總數(shù)的比率很小,一般不到5%,進行人工采集工作量不大,這里就采用人工采集的方式,采集到關(guān)鍵站點內(nèi)各終端的編號,形成初始終端站點對應(yīng)表6(TS表)的示例.其中站點類型就兩個類型,K表示初始采集到的關(guān)鍵站點,N表示后續(xù)計算添加的非關(guān)鍵站點.

表6 終端站點對應(yīng)表

終端編號與站點編號的關(guān)系是多對一,一個終端一定屬于也只能屬于一個站點,一個站點可以包含多個終端.

以廣州地鐵為例,關(guān)鍵站點組中包括了東山口站點(1號線與6號線的交點),人工采集終端編號的過程如圖2所示,具體采集過程為:持卡工作人員持卡通過不同的刷卡終端進站和出站,并記下終端位置編號;例如持卡工作人員刷卡通過C-1-1進站,并記下終端位置,再刷卡通過D-6-1出站,并記下終端位置.

圖2 東山口站點終端人工采集方案圖

根據(jù)上圖所示的方法,可以得到終端編號與東山口站點的關(guān)系,如表7所示.

表7 東山口站終端對應(yīng)表

3 終端與站點的對應(yīng)關(guān)系分析

終端與站點匹配過程是遍歷交易記錄中出現(xiàn)過的終端編號,依據(jù)終端編號與終端編號間的票價關(guān)系,站點與站點間的票價關(guān)系,確定終端與站點的關(guān)系.

具體流程如圖3所示:①從TL表順序讀取一條終端記錄記為aPID;②判斷該終端是否已經(jīng)處理;③查找該終端與已知的關(guān)鍵站點內(nèi)終端的票價情況;④形成該終端與關(guān)鍵站點的票價關(guān)系組;⑤將票價關(guān)系組與KSP表進行匹配,匹配上的站點即為終端所在站點;⑥將終端站點對應(yīng)關(guān)系插入TS表;⑦TL表所有記錄處理完成后,TS表記錄的數(shù)據(jù),即為通過該方法獲取的終端站點對應(yīng)關(guān)系信息.圖中M為關(guān)鍵站點數(shù)量.

圖3 終端與站點匹配過程

4 實例分析

隨機抽取1000個IC卡地鐵數(shù)據(jù),根據(jù)上一節(jié)確定的方法,推導(dǎo)出其進出站點,與實際站點進行比較,結(jié)果如表8所示,從表中可以發(fā)現(xiàn)該方法所得到終端編號與站點的對應(yīng)關(guān)系與實際情況完全相符.

表8 對比結(jié)果表(部分結(jié)果)

5 應(yīng)用

根據(jù)圖3所述的方法可以得到IC卡數(shù)據(jù)中終端編號與各地鐵站點的對應(yīng)關(guān)系,基于此可以得到乘客乘坐軌道交通的上下車站點,同時根據(jù)謝振東等[15]研究公交車站點識別方法能夠得到乘客乘坐公交車的上下車站點.

通過乘客的上下車站點可以進一步完善乘客的出行鏈,基于此能夠?qū)Τ丝偷膿Q乘行為和職住識別等方面進行分析研究:

(1)換乘行為分析,首先分析公交換乘行為的時間和空間影響因素,然后設(shè)計以公交出行記錄為基礎(chǔ)的公交換乘行為識別流程,通過實例推斷出研究時間段內(nèi)所有對象的公交換乘行為,最后以公交換乘系數(shù)為依據(jù)判斷城市公交直達性的優(yōu)劣;

(2)職住失衡問題是城市化發(fā)展必然遇到的一種空間資源配置不當問題,是新時代城市規(guī)劃建設(shè)和發(fā)展所面臨的重要課題.在大數(shù)據(jù)等新興互聯(lián)網(wǎng)技術(shù)逐步成熟和廣泛應(yīng)用、服務(wù)于行業(yè)發(fā)展的背景下,根據(jù)乘客的出行鏈設(shè)計一種通勤人群的居住地與就業(yè)地識別模型,識別通勤人群的通勤軌跡,探討職住平衡評價指標和測度方法.

6 結(jié)論

由于人工采集地鐵刷卡終端與站點的對應(yīng)關(guān)系需消耗較高的人力成本,而且人工采集不可能日?;瑢?dǎo)致搜集的數(shù)據(jù)無法實時更新,不能保證數(shù)據(jù)的準確性.因此本文首先通過分析IC卡刷卡數(shù)據(jù)以及地鐵票價等信息,同時采集極少量的關(guān)鍵站點與終端編號的關(guān)系,制作了終端票價表、終端票價表、關(guān)鍵站點票價表等,最后利用聚類分析法設(shè)計了一種基于IC卡數(shù)據(jù)的地鐵站點識別方法,能夠準確識別乘客刷卡的進出站點.

基于IC卡數(shù)據(jù)的地鐵站點識別方法能夠為后期的研究提供準確的數(shù)據(jù)支持,比如乘客動態(tài)OD分析、城市公共交通換乘分析等,并且有利于通過數(shù)據(jù)分析提高用戶的使用體驗和城市交通管理的效率.

猜你喜歡
IC卡進站刷卡
高鐵地下站內(nèi)氣流流動對空調(diào)系統(tǒng)的影響研究
春運期間北京西站共有154.8萬人次刷臉進站
閱讀(科學(xué)探秘)(2018年8期)2018-05-14
刷卡
結(jié)賬
長春開通公交IC卡充值平
刷臉就可以購物
論基層央行推進金融IC卡行業(yè) 應(yīng)用發(fā)展的困境與建議
第一次刷卡