国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于階梯收費(fèi)刷卡數(shù)據(jù)的公交下車(chē)站點(diǎn)算法優(yōu)化與實(shí)證評(píng)估

2022-03-18 05:33姜海航郭煜東劉健國(guó)
關(guān)鍵詞:刷卡乘車(chē)正確率

楊 飛,姜海航,郭煜東,劉健國(guó),周 濤

(1.西南交通大學(xué) 交通運(yùn)輸與物流學(xué)院,四川 成都 611756;2.重慶市交通規(guī)劃研究院,重慶 401147)

公共交通因其成本低、能耗低、占用資源少等優(yōu)點(diǎn),成為眾多城市倡導(dǎo)的出行方式。隨著相關(guān)政策[1]的提出,智能公交系統(tǒng)建設(shè)與優(yōu)化受到關(guān)注。相比常規(guī)公交體系,智能公交在指揮調(diào)度、運(yùn)營(yíng)管理上實(shí)現(xiàn)自動(dòng)化、精細(xì)化操作,大幅提升公交服務(wù)水平。準(zhǔn)確分析公交客流下車(chē)站點(diǎn),了解客流出行特征,摸清客流需求,對(duì)智能公交的調(diào)度、運(yùn)營(yíng)、規(guī)劃具有重要意義。公交IC卡作為各個(gè)城市智能公交的基礎(chǔ)部分,存儲(chǔ)了持卡用戶(hù)大量的乘車(chē)交易時(shí)空記錄,成為獲取公交基礎(chǔ)數(shù)據(jù)的新來(lái)源?;诠籌C卡數(shù)據(jù)的下車(chē)站點(diǎn)研究成為研究熱點(diǎn)。

在下車(chē)站點(diǎn)推算方法中,集計(jì)推算是一種常用、便捷的估計(jì)方法,但該方法僅能推算出站點(diǎn)客流總量,無(wú)法確定每位乘客的下車(chē)站點(diǎn)。個(gè)體推算方法中,基于公交出行鏈的估計(jì)考慮較多,這些方法相對(duì)容易且易于理解。2002年,James等[2]根據(jù)地鐵出行日志的記錄設(shè)計(jì)了兩個(gè)假設(shè):一是乘客會(huì)返回上次的目的地車(chē)站開(kāi)始下一次出行,二是乘客的最后一次出行會(huì)返回第一次出行的起點(diǎn),據(jù)此利用紐約市的AFC(automatic fare collection)數(shù)據(jù)實(shí)現(xiàn)了下車(chē)站點(diǎn)的推算。之后一些學(xué)者在該研究基礎(chǔ)上進(jìn)一步修正,Munizaga等[3]研究中發(fā)現(xiàn)僅通過(guò)該假設(shè)易導(dǎo)致下車(chē)站點(diǎn)推算錯(cuò)誤,在James等假設(shè)的基礎(chǔ)上,進(jìn)一步考慮了下一次公交出行的上車(chē)位置和時(shí)間并增加了額外的約束條件,優(yōu)化了站點(diǎn)推算目標(biāo)函數(shù)。Alsger等[4]利用澳大利亞昆士蘭州公交系統(tǒng)中含有乘客下車(chē)記錄的特殊收費(fèi)數(shù)據(jù)驗(yàn)證了出行鏈理論的下車(chē)站點(diǎn)推算模型,并研究了最大步行距離取值對(duì)推算結(jié)果的影響。He等[5]針對(duì)出行鏈斷裂情況(無(wú)下一次公交出行或下一次公交出行起點(diǎn)不能作為上次出行的終點(diǎn)),利用乘客歷史出行數(shù)據(jù)建立了個(gè)體空間和時(shí)間的下車(chē)復(fù)合概率模型,用以推算出行鏈理論無(wú)法解決的記錄。Kumar等[6]放松了現(xiàn)有公交出行鏈方法的參數(shù)限制,采用多元logit模型計(jì)算連續(xù)上車(chē)站點(diǎn)之間的路徑選擇概率,以最大概率方式推算乘客的下車(chē)站點(diǎn)。

但基于公交出行鏈的經(jīng)典推算方法難以估計(jì)單次、獨(dú)立出行的下車(chē)站點(diǎn),造成估計(jì)客流不能代表所有公交乘客真實(shí)的出行情況。一些研究通過(guò)補(bǔ)充多日刷卡記錄推算更多的數(shù)據(jù),其主要思路是在多日數(shù)據(jù)中尋找相似的出行記錄或與他日出行記錄建立連接修復(fù)斷裂出行鏈。但該方法在海量數(shù)據(jù)中需要設(shè)定復(fù)雜的規(guī)則,同時(shí)并不能有效地提升推算率。為解決該問(wèn)題Gordon等[7]研究中補(bǔ)充了公交投幣箱票務(wù)數(shù)據(jù)和登車(chē)器人次數(shù)據(jù),以此估算規(guī)則算法無(wú)法確定乘客和票務(wù)現(xiàn)金支付乘客的出行流量。Yan等[8]提出應(yīng)用樸素貝葉斯、SVM(support vector machine)、決 策 樹(shù)、隨 機(jī) 森 林、KNN(k-nearest neighbor)和集成學(xué)習(xí)等機(jī)器學(xué)習(xí)算法進(jìn)行下車(chē)站點(diǎn)的識(shí)別,楊鑫[9]以乘客的基本上車(chē)特征作為模型的輸入,采用Bi-LSTM-CRF模型對(duì)乘客的下站點(diǎn)實(shí)現(xiàn)推算。

乘客在選擇某線(xiàn)路某站點(diǎn)上車(chē)后,可供選擇的下車(chē)站點(diǎn)是有限的,因此相關(guān)研究將乘客下車(chē)站點(diǎn)推算視為分類(lèi)問(wèn)題,采用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)推算[8-11]。相對(duì)于出行鏈的推算方法,基于機(jī)器學(xué)習(xí)的方法能夠解決單次出行的下車(chē)站點(diǎn)識(shí)別,但也需要大量的訓(xùn)練數(shù)據(jù)及標(biāo)簽,同時(shí)預(yù)測(cè)耗時(shí)長(zhǎng),預(yù)測(cè)結(jié)果也存在較大偏誤。對(duì)此,Yan等[8]利用POI(point of interest)數(shù)據(jù)確定站點(diǎn)所在區(qū)域的土地性質(zhì),估計(jì)下車(chē)站點(diǎn)所在的交通小區(qū),最終正確率達(dá)到70%以上,識(shí)別效果較優(yōu)。

對(duì)于這類(lèi)數(shù)據(jù),也有學(xué)者從概率角度進(jìn)行分析。胡繼華等[12]通過(guò)計(jì)算站點(diǎn)上車(chē)客流,推算指向下游站點(diǎn)吸引權(quán)最大的站點(diǎn),李佳怡等[13]同樣采用了該方法。這些方法都假設(shè)個(gè)體服從群體的下車(chē)分布概率,即乘客很有可能選擇最大概率(最大吸引權(quán))站點(diǎn)下車(chē)。

然而,大部分公交線(xiàn)路采用“一票制”收費(fèi)方式,乘客下車(chē)時(shí)不會(huì)進(jìn)行刷卡操作,基于公交IC卡的下車(chē)站點(diǎn)估計(jì)缺乏有效驗(yàn)證。對(duì)此,本文首先利用隨機(jī)森林算法對(duì)現(xiàn)有出行鏈算法進(jìn)行優(yōu)化,構(gòu)建了完整的公交出行下車(chē)站點(diǎn)估計(jì)模型。然后結(jié)合具有公交上下站點(diǎn)的階梯收費(fèi)刷卡數(shù)據(jù),對(duì)兩種算法的識(shí)別效果進(jìn)行實(shí)證評(píng)估,保障了算法的可靠性。

1 公交下車(chē)站點(diǎn)估計(jì)模型

根據(jù)個(gè)體乘坐公交的行為模式,下車(chē)站點(diǎn)推算包括兩個(gè)步驟:首先結(jié)合乘客常見(jiàn)行為模式,構(gòu)建出行鏈估計(jì)模型,再針對(duì)出行鏈斷裂等復(fù)雜情況,利用隨機(jī)森林網(wǎng)絡(luò)進(jìn)行進(jìn)一步優(yōu)化。

1.1 出行鏈估計(jì)模型

個(gè)體每日出行活動(dòng)具有一定規(guī)律性,其公交出行多呈現(xiàn)時(shí)空閉環(huán)特性。本文結(jié)合現(xiàn)有研究,以個(gè)體多日或連續(xù)的公交出行行為為基礎(chǔ),首先構(gòu)建包含下述3條推斷的出行鏈估計(jì)模型,初步推算下車(chē)站點(diǎn)。

(1)當(dāng)乘客存在相鄰的兩次乘車(chē)出行,若后次的乘車(chē)站點(diǎn)位于前次乘車(chē)站點(diǎn)的下游,則乘客前次乘車(chē)的下車(chē)站點(diǎn)位于后次乘車(chē)站點(diǎn)附近。

(2)當(dāng)乘客為最后一次乘車(chē)出行,若該乘車(chē)站點(diǎn)遠(yuǎn)離當(dāng)日第一次乘車(chē)站點(diǎn),則為返程出行,下車(chē)站點(diǎn)應(yīng)位于第一次乘車(chē)站點(diǎn)附近。

(3)當(dāng)乘客為最后一次乘車(chē)出行,若該上車(chē)站點(diǎn)靠近當(dāng)日第一次乘車(chē)站點(diǎn),則為非返程出行,下車(chē)站點(diǎn)位于第一次乘車(chē)的下車(chē)站點(diǎn)附近。

1.2 隨機(jī)森林網(wǎng)絡(luò)

由于個(gè)體出行行為相對(duì)復(fù)雜,僅依靠出行鏈模型不可能實(shí)現(xiàn)所有情況分析,尤其是單次刷卡記錄和出行鏈斷裂記錄。對(duì)此本文結(jié)合隨機(jī)森林網(wǎng)絡(luò),對(duì)兩類(lèi)數(shù)據(jù)的下車(chē)站點(diǎn)進(jìn)行預(yù)測(cè)。利用公交IC卡數(shù)據(jù)推算下車(chē)站點(diǎn)可視為一種分類(lèi)問(wèn)題,即通過(guò)乘客上車(chē)時(shí)間、乘坐線(xiàn)路等特征篩選最可能的下車(chē)站點(diǎn)。隨機(jī)森林網(wǎng)絡(luò)是一種統(tǒng)計(jì)學(xué)習(xí)算法,通過(guò)重抽樣方法從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)樣本進(jìn)行決策樹(shù)建模,組合多棵決策樹(shù)的預(yù)測(cè)并投票得出最終結(jié)果。隨機(jī)森林網(wǎng)絡(luò)具有分類(lèi)回歸精度高、不易過(guò)擬合、高維數(shù)據(jù)適應(yīng)性強(qiáng)等優(yōu)點(diǎn),適用于復(fù)雜問(wèn)題的分類(lèi)與擬合分析。公交下車(chē)站點(diǎn)估算本質(zhì)可視為一種分類(lèi)問(wèn)題,本文以下車(chē)站點(diǎn)編號(hào)為目標(biāo),將上車(chē)時(shí)間、乘坐線(xiàn)路、上車(chē)站點(diǎn)、持卡類(lèi)型、用地性質(zhì)等個(gè)體屬性作為輸入,構(gòu)建相應(yīng)隨機(jī)森林網(wǎng)絡(luò)。公式(1)為預(yù)測(cè)函數(shù)。

式中:H(x)為隨機(jī)森林對(duì)輸入變量x的最終預(yù)測(cè);hi(x)為單個(gè)決策樹(shù)分類(lèi)模型;I(X)為示性函數(shù)。邊緣函數(shù)是隨機(jī)森林網(wǎng)絡(luò)的重要屬性,代表著對(duì)于輸入變量X的分類(lèi)中,正確分類(lèi)得票數(shù)超過(guò)錯(cuò)誤分類(lèi)得票數(shù)的概率,邊緣函數(shù)越大,隨機(jī)森林分類(lèi)的正確率越高,決策樹(shù)與整個(gè)森林的邊緣函數(shù)如公式(2)、(3)所示。

式中:g(X,Y)與r(X,Y)分別為決策樹(shù)與整個(gè)森林的邊緣函數(shù);ak I()為所取平均值;Pθ(h(X,θ)=Y)為判斷正確的分類(lèi)概率為判斷錯(cuò)誤的其他分類(lèi)的概率的最大值。

公式(4)為泛化誤差,表示模型對(duì)未知數(shù)據(jù)的預(yù)測(cè)能力,泛化誤差越小模型預(yù)測(cè)效果越好。公式(5)為隨機(jī)森林的邊緣函數(shù)期望。

公式(6)為決策樹(shù)之間的相關(guān)程度,其中v(r)、s(h(r))2分別為r(X,Y)的方差與標(biāo)準(zhǔn)差。

最終隨機(jī)森林網(wǎng)絡(luò)模型表達(dá)式如式(7)所示。

式中:(θ1,θ2,…,θT)為隨機(jī)森林中待標(biāo)定參數(shù);T為待標(biāo)定參數(shù)的個(gè)數(shù);n為輸入變量維度。

2 數(shù)據(jù)分析

2.1 公交階梯收費(fèi)刷卡數(shù)據(jù)

公交階梯收費(fèi)刷卡數(shù)據(jù)是乘客下站識(shí)別的基礎(chǔ),相比傳統(tǒng)公交IC卡數(shù)據(jù),乘客在分段計(jì)費(fèi)線(xiàn)路的上下車(chē)均要刷卡,為個(gè)體層面數(shù)據(jù)驗(yàn)證提供了保障。本文公交IC卡數(shù)據(jù)涵蓋某市連續(xù)5個(gè)工作日城市區(qū)域全部數(shù)據(jù),共計(jì)11條分段計(jì)費(fèi)線(xiàn)路,215 212條刷卡數(shù)據(jù)。線(xiàn)路均為中長(zhǎng)距離干線(xiàn),沿城市主要客流走廊布設(shè),占城市公交總運(yùn)量的40%,具有良好的代表性。刷卡數(shù)據(jù)字段包含乘客持卡編號(hào)、刷卡時(shí)間、乘坐線(xiàn)路、乘坐車(chē)輛、刷卡行為等信息,其中刷卡行為用以說(shuō)明乘客是上車(chē)還是下車(chē)。表1為2019年7月15日公交刷卡數(shù)據(jù)樣例。

表1 公交刷卡數(shù)據(jù)樣例Tab.1 Sample of bus swiping card data

2.2 公交GPS數(shù)據(jù)

公交GPS用于確定公交實(shí)時(shí)位置,判斷公交到站情況。其數(shù)據(jù)字段包含車(chē)輛牌照、線(xiàn)路、時(shí)間、速度和經(jīng)緯度等信息。表2為公交GPS數(shù)據(jù)樣例。

表2 GPS數(shù)據(jù)樣例Tab.2 Sample of GPS data

2.3 公交站點(diǎn)數(shù)據(jù)

由于公交GPS數(shù)據(jù)不包含公交進(jìn)出站信息,需要聯(lián)合公交站點(diǎn)數(shù)據(jù),識(shí)別不同時(shí)間公交到站點(diǎn)。數(shù)據(jù)字段包括站點(diǎn)名稱(chēng),經(jīng)緯度,途經(jīng)線(xiàn)路等,表3為站點(diǎn)信息數(shù)據(jù)樣例。

表3 公交站點(diǎn)數(shù)據(jù)樣例Tab.3 Sample of bus station data

2.4 模型輸入特征分析

乘客公交出行中將產(chǎn)生多種關(guān)聯(lián)信息,合理的輸入?yún)?shù)是下車(chē)站點(diǎn)估計(jì)的關(guān)鍵,根據(jù)個(gè)體實(shí)際分析,本文選擇如下特征,同時(shí)結(jié)合其他信息構(gòu)造新的特征,作為隨機(jī)森林的輸入。

2.4.1 上車(chē)時(shí)間、上車(chē)路線(xiàn)、上車(chē)站

個(gè)體的一日活動(dòng)通常具有規(guī)律,同一時(shí)段、同一路線(xiàn)及站點(diǎn)的活動(dòng)目的相對(duì)固定,下車(chē)站點(diǎn)也基本相同。

為保障識(shí)別結(jié)果的準(zhǔn)確,上車(chē)時(shí)間以小時(shí)為間隔進(jìn)行離散化,上車(chē)路線(xiàn)、上車(chē)站點(diǎn)利用標(biāo)簽編碼法(label encoding),從0開(kāi)始進(jìn)行重新編碼。

2.4.2 持卡類(lèi)型

持卡類(lèi)型代表乘車(chē)人屬性,能夠大范圍縮小目標(biāo)用戶(hù),與(1)中特征聯(lián)合,能夠較好刻畫(huà)乘客特征。持卡類(lèi)型同樣利用標(biāo)簽編碼法進(jìn)行編碼。

2.4.3 活動(dòng)半徑與出行頻率

活動(dòng)半徑表征乘客活動(dòng)空間大?。?4],代表乘客站點(diǎn)空間特征,出行頻率代表乘客對(duì)各個(gè)站點(diǎn)的出行偏好。圖1為活動(dòng)半徑示意圖。本文以5個(gè)工作日全部乘車(chē)數(shù)據(jù)為基礎(chǔ),分析乘客所有上車(chē)站點(diǎn)分布特征,公式(8)為活動(dòng)半徑計(jì)算公式。

圖1 活動(dòng)半徑計(jì)算原理Fig.1 Calculation principle of active radius

式中:μ為活動(dòng)半徑;r i為形心到上車(chē)站點(diǎn)i的距離。

由于活動(dòng)半徑μ與出行頻率分別為連續(xù)型與接近連續(xù)型變量,直接使用難以獲得準(zhǔn)確估計(jì)結(jié)果,同時(shí)無(wú)法直接確定分類(lèi)類(lèi)型。對(duì)此,本文利用K-means聚類(lèi)方法對(duì)兩個(gè)變量分別聚為3類(lèi),以劃分不同出行特征的乘客,表4為出行頻率與活動(dòng)空間的最終聚類(lèi)結(jié)果。

表4 出行特征劃分規(guī)則Tab.4 Classification rules of travel feature

為了更直觀地展示特征取值分布,將取值進(jìn)行min-max歸一化,取值界限約束到[0,1]之間。以出行頻率f為例,轉(zhuǎn)換函數(shù)如式(9)所示。

式中:fk為出行頻率f中第k個(gè)取值;f*k為fk歸一化后的取值;min(f)為所有出行頻率f中的最小值;max(f)為所有出行頻率f中的最大值。

圖2為聚類(lèi)結(jié)果示意圖??梢?jiàn)不同活動(dòng)空間與出行距離被分為9類(lèi),不同類(lèi)別間的特征差異顯著。

圖2 公交乘客聚類(lèi)Fig.2 Clustering of bus passengers

2.4.4 下游站點(diǎn)用地類(lèi)型

不同用地類(lèi)型下的站點(diǎn)客流吸引力存在較大差異,本文以站點(diǎn)周?chē)?00 m半徑為活動(dòng)范圍,統(tǒng)計(jì)下游主要用地類(lèi)型,圖3為站點(diǎn)周?chē)玫仡?lèi)型示意圖。

圖3 站點(diǎn)500 m覆蓋用地示意圖Fig.3 Schematic diagram of 500m site land use coverage

由于乘客并不會(huì)在所有下游站點(diǎn)進(jìn)行選擇,本文以R為活動(dòng)空間影響閾值,提取當(dāng)前站點(diǎn)到R內(nèi)特定站點(diǎn)C的用地面積,并將最大面積作為輸入特征。

式中:C為閾值范圍內(nèi)的下游站點(diǎn)數(shù);R為活動(dòng)范圍直徑;lnon為線(xiàn)路非直線(xiàn)系數(shù);ds為線(xiàn)路平均站間距。

2.4.5 下游站點(diǎn)下車(chē)概率

受站點(diǎn)周邊區(qū)域人口、崗位和土地利用等因素的影響,不同站點(diǎn)的下車(chē)客流存在差異,區(qū)域內(nèi)站點(diǎn)下車(chē)客流能夠反映出區(qū)域的吸引力,吸引力較大的區(qū)域更有可能吸引乘客下車(chē)。本文將同一群體在同一線(xiàn)路、同一方向、同一站點(diǎn)的下車(chē)分布頻率作為先驗(yàn)概率,則概率最大的站點(diǎn)為乘客最可能前往站點(diǎn)。以0.5為最大概率的下限值,若最大概率大于下限值,則最大概率對(duì)應(yīng)的站點(diǎn)可推算為下車(chē)站點(diǎn),若小于下限值則需要采用其他規(guī)則重新推算。其中,本文利用乘客下車(chē)信息直接獲取該先驗(yàn)概率,對(duì)于非階梯收費(fèi)線(xiàn)路,可預(yù)先調(diào)查獲取目標(biāo)線(xiàn)路各站點(diǎn)的下車(chē)乘客數(shù),再統(tǒng)計(jì)獲取目標(biāo)站點(diǎn)下游站點(diǎn)的下車(chē)概率。

對(duì)于無(wú)法確定最大概率站點(diǎn)(概率>0.5)的情況,可利用相鄰站點(diǎn)概率分布進(jìn)行疊加,以此反映相鄰站點(diǎn)周邊區(qū)域的下車(chē)吸引力。如圖4所示,在同一站點(diǎn)上車(chē)的群體出行數(shù)據(jù)中提取各下車(chē)站點(diǎn)(s1~s10)的出行頻率(f1~f10),將頻率大于零的相鄰下車(chē)站點(diǎn)劃分為多個(gè)站點(diǎn)區(qū)域,疊加各區(qū)域內(nèi)的站點(diǎn)頻率作為該區(qū)域的下車(chē)概率P,則下車(chē)概率最大的區(qū)域?yàn)槌丝妥羁赡芮巴膮^(qū)域,該區(qū)域中概率最大的站點(diǎn)可作為乘客的下車(chē)站點(diǎn)。

圖4 站點(diǎn)連續(xù)區(qū)域下車(chē)概率示意圖Fig.4 Probability diagram of getting off in continuous area of station

3 實(shí)例應(yīng)用

本文針對(duì)5個(gè)連續(xù)工作日內(nèi)采集的215 158條公交出行數(shù)據(jù),分別對(duì)比現(xiàn)有公交出行鏈模型、隨機(jī)森林算法與本文構(gòu)建融合模型的下車(chē)站點(diǎn)識(shí)別差異,并結(jié)合推算率、有效率、正確率3種指標(biāo)分析識(shí)別結(jié)果。其中正確率代表估計(jì)站點(diǎn)與實(shí)際站點(diǎn)一致;有效表示推算站點(diǎn)與實(shí)際站點(diǎn)誤差在一個(gè)站范圍內(nèi)。

式(11)、(12)中:N為有效估計(jì)的站點(diǎn)數(shù)量;P為全部樣本數(shù);Cl為推算率;E為有效率;Ea為全樣本有效率;Pe表示有效估計(jì)的站點(diǎn)數(shù)量。

3.1 與公交出行鏈模型對(duì)比

表5為公交出行鏈模型與本文融合模型的識(shí)別結(jié)果對(duì)比??梢?jiàn)公交出行鏈模型盡管具有較高的正確率和有效率,但全樣本有效率僅為55.6%,無(wú)法估計(jì)單次刷卡記錄和出行鏈斷裂記錄,也難以代表全樣本情況。而本文提出的融合模型能夠?qū)崿F(xiàn)100%出行數(shù)據(jù)推算,全樣本有效率達(dá)到76.2%,同時(shí)樣本有效率與正確率相比出行鏈模型差異不大,整體提升效果顯著。

表5 融合方法與公交出行鏈模型結(jié)果對(duì)比Tab.5 Comparison of fusion method and bus travel chain model

3.2 與隨機(jī)森林方法對(duì)比

針對(duì)公交出行鏈模型無(wú)法推算的35.5%剩余數(shù)據(jù),將既有的隨機(jī)森林方法與本文提出的融合模型的識(shí)別效果進(jìn)行對(duì)比,如表6所示。由表6可知,兩類(lèi)方法均能實(shí)現(xiàn)100%結(jié)果估計(jì),盡管既有的隨機(jī)森林方法在公交出行起訖交通小區(qū)識(shí)別的正確率達(dá)到70%以上,然而本文以出行起訖公交站點(diǎn)為評(píng)價(jià)單元,相比交通小區(qū)層面識(shí)別更加困難。將既有方法應(yīng)用到公交站點(diǎn)識(shí)別中,識(shí)別正確率約為19%,而本文提出模型通過(guò)增加乘客活動(dòng)半徑、出行頻率等輸入,將正確率提升至33.4%。兩種方法的正確率都相對(duì)較低,這主要由于單次刷卡以及出行鏈斷裂的出行記錄無(wú)明顯規(guī)律性,難以準(zhǔn)確推算乘客的下車(chē)站點(diǎn)。但值得注意的是,本文模型在錯(cuò)誤估計(jì)的估計(jì)下車(chē)站點(diǎn)中,57.2%與真實(shí)站點(diǎn)僅相差1個(gè)公交站,相比現(xiàn)有研究仍具有較大提升,說(shuō)明算法仍具有相對(duì)準(zhǔn)確的識(shí)別效果。

表6 融合方法與隨機(jī)森林方法結(jié)果對(duì)比Tab.6 Comparison of fusion method and random forest

3.3 基于融合模型的下車(chē)估計(jì)結(jié)果

圖5、6為不同出行距離下,本文提出融合模型的下車(chē)站點(diǎn)估計(jì)的詳細(xì)結(jié)果。在2 km誤差范圍內(nèi),誤差分布于0~100 m內(nèi)占比最高,其次主要集中于200~600 m,大致為兩個(gè)站點(diǎn)之間的距離??赡茉蚴浅丝拖萝?chē)在站點(diǎn)周邊移動(dòng)后并未返回前次出行的站點(diǎn)上車(chē),造成推算結(jié)果與真實(shí)站點(diǎn)間存在一段距離。

圖5 下車(chē)站點(diǎn)短距離誤差分布Fig.5 Error distribution of short distance at leaving station

圖6 下車(chē)站點(diǎn)長(zhǎng)距離誤差分布Fig.6 Error distribution of long distance at leaving station

從長(zhǎng)距離出行的誤差分布來(lái)看,近80%的誤差在0~1 km之內(nèi),誤差在5 km以上的占6.4%。由于城市交通出行需求研究中,常以交通小區(qū)為基本單位,占地面積為1~2 km2,因此從小區(qū)尺度看,近80%的推算記錄能夠滿(mǎn)足分析需求。

4 結(jié)論

準(zhǔn)確預(yù)測(cè)公交客流下車(chē)站點(diǎn)是了解站點(diǎn)客流、線(xiàn)路客流以及公交起訖點(diǎn)的基礎(chǔ),有助于把握公交出行特征,對(duì)智能公交規(guī)劃、調(diào)度、運(yùn)營(yíng)、管理具有重要的意義。

(1)本文以公交階梯收費(fèi)刷卡數(shù)據(jù)、車(chē)載GPS數(shù)據(jù)為基礎(chǔ),在傳統(tǒng)公交出行鏈識(shí)別算法基礎(chǔ)上,結(jié)合隨機(jī)森林算法,構(gòu)造了一套公交下車(chē)站點(diǎn)融合分析模型。首先基于公交出行鏈的方法,估計(jì)大部分乘客的下車(chē)站點(diǎn),然后對(duì)未推算記錄,利用隨機(jī)森林方法進(jìn)一步完成估計(jì)。

(2)構(gòu)建的融合模型針對(duì)刷卡記錄的下車(chē)站點(diǎn)成功推算率達(dá)到100%,全樣本有效率達(dá)76.2%,其中近80%的記錄誤差在1 km范圍以?xún)?nèi)。說(shuō)明本文提出模型具有較高的識(shí)別效果,能夠滿(mǎn)足區(qū)域?qū)用妫ń煌ㄐ^(qū))的分析需求。

作者貢獻(xiàn)聲明:

楊 飛:核心思想提煉。

姜海航:論文撰寫(xiě),論文修改。

郭煜東:論文撰寫(xiě),論文修改。

劉建國(guó):數(shù)據(jù)收集處理,論文撰寫(xiě)。

周 濤:資料整理,思想提煉。

猜你喜歡
刷卡乘車(chē)正確率
個(gè)性化護(hù)理干預(yù)對(duì)提高住院患者留取痰標(biāo)本正確率的影響
課程設(shè)置對(duì)大學(xué)生近視認(rèn)知的影響
這一次優(yōu)步乘車(chē),讓我感動(dòng)了
乘車(chē)的問(wèn)題
生意
生意
刷卡
結(jié)賬
刷臉就可以購(gòu)物
第一次刷卡
哈密市| 禄丰县| 大名县| 行唐县| 镇坪县| 桂阳县| 太仆寺旗| 西和县| 东辽县| 英德市| 连山| 柘荣县| 水城县| 大港区| 杭州市| 泌阳县| 内江市| 绥江县| 木里| 宜君县| 榕江县| 美姑县| 项城市| 滁州市| 灵石县| 石台县| 原平市| 甘谷县| 河南省| 商南县| 长葛市| 吉木乃县| 大方县| 吉安县| 五指山市| 迁安市| 阜南县| 枣庄市| 明水县| 饶河县| 科尔|