蔡曉禹,呂 亮,杜 蕊
(1. 重慶交通大學(xué) 交通運(yùn)輸學(xué)院,重慶 400074;2. 山地城市交通系統(tǒng)與安全重慶市重點(diǎn)實驗室,重慶 400074)
隨著區(qū)域一體化進(jìn)程的加快,城市出行需求增長迅速,私家車作為城市交通的主要組成部分,具有靈活、機(jī)動的優(yōu)勢。在綜合運(yùn)輸競爭日益激烈的背景下,研究私家車的出行特征,有助于改善城市交通組織,為城市智能的交通發(fā)展奠定基礎(chǔ)。
近些年,RFID(射頻識別技術(shù))在交通領(lǐng)域中被廣泛挖掘應(yīng)用,主要體現(xiàn)在公路收費(fèi)、停車場管理、車輛身份識別等方面[2-3]。根據(jù)相關(guān)外文文獻(xiàn),美國在RFID的應(yīng)用方面處于相對領(lǐng)先的地位,英國、德國、瑞士、瑞典、日本等國均具有較為成熟且先進(jìn)的RFID產(chǎn)品,如美國的E-Zpass 收費(fèi)、新家坡的不停車收費(fèi)以及英國倫敦的交通擁堵費(fèi)。此外德國也研究了RFID技術(shù)在交通信息采集方面的重要應(yīng)用,德國柏林交通管理中心在 2000 年建立基于 RFID技術(shù)的交通信息采集系統(tǒng)。21世紀(jì)初,RFID逐漸進(jìn)入中國市場,并得到了政府的大力支持。2019年6月,伴隨著《中國RFID技術(shù)政策白皮書》的發(fā)布,我國的RFID技術(shù)進(jìn)入了國家產(chǎn)業(yè)發(fā)展戰(zhàn)略層面?,F(xiàn)如今,我國的 RIFD技術(shù)發(fā)展相對成熟的城市有南京、杭州、無錫、深圳和重慶等地。上海、杭州、重慶等多個城市依靠設(shè)置在道路上的RFID系統(tǒng)對公交進(jìn)行實時監(jiān)控,實現(xiàn)對車輛到站、離站時間的預(yù)測,以及配合紅綠燈實現(xiàn)公交優(yōu)先通行等。隨著我國電子車牌國家標(biāo)準(zhǔn)的即將出臺以及物聯(lián)網(wǎng)技術(shù)的持續(xù)發(fā)展,RFID 技術(shù)將會在自動駕駛、智能交通管理、智慧城市發(fā)展中具有更加廣闊的應(yīng)用前景。
不同時間段里城市人群移動的動態(tài)變化規(guī)律,體現(xiàn)了城市交通流體變化規(guī)律,隱含城市地域功能性信息等,其實質(zhì)是對城市居民出行特征的研究分析。因此,車輛出行特征研究在城市建設(shè)規(guī)劃等方面具有重要的意義,同時也是制訂交通政策的科學(xué)依據(jù)。據(jù)相關(guān)國外研究,Sini Guo等[4]人主要研究軌跡數(shù)據(jù)的分割技術(shù),從而分析車輛行為,提取商務(wù)信息,提出了一種集二元理論和牛頓法相結(jié)合的高效數(shù)據(jù)值算法來獲取最優(yōu)值。Zun Wang等[5]學(xué)者利用GPS數(shù)據(jù)中瞬時速度分布的變化系數(shù)來測量行程時間可靠性,提出旅行時間可靠性與道路密度的模型。Csáji等[6]基于大約10萬組手機(jī)信令數(shù)據(jù)發(fā)掘了葡萄牙用戶的活動模式。MingqiLv等[7]人提出一種序列模式挖掘算法,通過考慮估計的空間接近度,從單元軌跡數(shù)據(jù)集中挖掘運(yùn)動模式。A. Ladino等[8]就提出了一種行程時間的動態(tài)聚類模型,利用聚類的質(zhì)心級別與趨勢變化規(guī)律來預(yù)測出行的旅行時間。Justin van Dijk[9]以軌跡數(shù)據(jù)提取利用不同的4種機(jī)器學(xué)習(xí)算法來識別軌跡數(shù)據(jù)中的活動點(diǎn)和旅行點(diǎn),引入局部密度概念并評估了4種算法的性能。在國內(nèi)的研究中,董宏輝等[10]人依據(jù)軌跡數(shù)據(jù)研究出行者的出行方式。充分挖掘GPS數(shù)據(jù),提出兩種基于相似性度量和窗口的轉(zhuǎn)換點(diǎn)識別方法,然后將該方法運(yùn)用到BP神經(jīng)網(wǎng)絡(luò)、決策樹、KNN和支持向量機(jī)(SVM)4種識別交通出行的算法中,最后比較得出采用SVM識別交通出行方式能夠取得最優(yōu)結(jié)果。丁玲等[11]研究了在公共交通優(yōu)先政策下對出行個體行為的影響。研究根據(jù)分析將出行個體劃分為了3類,并采用聚類的方法將出行個體進(jìn)行劃分。再基于非集計模型對出行行為進(jìn)行分析,研究綜合考慮了交通狀態(tài)影響以及公共交通優(yōu)先策略影響下,出行個體的行為變化。
城市車輛出行是出行者利用私家車、公交車以及出租車等方式在不同道路間的出行過程。本研究基于軌跡數(shù)據(jù)分析重點(diǎn)分析私家車及出租車輛的活動特點(diǎn)。
對于私家車軌跡研究,隨機(jī)選取了近千輛私家車個體進(jìn)行軌跡信息可視化定性分析。通過大量對私家車軌跡的觀察,發(fā)現(xiàn)私家車出行集中呈現(xiàn)某些統(tǒng)計特征,即私家車軌跡檢測數(shù)據(jù)大部分較短,但是大部分完整的RFID點(diǎn)位數(shù)據(jù)存在規(guī)律性。根據(jù)大量私家車出行軌跡分析,定性主要可以分析出存在兩類典型出行特征情況。
根據(jù)出行軌跡可視化分析,可知存在一部分私家車群體在不同工作日內(nèi)的出行會呈現(xiàn)高度重疊現(xiàn)象,例如周一至周五每天的出行時間以及軌跡基本一致,僅存在細(xì)微差別,特別是早高峰和晚高峰時期,例如圖1中給出了車輛編號為1005406和102563的私家車個體在2017年19日周四以及2017年20日周五的全天出行軌跡空間變化圖。從圖中可以看出該類型私家車個體工作日內(nèi)的軌跡是相似的,有極高的重現(xiàn)性。一般這種具有規(guī)律性的車輛出行時間集中在7:00—8:00以及18:00—19:00之間,即早晚交通高峰時期,首次出行后會在固定區(qū)域活動或駐留較長時間,再進(jìn)行1~2次折返,出行時間一般為1~2 h,并且這類私家車出行者占總體數(shù)目較多??傮w來說,這類私家車用戶出行需求較大,出行時間較為穩(wěn)定,出行空間分布固定。
圖1 典型私家車Ⅰ軌跡空間Fig.1 Trajectory spaces of typical private car I
還有部分私家車工作日內(nèi)每天的軌跡與之前類型的私家車完全不同,這些私家車用戶的軌跡相比較下十分混亂,且經(jīng)過的卡口點(diǎn)位較高,軌跡路徑隨機(jī)性也較高,但是起訖點(diǎn)基本一致。這種情況的私家車軌跡顯示該車輛出行時間一般集中在早晨7:00—8:00或者下午13:00—14:00,被檢測的時間分布較為均勻,其在道路網(wǎng)絡(luò)的運(yùn)行時間較大,且逗留位置較多即出行軌跡存在較多的斷點(diǎn),但駐留時間不長,如圖2中車輛編號為1008533(a)和1021804(b)的私家車個體在2017年19日周四以及2017年20日周五的全天出行軌跡空間變化圖。從圖上可看出這類私家車用戶出行時間較為不固定,出行的空間分布較為紊亂,隨機(jī)性高。但從大量類似出行特征的用戶軌跡統(tǒng)計發(fā)現(xiàn)這類用戶在道路網(wǎng)運(yùn)行時間較大,雖然出行路徑軌跡隨機(jī)性高重復(fù)率低,但存在區(qū)域集中的現(xiàn)象,說明該類型用戶擁有區(qū)域選擇偏好。
圖2 典型私家車Ⅱ軌跡空間展示圖Fig.2 Trajectory spaces of typical private car II
對于出租車軌跡研究,本研究隨機(jī)選取了數(shù)百輛出租車個體進(jìn)行軌跡信息可視化定性分析。發(fā)現(xiàn)出租車工作日內(nèi)出行軌跡空間分布極為廣泛,大多數(shù)出租車出行時間極早幾乎全天24 h都在路上運(yùn)行,因此在道路網(wǎng)絡(luò)運(yùn)行時間較長。且出租車的軌跡空間分布不僅廣泛,一般跨越4~5組團(tuán)區(qū)域,而且軌跡路徑組成較為復(fù)雜、隨機(jī)性高。但根據(jù)大量出租車數(shù)據(jù)的統(tǒng)計分析可見大量的出租車駕駛員一般會在熟悉的區(qū)域跑動,因此軌跡存在聚集的現(xiàn)象,如圖3(b)172639出租車一周工作日的軌跡多出現(xiàn)在南岸區(qū)、巴南區(qū)。由此可以推測部分出租車駕駛員出行具有個體偏好的活動區(qū)域。
從軌跡數(shù)據(jù)的定性分析可知軌跡數(shù)據(jù)特征中直接或間接得包含了此出行軌跡與其他出行軌跡的差異性和共同處。出行軌跡的特征指標(biāo)指對原始出行軌跡數(shù)據(jù)進(jìn)行分析研究后,從中得到的可以表征出行特點(diǎn)的一系列具有代表意義的向量值。在對出行數(shù)據(jù)研究過程中可以提取出很多特征屬性,其中包含一些目前研究不需要的指標(biāo);特征指標(biāo)相互之間也會存在各種關(guān)聯(lián),有的相互補(bǔ)充,有的相互依賴,有的相互重復(fù)。在研究過程中為了減少不必要的重復(fù),減少建模的復(fù)雜性和可行性,還需要對數(shù)據(jù)特征指標(biāo)進(jìn)行分析,剔除冗余或與研究不太相關(guān)的特征指標(biāo),以選取更加適合、完善的特征指標(biāo)序列進(jìn)行研究分析[12-14]。出行特征指標(biāo)提取的詳細(xì)研究分析過程如圖4流程所示。
圖4 特征指標(biāo)提取研究過程Fig.4 Study process of characteristic indicator extraction
出租車類型車輛較其他類型車輛在軌跡重復(fù)率指標(biāo)中總體較低,在網(wǎng)時間總體分布很高的特點(diǎn)。這是因為出租車在出行軌跡上具有極大的隨機(jī)性,但基于大數(shù)據(jù)軌跡的統(tǒng)計分析,發(fā)現(xiàn)出租車出行總體分布會存在偏好區(qū)域,即出租車會在偏好的區(qū)域內(nèi)更頻繁地活動。實際情況下,出租車在空載的情況下,一般會無目的地運(yùn)行在道路上尋找乘客,但在一段時間內(nèi)出租車需求少,出租車駕駛員會根據(jù)經(jīng)驗前往乘客較多的區(qū)域。另一方面,不同區(qū)域的乘客雖然出發(fā)點(diǎn)和目的地不相同,但根據(jù)概率也會存在概率高的出發(fā)點(diǎn)以及目的地。因此提出“熱點(diǎn)活動區(qū)域”出行特征,分析出租車群體的最大概率活動區(qū)域。在研究車輛出行特征指標(biāo)時提出熱點(diǎn)活動區(qū)域指標(biāo),熱點(diǎn)活動區(qū)域指標(biāo)主要針對軌跡的出現(xiàn)空間選擇偏好進(jìn)行刻畫,該指標(biāo)體現(xiàn)了車輛個體最大概率出現(xiàn)的區(qū)域。根據(jù)上述對出行特征指標(biāo)的差異性分析,最終選取出行頻次、在網(wǎng)時間、軌跡重復(fù)率、以及首次出行時段、出行結(jié)束時段等指標(biāo)變量構(gòu)成出行特征的指標(biāo)向量,見表1。
表1 出行特征指標(biāo)Tab.1 Travel characteristic indicators
CFSFDP聚類算法(clustering by fast search and find of density peaks)的基本步驟是:首先將多維數(shù)據(jù)集進(jìn)行距離和密度計算,再選取聚類中心,最后對數(shù)據(jù)集中非聚類中心點(diǎn)進(jìn)行歸類操作[15-16]。
(1)局部密度ρi
局部密度ρi具有兩種計算方式,即Cut-off kernel (截止內(nèi)核算法)和Gaussian kernel (高斯算法),其中當(dāng)數(shù)據(jù)規(guī)模較大時,局部密度應(yīng)該當(dāng)用截止內(nèi)核算法,當(dāng)數(shù)據(jù)規(guī)模較小時,利用高斯算法計算局部密度ρi。
Cut-off kernel (截止內(nèi)核算法):
(1)
其中函數(shù)
(2)
參數(shù)dc>0為截斷距離(cutoff distance),需聚類前研究設(shè)定。
由公式(1)可知,實際上ρi求得S數(shù)據(jù)集中與xi之間的距離小于截斷距離dc(不包含xi本身)的個數(shù)。
Gaussian kernel (高斯算法):
(3)
截止內(nèi)核算法為離散值而高斯算法為連續(xù)值,相對來說高斯算法更小可能產(chǎn)生沖突(即不同數(shù)據(jù)點(diǎn)具有相同的局部密度)。
(2)距離δi
距離δi的計算公式為:
(4)
ρq1≥ρq2≥...≥ρqN。
(5)
由計算公式可知,當(dāng)xi是具有局部密度的數(shù)據(jù)點(diǎn)時,δi表示xi與S數(shù)據(jù)集中距離最大的數(shù)據(jù)點(diǎn)的距離值;否則,δi表示在所有局部密度大于xi的數(shù)據(jù)點(diǎn)中,與xi距離最小的那些數(shù)據(jù)點(diǎn)的距離值。
圖5 決策圖實例及示意圖Fig.5 Example and schematic diagram of decision-making diagram
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network),是由大量處理單元通過廣泛互聯(lián)而構(gòu)成的網(wǎng)絡(luò)體系。神經(jīng)網(wǎng)絡(luò)的快速發(fā)展使得其成為模式識別強(qiáng)有力的工具。神經(jīng)網(wǎng)絡(luò)主要分為前饋神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)[17]。本研究介紹的BP神經(jīng)網(wǎng)絡(luò)模型屬于多層前饋神經(jīng)網(wǎng)絡(luò),能夠?qū)崿F(xiàn)從輸入到輸出的映射功能,數(shù)學(xué)理論證明三層的神經(jīng)網(wǎng)絡(luò)以任意精度逼近任何非線性連續(xù)函數(shù),這使得BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力。
BP神經(jīng)網(wǎng)絡(luò)可以由BP和前饋神經(jīng)網(wǎng)絡(luò)兩個部分組成[18],BP指的是Back Propagation(逆向傳播),即誤差的逆向傳播,以及信號的前向傳播。其學(xué)習(xí)規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小,BP網(wǎng)絡(luò)得結(jié)構(gòu)示意圖見圖6。
出行特征群體辨識主要由3部分內(nèi)容組成:(1)RFID軌跡數(shù)據(jù)的預(yù)處理與出行指標(biāo)參數(shù)的選取,主要包括對出行群體的軌跡分析、預(yù)判斷和出行指標(biāo)的提??;(2)基于出行特征指標(biāo)的聚類分析,主要是針對選取的出行特征指標(biāo)進(jìn)行基于峰值密度的聚類分析,再根據(jù)分類結(jié)果分析劃分群體的具體性質(zhì);(3)出行特征群體的識別,主要介紹BP神經(jīng)網(wǎng)絡(luò)出行特征識別模型。出行特征群體的辨識是先分出租車、私家車、貨車3種車輛類型,分別進(jìn)行群體的劃分和識別訓(xùn)練過程,針對不同車輛類型的出行特征分布特點(diǎn)進(jìn)行出行特征群體的研究,每一種車輛類型選取的出行特征指標(biāo)因車輛類型的運(yùn)行特點(diǎn)和分析角度有所不同,本研究先將全面考慮所有出行特征可能的不同分布,再利用聚類思想將選取的出行特征指標(biāo)進(jìn)行研究分析,再進(jìn)行群體識別。具體的車輛出行特征辨識方法結(jié)構(gòu)如圖7所示。
圖6 構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型Fig.6 Building a BP neural network model
圖7 出行特征群體辨識方法結(jié)構(gòu)Fig.7 Structure of travel characteristic group recognition method
本研究試驗分析數(shù)據(jù)來源于重慶市城市交通大數(shù)據(jù)工程技術(shù)研究中心。研究數(shù)據(jù)主要來源于道路安裝的RFID設(shè)備檢測器,數(shù)據(jù)類型包含車輛RFID檢測數(shù)據(jù)、RFID卡口經(jīng)緯度數(shù)據(jù),詳見表2。
表2 GIS路網(wǎng)匹配后的車輛RFID數(shù)據(jù)Tab.2 RFID data of vehicle after GIS road network matching
數(shù)據(jù)覆蓋范圍主要為重慶市主城區(qū),其中覆蓋北碚組團(tuán)、西永組團(tuán)、西彭組團(tuán)、蔡家組團(tuán)、沙坪壩組團(tuán)、空港組團(tuán)、悅來組圖、禮嘉組團(tuán)、人和組團(tuán)、觀音組團(tuán)、渝中組團(tuán)、大楊石組團(tuán)、南坪組團(tuán)、大渡口組團(tuán)、李家沱組團(tuán)、茶園組團(tuán)以及界石組團(tuán)。重點(diǎn)研究區(qū)域選定為機(jī)場路干線影響區(qū),其實際地理位置位于人和組團(tuán)內(nèi),覆蓋范圍實際是圍繞機(jī)場路以及機(jī)場路所能在交通方面直接影響的區(qū)域,詳細(xì)范圍以及范圍內(nèi)RFID卡口分布如圖8所示。各組團(tuán)區(qū)域劃分以及所在區(qū)域內(nèi)RFID卡口布設(shè)點(diǎn)位分布如圖9所示。
圖8 干線影響區(qū)范圍及RFID卡口Fig.8 Scope of mainline affected area and RFID gates
圖9 組團(tuán)及RFID卡口布設(shè)Fig.9 Grouping and layout of RFID gates
由于智能交通的發(fā)展,新型智能交通打車APP的出現(xiàn),使得越來越多的私家車多向性的發(fā)展為商用運(yùn)營車輛。合理規(guī)劃管理商用運(yùn)營車輛群體,可以更高效率地提高車輛的使用率,提高運(yùn)行效率。根據(jù)相關(guān)文獻(xiàn)可知,商用運(yùn)行車輛的在網(wǎng)時間一般小于出租車個體,但比通勤出行需求的車輛運(yùn)行時間長,且出行頻次較高,同時運(yùn)行軌跡與出租車相似隨機(jī)性高,因此軌跡重復(fù)率指標(biāo)值較低。由此可知,選取的出行特征指標(biāo)可以滿足商用運(yùn)行車輛的識別要求。
私家車群體的試驗對象來源于重慶市主城區(qū)2017年10月17號—10月22號的RFID數(shù)據(jù)。由于樣本數(shù)據(jù)過大會造成程序運(yùn)行需要大量時間,系統(tǒng)運(yùn)行負(fù)荷大易崩潰現(xiàn)象。因此經(jīng)過多次試驗后,隨機(jī)選取26 165組完整有效處理后數(shù)據(jù)樣本,提取出行頻次、在網(wǎng)時間、軌跡重復(fù)率、首次出行時段、出行結(jié)束時段出行特征指標(biāo)進(jìn)行聚類分析。數(shù)據(jù)樣本詳見表3。
表3 私家車指標(biāo)數(shù)據(jù)樣本Tab.3 Samples of private car indicators
(1)私家車群體劃分
由前節(jié)模型說明可知,CFSFDP算法的輸入?yún)?shù)是指標(biāo)相互之間的距離。為便于計算在計算指標(biāo)之間的距離前,首先需要對特征向量組數(shù)據(jù)進(jìn)行編號,詳見表4。
表4 私家車出行特征指標(biāo)向量Tab.4 Private car travel characteristic indictor vectors
本章節(jié)使用歐式距離公式來計算指標(biāo)向量之間的距離,詳見式(1)。
(1)
聚類中心A:總包含元素2 669個,其中核心元素2 669,無噪聲元素。
聚類中心B:總包含元素12 491個,其中核心元素12 491,無噪聲元素。
聚類中心C:總包含元素11 005個,其中核心元素11 005,無噪聲元素。
圖10展示了不同類別數(shù)據(jù)在二維圖上的分布情況,需要特別說明的是,圖10中的X軸與Y軸僅代表一種二維空間中的度量,沒有特定的含義。有圖可見,改進(jìn)后的局部密度計算方法是的每個數(shù)據(jù)點(diǎn)的值符合實際,避免了錯誤的分配,減少了私家車的噪聲數(shù)據(jù),且不同類型數(shù)據(jù)存在明顯分離。
圖10 私家車CFSFDP算法分類數(shù)據(jù)二維展示Fig.10 Two-dimensional display of classification data obtained by CFSFDP algorithm
(2)聚類結(jié)果分析及群體定義
由聚類算法結(jié)果可知26 165輛私家車樣本被劃分為3類。為了精準(zhǔn)地認(rèn)識這3種類型的出行特征,需要對選取的5個出行特征指標(biāo)進(jìn)行詳細(xì)的分析。對聚類結(jié)果的3類私家車樣本分別從5個指標(biāo)展開對比分析研究不同的特征規(guī)律,可以準(zhǔn)確定義3類出行特征群體。本研究為比較分析私家車不同群體的特征差異性,繪制參數(shù)比較圖,詳見圖11~圖16。
圖11 私家車出行群體出行頻次比較Fig.11 Comparison of travel frequencies of travel groups
圖12 私家車出行群體軌跡重復(fù)率比較Fig.12 Comparison of travel group trajectory repetition rates
圖13 私家車出行群體在網(wǎng)時間比較Fig.13 Comparison of online time of travel groups
① 出行頻次
類型A:該分類有較高的出行頻次,基本集中3~5次/d,平均4次/d。
類型B:該分類有較低的出行頻次,基本集中2~3次/d,平均2次/d。
圖14 類型A出行時段Fig.14 Travel time of Type A
圖15 類型B出行時段Fig.15 Travel time of Type B
圖16 類型C出行時段Fig.16 Travel time of Type C
類型C:該分類在出行頻次上集中2~4次/d,平均3次/d,出行頻次分布處于中間水平。
② 軌跡重復(fù)率
類型A:該類型有較低的軌跡重復(fù)率,分布集中在[0.18,0.46],平均在0.3左右,說明該類私家車駕駛員每天的行程不太一樣,具有多變性和偶然性。
類型B:該分類有較高的軌跡重復(fù)率,基本集中[0.4,0.83],平均在0.7左右,據(jù)相關(guān)分析軌跡重復(fù)率在0.7左右,即代表該類私家車駕駛員具有極高的軌跡重現(xiàn)性。
類型C:該類型在軌跡重復(fù)率集中[0.27,0.7],軌跡重復(fù)率處于中間水平。
③ 在網(wǎng)時間
類型A:該類型有較高的在網(wǎng)時間,分布集中在[3 609,15 340],平均在7 503 s,即2 h左右。說明該類私家車駕駛員每天在行程上花費(fèi)大量的時間。
類型B:該分類有較低的在網(wǎng)時間,基本集中[1 296,4 642],平均在2 688 s,即0.7 h左右。代表該類私家車駕駛員在行程上所費(fèi)時間較少,對于車輛的依賴性較低。
類型C:該類型在網(wǎng)時間指標(biāo)集中[2 387,6 773],平均4 325 s,駕駛員在網(wǎng)時間處于中間水平。
④ 出行時段分布
類型A:該類型首次出行時段較高集中在07:00—09:00時段,出行結(jié)束時間基本集中在22:00—24:00 時段。其中00:00—05:00出行的車輛分布較其他類型多。
類型B:該類型首次出行時段較高集中在07:00—09:00 時段,出行結(jié)束時間基本集中在17:00—19:00 時段。
類型C:該類型首次出行時段較高集中在07:00—09:00 時段,出行結(jié)束時間基本集中在19:00—22:00 時段。
表5 私家車出行特征群體指標(biāo)Tab.5 Private car travel characteristic group indicators
類型A出行頻次高,軌跡分布較離散且在網(wǎng)時間較高的特點(diǎn)看,該類型接近于私家車商用的司機(jī)特性,例如(滴滴車等),因此類型A在本研究定義為商用私家車出行群體。
類型B出行頻次低,平均2次/d,出行的軌跡重現(xiàn)性高且在網(wǎng)時間較短的特點(diǎn)看,該類型接近于通勤私家車司機(jī)的特性,例如(即基本上班和下班用車),因此類型B在本研究定義為通勤私家車出行群體。
類型C各特征指標(biāo)都處于中間水平的特點(diǎn)看,該類型是介于類型A和類型B之間的,因此類型C在本研究定義為其他私家車出行群體。
⑤ 群體識別結(jié)果
私家車出行群體識別性能函數(shù)見圖17,網(wǎng)絡(luò)經(jīng)過設(shè)定的296次訓(xùn)練達(dá)到設(shè)定的期望誤差。私家車10 466 組測試數(shù)據(jù)識別結(jié)果中準(zhǔn)確識別出10 173組數(shù)據(jù),將類型A識別為類型B的有7組、類型B識別為類型C的有89組數(shù)據(jù),將類型A識別為類型C的有20組,類型C識別為類型A的有59組,將類型C識別為類型B的有113組數(shù)據(jù),將類型B識別為類型A的有5組,因此測試集的識別準(zhǔn)確率高達(dá)97.2%。
圖17 私家車出行群體識別性能函數(shù)Fig.17 Performance function for private car travel group recognition
出租車群體的試驗對象來源于重慶市主城區(qū)2017年10月17日至10月22日的RFID數(shù)據(jù),經(jīng)數(shù)據(jù)處理后,共獲取14 866組完整有效處理后數(shù)據(jù)樣本。根據(jù)前文對出行特征的差異分析,本研究最終選取軌跡重復(fù)率、在網(wǎng)時間、熱點(diǎn)活動區(qū)域及干線影響區(qū)活動偏好4個指標(biāo)構(gòu)成模型的特征向量。
(1)出租車群體劃分
將出租車出行特征群體分類提取的4種特征指標(biāo)(軌跡重復(fù)率、在網(wǎng)時間、熱點(diǎn)活動區(qū)域及干線影響區(qū)活動偏好),進(jìn)行聚類分析,得到結(jié)果如下:
① 聚類中心F:總包含元素5 562個,其中核心元素5 199,噪聲元素有363。
② 聚類中心G:總包含元素9 304個,其中核心元素8 669,噪聲元素有635。
由圖18可知聚類的兩種群體具有部分噪聲點(diǎn),這可能由于部分出行車輛出行獨(dú)特性造成,但是這種獨(dú)特體較少,且可有不同,不能代表為一類群體,只能證明存在特殊情況。
圖18 出租車分類數(shù)據(jù)二維展示Fig.18 Two-dimensional display of taxi classification data
(2)聚類結(jié)果分析及群體定義
① 在網(wǎng)時間
類型F:相比類型G,該分類有存在較多樣本的在網(wǎng)時間較短,從箱圖比較上看略微低于類型G,但總體分布相差并不大。
類型G:同理對比類型F,該分類總體上略微比類型F的在網(wǎng)時間長。
出租車的兩種分類群體對于在網(wǎng)時間指標(biāo)上,相差不大都集中位于[14,20]區(qū)間。這與前章分析也較為符合,由于出租車時商業(yè)運(yùn)營車輛,基本全天都處于路網(wǎng)運(yùn)營,極少由于特殊原因在網(wǎng)時間短的,見圖19。
圖19 出租車出行群體在網(wǎng)時間比較Fig.19 Comparison of online time of taxi travel groups
② 軌跡重復(fù)率
類型F:對比類型G,該類型的軌跡重復(fù)率略低,且部分重復(fù)率<0.05的樣本比類型G多,分布集中在[0.203,0.278]區(qū)間,平均處于0.242左右,見圖20。
類型G:對比類型F,該分類軌跡重復(fù)率略高,基本集中[0.238,0.308]區(qū)間,平均在0.272左右,整體分布略高于類型F。類型F相對比類型G在軌跡重復(fù)率的特征上較低,說明類型G更偏向于在固定區(qū)域活動,但總體都處于很低的狀況,這是由于出租車的運(yùn)營性質(zhì)決定出租車軌跡的隨機(jī)性以及廣泛性,極少存在重復(fù)率很高或者重復(fù)率很低的情況,因此單獨(dú)來看也不足以劃分為一種常規(guī)群體。
圖20 出租車出行群體軌跡重復(fù)率比較Fig.20 Comparison of trajectory repetition rates of taxi travel groups
③ 熱點(diǎn)活動區(qū)域
類型F:該類型出租車熱點(diǎn)活動區(qū)域為大楊石組團(tuán)、沙坪壩組團(tuán)、李家沱組團(tuán)、大渡口組團(tuán)、空港組團(tuán)、西永組團(tuán)以及北碚組團(tuán)。其中該群體出租車的熱點(diǎn)活動區(qū)域集中分布在大楊石組團(tuán),占全部的61%,其次是李家沱組團(tuán),占據(jù)了18%的比例;以及沙坪壩組團(tuán),占比15%,見圖21。
類型G:該類型出租車熱點(diǎn)活動區(qū)域為渝中組團(tuán)、南坪組團(tuán)、觀音橋組團(tuán)、人和組團(tuán)、禮嘉組團(tuán)以及空港組團(tuán)。其中該群體出租車的熱點(diǎn)活動區(qū)域集中分布在觀音橋組團(tuán),占全部的68%;以及南坪組團(tuán),占據(jù)了21%的比例,見圖22。
圖21 類型F熱點(diǎn)活動區(qū)域分布Fig.21 Distribution of hotspot activity area type F
圖22 類型G熱點(diǎn)活動區(qū)域分布Fig.22 Distribution of hotspot activity area Type G
類型G與類型F兩個分類在熱點(diǎn)活動區(qū)域分布上有相交區(qū)域(觀音橋組團(tuán)、禮嘉組團(tuán)),但是在大部分區(qū)域上不是相同的。類型F的熱點(diǎn)活動區(qū)域集中在重慶城區(qū)中部和北面,類型G則是集中在西面。
④ 干線影響區(qū)選擇偏好
類型F:干線影響區(qū)偏好小于類型G,其集中在[0.012,0.067]之間,平均值為0.037,見圖23。
圖23 出租車出行群體干線影響區(qū)選擇偏好比較Fig.23 Comparison of selection preferences of taxi travel groups affected by main line
類型G:該分類較多的經(jīng)過干線影響區(qū),偏好指標(biāo)在[0.053,0.146],分布高于類型F。
綜上所述,類型F與類型G在干線影響區(qū)選擇偏好特征上存在較大的差別,干線影響區(qū)選擇偏好雖然也存在加大的隨機(jī)性,與出租車的熱點(diǎn)活動區(qū)域以及出租車駕駛員住址有著一定的關(guān)系。相臨近的區(qū)域偏向選擇干線影響區(qū)。
類型F出行區(qū)域集中在重慶中部以及南部,且干線影響區(qū)選擇偏好較小的特點(diǎn)看,該類型出租車較少經(jīng)過干線影響區(qū),因此類型F在本研究定義為其他區(qū)域偏好出租車群體。
類型G出行區(qū)域集中在重慶西部,且干線影響區(qū)選擇偏好較大的特點(diǎn)看,該類型干線影響區(qū)的影響想對較大,因此類型G在本研究定義為干線影響區(qū)偏好出租車群體。出租車的出行特征群體分類主要存在的差異性主要體現(xiàn)在運(yùn)行活動區(qū)域上,由表6分析可知出租車中類型G(干線影響區(qū)偏好群體)的活動熱點(diǎn)區(qū)域集中在渝中組團(tuán)、南坪組團(tuán)、觀音橋組團(tuán)、人和組團(tuán)以及空港組團(tuán)。
表6 出租車出行特征群體指標(biāo)Tab.6 Taxi travel characteristic group indicators
(三)群體識別結(jié)果
出租車特征群體得識的性能函數(shù)見圖24,從圖中可以看出實際網(wǎng)絡(luò)經(jīng)1 000次可以較精準(zhǔn)達(dá)到期望目標(biāo)。出租車5 946組測試數(shù)據(jù)識別結(jié)果見圖25,其中準(zhǔn)確識別出5 897組數(shù)據(jù),將類型F識別為類型G的有32組數(shù)據(jù),將類型G識別為類型F的有17組,因此測試集的識別準(zhǔn)確率高達(dá)99.18%。
圖24 出租車出行群體識別性能函數(shù)Fig.24 Performance function for taxi travel group recognition
圖25 出租車特征群體識別結(jié)果Fig.25 Taxi characteristic group recognition result
本研究主要開展軌跡數(shù)據(jù)驅(qū)動的出行特征指標(biāo)分析以及出行特征群體辨識建模兩大部分研究工作。通過RFID軌跡數(shù)據(jù),基于數(shù)據(jù)統(tǒng)計分析研究了出行特征指標(biāo)提取方法,由此建立車輛出行特征辨識指標(biāo)體系。針對私家車、出租車的出行特點(diǎn)進(jìn)行出行特征指標(biāo)的定制提取,采用基于密度峰值的聚類算法(CFSFDP)以及BP組合模型,對特征指標(biāo)進(jìn)行聚類分析,再集合BP神經(jīng)網(wǎng)絡(luò)算法,建立出行特征群體識別模型。以重慶主城區(qū)內(nèi)私家車、出租車為試驗對象,基于RFID數(shù)據(jù)分別提取出行頻次,軌跡重復(fù)率、首次出行時間、出行結(jié)束時間等指標(biāo)進(jìn)行聚類分析和識別建模,最終實現(xiàn)車輛的不同出行特征模式的辨識,具有較好的應(yīng)用前景,具體體現(xiàn)在以下幾個方面:
(1)本研究對車輛出行特征進(jìn)行了詳細(xì)的研究及分類,能夠有效辨識不同的車輛群體,為下一步預(yù)測不同群體的出行時長、路徑選擇,以及掌握車輛的OD出行等方面提供了數(shù)據(jù)支撐;
(2)城市交通流的變化規(guī)律,其實質(zhì)就是對城市居民出行特征的研究分析。不同的群體有著不同的出行特性,只有追蹤車輛出行軌跡的溯源,才能從根本上對交通流進(jìn)行管控,為解決干線擁堵問題奠定了重要基礎(chǔ);
(3)探究車輛運(yùn)動軌跡的溯源,挖掘車輛的出行特征,不僅是精準(zhǔn)掌握車輛出行OD和進(jìn)行合理的路網(wǎng)資源配置的前提,同時也能夠更加緊密地結(jié)合城市道路交通管控,為城市道路交通個性化智能管控提供理論依據(jù)。