鄒兵,余志,何兆成,黃敏,陳開穎,沙志仁
1. 中山大學智能工程學院/廣東省智能交通系統(tǒng)重點實驗室,廣東 廣州 510006
2. 廣東方緯科技有限公司,廣東 廣州 510006
城市路網(wǎng)在規(guī)劃設計上可分為快速路、主干路、次干路和支路4類[1]。分析道路在整個網(wǎng)絡的動態(tài)使用特征,挖掘道路隨著交通出行需求演變的使用模式,有助于交通管理部門更科學地進行城市道路交通管理和決策。目前,國內(nèi)外學者在道路使用特征的研究上主要分為2 類[2-4]。李彥瑾通過網(wǎng)絡特性分析篩選道路網(wǎng)絡中脆弱道路集合,并以此為基礎設計了一種路網(wǎng)矩陣壓縮算法[5]。尹洪英、戢曉峰分別提出了基于貝葉斯網(wǎng)絡的道路脆弱動態(tài)識別模型[6]和粗糙集的路網(wǎng)瓶頸路段識別方法[7],并驗證了方法的可靠性。鐘茹則建立了路網(wǎng)關鍵節(jié)點和路段的分析方法,并提出了針對性的管理建議[8]。Jiang 從道路的連通性[9]角度研究了街道是如何被使用的,并表明城市街道的連通性具有類似于復雜網(wǎng)絡的二八法則。Pu Wang[10]通過手機信令數(shù)據(jù)估計出行需求,研究道路在空間拓撲中的中介中心性和來源小區(qū)數(shù),以此進行城市道路的分類。此外,一些研究基于出租車軌跡數(shù)據(jù)分析路段行駛頻次,或基于運行速度分析挖掘城市道路動態(tài)層次性[11-12]。
以上研究主要通過將出行映射到路網(wǎng),利用交通流集計產(chǎn)生的交通狀態(tài)參數(shù)研究道路的實際使用特征,尚未有研究利用身份檢測數(shù)據(jù)的“身份”信息蘊含的出行規(guī)律,從車輛個體角度出發(fā)進行城市路網(wǎng)的使用特征的認知。而隨著檢測器技術的發(fā)展,以電警卡口、RFID 為代表的具有身份標識的檢測數(shù)據(jù)愈發(fā)普遍。道路身份檢測系統(tǒng)通過視頻分析、圖像識別等技術的應用,實現(xiàn)了對車輛個體的精準感知,檢測信息包括車輛的身份信息(如車牌)、經(jīng)行的道路及其車道、過車時刻等,為量化研究特定出行車輛個體與道路之間關系、挖掘道路使用特征提供了有效的數(shù)據(jù)支撐。
本文將借助基尼系數(shù)相關理論,根據(jù)洛倫茲曲線提出“平均分界點”的定義,基于車輛身份檢測數(shù)據(jù)研究城市道路使用的不均衡特性以及時空特征,從車輛個體的角度提出一種進行城市道路使用模式分類挖掘的方法,為城市道路規(guī)劃、建設以及交通需求管理提供科學參考。
本研究通過城市道路中電子警察系統(tǒng)、治安卡口系統(tǒng)所產(chǎn)生的身份檢測數(shù)據(jù)進行車輛個體出行信息獲取。車輛身份檢測是面向路網(wǎng)全體車輛、明確車輛個體及其時空信息的全量精準檢測。然而,車輛身份檢測數(shù)據(jù)只是車輛經(jīng)行時空戳的簡單記錄,尚未具備車輛出行趟次、出行路徑、旅行時間等交通信息。因此,需要融合車輛身份檢測相關的多源基礎數(shù)據(jù),進行車輛出行重構,才能全面獲取完整的車輛出行信息,進而開展道路出行的分析。本文采用卡口產(chǎn)生的車牌識別數(shù)據(jù)開展研究,圖1為車輛出行信息重構分析框架。
圖1 車輛個體出行信息重構分析Fig.1 Analysis of vehicles′mobility reconstruction
針對由于車牌識別錯誤,通信異常等因素產(chǎn)生的臟數(shù)據(jù)進行清洗,以提升數(shù)據(jù)的質(zhì)量。處理過程如下:
①重復冗余數(shù)據(jù)剔除。針對檢測過程中出現(xiàn)的檢測記錄重復,如車牌號、檢測卡口點位等記錄一致的數(shù)據(jù)進行去重;針對車牌號識別失敗,如出現(xiàn)“車牌”識別記錄的數(shù)據(jù)進行剔除;對車牌號位數(shù)不正確等不合理數(shù)據(jù)進行剔除。
②異常數(shù)據(jù)剔除。將檢測數(shù)據(jù)組織為車輛個體卡口檢測序列,若車輛veh 當前共產(chǎn)生n次卡口檢測,則其卡口序列記為Iveh=(I1,I2,…,In)。每次檢測的In=(veh,tn,pn),其中veh 為車輛身份標識,tn為檢測時間,pn為卡口標識,且pn包含卡口編號及其車道編號,可關聯(lián)到路網(wǎng)。根據(jù)兩次卡口檢測序列之間的時間得到時間差△T =tn-tn-1,剔除時間差小于最小路段行駛時間tmin的數(shù)據(jù)記錄。
式中l(wèi)為路段長度,vmax根據(jù)城市限速情況選取。
單次出行辨識的問題是:依據(jù)車輛個體在卡口的檢測記錄,判斷車輛的連續(xù)兩次卡口檢測屬于“同次出行”還是“前后兩次出行”。設定旅行時間閾值T,車輛經(jīng)由一對相鄰卡口檢測器的旅行時間為△t,當△t≤T時屬于同次出行,當△t>T時其分屬前后兩次出行。學習旅行時間閾值T是無監(jiān)督學習中的二分類問題,采用k-means(k= 2)聚類算法,具體流程為:
①利用長期(1個月)的歷史卡口數(shù)據(jù),獲取卡口對的旅行時間樣本集D={x1,x2,…,xm}。
②采用標準的k-means(k= 2)聚類算法將旅行時間樣本集D劃分為同次出行簇C1和兩次出行簇C2,如圖2 所示。那么,閾值T可取為同次出行簇C1的上界值,即
圖2 某相鄰卡口對的旅行時間樣本聚類Fig.2 Travel time sample clustering for adjacent bayonet pair
通過旅行時間閾值T,將卡口檢測序列分割為車輛個體的若干個單次出行記錄。
在提取車輛個體的單次出行卡口檢測序列后,進一步修復其連續(xù)的出行路徑。本文針對卡口密集分布的車輛身份檢測網(wǎng)絡,城市路段圍成的土地區(qū)塊可用網(wǎng)格狀表示。那么,相鄰兩次卡口檢測的位置關系如圖3所示。圖3(a)的相鄰檢測屬于路段上下游交叉口關系,圖3(b)的相鄰檢測屬于交叉口位于網(wǎng)格的對角位置?;贒ijkstra 最短路算法置信地認為相鄰檢測的出行路徑是圖中I1而非I2,因為路徑到達后次檢測交叉口的進口道方向與觀測不一致。
圖3 相鄰卡口檢測I1和I2的位置關系Fig.3 Location relationships for adjacent bayonet detection I1 and I2
基于車輛個體的單次出行卡口檢測序列重構其出行路徑后,最終得到車輛個體出行的起始卡口、終點卡口、路徑經(jīng)過卡口、出行出發(fā)時間、出行結束時間,將車輛每次出行時空軌跡通過卡口設備和路網(wǎng)關聯(lián)關系映射到路網(wǎng),進一步基于路網(wǎng)道路基本信息得到車輛每次出行的出行距離和出行時間。
基于車輛的個體出行路徑信息,借鑒網(wǎng)絡流重構問題的一般思路,路徑流可集計得到節(jié)點流、路段流、OD 流,從而獲得城市道路的多尺度交通需求。在固定時間間隔內(nèi),統(tǒng)計所有經(jīng)過某道路的車輛(折算為標準車輛數(shù))即得到道路的交通需求,同理可得交叉口、路徑、OD 的交通需求。通過“身份標識”,可以開展特定車輛個體在道路使用中的不均衡特性研究。
洛倫茲曲線是一種反映社會收入或分配不平均的工具。橫軸為家庭或人口的累計百分比,縱軸為家庭或者人口所占收入的累計百分比,表示收入最低的前p1%占據(jù)了p2%的財富,如圖4 所示。折線OHL 通常稱作“絕對不平均線”。對角線OL為“絕對平均線”,表示收入分配絕對公平。
圖4 洛倫茲曲線Fig.4 The curve of Lorenz equation
基尼系數(shù)是在洛倫茲曲線的基礎上提出的用于衡量國家和社會收入分配不公平程度的指標[13],也被廣泛應用于描述資源分配的均衡程度?;嵯禂?shù)G的計算公式為[14]
式中A表示洛倫茲曲線與絕對公平線之間的面積,B表示洛倫茲曲線與絕對不公平曲線之間的面積,f(x)是洛倫茲曲線的函數(shù)式。通用的基尼系數(shù)標準如表1所示。
表1 聯(lián)合國基尼系數(shù)標準Table 1 The Gini coefficient criterion of United Nations
基尼系數(shù)本質(zhì)是將不同的個體按照其某個屬性量進行升序排序,計算其分布的不均衡程度。在交通研究領域,黃志遠、肖雪梅將基尼系數(shù)相關理論用于軌道交通客流網(wǎng)絡分布均衡性評價[15]與客流在入口、車站、線路的分布均衡性研究[16],驗證了方法的可行性;代洪娜和房晉源則分別將基尼系數(shù)用于高速公路的流量分布不均衡[17]和公交線網(wǎng)不均衡性評價[18],證明了基尼系數(shù)在交通領域的適用性。
由于道路周邊土地利用性質(zhì)的不同,不同車輛個體在特定道路出行的頻率、距離、時間會存在較大的差異。如:對于核心區(qū)域,少部分車輛往往固定選擇通過這些道路出行,造成固定選擇該道路出行的很小一部分車輛占據(jù)了這些道路的大部分時空資源,而其余大部分車輛只占據(jù)了少部分的出行資源,表現(xiàn)出類似收入分配中“貧富差距不均衡”的現(xiàn)象?;谲囕v出行的道路基尼系數(shù)反映具有身份標簽的不同車輛使用該道路的不均衡程度,基尼系數(shù)越小,表示車輛個體在該道路的出行越均衡,即車輛長期使用該道路的不均衡程度越?。环粗?,少數(shù)車輛越集中使用該道路,車輛長期使用該道路的不均衡程度越大。道路的基尼系數(shù)能從車輛個體出行角度直觀地反映車輛個體與道路出行之間的不均衡規(guī)律,側面反映道路使用的特征與模式。因此,本文采用基尼系數(shù)進行城市道路車輛出行不均衡程度的度量。同時,基于洛倫茲曲線的變化規(guī)律提出平均分界點,用于提取二分閾值。
道路使用特征與模式是在車輛個體長期出行過程中逐漸形成的潛在規(guī)律。構建車輛出行的道路基尼系數(shù)模型對道路使用進行量化評價。目前,計算基尼系數(shù)常用的方法有幾何計算法、相對平均差法、矩陣方法以及曲線擬合法。本文基于車輛個體在全網(wǎng)道路的出行需求,以車輛個體出行次數(shù)為例,采用曲線擬合法進行城市道路車輛出行不均衡模型的構建。具體方法如下:
1)按照特定道路出行車輛個體i的出行次數(shù)si的大小將出行車輛i進行升序排序,得到i1≤i2≤…≤in。
3)以Xk為橫軸、Yk為縱軸,得到n組數(shù)據(jù)的散點圖,如圖5所示。
4)采用最小二乘法擬合確定待定系數(shù)、最小化擬合模型與實際觀測值的誤差平方和,得到曲線y如公式(5)所示:
5)基于車輛個體出行的洛倫茲曲線進行車輛個體使用道路的不均衡評價,進一步計算得到道路使用基尼系數(shù)G為
按照特定道路出行車輛個體i的出行次數(shù)si從小到大排序,假設f(s)為出行次數(shù)分布的密度函數(shù),F(xiàn)(s)為出行次數(shù)≤s的累計密度函數(shù),圖5 的橫軸可以表示為
圖5 車輛個體出行洛倫茲曲線Fig.5 The Lorenz curve based on vehicles′trip number
縱軸的累計車輛出行百分比可以表示為
特定道路車輛個體出行的平均次數(shù)μ為
令p=F(s),則圖5的洛倫茲曲線可以表示為
車輛個體出行的洛倫茲曲線L(p)隨著橫軸累計車輛百分比的增加,其斜率呈現(xiàn)出逐漸增大的趨勢。設洛倫茲曲線上與絕對平均線平行即斜率為1 的點為M(x*,y*)??梢钥闯?,在M點之前,曲線隨著車輛數(shù)累計百分比的增加其累計車輛出行百分比緩慢增加,曲線坡度較緩和;在M點之后曲線隨著車輛數(shù)累計百分比的增加,累計車輛出行百分比迅速增加,曲線坡度較陡。曲線斜率為
當其斜率平行于絕對平均線時,令L′(p) = 1,得p=F(μ)或x=μ,可以得到洛倫茲曲線上斜率為1 的點與車輛個體的出行次數(shù)是一致的。定義M(x*,y*)為洛倫茲曲線上的平均分界點,其值為
M點將車輛個體分為了占據(jù)較多出行的少數(shù)車輛和占據(jù)較少出行的多數(shù)車輛,其劃分閾值為該物理量的平均值。
以安徽省宣城市城市路網(wǎng)為例,截止2017 年市區(qū)建成面積達65.5 km2,道路總長度191.3 km,主次支道路比例為1∶1.09∶0.16。同時,機動車保有量的增加以及城鎮(zhèn)化的加速,導致路網(wǎng)與交通需求的矛盾日益加劇,路網(wǎng)使用模式與規(guī)劃服務等級不符,亟待科學合理的交通管理。
宣城市智能交通信息化基礎較好,核心城區(qū)建有108 個道路新型卡口式電警,覆蓋率高達76%。選取該市2018年8月城區(qū)電警卡口的車牌識別數(shù)據(jù)進行分析,數(shù)據(jù)示例如表2所示。
表2 車牌識別數(shù)據(jù)示例Table 2 Example records of license plate recognition data
通過卡口數(shù)據(jù)的預處理、單次出行辨識、出行路徑修復等步驟獲取道路的車輛個體出行信息。本研究的日均出行車輛約8萬輛,單次出行記錄約28萬條。提取車輛個體8月道路出行信息進行模型構建及道路使用評價。
以宣城市路網(wǎng)中的核心城區(qū)有向路段為例,依據(jù)上文描述的方法,以車牌號碼作為車輛個體標簽計算宣城市各道路的基尼系數(shù),同時進行不同時段的基尼系數(shù)對比。
3.2.1 空間特征分析 從圖6 可以看出,宣城市區(qū)不同區(qū)域的基尼系數(shù)大小的分布是不均勻的,路網(wǎng)中各道路的車輛出行不均衡程度不同。按照國際標準,基尼系數(shù)大于0.4時表示某道路車輛出行不均衡程度較大,即少數(shù)的車輛在該道路出行較頻繁,宣城市區(qū)出行不均衡程度較大的道路主要集中在:
(1)宣城市田字格中心區(qū)以及景德路梅園路附近,即圖6 中區(qū)域①。該區(qū)域道路位于中心城區(qū),出行不均衡程度較高,說明少數(shù)車輛需要經(jīng)常在該道路出行,道路可能承擔著較為重要的交通樞紐功能。
圖6 宣城市路網(wǎng)基尼系數(shù)Fig.6 The road segments′Gini coefficient in Xuancheng City
(2)宣城市部分新開發(fā)的居住地區(qū)域,即圖6中區(qū)域②。該區(qū)域道路附近車輛來源較少,出行車輛主要為集中于這些居住地的少部分車輛,道路的流量較少,但基尼系數(shù)較大,意味著該區(qū)域道路連通性差,主要服務區(qū)域車輛。
(3)一些重要的進出城區(qū)的主干道路,即圖6中道路③、薰化路、向陽大道等。該部分道路連接的出行小區(qū)數(shù)量較少,經(jīng)常經(jīng)過該道路的車輛較為固定。此種類型道路相較于第一種中心城區(qū)主干道路,實際主要承擔外圍主干連接型道路的功能。
因此,基尼系數(shù)通過描述特定道路上車輛出行的不均衡程度,能很好地從車輛個體的微觀角度反映道路的出行特征。不同城市均可以通過各道路基尼系數(shù)的對比,清晰直觀展現(xiàn)道路使用的空間特征。不均衡程度較大的道路,其使用集中于較少數(shù)的車輛,在日常的交通管理中,可以針對性地對這些少數(shù)車輛進行管理。如區(qū)域①部分的道路,可以通過路徑誘導、錯峰出行等手段引導經(jīng)常使用其的少數(shù)車輛避開該擁堵道路,將需求出行降低到承載力以下。
3.2.2 時間特征分析 路網(wǎng)中各道路基尼系數(shù)會隨時段變化而動態(tài)變化,出行不均衡程度的變化能從側面反映了城市道路在使用上的時變特征。而道路的這種使用特征也能從車輛出行的角度展現(xiàn)城市不同區(qū)域的土地利用功能現(xiàn)狀。
將宣城市道路的高峰(7:00 - 9:00)與平峰(10:00 - 12:00)時段的基尼系數(shù)進行對比,表示為高峰和平峰的比值G高峰/G平峰,觀測到不均衡程度相差較大的道路(線段較粗)主要分布在城市外圍區(qū)域。這些道路往往承擔著重要的通勤功能,即在高峰時段固定出行的車輛數(shù)多,而平峰時段固定出行的車輛數(shù)相對較小,從而導致其兩個時段的差異明顯。基尼系數(shù)變化不敏感的道路(線段較細)主要是分布在中心城區(qū)的道路,由于出行不均衡程度均很大,兩個時段的基尼系數(shù)差異不明顯,如圖7所示。
圖7 路網(wǎng)高峰和平峰時段的基尼系數(shù)比值Fig.7 The ratio of road segments′Gini coefficient between peak hour and off-peak hour
在日常的交通管理中,應該加強對高峰與平峰時段基尼系數(shù)比值較大道路的管理和服務。如:針對日常通勤需要經(jīng)過此類道路的車輛,根據(jù)其常駛道路形成的常駛路徑及時段設置彈性綠波帶,降低平均旅行時間,提高平均不停車通過率。
道路的使用模式分類是對道路使用的更加精細的量化手段。一方面,通過道路的分類,形成對城市道路在實際出行需求下的真實使用狀態(tài)的認知,幫助交通管理部門及時地對已建成道路進行更加科學的設計,如根據(jù)現(xiàn)有道路使用上的不足進行基礎道路設施的規(guī)劃和擴建;另一方面,有助于交通管理部門針對不同的道路使用類型,開展個性化管理,既可降低管理成本,又可提升管理效率。
本節(jié)從車輛出行的不均衡特征這一微觀角度出發(fā),提出一種道路使用模式分類方法。研究發(fā)現(xiàn),將基尼系數(shù)與傳統(tǒng)的道路交通流量結合,能夠很好地刻畫道路的使用特征。道路的交通流量反映“很多車輛出行需要使用該道路”,而道路基尼系數(shù)反映“固定的很少車輛經(jīng)常使用該道路”的出行不均衡程度。首先對兩個指標進行相關性檢驗,宣城市路網(wǎng)道路交通流量與基尼系數(shù)存在很弱的相關關系,如圖8(a)所示,說明道路交通流量與基尼系數(shù)并不具有顯著的正相關關系,也就是道路的交通流量大并不意味著該道路出行不均衡程度大,道路交通流量小并不意味著道路出行不均衡程度小。
圖8 道路交通流量與基尼系數(shù)的分類Fig.8 The road segments traffic tlow and Gini coefficient classification
本文通過“平均分界點”分別提取流量和基尼系數(shù)的二分閾值,將道路交通流量與其基尼系數(shù)結合進行四分類。根據(jù)平均分界點與物理量平均值相等的證明,將道路流量(基尼系數(shù))大于路網(wǎng)平均流量的道路定義為流量高道路(基尼系數(shù)高),其余的定義為流量低道路(基尼系數(shù)低),如圖8(b)所示。定義交通流量很大,基尼系數(shù)很大的道路為樞紐型道路,承擔重要的連接和中轉(zhuǎn)作用,如宣城市樞紐型道路主要為城市中心城區(qū)和外圍進出城區(qū)的道路。交通流量很大但是基尼系數(shù)小的道路為過境型道路,承擔服務過境需求的功能。交通流量小但基尼系數(shù)很大的道路為區(qū)域生活型支路,如宣城市區(qū)域生活型支路多位于新開發(fā)居住區(qū)域或者連通性較差的居住區(qū)域,以及服務于少數(shù)居民的固定居住區(qū)域。其他為開放生活型支路,其周邊土地利用性質(zhì)多樣,承擔連接高等級道路的支路功能。宣城市道路使用模式分類如圖9和表3所示。
圖9 道路使用模式分類Fig.9 The road segments usage patterns classification
表3 道路使用模式分類Table 3 The road segments usage patterns classification
針對樞紐型道路,在日常的交通管理中,保障其連接和中轉(zhuǎn)的重要功能,提升通行效率;并基于使用該類型道路的少數(shù)車輛開展個性化服務,如共享出行,公交優(yōu)先等。同時可考慮進行城市土地利用調(diào)整,將混合利用的土地功能向城市周邊疏解,緩解中心城區(qū)擁堵。針對過境型道路,由于其服務的車輛大多數(shù)為過境型車輛,可重點開展安全管控、貨運車管理。規(guī)劃方面應避免其他性質(zhì)土地干擾過境干道的使用功能,保障其過境服務的功能。針對區(qū)域生活型道路,可著力發(fā)展其周圍區(qū)域,承接中心擁堵城區(qū)的功能,并改善道路的連通性和可達性。針對開放型支路,保障其連接功能,提升其交通流的疏散效率,更好地與其他類型道路進行協(xié)調(diào)。
本文從車輛個體出行的角度,提出了基于車輛身份檢測數(shù)據(jù)和基尼系數(shù)的城市道路使用特征分析和模式分類方法,并根據(jù)洛倫茲曲線及其物理意義提出平均分界點的概念。以安徽省宣城市為例,基于身份檢測數(shù)據(jù)進行了案例分析。結果表明:在日常的交通管理中,需要對承擔著重要功能作用的道路進行重點管理;在城市建設和交通規(guī)劃中,應著重發(fā)展尚未被充分利用的區(qū)域和利用高等級但服務強度小的道路?;诨嵯禂?shù)和平均分界點的城市道路使用特征分析方法簡單直觀、易于操作,能夠從時間、空間維度對道路使用特征進行量化分析,同時從車輛個體出行不均衡的角度對道路模式進行分類。