葉秀秀 馬曉鳳▲ 鐘 鳴 黃傳明
(1.武漢理工大學(xué)智能交通系統(tǒng)研究中心 武漢430063;2.武漢理工大學(xué)國(guó)家水運(yùn)安全工程技術(shù)研究中心 武漢430063;3.武漢市公安局交通管理局 武漢430030)
短時(shí)交通預(yù)測(cè)是城市智能交通系統(tǒng)的重要部分,能為出行者提供出行路徑參考,也可為交通管理者制定交通控制和交通誘導(dǎo)決策提供依據(jù)。目前,短時(shí)交通流預(yù)測(cè)理論研究已經(jīng)相對(duì)成熟,預(yù)測(cè)模型主要分為:①基于統(tǒng)計(jì)方法的模型,如歷史平均法[1]、時(shí)間序列模型[2]等;②基于非線性系統(tǒng)理論的方法,如小波理論模型[3]等;③人工智能算法,近年來(lái)相關(guān)學(xué)者多使用該類方法進(jìn)行交通流預(yù)測(cè)研究,如Chen等[4]針對(duì)交通流具有時(shí)變和非線性的特點(diǎn)提出改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)短時(shí)交通流預(yù)測(cè)模型,其預(yù)測(cè)誤差比傳統(tǒng)的小波神經(jīng)網(wǎng)絡(luò)減小了14.994%;馮微等[5]基于深度學(xué)習(xí)構(gòu)建短時(shí)交通流參數(shù)預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)大規(guī)模路網(wǎng)速度參數(shù)預(yù)測(cè);④多種算法組合應(yīng)用,如Asif Raza等[6]采用遺傳算法對(duì)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化并結(jié)合局部加權(quán)回歸進(jìn)行短時(shí)交通流預(yù)測(cè)。以上方法主要為基于單個(gè)路段的交通流特性對(duì)該路段進(jìn)行交通流預(yù)測(cè)研究。為提高預(yù)測(cè)精度及更全面的挖掘交通流變化規(guī)律,許多學(xué)者進(jìn)行了基于路網(wǎng)時(shí)空特性的交通流預(yù)測(cè)研究,如李巧茹等[7]針對(duì)交通流量時(shí)間序列具有混沌特性進(jìn)行相空間重構(gòu),并在此基礎(chǔ)上構(gòu)建PSO-GPR模型短時(shí)交通流預(yù)測(cè)模型;Alireza Ermagun等[8]基于路網(wǎng)交通流數(shù)據(jù)提取路網(wǎng)的網(wǎng)絡(luò)權(quán)值矩陣進(jìn)行短時(shí)交通流預(yù)測(cè),該權(quán)值矩陣在交通流預(yù)測(cè)精度高于傳統(tǒng)的空間相關(guān)性方法且具有隨時(shí)間變化的穩(wěn)定性和魯棒性。
上述交通流預(yù)測(cè)方法是基于目標(biāo)路段及相關(guān)路段歷史交通流進(jìn)行模型訓(xùn)練,適用于有檢測(cè)器路段。但是隨著城鎮(zhèn)化及城市路網(wǎng)的快速擴(kuò)張,檢測(cè)器難以覆蓋路網(wǎng)的所有路段,如武漢市路網(wǎng)空間化后有ID的路段共有5萬(wàn)多條,其中有檢測(cè)器的路段只占10.48%。因此,要實(shí)現(xiàn)路網(wǎng)的宏觀管理,無(wú)檢測(cè)器路段的交通流預(yù)測(cè)將是路網(wǎng)交通流預(yù)測(cè)不可缺少的一部分。但是,國(guó)內(nèi)外對(duì)于無(wú)檢測(cè)器路段交通流預(yù)測(cè)理論研究還處于發(fā)展階段。張赫等[9]利用交叉口的相關(guān)性采用聚類分析、逐步回歸分析及主成分分析分別進(jìn)行無(wú)檢測(cè)器路段的交通流預(yù)測(cè),其中主成分分析法計(jì)算工作量大于另外2種方法,該方法能夠包含的交通信息量更多并且預(yù)測(cè)精度更高,其中聚類分析和主成分分析是早期研究中應(yīng)用較多的方法[10-11]。基于灰色預(yù)測(cè)模型(GM)預(yù)測(cè)所需原始數(shù)據(jù)少的特點(diǎn),相關(guān)學(xué)者采用改進(jìn)的GM、GM與神經(jīng)網(wǎng)絡(luò)的組合算法(GNN)等方法,以路段觀測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練和交通流量預(yù)測(cè),基于目標(biāo)路段觀測(cè)數(shù)據(jù)的改進(jìn)GM算法和GNN算法,其預(yù)測(cè)平均相對(duì)誤差可減小2%~10%[12-13]。此外,王志建[14]利用遺傳算法改進(jìn)的逐步回歸分析法進(jìn)行無(wú)檢測(cè)器交叉口流量預(yù)測(cè),相對(duì)于早期聚類分析法和主成分分析法,該方法對(duì)無(wú)檢測(cè)器路段流量預(yù)測(cè)平均相對(duì)誤差減小了11%和6%;郭沂鑫[15]首次將PNN概率神經(jīng)網(wǎng)絡(luò)應(yīng)用在無(wú)檢測(cè)器交叉口的歸類中,實(shí)驗(yàn)結(jié)果顯示PNN分類模式預(yù)測(cè)模型具有一定的穩(wěn)定性,優(yōu)于傳統(tǒng)的分類方法。由于交通流量具有不確定性和復(fù)雜性等特點(diǎn),數(shù)學(xué)解析的硬分類模型在解決交通流問(wèn)題中存在局限性,對(duì)此張明輝[16]提出采用模糊C均值(FCM)聚類方法對(duì)城市路網(wǎng)中各個(gè)交叉口進(jìn)行模糊聚類,基于該方法進(jìn)行無(wú)檢測(cè)器路段的短時(shí)交通流預(yù)測(cè)易于實(shí)現(xiàn)且預(yù)測(cè)精度較高。
以上利用路段聚類、回歸分析等統(tǒng)計(jì)方法及人工智能算法對(duì)無(wú)檢測(cè)器路段進(jìn)行交通流預(yù)測(cè)研究中,仍需要一定數(shù)量的無(wú)檢測(cè)器路段歷史數(shù)據(jù)進(jìn)行模型訓(xùn)練,這些歷史數(shù)據(jù)一般來(lái)源于浮動(dòng)車數(shù)據(jù)及人工采集等,采集手段有限,且存在采集精度差、成本高、實(shí)時(shí)性差等不足。因此,需要發(fā)掘新的方法以解決大量無(wú)檢測(cè)器路段的交通流預(yù)測(cè)問(wèn)題,這樣才能在大規(guī)模全路網(wǎng)的快速預(yù)測(cè)和應(yīng)用中具有可操作性和實(shí)用性。筆者提出1種基于上游路段空間特征影響度系數(shù)的交通流預(yù)測(cè)方法,對(duì)路網(wǎng)中所有路段均有檢測(cè)器的交叉口進(jìn)行數(shù)據(jù)挖掘和規(guī)律分析,獲取路段空間特征影響度系數(shù)。然后選取無(wú)檢測(cè)器路段為案例研究對(duì)象,基于空間特征影響度系數(shù)、案例空間特征及其上游路段交通流量,進(jìn)行該案例的流量預(yù)測(cè)計(jì)算及驗(yàn)證。
城市道路交通是1個(gè)復(fù)雜的系統(tǒng),交通流受多種因素的影響,表現(xiàn)出非線性、不確定性等特性。由于道路之間相互連通,上下游交通狀態(tài)之間的具有一定的相關(guān)性,該相關(guān)性可以使用上下游的流量關(guān)系來(lái)表示。
圖1 交叉口路段空間關(guān)系示意圖Fig.1 Spatial relationship between intersections
圖1 為武漢市路網(wǎng)2個(gè)交叉口上下游空間示意圖。其中,次干道8462路段的上游有8461和8463這2個(gè)路段,二者分別為次干道及支路;次干道170770的上游路段為170769、42045及42044,其中,170769為次干道,4045及42044路段則是支路。路段8462、170770及其上游2019年2月15日的交通流情況見(jiàn)圖2。
圖2 上下游路段交通流關(guān)系示例Fig.2 Cases of the traffic flow relationship between upstream and downstream roads
從圖2中可看出,在上下游的流量關(guān)系中,不同道路類型的路段流量變化情況具有一定的差異,道路類型相同的路段其交通流變化趨勢(shì)相似,且上游路段數(shù)量對(duì)下游路段交通流也會(huì)有一定的影響。
為明確空間特征對(duì)路段交通流量是否具有相關(guān)性,本文基于武漢市路網(wǎng)信息數(shù)據(jù)獲取以下3個(gè)空間特征。
1)路段道路類型,分為快速路、主干道、次干道、快速路輔路及支路,屬于分類變量。為簡(jiǎn)化建模數(shù)量、提升計(jì)算速度,根據(jù)道路等級(jí)、功能及寬度等因素,本研究將高速路和快捷路劃分為快速路,輔路劃分為快速路輔路,匝道及轉(zhuǎn)向?qū)S玫绖澐譃橹贰F渲锌焖俾仿范喂?39個(gè),主干道路段共391個(gè),次干道路段共621個(gè),快速路輔路路段共143,支路路段共890個(gè)。
2)相鄰路段數(shù)量,相鄰上游路段數(shù)量或下游路段數(shù)量,屬于數(shù)值變量。
3)相鄰路段道路類型,相鄰上游或下游路段的道路類型,劃分方法同1)。
交通高峰期時(shí)路段擁堵顯著、路段交通流變化規(guī)律性強(qiáng),針對(duì)武漢市2 285個(gè)卡口檢測(cè)器早高峰交通流量數(shù)據(jù)及對(duì)應(yīng)的空間特征數(shù)據(jù),利用SPSS進(jìn)行Spearman相關(guān)性分析,結(jié)果見(jiàn)表1。由表1相關(guān)性分析結(jié)果可知:路段流量與路段道路類型、相鄰路段數(shù)量及相鄰路段道路類型3類空間特征均呈現(xiàn)顯著性相關(guān),其中路段流量與路段道路類型的相關(guān)性最大;相鄰路段空間特征與路段流量的相關(guān)性中,相鄰上游路段特征與流量間的相關(guān)系數(shù)大于下游路段。
由此,考慮從路段道路類型及相鄰路段數(shù)等空間特征出發(fā),挖掘路網(wǎng)中有檢測(cè)器路段的空間特征對(duì)交通流分配的影響度,利用無(wú)檢測(cè)器路段相鄰路段的交通流數(shù)據(jù)及空間特征影響度系數(shù),進(jìn)行無(wú)檢測(cè)器路段交通流預(yù)測(cè)。
表1 路段特征與流量的相關(guān)性分析Tab.1 Correlation analysis of road characteristics and traffic flow
交叉口上下游各個(gè)路段間的交通流存在著一定的分/合流關(guān)系,交叉口中目標(biāo)路段的交通流量y與其n個(gè)上游路段(或下游路段)的流量x1,x2,…,x n間的流量分配權(quán)重模型[17-18]為
式中:y為目標(biāo)路段交通流量,veh/15 min;x1,x2,…,x n為n個(gè)上游(或下游)的交通流量,veh/15 min;θ0,θ1,θ2,…,θn為交通流權(quán)重系數(shù)。
令θ為n+1的列向量,見(jiàn)式(2)。令X b為(m,n+1)的矩陣;n為自變量個(gè)數(shù);m為訓(xùn)練樣本,見(jiàn)式(3)。
目前,在回歸分析中參數(shù)估計(jì)應(yīng)用最多的算法是最小二乘法,該方法是以誤差的平方和最小為準(zhǔn)則,依據(jù)觀測(cè)數(shù)據(jù)估計(jì)線性模型中未知參數(shù)的1種基本參數(shù)估計(jì)方法?;诼肪W(wǎng)拓?fù)浣煌鲾?shù)據(jù),采用最小二乘法求解交通流分配權(quán)重,結(jié)果見(jiàn)式(4)。
求出向量θ,即模型的具體回歸系數(shù),基于路網(wǎng)拓?fù)涞慕煌鞣峙錂?quán)重模型求解完成。
以往研究無(wú)檢測(cè)器路段交通流未來(lái)變化規(guī)律的成果中,一般先通過(guò)臨時(shí)布點(diǎn)采集交通流數(shù)據(jù),再構(gòu)建預(yù)測(cè)模型進(jìn)行預(yù)測(cè)[17,19-20],適用于對(duì)單一或若干道路開展研究。但是由于城市內(nèi)無(wú)檢測(cè)器路段數(shù)量大、分布廣,如武漢市近90%的路段為無(wú)檢測(cè)器路段或檢測(cè)器失效路段,要在小時(shí)間粒度條件下獲取大量無(wú)檢測(cè)器路段的交通流樣本數(shù)據(jù)十分困難,導(dǎo)致無(wú)檢測(cè)器路段因缺少歷史數(shù)據(jù)不能開展交通流分配權(quán)重模型的訓(xùn)練。
從表1的相關(guān)性分析結(jié)果可知,交叉口上下游路段的交通流分配系數(shù)是路段道路類型、上游路段數(shù)量等多個(gè)空間特征綜合作用的結(jié)果,即每個(gè)交通流分配系數(shù)與多個(gè)空間特征變量之間存在一定的相關(guān)性。本文在大量有檢測(cè)器的交叉口路段交通流分配權(quán)重模型訓(xùn)練結(jié)果的基礎(chǔ)上,再次采用多元線性回歸方法深入挖掘空間特征對(duì)交通流分配權(quán)重的影響規(guī)律,提取路段空間特征對(duì)交通流分配權(quán)重的影響度系數(shù)。進(jìn)而基于該影響度系數(shù)、目標(biāo)無(wú)檢測(cè)器路段的空間特征以及相鄰路段交通流數(shù)據(jù),可實(shí)現(xiàn)無(wú)檢測(cè)器路段短時(shí)交通流預(yù)測(cè)。該預(yù)測(cè)方法從城市路網(wǎng)中有檢測(cè)器交叉口的海量數(shù)據(jù)中挖掘路段空間特征對(duì)交通流分配權(quán)重的影響度系數(shù),在模型訓(xùn)練及目標(biāo)無(wú)檢測(cè)器路段交通流預(yù)測(cè)過(guò)程中無(wú)需將目標(biāo)路段的歷史數(shù)據(jù)作為輸入,能夠?qū)崿F(xiàn)城市大規(guī)模路網(wǎng)中大量無(wú)檢測(cè)器路段交通流的快速、實(shí)時(shí)及準(zhǔn)確預(yù)測(cè)。
對(duì)某一無(wú)檢測(cè)器路段,若其所有上游路段或者下游路段均有檢測(cè)器數(shù)據(jù),此方法能夠有效地對(duì)該路段進(jìn)行交通流預(yù)測(cè)。本文針對(duì)無(wú)檢測(cè)器路段所有上游都有檢測(cè)器數(shù)據(jù)的情況進(jìn)行建模,其他情況可參照該方法進(jìn)行,其模型步驟如下。
1)路網(wǎng)有檢測(cè)器路段回歸方程訓(xùn)練。
基于交叉口上下游各個(gè)路段間的交通流的分/合流關(guān)系,交叉口中單個(gè)路段的交通流量y與其n個(gè)上游路段(或下游路段)的流量x1,x2,…,xn間的交通流分配權(quán)重可根據(jù)歷史交通流數(shù)據(jù)采用2.1中路網(wǎng)拓?fù)涞慕煌鞣峙錂?quán)重模型求出。對(duì)路網(wǎng)中路段本身及其上游均有檢測(cè)器的路段進(jìn)行統(tǒng)計(jì)(k個(gè)),采用多元線性回歸算法分別對(duì)k個(gè)路段及其上游的歷史交通流數(shù)據(jù)進(jìn)行回歸分析,可以獲得各路段與其上游路段的交通流分配權(quán)重方程。
式中:y j為第j個(gè)路段流量,veh/15 min;X j為其上游路段的流量組成的向量;θj為回歸方程的參數(shù)向量(j=1,2,…,k)。
2)空間特征影響度系數(shù)回歸分析。在1)的基礎(chǔ)上,再次利用多元線性回歸對(duì)空間特征和交通流分配權(quán)重進(jìn)行回歸分析,研究空間特征對(duì)交叉口交通流分配權(quán)重的影響度系數(shù)。在式(5)交通流分配權(quán)重計(jì)算結(jié)果中,以k個(gè)回歸方程的交通流回歸參數(shù)向量及對(duì)應(yīng)路段的空間特征為訓(xùn)練樣本,進(jìn)一步挖掘路段空間特征對(duì)交通流分配權(quán)重的影響度規(guī)律。其詳細(xì)過(guò)程為將目標(biāo)路段道路類型f1、上游道路數(shù)量f2及上游路段的道路類型f3作為自變量,對(duì)回歸方程回歸系數(shù)向量θ中的常數(shù)項(xiàng)θ0及偏回歸參數(shù)θi分別作為因變量,進(jìn)行多元線性回歸分析。構(gòu)建空間特征與交通流權(quán)重參數(shù)間的回歸方程過(guò)程中,需要綜合考慮目標(biāo)路段道路類型、上游路段數(shù)量及上游路段道路類型3項(xiàng)空間特征對(duì)交通流分配權(quán)重的影響。θ0作為交通流分配權(quán)重模型的常數(shù)項(xiàng),其回歸方程構(gòu)建應(yīng)同時(shí)考慮前2項(xiàng)空間特征以及所有上游道路類型的影響;θi作為交通流分配權(quán)重模型的偏回歸參數(shù),前2項(xiàng)空間特征與該參數(shù)對(duì)應(yīng)的上游道路類型為主要影響因素,即常數(shù)項(xiàng)的及偏回歸參數(shù)回歸方程,見(jiàn)式(6)。
式中:θ0為路段回歸方程的常數(shù)項(xiàng);θi為路段回歸預(yù)測(cè)方程中第i個(gè)上游路段對(duì)應(yīng)的偏回歸參數(shù)為第i個(gè)上游路段的道路類型為n個(gè)上游的道路類型綜合值。
根據(jù)式(5)中各個(gè)路段交通流分配權(quán)重回歸模型及其對(duì)應(yīng)的空間特征求解式(6),獲得上游空間特征影響度向量見(jiàn)式(7)和式(8)。
其中:A為空間特征對(duì)預(yù)測(cè)方程常數(shù)項(xiàng)θ0的影響度向量;B為偏回歸參數(shù)θi的空間特征影響度系數(shù)向量。
3)基于空間特征影響度系數(shù)的交通流預(yù)測(cè)。通過(guò)向量A和B可求出無(wú)檢測(cè)器路段上游流量分配權(quán)重向量θ,再結(jié)合上游各路段交通流X就能對(duì)目標(biāo)路段交通流y進(jìn)行預(yù)測(cè)。如,對(duì)于具有單個(gè)上游的無(wú)檢測(cè)器路段,空間特征分別為目標(biāo)路段道路類型f1、上游道路數(shù)量f2及上游路段的道路類型f3,則其交通流預(yù)測(cè)方程為
對(duì)于具有2個(gè)上游的無(wú)檢測(cè)器路段,空間特征分別為目標(biāo)路段道路類型、上游道路數(shù)量上游路段的道路類型為則其交通流預(yù)測(cè)方程為
其他情況以此類推。
數(shù)據(jù)來(lái)源于武漢市智慧決策系統(tǒng),該系統(tǒng)對(duì)武漢市地磁檢測(cè)器、卡口電警、線圈檢測(cè)器共計(jì)5 869個(gè)點(diǎn)位、20 713個(gè)檢測(cè)器進(jìn)行管理。系統(tǒng)中路網(wǎng)含50 400多個(gè)路段,路段是路網(wǎng)中道路的有向劃分單元,具有唯一的ID編號(hào),本文選取武漢市路網(wǎng)中交叉口各路段均安裝卡口電警檢測(cè)器且檢測(cè)器正常工作的共135個(gè)路段進(jìn)行數(shù)據(jù)挖掘和訓(xùn)練,將16176、170239路段用于模型驗(yàn)證。其中,路段16176為主干道,位于二環(huán)線內(nèi)靠近長(zhǎng)江二橋,其上游只有1個(gè)主干道路段16176;路段170239為次干道,位于三環(huán)線外,離主城區(qū)較遠(yuǎn),具有4個(gè)上游路段170217、170238、170240、170273,前2個(gè)的道路類型為次干道,后2個(gè)為支路。
案例中使用的交通流數(shù)據(jù)以15 min的數(shù)據(jù)增量周期為1個(gè)時(shí)段,利用箱型圖法對(duì)所選路段2019年2月14日—3月3日的交通流數(shù)據(jù)進(jìn)行分時(shí)段的交通流閾值計(jì)算,在此基礎(chǔ)上進(jìn)行數(shù)據(jù)清洗并利用歷史平均法進(jìn)行數(shù)據(jù)填補(bǔ)。路段空間特征數(shù)據(jù)為智慧決策系統(tǒng)空間化信息提取結(jié)果,其中路段道路類型分為輔路、支路、次干道、主干道、快速路及高速路6類,將其分別賦予編號(hào)1~6。
由于城市路網(wǎng)交通流具有明顯的時(shí)變特征,不同時(shí)間段流量變化規(guī)律不同,選取07:00—09:00的早高峰數(shù)據(jù)進(jìn)行研究,其他時(shí)段可參照此流程進(jìn)行。利用多元線性回歸算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行回歸計(jì)算,獲得68組上下游交通流分配權(quán)重,并基于權(quán)重?cái)?shù)據(jù)和路段空間特征數(shù)據(jù)進(jìn)行回歸分析,計(jì)算空間特征影響度系數(shù)。最終獲得空間特征影響度系數(shù)向量分別為
利用以上方程及上游路段交通流量分別對(duì)16176及170239路段進(jìn)行交通流預(yù)測(cè)計(jì)算。
針對(duì)2019年2月14日3月3日每天上午07:00—09:00共161個(gè)時(shí)段進(jìn)行交通流預(yù)測(cè)驗(yàn)證,圖3為16176及170239路段實(shí)際交通流量與基于空間特征影響度系數(shù)預(yù)測(cè)的交通流對(duì)比情況,其預(yù)測(cè)的交通流與實(shí)際交通流變化趨勢(shì)相近。
圖3 路段交通流實(shí)際值與預(yù)測(cè)值對(duì)比Fig.3 Comparison of actual and predicted traffic flow of roads
采用絕對(duì)百分比誤差(absolute percentage error,APE)對(duì)路段空間特征影響度系數(shù)模型進(jìn)行預(yù)測(cè)性能評(píng)價(jià),見(jiàn)式(15)。
式中:y為實(shí)際流量值,veh/15 min;y?為預(yù)測(cè)流量值,veh/15 min。
由模型得到的預(yù)測(cè)結(jié)果絕對(duì)百分比誤差曲線見(jiàn)圖4,可以看出:本文所提出的路段空間特征影響度系數(shù)模型在不需要預(yù)測(cè)目標(biāo)路段歷史交通流的情況下,以路段的空間特征及上游路段交通流量數(shù)據(jù)作為預(yù)測(cè)因子,得到單個(gè)上游的路段預(yù)測(cè)結(jié)果絕對(duì)百分比誤差曲線波動(dòng)情況穩(wěn)定,對(duì)于多個(gè)上游的路段預(yù)測(cè)結(jié)果絕對(duì)百分比誤差曲線波動(dòng)的幅度較大。
圖4 交通流預(yù)測(cè)絕對(duì)百分比誤差Fig.4 APE of traffic flow prediction
路段16176和170239預(yù)測(cè)APE進(jìn)行平均值及百分位值的統(tǒng)計(jì),結(jié)果見(jiàn)表2,其中,PR表示百分位數(shù)值,表示在此樣本值以下的樣本數(shù)占總樣本數(shù)的百分比。對(duì)主城區(qū)的主干道路段16176的預(yù)測(cè)平均誤差為8.96%,對(duì)非主城區(qū)的次干道路段170239的預(yù)測(cè)平均誤差為22.82%,預(yù)測(cè)效果較好。
表2 預(yù)測(cè)絕對(duì)百分比誤差統(tǒng)計(jì)Tab.2 Statistics of forecasted APE%
本次研究是基于路網(wǎng)有檢測(cè)器路段數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,研究目標(biāo)路段道路類型、上游的路段數(shù)量及其道路類型等空間特征對(duì)交通流分配權(quán)重的影響,數(shù)據(jù)源為武漢市卡口電警檢測(cè)器的流量數(shù)據(jù)。以下對(duì)本文提出的模型及案例中造成誤差的原因進(jìn)行分析。
1)由課題組調(diào)研數(shù)據(jù)可知,目前武漢市卡口電警數(shù)量超過(guò)檢測(cè)器總數(shù)的50%,且44%左右的卡口電警沒(méi)有數(shù)據(jù)記錄,而有過(guò)車記錄數(shù)占總記錄的比例大于0.5的只有30%左右。本文獲取的卡口電警數(shù)據(jù)源存在部分?jǐn)?shù)據(jù)異常及數(shù)據(jù)缺失問(wèn)題,在進(jìn)行數(shù)據(jù)預(yù)處理過(guò)程中,采用箱型圖法和歷史平均法進(jìn)行數(shù)據(jù)清洗,且清洗數(shù)量較大。經(jīng)過(guò)數(shù)據(jù)清洗后,能夠增加可用數(shù)據(jù)樣本,但是清洗數(shù)據(jù)與實(shí)際數(shù)據(jù)不可避免地存在誤差,對(duì)模型訓(xùn)練精度有一定的影響。
另外,本文在訓(xùn)練數(shù)據(jù)的選取上,需要選取上下游均有卡口檢測(cè)器且具有大量的歷史數(shù)據(jù)的路段數(shù)據(jù)作為訓(xùn)練樣本,在現(xiàn)有檢測(cè)器完好率的情況下,滿足篩選條件的相對(duì)較少,使得模型在數(shù)據(jù)挖掘過(guò)程中樣本數(shù)據(jù)覆蓋不夠全面,對(duì)模型精度產(chǎn)生不利影響。在后續(xù)研究中可以通過(guò)增加訓(xùn)練集樣本、增大樣本在路網(wǎng)中的覆蓋度來(lái)提高模型的準(zhǔn)確度。具體措施為將多種檢測(cè)器數(shù)據(jù)融合結(jié)果作為訓(xùn)練集;對(duì)模型進(jìn)行改善,再將只有部分上游或下游路段有數(shù)據(jù)的情況歸入訓(xùn)練集。
2)對(duì)路段交通流有影響的空間影響因素較多,本文目前只對(duì)目標(biāo)路段道路類型、上游的路段數(shù)量及其道路類型3種空間特征進(jìn)行研究,未考慮路段所處的地形、土地利用類型等因素的影響,特征影響度在未來(lái)研究中仍可進(jìn)一步完善和提高。
另外,對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行空間分析發(fā)現(xiàn),滿足訓(xùn)練標(biāo)準(zhǔn)的數(shù)據(jù)主要來(lái)源于主城區(qū)且布設(shè)檢測(cè)器較多的密集路網(wǎng)區(qū)域,因此對(duì)非主城區(qū)路段預(yù)測(cè)時(shí)其誤差會(huì)相較于主城區(qū)路段大。如案例研究中的170239路段,其離主城區(qū)較遠(yuǎn),且其為交通量不大的次干道,所以預(yù)測(cè)結(jié)果APE較大,預(yù)測(cè)效果明顯次于16176路段。
3)現(xiàn)有無(wú)檢測(cè)器路段交通流預(yù)測(cè)研究中主要分為基于無(wú)檢測(cè)器路段自身歷史交通流及路網(wǎng)中相關(guān)路段交通流2類數(shù)據(jù)進(jìn)行無(wú)檢測(cè)器路段流量預(yù)測(cè),這些研究主要針對(duì)路段交通流變化規(guī)律進(jìn)行研究,未考慮路段空間時(shí)不變特征對(duì)路段流量產(chǎn)生的影響。本文基于第2類數(shù)據(jù),在大量有檢測(cè)器交叉口交通流分配權(quán)重基礎(chǔ)上,進(jìn)一步深入挖掘道路類型及相鄰路段的數(shù)量等空間特征對(duì)交通流分配權(quán)重的影響規(guī)律,進(jìn)而將大量有檢測(cè)器數(shù)據(jù)獲取的規(guī)律應(yīng)用于無(wú)檢測(cè)器路段進(jìn)行交通流預(yù)測(cè)。
另外,目前主流的無(wú)檢測(cè)器路段預(yù)測(cè)方法需要將一定數(shù)量的無(wú)檢測(cè)器路段流量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),但目前大部分城市路網(wǎng)中無(wú)檢測(cè)器路段占比在90%左右,對(duì)無(wú)檢測(cè)器路段進(jìn)行交通流采樣不僅耗費(fèi)大量時(shí)間和人力,同時(shí)也難以滿足城市路段交通流預(yù)測(cè)實(shí)時(shí)性的需求。本文通過(guò)研究路段空間時(shí)不變特征對(duì)交叉口交通流分配權(quán)重的影響度系數(shù),實(shí)現(xiàn)在不需要無(wú)檢測(cè)器路段交通流數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的情況下,將從海量有檢測(cè)器路段挖掘的規(guī)律應(yīng)用至無(wú)檢測(cè)器路段,從而實(shí)現(xiàn)城市大規(guī)模路網(wǎng)中大量無(wú)檢測(cè)器路段快速、準(zhǔn)確的預(yù)測(cè)。
路網(wǎng)短時(shí)交通流預(yù)測(cè)對(duì)城市交通控制、誘導(dǎo)及居民出行至關(guān)重要,現(xiàn)階段無(wú)檢測(cè)器路段在城市路網(wǎng)中仍占有很大的比重,且其歷史數(shù)據(jù)難以獲取,因此對(duì)無(wú)檢測(cè)器路段交通流預(yù)測(cè)進(jìn)行研究具有十分重要的意義。針對(duì)此問(wèn)題,筆者在現(xiàn)有研究基礎(chǔ)上,研究路段空間特征對(duì)交通流分配的影響度系數(shù),并基于此進(jìn)行無(wú)檢測(cè)器路段交通流預(yù)測(cè)。針對(duì)武漢市上下游均有卡口電警檢測(cè)器的交叉口數(shù)據(jù)進(jìn)行數(shù)據(jù)篩選和分析,在采用多元回歸獲得上游路段交通流分配權(quán)重基礎(chǔ)上,再次利用多元線性回歸對(duì)路段空間特征和交通流分配權(quán)重進(jìn)行分析,得出空間特征權(quán)重的影響度系數(shù),最后結(jié)合路段空間特征及上游交通流進(jìn)行無(wú)檢測(cè)器路段交通流預(yù)測(cè)。
案例結(jié)果表明,所提出的方法能夠在不需要無(wú)檢測(cè)器路段歷史數(shù)據(jù)的情況下,基于路段空間特征及上游路段交通流即可對(duì)下游無(wú)檢測(cè)器路段的交通流預(yù)測(cè)進(jìn)行預(yù)測(cè),能夠?yàn)榻煌ü芾碚咧贫ń煌Q策提供一定的參考。