李彤偉,王慶榮
蘭州交通大學(xué) 電子與信息工程學(xué)院,蘭州 730070
隨著人們出行需求的提升,國內(nèi)汽車保有量也與日俱增,交通擁堵、交通污染、交通噪聲等一系列問題日益嚴(yán)重,智能交通系統(tǒng)(ITS)是全世界公認(rèn)的緩解各類交通問題、提高道路通行效率的有效途徑。實時、準(zhǔn)確的交通流預(yù)測更是交通誘導(dǎo)、出行路線規(guī)劃等的前提和基礎(chǔ),也是智能交通系統(tǒng)研究的核心問題,所以作為ITS和交通誘導(dǎo)控制系統(tǒng)關(guān)鍵技術(shù)難點之一的短時交通流預(yù)測成為時下研究的熱點。
引入混沌理論、應(yīng)用智能算法、組合各類模型是過去研究短時交通流預(yù)測的主要方法。近年來國內(nèi)外研究人員給予了深度學(xué)習(xí)方法高度關(guān)注,深度學(xué)習(xí)中的深度信念網(wǎng)絡(luò)(DBN)[1]、長短時記憶(LSTM)網(wǎng)絡(luò)[2]和堆疊自編碼(SAE)模型[3]借助其能夠處理大規(guī)模的多維數(shù)據(jù),具有模型靈活度高、學(xué)習(xí)能力強、泛化能力強、預(yù)測力強等特點[4-6],并獲得比其他傳統(tǒng)方法更好的結(jié)果[7]。國內(nèi)外學(xué)者有較多相關(guān)研究成果,Huang等[1]以DBN為底部的堆棧架構(gòu),充分利用深層架構(gòu)中的權(quán)重共享提出了一種基于頂層權(quán)重的分組方法取得了較好的預(yù)測效果,但是文中對交通流數(shù)據(jù)時間信息的挖掘并不充分;Lyu等[8]第一次使用自動編碼器作為構(gòu)建塊來表示用于預(yù)測的交通流特征深層架構(gòu)模型,但該方法未考慮交通數(shù)據(jù)量處理對預(yù)測結(jié)果的影響;羅文慧等[9]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)提取交通流特征,將特征分量輸入到SVR 回歸模型中進(jìn)行預(yù)測,雖在準(zhǔn)確率上有了較大提升,但是未充分考慮交通路網(wǎng)的復(fù)雜性;羅向龍等[10]考慮了路網(wǎng)結(jié)構(gòu),使用K最近鄰(KNN)分類算法篩選出與目標(biāo)站點相關(guān)誤差最小時對應(yīng)的K個檢測站點數(shù)據(jù),輸入LSTM模型進(jìn)行預(yù)測取得了較好的預(yù)測效果;王祥雪等[11]構(gòu)建基于LSTM-RNN 的城市快速路預(yù)測模型,模型訓(xùn)練時對時空關(guān)聯(lián)特性進(jìn)行識別和強化,兼顧了精度和時效性;Shao 等[12]采用LSTM 模型進(jìn)行交通流預(yù)測,克服了循環(huán)神經(jīng)網(wǎng)絡(luò)存在的問題,但模型由于隱含層數(shù)量有限,沒有充分發(fā)揮LSTM 模型的優(yōu)勢,預(yù)測效果不佳;Ma 等[13]提出了一種融合預(yù)測模型,將其應(yīng)用于大型路網(wǎng)交通擁堵預(yù)測,雖考慮了時空相關(guān)性,當(dāng)該方法對過長的時間序列處理無能為力;張威威等[14]通過控制變量的方法確定最佳的輸入長度和隱藏層節(jié)點數(shù),研究了四種 LSTM 的實現(xiàn)方式并與 ARIMA 模型、BPNN 等模型進(jìn)行對比,結(jié)果表明考慮空間特征的LSTM 的性能最好。但是只對單一斷面時間特性分析忽略了相鄰路段交通流的變化,這也導(dǎo)致缺乏對路網(wǎng)的整體性的考慮。
綜上所述,如何從宏觀角度出發(fā),綜合考慮路網(wǎng)各方面影響因素,充分提取交通流數(shù)據(jù)的時空特征并運用一種高效的深度學(xué)習(xí)方法實現(xiàn)預(yù)測并未有較好的研究成果,故本文使用對交通流參數(shù)特性較為適配的LSTM深度網(wǎng)絡(luò)結(jié)構(gòu)并選取路網(wǎng)區(qū)域,收集其中各路段交通流檢測器數(shù)據(jù),將經(jīng)預(yù)處理后的數(shù)據(jù)矩陣輸入到模型中進(jìn)行預(yù)測,設(shè)置對比實驗進(jìn)行分析并得出結(jié)論。
2006 年,加拿大多倫多大學(xué)教授Hinton 在Science上就深度學(xué)習(xí)發(fā)表了一篇文章[15]之后,深度學(xué)習(xí)被廣泛應(yīng)用到各個學(xué)科領(lǐng)域。其實質(zhì)是通過構(gòu)建具有很多隱層的機器學(xué)習(xí)模型,利用海量的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)更有用的特征,最終提升分類或預(yù)測的準(zhǔn)確性。
循環(huán)神經(jīng)網(wǎng)絡(luò)中的隱含層節(jié)點之間具有連接,能夠把之前的處理信息加以記憶,從而使得隱含層的輸入包含兩部分——既有輸入層的輸出,也有前一時刻隱含層的輸出,層次結(jié)構(gòu)如圖1所示。RNN這種循環(huán)的網(wǎng)絡(luò)結(jié)構(gòu)具備保持信息的能力,能夠幫助RNN 更精確地掌握特征間的復(fù)雜關(guān)系。
圖1 RNN結(jié)構(gòu)
但是RNN 具備的記憶能力周期較短,當(dāng)相關(guān)信息和預(yù)測信息位置之間的間距變得相當(dāng)大時,會讓循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練變得困難,使網(wǎng)絡(luò)喪失連接先前信息到當(dāng)前輸出上的能力,所以當(dāng)面對長序列的信息,隨著學(xué)習(xí)量的增多或者學(xué)習(xí)周期的增長將會導(dǎo)致梯度消失(如圖2)或者梯度爆炸的現(xiàn)象[16]。
圖2 RNN網(wǎng)路梯度消失原理圖
為了解決該問題,Hochreiter在1997年提出了LSTM神經(jīng)網(wǎng)絡(luò)[17],在RNN 網(wǎng)絡(luò)基礎(chǔ)上對網(wǎng)絡(luò)隱藏層做了一些改進(jìn),使得LSTM可以學(xué)習(xí)長期依賴信息以此對梯度消失問題進(jìn)行有效規(guī)避。
該模型隱含層包含記憶模塊(Memory Block),能夠在較長時間內(nèi)存儲并傳遞信息,其內(nèi)部結(jié)構(gòu)如圖3所示。每個記憶模塊由輸入記憶元(Memory Cell)及三個復(fù)合單元——輸入門(Input Gate)、輸出門(Output Gate)、遺忘門(Forget Gate)構(gòu)成?!伴T”結(jié)構(gòu)包含Sigmoid 神經(jīng)網(wǎng)絡(luò)層和點乘運算,Sigmoid 層的輸出在0 到1 之間,其中0 表示不允許任何信息通過,1 表示允許所有的信息通過,以此來把控門的開關(guān)。輸入門(Input Gate)表示輸入層信息如何傳遞到隱含層的記憶模塊;遺忘門(Forget Gate)表示如何對當(dāng)前時刻該記憶模塊的歷史信息進(jìn)行保留;輸出門(Output Gate)表示該記憶模塊信息如何傳遞出去。
LSTM結(jié)構(gòu)中單個記憶塊在t時刻的計算過程如下:
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
3.1.1 相關(guān)系數(shù)
設(shè)有兩個變量x、y,定義兩個變量之間的相關(guān)系數(shù)為R,則有:
xi、yi分別為觀察值,對兩變量n的觀察值,其中i=1,ˉ是對變量n觀察計算所獲得的均值。其中|r|(|r|≤1)展示了變量之間關(guān)系與密切程度變化。|r|越大則其中變量間密切程度越強,反之則越弱。
3.1.2 空間互相關(guān)性分析
根據(jù)文獻(xiàn)[18]介紹,道路網(wǎng)絡(luò)上的任何位置都具有空間可達(dá)性,交通流量的互相關(guān)性大小是空間距離的函數(shù),隨著交通載荷的增加,處于同一路網(wǎng)中的兩道路斷面間的空間互相關(guān)性會隨之增大。路網(wǎng)內(nèi)道路結(jié)構(gòu)復(fù)雜,道路交通流的特性在路口交叉處表現(xiàn)得尤為明顯,如圖4 所示的一段兩個相鄰十字路口的路段。其中q1(k)、q2(k)、q3(k)分別為Q1、Q2、Q3方向的車流在時間段[(k-1)T,kT]內(nèi)的流量,由圖示的空間位置可看出,流量q(k)是包含了q1(k)、q2(k)、q3(k)的總車流量,從空間上考慮檢測點處的交通流量就與路口A 相關(guān)的Q1、Q2、Q3等方向的車流量有關(guān)。
圖4 空間相關(guān)示意圖
3.1.3 時間相關(guān)性分析
由文獻(xiàn)[19]可知,從公眾出行的周期特性來看,交通流具有一定的時間相關(guān)性。交通流時間序列具有分形特征,即交通流序列的未來變化趨勢與歷史變化趨勢正相關(guān),并且在同一時期表現(xiàn)出強烈的規(guī)律性,在不同的時間周期又具有差異性。想要通過分析目標(biāo)路段交通流參數(shù)的時間特性來預(yù)測下一個時段[kT,(k+1)T]的交通流量q(k+1),不但需要考慮與q(k+1)相關(guān)的前n個時段內(nèi)的流量q(k+1-n),…,q(k),還要考慮經(jīng)A路口匯入預(yù)測路段的前n個觀測時段的流量q1(k)、q2(k)、q3(k),…,q1(k+1-n),q2(k+1-n),q3(k+1-n) ,它們都與目標(biāo)路段的交通流具有很強相關(guān)性,如圖5所示。
圖5 時間相關(guān)示意圖
選取任意一塊路網(wǎng)區(qū)域,將區(qū)域內(nèi)的各條路段視為一個網(wǎng)絡(luò)圖G,則有G=(Q,E)。其中Q表示路網(wǎng)中的節(jié)點數(shù),E為整個網(wǎng)絡(luò)中所有路段的集合。假設(shè)該路網(wǎng)中有p個路段,N為歷史交通流量數(shù)據(jù)的時滯,則有E={Si,i=1,2,…,p} ,對于任意一個路段Si都包含一個連續(xù)的時間序列,記為矩陣qi,則qi={z(si,t-N+1),z(si,t-N+2),…,z(si,t)} ,qi表示路段Si在時間段 (t-N+1,t)的交通流量,z(si,tj)(i=1,2,…,p;tj=1=t-N+1,t-N+2,…,t)表示路段Si在時間間隔(tj-t0,tj)內(nèi)的交通流量。整個路網(wǎng)的交通流量數(shù)據(jù)組成一個時空二維矩陣,記為FP×M,則有:
計算該路網(wǎng)中任意兩個路段的相關(guān)系數(shù)R(i,g),由式(7)可得出:
壓縮矩陣的構(gòu)造流程如圖6。
圖6 壓縮矩陣構(gòu)造流程圖
選用模型的結(jié)構(gòu)如圖7 所示。該模型按照順序依次疊加每層,并且層與層之間網(wǎng)絡(luò)為全連接。從圖中可以看出,該模型包括輸入、輸出層和中間層共五層結(jié)構(gòu),前兩層隱層為LSTM層,選定特征之后將經(jīng)過預(yù)處理后的訓(xùn)練集交通流特征壓縮矩陣直接由輸入層送入LSTM層進(jìn)行循環(huán)計算,并分別設(shè)置每個LSTM層輸入張量維度和輸出張量維度,激活函數(shù)設(shè)置為tanh,在模型的隱含層分別添加dropout 約束,使得每個LSTM 網(wǎng)絡(luò)模塊的輸入連接上的信息將會以一定概率在前向激活和反向傳播權(quán)值更新的過程中暫時失活。模型優(yōu)化函數(shù)采用adam 算法,規(guī)定batch 的大小。隨后,所有提取到的特征一起送入到Flatten層展平為一維的向量,向量作為后兩層全連接層的輸入,使用全連接的Dense層作為輸出層,該層的激活函數(shù)設(shè)置為relu,全連接層輸出維度為1,最終模型的輸出為預(yù)測的目標(biāo)Y(t),也就是下一時刻的交通流量數(shù)據(jù)。
圖7 LSTM模型結(jié)構(gòu)圖
本文在深度學(xué)習(xí)框架Keras基礎(chǔ)上構(gòu)建LSTM網(wǎng)絡(luò)模型,將經(jīng)過處理的交通流數(shù)據(jù)利用python中numpy科學(xué)計算庫轉(zhuǎn)換為矩陣,本文使用Keras 建立線性疊加模型,并初始化網(wǎng)絡(luò)模型。具體訓(xùn)練預(yù)測流程圖(其中iterator、Epoach分別表示本輪迭代的次數(shù)和模型迭代的總輪數(shù))如圖8所示。
上述模型在處理時間序列數(shù)據(jù)上有較好的效果,但是對于輸入數(shù)據(jù)的質(zhì)量有較高的要求,如果數(shù)據(jù)干擾項較多將直接影響訓(xùn)練效果,所以數(shù)據(jù)輸入模型前要進(jìn)行數(shù)據(jù)預(yù)處理。并且選取訓(xùn)練數(shù)據(jù)時數(shù)據(jù)量不宜太龐大,否則訓(xùn)練周期非常長,影響模型方法的利用效率,本文的模型及方法可適用于大部分道路短時交通流預(yù)測。
本例實驗環(huán)境在Windows 10 64 位系統(tǒng)Intel-i7 CPU、32 GB 內(nèi)存的高配置計算機上進(jìn)行,開發(fā)環(huán)境使用python3.5 語言的Pycharm-professional 集成開發(fā)工具,使用Keras所提供的LSTM等神經(jīng)網(wǎng)絡(luò)模型。
為了評估本文方法的有效性,本文采用明尼蘇達(dá)德盧斯大學(xué)(University of Minnesota Duluth,http://www.d.umn.edu/tdrl/index.htm)公布交通數(shù)據(jù)進(jìn)行實證分析。該數(shù)據(jù)是從位于Twin Cities Metro 高速公路周圍的4 500多個環(huán)路探測器以30 s的間隔在道路網(wǎng)絡(luò)中的多個路段實時收集的交通流量、占用率和速度數(shù)據(jù)。該大學(xué)的服務(wù)器每天將收集的數(shù)據(jù)打包成單個zip文件并保存到存檔中。實際路網(wǎng)結(jié)構(gòu)圖如圖9 所示,以35E、35W、94E、169N、694N、494E 六條公路組成的區(qū)域為研究對象,拓?fù)鋱D如圖10所示,選取其中的60個檢測路段并編號,以2016年5月1日至2016年5月24日(00:00—23:55)的交通流量作為訓(xùn)練數(shù)據(jù),以 2016 年 5 月 25 日至2016年5月31日(00:00—23:55)中的任意一天交通流量作為測試數(shù)據(jù)對預(yù)測模型進(jìn)行檢驗。處理所收集的原始數(shù)據(jù)以形成具有5 min的采樣間隔的數(shù)據(jù)作為模型的輸入和輸出,以驗證預(yù)測方法的有效性。
圖8 LSTM預(yù)測流程圖
圖9 路網(wǎng)結(jié)構(gòu)圖
圖10 選中路網(wǎng)區(qū)域道路拓?fù)鋱D
將圖10 中的六條道路依次從左到右,每條道路劃分為十個路段,每個路段進(jìn)行編號,具體劃分結(jié)果如表1所示。
表1 路段編號
表2 相關(guān)系數(shù)矩陣
對實際道路網(wǎng)中的60 個路段進(jìn)行時空相關(guān)性分析,并根據(jù)2016年5月5日的交通流量數(shù)據(jù)計算相關(guān)系數(shù),利用公式(9)進(jìn)行計算,計算后可得出相關(guān)系數(shù)矩陣R的值如表2所示。
為了對路段進(jìn)行分組,將道路網(wǎng)絡(luò)中的所有路段進(jìn)行編號,使用由表2計算出的相關(guān)系數(shù)矩陣R,根據(jù)圖6中介紹的壓縮矩陣方法,設(shè)定不同的閾值α,根據(jù)相關(guān)系數(shù)對路段進(jìn)行分組,則設(shè)α=0.92時,計算分組結(jié)果如表3所示。
表3 路段分組表
取α=0.88,0.90,0.94,0.96,0.98,0.99,對應(yīng)上述閾值α經(jīng)過計算可以將路段分別分為2、4、10、11、15、27組。在分組完成之后,選擇適當(dāng)?shù)闹?,確定特定的組數(shù)并在每個組中任意選擇代表性的路段以構(gòu)建道路網(wǎng)絡(luò)壓縮矩陣。
為了評價預(yù)測結(jié)果的性能,本文分別以均方誤差(MSE)、平均絕對百分比誤差(MAPE)及準(zhǔn)確率(ACC)作為評價指標(biāo),具體定義如下:
式中,yi表示的是某一時刻的實際交通流量值,y?i表示對應(yīng)時刻的預(yù)測值,N為預(yù)測樣本個數(shù)。
5.5.1 構(gòu)造壓縮矩陣
由5.3節(jié)的內(nèi)容介紹可知α的大小決定了壓縮矩陣中路段數(shù)的選擇,這會影響整個路網(wǎng)預(yù)測的準(zhǔn)確性。因此,對于每一個閾值這里提出相應(yīng)的壓縮比(定義為UR),文中為了得到合適的壓縮比,分別設(shè)定了不同的α,通過多次實驗,得出了不同α與UR之間的關(guān)系,在設(shè)定不同的α的條件下,通過分析系統(tǒng)運行時間T來得出最佳的α值。壓縮比數(shù)學(xué)計算表達(dá)式定義為:
式中,p代表路段總數(shù),r代表分組組數(shù)。
由表4可以看出:相關(guān)系數(shù)閾值α的大小決定著壓縮比UR的大小,如果調(diào)整α增大,則UR減小,系統(tǒng)運行時間也會隨之變化。為了保證預(yù)測精度在一定范圍內(nèi),經(jīng)過嚴(yán)密分析,發(fā)現(xiàn)當(dāng)相關(guān)系數(shù)閾值取0.92(即UR=15%)時,系統(tǒng)有最短的運行時間。因此,文中選擇編號為15、43、19、47、58的路段交通流數(shù)據(jù)構(gòu)成路網(wǎng)壓縮矩陣,然后對每個路段分別進(jìn)行預(yù)測,以這五個路段的交通流預(yù)測值來刻畫出路網(wǎng)的交通情況。
5.5.2 數(shù)據(jù)特征分析
以編號15路段某一檢測站點為例,主要考量流量、占有率和速度三個因素,在數(shù)據(jù)庫中獲得原始數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)交通流數(shù)據(jù)具備以下幾點特征:
(1)相似性
人們出行規(guī)律很大程度上影響交通狀況,比如大部分上班族保持“朝八晚五”的工作作息時間,這導(dǎo)致出入工作區(qū)的交通流量保持一定規(guī)律,也使得每日的交通流具備相似性特征。
(2)周期性
經(jīng)過分析可知進(jìn)出工作區(qū)和生活區(qū)的道路上的交通量具有周期性特征,且工作日相比于節(jié)假日具有明顯的交通流峰值。
表4 不同α 對運行時間的影響
(3)時空相關(guān)性
由表2中計算結(jié)果可知,路網(wǎng)中不同路段車輛檢測站點間的交通流量具有很強的時空關(guān)聯(lián)性。
5.5.3 結(jié)果預(yù)測
每個路段的訓(xùn)練數(shù)據(jù)為2016年5月1日至2016年5月24 日(00:00—23:55),交通流數(shù)據(jù)采樣時間間距5 min,時間延遲為3,因此每天的樣本數(shù)為285,24 天的訓(xùn)練樣本集的總量為6 840 個樣本,5 月25 至31 日測試樣本集的總數(shù)為1 995個樣本。
通過上述分析可知,文中已經(jīng)選取出了五個路段來代表路網(wǎng)進(jìn)行預(yù)測,選擇編號為15(組內(nèi)已選路段)和編號為45(組內(nèi)未選路段)的路段作為分組后的特例進(jìn)行預(yù)測效果展示,驗證LSTM模型的預(yù)測效率。預(yù)測結(jié)果如圖11、12。
圖11 路段15交通流量預(yù)測圖
圖12 路段45交通流量預(yù)測圖
圖11、圖12中將交通流測試集數(shù)據(jù)以每5 min為一個時間點,劃分100 個時間序列點作為橫坐標(biāo),交通流量作為縱坐標(biāo)來顯示預(yù)測結(jié)果。從兩圖預(yù)測結(jié)果中可以看出,預(yù)測結(jié)果曲線中實際流量值出現(xiàn)明顯上下變化趨勢時,預(yù)測值隨后才開始做出相應(yīng)變化,有一定的滯后性,這是由于LSTM模型本身性質(zhì)引起的。不過預(yù)測值與實際流量曲線斜率變化趨勢保持高度一致,預(yù)測結(jié)果較為接近,說明模型具備好的預(yù)測能力。
5.5.4 dropout參數(shù)設(shè)置對預(yù)測結(jié)果的影響
為了測試dropout參數(shù)設(shè)置對于實驗預(yù)測誤差的影響,對不使用 dropout 和 dropout 取值為0.1、0.3、0.5 時分別構(gòu)建預(yù)測模型進(jìn)行測試,歷史交通流量數(shù)據(jù)時滯N在1~7變化,實驗的結(jié)果誤差如表5所示。
表5 dropout參數(shù)設(shè)置對預(yù)測結(jié)果的影響
從表5中可知采用dropout預(yù)測模型比不采用dropout預(yù)測模型在不同輸入時間段長度下計算得到的MSE和MAPE值都小,這是由于在訓(xùn)練階段利用輸入數(shù)據(jù)進(jìn)行權(quán)值調(diào)整時,隱藏層節(jié)點在每次迭代時都是以一定概率隨機出現(xiàn),這種權(quán)值的更新方式不再依賴于有復(fù)雜關(guān)系隱含節(jié)點的共同作用,增強了LSTM網(wǎng)絡(luò)模型在缺少個體連接信息條件下的學(xué)習(xí)能力,避免了某些數(shù)據(jù)特征僅僅在特定情況下才有效果的情況,這樣很大程度上提高了模型的泛化能力,整體上看dropout值為0.3的預(yù)測模型有更好的表現(xiàn)。
5.5.5 預(yù)測結(jié)果對比分析
對文中提出的模型改變不同的預(yù)測時間長度進(jìn)行實驗分析,為了評估提出方法的有效性,采用了另外四個模型進(jìn)行對比實驗。五種模型分別是支持向量回歸(SVR)模型、人工神經(jīng)網(wǎng)絡(luò)(ANN)模型、自回歸積分滑動平均(ARIMA)模型、卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型和本文提出的運用時空分析并經(jīng)過路網(wǎng)數(shù)據(jù)壓縮矩陣輸入的LSTM模型。首先,使用5 min交通流量的預(yù)測結(jié)果,使用三個預(yù)測誤差評估指標(biāo)來比較模型的性能:均方誤差(MSE)、平均絕對百分比誤差(MAPE)、準(zhǔn)確度(ACC)用于評估模型,計算結(jié)果如表6所示。
表6 5 min交通流量預(yù)測比較
進(jìn)一步討論所提模型和其他模型在不同時間段的預(yù)測性能,分別用不同模型預(yù)測未來10 min、15 min 和20 min的交通流量,并比較它們的預(yù)測性能。計算結(jié)果如表7所示。
表7 不同時長交通流預(yù)測比較
由表7可知在相同的網(wǎng)絡(luò)結(jié)構(gòu)下,當(dāng)預(yù)測時間間隔從10 min增加到20 min時,CNN算法的MAPE從10.87%增加到12.51%,在其他模型中也可以觀察預(yù)測性能降低的情況。雖然所有算法的準(zhǔn)確率會隨著預(yù)測時間的延長而降低,但誤差的增長率在模型之間有明顯的差異。例如,當(dāng)預(yù)測間隔從5 min延長到20 min時,路網(wǎng)LSTM模型的MAPE增加了1.88%;與此同時ARIMA、SVR、ANN和CNN分別增加了9.55%、6.06%、5.6%和2.04%。從以上數(shù)據(jù)可以發(fā)現(xiàn),本文提出的路網(wǎng)LSTM 模型誤差最小,隨著預(yù)測時間的擴展,誤差增長速度也最慢。根據(jù)上述討論,本文提出的方法及模型具有良好的預(yù)測精度,并且在不同的時間間隔預(yù)測問題上表現(xiàn)較為穩(wěn)定。
本文使用實驗室公開的交通數(shù)據(jù),選取路網(wǎng)區(qū)域路段進(jìn)行了時空相關(guān)性分析,通過分析并構(gòu)造壓縮矩陣輸入LSTM 模型之中,使用Dropout 正則化方法提高模型的泛化能力,并與其他四種模型進(jìn)行了預(yù)測結(jié)果對比測試,發(fā)現(xiàn)本文所提出的模型預(yù)測的準(zhǔn)確率達(dá)到了92.47%,比ARIMA、SVR、ANN、CNN 模型的預(yù)測準(zhǔn)確率分別提高了19.38%、11.85%、11.22%和4.94%,表明本文所提出的方法及模型具有良好的預(yù)測性能。雖然本文采用的方法取得了較好的預(yù)測效果,但天氣、交通事故、交通控制等因素對短期交通流量也有重要影響。在未來的研究中,應(yīng)進(jìn)一步考慮這些外部因素以更準(zhǔn)確地預(yù)測短時交通流量。