尹邵龍 趙亞楠
摘 要: 短時(shí)交通流狀態(tài)預(yù)測(cè)對(duì)于實(shí)現(xiàn)城市智能交通系統(tǒng)至關(guān)重要。在過(guò)去,很多神經(jīng)網(wǎng)絡(luò)模型被提出來(lái)用以預(yù)測(cè)交通流,但是效果并不是很顯著。究其原因,是因?yàn)榇蠖鄶?shù)都是利用淺層模型在學(xué)習(xí),淺層模型由于容易陷入局部極值而且不能模擬更復(fù)雜的數(shù)學(xué)運(yùn)算,所以并不適合于模擬現(xiàn)實(shí)的交通狀況。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的新興學(xué)科,在語(yǔ)音與圖像處理方面取得了顯著的成效,它能夠非監(jiān)督地從數(shù)據(jù)中學(xué)習(xí)出有效的特征用以預(yù)測(cè),故在此利用深度學(xué)習(xí)進(jìn)行建模用以城市主干道交通流預(yù)測(cè)。實(shí)驗(yàn)表明,模型取得了不錯(cuò)的交通流預(yù)測(cè)效果。
關(guān)鍵詞: 深度學(xué)習(xí); 交通流預(yù)測(cè); 神經(jīng)網(wǎng)絡(luò); 機(jī)器學(xué)習(xí)
中圖分類號(hào): TN915.5?34; TP183 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)15?0158?05
Practice and research on deep learning applied in urban traffic flow prediction
YIN Shaolong, ZHAO Yanan
(North China Institute of Computer Technology, Beijing 100086, China)
Abstract: Short?term traffic flow state prediction plays an important role in realizing urban intelligent transportation system. Many neural network models have been proposed to predict traffic flow in the past, and the effects are unsatisfied. The reason for this is that most models learning uses shallow model. Since shallow model is liable to sink into local extremum and unable to simulate more complicated arithmetical operation, it is not suitable for simulating actual traffic condition. As a new branch of machine learning, deep learning has made great success in the field of voice and image processing. It can learn valid features for prediction from data sets in an unsupervised way. Deep learning is applied to prediction urban main road traffic flow by modeling. The experimental results show that this method has achieved better traffic flow prediction effect.
Keywords: deep learning; traffic flow prediction; neural network; machine learning
0 引 言
隨著社會(huì)的快速發(fā)展和機(jī)動(dòng)車數(shù)量的急劇增加,城市交通日益趨向于擁堵,交通事故與空氣污染也進(jìn)一步加劇。在我國(guó),北京、上海這樣的大城市在中心市區(qū)的平均車速在高峰時(shí)期不足20 km/h,交通擁堵又進(jìn)一步導(dǎo)致了能耗加劇與環(huán)境污染。研究結(jié)果表明[1],當(dāng)車速由40 km/h降低至10 km/h時(shí),能量損耗量會(huì)增長(zhǎng)1倍,環(huán)境污染量會(huì)增加3倍以上。北京市汽車排放的氮氧化物、一氧化碳對(duì)環(huán)境分別占到46%和63%。所以,智能交通系統(tǒng)(Intelligent Transportation Systems,ITS)成為解決城市擁堵問(wèn)題的關(guān)鍵途徑。智能交通系統(tǒng)有效地利用當(dāng)前先進(jìn)的硬件和軟件,對(duì)交通進(jìn)行有效的綜合管理。短時(shí)交通流狀態(tài)預(yù)測(cè)(Short?term Traffic State Forecasting)作為智能交通系統(tǒng)的核心技術(shù),它利用現(xiàn)有數(shù)據(jù)對(duì)交通流狀況進(jìn)行預(yù)測(cè),進(jìn)而幫助出行者進(jìn)行路徑規(guī)劃,實(shí)現(xiàn)交通流誘導(dǎo),從而緩解了交通擁擠,減少了環(huán)境污染。人們針對(duì)交通流預(yù)測(cè),提出過(guò)不同的預(yù)測(cè)模型;但是由于城市交通流時(shí)間與空間上的復(fù)雜性,給預(yù)測(cè)結(jié)果的準(zhǔn)確率帶來(lái)了挑戰(zhàn)。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的新興學(xué)科,一經(jīng)提出便受到了廣泛的關(guān)注,像Google、微軟、百度,都在研究與利用深度學(xué)習(xí)。它被成功地應(yīng)用到了分類任務(wù)、自然語(yǔ)言處理、降維、圖像識(shí)別等等方面。深度學(xué)習(xí)通過(guò)利用多層體系架構(gòu)來(lái)有效地、非監(jiān)督地提取出底層數(shù)據(jù)的潛在的典型特征,進(jìn)而提供給高層進(jìn)行分類與回歸。交通流本身就是一個(gè)復(fù)雜的過(guò)程,深度學(xué)習(xí)架構(gòu)能夠幫助我們無(wú)先驗(yàn)知識(shí)卻能有效地學(xué)習(xí)與抓住其中內(nèi)在的復(fù)雜特征,進(jìn)而有效地進(jìn)行交通流預(yù)測(cè)。
本文提出了一個(gè)基于深度學(xué)習(xí)的交通流預(yù)測(cè)模型,通過(guò)訓(xùn)練并加以實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,這種方法在交通流預(yù)測(cè)當(dāng)中取得了不錯(cuò)的準(zhǔn)確率。
1 背景介紹
1.1 交通流預(yù)測(cè)
交通流預(yù)測(cè)一直都被認(rèn)為是實(shí)現(xiàn)城市智能交通系統(tǒng)(ITS)的關(guān)鍵技術(shù)問(wèn)題。它利用以往歷史數(shù)據(jù)對(duì)未來(lái)某段時(shí)間內(nèi)交通流量進(jìn)行預(yù)測(cè)。預(yù)測(cè)時(shí)段一般為5~30 min。
令[Xti]表示第[i]個(gè)交通道路在第[t]時(shí)間的交通流量,那么給定一個(gè)觀察得到的交通流序列,[i=1,2,…,m;][t=1,2,…,T,]那么交通流預(yù)測(cè)即是根據(jù)這以往的交通流序列對(duì)于某條道路[{T+Δt}]時(shí)間段進(jìn)行預(yù)測(cè)。其中[Δt]可以進(jìn)行調(diào)節(jié)。
交通流預(yù)測(cè)模型一般包括兩步,即特征學(xué)習(xí)與模型學(xué)習(xí)。特征學(xué)習(xí)即非監(jiān)督學(xué)習(xí),通過(guò)訓(xùn)練可以得到代表以往歷史交通時(shí)間序列的一個(gè)特征代表模型[h。]經(jīng)過(guò)特征訓(xùn)練后,以往的交通流序列[X]即可通過(guò)[h]轉(zhuǎn)化為另外的一個(gè)特征空間[Y,]即[h(x)→Y;]模型學(xué)習(xí)即監(jiān)督式學(xué)習(xí),給定一組特征[Y]與目標(biāo)任務(wù)[Z]的配對(duì)組[{(Y1,Z1),][(Y2,Z2),…,(Yn, Zn)}]學(xué)習(xí)預(yù)測(cè)模型[Zn+1=g(Y),]通過(guò)最小化目標(biāo)損耗函數(shù)[L,]得到預(yù)測(cè)模型的適合的參數(shù)[W:]
[L(Z;W)=Z-g(Y)2] (1)
盡管預(yù)測(cè)模型之間互有差別,但是目標(biāo)損耗函數(shù)大多數(shù)都是一樣的。以往的預(yù)測(cè)模型可以分為三類[2]:
(1) 基于以往歷史數(shù)據(jù)的時(shí)間序列法。自回歸整合滑動(dòng)平均模型[3](ARIMA)就是通過(guò)找到交通流隨時(shí)間變化的模式,從而實(shí)現(xiàn)預(yù)測(cè)。相似的還有子集ARIMA[4],表達(dá)變量ARIMA(ARIMAX)[5],向量自回歸移動(dòng)平均(ARMA)和基于時(shí)間與空間的ARIMA[6],還有季節(jié)性的ARIMA(SARIMA)[7],卡爾曼濾波方法[8]等。
(2) 基于概率圖模型的方法。通過(guò)概率圖的方法對(duì)交通流進(jìn)行建模與預(yù)測(cè),常見(jiàn)的方法有:貝葉斯網(wǎng)絡(luò)[9],馬爾可夫鏈,馬爾可夫隨機(jī)場(chǎng)(MRFs),模糊邏輯[10]等。
(3) 非參數(shù)統(tǒng)計(jì)方法。由于這種方法能夠很有效地模擬交通流不確定、復(fù)雜性和非線性等特點(diǎn),所以它比其他方法取得的效果更好。例如神經(jīng)網(wǎng)絡(luò)(NNs),支持向量回歸(SVR),局部加權(quán)學(xué)習(xí)(LWL),k?NN[11]方法,支持向量機(jī)(SVR)[12],隨機(jī)微分方程[13]等。
總體說(shuō)來(lái),隨著智能交通的發(fā)展,很多預(yù)測(cè)模型都被提出來(lái)了。但是,很難說(shuō)某個(gè)具體的方法在所有交通流領(lǐng)域強(qiáng)于另外一個(gè)方法。因?yàn)檫@些方法大多數(shù)都是基于某些特定的數(shù)據(jù)進(jìn)行建模的,并且預(yù)測(cè)結(jié)果也依賴于采集數(shù)據(jù)的準(zhǔn)確性。然而神經(jīng)網(wǎng)絡(luò)(NN)由于能夠有效利用歷史數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,所以能夠獲得更好的健壯性與預(yù)測(cè)結(jié)果??墒乾F(xiàn)有的神經(jīng)網(wǎng)絡(luò)大多數(shù)都是基于淺層體系架構(gòu),當(dāng)建立多層架構(gòu)時(shí),基于梯度下降的方法就不能有效地進(jìn)行參數(shù)調(diào)節(jié)。深度學(xué)習(xí)作為一種新興的神經(jīng)網(wǎng)絡(luò),它解決了傳統(tǒng)NN的訓(xùn)練問(wèn)題,獲得了比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更好的實(shí)驗(yàn)效果。所以利用深度信念網(wǎng)絡(luò)(DBN)可以對(duì)交通流模型進(jìn)行預(yù)測(cè)與改進(jìn)。
1.2 深度信念網(wǎng)絡(luò)
深度信念網(wǎng)絡(luò)(DBN)作為深度學(xué)習(xí)模型中最常見(jiàn)的一種模型,它是通過(guò)一系列的RBM堆積而成。每一層的RBM都只有一個(gè)隱藏層,每一層的輸出作為下一層的輸入。Hinton等人提出了一種可以快速的每次逐層訓(xùn)練DBN的方法[14],即每次訓(xùn)練一層。
RBM即限制玻爾茲曼機(jī),它是馬爾可夫隨機(jī)場(chǎng)(MRFs)的一個(gè)特例。若一個(gè)二分圖,每層節(jié)點(diǎn)互相之間沒(méi)有連接,一層是可視層(visible),另外一層是隱藏層(hidden),且假設(shè)所有節(jié)點(diǎn)都是隨機(jī)的、二值分布的,二層之間通過(guò)對(duì)稱矩陣進(jìn)行連接,并且概率分布滿足玻爾茲曼分布,那么這就是RBM??梢晫訉?duì)應(yīng)于輸入,因?yàn)樗鼈兊臓顟B(tài)已經(jīng)被觀察得到;隱藏層對(duì)應(yīng)于特征探測(cè),它們的聯(lián)合組態(tài)能量方程[(v,h)]為:
[E(v,h)=-i∈vnbivi-j∈hnajhj-i,jnvihjwij] (2)
式中:[vi]和[hj]是輸入[i]和特征[j;][bi]和[aj]分別是他們的偏移量;[wij]為它們之間的權(quán)重矩陣。因?yàn)殡[藏層之間是相互條件獨(dú)立的,即:
[P(hv)=jP(hj|v)] (3)
那么當(dāng)[v]或者[h]給定時(shí),便可以計(jì)算出它們的條件概率分布:
[P(hj=1v)=11+exp(-i=1nwijvi-aj)P(vi=1h)=11+exp(-j=1nwijhi-bi)] (4)
那么當(dāng)給定一組訓(xùn)練集[{Vcc∈{1,2,…,C}}]時(shí),其目標(biāo)就是最大化這個(gè)模型的對(duì)數(shù)似然函數(shù):
[c=1Clog p(Vc)=c=1Clogge-E(Vc,g)uge-E(U,g)] (5)
一般都是通過(guò)梯度下降法求得參數(shù)[wij,][bi]和[aj,]但這里可以用吉布斯采樣法近似求得,即可視層[V]根據(jù)指定的規(guī)則采樣出隱藏層[H,]然后再反過(guò)來(lái)采樣出可視層[V,]這個(gè)過(guò)程可以重復(fù)很多次。經(jīng)過(guò)多次的迭代,模型會(huì)忘記它的初始起點(diǎn),這樣就可以從它們的平衡分布中進(jìn)行采樣。最終,函數(shù)期望利用對(duì)比分歧(CD)方法在有限次內(nèi)便可以得到近似值。把[N+1]次采樣的算法標(biāo)記為CD?[N。]實(shí)踐中,一般用CD?1就可以得到合適的值。那么就可以得到權(quán)值[wij]的更新規(guī)則:
[Δwij=εω(Edatavihj-Emodvihj)] (6)
式中:[εω]為學(xué)習(xí)速率;[Edata]是根據(jù)初始模型分布當(dāng)可視層輸入的時(shí)候,隱藏層的期望輸出;[Emod]是通過(guò)CD算法估計(jì)出來(lái)的期望輸出。同理,[bi]和[aj]的更新規(guī)則與[wij]相類似。
[Δbi=εb(Edatavi-Emodvi)]
[Δbj=εb(Edatahj-Emodhj)] (7)
1.3 高斯?伯努利GBRBM
在普通的限制玻爾茲曼機(jī)(RBM)中,可視層的輸入限制為0或1,這樣對(duì)于模擬現(xiàn)實(shí)中像交通流這樣的連續(xù)值是很不方便的。于是,可以通過(guò)高斯?伯努利GBRBM[15]來(lái)模擬真實(shí)數(shù)據(jù)。它通過(guò)加入高斯噪音的連續(xù)值來(lái)模擬真實(shí)的數(shù)據(jù),進(jìn)而替代了普通RBM的二進(jìn)制的可視層輸入,其能量函數(shù)改為:
[E(v,h)=i=1V(vi-bvi)22σ2i-j=1Hahjhj-i=1Vj=1Hviσihjwij] (8)
式中:[vi]表示可視層第[i]個(gè)真實(shí)值;[σ]是高斯函數(shù)的標(biāo)準(zhǔn)方差。通過(guò)方程就能讓可視層表達(dá)獲得某個(gè)特定連續(xù)值的優(yōu)先權(quán),根據(jù)能量方程[16],得到它們的條件概率分布為:
[p(vih)=N(bi+σij=1nhjwij,σ2i)p(hjv)=sigm(i=1nviwij+aj)] (9)
它的訓(xùn)練調(diào)參過(guò)程與普通的RBM沒(méi)什么區(qū)別,都可以利用CD過(guò)程對(duì)參數(shù)進(jìn)行調(diào)節(jié)。
2 體系架構(gòu)
在此,建立了深度架構(gòu),底層是由GBRBM與RBM組成的DBN的架構(gòu),用于非監(jiān)督的特征學(xué)習(xí);頂層加入了一個(gè)回歸層用作預(yù)測(cè),當(dāng)然頂層也可以替換為支持向量機(jī)(SVM)。建立的模型如圖1所示。
圖1 單條道路預(yù)測(cè)的深度體系架構(gòu)
在DBN預(yù)訓(xùn)練以后,頂層再通過(guò)有標(biāo)簽的數(shù)據(jù)進(jìn)行BP算法去做參數(shù)調(diào)整。這種方法要強(qiáng)于以往傳統(tǒng)神經(jīng)網(wǎng)絡(luò)直接用BP算法做梯度下降調(diào)整,直觀的原因?yàn)椋篋BN預(yù)訓(xùn)練后的參數(shù)已經(jīng)接近于訓(xùn)練好,那么再做BP算法,只需要在已知參數(shù)里面進(jìn)行一個(gè)局部的搜索,無(wú)論訓(xùn)練與收斂速度都快很多。此模型的訓(xùn)練步驟如下:
(1) 把交通流數(shù)據(jù)進(jìn)行歸一化到[0,1]之間,那么輸入向量[X]便可以表示為:
[X={xtit∈T,i∈N}]
式中:[Xti]表示為第[i]條道路在第[t]時(shí)間的歸一化后的數(shù)據(jù)。初始化訓(xùn)練次數(shù)、學(xué)習(xí)速率。
(2) 把向量[X]作為輸入,通過(guò)CD過(guò)程訓(xùn)練第一層的GBRBM。
(3) 把GBRBM的輸出作為上層的RBM的輸入,訓(xùn)練RBM。
(4) 把RBM的輸出作為上層的RBM的輸入,訓(xùn)練RBM。
(5) 重復(fù)執(zhí)行第(4)步直到執(zhí)行完給定的層數(shù)。
(6) 最后一個(gè)RBM的輸出作為頂層回歸層的輸入,隨機(jī)初始化其參數(shù)。
(7) 通過(guò)監(jiān)督式BP方法微調(diào)這個(gè)架構(gòu)的參數(shù)。
最后通過(guò)訓(xùn)練得出的模型就可以作為預(yù)測(cè)模型,當(dāng)給定一組輸入向量后,便得到對(duì)應(yīng)道路的預(yù)測(cè)輸出。
3 實(shí)驗(yàn)及結(jié)果分析
3.1 實(shí)驗(yàn)數(shù)據(jù)描述
實(shí)驗(yàn)使用的交通流數(shù)據(jù)來(lái)源于英國(guó)官方交通流數(shù)據(jù)中心。數(shù)據(jù)集提供了每隔15 min的交通平均路途消耗時(shí)間、速度與交通流量,并且數(shù)據(jù)覆蓋了英格蘭地區(qū)的高速公路與A級(jí)道路(即城市主干道)。實(shí)驗(yàn)選取了英格蘭的紐卡斯?fàn)柺信c森德蘭市之間的5條主要城市道路AL1065,AL1596,AL566,AL543,LM69。選取其中2014年9月份的數(shù)據(jù),共有30天數(shù)據(jù)。其中前29天的數(shù)據(jù)用以訓(xùn)練模型,后1天的數(shù)據(jù)用以測(cè)試。
3.2 性能指標(biāo)
兩個(gè)最常見(jiàn)的性能指標(biāo)參數(shù)為:絕對(duì)平均誤差(MAE)和相對(duì)平均誤差(MRE),定義如下:
[MAE=1ni=1nZi-ZiMRE=1ni=1nZi-ZiZi] (10)
式中:[Zi]為實(shí)際的交通流數(shù)值;[Zi]為預(yù)測(cè)值。在這里選擇了MAE與MRE作為衡量標(biāo)準(zhǔn)。
3.3 架構(gòu)實(shí)現(xiàn)
在深度體系架構(gòu)中,需要決定其輸入層的大小,隱藏層的層數(shù),隱藏層每一層的節(jié)點(diǎn)個(gè)數(shù)。在此選擇AL1065,AL1596,AL566,AL543,LM69中前兩個(gè)時(shí)間段的交通流量作為輸入,即共10個(gè)輸入,道路LM69作為其預(yù)測(cè)輸出。其中隱藏層分別為淺層的結(jié)構(gòu){10,10,4}與深層的結(jié)構(gòu){10,12,10,8,6,4},通過(guò)訓(xùn)練以后對(duì)道路LM69第30天做預(yù)測(cè)的結(jié)果如圖2所示。
圖2 單條道路不同深度預(yù)測(cè)的結(jié)果
圖2中橫坐標(biāo)表示的為第[i]個(gè)15 min,縱坐標(biāo)表示交通流量。從圖可以看出深層結(jié)構(gòu)預(yù)測(cè)的結(jié)果更加接近于真實(shí)值。
3.4 結(jié)果對(duì)比與分析
實(shí)驗(yàn)程序在Windows 7上開(kāi)發(fā)完成,硬件條件為 Intel? CoreTM i7?4710MQ,4 GB內(nèi)存,顯卡NVIDIA Geforce 840 MHz。每次運(yùn)算時(shí)間基本在30 min以上,大多數(shù)1 h內(nèi)能完成。
實(shí)驗(yàn)中對(duì)DBN的BP過(guò)程調(diào)優(yōu)次數(shù)epochs做了調(diào)整測(cè)試,結(jié)果發(fā)現(xiàn)大于某個(gè)數(shù)量時(shí),DBN預(yù)測(cè)結(jié)果對(duì)于次數(shù)調(diào)整并沒(méi)有大的影響。這也印證了DBN在預(yù)訓(xùn)練階段參數(shù)的調(diào)整已經(jīng)近乎較優(yōu)的判斷。
為了衡量深度架構(gòu)的性能,同時(shí)也采用傳統(tǒng)的MLP神經(jīng)網(wǎng)絡(luò)做了BP算法訓(xùn)練進(jìn)行預(yù)測(cè),并做了對(duì)比;結(jié)果發(fā)現(xiàn),當(dāng)訓(xùn)練層數(shù)增加時(shí),BP算法的預(yù)測(cè)結(jié)果準(zhǔn)確性反而降低了。這也說(shuō)明傳統(tǒng)的BP算法并不適應(yīng)于深度架構(gòu)。實(shí)驗(yàn)中MLP采用的是{4,4,5}淺層架構(gòu)。
從圖3可以看出,DBN架構(gòu)相對(duì)于傳統(tǒng)的MLP神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),無(wú)論在交通流的最高峰時(shí)期還是最低交通流量時(shí),所預(yù)測(cè)得到的結(jié)果都更加準(zhǔn)確。
MLP與DBN的性能指標(biāo)對(duì)比如表1所示。
表1 性能指標(biāo)對(duì)比
[\&MAE\&MRE\&DBN shallow\&14.83\&0.281\&DBN deep\&14.80\&0.279\&MLP \&20.93\&0.752\&]
圖3 DBN與MLP對(duì)比的結(jié)果
從以上數(shù)據(jù)可以看出,深度學(xué)習(xí)架構(gòu)隨著層次越深相對(duì)平均誤差也越少,并且相對(duì)于傳統(tǒng)的MLP網(wǎng)絡(luò)有大幅度的預(yù)測(cè)準(zhǔn)確性提升。
4 總 結(jié)
本文第一次將深度學(xué)習(xí)架構(gòu)應(yīng)用于城市主干道的交通流預(yù)測(cè)中。相對(duì)于城市的高速公路,城市主干道交通具有更大的不確定性與多變性。進(jìn)而給預(yù)測(cè)帶來(lái)的挑戰(zhàn)也更大。同時(shí),模型也成功地通過(guò)深度學(xué)習(xí)發(fā)現(xiàn)了交通道路之間潛在的特征,如時(shí)間、空間上等的非線性關(guān)系。
在此首先建立了深度體系架構(gòu),通過(guò)逐層非監(jiān)督式的預(yù)訓(xùn)練挖掘潛在特征,并利用回歸層實(shí)現(xiàn)全局微調(diào)參數(shù),進(jìn)一步優(yōu)化了預(yù)測(cè)結(jié)果。然后,對(duì)比了DBN與MLP,實(shí)驗(yàn)表明,DBN所獲得的準(zhǔn)確率要大大強(qiáng)于MLP模型。
本文提出的模型仍可以進(jìn)一步改善,如頂層換為SVM等其他預(yù)測(cè)模型,模型的應(yīng)用場(chǎng)景可以推廣到整個(gè)城市的交通流預(yù)測(cè)等。
參考文獻(xiàn)
[1] 邵春福,熊志華,姚智勝.道路網(wǎng)短時(shí)交通需求預(yù)測(cè)理論、方法與應(yīng)用[M].北京:清華大學(xué)出版社,2011.
[2] HUANG Wenhao, SONG Guojie, XIE Kunqing. Deep architecture for traffic flow prediction: deep belief networks with multitask learning [J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 2191?2201.
[3] AHMED S A, COOK A R. Analysis of freeway traffic time?series data by using Box?Jenkins techniques [J]. Transportation Research Record, 1979, 722: 214?221.
[4] LEE S, FAMBRO D B. Application of subset autoregressive integrated moving average model for short?term freeway traffic volume forecasting [J]. Transportation Research Record, 1999,1678: 179?188.
[5] WILLIAMS B M. Multivariate vehicular traffic flow prediction?evaluation of ARIMAX modeling [J]. Transportation Research Record, 2001, 1776: 194?200.
[6] KAMARIANAKIS Y, PRASTACOS P. Forecasting traffic flow conditions in an urban network?comparison of multivariate and univariate approaches [J]. Transportation Research Record, 2003, 1857: 74?84.
[7] WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: Theoretical basis and empirical results [J]. Journal of Transportation Engineering, 2003, 129(6): 664?672.
[8] YANG F, YIN Z Z, LIU H, et al. Online recursive algorithm for short?term traffic prediction [J]. Transportation Research Record, 2004, 1879: 1?5.
[9] SUN Shiliang, ZHANG Changshui, YU Guoqiang. A Bayesian network approach to traffic flow forecasting [J]. IEEE Transactions on Intelligent Transportation Systems, 2006, 7(1): 124?132.
[10] ZARGARI S A, SIABIL S Z, ALAVI A H, et al. A computational intelligence?based approach for short?term traffic flow prediction [J]. Expert Systems, 2012, 29(2): 124?132.
[11] DAVIS G A, NIHAN N L. Nonparametric regression and short?term freeway traffic forecasting [J]. Journal of Transportation Engineering, 1991, 117(2): 178?188.
[12] JEONG Y S, BYON Y J, MENDONCA C N, EASA S M. Supervised weighting?online learning algorithm for short?term traffic flow prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(4): 1700?1707.
[13] TAHMASBI R, HASHEMI S M. Modeling and forecasting the urban volume using stochastic differential equations [J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(1): 250?259.
[14] HINTON G E, OSINDERO S, THE Y W. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527?1554.
[15] SALAKHUTDINOV R, HINTON G. Using deep belief nets to learn covariance kernels for Gaussian processes [J]. Advances in Neural Information Processing Systems, 2008, 20(1): 1249?1256.
[16] HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks [J]. Science, 2006, 313(5786): 504?507.