国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)處理中基于多任務(wù)學(xué)習(xí)的交通預(yù)測(cè)框架

2022-05-23 07:25:46殷正坤
關(guān)鍵詞:交通狀況多任務(wù)時(shí)段

殷正坤,李 鵬

(1.長(zhǎng)沙職業(yè)技術(shù)學(xué)院 經(jīng)貿(mào)與信息技術(shù)學(xué)院,湖南 長(zhǎng)沙 410217; 2.湖南中醫(yī)藥大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙 410208)

0 引 言

交通預(yù)測(cè)[1,2]在路線(xiàn)導(dǎo)航、交通管制和城市規(guī)劃等很多方面都有重要的應(yīng)用,已引起業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。人們已經(jīng)提出了多種方法來(lái)求解交通預(yù)測(cè)問(wèn)題,例如時(shí)間序列方法[3,4]、聚類(lèi)方法[5]和機(jī)器學(xué)習(xí)模型[6-8]等等。這些方法獨(dú)立地從一個(gè)傳感器上提取訓(xùn)練數(shù)據(jù),然后學(xué)習(xí)每個(gè)傳感器的預(yù)測(cè)模型,并沒(méi)有利用到多個(gè)傳感器之間在交通預(yù)測(cè)上所具有的共性。還有一些研究[9,10]根據(jù)傳感器的空間接近度或潛在空間中的相似性對(duì)傳感器進(jìn)行分組來(lái)找到多個(gè)傳感器之間的共性以進(jìn)行交通預(yù)測(cè),然而它們都不能區(qū)分潛在的不同交通情況。

此外,即使對(duì)于一個(gè)單一的傳感器,大量的交通狀況會(huì)導(dǎo)致交通擁堵,比如反復(fù)出現(xiàn)的交通狀況(比如每天的交通擁擠時(shí)間)、偶爾出現(xiàn)的交通狀況(比如雨天)、不可預(yù)測(cè)的交通狀況(比如交通事故),以及暫時(shí)性的交通擁擠(比如一場(chǎng)籃球賽)等,所以交通預(yù)測(cè)也會(huì)變得非常復(fù)雜。因此,單個(gè)模型難以捕獲所有這些復(fù)雜的交通情況。很少有研究為不同的交通情況建立不同的模型,例如文獻(xiàn)[11]在正常交通條件下使用差分整合移動(dòng)平均自回歸(autoregressive integrated moving average,ARIMA)模型,但在交通高峰時(shí)間使用歷史平均模型(historical average model,HAM)進(jìn)行交通預(yù)測(cè);文獻(xiàn)[12]使用兩種不同的深度學(xué)習(xí)模型來(lái)預(yù)測(cè)交通高峰時(shí)段和事故后的擁堵。然而,他們的研究忽略了一個(gè)事實(shí):在一種情況下表現(xiàn)相同的傳感器在另一種交通情況下可能會(huì)表現(xiàn)不同,例如,在“正常情況”下,傳感器x可能與傳感器y分在同一組,但在“交通高峰時(shí)段”下它又會(huì)與傳感器z分為一組。

總的來(lái)看,目前還沒(méi)有一種全面的交通預(yù)測(cè)方法能為所有交通狀況下的所有傳感器建立一個(gè)模型。一個(gè)傳感器內(nèi)的交通數(shù)據(jù)可能是多種交通情況的混合,因此難以構(gòu)建單個(gè)模型來(lái)捕獲所有這些交通狀況。另一方面,本文通過(guò)處理大量的交通傳感器數(shù)據(jù)發(fā)現(xiàn)傳感器之間存在很多的共性,特別是它們?cè)谙嗤慕煌ㄇ闆r下表現(xiàn)出相似的模式,例如在交通高峰時(shí)段或在下雨天。此外,交通情況的數(shù)量是有限的,這有助于對(duì)每種交通情況而不是對(duì)每個(gè)傳感器建立一個(gè)模型。為此,文中提出一種基于多任務(wù)學(xué)習(xí)(multi-task learning,MTL)[13]的交通預(yù)測(cè)模型。首先忽略潛在的交通狀況,單純地應(yīng)用MTL來(lái)共同學(xué)習(xí)所有傳感器的交通預(yù)測(cè)模型(稱(chēng)為Naive-MTL),即每個(gè)“任務(wù)”對(duì)應(yīng)一個(gè)傳感器(如圖1所示)。

圖1 簡(jiǎn)單多任務(wù)學(xué)習(xí)

然后在此基礎(chǔ)上,本文進(jìn)一步提出了一種基于情境感知的多任務(wù)學(xué)習(xí)(MTL-SA)框架:首先識(shí)別所有傳感器之間的交通情況,然后對(duì)每種識(shí)別的交通狀況應(yīng)用MTL框架,即每個(gè)“任務(wù)”對(duì)應(yīng)一種交通情況,如圖2所示。

圖2 MTL-SA框架

由于不同的交通情況數(shù)量很少,本文針對(duì)不同傳感器的每種單獨(dú)的交通情況應(yīng)用MTL,以便檢查是否所有傳感器間共享交通情況。具體來(lái)說(shuō),為了識(shí)別交通狀況,本文給一個(gè)傳感器的每個(gè)訓(xùn)練樣本增加額外的情境特征,包括道路類(lèi)型(例如,公路或主干線(xiàn))、位置、天氣狀況、區(qū)域類(lèi)型(例如,商業(yè)區(qū),住宅)和事故信息等。隨后,本文結(jié)合所有傳感器之間的訓(xùn)練樣本并將它們聚集到幾個(gè)分區(qū),其中每個(gè)分區(qū)代表一種典型的交通狀況。然后對(duì)于每種特定的交通情況,本文使用可以同時(shí)學(xué)習(xí)所有傳感器預(yù)測(cè)模型的MTL。最后,本文利用FISTA[14]方法來(lái)解決提出的多任務(wù)學(xué)習(xí)問(wèn)題,并保證收斂速度。通過(guò)對(duì)洛杉磯大規(guī)模交通傳感器數(shù)據(jù)進(jìn)行大量的實(shí)驗(yàn)來(lái)評(píng)估本文提出的模型。實(shí)驗(yàn)結(jié)果表明,所提出MTL-SA框架的表現(xiàn)不僅始終優(yōu)于Naive-MTL,而且優(yōu)于其它典型的交通預(yù)測(cè)方法。

1 問(wèn)題建模

本節(jié)首先對(duì)交通預(yù)測(cè)問(wèn)題進(jìn)行了定義,然后給出了一種將多任務(wù)學(xué)習(xí)框架應(yīng)用于交通預(yù)測(cè)問(wèn)題的典型方法,并對(duì)該方法的性能進(jìn)行了分析。為了便于描述,先給出文中用到的相關(guān)符號(hào)和說(shuō)明見(jiàn)表1。

1.1 問(wèn)題定義

給定一組包含T個(gè)交通傳感器的路段,假設(shè)在給定的時(shí)間間隔γ內(nèi)(例如,10分鐘),每個(gè)傳感器t提供交通速度讀數(shù)為vt(γ) (例如,50英里/小時(shí))。給定歷史傳感器數(shù)

表1 文中用到的符號(hào)和說(shuō)明

據(jù)集,本文研究的目的是預(yù)測(cè)任何給定傳感器在未來(lái)的交通速度。有如下的定義:

定義1 給定每個(gè)傳感器t的一組觀(guān)察到的歷史讀數(shù),假設(shè)當(dāng)前時(shí)間是γ, 交通預(yù)測(cè)問(wèn)題是估計(jì)每個(gè)傳感器的未來(lái)行進(jìn)速度vt(γ+h), 其中h是預(yù)測(cè)范圍。例如,當(dāng)h=1時(shí),本文預(yù)測(cè)下一個(gè)時(shí)間戳的交通速度。

定義2 短期預(yù)測(cè)和長(zhǎng)期預(yù)測(cè)分別指h=1和h>1時(shí)的情景。

交通預(yù)測(cè)問(wèn)題屬于典型的回歸問(wèn)題。對(duì)于每個(gè)傳感器t, 假設(shè)當(dāng)前時(shí)間為γ, 為了預(yù)測(cè)vt(γ+h), 本文主要提取先前的滯后(lag)讀數(shù)(即vt(γ-1),vt(γ-2), …,vt(γ-lag)) 作為訓(xùn)練特征。對(duì)于每個(gè)傳感器t, 本文構(gòu)造訓(xùn)練輸入xt和輸出yt, 其中xt∈Rnt×D,yt∈Rnt,D是特征的數(shù)目,本文的目標(biāo)是訓(xùn)練得到一個(gè)線(xiàn)性函數(shù)f, 其中ft(xt)=xtwt和wt∈Rd×1。 為了學(xué)習(xí)參數(shù)向量wt, 本文解決以下的優(yōu)化問(wèn)題

(1)

其中,l(ft(xt),yt) 用來(lái)定義損耗函數(shù), Ω(wt) 是每個(gè)傳感器的正則化項(xiàng)。例如,本文可以分別采用平方損失和l2的正則化。本文的目標(biāo)是學(xué)習(xí)每個(gè)傳感器T的線(xiàn)性模型。本文將W=[w1,w2,…,wT]∈RD×T表示為要估計(jì)的參數(shù)矩陣。

1.2 簡(jiǎn)單多任務(wù)學(xué)習(xí)

本文首先采用典型的多任務(wù)學(xué)習(xí)來(lái)共同學(xué)習(xí)所有傳感器的預(yù)測(cè)模型,而不是單獨(dú)解決每個(gè)任務(wù)。本文通過(guò)提取和利用這些傳感器的公共信息來(lái)同時(shí)學(xué)習(xí)所有預(yù)測(cè)任務(wù)。如圖1所示,估算W的一種典型MTL過(guò)程如下

(2)

圖3 3個(gè)不同高速公路傳感器在同一天的交通讀數(shù)

2 MTL-SA框架

MTL-SA首先將所有傳感器的訓(xùn)練樣本組合在一起,并將它們分類(lèi)成幾個(gè)分區(qū),其中每個(gè)分區(qū)代表一種典型的交通狀況,并由來(lái)自所有傳感器的不同數(shù)量的訓(xùn)練樣本組成。然后,對(duì)于每個(gè)分區(qū)而言(即交通狀況),本文使用多任務(wù)特征學(xué)習(xí)來(lái)同時(shí)得到所有傳感器的預(yù)測(cè)模型。下面對(duì)其細(xì)節(jié)進(jìn)行詳細(xì)闡述。

2.1 總體框架

雖然每個(gè)傳感器都有其獨(dú)特的交通模式,但它們?cè)谙嗤慕煌ㄇ闆r下(例如,正常或交通高峰時(shí)段條件)表現(xiàn)出相似的性能,如圖3所示。假設(shè)傳感器在通常交通情況下表現(xiàn)相似,這激勵(lì)本文在每種交通情況下探索傳感器之間的共性。為此,本文提出了情境感知多任務(wù)學(xué)習(xí)框架(MTL-SA),如圖2所示。在MTL-SA中,本文首先通過(guò)聚類(lèi)算法識(shí)別所有傳感器的交通情況,然后對(duì)每種交通狀況應(yīng)用傳統(tǒng)多任務(wù)學(xué)習(xí)框架進(jìn)行交通預(yù)測(cè),具體步驟如算法1所示:①將來(lái)自所有傳感器的訓(xùn)練樣本組合在一起(第(1)~第(3)行);②將組合的訓(xùn)練數(shù)據(jù)分類(lèi)為k個(gè)分區(qū),其中每個(gè)分區(qū)由來(lái)自不同傳感器的訓(xùn)練樣本構(gòu)成(第(4)行);③對(duì)每個(gè)分區(qū)Pc應(yīng)用多任務(wù)學(xué)習(xí),其中c∈[1,k], 并對(duì)每種交通情況學(xué)習(xí)每個(gè)參數(shù)矩陣Wc(第(5)~第(7)行)。利用每個(gè)分區(qū)Pc的訓(xùn)練模型Wc, 本文能夠在任何情況下對(duì)任何傳感器進(jìn)行流量預(yù)測(cè)。給定來(lái)自具有輸入特征的一個(gè)傳感器的預(yù)測(cè)請(qǐng)求,本文首先確定該請(qǐng)求的潛在流量情況(即,聚類(lèi)標(biāo)簽c)。然后利用基于Wc的訓(xùn)練模型來(lái)預(yù)測(cè)其未來(lái)的行進(jìn)速度。

算法1:MTL-SA框架

輸入: ?t∈[1,T],xt∈Rnt×D,yt∈R, 聚類(lèi)數(shù)量k

輸出: ?c∈[1,T],Wc

(1) Fort=1 toTdo

(2)X←∪xt//見(jiàn)2.2節(jié)

(3) End

(4) 將X分成簇Pc(c

(5) Forc=1tokdo

(6) 針對(duì)每種交通情況Pc的多任務(wù)學(xué)習(xí)Wc//見(jiàn)2.4節(jié)

(7) End

2.2 訓(xùn)練數(shù)據(jù)的整合和增強(qiáng)

2.3 交通狀況聚類(lèi)

本文對(duì)矩陣X進(jìn)行聚類(lèi)以識(shí)別隱藏的交通情況。具體而言,本文將訓(xùn)練數(shù)據(jù)分成不同的組,其中每組對(duì)應(yīng)一種交通情況。一個(gè)直截了當(dāng)?shù)南敕ㄊ鞘褂脗鹘y(tǒng)的聚類(lèi)方法(如K均值[15])并指定聚類(lèi)的數(shù)量。但在本文的交通預(yù)測(cè)問(wèn)題中,本文的目的是發(fā)現(xiàn)傳感器的潛在相似性,即潛在的交通模式。由于不同交通情況的密度可能會(huì)不同(例如,正常交通狀況在訓(xùn)練樣本中占主導(dǎo)地位),K均值聚類(lèi)可能表現(xiàn)不佳。因此,本文提出利用非負(fù)矩陣分解(non-negative matrix factorization,NMF)[16]來(lái)發(fā)現(xiàn)交通狀況。形式上,給定輸入矩陣X∈RN×D和聚類(lèi)數(shù)量k, 其中k

(3)

(4)

2.4 每個(gè)交通狀況的多任務(wù)學(xué)習(xí)

(5)

2.4.1 問(wèn)題求解

(6)

給定當(dāng)前搜索點(diǎn)Wi, FISTA算法首先求出f(W) 在點(diǎn)Wi處的二次近似Q來(lái)生成下一個(gè)點(diǎn)Wi+1。 二次近似函數(shù)Q(W,Wi) 在Wi處的定義如下所示

(7)

(8)

除了使用一個(gè)序列 {Wi} 之外,F(xiàn)ISTA還使用了另外一個(gè)序列 {Zi}, 其中 {Wi} 是近似解的序列, {Zi} 是搜索點(diǎn)序列。在搜索點(diǎn)Zi處生成Wi+1的近似解,并且Zi是Wi-1和Wi的仿射組合。算法2中給出了FISTA算法的細(xì)節(jié)。在每次迭代中,本文首先從Wi和Wi-1(第(4)行)生成Zi的搜索點(diǎn),并從Zi的搜索點(diǎn)(第(7)行)計(jì)算Wi+1。 最后,根據(jù)Armijo規(guī)則[18],通過(guò)線(xiàn)搜索計(jì)算每一步的步長(zhǎng)η。

算法2:FISTA算法

輸入: ?t,xt,ytandW0

輸出:W

(1) 初始化W1=W0,λ-1=0,λ0=1,η=1;

(2) fori=1,2,…, do

(4)Zi←(1-αi)Wi+αiWi-1;

(5) forj←0,1,… do

(6)η←2jηi-1;

(8) ifF(Wi≤Q(Wi,Zi)) then

(9)ηi←η;

(10) break;

(11) end

(12) end

(14) if Convergence then

(15)W←Wi;

(16) break;

(17) end

(18) end

2.4.2 時(shí)間復(fù)雜度分析

3 仿真實(shí)驗(yàn)

本文進(jìn)行了豐富的實(shí)驗(yàn)來(lái)評(píng)價(jià)MTL-SA框架的有效性和效率。先將MTL-SA框架與各種基線(xiàn)方法進(jìn)行了比較,然后展示了改變不同參數(shù)的效果。最后,本文提供了實(shí)例研究來(lái)驗(yàn)證MTL-SA框架的優(yōu)勢(shì)。

3.1 實(shí)驗(yàn)設(shè)計(jì)

3.1.1 數(shù)據(jù)集

本文使用了大量的來(lái)自洛杉磯高速公路和主干道的高分辨率(空間和時(shí)間)交通傳感器(環(huán)路檢測(cè)器)收集的數(shù)據(jù)集。該數(shù)據(jù)集包括15 000個(gè)交通傳感器的庫(kù)存和實(shí)時(shí)數(shù)據(jù),大約覆蓋3420英里。數(shù)據(jù)的采樣率為每分鐘每個(gè)傳感器讀取一個(gè)數(shù)值。傳感器的數(shù)據(jù)聚合為5分鐘一個(gè)間隔。本文選取了從2019年1月至2019年4月共計(jì)880個(gè)傳感器的4個(gè)月收集的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。

3.1.2 對(duì)比算法

本文將MTL-SA框架與以下基線(xiàn)方法進(jìn)行了比較:

(1)幾乎不需要訓(xùn)練的方法:歷史平均模型(HAM)[11]、隨機(jī)游走(RW)(即,使用最近的讀數(shù)作為預(yù)測(cè)速度)。

(2)單一傳感器模型:嶺回歸模型(Ridge)[19]、支持向量回歸(SVR)[20]、多層神經(jīng)網(wǎng)絡(luò)(Neural)[21]、隨機(jī)森林(Forest)[19]和時(shí)間序列方法差分整合移動(dòng)平均自回歸模型(ARIMA)[11]。

(3)多傳感器模型:不考慮交通狀況的多任務(wù)特征學(xué)習(xí)模型(MTFL)[22]和聚類(lèi)多任務(wù)學(xué)習(xí)模型(CMTL)[23]。

3.1.3 實(shí)驗(yàn)過(guò)程和配置

對(duì)于每個(gè)傳感器t, 本文從其歷史數(shù)據(jù)集生成訓(xùn)練樣本和測(cè)試樣本:假設(shè)當(dāng)前時(shí)間為γ, 為了預(yù)測(cè)v(γ+h), 本文主要利用先前傳感器讀數(shù)的信息,即v,vt(γ-1),vt(γ-2), …,vt(γ-lag) 作為本文的特征。本文測(cè)試了不同的lag值,發(fā)現(xiàn)當(dāng)將lag固定為6時(shí),在準(zhǔn)確性和訓(xùn)練復(fù)雜度之間實(shí)現(xiàn)了較好的平衡。此外,本文還生成了歷史特征:即對(duì)于一個(gè)傳感器的每個(gè)工作日時(shí)間(例如周一下午4點(diǎn)),本文匯總了該傳感器在過(guò)去3個(gè)月(一月至三月)的特定時(shí)間內(nèi)的先前讀數(shù)。除了來(lái)自傳感器讀數(shù)的特征,本文的訓(xùn)練特征還包括基本情境信息(例如,一天中的時(shí)間、一周中的某一天)和傳感器屬性(例如,傳感器的分類(lèi)、方向)。本文使用了兩個(gè)月的數(shù)據(jù),其中3月份的數(shù)據(jù)用于訓(xùn)練,4月份的數(shù)據(jù)用于測(cè)試。在本文的實(shí)驗(yàn)中,本文沒(méi)有將天氣和事件數(shù)據(jù)作為訓(xùn)練特征,本文在除ARIMA外的所有模型中應(yīng)用了相同的特征,因?yàn)锳RIMA是一個(gè)單變量時(shí)間序列方法。對(duì)于A(yíng)RIMA,本文只使用3月份的數(shù)據(jù)進(jìn)行訓(xùn)練,使用4月份的數(shù)據(jù)進(jìn)行測(cè)試。

本文使用均方根誤差(RMSE)來(lái)衡量精度。本文人工區(qū)分高峰時(shí)段(即早上7點(diǎn)到9點(diǎn),下午4點(diǎn)到7點(diǎn))和非高峰時(shí)段范圍,報(bào)告了它們的RMSE,并且分別進(jìn)行了短期和長(zhǎng)期的交通預(yù)測(cè),其中h=1 (即5 min)為短期預(yù)測(cè),h=6 (即30 min)為長(zhǎng)期預(yù)測(cè)。RMSE的定義如下所示

(9)

對(duì)于每一種測(cè)試方法,本文都使用5折交叉驗(yàn)證來(lái)選擇最佳參數(shù),并報(bào)告相應(yīng)的結(jié)果。本文在一臺(tái)Linux PC上進(jìn)行了實(shí)驗(yàn),CPU為i5-2400@ 3.10 G HZ,內(nèi)存為24 GB。

3.2 性能比較

(1)短期交通預(yù)測(cè):表2給出了當(dāng)h=1時(shí)的性能比較,即本文預(yù)測(cè)未來(lái)5 min的交通狀況。在所有方法中,MTL-SA與高峰時(shí)段和非高峰時(shí)段的基線(xiàn)方法相比,性能分別提高了18%和13%,達(dá)到了最佳。因?yàn)楦叻鍟r(shí)段的交通狀況預(yù)測(cè)更復(fù)雜,所以高峰時(shí)段的預(yù)測(cè)誤差高于非高峰時(shí)段。本文清楚地觀(guān)察到,通過(guò)結(jié)合交通情況,MTL-SA的表現(xiàn)明顯優(yōu)于Naive-MTL。即使是非高峰時(shí)段,由于其重復(fù)模式已經(jīng)準(zhǔn)確預(yù)測(cè)了非高峰時(shí)段的短期交通狀況,因此預(yù)測(cè)誤差減少了13%。另一方面,Naive-MTL的性能與其它單一傳感器模型(例如,Ridge、SVR)類(lèi)似??梢元?dú)立地為每個(gè)傳感器訓(xùn)練模型,簡(jiǎn)單地將傳感器分組而不考慮交通狀況的CMTL甚至比Naive-MTL的性能更差。這些觀(guān)察結(jié)果支持了本文的假設(shè),即將傳感器分組在一起而不考慮它們?cè)诓煌煌ㄇ闆r下的共性,這對(duì)于交通預(yù)測(cè)沒(méi)有影響甚至是負(fù)面的影響。在其它基線(xiàn)方法中,RW實(shí)現(xiàn)了良好的性能(甚至優(yōu)于其它單一傳感器模型)而HAM表現(xiàn)更差,這表明最近的讀數(shù)是短期預(yù)測(cè)的一個(gè)強(qiáng)有力指標(biāo),而歷史特征卻不起任何作用。在單個(gè)傳感器模型中,Ridge、Neural和SVR取得類(lèi)似的結(jié)果,而Forest在其中表現(xiàn)最差。

表2 短期預(yù)測(cè)性能(RMSE)

(2)長(zhǎng)期交通預(yù)測(cè):在表3中給出了長(zhǎng)期預(yù)測(cè)的實(shí)驗(yàn)結(jié)果,本文用它來(lái)預(yù)測(cè)接下來(lái)30分鐘的交通狀況(即h=6)。從表3可以看到,與每種情況的最佳基線(xiàn)相比,MTL-SA的預(yù)測(cè)精度都至少提高了30%以上。同時(shí),MTL-SA比Naive-MTL和CMTL表現(xiàn)更好,這表明在識(shí)別交通情況后探索共性更有效。值得注意的是,HAM和RW等簡(jiǎn)單方法不再適用于長(zhǎng)期預(yù)測(cè),因其預(yù)測(cè)性能比單一傳感器模型差得多。對(duì)于單一傳感器模型,SVR比Ridge、Neural和Forest表現(xiàn)更好。

表3 長(zhǎng)期預(yù)測(cè)性能(RMSE)

(3)運(yùn)行時(shí)間比較:表4給出了在訓(xùn)練和測(cè)試階段不同方法的運(yùn)行時(shí)間。在所有單一傳感器模型中,Ridge是最有效的,因?yàn)樗蔷€(xiàn)性模型,而其它非線(xiàn)性模型(如Neural、Forest和SVR)需要更多的訓(xùn)練時(shí)間。另一方面,作為多傳感器模型,MTFL需要與Ridge類(lèi)似的訓(xùn)練時(shí)間。與Ridge和RW相比,本文的方法MTL-SA需要更長(zhǎng)的時(shí)間,因?yàn)楸疚男枰~外的步驟來(lái)識(shí)別交通狀況,然后對(duì)每個(gè)已識(shí)別的情況應(yīng)用MTL。然而,即使包括額外的步驟,MTL-SA的訓(xùn)練時(shí)間仍然有效并且花費(fèi)不到70 s,因此它可以很容易地?cái)U(kuò)展到大量傳感器。

表4 不同方法運(yùn)行時(shí)間的比較

3.3 不同參數(shù)條件下的預(yù)測(cè)性能分析

(1)使用歷史特征的影響:本文評(píng)估了使用不同訓(xùn)練特征集的效果,圖4給出了有/無(wú)歷史平均速度讀數(shù)的交通預(yù)測(cè)結(jié)果。如圖4(a)所示,歷史聚集的平均讀數(shù)對(duì)短期預(yù)測(cè)沒(méi)有任何幫助,這與表2中的結(jié)果是一致的:HAM的精度最差,反而RW具有相對(duì)較好的性能。但是,如圖4(b)所示,歷史特征也無(wú)助于長(zhǎng)期預(yù)測(cè)。這與本文的常識(shí)-歷史平均值可以作為長(zhǎng)期預(yù)測(cè)的良好預(yù)測(cè)因子相矛盾。原因在于,根據(jù)本文的觀(guān)察,歷史數(shù)值反映了在大多數(shù)過(guò)渡時(shí)間地面真實(shí)數(shù)值的趨勢(shì)(即高峰時(shí)段的邊界),但與其它交通條件下的讀數(shù)沒(méi)有關(guān)系。此外,交通預(yù)測(cè)任務(wù)由那些非轉(zhuǎn)換時(shí)間的實(shí)例所支配,因此歷史特征在長(zhǎng)期預(yù)測(cè)中沒(méi)有多大幫助。圖5(a)和圖5(b)顯示了在非高峰時(shí)段類(lèi)似的影響。

圖4 使用歷史特征對(duì)高峰時(shí)段的影響

圖5 使用歷史特征對(duì)非高峰時(shí)段的影響

(2)變化的k的影響:不同聚類(lèi)算法結(jié)果(NMF與K均值)和不同的聚類(lèi)數(shù)量k(即交通情況)對(duì)于交通預(yù)測(cè)的影響如圖6(a)和圖6(b)所示??梢钥吹?,NMF和K-means獲得了類(lèi)似的結(jié)果,NMF的表現(xiàn)略好于K-means。這表明了NMF在發(fā)現(xiàn)潛在交通情況方面的優(yōu)越性。對(duì)于聚類(lèi)的數(shù)量k而言,本文注意到k=4時(shí),MTL-SA無(wú)論是做短期還是長(zhǎng)期交通預(yù)測(cè)都達(dá)到了最佳性能。這表明即使交通狀況混亂且復(fù)雜,本文仍然可以通過(guò)有限數(shù)量的交通情況來(lái)區(qū)分其潛在的分組,這是MTL-SA框架在交通預(yù)測(cè)任務(wù)中有效和高效的主要原因之一。

圖6 變化的k對(duì)高峰時(shí)段和非高峰時(shí)段的影響

圖7 變化的ρ1對(duì)高峰時(shí)段的影響

(3)式(5)中變化ρ1的影響:圖7(a)和圖7(b)顯示了ρ1從0.0001變化到1000時(shí)對(duì)于交通預(yù)測(cè)的影響。本文觀(guān)察到當(dāng)ρ1=1時(shí),MTL-SA達(dá)到最佳的RMSE值。當(dāng)ρ1變得越大時(shí),性能較差。因此,將ρ1設(shè)置為較小的值(例如,1)可以得到更好的準(zhǔn)確度。

3.4 交通預(yù)測(cè)實(shí)例分析

最后,以洛杉磯某一主干道的交通實(shí)況作為監(jiān)測(cè)環(huán)境,主要考慮了對(duì)于最難預(yù)測(cè)的交通高峰過(guò)渡時(shí)段,模擬事故模式和其它突發(fā)情況等監(jiān)測(cè)對(duì)象,以標(biāo)號(hào)為168的傳感器監(jiān)測(cè)數(shù)據(jù)為例,圖8給出了MTL-SA的預(yù)測(cè)值與最佳基線(xiàn)方法、地面真實(shí)交通情況的對(duì)比結(jié)果,以驗(yàn)證MTL-SA在各種交通情況下的優(yōu)越性。從圖中可以看到,與最佳基線(xiàn)方法相比,本文方法的預(yù)測(cè)結(jié)果在過(guò)渡時(shí)間有較小的誤差,特別是在[12 pm,13 pm]和[18 pm,19 pm]的范圍內(nèi),而最佳基線(xiàn)方法無(wú)法捕捉到這些突然的變化。此外,與地面真實(shí)交通情況相比,MTL-SA基本可以做到準(zhǔn)確地?cái)M合,這表明了MTL-SA在真實(shí)環(huán)境中進(jìn)行交通預(yù)測(cè)的有效性,可以應(yīng)用到大規(guī)模交通網(wǎng)絡(luò)中去。

圖8 h=6時(shí),傳感器168的實(shí)測(cè)結(jié)果

4 結(jié)束語(yǔ)

文中提出了一種多任務(wù)學(xué)習(xí)框架(MTL-SA)用于預(yù)測(cè)交通問(wèn)題。與現(xiàn)有的每個(gè)傳感器訓(xùn)練一個(gè)模型的MTL規(guī)則不同,本文提出的框架自動(dòng)識(shí)別基本交通情況,同時(shí)根據(jù)每種交通情況訓(xùn)練一個(gè)模型。通過(guò)大量的實(shí)驗(yàn)評(píng)估發(fā)現(xiàn)MTL-SA框架可以準(zhǔn)確地捕獲交通狀況,并能顯著改善短期和長(zhǎng)期的交通預(yù)測(cè),特別是對(duì)長(zhǎng)期的交通預(yù)測(cè)更加明顯。在下一步工作中,本文進(jìn)一步分析影響短期和長(zhǎng)期交通狀況的因素,并借鑒圖卷積神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜交通網(wǎng)絡(luò)上的優(yōu)勢(shì),擬提出一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的交通預(yù)測(cè)算法。

猜你喜歡
交通狀況多任務(wù)時(shí)段
基于中心化自動(dòng)加權(quán)多任務(wù)學(xué)習(xí)的早期輕度認(rèn)知障礙診斷
基于人工智能的交通狀況監(jiān)測(cè)淺析
四個(gè)養(yǎng)生黃金時(shí)段,你抓住了嗎
基于判別性局部聯(lián)合稀疏模型的多任務(wù)跟蹤
電測(cè)與儀表(2016年5期)2016-04-22 01:13:46
管莊路交通狀況調(diào)查研究
傍晚是交通事故高發(fā)時(shí)段
分時(shí)段預(yù)約在PICC門(mén)診維護(hù)中的應(yīng)用與探討
山區(qū)高速公路長(zhǎng)大隧道交通狀況及行車(chē)安全保障
未知環(huán)境下基于粒子群優(yōu)化的多任務(wù)聯(lián)盟生成
称多县| 西乌| 政和县| 天峻县| 龙胜| 弥勒县| 漯河市| 繁昌县| 都安| 昌图县| 昂仁县| 卓资县| 辉县市| 东乡族自治县| 玉林市| 壶关县| 新余市| 恩平市| 扶风县| 遵化市| 桦甸市| 洪泽县| 杭州市| 榆树市| 博乐市| 东乡| 嘉义市| 罗定市| 龙川县| 浙江省| 通榆县| 永州市| 赤峰市| 班玛县| 封丘县| 边坝县| 庄河市| 胶州市| 景洪市| 吉木乃县| 侯马市|