考慮注意力和時(shí)空特征深度學(xué)習(xí)的網(wǎng)約車行程時(shí)間預(yù)測(cè)

2023-05-30 13:59楊誼瀟鄔群勇

福州大學(xué)學(xué)報(bào)（自然科學(xué)版） 2023年3期

楊誼瀟,鄔群勇

(福州大學(xué)空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,衛(wèi)星空間信息技術(shù)綜合應(yīng)用國(guó)家地方聯(lián)合工程研究中心,數(shù)字中國(guó)研究院(福建),福建福州 350108)

0 引言

精確預(yù)測(cè)行程時(shí)間在道路導(dǎo)航、路徑優(yōu)化、乘客出行過程中扮演著重要的角色,但行程時(shí)間預(yù)測(cè)受到交通擁堵狀態(tài)[1]、出發(fā)時(shí)刻、天氣狀況、駕駛?cè)讼埠玫戎T多因素的影響,很難準(zhǔn)確預(yù)測(cè).故研究精準(zhǔn)的行程時(shí)間預(yù)測(cè)具有重要應(yīng)用價(jià)值.精準(zhǔn)、高效、可靠的行程時(shí)間預(yù)測(cè)模型一直是研究的熱點(diǎn),現(xiàn)有研究中,大多數(shù)研究者以期融入盡可能多的特征數(shù)據(jù)作為模型輸入最大程度地還原應(yīng)用場(chǎng)景,從數(shù)據(jù)驅(qū)動(dòng)的角度著手進(jìn)行行程時(shí)間預(yù)測(cè),基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法主要分為基于參數(shù)的機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法.基于參數(shù)的機(jī)器學(xué)習(xí)大都采用擬合回歸的方式進(jìn)行線性預(yù)測(cè),一般適應(yīng)于簡(jiǎn)單的數(shù)據(jù)形式.如文獻(xiàn)[3]通過聚類分析和多項(xiàng)式擬合方法對(duì)歷史軌跡數(shù)據(jù)進(jìn)行建模,匹配與查詢條件最近的歷史模式.文獻(xiàn)[4]采用自回歸移動(dòng)平均模型針對(duì)非平穩(wěn)性的數(shù)據(jù)進(jìn)行時(shí)間序列的建模,對(duì)于低時(shí)速、短距離的路段誤差較大.文獻(xiàn)[5]針對(duì)短距離交叉口的公交車輛行程時(shí)間預(yù)測(cè)采用多數(shù)據(jù)融合的方法,考慮單路段、多路段擬合進(jìn)行實(shí)驗(yàn),預(yù)測(cè)精度相比較有明顯的提高.而深度學(xué)習(xí)主要通過現(xiàn)有神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的組合模型融入復(fù)雜數(shù)據(jù)進(jìn)行時(shí)間預(yù)測(cè).文獻(xiàn)[6]提出卷積時(shí)空?qǐng)D注意力網(wǎng)絡(luò),將行程中的路段看為一個(gè)序列,通過設(shè)置一定大小卷積核的卷積網(wǎng)絡(luò)去捕獲子路段的空間信息,作為模型的輸入去預(yù)測(cè)行程時(shí)間,能夠更好地表征現(xiàn)實(shí)世界的場(chǎng)景.文獻(xiàn)[7]提出了一種新穎的門控循環(huán)單元模型,將輸入信息與隱藏狀態(tài)信息在輸入模型之前進(jìn)行交互,并提出一個(gè)軟殘差結(jié)構(gòu)設(shè)計(jì)進(jìn)行時(shí)間預(yù)測(cè),取得了很好的效果.基于路段的組合模型計(jì)算效率高,但隨著路徑長(zhǎng)度的增加,預(yù)測(cè)精度會(huì)有所下降.Wang等[8]考慮時(shí)空信息、交通信息、個(gè)性化等輔助信息,提出一種新的基于路徑的時(shí)間預(yù)測(cè)模型,由淺層線性層、深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)組成,相比較WD(wide deep)[9]模型能夠很好地挖掘路段的局部信息.Duan等[10]考慮到數(shù)據(jù)獲取的延遲,用長(zhǎng)短期記憶(long short-term memory,LSTM)預(yù)測(cè)多個(gè)時(shí)間段的旅行時(shí)間,當(dāng)觀測(cè)到的旅行時(shí)間未被獲取時(shí),預(yù)測(cè)的旅行時(shí)間將被輸入到模型中,彌補(bǔ)了數(shù)據(jù)稀疏問題.Hong等[11]提出一種異質(zhì)結(jié)構(gòu)信息的處理方法,將時(shí)間分為3個(gè)不同時(shí)間間隔(臨近、一天、一周)作為模型的輸入,可以很好地提取時(shí)間上的異質(zhì)性信息.Li等[12]通過OD點(diǎn)提出一種多任務(wù)表征學(xué)習(xí)方法,支持在有限的信息下進(jìn)行時(shí)間預(yù)測(cè),但對(duì)數(shù)據(jù)量的大小要求很高.文獻(xiàn)[13]采用長(zhǎng)短期LSTM的方法從粗、細(xì)兩種時(shí)間粒度去預(yù)測(cè)出租車短期時(shí)序的通行時(shí)間,但由于數(shù)據(jù)比較陳舊不具有時(shí)效性.

現(xiàn)有方法大多沒有融合路徑信息中的空間依賴性,較少關(guān)注交通擁堵變化對(duì)行程時(shí)間的影響,而嚴(yán)重的交通擁堵會(huì)導(dǎo)致時(shí)間預(yù)測(cè)的準(zhǔn)確度大大降低,考慮交通擁堵變化對(duì)時(shí)間預(yù)測(cè)的影響,研究一種基于注意力機(jī)制的時(shí)空特征深度學(xué)習(xí)時(shí)間預(yù)測(cè)模型,利用卷積神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制去捕獲在交通過程中由于交通擁堵變化所產(chǎn)生的影響,通過長(zhǎng)短期記憶網(wǎng)絡(luò)去處理軌跡路段信息.為了能夠平衡基于路段和端到端的預(yù)測(cè)方法,采用多任務(wù)學(xué)習(xí)機(jī)制去預(yù)測(cè)行程時(shí)間,最后通過全連接層輸出總的時(shí)間預(yù)測(cè)信息.

1 數(shù)據(jù)和方法

1.1 數(shù)據(jù)

數(shù)據(jù)采用的是滴滴聯(lián)合SIGSPATIAL共同在數(shù)據(jù)競(jìng)賽平臺(tái)biendata發(fā)布的2020年8月17日至8月31日深圳市網(wǎng)約車訂單數(shù)據(jù),總共包括519 299條軌跡.以網(wǎng)約車單個(gè)訂單數(shù)據(jù)的行程軌跡為數(shù)據(jù)集的基本單位,每個(gè)訂單表示一條包含多個(gè)路段的軌跡,即路徑.單條路徑R是由多個(gè)路段組成,即{R1,R2,R3,…,Rn},n表示路段的個(gè)數(shù).每個(gè)路段記錄當(dāng)前時(shí)刻(curr)和到達(dá)時(shí)刻(arriv)的擁堵狀態(tài).擁堵狀態(tài)分為5個(gè)等級(jí),由0、1、2、3、4表示不同路段的擁堵等級(jí).當(dāng)前時(shí)刻的擁堵狀態(tài)表示為行程出發(fā)前每個(gè)路段的擁堵狀況,到達(dá)時(shí)刻的擁堵狀態(tài)表示車輛到達(dá)該路段的擁堵狀態(tài).單個(gè)路段的通行時(shí)間(lk_t)、長(zhǎng)度(dist_gap)、路徑所花費(fèi)的總距離、總時(shí)間、行程出發(fā)時(shí)的天氣狀況、駕駛?cè)司幪?hào)(司機(jī)id)、路徑的出行時(shí)刻等信息,如表1所示.

表1 數(shù)據(jù)集描述

1.2 方法

一種考慮交通擁堵變化的深度預(yù)測(cè)模型,如圖1所示,模型主要分為4個(gè)部分: 基于卷積的路徑時(shí)間距離特征提取、基于注意力機(jī)制的擁堵時(shí)間異常特征提取、時(shí)序模型時(shí)間預(yù)測(cè)和多任務(wù)學(xué)習(xí)機(jī)制.基于卷積的路徑時(shí)間距離特征提取主要是通過卷積神經(jīng)網(wǎng)絡(luò)捕獲路段中的時(shí)間、距離和交通擁堵狀況信息;基于注意力機(jī)制的擁堵時(shí)間異常特征提取則是注重導(dǎo)致路徑擁堵的交通路段信息;時(shí)序模型時(shí)間預(yù)測(cè)訓(xùn)練模型學(xué)習(xí)的路徑信息,多任務(wù)學(xué)習(xí)機(jī)制是為了權(quán)衡預(yù)測(cè)路段與路徑弊端的方法.考慮到路徑發(fā)生中的背景信息,將天氣、司機(jī)編號(hào)等信息輸入到模型,豐富模型的內(nèi)容.

圖1 模型結(jié)構(gòu)Fig.1 Model structure

1.2.1基于卷積操作的路徑特征信息提取

卷積層由多個(gè)卷積核組成,通過對(duì)輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算來提取路徑過程中的特征信息.在行程過程中路段的擁堵狀態(tài)、通行時(shí)間和路段的距離對(duì)于行程預(yù)測(cè)非常重要,不同的路況信息表示著車輛行駛的速度有差別,擁堵的交通狀態(tài)則會(huì)造成車輛的逗留甚至停滯,增加了時(shí)間預(yù)測(cè)的難度.將路段的通行時(shí)間、距離、當(dāng)前時(shí)刻和到達(dá)時(shí)刻路段擁堵狀態(tài)連接作為卷積網(wǎng)絡(luò)的輸入.輸入前,先將連接路段序列的特征矩陣通過一個(gè)非線性變換映射到高維空間R(cat)∈S(d),即d維的輸入通道,每個(gè)輸入通道作為一個(gè)特征監(jiān)視器提取原始序列的路段特征信息,整個(gè)輸出序列R(cat)∈S(|n| ×d),變換映射如公式(1),n表示路徑中包含的路段數(shù).為了提高模型的有效性,模型考慮了基于路段和基于路徑的多任務(wù)學(xué)習(xí)機(jī)制,本文通過引入一個(gè)k×d的卷積核獲得局部路段loc,loc∈S(|n-k+1| ×d),如R(cat).為了加深卷積網(wǎng)絡(luò)的深度獲得更大的感受野,充分提取路徑中的特征信息,在卷積的過程中不斷增加網(wǎng)絡(luò)的通道數(shù),具體的操作可以表示為loci和R(conv).通過對(duì)路段序列進(jìn)行卷積運(yùn)算,識(shí)別擁堵狀態(tài)內(nèi)在的信息來學(xué)習(xí)不同擁堵狀態(tài)產(chǎn)生的影響,網(wǎng)絡(luò)的輸出out輸入到注意力機(jī)制中.則有

R(cat)=tanh(Wloc·[R.curr°R.arriv°R.lk_t°R.dist])

(1)

(2)

R(conv)=Maxpool(σcnn(Wconv1×loc+b1))

(3)

out=Maxpool(σcnn(Wconv2×R(conv)+b2))

(4)

其中:i表示路徑中i_th路段;k表示卷積核的大小,取值為3;Wloc、Wconv、Wconv1、Wconv2表示可學(xué)習(xí)的權(quán)重矩陣;°是合并運(yùn)算;σcnn是ReLU激活函數(shù);b、b1、b2是偏差.

1.2.2基于注意力機(jī)制的擁堵特征提取

為充分考慮交通擁堵所產(chǎn)生的通行時(shí)間異常,引入卷積塊的注意力模塊[14](convolutional block attention module,CBAM)機(jī)制,相比較SENet[15]網(wǎng)絡(luò)的通道注意力模塊,CBAM在通道和空間兩個(gè)維度上進(jìn)行卷積運(yùn)算,卷積運(yùn)算中每個(gè)通道都可以表征為特征監(jiān)視器.通道注意力機(jī)制模塊采用兩個(gè)自適應(yīng)的均值池化層和最大池化層同時(shí)對(duì)輸入要素進(jìn)行卷積操作,用來提取不同通道之間的關(guān)系,區(qū)分出不同通道的重要程度.為提取通道中更細(xì)致的特征信息采用最大池化的卷積運(yùn)算作為補(bǔ)充,重點(diǎn)識(shí)別交通擁堵嚴(yán)重的路段信息.作為通道注意力模塊的補(bǔ)充,空間注意力模塊是將上述操作的輸出作為輸入應(yīng)用均值池化和最大值池化,并將其連接輸入到標(biāo)準(zhǔn)的卷積運(yùn)算中獲取空間信息.池化操作可以使通道中重要的信息高亮,卷積可以捕獲哪些地方需要抑制或者強(qiáng)調(diào),具體操作為

Mc(out)=σ(MLP(Avgpool(out))+MLP(Maxpool(out)))

(5)

Ms(out)=σ(f(k*k)([Avgpool(Mc(out));Maxpool(Mc(out))]))

(6)

其中:σ為sigmoid激活函數(shù);Avgpool、Maxpool分別是均值池化和最大池化層;MLP是共享的多層感知機(jī);k為卷積操作中的卷積核大小,取值為3.

1.2.3時(shí)序模型時(shí)間預(yù)測(cè)

長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)解決了反向傳播過程中梯度消失和梯度爆炸問題,具有較強(qiáng)的預(yù)測(cè)和容錯(cuò)能力.采用多層LSTM預(yù)測(cè)行程時(shí)間,通過調(diào)節(jié)輸入門、遺忘門、輸出門的比例系數(shù)去選擇有多少信息被輸入、更新、輸出.不同的路徑所包含的路段數(shù)量是不相等的,在進(jìn)行路徑預(yù)測(cè)的過程中輸入的數(shù)據(jù)需要是一個(gè)定長(zhǎng)的特征矩陣,采用一個(gè)線性變換映射到一個(gè)固定序列.在進(jìn)行路徑序列的預(yù)測(cè)過程中我們關(guān)注到增加路徑的屬性信息對(duì)于模型精度的提高有所幫助,因此在實(shí)驗(yàn)過程中引入司機(jī)id、總時(shí)間、總距離、天氣狀況等因素作為特征因子同擁堵特征提取后的輸出out拼接后一同輸入到LSTM中.LSTM隱藏狀態(tài)的更新可以表示為{r1,r2,…,rn-k+1},具體操作為

ri=σrnn(Wx·outi+Wh·ri-1+Wa·attr)

(7)

其中:Wx、Wa、Wh為可學(xué)習(xí)權(quán)重;σrnn是非線性激活函數(shù);ri為i_th局部路段的隱藏層;attr表示屬性信息.

1.2.4多任務(wù)學(xué)習(xí)機(jī)制

多任務(wù)學(xué)習(xí)機(jī)制分別對(duì)局部路段和整條路徑預(yù)測(cè),為了提高預(yù)測(cè)的精度,在基于路徑的預(yù)測(cè)中采用殘差網(wǎng)絡(luò)加深網(wǎng)絡(luò)的層數(shù),每個(gè)殘差網(wǎng)絡(luò)結(jié)構(gòu)通過shorcuts將輸入特征矩陣與輸出特征矩陣相加.在實(shí)際出行預(yù)測(cè)中,不同的路段、路經(jīng)的紅綠燈個(gè)數(shù)對(duì)于軌跡花費(fèi)的時(shí)間影響是不同的,采用自注意力機(jī)制對(duì)LSTM隱藏層進(jìn)行權(quán)重的計(jì)算,重點(diǎn)預(yù)測(cè)通行時(shí)間較長(zhǎng)的局部路段,采用softmax對(duì)隱藏狀態(tài)ri賦予權(quán)重,動(dòng)態(tài)更新權(quán)重參數(shù)旨在預(yù)測(cè)精確的通行時(shí)間,具體見ri.局部路徑的預(yù)測(cè)采用多個(gè)全連接層進(jìn)行結(jié)果的輸出,LSTM通過對(duì)局部路段out1,out2,…,outi-k+1訓(xùn)練對(duì)應(yīng)的輸出r1,r2,…,ri-k+1進(jìn)行時(shí)間預(yù)測(cè),所預(yù)測(cè)的局部路段的通行時(shí)間表示為h1,h2,…,hi-k+1,這里的i表示第i個(gè)局部路段,r表示的是LSTM每個(gè)時(shí)間步的隱藏層.定義模型的損失函數(shù)為路徑和路段預(yù)測(cè)的加權(quán)組合,具體公式為

ri=risoftmax(ri)

(8)

(9)

(10)

(11)

在模型訓(xùn)練階段兩者都采用,在測(cè)試階段采用整條路徑的預(yù)測(cè)結(jié)果代替模型的預(yù)測(cè)結(jié)果.

2 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)環(huán)境為: Windows 10操作系統(tǒng),處理器為英特爾Core i7-10870H @ 2.20 GHz 八核,16 GB內(nèi)存與512 GB固態(tài)硬盤,使用Python語(yǔ)言,在PyTorch框架下進(jìn)行實(shí)驗(yàn).采用2020年8月17—30日的8點(diǎn)到10點(diǎn)的數(shù)據(jù)作為訓(xùn)練集,用2020年8月31日8:00—10:00的訂單數(shù)據(jù)進(jìn)行驗(yàn)證.

模型引入的司機(jī)id、天氣狀況等數(shù)據(jù)不是數(shù)值型的,需要對(duì)其進(jìn)行編碼.較傳統(tǒng)one-hot編碼而言,embedding的編碼方式對(duì)類別值特別大的屬性特征可以有效降低維度,提高模型計(jì)算的效率;并且embedding的編碼方式使數(shù)據(jù)間有了聯(lián)系,相似的詞語(yǔ)會(huì)有近似的語(yǔ)義信息,在編碼空間會(huì)更接近.因此,采用embedding編碼方式,將每個(gè)值通過一個(gè)參數(shù)矩陣映射到一個(gè)編碼空間.

2.1 模型消融實(shí)驗(yàn)

模型的卷積核、注意力機(jī)制、LSTM預(yù)測(cè)的設(shè)置對(duì)于預(yù)測(cè)精度有重要的影響.實(shí)驗(yàn)通過改變卷積核k=3,5,7,相比較k=3,模型的精度分別降低了0.88%和0.71%,分析原因是實(shí)驗(yàn)數(shù)據(jù)維度較小,卷積核為3 的時(shí)候能夠精確地學(xué)習(xí)到路段中的有效信息.采用包含和去掉自注意力機(jī)制模塊進(jìn)行對(duì)比實(shí)驗(yàn),模型的預(yù)測(cè)誤差分別為10.59%和12.72%,相比較前者精度降低了2.13%,證實(shí)自注意力機(jī)制對(duì)交通擁堵變化做出有效的關(guān)注.分別進(jìn)行了一層、二層、三層的LSTM堆疊實(shí)驗(yàn),結(jié)果表明層數(shù)的增加會(huì)增大內(nèi)存開銷和時(shí)間開銷,但在層數(shù)的堆疊過程中預(yù)測(cè)效果沒有提升,三層LSTM中結(jié)果相比較兩層預(yù)測(cè)精度降低了1.08%.最終本文采用卷積核為3,基于注意力機(jī)制的雙層LSTM模型作為最終的預(yù)測(cè)模型.

2.2 預(yù)測(cè)結(jié)果對(duì)比分析

2.2.1模型預(yù)測(cè)精度

實(shí)驗(yàn)采用平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MAPE)來驗(yàn)證模型精度.實(shí)驗(yàn)主要與隨機(jī)森

表2 不同模型的預(yù)測(cè)精度

林,LSTM網(wǎng)絡(luò)模型、BILSTM網(wǎng)絡(luò)(bi-directional long short-term memory)、DEEPTRAVEL作為對(duì)比,實(shí)驗(yàn)結(jié)果如表2所示.

從表2可以看出,隨機(jī)森林與LSTM的模型預(yù)測(cè)基本一樣,BILSTM模型的預(yù)測(cè)稍有提高,DEEPTRAVEL是基于改進(jìn)后雙向LSTM時(shí)間預(yù)測(cè),精度又有進(jìn)一步提升.模型實(shí)驗(yàn)表現(xiàn)明顯優(yōu)于上述模型,兩個(gè)衡量指標(biāo)均有明顯的提升.相對(duì)于DEEPTRAVEL而言,MAE和MAPE分別提升了8.23%和20.79%.

2.2.2不同距離下的模型預(yù)測(cè)

圖2 不同距離下的模型預(yù)測(cè)誤差Fig.2 Model prediction errors at different distances

隨著軌跡序列的增加,模型的預(yù)測(cè)難度也逐漸增大.為了進(jìn)一步驗(yàn)證模型的穩(wěn)定性,針對(duì)不同距離的軌跡信息進(jìn)行預(yù)測(cè),為確保實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,采用每組實(shí)驗(yàn)平均30次的預(yù)測(cè)結(jié)果作為最終的預(yù)測(cè)結(jié)果.根據(jù)滴滴平臺(tái)的計(jì)價(jià)規(guī)則,將距離劃分為0～3、>3～6、>6～10 km,以及大于10 km的數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果如圖2所示.

從圖2可以看到小于3 km的預(yù)測(cè)誤差普遍偏高,這是由動(dòng)態(tài)交通狀態(tài)的局限性造成的,短途的軌跡數(shù)據(jù)預(yù)測(cè)難度更大,受交通狀態(tài)的影響因素更嚴(yán)重,例如突發(fā)事件、交叉路口的延遲等等.相比較≤3、>3～6、>6～10 km的預(yù)測(cè)誤差有所降低,但是超過一定的距離,LSTM與BILSTM的表現(xiàn)并不好.提出的模型則在不同距離的時(shí)間預(yù)測(cè)均表現(xiàn)出穩(wěn)定精確的預(yù)測(cè)結(jié)果.圖3給出了隨機(jī)從測(cè)試集中抽取的50條軌跡數(shù)據(jù)真實(shí)值與預(yù)測(cè)值之間的誤差,按照行駛時(shí)間從長(zhǎng)到短進(jìn)行排列.通過計(jì)算得知模型對(duì)軌跡的預(yù)測(cè)精度可以達(dá)到90%左右,充分證明模型的有效性.但從圖中可以看出有些路徑預(yù)測(cè)誤差過大,通過查看數(shù)據(jù)集,發(fā)現(xiàn)這些軌跡數(shù)據(jù)有些是因?yàn)槁窂骄嚯x太長(zhǎng)途徑紅綠燈數(shù)量較多,增加了路徑的等待時(shí)間;有些路徑是因?yàn)榇嬖陂L(zhǎng)時(shí)間停留在某個(gè)路段的狀況,這種現(xiàn)象是很少見的.

圖3 隨機(jī)50條軌跡預(yù)測(cè)結(jié)果展示Fig.3 50 random trajectory prediction results are displayed

2.2.3不同特征輸入對(duì)比

表3 不同輸入特征的預(yù)測(cè)精度

模型對(duì)不同的特征輸入會(huì)有不同的表現(xiàn),通過實(shí)驗(yàn)分別來驗(yàn)證其作用.ETA_time表示包含各路段通行時(shí)間和交通擁堵變化的特征輸入;ETA_dist表示包含各路段的距離和交通擁堵變化的特征輸入;ETA_td表示去除交通擁堵變化的特征;ETA表示輸入完整的特征要素.實(shí)驗(yàn)結(jié)果如表3所示.從表3可以看出,所有的輸入特征都發(fā)揮了重要的作用,其中路段距離要比路段時(shí)間特征效果更好,保留兩個(gè)特征的ETA_td預(yù)測(cè)結(jié)果超過了ETA_time和ETA_dist,表明模型對(duì)于路徑的特征提取距離和時(shí)間是非常有效的,完整的特征輸入ETA輸出結(jié)果最優(yōu),證實(shí)在到達(dá)時(shí)間預(yù)測(cè)的過程中考慮各路段的距離和通行時(shí)間、交通擁堵狀態(tài)是非常必要的.

3 結(jié)語(yǔ)

集成多種機(jī)器學(xué)習(xí)結(jié)構(gòu)去預(yù)測(cè)網(wǎng)約車的行程時(shí)間,提出一種新的深度學(xué)習(xí)模型.模型采用基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò),降低因交通擁堵狀況對(duì)預(yù)測(cè)精度的影響,通過雙層LSTM、多任務(wù)學(xué)習(xí)機(jī)制從路段和路徑兩個(gè)角度來預(yù)測(cè)旅行時(shí)間,以滴滴出行平臺(tái)數(shù)據(jù)驗(yàn)證了模型的有效性.研究的主要結(jié)果如下.

1) 對(duì)比了其他機(jī)器學(xué)習(xí)的模型,在預(yù)測(cè)精度上有明顯的提升,相比較文獻(xiàn)[2]提出的DEEPTRAVEL,衡量指標(biāo)MAE和MAPE分別提升了8.23%和20.79%.

2) 模型的預(yù)測(cè)首先取決于數(shù)據(jù)的選擇,在實(shí)驗(yàn)中得出路段通行時(shí)間和距離對(duì)于通行時(shí)間預(yù)測(cè)影響很大,交通擁堵導(dǎo)致的通行時(shí)間異常也會(huì)導(dǎo)致預(yù)測(cè)的精度下降,模型在考慮交通擁堵變化的狀況下預(yù)測(cè)精度提高了2.03%.

3) 驗(yàn)證模型對(duì)不同距離范圍內(nèi)的路徑進(jìn)行預(yù)測(cè),模型在不同范圍內(nèi)的預(yù)測(cè)精度變化不大,證明模型可以適應(yīng)不同距離的預(yù)測(cè)模式.

接下來將進(jìn)一步采用圖卷積優(yōu)化模型實(shí)驗(yàn),以期探索出一個(gè)更有針對(duì)性的深度學(xué)習(xí)模型.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡