在過去的幾十年中,通過全球定位系統(tǒng)(GPS)和來自相機、直升機或無人機的高分辨率數(shù)字圖像等技術(shù)的進步,已經(jīng)收集了詳細的車輛軌跡數(shù)據(jù)[1]。隨著這些數(shù)據(jù)的積累,車輛軌跡預(yù)測在道路交通上就引發(fā)了很大的關(guān)注[2]。
深度學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域中一個新的研究方向,隨著深度學(xué)習(xí)在人工智能領(lǐng)域取得的成功,訓(xùn)練深層網(wǎng)絡(luò)成為了一個重要發(fā)展方向。Lei Lin基于注意力的長短時記憶模型,用于混合流交通環(huán)境中的縱向軌跡預(yù)測[3];孟憲偉利用連續(xù)隱馬爾可夫模型進行意圖檢測,再建立LSTMAdaBoost模型進行換道軌跡預(yù)測[4]。
雖然以上幾種方法在精度上已經(jīng)較傳統(tǒng)模型提升了精度,但是超參數(shù)的確定都是根據(jù)人為判斷。
因此,根據(jù)超參數(shù)優(yōu)化算法與深度學(xué)習(xí)模型所結(jié)合,提出一種基于貝葉斯優(yōu)化LSTM模型的車輛軌跡預(yù)測方法。
LSTM的控制門有遺忘門,更新門和輸出門三種,其中遺忘門控制輸入和上一個隱藏層輸出被遺忘的程度大小,更新門決定輸入中新的有價值的信息被加入,輸出門控制輸出和當(dāng)前計算的狀態(tài)更新到記憶單元的程度,示意圖如圖1。
圖1 LSTM流程圖
LSTM數(shù)學(xué)表達式:
式中,σ是sigmoid函數(shù),Wf表示遺忘門的權(quán)重矩陣,bf表示遺忘門的偏置項,[ht-1,xt]表示將兩個向量組合成一個更長的向量。
輸入門根據(jù)上一次的輸出和這一次的輸入在計算當(dāng)前的單元狀態(tài)c?t:
Wi和bi表示輸入門的權(quán)重和偏置,Wc和bc表示構(gòu)造候選向量時的權(quán)重和偏置,最后由輸出門決定輸出值,將舊狀態(tài)與ft相乘,丟棄確定需要丟棄的信息。
最后,運行sigmoid函數(shù)來確定細胞狀態(tài)的輸出值:
Bayes優(yōu)化算法模型具體流程如圖2所示。
圖2 Bayes優(yōu)化模型
1.2.1 高斯過程
高斯過程是概率論中的一種隨機過程,在機器學(xué)習(xí)中用途廣泛,高斯過程主要包括協(xié)方差函數(shù)和均值函數(shù):
1.2.2 采集函數(shù)
采集函數(shù)按照最大化采集函數(shù)的方式,選取下一次嘗試的(fxma)x,表達式為:
式中,(fx)為目標(biāo)函數(shù)值,φ(*)為分布函數(shù),μ(x)為均值、σ(x)為方差,σ則代表超參數(shù),一般將σ=0使得值收斂于(fxma)x,避免出現(xiàn)局部最優(yōu)。本文利用貝葉斯優(yōu)化LSTM模型參數(shù)步驟為:①設(shè)定優(yōu)化目標(biāo)為均方根誤差并給定參數(shù)范圍;②Bayes算法優(yōu)化隱藏層數(shù)和初始學(xué)習(xí)率;③返回結(jié)果最好的RMSE的超參數(shù)作為最終參數(shù)。
該模型在運用LSTM進行基預(yù)測的基礎(chǔ)上,使用貝葉斯算法得到模型最優(yōu)參數(shù),提高預(yù)測的準(zhǔn)確度,主要優(yōu)化的參數(shù)為InitialLeranRate以及NumHiddenUnits,超參數(shù)約束條件如表1所示。
表1 參數(shù)約束范圍
運用貝葉斯優(yōu)化LSTM網(wǎng)絡(luò)超參數(shù),進而應(yīng)用LSTM網(wǎng)絡(luò)對車輛行駛軌跡進行預(yù)測。
模型準(zhǔn)確度評價指標(biāo)使用均方根誤差(RMSE)對軌跡預(yù)測精度進行評價[5]。RMSE的表達式如下所示:
其中,n是樣本數(shù)量,yi和yˉi是第i個樣本的網(wǎng)絡(luò)預(yù)測值和初始值。
本文計算最優(yōu)超參數(shù)的所有驗證結(jié)果的RMSE值。
3.2.1 NGSIM數(shù)據(jù)集簡介
本文使用NGSIM數(shù)據(jù)集的I-80路段對軌跡預(yù)測模型進行訓(xùn)練和測試。
3.2.2 車輛篩選及實驗過程
為了驗證模型有效性,從數(shù)據(jù)集中提取特殊行駛軌跡車輛,輸入?yún)?shù)為車輛橫縱坐標(biāo)、速度、加速度,此過程通過Python完成NGSIM篩選,按9:1的比例拆分為訓(xùn)練集和驗證集,創(chuàng)建LSTM回歸網(wǎng)絡(luò),指定LSTM層的輸入、輸出、隱含單元個數(shù),指定訓(xùn)練選項并訓(xùn)練LSTM網(wǎng)絡(luò),利用驗證集的軌跡驗證所訓(xùn)練網(wǎng)絡(luò)的有效RMSE。
LSTM網(wǎng)絡(luò)結(jié)果如表2所示。
表2 LSTM網(wǎng)絡(luò)參數(shù)表
3.4.1 模型訓(xùn)練結(jié)果
模型超參數(shù)經(jīng)過迭代擇優(yōu),找到了LSTM超參數(shù)最優(yōu)解,當(dāng)初始學(xué)習(xí)率為0,01057,隱藏層數(shù)為456時最小,RMSE_Y為0.9694,RMSE_X為1.0673。模型訓(xùn)練損失變化結(jié)果如圖3。
圖3 優(yōu)化超參數(shù)LSTM訓(xùn)練損失變化
3.4.2 數(shù)據(jù)集驗證
對NGSIM數(shù)據(jù)集預(yù)處理后,截取其中S型行駛車輛片段進行局部軌跡預(yù)測,在進行軌跡預(yù)測時LSTM網(wǎng)絡(luò)的起始輸入量應(yīng)該具有一定的長度,輸入量長度過短會使得輸入量特征不明顯,影響預(yù)測效果;預(yù)測軌跡時域過長會導(dǎo)致軌跡末期出現(xiàn)精度下降的情況,所以要使用滾動預(yù)測,即不斷地重復(fù)更新LSTM模型。圖4和圖5分別為該場景下軌跡預(yù)測橫向和縱向誤差以及實際行車軌跡與預(yù)測軌跡對比。
圖4 橫縱向誤差
圖5 實際軌跡與預(yù)測軌跡
為了進一步說明預(yù)測方法的可行性和有效性,選取傳統(tǒng)回歸預(yù)測模型SVM和AdaBoost分別不考慮變道意圖影響的LSTM軌跡預(yù)測模型,使用統(tǒng)一數(shù)據(jù)進行預(yù)測,以評測參數(shù)優(yōu)化后的LSTM預(yù)測效果。其余三種方法均使用RMSE評價指標(biāo),表3所示為具體對比結(jié)果。
表3 模型RMSE對比分析表
由表3可見相比表現(xiàn)最好的改進模型Bi-LSTM精確率提升了13.4%。
通過貝葉斯優(yōu)化對LSTM模型的隱藏層數(shù)和初始學(xué)習(xí)率進行優(yōu)化,將此組超參數(shù)在驗證集上的RMSE作為目標(biāo)函數(shù),其他子集進行訓(xùn)練,最后計算訓(xùn)練函數(shù)的RMSE平均值并返回結(jié)果。使用Pandas框架提取NGSIM數(shù)據(jù)集中S型行駛車輛數(shù)據(jù),以0.1s為單次幀的連續(xù)幀數(shù)車輛數(shù)據(jù),最終輸出預(yù)測軌跡與測試集對比。通過驗證與其他算法進行對比,證明貝葉斯超參數(shù)優(yōu)化算法具有更好的表現(xiàn)。