宋維凱, 張洪海, 萬俊強, 周錦倫
(南京航空航天大學民航學院, 南京 211106)
空中交通流量短期預測是空中交通流量管理的基礎性問題,通過準確地預測空中交通流量,有助于掌握空域發(fā)展態(tài)勢,為空中交通管理人員提供決策支持,緩解空中交通擁堵問題,提高空域運行效率。
目前針對空中交通流短期預測的方法主要有兩類,一類方法是通過交通流參數(shù)建立數(shù)學模型,描述交通流的變化情況,如非參數(shù)回歸等; 另一類方法基于歷史數(shù)據(jù),挖掘數(shù)據(jù)隱含的信息,如機器學習等[1]??罩薪煌骶哂蟹蔷€性特征[2],楊陽[3]證明了流量時間序列的混沌特性,提出基于回聲狀態(tài)網(wǎng)絡的流量短期預測方法;王飛等[4]應用集合經(jīng)驗模態(tài)分解方法將流量時序分為若干分量,對不同分量采用不同方法進行預測,通過對預測結果集成得到預測值;王飛等[5]利用交通流時間序列的周期性,采用分形插值的方法構建預測日的迭代函數(shù)系,實現(xiàn)對扇區(qū)流量的短期預測。這些模型方法利用交通流的非線性、自相似性等特征,取得了良好的預測效果,但沒有考慮交通流的時空相關性。
深度學習作為一種新的機器學習方法,近年來受到學者的廣泛關注,它能夠更加深入地挖掘數(shù)據(jù)關系,在處理非線性數(shù)據(jù)方面具有良好效果,被越來越多的應用在交通流預測中。在地面交通領域,李明明等[6]將長短期記憶(long short-term memory, LSTM)與反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡組合,建立短期交通流時間序列分析及預測模型;王康[7]基于深度學習考慮擁堵特征對城市交通擁堵進行預測;于德新等[8]提出一種基于門控循環(huán)單元與循環(huán)神經(jīng)網(wǎng)絡的短時流量預測模型,提升交叉口短時交通流預測精度;張涵[9]用卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)層提取時間特征,LSTM層預測流量,構建CNN與LSTM組合預測模型;陶璐[10]考慮路網(wǎng)空間拓撲結構及交通流時空特性,構建基于深度學習方法的城市路網(wǎng)短時交通流預測模型。
在空中交通領域,深度學習被越來越多的用于航路網(wǎng)絡交通流預測中,Lin等[11]通過分析相鄰區(qū)域的空間相關性和給定區(qū)域歷史交通的時間相關性,利用卷積LSTM模塊預測空中交通流量;Yang等[12]提出了一種具有三向時間特征的混合時空卷積長短時記憶網(wǎng)絡,用于預測航路擁堵指數(shù);李桂毅等[13]依據(jù)航段交通流相關性,建立基于多維標度法與LSTM的航路網(wǎng)絡短時交通流預測模型。
航路網(wǎng)絡中交通流復雜多變,相互關聯(lián),交通流的時變特性與路網(wǎng)的空間分布使得交通流有明顯的時空屬性[14]。交通流的時間相關性是指同一區(qū)域當前時段交通流與過去時段交通流存在相關性,空間相關性是指相同時段內(nèi)交通流空間分布的相關性。通過綜合利用交通流的時間與空間特性,更深入地挖掘交通流特征,提高流量預測結果的準確性。
現(xiàn)綜合利用交通流的時間與空間相關性進行扇區(qū)流量預測,首先對空中交通流的時空相關性進行分析,然后采用動態(tài)時間規(guī)整(dynamic time warping, DTW)算法計算扇區(qū)之間的空間相關性;其次,將空間相關性較高扇區(qū)的時間序列作為輸入特征,利用扇區(qū)的時間相關性構造時間序列長度不同的數(shù)據(jù)集;最后,將組合的時空數(shù)據(jù)采用LSTM模型訓練,實現(xiàn)扇區(qū)的流量預測。
交通流變化具有周期性、相似性與連貫性。航班計劃按時間維度可劃分為季度航班計劃、月度航班計劃等,航班的班期一般按周確定執(zhí)行的天數(shù),由于航班計劃具有周期性,因此對于同一個季度的相同周、天,交通流數(shù)據(jù)具有相似性。
如圖1所示為廣州區(qū)域AR04扇區(qū)2019年5月1日交通流數(shù)據(jù),一天當中交通流不斷變化,在白天航班量較多,流量隨時間波動性較強,在夜間航班量較少,流量變化趨于平緩。雖然空中交通流量受天氣、空域限制等多種因素的影響,但當前時段的交通流量與前幾個時段的交通流量有著必然聯(lián)系。由此可知交通流具有明顯時變性與連貫性。
通過交通流時間相關性的分析可知,利用交通流的周期性、相似性與連貫性,可以使用歷史的交通流數(shù)據(jù)對將來一段時間交通流量進行預測。
圖1 AR04扇區(qū)交通流日變化曲線Fig.1 Daily traffic flow variation curve of AR04 sector
空中交通網(wǎng)絡錯綜復雜,大量航路航段連接構成航路網(wǎng)絡,航路之間存在著相互聯(lián)系。由于扇區(qū)通過航路相互連接,因此扇區(qū)之間也存在相互關聯(lián),上游扇區(qū)的交通狀態(tài)會對下游扇區(qū)的交通狀態(tài)產(chǎn)生直接影響,本扇區(qū)交通狀態(tài)變化的影響也會傳播至其他扇區(qū)。
扇區(qū)交通流數(shù)據(jù)實際上是交通流變化的時間序列,研究扇區(qū)的空間相關性實質(zhì)上就是探索交通流數(shù)據(jù)變化的相關性。因此,可以利用扇區(qū)交通流時間序列計算扇區(qū)之間的相關性,將相關性較高的扇區(qū)納入預測模型,加入更多的空間信息,更能夠有效地預測短期空中交通流量。
DTW算法常用于處理時間序列相似性問題,通過在時間軸上的延伸或收縮實現(xiàn)兩個時間序列的相似性度量。相較于傳統(tǒng)的歐氏距離測度方法,DTW算法不要求兩個序列完全對齊,克服了時間扭曲問題。DTW的求解采用動態(tài)規(guī)劃思想,在兩個時間序列構成的鄰接矩陣中找到一條規(guī)整路徑,使得規(guī)整路徑的總代價最小,所得路徑距離越小,時序相似性越高。
對于兩個長度分別為N的時間序列P=(p1,p2,…,pN),Q=(q1,q2,…,qN),定義一條規(guī)整路徑W=(w1,w2,…,wL),其中W的第i個元素wi=(ni,mi),其中1≤ni≤N,1≤mi≤N,1≤i≤L。
DTW所選擇的路徑需要滿足以下條件。
(1)邊界條件。w1=(1,1),wL=(N,N),即將兩序列的起始數(shù)據(jù)與最后一個數(shù)據(jù)分別對齊。
(2)單調(diào)性。單調(diào)性是保證路徑上的點隨著時間的推移是單調(diào)變化的,W上相鄰的兩點wi=(ni,mi)與wi+1=(ni+1,mi+1)應滿足ni+1-ni≥0且mi+1-mi≥0。
(3)連續(xù)性。規(guī)整路徑W中點wi=(ni,mi)與wi+1=(ni+1,mi+1)應滿足ni+1-ni≤1且mi+1-mi≤1,以保證當前點只能與相鄰的點進行匹配。
滿足以上條件的規(guī)整路徑有多條,DTW的目標是求序列P與Q之間最小的規(guī)整路徑總代價,表達式為
(1)
式(1)中:d(pni,qmi)=|pni-qmi|,表示點pni與點qmi之間的規(guī)整路徑代價;DTW(P,Q)為序列P與Q之間的最小規(guī)整路徑總代價。
采用動態(tài)規(guī)劃思想求解最優(yōu)規(guī)整路徑,定義累加距離dDTW,從點(0, 0)開始對序列P與Q進行匹配,每到下一個點都會對之前的點距離進行累積,在最后一個點(pN,qN)求得的累加距離即為最優(yōu)規(guī)整路徑的代價總和,可用于衡量時間序列P與Q之間的相似程度。累加距離計算過程表達式為
dDTW(pi,qj)=d(pi,qj)+min{dDTW(pi-1,qj),dDTW(pi,qj-1),dDTW(pi-1,qj-1)}
(2)
式(2)中:dDTW(pi,qj)為從起點到點(pi,qj)的規(guī)整路徑距離。
因此,通過DTW算法研究扇區(qū)時間序列的相似性以衡量扇區(qū)的空間相關性,若兩扇區(qū)交通流時間序列的相似性越高,則扇區(qū)的空間相關性越高。
長短期記憶神經(jīng)網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)的進一步改進,LSTM通過引入記憶塊單元,解決了RNN存在的梯度消失或梯度爆炸問題,使循環(huán)神經(jīng)網(wǎng)絡能夠有效地利用長距離的時序信息,在處理時間序列問題方面具有較好的效果。因此,使用LSTM模型能夠較好地利用交通流的時間相關性。
LSTM的基本結構主要由遺忘門、輸入門與輸出門組成[15-16],如圖2所示。
圖2 LSTM單元結構Fig.2 Structure of LSTM cell
遺忘門決定上一階段有多少信息可以保留。輸出值范圍為[0, 1],越接近1則上一階段保留的信息越多,越接近0則保留的越少,其表達式為
ft=σ(Wf[yt-1,xt]+bf)
(3)
式(3)中:σ為sigmoid激活函數(shù);Wf為遺忘門權值向量;yt-1為t-1時刻輸出;xt為t時刻輸入;bf為遺忘門偏置;ft為t時刻遺忘激活。
輸入門決定將當前多少輸入信息保存在記憶單元,并對細胞狀態(tài)進行更新,其表達式為
(4)
(5)
輸出門決定當前時刻的輸入,其表達式為
Ot=σ(Wο[yt-1,xt]+bo)
(6)
yt=OttanhCt
(7)
式中:Wo為輸出門權值向量;bo為輸出門偏置項;Ot為輸出門激活;yt為t時刻輸出。
LSTM模型構建包括如下步驟:首先,對原始數(shù)據(jù)預處理并劃分數(shù)據(jù)集;其次,確定訓練目標,構建LSTM模型并確定LSTM訓練模型的參數(shù);最后,使用預測集數(shù)據(jù)檢驗模型。LSTM模型存在一個輸入對應一個輸出、多個輸入對應一個輸出等多種應用方式。采用多個輸入對應一個輸出的方式,將預測時間段前的n個時間段流量值作為輸入,預測時間段的流量值作為輸出,因此需將輸入數(shù)據(jù)處理為n維數(shù)據(jù)。為加快訓練的收斂,還需將原始數(shù)據(jù)進行歸一化處理。
構建LSTM模型需要設置的參數(shù)有輸入序列長度、輸入層維數(shù)、隱藏層維數(shù)、輸出變量維數(shù)等。輸入序列的長度決定預測使用的時間長度,輸入序列的長度越長,則表示輸入數(shù)據(jù)包含越多的歷史信息。輸入層維數(shù)決定輸入的特征數(shù),在本文模型中,若輸入層維數(shù)為1表示僅使用本扇區(qū)歷史數(shù)據(jù)預測,維數(shù)大于1表示使用多個扇區(qū)歷史數(shù)據(jù)預測。隱藏層維數(shù)表示隱藏層的神經(jīng)單元個數(shù),本文模型的隱藏層由單層LSTM與Dense層構成。本文模型預測值為未來一個時間段的交通流量值,因此輸出層維數(shù)為1。
為了衡量預測結果的性能,采用平均絕對誤差(mean absolute error, MAE)、均方根誤差(root mean squared error, RMSE)作為評價依據(jù)。
(8)
(9)
步驟1選擇扇區(qū)作為流量短期預測的對象,確定為目標扇區(qū)。
步驟2由扇區(qū)流量的時間序列,計算各鄰近扇區(qū)與目標扇區(qū)的DTW距離,按照數(shù)值由小到大進行排列,表示空間相關性的依次減弱。
步驟3選取與目標扇區(qū)空間相關性最強的前K個扇區(qū)與目標扇區(qū)構造訓練數(shù)據(jù)集,將數(shù)據(jù)集分別劃分為訓練集、驗證集與測試集。
步驟4構建LSTM模型,確定LSTM模型訓練參數(shù),包括輸入序列長度、迭代次數(shù)等。
步驟5使用預測集對訓練后模型進行預測,對預測結果進行誤差分析。
步驟6選取不同的輸入序列長度與扇區(qū)數(shù)據(jù)進行組合,重復步驟4與步驟5。
步驟7選取最優(yōu)參數(shù)組合結果作為模型輸出。
為驗證模型的可行性,算例選取2019年5月1—28日廣州區(qū)域ZGGGAR01-ZGGGAR06共6個扇區(qū)的自動相關監(jiān)視(automatic dependent surveillance-broadcast, ADS-B)數(shù)據(jù)進行實驗,原始數(shù)據(jù)采用協(xié)調(diào)世界時(coordinated universal time,UTC)時間。實驗在Python3.8環(huán)境中使用基于TensorFlow的Keras深度學習網(wǎng)絡框架搭建訓練模型。以ZGGGAR04扇區(qū)為目標扇區(qū),利用建立的模型對該扇區(qū)流量進行預測。實驗選擇前24 d數(shù)據(jù)作為訓練集,25—27日數(shù)據(jù)為驗證集,28日數(shù)據(jù)作為測試集,設置模型的最小批尺寸為50,最大訓練輪數(shù)為30。
由獲取到的各扇區(qū)地理邊界信息,得到每個扇區(qū)的空域范圍,6個扇區(qū)空域結構如圖3所示。利用邊界信息對ADS-B原始數(shù)據(jù)進行篩選,得到每個扇區(qū)內(nèi)的航跡點數(shù)據(jù),以15 min尺度統(tǒng)計航班量,得到各個扇區(qū)每日流量的時間序列。圖4為5月1日ZGGGAR01-ZGGGAR06扇區(qū)流量變化曲線。
圖3 扇區(qū)空域結構圖Fig.3 Diagram of sector airspace structure
圖4 5月1日各扇區(qū)流量曲線Fig.4 Sector flow curve on May 1
以ZGGGAR04為目標扇區(qū),根據(jù)2.1節(jié)所述DTW計算方法,計算DTW距離衡量目標扇區(qū)與其他扇區(qū)之間的空間相關性,所得DTW距離越小,則與目標扇區(qū)相似度越高,反之,相似性越低。DTW距離計算結果如圖5所示。
圖5 DTW距離計算結果Fig.5 DTW distance calculation result
如圖5所示,ZGGGAR05扇區(qū)與ZGGGAR04扇區(qū)最為相似,從空域結構看,兩扇區(qū)相鄰,說明相鄰扇區(qū)的空間相關性較大,符合實際情況;其次是ZGGGAR01扇區(qū),這是由于ZGGGAR01雖不與ZGGGAR04直接相鄰,但存在連接兩個扇區(qū)的航路,因此具有相關性。
以下一個15 min的扇區(qū)流量作為預測目標,選取不同時間與空間參數(shù)的組合進行預測,其中空間參數(shù)是指與目標扇區(qū)具有空間相關性的扇區(qū)構成的扇區(qū)組合,時間參數(shù)是指預測模型輸入的時間序列長度。不同時空參數(shù)組合的評價結果,如表1所示。
表1 不同時空參數(shù)下預測性能評價結果Table 1 Prediction performance evaluation results under different spatio-temporal parameters
在設置的模型參數(shù)下,每輪模型訓練平均耗時約15 s,滿足流量短期預測對時間效率的要求。對不同時空參數(shù)組合的預測結果分析可知,在同一扇區(qū)組合中,隨著輸入時間步長的增加,在一定范圍內(nèi),模型預測結果的精度在提高,但輸入的時間步長過長,模型的預測精度會有所下降,這是由于較長的時間序列雖然包含較多的歷史信息,但也會加入無用數(shù)據(jù),降低模型的預測精度,同時也增加了模型的訓練時長;在時間步長一定時,隨著選取相關扇區(qū)數(shù)量的不同,模型的精度也出現(xiàn)波動,當選取相關扇區(qū)數(shù)量較少時,模型中包含的空間信息較少,模型預測結果欠佳,當選取的扇區(qū)數(shù)量過多時,輸入數(shù)據(jù)包含了無關的空間信息,干擾模型的預測效果。最終選取時間步長為6的第5組扇區(qū)組合作為模型的最優(yōu)時空參數(shù)組合,此時預測結果的MAE為1.278,RMSE為1.780。
為進一步研究本文模型的預測性能,分別采用LSTM模型、時空相關性SVR模型進行多次實驗,選取模型的最優(yōu)結果作為輸出,各模型的預測結果如圖6所示。
如表2所示,本文模型性能指標均優(yōu)于LSTM模型與時空相關SVR模型,相比LSTM模型,MAE降低24.5%,RMSE降低31.4%;相比時空相關SVR模型,MAE降低36.4%,RMSE降低30.6%。本文模型與LSTM模型均為深度學習模型,相比于時空相關SVR模型,預測精度更高,說明深度學習能更加深入地學習數(shù)據(jù)關系;LSTM模型預測精度低于本文模型,這是由于LSTM模型未考慮空間相關性,說明交通流空間信息的加入有助于提高預測結果準確性。
圖6 不同模型流量預測結果Fig.6 Flow prediction results of different models
表2 不同模型性能評價結果Table 2 Performance evaluation results of different models
(1)提出的空中交通流量短期預測模型利用了空中交通流的時空相關性,采用深度學習方法更加深入地挖掘數(shù)據(jù)關系,提升了流量預測結果的準確性。
(2)模型的時空參數(shù)對預測結果有著重要影響。在一定范圍內(nèi),隨著時間步長的增大,模型的預測精度逐漸增大,但時間步長過長會增加無關信息,導致預測精度下降;對于空間參數(shù),較少的相關扇區(qū)會由于信息過少導致預測精度不高,過多的扇區(qū)會加入無關空間信息干擾預測結果。
(3)所提出模型的預測結果相比LSTM模型、考慮時空相關SVR模型的準確性有所提高。LSTM模型僅利用時間相關性進行流量預測,但未考慮空間相關性,因此預測結果精度低于本文模型;時空相關性SVR模型,雖綜合考慮了時空相關性,但相比于深度學習方法,SVR方法挖掘數(shù)據(jù)關系不夠充分。
(4)在后續(xù)研究中可嘗試對模型進一步改進,尋找最優(yōu)的參數(shù)組合,提高模型的預測精度。此外,本文只是在扇區(qū)層面進行流量預測,對于航路網(wǎng)絡中航段之間的時空相關性流量預測還需要進一步研究。