国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于注意力機(jī)制優(yōu)化EDM機(jī)場客流量預(yù)測①

2022-01-06 06:05鄧穎紅
關(guān)鍵詞:客流量解碼編碼

李 航,鄧穎紅

(中國民航大學(xué) 經(jīng)濟(jì)與管理學(xué)院,天津 300300)

近年來,我國經(jīng)濟(jì)的高速增長促使著人們追求更高的生活品質(zhì),人們的航空出行需求迅速增長,給機(jī)場帶來了不小的壓力.機(jī)場的旅客吞吐量是民用機(jī)場的主要生產(chǎn)指標(biāo),旅客流量是機(jī)場對資源進(jìn)行高效配置的依據(jù),是機(jī)場進(jìn)行決策的基本前提.因此,客流量的預(yù)測對機(jī)場的管理和建設(shè)有很大的參考意義.

傳統(tǒng)的機(jī)場客流量預(yù)測多為基于線性假設(shè)的模型.如陳玉寶等[1]以首都機(jī)場為例采用組合預(yù)測方法對旅客吞吐量進(jìn)行預(yù)測.俞佳立等[2]運(yùn)用指數(shù)平滑法與灰色預(yù)測法兩者的組合預(yù)測模型對管道貨運(yùn)量進(jìn)行預(yù)測分析.劉夏等[3]基于三亞機(jī)場2008-2016年的月度客流量數(shù)據(jù),運(yùn)用ARMA模型、灰色預(yù)測模型、ARMA改進(jìn)回歸模型對客流預(yù)測及數(shù)據(jù)仿真.由于線性模型對機(jī)場流量預(yù)測的局限性(交通流量因自由流、阻塞、故障和恢復(fù)情況等頻繁變化而具有非線性特征),上述模型的性能和應(yīng)用都受到限制.近年來學(xué)者們開發(fā)出各種機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的模型應(yīng)用于交通流預(yù)測.鐘穎等[4]把極端樣度上升(XGBoost)模型用于路段短時(shí)交通流的預(yù)測.周燎等[5]用期望最大化(EM)算法從交通流數(shù)據(jù)中學(xué)習(xí)出貝葉斯動(dòng)態(tài)線性模型(DLM)的關(guān)鍵參數(shù),對下一時(shí)刻的車流量進(jìn)行預(yù)測.朱征宇等[6]建立了支持向量機(jī)與卡爾曼濾波組合模型,并將該模型應(yīng)用于短時(shí)交通流量預(yù)測.衡紅軍等[7]用動(dòng)態(tài)回歸ARIMAX模型,對航站樓內(nèi)短時(shí)段的值機(jī)旅客人數(shù)進(jìn)行預(yù)測.Ma等[8]將遞歸神經(jīng)用于交通速度預(yù)測的網(wǎng)絡(luò)(RNN).Polson和Sokolov[9]提出了一種深度學(xué)習(xí)架構(gòu)來捕捉非線性時(shí)空效應(yīng).Huang等[10]提出了一個(gè)由深度信任網(wǎng)絡(luò)(DBN)和一個(gè)多任務(wù)回歸層組成的預(yù)測短期交通流的體系結(jié)構(gòu).

本文提出的是一種基于注意機(jī)制的編碼-解碼結(jié)構(gòu)時(shí)序預(yù)測模型(Temporal Attention-based Encoder-Decoder model,TAED),把基于注意機(jī)制的融合雙向長短時(shí)記憶網(wǎng)絡(luò)編碼-解碼模型應(yīng)用到機(jī)場客流量預(yù)測.由于深度神經(jīng)網(wǎng)絡(luò)在長時(shí)間尺度的預(yù)測中存在著淹沒前期輸入信號的缺點(diǎn),因此,在設(shè)計(jì)深度學(xué)習(xí)預(yù)測方法時(shí)引入注意力機(jī)制,使模型能夠根據(jù)不同時(shí)期輸入信號對于輸出結(jié)果的貢獻(xiàn)強(qiáng)度分配不同的關(guān)注度,從而使模型具備處理大時(shí)間尺度序列的能力.同時(shí)對于標(biāo)準(zhǔn)的編碼解碼模型對時(shí)間序列數(shù)據(jù)的特征提取能力弱的問題,引入了Bi-LSTM,使模型能夠?qū)?shù)據(jù)特征進(jìn)行充分學(xué)習(xí),捕捉不同時(shí)間段的隱含特征.此外,時(shí)間序列數(shù)據(jù)的多步前向預(yù)測比單步預(yù)測困難,而序列-序列學(xué)習(xí)結(jié)構(gòu)可以很好地解決這一問題.由于上述優(yōu)勢,TAED模型相對于經(jīng)典LSTM模型能夠更好的捕捉時(shí)間序列中的隱含特征,并且對于前期輸入信號有更好的記憶力,因而具有更好的預(yù)測效果.

1 基于時(shí)間注意機(jī)制的編碼解碼模型

1.1 本文框架

本文提出的基于注意機(jī)制的多變量時(shí)間序列多步預(yù)測框架(如圖1).該框架由Bi-LSTM、LSTM和基于時(shí)間注意機(jī)制的上下文層3部分組成.Bi-LSTM用于學(xué)習(xí)任意長度的輸入數(shù)據(jù)的隱藏表示,從時(shí)間序列中提取出深層的時(shí)間依賴特征,然后利用時(shí)間注意層構(gòu)造潛在的空間變量(時(shí)間注意上下文向量).LSTM解碼器根據(jù)生成的潛在空間變量,對未來的時(shí)間序列值進(jìn)行預(yù)測.圖1給出了該框架的圖解,該框架可以端到端對時(shí)間序列數(shù)據(jù)建模.

圖1 TAED模型

1.2 編碼解碼結(jié)構(gòu)

LSTM是一種處理具有時(shí)間序列特征數(shù)據(jù)的長期學(xué)習(xí)模型[11].典型的LSTM包括5個(gè)部分:it、ft、st、ot、ht,分別作為輸入門、遺忘門、存儲單元、輸出門以及LSTM單元的隱藏狀態(tài).一個(gè)典型的LSTM單元塊包括3個(gè)門和1個(gè)存儲單元,基于這些部分使得其具有忘記或記憶信息的能力(決定信息是否傳輸?shù)较乱粋€(gè)單元格).

式中,對于輸入的時(shí)間序列值在t時(shí)間步時(shí),LSTM單元計(jì)算一個(gè)隱藏狀態(tài)ht和一個(gè)內(nèi)存狀態(tài)St,σ是激活函數(shù),⊙是元素的乘法,這是輸入時(shí)間序列值的編碼.

但傳統(tǒng)的LSTM有一個(gè)缺點(diǎn),它只能學(xué)習(xí)時(shí)間序列數(shù)據(jù)的前一個(gè)上下文,不能學(xué)習(xí)同一序列數(shù)據(jù)的前向上下文.所以我們用Bi-LSTM作為編碼器,可以同時(shí)處理兩個(gè)不同方向的數(shù)據(jù)互連的隱藏層:單向進(jìn)程使用從t=1到T的前向隱藏層; 另一個(gè)方向進(jìn)程使用從t=T到1的后向隱藏層.這個(gè)經(jīng)典的Bi-LSTM計(jì)算過程如下:

1.3 時(shí)間注意力機(jī)制

其中,式(21)表示解碼器層的隱藏狀態(tài)與編碼器層的隱藏狀態(tài)之間的軟對齊計(jì)算.式(22)表示與輸入時(shí)間序列幀在時(shí)間步上的重要性相對應(yīng)的注意權(quán)重,用于預(yù)測在時(shí)間步上的輸出值,該方法使用Softmax函數(shù)對長度向量進(jìn)行歸一化,作為輸入時(shí)間序列上的注意掩碼.式(23)表示為編碼層每一個(gè)時(shí)間步分配相應(yīng)的權(quán)重.式(24)表示模型解碼后的輸出值.模型通過式(25)進(jìn)行訓(xùn)練.

2 實(shí)驗(yàn)仿真

2.1 數(shù)據(jù)集構(gòu)造

數(shù)據(jù)源于中國民用航空華東地區(qū)管理局官網(wǎng)提供的真實(shí)生產(chǎn)運(yùn)行數(shù)據(jù),選取上海虹橋機(jī)場2013-2020年每月客流量數(shù)據(jù)應(yīng)用本文算法進(jìn)行分析,對其進(jìn)行可視化,如圖2.

圖2 2013-2020年上海虹橋機(jī)場月客流量數(shù)據(jù)

一般來說,機(jī)場客流量的總體趨勢受到地區(qū)經(jīng)濟(jì)發(fā)展和結(jié)構(gòu)、人口因素及其構(gòu)成、地面交通情況以及機(jī)場的布局和功能定位等多種因素的影響,此外更小時(shí)間維度上又受季節(jié)、天氣、大型活動(dòng)(如節(jié)假日)等的影響.觀察圖2可以發(fā)現(xiàn),虹橋機(jī)場客流量總體上隨著年份呈上升趨勢,且每月的客流量隨著季節(jié)的不同呈現(xiàn)出一定的周期性趨勢,在冬季客流量偏低.

圖3 樣本構(gòu)造示意圖

將所構(gòu)造的樣本劃分為訓(xùn)練集與測試集,樣本詳細(xì)描述見表1.

表1 數(shù)據(jù)集

2.2 實(shí)驗(yàn)與結(jié)果分析

為對模型進(jìn)行評價(jià),實(shí)驗(yàn)采用平均絕對百分比誤差(MAPE)與均方根誤差作為指標(biāo)(RMSE),其具體計(jì)算公式如下:

式中,Pt為模型的預(yù)測值、Rt為真實(shí)值.易知,上述兩種指標(biāo)值越小則說明模型性能越好,即預(yù)測值越接近真實(shí)值.

上述模型在3個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),測試結(jié)果如圖4(a)-圖4(c),誤差指標(biāo)見表2.

通過對圖4(a)-圖4(c)對比可知:由于數(shù)據(jù)集S1進(jìn)行的是單步預(yù)測,因此模型均能夠?qū)C(jī)場客流量進(jìn)行準(zhǔn)確預(yù)測,雖然RNN相對于LSTM與TAED誤差較大,但預(yù)測值與真實(shí)值基本保持在可容忍范圍內(nèi).在數(shù)據(jù)集S2中,對于時(shí)間步的預(yù)測增加到3步,可以看出相對于數(shù)據(jù)集S1,3種模型的性能均有所下降,其中,TAED模型性能下降程度最小; 在數(shù)據(jù)集S3中,將時(shí)間步的預(yù)測增加到5步,RNN和LSTM一定程度上偏離真實(shí)值,而TAED模型仍能夠保持較好的性能,這是由于該模型能夠通過調(diào)整不同時(shí)刻輸入值對輸出值的貢獻(xiàn)來進(jìn)行預(yù)測.同時(shí),根據(jù)表2對于殘差的計(jì)算結(jié)果可以看出,TAED模型在3個(gè)數(shù)據(jù)集上的表現(xiàn)明顯優(yōu)于RNN和LSTM,且多步預(yù)測中效果更為明顯,如在數(shù)據(jù)集S1和數(shù)據(jù)集S3上,TAED模型的平均標(biāo)準(zhǔn)誤差分別比LSTM低了57.9%和78.4%.

表2 不同方法的殘差計(jì)算結(jié)果

圖4 數(shù)據(jù)集S1-S3在不同方法下的測試結(jié)果

3 結(jié)論

機(jī)場客流量預(yù)測對于機(jī)場調(diào)度安排,制定運(yùn)行計(jì)劃具有重要意義.由于機(jī)場客流量數(shù)據(jù)具有強(qiáng)時(shí)序特征,而傳統(tǒng)方法如LSTM、RNN難以有效提取數(shù)據(jù)的時(shí)間依賴特征.本文提出一種基于注意力機(jī)制的編碼解碼模型,并對虹橋機(jī)場客流量數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明:通過對編碼解碼模型引入注意力機(jī)制,使得模型能夠?qū)v史數(shù)據(jù)特征進(jìn)行充分提取,從而在單步預(yù)測與多步預(yù)測上均表現(xiàn)出較高的精度.虹橋機(jī)場客流量主要受到地區(qū)經(jīng)濟(jì)發(fā)展等各類因素的綜合影響,不同類型的機(jī)場客流量影響因素略有差異,主要包括貿(mào)易、人口、資源、環(huán)境等,但不同類型機(jī)場的歷史數(shù)據(jù)特征是可以學(xué)習(xí)的,因此本文方法對于不同類型的機(jī)場客流量預(yù)測具有普適性.同時(shí),本文未考慮影響機(jī)場客流量的相關(guān)因素,今后的工作中,可以通過引入準(zhǔn)點(diǎn)率等相關(guān)因素,從更多維度對客流量進(jìn)行預(yù)測.

猜你喜歡
客流量解碼編碼
HEVC對偶編碼單元?jiǎng)澐謨?yōu)化算法
住院病案首頁ICD編碼質(zhì)量在DRG付費(fèi)中的應(yīng)用
解碼 四十五度仰望天空
文化解碼
文化 解碼
地鐵開,玩起來
文明 解碼
基于灰色預(yù)測理論在交通樞紐客流量的實(shí)際應(yīng)用
基于灰色預(yù)測理論在交通樞紐客流量的實(shí)際應(yīng)用
論紀(jì)錄片影像中的組合編碼運(yùn)用