国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MA-BiLSTM的多時間窗航班過站時間估計方法

2022-07-17 08:10:04曹衛(wèi)東
陜西科技大學學報 2022年4期
關(guān)鍵詞:航班機場長度

曹衛(wèi)東, 梁 陳

(中國民航大學 計算機科學與技術(shù)學院, 天津 300300)

0 引言

航空公司為提高飛機使用率,通常采用由單架飛機一天內(nèi)連續(xù)執(zhí)行多個航班任務(wù)的航班鏈運行方式,某架飛機若在執(zhí)行航班鏈的過程中未出現(xiàn)延誤情況,各過站機場的實際過站時間與計劃過站時間相差不大;但是當航班鏈中發(fā)生了前航延誤,后續(xù)航班若再受到過站機場運行效率較低或惡劣天氣等因素的影響,較大可能出現(xiàn)延誤波及,產(chǎn)生更多的航班延誤[1].因此,精準估計航班過站時間可以幫助航空公司適時調(diào)整航班計劃,為機場進行資源調(diào)配提供決策依據(jù),降低航空公司由航班鏈運行的脆弱性導致的成本損失[2],同時幫助旅客及時調(diào)整出行計劃,降低旅客時間和經(jīng)濟損失.

針對航班延誤吸收與波及問題,眾多學者從不同角度進行研究.Chen等[3]通過隨機森林、LightGBM和XGBoost三種模型分別預測的結(jié)果進行二次訓練,提出了一種多模型融合的航班延誤預測模型;朱星輝等[4]依據(jù)基于航班延誤等級,調(diào)整過站時間,提高航班計劃的魯棒性;高強等[5]利用波及延誤樹構(gòu)建以初始航班延誤為根節(jié)點觸發(fā)的延誤傳播過程,對航班過站松弛時間重分配,降低延誤時間.丁建立等[6]利用貝葉斯網(wǎng)絡(luò)增量學習的特性,依賴貝葉斯估計動態(tài)修正貝葉斯網(wǎng)絡(luò)參數(shù),動態(tài)更新過站時間估計值;邢志偉等[7]針對單機場服務(wù)保障流程數(shù)據(jù)采用貝葉斯網(wǎng)絡(luò)架構(gòu),再結(jié)合條件概率推理方法動態(tài)估計了航班預計離港時間.何堅等[8]基于多機場真實運營數(shù)據(jù),構(gòu)建了基于LightGBM的航班中轉(zhuǎn)時間預測模型.以上學者研究方法多采用有監(jiān)督的機器學習方法,預測效果受影響因素個數(shù)限制,為降低模型復雜度,提高模型準確度,需先對航班、天氣等數(shù)據(jù)進行特征提取,而深度學習模型可以增加輸入數(shù)據(jù)維度,自動提取特征并較好地挖掘其中的潛在關(guān)系.

此外,航班鏈各機場過站數(shù)據(jù)隨航班計劃執(zhí)行航班狀態(tài)不斷更新,具有時序特性,數(shù)據(jù)更新時間間隔隨航班計劃安排長短不一.LIM等[9]經(jīng)過實驗探索發(fā)現(xiàn),基于深度學習的時間序列預測效果較優(yōu).注意力機制[10]模仿人類大腦的注意力思維方式,可通過網(wǎng)絡(luò)自主學習出的一組權(quán)重系數(shù),并以概率動態(tài)加權(quán)的方式來強調(diào)關(guān)注目標和抑制無效信息.Du等[11]采用一種融合注意力機制和雙向長短時記憶網(wǎng)絡(luò)(Bi-LSTM)進行時序數(shù)據(jù)預測方法,在預測精度和算法魯棒性方面取得較好的效果.綜上可以得到采用Bi-LSTM模型[12]在解決非固定時間步長時序任務(wù)時,具有充分探索全局上下文信息的能力,注意力機制[13]可以高效提取關(guān)注目標主要特征信息.基于此,結(jié)合航班鏈過站數(shù)據(jù)的時序特征、數(shù)據(jù)量大、影響因素多等特性,提出了一種基于MA-BiLSTM (Mixed Attention based Bidirectional Long Short-Term Memory)的多時間窗航班過站時間估計方法.采用具有可以獲得雙向信息的Bi-LSTM模型進行基礎(chǔ)建模,為更加高效選擇聚焦屬性,在Bi-LSTM網(wǎng)絡(luò)模型的基礎(chǔ)上增加時間和多維屬性的混合注意力機制,最后根據(jù)航班鏈執(zhí)行狀態(tài)設(shè)置不同長度的時間窗,采用多時間窗滑動推進的方法對各機場過站時間進行動態(tài)估計.

1 航班鏈航班過站流程

單架飛機一天內(nèi)通常會連續(xù)到達多個過站機場,執(zhí)行多段航班,稱為航班鏈[14].如圖1所示,長度為7的航班鏈.

圖1 長度為7的航班鏈

在航班鏈中,飛機到達過站機場后,完成一系列航班過站保障流程和旅客登機程序等.如圖2所示,實際過站時間等于實際離港時間和前序?qū)嶋H到港時間之差.

圖2 航班過站流程

2 航班過站多維度影響因素分析

多數(shù)研究受限于數(shù)據(jù)難以收集,同時傳統(tǒng)機器學習方法對影響因素選擇個數(shù)有較高要求,既往研究選用的影響因素較少[6].本文在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,結(jié)合專家經(jīng)驗,從天氣因素、機場因素、飛機因素及航班相關(guān)時間信息四個方面選擇影響因素.

2.1 天氣因素

根據(jù)機場天氣狀況可以判斷是否進行航班起降,主要包括能見度等參考指標.其中天氣描述參考指標綜合概括機場的天氣狀況,本文將其劃分為5個等級,如表1所示.

2.2 機場因素

用于量化機場規(guī)模和機場運行效率,主要包括機場類型等.其中標準機場地面滑行時間是民航局為客觀反映不同機場實際地面運行效率而設(shè)定的,如表2所示,將國內(nèi)機場分為4類,并給出對應的標準機場地面滑行時間.

此外,過站機場小時吞吐量是指過站機場每小時到港航班架次和離港航班架次總和,為更準確地描述機場實時運營效率,增加過站機場小時吞吐量為過站時間影響因素;機場停機位的遠近會影響實際到港時間,增加是否為遠機位作為影響因素.

表1 天氣描述等級

表2 全國機場等級

2.3 飛機因素

用于量化航空公司對航班計劃制定合理性以及應急保障能力.其中,航空公司、機齡和座位數(shù)等飛機屬性不同,航班過站時間也會不同.當航空公司和過站機場相同,機型越大,座位數(shù)越多,則過站時間越長.以某大型航空公司為例,根據(jù)不同機型的座位數(shù)、過站機場,統(tǒng)計最小過站時間如表3所示.

表3 某大型航空公司最小過站時間(分鐘)

2.4 航班相關(guān)時間信息

用于量化航班鏈相關(guān)時間信息,航班過站關(guān)鍵時間節(jié)點如圖2所示.首先,為探究各航段計劃飛行時間松弛度對航班延誤時間的影響,增加了計劃飛行時間和實際飛行時間作為影響因素.其次,為凸顯出季節(jié)、節(jié)假日和工作日對機場進離港流量的影響,增加了相應字段作為影響因素.同時,為進一步探究繁忙時段對航班鏈過站延誤波及的影響,增加了繁忙時段作為影響因素.

綜上,航班鏈航班的機場過站時間影響因素如圖3所示,其中灰色部分表示前序航班相關(guān)信息.

圖3 過站時間影響因素

3 過站時間預測模型

構(gòu)建基于MA-BiLSTM網(wǎng)絡(luò)的航班過站時間動態(tài)估計模型,以航班上、下游過站機場天氣因素、機場因素、飛機因素及航班相關(guān)時間因素作為模型輸入;再根據(jù)航班鏈執(zhí)行狀態(tài)設(shè)置不同長度的時間窗,采用MA-BiLSTM模型預測出下游不同過站機場的預計過站時間;最后采用加權(quán)平均方法融合多時間窗估計結(jié)果,提高預測精度.

3.1 MA-BiLSTM模型

MA-BiLSTM模型由Bi-LSTM網(wǎng)絡(luò)層、Mixed Attention層和Dense層組成,結(jié)構(gòu)如圖4所示.模型是基于Bi-LSTM網(wǎng)絡(luò)對航班過站數(shù)據(jù)進行建模,得到上游和下游機場過站數(shù)據(jù)序列之間的關(guān)系,再增加感知時間(Time)和多維屬性(Factor)的混合注意力機制(Mixed Attention),獲取上下游不同過站機場不同因素的影響重要程度,最終全連接層(Dense)輸出下游不同過站機場的預計過站時間.

圖4 MA-BiLSTM模型

Bi-LSTM[13]網(wǎng)絡(luò)層利用Bi-LSTM網(wǎng)絡(luò)可獲得雙向時序信息的特性,得到上游和下游機場間的時序記憶信息.Bi-LSTM是在LSTM[15]上擴展,結(jié)合BRNN[16]原理,在輸入序列上分別地向前和向后訓練兩個LSTM,其輸出由這兩個LSTM共同決定,從而可以充分學習某時刻過去和未來的時序信息[17].LSTM是在RNN[18]基礎(chǔ)上改進,其特有的記憶和遺忘方式,能夠解決許多使用固定長度的時間窗無法解決的時間序列任務(wù).

遺忘門:

ft=σ(Wf[ht-1,xt]+bf)

(1)

輸入門:

it=σ(Wi[ht-1,xt]+bi)

(2)

(3)

(4)

輸出門:

yt=σ(Wy[ht-1,xt]+by)

(5)

ht=yt*tanh(ct)

(6)

(7)

(8)

(9)

設(shè)H表示對過站數(shù)據(jù)輸入時間序列進行Bi-LSTM網(wǎng)絡(luò)構(gòu)建后得到的隱狀態(tài)矩陣,其中行向量代表同一變量的所有時間步構(gòu)成的向量集合,列向量代表同一時間步下的所有變量構(gòu)成的向量集合,H1和H2分別表示向前和向后兩個方向得到的隱狀態(tài)矩陣.具體描述如下:

(10)

Mixed Attention層分別針對時間和多維屬性進行注意力訓練,得到了混合注意力權(quán)重矩陣.具體計算如下:

(11)

(12)

(13)

(14)

qt=τ(Wc[Ct;ht;Cs;hs])+bq

(15)

式(11)~(15)中:αt表示當前輸入的時間步為t時隱藏層的注意力權(quán)重,Ct表示各時間步加權(quán)平均后的權(quán)重;βs表示影響因素s對應的注意力權(quán)重,Cs表示各因素加權(quán)平均后的權(quán)重;qt表示混合注意力機制結(jié)果輸出.

Dense層通過線性運算得出下游各過站機場的預計過站時間.主要進行MA-BiLSTM網(wǎng)絡(luò)層和輸出層之間的過渡,最終輸出預計過站時間向量y.

3.2 模型輸入及輸出

本文預測場景為:假設(shè)某飛機的航班計劃為一天連續(xù)飛行N趟航班,已知首航起飛已完成,后續(xù)經(jīng)過N-1個過站機場,完成前i-1趟航班,到達第i個過站機場,依據(jù)第i-k個至第i-1個過站數(shù)據(jù),預測此飛機在第i個至第i+j-1個過站機場的過站時間.其中,k表示上游過站機場個數(shù),j表示預測下游過站機場個數(shù).

定義I為模型輸入的航班鏈過站數(shù)據(jù)集合,表示如下:

(16)

式(16)中:n表示輸入過站數(shù)據(jù)總條數(shù),Xi表示第i條輸入過站數(shù)據(jù),xi,t表示第i條數(shù)據(jù)的第t個過站數(shù)據(jù)序列,分為離散型數(shù)據(jù)變量和連續(xù)型數(shù)據(jù)變量.離散型數(shù)據(jù)變量主要包括機場類型、航空公司等變量,由原始數(shù)據(jù)進行One-Hot編碼[19]處理得到.連續(xù)型數(shù)據(jù)變量主要包括溫度、過站機場小時吞吐量和飛行時間等變量,使用Min-Max標準化法[11]對原始數(shù)據(jù)進行歸一化得到.

定義O為模型輸出的過站數(shù)據(jù)集合,表示如下:

(17)

式(17)中:n表示輸出預計過站時間總條數(shù),Yi表示第i條輸出預計過站時間向量,yi,t為第i條數(shù)據(jù)預計第t個過站機場的過站時間,由模型輸出結(jié)果進行歸一化還原后得到.

3.3 多時間窗過站時間估計

隨著航班鏈運行狀態(tài)的變化,為及時降低因前航延誤帶來的延誤波及,采用多時間窗滑動的方式進行過站時間估計,圖5為多時間窗航班過站時間估計流程圖.

圖5 多時間窗過站時間估計流程

具體流程如下所示:

步驟1輸入或更新航班鏈數(shù)據(jù).

步驟2判斷航班鏈最新過站完成狀態(tài),當過站個數(shù)大于2時,分別采用時間窗長度為1,2,3模型進行預測,跳轉(zhuǎn)至第5步;否則跳轉(zhuǎn)至第3步.

步驟3當過站個數(shù)為2時,分別采用輸入時間窗長度為1,2模型進行預測,跳轉(zhuǎn)至第5步;否則跳轉(zhuǎn)至第4步.

步驟4當過站個數(shù)為1時,采用輸入時間窗長度為1模型進行預測,跳轉(zhuǎn)至第5步.

步驟5對多時間窗預測結(jié)果進行融合,跳轉(zhuǎn)至第6步.

步驟6判斷航班鏈是否執(zhí)行完畢,如果否,等待更新航班鏈狀態(tài),跳轉(zhuǎn)至步驟1;否則流程結(jié)束.

4 實驗結(jié)果及分析

4.1 實驗數(shù)據(jù)

實驗原始數(shù)據(jù)為全國2019年一整年的真實航班數(shù)據(jù),覆蓋全國136個機場,數(shù)據(jù)量約350萬條.一條航班數(shù)據(jù)主要包含航班過站關(guān)鍵時間節(jié)點(見圖2)等字段,不包含前序航班相關(guān)數(shù)據(jù).需要先對航班數(shù)據(jù)進行預處理轉(zhuǎn)化為航班鏈過站數(shù)據(jù),使用JetBrains PyCharm進行編程實現(xiàn),運行內(nèi)存為16G.

4.1.1 航班數(shù)據(jù)清洗

某飛機一天內(nèi)先后到達A、B、…等多個機場,若航空公司售賣聯(lián)程機票,航班數(shù)據(jù)中可能同時包含A-B、B-C、…等單航段及A-(B)-C、B-(C)-D、…等多航段數(shù)據(jù),或者包含部分單航段和部分多航段數(shù)據(jù),對重復航段的數(shù)據(jù)進行重組,保留最小的單航段數(shù)據(jù).

4.1.2 航班鏈過站數(shù)據(jù)集成

將得到的航班數(shù)據(jù)通過飛機注冊號這一唯一標識來匹配同一架飛機執(zhí)行的航班;通過機場唯一標識匹配天氣相關(guān)屬性數(shù)據(jù);通過飛機機型匹配飛機相關(guān)屬性數(shù)據(jù);通過日期拼接成航班鏈過站數(shù)據(jù).

4.1.3 航班鏈數(shù)據(jù)選擇

對航班鏈中每條過站數(shù)據(jù)的過站時間進行過站時間等級統(tǒng)計.根據(jù)時間長度分為5個等級,如表4所示.

表4 時間長度等級

分析不同過站時間等級航班數(shù)占總過站架次百分比,其中計劃過站時間在Level 1范圍內(nèi)占比33%,但實際過站時間在Level 1范圍內(nèi)占比9%,大約24%航班過站時間高于計劃過站時間;計劃過站時間長度和實際過站時間長度在Level 5范圍內(nèi)占比穩(wěn)定,說明當過站時間大于4 h時,過站時間安排較為充裕,較大可能將前序航班延誤吸收,因此設(shè)定當過站時間大于4 h,表示航班鏈執(zhí)行末班航班.對數(shù)據(jù)集中航班鏈過站延誤時間進行統(tǒng)計,航班鏈執(zhí)行過程中發(fā)生過站延誤時間的航班占比約為20%,發(fā)生首航延誤的航班占比約為14%.

為探究航班鏈不同執(zhí)行狀態(tài)下,機場過站時間對后續(xù)航班延誤的影響,對航班鏈中占較大比重的未發(fā)生延誤數(shù)據(jù)進行隨機采樣處理,使延誤與未延誤數(shù)據(jù)保持平衡,提高訓練模型的魯棒性.

4.2 結(jié)果與分析

(18)

(19)

4.2.1 多模型對比分析

通常單架飛機單日過站機場個數(shù)約為2至6個,即航班鏈長度為3至7,航班鏈長度為5占比總航班鏈個數(shù)的40%.選擇航班鏈長度為5的航班鏈數(shù)據(jù)進行MA-BiLSTM模型的準確度評估,選用RNN[18]、LSTM[18]、Bi-LSTM[17]和Bi-LSTM+Att[11]四種作為對比模型.各模型基于Tensorflow框架進行網(wǎng)絡(luò)構(gòu)建和訓練,對每個模型多次訓練調(diào)優(yōu),得到各模型超參數(shù)(學習率、訓練輪次、隨機失活比例);依賴sklearn編程庫,對數(shù)據(jù)集按照8∶2的比例多次劃分訓練集和測試集.

同時,為探索輸入前序過站機場個數(shù)和輸出預測后續(xù)過站機場個數(shù)對預測模型預測本機場過站時間的影響,各模型設(shè)置不同長度時間窗的輸入和輸出進行實驗,表5和表6為其5次MAE和RMSE評價結(jié)果的平均值,其中,時間窗長(k,j)表示輸入過站數(shù)據(jù)的前序過站機場個數(shù)為k和輸出預計過站時間的機場個數(shù)為j.

多個模型結(jié)果對比分析發(fā)現(xiàn),當選擇相同的時間步時,MA-BiLSTM模型的MAE值和RMSE值均小于四種對比模型,MA-BiLSTM模型在預測航班過站時間方面有較好的準確性.其中,當時間窗長為(2,1)時,MA-BiLSTM模型評估效果最好,MAE值和RMSE值分別為2.45 min和3.95 min,較Bi-LSTM+Att模型MAE值提升1.1 min,RMSE值提升1.92 min,即輸入已完成2個機場的過站數(shù)據(jù),能夠更為準確預測后續(xù)1個機場的過站時間.

表5 長度為5的航班鏈各模型MAE結(jié)果

表6 長度為5的航班鏈各模型RMSE結(jié)果

4.2.2 模型準確度驗證

為進一步驗證MA-BiLSTM模型的準確性,選擇時間窗長(3,1)時,分別按照月份和工作日對結(jié)果進行MAE和RMSE值驗證,圖6為各月份的評估結(jié)果,圖7為各季度工作日與節(jié)假日的評預測估結(jié)果.

依據(jù)民航航班計劃安排將12個月分為夏秋季和冬春季,夏秋季是指4月至10月,其余月份為冬春季,其中夏秋季平均航班延誤率高于冬春季,且6月份至8月份的延誤率最高.如圖6所示,全年12月份驗證結(jié)果均勻分布在全年的綜合評估結(jié)果上下,其中,6月份至8月份評估結(jié)果高于全年的綜合評估結(jié)果受臺風、暴雨等天氣影響因素較大.

對比全年節(jié)假日和工作日平均延誤率發(fā)現(xiàn),節(jié)假日平均每日運輸量高于工作日,但節(jié)假日延誤率低于工作日延誤率.如圖7所示,整體評估結(jié)果分布均勻,說明MA-BiLSTM模型預測效果良好.其中各季度節(jié)假日優(yōu)于工作日評估指標受節(jié)假日調(diào)整運營保障計劃的影響.

圖6 月份評估結(jié)果

圖7 工作日與節(jié)假日評估結(jié)果

4.2.3 多航班鏈實驗分析

為驗證航班過站時間動態(tài)估計精度,選擇數(shù)據(jù)集中航班鏈長度為4、5、6和7根據(jù)圖5流程進行多時間窗滑動方法估計航班過站時間.首先采用多次訓練調(diào)優(yōu)得到不同長度時間窗預測模型作為基礎(chǔ)模型,隨著多時間窗的推進增加模型訓練數(shù)據(jù),由于新增數(shù)據(jù)量較歷史數(shù)據(jù)較小,調(diào)整模型訓練超參數(shù),動態(tài)更新模型參數(shù),表7和表8為MA-BiLSTM模型預測結(jié)果,表中“-”表示不存在數(shù)據(jù)結(jié)果,表中“A、B、…”表示航班鏈第1個、第2個、…過站機場.

表7 MA-BiLSTM模型MAE結(jié)果

表8 MA-BiLSTM模型RMSE結(jié)果

通過對比不同航班鏈長度評價指標發(fā)現(xiàn),當航班鏈長度為4時,3個過站機場預測結(jié)果隨時間窗推動波動不大,說明預測效果較為穩(wěn)定;當航班鏈為7時,6個過站機場預測結(jié)果隨多時間窗滑動推進在一定范圍內(nèi)波動相對較大.當航班鏈為5時,MA-BiLSTM模型預測結(jié)果比單時間窗預測結(jié)果MAE值和RMSE值均有顯著提升,說明基于MA-BiLSTM的多時間窗航班過站時間估計方法有良好效果.

5 結(jié)論

本文充分提取航班過站時間的影響因素,從天氣因素、機場因素、飛機因素和航班相關(guān)時間信息四個方面進行影響因素選擇,基于可充分學習前后段時序特征的Bi-LSTM網(wǎng)絡(luò),融合時間和多屬性兩維度的混合注意力機制,提出了基于MA-BiLSTM的多時間窗航班過站時間估計方法.首先,與常用模型對比實驗,進一步探究了輸入和輸出過站機場個數(shù)對多模型預測模型的影響,采用不同模型和不同時間步長進行訓練預測,得出了MA-BiLSTM模型預測效果最好.最后采用了多時間窗滑動推進的方式,分別對不同長度的航班鏈進行航班過站時間動態(tài)估計,驗證了MA-BiLSTM的多時間窗航班過站時間估計方法有較好的預測準確性.在今后的研究中,如果能夠加入機場保障數(shù)據(jù),將進一步提高航班過站時間預測模型性能.

猜你喜歡
航班機場長度
機場罷工
全美航班短暫停飛
山航紅色定制航班
金橋(2021年10期)2021-11-05 07:23:10
山航紅色定制航班
金橋(2021年8期)2021-08-23 01:06:24
山航紅色定制航班
金橋(2021年7期)2021-07-22 01:55:10
1米的長度
如何避免GSM-R無線通信系統(tǒng)對機場電磁干擾
面部識別使機場安檢提速
愛的長度
怎樣比較簡單的長度
石柱| 乌鲁木齐市| 邹平县| 阳江市| 三明市| 蒲江县| 上栗县| 敦煌市| 滁州市| 临夏县| 阜阳市| 岳西县| 文登市| 清远市| 丘北县| 瑞丽市| 于田县| 绥棱县| 宜章县| 昌平区| 罗城| 米林县| 建始县| 九江市| 南郑县| 商水县| 彰化市| 刚察县| 龙里县| 滨海县| 伊宁市| 鹤山市| 凉山| 阜南县| 永清县| 西华县| 河池市| 黄梅县| 建宁县| 永吉县| 泽州县|