臧海培,朱金福,高 強
(南京航空航天大學 民航學院, 江蘇 南京 211100)
在航班延誤發(fā)生后,航班運行控制需要制定航班恢復計劃,對航班運行進行人工干預。精確預測實際運輸中各機場的保障能力(容量),可以對航班延誤實現(xiàn)精準控制,有助于提高延誤后整體航班的運行效率,減輕延誤在運輸網(wǎng)絡中的傳播和擴散。天氣是影響機場容量的主要因素,準確量化評估天氣對機場容量的影響對于民航運輸管理至關(guān)重要[1]?,F(xiàn)有容量評估大多是對確定容量進行研究,經(jīng)典評估方法主要是通過構(gòu)建數(shù)學分析模型,理論計算機場跑道、停機坪等機場各系統(tǒng)單元容量,再整體對機場容量進行綜合評估[2]。因為氣象數(shù)據(jù)的限制,現(xiàn)有的數(shù)學模型大多基于特定時段的季節(jié)性天氣條件,研究特定機場[3]或機場系統(tǒng)單元[4]或空域中主要位置[5]的容量分布問題。也有學者通過構(gòu)建馬爾科夫鏈預測天氣,模擬對應天氣條件下的航班排序結(jié)果評估機場動態(tài)容量[6],但研究結(jié)果依賴機場飛機數(shù)量,且容量評估過程復雜不能進行實時計算,無法建立機場實時容量與天氣的直接函數(shù)關(guān)系。隨著全球數(shù)字化機場建設進程的推進,采用抽象數(shù)學表達式的傳統(tǒng)數(shù)學模型,已不能滿足更加精細化的實際操作要求。為了從微觀層面獲得準確的機場容量評估結(jié)果,應用計算機仿真軟件構(gòu)建仿真模型,模擬機場運行成了一種可行的方法。全球預測機場容量的主流仿真軟件有波音公司的TAAM軟件[7]、FAA研發(fā)的SIMMOD軟件[8]和MITRE公司開發(fā)的runwaySimulator軟件[9]。然而該方法需要詳細和復雜的業(yè)務流程設置,所需成本高且難以普及。
機場容量是一個動態(tài)變化的量,易受到天氣條件、交通流構(gòu)成、交通管理行為以及人為因素等隨機因素的影響[10],呈現(xiàn)出隨機性。近年來,越來越多的學者開始研究容量的隨機性問題,有的基于歷史數(shù)據(jù)構(gòu)建自適應學習模型的容量評估方法[11-12];有的通過概率統(tǒng)計將機場天氣發(fā)生概率轉(zhuǎn)換為機場容量分布概率[13],將天氣單獨考慮,降低多種因素對機場容量影響的復雜程度;或者通過提取24 h平均天氣和機場延誤特征的方法,參考歷史相似氣象條件下的機場運行狀態(tài)[14-15]。但是這些模型主要從戰(zhàn)術(shù)層面將特定機場或者特定區(qū)域內(nèi)的機場網(wǎng)絡作為研究對象,僅將機場日高峰運行時刻的實際運行流量作為容量數(shù)據(jù),且研究時間天數(shù)不超過3個月。由于天氣因素具有很強的實時性、隨機性和動態(tài)性,當前的研究方法無法精確捕捉各類天氣和容量的特征關(guān)系,更無法實時精確地評估機場容量。機場容量是指在特定的時間段內(nèi)通過該機場的航空器最大數(shù)量,也稱為機場理論容量或飽和容量[16],而預測機場容量時空分布的前提是要獲得實際運輸中各機場的實時容量,機場實時狀態(tài)下的理論容量。因受實時天氣的影響,機場容量只有當航班流量需求足夠大時才可被觀察到。所以筆者將時間離散為單位時間片段,從我國民航有記錄的天氣和航班運行歷史大數(shù)據(jù)中挖掘?qū)崟r天氣和理論容量的特征關(guān)系,研究復雜天氣影響下的機場實時容量提取和預測方法。為提前預判機場航班起降情況提供理論依據(jù),從本質(zhì)上緩解航班延誤產(chǎn)生的負面影響,提升航空公司航班運行效能。
使用Python語言處理機場天氣-容量數(shù)據(jù)和實現(xiàn)機器學習預測模型的主要任務有:① 通過國內(nèi)機場天氣和航班運行歷史大數(shù)據(jù)提取機場實時容量。首先研究了天氣與機場航班運行數(shù)據(jù)之間的相關(guān)關(guān)系,提取機場實時天氣-容量數(shù)據(jù)。② 深度挖掘機場天氣與容量數(shù)據(jù)之間的相關(guān)關(guān)系,構(gòu)建機場實時容量預測模型。其次重點研究了航空運輸網(wǎng)絡中機場天氣時空分布與容量時空分布之間的映射關(guān)系,運用支持向量回歸(support vector regression,SVR)、神經(jīng)網(wǎng)絡(neural network,NN)、隨機森林(random forest,RF)和深度森林(deep forest,DF)等機器學習算法進行預測模型訓練。并在分析單一模型預測結(jié)果的基礎上,構(gòu)建融合多種算法的深度集成回歸(deep ensemble regression,DER)預測模型,進一步提升預測準確率。③ 最后將華東地區(qū)12家千萬級機場作為測試對象,驗證模型在實際應用中的預測表現(xiàn)。
獲取機場實時容量的前提,是要得到機場實時容量與天氣之間的映射關(guān)系。該映射關(guān)系較為復雜,涉及3個方面:① 不利的天氣會降低機場容量,但是不同的天氣狀況對機場實時容量的影響程度卻可能相同,例如嚴重大霧天和臺風天的機場實時容量可能都為0;② 不同機場的運行條件存在差異,相同天氣條件對不同機場的容量的影響程度可能不同;③ 歷史的機場實時容量只有在航班需求足夠大時才能夠真正被觀察到,所以機場實時容量需要從可獲得的機場實際運行數(shù)據(jù)中挖掘提取。但是機場的航班運行會受到航班延誤鏈式傳播造成的影響,導致獲取的機場實時容量值存在誤差。所以需要對天氣和航班運行大數(shù)據(jù)進行聚類挖掘,將天氣作為外在影響因素,探尋單位時間內(nèi)機場航班運行架次與容量之間的關(guān)系,分析不同天氣對機場實時容量預測的影響,構(gòu)建提取機場實時容量的方法。
1.1.1 數(shù)據(jù)說明
研究數(shù)據(jù)主要來源于中國民航信息網(wǎng)絡股份有限公司旗下航旅縱橫Kebuflow大數(shù)據(jù)平臺,數(shù)據(jù)包括中國2017年01月01日至2019年12月31日的全部國內(nèi)航班計劃運行大數(shù)據(jù)和同時期的民航機場氣象數(shù)據(jù)如表1。將2019年旅客吞吐量在千萬級以上的39家機場作為研究對象。這些機場在大部分或特定時間段里的航班時刻需求大于供給,存在機場擁堵和航班延誤現(xiàn)象,是國內(nèi)典型的航班時刻協(xié)調(diào)機場,具備研究的必要性。
表1 數(shù)據(jù)指標描述Table 1 Description of data indicators
1.1.2 數(shù)據(jù)融合
將連續(xù)的時間離散化,分別以30、60 min時間間隔為單位時間(以下稱為時段)對時間切片,分別計劃52 560、26 280個時段,再將航班運行數(shù)據(jù)和氣象數(shù)據(jù)依據(jù)時段切片。表2展示了數(shù)據(jù)的特征指標提取,將容量和氣象數(shù)據(jù)依據(jù)劃分時段進行融合。形成的數(shù)據(jù)表中每一行都有關(guān)于特定時段的容量和氣象數(shù)據(jù)特征。
表2 機場容量和天氣數(shù)據(jù)的描述特征Table 2 Description characteristics of airport capacity and weather data
量化機場氣象條件的方法主要參考了2011年歐洲EUROCONTROL績效評估部門頒布的ATMAP(air traffic management airport performance)天氣分類算法。該算法旨在量化歐洲機場的天氣條件,給不同嚴重程度的5個航空氣象類別分配評分值,分別為:①云底高和能見度;②風;③降水;④露點;⑤危險氣象現(xiàn)象。因多數(shù)危險氣象現(xiàn)象可以由前4類氣象條件體現(xiàn)(例如:暴雪、颶風、冰雹、沙塵暴、雷暴等),故依據(jù)表3簡化ATMAP算法中的天氣分類項。又因同一個時間切片的不同機場可以有零次或多次氣象數(shù)據(jù)采集結(jié)果,將同一機場同一切片多次氣象采集數(shù)據(jù)求平均,將沒有天氣記錄的切片遺傳前一切片的氣象數(shù)據(jù),以保證氣象數(shù)據(jù)的完整性。
表3 機場氣象條件說明Table 3 Description of airport meteorological conditions
機場的實時容量指的是機場在單位時間間隔里能夠保障的飛機運行架次數(shù)。理論上當機場航班運行流量足夠高時,就可以觀察到機場的實時容量。但是機場并不是時刻都處在“飽和”的運行狀態(tài),非高峰時段的機場計劃和實際運行流量通常遠低于機場實時容量。所以過去的研究將機場日高峰運行時段的實際運行流量作為機場容量,但是這樣僅可研究機場高峰時段對應的有限類別的天氣條件。為了深度挖掘復雜天氣與機場容量的映射關(guān)系,就需要解決非高峰時段機場實時容量獲取的問題。
天氣是影響機場容量最主要的因素,由于國內(nèi)外機場的實際運行狀況受天氣影響的程度不同,因此研究天氣對機場容量影響的方法也應有所不同。國外大部分機場運行極易受天氣影響的小型客機,且多存在飛行員利用目視進近提高運行效率的情況,所以國外學者將機場容量劃分為滿足目視和儀表運行條件的容量[3],或者通過特征工程和相關(guān)性研究來決定復雜天氣對機場容量的影響程度[14-15]。而國內(nèi)航班大多為中大型客機,且普遍采用CAT-Ⅰ類精密進近,部分機場可以完成Ⅱ類甚至更高類別。所以筆者直接結(jié)合中國機場的實際運行狀況,對天氣和航班運行大數(shù)據(jù)的聚類挖掘分析,將機場實際的運行狀態(tài)分為3種:①完全正常運行;②受影響可以部分正常運行;③完全不能運行,并根據(jù)飛行員操作、航空器運行和機場運行3個方面的運行規(guī)范,對影響機場容量的天氣條件分級和閾值設定,間接確定機場實時容量,詳見表4。主要參考規(guī)范包括:國際民用航空組織附錄14(ICAO Annex 14)、《中國民用航空局令》第98號、波音和空客公司主流航空器運行指導手冊、中國三大航空公司《運行手冊》和歐洲機場ATMAP評分方法。
表4 機場天氣條件分級說明Table 4 Classification of airport weather conditions
依據(jù)運行規(guī)范,“好天氣”和“跑道關(guān)閉天氣”等級的機場實時容量分別對應高峰時段機場運行流量和零容量,而“壞天氣”等級中的機場實時容量應依據(jù)機場天氣和實際航班運行數(shù)據(jù)提取,提取的前提是要判斷機場在當前時段是否處在“飽和”運行狀態(tài)。理論上當機場實際運行流量小于計劃運行流量時,可以認為機場的運行狀態(tài)接近飽和。但這其中包括了其他機場的延誤波及影響,例如在本地機場航班計劃流量遠低于機場運行容量時,由其他機場原因?qū)е碌难诱`航班同樣會影響本地機場的運行流量。為了降低影響誤差,通過數(shù)據(jù)挖掘技術(shù)得出具有相同天氣條件的歷史最大實際運行航班流量趨近于機場真實容量的結(jié)論,通過判斷歷史最大實際運行流量對應時段的機場延誤狀態(tài)篩選數(shù)據(jù)。間接解決非高峰時段機場實時容量獲取問題,得到39家機場的實時天氣-容量數(shù)據(jù)表。
因為天氣復雜多變,傳統(tǒng)的數(shù)學模型無法在短時間內(nèi)實時處理多項具有非線性關(guān)系的氣象指標,所以筆者利用機器學習方法學習天氣與機場實時容量數(shù)據(jù)之間的潛在規(guī)律,深度挖掘天氣與容量的真實關(guān)系。但在研究過程中發(fā)現(xiàn),單一機器學習算法對機場實時容量的預測表現(xiàn)具有差異。為了提高機場實時容量預測的準確性,筆者采用將具有異質(zhì)性的算法融合的方法,依據(jù)集成學習理論構(gòu)建深度集成預測模型,提高模型對數(shù)據(jù)變化的魯棒性。
如圖1,模型訓練前將數(shù)據(jù)進行標準化處理,采用留出法對各機場按照6∶4的比例,依據(jù)天氣分級進行分層采樣構(gòu)建訓練集與驗證集。其中輸入數(shù)據(jù)為各機場單位時段的7維氣象條件,詳見表3,輸出數(shù)據(jù)為對應時段的實時容量(架次)。采用均方誤差EMSE作為損失函數(shù),均方根誤差ERMSE、決定系數(shù)R2、平均絕對誤差EMAE來評估模型的預測性能,并重復40次實驗后取平均值作為最終評估結(jié)果,評估指標公式如下:
圖1 機場實時容量的深度集成預測模型Fig. 1 The DER model of airport real-time capacity
(1)
(2)
(3)
(4)
2.1.1 模型配置
機器學習是一種數(shù)據(jù)驅(qū)動型技術(shù),其對多變量之間非線性關(guān)系的處理能力和自身具備的穩(wěn)定性可以有效降低預測結(jié)果的方差,有利于動態(tài)的機場實時容量評估。筆者設置非線性回歸的經(jīng)典高斯-支持向量機回歸為基準模型。在早期相關(guān)領(lǐng)域的研究中發(fā)現(xiàn),隨機森林在對于天氣和部分航空運輸特征的預測性能略好于其他機器學習模型[15],而深度森林作為隨機森林的擴展,通過將特征學習融入到了建模過程,減少了人為設計特征造成的不完備性,所以筆者將隨機森林和深度森林納入研究,使用網(wǎng)格搜索最佳參數(shù)組合。
深度學習提出了一種讓計算機自動學習出模式特征的方法,特別適合于研究氣象條件在特定情況下對機場容量造成的關(guān)聯(lián)性影響,例如霜霧、臺風、沙塵暴等復雜氣象現(xiàn)象可能會對多類氣象條件產(chǎn)生影響,和特定氣象條件在不同組合下造成的不同影響,例如下雨會伴隨雨云,且溫度在露點以下會導致結(jié)冰現(xiàn)象等。因此傳統(tǒng)的神經(jīng)網(wǎng)絡全連接層不能很好的捕獲天氣數(shù)據(jù)的綜合特征。所以筆者在多層網(wǎng)絡中嵌入帶Dropout率的隱藏層防止過度連接,以一定的概率刪除神經(jīng)元之間的連接,使模型泛化性更強[17]。為了避免參數(shù)初始化不當,實驗中采用提前停止技術(shù)和正則化技術(shù)對模型批量參數(shù)利用二進制計數(shù)單位由小到大進行多次訓練,發(fā)現(xiàn)隨著批量的增大模型處理數(shù)據(jù)的速度越快,訓練精度和穩(wěn)定性越高,所以最后因內(nèi)存限制將批量設定為4 096。后又經(jīng)實驗發(fā)現(xiàn)模型設置1層隱藏層效果不佳,4層出現(xiàn)過擬合,2層和3層隱藏層的預測精度較高但2層所需時間少,所以構(gòu)建2層神經(jīng)網(wǎng)絡,最后在各層神經(jīng)元數(shù)和Dropout率相等的情況下,依據(jù)RMSE調(diào)整參數(shù)組合如圖2。
圖2 模型不同參數(shù)組合下的預測性能比較Fig. 2 Comparison of prediction performance under different combination of parameters of the model
2.1.2 結(jié)果及討論
當單位時間設置為30、60 min時,各模型對39家機場的實時容量的預測性能如表5,下劃線標注了模型的超參數(shù)設置。結(jié)果顯示,神經(jīng)網(wǎng)絡、隨機森林和深度森林預測結(jié)果的精確度均明顯優(yōu)于SVR。其中隨機森林的表現(xiàn)優(yōu)于其他模型,耗費時間最少,單位時間為30 min時,訓練時間不到2 min,R2為97.3%,EMAE和ERMSE分別為0.682、1.908架次,說明預測的機場實時容量精度在2次起降架次;單位時間為60 min時,訓練時間為72 s,R2為98.1%,EMAE和ERMSE分別為0.892、2.753架次。
表5 研究的39家機場3年運行數(shù)據(jù)的模型評估結(jié)果Table 5 Model evaluation results based on three-year operation data of 39 airports studied in this paper
當單位時間時為30 min時,各模型的預測表現(xiàn)均明顯優(yōu)于60 min為單位時間時的預測表現(xiàn)。且4個模型的決定系數(shù)R2均在93%以上,ERMSE均小于3架次,說明筆者提出的考慮天氣影響的機場實時容量提取方法可行。雖然當單位時間為60 min時,神經(jīng)網(wǎng)絡的ERMSE比隨機森林多了2個架次,但當單位時間縮小至30 min時神經(jīng)網(wǎng)絡的表現(xiàn)僅略低于隨機森林,雖然訓練時間還是隨機森林的9倍以上。深度森林與神經(jīng)網(wǎng)絡的預測水平不相上下,但在文中問題中并沒有表現(xiàn)出相較于隨機森林模型的預測優(yōu)勢,這可能是因為深度學習相比集成學習需要更大規(guī)模的訓練數(shù)據(jù)。
圖3展示了單位時間為30 min時的機場實際容量與4個模型的預測容量,可以定性地分析各模型的回歸性能??v軸和橫軸分別是預測值和實際值,對角線表示誤差為零的狀態(tài)。因此,實際值與預測值之間的差異越顯著,偏離對角線的點越多。從分布圖展示的結(jié)果來看,SVR較多地高估了容量值;神經(jīng)網(wǎng)絡對中間容量的預測精度較高,但容易高估小容量值,低估大容量值;深度森林和隨機森林對大容量值的預測精度較高,但對極小的容量值表現(xiàn)敏感,出現(xiàn)過擬合現(xiàn)象;深度森林則因回歸結(jié)果為整數(shù),呈現(xiàn)網(wǎng)格點式對稱的分布在對角線兩邊。
圖3 機場實際容量和模型預測容量分布(30 min)Fig. 3 Distribution of actual airport capacity and model predicted capacity (30 min)
實驗中產(chǎn)生誤差的主要原因是由于實驗基于天氣條件獲取的容量值存在低于機場真實的容量值的情況,雖然在1.3節(jié)中針對實時容量數(shù)據(jù)進行了3年歷史流量最大值處理,但是仍然無法避免因數(shù)據(jù)不夠精確而產(chǎn)生的負面影響。理論上,通過擴大原始數(shù)據(jù)統(tǒng)計時間范圍,例如考慮5年、甚至10年機場歷史天氣和運行數(shù)據(jù),可以更精確地捕捉相應天氣條件下真實的機場容量值。通過對比30 min和60 min單位時間的預測結(jié)果可以發(fā)現(xiàn),通過適當提高天氣數(shù)據(jù)采集的時間密度,可以顯著減小這一誤差。
2.2.1 模型配置
由上述的實驗結(jié)果可知,不同的機器學習算法對機場天氣數(shù)據(jù)變化的魯棒性不同,各模型對大容量值和小容量值的預測效果和精度表現(xiàn)不一。依據(jù)集成學習理論,讓多個異質(zhì)模型“取長補短”組成深度集成預測模型,可以發(fā)揮出各個模型的優(yōu)勢提高魯棒性。考慮到機場實時容量的動態(tài)特征復雜,傳統(tǒng)基于回歸投票法的集成策略僅可以依據(jù)子模型預測結(jié)果求平均,不能直接關(guān)聯(lián)天氣條件與機場容量的特征關(guān)系,所以筆者將上述多層神經(jīng)網(wǎng)絡作為DER模型的子模型嵌入,并通過構(gòu)建網(wǎng)絡加權(quán)融合層連接其他3個子模型,將具有相同輸入尺寸的輸入數(shù)據(jù)進行如式(5)表述的加權(quán)特征融合:
F=W1·XSVR+W2·XRF+W3·XDF+W4·XNN
(5)
式中:X為單一機器學習模型的輸出,即各機場實時容量預測值;Wi為輸入張量i的權(quán)重向量;“·”為Hadamard積。
DER模型中的權(quán)重向量W在訓練前隨機初始化,可在子模型和加權(quán)融合層的反向傳播中實現(xiàn)權(quán)重矩陣的迭代更新,充分利用深度學習對非線性數(shù)據(jù)的特征學習能力,進一步加深并優(yōu)化DER預測模型的整體結(jié)構(gòu)。圖4展示了DER模型的結(jié)構(gòu),其通過神經(jīng)網(wǎng)絡ADD層加權(quán)融合多種機器學習模型的預測結(jié)果,最終通過全連接Dense層與39個神經(jīng)元鏈接產(chǎn)生最終的輸出數(shù)據(jù)。DER模型的參數(shù)使用K折交叉驗證方法,運用RandomizedSearchCV函數(shù),在1E-3和1E-4學習率,1~4層隱藏層,和[2, 4, 8, 16, 32, 64]個神經(jīng)元數(shù)量中,確定最優(yōu)參數(shù)組合為學習率0.001,2層隱藏層包含的神經(jīng)元個數(shù)分別為16和32。
圖4 深度集成預測模型結(jié)構(gòu)Fig. 4 Structure of DER model
2.2.2 結(jié)果及討論
如圖5,DER模型同時優(yōu)化了小容量值和大容量值的預測誤差,散點集中分布于對角線兩側(cè),其中ERMSE在單位時間為30、60 min的結(jié)果為1.761和2.428。DER模型融合了多個模型算法,比單一的機器學習模型表現(xiàn)出了更好地擬合性能,有效提升機場實時容量預測的準確性。
圖5 深度集成預測模型預測結(jié)果Fig. 5 Predication results of DER model
中國華東地區(qū)在每年的冬、春、夏三季會出現(xiàn)雨雪、大霧、臺風等影響航班運行的天氣現(xiàn)象,對當?shù)貦C場的實時容量產(chǎn)生復雜影響。所以筆者選擇華東地區(qū)12家千萬級機場(由北到南為:濟南遙墻、青島流亭、合肥新橋、南京祿口、上海虹橋、上海浦東、寧波櫟社、杭州蕭山、溫州龍灣、南昌昌北、福州長樂和廈門高崎)組成的機場網(wǎng)絡為測試對象,從2019年4個季節(jié)中提取發(fā)生不利天氣的時區(qū):① 1月23日—26日,初春大霧;② 6月25日—28日,梅雨;③ 8月9日—12日,臺風“利奇馬”;④ 12月8日—11日,雨雪,共計16個單位日。并以單位時間30 min的各機場天氣和航班運行數(shù)據(jù)為測試算例(不存在于訓練數(shù)據(jù)中),測試模型在復雜天氣條件下的預測效果。
從圖6展示的預測結(jié)果可以發(fā)現(xiàn),不同天氣現(xiàn)象對機場實時容量的影響在時空分布上存在較大差異(顏色越深代表機場實時容量越低)。例如:大霧多出現(xiàn)于夜晚和清晨;梅雨會對長江中下游地區(qū)的10家機場造成持續(xù)性影響;臺風過境會對沿海機場造成嚴重影響;北方機場受冬季雨雪影響更嚴重。
圖7展示了各模型在不同天氣現(xiàn)象下,對上海浦東國際機場(PVG)實時容量的預測結(jié)果,其中折線圖反映容量在時間維度上的波動情況,條形圖表示各模型的預測誤差。對比結(jié)果發(fā)現(xiàn),在臺風天氣條件下的預測精度最低。這是由于臺風變化迅速,不僅影響機場還會影響航路空域的飛行安全,所以航班計劃會在事先被過多干預,且臺風這類極端天氣樣本占比過小,會直接影響機場實時容量的預測精度。
結(jié)合表6中各模型的預測性能指標,發(fā)現(xiàn)神經(jīng)網(wǎng)絡對天氣數(shù)據(jù)的泛化能力強于其他算法,可以更好的描述復雜天氣與機場實時容量的映射關(guān)系。由于預測天氣的復雜程度高,各模型的預測表現(xiàn)均明顯低于驗證時的預測表現(xiàn)。神經(jīng)網(wǎng)絡的預測精度雖然有所下降但卻成了預測精度最高的單一算法模型,深度森林雖然分類能力強,但在回歸時由于不能夠做出超越訓練集數(shù)據(jù)范圍的預測,使得其預測表現(xiàn)低于其他模型。在復雜天氣條件下,DER模型的預測表現(xiàn)要明顯優(yōu)于單一算法模型,這歸功于集成學習和深度神經(jīng)網(wǎng)絡強大的特征學習能力,有效提升了機場實時容量的預測精度。在機場容量實時預測實驗中,DER模型通過融合多種算法可以有效提升機場的的預測精度。此外,模型預測24 h實時容量所需的時間在5 s以內(nèi),滿足實際操作中的實時預測的需求。
表6 上海浦東機場運行數(shù)據(jù)的模型評估結(jié)果Table 6 Model evaluation results of operation data of PVG
1)首次提出了非飽和運行狀態(tài)下受天氣影響的機場實時容量提取辦法。提出在非線性氣象條件影響下的機場實時容量多等級提取方法,有效解決機場實時容量在隨機天氣因素影響下難以確定的問題。并運用支持向量回歸、神經(jīng)網(wǎng)絡、隨機森林和深度森林4種機器學習算法挖掘天氣與機場容量之間的特征關(guān)系,首次構(gòu)建依據(jù)動態(tài)機場天氣預報數(shù)據(jù)實時預測機場容量時空分布的機器學習模型。
2)首次運用神經(jīng)網(wǎng)絡加權(quán)融合層構(gòu)建融合多種算法的深度集成預測模型DER。通過在子模型中嵌入多層神經(jīng)網(wǎng)絡,再運用神經(jīng)網(wǎng)絡融合層對其他子模型預測結(jié)果進行賦權(quán)組合,并利用反向傳播機制更新網(wǎng)絡中的權(quán)重矩陣,達到充分學習天氣條件與機場容量的特征關(guān)系的目的。實驗結(jié)果表明,該方法可以結(jié)合多個機器學習預測模型的優(yōu)勢,對復雜天氣條件下的機場實時容量預測有較好提升效果,并且滿足實時預測多機場容量時空分布的要求。預測結(jié)果可以用于動態(tài)度量交通時空供給量,并可從供需平衡的角度通過需求平移(延誤)手段調(diào)整航班運行計劃,為航班運行控制決策提供數(shù)據(jù)支持,提高航空運輸系統(tǒng)運行效率。
3)應用中國民航3年的歷史運行大數(shù)據(jù),比較了單位時間30、60 min的天氣采集精度對各模型預測精度的影響。從實驗結(jié)果可以看出,模型預測精度隨著單位時間的增加而減少,這說明天氣對機場容量的影響具有時效性,所以提高天氣數(shù)據(jù)的采集密度可以提高機場實時容量的預測精度。另外,通過將大規(guī)模的歷史天氣數(shù)據(jù)關(guān)聯(lián)航班運行數(shù)據(jù),也可以有效提高機場實時容量的評估的準確性。
4)在實際運行中,天氣預報是預測未來機場容量狀態(tài)的主要判斷依據(jù),而天氣預報在預測未來天氣上存在不確定性,其預測精度會影響最終的判斷結(jié)果,這對機場容量的動態(tài)預測造成困難。研究天氣預報與真實天氣之間的差異有助于提高模型的魯棒性,是未來研究的努力方向。另一方面,隨著時間的推移,天氣數(shù)據(jù)的采集點可以進行動態(tài)擴充。例如出現(xiàn)歷史未出現(xiàn)的天氣狀況,相同天氣條件下機場運行流量大于歷史最大運行流量的情況,或機場自身進行改擴建等情況。隨著新采集數(shù)據(jù)的加入,及時修改預測模型參數(shù)值,可以達到實時建模動態(tài)預測的目的。所以未來的研究方向需要考慮數(shù)據(jù)的動態(tài)更新。