朱玉祥,劉海文,萬文龍,姜曉飛,尕藏程林
① 中國氣象局 氣象干部培訓學院,北京 100081;
② 中國民航大學,天津 300300;
③ 東營市氣象局,山東 東營 257091
飛機顛簸,是指水平尺度介于100 m~1 km的大氣湍流所導致的飛機飛行中突然出現(xiàn)的忽上忽下、左右搖晃及機身震顫等現(xiàn)象,也稱為飛機尺度湍流(Sharman and Lane,2016)。飛機在航路上飛行時遇到顛簸而產(chǎn)生的機體搖晃和震顫,對飛機的安全會產(chǎn)生影響,嚴重時甚至會導致人員傷害和財產(chǎn)損失(Williams and Joshi,2013;申艷玲等,2017)。胡伯彥等(2022)對東亞地區(qū)晴空湍流的變化趨勢進行了預估,指出未來東亞地區(qū)垂直風切變作用的增強可能是引起晴空湍流增多的重要原因之一。Prosser et al.(2023)的研究表明,受氣候變化的影響,晴空湍流有增加的趨勢。這意味著未來乘坐飛機時可能會遇到更多的強烈顛簸。因此,對飛機顛簸的預報具有十分重要的意義和價值。最近幾年,人工智能(AI)技術在天氣預報和氣候預測中的應用取得了迅速發(fā)展,并且有多篇綜述性論文對其進行了介紹(楊淑賢等,2022;楊絢等,2022)。但目前為止,尚未見到人工智能在飛機顛簸預報中應用的綜述性論文,這不利于該領域相關科研和業(yè)務的深入開展。
因此,本文將對飛機顛簸的預報方法進行回顧,特別是人工智能(AI)方法在飛機顛簸預報中的最新應用。在此基礎上,歸納總結AI方法在飛機湍流預報中存在的主要問題和解決思路。
飛機顛簸來自大氣中的湍流,其產(chǎn)生的原因有很多,最常見的是由風的垂直切變和氣流的變形引起的晴空湍流(Sharman and Lane,2016)。根據(jù)物理機理,可以將湍流分為3種類型:晴空湍流、對流湍流、山地波湍流(Storer et al.,2019)。其中晴空湍流是由6 000 m以上自由大氣中的小尺度湍流渦流(100~2 000 m)直接產(chǎn)生的,與對流云(不包括非對流卷云)無關(Chambers,1955)。
飛機顛簸發(fā)生的范圍往往是區(qū)域性的,其水平范圍可以從幾千米到幾百千米。在高空槽脊、切變線、鋒區(qū)的彎曲部分及急流兩側容易發(fā)生顛簸。飛機顛簸和大氣湍流多發(fā)生在具有以下特性的區(qū)域:1)風的垂直切變區(qū);2)風的水平切變區(qū);3)流場的輻合或輻散區(qū);4)流場的水平變形區(qū);5)流場變化的不連續(xù)區(qū);6)強的水平溫度梯度區(qū)(干全等,2002)。
飛機顛簸的預報方法大致可以分為兩類:一類是通過對天氣環(huán)流形勢、氣象環(huán)境因子和氣象要素進行總結得到的物理特征做預報,這類方法稱為定性預報;另一類是通過高分辨率的數(shù)值模式,以及在數(shù)值模式預報基礎上的數(shù)值產(chǎn)品釋用做預報,這類方法稱為定量預報(李耀東等,1997;干全等,2002;Kim et al.,2011,2018;黃儀方和馬婷,2012;Pearson and Sharman,2017;Sharman and Pearson,2017;Storer et al.,2019;楊波等,2021;閆文輝等,2022;蔡雪薇等,2023)。圖1是這兩類飛機顛簸預報方法的示意圖,其中數(shù)值產(chǎn)品的釋用分為動力釋用和統(tǒng)計釋用,機器學習釋用可以歸類為統(tǒng)計釋用。
圖1 飛機顛簸預報分類Fig.1 Classification of aircraft turbulence forecast
預報員基于衛(wèi)星、雷達等數(shù)據(jù)進行經(jīng)驗外推做2 h以內(nèi)的臨近預報,是航空氣象預報業(yè)務的常用方法,這種預報也可以歸為定性預報。對于民用航空運營來說,為了合理地計劃與調(diào)整在有限空域中航班的空中流量和飛機起降,需要航空公司、機場和空管動態(tài)地把握分鐘和小時時間分辨率的天氣信息。因此重要天氣預報的實時化、準確化和定量化對于民航運營極其重要。這種民航空運業(yè)務的要求,已經(jīng)超過了人工定性經(jīng)驗加外推式預報的極限(周斌斌等,2016)。
隨著計算機能力的提高和衛(wèi)星、雷達等更多觀測數(shù)據(jù)在數(shù)值模式中的同化應用,數(shù)值預報取得了迅速的發(fā)展。當今發(fā)達國家的航空氣象業(yè)務預報,都是在數(shù)值模式和數(shù)值模式后處理產(chǎn)品的基礎上開展的,而飛機顛簸預報的主流趨勢也是建立在數(shù)值預報基礎之上的定量預報(李耀東等,1997;Gill and Buchanan,2014;周斌斌等,2016;朱玉祥等,2016)。
數(shù)值天氣預報(Numerical Weather Prediction,NWP)是對“臨近預報”時間范圍(即0~2 h)以外航空湍流發(fā)生和時空分布進行預報的主要手段。NWP是指根據(jù)已知的控制大氣演化的數(shù)學和物理規(guī)律,對一組離散方程在時間上進行數(shù)值積分,從而預報大氣的未來狀態(tài)(Kalnay,2002)。最終的NWP預報是一個三維大氣狀態(tài)的集合,包括風速、氣壓、濕度、位勢高度和水汽含量等變量,并在預報期內(nèi)的指定時間點輸出預報結果。由于數(shù)值預報方程組不存在解析解,所以在進行NWP計算時,需要將預報區(qū)域離散化到網(wǎng)格框中。對于大多數(shù)實時的實際業(yè)務應用,這些網(wǎng)格框的水平間距的量級為100~101km。例如,全球NWP模式(覆蓋整個地球)通常水平網(wǎng)格間距為10~30 km(Bauer et al.,2015),而許多區(qū)域(只覆蓋全球的一部分區(qū)域)數(shù)值天氣預報模式只在幾千米的水平網(wǎng)格距上運算(Benjamin et al.,2018)。相比之下,這種水平網(wǎng)格間距比航空湍流的尺度要大得多(Lindborg,1999),并且航空湍流可能在幾秒鐘內(nèi)發(fā)生,這意味著實時運行的NWP模式將無法完全分辨直接導致航空湍流的大氣環(huán)流特征。為了克服這些局限性,形式為“湍流診斷量”或“指數(shù)”的解決方案已經(jīng)被開發(fā)出來?!巴牧髟\斷量”或“指數(shù)”是由代表大尺度大氣環(huán)境的NWP預報變量導出的物理量,這些物理量是通過推測或經(jīng)驗確定的,與航空湍流的發(fā)生有關。例如,Ellrod-Knapp湍流指數(shù)是一種著名的、被廣泛使用的湍流診斷方法;它是根據(jù)Kelvin-Helmholtz不穩(wěn)定理論,基于風場的變形和垂直切變所導致的湍流生成而定義的(Ellrod and Knapp,1992)。多年來,對航空湍流背后不同物理機制的考慮產(chǎn)生了許多湍流診斷公式(Dutton,1980)。
NCEP采用單模式和多模式集合所做的美國顛簸預報采用的是Ellrod方法,英國氣象局做的全球預報采用的也是Ellrod方法,該方法通過計算風場的切變和變形來診斷顛簸的弱、中和強三個等級(Ellrod and Knapp,1992;Turp et al.,2006)。NCAR發(fā)展了一種綜合性的顛簸診斷方法(Graphical Turbulence Guidance,GTG)(Sharman et al.,2006;Sharman and Lane,2016),該方法不是用一種方法來診斷湍流,而是對12種湍流診斷方法進行權重集合,這種權重集合可以提高預報的準確率和信心(用概率給出)。比如,如果12種湍流診斷方法中有10種預報會出現(xiàn)強湍流,則強湍流出現(xiàn)的概率為10/12=83%。
人工智能是指通過計算機復現(xiàn)人類的智能。一般認為,1956年夏天在達特茅斯學院召開的會議(Dartmouth Conference)是人工智能的起源。當然,關于人工智能方面的研究更早就開始了。1950年,圖靈發(fā)表了一篇劃時代的論文,文中預言了創(chuàng)造出真正具有智能的機器的可能性(Turing,1950)。由于注意到“智能”這一概念難以確切定義,所以他提出了著名的圖靈測試:如果一臺機器能夠與人類展開對話(通過電傳設備)而不能被辨別出其機器身份,那么就可以稱這臺機器具有智能。這一簡化的定義使得圖靈能夠令人信服地說明“思考的機器”是可能的。
人工智能問世60多年來,在語音識別、圖形處理、機器翻譯、智能搜索等很多領域都得到了廣泛的應用(張鈸等,2020;吳焦蘇和李真真,2022a,b)。在氣象領域,人工智能也取得了一系列創(chuàng)新性成果和應用嘗試(Shi et al.,2017;Ham et al.,2019;賀圣平等,2021;黃亮等,2022;雷蕾等,2022;劉泉宏等,2022;謝文鴻等,2022;楊淑賢等,2022;Bi et al.,2023;Ham et al.,2023;Zhang et al.,2023)。
機器學習使用計算機從數(shù)據(jù)中學習規(guī)律,是人工智能領域最能體現(xiàn)智能的一個分支學科(周志華,2022)。機器學習的主要算法包括:線性回歸、決策樹、集成學習(Boosting、Bagging、隨機森林等)、神經(jīng)網(wǎng)絡、支持向量機、貝葉斯分類器、聚類、主成分分析、奇異值分解等。機器學習也被稱統(tǒng)計學習(李航,2019)。機器學習在飛機湍流預報中也得到了應用,并且取得了相對較好的效果(Hon et al.,2020;Muoz-Esparza et al.,2020)。
21世紀以來,深度學習從各種機器學習算法中脫穎而出。深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究,含多個隱含層的多層感知器就是一種深度學習結構,深度學習也屬于機器學習。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。深度學習的研究動機源自建立模擬人腦進行分析學習的神經(jīng)網(wǎng)絡,它試圖模仿人腦的機制來對數(shù)據(jù)進行學習和解釋。深度學習是目前科學界研究最為活躍的領域,新方法新進展層出不窮。常見的深度學習算法包括:卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)、長短期記憶網(wǎng)絡(Long Short Term Memory Networks,LSTM)、遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)、生成對抗網(wǎng)絡(Generative Adversarial Networks,GAN)、多層感知機(Multilayer Perceptrons,MLP)、自組織映射神經(jīng)網(wǎng)絡(Self Organizing Maps,SOM)、深度信念網(wǎng)絡(Deep Belief Networks,DBN)等。Hinton and Salakhutdinov(2006)提出了深度信念網(wǎng)絡,并運用反向傳播算法成功地訓練了一個具有多個隱含層的神經(jīng)網(wǎng)絡,這種算法能夠為多層聯(lián)合訓練過程找到一個好的初始值,甚至可以訓練全連接結構的神經(jīng)網(wǎng)絡,突破了此前只能訓練深度卷積神經(jīng)網(wǎng)絡(DCNN)或深度循環(huán)神經(jīng)網(wǎng)絡(DRNN)這類特殊結構的神經(jīng)網(wǎng)絡的局限性,使訓練一般的深度神經(jīng)網(wǎng)絡變得具有可行性,為工業(yè)界大規(guī)模應用深度學習做好了準備。這標志著深度學習進入了一個新時代。Hinton由于在深度學習領域的杰出貢獻,被稱為“深度學習之父”。深度學習具體的技術細節(jié)可參考Ian et al.(2016)?,F(xiàn)在大家談到的人工智能算法,往往指的就是深度學習。
綜上可見,深度學習是機器學習的一個子集,而機器學習又是人工智能的一個子集,即:深度學習<機器學習<人工智能。圖2為它們之間關系的示意圖。
圖2 人工智能、機器學習、深度學習之間關系的示意圖Fig.2 Schematic diagram of relationship among artificial intelligence,machine learning,and deep learning
淺層學習和深度學習通常都是基于人工神經(jīng)網(wǎng)絡(ANN)開展的,二者之間的區(qū)別如圖3所示。與深度學習(圖3b)相對應的是淺層學習(圖3a)。淺層學習中間的隱層只有一層,而深度學習中間的隱層可以有多層。當然,這只是二者之間關系的一個簡單的示意圖,現(xiàn)在深度學習算法的變種有很多,構造也十分復雜。
圖3 淺層學習(a)與深度學習(b)的對比示意圖Fig.3 Contrast diagram between (a) shallow learning and (b) deep learning
人工神經(jīng)網(wǎng)絡(ANN)是20世紀80年代人工智能領域興起的研究熱點,它對人大腦的神經(jīng)元網(wǎng)絡進行抽象,建立某種數(shù)學模型,按不同的方式組成不同的網(wǎng)絡。人工神經(jīng)網(wǎng)絡是一種數(shù)學上的運算模型,由大量的節(jié)點(或稱神經(jīng)元)之間相互連接而構成(圖3)。每個節(jié)點代表一種特定的輸出函數(shù),稱為激活函數(shù)。每兩個節(jié)點之間的連接都代表通過該連接的信號的加權值(稱為權重),這相當于人工神經(jīng)網(wǎng)絡的記憶。網(wǎng)絡的輸出值取決于網(wǎng)絡的連接方式、權重值和激活函數(shù)。網(wǎng)絡自身可以是對某種算法或函數(shù)的逼近,也可以是一種邏輯策略的表達。20世紀80年代中期,誤差反向傳播算法(Error Back Propagation Training,簡稱BP算法)的提出(Rumelhart et al.,1986),系統(tǒng)解決了多層神經(jīng)網(wǎng)絡隱含層連接權重的學習問題。Robert(1989)成功證明了多層感知機(是ANN的一種,結構類似于圖3a)的萬能逼近定理,即對于任何閉區(qū)間內(nèi)的一個連續(xù)函數(shù),都可以用含有一個隱含層的BP網(wǎng)絡來逼近。這一理論上的證明,極大地鼓舞了當時神經(jīng)網(wǎng)絡的研究人員,使得ANN風靡一時。
但20世紀90年代BP算法被指出存在梯度消失問題,即在誤差梯度反向傳遞的過程中,后層梯度以乘法方式疊加到前層,誤差梯度傳到前層時幾乎為0,在更新權值的時候,由于誤差梯度太小,導致權值更新很小,因此無法對前層的參數(shù)進行有效的學習。這是使用sigmoid激活函數(shù)的一大弊端。這一時期,符號學習中的決策樹、支持向量機(SVM)等算法被提出并被廣泛應用,特別是在處理線性分類的問題上取得了當時最好的成績,而ANN的研究則陷入了低谷。
不過,多倫多大學的Hinton教授并未放棄ANN的研究。功夫不負有心人,Hinton and Salakhutdinov(2006)提出了利用RBM編碼的深層神經(jīng)網(wǎng)絡(深度學習),該方法基于樣本數(shù)據(jù),通過一定的訓練方法得到了包含多個層級的深度網(wǎng)絡結構。傳統(tǒng)的神經(jīng)網(wǎng)絡隨機初始化網(wǎng)絡中的權值,導致網(wǎng)絡容易收斂到局部最小值,為了解決這一問題,Hinton and Salakhutdinov(2006)提出使用無監(jiān)督預訓練方法優(yōu)化網(wǎng)絡權值的初值,然后再進行權值的微調(diào)。這使得深層神經(jīng)網(wǎng)絡變得實用起來,從此拉開了深度學習大發(fā)展的序幕。2012年10月,Hinton教授和他的兩個學生采用深層的卷積神經(jīng)網(wǎng)絡模型在著名的ImageNet大規(guī)模視覺識別挑戰(zhàn)賽上取得了當時世界上的最好成績,這使得對于圖像識別的研究工作前進了一大步,也把深度學習的應用推向了一個新高度。
對于淺層模型來說,需要依靠人工經(jīng)驗來抽取樣本的特征(對于天氣預報和氣候預測問題來說,就是預報因子),模型的輸入是這些已經(jīng)選取好的特征,模型只用來負責分類和預測。在淺層模型中,最重要的工作往往不是模型的構建而是特征的選取,這樣就需要花費大量的精力用來進行特征的開發(fā)和篩選,這限制了淺層模型的應用效果。而深度學習采取的是端到端(輸入端到輸出端)的學習方法,從輸入端經(jīng)過卷積、池化、反向傳播等操作后可以得到原始數(shù)據(jù)的特征表達,基于這種特征表達,可以對原始數(shù)據(jù)進行識別與分類,在這個過程中,并沒有將學習任務分成一段一段的子任務進行分析和處理??梢?相對于淺層學習,深度學習采取了完全不同的處理手段,它是從輸入端輸入數(shù)據(jù),然后傳到中間層,通過層層抽象的方法直接得到輸入數(shù)據(jù)的特征表達,進而對這種特征表達進行分析與處理,因此它是一種端到端的學習方法,具有明顯的優(yōu)勢。
根據(jù)學習方式,機器學習可以分為監(jiān)督學習算法、非監(jiān)督學習和強化學習算法(杜智濤等,2021)。氣象問題大多都是分類問題和回歸問題,常用的是監(jiān)督學習算法,包括:多元線性回歸、邏輯回歸(LR)、隨機森林(RF)、支持向量機(SVM)、XGboost、人工神經(jīng)網(wǎng)絡(ANN)、深度學習(DL)等(朱玉祥等,2017;周志華,2022)。
機器學習在氣象領域中得到了廣泛應用,代表性工作有:雷暴預報(Williams et al.,2008)、中尺度對流系統(tǒng)預報(Ahijevych et al.,2016)、對流風實時預報(Lagerquist et al.,2017)、冰雹預報(Gagne et al.,2017a;Burke et al.,2020)、太陽輻照度預報(Gagne et al.,2017b)、2 m溫度的集合預報后處理(Rasp and Lerch,2018)、極端降水預報(Herman and Schumacher,2018)、實時風暴預報(McGovern et al.,2019)、風功率預報(Kosovic et al.,2020)和惡劣天氣預報(Hill et al.,2020)。圖4是與數(shù)值天氣預報相關的機器學習文章的統(tǒng)計結果,可見使用最多的是深度學習(DL)方法。
圖4 與數(shù)值天氣預報相關的機器學習文章統(tǒng)計(引自Bochenek and Ustrnul(2022))Fig.4 Statistics of machine learning articles related to numerical weather prediction(from Bochenek and Ustrnul(2022))
機器學習在飛機顛簸預報中應用的代表性文獻主要有如下一些。
由于數(shù)值天氣預報(NWP)模式不能明確預報飛機尺度的湍流,Abernethy et al.(2008)使用支持向量機和邏輯回歸算法來捕捉大尺度大氣條件與湍流之間的關系,并應用于晴空湍流預報,結果表明該算法可以應用于實時預報湍流預報系統(tǒng)。
Williams(2014)基于來自商用飛機的客觀湍流報告和模式預報數(shù)據(jù),采用隨機森林算法構建適合空中交通管理人員、調(diào)度員和飛行員使用的湍流預報,該算法于2014年在美國國家氣象局航空氣象中心得到應用。
Hon et al.(2020)應用XGboost算法,通過一個NWP模式生成的一組傳統(tǒng)“湍流指數(shù)”的優(yōu)化組合,生成了有技巧的航空湍流預報。經(jīng)過1 a時間,對16 000多架飛機飛行員報告的驗證表明,基于機器學習的多指數(shù)共識(MIC)在亞太地區(qū)表現(xiàn)出一致的優(yōu)越性能,與單獨考慮湍流指數(shù)相比,技巧評分的中值提高了3%~17%。
Emara et al.(2021)將分類和回歸監(jiān)督機器學習模型與從6 000次常規(guī)航班收集的飛行運營質(zhì)量保證數(shù)據(jù)結合使用,來估計未來時段內(nèi)的EDR以及湍流嚴重程度。為此,他們收集和分析了航空公司日常運營中遇到不同程度湍流的數(shù)據(jù)。結果表明,在遇到湍流事件前10 s左右,模型能夠很好地預測EDR和湍流嚴重程度。該模型可以獲得對未來可能發(fā)生的湍流事件的近乎連續(xù)的預測,并為飛行員和空乘人員建立了早期預警系統(tǒng)的能力。
可能是由于受到湍流數(shù)據(jù)在時間和空間覆蓋范圍上的限制,或者受到學識所限,深度學習在飛機顛簸預報中應用的文獻尚未見到。
目前的數(shù)值預報模式,時空分辨率越來越高,參數(shù)化方案越來越精細,致使模式越來越復雜。而數(shù)值模式越復雜,就意味著要搜集更多氣象數(shù)據(jù),進行更大量的計算,這對算力的消耗非常大。如 0.25°×0.25°精度的未來10 d數(shù)值預報,需在超過3 000個節(jié)點的超級計算機上花費數(shù)小時,這讓數(shù)值預報的預測速度難以進一步提升(Bi et al.,2023)。而飛機湍流預報更是需要十分精細的時空分辨率,采用數(shù)值模式開展飛機湍流預報,對計算資源的花費更高。
AI預報的出現(xiàn),給天氣預報帶來了新思路。AI擅長擬合未知的復雜數(shù)據(jù)關系,它不需要熟知大氣運動中的物理原理,只需要用深度學習的方法擬合氣象數(shù)據(jù)中的關系,就能做天氣預報。數(shù)值預報無法給出分鐘級的氣象預報,而AI方法擬合雷達回波、衛(wèi)星遙感及臺站觀測等數(shù)據(jù)的能力,超過了光流法等外插方法,這使AI方法能更快(甚至在幾秒鐘內(nèi))做出天氣預報。
谷歌公司首次引入注意力機制,發(fā)展了“MetNet”系列預報模型,該模型輸入雷達和衛(wèi)星等觀測數(shù)據(jù),可以預報出降水的概率分布;該模型實現(xiàn)了1 km空間分辨率、2 min時間分辨率的12 h時效降水預報,回報性能超過了NOAA的高分辨率快速更新天氣模式(HRRR)(Espeholt et al.,2021)。英偉達公司憑借其強大的算力資源,構建了“FourCastNet”全球預報模型,其預報性能與歐洲中期天氣預報中心(ECMWF)的綜合預報系統(tǒng)(IFS)相當(Pathak et al.,2022)。
華為開發(fā)的盤古氣象大模型提供的Z500五天預報均方根誤差為296.7,顯著低于之前最好的數(shù)值預報方法(均方根誤差為333.7)和AI方法(均方根誤差為462.5)。在保持精度的同時,盤古氣象大模型也有著無可比擬的預報速度:在一張V100顯卡上只需要1.4 s就能完成24 h的全球氣象預報,相比傳統(tǒng)數(shù)值預報提速10 000倍以上(Bi et al.,2023)。
復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院聯(lián)合大氣與海洋科學系發(fā)布了伏羲氣象大模型(https://arxiv.org/pdf/2306.12873.pdf)。該模型利用AI算法實現(xiàn)未來15 d的全球天氣預報,在15 d預報中具有與ECMWF集合平均(EM)相當?shù)念A報性能。伏羲超過了ECMWF高分辨率預報(HRES)的預報技巧時效,將Z500的預報時效從9.25 d延長到10.5 d,將2 m溫度的預報時效從10 d延長到14.5 d。
清華大學軟件學院王建民、龍明盛團隊提出了極端降水臨近預報大模型,將數(shù)據(jù)驅動與物理驅動兩大科學范式緊密結合,顯著提高了千米尺度下0~3 h極端降水的預報能力,在全國62位氣象預報專家的過程檢驗中大幅領先國際上的同類方法。目前該大模型已經(jīng)在國家氣象中心短臨預報業(yè)務平臺(SWAN 3.0)部署上線,將為全國極端降水天氣短臨預報業(yè)務提供支撐(Zhang et al.,2023)。
這些氣象大模型的開發(fā)和業(yè)務化運行,給飛機湍流預報奠定了基礎;基于這些大模型的輸出結果,飛機湍流預報可得實現(xiàn)。
未來的人工智能必將從通用大模型發(fā)展到行業(yè)或專業(yè)大模型,AI技術為提升飛機顛簸預報能力提供了難得的機遇。雖然國內(nèi)外對AI技術(主要是其中的子集機器學習)在飛機顛簸中的預報進行了大量研究,但還存在以下幾個值得重點關注的問題:
1)飛機實況數(shù)據(jù)的開放共享以及多源湍流數(shù)據(jù)的融合構建問題。比如,AMDAR(Aircraft Meteorological Data Relay)數(shù)據(jù)是通過民航班機的自動觀測儀器觀測得到的氣象信息,主要包括:觀測時的經(jīng)度、緯度、飛行高度、氣溫、風向、風速、導出等效垂直風速DEVG、湍流耗散率EDR、飛機結冰程度等。其中DEVG和EDR可以作為飛機顛簸程度的指標,在AI模型的訓練中特別有用。但目前,該數(shù)據(jù)并未開放共享,這給飛機顛簸預報的研究帶來了很大的困難。當然,基于這些飛機觀測數(shù)據(jù),融合飛行員話音報(PIPEPs)、衛(wèi)星、雷達等多源數(shù)據(jù)做出一套時空覆蓋完整的EDR數(shù)據(jù),對于相關科研和業(yè)務的開展具有重要意義。深度學習在數(shù)據(jù)插補和多源數(shù)據(jù)融合中正在發(fā)揮越來越大的作用,比如Ma et al.(2023)采用深度學習方法建立了一套1979年以來北極地區(qū)1°×1°格點月平均地表氣溫資料和2010年之后的北極地區(qū)日平均溫度資料,這為在數(shù)據(jù)稀疏的北極地區(qū)開展科學研究奠定了堅實的數(shù)據(jù)基礎。
2)以深度學習為代表的大模型和以傳統(tǒng)的統(tǒng)計學習或機器學習為代表的小模型之間的關系,以及深度學習的可解釋性問題?,F(xiàn)在的研究大多數(shù)都表明深度學習模型具有優(yōu)勢,但深度學習是有代價的,需要足夠多和足夠精確的數(shù)據(jù)以及昂貴的計算資源。當數(shù)據(jù)和計算資源都受限時,傳統(tǒng)的統(tǒng)計學習或機器學習可能更實用。開展飛機顛簸預報研究,能拿到的飛機觀測數(shù)據(jù)往往只是航路上的,時間也只是飛機飛行時才有,這時采用統(tǒng)計學習或機器學習的小模型可能更實用。對于構建飛機顛簸預報模型來說,可解釋性也是一個十分重要的問題,相比于參數(shù)數(shù)量十分龐大的深度學習大模型,傳統(tǒng)的統(tǒng)計模型在可解釋性方面具有明顯優(yōu)勢。
3)基于集合預報的概率預報值得深入研究。湍流的高瞬態(tài)和局地性意味著飛機顛簸的確定性預報十分困難。從概率論的觀點來看,飛機顛簸是隨機變量,因此只有采用概率分布才能對其進行準確的描述。相對于單一預報,集合預報或集成預報具有明顯的優(yōu)勢。無論是深度學習還是傳統(tǒng)的統(tǒng)計學習,集合預報的表現(xiàn)往往都比單一預報更好,其原因可能是每個單獨的模型或成員擅長捕捉不同的模態(tài),將它們的預報結果結合起來,可以識別復雜的模態(tài),因而能夠取得更好的預報效果。由于飛機湍流的尺度小,單一模式或方法的不確定性往往更大。因此,基于集合預報或集成預報,開展飛機湍流的概率預報極具實用價值。而更節(jié)省計算機機時的人工智能大模型為開展飛機湍流的概率預報提供了便利條件。
湍流是飛機飛行過程中遇到的一種影響巨大的災害性天氣,其準確預報對于減輕災害影響具有十分重要的意義。但由于受計算機資源和數(shù)值模式發(fā)展水平的限制,數(shù)值模式目前尚無法直接模擬出湍流渦旋,所以湍流預報的準確率離防災減災需求還存在不小差距,人工智能技術的發(fā)展為開展更加深入的研究并用來提高飛機顛簸的預報準確率提供了條件。
相比傳統(tǒng)的數(shù)值模式,氣象AI大模型大大節(jié)省了計算機時,這為開展高精度的湍流預報提供了新的機遇和條件。目前的人工智能技術在氣象預報和湍流預報中的應用,大都是基于歷史數(shù)據(jù)的關系擬合,本質(zhì)上屬于統(tǒng)計學習的范疇。目前的深度學習技術,說到底就是對由人工神經(jīng)元網(wǎng)絡構成的非線性函數(shù)在大數(shù)據(jù)上所做的擬合,這種學習行為使得它在應用的普適性上有很大的優(yōu)勢,滿足了我們讓機器“做得多”的要求,但是其結果的可靠性和合理性無法得到完備的驗證,這是因為我們尚無法理解深度學習結果生成的邏輯,無法完美解釋學習的認知行為。
人工智能自誕生以來,在其發(fā)展歷程中,一直存在兩種相互競爭的范式,即符號主義與聯(lián)接主義。符號主義認為人工智能起源于數(shù)理邏輯,旨在用數(shù)學和物理學中的邏輯符號來表達思維的形成,通過大量的“如果(if)-就(then)”規(guī)則進行定義,產(chǎn)生像人一樣的推理和決策。符號主義強調(diào)思維過程的邏輯性,側重于推理和解決問題的思路。聯(lián)結主義又稱仿生學派或生理學派,其主要原理為神經(jīng)網(wǎng)絡及神經(jīng)網(wǎng)絡間的連接機制與學習算法。它通過模擬人類大腦的神經(jīng)系統(tǒng)來實現(xiàn)學習。聯(lián)結主義認為知識和技能的獲取是通過對大量數(shù)據(jù)進行學習來實現(xiàn)的。
符號主義和聯(lián)結主義幾乎同時起步,但20 世紀80 年代之前符號主義一直占據(jù)主導地位,而20 世紀90 年代之后聯(lián)接主義逐步發(fā)展起來,進入21 世紀后更是迎來了發(fā)展的高潮,大有替代符號主義之勢。張鈸等(2020)稱符號主義為第一代AI,稱聯(lián)接主義為第二代AI,將要發(fā)展的AI 稱為第三代AI。第一代AI是知識驅動的,即利用知識、算法、算力3個要素構造AI。第二代AI是數(shù)據(jù)驅動的,即利用數(shù)據(jù)、算法、算力3個要素構造AI。
20世紀80年代我國就開始了氣象人工智能的研究和業(yè)務嘗試,包括專家系統(tǒng)、人工神經(jīng)元網(wǎng)絡、智能數(shù)據(jù)庫、天氣過程的計算機理解和仿真、衛(wèi)星云圖的分析識別等方面(王耀生,1994)。氣象領域大量的觀測、分析、再分析等數(shù)據(jù)為建立人工智能大模型提供了條件和便利,這可能也是目前氣象領域AI大模型如雨后春筍般不斷涌現(xiàn)的一個原因(Bi et al.,2023;Zhang et al.,2023)。但目前人工智能在氣象領域的應用,基本上還是屬于第二代AI。張鈸等(2020)認為符號主義和聯(lián)接主義兩種范式只是從不同的側面模擬人類的心智(或大腦),具有各自的片面性,依靠單個范式不可能觸及人類真正的智能;他提出第三代人工智能的發(fā)展路徑是融合第一代的知識驅動和第二代的數(shù)據(jù)驅動的人工智能,同時利用知識、數(shù)據(jù)、算法和算力4個要素,建立新的可解釋和魯棒性的AI理論與方法,發(fā)展安全、可信、可靠和可擴展的AI技術。基于這種思想,我們對氣象領域的第一代和第二代人工智能進行了歸納,并提出了氣象領域第三代人工智能的發(fā)展思路(圖5)。
圖5 氣象領域三代人工智能的發(fā)展路徑Fig.5 Development path of the third generation of artificial intelligence in the field of meteorology
對于氣象領域來說,“知識”可以是物理機理,也可以是預報員的經(jīng)驗,或者是天氣學、氣候學等方面的基本原理。氣象第一代人工智能是采用數(shù)理邏輯、歸納、類比等算法,基于“知識”自動形成推理原則,代表應用為氣象專家系統(tǒng)、氣象智能數(shù)據(jù)庫。多元線性回歸、SVM、決策樹、隨機森林等算法,可以歸為第一代人工智能算法。氣象第二代人工智能主要采用ANN、深度學習等算法,基于模式數(shù)據(jù)和觀測數(shù)據(jù)做天氣預報和氣候預測,代表應用為華為的盤古氣象大模型。氣象領域未來的第三代人工智能可能要以深度學習為主,融合數(shù)理邏輯推理算法,同時基于“知識”和“數(shù)據(jù)”,即把聯(lián)結主義學派和符號主義學派的優(yōu)勢結合起來,開展天氣預報和氣候預測工作。當然,氣象第三代人工智能需要具有更高的預報準確率,具有自學習、自適應(比如適應由于氣候變化導致的氣象數(shù)據(jù)規(guī)律的變化等)等特點,同時在機理上具有較好的可解釋性。
對于氣象預報和飛機湍流預報來說,把基于數(shù)據(jù)驅動的人工智能與以牛頓力學為基礎的物理定律相融合,是增強氣象大模型或湍流預報大模型的可解釋性、魯棒性并且提高預報準確率的重要途徑。對于在業(yè)務上開展概率預報來說,人工智能大模型節(jié)省計算機時的優(yōu)越性更是具有重要的實用價值。
致謝:國家氣象中心蔡雪薇高工對本文提出了建設性意見,在此致以最誠摯的感謝!