屈遠,高志一,蔡靖澤,王久珂,侯放
(國家海洋環(huán)境預報中心,北京 100081)
海浪預報是對未來某時段內(nèi)海區(qū)或部分海域可能出現(xiàn)的海浪狀況所作的預測。海浪預報對保障海上和岸邊人員的生命和財產(chǎn)安全以及海洋生產(chǎn)作業(yè)降本增效有重要作用。海上航行和作戰(zhàn)等活動催生了現(xiàn)代海浪預報業(yè)務。在很長一段時間里,人工經(jīng)驗預報能很好地滿足海上避浪需求[1]。20 世紀80 年代以來,衛(wèi)星遙感、地球系統(tǒng)數(shù)值模擬以及近海和近岸工程等新領域需要更精細化的甚至包含波浪內(nèi)部結(jié)構(gòu)的海浪預報產(chǎn)品[2]。這些預報需求是經(jīng)驗預報無法滿足的,因此數(shù)值預報逐漸成為海浪預報業(yè)務的核心方法。近年來,在碳達峰和碳中和國家重大戰(zhàn)略決策的引領下,節(jié)能增效和發(fā)展新能源成為全社會的共同目標[3-4]。預報行業(yè)本身就是高耗電行業(yè)之一,每年因數(shù)值計算產(chǎn)生的耗電量巨大,降低計算能耗勢在必行。與此同時,海洋新能源行業(yè)的快速發(fā)展,行業(yè)對海浪預報的靈活性、時效性和便捷性提出了更高要求,甚至要求預報系統(tǒng)下沉部署到行業(yè)一線[5]。經(jīng)驗預報和數(shù)值預報由于人工成本高和計算條件要求高等問題難以滿足需求,在這種背景下數(shù)據(jù)驅(qū)動型海浪智能預報(Artificial Intelligent,AI)應運而生。海浪智能預報以深度神經(jīng)網(wǎng)絡模型為主要工具,需要合理設計網(wǎng)絡結(jié)構(gòu)以滿足浪場時空序列預測要求[6-8]。模型的預測能力源于神經(jīng)網(wǎng)絡從大量風-浪資料里學到的浪場運動的受迫性和記憶性規(guī)律,即浪場對風強迫的響應規(guī)律和浪場傳播耗散規(guī)律。智能預報的預報原理與經(jīng)驗預報和數(shù)值預報十分不同,由此產(chǎn)生的業(yè)務效益提升非常顯著。本文利用基于卷積-長短記憶機制的深度神經(jīng)網(wǎng)絡預報模型搭建了海浪智能預報系統(tǒng)并開展業(yè)務化試運行,為建設計算精度高、速度快、可輕量化部署的海浪智能預報系統(tǒng)提供了一種有效的方案,可以促使海浪預報更好地響應國家倡導和滿足新興行業(yè)要求。
經(jīng)驗預報、數(shù)值預報和智能預報3 類技術(shù)出現(xiàn)的時代不同(見圖1),其理論依據(jù)、技術(shù)路線與業(yè)務化應用場景迥異。經(jīng)驗預報主要應用于海洋科學層面,其基于風、浪觀測數(shù)據(jù)的規(guī)律總結(jié),抓住海浪宏觀特征與風速、風區(qū)和風時的關(guān)系,適用于有長期氣象與海浪觀測資料積累的單點預報及客觀結(jié)果人工訂正。數(shù)值預報主要應用于物理海洋學層面,其基于海浪譜理論和計算機技術(shù),能夠從海浪內(nèi)部結(jié)構(gòu)角度定量且客觀地實現(xiàn)海浪場預報,因此廣泛適用于海浪業(yè)務化預報。智能預報憑借大數(shù)據(jù)理論,利用基于圖形處理器(Graphics Processing Unit,GPU)計算的深度神經(jīng)網(wǎng)絡挖掘數(shù)值模擬等方法獲得的浪場資料,從中學習海浪宏觀特征場的時空演化規(guī)律并實現(xiàn)預報,適用于野外和遠洋等計算資源不足且須提供實時預報服務的現(xiàn)場預報保障。
圖1 海浪預報技術(shù)發(fā)展歷程Fig.1 History of wave prediction technology development
海浪經(jīng)驗預報基于大量風、浪觀測數(shù)據(jù),建立風-浪成長關(guān)系模型并作為預報依據(jù)。這種方法因軍事需求于20 世紀40 年代開始發(fā)展,由于僅需要預報員的經(jīng)驗即可快速便捷地制作海浪預報圖并提出預報意見,一直在海洋預報業(yè)務中發(fā)揮著重要作用。如今預報員并不是根據(jù)經(jīng)驗直接做預報,而是根據(jù)經(jīng)驗修正數(shù)值預報和其他客觀預報的結(jié)果,并給出綜合預報結(jié)論,因此又被稱為“綜合預報”。在應對臺風、氣旋-高壓配合和強冷空氣等惡劣天氣引起的災害性海浪過程時,綜合預報整體表現(xiàn)較好,預報員的經(jīng)驗對糾正數(shù)值預報的偏差具有重要意義。目前,綜合預報仍在日本氣象廳、韓國氣象廳、我國國家和地方(含臺灣地區(qū))等多個預報機構(gòu)得到廣泛應用[9-15]。海浪經(jīng)驗預報流程如圖2a 所示。預報員1 個工作周期為3 d:第一天,預報員收集整理實況觀測和天氣分析產(chǎn)品并繪制浪場實況圖,在頭腦中建立基本天氣形勢圖景,與前一預報員共同研判天氣形勢并交接注意事項;第二天,預報員收集整理最新的風-浪預報產(chǎn)品以及實況觀測資料,形成綜合預報思路,然后訂正繪圖并編制預報結(jié)論并與后一預報員交接;第三天,預報員結(jié)合新一天的實況分析結(jié)果評判前一天預報結(jié)論的精度并修正經(jīng)驗。
海浪數(shù)值預報以海浪譜理論為基礎,利用計算機求解譜平衡方程來預測浪場的時空演化。海浪譜模式即求解譜平衡方程的計算機程序,歷經(jīng)三代發(fā)展已經(jīng)成為數(shù)值預報的主要工具[16-28]。目前,先進的第三代海浪譜模式具有較完善的物理機制,可以描述海浪內(nèi)部能量相對于頻率和方向的分布,直接計算無形狀限制的波-波非線性相互作用,還可模擬波浪與外部環(huán)境間的相互作用(如波-流相互作用,波-風相互作用、底摩擦變化及岸線影響形成的波浪變淺、折射、繞射、變形和破碎)以及海浪的空間傳播[29]。利用第三代海浪譜模式可以了解未來兩周全球任意海域的海浪狀況[30]。當前,國際主流的業(yè)務化數(shù)值模式包括:波浪模式(WAve Modelling,WAM)、海浪觀測模式(WAVEWATCHⅢ,WW3)、近岸海浪模式(Simulating WAves Nearshore,SWAN)和 海 洋 數(shù) 值 模 式(MArine Science and NUmerical Modeling,MASNUM)等,數(shù)值預報流程圖如圖2b 所示。系統(tǒng)首先通過數(shù)據(jù)同化或資料融合等方法生成模式初始條件,這一步驟需要驅(qū)動場數(shù)值分析及實況觀測資料、海浪模式熱啟動文件及實況觀測資料和地理信息等數(shù)據(jù)支持;然后,數(shù)值模式錄入預報驅(qū)動場和初始場開始計算并制作產(chǎn)品;最后,定期進行數(shù)值預報產(chǎn)品精度檢驗,并根據(jù)檢驗結(jié)果對數(shù)值模式關(guān)鍵參數(shù)調(diào)優(yōu)。
圖2 3種海浪預報技術(shù)流程圖Fig.2 Flow charts of three wave prediction techniques
海浪智能預報是利用智能模型來推理浪場的時空演化。這里智能模型通常是指利用神經(jīng)網(wǎng)絡對風-浪實況大數(shù)據(jù)進行信息挖掘構(gòu)建的數(shù)據(jù)驅(qū)動智能模型。早在21 世紀初人們就嘗試將智能模型引入預報業(yè)務,提出如多層前饋(Back Propagation,BP)神經(jīng)網(wǎng)絡、長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡、動態(tài)貝葉斯網(wǎng)絡(Dynamic Bayesian Network,DBN)等模型[31-36],但這些模型由于本身性能原因僅能完成單點預測或數(shù)值產(chǎn)品大面訂正任務。2010 年后,數(shù)據(jù)學習能力更強的深度神經(jīng)網(wǎng)絡模型開始出現(xiàn)。JAMES 等[6]應用基于BP神經(jīng)網(wǎng)絡的多層感知器(MultiLayer Perceptron,MLP)和 支 持 向 量 機(Support Vector Machine,SVM)實現(xiàn)了海灣尺度浪場預測;ZHOU 等[7]提出利用卷積長短期記憶網(wǎng)絡(Convolutional LSTM Network,ConvLSTM)來學習中國近海無驅(qū)動浪場的演化;LIU等[8]提出了一種多通道卷積神經(jīng)網(wǎng)絡并實現(xiàn)了渤海和黃海的風浪預報。上述模型均存在對風強迫作用、浪場傳播和耗散規(guī)律學習不足或網(wǎng)絡規(guī)模偏小等問題,不能刻畫大洋-海域尺度非平穩(wěn)態(tài)浪場的時空演化,如氣旋等快變天氣系統(tǒng)激發(fā)的浪場跨洋傳播,因此,這些模型無法應用于實際預報業(yè)務。國家海洋環(huán)境預報中心新近提出了一種達到實用化水平的深度神經(jīng)網(wǎng)絡模型,即驅(qū)動場強迫卷積長短記憶模型(Driving Field Forced ConvLSTM,DFF-ConvLSTM),其智能預報流程如圖2c所示。從圖中可以看出,該智能預報系統(tǒng)的流程與數(shù)值預報系統(tǒng)幾乎一致,除生成模型初始條件不同外,模型推理預報和定期檢驗調(diào)優(yōu)與數(shù)值預報系統(tǒng)完全相同。各個模型通用的輸入資料為近實時風場,近實時浪場、實況觀測以及地理信息數(shù)據(jù)則根據(jù)模型結(jié)構(gòu)和能力按需輸入。
目前,在實際的海浪預報業(yè)務中,各預報技術(shù)通常搭配使用以發(fā)揮各自優(yōu)勢,預報員敏銳的直覺對判斷形勢場的重要轉(zhuǎn)折點有獨特優(yōu)勢,豐富的經(jīng)驗對訂正客觀預報結(jié)果并提煉綜合預報意見尤其重要。數(shù)值預報作為業(yè)務核心,廣泛應用于全球、區(qū)域及單點的預報業(yè)務,但存在計算量大、預報系統(tǒng)建設及運維成本較高和應用場景少等不足。本文以西北太平洋作為典型的預報場景,將數(shù)值預報系統(tǒng)與智能預報系統(tǒng)進行對比,對比內(nèi)容包括系統(tǒng)預報產(chǎn)品的精度和費效比(計算速度以及可部署性)。智能預報系統(tǒng)采用DFF-ConvLSTM 網(wǎng)絡預報模型(模型結(jié)構(gòu)見圖3)。模型基本組件為ConvLSTM 單元,三重堆疊ConvLSTM 單元構(gòu)成基礎網(wǎng)絡,多個基礎網(wǎng)絡串接組成深度網(wǎng)絡。ConvLSTM單元的數(shù)學形式為:
圖3 ConvLSTM單元結(jié)構(gòu)與DFF-ConvLSTM網(wǎng)絡結(jié)構(gòu)Fig.3 ConvLSTM cell and DFF-ConvLSTM network
式中:*和°分別表示卷積和Hadamard 乘積;Xt和Ct分別為輸入和輸出;Ht為隱藏狀態(tài);(Wx·,Wc·,Wh·)為權(quán)重系數(shù);(it,ft,ot)為輸入門、遺忘門和輸出門,全部為RT×W×H維的張量;b為卷積的偏差;σ為激活函數(shù)sigmoid。這種結(jié)構(gòu)可以從數(shù)據(jù)中提取風場和浪場間關(guān)系以及周邊和局地浪場間關(guān)系。模型輸入為10 m風速U(U10m,V10m)和前一時刻海浪狀態(tài)參量有效波高、平均波長、平均波向及方向散布寬度(Hs,Lm,Dir,Spr),輸出為預報時刻 (Hs,Lm,Dir,Spr)。模型損失函數(shù)采用有效波高、平均波長、平均波向及方向散布寬度加權(quán)復合損失函數(shù),根據(jù)實際需求將有效波高權(quán)重設為最大。本文設置3個時次編碼基礎網(wǎng)絡和8 個時次解碼基礎網(wǎng)絡,其中編碼網(wǎng)絡為輸入實況風場和浪場,輸出下一時刻浪場,解碼網(wǎng)絡為輸入預報風場和前次輸出浪場,輸出下一時刻預測浪場。DFF-ConvLSTM 模型訓練集為WW3生成的1999—2009年再分析浪場;驅(qū)動場采用中國氣象局中尺度天氣數(shù)值預報系統(tǒng)全球模式(China Meteorological Administration MESOscale model,CMA-MESO)生產(chǎn)的風場,預報要素為10 m 高度風速,風場空間分辨率為0.25°,時間分辨率為3 h,預報時效為120 h;模型的空間范圍為西北太平洋(99°~165°E,0°~45°N),空間分辨率為0.1°,時間分辨率為1 h,預報時效為120 h;模型初始條件采用風-浪業(yè)務分析場;預報產(chǎn)品包括有效波高、平均波長和平均波向。作為對比的數(shù)值預報系統(tǒng)采用第三代海浪譜模式WW3(v6.07),源函數(shù)采用ST6[37];驅(qū)動場與智能預報系統(tǒng)相同;海浪模式空間覆蓋范圍、空間分辨率、時間分辨率和預報要素設置與智能預報系統(tǒng)一致;模型初始條件采用前一次預報保存的熱啟動文件。兩個預報系統(tǒng)的對比時段為2021年3月 1 日—2022 年 2 月 28 日,每天早晨運行 1 次,起報時間為前一天12時(世界時,下同)。本文采用遙感資料對不同系統(tǒng)的產(chǎn)品進行精度檢驗,并采用3 種完全不同的硬件平臺測試系統(tǒng)的費效比。
本文采用海洋二號(HY-2B)星載高度計的沿軌道資料,分季節(jié)檢驗數(shù)值預報模型和智能預報模型的預報精度和預報技能。精度檢驗指標包括均方根誤差(Root Mean Square Error,RMSE)、平均相對誤差(Average Relative Error,ARE)以及平均絕對誤差(Mean Absolute Error,MAE)。3 個參數(shù)定義如下:
式中:XF和XO分別表示預報和觀測有效波高。模式預報技能評價工具為Taylor圖[38]。該圖將預報產(chǎn)品的相關(guān)系數(shù)、均方根誤差和標準差顯示在一個極坐標圖中,可直觀地看出不同模式的預報技能高低(檢驗點越趨于參考點代表預報技能越高)。
精度檢驗結(jié)果表明(見表1),數(shù)值模型和智能模型預報精度表現(xiàn)良好。數(shù)值預報和智能預報的RMSE、ARE 和MAE 均隨預報時效的增長而增大,從春季到冬季的RMSE 有增大趨勢;冬季的ARE 最小,夏季最大,秋、冬兩季居中,這與冬季觀測有效波高總體較大有關(guān)。數(shù)值預報總體精度稍好,這是因為數(shù)據(jù)驅(qū)動智能模型是以數(shù)值模式生成的再分析資料為學習對象,學習誤差會使模型精度低于其學習對象。另外,與數(shù)值模型WW3 不同,DFFConvLSTM 是通過浪場梯度而不是以地理信息作為依據(jù)判斷岸線位置的,因此近岸區(qū)域的智能模型預報精度與數(shù)值模型差別增大。模式預報技能檢驗結(jié)果表明(見圖4),兩種模型的預報技能良好。數(shù)值模型在冬季的預報技能最優(yōu),春、秋季預報技能總體接近,夏季預報技能下降較大;智能模型預報技能的季節(jié)變化與數(shù)值模型相似,但冬季的預報技能優(yōu)勢減弱。智能模型的夏季預報技能下降較多與CMA-MESO 模型對臺風預報的準確度不理想有關(guān)。兩種模型的預報技能在春季最接近,冬季差異最大,究其原因,除去驅(qū)動場誤差的季節(jié)波動原因以外,還與智能模型推理涌浪背景場的能力弱于數(shù)值模型有關(guān)。
圖4 智能模型預報與數(shù)值模型預報精度的季節(jié)對比Fig.4 Seasonal accuracy comparison between AI model and numerical model
表1 數(shù)值模型和智能模型準確度檢驗結(jié)果Tab.1 Accuracy of numerical Model and AI Model
從總體檢驗結(jié)果來看,智能模型的預報誤差與數(shù)值預報誤差水平接近,二者預報精度相當,智能預報產(chǎn)品完全可以滿足海浪大面預報的業(yè)務應用需求,以此為基礎可以進一步探索城市、海島和航線等精細化預報業(yè)務的場景應用。
為較全面地比較智能預報和數(shù)值預報系統(tǒng)的業(yè)務表現(xiàn),本文詳細對比了兩種系統(tǒng)完成典型預報任務的費效比。測試環(huán)境跨平臺、跨系統(tǒng),其中硬件環(huán)境包括高性能GPU 服務器、主流筆記本電腦和邊緣計算設備,軟件環(huán)境因硬件平臺不同有所差異。軟硬件平臺參數(shù)和計算時間見表2所示。完成同樣的預報任務,GPU 服務器基于CPU的數(shù)值預報和基于GPU的智能預報分別耗時2 542 s和3.7 s,筆記本電腦基于CPU 和GPU 的智能預報分別耗時113 s和21 s,邊緣計算設備基于GPU 的智能預報耗時84 s。結(jié)果表明,在GPU 平臺上智能預報模型的計算效率較數(shù)值預報高近700 倍(2 542 s/3.7 s),智能預報在數(shù)據(jù)中心和邊緣計算環(huán)境中均可部署,且應用場景靈活多樣。
表2 數(shù)值模型和智能模型試運行環(huán)境Tab.2 Trial operation environment of numerical model and AI model
本文回顧了海浪預報技術(shù)經(jīng)歷的3 個階段:經(jīng)驗預報,基于觀測資料總結(jié)出風、浪的經(jīng)驗關(guān)系;數(shù)值預報,由宏觀特征深入到海浪內(nèi)部結(jié)構(gòu),利用高性能計算設備求解譜平衡方程(波作用量方程)并模擬海浪的生消和傳播過程;智能預報,由風-浪實況數(shù)據(jù)驅(qū)動,基于深度神經(jīng)網(wǎng)絡模型強大的特征提取和非線性擬合能力實現(xiàn)浪場時空演化的推理。本文利用DFF-ConvLSTM 對WW3再分析浪場進行訓練,構(gòu)建智能預報模型,并在西北太平洋海浪預報業(yè)務中與數(shù)值模型進行對比。實驗結(jié)果表明:數(shù)據(jù)驅(qū)動的智能預報已經(jīng)達到業(yè)務實用水平,具備推理大洋-海域尺度非平穩(wěn)態(tài)浪場時空演化過程的能力;智能預報準確度與數(shù)值預報接近,計算效率提升近700 倍,業(yè)務流程與數(shù)值預報系統(tǒng)幾乎完全相同且便于系統(tǒng)更新;智能預報應用場景豐富,其移動化、低成本和低功耗的優(yōu)勢將使其成為預報新業(yè)態(tài)的優(yōu)先選項,具有廣泛的應用前景。