国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

全球高分辨率海洋預(yù)報(bào)系統(tǒng)中的SST 預(yù)報(bào)偏差校正

2023-07-29 11:48:00謝波濤黃必桂尹訓(xùn)強(qiáng)王志翔楊永增
海洋科學(xué)進(jìn)展 2023年3期
關(guān)鍵詞:個(gè)數(shù)校正偏差

劉 波,謝波濤,黃必桂,尹訓(xùn)強(qiáng),王志翔,楊永增

(1. 自然資源部 第一海洋研究所,山東 青島 266061;2. 自然資源部 海洋環(huán)境科學(xué)與數(shù)值模擬重點(diǎn)實(shí)驗(yàn)室,山東 青島 266061;3. 山東省海洋環(huán)境科學(xué)與數(shù)值模擬重點(diǎn)實(shí)驗(yàn)室,山東 青島 266061;4. 中海油研究總院有限責(zé)任公司,北京 100028)

隨著社會(huì)的發(fā)展,陸地資源不斷被消耗,各國(guó)紛紛將目光轉(zhuǎn)向海洋索取資源,加快了海洋研究進(jìn)展[1]。由于海洋資源開發(fā)帶來的海洋活動(dòng)日益增多,海洋預(yù)報(bào)技術(shù)越來越受到人們的關(guān)注和重視。海洋預(yù)報(bào)基于對(duì)海洋過去和現(xiàn)在的狀態(tài)與演變規(guī)律,結(jié)合數(shù)值模式、觀測(cè)結(jié)果和數(shù)據(jù)同化等多種手段,對(duì)不同時(shí)空尺度上的海洋現(xiàn)象及海洋狀況(海水溫度及鹽度、海流、潮汐、海浪和海冰等)進(jìn)行預(yù)測(cè)[2]。海表面溫度(Sea Surface Temperature,SST)是一個(gè)非常重要的海洋水文要素,它不僅是表征地球表面能量平衡的重要參數(shù),也是衡量海水熱量的關(guān)鍵指標(biāo),對(duì)全球的氣候以及生態(tài)系統(tǒng)有著重要影響[3]。因此對(duì)SST 的變化規(guī)律進(jìn)行研究和預(yù)報(bào)預(yù)測(cè)是海洋和大氣研究與應(yīng)用的一項(xiàng)重要內(nèi)容。目前對(duì)SST 預(yù)報(bào)預(yù)測(cè)的常用方法主要有兩種[4-5]:一種是數(shù)值方法(動(dòng)力學(xué)方法),即利用動(dòng)力學(xué)、熱力學(xué)方程建立模型,給定初始狀態(tài)和邊界條件,利用高性能計(jì)算機(jī)計(jì)算來實(shí)現(xiàn)對(duì)未來狀態(tài)的預(yù)報(bào)預(yù)測(cè)[5-6];另一種是數(shù)據(jù)驅(qū)動(dòng)方法,即統(tǒng)計(jì)預(yù)報(bào)或機(jī)器學(xué)習(xí)方法,從歷史數(shù)據(jù)中尋找規(guī)律建立預(yù)報(bào)預(yù)測(cè)模型[5,7-8],數(shù)據(jù)驅(qū)動(dòng)模型可以從大批量原始數(shù)據(jù)中學(xué)習(xí)物理特征,對(duì)未來進(jìn)行預(yù)測(cè),彌補(bǔ)了部分海洋領(lǐng)域數(shù)據(jù)缺失和理論的不足[9-10]。近年來,機(jī)器學(xué)習(xí)領(lǐng)域出現(xiàn)的深度學(xué)習(xí)技術(shù)已經(jīng)證明了其比傳統(tǒng)的基于物理或統(tǒng)計(jì)的算法有著更顯著的優(yōu)勢(shì)[11-15]。數(shù)值預(yù)報(bào)由于觀測(cè)數(shù)據(jù)的時(shí)空分辨率不夠、數(shù)據(jù)自身誤差、觀測(cè)儀器系統(tǒng)偏差或觀測(cè)誤差等限制引起的初始誤差,人們對(duì)于運(yùn)動(dòng)規(guī)律認(rèn)識(shí)的局限性導(dǎo)致模式對(duì)物理過程描述尚未完全準(zhǔn)確,數(shù)值求解過程的離散化、截?cái)嗾`差、舍入誤差引起的模式誤差等各種因素,使得數(shù)值預(yù)報(bào)結(jié)果與真實(shí)狀態(tài)之間存在一定差異[16-20]。

到目前為止,在結(jié)合數(shù)值預(yù)報(bào)模式進(jìn)行預(yù)報(bào)誤差校正方面研究已有相關(guān)報(bào)道,尹姍等[21]利用ECMWF(European Centre for Medium-Range Weather Forecasts)模式結(jié)果和站點(diǎn)觀測(cè)資料之間的差異分別用滑動(dòng)平均和歷史偏差對(duì)模式預(yù)報(bào)溫度進(jìn)行誤差校正,2 種校正方法都能校正模式的系統(tǒng)偏差,但是無法校正變溫時(shí)間的誤差。韓玉康等[22]根據(jù)1992—2006 年15 a 的衛(wèi)星觀測(cè)資料和NERSCHYCOM(Nansen Environmental and Remote Sensing Center-Hybrid Coordinate Ocean Model)模式數(shù)據(jù)得到歷史偏差序列,建立自回歸模型來預(yù)測(cè)誤差對(duì)模式結(jié)果進(jìn)行校正,一定程度上提高了模式的準(zhǔn)確性,自回歸模型在求解的過程中,誤差和隨機(jī)干擾序列需要滿足一定的限制條件,并不是所有的偏差數(shù)據(jù)都可以滿足其限制條件,更普適的方法有待進(jìn)一步研究。張培軍等[23]利用GHRSST(Group for High Resolution Sea Surface Temperature)數(shù)據(jù)和南海業(yè)務(wù)化SST 模式預(yù)報(bào)結(jié)果的偏差,校正下一時(shí)刻的預(yù)報(bào)結(jié)果,整體上降低了模式偏差,但是此方法在SST 變化劇烈時(shí)不適用。

預(yù)報(bào)結(jié)果與觀測(cè)之間的差異隨時(shí)間的變化,不但反映了變量本身的時(shí)間演變特征,同時(shí)也體現(xiàn)了模式誤差隨時(shí)間的變化,本文嘗試直接對(duì)模式偏差進(jìn)行預(yù)報(bào),進(jìn)而校正數(shù)值預(yù)報(bào)結(jié)果。本文分別采用線性回歸模型和單點(diǎn)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)模型[24]預(yù)報(bào)模式偏差,然后將得到的偏差的預(yù)報(bào)結(jié)果重新插值到模式網(wǎng)格點(diǎn),并對(duì)數(shù)值預(yù)報(bào)結(jié)果進(jìn)行校正。采用線性回歸模型和單點(diǎn)的LSTM[24]模型預(yù)報(bào)模式偏差時(shí),對(duì)偏差的時(shí)間序列沒有額外的條件限制,具有較強(qiáng)的普適性,同時(shí)也便于推廣到其他海洋預(yù)報(bào)要素的誤差校正。在對(duì)比兩類方法的基礎(chǔ)上,本文對(duì)二維變量、三維變量的校正進(jìn)行了初步探索。實(shí)驗(yàn)采用自然資源部第一海洋研究所全球高分辨率海洋 預(yù) 報(bào) 系 統(tǒng)[25]( The surface wave-tide-circulation coupled ocean model developed by First Institute of Oceanography,MNR,China,F(xiàn)IO-COM,簡(jiǎn)稱FIO-COM 預(yù)報(bào)系統(tǒng))24 h 的 SST 預(yù)報(bào)結(jié)果進(jìn)行誤差校正,期望進(jìn)一步提高預(yù)報(bào)產(chǎn)品的精度。

1 數(shù)據(jù)與方法

1.1 數(shù)據(jù)來源

實(shí)驗(yàn)數(shù)據(jù)包括衛(wèi)星遙感SST 觀測(cè)數(shù)據(jù)和全球預(yù)報(bào)系統(tǒng)SST 預(yù)報(bào)結(jié)果兩類數(shù)據(jù)。觀測(cè)數(shù)據(jù)為來自美國(guó)國(guó)家海洋和大氣管理局(National Ocean and Atmospheric Administration,NOAA)的最優(yōu)插值海面溫度(Optimum Interpolation Sea Surface Temperature,OISST),是多源衛(wèi)星觀測(cè)數(shù)據(jù)的融合產(chǎn)品,將主要來自甚高分辨率掃描輻射計(jì)(Advanced Very High Resolution Radiometer,AVHRR)的衛(wèi)星觀測(cè)數(shù)據(jù)和一些船舶、浮標(biāo)數(shù)據(jù)通過最優(yōu)插值進(jìn)行了融合,其水平分辨率為 0.25°×0.25°,時(shí)間分辨率為日平均[26-27]。值得注意的是OISST 數(shù)據(jù)與FIO-COM 預(yù)報(bào)系統(tǒng)[25]業(yè)務(wù)化同化的數(shù)據(jù)不同。

數(shù)值預(yù)報(bào)結(jié)果采用FIO-COM 預(yù)報(bào)系統(tǒng)的SST 產(chǎn)品,本研究使用前24 h 的溫度預(yù)報(bào)結(jié)果作為研究對(duì)象。該系統(tǒng)的海洋預(yù)報(bào)模式是在浪致混合理論[28]的基礎(chǔ)上發(fā)展的全球首個(gè)“海浪-潮流-環(huán)流耦合”高分辨率海洋預(yù)報(bào)模式,在上層海洋的模擬與預(yù)測(cè)能力[29]等方面有顯著優(yōu)勢(shì),同時(shí)該系統(tǒng)采用了集合調(diào)整卡爾曼濾波器(Ensemble Adjustment Kalman Filter system,EAKF)數(shù)據(jù)同化方案[30]進(jìn)一步提高了預(yù)報(bào)的精度。FIO-COM 預(yù)報(bào)系統(tǒng)每天業(yè)務(wù)化預(yù)報(bào)未來5 d 全球的海浪、潮汐潮流、環(huán)流、溫度和鹽度等海洋環(huán)境要素,其水平分辨率為0.1°×0.1°,垂向54 層,時(shí)間分辨率為3 h。為了便于對(duì)比衛(wèi)星遙感SST 產(chǎn)品,本文對(duì)預(yù)報(bào)數(shù)據(jù)進(jìn)行了預(yù)處理,在空間上利用雙線性插值的方法將0.1°×0.1°預(yù)報(bào)數(shù)據(jù)插值到0.25°×0.25°觀測(cè)數(shù)據(jù)的網(wǎng)格點(diǎn)上,同時(shí)利用前24 h 的預(yù)報(bào)數(shù)據(jù)進(jìn)行時(shí)間平均得到日平均數(shù)據(jù)。

1.2 實(shí)驗(yàn)方法

1.2.1 線性回歸模型

考慮到模式的預(yù)報(bào)偏差隨時(shí)間的變化具有一定的規(guī)律,在長(zhǎng)時(shí)間上其變化過程并非線性關(guān)系,但在某個(gè)局部時(shí)段內(nèi),偏差的變化可以近似為線性。將這一偏差看作時(shí)間的函數(shù),在短時(shí)間內(nèi)對(duì)其進(jìn)行泰勒展開,對(duì)應(yīng)的零階和一階近似可以統(tǒng)一表示為:式中:e 為模式偏差,由模式預(yù)報(bào)結(jié)果減去觀測(cè)結(jié)果得到;t 為時(shí)間;下標(biāo)n 表示該時(shí)段的長(zhǎng)度;k和b 分別為線性擬合所得的系數(shù)。當(dāng)k=0 時(shí)為零階線性近似,k≠0 時(shí)為一階線性近似。

將零階近似和一階近似對(duì)應(yīng)的線性回歸模型分別記為方法A 和方法X,根據(jù)不同的時(shí)段長(zhǎng)度n分別記為An 和Xn。利用最小二乘原理,可得到零階近似表達(dá)式中的系數(shù)b 的表達(dá)式為:式中:T 為當(dāng)前時(shí)刻;n 為時(shí)段的長(zhǎng)度。

對(duì)應(yīng)的一階近似方法Xn 中的2 個(gè)系數(shù)分別表示為:

本文將利用歷史偏差數(shù)據(jù)計(jì)算上述參數(shù),并通過一系列敏感實(shí)驗(yàn),比較利用幾天的數(shù)據(jù)做線性近似預(yù)報(bào)模式偏差的效果最好。

1.2.2 LSTM 模型

在深度學(xué)習(xí)領(lǐng)域,LSTM 是為解決長(zhǎng)序列訓(xùn)練過程中的梯度消失和梯度爆炸問題而發(fā)展起來的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),相比循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),其在長(zhǎng)序列中有更好的表現(xiàn)。通過觀察偏差的時(shí)間連續(xù)曲線,發(fā)現(xiàn)它的時(shí)間演變并沒有明顯的短周期信號(hào),因此在訓(xùn)練時(shí)不能直接固定輸入個(gè)數(shù)[31]。在利用LSTM 預(yù)報(bào)溫度偏差過程中,輸入偏差的個(gè)數(shù)(時(shí)間步長(zhǎng))對(duì)預(yù)報(bào)結(jié)果影響較大,需要通過實(shí)驗(yàn)進(jìn)行優(yōu)選。當(dāng)輸入個(gè)數(shù)為n 時(shí),方法記作Dn。針對(duì)SST 預(yù)報(bào)偏差的LSTM 模型的工作流程如下。

步驟1:按照9∶2 的比例將SST 預(yù)報(bào)偏差數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,本實(shí)驗(yàn)將2016 年5 月1日至2020 年12 月31 日的數(shù)據(jù)作為訓(xùn)練集,2021 年的數(shù)據(jù)作為測(cè)試集。

步驟2:利用訓(xùn)練集數(shù)據(jù)訓(xùn)練模型,輸入個(gè)數(shù)為n,輸出個(gè)數(shù)為1,對(duì)應(yīng)下一時(shí)刻的偏差。

步驟3:調(diào)整神經(jīng)元個(gè)數(shù)和隱藏層的層數(shù)得到相對(duì)最優(yōu)模型,然后調(diào)整輸入天數(shù),分別保存不同輸入天數(shù)的訓(xùn)練模型。

步驟4:利用訓(xùn)練好的LSTM 模型分別對(duì)訓(xùn)練集進(jìn)行后報(bào)實(shí)驗(yàn),對(duì)測(cè)試集進(jìn)行預(yù)報(bào)實(shí)驗(yàn)。

步驟5:檢驗(yàn)訓(xùn)練集的后報(bào)實(shí)驗(yàn)和測(cè)試集的預(yù)報(bào)實(shí)驗(yàn)結(jié)果,分析實(shí)驗(yàn)設(shè)置的影響。

1.3 實(shí)驗(yàn)設(shè)計(jì)

實(shí)驗(yàn)主要包括單點(diǎn)校正實(shí)驗(yàn)、多點(diǎn)校正實(shí)驗(yàn)和區(qū)域校正實(shí)驗(yàn)三部分。

1)單點(diǎn)校正實(shí)驗(yàn)。針對(duì)單點(diǎn)數(shù)據(jù),對(duì)3 種方法分別進(jìn)行敏感性實(shí)驗(yàn),比較不同輸入個(gè)數(shù)情況下方法A、方法X、LSTM 各自的校正效果,并比較3 種方法的優(yōu)劣。

2)多點(diǎn)校正實(shí)驗(yàn)。為了避免單點(diǎn)數(shù)據(jù)具有偶然性,隨機(jī)選取5 個(gè)點(diǎn)開展實(shí)驗(yàn),考察3 種方法對(duì)輸入個(gè)數(shù)的敏感性,確定方法A、方法X、LSTM 的最優(yōu)天數(shù),并比較3 種方法的校正效果。

3)區(qū)域校正實(shí)驗(yàn)。利用多點(diǎn)實(shí)驗(yàn)所確定的3 種方法最優(yōu)配置,對(duì)區(qū)域內(nèi)的每個(gè)空間點(diǎn)分別進(jìn)行模型訓(xùn)練和校正,綜合比較3 種方法的表現(xiàn)。

各實(shí)驗(yàn)具體設(shè)置如表1 所示,單點(diǎn)和小區(qū)域的位置如圖1 所示。

圖1 測(cè)試位置分布Fig. 1 Spatial distribution of the test locations

表1 實(shí)驗(yàn)設(shè)計(jì)表Table 1 Design of experiments

2 結(jié)果與分析

本研究利用方法A、方法X 和LSTM 對(duì)偏差進(jìn)行預(yù)測(cè),進(jìn)而校正系統(tǒng)的預(yù)報(bào)產(chǎn)品。首先利用單點(diǎn)數(shù)據(jù)對(duì)3 種方法進(jìn)行比較,然后在觀測(cè)網(wǎng)格上隨機(jī)選取不同緯度上5 個(gè)點(diǎn)確定各類方法的最優(yōu)輸入個(gè)數(shù),最后利用3 種方法的最優(yōu)配置開展對(duì)西北太平洋區(qū)域的校正實(shí)驗(yàn)。

2.1 單點(diǎn)海水表面溫度校正檢驗(yàn)

以太平洋中緯度點(diǎn)(149°52′30″E,34°52′30″N )(圖1 中點(diǎn)1)為例進(jìn)行實(shí)驗(yàn),檢驗(yàn)方法A、方法X 和LSTM 的可行性并對(duì)這幾種方法的校正效果進(jìn)行對(duì)比分析。

圖2 給出了位置1 自2017 年1 月1 日至2021 年12 月31 日的24 h 預(yù)報(bào)校正前后結(jié)果與衛(wèi)星觀測(cè)的對(duì)比,3 個(gè)子圖分別是利用方法A、方法X 和LSTM 對(duì)該點(diǎn)數(shù)據(jù)校正的結(jié)果,反映了觀測(cè)值、模式校正前后數(shù)據(jù)的比較結(jié)果。圖2a 中黑線表示觀測(cè)值,紅點(diǎn)表示原始模式24 h 預(yù)報(bào)結(jié)果,藍(lán)點(diǎn)和綠點(diǎn)分別是選取兩種不同天數(shù)利用方法A(5 d 平均和10 d 平均,分別記為A5 和A10,后文中的其他天數(shù)平均以此類推)校正后的結(jié)果,結(jié)果表明校正后的模式值都比原始模式值更接近觀測(cè)數(shù)據(jù);圖2b 中同樣黑線表示觀測(cè)值,紅點(diǎn)表示原始模式24 h 預(yù)報(bào)平均結(jié)果,藍(lán)點(diǎn)和綠點(diǎn)分別是選取2 種不同天數(shù)利用方法X(3 d 線性擬合和30 d 線性擬合,分別記為X3 和X30,后文中的其他天數(shù)擬合以此類推)校正后的結(jié)果,其中X3、X30 大部分時(shí)間下的校正值比模式值更接近觀測(cè)值,但是在偏差出現(xiàn)極值后的某些日期上的校正結(jié)果不理想,甚至不如校正前的原始結(jié)果。圖2c 中,由于LSTM 方法選取不同天數(shù)繪制的曲線基本重合,因此只展示輸入個(gè)數(shù)為5(記為D5,后文中的其他輸入個(gè)數(shù)以此類推)的校正結(jié)果;綠色虛線是訓(xùn)練集與測(cè)試集的分界線,2016 年5 月1 日到2020 年12 月31 日作為訓(xùn)練集,選取2017 年到2020 年的數(shù)據(jù)來驗(yàn)證訓(xùn)練效果。

圖2 觀測(cè)和預(yù)報(bào)結(jié)果校正前后的SST 時(shí)間序列Fig. 2 Observed SST and the simualted and corrected SST from OFS

由圖2 可見,訓(xùn)練集中后報(bào)檢驗(yàn)校正后的模式值與觀測(cè)值基本重合,訓(xùn)練的LSTM 模型能夠刻畫偏差的主要變化規(guī)律,此模型可以用來對(duì)未來偏差進(jìn)行預(yù)報(bào)實(shí)驗(yàn)。綠色虛線之后為測(cè)試集,用來檢驗(yàn)?zāi)J降念A(yù)報(bào)效果,校正后的模式值比原始模式值更接近于觀測(cè),基本與之重合,LSTM 模型能夠?qū)崿F(xiàn)對(duì)未來偏差的準(zhǔn)確預(yù)報(bào)。

為了清晰對(duì)比校正前后的差異,本文將校正后的絕均差與校正前的絕均差的比值定義為剩余絕均差,其值越小,代表校正效果越好。圖3 給出了3 種方法選取不同天數(shù)對(duì)校正結(jié)果的影響,其中圖3a 是方法A 取不同天數(shù)校正后得到的剩余絕均差,隨著天數(shù)的減少校正效果變好,利用前一天的偏差作為當(dāng)前天的偏差進(jìn)行校正效果是最好的,校正后的剩余絕均差為42.53%。類似地,張培軍等[23]利用與本實(shí)驗(yàn)中A1 相似的方法對(duì)南海存在浮標(biāo)觀測(cè)數(shù)據(jù)的位置進(jìn)行校正,結(jié)果顯示24 h 預(yù)報(bào)的均方根誤差從0.85 降低到0.36。圖3b 是方法X 取不同天數(shù)進(jìn)行校正后的剩余絕均差,與方法A 類似,同樣是取更短的天數(shù)進(jìn)行線性擬合校正結(jié)果更好,利用預(yù)報(bào)當(dāng)天以前2 d 的數(shù)據(jù)做一階線性擬合來預(yù)報(bào)當(dāng)天的偏差效果最好,校正后的剩余絕均差為46.34%。

圖3 3 種方法對(duì)單點(diǎn)校正后的剩余絕均差Fig. 3 Residual absolute mean difference in single correction experiments of the three methods

利用LSTM 來對(duì)偏差進(jìn)行預(yù)報(bào),進(jìn)行訓(xùn)練集數(shù)據(jù)的自檢驗(yàn),可以證明其模型的可行性并對(duì)輸入天數(shù)進(jìn)行敏感性實(shí)驗(yàn),然后利用測(cè)試集數(shù)據(jù)來對(duì)模型進(jìn)行預(yù)報(bào)實(shí)驗(yàn)。圖3c 是LSTM 取不同天數(shù)作為輸入進(jìn)行校正得到的部分訓(xùn)練集(時(shí)間范圍為2017 年至2020 年)的剩余絕均差。整體來看,輸入個(gè)數(shù)的不同對(duì)訓(xùn)練集校正結(jié)果影響很小,校正后的剩余絕均差都在35%左右。選取個(gè)數(shù)太少,校正結(jié)果較差,隨著輸入個(gè)數(shù)的增多,校正效果略有提升,在選擇不同輸入個(gè)數(shù)中,選取30 d 訓(xùn)練效果最好,其剩余絕均差小于35%,輸入個(gè)數(shù)選取5 d 次之。圖3d 是LSTM 比較不同輸入個(gè)數(shù)對(duì)測(cè)試集校正結(jié)果的影響,所有的輸入個(gè)數(shù)校正后的剩余絕均差均在28%左右,大大減小了預(yù)報(bào)結(jié)果的偏差;對(duì)比不同的輸入個(gè)數(shù)對(duì)校正效果的影響發(fā)現(xiàn),測(cè)試集中選取輸入個(gè)數(shù)為1 時(shí)校正效果與其他輸入個(gè)數(shù)相比較差,隨著個(gè)數(shù)的增加其校正效果略有起伏,但差距不大。

針對(duì)單點(diǎn)校正,3 種方法中LSTM 效果最好,方法A 次之,方法X 相對(duì)最差,其中LSTM 中的測(cè)試集效果優(yōu)于訓(xùn)練集。理論上來說,利用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,然后利用模型對(duì)訓(xùn)練集和驗(yàn)證集進(jìn)行預(yù)報(bào)檢驗(yàn),針對(duì)訓(xùn)練集的訓(xùn)練效果應(yīng)該優(yōu)于驗(yàn)證集的預(yù)報(bào)結(jié)果,但是實(shí)際結(jié)果卻恰恰相反。分析認(rèn)為原始偏差數(shù)據(jù)時(shí)間序列是出現(xiàn)預(yù)報(bào)結(jié)果優(yōu)于訓(xùn)練效果的主要原因,如圖2c 所示,訓(xùn)練集中模式預(yù)報(bào)值與觀測(cè)值交點(diǎn)更多,說明訓(xùn)練集中偏差數(shù)據(jù)極值出現(xiàn)得更為頻繁,反之測(cè)試集的偏差相對(duì)更穩(wěn)定,LSTM 模型對(duì)極值情況下的預(yù)報(bào)較差,因此總體來看測(cè)試集的校正效果會(huì)更好。

為了考察單點(diǎn)偏差校正的通用性,我們選取圖1 中的5 個(gè)不同緯度的點(diǎn)統(tǒng)計(jì)3 種方法下不同天數(shù)的剩余絕均差(圖4)。由圖4a 可見,在A1~A10、A30 中校正結(jié)果最好的是A1;由圖4b 可見,在X2~X10、X30 中校正效果最好的是X3;由圖4c、圖4d 可見,LSTM 模型的輸入個(gè)數(shù)除選取1之外,校正效果差別不大。結(jié)合圖3 來看,校正效果整體來看差別不大,由于隨著輸入個(gè)數(shù)增多,訓(xùn)練所需的時(shí)間在變長(zhǎng),綜合校正效果和計(jì)算效率,LSTM 神經(jīng)網(wǎng)絡(luò)的輸入個(gè)數(shù)選擇5。接下來利用方法A1、方法X3、方法D5 對(duì)某一區(qū)域進(jìn)行校正實(shí)驗(yàn),比較零階和一階的線性擬合方法,以及深度學(xué)習(xí)LSTM 神經(jīng)網(wǎng)絡(luò)的預(yù)報(bào)效果。

圖4 3 種方法對(duì)多點(diǎn)校正后的剩余絕均差Fig. 4 Residual absolute mean difference in multipoint correction experiments of the three methods

2.2 區(qū)域海水表面溫度校正

選取的區(qū)域?qū)嶒?yàn)范圍為(140°~175°E,9° ~31°N)(圖1 中黑框區(qū)域),用于比較3 種方法的校正效果。圖5a 是2021 年1 月校正前模式預(yù)報(bào)結(jié)果的月平均偏差分布,模式預(yù)報(bào)結(jié)果在所選區(qū)域范圍內(nèi)的月平均偏差整體處于(± 1.0) ℃;圖5b、圖5c 和圖5d 分別是方法A1、方法X3 和方法D5 校正后的月平均偏差分布??傮w來看,相對(duì)于模式預(yù)報(bào)的原始偏差,校正后的月平均偏差基本都降到了(± 0.2) ℃。方法A1、方法X3 校正后的月平均偏差比D5 更接近0,與后續(xù)的絕均差及日偏差概率密度分布得出的D5 校正效果最好不符。其原因在于計(jì)算月平均偏差時(shí),方法A1、方法X3 的部分正負(fù)偏差相互抵消,而D5 在預(yù)報(bào)偏差的時(shí)候訓(xùn)練的模型是對(duì)真實(shí)數(shù)據(jù)的接近,極少出現(xiàn)預(yù)報(bào)結(jié)果在真實(shí)結(jié)果兩側(cè)跳躍的現(xiàn)象,因此D5 的月平均偏差反而比方法A1、方法X3 的大。

圖5 校正前后區(qū)域月平均偏差空間分布Fig. 5 Spatial distribution of monthly mean difference resulted from the correction

為了量化校正效果并比較3 種校正方法優(yōu)劣,分析了這一區(qū)域的年平均絕均差(圖6)與日偏差概率密度分布(圖7)。由圖6 可見,模式預(yù)報(bào)結(jié)果在選取區(qū)域的年平均絕均差分布在0.25~0.47 ℃。由于系統(tǒng)運(yùn)行中的升級(jí)優(yōu)化,模式預(yù)報(bào)結(jié)果的年平均絕均差隨時(shí)間在變小,從2017 年的0.45 ℃左右降到了2021 年的0.27 ℃左右。

圖6 各實(shí)驗(yàn)的區(qū)域年平均絕均差統(tǒng)計(jì)Fig. 6 Statistics of the yearly absolute mean in different study regions

在按照LSTM 神經(jīng)網(wǎng)絡(luò)方法建議劃分的訓(xùn)練集時(shí)段內(nèi)(2017 年至2020 年),A1、X3 方法校正后的年平均絕均差明顯小于模式預(yù)報(bào)結(jié)果的年平均絕均差,LSTM 的年平均絕均差明顯小于模式預(yù)報(bào)結(jié)果的年平均絕均差,且小于方法A1 和方法X3。由圖7 可見, 采用A1 和X3 方法校正后的SST偏差比較正前更多集中在0 附近,對(duì)偏差進(jìn)行校正的效果顯著;LSTM 比前兩者更多地集中在0 附近,表明訓(xùn)練的LSTM 模型可以很好地抓住訓(xùn)練集數(shù)據(jù)的變化規(guī)律,可以用來對(duì)未來偏差預(yù)報(bào)進(jìn)行檢驗(yàn)。

處于驗(yàn)證集時(shí)間段的3 種方法校正后的年平均絕均差明顯小于原始預(yù)報(bào)結(jié)果的年平均絕均差,其中,LSTM 校正后的年平均絕均差最小,A1 次之,且這2 種方法校正后的年平均絕均差極為接近,X3 效果相對(duì)最差,但其年平均絕均差也降低了50%左右。由圖7 可見,LSTM 方法校正后的日偏差數(shù)據(jù)比A1、X3 集中在0 附近的更多。總體而言,在這個(gè)區(qū)域的校正效果對(duì)比中,LSTM 取得的效果最好。

從這些對(duì)比圖也可以發(fā)現(xiàn),在原始模式預(yù)報(bào)結(jié)果與觀測(cè)數(shù)據(jù)相差最大之后的點(diǎn),也就是偏差極值點(diǎn)之后的位置,方法X 校正后的預(yù)報(bào)結(jié)果與實(shí)際值相差較大,這表明方法X 假定的局地線性關(guān)系在此處不適用。當(dāng)偏差隨時(shí)間變化的極值點(diǎn)比較多時(shí),整體上的校正效果也將不理想。

3 結(jié) 語

針對(duì)海洋數(shù)值預(yù)報(bào)結(jié)果存在的偏差,本文利用零階線性回歸模型、一階線性回歸模型和深度學(xué)習(xí)中的LSTM 神經(jīng)網(wǎng)絡(luò)三種方法進(jìn)行了實(shí)驗(yàn)研究。利用FIO-COM 模式的24 h 預(yù)報(bào)SST 和衛(wèi)星觀測(cè)數(shù)據(jù)開展了預(yù)報(bào)偏差校正的一系列實(shí)驗(yàn)對(duì)比分析,分別采用3 種方法對(duì)歷史偏差數(shù)據(jù)進(jìn)行學(xué)習(xí)從而對(duì)未來時(shí)刻的偏差進(jìn)行預(yù)報(bào),試圖探討切實(shí)有效對(duì)預(yù)報(bào)產(chǎn)品進(jìn)行校正的方法。實(shí)驗(yàn)結(jié)果表明:①線性回歸模型和LSTM 神經(jīng)網(wǎng)絡(luò)對(duì)于單點(diǎn)及區(qū)域的模式偏差都有一定的校正效果;②在A1~A10、A30 中A1 校正效果最好,在X2~X10、X30 中X3 校正效果最好,LSTM 神經(jīng)網(wǎng)絡(luò)方法的校正效果隨著輸入個(gè)數(shù)的減小整體上呈遞減趨勢(shì),輸入個(gè)數(shù)為1 的時(shí)的校正效果相對(duì)較差,輸入個(gè)數(shù)從2 到30 對(duì)于訓(xùn)練結(jié)果和預(yù)報(bào)結(jié)果影響均不明顯;③總體來看,LSTM 神經(jīng)網(wǎng)絡(luò)的校正效果最好,方法A次之,采用LSTM 神經(jīng)網(wǎng)絡(luò)選取輸入個(gè)數(shù)為5 對(duì)區(qū)域進(jìn)行偏差校正,可以將絕均差降低70%左右。

綜合對(duì)比線性回歸模型和LSTM 在預(yù)報(bào)模式偏差中的差異,結(jié)果表明LSTM 的結(jié)果更好。分析認(rèn)為是LSTM 神經(jīng)網(wǎng)絡(luò)采用了多種函數(shù)關(guān)系的組合,比單純的根據(jù)泰勒展開中的零階近似、一階近似等單個(gè)函數(shù)關(guān)系進(jìn)行局地回歸的做法更具有普適性,可以為校正預(yù)報(bào)偏差建立效果更穩(wěn)定的回歸模型。從實(shí)驗(yàn)結(jié)果來看,利用機(jī)器學(xué)習(xí)來對(duì)預(yù)報(bào)偏差進(jìn)行校正具有潛在的優(yōu)勢(shì),但在推廣到業(yè)務(wù)化應(yīng)用之前,仍需開展一系列的研究工作。本研究采用的LSTM 模型都只是針對(duì)每個(gè)點(diǎn)的SST 數(shù)據(jù)單獨(dú)進(jìn)行訓(xùn)練,其計(jì)算量龐大,不同空間點(diǎn)上的聯(lián)系考慮得也不夠充分。此外,如何校正海面以下的溫度產(chǎn)品仍是一個(gè)待解決的問題。我們下一步將從以下2 個(gè)方面深入開展相關(guān)的研究:①針對(duì)LSTM 模型單點(diǎn)訓(xùn)練計(jì)算量大、耗費(fèi)時(shí)間長(zhǎng)和未考慮空間相關(guān)性等問題,進(jìn)一步完善SST 偏差校正方法;②對(duì)于缺少觀測(cè)值的海表以下的海水溫度,結(jié)合Argo 浮標(biāo)等觀測(cè)數(shù)據(jù)實(shí)現(xiàn)三維溫度場(chǎng)預(yù)報(bào)偏差的校正,結(jié)合模式不同物理量之間的內(nèi)部關(guān)系,建立可行方案實(shí)現(xiàn)預(yù)報(bào)系統(tǒng)中其他變量的校正,尤其是有模式預(yù)報(bào)但是缺乏觀測(cè)資料的要素變量。

猜你喜歡
個(gè)數(shù)校正偏差
怎樣數(shù)出小正方體的個(gè)數(shù)
如何走出文章立意偏差的誤區(qū)
兩矩形上的全偏差
劉光第《南旋記》校正
等腰三角形個(gè)數(shù)探索
怎樣數(shù)出小木塊的個(gè)數(shù)
怎樣數(shù)出小正方體的個(gè)數(shù)
一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
機(jī)內(nèi)校正
關(guān)于均數(shù)與偏差
呼伦贝尔市| 重庆市| 汕头市| 九龙县| 卢氏县| 章丘市| 淄博市| 万山特区| 肇州县| 会同县| 察雅县| 河津市| 马鞍山市| 贵定县| 白沙| 潞城市| 北安市| 四子王旗| 淮南市| 海口市| 大英县| 永城市| 济阳县| 侯马市| 淮安市| 杂多县| 措勤县| 兖州市| 旅游| 武威市| 台前县| 清河县| 和田市| 永修县| 苍梧县| 满城县| 湖南省| 安丘市| 扬中市| 金寨县| 阿图什市|