国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學(xué)習(xí)算法的西部方向氣候模式預(yù)測訂正研究

2023-12-13 11:43:46楊理智張櫨丹王俊鋒嚴(yán)渝昇
關(guān)鍵詞:格點氣候模態(tài)

楊理智,張櫨丹,王俊鋒,張 帥,嚴(yán)渝昇

(中國人民解放軍31308部隊,四川 成都 610031)

0 引言

氣候預(yù)測方法有統(tǒng)計學(xué)、動力學(xué)和動力統(tǒng)計相結(jié)合三類方法。統(tǒng)計學(xué)方法由于指數(shù)因子過多且各因子相互作用過程復(fù)雜,難以基于簡單的人工分析把握主要統(tǒng)計要素,因此不確定性較高。動力學(xué)方法基于數(shù)值預(yù)報模式,受初始擾動和大氣可預(yù)報性影響,氣候預(yù)測技巧有限,特別是青藏高原地區(qū)海拔高且地形復(fù)雜,氣候動力模式難以精準(zhǔn)捕捉氣候過程,從而表現(xiàn)出了明顯偏差[1-2]。動力統(tǒng)計結(jié)合方式為現(xiàn)在主流方式,能彌補統(tǒng)計和動力方法各自的不足,明顯提升預(yù)測準(zhǔn)確度[3-5]。因此,利用統(tǒng)計學(xué)方法訂正西部方向氣候模式,以提升預(yù)報準(zhǔn)確度是值得探索的一個方向。

近年來,大數(shù)據(jù)分析挖掘技術(shù)——機器學(xué)習(xí)正騰飛發(fā)展,也在對數(shù)據(jù)關(guān)鍵信息的提取、識別和預(yù)測上取得了巨大成就。充分利用大數(shù)據(jù)分析挖掘技術(shù),優(yōu)化傳統(tǒng)統(tǒng)計預(yù)測方法,是提升高原地區(qū)氣候預(yù)測準(zhǔn)確度的重要途徑。氣候預(yù)測準(zhǔn)確性的影響因子眾多,包含不同起報時間的模式場數(shù)據(jù)以及前期環(huán)流特征等,因子數(shù)量多、呈現(xiàn)顯著的非線性。機器學(xué)習(xí)算法能夠挖掘大數(shù)據(jù)規(guī)律,區(qū)別于傳統(tǒng)統(tǒng)計方法,它從數(shù)據(jù)出發(fā)進行學(xué)習(xí),具有很強的處理非線性問題的能力[6],能夠從地氣系統(tǒng)大數(shù)據(jù)中發(fā)現(xiàn)并挖掘分析相互關(guān)聯(lián)信號,提升氣候預(yù)測技巧[7-8]。

機器學(xué)習(xí)已經(jīng)被廣泛應(yīng)用于氣候預(yù)測中,涌現(xiàn)出大量創(chuàng)新創(chuàng)造性成果[9-11]。機器學(xué)習(xí)方法常與數(shù)值模式融合,Gentine等[11]用神經(jīng)網(wǎng)絡(luò)模擬云和對流中熱量、水汽的垂直輸送以及輻射與云和水蒸氣的相互作用,更有效地改進數(shù)值模式的模擬性,對氣候模式的發(fā)展和預(yù)測水平的提高帶來深遠影響。機器學(xué)習(xí)也被廣泛用于訂正動力模式偏差,Moghim和Bras[12]使用ANN模型對CCSM3的南美洲北部降水進行訂正,效果顯著優(yōu)于線性回歸模型;Wang等[13-14]用隨機森林、支持向量、貝葉斯模型等工智能模型訂正偏差,從而提高動力模式預(yù)測水平。機器學(xué)習(xí)算法對提升氣候預(yù)測業(yè)務(wù)水平也有極大的貢獻,黃超[15]等采用隨機森林挑選因子、多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量回歸和自然梯度算法建立模型,有效提升了湖南夏季降水的預(yù)測能力;鄧居昌等[7]用多種機器學(xué)習(xí)算法構(gòu)建廣西月降水量預(yù)測統(tǒng)計訂正,結(jié)合動力模式方法,極大提升了預(yù)測準(zhǔn)確率;向波等創(chuàng)造性地將機器學(xué)習(xí)算法融入多省市的氣候預(yù)測業(yè)務(wù)中,成功優(yōu)化預(yù)測效果。

上述研究在氣候預(yù)測中機器學(xué)習(xí)算法的應(yīng)用領(lǐng)域做出了較大貢獻,但由于模式表現(xiàn)差、測站少等原因,鮮有研究關(guān)注西部方向。因此,本文利用西部方向240個區(qū)域站30年觀測數(shù)據(jù)、國內(nèi)外主流氣候模式數(shù)據(jù)、前期環(huán)流特征等大數(shù)據(jù)樣本,基于EOF分解的時間系數(shù),采用信息流算法分析挖掘數(shù)據(jù)因果特征,運用機器學(xué)習(xí)算法構(gòu)建高影響因子集與時間系數(shù)的預(yù)報模型,以優(yōu)化模式預(yù)報場,最后將模式數(shù)據(jù)、重構(gòu)預(yù)報數(shù)據(jù)插值回240個區(qū)域站,分析對比模型預(yù)報效果,探索基于機器學(xué)習(xí)算法的氣候模式訂正方法在西部方向的適用性。

1 訂正模型構(gòu)建

1.1 模型構(gòu)建

本文基于機器學(xué)習(xí)算法實現(xiàn)氣候模式訂正,技術(shù)方案如圖1所示。

圖1 建模流程

具體步驟如下:

(1)融合格點場。取EC預(yù)報場和NCC預(yù)報場的均值,形成融合格點場。

(2)訂正格點場。將融合格點場插值到站點,并作為輸入,站點實測數(shù)據(jù)作為輸出,利用隨機森林訓(xùn)練訂正模型,從而訂正融合格點場,形成訂正預(yù)報場。

(3)EOF分解。對訂正后的格點場進行EOF分解,得到前N個模態(tài)的空間系數(shù)、時間系數(shù),將前N個模態(tài)的時間系數(shù)作為模型的預(yù)測因子。

(4)影響因子選取。采用信息流算法,尋找前N個模態(tài)時間系數(shù)與起報前M個月環(huán)流指數(shù)的因果關(guān)系,構(gòu)建高影響因子集。

(5)機器學(xué)習(xí)建模。采用機器學(xué)習(xí)算法,對不同模態(tài)的高影響因子集與前N個模態(tài)的時間系數(shù)進行建模,得到預(yù)測的時間系數(shù)。

(6)重構(gòu)格點場。利用前N個模態(tài)空間系數(shù)及預(yù)測的時間系數(shù),得到預(yù)報的格點場。

(7)預(yù)測效果評估。將預(yù)報的格點數(shù)據(jù)插值到西部方向240個站點上,通過RMSE評估預(yù)報準(zhǔn)確度;通過PS評分、ACC評分分析模型預(yù)報技巧。

1.2 核心算法簡介

1.2.1 隨機森林

隨機森林(Random Forest,RF)算法是2001年Breiman[15]基于Bagging思想首次提出的一種分類和回歸算法,它由相互獨立的單棵決策樹組成,使用多棵決策樹樣本進行訓(xùn)練和預(yù)測,最后利用投票機制來實現(xiàn)最終的分類。具體算法流程如下:

(1)矩利用自助重采樣方法,從原始樣本集S中采用有放回的采樣方式,隨機抽取N個樣本子集。

(2)從N個樣本子集中建立相應(yīng)的N棵決策樹:

{h(x,θn),n=1,2,…,N}

(1)

其中x為輸入的自變量和因變量,θn為服從獨立同分布隨機向量。

(3)訓(xùn)練決策樹模型節(jié)點時,隨機選取m(m≤M)個預(yù)測因子作為樹節(jié)點劃分特征(M為預(yù)測因子總個數(shù)),以其中最優(yōu)的一個特征來劃分決策樹的左右子樹。

(4)訓(xùn)練結(jié)束后,將投票得到的所有模態(tài)的平均值作為輸出,得到隨機森林模型預(yù)測結(jié)果。

(2)

1.2.2 信息流

區(qū)別于以往因果分析方法,近幾年Liang[16-18]突破性地證明了因果關(guān)系實際上具有嚴(yán)格的物理意義和理論基礎(chǔ):因果關(guān)系可以被一規(guī)范方程運用最大似然估計所推得的閉合解(定義為信息流,Information Flow,IF)來度量。信息流不僅被證實在線性系統(tǒng)中能夠快捷有效地探明因果信息交換情況,還在非線性系統(tǒng)的因果分析中展示了明顯優(yōu)于Granger因果測試法和轉(zhuǎn)移熵的表現(xiàn)[19]。

針對兩兩時間序列X2和X1,Liang[20]運用最大似然估計推得從X2向(注意方向性)傳輸?shù)男畔⒘骺捎萌缦鹿接嬎悖?/p>

(3)

(4)

1.3 預(yù)測結(jié)果評價方法

1.3.1 趨勢異常綜合評分PS

PS評分計算公式:

(5)

其中N0為氣候趨勢預(yù)測正確的站數(shù),N1為一級異常預(yù)測正確的站數(shù),N2為二級異常預(yù)測正確的站數(shù),M為沒有預(yù)報二級異常而實況出現(xiàn)降水距平百分率≥100%或等于-100%的站數(shù)(稱漏報站)。其中,20%≤降水距平百分率絕對值<50%為一級異常,降水距平百分率絕對值≥50%為二級異常;同號率指各站降水距平值實況和預(yù)報正負符號相同的站數(shù)占總站數(shù)的百分比。

1.3.2 空間距平相關(guān)系數(shù)ACC

ACC計算公式:

(6)

1.3.3 均方根誤差

均方根誤差(RMSE)又稱標(biāo)準(zhǔn)誤差,是評估預(yù)測結(jié)果好壞的常用指標(biāo),用來衡量一組數(shù)自身的離散程度,能更好地反映模型預(yù)測值與真實值之間的偏差,值越小,表明模型的預(yù)測能力越好。計算公式為:

(7)

其中Xobs,i為每一個真實值,Xmodel,i表示對應(yīng)的預(yù)測值,n為樣本量。

2 訂正模型在氣候預(yù)測中的應(yīng)用

2.1 數(shù)據(jù)來源

本文選取西部方向7省(市/區(qū))區(qū)域站歷史數(shù)據(jù)、歐洲中期天氣預(yù)報中心EC氣候模式數(shù)據(jù)、國家氣候中心NCC氣候模式數(shù)據(jù)、114項氣候系統(tǒng)監(jiān)測指數(shù)(88項大氣環(huán)流指數(shù)、26項海溫指數(shù))。

(1)區(qū)域站數(shù)據(jù)選擇1985年1月至2021年9月240個地面氣象觀測站逐月的降水資料(西部方向共243個區(qū)域站,其中56 666攀枝花、57 503東興區(qū)、51 747塔中站點因缺測資料較多,不計入此次建模);

(2)EC氣候模式歷史回算時間范圍為1993年2月至2022年9月,空間范圍為25°N - 50°N、70°E - 140°E,空間分辨率1°×1°,時間分辨率1 month;

(3)NCC氣候模式歷史回算時間范圍為1991年1月至2022年12月,空間范圍為25°N - 50°N、70°E - 140°E,空間分辨率1°×1°,時間分辨率1 month;

(4)114項氣候系統(tǒng)監(jiān)測指數(shù)包含副高、東亞槽、歐亞環(huán)流型等88項大氣環(huán)流指數(shù),及厄爾尼諾、暖池等26項海溫指數(shù)的逐月平均值,時間范圍為1951年1月至2023年2月。

2.2 氣候模式訂正實驗

2.2.1 模式數(shù)據(jù)訂正

將NCC模式數(shù)據(jù)與EC模式數(shù)據(jù)進行均值融合,得到融合網(wǎng)格NEC,將其插值到240個站點。令插值的降水?dāng)?shù)據(jù)為輸入,各測站實測的降水?dāng)?shù)據(jù)為輸出,利用隨機森林構(gòu)建訂正模型。建模完成后,輸入均值融合網(wǎng)格數(shù)據(jù)進入訂正模型,得到利用實測站點訂正后的模式網(wǎng)格數(shù)據(jù)R_NEC。

將R_NEC、NCC、EC插值到站點,與站點實測數(shù)據(jù)進行誤差分析,經(jīng)訂正后的R_NEC模式網(wǎng)格數(shù)據(jù)能夠有效減少原有模式數(shù)據(jù)的均方根誤差,如圖2所示。

圖2 R_NEC、NCC、EC模式均方根誤差

2.2.2 因果分析

對R_NEC格點場降水進行EOF分解,得到空間系數(shù)和時間系數(shù)。根據(jù)累積方差貢獻率,各模態(tài)累計方差貢獻率如圖3所示。

圖3 各模態(tài)累計方差貢獻率

選取前4個模態(tài)(方差貢獻率90%)時間系數(shù)分別與起報前1~6 mon共684項環(huán)流指數(shù)進行相關(guān)性分析。采用信息流分析各模態(tài)高影響環(huán)流因子,取信息流值τCol→Row≥1%表示因子之間具有強因果關(guān)系[20],高影響因子集數(shù)量如表1所示。

表1 各模態(tài)影響因子概況

2.3 結(jié)果分析

基于隨機森林構(gòu)建模型,以不同模態(tài)高影響因子集為輸入,以其時間系數(shù)為輸出,得到各模態(tài)預(yù)報的時間系數(shù);利用模型預(yù)報的時間系數(shù)和EOF分解出的空間系數(shù)還原成格點場。

使用1993年2月~2014年7月258個樣本進行訓(xùn)練,2014年8月~2021年9月86個樣本進行檢驗。將預(yù)報數(shù)據(jù)和優(yōu)化后的格點數(shù)據(jù)插值到站點,計算各站點RMSE以及逐月ACC、PS評分,隨機森林模型RF、融合網(wǎng)格R_NEC、歐洲中心氣候模式EC、國家氣候中心模式NCC四種模式結(jié)果如圖4所示。

圖4 不同預(yù)測模型預(yù)報效果評價

隨機森林模型RF、融合網(wǎng)格R_NEC、歐洲中心氣候模式EC、國家氣候中心模式NCC四種模式平均RMSE、ACC得分、PS得分及其對應(yīng)的方差如表2所示。

表2 各站點預(yù)報評分

對比來看,RF模型預(yù)報效果最優(yōu),R_NEC網(wǎng)格次之,均比NCC、EC模式預(yù)報效果有較大提升。

(1)模型精度方面,RF模型預(yù)報RMSE均值最低、RMSE方差最小。

(2)預(yù)報技巧方面,RF模型ACC評分、PS評分及PS評分方差均為最小,特別是PS方差較模式預(yù)報大幅減小,說明模型在異常降水預(yù)報的表現(xiàn)穩(wěn)定度較模式大幅提升。但RF模型ACC方差大于NCC模式,離散度較高,說明RF模型在降水預(yù)報空間場表現(xiàn)有待提高。

3 結(jié)論

西部方向氣候預(yù)測影響因子眾多、非線性特征凸顯,本文利用機器學(xué)習(xí)算法,分析挖掘地氣系統(tǒng)內(nèi)部規(guī)律,提高了氣候模式在西部方向的預(yù)報準(zhǔn)確度,為機器學(xué)習(xí)算法在西部氣候預(yù)測中的應(yīng)用提供了思路。對比國內(nèi)外主流氣候預(yù)測模式,本文所建立的模式訂正方案能夠有效降低預(yù)測誤差,并具有更好的預(yù)報技巧。

然而,由于模式在高原地區(qū)表現(xiàn)極為不佳,加之初始場擾動劇烈,模型優(yōu)化后的預(yù)報準(zhǔn)確度依然不高,下一步將探索使用不同機器學(xué)習(xí)算法修訂對比預(yù)報結(jié)果;此外,將探索數(shù)學(xué)算法與地氣系統(tǒng)物理模型相結(jié)合的研究途徑,提升模式預(yù)報精度,從而為算法模型構(gòu)建提供更好的初始場。

猜你喜歡
格點氣候模態(tài)
帶有超二次位勢無限格點上的基態(tài)行波解
一種電離層TEC格點預(yù)測模型
帶可加噪聲的非自治隨機Boussinesq格點方程的隨機吸引子
瞧,氣候大不同
氣候變暖會怎樣?
格點和面積
國內(nèi)多模態(tài)教學(xué)研究回顧與展望
基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識別
立冬
由單個模態(tài)構(gòu)造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
孝义市| 理塘县| 乌什县| 三亚市| 宁城县| 阳朔县| 昌黎县| 鹿邑县| 陵水| 屏东市| 大同县| 进贤县| 东乡县| 崇左市| 公安县| 连江县| 万载县| 昭通市| 台南县| 潼关县| 宜城市| 沁水县| 太白县| 晋宁县| 珲春市| 收藏| 株洲县| 阿拉善盟| 仁怀市| 巨野县| 安平县| 泗水县| 鹤庆县| 会昌县| 湖北省| 白朗县| 昭通市| 织金县| 文昌市| 梅州市| 平邑县|