国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)方法在湖南夏季降水預(yù)測中的應(yīng)用

2022-05-12 23:13:54黃超李巧萍謝益軍彭嘉棟
大氣科學(xué)學(xué)報(bào) 2022年2期
關(guān)鍵詞:機(jī)器學(xué)習(xí)預(yù)測

黃超 李巧萍 謝益軍 彭嘉棟

摘要利用湖南97個(gè)國家站的逐月降水資料、國家氣候中心130項(xiàng)氣候指數(shù)集以及國家氣候中心和美國國家環(huán)境預(yù)報(bào)中心兩套季節(jié)預(yù)測模式的降水預(yù)測資料,采用遞歸特征消除法確定預(yù)測因子并使用多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量回歸和自然梯度提升三種算法建立了兩種湖南夏季降水統(tǒng)計(jì)預(yù)測方案的模型,檢驗(yàn)了預(yù)測效果。結(jié)果表明:基于機(jī)器學(xué)習(xí)的預(yù)測模型對湖南夏季雨型分布有較好的預(yù)測能力,兩種統(tǒng)計(jì)方案提前1~6mon起報(bào)的夏季降水平均距平相關(guān)系數(shù)分別為0.15和0.19,相比于NCEP和NCC模式有較大提升,平均PS評分分別為69.3和69.2,高于NCC模式的63.1,略低于NCEP模式的71.5;進(jìn)一步分析表明,3—5月起報(bào)的機(jī)器學(xué)習(xí)模型的預(yù)測技巧可能來源于前冬極地和中高緯環(huán)流,12—2月起報(bào)的模型預(yù)測技巧則可能來自海溫的前兆信號(hào)。

關(guān)鍵詞機(jī)器學(xué)習(xí);夏季降水;預(yù)測

湖南地形具有三面環(huán)山、南高北低的特點(diǎn),氣候復(fù)雜多變,夏季旱澇轉(zhuǎn)換(李易芝等,2017),易出現(xiàn)洪澇、干旱等氣象災(zāi)害。在全球變暖背景下,湖南夏季極端降水明顯增加(周莉等,2018),因此進(jìn)一步提升夏季降水預(yù)測水平對湖南防災(zāi)減災(zāi)具有重要現(xiàn)實(shí)意義。

目前降水季節(jié)趨勢預(yù)報(bào)主要分為統(tǒng)計(jì)學(xué)、動(dòng)力學(xué)和動(dòng)力統(tǒng)計(jì)相結(jié)合三類方法。統(tǒng)計(jì)方法充分利用歷史資料規(guī)律,選取有明確物理意義和顯著相關(guān)的因子進(jìn)行建模。范可等(2007)通過前期因子建立統(tǒng)計(jì)模型對長江中下游夏季降水年際增量進(jìn)行預(yù)測,顯著提高了業(yè)務(wù)預(yù)測技巧。杜良敏等(2016)針對不同氣候分區(qū)建立統(tǒng)計(jì)模型對我國夏季降水進(jìn)行預(yù)測。李春暉等(2018)采用時(shí)空投影方法建立廣東省降水統(tǒng)計(jì)預(yù)測方法。Yimetal.(2014)使用統(tǒng)計(jì)模型對中國南方夏季降水進(jìn)行預(yù)測。但由于各預(yù)測因子相互作用過程復(fù)雜,不同時(shí)間尺度的預(yù)測信號(hào)不一致,加大了預(yù)測的難度。隨著數(shù)值模式的發(fā)展,動(dòng)力模式成為氣候預(yù)測的主要工具,許多國家建立了數(shù)值預(yù)報(bào)模式(丁一匯,2011)。近年來,我國季節(jié)預(yù)測模式對大氣環(huán)流、ENSO(ElNioSouthernOscillation)現(xiàn)象、亞洲夏季風(fēng)等的預(yù)測能力已有明顯提升(吳捷等,2017),但對降水預(yù)測技巧依然有限,特別是對東亞地區(qū)夏季降水的預(yù)報(bào)技巧相對較低(王予等,2021)。在這樣的現(xiàn)實(shí)情況下,專家學(xué)者在此基礎(chǔ)上發(fā)展了動(dòng)力和統(tǒng)計(jì)相結(jié)合的預(yù)測方法(封國林等,2013),充分利用歷史資料并考慮大氣海洋物理機(jī)制,進(jìn)一步提高了降水預(yù)測準(zhǔn)確率??伦诮ǖ龋?009)提出了最優(yōu)子集回歸方法。賈小龍等(2010)發(fā)展了變形典型相關(guān)分析(CombinationofEmpiricalOrthogonalFunctionandCanonicalCorrelationAnalysis,BPCCA)方法。舒建川等(2019)在此基礎(chǔ)上使用BPCCA方法在西南地區(qū)進(jìn)行了應(yīng)用。組合統(tǒng)計(jì)降尺度方法(LiuandFan,2014;劉穎等,2020)也能夠提升一定的降水預(yù)測技巧。此外,國家氣候中心多模式解釋應(yīng)用集成預(yù)測系統(tǒng)(MultimodelDownscalingEnsemblePredictionSystem,MODES)(劉長征等,2013)和動(dòng)力統(tǒng)計(jì)相結(jié)合的季節(jié)預(yù)測系統(tǒng)(ForecastSystemonDynamicAnalogueCombinedSkills,F(xiàn)ODAS)(王啟光等,2011)的研發(fā)對我國夏季降水預(yù)測業(yè)務(wù)水平提升起到了關(guān)鍵作用。

機(jī)器學(xué)習(xí)強(qiáng)調(diào)從歷史數(shù)據(jù)中學(xué)習(xí)規(guī)則,對新數(shù)據(jù)進(jìn)行推理和預(yù)測。區(qū)別于傳統(tǒng)統(tǒng)計(jì)方法,機(jī)器學(xué)習(xí)擅長處理非線性問題,利用機(jī)器學(xué)習(xí)的優(yōu)勢可以從地球系統(tǒng)中發(fā)現(xiàn)并提取新的相互關(guān)聯(lián)信號(hào)(賀圣平等,2021)。近年來,機(jī)器學(xué)習(xí)在氣象領(lǐng)域的應(yīng)用越來越廣泛,常用的機(jī)器學(xué)習(xí)算法有支持向量機(jī)、貝葉斯算法、神經(jīng)網(wǎng)絡(luò)、決策樹算法等(馮漢中和陳永義,2004;孫照渤等,2013;張宇彤等,2013;苗春生等,2017)。隨著計(jì)算能力的提高和深度學(xué)習(xí)理論的發(fā)展,以卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)和長短期時(shí)間記憶網(wǎng)絡(luò)(LongShortTermMemory,LSTM)為代表的深度學(xué)習(xí)方法在氣候領(lǐng)域得到應(yīng)用,例如CNN算法對ENSO指數(shù)的預(yù)測技巧超過了主流動(dòng)力模式(Hametal.,2019),沈皓俊等(2020)采用的LSTM算法對中國夏季降水預(yù)測評分超過了同期業(yè)務(wù)模式。

湖南夏季降水時(shí)空分布不均,影響因子復(fù)雜,當(dāng)前對其機(jī)理和預(yù)測的研究還存在短板,動(dòng)力模式預(yù)測水平與業(yè)務(wù)服務(wù)需求存在差距,有必要利用機(jī)器學(xué)習(xí)的優(yōu)勢進(jìn)一步提高當(dāng)?shù)仡A(yù)測水平。考慮到湖南降水觀測資料年份較少,不適合深度學(xué)習(xí)方法,因此本文采用隨機(jī)森林算法進(jìn)行遞歸特征消除來挑選預(yù)測因子,使用多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量回歸和自然梯度提升方法建模,結(jié)合動(dòng)力模式降水預(yù)測結(jié)果,建立適用于湖南本地的夏季降水統(tǒng)計(jì)預(yù)測方法。

1資料和方法

1.1數(shù)據(jù)來源和預(yù)處理

預(yù)報(bào)因子資料來源于國家氣候中心提供的氣候系統(tǒng)監(jiān)測指數(shù)集(下載地址:http://cmdp.ncccma.net/Monitoring/cn_index_130.php),共包含130項(xiàng)氣候系統(tǒng)指數(shù)的月平均值。其中大氣環(huán)流指數(shù)88項(xiàng),主要包括副高、東亞槽、極渦、歐亞環(huán)流型、遙相關(guān)、太平洋信風(fēng)等大氣環(huán)流指數(shù)。海溫指數(shù)26項(xiàng),主要包括厄爾尼諾(各區(qū)及類型)、暖池、印度洋、親潮區(qū)、黑潮區(qū)等海溫指數(shù)。其他指數(shù)16項(xiàng),主要包括冷空氣、臺(tái)風(fēng)、南方濤動(dòng)、北太平洋年代際振蕩、準(zhǔn)兩年振蕩、次表層海溫等指數(shù)。時(shí)間尺度為1980年1月—2020年12月,若出現(xiàn)缺測,直接將該因子剔除。

美國國家環(huán)境預(yù)報(bào)中心(NationalCentersforEnvironmentalPrediction,NCEP)和國家氣候中心(NationalClimateCenter,NCC)氣候預(yù)測模式數(shù)據(jù)來自MODES系統(tǒng),空間分辨率均為1°×1°,NCEP模式歷史回算時(shí)間范圍為1982—2020年(其中2011年資料缺失),模式氣候態(tài)取1982—2010年,NCC模式歷史回算時(shí)間范圍為1991—2020年,氣候態(tài)取1991—2010年。分別計(jì)算模式不同起報(bào)時(shí)間的夏季(6—8月)降水距平百分率,并采用雙線性插值將網(wǎng)格數(shù)據(jù)插值到站點(diǎn)上。實(shí)況夏季降水資料來自湖南省97個(gè)國家站1981—2020年的觀測數(shù)據(jù),夏季降水沒有明顯的線性趨勢,因此未做去趨勢處理,直接處理成降水距平百分率進(jìn)行分析。

樣本集共包含1981—2020年共40a、6個(gè)起報(bào)時(shí)間、10個(gè)模態(tài)共計(jì)2400個(gè)樣本(40×6×10);根據(jù)起報(bào)時(shí)間和模態(tài)劃分為60個(gè)子樣本集,每個(gè)子樣本集40個(gè)樣本;訓(xùn)練集時(shí)間段為1981—2010年,測試集為2011—2020年。建模時(shí)挑選對應(yīng)起報(bào)時(shí)間和模態(tài)的樣本集,其中訓(xùn)練集30個(gè)樣本進(jìn)行訓(xùn)練和交叉驗(yàn)證,測試集10個(gè)樣本進(jìn)行獨(dú)立檢驗(yàn)。

1.2評估方法

對湖南夏季降水評價(jià)指標(biāo)采用趨勢異常綜合評分PS(PS)和空間距平相關(guān)系數(shù)ACC(AnomalyCorrelatiomCoefficent,ACC)。PS評分的計(jì)算公式為:

其中:N為總站數(shù),本研究中取97;P1=0.5,P2=1.0;N0為預(yù)報(bào)與實(shí)況距平符號(hào)相同站數(shù)或符號(hào)不同但相差只有1級(jí)站數(shù)之和;N1為預(yù)報(bào)與實(shí)況同為2級(jí)5級(jí)的站數(shù),N2為預(yù)報(bào)與實(shí)況同為1級(jí)、6級(jí)的站數(shù)。

ACC的計(jì)算公式為:

其中:n為站點(diǎn)數(shù),yi和oi分別表示預(yù)測值和觀測值;和分別表示預(yù)測值和觀測值的平均值。

1.3建模方法

為了減少建模過程中機(jī)器學(xué)習(xí)算法的隨機(jī)性影響,本文采用多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和決策樹集成三種不同的機(jī)器學(xué)習(xí)方法進(jìn)行建模,這三種算法均屬于機(jī)器學(xué)習(xí)中的分類和回歸方法,對數(shù)據(jù)的識(shí)別和擬合過程具有一定差異。

1)多層前饋神經(jīng)網(wǎng)絡(luò)

本文使用的神經(jīng)網(wǎng)絡(luò)算法為多層前饋神經(jīng)網(wǎng)絡(luò),其一般包含輸入層、隱含層和輸出層(韓力群,2006;LeCunetal.,2015)。隱含層越多,模型數(shù)據(jù)表示能力越強(qiáng),更易造成過擬合,因此本文僅采用兩層隱含層,神經(jīng)元個(gè)數(shù)也不超過預(yù)報(bào)因子個(gè)數(shù)。模型的表達(dá)式為:

其中:xi為節(jié)點(diǎn)i的輸入值;Pk為節(jié)點(diǎn)k的輸出值;g1為隱含層激活函數(shù);g2為輸出層激活函數(shù);m和n分別為輸入層和輸出層神經(jīng)元個(gè)數(shù);wj0為隱含層第j個(gè)神經(jīng)元的偏差;wk0為輸出層第k個(gè)神經(jīng)元的偏差;wkj為輸出節(jié)點(diǎn)k與隱含節(jié)點(diǎn)j的權(quán)重;wji為輸入節(jié)點(diǎn)i與隱含節(jié)點(diǎn)j的權(quán)重。

2)支持向量回歸

支持向量回歸是支持向量機(jī)的拓展,算法通過核函數(shù)在高維或有限維空間中構(gòu)造一個(gè)或一組超平面使數(shù)據(jù)與其距離最?。愑懒x等,2004),在處理小樣本、高維和非線性問題上具有優(yōu)勢。本文選用高斯核函數(shù),因此表達(dá)式為:

其中:L為支持向量的個(gè)數(shù);ai、a*i、b為通過訓(xùn)練樣本確定的最優(yōu)超平面參數(shù);xi為預(yù)報(bào)因子;σ為控制高斯核參數(shù)寬度的參數(shù)。

3)決策樹集成

決策樹是機(jī)器學(xué)習(xí)中的分類回歸算法,對于回歸問題,算法目標(biāo)是盡量使劃分同一類別的平方誤差最小,但也易造成過擬合,可通過決策樹集成方法克服。本文使用的隨機(jī)森林和自然梯度提升樹均屬于決策樹集成算法。隨機(jī)森林回歸算法通過對訓(xùn)練集重復(fù)隨機(jī)采樣進(jìn)行決策樹建模,取多個(gè)決策樹平均值作為預(yù)測結(jié)果(Breiman,2001);而自然梯度提升樹算法通過梯度提升方法進(jìn)行預(yù)測,不斷對預(yù)測殘差進(jìn)行建模并集成多個(gè)決策樹,從而達(dá)到減少預(yù)測誤差的目(Pengetal.,2020)。

4)遞歸特征消除法

遞歸特征消除法是機(jī)器學(xué)習(xí)中常用的特征處理方法,起到挑選重要因子的作用。該方法通過反復(fù)構(gòu)建模型剔除重要程度最低的因子,并遍歷所有因子達(dá)到確定因子重要程度的目的。本文采用的重要性衡量方法為基尼重要性,在隨機(jī)森林內(nèi)部節(jié)點(diǎn)中通過反復(fù)將數(shù)據(jù)集分為兩個(gè)獨(dú)立的集合,計(jì)算每次分類后的集合內(nèi)部方差,依據(jù)分類前后集合的方差差值確定氣候因子的重要性,方差差值越大表示因子重要性越高。

2機(jī)器學(xué)習(xí)在降水預(yù)測中的應(yīng)用

2.1湖南夏季降水預(yù)報(bào)方案

將機(jī)器學(xué)習(xí)方法應(yīng)用預(yù)測因子篩選及湖南夏季降水預(yù)測建模中,圖1給出了降水預(yù)測的主要流程:

1)資料處理:分為三部分,第一部分獲取前期因子集,將起報(bào)時(shí)間前3mon的130項(xiàng)氣候系統(tǒng)指數(shù)作為前期因子集,例如5月起報(bào)的模型使用的是2、3、4月的氣候因子。第二部分是降水?dāng)?shù)據(jù),對1981—2010年湖南夏季觀測降水的距平百分率采用經(jīng)驗(yàn)正交函數(shù)分析方法(EOF)進(jìn)行分解,時(shí)間系數(shù)為預(yù)測目標(biāo)。第三部分是模式預(yù)報(bào)降水場,使用觀測降水場EOF分解后的空間系數(shù)對模式降水場進(jìn)行投影,得到模式預(yù)報(bào)的時(shí)間系數(shù)。

2)篩選關(guān)鍵因子組合:基于機(jī)器學(xué)習(xí)的遞歸特征消除思想,采用隨機(jī)森林算法獲取重要的氣候因子,再通過交叉驗(yàn)證選取合適的關(guān)鍵因子組合。

3)建模:分為兩個(gè)方案,方案一直接使用篩選的關(guān)鍵因子組合與EOF時(shí)間系數(shù)進(jìn)行建模;方案二將NCEP模式預(yù)報(bào)的降水場時(shí)間系數(shù)與方案一中的因子共同作為預(yù)報(bào)因子進(jìn)行建模。

4)輸出預(yù)報(bào)結(jié)果:利用模型預(yù)報(bào)的時(shí)間系數(shù)和觀測降水EOF分解的空間系數(shù)還原成預(yù)報(bào)降水場,對不同機(jī)器學(xué)習(xí)模型的預(yù)報(bào)結(jié)果進(jìn)行等權(quán)集合平均作為最終的預(yù)報(bào)結(jié)果。

2.2確定預(yù)測因子及EOF模態(tài)個(gè)數(shù)

使用隨機(jī)森林算法進(jìn)行遞歸特征消除來篩選預(yù)測因子,隨機(jī)森林算法通過計(jì)算預(yù)測因子的基尼重要性對其進(jìn)行排序,從而剔除不重要的預(yù)測因子,達(dá)到降維的目的。將所有候選氣候因子與前10個(gè)EOF模態(tài)時(shí)間系數(shù)分別進(jìn)行遞歸特征消除(決策樹數(shù)量參數(shù)設(shè)置為100,持續(xù)增大后誤差并無顯著減少),采用五折交叉驗(yàn)證進(jìn)行誤差分析。圖2給出了5月起報(bào)的前10個(gè)模態(tài)通過遞歸特征消除法剔除因子后均方根誤差,當(dāng)因子數(shù)達(dá)到某一閾值,誤差趨于平穩(wěn)。在因子重要性排序之后,選取該閾值之前的關(guān)鍵性因子即能在降低模型誤差的同時(shí)達(dá)到降維的目的,依據(jù)此方法便得到提前1~6mon起報(bào)和不同模態(tài)的預(yù)測因子(表2)。

采用交叉驗(yàn)證方法分析不同EOF模態(tài)個(gè)數(shù)對預(yù)測結(jié)果的影響。圖3給出了利用1981—2010年湖南夏季降水?dāng)?shù)據(jù)分別截取前1~20個(gè)不同EOF模態(tài)進(jìn)行五折交叉驗(yàn)證的結(jié)果,ACC和PS評分均為提前1~6mon起報(bào)的平均值。從圖中可以看出,EOF模態(tài)個(gè)數(shù)超過6個(gè),PS和ACC變化趨于平穩(wěn),當(dāng)EOF個(gè)數(shù)取8和10時(shí),ACC和PS分別達(dá)到最大值。結(jié)合圖3中所示的不同EOF模態(tài)的累計(jì)方差貢獻(xiàn)率以及還原后降水場與觀測場的相關(guān)系數(shù)來看,EOF模態(tài)個(gè)數(shù)越多,越能反映降水的時(shí)空變化,因此這里將EOF模態(tài)個(gè)數(shù)定為10,此時(shí)累計(jì)方差貢獻(xiàn)率為89.1%,ACC和TCC分別達(dá)到0.86和0.94,能夠反映降水的時(shí)空分布特征。

2.3參數(shù)設(shè)置及模型建立

表3中給出了多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)回歸、自然梯度提升樹三種算法的參數(shù)范圍,為避免

過擬合,參數(shù)設(shè)置盡量簡單,降低模型復(fù)雜度,所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。神經(jīng)網(wǎng)絡(luò)層數(shù)為2層,節(jié)點(diǎn)數(shù)取20~50,激活函數(shù)使用Relu;支持向量機(jī)使用高斯核;自然梯度提升樹的決策樹數(shù)量在20~500間取值。建模時(shí)取訓(xùn)練集對參數(shù)取值范圍內(nèi)的不同參數(shù)組合分別建模。例如對5月起報(bào)的EOF第一模態(tài)時(shí)間系數(shù)使用多層前饋神經(jīng)網(wǎng)絡(luò)建模時(shí),隱含層數(shù)量為2,對應(yīng)隱含層節(jié)點(diǎn)數(shù)分別為{50,50}、{40,40}、{30,30}、{20,20}共4組,正則化參數(shù)分別為0.0001、0.001、0.01、0.1、1共5個(gè),不同參數(shù)組合共計(jì)20個(gè);然后采用五折交叉驗(yàn)證方法計(jì)算得到20個(gè)模型的平均均方根誤差,其中隱含層節(jié)點(diǎn)數(shù)為{40,40}、正則化參數(shù)為0.01的模型誤差最小,作為最終預(yù)測模型;重復(fù)該步驟即得到2種方案3種算法10個(gè)模態(tài)提前1~6mon起報(bào)的共計(jì)360個(gè)預(yù)測模型。

對比三種算法不同起報(bào)時(shí)間的平均均方根誤差(圖4a),提前1、3、4mon起報(bào)的模型中支持向量回歸誤差最小,提前2、5、6mon起報(bào)的模型中,自然梯度提升樹誤差最小;通過不同模態(tài)的平均均方根誤差來看(圖4b),預(yù)測誤差主要位于前兩個(gè)模態(tài)。

兩種統(tǒng)計(jì)方案分別使用2011—2020年和2012—2020年數(shù)據(jù)進(jìn)行獨(dú)立樣本檢驗(yàn),得到對應(yīng)年份97個(gè)國家站夏季降水距平百分率數(shù)據(jù)并評估預(yù)報(bào)技巧。圖5分別給出氣候模式本身及兩種方案的統(tǒng)計(jì)模型提前1~6mon起報(bào)的降水距平空間相關(guān)系數(shù)(ACC)和PS評分。整體來看,方案一提前1~6mon起報(bào)的ACC分別為0.25、0.15、0.09、0.23、0.15、0.05,平均為0.15;方案二提前1~6mon起報(bào)的ACC分別為0.25、0.23、0.19、0.26、0.24、-0.01,平均為0.19;NCEP和NCC模式預(yù)報(bào)的平均ACC分別為0.08和0.02,統(tǒng)計(jì)方案有明顯提高;兩種方案提前1~6mon起報(bào)的平均PS評分分別為69.3和69.2,相比NCEP模式的71.5略低,但優(yōu)于NCC模式的63.1。從不同起報(bào)時(shí)間來看,2月起報(bào)(Lead4)的ACC最高,4月起報(bào)(Lead2)的PS評分最高。與動(dòng)力模式結(jié)果相比,機(jī)器學(xué)習(xí)模型的平均ACC比NCEP、NCC模式高,這種優(yōu)勢在提前3~6mon起報(bào)的模型上更加明顯,兩套動(dòng)力模式在提前3mon以上預(yù)報(bào)夏季降水幾乎沒有技巧,但在PS評分上,NCEP模式則更具優(yōu)勢。上述結(jié)果說明兩種基于機(jī)器學(xué)習(xí)的預(yù)測方法在降水空間分布的預(yù)測技巧上有優(yōu)勢,并且方案二比方案一效果更好,但在降水異常級(jí)的預(yù)測能力上比NCEP的動(dòng)力模式要差,可能因?yàn)榻y(tǒng)計(jì)方法更加傾向于預(yù)測平均狀態(tài),對降水異常級(jí)的預(yù)測能力不足。

圖6給出了方案一的2011—2020年和方案二的2012—2020年逐年夏季降水預(yù)測ACC和PS評分,可見預(yù)測評分表現(xiàn)出明顯的年際差異。兩種方案的預(yù)測模型在2012、2013、2016、2018年提前1~6mon起報(bào)的平均PS評分均超過70,預(yù)測效果較好,對應(yīng)的ACC評分在上述年份也較高。相比之下,方案二的平均ACC除2015年為負(fù)值,其余年份均為正值,整體預(yù)測技巧高于方案一。眾所周知,ENSO是熱帶太平洋地區(qū)海氣系統(tǒng)年際氣候變率最強(qiáng)信號(hào)(宗海鋒等,2010;Wenelal.,2015),ENSO對湖南降水預(yù)測有重要指示意義,分析機(jī)器學(xué)習(xí)模型在ENSO年的預(yù)測情況可以進(jìn)一步了解其預(yù)測水平。2016和2020年為典型的厄爾尼諾衰減年,兩種方案在2016年不同起報(bào)時(shí)間的預(yù)測均有較高的正技巧,平均ACC分別達(dá)到0.37和0.36,PS評分分別達(dá)到79.8和75.3,但2020年的預(yù)測并不穩(wěn)定,3月起報(bào)的降水預(yù)測為評分較低。從拉尼娜衰減年預(yù)測來看,2013和2018年的預(yù)測均有較高的正技巧;整體來看,機(jī)器學(xué)習(xí)建模方法在一定程度上能夠識(shí)別ENSO對湖南降水的影響。

4討論

上述結(jié)果表明機(jī)器學(xué)習(xí)方法能夠改善湖南夏季降水空間分布的預(yù)測技巧,但機(jī)器學(xué)習(xí)算法通常屬于黑箱模型,在解決氣候問題時(shí)難以給出合理的物理過程解釋,為了能夠進(jìn)一步了解機(jī)器學(xué)習(xí)方法預(yù)報(bào)技巧的來源,同時(shí)考慮到相近起報(bào)月份的預(yù)測因子相近,這里僅給出3月和12月起報(bào)的預(yù)測因子中前4個(gè)模態(tài)通過顯著性檢驗(yàn)的因子(表4)。可以看出,3月起報(bào)模型的前3個(gè)模態(tài)相關(guān)顯著的預(yù)測因子以前冬極地和中高緯環(huán)流指數(shù)為主,第四個(gè)模態(tài)中的南方濤動(dòng)和赤道中東太平洋200hPa緯向風(fēng)指數(shù)均反映與ENSO的高相關(guān)性,并且4月和5月起報(bào)的預(yù)測因子具有相似特點(diǎn)。12月起報(bào)的模型因子第一模態(tài)與前期東亞槽和西太副高位置有顯著相關(guān),后3個(gè)模態(tài)與海溫相關(guān)顯著,2月和1月起報(bào)的預(yù)測因子也與海溫顯著相關(guān)。這可能說明,3—5月起報(bào)的模型預(yù)報(bào)技巧主要來自前冬極地和中高緯環(huán)流的信號(hào),而12月—次年2月起報(bào)的模型預(yù)報(bào)技巧主要來自前期海溫,而這些因子如何影響湖南降水還需要進(jìn)一步研究。

本文僅考慮了起報(bào)時(shí)間前3mon的氣候因子,相關(guān)研究表明湖南夏季降水與前冬的大氣海洋狀態(tài)有重要聯(lián)系(李瑜等,2015;趙俊虎等,2016;高輝等,2017;余榮和翟盤茂,2018;謝傲和羅伯良,2020),而5月起報(bào)模型的預(yù)測因子并未包含整個(gè)冬季,本文嘗試將預(yù)測因子時(shí)間擴(kuò)大至起報(bào)時(shí)間前6mon的范圍,結(jié)果表明5月起報(bào)的方案一和方案二模型對于湖南夏季降水預(yù)測的平均ACC分別為0.12和0.15,PS分別為65.1和68.7,效果并不如前者,將其他起報(bào)時(shí)間的預(yù)測因子范圍也擴(kuò)大至前6mon,整體來看二者的平均ACC分別為0.16和0.17,PS分別為68.8和69.1,相比前者也并沒有顯著的提升,說明機(jī)器學(xué)習(xí)模型挑選的預(yù)測因子也存在一定的局限性,通過簡單增加預(yù)測因子數(shù)量的方式對于機(jī)器學(xué)習(xí)模型的預(yù)測效果并不會(huì)有顯著的提升。此外,地形的動(dòng)力和熱力作用對降水的發(fā)生有重要影響,湖南三面環(huán)山的特殊地形是影響湖南區(qū)域性降水的因素之一,本文基于大尺度氣候信號(hào)構(gòu)建的模型沒有考慮地形因素,對降水異常級(jí)預(yù)測能力有限,如何在機(jī)器學(xué)習(xí)模型中加入地形因素的影響還需進(jìn)一步研究。

5結(jié)論

本文采用機(jī)器學(xué)習(xí)算法篩選預(yù)測因子并結(jié)合動(dòng)力模式的降水預(yù)報(bào)建立了湖南夏季降水預(yù)測模型。主要結(jié)論如下:

采用隨機(jī)森林算法進(jìn)行遞歸特征消除確定預(yù)測因子,通過交叉驗(yàn)證確定最優(yōu)EOF模態(tài)個(gè)數(shù)后,使用多層前饋神經(jīng)網(wǎng)絡(luò)、支持向量回歸以及自然梯度提升分別建模并對預(yù)測結(jié)果進(jìn)行集合平均,比較了兩種方案的預(yù)測模型及兩套動(dòng)力模式對于湖南夏季降水的預(yù)測性能。評估結(jié)果表明基于機(jī)器學(xué)習(xí)的預(yù)測模型對湖南夏季雨型分布有較好的預(yù)測能力,ACC技巧優(yōu)于動(dòng)力模式,但對降水異常級(jí)的預(yù)測不如NCEP模式,兩種方案的預(yù)測模型不同起報(bào)時(shí)間的平均ACC分別為0.15和0.19,平均PS評分分別為69.3和69.2;并且機(jī)器學(xué)習(xí)建模方法能夠較好地識(shí)別ENSO對湖南降水的影響。

進(jìn)一步分析機(jī)器學(xué)習(xí)模型挑選的預(yù)測因子與降水關(guān)聯(lián),3—5月起報(bào)的機(jī)器學(xué)習(xí)模型的預(yù)測技巧可能來源于前冬極地和中高緯環(huán)流,12月—次年2月起報(bào)的模型預(yù)測技巧則可能來自海溫的前兆信號(hào),由于機(jī)器學(xué)習(xí)的黑箱特點(diǎn),很難了解這些因子之間相互調(diào)制的物理過程,有待通過診斷分析及模式敏感性試驗(yàn)等方法進(jìn)一步研究。

參考文獻(xiàn)(References)

BreimanL,2001.RandomForests[J].MachineLearning,45(1):532.

陳永義,俞小鼎,高學(xué)浩,等,2004.處理非線性分類和回歸問題的一種新方法(Ⅰ):支持向量機(jī)方法簡介[J].應(yīng)用氣象學(xué)報(bào),15(3):345354.ChenYY,YuXD,GaoXH,etal.,2004.AnewmethodfornonlinearclassifyandnonlinearregressionⅠ:introductiontosupportvectormachine[J].JApplMeteor,15(3):345354.(inChinese).

丁一匯,2011.季節(jié)氣候預(yù)測的進(jìn)展和前景[J].氣象科技進(jìn)展,1(3):1427.DingYH,2011.Progressandprospectsofseasonalclimateprediction[J].AdvMeteorSciTechnol,1(3):1427.(inChinese).

杜良敏,柯宗建,劉長征,等,2016.基于聚類分區(qū)的中國夏季降水預(yù)測模型[J].氣象,42(1):8996.DuLM,KeZJ,LiuCZ,etal.,2016.SummerprecipitationpredictionmodelsbasedontheclusteringregionalizationinChina[J].MeteorMon,42(1):8996.(inChinese).

范可,王會(huì)軍,ChoiYJ,2007.一個(gè)長江中下游夏季降水的物理統(tǒng)計(jì)預(yù)測模型[J].科學(xué)通報(bào),52(24):29002905.FanK,WangHJ,ChoiYJ,2007.AphysicalstatisticalpredictionmodelforsummerprecipitationinthemiddleandlowerreachesoftheYangtzeRiver[J].ChinSciBull,52(24):29002905.(inChinese).

封國林,趙俊虎,支蓉,等,2013.動(dòng)力統(tǒng)計(jì)客觀定量化汛期降水預(yù)測研究新進(jìn)展[J].應(yīng)用氣象學(xué)報(bào),24(6):656665.FengGL,ZhaoJH,ZhiR,etal.,2013.Recentprogressontheobjectiveandquantifiableforecastofsummerprecipitationbasedondynamicalstatisticalmethod[J].JApplMeteorSci,24(6):656665.(inChinese).

馮漢中,陳永義,2004.處理非線性分類和回歸問題的一種新方法(Ⅱ):支持向量機(jī)方法在天氣預(yù)報(bào)中的應(yīng)用[J].應(yīng)用氣象學(xué)報(bào),15(3):355365.FengHZ,ChenYY,2004.AnewmethodfornonlinearclassifyandnonlinearregressionⅡ:applicationofsupportvectormachinetoweatherforecast[J].JApplMeteor,15(3):355365.(inChinese).

高輝,袁媛,洪潔莉,等,2017.2016年汛期氣候預(yù)測效果評述及主要先兆信號(hào)與應(yīng)用[J].氣象,43(4):486494.GaoH,YuanY,HongJL,etal.,2017.Overviewofclimatepredictionofthesummer2016andtheprecursorysignals[J].MeteorMon,43(4):486494.(inChinese).

HamYG,KimJH,LuoJJ,2019.DeeplearningformultiyearENSOforecasts[J].Nature,573(7775):568572.doi:10.1038/s4158601915597.

韓力群,2006.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學(xué)出版社:2936.HanLQ,2006.Artificialneuralnetworktutorial[M].Beijing:BeijingUniversityofPostsandTelecommunicationsPress:2936.(inChinese).

賀圣平,王會(huì)軍,李華,等,2021.機(jī)器學(xué)習(xí)的原理及其在氣候預(yù)測中的潛在應(yīng)用[J].大氣科學(xué)學(xué)報(bào),44(1):2638.HeSP,WangHJ,LiH,etal.,2021.Machinelearninganditspotentialapplicationtoclimateprediction[J].TransAtmosSci,44(1):2638.doi:10.13878/j.cnki.dqkxxb.20201125001.(inChinese).

賈小龍,陳麗娟,李維京,等,2010.BPCCA方法用于中國冬季溫度和降水的可預(yù)報(bào)性研究和降尺度季節(jié)預(yù)測[J].氣象學(xué)報(bào),68(3):398410.JiaXL,ChenLJ,LiWJ,etal.,2010.StatisticaldownscalingbasedonBPCCA:predictabilityandapplicationtothewintertemperatureandprecipitationinChina[J].ActaMeteorolSin,68(3):398410.(inChinese).

柯宗建,張培群,董文杰,等,2009.最優(yōu)子集回歸方法在季節(jié)氣候預(yù)測中的應(yīng)用[J].大氣科學(xué),33(5):9941002.KeZJ,ZhangPQ,DongWJ,etal.,2009.Anapplicationofoptimalsubsetregressioninseasonalclimateprediction[J].ChinJAtmosSci,33(5):9941002.(inChinese).

李春暉,潘蔚娟,王婷,2018.廣東省降水的多尺度時(shí)空投影預(yù)測方法[J].應(yīng)用氣象學(xué)報(bào),29(2):217231.LiCH,PanWJ,WangT,2018.AmultiscalespatialtemporalprojectionmethodformonthlyandseasonalrainfallpredictioninGuangdong[J].JApplMeteorSci,29(2):217231.(inChinese).

李易芝,羅伯良,霍林,2017.湖南夏季旱澇轉(zhuǎn)折異常特征分析[J].暴雨災(zāi)害,36(4):339347.LiYZ,LuoBL,HuoL,2017.AnalysisonanomalouscharacteristicsofthesummerdroughtfloodtransitionsinHunan[J].TorrentialRainDisasters,36(4):339347.(inChinese).

李瑜,李維京,任宏利,等,2015.長江中下游地區(qū)冬夏干濕韻律特征分析[J].氣象學(xué)報(bào),73(3):496504.LiY,LiWJ,RenHL,etal.,2015.Analysisofdry/wetrhythmsinwinterandsummerprecipitationsoverthemidlowerreachesoftheYangtzeRiverBasin[J].ActaMeteorolSin,73(3):496504.(inChinese).

LeCunY,BengioY,HintonG,2015.Deeplearning[J].Nature,521(7553):436444.doi:10.1038/nature14539.

劉長征,杜良敏,柯宗建,等,2013.國家氣候中心多模式解釋應(yīng)用集成預(yù)測[J].應(yīng)用氣象學(xué)報(bào),24(6):677685.LiuCZ,DuLM,KeZJ,etal.,2013.Multimodeldownscalingensemblepredictioninnationalclimatecenter[J].JApplMeteorSci,24(6):677685.(inChinese).

LiuY,F(xiàn)anK,2014.AnapplicationofhybriddownscalingmodeltoforecastsummerprecipitationatstationsinChina[J].AtmosRes,143:1730.doi:10.1016/j.atmosres.2014.01.024.

劉穎,任宏利,張培群,等,2020.中國夏季降水的組合統(tǒng)計(jì)降尺度模型預(yù)測研究[J].氣候與環(huán)境研究,25(2):163171.LiuY,RenHL,ZhangPQ,etal.,2020.ApplicationofthehybridstatisticaldownscalingmodelinsummerprecipitationpredictioninChina[J].ClimEnvironRes,25(2):163171.(inChinese).

苗春生,何東坡,王堅(jiān)紅,等,2017.基于C4.5算法的長江中下游地區(qū)夏季降水預(yù)測模型研究及應(yīng)用[J].氣象科學(xué),37(2):256264.MiaoCS,HeDP,WangJH,etal,2017.ResearchandapplicationofsummerrainfallpredictionmodelinthemiddleandlowerreachesoftheYangtzeRiverbasedonC4.5algorithm[J].JMeteorSci,37(2):256264.(inChinese).

PengT,ZhiXF,JiY,etal,2020.Predictionskillofextendedrange2mmaximumairtemperatureprobabilisticforecastsusingmachinelearningpostprocessingmethods[J].Atmosphere,11(8):823.doi:10.3390/atmos11080823.

沈皓俊,羅勇,趙宗慈,等,2020.基于LSTM網(wǎng)絡(luò)的中國夏季降水預(yù)測研究[J].氣候變化研究進(jìn)展,16(3):263275.ShenHJ,LuoY,ZhaoZC,etal.,2020.PredictionofsummerprecipitationinChinabasedonLSTMnetwork[J].ClimChangeRes,16(3):263275.(inChinese).

舒建川,蔣興文,黃小梅,等,2019.中國西南夏季降水預(yù)測的統(tǒng)計(jì)降尺度建模分析[J].高原氣象,38(2):349358.ShuJC,JiangXW,HuangXM,etal.,2019.StatisticaldownscalingmodelinganalysisofsummerprecipitationinsouthwestChina[J].PlateauMeteor,38(2):349358.(inChinese).

孫照渤,譚桂容,趙振國,等,2013.中國東部夏季雨型的人工神經(jīng)網(wǎng)絡(luò)集合預(yù)測[J].大氣科學(xué)學(xué)報(bào),36(1):16.SunZB,TanGR,ZhaoZG,etal.,2013.EnsemblepredictionofsummerrainfallpatternsoverEasternChinabasedonartificialneuralnetworks[J].TransAtmosSci,36(1):16.doi:10.13878/j.cnki.dqkxxb.2013.01.001.(inChinese).

王啟光,封國林,鄭志海,等,2011.長江中下游汛期降水優(yōu)化多因子組合客觀定量化預(yù)測研究[J].大氣科學(xué),35(2):287297.WangQG,F(xiàn)engGL,ZhengZH,etal.,2011.AstudyoftheobjectiveandquantifiableforecastingbasedonoptimalfactorscombinationsinprecipitationinthemiddleandlowerreachesoftheYangtzeRiverinsummer[J].ChinJAtmosSci,35(2):287297.(inChinese).

王予,李惠心,王會(huì)軍,等,2021.CMIP6全球氣候模式對中國極端降水模擬能力的評估及其與CMIP5的比較[J].氣象學(xué)報(bào),79(3):369386.WangY,LiHX,WangHJ,etal.,2021.EvaluationofCMIP6modelsimulationsofextremeprecipitationinChinaandcomparisonwithCMIP5[J].ActaMeteorolSin,79(3):369386.(inChinese).

WenN,LiuZY,LiuYH,2015.DirectimpactofElNioonEastAsiansummerprecipitationintheobservation[J].ClimateDyn,44(11/12):29792987.doi:10.1007/s0038201526052.

吳捷,任宏利,張帥,等,2017.BCC二代氣候系統(tǒng)模式的季節(jié)預(yù)測評估和可預(yù)報(bào)性分析[J].大氣科學(xué),41(6):13001315.WuJ,RenHL,ZhangS,etal.,2017.EvaluationandpredictabilityanalysisofseasonalpredictionbyBCCsecondgenerationclimatesystemmodel[J].ChinJAtmosSci,41(6):13001315.(inChinese).

謝傲,羅伯良,2020.湖南夏季降水與前期北太平洋海溫異常的關(guān)系[J].氣象與環(huán)境科學(xué),43(4):4957.XieA,LuoBL,2020.RelationsbetweentheprecedingSSTAinnorthernPacificOceanandsummerprecipitationinHunan[J].MeteorEnvironSci,43(4):4957.doi:10.16765/j.cnki.16737148.2020.04.007.(inChinese).

YimSY,WangB,XingW,2014.PredictionofearlysummerrainfalloverSouthChinabyaphysicalempiricalmodel[J].ClimateDyn,43(7/8):18831891.doi:10.1007/s0038201320143.

余榮,翟盤茂,2018.厄爾尼諾對長江中下游地區(qū)夏季持續(xù)性降水結(jié)構(gòu)的影響及其可能機(jī)理[J].氣象學(xué)報(bào),76(3):408419.YuR,ZhaiPM,2018.TheinfluenceofElNioonsummerpersistentprecipitationstructureinthemiddleandlowerreachesoftheYangtzeRiveranditspossiblemechanism[J].ActaMeteorolSin,76(3):408419.(inChinese).

張宇彤,矯梅燕,陳靜,2013.基于模式先驗(yàn)信息的貝葉斯集合降水概率預(yù)報(bào)試驗(yàn)[J].氣象,39(10):12331246.ZhangYT,JiaoMY,ChenJ,2013.Bayesianensembleprobabilisticforecastingmodelexperimentofprecipitationbasedonmodelprioriinformation[J].MeteorMon,39(10):12331246.(inChinese).

趙俊虎,楊柳,曾宇星,等,2016.夏季長江中下游和華南兩類雨型的環(huán)流特征及預(yù)測信號(hào)[J].大氣科學(xué),40(6):11821198.ZhaoJH,YangL,ZengYX,etal.,2016.AnalysisofatmosphericcirculationandpredictionsignalsforsummerrainfallpatternsinSouthernChina[J].ChinJAtmosSci,40(6):11821198.(inChinese).

周莉,胡瑞卿,李偉,等,2018.湖南省夏季極端降水異常時(shí)空特征及其成因分析[J].氣象科學(xué),38(6):838848.ZhouL,HuRQ,LiW,etal.,2018.CharacteristicsofsummerextremeprecipitationanomalyandthecauseofconcurrentanomalypatterninHunanProvince[J].JMeteorSci,38(6):838848.(inChinese).

宗海鋒,陳烈庭,張慶云,2010.ENSO與中國夏季降水年際變化關(guān)系的不穩(wěn)定性特征[J].大氣科學(xué),34(1):184192.ZongHF,ChenLT,ZhangQY,2010.TheinstabilityoftheinterannualrelationshipbetweenENSOandthesummerrainfallinChina[J].ChinJAtmosSci,34(1):184192.(inChinese).

PredictionofsummerprecipitationinHunanbasedonmachinelearning

HUANGChao1,2,LIQiaoping3,XIEYijun1,2,PENGJiadong1,2

1HunanClimateCenter,Changsha410118,China;

2HunanKeyLaboratoryofMeteorologicalDisasterPreventionandReduction,Changsha410118,China;

3CMAEarthSystemModelingandPredictionCentre(CEMC),Beijing100081,China

Againstthebackgroundofglobalwarming,summerextremeprecipitationinHunanhasincreasedsignificantly.Therefore,improvingthepredictionaccuracyofprecipitationisofgreatpracticalsignificancefordisasterpreventionandmitigationinHunanProvince.UsingthemonthlyprecipitationdatafrommeteorologicalstationsinHunan,theclimateindexsetsfromtheNationalClimateCenter(NCC)andtheprecipitationdatafromthehindcastexperimentsareperformedusingseasonalpredictionmodelsofNCCandNCEP(NationalCentersforEnvironmentalPrediction).Therecursivefeatureelimination(RFE)methodisusedtodeterminethekeyfactors,andtwostatisticalpredictionschemesofsummerprecipitationinHunanareestablishedbythreealgorithms:multilayerfeedforwardneuralnetwork(FNN),supportvectorregression(SVR)andnaturalgradientboosting(NGBoost).Theresultsshowthatthepredictionmodelbasedonmachinelearning(ML)hassuperiorabilitytopredictthedistributionpatternofsummerprecipitationinHunan.TherespectiveaverageACCskillsofthetwostatisticalschemeswithleadtimesof1to6monthsare0.15and0.19,whichisagreatimprovementcomparedwiththedynamicmodel.TherespectiveaveragePSscoresare69.3and69.2,whicharehigherthantheNCCmodel.ThefurtheranalysisindicatesthattheprecedingwinterpolarandmidandhighlatitudelatitudecirculationmaybethemainpredictabilitysourcesofMLmodelswithleadtimesof1to3months.Finally,thepredictionskillsofmodelswithleadtimesof4to6monthsarelikelyderivedfromtheprecursorysignalofseasurfacetemperature.

machinelearning;summerprecipitation;forecast

doi:10.13878/j.cnki.dqkxxb.20210903001

(責(zé)任編輯:劉菲)

20210903收稿,20211210接受

湖南省氣象局研究型業(yè)務(wù)預(yù)報(bào)預(yù)測專項(xiàng)(XQKJ21C011);中國氣象局預(yù)報(bào)員專項(xiàng)(CMAYBY2020087);國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2018YFC1505806)

猜你喜歡
機(jī)器學(xué)習(xí)預(yù)測
無可預(yù)測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
選修2—2期中考試預(yù)測卷(A卷)
不可預(yù)測
不必預(yù)測未來,只需把握現(xiàn)在
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
文登市| 旬阳县| 岱山县| 漳浦县| 赞皇县| 双流县| 慈溪市| 红原县| 文化| 永安市| 大姚县| 页游| 明光市| 珠海市| 盐边县| 临武县| 大悟县| 乐昌市| 南澳县| 苍南县| 天津市| 息烽县| 汝阳县| 乌拉特后旗| 临澧县| 上高县| 岱山县| 略阳县| 东丰县| 文山县| 馆陶县| 内江市| 呼玛县| 宜黄县| 织金县| 奈曼旗| 武夷山市| 武隆县| 罗城| 土默特右旗| 开化县|