国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

京津冀站點風(fēng)溫濕要素的機器學(xué)習(xí)訂正方法

2022-07-14 10:44韓念霏陳明軒宋林燁曹偉華
應(yīng)用氣象學(xué)報 2022年4期
關(guān)鍵詞:報時方根風(fēng)速

韓念霏 楊 璐 陳明軒 宋林燁 曹偉華 韓 雷

1)(中國海洋大學(xué), 青島 266100) 2)(北京城市氣象研究院, 北京 100089)

引 言

災(zāi)害性天氣對我國乃至全球社會經(jīng)濟發(fā)展和人民生活均有較大影響,因此天氣預(yù)報在日常出行、戶外體育賽事舉辦、防災(zāi)減災(zāi)、交通運輸及農(nóng)業(yè)生產(chǎn)等方面作用越來越重要。數(shù)值天氣預(yù)報是根據(jù)大氣實際情況,在一定初值和邊值條件下,通過大型計算機進(jìn)行數(shù)值計算,求解描述天氣演變過程的流體力學(xué)和熱力學(xué)的方程組,預(yù)測未來一定時段大氣運動狀態(tài)和天氣現(xiàn)象的方法。雖然目前制作日常天氣預(yù)報的主要方法均來自于區(qū)域或全球尺度數(shù)值天氣預(yù)報模式,但模式初始場、動力和物理過程的不確定性等因素,可能導(dǎo)致數(shù)值天氣預(yù)報與實況間存在較大偏差[1]。

在海量數(shù)據(jù)背景下,人們開始研究采用多種誤差訂正方法[2-6]實現(xiàn)對單一數(shù)值預(yù)報結(jié)果準(zhǔn)確率的進(jìn)一步提升,其中人工智能顯現(xiàn)出非常廣闊的應(yīng)用前景[7-8],越來越多的研究嘗試采用新方法對模式產(chǎn)品進(jìn)行誤差訂正,并取得理想結(jié)果。孫全德等[9]利用LASSO回歸、隨機森林(random forest,RF)和深度學(xué)習(xí)(deep learning,DL)3種機器學(xué)習(xí)算法,對歐洲中期天氣預(yù)報中心(European Centre for Medium-Range Weather Forecasts,ECMWF)的華北地區(qū)近地面10 m風(fēng)速預(yù)報進(jìn)行訂正,并與傳統(tǒng)的模式輸出統(tǒng)計(model output statistics,MOS)方法進(jìn)行對比,表現(xiàn)出機器學(xué)習(xí)方法在改善局地氣象精準(zhǔn)預(yù)報方面的潛力。Han等[10-11]不僅借助支持向量機(support vector machine,SVM)模型預(yù)測風(fēng)暴運動趨勢和風(fēng)暴增長,還在2021年采用深度學(xué)習(xí)模型CU-net對ECMWF全球數(shù)值預(yù)報系統(tǒng) (ECMWF-IFS)2 m溫度、2 m相對濕度、10 m風(fēng)的24~240 h預(yù)報進(jìn)行格點訂正,為數(shù)值天氣預(yù)報偏差訂正研究和業(yè)務(wù)應(yīng)用開辟了新途徑。楊璐等[12]采用SVM建立雷暴大風(fēng)天氣識別模型,有效提高了雷暴大風(fēng)預(yù)警預(yù)報準(zhǔn)確率;譚江紅等[13]采用lightGBM機器學(xué)習(xí)方法建立模型對湖北89個氣象站的氣溫預(yù)報進(jìn)行訂正,準(zhǔn)確率較數(shù)值預(yù)報產(chǎn)品明顯提升,展現(xiàn)了lightGBM機器學(xué)習(xí)方法對于氣象要素預(yù)報的良好應(yīng)用前景。疏杏勝等[14]利用人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、極限學(xué)習(xí)機(extreme learning machine,ELM)以及SVM模型對遼寧桓仁水庫流域未來1~3 d降雨進(jìn)行多模式集成預(yù)報,結(jié)果表明:基于機器學(xué)習(xí)模型的多模式降雨集成預(yù)報方法可行且能夠提高短期預(yù)報降雨精度;Burke[15]在改善高分辨率的冰雹預(yù)報效果時采用RF方法,減小了模型偏差,冰雹預(yù)測準(zhǔn)確率更高。

2016年Chen等[16]提出了XGBoost(eXtreme Gradient Boosting)方法,由于其優(yōu)良性能及在各領(lǐng)域出色表現(xiàn)而廣泛應(yīng)用。韓豐等[17]基于XGBoost方法提高了短時強降水事件的預(yù)報準(zhǔn)確率;毛開銀等[18]在XGBoost方法的基礎(chǔ)上提出CD-XGBoost(clustering and double XGBoost)算法,對中國2552個氣象觀測站觀測數(shù)據(jù)與ECMWF數(shù)值模式逐3 h地面10 m風(fēng)速預(yù)報進(jìn)行站點訂正,取得較高準(zhǔn)確率;任萍等[19]采用XGBoost方法對北京地區(qū)快速更新循環(huán)數(shù)值系統(tǒng)的預(yù)報數(shù)據(jù)進(jìn)行訂正,有效減小了模式預(yù)報誤差;徐磊等[20]提出結(jié)合XGBoost方法和奇異譜分析法(SSA)的SSA-XGBoost預(yù)測模型,試驗結(jié)果表明,該模型對降水變化趨勢預(yù)測具有指導(dǎo)意義。

北京城市氣象研究院于2017年開始研發(fā)建立睿圖模式體系中的快速集成與無縫隙融合預(yù)報子系統(tǒng)——睿圖-睿思系統(tǒng)(rapid-update multi-scale analysis and prediction system-rapid integration and seamless ensemble,RMAPS-RISE,簡稱RISE系統(tǒng)),該系統(tǒng)是一個多源氣象數(shù)據(jù)快速集成與融合預(yù)報系統(tǒng),可以實現(xiàn)逐10 min更新、覆蓋京津冀全域500 m、北京冬奧重點賽區(qū)100 m網(wǎng)格分辨率的風(fēng)場、溫度、降水等的實時預(yù)報,并在數(shù)據(jù)融合、偏差訂正、氣候?qū)W訂正等方面開展大量工作[21-25]。本文嘗試采用線性回歸方法、梯度提升回歸(gradient boosting regression tree, GBRT)方法、XGBoost方法以及堆疊集成學(xué)習(xí)方法(Stacking方法)與RISE系統(tǒng)預(yù)報的高時空分辨率氣象數(shù)據(jù)相結(jié)合,構(gòu)建加入地形特征以及多源氣象要素特征的誤差分析模型對RISE系統(tǒng)各起報時次的站點預(yù)報進(jìn)行逐小時間隔訂正,探索機器學(xué)習(xí)方法在高分辨率預(yù)報誤差訂正方面的作用和效果,為業(yè)務(wù)應(yīng)用提供參考。

1 數(shù)據(jù)及模型構(gòu)建方法

1.1 數(shù) 據(jù)

1.1.1 數(shù)據(jù)簡介

本文采用2020年12月—2021年11月RISE系統(tǒng)提供的時間分辨率為10 min、水平分辨率為500 m的京津冀網(wǎng)格化快速更新預(yù)報產(chǎn)品(簡稱RISE產(chǎn)品)。觀測數(shù)據(jù)為同時段京津冀地區(qū)470個考核站的溫度、濕度、風(fēng)速、風(fēng)向4種氣象要素。RISE產(chǎn)品為網(wǎng)格數(shù)據(jù),而本研究針對470個考核站進(jìn)行訂正,因此為了與自動氣象站觀測數(shù)據(jù)匹配,首先需要對格點數(shù)據(jù)采用歐氏距離插值法進(jìn)行處理,針對470個考核站每個站點的經(jīng)緯度坐標(biāo),同時遍歷所有格點的經(jīng)緯度坐標(biāo),通過歐式距離公式計算出每個站點與所有格點的距離,將最小距離的所對應(yīng)格點預(yù)報數(shù)據(jù)插值保存為站點數(shù)據(jù)。對風(fēng)場信息的預(yù)報與觀測進(jìn)行數(shù)據(jù)格式統(tǒng)一化后,以時間維度對所有時刻的自動氣象站觀測數(shù)據(jù)和RISE站點預(yù)報疊加,制作三維數(shù)據(jù)集的同時完成觀測數(shù)據(jù)與預(yù)報在時間維度的對應(yīng),方便后續(xù)建模訓(xùn)練。

1.1.2 數(shù)據(jù)集劃分

由于RISE產(chǎn)品在不同季節(jié)、不同氣象要素誤差表現(xiàn)不同,因此將RISE產(chǎn)品按季節(jié)分為春(2021年3—5月)、夏(2021年6—8月)、秋(2021年9—11月)、冬(2020年12月—2021年2月)4個季節(jié)構(gòu)建樣本集。圖1為4個季節(jié)24個整點起報時次有效樣本量,不同季節(jié)可用樣本量均在20000以上,秋冬季樣本量多于春夏季。

模型訓(xùn)練過程中,對數(shù)據(jù)集采用k折交叉驗證[26]對各季節(jié)測試集進(jìn)行評估:將所有的數(shù)據(jù)集分成k份子集,進(jìn)行k輪測試過程,每次選取其中1份作為測試集,其余(k-1)份作為訓(xùn)練集訓(xùn)練模型,用保留的測試集計算預(yù)測誤差;重復(fù)訓(xùn)練過程直到k個子集均被作為測試集使用過,計算k個模型的誤差平均值作為該模型評分。k折交叉驗證是估計模型準(zhǔn)確性的可靠方法,本文對各模型進(jìn)行5折交叉驗證評估可以提供更準(zhǔn)確的測試誤差估計值,減少單一異常值對結(jié)果影響。

圖1 不同季節(jié)各起報時次有效樣本量Fig.1 Number of valid samples for each initial time in different seasons

1.2 模型構(gòu)建

考慮到RISE系統(tǒng)不同季節(jié)、不同起報時次誤差分布特征不同,本文采用誤差分析的建模思路針對RISE產(chǎn)品的4個季節(jié)以及24個整點起報時次(00:00—23:00,世界時,下同)分別構(gòu)建樣本進(jìn)行訂正,起報時次是指開始發(fā)出預(yù)報的時次,RISE產(chǎn)品中每個起報時次均對未來1~12 h的每個整點發(fā)出對應(yīng)12個時刻預(yù)報(也稱為預(yù)報時效分別為1~12 h 預(yù)報),由于RISE系統(tǒng)前2 h預(yù)報準(zhǔn)確率已較高,因此本文分別對所有起報時次未來3~12 h預(yù)報進(jìn)行訂正,提高各起報時次預(yù)報準(zhǔn)確率。本建模方法訂正2 m溫度、2 m相對濕度、10 m風(fēng)速和10 m 風(fēng)向4種氣象要素,所有建模特征的提取均需要滾動遍歷訓(xùn)練集所有相鄰前后兩日數(shù)據(jù)進(jìn)行誤差分析,對于各要素按照不同起報時次分別建模進(jìn)行訂正,模型特征與標(biāo)簽由以下幾部分構(gòu)成:①收集前一日所有不同起報時次對未來3~12 h的各氣象要素預(yù)報,并與自動氣象站對應(yīng)的觀測數(shù)據(jù)相減,計算前一日預(yù)報偏差作為特征;②收集當(dāng)日不同起報時次對未來3~12 h多種氣象要素的預(yù)報作為特征,這是由于多種氣象要素相互影響,將多要素預(yù)報作為特征能夠更全面學(xué)習(xí)天氣變化。如在溫度預(yù)報中,加入濕度和風(fēng)場信息預(yù)報,其他要素亦然;③每個樣本對應(yīng)的站點高度特征;④標(biāo)簽為所訂正氣象要素預(yù)報對應(yīng)時間的自動氣象站觀測數(shù)據(jù)。

考慮到每個起報時次對未來3~12 h的預(yù)報誤差會隨著預(yù)報時效增加而出現(xiàn)不同的變化趨勢,為了更好地對前一日預(yù)報誤差進(jìn)行學(xué)習(xí),本建模方法將每個起報時次的預(yù)報時效分為兩段單獨進(jìn)行訓(xùn)練,以達(dá)到更好的學(xué)習(xí)效果,第1段采用預(yù)報時效為3~6 h的所有樣本訓(xùn)練,第2段采用預(yù)報時效為7~12 h的所有樣本訓(xùn)練。

2 機器學(xué)習(xí)方法

2.1 線性回歸方法

線性回歸方法是機器學(xué)習(xí)中屬于監(jiān)督學(xué)習(xí)的基礎(chǔ)且常用的方法之一。氣象要素預(yù)報受多個變量影響,因此選用多元線性回歸模型,根據(jù)不同建模方法尋找觀測數(shù)據(jù)與所選特征變量之間的線性關(guān)系。

2.2 梯度提升回歸方法(GBRT方法)

梯度提升回歸方法(GBRT方法)是機器學(xué)習(xí)Boosting算法家族中應(yīng)用較廣泛的樹型算法之一,是一種具有高預(yù)測精度和強可解釋性的機器學(xué)習(xí)方法。GBRT方法每次計算的目的是減少上一次計算的殘差(利用殘差學(xué)模型),為了消除殘差,在殘差減少的梯度方向上創(chuàng)建一個新的模型。GBRT方法可以看作M棵樹組成的加法模型。

2.3 XGBoost方法

XGBoost方法是一種開源機器學(xué)習(xí)算法。XGBoost方法相比于GBRT方法將損失函數(shù)(預(yù)測值和真實值的誤差)變得更復(fù)雜,同時XGBoost方法針對過擬合這一關(guān)鍵問題也進(jìn)行改善:在代價函數(shù)增加了正則化項,不僅控制模型復(fù)雜度,還可以降低模型偏差,有效防止過擬合,得到學(xué)習(xí)能力極強的模型。除此之外,引入閾值限制深度優(yōu)化、葉節(jié)點分裂和樹形生長過程。在XGBoost方法訓(xùn)練過程中,從第2棵樹開始,每棵樹的目標(biāo)值設(shè)定為上一棵樹預(yù)測值與真實值的誤差,以不斷提高對錯誤樣本的學(xué)習(xí)能力。同大部分機器學(xué)習(xí)模型一樣XGBoost方法的目標(biāo)函數(shù)可以用損失函數(shù)和正則項之和表示,對模型的準(zhǔn)確度和復(fù)雜度進(jìn)行控制和優(yōu)化。

2.4 堆疊集成學(xué)習(xí)方法(Stacking方法)

集成學(xué)習(xí)的思想1979年由Dasarathy等[27]提出,廣泛用于分類和回歸任務(wù)。集成學(xué)習(xí)往往通過一些結(jié)合策略將多個學(xué)習(xí)器的結(jié)果進(jìn)行合成從而得到集成學(xué)習(xí)器的結(jié)果,相對于單一機器學(xué)習(xí)模型,該方法通過選取不同的結(jié)合策略對得到的多個學(xué)習(xí)器進(jìn)行組合得到最終結(jié)果,充分利用各個機器學(xué)習(xí)方法的優(yōu)勢,提高泛化能力,避免單一學(xué)習(xí)器可能因誤選而導(dǎo)致預(yù)測效果不佳的情況。其中典型代表為一種異質(zhì)集成學(xué)習(xí)算法堆疊法(簡稱Stacking方法)[28],在Stacking方法中將個體學(xué)習(xí)器稱為初級學(xué)習(xí)器,用于結(jié)合的學(xué)習(xí)器稱為次學(xué)習(xí)器或元學(xué)習(xí)器,該方法首先從初始數(shù)據(jù)集訓(xùn)練出初級學(xué)習(xí)器,生成一個新的數(shù)據(jù)集用于訓(xùn)練次級學(xué)習(xí)器。近年人們嘗試將該方法應(yīng)用于各個領(lǐng)域,其預(yù)測結(jié)果相比單模型均展現(xiàn)出良好的學(xué)習(xí)能力[29-31]。

本文將前3種機器學(xué)習(xí)方法(線性回歸方法、GBRT方法以及XGBoost方法)作為Stacking方法中的初級學(xué)習(xí)器,選用3種方法中泛化能力最強的模型作為元學(xué)習(xí)器,利用Stacking方法,通過對前3種單一訂正方法進(jìn)行有效集成和二次學(xué)習(xí)訂正,充分發(fā)揮各方法的優(yōu)勢,訓(xùn)練過程如下:首先,將訓(xùn)練集按照初始建模選取的特征量F(x1,x2,…,xn),采用線性回歸方法、GBRT方法、XGBoost方法3種方法輸入特征標(biāo)簽進(jìn)行模型訓(xùn)練,并采用訓(xùn)練數(shù)據(jù)對應(yīng)輸入訓(xùn)練后的3個模型,得到3個模型的預(yù)報值tlr,tgb,txgb;其次,將得到的3個預(yù)報值加入到原始訓(xùn)練數(shù)據(jù)特征,構(gòu)建新的訓(xùn)練數(shù)據(jù)特征量F(tlr,tgb,txgb,x1,…,xn),將新的數(shù)據(jù)集采用3種方法中表現(xiàn)相對較好的方法作為元學(xué)習(xí)器再進(jìn)行一次訓(xùn)練,得到元學(xué)習(xí)器最終訓(xùn)練模型;最后,采用測試集重復(fù)以上步驟,得到初級學(xué)習(xí)器的預(yù)報值后,構(gòu)建新的測試數(shù)據(jù)特征量,并輸入元學(xué)習(xí)器的最終訓(xùn)練模型,得到最終預(yù)報并進(jìn)行對比分析。

3 試驗結(jié)果

3.1 2 m溫度

圖2為春季00:00,06:00,12:00,18:00 4個不同起報時次,采用上述4種方法對RISE系統(tǒng)的2 m溫度站點預(yù)報訂正前后均方根誤差對比。圖2中4條虛線分別對應(yīng)不同方法3~12 h預(yù)報時效均方根誤差平均值。由圖2可見,不同起報時次的RISE溫度預(yù)報呈不同的誤差狀態(tài)。其他3個季節(jié)(圖略)同春季展示的情況相似,均在12:00起報的未來10~12 h(對應(yīng)北京時間為06:00—08:00)預(yù)報誤差最大。這是由于RISE系統(tǒng)所用背景場為中國氣象局北京快速更新循環(huán)數(shù)值預(yù)報系統(tǒng)(CMA-BJ)預(yù)報產(chǎn)品,該系統(tǒng)預(yù)報誤差有明顯的日變化特征,在早上和傍晚時段受太陽輻射等影響導(dǎo)致誤差較大[32]。

圖2 RISE系統(tǒng)春季2 m溫度預(yù)報訂正前后均方根誤差對比Fig.2 Comparison of 2 m temperature root mean square error of RISE in spring before and after correction

續(xù)圖2

表1為4種方法采用誤差分析建模后,對2 m溫度的季節(jié)訂正結(jié)果??梢钥吹?,經(jīng)過機器學(xué)習(xí)方法訂正后,4個季節(jié)的所有起報時次溫度預(yù)報誤差相比RISE產(chǎn)品誤差均明顯降低。其中,Stacking方法訂正效果在4個季節(jié)中均表現(xiàn)最佳,訂正后春、夏、秋、冬4個季節(jié)相對于RISE產(chǎn)品的均方根誤差分別降低35.4%,37.12%,40.25%和40.40%。單一方法訂正中,XGBoost方法表現(xiàn)最佳,均方根誤差降低20%~35%,其次為GBRT方法,線性回歸方法相對最低,但仍有明顯效果。

表1 4種方法對2 m溫度預(yù)報的季節(jié)訂正結(jié)果Table 1 Corrected results for 2 m temperature based on four methods in each season

3.2 2 m相對濕度

由于RISE系統(tǒng)的溫度和相對濕度預(yù)報技術(shù)路線基本一致,因此文中僅給出基于誤差分析建模,采用4種方法對4個季節(jié)所有起報時次未來3~12 h的2 m相對濕度預(yù)報均方根誤差對比,其中4條虛線為對應(yīng)訂正方法的3~12 h預(yù)報時效均方根誤差的平均值(圖3),采用4種方法對4個季節(jié)2 m相對濕度的季節(jié)訂正結(jié)果見表2。由圖3可見,4個季節(jié)所有起報時次對未來3~8 h的2 m相對濕度預(yù)報均方根誤差均隨著預(yù)報時效的增加而增大,達(dá)到最大后趨于平穩(wěn),訂正后的誤差變化規(guī)律與原始預(yù)報的變化規(guī)律保持一致,但幅度較小。同時可以看到,Stacking方法訂正結(jié)果優(yōu)勢最明顯,其次是XGBoost方法、GBRT方法、線性回歸方法。由表2可知Stacking方法在4個季節(jié)RISE產(chǎn)品2 m相對濕度預(yù)報訂正中,使均方根誤差降低35%~45%,改善效果明顯。

圖3 RISE系統(tǒng)4個季節(jié)2 m相對濕度預(yù)報訂正前后均方根誤差對比Fig.3 Comparison of 2 m relative humidity root mean square error of RISE in four seasons before and after correction

表2 4種方法對2 m相對濕度的季節(jié)訂正結(jié)果Table 2 Corrected results for 2 m relative humidity based on four methods in each season

3.3 10 m風(fēng)速

限于篇幅,圖4僅給出夏季和在00:00,06:00,12:00,18:00 4個起報時次采用4種機器學(xué)習(xí)方法對RISE 10 m風(fēng)速預(yù)報訂正前后的均方根誤差對比,其中4條虛線為對應(yīng)訂正方法的3~12 h預(yù)報時效均方根誤差平均值。表3給出4種機器學(xué)習(xí)方法采用誤差分析建模對10 m風(fēng)速的季節(jié)訂正結(jié)果。綜合對比圖4和表3可以看到,經(jīng)過4種機器學(xué)習(xí)方法訂正后不同起報時次、不同季節(jié)和不同預(yù)報時效的風(fēng)速預(yù)報誤差相比RISE系統(tǒng)預(yù)報誤差均明顯降低。4個季節(jié)中,秋冬季均方根誤差較大,為1.5~2 m·s-1,訂正后大部分預(yù)報時效均方根誤差低于1 m·s-1,Stacking方法訂正效果最佳,使均方根誤差分別減小47.44%和46.81%;春夏季RISE產(chǎn)品均方根誤差較小,不超過1.5 m·s-1,Stacking方法訂正后,均方根誤差分別降低32.17%和36.80%。

圖4 RISE系統(tǒng)夏季10 m風(fēng)速預(yù)報訂正前后均方根誤差對比Fig.4 Comparison of 10 m wind speed root mean square error of RISE in summer before and after correction

表3 4種方法對10 m風(fēng)速的季節(jié)訂正結(jié)果Table 3 Corrected results for 10 m wind speed based on four methods in each season

3.4 10 m風(fēng)向

參考中國氣象局對風(fēng)向的檢驗標(biāo)準(zhǔn)《QXT 229—2014風(fēng)預(yù)報檢驗方法》,對風(fēng)向進(jìn)行處理后采用平均絕對偏差對訂正結(jié)果進(jìn)行檢驗。表4分別給出4種機器學(xué)習(xí)方法采用誤差分析建模對10 m風(fēng)向所有起報時次的季節(jié)訂正結(jié)果??梢钥吹?,線性回歸方法對于春季、夏季和冬季的風(fēng)向訂正效果不明顯,對于RISE產(chǎn)品平均絕對偏差僅降低10%左右,而Stacking方法對于這3個季節(jié)RISE產(chǎn)品平均絕對偏差分別降低16.95%,18.75%和23.89%。RISE系統(tǒng)預(yù)報秋季10 m風(fēng)向誤差最大,平均絕對偏差為88.56°,Stacking方法訂正后平均絕對偏差為64.88°,降低26.74%,在4個季節(jié)中訂正效果最明顯。對于RISE系統(tǒng)10 m風(fēng)向預(yù)報的訂正效果仍是Stacking方法最佳,XGBoost方法效果次之,GBRT方法與線性回歸方法較差,但4種方法對RISE系統(tǒng)10 m風(fēng)向預(yù)報均有提升效果。

3.5 個例分析

圖5和圖6分別給出2022年2月19日和3月4日兩次大風(fēng)天氣個例中北京延慶佛爺頂站00:00與09:00起報基于Stacking方法及RISE系統(tǒng)2 m溫度與10 m風(fēng)速預(yù)報對比。

由圖5可以看到,RISE系統(tǒng)2月19日00:00起報對溫度的預(yù)報較實況偏低,09:00起報對溫度預(yù)報較實況偏高,而經(jīng)Stacking方法訂正后溫度始終與實況保持相同的變化趨勢,且在數(shù)值上也更接近,有效改善了RISE系統(tǒng)的溫度預(yù)報結(jié)果。由10 m 風(fēng)速變化可知,RISE系統(tǒng)00:00起報風(fēng)速經(jīng)Stacking方法訂正后與實況變化趨勢一致,在9 h預(yù)報時效時風(fēng)速均出現(xiàn)增大的趨勢,而RISE系統(tǒng)預(yù)報風(fēng)速逐漸減??;RISE系統(tǒng)09:00起報的風(fēng)速預(yù)報始終偏小,而經(jīng)Stacking方法訂正后的風(fēng)速與實況變化更吻合,表現(xiàn)出機器學(xué)習(xí)方法對于風(fēng)速預(yù)報有較為穩(wěn)定的正向訂正效果。

由圖6可以看到,RISE系統(tǒng)3月4日00:00和09:00起報的溫度預(yù)報較實況整體偏低,未能準(zhǔn)確預(yù)報升溫趨勢,而經(jīng)Stacking方法訂正后的溫度在大部分時效與實況更為接近。RISE系統(tǒng)00:00起報風(fēng)速存在明顯的減小趨勢,而實況則為增大趨勢,Stacking方法訂正后風(fēng)速也呈減小趨勢,在數(shù)值上與實況更為接近。RISE系統(tǒng)08:00起報的風(fēng)速始終低于5 m·s-1,而實況為7~10 m·s-1,經(jīng)Stacking方法訂正后,風(fēng)速與實況更接近,因此Stacking方法對大風(fēng)天氣的變化敏感,對改善RISE系統(tǒng)預(yù)報有實際應(yīng)用價值。

圖5 2022年2月19日2 m溫度(柱狀)與10 m風(fēng)速(折線)訂正對比Fig.5 Comparison of 2 m temperature(the bar) and 10 m wind speed(the line) on 19 Feb 2022

圖6 如圖5,但為2022年3月4日訂正對比Fig.6 The same as in Fig.5,but for 4 Mar 2022

4 結(jié)論與討論

本文基于線性回歸方法、GBRT方法、XGBoost方法和Stacking方法4種機器學(xué)習(xí)訂正方法,采用氣象要素客觀預(yù)報誤差分析的建模思路,對北京城市氣象研究院研發(fā)的睿圖-睿思系統(tǒng)的風(fēng)溫濕要素預(yù)報產(chǎn)品開展站點訂正研究,結(jié)論如下:

1) 以RISE系統(tǒng)500 m分辨率格點預(yù)報為基礎(chǔ),插值得到站點預(yù)報,并與自動氣象站觀測數(shù)據(jù)匹配作為真實標(biāo)簽數(shù)據(jù),針對RISE系統(tǒng)每日24個起報時次對未來3~12 h的站點預(yù)報,基于上述4種機器學(xué)習(xí)方法構(gòu)建預(yù)報誤差模型進(jìn)行訂正,可以更好地擬合不同起報時次地面氣象要素的誤差特征,有效降低原始預(yù)報誤差。由于秋冬季的可用樣本量多于春夏季,因此整體上多種要素訂正試驗效果為秋冬季好于春夏季。

2) 基于Stacking方法,構(gòu)建適合于誤差分析模型的集成學(xué)習(xí)訂正模型,充分集成3種機器學(xué)習(xí)方法的優(yōu)勢,結(jié)果表明:該方法對4個季節(jié)的風(fēng)溫濕要素預(yù)報效果改善最明顯?;诰€性回歸方法、GBRT方法和XGBoost方法3種機器學(xué)習(xí)方法構(gòu)建的預(yù)報誤差訂正模型中,相較RISE產(chǎn)品而言,均有較為明顯的正向提升效果,其中XGBoost方法效果最佳,其后依次是GBRT方法、線性回歸方法。

總體上,機器學(xué)習(xí)方法可以有效減小RISE系統(tǒng)高分辨率氣象要素預(yù)報誤差,在客觀預(yù)報誤差訂正方面具有廣闊的應(yīng)用前景。在今后工作中,將從復(fù)雜地形角度出發(fā),將山區(qū)和平原地區(qū)不同類型站點分類建模進(jìn)行訂正試驗,提升復(fù)雜地形下的客觀預(yù)報誤差訂正效果;同時可以在保證當(dāng)前預(yù)報效果前提下,嘗試訓(xùn)練更長預(yù)報時效的訂正模型。隨著預(yù)報系統(tǒng)產(chǎn)品不斷積累,可以嘗試增加訓(xùn)練樣本,進(jìn)一步提高機器學(xué)習(xí)模型訂正效果。

猜你喜歡
報時方根風(fēng)速
邯鄲市近46年風(fēng)向風(fēng)速特征分析
基于最優(yōu)TS評分和頻率匹配的江蘇近海風(fēng)速訂正
基于時間相關(guān)性的風(fēng)速威布爾分布優(yōu)化方法
我們愛把馬鮫魚叫鰆鯃
報時豬
感應(yīng)式報時鬧鐘
報時貓
均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
快速評估風(fēng)電場50年一遇最大風(fēng)速的算法
數(shù)學(xué)魔術(shù)——神奇的速算
巴林右旗| 左贡县| 抚州市| 垦利县| 山阳县| 广宁县| 九江市| 河北区| 襄樊市| 民乐县| 浏阳市| 神池县| 泰宁县| 花垣县| 武胜县| 武功县| 通化县| 高青县| 张家界市| 河源市| 新宁县| 修武县| 沐川县| 三明市| 池州市| 阿克苏市| 象州县| 东宁县| 刚察县| 晋江市| 基隆市| 江西省| 兴和县| 镇雄县| 高淳县| 中江县| 房产| 时尚| 景谷| 贡觉县| 勐海县|