国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學(xué)習(xí)的多源實況分析產(chǎn)品和觀測數(shù)據(jù)融合應(yīng)用試驗

2024-03-25 20:37:52李樹文趙桂香王一頡陳霄健閆慧
海洋氣象學(xué)報 2024年1期
關(guān)鍵詞:誤差分析機器學(xué)習(xí)

李樹文 趙桂香 王一頡 陳霄健 閆慧

摘 要 利用中國氣象局公共氣象服務(wù)中心地面實況專業(yè)服務(wù)產(chǎn)品(CARAS_SUR1 km,簡記為“CAR”)、國家氣象信息中心多源融合實況分析產(chǎn)品(ART_1 km,簡記為“ART”)、全國雷達反演降水產(chǎn)品(簡記為“RAD”)、風(fēng)云四號衛(wèi)星反演降水產(chǎn)品(簡記為“SAT”)以及全國氣象觀測站逐小時資料,應(yīng)用機器學(xué)習(xí)方法建立了基于選定位置氣溫、降水、風(fēng)向、風(fēng)速要素的實況融合應(yīng)用模型(簡記為“GBDT模型”)。15 d逐時GBDT融合產(chǎn)品的全國分區(qū)域檢驗結(jié)果表明:GBDT氣溫融合產(chǎn)品在東北、華北、西北、華中、新疆、西藏6個區(qū)域較CAR和ART均有改進,在西藏的改進最明顯,在華東和西南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR,在華南和內(nèi)蒙古GBDT融合產(chǎn)品誤差較ART、CAR略有增加;GBDT降水融合產(chǎn)品在樣本偏少的內(nèi)蒙古較ART、CAR誤差略有增加,其他區(qū)域有改進或基本相當;GBDT風(fēng)速、風(fēng)向融合產(chǎn)品較ART、CAR均有較大改進。試驗結(jié)果表明,機器學(xué)習(xí)方法可應(yīng)用于融合多源實況分析產(chǎn)品和觀測數(shù)據(jù),以開展選定位置氣溫、降水、風(fēng)向、風(fēng)速要素的實況氣象信息服務(wù)。

關(guān)鍵詞 機器學(xué)習(xí);多源數(shù)據(jù);動態(tài)模型;誤差分析

中圖分類號:P457文獻標志碼:A文章編號:2096-3599(2024)01-0108-10

DOI:10.19513/j.cnki.hyqxxb.20230330001

收稿日期:2023-03-30;修回日期:2023-08-02

基金項目:山西省基礎(chǔ)研究計劃自然科學(xué)研究面上項目(202203021211081);山西省氣象局面上項目(SXKMSTQ20226305)

第一作者簡介:李樹文,男,碩士,高級工程師,主要從事天氣預(yù)報技術(shù)和機器學(xué)習(xí)方法在氣象中的應(yīng)用研究,lsw1989@163.com。

通信作者簡介:趙桂香,女,碩士,正高級工程師,主要從事中尺度數(shù)值診斷和災(zāi)害性天氣預(yù)報技術(shù)研究,liyun0123@126.com。

Fusion and application experiment of machine learning based multi-source real-time analysis products and observation data

LI Shuwen1, ZHAO Guixiang2, WANG Yijie2, CHEN Xiaojian3, YAN Hui2

(1. Taiyuan Meteorological Bureau, Taiyuan 030002, China; 2. Shanxi Meteorological Observatory, Taiyuan 030006, China; 3. Shanxi Meteorological Information Center, Taiyuan 030006, China)

Abstract Based on machine learning, an application model (GBDT model) of real-time fusion on temperature, precipitation, wind direction, and wind speed at selected locations is developed by using the professional service product (CAR) of Public Meteorological Service Centre of China Meteorological Administration, the multi-source fusion observation analysis data (ART) of National Meteorological Information Centre, the nationwide radar precipitation retrieval product (RAD), the Fengyun-4 satellite precipitation retrieval product (SAT), and the hourly data of nationwide meteorological observation stations. The regional inspection results of the 15-d hourly GBDT fusion product throughout the country are as follows. The GBDT temperature fusion product improves compared to CAR and ART in 6 regions: Northeast China, North China, Northwest China, Central China, Xinjiang, and Tibet, with the most significant improvement in Tibet. In East China and Southwest China, GBDT fusion product is superior to ART, but inferior to CAR, and its error slightly increases compared to ART and CAR in South China and Inner Mongolia. The error of GBDT precipitation fusion product has a slight increase compared to ART and CAR in Inner Mongolia, where there are fewer samples, while in other areas, there are improvements or they are basically equivalent. The GBDT wind speed and direction fusion products have significant improvements compared to ART and CAR. The experiment results indicate that the machine learning method can be applied to fuse multi-source real-time analysis products and observation data, providing real-time meteorological information service of temperature, precipitation, wind direction, and wind speed at selected locations.

Keywords machine learning; multi-source data; dynamic model; error analysis

引言

氣象監(jiān)測系統(tǒng)不斷完備、監(jiān)測數(shù)據(jù)日趨精密,形成了以地面觀測、大氣探空、天氣雷達、氣象衛(wèi)星為主的多位一體探測布局,極大地提升了氣象服務(wù)與保障能力。在重大社會活動、氣象災(zāi)害應(yīng)急、個性化商業(yè)等服務(wù)與保障中,往往需要某一確定經(jīng)緯度的實況數(shù)據(jù)。而依賴于地面觀測站點布網(wǎng)的傳統(tǒng)資料離散化程度較高,難以滿足任意位置實況數(shù)據(jù)的氣象服務(wù)需求。

為發(fā)展無縫隙、全覆蓋的高分辨率實況產(chǎn)品,科研人員做出了很多努力。早期的研究多以站點觀測數(shù)據(jù)為主,運用數(shù)學(xué)插值方法形成格點化產(chǎn)品,這些產(chǎn)品在站點密集區(qū)效果較好,但在地形復(fù)雜、站點稀少的區(qū)域并不理想。20世紀90年代,隨著衛(wèi)星技術(shù)的發(fā)展,有學(xué)者使用地面降水實況對多衛(wèi)星集成降水產(chǎn)品進行訂正,研發(fā)了早期衛(wèi)星融合降水產(chǎn)品[1-2。21世紀以來,概率密度函數(shù)(probability density function,PDF)匹配、最優(yōu)插值(optimal interpolation,OI)、卡爾曼濾波(Kalman filter,KF)等方法在衛(wèi)星資料校正中的成熟應(yīng)用,衛(wèi)星融合降水產(chǎn)品得到顯著改善[3-5。伴隨氣象雷達的廣泛應(yīng)用,將雷達定量降水評估(quantitative precipitation estimation,QPE)產(chǎn)品[6與站點降水實況相結(jié)合,發(fā)展了基于卡爾曼濾波、最優(yōu)插值、反距離權(quán)重(inverse distance weighted,IDW)等方法的系統(tǒng)誤差訂正和局部偏差訂正技術(shù)[7,逐步形成雷達降水融合產(chǎn)品。2014年,中國氣象局氣象探測中心將“概率密度函數(shù)+貝葉斯模型平均(Bayes model averaging,BMA)+最優(yōu)插值”方法引入雷達定量估測產(chǎn)品[8,研制了地面、衛(wèi)星、雷達三源融合降水產(chǎn)品。與此同時,隨著計算機技術(shù)的不斷發(fā)展,國內(nèi)外研究人員借助數(shù)值模式,將站點、雷達和衛(wèi)星等觀測數(shù)據(jù)進行融合,取得了很多成果9-13。

逐小時1 km×1 km高分辨率的格點化實況產(chǎn)品已有多種選擇。2020年7月,國家氣象信息中心研發(fā)的中國區(qū)域1 km×1 km多源融合實況分析產(chǎn)品(簡記為“ART_1 km”)[14-15業(yè)務(wù)試運行;2021年7月,根據(jù)應(yīng)用評估成果16-18完成了產(chǎn)品質(zhì)量和時效優(yōu)化。2021年1月,中國氣象局公共氣象服務(wù)中心研發(fā)的逐小時滾動生成的全國1 km×1 km地面實況專業(yè)服務(wù)產(chǎn)品(簡記為“CARAS_SUR1 km”)業(yè)務(wù)運行。但在日益精細化的氣象業(yè)務(wù)與服務(wù)中,還缺少綜合應(yīng)用這兩種分析產(chǎn)品制作任意位置的氣象要素實況客觀工具方法。如果進一步提高現(xiàn)有格點產(chǎn)品的分辨率,帶來的計算量將呈指數(shù)級增長。那么,這些產(chǎn)品的日常應(yīng)用效果如何[19-20,能否將這些產(chǎn)品融合使用或者在此基礎(chǔ)上進一步優(yōu)化,這方面的研究目前還較少21-22。本研究旨在充分利用各類已有的實況分析數(shù)據(jù),運用機器學(xué)習(xí)方法23-26,研究多源資料和實況融合算法,建立基于任意位置的逐時實況分析(氣溫、降水、風(fēng)速、風(fēng)向)模型,并進行對比檢驗,為實況分析服務(wù)提供基礎(chǔ)支撐。

1 資料與方法

1.1 資料

所用資料為2020年8月1—15日由國家氣象信息中心提供的5類全國范圍逐小時數(shù)據(jù):國家氣象信息中心多源融合實況分析產(chǎn)品(ART_1 km,簡記為“ART”)、中國氣象局公共氣象服務(wù)中心地面實況專業(yè)服務(wù)產(chǎn)品(CARAS_SUR1 km,簡記為“CAR”)、全國雷達反演降水產(chǎn)品(簡記為“RAD”)、風(fēng)云四號衛(wèi)星反演降水產(chǎn)品(簡記為“SAT”)以及站點觀測數(shù)據(jù)。其中:ART包括氣溫、降水、風(fēng)速、U分量和V分量,水平分辨率為0.01°×0.01°,單要素單文件存儲;CAR包括氣溫、降水、露點溫度、相對濕度、平均風(fēng)速、平均風(fēng)向、平均風(fēng)U分量、平均風(fēng)V分量、極大風(fēng)U分量、極大風(fēng)V分量和地表氣壓,分辨率為0.01°×0.01°,單文件多要素存儲;RAD即全國天氣雷達定量估測降水產(chǎn)品,分辨率為0.01°×0.01°;SAT即風(fēng)云四號衛(wèi)星降水估計實時產(chǎn)品,原始數(shù)據(jù)平均分辨率為4 km,按照衛(wèi)星行列號存儲,換算為經(jīng)緯度后,在中國區(qū)域其分辨率約為0.01°×0.01°。將ART、CAR、RAD、SAT等4類格點產(chǎn)品作為自變量,實況觀測數(shù)據(jù)作為因變量來構(gòu)建模型,并將模型輸出產(chǎn)品與實況觀測數(shù)據(jù)對比分析檢驗。

需要特別說明的是,降水是離散數(shù)據(jù),模型構(gòu)建時樣本內(nèi)可能不存在降水。因此,在降水樣本選取時,先用觀測數(shù)據(jù)對研究區(qū)域內(nèi)降水要素做篩選得到降水時段,確保取樣時段內(nèi)該區(qū)域存在降水。

1.2 方法

1.2.1 梯度提升決策樹算法

梯度提升決策樹(gradient boosting decision tree,GBDT)是機器學(xué)習(xí)中一種基于決策樹的集成算法,其主要思想是利用弱分類器(決策樹)迭代訓(xùn)練以得到最優(yōu)算法,該算法具有訓(xùn)練效果好、不易過擬合等優(yōu)點。核心是將預(yù)測樣本逐次輸入到k個回歸決策樹的基分類算法,每次迭代過程用梯度下降減小損失,再由基分類算法的分類條件得到葉子節(jié)點值,乘以權(quán)重,最后累加得出結(jié)果。其表達式為:

式中:x為訓(xùn)練樣本點,Parm為GBDT算法參數(shù);Tk為回歸決策樹;αk為每棵決策樹的權(quán)重系數(shù)。k為第k棵子回歸決策樹(k=0,1,……,K)。

1.2.2 模型參數(shù)優(yōu)化

基于GBDT算法的模型建立后,分別對損失函數(shù)、權(quán)重縮減系數(shù)、最大迭代次數(shù)、子采樣比例、樹節(jié)點最大深度等參數(shù)調(diào)優(yōu),以更好地擬合訓(xùn)練數(shù)據(jù)集,提高模型擬合精度。

1.3 資料分析與處理

1.3.1 數(shù)據(jù)讀取與插值

對數(shù)據(jù)統(tǒng)一用Python處理,逐小時實況觀測數(shù)據(jù)為文本文件,用pandas庫直接讀入氣溫、降水、風(fēng)速、風(fēng)向4類要素。ART和CAR是grib2格式,使用xarray、cfgrib、pygrib庫讀入,其中ART讀入5類要素,CAR讀入11類要素;RAD為二進制(bin)格式,按照編碼方式對bin進行解析讀入;SAT為nc格式,用xarray讀入。

用Python處理時,為盡可能降低插值方法帶來的誤差,對ART、CAR、RAD和SAT等4類格點數(shù)據(jù)統(tǒng)一使用xarray庫內(nèi)置插值方法。其中ART、CAR直接使用xarray,RAD解析后轉(zhuǎn)為xarray類型。SAT在行列號的等距網(wǎng)格中完成插值與提取。

1.3.2 耗時與并行策略設(shè)計

由表1可見,單時次5類數(shù)據(jù)的讀取耗時主要集中在兩類grib2格式的數(shù)據(jù)。其中ART是單文件單要素,采用并行可提升效率??紤]到建模數(shù)據(jù)需要多個時次,將并行策略用于多時次上,采用多Python終端帶參數(shù)執(zhí)行。

需要說明的是,從機器學(xué)習(xí)GBDT算法的理論來講,適度增加特征數(shù)量有利于GBDT算法發(fā)揮其決策樹的優(yōu)勢。但當特征維度超過一定界限后,性能會隨特征維度增加而下降,此時需要去除冗余和無關(guān)特征。在本文中,特征數(shù)量遠遠小于維度界限,增加特征有利于得到更好的結(jié)果。因此,表1中提取了露點、相對濕度和地表氣壓3個與氣溫、降水、風(fēng)相關(guān)的要素作為增加特征量。

2 模型建立

2.1 算法設(shè)計策略

2.1.1 研究區(qū)域確定

建立基于任意位置的實況分析模型,先要確定研究區(qū)域。經(jīng)過大量試驗發(fā)現(xiàn),以任意位置的目標點為中心,向四周外擴0.35°形成0.7°×0.7°的區(qū)域作為目標位置的研究區(qū)域效果最好,對降水的分析尤為明顯。這主要因為:一是可以獲取到區(qū)域內(nèi)相關(guān)度高的站點,二是可以降低因范圍太大產(chǎn)生的噪聲影響。

2.1.2 算法設(shè)計思路

圖1a為目標位置分布,圖1b為以目標位置為中心的研究區(qū)域,圓點為研究區(qū)域中的站點。首先確定任意目標位置所在的區(qū)域(圖1b)后,分別提取區(qū)域內(nèi)站點實況數(shù)據(jù)和站點所在位置對應(yīng)的ART、CAR、RAD和SAT等4類融合數(shù)據(jù)。站點實況數(shù)據(jù)為因變量,其余4類融合數(shù)據(jù)為自變量,然后構(gòu)建機器學(xué)習(xí)模型,最后將目標點的4類融合數(shù)據(jù)帶入到建立的模型中得到目標點的最終實況融合數(shù)據(jù)。

在使用GBDT算法構(gòu)建模型時,對于氣溫、降水、風(fēng)速采用直接建模方法;而對于風(fēng)向,構(gòu)建U分量和V分量2個模型,再將U分量和V分量合成,得出結(jié)果。

2.1.3 建模數(shù)據(jù)時次選取

基于不同時次數(shù)據(jù)為自變量構(gòu)建的融合模型,經(jīng)10次隨機試驗,計算其平均絕對誤差(表2)。由表2可見,氣溫在1~3 h模型中的融合效果明顯優(yōu)于6 h以上;隨著時間的延長,降水誤差增大明顯,2 h模型融合效果較好;風(fēng)速、風(fēng)向也是2 h模型融合效果較好。因此,對于任意位置的實況分析模型,選取2 h數(shù)據(jù)建模,即當前時次和上一時次。

2.1.4 模型選擇

為探討模型的區(qū)域適用性,設(shè)計了靜態(tài)單一模型、靜態(tài)分區(qū)多模型、動態(tài)單目標模型、動態(tài)全目標模型共4類進行試驗。其中靜態(tài)模型是固定模型,為提前建模,后期將目標位置相關(guān)數(shù)據(jù)輸入模型即可;而動態(tài)模型需每次重新建模。2類靜態(tài)模型使用8月1—12日的全部時次數(shù)據(jù)建模,而2類動態(tài)模型僅使用當前時次和上一時次2 h數(shù)據(jù)建模。區(qū)域劃分采用全國氣象區(qū)域。分量級是在降水和風(fēng)速建模時,采用自然斷點法,按照目標位置的CAR產(chǎn)品要素劃分級別后建模。表3為4類模型構(gòu)建思路對比。

表4為4類模型試驗的平均絕對誤差,由此可見,4類模型的融合效果從高到低依次是:動態(tài)全目標模型、動態(tài)單目標模型、靜態(tài)分區(qū)多模型、靜態(tài)單一模型,選擇動態(tài)全目標模型作為實況融合算法。

2.2 算法技術(shù)路線

如圖2所示,建模到運行共4步:第一步,數(shù)據(jù)提取目標確定;第二步,提取數(shù)據(jù);第三步,方法選取并構(gòu)建模型;第四步,結(jié)果輸出。

3 結(jié)果分析

利用ART、CAR、RAD、SAT以及實況觀測資料,構(gòu)建GBDT模型后,將預(yù)測目標的ART、CAR、RAD、SAT等4類數(shù)據(jù)作為自變量代入模型,輸出最終融合產(chǎn)品。為驗證GBDT模型的融合效果以及在不同區(qū)域的適用性,將GBDT模型輸出的融合產(chǎn)品、ART、CAR分別與逐小時實況數(shù)據(jù)做全國分區(qū)域的誤差分析。誤差分析方法采用計算平均絕對誤差、最大絕對誤差和均方根誤差。

為盡可能讓試驗具有可對比性,在全國氣象分區(qū)(圖3)試驗取樣中(表5),對于時次盡量選取該區(qū)域內(nèi)出現(xiàn)降水且量級變化大、空間分布不均的時段。對于目標數(shù),東北、華北和西北3個區(qū)域內(nèi)各省隨機目標取10個,突出緯向分布檢驗;而華中和華南區(qū)域內(nèi)各省目標取5個,突出經(jīng)向分布檢驗;華東和西南各省目標取3個,突出東部與西部差異的檢驗;新疆、西藏和內(nèi)蒙古都是單省分區(qū),新疆和西藏取40個目標、內(nèi)蒙古取20個目標,相互可形成對比檢驗。

3.1 不同區(qū)域氣溫的檢驗

由GBDT融合產(chǎn)品與ART、CAR的氣溫平均絕對誤差對比(圖4a)可見,東北、華北、西北、華中、新疆、西藏6個區(qū)域GBDT融合產(chǎn)品誤差為0.06~0.31℃,ART、CAR誤差范圍分別為0.17~0.53℃、0.11~0.38℃,GBDT融合產(chǎn)品效果優(yōu)于ART與CAR。華南、華東、西南、內(nèi)蒙古4個區(qū)域GBDT融合產(chǎn)品誤差為0.12~0.31℃,ART、CAR誤差范圍分別為0.06~0.49℃、0.07~0.24℃,GBDT融合產(chǎn)品表現(xiàn)略遜,其中華東和西南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR,華南和內(nèi)蒙古GBDT融合產(chǎn)品誤差增加,但幅度小于0.06℃。由最大絕對誤差(圖4b)來看,GBDT融合產(chǎn)品在西藏改善幅度最大,較ART、CAR誤差降幅分別達5.87℃和3.94℃;東北、華中、新疆GBDT融合產(chǎn)品誤差為0.10~0.60℃,ART、CAR誤差分別為0.47~1.26℃、0.17~0.69℃,誤差均有小幅減小,表現(xiàn)略優(yōu);華北、華南三者誤差差別極??;西北GBDT融合產(chǎn)品與CAR相近,優(yōu)于ART;華東、西南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR;內(nèi)蒙古GBDT融合產(chǎn)品誤差約增加0.14℃。由氣溫均方根誤差(圖5)來看,GBDT融合產(chǎn)品在西藏提升幅度最大,均方根誤差小于0.20℃,表明誤差分布較為集中;東北、華北、西北、華中、新疆誤差為0.01~0.09℃,ART、CAR誤差分別為0.02~0.20℃、0.01~0.15℃,GBDT融合產(chǎn)品優(yōu)于二者;華東、西南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR;華南、內(nèi)蒙古GBDT融合產(chǎn)品誤差較二者略有增大,這與平均絕對誤差在各區(qū)域的表現(xiàn)是一致的。

總體上,氣溫檢驗中GBDT融合產(chǎn)品在西藏效果最好,盡管由空間分布來看誤差仍為最大,但從最大絕對誤差與均方根誤差來看,該區(qū)域誤差整體減小幅度明顯,且誤差相對集中,較ART、CAR均有較大改進。這與該地區(qū)站點布網(wǎng)偏少有關(guān),ART、CAR在當?shù)刭|(zhì)量不高,使GBDT模型優(yōu)勢得以凸顯。在其他區(qū)域,最大絕對誤差接近或明顯小于1.00℃,平均絕對誤差較ART、CAR在60%的區(qū)域均有減小。

3.2 不同區(qū)域降水的檢驗

2020年8月1—4日、5—7日、8—10日、11—15日先后受東北冷渦、副熱帶高壓、臺風(fēng)、西南渦、蒙古氣旋、熱帶季風(fēng)槽等系統(tǒng)影響,全國各地均有降水,除新疆、西藏以及西北北部降水較少外,其他各地均有短時強降水出現(xiàn),其中西北東部、華北、東北頻次最多。因此,利用8月1—15日的多源資料進行降水融合試驗是有意義的。

由GBDT融合產(chǎn)品與ART、CAR的降水量平均絕對誤差(圖6a)、最大絕對誤差(圖6b)和均方根誤差(圖7)對比來看,三者差異在各區(qū)域表現(xiàn)一致。東北、華北和西北GBDT融合產(chǎn)品改進較明顯,其平均絕對誤差為0.04~0.09 mm,最大絕對誤差為0.60~0.90 mm,均方根誤差為0.02~0.04 mm,而ART、CAR的平均絕對誤差分別為0.06~0.15 mm、0.07~0.21 mm,最大絕對誤差分別為1.68~7.31 mm、1.19~1.92 mm,均方根誤差分別為0.09~0.77 mm、0.05~0.19 mm。華中、華東、西南、新疆、西藏地區(qū)三者差異極小,GBDT融合產(chǎn)品與CAR表現(xiàn)相當;華南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR;內(nèi)蒙古GBDT融合產(chǎn)品平均絕對誤差為0.11 mm、最大絕對誤差為1.30 mm、均方根誤差為0.09 mm,3類誤差較ART、CAR均略有增大。

可見,在降水檢驗中,除華南和內(nèi)蒙古外,GBDT融合產(chǎn)品都取得了較好效果。由平均絕對誤差來看,GBDT融合產(chǎn)品較ART、CAR在東北、華北和西北誤差減小明顯,在華中、華東、西南、新疆、西藏5個區(qū)域三者基本相當,在華南和內(nèi)蒙古效果略差。對內(nèi)蒙古而言,可能與其東西跨度太大,試驗中有限數(shù)量的取樣有關(guān),得到的樣本特征不一致,導(dǎo)致建模效果不理想。

3.3 不同區(qū)域風(fēng)速和風(fēng)向的檢驗

由GBDT融合產(chǎn)品與ART、CAR的風(fēng)速平均絕對誤差和最大絕對誤差對比(圖8)來看,GBDT融合產(chǎn)品在各分區(qū)融合效果都很好,較ART、CAR均有明顯改進。GBDT融合產(chǎn)品與真值相比,平均絕對誤差小于或接近1.0 m·s-1,最大絕對誤差為1.5~4.5 m·s-1,均方根誤差(圖略)小于1.5 m·s-1。

由GBDT融合產(chǎn)品與ART、CAR的風(fēng)向?qū)Ρ龋▓D9)來看,平均絕對誤差在各區(qū)域都有減小,表明風(fēng)向整體較ART、CAR均有改進。在最大絕對誤差中,GBDT融合產(chǎn)品在東北、西北、華中、華南、華東、內(nèi)蒙古、新疆、西藏8個區(qū)域較ART、CAR有改進,而在華北與西南2個區(qū)域沒有明顯改善,其中華北區(qū)域較ART、CAR誤差均略有增大,西南區(qū)域優(yōu)于ART而遜于CAR。深入分析最大絕對誤差在西南區(qū)域中明顯偏離CAR的樣本結(jié)果,發(fā)現(xiàn)這些樣本風(fēng)速分布在2.3~2.5 m·s-1,而樣本總體的風(fēng)速分布在0~15.0 m·s-1,負訂正樣本占比為0.32%,并且風(fēng)向出現(xiàn)的負訂正并非由強風(fēng)或靜風(fēng)引起。同時也發(fā)現(xiàn),GBDT融合產(chǎn)品風(fēng)向負訂正超CAR的50°以上樣本數(shù)有且僅有1站次,而絕對誤差中次大值為30°,與CAR的次大值相近。

綜上,GBDT模型在風(fēng)速和風(fēng)向的分析中總體較ART、CAR有較大的改進,尤其是在對于風(fēng)速的分析中平均絕對誤差較ART、CAR分別減小23%~73%、61%~80%,對于風(fēng)向的分析中平均絕對誤差分別減小5%~37%、28%~63%。

4 結(jié)論

從氣象業(yè)務(wù)綜合應(yīng)用多源實況分析產(chǎn)品制作任意位置實況數(shù)據(jù)的需求出發(fā),應(yīng)用逐時ART、CAR、RAD、SAT格點實況分析產(chǎn)品和觀測數(shù)據(jù),基于GBDT機器學(xué)習(xí)方法構(gòu)建了動態(tài)融合應(yīng)用模型(GBDT模型),對15 d的GBDT氣溫、降水、風(fēng)向、風(fēng)速融合產(chǎn)品進行了全國分區(qū)檢驗,得到如下結(jié)論:

(1)GBDT氣溫融合產(chǎn)品在東北、華北、西北、華中、新疆、西藏6個區(qū)域較ART、CAR均有改進,在華東和西南GBDT融合產(chǎn)品優(yōu)于ART而遜于CAR,在華南和內(nèi)蒙古GBDT融合產(chǎn)品誤差較ART、CAR略有增大,幅度小于0.06℃??紤]到氣溫在實際應(yīng)用中,只保留一位小數(shù),其融合產(chǎn)品僅在西藏區(qū)域意義較大。

(2)GBDT降水融合產(chǎn)品在東北、華北和西北3個區(qū)域平均絕對誤差較ART、CAR改進明顯,在華中、華東、西南、新疆、西藏5個區(qū)域三者基本相當,在華南GBDT融合產(chǎn)品優(yōu)于ART遜于CAR;在樣本偏少的內(nèi)蒙古較ART、CAR誤差略有增大。

(3)GBDT風(fēng)速、風(fēng)向融合產(chǎn)品較ART、CAR均有較大改進。風(fēng)速融合產(chǎn)品平均絕對誤差較ART、CAR分別減小23%~73%、61%~80%,風(fēng)向融合產(chǎn)品平均絕對誤差分別減小5%~37%、28%~63%。

初步試驗結(jié)果表明,基于機器學(xué)習(xí)方法的動態(tài)全目標模型(GBDT模型)可應(yīng)用于融合多源實況分析產(chǎn)品和觀測數(shù)據(jù)開展選定位置氣溫、降水、風(fēng)向、風(fēng)速要素的實況氣象信息服務(wù),但有待利用更長時間序列資料進行檢驗并不斷完善模型。

參考文獻:

[1] HUFFMAN G J, ADLER R F, ARKIN P, et al. The Global Precipitation Climatology Project (GPCP) combined precipitation dataset[J]. Bull Amer Meteor Soc,1997,78(1):5-20.

[2]XIE P P, ARKIN P A. Global precipitation: a 17-year monthly analysis based on gauge observations, satellite estimates, and numerical model outputs[J]. Bull Amer Meteor Soc,1997,78(11):2539-2558.

[3]HUFFMAN G J,ADLER R F, BOLVIN D T, et al. The TRMM Multisatellite Precipitation Analysis (TMPA):quasi-global, multiyear, combined-sensor precipitation estimates at fine scales[J]. J Hydrometeorol,2007,8(1):38-55.

[4]JOYCE R J, JANOWIAK J E, ARKIN P A, et al. CMORPH: a method that produces global precipitation estimates from passive microwave and infrared data at high spatial and temporal resolution[J]. J Hydrometeorol,2004,5(3):487-503.

[5]USHIO T, SASASHIGE K, KUBOTA T, et al. A Kalman filter approach to the global satellite mapping of precipitation (GSMaP) from combined passive microwave and infrared radiometric data[J]. J Meteor Soc Japan,2009,87A:137-151.

[6]畢寶貴,代刊,王毅,等.定量降水預(yù)報技術(shù)進展[J].應(yīng)用氣象學(xué)報,2016,27(5):534-549.

[7]SEO D J, BREIDENBACH J P. Real-time correction of spatially nonuniform bias in radar rainfall data using rain gauge measurements[J]. J Hydrometeorol,2002,3(2):93-111.

[8]潘旸,沈艷,宇婧婧,等.基于最優(yōu)插值方法分析的中國區(qū)域地面觀測與衛(wèi)星反演逐時降水融合試驗[J].氣象學(xué)報,2012,70(6):1381-1389.

[9]RASMY M, KOIKE T, BOUSSETTA S, et al. Development of a satellite land data assimilation system coupled with a mesoscale model in the Tibetan Plateau[J]. IEEE Trans Geosci Remote Sens,2011,49(8):2847-2862.

[10]XIA Y L, MITCHELL K, EK M, et al. Continental-scale water and energy flux analysis and validation for North American Land Data Assimilation System Project phase 2 (NLDAS-2): 2. validation of model-simulated streamflow[J]. J Geophys Res,2012,117(D3):D03109.

[11]ALBERGEL C, DORIGO W, BALSAMO G, et al. Monitoring multi-decadal satellite earth observation of soil moisture products through land surface reanalyses[J]. Remote Sens Environ,2013,138:77-89.

[12]陳冠宇,艾未華,程玉鑫,等.基于星載SAR數(shù)據(jù)和模式資料的海面風(fēng)場變分融合方法研究[J].海洋氣象學(xué)報,2017,37(4):65-74.

[13]周強,陳潔,李玉華.基于Himawari-8衛(wèi)星的自適應(yīng)閾值火點判識算法適用性分析[J].海洋氣象學(xué)報,2020,40(1):127-133.

[14]師春香,潘旸,谷軍霞,等.多源氣象數(shù)據(jù)融合格點實況產(chǎn)品研制進展[J].氣象學(xué)報,2019,77(4):774-783.

[15]張璐,潘旸,谷軍霞,等.國際主流多源融合降水實況產(chǎn)品的研究進展與展望[J].氣象科技進展,2022,12(6):16-27.

[16]崔園園,張強,李威,等.CLDAS融合土壤相對濕度產(chǎn)品適用性評估及在氣象干旱監(jiān)測中的應(yīng)用[J].海洋氣象學(xué)報,2020,40(4):105-113.

[17]劉維成,徐麗麗,朱姜韜,等.再分析資料和陸面數(shù)據(jù)同化資料土壤濕度產(chǎn)品在中國北方地區(qū)的適用性評估[J].大氣科學(xué)學(xué)報,2022,45(4):616-629.

[18]劉瑩,師春香,王海軍,等.CLDAS氣溫數(shù)據(jù)在中國區(qū)域的適用性評估[J].大氣科學(xué)學(xué)報,2021,44(4):540-548.

[19]殷笑茹,焦圣明,喜度,等.基于多源數(shù)據(jù)的地面降水質(zhì)量控制方法研究[J].氣象科學(xué),2022,42(4):539-548.

[20]李奇臨,曠蘭,魏麟驍,等.不同分辨率的氣溫格點實況分析產(chǎn)品在重慶的對比檢驗[J].氣象科技進展,2022,12(6):91-96.

[21]潘旸,谷軍霞,師春香,等.中國北方冬季降水的多源資料產(chǎn)品評估和融合優(yōu)化[J].氣象學(xué)報,2022,80(6):953-966.

[22]董春卿,郭媛媛,張磊,等.基于CLDAS的格點溫度預(yù)報偏差訂正方法[J].干旱氣象,2021,39(5):847-856.

[23]孫全德,焦瑞莉,夏江江,等.基于機器學(xué)習(xí)的數(shù)值天氣預(yù)報風(fēng)速訂正研究[J].氣象,2019,45(3):426-436.

[24]李昕蓓,張?zhí)K平,衣立,等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)的單站能見度短臨預(yù)報試驗[J].海洋氣象學(xué)報,2019,39(2):76-83.

[25]王萌,劉合香,盧耀健,等.基于模糊時間序列的華南臺風(fēng)登陸時最大風(fēng)速極值預(yù)測模型[J].海洋氣象學(xué)報,2019,39(4):68-74.

[26]任萍,陳明軒,曹偉華,等.基于機器學(xué)習(xí)的復(fù)雜地形下短期數(shù)值天氣預(yù)報誤差分析與訂正[J].氣象學(xué)報,2020,78(6):1002-1020.

猜你喜歡
誤差分析機器學(xué)習(xí)
氣壓高度計的測量誤差分析及修正方法
基于詞典與機器學(xué)習(xí)的中文微博情感分析
基于“比值比較法”確定最佳實驗方案的研究
基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
云錫老廠錫礦貫通測量分析研究
基于支持向量機的金融數(shù)據(jù)分析研究
電學(xué)計量的誤差分析及不確定度理論探究分析
車載雷達陣面舉升裝置的位置誤差
山丹县| 缙云县| 吴堡县| 甘南县| 绥阳县| 玉门市| 大新县| 湘乡市| 吴堡县| 阿拉善左旗| 马山县| 塔河县| 张掖市| 岑溪市| 佛坪县| 五峰| 南开区| 沂水县| 临桂县| 璧山县| 岫岩| 喀什市| 巍山| 丹凤县| 北流市| 金湖县| 昌黎县| 乌拉特后旗| 盘山县| 宜兰县| 吴旗县| 犍为县| 扬州市| 庆城县| 夏津县| 福泉市| 北票市| 政和县| 德保县| 涪陵区| 娄底市|