国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林算法對(duì)ERA5太陽(yáng)輻射產(chǎn)品的訂正

2022-06-22 07:04:04王雪潔施國(guó)萍周子欽甄洋
自然資源遙感 2022年2期
關(guān)鍵詞:輻射量太陽(yáng)輻射決策樹(shù)

王雪潔, 施國(guó)萍, 周子欽, 甄洋

(1.南京信息工程大學(xué)長(zhǎng)望學(xué)院,南京 210044; 2.南京信息工程大學(xué)地理科學(xué)學(xué)院,南京 210044)

0 引言

太陽(yáng)能作為地球最主要的能量來(lái)源和基本動(dòng)力,推動(dòng)了地表的幾乎全部自然地理過(guò)程,使地理環(huán)境得以形成和有序發(fā)展[1]。也是氣候形成和演變過(guò)程中重要的外參數(shù)[2],是陸面過(guò)程的主要驅(qū)動(dòng)因子。太陽(yáng)輻射影響大氣圈、水圈、陸地圈層中的物質(zhì)與能量交換,對(duì)太陽(yáng)輻射研究可以促進(jìn)對(duì)碳循環(huán)、水循環(huán)等的研究,對(duì)全球氣候變化也有重要意義。

隨著科技的進(jìn)步,農(nóng)業(yè)、電力和城市建設(shè)等行業(yè)對(duì)太陽(yáng)輻射的研究提出了新的要求[3-5]。我國(guó)太陽(yáng)輻射觀測(cè)臺(tái)站較少,且測(cè)站空間分布不均勻。而再分析數(shù)據(jù),即經(jīng)過(guò)對(duì)太陽(yáng)輻射觀測(cè)資料(包括地面觀測(cè)、衛(wèi)星,還有雷達(dá)、探空等)的質(zhì)量控制,再同化入全球模式后得到的數(shù)據(jù),有著時(shí)間序列長(zhǎng)、空間分布廣的特點(diǎn),可以極大彌補(bǔ)地面觀測(cè)數(shù)據(jù)的不足。但是,再分析數(shù)據(jù)受資料源、模式等影響,無(wú)法完全達(dá)到真實(shí)模擬大氣的程度,具有一定程度的偏差,建立訂正模型對(duì)于使用再分析數(shù)據(jù)來(lái)說(shuō)顯得極為重要。目前已有相關(guān)研究利用地面站點(diǎn)地表輻射數(shù)據(jù)對(duì)再分析輻射數(shù)據(jù)進(jìn)行了多尺度的驗(yàn)證。研究表明太陽(yáng)輻射與云量、氣溶膠、水汽等有關(guān)[6-7]。再分析資料與我國(guó)太陽(yáng)輻射站點(diǎn)觀測(cè)資料相比,絕大部分高于臺(tái)站數(shù)據(jù)[8-10]。6種再分析地表輻射產(chǎn)品(NCEP-NCAR reanalysis, NCEP-DOE reanalysis, Climate Foreast System Reanalysis (CFSR) ,ECMWF Interim Reanalysis (ERA Interim),Modem-Era Retrospective Analysis for Research and Applications (MERRA) reanalysis,The Japanese 55-year reanalysis),全球月均偏差為11.25~49.80 W/m2,并且發(fā)現(xiàn)在中國(guó)范圍上,云量和氣溶膠的低估都可能導(dǎo)致再分析地表輻射的高估,夏秋季節(jié)明顯好于春冬季節(jié)[8-9]。

隨著機(jī)器學(xué)習(xí)的發(fā)展,越來(lái)越多的研究者開(kāi)始使用機(jī)器學(xué)習(xí)進(jìn)行不同地區(qū)的太陽(yáng)輻射的預(yù)報(bào)偏差的訂正。大量的研究表明,機(jī)器學(xué)習(xí)模型效果較理論參數(shù)模型、經(jīng)驗(yàn)?zāi)P透訙?zhǔn)確。陳昱文等[11]利用氣象站點(diǎn)的4個(gè)觀測(cè)要素,挖掘觀測(cè)數(shù)據(jù)的時(shí)序特征并結(jié)合氣溫預(yù)報(bào)結(jié)果訓(xùn)練機(jī)器學(xué)習(xí)模型,對(duì)結(jié)果進(jìn)行偏差訂正,發(fā)現(xiàn)集成學(xué)習(xí)方法在數(shù)值模式預(yù)報(bào)結(jié)果訂正中具有較大的應(yīng)用潛力; 李凈等[12]利用ERA5(ECMWF Reanalysis 5)等產(chǎn)品,將人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林3種機(jī)器學(xué)習(xí)模擬黃土高原地區(qū)的太陽(yáng)輻射并對(duì)3種方法進(jìn)行比較; Benali等[13]將智能持久性、人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林這3種方法進(jìn)行比較,預(yù)測(cè)了法國(guó)的太陽(yáng)輻射,二者結(jié)果都表明隨機(jī)森林的模擬精度最高; Yu等[14]利用4種機(jī)器學(xué)習(xí)方法,包括梯度提升回歸樹(shù)、隨機(jī)森林、多元自適應(yīng)回歸樣條和人工神經(jīng)網(wǎng)絡(luò)對(duì)地面96個(gè)站點(diǎn)日、月尺度的太陽(yáng)輻射進(jìn)行模擬評(píng)估,驗(yàn)證了訓(xùn)練數(shù)據(jù)集基于隨機(jī)森林方法的太陽(yáng)輻射估計(jì)值與地面測(cè)量值的相關(guān)性最好。隨機(jī)森林的訂正方法在海洋環(huán)境預(yù)報(bào)[15]、氣溫?cái)?shù)值預(yù)報(bào)[16]、空氣質(zhì)量[17]等方面都有應(yīng)用且精度很高。Babar等[18]利用ERA5和云、反照率、輻射數(shù)據(jù)集(CLARA-A2)建立隨機(jī)森林回歸模型對(duì)挪威地區(qū)日平均全球水平輻照度(GHI)進(jìn)行估計(jì),發(fā)現(xiàn)隨機(jī)森林模型的估計(jì)值較原來(lái)的預(yù)報(bào)值更精確,能夠更好地估計(jì)。但是目前很少有研究對(duì)中國(guó)范圍內(nèi)的ERA5的高精度太陽(yáng)輻射數(shù)據(jù)進(jìn)行空間訂正,沒(méi)有連續(xù)的空間分布訂正資料。

本文利用2013年全國(guó)93個(gè)輻射站的總輻射逐時(shí)觀測(cè)資料對(duì)ERA5同期再分析輻射資料進(jìn)行了評(píng)估,并選擇相關(guān)氣象要素及地理要素作為隨機(jī)森林學(xué)習(xí)的輸入量,對(duì)全國(guó)93個(gè)站點(diǎn)上ERA5輻射量的值進(jìn)行了訂正,進(jìn)而對(duì)ERA5輻射產(chǎn)品進(jìn)行空間分布上的訂正,得到訂正后的逐時(shí)輻射空間分布圖。利用ERA5輻射產(chǎn)品作為輸入變量進(jìn)行隨機(jī)森林回歸,對(duì)中國(guó)范圍內(nèi)的高空間分辨率格網(wǎng)數(shù)據(jù)進(jìn)行逐時(shí)數(shù)值訂正,解決了太陽(yáng)輻射站點(diǎn)不均的問(wèn)題,為高精度太陽(yáng)輻射量空間分布資料的獲取提供一種方法。

1 數(shù)據(jù)源與研究方法

1.1 數(shù)據(jù)源

①使用歐洲中心天氣預(yù)報(bào)中心(European Centre for Medium-Range Weather Forecasts,ECMWF)發(fā)布的第五代再分析數(shù)據(jù)集ERA5(ECMWF Reanalysis 5)中相關(guān)數(shù)據(jù)進(jìn)行分析與訂正,主要包括太陽(yáng)下行短波輻射(mean surface downward shot-wave radiation flux,MSDWSWRF)、地表反照率、水汽、總云量、臭氧、高云、低云、中云、冰云、水云產(chǎn)品,時(shí)間為2013年,時(shí)間分辨率為1 h,空間分辨率為0.25°×0.25°; ②中國(guó)93個(gè)輻射站點(diǎn)信息(經(jīng)度、緯度和海拔),以及2013年逐時(shí)的太陽(yáng)總輻射量。

1.2 研究方法

1.2.1 數(shù)據(jù)評(píng)估指標(biāo)

采用絕對(duì)誤差(absolute error,AE)、平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean squared error,RMSE)和相關(guān)系數(shù)(R)來(lái)分別描述偏離程度、不確定性、準(zhǔn)確性和相關(guān)性。表達(dá)式分別為:

AE=|x-y|

,

(1)

,

(2)

,

(3)

,

(4)

式中:x為估計(jì)值;y為觀測(cè)值;n為樣本數(shù);i為樣本序號(hào),i=1,2,…,n;Cov(·)為協(xié)方差函數(shù);D(·)為方差函數(shù)。

本文主要運(yùn)用MAE,RMSE和R進(jìn)行逐時(shí)資料的再分析資料與實(shí)測(cè)值、逐時(shí)訂正值與實(shí)測(cè)值之間的誤差對(duì)比分析。AE用于比較ERA5再分析資料的模擬值和隨機(jī)森林回歸值與中國(guó)地面站點(diǎn)輻射量的月均實(shí)測(cè)值之間的差異。

1.2.2 隨機(jī)森林回歸

1)隨機(jī)森林算法。該算法是基于多棵決策樹(shù)的一種集成學(xué)習(xí)算法,且森林中的每一棵決策樹(shù)之間沒(méi)有關(guān)聯(lián),模型的最終輸出由森林中的每一棵決策樹(shù)共同決定。隨機(jī)森林用于分類(lèi)時(shí),采用N個(gè)決策樹(shù)分類(lèi),將分類(lèi)結(jié)果采用簡(jiǎn)單投票法得到最終分類(lèi),提高分類(lèi)準(zhǔn)確率。選取與太陽(yáng)輻射有關(guān)的因子,即時(shí)間、經(jīng)緯度、地表反照率、海拔、天頂角余弦、總云量、臭氧、水汽、低云、中云、高云、冰云、水云作為輸入數(shù)據(jù),輸出量為每小時(shí)輻射值。算法步驟為: ①用有抽樣放回的方法(bootstrap)從樣本集中選取n個(gè)樣本作為一個(gè)訓(xùn)練集; ②用抽樣得到的樣本集生成一棵決策樹(shù),在每一個(gè)決策樹(shù)節(jié)點(diǎn)不重復(fù)地選擇m個(gè)特征,使用基尼指數(shù)找到最佳的劃分特征; ③重復(fù)第二步N次之后生成N棵決策樹(shù); ④用訓(xùn)練得到的隨機(jī)森林對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),并采用票選法決定預(yù)測(cè)的結(jié)果。

2)特征重要性分析。基尼指數(shù)用作對(duì)隨機(jī)森林訓(xùn)練樣本特征進(jìn)行重要性分析,比較每個(gè)特征在隨機(jī)森林中的每棵樹(shù)所做的貢獻(xiàn)?;嶂笖?shù)越小表示集合中被選中的樣本被分錯(cuò)的概率越小,也就是說(shuō)集合的純度越高,反之,集合越不純。設(shè)VIM為變量重要性評(píng)分,GI為基尼指數(shù),假設(shè)有m個(gè)特征X1,X2,…,Xm,則GI的計(jì)算公式為:

,

(5)

式中:K為類(lèi)別數(shù);pmk為節(jié)點(diǎn)m中類(lèi)別k所占的比例。在節(jié)點(diǎn)m上,特征Xi在節(jié)點(diǎn)m分支前后的基尼指數(shù)變化為:

VIMim=GIm-GIg-GIh

,

(6)

式中GIg和GIh為分支后新的基尼指數(shù)。特征Xi在第j棵決策樹(shù)的重要性為特征Xi在決策樹(shù)j中出現(xiàn)的節(jié)點(diǎn)m的基尼指數(shù)變化量的和,記為VIMij。若隨機(jī)森林模型中有N棵樹(shù),特征Xi的變量重要性評(píng)分VIMi為出現(xiàn)的所有決策樹(shù)j中的VIMij的總和。最后,把所有求得的重要性評(píng)分做一個(gè)歸一化處理即可。

3)K折交叉驗(yàn)證。該方法用于模型調(diào)優(yōu),可以減少過(guò)擬合的問(wèn)題。為了進(jìn)一步檢驗(yàn)?zāi)P头夯芰?,基于?dú)立樣本數(shù)據(jù),因訓(xùn)練集較大選擇5折交叉驗(yàn)證以降低訓(xùn)練成本。步驟為: 將數(shù)據(jù)分為5組,每次從訓(xùn)練集中,抽取出5份中的一份數(shù)據(jù)作為驗(yàn)證集,剩余4組作為測(cè)試集,重復(fù)5次。測(cè)試結(jié)果采用5組數(shù)據(jù)的測(cè)試誤差的平均值作為最后精度評(píng)價(jià)。原始數(shù)據(jù)集劃分成訓(xùn)練集和測(cè)試集以后,其中測(cè)試集除了用作調(diào)整參數(shù),也用來(lái)測(cè)量模型的好壞。K折交叉驗(yàn)證對(duì)網(wǎng)格搜索(GridSearchCV)是很重要的,用來(lái)選擇模型的最優(yōu)參數(shù),本文將全部數(shù)據(jù)集按照7∶3劃分為訓(xùn)練集和測(cè)試集進(jìn)行5折交叉驗(yàn)證。

1.3 隨機(jī)森林模型

1.3.1 模型參數(shù)取值

使用隨機(jī)森林模型進(jìn)行學(xué)習(xí)時(shí),參數(shù)對(duì)模型準(zhǔn)確度意義重大。網(wǎng)格搜索算法(GridSearchCV)是一種通過(guò)遍歷給定的參數(shù)組合來(lái)優(yōu)化模型表現(xiàn)的方法,再利用K折交叉驗(yàn)證,得到最優(yōu)模型。隨機(jī)森林算法參數(shù)眾多,最終優(yōu)化模型參數(shù)取值如表1所示。

表1 模型參數(shù)取值

隨機(jī)森林模型參數(shù)優(yōu)化的一般步驟是: 先保持其他參數(shù)為默認(rèn)值,對(duì)待定參數(shù)設(shè)置范圍,然后不斷縮小范圍,最終確定參數(shù)值。子樹(shù)數(shù)量對(duì)模型的準(zhǔn)確性影響最大,設(shè)置過(guò)低會(huì)導(dǎo)致模型不準(zhǔn)確,設(shè)置過(guò)高會(huì)增加模型復(fù)雜度,所以首先確定子樹(shù)數(shù)量。設(shè)置范圍從[50,70]縮小為[50,57],最終確定子樹(shù)數(shù)量為56。其他參數(shù)仍然利用網(wǎng)格搜索方法,得到最終模型。

1.3.2 5折交叉驗(yàn)證模型的精度

經(jīng)過(guò)5折交叉驗(yàn)證模型,結(jié)果如表2所示,決定系數(shù)平均值為0.855,說(shuō)明建立的隨機(jī)森林模型的精度較高,模型模擬較優(yōu),穩(wěn)定性良好。

表2 5折交叉驗(yàn)證模型結(jié)果

1.3.3 特征重要性分析

特征重要性可以看出每個(gè)輸入量對(duì)模型預(yù)報(bào)所做的貢獻(xiàn),將時(shí)間、經(jīng)緯度、地表反照率、海拔、天頂角、水汽、總云量、臭氧、高云、低云、中云、冰云、水云作為最終輸入量,輸出量為每小時(shí)輻射量。利用基尼指數(shù)作為評(píng)價(jià)指標(biāo)來(lái)衡量特征重要性。由圖1可以看出,天頂角數(shù)據(jù)重要性最大,為0.325,高云重要性最小,為0.004。說(shuō)明天頂角對(duì)地表太陽(yáng)輻射量影響較大,高云對(duì)地表太陽(yáng)輻射量影響很小。

圖1 特征重要性比較

2 結(jié)果與分析

2.1 訂正前后的精度分析

圖2為1月、4月、7月、10月ECMWF再分析數(shù)據(jù)與地面站觀測(cè)數(shù)據(jù)小時(shí)地表輻射的訂正前((a)—(d))后((e)—(h))逐時(shí)輻射量散點(diǎn)分布對(duì)比圖。訂正前,MAE分別為112.22 W/m2,141.91 W/m2,140.08 W/m2和125.50 W/m2,RMSE分別為155.84 W/m2,201.50 W/m2,196.69 W/m2和175.27 W/m2,R分別為0.74,0.80,0.79,0.77。結(jié)果表明不同月份的小時(shí)輻射數(shù)據(jù)誤差不同且較大,1月和10月的離散程度小,相關(guān)程度也較小,4月和7月的離散程度大,相關(guān)程度也較大。訂正后,各月份的訂正值與站點(diǎn)值的離散程度減小,相關(guān)性明顯提高,MAE分別為47.99 W/m2,78.77 W/m2,96.44 W/m2和58.38 W/m2,RMSE分別為87.90 W/m2,133.53 W/m2,160.59 W/m2和102.29 W/m2,R分別為0.91,0.91,0.88和0.92; 1月、4月、7月、10月的各誤差指標(biāo)變化幅度不同,MAE分別降低了57.24%,44.49%,31.15%和53.48%,RMSE分別降低了43.60%,33.73%,18.35%和41.64%,R分別提高了0.17,0.11,0.09和0.15,可見(jiàn)4個(gè)月中1月的ERA5地表太陽(yáng)輻射值訂正效果最好。

(a) 1月訂正前 (b) 4月訂正前 (c) 7月訂正前 (d) 10月訂正前

(e) 1月訂正后 (f) 4月訂正后 (g) 7月訂正后 (h) 10月訂正后

2.2 月均輻射值變化

2013年ERA5再分析資料與中國(guó)氣象站點(diǎn)資料訂正前后的月均輻射變化如圖3所示??梢钥闯觯喺癊RA5太陽(yáng)輻射量的值較站點(diǎn)值偏高,總體規(guī)律都是夏秋輻射量高、春冬輻射量低。訂正后的值接近站點(diǎn)實(shí)測(cè)值,誤差較小。

圖3 訂正前后月輻射均值

誤差指標(biāo)比較如表3所示,訂正前的MAE,RMSE和R分別是27.60 W/m2,29.87 W/m2和0.97,訂正后三者值分別為3.34 W/m2,3.85 W/m2和1.00。MAE下降了87.90%,RMSE下降了87.11%,R提高了0.03。

表3 3種誤差指標(biāo)比較

2.3 訂正前后分月的誤差分布規(guī)律

圖4(a)為ERA5再分析資料與中國(guó)地面站點(diǎn)輻射量的月均值絕對(duì)誤差比較,圖4(b)—(d)為對(duì)每個(gè)月的小時(shí)數(shù)據(jù)求MAE,RMSE和R的分月誤差比較。得出的結(jié)果是,在訂正前,ERA5數(shù)據(jù)與地面站點(diǎn)的AE在10.28~49.53 W/m2之間,且夏秋季絕對(duì)誤差小,春冬季絕對(duì)誤差大;MAE在107.80~142.75 W/m2之間,RMSE在148.85~202.15 W/m2之間,R在0.74~0.80之間; 訂正后,AE在-5.91~7.08 W/m2之間,MAE在40.00~98.31 W/m2之間,RMSE在70.98~164.07 W/m2之間,R在0.87~0.94之間。此結(jié)果說(shuō)明: 隨機(jī)森林模型對(duì)ERA5地表太陽(yáng)輻射量的訂正效果較好;MAE和RMSE隨著時(shí)間的變化也有所規(guī)律,明顯看出夏秋季2種誤差指標(biāo)較大,春冬季較小。

(a) AE (b) MAE (c) RMSE (d) R

2.4 簡(jiǎn)單交叉驗(yàn)證

為了進(jìn)一步驗(yàn)證隨機(jī)森林模型的穩(wěn)定性,在中國(guó)范圍內(nèi)采用均勻分布的方法選取6個(gè)站點(diǎn)(表4),分別為阿克蘇、剛察、長(zhǎng)春、綿陽(yáng)、建甌和北海,將其2013年所有樣本數(shù)據(jù)作為模型的驗(yàn)證數(shù)據(jù)集,不參與訓(xùn)練,其余站點(diǎn)的樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,進(jìn)行訓(xùn)練,訂正結(jié)果的比較如表5所示。從表5中看出,對(duì)于本身離散程度大、相關(guān)性弱的站點(diǎn)數(shù)據(jù),經(jīng)過(guò)隨機(jī)森林的訂正后精度有明顯的提高,而本身離散程度小、相關(guān)性較高的站點(diǎn)數(shù)據(jù),經(jīng)過(guò)隨機(jī)森林訂正后能夠保持精度或者有小幅度的提高。說(shuō)明隨機(jī)森林的模擬精度高,有較好的穩(wěn)定性。

表4 6個(gè)站點(diǎn)的信息

表5 6個(gè)站點(diǎn)前后訂正的誤差指標(biāo)分析

2.5 訂正前后的空間分布變化

圖5為利用上述建立的隨機(jī)森林模型對(duì)1月、4月、7月、10月的北京時(shí)間15日13時(shí)ERA5總輻射進(jìn)行訂正前后的空間分布圖。圖5(a)—(d)和(e)—(h)分別為訂正前后的空間分布結(jié)果。由圖5可見(jiàn),太陽(yáng)輻射量訂正前后的宏觀分布規(guī)律一致,訂正后ERA5太陽(yáng)輻射量在局部地區(qū)有明顯的下降,對(duì)ERA5太陽(yáng)輻射量偏高的情況有所改進(jìn),通過(guò)隨機(jī)森林訂正后的分布圖局部特征更加明顯,精度得到提高。

(a) 1月訂正前(b) 4月訂正前(c) 7月訂正前(d) 10月訂正前

圖5-1 訂正前后太陽(yáng)輻射的空間分布

(e) 1月訂正后(f) 4月訂正后(g) 7月訂正后(h) 10月訂正后

圖5-2 訂正前后太陽(yáng)輻射的空間分布

3 結(jié)論與討論

1)本文首先對(duì)2013年的再分析資料ERA5和地面觀測(cè)的太陽(yáng)總輻射數(shù)據(jù)進(jìn)行了對(duì)比。從總體上看,兩者有較大的差異,ERA5的地表太陽(yáng)輻射量要高于地面觀測(cè)數(shù)據(jù),這與前人研究一致; ERA5輻射量與站點(diǎn)值的AE夏秋季小,春冬季大; 1月和10月的離散程度小,相關(guān)程度也較小,4月和7月的離散程度大,相關(guān)程度也較大。訂正前,2013年MAE,RMSE和R的值分別是27.60 W/m2,29.87 W/m2和0.97,對(duì)小時(shí)數(shù)據(jù)分月比較,ERA5數(shù)據(jù)與地面站點(diǎn)的AE在10.28~49.53 W/m2之間,且夏秋季AE小,春冬季AE大;MAE在107.80~142.75 W/m2之間,RMSE在148.85~202.15 W/m2之間,R在0.74~0.80之間。

2)利用5折交叉驗(yàn)證和網(wǎng)格搜索選擇模型參數(shù),得到模型最優(yōu)參數(shù)和交叉驗(yàn)證的模型得分并評(píng)價(jià)模型的穩(wěn)定性,從得分可以驗(yàn)證模型的模擬較優(yōu),穩(wěn)定性較好。將時(shí)間、經(jīng)緯度、地表反照率、海拔、天頂角、水汽、云量、高云等作為輸入?yún)?shù)進(jìn)行隨機(jī)森林訓(xùn)練。從2013年總體上看,MAE下降了24.26 W/m2,RMSE下降了26.02 W/m2,R提高了0.03,說(shuō)明隨機(jī)森林回歸模型取得了相對(duì)有效的訂正結(jié)果。對(duì)小時(shí)數(shù)據(jù)處理并分月比較,訂正后的AE在-5.91~7.08 W/m2之間,MAE在40.00~98.31 W/m2之間,RMSE在70.98~164.07 W/m2之間,R在0.87~0.94之間,訂正后的離散程度減小,相關(guān)性明顯提高。MAE和RMSE隨著時(shí)間的變化有所規(guī)律,明顯看出夏秋季2種誤差指標(biāo)較大,春冬季較小。1月、4月、7月、10月的各誤差指標(biāo)增長(zhǎng)幅度不同,4個(gè)月中1月的ERA5地表太陽(yáng)輻射量訂正效果最好。

3)利用簡(jiǎn)單交叉驗(yàn)證,進(jìn)一步驗(yàn)證隨機(jī)森林模型的穩(wěn)定性。阿克蘇、剛察、長(zhǎng)春、綿陽(yáng)、建甌、北海站點(diǎn)的太陽(yáng)輻射量訂正后的MAE,RMSE和R均有提高。結(jié)果表明對(duì)于本身離散程度大、相關(guān)性弱的站點(diǎn)數(shù)據(jù),經(jīng)過(guò)隨機(jī)森林的訂正后精度有明顯的提高,而本身離散程度小、相關(guān)性較高的站點(diǎn)數(shù)據(jù),經(jīng)過(guò)隨機(jī)森林訂正后能夠保持精度或者有小幅度的提高。說(shuō)明隨機(jī)森林的模擬精度高,有較好的穩(wěn)定性。

4)通過(guò)隨機(jī)森林的回歸,對(duì)ERA5進(jìn)行了空間分布上的訂正,訂正前后的宏觀規(guī)律一致,訂正后ERA5太陽(yáng)輻射量在局部地區(qū)有明顯的下降,精度得到提高。隨機(jī)森林模型對(duì)ERA5地表太陽(yáng)輻射量能夠進(jìn)行有效地訂正,在實(shí)現(xiàn)大樣本數(shù)據(jù)訓(xùn)練時(shí)能夠保證速度,訓(xùn)練的模型精度較高,實(shí)現(xiàn)較為方便快捷,能夠更好地進(jìn)行太陽(yáng)輻射產(chǎn)品的數(shù)據(jù)融合,得到的全國(guó)范圍的連續(xù)的太陽(yáng)輻射數(shù)據(jù)能夠?yàn)檗r(nóng)業(yè)、電力和城市建設(shè)等行業(yè)研究提供基礎(chǔ)數(shù)據(jù)。

猜你喜歡
輻射量太陽(yáng)輻射決策樹(shù)
雙面光伏組件安裝特點(diǎn)的模擬研究
邯鄲太陽(yáng)輻射時(shí)空分布特征
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
基于PCA 的太陽(yáng)輻射觀測(cè)算法研究
太陽(yáng)輻射作用下鋼筒倉(cāng)結(jié)構(gòu)溫度場(chǎng)分析研究
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
洛陽(yáng)地區(qū)太陽(yáng)輻射變化特征及影響因子分析
河南科技(2015年11期)2015-03-11 16:25:00
基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
稷山县| 腾冲县| 金秀| 西城区| 镇康县| 宁阳县| 武强县| 芜湖市| 冕宁县| 寻甸| 通榆县| 喜德县| 黔东| 六安市| 章丘市| 厦门市| 集贤县| 新巴尔虎右旗| 峨眉山市| 海晏县| 筠连县| 新余市| 柳林县| 旬阳县| 乐平市| 宽甸| 峨山| 樟树市| 城固县| 沾化县| 公主岭市| 英吉沙县| 鄂州市| 塘沽区| 山东省| 平利县| 深水埗区| 陈巴尔虎旗| 莱芜市| 泗水县| 射阳县|