李石波,朱秀芳,侯陳瑤,郭 銳,劉 瑩
(1.地表過(guò)程與資源生態(tài)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京師范大學(xué),北京 100875;2.土地科學(xué)技術(shù)學(xué)院,中國(guó)地質(zhì)大學(xué)(北京),北京 100083;3.地理科學(xué)學(xué)部遙感科學(xué)與工程研究院,北京師范大學(xué),北京 100875)
作物生長(zhǎng)發(fā)育和產(chǎn)量形成是一個(gè)復(fù)雜的生理過(guò)程,作物產(chǎn)量預(yù)測(cè)需要考慮氣象、土壤、田間管理等多種因素[1-2],因此作物估產(chǎn)一直是農(nóng)業(yè)研究熱點(diǎn)和難點(diǎn)。近年來(lái),由于全球氣溫升高,越發(fā)頻繁的極端氣候嚴(yán)重影響作物生長(zhǎng),國(guó)家糧食安全面臨極大挑戰(zhàn),因而氣候異常情況下及時(shí)獲取作物產(chǎn)量信息能夠?yàn)橄嚓P(guān)部門(mén)應(yīng)對(duì)極端氣候、保障糧食安全提供決策依據(jù)。
幾十年來(lái),眾多不同領(lǐng)域的學(xué)者做了大量相關(guān)研究,使傳統(tǒng)作物估產(chǎn)技術(shù)得到快速發(fā)展。目前作物估產(chǎn)模型有上百種,模型的理論基礎(chǔ)和特點(diǎn)各不相同。從模型建立的理論角度看,當(dāng)前主流的作物估產(chǎn)模型可以分為經(jīng)驗(yàn)統(tǒng)計(jì)模型、光能利用率模型、作物生長(zhǎng)模擬模型和耦合模型[3]。經(jīng)驗(yàn)統(tǒng)計(jì)模型是建立作物產(chǎn)量與統(tǒng)計(jì)數(shù)據(jù)之間的統(tǒng)計(jì)關(guān)系來(lái)進(jìn)行作物估產(chǎn)的一類(lèi)模型,因原理簡(jiǎn)單、數(shù)據(jù)容易獲取、貫穿整個(gè)估產(chǎn)領(lǐng)域的發(fā)展過(guò)程,在業(yè)務(wù)化推廣應(yīng)用中發(fā)展的最早也最廣泛。
基于氣象數(shù)據(jù)的估產(chǎn)模型是經(jīng)驗(yàn)統(tǒng)計(jì)模型的一種。它通過(guò)建立氣象數(shù)據(jù)與作物產(chǎn)量之間的關(guān)系,并在考慮其他因素的基礎(chǔ)上建立統(tǒng)計(jì)模型,最終實(shí)現(xiàn)作物單產(chǎn)估算。氣象估產(chǎn)技術(shù)比較成熟,適合業(yè)務(wù)化運(yùn)行,且具有一定的生理學(xué)基礎(chǔ)[4]?;跉庀髷?shù)據(jù)的作物估產(chǎn)模型已經(jīng)在國(guó)內(nèi)外得到了廣泛應(yīng)用[5-7]。基本的氣象預(yù)測(cè)模型的預(yù)測(cè)模式有三種:第一種,直接建立氣象因子和作物產(chǎn)量之間的回歸模型[8];第二種,將作物產(chǎn)量分解為由趨勢(shì)產(chǎn)量和氣象產(chǎn)量?jī)刹糠?,前者反映由技術(shù)進(jìn)步(如灌溉、施肥、新品種等)導(dǎo)致的產(chǎn)量長(zhǎng)期變化,后者反映由自然氣候要素(光照、降水、輻射等)引起的產(chǎn)量短期波動(dòng)[9-10];第三種,首先計(jì)算相鄰兩年作物產(chǎn)量差和氣象因子差,然后建立作物產(chǎn)量差和氣象因子差之間的回歸模型,進(jìn)而進(jìn)行作物產(chǎn)量預(yù)測(cè)[11]。第一種方法僅僅依靠氣象數(shù)據(jù)進(jìn)行產(chǎn)量的預(yù)測(cè),不能反映趨勢(shì)產(chǎn)量,因此相比而言后兩種方法更科學(xué)。
全球氣候變化異常,導(dǎo)致自然極端氣候越發(fā)頻繁,給我國(guó)農(nóng)業(yè)生產(chǎn)帶來(lái)了很多新的挑戰(zhàn)[12-15]。其中,干旱是各種氣象災(zāi)害中影響最嚴(yán)重、最頻繁、持續(xù)時(shí)間最長(zhǎng)的氣象災(zāi)害,也是影響作物產(chǎn)量和糧食安全最重要的限制因素[16]。有關(guān)統(tǒng)計(jì)數(shù)據(jù)[17]表明,2007-2016年全國(guó)農(nóng)作物旱災(zāi)面積均值為1.53×107hm2,糧食損失均值為214.14億kg,直接經(jīng)濟(jì)損失平均占當(dāng)年GDP的0.21%。目前在已有的估產(chǎn)模式中,針對(duì)極端氣候條件下作物估產(chǎn)模型的建立研究較少,建模的輸入數(shù)據(jù)多為原始?xì)庀笠蜃?比如溫度、降水),不能直接反映極端氣候?qū)Ξa(chǎn)量波動(dòng)的影響。鑒于此,本研究引入干旱指數(shù),以干旱指數(shù)和趨勢(shì)產(chǎn)量為輸入,以近年來(lái)受干旱影響嚴(yán)重的河南省冬小麥為例,采用氣象估產(chǎn)的方式,兼顧社會(huì)技術(shù)與氣象因素對(duì)小麥生產(chǎn)的影響,利用非參數(shù)統(tǒng)計(jì)方法進(jìn)行估產(chǎn)模型構(gòu)建,選擇典型干旱和非干旱年份進(jìn)行模型精度的驗(yàn)證,以期為提高極端氣候條件下的估產(chǎn)精度提供方法參考。
河南省位于北緯31°23′~36°22′,東經(jīng)110°21′~116°39′之間,東接安徽、山東,北界河北、山西,西連陜西,南臨湖北。全省下轄17個(gè)地級(jí)市和1個(gè)省直轄縣級(jí)市,總面積達(dá)16.7萬(wàn)km2,地勢(shì)西高東低,由平原和盆地、山地、丘陵、水面構(gòu)成;地跨海河、黃河、淮河、長(zhǎng)江四大水系,大部分地處暖溫帶,南部跨亞熱帶,屬北亞熱帶向暖溫帶過(guò)渡的大陸性季風(fēng)氣候區(qū)。河南省是糧食種植大省,隸屬于黃淮海區(qū),是我國(guó)冬小麥主要生產(chǎn)地之一,土地肥沃,具有較好的農(nóng)業(yè)生產(chǎn)條件。自20世紀(jì)90年代以來(lái)河南極端氣溫處于明顯加速變化階段[18],1994-2014年,河南省極端氣溫指數(shù)的變化速率明顯高于中國(guó)其他地區(qū)2倍之多,農(nóng)作物種植面臨極大挑戰(zhàn)。
圖1 研究區(qū)
本研究所用數(shù)據(jù)包括來(lái)自1991-2016年河南省統(tǒng)計(jì)年鑒的1990-2015年各縣區(qū)的冬小麥播種面積和總產(chǎn)量(http://data.cnki.net)、來(lái)自中國(guó)科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心的2000年1 km分辨率的中國(guó)土地利用類(lèi)型空間分布圖(http://www.resdc.cn)及來(lái)自全球標(biāo)準(zhǔn)化降水蒸散指數(shù)(standardized precipitation evapotranspiration index, SPEI)數(shù)據(jù)庫(kù)(http://sac.csic.es/spei/database.html)的SPEIbase v2.5數(shù)據(jù)集。其中,河南各縣小麥產(chǎn)量和播種面積數(shù)據(jù)主要用于各縣小麥單產(chǎn)的計(jì)算;土地利用類(lèi)型空間分布圖主要用于對(duì)河南省耕地空間分布的提?。籗PEIbase v2.5數(shù)據(jù)集提供了全球1901-2015年1~48個(gè)月時(shí)間尺度的0.5度分辨率的SPEI月值數(shù)據(jù),該數(shù)據(jù)不僅綜合考慮了溫度與降水對(duì)干旱程度的影響,而且具有多種時(shí)間尺度。由于干旱對(duì)于河南省冬小麥產(chǎn)量影響較大,為了研究小麥生長(zhǎng)期各個(gè)時(shí)間尺度的SPEI對(duì)產(chǎn)量的影響,以及提高干旱條件下估產(chǎn)精度,本研究基于該數(shù)據(jù)集提取了1990-2015年間河南省估產(chǎn)小麥生育期內(nèi)不同時(shí)間尺度(1~3個(gè)月尺度)的SPEI數(shù)據(jù)集,分別記作SPEI-1、SPEI-2和SPEI-3,作為輸入變量用于隨機(jī)森林估產(chǎn)模型構(gòu)建。
本研究技術(shù)路線如圖2所示,主要包括如下步驟:1)利用河南縣級(jí)矢量數(shù)據(jù)和河南土地利用分類(lèi)數(shù)據(jù)對(duì)河南省各縣耕地范圍內(nèi)平均SPEI值進(jìn)行計(jì)算,得到各縣不同時(shí)間尺度的SPEI均值;2)結(jié)合龔珀茲曲線和自回歸移動(dòng)平均模型(Autoregressive-moving-average model,ARMA)擬合縣級(jí)趨勢(shì)單產(chǎn);3)用隨機(jī)森林算法建立趨勢(shì)單產(chǎn)、干旱指數(shù)與實(shí)際單產(chǎn)的回歸模型并進(jìn)行模型擬合精度驗(yàn)證;4)選擇干旱和非干旱年份對(duì)小麥單產(chǎn)進(jìn)行估算并進(jìn)行精度評(píng)價(jià);5)基于隨機(jī)森林算法進(jìn)行輸入變量重要性評(píng)價(jià)并進(jìn)行結(jié)果分析。
圖2 技術(shù)路線
1.3.1 SPEI均值計(jì)算
SPEI是目前最常用的氣象干旱指數(shù)之一,具有多時(shí)間尺度的特征。由于SPEI原始數(shù)據(jù)集與中國(guó)耕地空間分布圖分辨率不一致,因此首先對(duì)SPEI數(shù)據(jù)進(jìn)行重采樣至1 km×1 km。利用2000年河南省耕地空間分布圖提取出河南省耕地范圍上的SPEI干旱數(shù)據(jù),基于河南省縣級(jí)矢量對(duì)全省各縣耕地范圍進(jìn)行提取,并針對(duì)每一個(gè)縣區(qū),找到其耕地范圍內(nèi)的所有SPEI柵格,求其干旱指數(shù)的均值,得到縣級(jí)SPEI均值。
1.3.2 趨勢(shì)單產(chǎn)擬合
冬小麥單產(chǎn)受多種因素的影響,其中主要包括社會(huì)因素、自然因素和一些其他隨機(jī)因素[19]。一般將由社會(huì)因素導(dǎo)致小麥產(chǎn)量發(fā)生變化的部分稱(chēng)為趨勢(shì)單產(chǎn),主要表現(xiàn)為科技發(fā)展和社會(huì)投入引起的小麥單產(chǎn)變化;將由氣象因素引起的小麥單產(chǎn)波動(dòng)性變化稱(chēng)為氣象單產(chǎn),主要表現(xiàn)為年際間氣象條件的差異造成的小麥單產(chǎn)變化;將由一些其他隨機(jī)因素造成的小麥單產(chǎn)波動(dòng)稱(chēng)為隨機(jī)單產(chǎn)。因此對(duì)單產(chǎn)進(jìn)行模擬時(shí),把作物單產(chǎn)分解為趨勢(shì)單產(chǎn)、氣象單產(chǎn)和隨機(jī)單產(chǎn)三部分,由于隨機(jī)單產(chǎn)的不確定性,通常將其忽略不計(jì)。因此,實(shí)際單產(chǎn)可以分解為趨勢(shì)單產(chǎn)和氣象單產(chǎn)之和(如公式1)。
yi=Yi+Yc
(1)
式中,yi為冬小麥實(shí)際單產(chǎn),Yi為趨勢(shì)單產(chǎn),Yc為氣象單產(chǎn)。
理論上小麥單產(chǎn)的變化趨勢(shì)應(yīng)該符合有限增長(zhǎng)上限曲線的趨勢(shì)模型,其中關(guān)于拐點(diǎn)不對(duì)稱(chēng)的S形曲線,即龔珀茲曲線(公式2)應(yīng)用較為廣泛。單獨(dú)應(yīng)用龔珀茲曲線對(duì)趨勢(shì)單產(chǎn)進(jìn)行擬合,可能會(huì)導(dǎo)致趨勢(shì)單產(chǎn)和實(shí)際單產(chǎn)殘差自相關(guān),進(jìn)而使得擬合結(jié)果失真。采用自回歸移動(dòng)平均模型(autoregressive-moving-average model,ARMA)進(jìn)一步對(duì)殘差序列進(jìn)行擬合,將ARMA對(duì)殘差的擬合結(jié)果與龔珀茲曲線得到的趨勢(shì)單產(chǎn)相加得到最終的趨勢(shì)單產(chǎn),能夠有效解決上述問(wèn)題,提高擬合精度[20]。因此,本文采用龔珀茲曲線和自回歸移動(dòng)平均模型(Autoregressive-moving-average model,ARMA)相結(jié)合的方式,對(duì)河南省縣級(jí)趨勢(shì)單產(chǎn)進(jìn)行擬合。由龔珀茲曲線和ARMA模型構(gòu)成混合時(shí)間序列模型,見(jiàn)公式3和公式4。
Yi=Le-aebt(a>0,b>0)
(2)
u1=Y1+uc
(3)
φ(B)ut=θ(B)εi
(4)
式中,Yt為龔珀茲曲線擬合的趨勢(shì)單產(chǎn),e為自然對(duì)數(shù),t表示年序,初始值為1,代表1990年,a和b為待估計(jì)參數(shù),ut為混合時(shí)間序列擬合的趨勢(shì)單產(chǎn),uc是龔珀茲擬合殘差的趨勢(shì)改 正值。
φ(B)=1-φ1B-φ2B2-…-φpBp
θ(B)=1-θ1B-θ2B2-…-θqBq
B為滯后算子,εt為白噪聲序列。
1.3.3 各市隨機(jī)森林回歸模型建立與精度驗(yàn)證
隨機(jī)森林方法是一種較新的機(jī)器學(xué)習(xí)算法,具有穩(wěn)定性好,預(yù)測(cè)精度高等優(yōu)點(diǎn),不需要檢查變量的交互作用是否顯著,不用做變量選擇,在異常值和噪聲方面具有較高的容忍度,而且不容易出現(xiàn)過(guò)擬合現(xiàn)象。它的主要思想是通過(guò)自助法抽樣從原始訓(xùn)練集中抽取k個(gè)樣本,且每個(gè)樣本的樣本容量均與原始訓(xùn)練集的大小一致;然后對(duì)每個(gè)樣本分別進(jìn)行決策樹(shù)建模,得到k個(gè)建模結(jié)果,最后,以每一個(gè)棵決策樹(shù)預(yù)測(cè)結(jié)果的平均值作為最終預(yù)測(cè)結(jié)果。
干旱是影響河南省冬小麥產(chǎn)量的最主要?dú)庀鬄?zāi)害,具有緩發(fā)性、持續(xù)性和復(fù)雜性的特點(diǎn)。不同干旱發(fā)生的時(shí)間和強(qiáng)度對(duì)作物產(chǎn)量的影響不同。河南省冬小麥通常于10月上旬播種,次年6月收獲,冬小麥在剛播種時(shí)期和收獲時(shí)期需水量一般相對(duì)較小??紤]到實(shí)際應(yīng)用與河南省小麥生長(zhǎng)期狀況,本研究以10月至次年5月為研究時(shí)間,以該時(shí)間段中各月份1~3個(gè)月時(shí)間尺度的縣級(jí)SPEI均值和趨勢(shì)單產(chǎn)共25個(gè)變量作為輸入變量,縣級(jí)實(shí)際單產(chǎn)作為輸出變量,在去除擬用于模型驗(yàn)證的年份(2011和2015年)的樣本后,構(gòu)建市級(jí)隨機(jī)森林回歸模型,用決定系數(shù)R2、驗(yàn)證樣本的平均絕對(duì)值誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)相對(duì)誤差(MRE)對(duì)模型進(jìn)行精度評(píng)價(jià)。
(5)
(6)
(7)
(8)
式中,RSS為殘差平方和,TSS為執(zhí)行回歸分析前,輸出變量固有的方差。vi和Vi分別表示驗(yàn)證樣本中第i個(gè)樣本的真值和估計(jì)值,n表示樣本點(diǎn)的個(gè)數(shù)。
由于受樣本數(shù)量和隨機(jī)森林回歸模型特性的限制,當(dāng)建模樣本數(shù)量較小時(shí)隨機(jī)森林回歸模型擬合精度較低,可信度不高,故將樣本量過(guò)小的市(包括濟(jì)源市、鶴壁市和漯河市,它們的樣本個(gè)數(shù)分別為25個(gè)、50個(gè)和50個(gè))按照地理位置最近的原則,合并到周邊的其他市中進(jìn)行模型建立。
1.3.4 典型年份單產(chǎn)預(yù)測(cè)及驗(yàn)證
近年來(lái),河南省冬小麥產(chǎn)量遭受旱災(zāi)影響嚴(yán)重,其中2014年旱災(zāi)持續(xù)時(shí)間長(zhǎng),2000年前后和2011年各發(fā)生干旱的整體強(qiáng)度大[20]。結(jié)合文獻(xiàn)[20]同時(shí)參考中國(guó)民政統(tǒng)計(jì)年鑒和河南省統(tǒng)計(jì)年鑒,發(fā)現(xiàn)河南省旱災(zāi)發(fā)生頻繁,每年或多或少都會(huì)受到旱災(zāi)的影響。其中2015年河南全省干旱情況最輕,全省作物受災(zāi)面積為33.43 hm2,成災(zāi)面積和絕收面積分別只有3.84×103和0.53×103hm2。而2011年受災(zāi)情況居中。在2011年旱情中,2010年11月中旬河南省出現(xiàn)旱情,至次年2月份上旬達(dá)到高峰,累計(jì)降水量比多年同期平均偏少8成以上,4月初全省旱情才得以解除,全省作物受旱災(zāi)損失嚴(yán)重,受災(zāi)面積、成災(zāi)面積、絕收面積分別達(dá)到了1 020.4×103、211.3×103和12.9×103hm2。因此,為了進(jìn)一步驗(yàn)證市級(jí)模型在小麥不同生長(zhǎng)環(huán)境下的估產(chǎn)精度,本研究挑選了2011年作為典型干旱年份和2015年作為典型非干旱年份,對(duì)這兩個(gè)特定年份進(jìn)行河南各市小麥單產(chǎn)估計(jì),并分別用簡(jiǎn)單平均估計(jì)值與面積加權(quán)后估計(jì)值進(jìn)行精度對(duì)比。簡(jiǎn)單平均估計(jì)值是將市內(nèi)各縣的趨勢(shì)單產(chǎn)和平均SPEI帶入隨機(jī)森林回歸模型,得到各縣的單產(chǎn)估計(jì)結(jié)果,然后對(duì)各縣的單產(chǎn)估計(jì)值求平均值作為最終的市級(jí)小麥單產(chǎn)估計(jì)值;面積加權(quán)后估計(jì)值是將市內(nèi)各縣的趨勢(shì)單產(chǎn)和平均SPEI帶入隨機(jī)森林回歸模型,得到各縣的單產(chǎn)估計(jì)結(jié)果,然后用各縣小麥播種面積進(jìn)行面積加權(quán)平均,以此作為最終的市級(jí)小麥單產(chǎn)估計(jì)值。
1.3.5 小麥單產(chǎn)影響因子重要性評(píng)價(jià)
隨機(jī)森林模型可以進(jìn)行特征變量重要性排序和篩選,其原理是用袋外數(shù)據(jù)樣本得到誤差e1,然后給予袋外數(shù)據(jù)樣本某一特征隨機(jī)誤差,重新得到袋外數(shù)據(jù)誤差e2。至此,可以用e1-e2來(lái)刻畫(huà)該特征的重要性。其依據(jù)就是,如果一個(gè)特征很重要,那么其變動(dòng)后會(huì)非常影響測(cè)試誤差,如果測(cè)試誤差沒(méi)有怎么改變,則說(shuō)明該特征不重要。在隨機(jī)森林回歸模型中,輸入變量的重要性大小意味著該輸入變量對(duì)輸出變量的解釋程度。輸入變量重要性越大,說(shuō)明該變量對(duì)輸出變量的解釋能力越強(qiáng)。本文利用隨機(jī)森林算法對(duì)趨勢(shì)產(chǎn)量和不同時(shí)間尺度SPEI月均值,共25個(gè)輸入變量進(jìn)行重要性排序,統(tǒng)計(jì)分析影響各市小麥產(chǎn)量的重要因素。
全省共18個(gè)市,其中鶴壁市、濟(jì)源市、漯河市因樣本量較小,分別合并到安陽(yáng)市、焦作市、許昌市中,合并后共得到15個(gè)市級(jí)估產(chǎn)模型。表1 為合并后河南各市隨機(jī)森林回歸模型擬合精度指標(biāo)。從表1可以看出,全省各市隨機(jī)森林回歸模型擬合精度整體較高,決定系數(shù)R2的平均值為0.87,其中三門(mén)峽市模型決定系數(shù)最小(0.655),商丘市模型決定系數(shù)最大(0.966)。各市均方根誤差均值為23.45 kg·hm-2,其中周口市均方根誤差最大(29.395 kg·hm-2),濮陽(yáng)市均方根誤差最小(17.679 kg·hm-2)。各市平均絕對(duì)值誤差的均值為17.69 kg·hm-2,其中洛陽(yáng)市平均絕對(duì)誤差最大(23.196 kg·hm-2),濮陽(yáng)市平均絕對(duì)誤差最小(11.931 kg·hm-2)。各市平均絕對(duì)相對(duì)誤差的平均值為0.07,其中三門(mén)峽市平均相對(duì)誤差最大(0.138 7),焦作市平均相對(duì)誤差最小(0.034 1)。整體上看,各市模型精度指標(biāo)較好,模型擬合精度較高。這里要說(shuō)明一點(diǎn):各市平均相對(duì)誤差的均值、平均絕對(duì)值誤差均值和平均絕對(duì)相對(duì)誤差的均值指的是該市內(nèi)整個(gè)研究時(shí)間段內(nèi)所有縣產(chǎn)量估計(jì)值的相對(duì)誤差、絕對(duì)值誤差和絕對(duì)相對(duì)誤差的平均值。
從表2和圖3可以看出,無(wú)論干旱年份(2011)或非干旱年份(2015年),除三門(mén)峽市以外,其他市級(jí)模型估產(chǎn)精度均達(dá)到80%以上,最高估產(chǎn)精度可達(dá)到95%以上。三門(mén)峽市估產(chǎn)精度最低,2011年其小麥簡(jiǎn)單平均估產(chǎn)精度和面積加權(quán)后估產(chǎn)精度分別為88.05%、88.39%,2015年分別為78.96%、79.46%。從圖3可以看出,不管是簡(jiǎn)單平均估產(chǎn)還是面積加權(quán)后估產(chǎn),2011年小麥估產(chǎn)精度平均值均在95.00%以上,2015年小麥估產(chǎn)精度平均值均在92.00%以上;兩個(gè)典型年份小麥面積加權(quán)估產(chǎn)精度整體高于簡(jiǎn)單平均估產(chǎn)精度;2011年小麥估產(chǎn)精度整體高于2015年。
a:2011年小麥單產(chǎn)預(yù)測(cè)精度; b:2015年小麥單產(chǎn)預(yù)測(cè)精度。
表2 特定年份各市小麥單產(chǎn)預(yù)測(cè)結(jié)果
合并部分市的樣本后,基于隨機(jī)森林算法計(jì)算共得到15個(gè)市輸入變量重要性的排序結(jié)果。為了便于分析,對(duì)15個(gè)模型各變量重要性排序結(jié)果進(jìn)行統(tǒng)計(jì)(圖4)。從各輸入變量在15個(gè)模型重要性排序中的平均排名(圖4a)可以看出,排名前6的變量的編號(hào)依次為0、22、6、2、3和5,對(duì)應(yīng)的變量分別為趨勢(shì)單產(chǎn)、3個(gè)月時(shí)間尺度的4月份的SPEI均值以及1個(gè)月時(shí)間尺度的4月份、11月份、1月份、3月份的SPEI均值,其平均排名值分別為1、9、9.6、10、10.4和10.5。在各干旱指數(shù)中,1個(gè)月時(shí)間尺度的干旱指數(shù)重要性要強(qiáng)于2個(gè)月和3個(gè)月時(shí)間尺度的干旱指數(shù)。
圖4b為25個(gè)輸入變量中每一個(gè)輸入變量在各自模型重要性排序中出現(xiàn)在前5的頻數(shù)統(tǒng)計(jì)結(jié)果,不包含頻數(shù)為0的變量。從圖4b可以看出,25個(gè)輸入變量中有22個(gè)變量在排名前5中出現(xiàn)過(guò)。趨勢(shì)單產(chǎn)(編號(hào)為0的變量)出現(xiàn)頻率最高為15,即在每個(gè)模型中均有出現(xiàn);其次是1個(gè)月時(shí)間尺度的3月份和4月份的SPEI均值(編號(hào)為5和6的變量),出現(xiàn)的頻數(shù)均為7;接著是3個(gè)月尺度的4月的SPEI均值(編號(hào)為22的變量)出現(xiàn)過(guò)6次;其他編號(hào)變量雖在前5出現(xiàn)過(guò),但出現(xiàn)頻數(shù)較低,均小于5次。
編號(hào)為0的變量為趨勢(shì)單產(chǎn),編號(hào)為1~8的變量依次為1個(gè)月時(shí)間尺度的10月份到次年5月份的SPEI均值;編號(hào)9~16的變量依次為2個(gè)月時(shí)間尺度的10月份到次年5月份的SPEI均值;編號(hào)17~25的變量以此為3個(gè)月時(shí)間尺度的10月份到次年5月份的SPEI均值。
綜上可以看出,趨勢(shì)單產(chǎn)對(duì)估產(chǎn)的精度影響最大;在各干旱指數(shù)中1個(gè)月時(shí)間尺度的干旱指數(shù)對(duì)單產(chǎn)估算精度的影響大于2個(gè)月和3個(gè)月時(shí)間尺度的干旱指數(shù);在各月份中,4月份(小麥拔節(jié)抽穗期)的干旱指數(shù)對(duì)估產(chǎn)精度影響最大。
本研究以河南省為研究區(qū),綜合考慮影響小麥產(chǎn)量的技術(shù)因素和氣象因素,以趨勢(shì)單產(chǎn)和不同時(shí)間尺度干旱指數(shù)作為輸入變量,實(shí)際單產(chǎn)作為輸出變量,建立了隨機(jī)森林回歸模型并分析討論了影響小麥單產(chǎn)的重要因素,結(jié)果表明,本研究建立的模型具有較高的估產(chǎn)精度,尤其是在干旱年份表現(xiàn)出較好的估產(chǎn)精度,該方法對(duì)于受極端氣候事件影響的作物單產(chǎn)的估算具有一定的參考價(jià)值。隨機(jī)森林算法是一種非參數(shù)統(tǒng)計(jì)方法,其優(yōu)勢(shì)在于不需要過(guò)多考慮特征的選擇,模型建立之后能夠得到所有特征的重要性,對(duì)于處理數(shù)量較大的數(shù)據(jù)集表現(xiàn)出良好的效果,泛化能力較強(qiáng),但隨機(jī)森林回歸模型對(duì)于樣本數(shù)量有一定的要求。本研究中鶴壁市、濟(jì)源市和漯河市樣本數(shù)量過(guò)少導(dǎo)致模型擬合精度不高,可信度較低。另外,建模所用基礎(chǔ)統(tǒng)計(jì)數(shù)據(jù)存在誤差也是導(dǎo)致模型擬合精度不高的原因,例如三門(mén)峽市模型擬合精度較低,可能與基礎(chǔ)統(tǒng)計(jì)數(shù)據(jù)存在誤差有關(guān)。
在本研究中,2011年(干旱年份)的估產(chǎn)精度整體高于2015年(非干旱年份)的估產(chǎn)精度,這與模型輸入變量類(lèi)型有關(guān),本研究輸入變量為趨勢(shì)單產(chǎn)和小麥生長(zhǎng)期內(nèi)不同時(shí)間尺度的SPEI干旱指數(shù),其中干旱指數(shù)在干旱年份能夠更好解釋小麥產(chǎn)量隨氣候的波動(dòng)。另外,簡(jiǎn)單平均的小麥估計(jì)值略低于面積加權(quán)后小麥估產(chǎn)值,但無(wú)明顯差異??紤]其操作簡(jiǎn)單,無(wú)需各縣小麥種植面積數(shù)據(jù),在實(shí)際操作,特別是沒(méi)有細(xì)致的小麥播種面積數(shù)據(jù)時(shí),可以通過(guò)簡(jiǎn)單平均縣級(jí)小麥單產(chǎn)估計(jì)值來(lái)得到市級(jí)小麥單產(chǎn)的估計(jì)值。
影響河南省小麥單產(chǎn)的主要因素為技術(shù)因素,即趨勢(shì)單產(chǎn),說(shuō)明改進(jìn)趨勢(shì)單產(chǎn)擬合方法能夠提高小麥估產(chǎn)模型擬合精度。在各干旱指數(shù)中,整體來(lái)看1個(gè)月尺度的干旱指數(shù)重要性高于2、3個(gè)月尺度的干旱指數(shù),說(shuō)明在河南省短時(shí)間尺度的干旱指數(shù)更能捕捉到降水對(duì)小麥的影響。此外,從時(shí)間上看,4月份干旱指數(shù)重要性高于其他月份干旱指數(shù),可能的原因是4月份處于河南小麥的拔節(jié)抽穗期,這一時(shí)期是小麥一生中生長(zhǎng)速度最快,生長(zhǎng)量最大的時(shí)期,需水量較大,對(duì)水分敏感。
傳統(tǒng)的氣象估產(chǎn)方法建模時(shí)需要首先篩選出與輸出變量相關(guān)性較大的特征參與建模,而隨機(jī)森林回歸不需要刻意進(jìn)行特征選擇,能夠達(dá)到較高擬合精度的同時(shí)獲取特征重要性排序,不需要考慮輸入變量之間的相關(guān)性高低,而傳統(tǒng)的線性回歸還要考慮多重共線性的問(wèn)題。另外,各種氣象因子與產(chǎn)量并不是簡(jiǎn)單的線性關(guān)系,隨機(jī)森林回歸是一種非線性回歸方法,相比傳統(tǒng)的氣象估產(chǎn)模型建立方法更具優(yōu)勢(shì)。本研究還存在一些待改進(jìn)之處,例如只考慮了播種到收獲時(shí)間內(nèi)的干旱指數(shù)(SPEI),未分析播種前的降水,生育期內(nèi)的低溫冷凍、高溫?zé)崂说绕渌麣庀鬄?zāi)害對(duì)作物產(chǎn)量的影響,未來(lái)研究將考慮加入更多的氣象因素來(lái)參與模型構(gòu)建,以提高模型在不同條件下的適用性。
兼顧影響小麥產(chǎn)量的社會(huì)因素和氣象因素,利用隨機(jī)森林非參數(shù)統(tǒng)計(jì)的方法建立了小麥估產(chǎn)模型,并在典型的干旱和非干旱年份進(jìn)行了精度驗(yàn)證。結(jié)果顯示:1)模型擬合精度較高,在極端氣候條件下表現(xiàn)出良好的估產(chǎn)效果;2)用縣級(jí)小麥播種面積加權(quán)得到的市級(jí)估產(chǎn)結(jié)果相對(duì)于簡(jiǎn)單平均的精度提升并不明顯,在實(shí)際應(yīng)用中,可直接通過(guò)簡(jiǎn)單平均的方法獲取市級(jí)小麥單產(chǎn)的估計(jì)值;3)不同月份和不同時(shí)間尺度的干旱指數(shù)對(duì)建模的重要性程度不一樣。