康曉鳳, 鄔定榮, 田 琪, 譚姣姣, 馬玉平, 于 強(qiáng),4**
(1.西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院 楊凌 712100; 2.中國氣象科學(xué)研究院 北京 100081; 3.中國科學(xué)院大學(xué) 北京100049; 4.西北農(nóng)林大學(xué)水土保持研究所黃土高原土壤侵蝕與旱地農(nóng)業(yè)國家重點(diǎn)實(shí)驗(yàn)室 楊凌 712100)
IPCC第六次評(píng)估報(bào)告指出全球氣候變暖仍將持續(xù), 中國自1980年起變暖趨勢也很明顯。在變暖趨勢為主的氣候變化背景下, 準(zhǔn)確預(yù)測未來作物的產(chǎn)量是制定氣候變化適應(yīng)戰(zhàn)略的必要前提。而作物發(fā)育期預(yù)測是準(zhǔn)確預(yù)測作物產(chǎn)量的基礎(chǔ)。在過去數(shù)十年里, 科學(xué)家們發(fā)展了多種不同類型的發(fā)育模式。利用觀測值校正后, 各模式普遍能獲得較好的模擬效果, 但由于機(jī)理的不同, 應(yīng)用在變暖環(huán)境時(shí), 不同模式的模擬能力可能會(huì)出現(xiàn)較大差異。而變暖環(huán)境下模擬發(fā)育期的差異對(duì)預(yù)測產(chǎn)量有較大影響, 因此評(píng)估變暖環(huán)境下發(fā)育模式表現(xiàn)的差異, 對(duì)于準(zhǔn)確預(yù)測氣候變化環(huán)境下的作物產(chǎn)量具有重要意義。
現(xiàn)有發(fā)育模式大多基于積溫理論構(gòu)建, 該理論假設(shè)作物完成發(fā)育階段所需要的積溫/光熱時(shí)是常數(shù), 考慮的機(jī)理主要包括溫度響應(yīng)、光周期、春化和水肥狀況影響等。模式間的差異主要體現(xiàn)在描述這些機(jī)理采用的具體方法。近年來, 發(fā)展了一些基于非常數(shù)積溫假設(shè)的模式。例如Wu等假設(shè)發(fā)育速率與溫度呈線性關(guān)系, 以發(fā)育階段始期日序?yàn)楸碚鬟m應(yīng)環(huán)境因子, 建立了耦合響應(yīng)與適應(yīng)機(jī)制的發(fā)育模式。該模式具有參數(shù)少、參數(shù)化過程簡單和精度高等特點(diǎn)。此外, 隨著信息技術(shù)的不斷發(fā)展, 有關(guān)機(jī)器學(xué)習(xí)算法用于模擬發(fā)育期的報(bào)道越來越多。研究發(fā)現(xiàn), 由于機(jī)器學(xué)習(xí)算法通過建立環(huán)境因素與作物發(fā)育及產(chǎn)量的深度關(guān)系, 在利用歷史數(shù)據(jù)對(duì)不同模式進(jìn)行訓(xùn)練時(shí), 能較好地預(yù)測發(fā)育期和產(chǎn)量。已有研究表明機(jī)器學(xué)習(xí)算法應(yīng)用在發(fā)育期模擬、作物發(fā)育生長及產(chǎn)量研究等方面時(shí), 表現(xiàn)較為突出。
發(fā)育模式的重要應(yīng)用場景之一是預(yù)測發(fā)育期對(duì)變暖環(huán)境的響應(yīng)。但目前對(duì)變暖環(huán)境下不同類型發(fā)育模式的表現(xiàn)還缺乏綜合比較。雖有報(bào)道指出機(jī)器學(xué)習(xí)算法在校正階段表現(xiàn)突出, 但應(yīng)用到變暖環(huán)境下時(shí), 變暖環(huán)境的氣候條件很可能沒被包括在訓(xùn)練集中, 這給機(jī)器學(xué)習(xí)算法的表現(xiàn)帶來一定的不確定性。而機(jī)理發(fā)育模式雖然有機(jī)理性較強(qiáng)的優(yōu)勢, 但參數(shù)化階段涉及的非線性過程普遍弱于機(jī)器學(xué)習(xí)模式, 因此哪種模式更適合變暖環(huán)境目前還不確定。
本研究以東北春玉米(Zea mays)和華北夏玉米為研究對(duì)象, 選擇3個(gè)代表性的機(jī)理發(fā)育模式和1個(gè)機(jī)器學(xué)習(xí)模式, 將觀測年份劃分為冷、暖年, 冷年的發(fā)育資料用于校正, 暖年資料用于驗(yàn)證, 根據(jù)模式在冷暖年表現(xiàn)的差異評(píng)價(jià)模式在氣候變暖情景下的適用性, 以期為氣候變化下的發(fā)育期模式的選擇及模式改進(jìn)提供科學(xué)依據(jù)。
以我國東北和華北為研究區(qū)域(圖1), 以春玉米和夏玉米為研究對(duì)象。東北屬于寒溫帶、中溫帶濕潤(半濕潤)氣候, 種植制度是一年一熟制。春玉米一般在4月下旬種植, 7月中下旬開花, 9月初成熟, 主要是雨養(yǎng), 個(gè)別年份可能會(huì)遭遇較嚴(yán)重的干旱。華北屬暖溫帶季風(fēng)氣候, 種植制度是一年兩熟或兩年三熟制, 夏玉米生長期間雨熱同期, 通常不需要灌溉,一般在6月上中旬播種, 8月上旬開花, 9月底至10月成熟。
圖1 研究區(qū)域和農(nóng)業(yè)氣象站點(diǎn)的分布Fig.1 Study area and location of agrometeorological observation sites
東北春玉米和華北夏玉米物候資料來自國家氣象信息中心。資料時(shí)段為各站建站起至2020年。從中選擇具有20年及以上發(fā)育期觀測的站點(diǎn), 共包括36個(gè)春玉米站和25個(gè)夏玉米站(圖1), 站點(diǎn)平均觀測年數(shù)分別為29年和28年。收集每年出苗、開花和成熟等3個(gè)發(fā)育期的日期。根據(jù)常用的發(fā)育階段劃分方法, 將出苗—開花歸為營養(yǎng)生長階段(vegetative growth period, VGP), 開花—成熟歸為生殖生長階段(reproductive growth period, RGP)。
氣象數(shù)據(jù)來自國家氣象信息中心, 選取與農(nóng)業(yè)氣象觀測站對(duì)應(yīng)的國家級(jí)地面氣象觀測站的逐日氣象數(shù)據(jù), 包括平均氣溫、最高氣溫、最低氣溫、日照時(shí)數(shù)和降水量等。數(shù)據(jù)時(shí)間與物候資料相同。缺失的氣象數(shù)據(jù)使用Python編程進(jìn)行修訂。缺測序列小于5 d時(shí)缺測值采用線性插值法計(jì)算, 缺測序列大于或者等于5 d時(shí)采用同一日的多年平均值代替。假設(shè)某站1980年7月14—20日, 連續(xù)7日缺測平均氣溫?cái)?shù)據(jù), 而1981—2020年這7日均有觀測數(shù)據(jù), 則用1981—2020年的同日平均值代替缺測的7日數(shù)據(jù)。各站資料的開始時(shí)間各異, 各日缺測年數(shù)也不盡相同, 計(jì)算多年平均值的年數(shù)因站點(diǎn)而異。本文采取的數(shù)據(jù)插補(bǔ)方法是氣象數(shù)據(jù)常規(guī)處理方法。此外,氣象數(shù)據(jù)的缺失量非常小, 總體上不會(huì)對(duì)研究結(jié)果產(chǎn)生較大影響。
1.4.1 發(fā)育模式簡介
選擇3個(gè)機(jī)理發(fā)育模式和1個(gè)機(jī)器學(xué)習(xí)模式進(jìn)行比較。3個(gè)機(jī)理發(fā)育模式是前人研究表明具有較高精度的模式, 分別為MAIS (maize simulation)、Beta和RAM (response and adaption model)。機(jī)器學(xué)習(xí)算法選擇多層感知器 (multi-layer perceptron, MLP)。
在機(jī)理發(fā)育模式中, MAIS既不考慮光周期現(xiàn)象,也不考慮三基點(diǎn)溫度, 而是使用日平均氣溫的二次和三次函數(shù)計(jì)算積溫的逐日增量。Beta模式不僅考慮了光周期和三基點(diǎn)溫度, 還用非線性關(guān)系描述溫度和發(fā)育速率的關(guān)系。RAM模式由Wu等開發(fā), 該模式假設(shè)發(fā)育速率與溫度呈線性關(guān)系, 且線性傾向率與發(fā)育階段始期的日序線性相關(guān)。由于每年的發(fā)育階段始期和溫度都不盡相同, 因此RAM認(rèn)為完成發(fā)育階段所需的積溫不是常數(shù)。
機(jī)器學(xué)習(xí)模式是一種基于統(tǒng)計(jì)關(guān)系建立的模式,在對(duì)輸入數(shù)據(jù)進(jìn)行復(fù)雜訓(xùn)練后, 可以進(jìn)行準(zhǔn)確預(yù)測。不同的訓(xùn)練算法有不同的特點(diǎn), 適用于不同的應(yīng)用方向。由于預(yù)測發(fā)育期通常需要將作物發(fā)育依據(jù)時(shí)間序列展開, 因而常采用神經(jīng)網(wǎng)絡(luò)算法。有研究表明神經(jīng)網(wǎng)絡(luò)模式比基于氣候適宜度的發(fā)育模式具有更高的精度。因此, 本研究選擇多層感知器神經(jīng)網(wǎng)絡(luò)作為代表性的機(jī)器學(xué)習(xí)模式。4個(gè)發(fā)育模式介紹如下:
參考已有的研究, 采用通用的框架介紹發(fā)育模式。玉米發(fā)育到某一階段的進(jìn)展采用玉米發(fā)育指數(shù)(DVI)表示。將出苗的DVI定義為1, 開花定義為2, 成熟定義為3。
1) MAIS模式
MAIS模式中生長發(fā)育主要通過日平均溫度的二次和三次函數(shù)計(jì)算累積熱量單位的日增量(GTI)實(shí)現(xiàn)。公式如下:
式中: DVR為日發(fā)育速率, GTI, GTI分別是VGP和RGP的熱時(shí)(℃·d), T是日平均溫度(℃),T和T分別是日最高和最低氣溫(℃)。
2) Beta模式
Beta公式如下:
式中: T為日平均氣溫(℃), T為該發(fā)育階段下限溫度(℃), T為該發(fā)育階段適宜溫度(℃), T為該發(fā)育階段上限溫度(℃), K為基本發(fā)育系數(shù), P為增溫促進(jìn)系數(shù), Q為高溫抑制系數(shù), G為感光性系數(shù), D為天文日長(h), D為發(fā)育階段臨界日長(h)。Beta模式中的T和MAIS中的T不完全相同。前者是氣象數(shù)據(jù)中的日平均氣溫, 后面是依據(jù)日最高和最低氣溫計(jì)算到的日平均溫度。Beta模式參數(shù)較多, 為便于參數(shù)化, 參照前人研究, 本研究將T、T和T分別取8 ℃、34 ℃和44 ℃, D取12.5 h。
3) RAM模式
RAM模式是一種耦合響應(yīng)與適應(yīng)機(jī)制的模式,計(jì)算公式如下:
式中: DVR為發(fā)育階段始期后的逐日發(fā)育速率, α、β和 γ是從出苗到開花階段的系數(shù), α、 β和 γ是開花到成熟階段的系數(shù), D OY和D OY分別是一年中的出苗和開花日期的日序。
4)多層感知器神經(jīng)網(wǎng)絡(luò)模式
多層感知器神經(jīng)網(wǎng)絡(luò)是一種監(jiān)督式學(xué)習(xí)算法,可對(duì)線性函數(shù)或者復(fù)雜的非線性函數(shù)進(jìn)行學(xué)習(xí), 通常由輸入層、隱藏層和輸出層3部分組成。算法基于一種多層前饋網(wǎng)絡(luò)結(jié)構(gòu), 模擬時(shí)先輸入學(xué)習(xí)樣本,樣本在MLP網(wǎng)絡(luò)中逐層前饋(從輸入層到隱藏層到輸出層), 逐層計(jì)算出結(jié)果。本研究使用反向傳播算法對(duì)網(wǎng)絡(luò)的權(quán)重和偏差進(jìn)行反復(fù)調(diào)整訓(xùn)練, 使輸出的向量與期望向量盡可能地接近。本文使用Python 3.7版本sklearn.neural_network包中的MLPRegressor函數(shù), 神經(jīng)網(wǎng)絡(luò)的激活函數(shù)使用整流線性單元(ReLU), 梯度下降采用Adam算法進(jìn)行優(yōu)化。
選擇5個(gè)特征因素作為MLP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù):日平均氣溫、日照時(shí)數(shù)、降水量、日長和高溫度日(heat degree days, HDD)。高溫度日依文獻(xiàn) 計(jì)算。東北春玉米和華北夏玉米在VGP和RGP階段的最高溫度均為35 ℃。由于同一站點(diǎn)同一生長階段的天數(shù)在不同年份存在差異, 本研究按照各年最大時(shí)間長度輸入逐日數(shù)據(jù)。VGP階段的最大時(shí)間長度為最早出苗期到最晚開花期, RGP階段為最早開花期到最晚成熟期, 以確保神經(jīng)網(wǎng)絡(luò)能夠獲得相同長度的輸入序列的同時(shí)將玉米不同發(fā)育階段經(jīng)歷的氣候條件盡可能包括在內(nèi)。
1.4.2 模式參數(shù)化方法
根據(jù)氣候要素異常度(C)將發(fā)育期資料分為冷年數(shù)據(jù)和暖年數(shù)據(jù), 冷年數(shù)據(jù)用于校正模式參數(shù), 暖年數(shù)據(jù)用于驗(yàn)證模式在氣候變暖背景下的模擬能力。參考中華人民共和國國家標(biāo)準(zhǔn)《農(nóng)業(yè)氣候影響評(píng)價(jià):農(nóng)作物氣候年型劃分方法》(GB/T 21986—2008), 氣候要素異常度計(jì)算公式如下:
式中: Y 為逐年玉米生長季平均溫度(℃), Y為 研究時(shí)段內(nèi)玉米生長季平均氣溫的多年平均值, s為標(biāo)準(zhǔn)差。
根據(jù)玉米生長季平均氣溫的異常度劃分等級(jí),為了在校正和驗(yàn)證時(shí)有盡可能多的數(shù)據(jù), 同時(shí)使冷暖年記錄數(shù)盡可能一致, 參考文獻(xiàn)[32]的劃分標(biāo)準(zhǔn),將C>0定義為暖年(正常年+高溫年), C<0定義為冷年(正常年+低溫年)。區(qū)分后, 春玉米冷暖年生長季平均溫度分別為18.91 ℃和19.95 ℃, 暖年生長季均溫較冷年高1.04 ℃; 夏玉米冷暖年生長季平均溫度分別為23.21 ℃和24.32 ℃, 暖年生長季均溫較冷年高1.11 ℃。為便于比較, 春玉米生長季統(tǒng)一定義為5月1日—9月30日, 夏玉米為6月10日—10月10日。
MAIS模式和Beta模式以均方根誤差(RMSE)最小化為原則, 在站點(diǎn)尺度用“窮舉法”對(duì)不同模式的參數(shù)進(jìn)行全局尋優(yōu)。對(duì)于VGP階段, 從出苗期開始, 模擬開花期。對(duì)于RGP階段, 則從開花期開始,模擬成熟期。各參數(shù)的尋優(yōu)空間略大于公開報(bào)道的值, 以在確保得到最優(yōu)參數(shù)的同時(shí)減少計(jì)算量。RAM模式的參數(shù)可根據(jù)觀測值直接求出。除RAM模式外, 其他模式優(yōu)化的參數(shù)、取值范圍和步長如表1所示。MLP采用網(wǎng)格搜索算法進(jìn)行超參數(shù)尋優(yōu),使用每組超參數(shù)訓(xùn)練模式并挑選驗(yàn)證集誤差最小的超參數(shù)組合。研究采用Python 3.7版本Grid SearchCV函數(shù)調(diào)整超參數(shù), 包括隱含層的節(jié)點(diǎn)數(shù)、最大迭代次數(shù)、隨機(jī)種子, 通過五折交叉驗(yàn)證獲得最佳超參數(shù)組合。
表1 發(fā)育模式參數(shù)/超參數(shù)取值范圍Table 1 Parameter / hyperparameter value range of phenological models
1.4.3 統(tǒng)計(jì)分析
采用歸一化均方根誤差(NRMSE)、平均偏差(MBE)和系統(tǒng)偏差等指標(biāo)評(píng)價(jià)模式表現(xiàn)。NRMSE是均方根誤差與實(shí)際觀測數(shù)據(jù)平均值之比, 主要體現(xiàn)模擬值與觀測值的差異程度, 值越小模擬越好。MBE是模擬偏差的平均, 主要用于估計(jì)模式偏差的方向, 正偏差表示模擬值高于實(shí)測值, 負(fù)偏差表示低于實(shí)測值。發(fā)育模式經(jīng)常用于預(yù)測未來氣候變化背景下發(fā)育期的變化, 模擬誤差的系統(tǒng)偏差可指示變暖環(huán)境下模擬的偏差程度, 因此本文還比較了模擬誤差隨發(fā)育階段平均溫度的趨勢, 以此作為模式的系統(tǒng)偏差。各指標(biāo)的計(jì)算公式如下:
2.1.1 歸一化均方根誤差
在春玉米的VGP階段, NRMSE最小的模式是MLP (3.5%), 其次是RAM (4.5%)和Beta (4.8%), MAIS最大(5.3%) (圖2a)。在RGP階段, NRMSE最小的仍是MLP (4.6%), 其次是RAM (8.6%)和Beta (10.1%),最大的是MAIS (10.4%) (圖2b)。
夏玉米的結(jié)果與春玉米類似, VGP階段也是MLP最優(yōu)(4.5%), 其次是RAM (4.7%)和Beta (4.8%),NRMSE最大的模式是MAIS (5.7%) (圖2c)。RGP階段是MLP模式最優(yōu)(8.3%), 其次是RAM (8.9%)和Beta (9.1%) , 最大的是MAIS (9.8%) (圖2d)。
圖2 不同發(fā)育模式冷年模擬發(fā)育期的歸一化均方根誤差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.2 Normalized root mean square error of simulated maize growth period of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.
各模式在RGP階段的模擬誤差普遍高于VGP階段。平均而言, 模式在冷年調(diào)參后的模擬表現(xiàn)中,最優(yōu)的模 式 是MLP (5.2%), 其次是RAM (6.7%)、Beta (7.2%)和MAIS (7.8%)。
2.1.2 平均偏差
在春玉米VGP階段, 各模式均很好地模擬了開花期。Beta和MAIS模擬開花期與觀測值接近,MBE分別為0.0 d和0.1 d。RAM和MLP模擬開花期略晚于觀測值, MBE分別為0.4 d和0.7 d (圖3a)。各模式在RGP階段的表現(xiàn)普遍次于VGP階段。MAIS、Beta、RAM和MLP的MBE分別為—0.2 d、—0.9 d、0.4 d和0.6 d (圖3b)。
與春玉米類似, 各模式在夏玉米VGP階段也表現(xiàn)較好。Beta和MAIS模擬日期與觀測值接近,MBE分別為0.0 d和—0.1 d, RAM和MLP模擬開花期晚于觀測值, MBE分別為0.4 d和0.6 d (圖3c)。在RGP階段, Beta和MAIS模擬成熟期接近觀測值,MBE分別為0.0 d和—0.1 d, RAM和MLP模擬成熟期均晚于觀測值, MBE分別為0.3 d和0.7 d (圖3d)。
圖3 不同發(fā)育模式冷年模擬發(fā)育期的平均偏差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.3 Mean bias error of simulated growth period of different phenological models in cold years.a: vegetative growth period (VGP)of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, MAIS和Beta模擬趨于提前, MBE分別為—0.1 d和—0.2 d, RAM和MLP模擬趨于推遲, 其值分別為0.4 d和0.7 d。
2.1.3 系統(tǒng)偏差
在春玉米VGP階段, Beta和RAM模式所有站點(diǎn)系統(tǒng)偏差均不顯著(圖4a), MAIS模式有顯著系統(tǒng)偏差的站點(diǎn)比例為11.1%, 系統(tǒng)偏差最大的是MLP模式(36.1%) (圖4a)。RGP階段則幾乎相反, MLP模式系統(tǒng)偏差最小(22.2%), 其次是Beta (25.0%)和RAM (33.3%), 系統(tǒng)偏差最大的是MAIS模式(58.3%)(圖4b)。
夏玉米VGP階段的結(jié)果與春玉米類似, Beta和RAM模式所有站點(diǎn)模擬誤差隨發(fā)育階段均溫的趨勢均不顯著(圖4c), 其次是MAIS模式, 有顯著趨勢的站點(diǎn)比例為8.0%, 系統(tǒng)偏差最大的為MLP模式,有顯著趨勢的站點(diǎn)比例為24.0% (圖4c)。夏玉米R(shí)GP階段, Beta模式的系統(tǒng)偏差最低, 有顯著趨勢的站點(diǎn)比例為4.0%, 其次是RAM模式(8.0%)和MAIS模式(20.0%); 系統(tǒng)偏差最大的是MLP模式, 有顯著趨勢的站點(diǎn)比例為44.0% (圖4d)。
圖4 不同發(fā)育模式在冷年模擬時(shí)的模擬誤差隨發(fā)育階段均溫的趨勢[a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段;c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段。實(shí)心點(diǎn)為站點(diǎn)趨勢顯著(P<0.05)]Fig.4 Trend of simulation error against growth period average temperature of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在冷年模擬時(shí), 機(jī)理發(fā)育模式RGP階段的系統(tǒng)偏差高于VGP階段的系統(tǒng)偏差, 但MLP系統(tǒng)偏差表現(xiàn)較穩(wěn)定。平均而言, 系統(tǒng)偏差最小的模式是Beta(7.3%), 其次是RAM (10.3%)和MAIS (24.4%), 系統(tǒng)偏差最大的是MLP (31.6%)。
2.2.1 歸一化均方根誤差
和冷年的模擬結(jié)果不同, 在春玉米的VGP階段,表現(xiàn)最好的模式是MAIS (6.8%), 其次是Beta和RAM (均值均為7.4%), NRMSE最大的模式是MLP(8.9%) (圖5a)。在RGP階段, NRMSE最小的是MLP(10.0%), 其次是RAM (11.7%)和Beta (12.2%), NRMSE最大的是MAIS (14.8%) (圖5b)。
夏玉米的結(jié)果與春玉米相似, VGP階段是Beta最優(yōu)(7.1%), 其次是RAM (7.3%)和MAIS (7.5%),NRMSE最大的模式是MLP (10.7%) (圖5c)。RGP階段差異較大, Beta模式最優(yōu)(14.0%), 其次是MLP(14.1%)和MAIS (16.5%), 最大的是RAM (17.2%)(圖5d)。
圖5 不同發(fā)育模式暖年模擬發(fā)育期的歸一化均方根誤差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.5 Normalized root mean square error of simulated growth period of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d:RGP of summer maize.
在暖年的模擬精度明顯低于冷年, 不同發(fā)育階段的模擬結(jié)果也存在差異。4個(gè)發(fā)育模式RGP階段的模擬誤差普遍高于VGP階段。平均而言, 最優(yōu)的模式是Beta (10.2%), MLP雖然在RGP表現(xiàn)最好, 但受VGP階段表現(xiàn)的影響, 綜合表現(xiàn)(10.9%)次于Beta,RAM 綜合表現(xiàn)與 MLP 相同, MAIS 表現(xiàn)稍差, 為11.4%。
2.2.2 平均偏差
在春玉米VGP階段, MAIS和Beta模擬開花期均呈提前趨勢, 平均偏差值相同, 均為—1.7 d; RAM和MLP模擬開花期均呈延遲趨勢, 平均偏差分別為2.1 d和2.4 d (圖6a)。RGP階段各模式模擬成熟期較觀測值普遍提前: MAIS、Beta、RAM和MLP的平均偏差分別為—5.7 d、—4.0 d、—2.8 d和—1.7 d (圖6b)。MAIS模式平均偏差最大, MLP模式平均偏差最小。
在夏玉米VGP階段, MAIS和RAM模擬開花期與觀測值接近, 平均偏差值相近(圖6c), Beta和MLP的平均偏差分別為—0.1 d和2.6 d (圖6c)。RGP階段各模式模擬成熟期普遍較觀測值呈提前的趨勢:MLP的表現(xiàn)好于3個(gè)機(jī)理發(fā)育模式, MBE為—1.2 d;機(jī)理發(fā)育模式中, 表現(xiàn)最好的是Beta, 平均偏差值為—2.7 d, 其次是RAM模 式, 平均偏差值為—3.8 d,MAIS模式平均偏差最大, 平均偏差為—4.3 d (圖6d)。
圖6 不同發(fā)育模式暖年模擬發(fā)育期的平均偏差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.6 Mean bias error of simulated growth period of different phenological models in warm years.a: vegetative growth period(VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, 機(jī)理發(fā)育模式模擬趨于提前, MAIS、Beta和RAM的平均偏差值分別為—2.9 d、—2.1 d和—1.1 d; MLP趨于延遲, 均值為0.5 d。
2.2.3 系統(tǒng)偏差
春玉米VGP階段, Beta模式有顯著系統(tǒng)偏差的站點(diǎn)比例最小(8.3%), 其次是MAIS模式(11.1%)和RAM模式(19.4%), MLP模式有顯著趨勢的站點(diǎn)比例達(dá)47.2%, 系統(tǒng)偏差較大(圖7a)。RGP階段表現(xiàn)與冷年模擬時(shí)表現(xiàn)一致, MLP模式有顯著趨勢的站點(diǎn)比例最低(11.1%), 其次是Beta (30.6%), RAM模式有顯著趨勢的站點(diǎn)比例為44.4%, 系統(tǒng)偏差最大的是MAIS模式(61.1%) (圖7b)。
在夏玉米VGP階段, MAIS和Beta模式系統(tǒng)偏差有顯著趨勢的站點(diǎn)比例均最低(20.0%), 其次是RAM模式, 有顯著趨勢的站點(diǎn)比例為32.0%, 系統(tǒng)偏差最大的為MLP模式(56.0%) (圖7c)。夏玉米R(shí)GP階段, 系統(tǒng)偏差最小的是MLP模式(12.0%), 其次是Beta模式(40.0%), MAIS模式有顯著趨勢的站點(diǎn)比例達(dá)60.0%, 系統(tǒng)偏差最大的是RAM模式(64.0%)(圖7d)。
圖7 不同發(fā)育模式暖年模擬時(shí)的模擬誤差隨發(fā)育階段均溫的趨勢。a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段;c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段。實(shí)心點(diǎn)為站點(diǎn)趨勢顯著(P<0.05)。Fig.7 Trend of simulation error against growth period average temperature of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在暖年模擬時(shí), 機(jī)理發(fā)育模式RGP階段系統(tǒng)偏差高于VGP階段, MLP表現(xiàn)相反。平均而言, 系統(tǒng)偏差最小的是Beta模式(24.7%), 其次是MLP (31.6%),隨后是MAIS (38.1%)和 RAM (40.0%)。
本研究使用了站點(diǎn)20年以上的長期發(fā)育期觀測資料, 研究時(shí)段內(nèi)玉米品種變化頻繁, 氣候明顯變暖,春玉米年均溫隨年份變化的平均傾向率為0.28 ℃?(10a), 夏玉米平均傾向率為0.43 ℃?(10a)。本文未區(qū)分品種, 直接用發(fā)育期數(shù)據(jù)驅(qū)動(dòng)模式, 其中隱含的假設(shè)之一是品種變化對(duì)發(fā)育期影響較小。大量研究認(rèn)為品種變化對(duì)發(fā)育期有明顯影響, 但研究結(jié)果多基于統(tǒng)計(jì)關(guān)系和復(fù)雜程度不一的發(fā)育模式模擬得到, 未經(jīng)過同一品種連續(xù)種植多年的實(shí)際資料的驗(yàn)證。此外, 統(tǒng)計(jì)關(guān)系和發(fā)育模式在捕捉變化環(huán)境下作物發(fā)育與環(huán)境因子關(guān)系方面還存在一定的問題。例如在分析三大主糧作物[小麥、玉米、水稻(Oryza sativa)]同一站點(diǎn)15年以上品種不變的實(shí)測發(fā)育期數(shù)據(jù)后發(fā)現(xiàn), 在發(fā)育期、發(fā)育階段日數(shù)、有效積溫的變化趨勢, 以及發(fā)育速率對(duì)溫度的敏感性等方面的結(jié)果與其他站品種變化時(shí)的結(jié)果無明顯差異, 表明品種變化對(duì)發(fā)育的影響可能遠(yuǎn)小于基于統(tǒng)計(jì)關(guān)系和發(fā)育模式的結(jié)果。此外, 不少研究也認(rèn)為品種變化對(duì)物候的影響并不如已有研究報(bào)道的大,進(jìn)而不區(qū)分品種, 直接使用這些數(shù)據(jù)去訂正發(fā)育模式參數(shù)。在分析氣候變化對(duì)于物候的影響時(shí), 有研究也傾向于不考慮作物品種特性的差異, 或者將差異主要?dú)w因于生長條件氣候差異。綜上所述, 我們認(rèn)為本研究中品種變化對(duì)發(fā)育期影響較小的假設(shè), 對(duì)發(fā)育模式表現(xiàn)的影響應(yīng)該在可接受范圍內(nèi)。
本研究根據(jù)生長季平均溫度劃分為冷年和暖年,而在表示模式的系統(tǒng)偏差時(shí)使用了發(fā)育階段的平均溫度。其原因是生長季的長度遠(yuǎn)大于VGP和RGP的實(shí)際經(jīng)歷。與生長季平均溫度相比, 發(fā)育階段的平均溫度更能真實(shí)地反映VGP和RGP階段所經(jīng)歷的真實(shí)氣溫。此外, 在生長季平均氣溫相同的情況下, 逐日氣溫在不同發(fā)育階段有不同的分布, 可能會(huì)導(dǎo)致VGP和RGP模擬誤差產(chǎn)生明顯差異。但氣候變暖導(dǎo)致發(fā)育期相應(yīng)往前平移, 生長季因此處在比平移前相對(duì)更冷的環(huán)境中, 而生長季平均溫度尚不能反映這種變化。如何更準(zhǔn)確地表示模式的系統(tǒng)誤差還需要進(jìn)一步研究。
RAM和Beta在冷年和暖年的模擬中均有比較穩(wěn)定的良好表現(xiàn), 尤其是變暖背景下, 表明機(jī)理發(fā)育模式具有良好的外推能力。馬玉平等參考RAM構(gòu)建了甘蔗(Saccharum officinarum)發(fā)育模式, 近40年實(shí)測數(shù)據(jù)表明該模式的適應(yīng)性較好。本文研究結(jié)果認(rèn)為冷年校正時(shí)RAM表現(xiàn)較好, 優(yōu)于Beta模式,但在變暖環(huán)境弱于Beta模式。也有文獻(xiàn)表明, 用大量數(shù)據(jù)同時(shí)訂正RAM和Beta模式時(shí), RAM的表現(xiàn)好于Beta, 表明RAM中的耦合關(guān)系需要大量數(shù)據(jù)的訓(xùn)練才能穩(wěn)定建立。
MLP模式將降水、日照等氣象因素及日長輸入模式, 同時(shí)還考慮生長發(fā)育過程中極端高溫事件對(duì)物候的影響, 加上MLP可獲得極其復(fù)雜的多元回歸關(guān)系, 因此MLP在冷年模擬時(shí)表現(xiàn)突出。但當(dāng)生長季溫度升高時(shí), 模式的模擬表現(xiàn)明顯降低, 原因?yàn)镸LP模式本質(zhì)上是根據(jù)輸入數(shù)據(jù)獲得的多元回歸關(guān)系, 而回歸關(guān)系天然存在外推困難的問題。但是, 與機(jī)理發(fā)育模式相比, MLP沒有考慮作物生長發(fā)育的生理機(jī)制, 這可能是MLP暖年模擬能力明顯弱于機(jī)理發(fā)育模式的原因之一。典型的機(jī)理之一是, 高于上限溫度時(shí), 發(fā)育就會(huì)停止, 不經(jīng)大量數(shù)據(jù)訓(xùn)練,MLP可能難以捕捉到這一過程。因此, MLP輸入樣本量會(huì)直接影響模式優(yōu)化的結(jié)果。研究中單個(gè)站點(diǎn)數(shù)據(jù)較為有限, 可能導(dǎo)致MLP模式泛化能力不高。本研究結(jié)果表明MLP模擬有過擬合現(xiàn)象。有報(bào)道認(rèn)為輸入差異顯著的氣象數(shù)據(jù)能顯著提高模式的表現(xiàn), 因此應(yīng)盡可能多用數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模式, 以包括多的環(huán)境變化條件, 提高M(jìn)LP的泛化能力。值得關(guān)注的是, 發(fā)育模式的一個(gè)重要應(yīng)用方向是預(yù)測未來變暖環(huán)境下的物候, 而未來變暖條件下的氣象數(shù)據(jù), 很可能無法體現(xiàn)在訓(xùn)練數(shù)據(jù)中, 這在一定程度上限制了機(jī)器學(xué)習(xí)模式在變暖環(huán)境中的應(yīng)用。在RGP階段, MLP表現(xiàn)突出, 表明現(xiàn)有的機(jī)理發(fā)育模式對(duì)RGP階段機(jī)理的認(rèn)識(shí)可能還存在不足。如研究發(fā)現(xiàn), 在RGP階段加入光周期的影響可顯著提高Beta模式模擬玉米成熟期的精度, 經(jīng)改進(jìn)后的Beta模式模擬效果提升明顯。RAM在暖年的RGP階段表現(xiàn)突出(圖5), 原因之一可能是RAM考慮的適應(yīng)過程在形式上類似于光周期。此外, MLP在RGP的輸入特征也包括日長。因此, 在進(jìn)一步的研究中, 應(yīng)加強(qiáng)RGP階段這種類似于日長影響的研究。
本研究基于實(shí)測歷史發(fā)育期數(shù)據(jù)比較了3個(gè)不同的機(jī)理發(fā)育模式和1個(gè)機(jī)器學(xué)習(xí)算法在變暖環(huán)境下的適用性。冷年校正結(jié)果表明MLP模擬精度優(yōu)于3個(gè)機(jī)理發(fā)育模式, 機(jī)理發(fā)育模式中精度最高的是RAM, 其次是Beta和MAIS。MAIS和Beta模擬值普遍稍提前于觀測值, 其他2個(gè)模式則略晚于觀測值。3個(gè)機(jī)理發(fā)育模式的系統(tǒng)偏差均低于MLP,機(jī)理發(fā)育模式中, Beta系統(tǒng)偏差最小, 其次是RAM和MAIS。應(yīng)用到變暖環(huán)境后, 各模式的模擬誤差均有所上升, 其中Beta精度最高, 其次是MLP和RAM,MAIS表現(xiàn)較差。機(jī)理發(fā)育模式模擬值較觀測值呈提前趨勢, 而MLP趨于推遲。除MLP以外的模式系統(tǒng)偏差較冷年時(shí)增大。4個(gè)模式中Beta偏差最小,其次是MLP, 隨后依次為MAIS和RAM。
機(jī)器學(xué)習(xí)通過輸入數(shù)據(jù)獲得復(fù)雜多元回歸關(guān)系對(duì)玉米物候進(jìn)行模擬, 冷年校正時(shí)模擬表現(xiàn)優(yōu)于機(jī)理發(fā)育模式。但當(dāng)生長季溫度升高時(shí), MLP模擬表現(xiàn)明顯下降, 而機(jī)理發(fā)育模式中Beta和RAM模擬表現(xiàn)較為穩(wěn)定。
沒有一個(gè)模式在冷年校正和暖年驗(yàn)證時(shí)均占優(yōu)勢, 因此應(yīng)根據(jù)應(yīng)用場景選用發(fā)育模式。關(guān)注準(zhǔn)確反演歷史氣候變化對(duì)作物發(fā)育期的影響時(shí), 建議采用MLP; 而更關(guān)注預(yù)測未來氣候變化對(duì)發(fā)育期影響時(shí), 應(yīng)以機(jī)理發(fā)育模式為主。