張志勇, 樊澤華, 張娟娟, 邱青彬, 鄭亮, 芮戰(zhàn)許, 馬新明, 熊淑萍
(1.河南農(nóng)業(yè)大學農(nóng)學院/作物生長發(fā)育調(diào)控教育部重點實驗室,河南 鄭州 450046;2.河南農(nóng)業(yè)大學信息管理與科學學院,河南 鄭州 450046)
小麥是中國三大糧食作物之一,隨著社會經(jīng)濟的發(fā)展和農(nóng)業(yè)供給側(cè)結(jié)構(gòu)性改革的深入,小麥需求已由數(shù)量型向質(zhì)量型轉(zhuǎn)變。提升小麥品質(zhì),解決專用優(yōu)質(zhì)小麥生產(chǎn)問題已成為中國小麥產(chǎn)業(yè)的主要發(fā)展方向[1-2]。小麥籽粒蛋白質(zhì)含量(grain protein content,GPC)是影響小麥品質(zhì)最重要的指標,不同生態(tài)環(huán)境、栽培措施均會對其造成顯著的影響。因此,在小麥生育進程中較早感知小麥籽粒蛋白質(zhì)含量信息,實時采取相應栽培調(diào)控措施,對保障小麥籽粒蛋白質(zhì)含量達標,實現(xiàn)小麥優(yōu)質(zhì)專用生產(chǎn)指導、分級收割、企業(yè)按質(zhì)論價收購及國家制定作物進出口政策有著重要的現(xiàn)實意義[3]。由于高光譜遙感技術(shù)具有分辨率高、連續(xù)性強、光譜范圍窄、數(shù)據(jù)信息量大等特點,近年來,國內(nèi)外不少學者以不同的農(nóng)學參數(shù)為鏈接點,利用高光譜技術(shù),分別構(gòu)建了“高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量”的籽粒蛋白質(zhì)預測模型,在實現(xiàn)小麥籽粒品質(zhì)的預測方面,進行了不少的研究與探索[4-6]。田永超等[7]發(fā)現(xiàn),抽穗后利用葉片葉綠素含量(SPAD)和冠層光譜比值指數(shù)R(1 220,560)可以對單位土地面積上籽粒蛋白質(zhì)與淀粉的動態(tài)積累進行預測,其成熟期籽粒蛋白質(zhì)積累量監(jiān)測模型實測值與預測值之間的相關(guān)系數(shù)R可達0.94。李娜[8]對小麥成熟期GPC和各個生育時期SPAD進行相關(guān)分析與建模,發(fā)現(xiàn)灌漿期SPAD與冠層光譜指數(shù)PSSRb(R800,R635)構(gòu)建的GPC估測模型效果較優(yōu),其決定系數(shù)(coefficient of determination,R2)與均方根誤差(root mean squared error,RMSE)達到0.693和0.152。馮偉等[9]、王紀華等[10]和黃文江等[11]研究表明,小麥開花期葉片氮指標與成熟期籽粒品質(zhì)有顯著的相關(guān)性,可以很好地預測籽粒蛋白質(zhì)含量,相關(guān)系數(shù)分別為0.842、0.527、0.562,前兩者的建模驗證實測值與預測值的決定系數(shù)R2分別最高達到0.616、0.909。賀佳等[12]以植株氮含量為鏈接點,使用最小二乘法建立的不同生育時期植被指數(shù)監(jiān)測成熟期籽粒蛋白質(zhì)含量模型均有很好的模擬精度,其中以抽穗期植株氮含量構(gòu)建的GPC預測模型效果最佳,實測值與預測值的R2和RMSE分別達到0.979與1.767。
綜上所述,前人對于小麥籽粒品質(zhì)即籽粒蛋白質(zhì)含量的遙感估測預測較多,但多基于小麥生育后期的單一農(nóng)學參數(shù)與籽粒蛋白質(zhì)含量建立遙感估測預測模型,缺乏不同農(nóng)學參數(shù)間的橫向?qū)Ρ?,對于不同農(nóng)學參數(shù)對模型產(chǎn)生的影響也較少解釋。本研究通過對不同氮處理下兩類品質(zhì)類型4個小麥品種的開花期SPAD、葉片干物質(zhì)質(zhì)量(leaf dry weight,LDW)、地上生物量(aboveground biomass,AGB)、葉片氮含量(leaf nitrogen content,LNC)、葉片氮積累量(leaf nitrogen accumulation,LNA)、葉面積指數(shù)(leaf area index,LAI)、植株氮含量(plant nitrogen content,PNC)、植株氮積累量(plant nitrogen accumulation,PNA)、氮營養(yǎng)指數(shù)(nitrogen nutrition index,NNI)9個不同農(nóng)學參數(shù)的測定,利用一階導數(shù)作為光譜預處理方法和偏最小二乘法作為模型構(gòu)建方法,構(gòu)建不同的高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量的冬小麥品質(zhì)預測模型,以期篩選確定最優(yōu)中間參數(shù)與建模方法組合,實現(xiàn)小麥生育進程中籽粒蛋白質(zhì)品質(zhì)提前精準預測,為優(yōu)質(zhì)小麥品質(zhì)調(diào)控栽培管理提供技術(shù)支持。
試驗于2020—2021年在河南農(nóng)業(yè)大學原陽科教園區(qū)進行(113.94°E,35.10°N)。試驗田0~0.2 m土層全氮含量1.90 g·kg-1,硝態(tài)氮含量20.80 mg·kg-1,有效磷含量9.38 mg·kg-1,速效鉀含量239.90 mg·kg-1。試驗采用裂區(qū)設(shè)計,主區(qū)為不同供氮水平,設(shè)N0(0 kg·hm-2)、N8(120 kg·hm-2)、N15(225 kg·hm-2)、N22(330 kg·hm-2);副區(qū)為不同小麥品種,分別為弱筋小麥揚麥13和揚麥15、強筋小麥鄭麥366和鄭麥369;3次重復。氮肥為尿素(總氮含量≥46.4%),分基肥和追肥,基追質(zhì)量比為6∶4,追肥于拔節(jié)期施入。每個小區(qū)面積約為41.5 m2,其他栽培管理措施同一般高產(chǎn)田。
1.2.1 小麥冠層光譜測定 試驗于小麥開花期前后(時間為2021-04-26)進行群體冠層光譜測定。采用美國生產(chǎn)的ASD Field Spec野外便攜式光譜輻射儀測定。該儀器采集光譜波段范圍為350~2 500 nm,連續(xù)采樣間隔為1 nm,測量時將光譜探頭垂直于小麥冠層1 m高度的位置進行測量。每個小區(qū)選定3個位置,每個位置測量記錄10條光譜曲線,去除異常值后以剩余光譜曲線的平均值作為該小區(qū)的冠層光譜。在北京時間10:00—14:00進行測量,并在測量時選擇晴朗無云的條件,測量過程中使用標準白板進行校正。
1.2.2 農(nóng)學參數(shù)測定 光譜測定完之后,在正下方每次取3~4株小麥,3個樣點共取10株以上小麥,然后,隨機選取10株小麥用于以下指標測定。將隨機選取出來的10株小麥莖部、葉片及穗部分離,然后將它們分別裝入信封,烘箱內(nèi)105 ℃殺青0.5 h,之后下調(diào)到80 ℃烘干,直至其干物質(zhì)質(zhì)量不再發(fā)生變化,得到其葉片干物質(zhì)質(zhì)量(LDW)及地上部生物量(AGB)。葉片氮含量(LNC)、葉片氮積累量(LNA)、植株氮積累量(PNA)和植株氮含量(PNC)的測定與計算參照張英利等[13]的方法。葉綠素含量(SPAD)的測定參照徐云飛等[14]的方法。葉面積指數(shù)(LAI)的測定參照劉镕源等[15]的方法,以比葉重法進行測定計算。氮素營養(yǎng)指數(shù)(NNI)是Lemaire提出的能夠精準地量化反映作物體內(nèi)氮素狀況的概念,計算公式為:
NNI=Na/Nc
式中:Na為作物地上部植株氮的實測值/%,Nc為臨界氮質(zhì)量分數(shù)/%,是作物地上干物質(zhì)達到最大生長速率所需要的最低氮質(zhì)量分數(shù)[16]。采用已有研究的河南省原陽縣地區(qū)的冬小麥氮稀釋曲線進行計算[17]:
Nc=5.25W-0.472
式中:W為小麥地上部生物量/(kg·hm-2)。
1.2.3 小麥籽粒蛋白質(zhì)含量(GPC)的測定 將成熟期的小麥穎殼與籽粒分離,將籽粒裝入自封袋,烘干,研磨籽粒,粉碎后用H2SO4-H2O2消煮,繼而用流動分析儀AA3測定小麥籽粒中全氮含量,小麥中GPC是籽粒全氮含量與5.7的乘積[18]。
1.3.1 光譜數(shù)據(jù)處理方法 高光譜數(shù)據(jù)在采集時容易受樣本群體分布不均勻、光路散射、高頻噪聲與電路噪聲等環(huán)境和儀器的影響,需要排除其中大量的噪聲信息及干擾波段。因此本研究選用作物敏感性較高的400~1 000 nm波段為有效波段進行分析[19]。
同時,為提高光譜信息中的有效信噪比,采用一階導數(shù)變換(first derivative,F(xiàn)D)對小麥冠層光譜進行預處理,其可以通過導數(shù)計算確定光譜曲線的彎曲點,以及最大最小反射率處的波長位置等光譜特征[20]。
1.3.2 模型構(gòu)建 采用偏最小二乘法(partial least-squares method regression,PLSR)進行建模。偏最小二乘法是應用最為廣泛的一種模型估測方法,它融合了主成分回歸和多元線性回歸的主要優(yōu)勢,既不會發(fā)生過度擬合或不能充分利用光譜信息的問題,也不會受到多種信號重疊、線性回歸的干擾,且顧慮光譜信息與待測組分性質(zhì)信息的相互作用[21]。
本研究中,選取開花期葉綠素含量(SPAD)、葉片干物質(zhì)質(zhì)量(LDW)、地上生物量(AGB)、葉片氮含量(LNC)、葉片氮積累量(LNA)、葉面積指數(shù)(LAI)、植株氮含量(PNC)、植株氮積累量(PNA)、氮營養(yǎng)指數(shù)(NNI)9個農(nóng)學參數(shù)指標與經(jīng)過一階導數(shù)變換的結(jié)果進行建模,將樣本按照2∶1的比例隨機劃分為建模集與預測集,每個農(nóng)學參數(shù)的建模集與預測集的樣本個數(shù)分別為32和16。
1.3.3 檢驗方法 在每個模型構(gòu)建完成之后,利用預測集數(shù)據(jù)對所構(gòu)建的回歸估測模型的精度進行檢驗,利用決定系數(shù)(coefficient of determination,R2)、均方根誤差(root mean squared error,RMSE)、標準均方根誤差(normalized root mean squared error,nRMSE)以及相對預測偏差(ratio of performance to deviation,RPD)作為評價指標對其進行評估。其中,R2越高,RMSE越小,說明模型預測性能越好;反之,則模型預測性能越低。nRMSE≥30%為較大差異,30%>nRMSE≥20%為中等,20%>nRMSE≥10%為較小差異,nRMSE<10%為無差異。RPD≥2,表示模型結(jié)果可靠;2>RPD>1.4表示模型結(jié)果可行,但準確性與穩(wěn)定性有待提高;RPD≤1.4表明模型結(jié)果較差,數(shù)據(jù)不可靠。
對小麥開花期的各農(nóng)學參數(shù)與成熟期籽粒蛋白質(zhì)含量進行統(tǒng)計分析。由表1可知,不同農(nóng)學參數(shù)在試驗處理下的數(shù)據(jù)離散程度,即變異系數(shù)表現(xiàn)具有一定的差異性,將各參數(shù)建模集與預測集的變異系數(shù)差值絕對值作比較,從小到大排序為LNC(0.16%),GPC(0.62%),PNC(0.74%),SPAD(1.22%),LAI(2.46%),NNI(3.28%),LDW(6.53%),LNA(6.79%),PNA(7.86%),AGB(8.71%)。結(jié)合統(tǒng)計分析特征來看,建模集與預測集在LNC,GPC,PNC,SPAD,LAI,NNI等6個指標較為相近,在LDW,LNA,PNA,AGB等4個指標上因為單位量綱的原因數(shù)據(jù)集之間的波動范圍較大,但仍存在處理間差異性。這為冬小麥籽粒蛋白質(zhì)含量高光譜預測模型的實現(xiàn)奠定了數(shù)據(jù)基礎(chǔ)。
表1 小麥農(nóng)學參數(shù)與籽粒蛋白質(zhì)含量統(tǒng)計分析
續(xù)表
對開花期小麥冠層原始光譜和其一階導數(shù)光譜反射率與不同農(nóng)學參數(shù)進行相關(guān)性分析。結(jié)果如圖1所示,可以看出原始光譜農(nóng)學參數(shù)敏感區(qū)域主要集中在400~900 nm,呈先負相關(guān)后正相關(guān)關(guān)系,先增高后降低再增高的趨勢,相關(guān)性最強的參數(shù)為SPAD(相關(guān)系數(shù)r=0.770),最低為PNC(相關(guān)系數(shù)r=0.529)。而一階導數(shù)光譜農(nóng)學參數(shù)敏感區(qū)域表現(xiàn)則明顯優(yōu)于原始光譜,相關(guān)性最強的參數(shù)為SPAD(相關(guān)系數(shù)r=0.891),最低為AGB(相關(guān)系數(shù)r=0.626)(表2)。由此可以看出,一階導數(shù)的處理可以提高農(nóng)學參數(shù)與光譜數(shù)據(jù)的相關(guān)性。
表2 小麥不同農(nóng)學參數(shù)與原始光譜(OS)及一階導數(shù)預處理光譜(FD)的相關(guān)性
圖1 小麥不同農(nóng)學參數(shù)與原始光譜(A)及一階導數(shù)預處理光譜(B)的相關(guān)性
使用經(jīng)過一階導數(shù)處理后的建模集光譜數(shù)據(jù),通過PLS最小二乘法構(gòu)建冬小麥9個農(nóng)學參數(shù)的估算模型,使用預測集的光譜數(shù)據(jù)輸入進行效果檢驗。由表3可以看出,LAI、LDW、AGB3個參數(shù)構(gòu)建的模型建模集與預測集的R2相對較低,nRMSE小于30%,RPD小于1.4,說明這3種參數(shù)估測模型準確性與穩(wěn)定性差,有著中等的差異。LNA、PNA構(gòu)建的模型建模集與預測集的R2大于0.5小于0.7,nRMSE小于30%大于20%,RPD均大于1.4小于2.0,表明模型的準確性和穩(wěn)定性有待提高。SPAD、LNC、PNC、NNI構(gòu)建的模型建模集R2大于0.8,nRMSE除NNI的建模集大于10%,其余皆小于10%,RPD大于2,說明該4種農(nóng)學參數(shù)建模具有很高的精度,同時無差異,NNI有較小差異。預測集的R2低于建模集,大于0.58小于0.76。nRMSE以SPAD和LNC的預測集小于10%,PNC與NNI的預測集大于10%小于20%。RPD僅有NNI構(gòu)建的模型預測集大于2.0其余皆大于1.4小于2.0。出現(xiàn)這種情況的原因可能是由于數(shù)據(jù)量少發(fā)生了過擬合的現(xiàn)象,驗證效果受到了一定的影響,沒能達到最佳,有待進一步提高。
表3 小麥不同農(nóng)學參數(shù)的高光譜估測模型的構(gòu)建與驗證
將試驗所獲得的開花期農(nóng)學參數(shù)與成熟期籽粒蛋白質(zhì)含量進行相關(guān)性分析。由表4可以看出,8個農(nóng)學參數(shù)與成熟期GPC達到極顯著正相關(guān)關(guān)系,其從大到小分別為LNC(0.822)、LAI(0.744)、LNA(0.732)、PNC(0.712)、SPAD( 0.708)、NNI(0.693)、PNA(0.633)、LDW(0.599)。而AGB與GPC之間則不具有相關(guān)性。
表4 小麥不同農(nóng)學參數(shù)與籽粒蛋白質(zhì)含量的相關(guān)關(guān)系
開花期農(nóng)學參數(shù)與成熟期籽粒蛋白質(zhì)含量存在顯著的相關(guān)性,因此以線性回歸的方法利用開花期9個農(nóng)學參數(shù)的建模集與成熟期籽粒蛋白質(zhì)含量構(gòu)建冬小麥籽粒蛋白質(zhì)含量預測模型,其回歸方程與驗證精度如表5所示。將各參數(shù)模型建模決定系數(shù)作比較,從大到小排序為LNC(0.636),LAI(0.598),LNA(0.577),SPAD(0.53),PNC(0.493),PNA(0.448),NNI(0.430),LDW(0.411),AGB(0.057),可知除AGB以外其余皆可達到差異極顯著水平,其中最優(yōu)的為LNC。將預測集實測值帶入模型中,根據(jù)其預測值的驗證效果可以將不同估測模型分為4類,最佳的為LNC,其R2達到0.766,RMSE達到0.79,RPD達到2.11;較好的為PNC與NNI,其R2在0.5到0.6之間,RMSE在1.0到1.1之間,RPD在1.5到1.7之間;適中的為SPAD、LNA、LAI,其R2在0.46到0.47之間,RMSE在1.2到1.3之間,RPD在1.3到1.4之間;較差的為PNA、LDW,其R2在0.4以下達到差異顯著水平,RMSE大于1.3,RPD在1.2以下;AGB無差異。
表5 基于小麥不同農(nóng)學參數(shù)的籽粒蛋白質(zhì)含量預測模型
經(jīng)過一階導數(shù)-最小二乘法處理的高光譜農(nóng)學參數(shù)估測模型具有較高的估算精度,因此,利用高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量的技術(shù)路徑,以農(nóng)學參數(shù)作為中間變量構(gòu)建基于冬小麥開花期高光譜數(shù)據(jù)的籽粒蛋白質(zhì)含量預測模型。將高光譜農(nóng)學參數(shù)估測模型的預測輸出值作為輸入值帶入表5中的基于小麥不同農(nóng)學參數(shù)的籽粒蛋白質(zhì)含量預測模型,最終獲得基于高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量的預測模型結(jié)果。表6為各農(nóng)學參數(shù)模型中建模集與預測集的驗證結(jié)果,預測值與實測值的1∶1比較關(guān)系見圖2。結(jié)果顯示,農(nóng)學參數(shù)SPAD、LNC、NNI作為中間參數(shù)的預測模型可以達到較高的精度,R2達到差異極顯著水平,分別為0.417、0.554和0.410,而RMSE則以SPAD、LNC、LAI、NNI4個參數(shù)構(gòu)建的預測模型表現(xiàn)較低。總體上,以SPAD、LNC和NNI為中間參數(shù)的預測模型可以給出很好的檢驗效果,因此,可以利用開花期光譜數(shù)據(jù)對不同品質(zhì)類型的小麥籽粒進行品質(zhì)預測,其中,以LNC作為中間參數(shù)的模型預測效果最好。
圖2 基于不同農(nóng)學參數(shù)的高光譜預測籽粒蛋白質(zhì)含量的預測值和實測值比較(1∶1)
表6 基于小麥不同農(nóng)學參數(shù)的高光譜籽粒蛋白質(zhì)含量預測模型的構(gòu)建與驗證
基于“高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量”的籽粒蛋白質(zhì)含量預測模型在實現(xiàn)高光譜對當前作物生長狀況反演的基礎(chǔ)上,涉及農(nóng)學參數(shù)與成熟期籽粒蛋白質(zhì)含量的關(guān)系,可以準確預測籽粒品質(zhì),為農(nóng)業(yè)管理指導生產(chǎn)提供必要的信息。在此方法中,農(nóng)學參數(shù)作為中間參數(shù)起到至關(guān)重要的作用,其必須能夠?qū)ψ蚜5鞍踪|(zhì)含量有著較高的相關(guān)性從而準確預測出其值大小,還需具備可以被作物冠層光譜有效反演的特征。陳鵬飛等[22]利用主成分回歸分析的方法建模,得出在AGB、PNC和NNI3個參數(shù)中挑旗期的NNI能夠有效利用冠層高光譜參數(shù)預測,進而估測小麥GPC。屈莎等[23]利用支持向量機的建模方法,選用PNA、PNC、LNA和LNC4個參數(shù)與植被指數(shù)構(gòu)建GPC預測模型,最終得出PNC為最優(yōu)參數(shù)。可以看出不同建模方法以及植被指數(shù)選擇對不同中間參數(shù)的建模效果影響是不同的。本研究表明,一階導數(shù)可以顯著提高農(nóng)學參數(shù)與光譜曲線的相關(guān)性,以SPAD、LNC、PNC、NNI構(gòu)建的高光譜農(nóng)學參數(shù)反演模型效果較優(yōu),其中SPAD建模集以及預測集R2與nRMSE最佳,分別為0.993、0.759與0.54%、4.10%,NNI預測集RPD最佳,為2.04。以上4種農(nóng)學參數(shù)同樣是與高光譜曲線相關(guān)性最高的4種參數(shù),說明小麥冠層高光譜可以有效反演當前葉片及植株氮素指標與生長狀況,這一結(jié)論與前人[24-26]研究結(jié)果一致。
開花期之后小麥從營養(yǎng)生長轉(zhuǎn)化為生殖生長,植株營養(yǎng),尤其是氮素營養(yǎng),主要向籽粒轉(zhuǎn)運,所以可反映開花期葉片及植株氮素營養(yǎng)狀況及能力相關(guān)的指標,諸如LNC、PNC和NNI與成熟期籽粒蛋白質(zhì)含量擬合程度較高,SPAD、LNA、LAI和PNA等4個農(nóng)學參數(shù)可以預測GPC且具有一定建模精度,但驗證效果有待提高,而地上部生物量及葉片干物質(zhì)質(zhì)量僅能反應植株生長狀態(tài)而不具備可顯著反應氮素營養(yǎng)的特征,故其與籽粒蛋白質(zhì)含量擬合程度較低。這與陳鵬飛等[22]、屈莎等[23]、宋曉宇等[27]的研究結(jié)果相同。
構(gòu)建“高光譜-農(nóng)學參數(shù)-籽粒蛋白質(zhì)含量”的籽粒蛋白質(zhì)含量預測模型,比較9個農(nóng)學參數(shù)作為中間參數(shù)構(gòu)建的模型預測效果,LNC的建模集與預測集的決定系數(shù)R2為0.64和0.55,RMSE為1.05和1.12,RPD為1.68和1.49。所以可以判斷LNC是高光譜籽粒蛋白質(zhì)含量預測模型中的最佳選擇。另外,本研究主要在一階導數(shù)與偏最小二乘法的方法基礎(chǔ)上利用開花期高光譜數(shù)據(jù)與農(nóng)學參數(shù)進行籽粒蛋白質(zhì)含量預測,對于對比不同生育時期下的籽粒蛋白質(zhì)含量預測模型效果能否進一步提前預測,以及結(jié)合不同農(nóng)學參數(shù)相關(guān)的植被指數(shù),進而提高籽粒蛋白質(zhì)含量預測精度,仍需要在下一步研究中進行探討。同時,在小麥籽粒蛋白質(zhì)含量預測模型構(gòu)建中,缺乏考慮溫度等生態(tài)環(huán)境等因子的影響,需要在以后的研究中加入作物模型來進行綜合研究。