卓 偉,于旭峰,李欣庭,龔冬冬,馮 潔
(云南師范大學 物理與電子信息學院,云南 昆明 650500)
葉綠素是植物進行光合作用的主要色素,它位于植物細胞的類囊體薄膜上,在光合作用的光吸收過程中起核心作用。因此,葉綠素含量及其變化情況能夠很好地反映植物的光合作用能力、生長健康狀況等[1-2],在監(jiān)測農(nóng)作物長勢、病蟲害、農(nóng)作物產(chǎn)量、預(yù)測農(nóng)作物成熟期等方面有著重要意義[3]。目前,測量葉綠素含量的方法主要是分光光度法。雖然該方法能準確測定葉綠素含量,但耗費人力,測定時間長,且對植物葉片有破壞性。
隨著高光譜技術(shù)的發(fā)展,國內(nèi)外學者開始探討研究植物葉片葉綠素與其高光譜信息之間的關(guān)系并取得較好的成果,已驗證了利用高光譜技術(shù)無損測定葉片葉綠素的可能性。Madeira等[4]確定了綠豆葉片的光譜反射率和葉綠素含量相對值(SPAD值)之間的相關(guān)關(guān)系。Filella等[5]研究發(fā)現(xiàn)紅邊位置和紅邊面積可以指示植物葉綠素含量、生物量和水分狀態(tài)。牛魯燕等[6]以葡萄葉片的高光譜反射率和SPAD值為數(shù)據(jù)源,篩選葉綠素敏感波段,建立了基于高光譜反射率的葡萄葉片葉綠素含量估測模型。鄒小波等[7]選取8個具有代表性的植被指數(shù),建立特征波長λ下相應(yīng)的光譜反射值R與黃瓜葉片葉綠素含量之間的關(guān)系模型;確定了最優(yōu)植被指數(shù)所包含的695~705 nm和750~800 nm這2個波段。宋開山等[8]實測了不同水肥耦合作用下大豆冠層的高光譜反射率與葉綠素含量數(shù)據(jù),采用特定葉綠素敏感波段建立了植被指數(shù)葉綠素估算模型。
綜上所述,國內(nèi)外學者利用高光譜技術(shù)反演葉綠素的研究主要集中于大豆、小麥、水稻、玉米等大田作物及葡萄、蘋果等木本植物[9-12],對作為世界第四大糧食作物的馬鈴薯研究較少,且大多數(shù)研究的是植物葉綠素含量相對值SPAD,對其真實值快速檢測的研究尚少。鑒于此,本文利用實驗測得的80組健康馬鈴薯葉片高光譜數(shù)據(jù)與葉綠素真實值作為樣本,結(jié)合光譜導數(shù)與植被指數(shù),建立預(yù)測馬鈴薯葉片葉綠素含量的傳統(tǒng)模型與反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模型。研究發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度高于傳統(tǒng)模型,可用作快速無損檢測馬鈴薯葉片葉綠素含量,為馬鈴薯的種植、管理和生產(chǎn)提供科學依據(jù)。
實驗所用馬鈴薯葉片均摘自云南師范大學生命科學學院的馬鈴薯實驗基地,采摘時間為2019年10月8日至27日,總計80個樣本葉片;采摘的葉片要求生長狀況良好,健康,無病害侵染。為保證實驗結(jié)果準確性,80個樣本葉片隨機摘自實驗基地不同馬鈴薯植株。選取總樣本數(shù)的75%作為實驗校正集,即選取60個樣本作為校正集,其余20個樣本作為預(yù)測集。
葉片光譜反射率的測定采用四川雙利合譜公司生產(chǎn)的Gaia-Sorter型高光譜分選儀,其中搭載GaiaField-F-V10E型高光譜相機,響應(yīng)波長為400~1 000 nm,光譜分辨率為2.8 nm。
分選儀開機預(yù)熱15 min后采集葉片光譜反射率。為消除噪聲影響,需對原始光譜反射率進行校正:在相同條件下采集標準白板光譜反射率,得到白幀W;采集無光環(huán)境下光譜反射率,得到黑幀D;設(shè)葉片原始光譜反射率為R,則校正后反射率R′為
圖1為校正后80個樣本的光譜反射率曲線,其中出現(xiàn)在520~580 nm處的反射峰與葉片葉綠素有關(guān),750~1 000 nm處的反射率差異與葉片組織細胞結(jié)構(gòu)、含水量有關(guān)。
圖1 80 個樣本的光譜反射率Fig. 1 Spectral reflectance of 80 samples
實驗采用分光光度法對馬鈴薯葉片葉綠素含量進行測定。用電子天平稱得每片葉片質(zhì)量m(單位:g),將其剪碎置于研缽中,加入少量石英砂和碳酸鈣粉末及體積分數(shù)為95%的乙醇溶液,研磨至組織變白,再加入適量乙醇溶液,研成勻漿,于室溫下暗處靜置10 min[13];用一層干濾紙將勻漿過濾至25 mL的容量瓶中,待濾紙和殘渣全部變白后用乙醇溶液定容至25 mL,得到葉綠素提取液。最后用分光光度計測得提取液在波長652 nm處的吸光度A652,利用
得到提取液中葉綠素總質(zhì)量濃度(單位: mg/L),其中34.5是葉綠素在652 nm波長下的吸光系數(shù)。再利用
得出葉綠素質(zhì)量分數(shù)(單位:mg/g),其中V為提取液體積(本實驗中V=25 mL)。所有樣本葉片葉綠素含量統(tǒng)計結(jié)果如圖2所示,校正集與預(yù)測集葉綠素含量最小值分別為0.912 1 mg/g和0.949 5 mg/g,最大值分別為1.382 7 mg/g和1.426 6 mg/g,平均值為1.113 6 mg/g和1.151 0 mg/g,標準偏差(SD)為0.122 0和0.122 9。校正集與預(yù)測集數(shù)據(jù)差別較小,有利于葉綠素預(yù)測模型建立。
圖2 樣本葉片葉綠素含量統(tǒng)計Fig. 2 Chlorophyll content statistics of sample leaves
光譜導數(shù)可以增強光譜曲線在坡度上的細微變化,對植物來說,這種變化與植物的生物化學吸收特性有關(guān)[14]。因此,采用光譜導數(shù)的方法選取高光譜特征參數(shù),并應(yīng)用于葉綠素含量的反演是可行的。
對樣本光譜反射率進行一階導數(shù)運算,得到圖3(a)所示光譜反射率一階導數(shù)曲線。用每個波段的光譜反射率一階導數(shù)值與葉綠素含量進行Pearson相關(guān)性分析,得到葉綠素含量與其光譜一階導數(shù)的相關(guān)性分析曲線。由圖4(a)可知473~552 nm、567~665 nm、683~710 nm波段中光譜反射率一階導數(shù)值與葉綠素含量相關(guān)性達到了0.01極顯著相關(guān)水平;在498 nm處光譜反射率一階導數(shù)與葉綠素含量相關(guān)性最大,相關(guān)系數(shù)為-0.697。同理,對樣本光譜反射率進行二階導數(shù)運算與相關(guān)性分析,得出在496 nm處光譜反射率二階導數(shù)與葉綠素含量相關(guān)性最大,相關(guān)系數(shù)為-0.657,如圖 3(b)、圖 4(b)所示。因此分別選擇498 nm處光譜反射率一階導數(shù)值與496 nm處光譜反射率二階導數(shù)值作為自變量,用于建立基于光譜導數(shù)的馬鈴薯葉片葉綠素含量預(yù)測模型。
圖3 樣本葉片光譜導數(shù)圖Fig. 3 Spectral derivative graph of sample leaf
圖4 光譜導數(shù)與葉綠素含量相關(guān)性曲線Fig. 4 Correlation curve between spectral derivative and chlorophyll content
植被指數(shù)是根據(jù)植被的光譜特性,將高光譜可見光與近紅外波段進行組合而形成的各種無量綱參數(shù)[15],已經(jīng)成為定性、定量評估植被的常用方法之一;它對植被的生物、物理參數(shù),如葉面積指數(shù)(LAI)、葉綠素含量、氮含量等生物量的靈敏度遠高于單波段反射率,而且其計算簡單有效[16]。
選取與葉綠素相關(guān)的歸一化植被指數(shù)(NDVI)、比值植被指數(shù)(RVI)、改進型葉綠素吸收植被指數(shù)(TCARI)等10種植被指數(shù)與馬鈴薯葉片葉綠素含量進行相關(guān)性分析。如表1所示,GNDVI、TCARI、MCARI、MTCI與葉綠素含量均達到極顯著相關(guān)水平,MTCI與葉綠素含量呈最大正相關(guān),相關(guān)系數(shù)為0.431 5;MCARI與葉綠素含量呈最大負相關(guān),相關(guān)系數(shù)為-0.483 3。實驗選擇相關(guān)性達到極顯著相關(guān)水平的GNDVI、MCARI、MTCI作為自變量特征參數(shù),建立基于植被指數(shù)的葉綠素預(yù)測模型。
基于光譜導數(shù)建立的葉綠素含量反演模型如表2所示,根據(jù)校正集決定系數(shù)Rc高、預(yù)測集決定系數(shù)Rv高、均方根誤差RMSE小的原則選擇最優(yōu)馬鈴薯葉片葉綠素含量反演模型。經(jīng)對比可以看出,基于光譜一階導數(shù)特征參數(shù)建立的模型,其建模和預(yù)測效果均優(yōu)于基于光譜二階導數(shù)建立的預(yù)測模型。
在光譜一階導數(shù)模型中,對數(shù)模型的決定系數(shù)Rc最大,為0.703 6,建模效果優(yōu)于其他模型;冪函數(shù)模型校正集決定系數(shù)Rc為0.703 6,建模效果僅次于對數(shù)模型。以光譜二階導數(shù)建立的模型中,對數(shù)模型的建模效果最好,校正集決定系數(shù)Rc為0.660 1,其次是多項式模型,Rc為 0.659 8。
將預(yù)測集樣本特征參數(shù)輸入已建立的模型中,得到的預(yù)測結(jié)果如表2所示。對于光譜一階導數(shù),冪函數(shù)模型預(yù)測效果較好,預(yù)測集決定系數(shù)Rv達到0.685 8,均方根誤差RMSE為0.079 4;冪函數(shù)模型對馬鈴薯葉片葉綠素含量預(yù)測值與實測值關(guān)系如圖5(a)所示。以光譜二階導數(shù)建立的預(yù)測模型中,預(yù)測效果最好的為冪函數(shù)模型,預(yù)測集決定系數(shù)達到0.582 9,均方根誤差為0.0896,但其建模效果一般,不能作為最佳模型。綜合考慮,選擇決定系數(shù)Rc和Rv較高、均方根誤差RMSE較小的對數(shù)模型作為基于光譜二階導數(shù)的最佳預(yù)測模型,其葉綠素預(yù)測值與實測值關(guān)系如圖5(b)所示,預(yù)測集決定系數(shù)Rv為0.572 3。
對GNDVI、MCARI、MTCI建立傳統(tǒng)預(yù)測模型。對于GNDVI,對數(shù)與多項式模型建模效果較好,Rc分別為 0.423 4和 0.425 3;對于MCARI,建模效果較好的為對數(shù)與多項式模型,Rc為0.485 1和0.486 2;MTCI模型中,冪函數(shù)和多項式模型結(jié)果較好,其中冪函數(shù)模型Rc最大為0.440 3。
將預(yù)測集樣本數(shù)據(jù)輸入反演模型中并檢驗各模型的預(yù)測性能,結(jié)果如表3所示。對于GNDVI,選擇Rc和Rv較高,RMSE較小的冪函數(shù)模型作為最佳模型。MCARI的模型中,多項式模型的預(yù)測集決定系數(shù)Rv為0.624 8,RMSE為0.0898,同時校正集Rv高于其他模型,可作為最佳預(yù)測模型。MTCI的模型中,對數(shù)模型為最佳模型。
表3 基于植被指數(shù)的葉綠素含量反演模型Tab. 3 Chlorophyll content inversion model based on vegetation index
基于植被指數(shù)(GNDVI、MCARI、MTCI)建立的最優(yōu)模型葉綠素含量預(yù)測值與實測值比較如圖6所示,預(yù)測集決定系數(shù)分別為0.532 9,0.624 8,0.681 6。植被指數(shù)中基于MTCI建立的預(yù)測模型相對較好。
圖6 植被指數(shù)最佳反演模型的葉綠素含量預(yù)測值與實測值關(guān)系圖Fig. 6 Predicted chlorophyll content and measured value in the best inversion model of vegetation index
BP神經(jīng)網(wǎng)絡(luò)是一種反向傳遞并修正誤差的多層映射神經(jīng)網(wǎng)絡(luò),由三個部分組成,即輸入層、隱含層、輸出層,每一層都有多個處理單元,又稱為神經(jīng)元或節(jié)點,每個節(jié)點有多個輸出通道,將輸出信息送至下一層的每個節(jié)點[17]。每層網(wǎng)絡(luò)都具有非線性傳播函數(shù)。BP神經(jīng)網(wǎng)絡(luò)的工作分為兩步:信息的正向傳遞和誤差的反向傳播。在正向傳播過程中,輸入信息從輸入層經(jīng)隱含層逐層計算傳向輸出層;如果在輸出層沒有得到期望的輸出,則計算輸出層的誤差變化值,然后轉(zhuǎn)向反向傳播,通過網(wǎng)絡(luò)將誤差信號沿原來的傳播路線反傳回來修改各層節(jié)點的權(quán)值,直至達到期望目標[18]。因此,BP神經(jīng)網(wǎng)絡(luò)具有很強的非線性運算能力和極好的預(yù)測精度,是當下應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。
但是,BP神經(jīng)網(wǎng)絡(luò)也存在一些缺陷,其中對預(yù)測結(jié)果影響最大的是它容易陷入局部最小值,出現(xiàn)過擬合現(xiàn)象。本文利用貝葉斯正則化方法對BP神經(jīng)網(wǎng)絡(luò)進行改進,具體原理如下。
設(shè)BP神經(jīng)網(wǎng)絡(luò)的誤差函數(shù)為
式中:s2為輸出層節(jié)點個數(shù);ak為輸出層第k個節(jié)點的輸出;tk對應(yīng)第k個節(jié)點的期望輸出。在誤差函數(shù)中添加一個參數(shù)懲罰項,使誤差函數(shù)修正為
式中:α為正則化系數(shù);Ω(θ)為貝葉斯函數(shù),其作用是將權(quán)值參數(shù)設(shè)置為隨機變量,根據(jù)權(quán)值的概率密度確定最優(yōu)的權(quán)值函數(shù)[19],使得BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果誤差更小。
貝葉斯正則化BP神經(jīng)網(wǎng)絡(luò)(BR-BP神經(jīng)網(wǎng)絡(luò))的編程及模型的建立均在MATLAB R2015b中完成。選擇與馬鈴薯葉片葉綠素含量相關(guān)性較高的高光譜特征參數(shù),即498 nm光譜一階導數(shù)值,MCARI、MTCI作為網(wǎng)絡(luò)輸入層,葉片葉綠素含量作為輸出層,應(yīng)用多次試錯法,確定隱含層節(jié)點個數(shù)為8;將校正集樣本數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)中并對其進行訓練,得出校正集決定系數(shù)Rc為0.846 4,該模型具有優(yōu)異的建模效果;將預(yù)測集樣本數(shù)據(jù)輸入訓練好的網(wǎng)絡(luò)中進行葉綠素含量預(yù)測,其決定系數(shù)Rv為0.680 4,均方根誤差RMSE為0.074 6,對馬鈴薯葉片葉綠素含量有優(yōu)異的預(yù)測效果。
本研究在BP神經(jīng)網(wǎng)絡(luò)中加入貝葉斯正則化防止其過擬合,提升神經(jīng)網(wǎng)絡(luò)的預(yù)測精度。對比傳統(tǒng)預(yù)測模型的各項指標,BR-BP神經(jīng)網(wǎng)絡(luò)模型具有優(yōu)異的建模和預(yù)測效果。但由于實驗條件限制,樣本數(shù)量相對較少,導致預(yù)測精度較傳統(tǒng)預(yù)測模型并無很大提升。因此在后續(xù)研究中,需增加實驗樣本數(shù)量,提高神經(jīng)網(wǎng)絡(luò)訓練精度,建立更加準確的馬鈴薯葉片葉綠素含量反演模型。
研究表明,依托高光譜技術(shù),應(yīng)用不同預(yù)測方法無損、快速、精確檢測馬鈴薯葉片葉綠素含量是可行的,同時對其他農(nóng)作物與各種綠色植物的葉綠素含量檢測具有借鑒意義。研究結(jié)果也為馬鈴薯的科學生產(chǎn)以及其他作物的種植、生產(chǎn)提供科學依據(jù)。