胡耀華, 李清宇, 唐 翊
(1. 西北農(nóng)林科技大學(xué) 機(jī)械與電子工程學(xué)院, 陜西 楊凌 712100; 2. 西北農(nóng)林科技大學(xué) 農(nóng)業(yè)部物聯(lián)網(wǎng)重點(diǎn)綜合實驗室, 陜西 楊凌 712100)
在生產(chǎn)實踐中,馬鈴薯晚疫病嚴(yán)重制約了我國馬鈴薯的產(chǎn)量和質(zhì)量,是危害最為嚴(yán)重的幾種病害之一.葉片染病后,先是形成不規(guī)則的黃褐色斑點(diǎn);氣候潮濕時,迅速擴(kuò)展至主蔓或葉柄,導(dǎo)致葉片萎蔫蜷縮,全株焦黑呈尸腐狀;由于其流行度大,防治難,經(jīng)常造成無法預(yù)估的重大損失[1].因此,能夠及時、準(zhǔn)確地檢測出馬鈴薯晚疫病是該病害防治中的重要內(nèi)容.
過氧化物酶(peroxidase, POD)在植株體內(nèi)普遍存在,與植株的各種重要生理活動都有著密切關(guān)系.因此,POD的酶活性可反映出植物的生長狀況是否良好[2-3].遭受病原菌侵害或逆境的植株會打破內(nèi)部原有平衡,所產(chǎn)生的大量活性氧會對植物的生理結(jié)構(gòu)造成破壞.POD能把有毒的過氧化氫(H2O2) 轉(zhuǎn)化為無害的H2O, 其活性值也會相應(yīng)發(fā)生一系列改變,因此被廣泛用于評價植物的抗逆性.目前實驗室檢測作物中POD活性的方法主要是化學(xué)比色法,但是化學(xué)比色法的預(yù)處理工作復(fù)雜繁瑣、且要對樣本進(jìn)行破壞性處理,過程耗時費(fèi)力,不能實現(xiàn)連續(xù)性監(jiān)測.因此,研究一種能夠快速無損測定作物中POD活性的方法十分必要.
高光譜成像技術(shù)已經(jīng)在植物葉片中抗氧化酶系統(tǒng)的活性預(yù)測方面有所涉及[2-4].朱文靜等[2]在建立番茄葉片中過氧化物酶(POD)活性的預(yù)測模型時,運(yùn)用了高光譜技術(shù)與化學(xué)計量學(xué)結(jié)合的方法,實現(xiàn)的準(zhǔn)確率高達(dá)93%以上;楊燕等[3]的研究表明,高光譜圖像能夠反演出水稻稻瘟病潛育期的抗氧化酶(SOD)活性,并可以由此推斷出病害脅迫程度信息是可行的;謝傳奇等[4]對茄子灰霉病葉片進(jìn)行高光譜測定,結(jié)果表明基于PLSR模型推薦的隱含變量建立的BP神經(jīng)網(wǎng)絡(luò)模型對灰霉病脅迫下用過氧化氫酶(CAT)活性定量檢測的準(zhǔn)確率最高.但在馬鈴薯晚疫病研究中,還沒有關(guān)于葉片中POD活性的研究成果.
筆者對感染馬鈴薯晚疫病的葉片在不同病害程度下的高光譜信息和POD活性值進(jìn)行檢測,利用高光譜信息和化學(xué)計量學(xué)相結(jié)合的方法,建立馬鈴薯晚疫病葉片中POD活性的預(yù)測模型,并通過POD值來判斷葉片是否染病及染病程度,為晚疫病的早期防治簡易檢測裝置的研發(fā)提供參考.
1.1.1 高光譜成像采集系統(tǒng)
試驗采用了北京卓立漢光儀器有限公司研制的Zolix Hypersis農(nóng)產(chǎn)品高光譜成像系統(tǒng)(裝置示意圖見圖1).
由圖1可見,該成像系統(tǒng)由 V10E-QE型可見/近紅外波段光譜成像儀、光源、XEVA2616型面陣CCD相機(jī)、PSA300-X型電控平移臺裝置以及計算機(jī)等部件組成.所使用的光譜儀的波長范圍為375~1 018 nm,光譜分辨率是2.8 nm;試驗的采樣間隔是0.65 nm,圖像分辨率336 nm×256 nm.為了減小環(huán)境光線對測量的影響,將整個系統(tǒng)放置在暗箱內(nèi).該儀器的工作過程可簡述如下:光源發(fā)射出光,照射在放置于電控平移臺上的待測樣本上,所形成的圖像被相機(jī)捕捉到,成為樣本高光譜圖像.電控平移臺帶動樣本連續(xù)運(yùn)行以獲取樣本連續(xù)的圖譜信息,這些信息被傳送并存儲到計算機(jī)中,以便進(jìn)行后續(xù)分析.
采集數(shù)據(jù)前,設(shè)定如下參數(shù):曝光時間為50 ms;電動平臺移動速度為20 mm·s-1;樣本到相機(jī)鏡頭的距離為65 cm.首先要讓系統(tǒng)進(jìn)行30 min的預(yù)熱,再開始采集高光譜圖像;同時,利用黑白校正來消除光照條件的變化對成像的影響,以及基線漂所導(dǎo)致的誤差.具體操作方法如下:用標(biāo)準(zhǔn)反射板(聚四氟乙烯材料)采集的全白圖像標(biāo)定為W;蓋上鏡頭蓋采集的全黑圖像標(biāo)定為B;通過樣本采集到的原始圖像標(biāo)定為I;則校正后圖像R[5-6]的計算式為
(1)
1.1.2 POD酶活性測定設(shè)備
通過對比,最終決定使用紫外分光光度計法對POD的酶活性進(jìn)行測量[7].測定所需設(shè)備如下:超低溫冰箱(海爾BCD-226SDCZ,中國),冷凍溫度-40~-20 ℃;冷凍離心機(jī)(安亭TGL-16G-A,中國),最大轉(zhuǎn)速16 000 r·min-1,工作溫度-5~30 ℃;紫外分光光度計(UV1102,中國),來測試190 nm到1 100 nm之間的波長.POD活性由紫外分光光度計在離心后加入試劑測得,具體測定方法見參考文獻(xiàn)[7].
試驗選用中薯18號葉片,屬晚疫病中感品種,廣泛種植于西北地區(qū).使用盆栽的方式進(jìn)行培養(yǎng).培養(yǎng)10盆,平均每盆栽種3株,共種植30株.2017年6月,盆栽種植在西北農(nóng)林科技大學(xué)科研用玻璃溫室中,經(jīng)過日常管理,3個月后開始試驗,選取質(zhì)量為0.2~0.4 g、且大小基本一致的100片葉片進(jìn)行離體接菌.試驗所使用的馬鈴薯晚疫病孢子懸浮液由西北農(nóng)林科技大學(xué)植物保護(hù)學(xué)院提供.試驗接種于葉片背面二級葉脈之間,劑量為100 μL·片-1,覆蓋面積約為20 mm2.在接種菌完成之后,將樣本放入人工氣候箱中,在溫度為18 ℃,相對濕度為100%,每天16 h光照和8 h黑暗培養(yǎng)的條件下,進(jìn)行為期6 d的連續(xù)培養(yǎng).
將100片葉片分為5組,每組20片;采集完高光譜信息后,再測定POD酶活性.首先對第1組的20片馬鈴薯葉片進(jìn)行了第1次樣本采集;24 h后擦去剩余4組接種晚疫病菌樣本的殘留液滴,以防止交叉感染;同時對第2組的20片葉片進(jìn)行第2次數(shù)據(jù)采集.之后的數(shù)據(jù)每隔24 h采集一次,共采集樣本數(shù)據(jù)100組.
1.3.1 光譜數(shù)據(jù)預(yù)處理
將獲得的高光譜圖像用軟件ENVI4.8進(jìn)行處理.選擇病斑部位作為感興趣區(qū)域(region of inte-rest, ROI),對未發(fā)病葉片也選取其相應(yīng)的位置作為感興趣區(qū)域.計算出所有感興趣區(qū)域在全光譜下像素點(diǎn)的光譜反射率平均值,留待后續(xù)的處理,即將原始高光譜數(shù)據(jù)轉(zhuǎn)化成為感興趣部分的全光譜信息.
為了提高信噪比,以保證所建模型的有效和穩(wěn)健性,應(yīng)對提取出來的平均光譜曲線進(jìn)行預(yù)處理.文中所采取的預(yù)處理方法有平滑(savitzky-golay smoo-thing, SG)、變量標(biāo)準(zhǔn)化(standard normal variate, SNV)、多元散射校正(multiplicative scatter correction, MSC)、二階求導(dǎo)(2nd derivative, 2-Der).用于建模分析的光譜數(shù)據(jù)都是經(jīng)過以上預(yù)處理獲得的.
1.3.2 化學(xué)計量學(xué)建模方法
偏最小二乘回歸法(partial least square, PLS)是一種建立線性回歸模型的方法,可以反映出潛在變量.該方法常用來間接反映、解釋變量,或者反映不同變量在一定條件下的關(guān)系.因此,此方法適用于處理多重共線性嚴(yán)重的數(shù)據(jù),特別是變量多、樣本量少的情況[8].但它無法將非線性特征納入到預(yù)測模型中,為了提高模型精度,試驗進(jìn)一步采用最小二乘支持向量機(jī)(least squares-support vector machine,LS-SVM)法來建立模型.LS-SVM模型以線性方程代替二次規(guī)劃問題解決線性和非線性多元回歸問題,能夠大幅度地簡化運(yùn)算,加快求解速度[9].
在光譜分析中,最基本、最常應(yīng)用的處理方法就是多元線性回歸(multiple linear regression, MLR)[10].這種方法用多個波長的光譜數(shù)據(jù)作為說明函數(shù),將光譜中包含的有用信息集成起來,建立用來描述相關(guān)目的品質(zhì)和光譜數(shù)據(jù)之間關(guān)系的模型.
校正集相關(guān)系數(shù)RC及其均方根誤差RMSEC、預(yù)測集相關(guān)系數(shù)RP及其均方根誤差RMSEP常用于評價模型的好壞,其中,RMSEP值小而RP值大的模型預(yù)測效果較好[11].
1.3.3 特征波長的優(yōu)選
在使用全光譜進(jìn)行建模時,有些波段數(shù)據(jù)之間存在的相關(guān)性小,所包含有效信息較少,除了會增大計算量,也嚴(yán)重影響到預(yù)測模型,造成模型精度低和穩(wěn)定性差的后果.因此,采用連續(xù)投影算法(successive projection algorithm, SPA)提取出對被測成分的影響較大的幾個或者十幾個特征波長,可在信息最少化前提下保證模型準(zhǔn)確度,提高建模效率.
用PLS進(jìn)行建模分析時,可通過每個隱含變量下各個波長點(diǎn)獲得所對應(yīng)的載荷系數(shù).載荷系數(shù)絕對值的大小能夠反映出該波長對應(yīng)下所建模型預(yù)測性能的好壞.因此,選取特征波長時,可以依據(jù)某一隱含變量下各個波長所對應(yīng)的載荷系數(shù)絕對值大小(即載荷系數(shù)法x-loading weight, X-LW)來判斷[12].利用提取的特征波長建立POD酶活性的預(yù)測模型,這樣能夠大幅度減少運(yùn)算量,實現(xiàn)簡化模型的目的.
將100個樣本數(shù)據(jù)按照3 ∶1的比例劃分為建模集75個,預(yù)測集25個(每天20個樣本中取15個數(shù)據(jù)作為建模集,其余5個作為預(yù)測集,共5 d的數(shù)據(jù)).POD活性的統(tǒng)計信息見表1,其中A為POD的酶活性值.圖2為不同感染時間下POD酶活性的平均變化趨勢,其中t為累計染病時間.
表1 POD酶活性值的統(tǒng)計信息
圖2 不同感染時間下POD酶活性的平均變化趨勢
由圖2可見,馬鈴薯葉片在初期感染晚疫病的12 h內(nèi)酶活性上升緩慢,這意味著該馬鈴薯品種植株的抗病性不強(qiáng).染病24~48 h,酶活性上升迅速,并達(dá)到最大,此時葉片處于被晚疫病強(qiáng)烈侵害的應(yīng)激狀態(tài),POD活性增強(qiáng);之后,由于葉片組織細(xì)胞壁不斷遭到破壞,酶活性隨之降低.
圖3顯示了在染病的不同階段中,馬鈴薯病葉的高光譜反射率曲線隨時間的變化情況.圖3中,λ為波長,Rr為光譜反射率.由于提取到的光譜數(shù)據(jù)在<400 nm和>1 000 nm的波長存在嚴(yán)重的噪聲干擾, 因此僅采用400~1 000 nm的波長范圍進(jìn)行了分析.
圖3 不同患病時間的平均光譜曲線
由圖3可知,發(fā)病葉片的光譜反射率都會隨著染病時間的增加而呈現(xiàn)出減小的趨勢,即健康葉片往往呈現(xiàn)出最高的光譜反射率,染病程度較輕的葉片較弱,染病程度最高的葉片光譜反射率最低.具體表現(xiàn)在:馬鈴薯葉片從健康狀態(tài)發(fā)展到感染病害且病情不斷加深時,葉片中葉綠素含量逐漸減少,對藍(lán)光(λ=490~500 nm)、綠光(λ=500~560 nm) 的吸收增強(qiáng),而反射減弱.在近紅外區(qū)域(λ>780 nm),晚疫病破壞馬鈴薯葉片組織細(xì)胞,光合作用無法合成產(chǎn)物,原有物質(zhì)不斷分解,使得葉片在病害嚴(yán)重時的光譜反射率進(jìn)一步下降.這表明馬鈴薯晚疫病葉片在不同病害程度時的光譜反射曲線變化有著一定的規(guī)律性,并且遵循病葉的生理變化規(guī)律.
表2給出了不同預(yù)處理方法對PLS模型的預(yù)測結(jié)果.
表2 不同預(yù)處理方法對PLS模型的預(yù)測結(jié)果
由表2可見:經(jīng)過高斯濾波預(yù)處理后,建模集的效果最好;SG平滑與中值濾波預(yù)處理后,對預(yù)測集的效果相當(dāng);經(jīng)過中值濾波預(yù)處理后,建模集和預(yù)測集的均方根誤差相差最小,模型穩(wěn)定度最高,預(yù)測效果最好.綜上所述,選擇中值濾波作為最優(yōu)預(yù)處理方法,文中所有光譜數(shù)據(jù)都使用該方法進(jìn)行預(yù)處理.
同時,經(jīng)過中值濾波法預(yù)處理后的光譜數(shù)據(jù)作為輸入值,POD的活性作為輸出值,建立基于全光譜的LS-SVM模型.該模型的預(yù)測結(jié)果見表3.
表3 模型預(yù)測結(jié)果的對比
由表3可見,與使用PLS法所建立的模型相比,使用LS-SVM法建立的模型建模集RC值較小,而其預(yù)測集RP值大、RMSEP值較小,所以使用LS-SVM法建立的模型預(yù)測能力強(qiáng).綜上,在全光譜范圍之內(nèi),使用LS-SVM法建的模型更適用對POD活性的預(yù)測.由表3可知,LS-SVM的RC值和RP值都在0.9以上,說明擬合效果較好.
2.4.1 基于SPA算法提取特征波長的預(yù)測模型
試驗中設(shè)定最小和最大選定波段數(shù)分別為1和30,計算過程通過Matlab軟件實現(xiàn).計算結(jié)果見圖4,5,其中N為特征波長的個數(shù),X為x載荷系數(shù).最佳特征波長個數(shù)的確定以建模集的RMSE趨于穩(wěn)定且達(dá)到最小時所對應(yīng)的波長數(shù)為依據(jù).
圖4 RMSEP值隨有效波長數(shù)目的變化趨勢
圖5 前3個LV的x載荷系數(shù)
圖4展示了均方根誤差隨特征波長增加的變化趨勢,由圖4可確定出特征波長數(shù)目為8個.圖5顯示了特征波長所在的波段序號,其編號分別為1,6,20,39,93,101,128,199,所對應(yīng)的波長分別為450,462,496,543,677,697,766,949 nm.
把以上8個特征波長對應(yīng)的光譜數(shù)據(jù)作為輸入,分別建立基于PLS,MLR法的線性模型和基于LS-SVM法的非線性模型,結(jié)果見表4.
表4 不同預(yù)測方法的SPA模型的結(jié)果
由表4可見,使用SPA算法提取特征波長后,基于非線性LS-SVM模型預(yù)測效果較基于線性PLS,MLR模型的好.在2種線性模型中,顯然SPA-MLR的模型預(yù)測效果更好,預(yù)測的表達(dá)式如下:
A=67.322-3 191X1-3 083X2+
3 841X3-535.571X4-7 451X5+
3 238X6+35.224X7-137.391X8,
(2)
式中X1-X8依次為450,462,496,543,677,697,766,949 nm這8個特征波長下的光譜反射率.
2.4.2 基于X-LW法提取特征波長的預(yù)測模型
在Unscrambler環(huán)境中建立全光譜的PLS模型時,把推薦的前3個隱含變量(LVs)作為已知參數(shù).圖5顯示了每個隱含變量在各個波長點(diǎn)處的載荷系數(shù).特征波長就是局部載荷系數(shù)在絕對值最大處對應(yīng)的波長點(diǎn).由圖5可得到10個特征波長,分別為481,557,560,680,702,722,755,758,761,776 nm.把使用X-LW法提取到的10個特征波長所對應(yīng)的光譜數(shù)據(jù)作為輸入值,分別建立基于PLS,MLR的線性模型以及基于LS-SVM的非線性模型.表5給出了X-LW方法對不同模型的預(yù)測結(jié)果.
表5 X-LW方法對不同模型的預(yù)測結(jié)果
由表5可見,基于X-LW線性模型法提取特征波長后,使用線性模型PLS,MLR模型預(yù)測效果比使用非線性LS-SVM法所建的模型好.其中,X-LW-PLS模型的RC和RP均為3者中最高,預(yù)測效果最佳.但3種模型的相關(guān)系數(shù)都低于0.9,可以進(jìn)一步優(yōu)化模型以達(dá)到更好的預(yù)測效果.
綜上所述,在使用特征波長所建立的預(yù)測模型中,SPA-LS-SVM模型的預(yù)測集RP值最大,但與建模集RC相差較大,不利于建模的穩(wěn)定性.因此,選擇X-LW-PLS作為最優(yōu)預(yù)測模型.
1) 基于全波長的預(yù)測模型中,LS-SVM模型預(yù)測效果最優(yōu),預(yù)測集RP值為0.932,RMSEP值為14.966 U·(g·min)-1.利用SPA與X-LW這2種方法進(jìn)行擇特征波長的選擇,得到的X-LW-PLS模型,預(yù)測效果最優(yōu),預(yù)測集RP值是0.892,RMSEP值是28.922 U·(g·min)-1.
2) POD酶活性的變化并不是隨著染病時間的增加而單調(diào)遞增或是遞減,因此僅僅憑借POD酶活性是無法對馬鈴薯的染病時間進(jìn)行判斷的,還需結(jié)合病害的其他癥狀.
3) 根據(jù)POD酶活性的變化可以判斷葉片是否處于染病狀態(tài),為及時發(fā)現(xiàn)病害并進(jìn)行早期防治提供了參考.
4) 高光譜成像技術(shù)能夠用來實現(xiàn)馬鈴薯晚疫病葉片中過氧化物酶POD酶活性的快速無損測定,并證實了POD酶活性實現(xiàn)晚疫病的早期實時檢測的可行性.