伍 南, 劉君昂*, 閆瑞坤, 臧 卓
(1.中南林業(yè)科技大學,林業(yè)生物技術湖南省重點實驗室,長沙 410004;2.中南林業(yè)科技大學,林業(yè)遙感信息工程研究中心,長沙 410004)
基于地面高光譜數(shù)據(jù)的油茶炭疽病病情指數(shù)反演
伍 南1, 劉君昂1*, 閆瑞坤1, 臧 卓2
(1.中南林業(yè)科技大學,林業(yè)生物技術湖南省重點實驗室,長沙 410004;2.中南林業(yè)科技大學,林業(yè)遙感信息工程研究中心,長沙 410004)
使用FieldSpec HandHeldTM地物光譜儀采集不同發(fā)病程度的油茶冠層光譜數(shù)據(jù),并實地調(diào)查油茶炭疽病病情指數(shù),將光譜數(shù)據(jù)進行一階微分與滑動平均濾波相結(jié)合的預處理,提取與病情指數(shù)相關性較高的敏感波段,并采用主成分分析法(principal component analysis,PCA)對敏感波段的光譜數(shù)據(jù)進行降維,分別以敏感波段和PCA降維處理后的敏感波段作為輸入變量建立了病情指數(shù)的BP神經(jīng)網(wǎng)絡反演模型。兩種建模方法建立的BP神經(jīng)網(wǎng)絡模型計算出的預測值與觀測值之間的決定系數(shù)(R2)均達99%以上。精度檢驗證明,以PCA降維所得到的前10個主成分作為輸入變量建立的10-7-1三層BP神經(jīng)網(wǎng)絡模型預測精度更高,模型計算出的預測值與觀測值之間的決定系數(shù)(R2)和均方根誤差(RMSE)分別為0.998 6和0.814 8。該研究表明,利用地面高光譜數(shù)據(jù)結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡算法反演油茶炭疽病病情指數(shù)是一種有效的方法。
高光譜; 油茶炭疽??; 主成分分析; BP神經(jīng)網(wǎng)絡; 病情指數(shù); 反演
油茶炭疽病(Colletotrichumgloeosporioides)是中國油茶產(chǎn)區(qū)普遍發(fā)生的一種重要病害,易引起落果、落蕾、枝梢枯死,甚至整株衰亡,嚴重影響油茶產(chǎn)量,造成重大經(jīng)濟損失[1]。傳統(tǒng)的油茶炭疽病監(jiān)測主要依靠人工,采取林間定點監(jiān)測和隨機調(diào)查等方法,既費時又費力,而且在病害大面積發(fā)生時不能及時地了解病害的發(fā)展情況,因而無法及時、準確地進行預報和防治決策。因此,發(fā)展一種實時、大面積監(jiān)測油茶病害的方法,對及時了解油茶林的健康狀況并制定綜合防治策略具有重要意義。
與傳統(tǒng)的災害監(jiān)測相比,遙感監(jiān)測技術具有宏觀性、經(jīng)濟性、動態(tài)性和實效性等特點[2]。近年來,國內(nèi)外學者利用遙感技術特別是高光譜、衛(wèi)星技術監(jiān)測植物病蟲 害已取 得 許 多 成 果[3-6]。陳兵等[7]將TM影像光譜指數(shù)與棉花黃萎病病情嚴重度進行相關分析,建立了棉花病害嚴重度估測模型。競霞等[8]利用高光譜遙感數(shù)據(jù)建立了棉花黃萎病病情嚴重度的反演模型,也取得了較好的效果。郭潔濱等[9]研究發(fā)現(xiàn),條銹病脅迫下小麥冠層反射率在可見光區(qū)域與病情指數(shù)成正相關,而在近紅外區(qū)域則為負相關。徐華潮等[10]研究了松材線蟲自然侵染后松樹不同感病階段針葉光譜特征變化。Huang等[4]研究發(fā)現(xiàn)PRI指數(shù)與小麥條銹病病情指數(shù)之間有很好的相關性。Moshou等[11]研究了冬小麥條銹病發(fā)展初期健康植株與發(fā)病植株反射光譜的差異,并開發(fā)了基于神經(jīng)網(wǎng)絡系統(tǒng)的病害監(jiān)測程序。
本研究通過實地調(diào)查病情指數(shù),使用便攜式光譜儀采集不同病害程度的油茶冠層光譜,并對光譜數(shù)據(jù)進行了一階微分與滑動平均濾波相結(jié)合的預處理。然后通過對油茶冠層光譜數(shù)據(jù)的一階微分值與病情指數(shù)進行相關分析,提取與病情指數(shù)相關性較高的敏感波段,建立了基于地面高光譜數(shù)據(jù)的油茶炭疽病病情指數(shù)的BP神經(jīng)網(wǎng)絡反演模型。
試驗于2011年5-10月在湖南省油茶示范基地進行,所選油茶品種為‘長林166號’,林齡為10年,林分密度1 200株/km2,郁閉度0.8,平均樹高2.3m。在研究區(qū)內(nèi)隨機選取4塊30m×30m的標準樣地,分別測量了52株不同發(fā)病程度油茶的冠層光譜。在光譜測試過程中,由于測試環(huán)境(如陽光、風向等)及人為操作過程中的失誤,會導致采集的光譜數(shù)據(jù)不能有效反映植物的光譜反射率,例如出現(xiàn)光譜反射率異常偏低,波段噪聲異常偏大等,因此,剔除有明顯誤差的6條數(shù)據(jù)。最終采集有效數(shù)據(jù)46組,其病情指數(shù)(disease index,DI)在0~78.2之間。隨機抽取30組作為建模集,其余16組作為驗證集。病情嚴重度分為5級,即:無明顯病斑為Ⅰ級,代表值為0;病斑面積占葉片總面積的20%以下為Ⅱ級,代表值為1;病斑面積占葉片總面積的20%~50%為Ⅲ級,代表值為2;病斑面積占葉片總面積的51%~75%為Ⅳ級,代表值為3;病斑面積占葉片總面積的75%以上為Ⅴ級,代表值為4。通過統(tǒng)計各嚴重度的油茶葉片數(shù),再根據(jù)統(tǒng)計結(jié)果按公式(1)計算病情指數(shù)(DI)[12]:
其中:x為各梯度的級值;n為最高梯度值4;f為各梯度的葉片數(shù)。
由于研究對象是不同發(fā)病程度的油茶冠層,而冠層結(jié)構(gòu)的復雜性以及影響冠層光譜的因素較多,如其他病、蟲害等的影響都會導致光譜反射率的變化。因此,本研究為盡量避免其他因素的影響,在測試每一株油茶樣本時,盡量選取DI相同或相近的冠層進行光譜測試。試驗使用美國ASD(Analytical Spectral Device)公司生產(chǎn)的FieldSpec HandHeldTM地物光譜儀進行光譜測試,其波長范圍為325~1 075nm,光譜分辨率為3.5nm,光譜采樣間隔1.6nm,視場角25°。選擇在晴朗無云或少云的天氣進行,為了減小太陽高度角變化對光譜測量結(jié)果的影響,測試時間選擇為北京時間10:00-14:00(太陽高度角大于45°)。由于測試對象油茶的平均樹高在2.3m左右,因此本研究使用一根5m長的光纖,并用3m長的標桿將探頭舉到樹頂冠層進行測量。測量時儀器探頭保持垂直向下,探頭與測試目標的垂直距離控制在1.2m左右,觀測范圍直徑約為0.53m,每次采集前進行白板校正,每個采樣點連續(xù)記錄10條光譜曲線,以其平均值作為該點的光譜反射率。
光譜反射率曲線是指被物體反射的光通量與入射到物體的光通量之比即光反射比與波長之間的關系曲線。一種物體的光譜反射率曲線反映了該物體對入射光的光譜選擇性吸收、光散射以及物體表面的鏡面反射的綜合特性。為了消除儀器噪聲、基線漂移、樣本不均、光散射及其他隨機噪聲的影響,需要對光譜數(shù)據(jù)進行預處理。首先使用ASD公司的Viewspec Pro軟件對每個采樣點記錄的10條光譜反射率曲線進行平均處理,然后采用Savitzky-Golay平滑法,選用平滑點數(shù)為7,消除各種因素產(chǎn)生的噪聲影響,同時考慮到系統(tǒng)誤差導致光譜曲線首端和末端噪音較大[13],截取400~900nm的波長范圍進行研究,然后采用光譜歸一化微分分析技術對原始光譜(R)進行一階微分處理,得到微分光譜(D(R)),其計算公式見(2)式[14]:
其中,Δλ為兩倍波段寬。
敏感波段的選擇是簡化分析模型和提高模型預測精度的關鍵技術之一[15]。由于高光譜數(shù)據(jù)波段多,波段間的相關性強,數(shù)據(jù)的冗余現(xiàn)象明顯。如果將高光譜數(shù)據(jù)直接作為變量輸入進行建模,不但會因變量過多而增加建模難度,而且會引入噪聲而降低模型的預測精度。為了避免這一問題,根據(jù)炭疽病脅迫下的油茶冠層光譜特征,以建模集中的30組數(shù)據(jù)作為訓練樣本,將冠層光譜反射率的一階微分值與病情指數(shù)進行相關分析,提取與病情指數(shù)相關性較高的敏感波段,然后采用主成分分析(PCA)對敏感波段的光譜數(shù)據(jù)進行降維。本研究分別以敏感波段和降維后的敏感波段作為變量輸入,采用BP神經(jīng)網(wǎng)絡算法建立油茶炭疽病病情指數(shù)的反演模型,并將兩種建模方法進行比較分析以獲得較優(yōu)的模型。
從圖1可以看出,健康油茶冠層光譜反射率的一階微分值在496nm附近的藍光區(qū)域有明顯的“波峰”,在547nm附近的綠邊和黃邊區(qū)域有明顯的“波谷”,在660~720nm的紅光區(qū)域則有一個明顯的峰值。且隨著病情指數(shù)的增大,藍光區(qū)域的“波峰”及綠邊和黃邊區(qū)域的“波谷”逐漸消失;而紅光區(qū)域峰值的頂點依次向左偏移且逐漸降低,其中病情指數(shù)為0、18.6、37.5和67.2的冠層光譜反射率的一階微分值的峰值頂點分別在702、685、678nm和669nm處。這表明油茶冠層微分光譜的“紅邊”位置隨著病情指數(shù)的增加而依次發(fā)生“藍移”,紅邊斜率逐漸減小。因此,我們可以利用這些光譜上的差異對炭疽病脅迫下的油茶冠層光譜進行分析,進而應用高光譜遙感技術實現(xiàn)油茶病害的監(jiān)測。
圖1 不同DI的油茶冠層一階微分光譜特征
圖2是利用建模集的30個樣本建立的炭疽病脅迫下油茶冠層光譜反射率的一階微分值與病情指數(shù)的相關曲線(r0.05=0.349 4,r0.01=0.448 7)。從圖2可以看出,油茶炭疽病病情指數(shù)與其冠層光譜反射率的一階微分值在477~514、525~566、585~607nm和668~725nm 4個波段均達到極顯著相關,其余波段相關性波動較大。其中,477~514nm和668~725nm兩個波段為極顯著負相關,525~566nm和585~607nm兩個波段為極顯著正相關。由此可知,冠層光譜反射率的一階微分值(微分光譜)對油茶炭疽病病情指數(shù)具有較好的指示作用,且可見光和近紅外區(qū)域是炭疽病脅迫下油茶冠層光譜反射率一階微分值的敏感區(qū)域。因此,利用地面高光譜遙感數(shù)據(jù)反演油茶炭疽病病情指數(shù)是可行的。
圖2 油茶冠層光譜一階微分值與病情指數(shù)之間的相關曲線特征
通過剔除了一些冗余的或影響不顯著的波段,本研究選取與病情指數(shù)相關性較高的490~510、533~563nm和675~705nm 3個微分光譜的波段為采樣區(qū)間,共有83處采樣點。為了避免變量過多而將噪聲引入模型,對所提取的敏感波段的光譜數(shù)據(jù)采用主成分分析法進行降維,同時,通過交互驗證確定最佳主成分數(shù),即在累積可信度(累積方差貢獻)變化不大的情況下選取較少的主成分數(shù)。將油茶炭疽病病情指數(shù)的敏感波段進行PCA降維后,所得前12個主成分的累積可信度如圖3所示。其中,前10個主成分的累積可信度達99.23%,包含了光譜數(shù)據(jù)絕大部分的特征信息。
圖3 前12個主成分的累積可信度
根據(jù)上述分析結(jié)果,選取490~510、533~563nm和675~705nm 3個微分光譜的波段為采樣區(qū)間,對所有建模集和驗證集進行采樣,所采數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡模型的輸入變量。網(wǎng)絡中采用的變量及相關參數(shù)設置如下:參數(shù)SIGMOID為0.9,動態(tài)參數(shù)為0.6,最小訓練速率為0.1,允許誤差為0.000 1。網(wǎng)絡輸入層的節(jié)點數(shù)為83,經(jīng)多次測試確定隱含層的節(jié)點數(shù)為61時模型預測效果最佳,輸出層的節(jié)點數(shù)為1,即構(gòu)成了一個83-61-1三層BP神經(jīng)網(wǎng)絡模型,最大迭代次數(shù)經(jīng)測試確定為3 500。
采用主成分分析(PCA)對采樣數(shù)據(jù)進行降維得到的前10個主成分作為輸入變量,經(jīng)反復調(diào)整隱含層的節(jié)點數(shù)優(yōu)化網(wǎng)絡結(jié)構(gòu),得到最佳的網(wǎng)絡結(jié)構(gòu)為10-7-1三層BP神經(jīng)網(wǎng)絡模型。模型的基本參數(shù)除最大迭代次數(shù)經(jīng)測試確定為1 000外,其余參數(shù)設置保持不變。兩類模型計算出的預測值見表1,結(jié)果表明兩類模型對所有樣本預測的正確率較高,模型計算出的預測值與觀測值之間的決定系數(shù)(R2)均達99%以上。
表1 兩種模型對建模集30個樣本的預測結(jié)果
為了進一步驗證模型的預測能力和獲得最佳建模方法,本研究分析了兩類模型對驗證集的16個樣本的預測結(jié)果(見圖4)。以敏感波段為變量輸入建立的BP神經(jīng)網(wǎng)絡模型計算出的預測值與觀測值之間進行擬合,結(jié)果如圖4a所示:預測值與觀測值之間的決定系數(shù)(R2)為0.997 8,均方根誤差(RMSE)為1.130 8;將敏感波段進行降維處理后作為變量輸入建立的BP神經(jīng)網(wǎng)絡模型計算出的預測值與觀測值之間進行擬合,結(jié)果如圖4b所示:預測值與觀測值之間的決定系數(shù)(R2)為0.998 6,均方根誤差(RMSE)為0.814 8,兩種建模方法都取得較好的預測效果。
圖4 兩種BP神經(jīng)網(wǎng)建模方法的精度檢驗
根據(jù)炭疽病脅迫下油茶冠層光譜反射率的一階微分值與病情指數(shù)的相關性,通過對比分析剔除了一些冗余的或影響不顯著的波段,從而提取出與病情指數(shù)相關性較高的敏感波段。同時采用主成分分析(PCA)對提取的敏感波段作進一步的降維處理,以提高模型的精度和運算速度。然后分別以敏感波段和PCA降維后的敏感波段為輸入變量,采用BP神經(jīng)網(wǎng)絡算法建立了油茶炭疽病病情指數(shù)的反演模型,并將兩種建模方法進行比較分析以獲得較優(yōu)的模型。其中,以敏感波段進行降維處理后作為變量輸入建立的模型相比直接將提取的敏感波段作為輸入變量建立的模型預測精度更高,有較高的擬合R2值和較小的均方根誤差值,且運算速度更快。說明油茶冠層光譜反射率的一階微分值與病情指數(shù)通過相關分析提取的敏感波段,再經(jīng)PCA降維后提取的主成分作為輸入變量建立的油茶炭疽病病情指數(shù)BP神經(jīng)網(wǎng)絡反演模型預測效果更好,是一種優(yōu)選的建模方法。該研究結(jié)果可為油茶林炭疽病病情的快速診斷提供科學參考,并為今后利用航空、航天遙感實現(xiàn)大面積監(jiān)測奠定了基礎。
[1]靳愛仙,周國英,李河.油茶炭疽病的研究現(xiàn)狀、問題與方向[J].中國森林病蟲,2009,28(2):27-31.
[2]王植,曹均,曹慶昌,等.高光譜遙感監(jiān)測板栗病蟲害的可行性初探[J].中國農(nóng)學通報,2010,26(13):380-384.
[3]Johnson D A,Richard A J,Hamm P B,et al.Aerial photography used for spatial pattern analysis of late blight infection in irrigated potato circles[J].Phytopathology,2003,93(7):805-812.
[4]Huang W J,Lamb D W,Niu Z,et al.Identification of yellow rust in using in-situ spectral reflectance measurements and airborne hyperspectral imaging[J].Precision Agriculture,2007,8(5):187-197.
[5]劉占宇,黃獲峰,陶榮祥,等.基于主成分分析和徑向基網(wǎng)絡的水稻胡麻斑病嚴重度估測[J].光譜學與光譜分析,2008,28(9):2156-2160.
[6]陳云浩,蔣金豹,黃文江,等.主成分分析法與植被指數(shù)經(jīng)驗方法估測冬小麥條銹病嚴重度的對比研究[J].光譜學與光譜分析,2009,29(8):2161-2165.
[7]陳兵,李少昆,王克如,等.基于TM影像光譜指數(shù)的棉花病害嚴重度估測[J].紅外與毫米波學報,2011,30(5):451-457.
[8]競霞,黃文江,王紀花,等.棉花單葉黃萎病病情嚴重度高光譜反演模型研究[J].光譜學與光譜分析,2009,29(12):3348-3352.
[9]郭潔濱,黃沖,王海光,等.基于高光譜遙感技術的不同小麥品種條銹病病情指數(shù)的反演[J].光譜學與光譜分析,2009,29(12):3353-3357.
[10]徐華潮,駱有慶,張廷廷,等.松材線蟲自然侵染后松樹不同感病階段針葉光譜特征變化[J].光譜學與光譜分析,2011,31(5):1352-1356.
[11]Moshou D,Brav C,West J,et al.The automatic detection of‘yellow rust’in wheat using reflectance measurements and neural networks[J].Computers and Electronics in Agriculture,2004,44(3):173.
[12]劉君昂,潘華平,伍南,等.油茶主要病害空間分布格局規(guī)律的研究[J].中國森林病蟲,2010,29(9):7-11.
[13]邵詠妮,何勇.基于獨立組分分析和BP神經(jīng)網(wǎng)絡的可見/近紅外光譜蜂蜜品牌的鑒別[J].紅外與毫米波學報,2006,25(6):478-480.
[14]王磊,白由路,盧艷麗,等.光譜數(shù)據(jù)變換對玉米氮素含量反演精度的影響[J].遙感技術與應用,2011,26(2):220-225.
[15]林芬芳,陳祝爐,王珂,等.基于傅里葉變換紅外光譜和siPLSGA-PLS的水稻葉片氮素含量預測研究[J].紅外與毫米波學報,2009,28(4):277-280.
Inverse disease indices ofColletotrichumgloeosporioidesbased on ground hyper-spectral data
Wu Nan1, Liu Jun’ang1, Yan Ruikun1, Zang Zhuo2
(1.HunanProvincialKeyLaboratoryofForestryBiotechnology,CentralSouth UniversityofForestryandTechnology,Changsha410004,China;2.ResearchCenterofForestryRemoteSensing&InformationEngineering,CentralSouth UniversityofForestry&Technology,Changsha410004,China)
TheColletotrichumgloeosporioidesdisease index(DI)was available through field investigation,and the spectral data of canopy with different disease severities was collected by using the FieldSpec HandHeldTMspectrometer.The first order differential of spectral data combined with moving average filter was pretreated.The dimensions of spectral data in sensitive band ranges highly related toDIwere descended by PCA.The BP neural network models were built by using sensitive bands and dealt with PCA as input variables separately.The results showed that both determination coefficients between predictive values calculated by the above two models and observed values were over 99%.The accuracy test demonstrated that the prediction precision in the three layers 10-7-1 BP neural network model built by using top 10 principal components from the dimension reduction as input variables was higher.TheR2and theRMSEbetween predictive values and observed values were 0.998 6 and 0.814 8,respectively.This study showed an effective way to retrieveC.gloeosporioidesDIby exploiting ground hyper-spectral data combined with PCA and BP neural network.
hyper-spectra; oil camelliae anthracnose; principal component analysis; BP neural network;disease index; inversion
S 763;S 431.9
A
10.3969/j.issn.0529-1542.2012.05.004
2011-12-26
2012-02-18
國家自然科學基金項目(31170598);國家林業(yè)局重點項目(2011-05)
* 通信作者E-mail:kjc9620@163.com