張愛武,郭超凡※,鄢文艷
?
區(qū)間優(yōu)化提高牧草粗蛋白含量遙感估算精度
張愛武1,2,郭超凡1,2※,鄢文艷1,2
(1. 首都師范大學(xué) 三維信息獲取與應(yīng)用教育部重點實驗室,北京 100048;2. 首都師范大學(xué) 空間信息技術(shù)教育部工程研究中心,北京 100048)
牧草粗蛋白含量的估算對于草地營養(yǎng)狀況監(jiān)測以及草地資源可持續(xù)利用和管理具有重要意義。針對當(dāng)前地面遙感與航天遙感的限制,嘗試基于航空飛艇高光譜遙感進(jìn)行牧草粗蛋白含量估算研究,以便更好滿足智慧畜牧業(yè)的應(yīng)用需求。針對現(xiàn)有植被生化含量反演不確定性的問題,基于區(qū)間劃分與判別分析的思想,提出了一種結(jié)合等寬區(qū)間劃分法、逐步判別分析與Fisher判別法相結(jié)合的多步驟牧草粗蛋白含量估算模型,以青海省海晏縣金銀灘草原為研究區(qū)進(jìn)行方案可行性研究。結(jié)果表明,提出的模型能夠較好的實現(xiàn)牧草粗蛋白含量的精準(zhǔn)估算,設(shè)定的3種不同劃分區(qū)間(3區(qū)間,5區(qū)間和7區(qū)間)所對應(yīng)的全樣本檢驗精度和交叉檢驗精度分別達(dá)到了95%、90%,95%、80%和85%、65%。與傳統(tǒng)的逐步線性回歸方法相比,估算精度有了明顯提高(總體檢驗精度提高18.7%~70%,交叉檢驗精度提高20%~62.5%)。3種不同區(qū)間模型(3區(qū)間,5區(qū)間和7區(qū)間)所對應(yīng)的特征波段依次為870、815、802、737、391 nm;988、391、398、405、548 nm;870、815、946、888、839 nm。此外,模型的估算精度與劃分區(qū)間數(shù)量成反比關(guān)系,在實際中可以根據(jù)不同的應(yīng)用需求來調(diào)節(jié)劃分區(qū)間數(shù)量。綜上,該文利用航空飛艇高光譜數(shù)據(jù)實現(xiàn)了牧草粗蛋白含量的精準(zhǔn)反演估算,對后期牧場營養(yǎng)狀況實時監(jiān)測以及草地資源可持續(xù)利用和管理具有重要的指導(dǎo)意義。
光譜分析;蛋白質(zhì);遙感;飛艇;高光譜圖像;牧草;區(qū)間分析
粗蛋白(crude protein,CP)是牧草主要的營養(yǎng)參量,是評價牧草品質(zhì)和飼用價值的重要指標(biāo)。因此,快速準(zhǔn)確地獲取牧草的粗蛋白含量對于牧場營養(yǎng)狀況監(jiān)測以及草地資源利用和管理具有重要意義。早期的研究多利用非成像地物光譜儀進(jìn)行植被葉面或冠層光譜測定,從而實現(xiàn)粗蛋白含量的反演和預(yù)測[1-4]。但該方法每次只能獲取單個樣點的光譜數(shù)據(jù)。同時,部分學(xué)者利用地面成像光譜儀獲取植被冠層高光譜圖像,獲取的高光譜圖像具有圖譜合一的優(yōu)勢,但因應(yīng)用平臺高度限制,不能獲取大范圍地物信息[5]。另外,一些學(xué)者利用衛(wèi)星高光譜遙感影像(如EO-1 Hyperion)結(jié)合地面采樣數(shù)據(jù)進(jìn)行植被營養(yǎng)參量的估算研究[6-7],但其空間分辨率和光譜分辨率低,反演精度相對較低。近年來以航空飛行器為平臺的低空高光譜遙感技術(shù)發(fā)展迅速。以其高光譜分辨率、高空間分辨率以及靈活性、可控性等優(yōu)點受到相關(guān)學(xué)者的廣泛關(guān)注。航空高光譜遙感數(shù)據(jù)已被廣泛應(yīng)用于類胡蘿卜素、葉綠素、氮、生物量以及葉面指數(shù)等多種植被生化參量的反演研究[8-12]。利用航空高光譜遙感數(shù)據(jù)估算牧草粗蛋白含量具有很大的潛力,但此方面的研究還鮮有報道。
多年來,國內(nèi)外學(xué)者致力于植被生物參量反演模型的構(gòu)建,并形成了多種多樣的方法。如指數(shù)模型、逐步線性回歸模型、偏最小二乘回歸模型以及非線性模型等[13-14]。此外,還有學(xué)者通過對高光譜數(shù)據(jù)進(jìn)行衍生變換(如導(dǎo)數(shù)變換、包絡(luò)線去除變換、小波變換)來提高監(jiān)測模型的反演精度[15-18]。但是研究發(fā)現(xiàn)這些反演模型并不總是能夠滿足實際應(yīng)用的需求。遙感反演的根本問題在于定量遙感往往需要用少量觀測數(shù)據(jù)估計非常復(fù)雜的地表系統(tǒng)的當(dāng)前狀態(tài),本質(zhì)上是一個病態(tài)反演問題[19]。反演模型過度依賴于先驗數(shù)據(jù),而先驗數(shù)據(jù)容易受人為因素、環(huán)境差異、儀器偏差以及實測數(shù)據(jù)受限等諸多不確定因素的干擾。另外,遙感數(shù)據(jù)獲?。◣缀侮P(guān)系、衛(wèi)星平臺、地面控制等)和數(shù)據(jù)處理(幾何校正、輻射校正等)等各個階段也會引入不確定因素[20]。雖然大多數(shù)情況下這些誤差或不確定性可能很小,但這些不確定性結(jié)合到一起可能使估算結(jié)果產(chǎn)生較大的偏差。同時,在農(nóng)牧業(yè)生產(chǎn)中,準(zhǔn)確的含量估算區(qū)間便能滿足實際應(yīng)用的需求,而不必過度追求反演結(jié)果的精確性(傳統(tǒng)的反演結(jié)果是點變量)。如草地質(zhì)量評價中,將草地劃分為5個等級(一等草地到五等草地)便能滿足實際需求[21];牧草品質(zhì)綜合評定中采用九分制評定標(biāo)準(zhǔn)(9分代表最好,最低為1分)[22]。在實際的工程問題中,很多國內(nèi)外學(xué)者采用區(qū)間分析的方法去消除不確定因素對于預(yù)測模型的影響,并取得了喜人的成果。Wong等[23]采用一階泰勒展開對損傷結(jié)構(gòu)前后的剛度參數(shù)進(jìn)行區(qū)間建模,基于實測固有頻率來進(jìn)行結(jié)構(gòu)損傷判定,降低了損傷識別不確定性問題。孫彬等[24]采用區(qū)間分析進(jìn)行了銹蝕鋼筋混凝土結(jié)構(gòu)使用壽命預(yù)測,降低了銹蝕不確定性對結(jié)構(gòu)壽命預(yù)測結(jié)果的影響。區(qū)間分析方法為消除定量遙感反演中的不確定性提供了一個新的思路,同時獲得的區(qū)間估算結(jié)果也能夠滿足實際應(yīng)用的需求。然而區(qū)間分析在定量遙感反演中的應(yīng)用尚不多見。
本文以青海省海晏縣金銀灘草原為研究區(qū),使用自主研發(fā)的ASQ-AHSMap艇載高光譜推帚成像系統(tǒng)進(jìn)行高光譜遙感數(shù)據(jù)采集,利用獲取的高光譜影像結(jié)合地面同步采樣數(shù)據(jù)構(gòu)建牧草粗蛋白含量的遙感估算模型。并針對現(xiàn)有反演模型中先驗數(shù)據(jù)不確定性問題,提出了一種基于區(qū)間劃分與判別分析的牧草粗蛋白含量估算模型。首先基于等寬區(qū)間劃分法對全部的樣本含量進(jìn)行區(qū)間劃分;然后通過逐步判別分析選取與牧草粗蛋白含量密切相關(guān)的波段,同時考慮了波段間的相關(guān)性問題;最后利用費希爾(fisher)判別法定義不同粗蛋白含量區(qū)間的隸屬規(guī)則,實現(xiàn)牧草粗蛋白含量的估算。研究結(jié)果以期牧場營養(yǎng)狀況監(jiān)測以及草地資源可持續(xù)利用和管理提供參考和借鑒。
試驗區(qū)位于青海省海北藏族自治州海晏縣境內(nèi)的金銀灘草原。海拔3 000~3 600 m,地理位置為36°53¢~37°12¢N,100°42¢~101°02¢E。該區(qū)屬大陸性高原氣候,氣候干燥,紫外線輻射強(qiáng),年溫差較大,年均氣溫-0.3 ℃,年均降水量456.0 mm,年均蒸發(fā)量1 461.4 mm。金銀灘草原屬祁連山山地環(huán)湖盆地高寒草甸地區(qū),是我國溫性草原與高寒草甸草原的過渡地帶。典型植被主要包括矮生嵩草、高山嵩草、針茅草、芨芨草、狼毒草等植物。
本研究使用的高光譜圖像數(shù)據(jù)來自于課題組自主研發(fā)的艇載高光譜成像系統(tǒng)ASQ-AHSMap(如圖1所示)。與常規(guī)的無人遙感系統(tǒng)對比,艇載高光譜成像系統(tǒng)具有安全系數(shù)高、續(xù)航時間長(油電雙動力)、載重負(fù)荷大等特點,能夠更好的適應(yīng)高海拔地區(qū)惡劣的氣候環(huán)境。數(shù)據(jù)獲取時間為2016年6月15日11時,數(shù)據(jù)包含840個波段,其光譜范圍為400~1 000 nm,光譜分辨率為0.727 nm,飛行相對高度為300 m,空間分辨率為0.09 m。為減少數(shù)據(jù)冗余,對高光譜數(shù)據(jù)進(jìn)行重采樣,采樣間隔為5 nm。為了保證草地牧草遙感監(jiān)測的可靠性和準(zhǔn)確性,在進(jìn)行光譜數(shù)據(jù)分析之前,對采集的高光譜數(shù)據(jù)進(jìn)行圖像拼接、幾何校正、輻射定標(biāo)、大氣校正等處理,最終得到高光譜反射率圖像。
圖1 艇載高光譜成像系統(tǒng)
地面數(shù)據(jù)采集與影像獲取同步進(jìn)行。根據(jù)研究區(qū)域狀況在對應(yīng)樣區(qū)內(nèi)布設(shè)20個采樣點(如圖2所示),利用RTK(real-time kinematic)方法測量每個采樣點的經(jīng)緯度,同時在樣區(qū)內(nèi)布設(shè)若干靶標(biāo),以便在圖像上精確定位。采用50 cm′50 cm樣方,齊地面刈割,挑出石子、動物糞便等不可食部分,將樣本放入密封的塑料袋中,帶回實驗室分析。委托青海省高原放牧家畜營養(yǎng)與生態(tài)國家重點實驗室培育基地測定CP含量。
圖2 研究區(qū)采樣點分布
不確定性一直是定量遙感分析中一個比較棘手的問題,它源于數(shù)據(jù)采樣誤差、處理誤差和人為誤差。相關(guān)學(xué)者在努力使估算結(jié)果滿足應(yīng)用需求精度的同時,由于這些誤差的累積可能使計算結(jié)果失去意義。區(qū)間分析提供了一種簡便的方法,它考慮了各種誤差,同時作為計算結(jié)果得到一個包含精確結(jié)果的區(qū)間。這種方法減少了決策信息中的不確定性(誤差),可能使我們能夠獲得更好的估算結(jié)果。等寬區(qū)間法(equal-width-intervals)是一種常見的無監(jiān)督區(qū)間劃分算法。它根據(jù)用戶指定的區(qū)間數(shù)目,將數(shù)值屬性的值域[min,max]劃分為個子區(qū)間,使每個子區(qū)間寬度相等,即都等于(min,max)/。如果確定了樣本的含量范圍,可以通過調(diào)整區(qū)間數(shù)目值,人為的控制估算結(jié)果的區(qū)間范圍,以便更靈活的滿足實際應(yīng)用的需求。因此,本文采用等寬區(qū)間法對樣本粗蛋白含量進(jìn)行區(qū)間劃分。劃分的具體流程為:統(tǒng)計樣本粗蛋白含量,確定樣本含量的區(qū)間范圍,確定最大值和最小值;根據(jù)實際應(yīng)用的需求設(shè)定含量劃分的區(qū)間數(shù)目,同時可以獲得每個區(qū)間內(nèi)粗蛋白含量的范圍。為了討論不同的區(qū)間數(shù)目(含量區(qū)間范圍)對于估算結(jié)果的影響,本研究中設(shè)定了3、5、7共3個不同的區(qū)間數(shù)目對樣本進(jìn)行劃分。
高光譜遙感數(shù)據(jù)具有波段數(shù)目多、光譜分辨率高、波段寬度窄等特點,為草地定量遙感研究提供了極大的便利。但同時也面臨著數(shù)據(jù)量大、波段間相關(guān)性高、數(shù)據(jù)冗余以及波段噪聲等問題。因此,在保證數(shù)據(jù)信息完整的情況下,從海量的信息中選取與目標(biāo)要素關(guān)系密切的特征波段具有重要的意義。本文中,特征波段選擇采用逐步判別分析方法進(jìn)行。逐步判別分析是將判別變量一個接一個地選入判別函數(shù),而且每次在選入變量之前對已進(jìn)入判別函數(shù)的變量逐個檢驗,當(dāng)每個變量因新的變量的進(jìn)入變得不顯著時,就將這個變量移出,使得判別函數(shù)中入選變量全部為有顯著判別能力的變量。即將判別能力顯著的變量“篩選”出來建立“最優(yōu)”判別函數(shù)。本研究中各個樣點的反射率特征為自變量,對應(yīng)的蛋白質(zhì)含量區(qū)間為因變量,用SPSS進(jìn)行逐步判別分析。按統(tǒng)計量Wilks’Lambda最小值原則[24],以值作為判斷統(tǒng)計量,設(shè)定合適的“輸入”值與“剔除”值,進(jìn)行變量篩選,提取特征波段[25]。
模型的精度驗證從3個方面進(jìn)行論述:全樣本模型的準(zhǔn)確率,即利用全部樣本構(gòu)建的估算模型對樣本自身判別的正確率;交叉驗證模型的準(zhǔn)確率,即采用十折交叉驗證的方法獲取的樣本判別正確率;與常規(guī)逐步線性回歸模型估算結(jié)果對比研究。探討了逐步線性回歸方法反演結(jié)果在同等區(qū)間劃分條件下與實測數(shù)據(jù)的一致性。對比參數(shù)包括全樣本模型準(zhǔn)確率和交叉驗證模型準(zhǔn)確率。
本文首先對獲取的樣本粗蛋白含量進(jìn)行了統(tǒng)計分析,指標(biāo)包括樣本的數(shù)量,粗蛋白含量的平均值、最大值、最小值和置信區(qū)間,其結(jié)果如表1、表2所示。其中置信區(qū)間反應(yīng)了粗蛋白含量的置信范圍,粗蛋白含量的波動范圍為每像素(0.71±0.36)mg(下同),這種波動為研究牧草反射率光譜特征與粗蛋白含量的關(guān)系奠定了基礎(chǔ)。最大值、最小值反映了蛋白質(zhì)含量的區(qū)間。本文采用等寬區(qū)間法對蛋白質(zhì)含量進(jìn)行劃分。設(shè)置的劃分區(qū)間數(shù)分別為3、5、7,分別命名為3區(qū)間模型、5區(qū)間模型、7區(qū)間模型。結(jié)果如表2所示。
表1 樣本粗蛋白含量統(tǒng)計
注:d表示第個區(qū)間。
Note: dis the-th interval.
為了進(jìn)一步探索區(qū)間劃分對于估算模型的影響,分別對3種區(qū)間含量數(shù)據(jù)與所對應(yīng)的光譜特征進(jìn)行相關(guān)性分析,并與原始數(shù)據(jù)的分析結(jié)果進(jìn)行對比。圖3為4種不同模型對應(yīng)的相關(guān)性分析結(jié)果。結(jié)果表明:4種模型的相關(guān)性變化趨勢是一致的,其中在400~710 nm波段范圍相關(guān)性較低,而在710~1 000 nm范圍內(nèi)相關(guān)性較高,幾乎全部達(dá)到顯著水平(<0.05);不同區(qū)間模型對比,主要表現(xiàn)為隨劃分區(qū)間數(shù)的增多相關(guān)性逐漸降低,特別是在710~1 000 nm(即顯著性波段)范圍內(nèi);區(qū)間模型與原始數(shù)據(jù)對比,在顯著性波段范圍內(nèi),3區(qū)間模型和5區(qū)間模型的相關(guān)性均好于原始數(shù)據(jù),而7區(qū)間模型的相關(guān)性弱于原始數(shù)據(jù),說明并不是所有的區(qū)間劃分都能很好的凸顯光譜反射特征與粗蛋白含量間的關(guān)系。
為了選擇合適的特征波段,綜合考慮模型判別效果和變量盡可能少的原則,設(shè)定的“進(jìn)入”值為1.75、“剔除”值為1.50;為了便于進(jìn)行不同模型間精度的對比,分別選取前5個變量作為特征波段。由此選出的3、5、7區(qū)間模型對應(yīng)的特征波段集分別為870、815、802、737、391 nm;988、391、398、405、548 nm;870、815、946、888、839 nm,如表3所示。
在特征波段篩選過程中,Wilks’lambda表示組內(nèi)平方和與總平方和之比,介于0到1之間。Wilks’lambda值大,表示各個組的均值基本相等;Wilks’lambda小則表示組間有差異。在判別分析中,只有組均值不等時,判別分析才有意義。如果每組數(shù)據(jù)中最大的Wilks’lambda值遠(yuǎn)小于1,那么說明這組數(shù)據(jù)具有可分析性。因此本文選取“組間最大Wilks’lambda值”對選取的波段集進(jìn)行可分析性檢驗。結(jié)果如表3所示,3、5、7區(qū)間模型所對應(yīng)的組間最大Wilks’lambda值分別為0.51,0.47,0.45。這些組間最大值均小于1,說明所有區(qū)間模型的組均值均存在差異性,具有可分析性。
為判定逐步判別分析法選取的波段集對各含量區(qū)間分離性大小,采用JM(Jeffreys-Matusita)距離作為評判指數(shù)。JM距離是基于條件概率理論的光譜可分性指標(biāo),取值范圍是0~2,其值越大表示光譜分離性越好。在實際遙感應(yīng)用中,常采用光譜區(qū)分性≥95%(即JM距離值為1.9)作為閾值來評估各組別波段是否具有可分離性[27]。本試驗中采用組間最小JM距離來反映不同模型各區(qū)間光譜特征的差異性。結(jié)果如表3所示,不同區(qū)間模型所對應(yīng)的組間最小JM距離均大于1.9,說明所選取的波段是有效的,不同區(qū)間模型中粗蛋白含量區(qū)間是可區(qū)分的。
在SPSS中選擇Fisher判別分析法對全部樣本進(jìn)行分析處理,得到各個區(qū)間模型所對應(yīng)的判別函數(shù)1和判別函數(shù)2(前2個函數(shù)模型的貢獻(xiàn)率均大于97%)以及各模型中不同含量區(qū)間所對應(yīng)的質(zhì)心。結(jié)果如圖4所示,3區(qū)間模型不同含量區(qū)間所對應(yīng)的質(zhì)心分別為(–6.36,–0.24)、(0.89,1.55)和(1.91,–0.62),對應(yīng)的函數(shù)1和函數(shù)2如公式(3)、(4)。
1=–81.7+295.56870–281.39815+397.86802– 238.25737–83.04391(3)
2=5.18+16.76870+34.47815–213.57802+ 148.1737+549.19391(4)
5區(qū)間模型含量區(qū)間所對應(yīng)的質(zhì)心分別為(–3.61, –0.90)、(–0.16,4.77)、(1.18,–0.71)、(–1.31,–0.13)和(2.71, –0.56),對應(yīng)的函數(shù)1和函數(shù)2如公式(5)、(6)
1=–20.62+61.13988+870.6391–693.77398+ 338.55405–138.31548(5)
2=14.49+27.53988+790.37391+590.56398– 624.81405–464.11548(6)
7區(qū)間模型含量區(qū)間所對應(yīng)的質(zhì)心分別為(–8.60, –0.39)、(–14.49,–1.41)、(–0.25,3.72)、(8.3,–1.54)、(3.45, –1.04)、(–0.22,–0.25)、(3.02,0.22),對應(yīng)的典型判別函數(shù)1和判別函數(shù)2如公式(7)、(8)
1=9.84+529.24870–463.64815–302.71946+ 87.88888+127.37839(7)
2=–77.30–12.63870–17.67815+151.26946– 151.5888+205.23839(8)
式中R為第個波段對應(yīng)的光譜特征值。
用構(gòu)建的判別函數(shù)和定義的質(zhì)心對全部樣本進(jìn)行分類。圖4展示了不同區(qū)間模型中,構(gòu)建的判別函數(shù)對樣本進(jìn)行分組的示意,據(jù)此可以清晰地分辨各個模型中粗蛋白含量區(qū)間的分布及錯分情況。其中3區(qū)間模型中發(fā)生1個誤判(區(qū)間3被誤判為區(qū)間2),模型的正確率為95%;5區(qū)間模型中發(fā)生1個誤判(區(qū)間4含量被誤判為區(qū)間1),模型的正確率為95%;7區(qū)間模型中發(fā)生3個誤判(2個區(qū)間7被誤判為區(qū)間5,1個區(qū)間7含量被誤判為區(qū)間6),模型的正確率為85%。
圖4 不同區(qū)間模型判別函數(shù)組中心圖
表4展示了利用特征波段集構(gòu)建的全樣本模型與交叉檢驗?zāi)P偷呐袆e精度。結(jié)果表明,無論是全樣本模型還是交叉驗證模型,其所對應(yīng)的區(qū)間分析模型精度均高于傳統(tǒng)的逐步回歸模型(總體檢驗精度提高18.7%~70%,交叉檢驗精度提高20%~62.5%)。說明本文提出的方法能夠有效地提高粗蛋白含量的估算結(jié)果。不同區(qū)間模型對比,3區(qū)間,5區(qū)間和7區(qū)間模型所對應(yīng)的全樣本驗證精度分別為95%、90% 和95%,交叉驗證精度分別為80%和85%、65%,模型精度隨著劃分區(qū)間的加密逐漸降低。說明區(qū)間模型的判別精度與區(qū)間劃分?jǐn)?shù)目有關(guān),區(qū)間劃分的越細(xì),估算精度越低。
將構(gòu)建的全樣本模型運用到整幅高光譜圖像上,并結(jié)合定義的質(zhì)心點進(jìn)行研究牧草粗蛋白含量的估算研究。3區(qū)間、5區(qū)間和7區(qū)間模型所對應(yīng)估算結(jié)果如圖5所示。圖像中的道路、房屋、水域為非植被地物,在試驗中予以剔除。如圖所示,3種不同區(qū)間的估算模型所生成的牧草粗蛋白含量分布圖在整體上具有一定的一致性,但在部分區(qū)域內(nèi),估算結(jié)果差異明顯(3、5區(qū)間模型一致性較好,與7區(qū)間模型的一致性較差)??赡茉蚴怯捎谠?區(qū)間模型中,個別區(qū)間內(nèi)出現(xiàn)了樣本數(shù)較少(在0.92~1.06 mg區(qū)間范圍內(nèi)只有一個樣本)的情況,代表性不足,可能會對后期判別模型的構(gòu)建產(chǎn)生一定的影響。
表4 模型判別檢驗結(jié)果對比
圖5 研究區(qū)牧草粗蛋白含量估算結(jié)果圖
高光譜數(shù)據(jù)具有波段數(shù)目多、波段間相關(guān)性高的特點。從反演算法的角度分析,采用全波段數(shù)據(jù)構(gòu)建反演誤差方程會引入大量無效信息,影響反演算法的收斂性和效率。因此,特征波段選擇在反演模型構(gòu)架中具有重要的意義。本文中采用逐步判別分析方法進(jìn)行特征波段選擇。最終,確定了3、5、7區(qū)間模型所對應(yīng)的特征波段集依次為870、815、802、737、391 nm,988、391、398、405、548 nm 和 870、815、946、888、839 nm。這些特征波段主要分布在近紅外波區(qū)域(802、815 、815、839、870 、870、880、946和988 nm,共9個波段,占全部特征波段的60%)。大量的研究表明近紅外光譜反射率對于蛋白質(zhì)含量(或氮含量)變化十分敏感[28-30],而植被中蛋白質(zhì)、氮含量與粗蛋白含量具有密切的關(guān)系,進(jìn)一步證明了所選波段的有效性。剩余特征波段分布在綠光(548 nm)、紅邊(737 nm)和紫光(391、391、398 和 405 nm)區(qū)域。綠光波段和紅邊波段已被證明能夠應(yīng)用于蛋白質(zhì)、氮含量的反演研究[31],而紫光波段在相關(guān)研究中尚不多見。這些紫光波段屬于噪聲信息,還是能夠被應(yīng)用于牧草粗蛋白含量估算的特征波段?尚有待進(jìn)一步研究。此外,不同區(qū)間模型所選擇的波段具有一定的相似性(391、815和870 nm),說明一些關(guān)鍵波段在粗蛋白反演中具有魯棒性,能夠抵抗先驗數(shù)據(jù)差異性干擾。
采用全樣本檢驗和交叉檢驗方法對構(gòu)建的模型進(jìn)行了可行性評價,結(jié)果表明3和5區(qū)間模型所對應(yīng)的總體驗證精度和交叉驗證精度分別為95%、90%,95%、80%,估算效果較好;7區(qū)間模型所對應(yīng)的總體驗證精度和交叉驗證精度分別為和85%、65%精度相對較低,但仍高于傳統(tǒng)的逐步回歸模型。說明通過對牧草粗蛋白含量進(jìn)行區(qū)間劃分,并通過運用逐步判別分析與Fisher判別能夠?qū)崿F(xiàn)牧草粗蛋白含量的精確估算。
本文提出的模型中,一個比較明顯的制約條件是該模型只適用于估算采樣區(qū)間范圍內(nèi)的含量。本試驗中,共設(shè)置了20個采樣點,樣本含量區(qū)間0.76~1.84 mg,雖然盡可能選取具有代表性的樣點,但由于采樣點的限制,構(gòu)建的牧草粗蛋白估算模型代表性尚存在一定不足,后期會做進(jìn)一步的數(shù)據(jù)補(bǔ)充和模型修正。此外,本實驗組的早期研究表明通過對高光譜數(shù)據(jù)進(jìn)行衍生變換(如導(dǎo)數(shù)變換、包絡(luò)線去除變換)來能夠提高估算模型的反演精度[32],光譜衍生變換與本文提出的模型具有很好的兼容性,可綜合應(yīng)用于粗蛋白以及其他營養(yǎng)含量的遙感監(jiān)測。
本文采用航空飛艇高光譜影像結(jié)合地面實測數(shù)據(jù)進(jìn)行牧草粗蛋白含量的估算研究,并針對當(dāng)前估算模型的不足和農(nóng)牧業(yè)生產(chǎn)中實際應(yīng)用需求,提出了一種基于等寬區(qū)間劃分、逐步判別分析和Fisher判別法相結(jié)合的多步驟牧草粗蛋白含量估算模型。以青海省海晏縣金銀灘草原為研究區(qū)進(jìn)行方案可行性研究。研究結(jié)果表明提出的方法能夠較好的解決先驗數(shù)據(jù)不確定性問題對于反演模型的影響,估算結(jié)果能夠滿足實際應(yīng)用的需求,并且精度明顯優(yōu)于傳統(tǒng)的反演方法(總體檢驗精度提高18.7%~70%,交叉檢驗精度提高20%~62.5%)。此外,模型的估算精度與劃分區(qū)間數(shù)量成反比關(guān)系,在實際中可以根據(jù)不同的應(yīng)用需求來調(diào)節(jié)劃分區(qū)間數(shù)量。綜上,本文提出了一種利用航空高光譜遙感數(shù)據(jù)進(jìn)行牧草粗蛋白含量估算的有效方法,一定程度上滿足精準(zhǔn)農(nóng)業(yè)的需求,并且該法可以擴(kuò)展到其他植被類型和更多生化參量的估算研究。研究結(jié)果還可為今后高光譜圖像在大面積區(qū)域草地動態(tài)監(jiān)測及其他農(nóng)業(yè)領(lǐng)域的研究提供借鑒。
[1] 石云鷺,趙明,李連祿,等. 農(nóng)牧交錯區(qū)青貯玉米粗蛋白含量分析及高光譜反演[J]. 玉米科學(xué),2005,13(1):64-68. Shi Yunlu, Zhao Ming, Li Lianlu, et al. Analysis on crude protein content of silage corn in agriculture-animal husbandry ecotone and hyperspectral remote sensing estimation [J]. Journal of Maize Sciences, 2005, 13(1): 64-68. (in Chinese with English abstract)
[2] Liu Mingbo, Li Xiaoli, Liu Yun, et al. Detection of crude protein, crude starch, and amylose for rice by hyperspectral reflectance[J]. Spectroscopy Letters , 2014, 47 (2): 101-106.
[3] Dale L M, Pierna J A F, Vermeulen P, et al. Research on crude protein and digestibility ofL. using conventional NIR spectrometry and hyperspectral imaging NIR[J]. Journal of Food Agriculture & Environment, 2012, 10(1): 391-396.
[4] 唐延林,黃敬峰,王人潮,等. 利用高光譜數(shù)據(jù)預(yù)測水稻籽粒粗蛋白含量研究[J]. 農(nóng)業(yè)工程學(xué)報,2006,22(7):114-118. Tang Yanlin, Huang Jingfeng, Wang Renchao, et al. Estimating the crude protein contents in rice grains using hyperspectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2006, 22(7): 114-118. (in Chinese with English abstract)
[5] Zhang Chu, Liu Fei, Kong Wenwen, et al. Application of visible and near-infrared hyperspectral imaging to determine soluble protein content in oilseed rape leaves[J]. Sensors, 2015, 15(7): 16576-16588.
[6] Thulin S, Hill M J, Held A, et al. Predicting levels of crude protein, digestibility, lignin and cellulose in temperate pastures using hyperspectral image data[J]. American Journal of Plant Sciences, 2014, 5(7): 997-019.
[7] 馬維維,鞏彩蘭,胡勇,等. 牧草品質(zhì)的高光譜遙感監(jiān)測模型研究[J]. 光譜學(xué)與光譜分析,2015,35(10):2851-2855. Ma Weiwei, Gong Cailan, Hu Yong, et al. Hyperspectral remote sensing estimation models for pasture quality [J]. Spectroscopy & Spectral Analysis, 2015, 35(10): 2851-2855. (in Chinese with English abstract)
[8] Zarcotejada P J, Guilléncliment M L, Hernándezclemente R, et al. Estimating leaf carotenoid content in vineyards using high resolution hyperspectral imagery acquired from an unmanned aerial vehicle (UAV) [J]. Agricultural & Forest Meteorology, 2013, 171 (8): 281-294.
[9] Zarco-Tejada P J, Miller J R, Harron J, et al. Needle chlorophyll content estimation through model inversion using hyperspectral data from boreal conifer forest canopies [J]. Remote Sensing of Environment, 2004, 89(2): 189-199.
[10] 高林,楊貴軍,于海洋,等. 基于無人機(jī)高光譜遙感的冬小麥葉面積指數(shù)反演[J]. 農(nóng)業(yè)工程學(xué)報,2016,32(22):113-120. Gao Lin, Yang Guijun, Yu Haiyang, et al. Retrieving winter wheat leaf area index based on unmanned aerial vehicle hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(22): 113-120. (in Chinese with English abstract)
[11] 田明璐,班松濤,常慶瑞,等. 基于無人機(jī)成像光譜儀數(shù)據(jù)的棉花葉綠素含量反演[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2016,47(11):285-293.Tian Minglu, Ban Songtao, Chang Qingrui, et al. Estimation of SPAD value for cotton leaf using hyperspectral images from UAV based imaging spectroradiometer[J] . Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(11): 285-293. (in Chinese with English abstract)
[12] 秦占飛,常慶瑞,謝寶妮,等. 基于無人機(jī)高光譜影像的引黃灌區(qū)水稻葉片全氮含量估測[J]. 農(nóng)業(yè)工程學(xué)報,2016,32(23):77-85. Qin Zhanfei, Chang Qingrui, Xie Baoni, et al. Rice leaf nitrogen content estimation based on hysperspectral imagery of UAV in Yellow River diversion irrigation district[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(23): 77-85. (in Chinese with English abstract)
[13] 郭超凡,郭逍宇. 基于可見光波段包絡(luò)線去除的濕地植物葉片葉綠素估算[J]. 生態(tài)學(xué)報,2016,36(20):6538-6546. Guo Chaofan, Guo Xiaoyu. Estimation of wetland plant leaf chlorophyll content based on continuum removal in the visible domain[J]. Acta Ecologica Sinica, 2016, 36(20): 6538-6546.
[14] 劉克,趙文吉,郭逍宇,等. 基于濕地植物光譜的水體總氮估測[J]. 生態(tài)學(xué)報,2012,32(8):2410-2419. Liu Ke, Zhao Wenji, Guo Xiaoyu, et al. Estimating total nitrogen content in water body based on reflectance from wetland vegetation[J]. Acta Ecologica Sinica, 2012, 32(8): 2410-2419. (in Chinese with English abstract)
[15] Guo C, Guo X. Estimating leaf chlorophyll and nitrogen content of wetland emergent plants using hyperspectral data in the visible domain[J]. Spectroscopy Letters, 2016, 49(3): 180-187.
[16] Tan Kun, Ye Yuanyuan, Du Peijun, et al. Estimation of heavy metal concentrations in reclaimed mining soils using reflectance spectroscopy[J]. Spectroscopy and Spectral Analysis, 2014, 34(12): 3317-3322.
[17] Blackburn G A, Ferwerda J G. Retrieval of chlorophyll concentration from leaf reflectance spectra using wavelet analysis[J]. Remote Sensing of Environment, 2008, 112(4): 1614-1632.
[18] 王迅,劉書杰,賈海峰,等. 基于高光譜數(shù)據(jù)的高寒草地營養(yǎng)狀況的研究[J]. 光譜學(xué)與光譜分析,2012,32(10): 2780-2784. Wang Xun, Liu Shujie, Jia Haifeng, et al. Study on the nutrition of alpine meadow based on hyperspectral data[J]. Spectroscopy and Spectral Analysis, 2012, 32(10): 2780-2784. (in Chinese with English abstract)
[19] 崔紅霞. 定量遙感反演策略與算法的幾個問題[D]. 北京:北京師范大學(xué),2005.
[20] Lunetta R S, Congalton R G, Fenstermaker L K, et al. Remote sensing and geographic information system data integration: Error sources and research issues[J]. Photogrammetric Engineering & Remote Sensing, 1991, 57(6): 677-687.
[21] 萬國棟,胡發(fā)成,周順成. 應(yīng)用灰色系統(tǒng)理論評價草地質(zhì)量初探[J]. 草業(yè)科學(xué),1997,14(2):5-8. Wan Guodong, Hu Facheng, Zhou Shuncheng. Applying grey system to evaluate grassland quality[J]. Pratacultural Science, 1997, 14(2): 5-8. (in Chinese with English abstract)
[22] 曾洪光. 牧草品質(zhì)綜合評定概述[J]. 四川畜牧獸醫(yī),2001,28(9):40. Zeng Hongguang. Overvierw of comprehensive evalution of pasture quality[J]. Sichuan Animal & Veterinary Sciences. 2001, 28(9): 40. (in Chinese with English abstract)
[23] Wong S C, Barhorst A A. Parameter identification of nonlinear hybrid parameter multibody dynamic system with contacts using a polynomial interpolated taylor series method[C]// ASME 2005 International Design Engineering Technical Conferences and Computers and Information in Engineering Conference. 2005: 591-600.
[24] 孫彬,牛荻濤,王慶霖. 基于區(qū)間分析的銹蝕鋼筋混凝土結(jié)構(gòu)使用壽命預(yù)測[J]. 建筑結(jié)構(gòu)學(xué)報,2012,33(6):110-115. Sun Bin, Niu Ditao, Wang Qinglin. Service life prediction of corroded RC structures based on interval analysis[J]. Journal of Building Structures, 2012, 33(6): 110-115. (in Chinese with English abstract)
[25] 白敬,徐友,魏新華,等. 基于光譜特性分析的冬油菜苗期田間雜草識別[J]. 農(nóng)業(yè)工程學(xué)報,2013,29(20):128-134. Bai Jing, Xu You, Wei Xinhua, et al. Weed identification from winter rape at seedling stage based on spectrum characteristics analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(20): 128 -134. (in Chinese with English abstract)
[26] Mika S, Ratsch G, Weston J, et al. Fisher discriminant analysis with kernels[C]// Neural Networks for Signal Processing IX, 1999. Proceedings of the 1999 IEEE Signal Processing Society Workshop. IEEE, 2002: 41-48.
[27] 艾金泉,陳文惠,羅麗娟,等. 入侵種互花米草的光譜分層分析方法[J]. 測繪科學(xué),2015,40(10):118-122. Ai Jinquan, Chen Wenhui, Luo Lijuan, et al. Spectral discrimination of the invasive species spartina alterniflora based on the measured hyperspectral data[J]. Science of Surveying & Mapping, 2015, 40(10): 118-122. (in Chinese with English abstract)
[28] Yang C M. Assessment from infrared thermograms of nitrogen status in rice plants as affected by air temperature[J]. Journal of Agricultural Meteorology, 2016, 60(5): 1005-1008.
[29] Kleinebecker T, Schmidt S R, Fritz C, et al. Prediction of delta(13)C and delta(15)N in plant tissues with near-infrared reflectance spectroscopy[J]. New Phytologist, 2009, 184(3): 732-739.
[30] Isaac R A, Johnson W C. Near infrared reflectance spectroscopic determination of protein nitrogen in plant tissu[J]. J Assoc Off Anal Chem, 1984, 67(67): 506-509.
[31] Raun W R. Evaluation of green, red, and near infrared bands for predicting winter wheat biomass, nitrogen uptake, and final grain yield [J]. Journal of Plant Nutrition, 2005, 27(8): 1431-1441.
[32] 張愛武,鄢文艷,郭超凡. 基于高光譜圖像的牧草粗蛋白含量反演模型[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(3):188-194. Zhang Aiwu, Yan Wenyan, Guo Chaofan. Inversion model of pasture crude protein content based on hyperspectral image[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2018, 34(3): 188-194. (in Chinese with English abstract)
Improving remote sensing estimation accuracy of pasture crude protein content by interval analysis
Zhang Aiwu1,2, Guo Chaofan1,2※, Yan Wenyan1,2
(1.100048,; 2.100048,)
Crude protein is the key indication for evaluation of the quality and feeding value of pasture grass. Estimating crude protein content of pasture grass is necessary for monitoring grassland nutrition status, sustainable utilization and management of grassland resources, eventually preventing grassland degradation. Hyperspectral remote sensing technology is supplied as a new approach for scientists to study properties and processes of ecosystems and their inner biochemical content variation. In view of the limitation of ground remote sensing and astronautics remote sensing, we try to construct estimation model of pasture crude protein content based on the hyperspectral aerial airship imaging system, in order to meet the application needs of smart animal husbandry. In view of the uncertainty problems of traditional biochemical parameter inversion models and practical application needs in agriculture and animal husbandry production, we propose a multi-step pasture crude protein content estimation model, which combined the equal width interval division method, stepwise discriminant analysis and Fisher discriminant method. An experiment was designed to determine whether pasture crude protein content could be predicted by means of the developed strategy. Jinyintan grassland, a typical prairie in Haiyan County, Qinghai Province was chosen as the research area. The hyperspectral data were acquired with the hyperspectral mapping system installed on an airship (named ASQ-HAA380), which was developed by our research group. Pasture crude protein samples were collected at the same time and analyzed in Qinghai University. The results show that the proposed model can accurately estimate the crude protein content of pasture. The test accuracy of the 3 models with different interval numbers (3, 5, and 7) for all samples is 95%, 95% and 85% respectively, while their corresponding cross-check accuracy is 90%, 80% and 65% respectively. Compared with the traditional stepwise linear regression method, the estimation accuracy also has a great improvement (overall test accuracy is increased by 18.7%-70%, and cross test accuracy is increased by 20%-62.5%). The selected bands of the 3 models with different interval numbers (3, 5, and 7) are 870, 815, 802, 737, 391 nm; 988, 391, 398, 405, 548 nm; and 870, 815, 946, 888, 839 nm respectively. In addition, we can adjust content interval range according to different application requirements. And our experimental results indicate that the model accuracy is inversely proportional to interval number. In general, this paper has successfully realized the accurate estimation of the crude protein content of pasture with hyperspectral aerial airship imaging data, which provides reference and technical basis for quantitative estimation of crude protein content and efficient implementation of precision livestock husbandry based on hyperspectral images, and also lays the foundation for the development of intelligent livestock husbandry in the future.
spetrum analysis;protein; remote sensing; unmanned aerial airship; hyperspectral image; pasture; interval analysis
10.11975/j.issn.1002-6819.2018.14.019
TP79
A
1002-6819(2018)-14-0149-08
2018-03-13
2018-06-13
國家自然科學(xué)基金面上項目(NSFC 41571369);青海省科技計劃項目(2016-NK-138);北京市長城學(xué)者(CIT&TCD20150323)
張愛武,教授,博士生導(dǎo)師,主要研究方向為定量遙感。Email:zhangaw@163.com.
郭超凡,博士生,主要研究方向為定量遙感。Email:guochao881016@163.com
張愛武,郭超凡,鄢文艷.區(qū)間優(yōu)化提高牧草粗蛋白含量遙感估算精度[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(14):149-156. doi:10.11975/j.issn.1002-6819.2018.14.019 http://www.tcsae.org
Zhang Aiwu, Guo Chaofan, Yan Wenyan.Improving remote sensing estimation accuracy of pasture crude protein content by interval analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(14): 149-156. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.14.019 http://www.tcsae.org