康孝巖,張愛武
·農(nóng)業(yè)信息與電氣技術(shù)·
多粒度光譜特征的牧草粗蛋白含量高光譜遙感估算
康孝巖,張愛武※
(1.首都師范大學(xué)三維信息獲取與應(yīng)用教育部重點(diǎn)實(shí)驗(yàn)室,北京 100048;2.首都師范大學(xué)空間信息技術(shù)教育部工程研究中心,北京 100048)
快速準(zhǔn)確地估算牧草粗蛋白(crude protein, CP)含量是開展草原牧草生長(zhǎng)監(jiān)測(cè)和管理的重要內(nèi)容之一。高光譜數(shù)據(jù)是牧草CP含量監(jiān)測(cè)的理想數(shù)據(jù)源,然而,現(xiàn)有牧草CP含量高光譜反演方法缺乏對(duì)光譜多粒度信息的有效利用。針對(duì)該問題,提出一種新的多粒度光譜特征提取方法MGSS(multi-granularity spectral segmentation),以青海高原典型牧場(chǎng)為樣區(qū),對(duì)MGSS估算牧草CP含量的有效性進(jìn)行驗(yàn)證。結(jié)果表明:1)在相同數(shù)量的自變量下,MGSS均能取得優(yōu)于原始光譜的CP含量估測(cè)性能;2)MGSS最優(yōu)估測(cè)模型的決定系數(shù)(coefficient of determination,2)、均方根誤差(root mean squared error, RMSE)和平均相對(duì)誤差(mean relative error, MRE)分別為0.937、1.906 g/m2和8.82%,比原始光譜最優(yōu)模型的2高0.06,RMSE和MRE分別低0.75 g/m2和1.37個(gè)百分點(diǎn)。可知,MGSS實(shí)現(xiàn)了高光譜影像對(duì)牧草CP含量的高性能估算,相比原始光譜性能更優(yōu),驗(yàn)證了其有效性,可為牧草CP含量的準(zhǔn)確估算提供新的技術(shù)手段。
光譜分析;蛋白質(zhì);遙感;牧草;粗蛋白;無人機(jī);高光譜影像;多粒度光譜特征;青海湖盆地
牧草的營養(yǎng)價(jià)值是決定放牧牲畜產(chǎn)出質(zhì)量和數(shù)量的決定因素,而粗蛋白(crude protein, CP)含量則是衡量牧草營養(yǎng)價(jià)值的重要指標(biāo)之一[1-2],提高牧草CP含量可以有效改善牧草的品質(zhì)[3]。
牧草CP的監(jiān)測(cè)是合理放牧和草地管理的基礎(chǔ)工作之一[4]。長(zhǎng)期以來,通過原位采樣+實(shí)驗(yàn)室分析的手段可以獲取草地樣方牧草CP的精確含量,但該方案的成本較高,樣方數(shù)量有限,時(shí)效性較差[5-6]。隨著遙感技術(shù)的發(fā)展,人們開始通過探求牧草冠層光譜與CP含量的定量關(guān)系,從而快速和非破壞性地估算牧草CP含量,可分為近景高光譜估算[5-9]、星載多光譜影像估算[10-12]和無人機(jī)高光譜影像估算[13-16]等3類。其中,近景遙感常運(yùn)用手持光譜儀獲取草地冠層的精細(xì)光譜,選擇敏感光譜指數(shù)[5,7,9]或敏感波段[8-9]構(gòu)建估算模型,精度較高(決定系數(shù)2可達(dá)0.76~0.84),但此類“點(diǎn)尺度”解決方案難以高效率和低成本地實(shí)現(xiàn)大范圍草場(chǎng)牧草CP的評(píng)估[13]。而星載遙感可快速獲取大范圍牧草的冠層光譜影像,但其對(duì)CP含量估算的精度相對(duì)偏低(最優(yōu)模型2為0.44~0.71)[10-12],且中等分辨率(20~100 m)和較長(zhǎng)的重訪周期難以滿足精準(zhǔn)牧業(yè)的基本需求[13]。近年來,通過無人機(jī)(UAV, unmanned aerial vehicle)平臺(tái)可方便獲取高空間分辨率的高光譜影像,可滿足精準(zhǔn)牧業(yè)的需要[14-16]。
作為一種側(cè)重于波形信息提取的方法框架,多粒度光譜特征提取能夠有效抑制光譜噪聲,并獲取一些光譜弱信息,從而構(gòu)建出高精度的反演模型(最優(yōu)模型2可達(dá)0.94~0.99)[17-20],其實(shí)現(xiàn)技術(shù)主要有小波變換[17-18]和經(jīng)驗(yàn)?zāi)B(tài)分解[19-20]等。Cheng等發(fā)現(xiàn)葉片光譜的多粒度小波系數(shù)能夠顯著提升葉片含水率的反演精度(最優(yōu)模型的2高達(dá)0.99)[17];付萍杰等利用多粒度經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)玉米葉片光譜進(jìn)行降噪和重構(gòu),實(shí)現(xiàn)了重金屬元素(銅和鉛)的準(zhǔn)確反演(最優(yōu)模型的2為0.936)[20]。
由上可知,成像和非成像光譜數(shù)據(jù)是當(dāng)前牧草CP含量估算的主流數(shù)據(jù)源,Thenkabail和Lyon明確指出高光譜數(shù)據(jù)是牧草監(jiān)測(cè)的理想數(shù)據(jù)[21]。當(dāng)前,在高光譜估算牧草CP的諸多方案中,通常利用冠層光譜的降維[4,8,10](敏感波段選擇和特征提取等)、衍生光譜[13,15](光譜導(dǎo)數(shù)和光譜積分等)和植被指數(shù)[5-7,9,14,16]等信息作為回歸分析的輸入,而忽略了牧草光譜的多粒度特征這一重要信息。針對(duì)該問題,本文將多粒度光譜分析技術(shù)引入到牧草CP含量的估算研究中,擬提出一種新的多粒度光譜特征提取方法,并結(jié)合序列前向選擇(SFS, sequential forward selection)方法[22],提出一種新的牧草CP含量估算的解決方案,對(duì)比原始光譜,探討不同方法的反演效果,以期為牧草CP含量的高精度估算提供一種新的技術(shù)手段。
研究區(qū)位于青海省海晏縣西海鎮(zhèn)東北部(37°00′18″N~37°00′24″N,100°55′6″E~100°55′21″E)(圖1),總面積約為3.98 hm2。研究區(qū)地處祁連山環(huán)青海湖盆地,屬高原大陸性氣候,是中國溫性草原與高寒草甸草原的過渡地帶,海拔高度3 100~3 150 m。牧草主要有蒿草、針茅草、芨芨草和賴草等。
圖1 研究區(qū)及采樣點(diǎn)分布
使用搭載于大疆經(jīng)緯M600無人機(jī)上的課題組組裝研發(fā)的高光譜傳感器系統(tǒng)ASQ-Hyper192,于2018年7月31日11: 00在牧場(chǎng)樣區(qū)采集牧草冠層的高光譜影像,當(dāng)天天氣晴朗無風(fēng),光照強(qiáng)度穩(wěn)定。無人機(jī)航高100 m,影像空間分辨率約為10 cm;光譜范圍為470~930 nm,共有149個(gè)有效波段;輻射分辨率為8 bits。
試驗(yàn)場(chǎng)共布設(shè)了7個(gè)地面控制點(diǎn),架設(shè)一臺(tái)GPS基站,采用RTK(real-time kinematic)方法精確測(cè)定每個(gè)控制點(diǎn)的三維坐標(biāo);布設(shè)有4塊定標(biāo)板,反射率分別為5%、20%、40%和60%。首先,根據(jù)利用POS(position and orientation system, GPS/INS)數(shù)據(jù)對(duì)原始高光譜影像進(jìn)行拼接和幾何粗校正;然后利用地面控制點(diǎn)進(jìn)行幾何精校正;最后,采用經(jīng)驗(yàn)線性法對(duì)影像進(jìn)行輻射定標(biāo),得到測(cè)區(qū)牧草冠層的反射光譜影像。
在無人機(jī)高光譜影像采集時(shí),同步開展了牧草采樣工作。首先,設(shè)置0.5 m×0.5 m的樣方,利用RTK方法測(cè)量樣方中心點(diǎn)坐標(biāo);然后,對(duì)樣方內(nèi)的牧草齊地面刈割,裝袋密封。委托北京市農(nóng)林科學(xué)院北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測(cè)技術(shù)研究中心[23]測(cè)定牧草樣本的CP含量(g/m2)等指標(biāo)。在剔除粗差點(diǎn)和測(cè)區(qū)外點(diǎn)后,共有30個(gè)有效采樣點(diǎn)(圖1)。以樣方中心點(diǎn)坐標(biāo)所對(duì)應(yīng)的影像像素為中心,取5×5的鄰域像素塊(0.5 m×0.5 m)作為該樣方的牧草冠層反射光譜圖像,以其均值光譜作為樣方牧草的冠層反射光譜。
1.4.1 多粒度光譜分割特征
由最小二乘法可知,光譜的單值曲線為其光譜均值曲線,可用于表達(dá)光譜的整體特性;光譜二值曲線則常用于光譜粗分類等方向[24]。顯然,光譜單值和二值曲線均是對(duì)光譜信息的粗略提取,其殘差中含有大量損失的信息。本研究假設(shè),通過對(duì)光譜殘差信息的循環(huán)提取,可以降低光譜信息的損失,同時(shí)產(chǎn)生多個(gè)新的光譜特征。
文獻(xiàn)[25]提出一種多級(jí)殘差量化的技術(shù),用于計(jì)算機(jī)視覺領(lǐng)域圖像分類的網(wǎng)絡(luò)簡(jiǎn)化和加速,取得了較好的效果。多級(jí)殘差量化屬于函數(shù)逼近理論(approximation theory of functions),可對(duì)殘差進(jìn)行多級(jí)信息的提取[24]?;诖耍疚奶岢鲆环N新的多粒度光譜特征,即多粒度光譜分割(MGSS, multi-granularity spectral segmentation),其解算過程如下。
以隨機(jī)選擇的一個(gè)牧草樣方(圖1)的冠層光譜(圖2a)為例,顯然由=149個(gè)值域?(0,1)的反射率數(shù)值構(gòu)成,即=[1,2,…,s]T,0<s<1,1≤≤。假設(shè)存在一條與等長(zhǎng)的序列0,即0也由149個(gè)數(shù)值組成,同時(shí)0滿足以下條件:1)0=00;2)0為一個(gè)正實(shí)數(shù);3)0為一個(gè)與0等長(zhǎng)的序列,且僅由-1和1組成。則當(dāng)0與的歐氏距離最小時(shí),本文稱0為在粒度0上的分割特征,稱0=0為在粒度0上的殘差特征。該過程可表達(dá)為
首先,將殘差0視作一條新的廣義光譜(光譜值可以為負(fù)值),并對(duì)其進(jìn)行如式(1)和(2)的近似光譜求解,可得到光譜在粒度1上的分割特征1和殘差特征1。然后,將1視作一條新的廣義光譜,求解2和2。如此,通過R解算S+1和R+1,為非負(fù)整數(shù),便可得到的多粒度分割特征MGSS(S)和殘差特征(R)。
圖2 牧草冠層光譜的多粒度光譜分割及殘差特征
由上可知,0實(shí)質(zhì)上是原始光譜的均值SM,;0=00為光譜的單值(均值)曲線,信息量極低;而0=?0實(shí)際上是原始光譜去均值化后的結(jié)果,信息量等同于原始光譜。為了論述的簡(jiǎn)潔性,下文將作如下約定:
1)將(0+1)統(tǒng)稱為粒度1上的MGSS特征,即1(圖2b),而其他粒度保持不變(圖2c~2l);
2)對(duì)任意粒度下的特征,稱其中的每個(gè)值為對(duì)應(yīng)波長(zhǎng)上的分量,如光譜的粒度3分割特征的720 nm上的分量值為0.026 1(圖2f)。
通常,特征提取方法傾向于獲取多個(gè)相互獨(dú)立或弱相關(guān)的特征,如主成分分析(PCA, principal component analysis)和獨(dú)立成分分析(ICA, independent component analysis)等。一般來說,特征之間的相關(guān)性越小,值越大,則其二者的相互獨(dú)立性越強(qiáng)[26-27];因此,以粒度1~32為例,基于不同粒度特征之間的相關(guān)分析結(jié)果(圖3),本文比較了2種多粒度光譜特征的優(yōu)劣。
圖3 牧草冠層光譜的多粒度光譜特征之間的Pearson相關(guān)分析
由圖3可見,1)光譜的MGSS特征之間的相關(guān)性明顯低于殘差特征,前者相關(guān)系數(shù)介于(?0.3,0.3)之間的占76.21%(圖3a),而后者相關(guān)系數(shù)介于(0.8,1)之間的占78.23%(圖3c);前者相關(guān)分析值≥0.05的占48.99%(圖3b),而后者的所有值均接近于零值(圖3d)。換言之,MGSS各粒度特征之間的獨(dú)立性較強(qiáng),且顯著高于殘差特征。2)相對(duì)而言,MGSS特征之間獨(dú)立性與粒度距離呈現(xiàn)正相關(guān),即兩粒度之間的距離越大,則其獨(dú)立性越強(qiáng),如粒度7和9之間的相關(guān)系數(shù)=0.655 8 (=0),獨(dú)立性較弱;而粒度5和26之間的=0.036 3(=0.660 4),獨(dú)立性較強(qiáng)。
對(duì)研究區(qū)的其他樣方光譜和非樣方光譜進(jìn)行了上述分析,均表現(xiàn)出近似的結(jié)果,驗(yàn)證了MGSS特征分析方法的穩(wěn)定性。因此,本文將著重探討光譜的MGSS特征及其分量對(duì)牧草CP估算的有效性。
1.4.2 MGSS特征的分量選擇方法
通常在冠層光譜的諸多定量應(yīng)用中,需要對(duì)光譜的波段進(jìn)行篩選,以消除Hughes問題[13,21,26-27]。隨著粒度的增加,MGSS特征及其分量的數(shù)量成倍增加;類似地,也需要對(duì)MGSS特征的敏感分量進(jìn)行選擇。本文選用序列前向選擇SFS方法[22]對(duì)MGSS進(jìn)行分量篩選,SFS由空分量集開始,在其后的每一次篩選中,選擇原特征分量集合中一個(gè)最優(yōu)分量(即該分量與已選分量組成的分量集合具有最高的牧草CP估算性能),并將其添加到入選分量集中,然后進(jìn)入下一循環(huán),直到入選分量數(shù)量或分量組合性能達(dá)到要求。SFS可表述為:
假設(shè)原始分量集有個(gè)分量,已入選的個(gè)分量組成分量集F,未入選的-個(gè)分量表示為f,= 1,2,…,-,若f滿足:
式中函數(shù)F表示分量組合的牧草CP預(yù)測(cè)精度。那么,第+1個(gè)入選分量為f, 1≤≤?。
為便于與原始光譜做比較,本文對(duì)原始光譜的波段和MGSS每個(gè)粒度特征的分量進(jìn)行了相同數(shù)量的SFS篩選。
1.4.3 反演模型及精度驗(yàn)證
本文選擇2種回歸分析模型,即多元逐步線性回歸(SMLR, stepwise multivariate linear regression)和偏最小二乘回歸(PLSR, partial least squares regression),來構(gòu)建牧草CP的反演模型。采用留一交叉驗(yàn)證法(LOOCV, leave one out of cross validation),進(jìn)行回歸模型的訓(xùn)練和評(píng)價(jià)。
研究選用測(cè)量值與預(yù)測(cè)值之間的線性決定系數(shù)2[28]、均方根誤差(RMSE, root mean square error)[29]和平均相對(duì)誤差(MRE, mean relative error)[30]等3種評(píng)價(jià)指標(biāo)。
2.1.1 牧草CP與MGSS的相關(guān)分析
首先,對(duì)研究區(qū)牧草CP含量與原始光譜各波段、光譜MGSS特征各分量之間的相關(guān)性進(jìn)行了統(tǒng)計(jì)(圖4),探討MGSS特征的敏感分量和光譜的敏感波段的異同。
其次,構(gòu)建完整的植物群落結(jié)構(gòu)研究體系。針對(duì)不同區(qū)域、不同場(chǎng)地的城鄉(xiāng)環(huán)境,將研究視角放在“點(diǎn)”“線”“面”的逐級(jí)深化研究,深入研究民居單體與聚落群體之間、植物特性與植被群體組合之間的植物搭配文化,完善本地民居的植物群落結(jié)構(gòu)的搭配文化。
圖4 牧草冠層光譜的不同變量(波段/特征分量)與CP含量的相關(guān)性
由圖4可見,1)原始光譜在紅邊(680~760 nm)和近紅外波段區(qū)間上與牧草CP的相關(guān)性最為突出(圖4a):在紅邊波段上,隨波長(zhǎng)的增加由弱相關(guān)急劇增大到強(qiáng)相關(guān)(?0.618 5);接著在近紅外波段區(qū)間上呈現(xiàn)穩(wěn)定的強(qiáng)相關(guān)。這與Knyazikhin等的研究結(jié)果具有一致性[31],文獻(xiàn)[31]指出植物氮含量與冠層反射率在近紅外上呈顯著負(fù)相關(guān)。2)整體上看,MGSS的敏感特征分量主要集中于紅邊波段(所有粒度)和近紅外波段(前2個(gè)粒度),這點(diǎn)與原始光譜的情況相似;而在其他位置上也散布著少量敏感分量,如粒度3~32上的非紅邊范圍分量中,||>0.50的特征分量約占1%。就||>0.50的波段/特征分量數(shù)量而言,原始光譜有71個(gè),而MGSS多達(dá)279個(gè)(占分量總數(shù)量的5.85%)。總的來說,MGSS對(duì)牧草CP敏感的特征分量具有集聚性與散布性共存,且稀疏性較高的特點(diǎn),便于開展敏感分量篩選。3)就單一粒度下的特征分量而言,前兩個(gè)粒度的敏感分量最為集中,二者在近紅外波段均表現(xiàn)出與原始光譜相似的穩(wěn)定強(qiáng)相關(guān)性;但其他粒度下的敏感分量與原始光譜有著較大的差異,除在紅邊中心(720 nm)附近有少量聚集的敏感分量外,其他敏感分量均散布在整個(gè)光譜上。
故而,從與牧草CP的相關(guān)分析來看,1)與原始光譜相比,MGSS特征有著更多的敏感分量,后者敏感分量數(shù)量約為前者敏感波段數(shù)量的4倍。2)原始光譜敏感波段皆位于紅邊和近紅外譜段,波段之間的獨(dú)立性較低,冗余度較高,而MGSS的敏感分量除了紅邊-近紅外譜段外,在其他譜段上散布有少量敏感特征分量,波長(zhǎng)差距較大,獨(dú)立性較強(qiáng)。
2.1.2 MGSS的敏感分量組合分析
波段/特征分量與牧草CP的相關(guān)分析結(jié)果能夠反映出單個(gè)波段/特征分量的反演性能,但并不能有效推斷出多波段/特征分量組合的反演能力。這是因?yàn)椴ǘ?特征分量之間有著不同程度的信息重疊、冗余以及相關(guān)性,從而,獨(dú)立性強(qiáng)的弱敏感分量組合的反演性能未必低于獨(dú)立性弱的強(qiáng)敏感分量組合。依照上文提及的SFS方法,對(duì)原始光譜進(jìn)行波段選擇,對(duì)MGSS各個(gè)粒度特征進(jìn)行分量選擇,以前10個(gè)敏感波段/分量組合為例,其結(jié)果如圖5所示。
圖5 牧草CP的敏感波段組合(原始光譜)和敏感分量組合(MGSS)的對(duì)比
可見,1)原始光譜的組合敏感波段均勻分布在橙色-紅色-近紅外短波(O-R-NIR)上,值得注意的是,選擇的第6波段為弱敏感的橙色光(608 nm,=0.223 1),而非紅邊-近紅外短波(RE-NIR)上的70個(gè)強(qiáng)敏感波段(||>0.50)之一。這說明,組合敏感波段不僅僅考慮單一波段的性能,還要衡量波段之間的獨(dú)立性和冗余度。2)就MGSS而言,粒度1下的組合敏感分量?jī)H選出3個(gè),這意味著添加其他任一分量作為組合的第4分量均會(huì)使新組合的性能低于原組合;然而,粒度1特征的強(qiáng)敏感分量遠(yuǎn)多于3個(gè)(圖4b),因此,可推斷這些強(qiáng)敏感分量因具有極高的冗余度和相關(guān)性而不被選擇。3)在粒度2~32上,組合敏感分量均為10個(gè),不同粒度特征的組合分量分布具有較大的差異,如粒度2的組合分量相對(duì)均勻地分布在紅邊之前的各色波譜上(470~680 nm),粒度3的組合分量在除青色光之外的其他波譜區(qū)間上均有分布,而粒度29在各色波譜上均有分布。4)可以明顯看出,多數(shù)粒度的敏感分量組合的前3個(gè)分量聚集在紅邊范圍內(nèi)或附近,形成一條明顯的條帶(710~730 nm,與圖4b的強(qiáng)相關(guān)分量條帶對(duì)應(yīng)),這顯示了紅邊在MGSS分量分析中的重要作用。
總的來看,與原始光譜的組合敏感波段對(duì)比,MGSS特征的組合敏感分量在光譜范圍上分布更廣;MGSS可揭示不同波段對(duì)牧草CP含量響應(yīng)的顯著粒度,拓展了光譜的利用范圍;同時(shí),MGSS也反映出一些經(jīng)典植被光譜學(xué)中的規(guī)律,如紅邊效應(yīng),并為其增添了新的內(nèi)涵。
2.2.1 基于MGSS敏感分量的SMLR模型
利用原始光譜和MGSS各粒度特征,在SFS組合敏感波段和分量篩選結(jié)果的基礎(chǔ)上,開展了樣區(qū)牧草CP含量的SMLR估算模型的訓(xùn)練以及評(píng)價(jià)。本文選擇了估算性能較好的前10種粒度,展示如表1。
表1 基于多元逐步線性回歸的牧草CP估算模型評(píng)價(jià)
基于SLMR的牧草CP估算結(jié)果總體上表明,G28優(yōu)于原始光譜,且相對(duì)穩(wěn)定;而G21和G23等粒度與原始光譜性能近似。初步驗(yàn)證了MGSS在牧草CP估算上的有效性,前3或5個(gè)敏感分量組合中,均有優(yōu)于和近似于原始光譜敏感波段組合CP估算性能的粒度,體現(xiàn)了MGSS性能的魯棒性。
圖6 不同波段/分量選擇下牧草CP含量的多元線性回歸模型評(píng)價(jià)
2.2.2 基于MGSS敏感分量的PLSR模型
PLSR方法可以利用PCA將多個(gè)具有共線性的特征減少為幾個(gè)不相關(guān)的主成分,從而使反演模型的預(yù)測(cè)能力更強(qiáng),性能更加魯棒[28-29]。利用SFS篩選得到敏感波段組合(原始光譜)和敏感分量組合(MGSS),以選擇的前10個(gè)波段/分量(圖5)為例,將其分別降維至5和7個(gè)主成分,來對(duì)牧草CP含量進(jìn)行PLSR建模和性能評(píng)價(jià)。選擇模型估算性能較好的前10種粒度,如表2所示。
由表2可見,1)與SMLR模型相比,在增加到10個(gè)敏感波段/分量,并進(jìn)行PCA降維后,基于PLSR的牧草CP預(yù)測(cè)模型的性能有了顯著提升。原始光譜在前5或7個(gè)主成分組合下均取得了優(yōu)異的CP估算能力,其中,前7個(gè)主成分組合的PLSR模型(圖7c)比前5敏感波段的SMLR模型(圖6c)在MRE上降低了4.54個(gè)百分點(diǎn),在2上提高了0.123,在RMSE上則降低了1.134 g/m2。而MGSS的牧草CP估算性能的提升更為顯著,前7個(gè)主成分組合的PLSR模型比前5敏感分量的SMLR模型的MRE(10個(gè)粒度均值)低4.36個(gè)百分點(diǎn)。2)與原始光譜模型相比,MGSS有多個(gè)粒度表現(xiàn)出更優(yōu)的性能,如G23在兩種主成分組合下(圖7b和7d)均明顯優(yōu)于原始光譜(圖7a和7c)。G23前7個(gè)主成分組合的模型性能表現(xiàn)最優(yōu),其MRE最低(8.82%),RMSE最?。?.906 g/m2),2最大(0.937),且比原始光譜最優(yōu)模型的RMSE和MRE分別低0.75 g/m2和1.37個(gè)百分點(diǎn),2高0.06。
表2 基于偏最小二乘回歸的牧草CP估算模型評(píng)價(jià)
圖7 不同波段/分量選擇下牧草CP含量的偏最小二乘回歸模型評(píng)價(jià)
在SMLR和PLSR等兩種回歸方法中,G9、G17、G23和G28等4種粒度均表現(xiàn)出較高的反演性能,顯示出MGSS具有適用于多種預(yù)測(cè)分析模型的粒度,也一定程度上反映了MGSS的穩(wěn)定性。
當(dāng)前牧草CP含量高光譜估算的研究多采用降維[4,8,10]、光譜衍生變量[13,15]或植被指數(shù)[5-7,9,14,16]等信息提取技術(shù)構(gòu)建定量模型,估算精度有待提升(多數(shù)方法的最優(yōu)模型2<0.90)。在本研究組的早期研究[13]中,使用光譜衍生變量構(gòu)建了牧草CP含量的非線性回歸模型,其2=0.918,明顯低于本文MGSS的最優(yōu)模型精度2=0.937;并且前期研究中的高光譜影像質(zhì)量(400~1 000 nm,840個(gè)波段)明顯優(yōu)于本研究(470~930 nm,149個(gè)波段)。換言之,在數(shù)據(jù)質(zhì)量相對(duì)劣勢(shì)下,本文MGSS模型精度高于前期研究中高質(zhì)量影像的模型精度,即MGSS模型的魯棒性更高。
現(xiàn)有研究[18]表明,多粒度光譜特征可以提取一些隱藏的弱光譜信息,這對(duì)含量低的理化指標(biāo)的反演具有重要意義,如植物重金屬含量的預(yù)測(cè)[20]等。同時(shí),與原始光譜相比,多粒度光譜特征能夠?yàn)槔砘瘏?shù)的反演提供更多的敏感分量,如本文中牧草CP含量指標(biāo),MGSS敏感分量數(shù)量是原始光譜敏感波段的4倍。
總之,相比于原始光譜,MGSS和多粒度小波系數(shù)等多粒度光譜特征方法能夠?yàn)楦鞣N理化參數(shù)找到其獨(dú)有的敏感分量提供了更多可能性。與經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)[19-20]類似,MGSS是對(duì)原始光譜的自適應(yīng)建模,無其他信息約束,但其是否適用于植被的其他性狀參數(shù)的反演,尚需進(jìn)一步研究。
為保證公平性,本文在牧草CP含量反演的對(duì)比試驗(yàn)中,在自變量選擇方法、選擇數(shù)量和反演模型及其參數(shù)設(shè)定等方面,均使MGSS與原始光譜保持一致。在單一粒度下,MGSS的部分粒度仍達(dá)到了高于或等同于原始光譜的反演精度,但這并未充分利用MGSS的有效特征。而由圖4b和圖5來看,MGSS的敏感分量在各個(gè)粒度下的譜段分布并不相同,若將不同粒度分割特征進(jìn)行組合篩選,其預(yù)測(cè)效果是否會(huì)優(yōu)于單一粒度的最優(yōu)性能,將是接下來的研究重點(diǎn)之一。
本文主要聚焦于MGSS與原始光譜對(duì)牧草CP含量預(yù)測(cè)性能的對(duì)比分析,而未對(duì)多粒度光譜殘差特征給予足夠關(guān)注。圖3表明了多粒度殘差特征的信息冗余高于MGSS,但各粒度MGSS均是由殘差特征量化而來,由此可見,多粒度殘差特征存在高精度預(yù)測(cè)牧草CP含量的可能性,這也是今后有待探討的地方。
利用無人機(jī)成像光譜儀獲取了青海高原典型牧草樣區(qū)的高時(shí)間、空間和光譜分辨率的遙感影像,經(jīng)過拼接、校正和定標(biāo)得到了樣區(qū)牧草冠層的光譜影像,借此研究了牧草CP的估算問題;為了充分利用牧草冠層光譜的多粒度信息,提出了一種新的多粒度光譜特征提取方法,即多粒度光譜分割特征MGSS;利用序列前向選擇SFS獲取了MGSS各粒度特征下的敏感分量組合,基于多元逐步線性回歸SMLR和偏最小二乘回歸PLSR構(gòu)建了牧草CP含量的估測(cè)模型以開展精度評(píng)價(jià),研究結(jié)果表明:
1)MGSS大大提升了牧草光譜的有效特征及其分量的數(shù)量和質(zhì)量,與光譜波段相比,MGSS的特征分量能更加精確地估測(cè)牧草CP含量。其中,基于MGSS/G23特征的前7敏感分量組合訓(xùn)練得到的PLSR模型取得了最優(yōu)的牧草CP含量估算性能,2、RMSE和MRE分別為0.937、1.906 g/m2和8.82%。
2)MGSS各粒度特征及其分量對(duì)牧草CP含量反演的效果不同,敏感分量呈現(xiàn)出集聚性(紅邊范圍)、分散性(非紅邊范圍)和稀疏性(強(qiáng)相關(guān)的單一分量占分量總數(shù)量的5.85%),這些特點(diǎn)有助于敏感分量及其組合的篩選。其中,強(qiáng)敏感分量的集聚性反映了MGSS敏感分量的紅邊特征,這與經(jīng)典植被光譜學(xué)中的“紅邊效應(yīng)”具有內(nèi)在一致性。
借由MGSS的多粒度光譜信息可以從新的維度開展植被光譜的定量應(yīng)用,為牧草CP含量預(yù)測(cè)等植被光譜應(yīng)用提供一種新的解決方案。
[1]Pullanagari R R, Yule I J, Tuohy M P, et al. Proximal sensing of the seasonal variability of pasture nutritive value using multispectral radiometry[J]. Grass and Forage Science, 2013, 68(1): 110-119.
[2]馬維維,鞏彩蘭,胡勇,等. 牧草品質(zhì)的高光譜遙感監(jiān)測(cè)模型研究[J]. 光譜學(xué)與光譜分析,2015,35(10):2851-2855.
Ma Weiwe, Gong Cailan, Hu Yong, et al. Hyperspectral remote sensing estimation models for pasture quality[J]. Spectroscopy and Spectral Analysis, 2015, 35(10): 2851-2855. (in Chinese with English abstract)
[3]鄭凱,顧洪如,沈益新,等. 牧草品質(zhì)評(píng)價(jià)體系及品質(zhì)育種的研究進(jìn)展[J]. 草業(yè)科學(xué),2006,23(5):57-61.
Zheng Kai, Gu Hongru, Shen Yixin, et al. Evaluation system of forage quality and research advances in forage quality breeding[J]. Pratacultural Science, 2006, 23(5): 57-61. (in Chinese with English abstract)
[4]張愛武,郭超凡,鄢文艷. 區(qū)間優(yōu)化提高牧草粗蛋白含量遙感估算精度[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(14):149-156.
Zhang Aiwu, Guo Chaofan, Yan Wenyan. Improving remote sensing estimation accuracy of pasture crude protein content by interval analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(14): 149-156. (in Chinese with English abstract)
[5]Safari H, Fricke T, Wachendorf M. Determination of fibre and protein content in heterogeneous pastures using field spectroscopy and ultrasonic sward height measurements[J]. Computers and Electronics in Agriculture, 2016, 123: 256-263.
[6]Pittman J J, Arnall D B, Interrante S M, et al. Bermudagrass, wheat, and tall fescue crude protein forage estimation using mobile-platform, active-spectral and canopy-height data[J]. Crop Science, 2016, 56(2): 870-881.
[7]Lim J, Kawamura K, Lee H J, et al. Evaluating a hand-held crop-measuring device for estimating the herbage biomass, leaf area index and crude protein content in an Italian ryegrass field[J]. Grassland Science, 2015, 61(2): 101-108.
[8]Zeng L, Chen C. Using remote sensing to estimate forage biomass and nutrient contents at different growth stages[J]. Biomass and Bioenergy, 2018, 115: 74-81.
[9]Noland R L, Wells M S, Coulter J A, et al. Estimating alfalfa yield and nutritive value using remote sensing and air temperature[J]. Field Crops Research, 2018, 222: 189-196.
[10]王迅,劉書杰,賈海峰,等. 基于高光譜數(shù)據(jù)的高寒草地營養(yǎng)狀況的研究[J]. 光譜學(xué)與光譜分析,2012,32(10):2780-2784.
Wang Xun, Liu Shujie, Jia Haifeng, et al. Study on the nutrition of alpine meadow based on hyperspectral data[J]. Spectroscopy and Spectral Analysis, 2012, 32(10): 2780-2784. (in Chinese with English abstract)
[11]Ferreira G, Cayford E L, Feng L, et al. Use of satellite remote-sensing techniques to predict the variation of the nutritional composition of corn () for silage[J]. Maydica, 2018, 61(1): M7.
[12]Lugassi R, Zaady E, Goldshleger N, et al. Spatial and temporal monitoring of pasture ecological quality: Sentinel-2-based estimation of crude protein and neutral detergent fiber contents[J]. Remote Sensing, 2019, 11(7): 799.
[13]張愛武,鄢文艷,郭超凡. 基于高光譜圖像的牧草粗蛋白含量反演模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(3):188-194.
Zhang Aiwu, Yan Wenyan, Guo Chaofan. Inversion model of pasture crude protein content based on hyperspectral image[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(3): 188-194. (in Chinese with English abstract)
[14]Homolová L, Schaepman M E, Lamarque P, et al. Comparison of remote sensing and plant trait-based modelling to predict ecosystem services in subalpine grasslands[J]. Ecosphere, 2014, 5(8): 1-29.
[15]Pullanagari R, Kereszturi G, Yule I. Integrating airborne hyperspectral, topographic, and soil data for estimating pasture quality using recursive feature elimination with random forest regression[J]. Remote Sensing, 2018, 10(7): 1117.
[16]Capolupo A, Kooistra L, Berendonk C, et al. Estimating plant traits of grasslands from UAV-acquired hyperspectral images: a comparison of statistical approaches[J]. ISPRS International Journal of Geo-Information, 2015, 4(4): 2792-2820.
[17]Cheng T, Rivard B, Sánchez-Azofeifa A G, et al. Predicting leaf gravimetric water content from foliar reflectance across a range of plant species using continuous wavelet analysis[J]. Journal of Plant Physiology, 2012, 169(12): 1134-1142.
[18]張競(jìng)成,劉鵬,王斌,等. 基于連續(xù)小波分析的植物理化參數(shù)反演中光譜分辨率影響分析[J]. 紅外與毫米波學(xué)報(bào),2018,37(6):107-114.
Zhang Jingcheng, Liu Peng, Wang Bin, et al. Impact analysis of spectral resolution on retrieving plant biophysical and biochemical parameters based on continuous wavelet analysis[J]. Journal of Infrared and Millimeter Waves, 2018, 37(6): 107-114. (in Chinese with English abstract)
[19]Zhou Z. Super-resolution reconstruction of hyperspectral images using empirical mode decomposition and compressed sensing[J]. Journal of Applied Remote Sensing, 2016, 10(4): 042011.
[20]付萍杰,楊可明,王曉峰,等. 重構(gòu)玉米葉片光譜的銅鉛污染區(qū)分與其含量反演方法[J]. 科學(xué)技術(shù)與工程,2018,18(23):139-150.
Fu Pingjie, Yang Keming, Wang Xiaofeng, et al. Copper-lead pollution distinctions and a content retrieval method for the reconstruction of maize leaf spectra[J]. Science Technology and Engineering, 2018, 18(23): 139-150. (in Chinese with English abstract)
[21]Thenkabail P S, Lyon J G. Hyperspectral remote sensing of vegetation[M]. Boca Raton: CRC press, 2016.
[22]Mendoza F A, Wiesinger J A, Lu R, et al. Prediction of cooking time for soaked and unsoaked dry beans () using hyperspectral imaging technology[J]. The Plant Phenome Journal, 2018, 1(1): 180001.
[23]平華,李楊,李冰茹,等. 基于分散固相萃取-超高效液相色譜串聯(lián)質(zhì)譜法同時(shí)測(cè)定蔬菜中多種除草劑殘留的方法[J]. 中國農(nóng)業(yè)科學(xué),2017,50(21):4159-4169.
Ping Hua, Li Yang, Li Bingru, et al. Simultaneous determination of multi herbicides residues in vegetables by dispersive solid phase extraction and ultra-high performance liquid chromatography-tandem mass spectrometry[J]. Scientia Agricultura Sinica, 2017, 50(21): 4159-4169. (in Chinese with English abstract)
[24]康孝巖,張愛武. 基于高階殘差量化的光譜二值編碼新方法[J]. 光譜學(xué)與光譜分析,2019,39(10):3013-3020.
Kang Xiaoyan, Zhang Aiwu. A novel method for high-order residual quantization-based spectral binary coding[J]. Spectroscopy and Spectral Analysis, 2019, 39(10): 3013-3020. (in Chinese with English abstract)
[25]Li Z, Ni B, Zhang W, et al. Performance guaranteed network acceleration via high-order residual quantization[C]// Proceedings of the IEEE International Conference on Computer Vision, 2017: 2584-2592.
[26]張愛武,杜楠,康孝巖,等. 非線性變換和信息相鄰相關(guān)的高光譜自適應(yīng)波段選擇[J]. 紅外與激光工程,2017,46(5):213-221.
Zhang Aiwu, Du Nan, Kang Xiaoyan, et al. Hyperspectral adaptive band selection method through nonlinear transform and information adjacency correlation[J]. Infrared and Laser Engineering, 2017, 46(5): 213-221. (in Chinese with English abstract)
[27]張愛武,康孝巖.值統(tǒng)計(jì)量建模獨(dú)立性的高光譜波段選擇方法[J]. 紅外與激光工程,2018,47(9):401-409.
Zhang Aiwu, Kang Xiaoyan. Hyperspectral images band selection algorithm through-value statistic modeling independence[J]. Infrared and Laser Engineering, 2018, 47(9): 401-409. (in Chinese with English abstract)
[28]劉帥兵,楊貴軍,景海濤,等. 基于無人機(jī)數(shù)碼影像的冬小麥氮含量反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(11):75-85.
Liu Shuaibing, Yang Guijun, Jing Haitao, et al. Retrieval of winter wheat nitrogen content based on UAV digital image[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(11): 75-85. (in Chinese with English abstract)
[29]Yue J, Yang G, Li C, et al. Estimation of winter wheat above-ground biomass using unmanned aerial vehicle-based snapshot hyperspectral sensor and crop height improved models[J]. Remote Sensing, 2017, 9(7): 708.
[30]李毅念,杜世偉,姚敏,等. 基于小麥群體圖像的田間麥穗計(jì)數(shù)及產(chǎn)量預(yù)測(cè)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(21):185-194.
Li Yinian, Du Shiwei, Yao Min, et al. Method for wheatear counting and yield predicting based on image of wheatear population in field[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(21): 185-194. (in Chinese with English abstract)
[31]Knyazikhin Y, Schull M A, Stenberg P, et al. Hyperspectral remote sensing of foliar nitrogen content[J]. Proceedings of the National Academy of Sciences, 2013, 110(3): E185-E192.
Hyperspectral remote sensing estimation of pasture crude protein content based on multi-granularity spectral feature
Kang Xiaoyan, Zhang Aiwu※
(1.,,,100048,; 2.,,,100048,)
Rapid and accurate estimation of crude protein (CP) content in pasture plays an important role in the monitoring and management of the forage growth on a wide range of grassland. Crude protein contents of pastures are ideal for characterization using hyperspectral data. In view of the limitation of ground and satellite remote sensing, in this paper, we attempted to achieve an accurate estimation of CP content in forage by unmanned aerial vehicle (UAV)-based hyperspectral remote sensing images with high spatial resolution of the pasture canopy. Although the hyperspectral data of the forage have a large number of bands, the reflectance of the canopy spectrum at each band contains information of various parameters which are from atomic level to plant community level. So, when estimating a physicochemical parameter using the spectral data, we may achieve low prediction accuracy because the spectra are affected by other parameters. Compared with the original spectra, multi-granularity spectral features can provide more sensitive features for inversion of chemical parameters. More importantly, multi-granularity spectral features can extract some hidden weak spectral information, which is of great significance for inversion of low-content physical and chemical indicators. However, in current inversion methods of pasture CP content, there is a lack of effective utilization of spectral multi-granularity information. In view of this, we first proposed a novel multi-granularity spectral feature extraction approach named multi-granularity spectral segmentation (MGSS) to segment each canopy spectrum into multiple spectral features. Second, by using the sequential forward selection method, sensitive components of each feature under a granularity can be selected. Finally, based on these selected components of different features, the inversion models of pasture CP content can be established using two regression methods, i.e., the stepwise multivariate linear regression (SMLR) and the partial least squares regression (PLSR). Taking a typical meadowland in Qinghai Plateau as an example, the detailed experimental analyses have been conducted. Results showed that under the same quantity sensitive components for MGSS and sensitive bands for the raw spectra, on the estimation accuracy of pasture CP content, MGSS was superior to the raw spectra. So the validity of MGSS in improving the accuracy of hyperspectral estimation of CP content in forage was verified. Specifically, under Granularity 23 (G23) of MGSS, the PLSR model achieved the best performance. Its determining coefficient (2) was 0.937 which was 0.06 higher than that of the optimal model of the raw spectra. And the root mean square error (RMSE) and the mean relative error (MRE) were 1.906 (g/m2) and 8.82%, respectively, which were 0.75 (g/m2) and 1.37 percentage points lower than those of the optimal model of raw spectra. Moreover, on the single and combined components sensitive to CP content in forage, there were three characteristics among the selected components of MGSS, i.e., the agglomeration within the Red Edge range, the dispersion of non-Red Edge range, and the sparsity of strongly sensitive components, which can be helpful for selecting sensitive components. In conclusion, the proposed MGSS achieved the high performance estimation of CP content in forage by UAV hyperspectral imagery. And compared with the raw spectra, MGSS had better performance. This study provides a new technical means for the accurate estimation of CP content in grasslands in large areas.
spectrum analysis; protein; remote sensing; forage grass; crude protein (CP); unmanned aerial vehicle (UAV); hyperspectral image; multi-granularity spectral feature; Qinghai Lake Basin
康孝巖,張愛武. 多粒度光譜特征的牧草粗蛋白含量高光譜遙感估算[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(23):161-169.doi:10.11975/j.issn.1002-6819.2019.23.020 http://www.tcsae.org
Kang Xiaoyan, Zhang Aiwu. Hyperspectral remote sensing estimation of pasture crude protein content based on multi-granularity spectral feature[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(23): 161-169. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.23.020 http://www.tcsae.org
2019-08-15
2019-10-01
國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFB0502500);國家自然科學(xué)基金(41571369);北京市自然科學(xué)基金(4162034);青海省科技計(jì)劃項(xiàng)目(2016-NK-138)
康孝巖,博士生,主要從事遙感機(jī)理與植被遙感應(yīng)用研究。Email:xy.kang@cnu.edu.cn; xy.muap.kxy@gmail.com
張愛武,博士,教授,博士生導(dǎo)師,主要從事高光譜成像及農(nóng)業(yè)定量遙感研究。Email:zhangaw@163.com
10.11975/j.issn.1002-6819.2019.23.020
O433.3; TP751
A
1002-6819(2019)-23-0161-09