紀(jì)偉帥,陳紅艷,王淑婷,張玉婷
(1山東農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,山東泰安271018;2東營市自然資源和規(guī)劃局墾利分局,山東東營257500)
棉花是世界上重要的經(jīng)濟(jì)作物,在中國及世界經(jīng)濟(jì)發(fā)展中占有重要地位[1-2]。葉綠素是植物光合作用中最重要的色素,葉綠素相對含量(SPAD)是評價棉花長勢的重要指標(biāo),精準(zhǔn)估測棉花葉片SPAD值是監(jiān)測棉田長勢并指導(dǎo)棉田生產(chǎn)與管理的先決條件[3-5]。目前,遙感技術(shù)在農(nóng)作物研究領(lǐng)域被廣泛應(yīng)用,無人機(jī)遙感技術(shù)更是因其機(jī)動靈活、操作簡便、時空分辨率高等優(yōu)勢越來越多地用于農(nóng)情監(jiān)測,利用無人機(jī)搭載光譜傳感器進(jìn)行棉花葉綠素的定量光譜分析已成為研究熱點(diǎn)[6-8]。
中國主要有新疆棉區(qū)、黃河流域棉區(qū)和長江流域棉區(qū)3個產(chǎn)棉區(qū)。新疆棉區(qū)因其地域優(yōu)勢,當(dāng)前區(qū)域內(nèi)開展的棉花葉綠素定量遙感研究較多[9-10];如依爾夏提等[11]基于地面高光譜估算了南疆地區(qū)棉花冠層葉綠素含量,為新疆地區(qū)棉花長勢監(jiān)測提供了手段。黃河流域棉區(qū)主要位于黃河沿岸的平原地帶,如陜北地區(qū)、華北平原地區(qū)等,流域內(nèi)空間跨度大,當(dāng)前該棉區(qū)的棉花葉綠素定量遙感研究主要集中在陜北地區(qū)[12-14];如田明璐等[15]借助無人機(jī)高光譜影像估測了棉花葉綠素含量,為陜北地區(qū)估測棉花冠層生長參數(shù)提供了參考方法??梢姡?dāng)前中國棉花葉綠素定量光譜分析大部分集中在新疆棉區(qū)和黃河流域的陜北棉區(qū),而黃河流域的華北平原和長江流域棉區(qū)的有關(guān)研究比較少見。黃河流域華北平原地區(qū)植棉歷史悠久,自然條件優(yōu)越,棉花品質(zhì)高,產(chǎn)量大,一直是中國重要的商品棉基地。因此,利用無人機(jī)遙感技術(shù)開展該區(qū)棉花葉綠素定量分析研究,監(jiān)測棉田長勢以實(shí)現(xiàn)其精準(zhǔn)管理,對該區(qū)棉花生產(chǎn)具有積極的促進(jìn)作用。
在建模方法方面,當(dāng)前棉花定量遙感模型分為統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)2類,統(tǒng)計(jì)分析是利用棉花生長指標(biāo)與光譜數(shù)據(jù)的線性相關(guān)關(guān)系建立回歸模型[16-18],如陳碩博[12]基于無人機(jī)多光譜影像利用主成分回歸、嶺回歸和偏最小二乘回歸3種方法構(gòu)建了棉花光合參數(shù)的反演模型。但統(tǒng)計(jì)分析模型多用于解決線性問題,對非線性問題預(yù)測能力較低。機(jī)器學(xué)習(xí)是模擬人類學(xué)習(xí)的方式建立棉花生長指標(biāo)與光譜數(shù)據(jù)的關(guān)系模型[19-21],已有學(xué)者對機(jī)器學(xué)習(xí)模型和統(tǒng)計(jì)分析模型進(jìn)行了對比分析,如張卓然等[22]利用單因素回歸分析法和支持向量機(jī)分析法構(gòu)建了棉花葉片SPAD遙感估算模型,結(jié)果表明支持向量機(jī)模型精度較高;李媛媛等[23]利用偏最小二乘回歸、主成分回歸和BP神經(jīng)網(wǎng)絡(luò)建立了玉米葉片葉綠素含量估算模型,對比表明BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果最好??梢?,已有研究表明在作物葉綠素定量光譜分析中,機(jī)器學(xué)習(xí)模型優(yōu)于統(tǒng)計(jì)分析,但針對華北平原棉花葉片SPAD反演,不同建模方法的表現(xiàn)仍需討論,最佳建模方法有待明確。
綜上,中國華北平原地區(qū)棉花葉片SPAD光譜特征以及最佳建模方法有待探明。因此,本研究針對黃河流域華北平原地區(qū),以山東省德州市夏津縣大李莊棉區(qū)為研究區(qū),基于無人機(jī)多光譜近地圖像,探明棉花葉片SPAD的光譜特征,分別采用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、多元逐步回歸等方法構(gòu)建其定量反演模型,并進(jìn)行精度對比分析,優(yōu)選針對該區(qū)棉花葉片SPAD定量近地遙感分析的最佳建模方法,以期豐富華北平原地區(qū)棉田定量遙感理論和技術(shù)。
本研究區(qū)為山東省德州市夏津縣新盛店鎮(zhèn)大李莊村棉田試驗(yàn)區(qū)(東經(jīng)116°1'59",北緯37°3'15″)(圖1)。夏津縣盛產(chǎn)棉花,是中國棉花生產(chǎn)十強(qiáng)縣,享有“銀夏津”之美譽(yù),是國家重要的棉花現(xiàn)貨交易集散中心、國家級優(yōu)質(zhì)棉標(biāo)準(zhǔn)化生產(chǎn)基地。夏津縣地處華北平原黃泛沖積平原,屬暖溫帶半濕潤大陸性季風(fēng)氣候,半濕潤易旱,年降水量平均556.5 mm,且位于黃河流域下游,灌溉充足,作物熟制為一年一熟。大李莊村研究區(qū)種植棉花品種為‘魯研棉37號’,田間管理嚴(yán)格控制變量。研究區(qū)北部棉花葉片枯黃、葉面積小、植被覆蓋率低、長勢較差;南部葉片繁茂、植被覆蓋率高、長勢較好(圖1)。
圖1 大李莊棉田研究區(qū)圖像和現(xiàn)場照片
1.2.1 多光譜影像獲取與預(yù)處理 于2019年8月3日10:00—15:00,利用深圳市大疆創(chuàng)新科技有限公司生產(chǎn)的大疆Matrice 600 Pro?六旋翼無人機(jī)(無人機(jī)飛行載重為6 kg,無風(fēng)環(huán)境下最大飛行水平飛行速度為65 km/h,圖2)搭載Parrot Sequoia農(nóng)業(yè)專用多光譜相機(jī)(含有4個120萬像素窄帶和同步化單色傳感器)獲取研究區(qū)田間無人機(jī)多光譜遙感圖像。相機(jī)傳感器有綠光(波長550 nm,帶寬40 nm)、紅光(波長660 nm,帶寬40 nm)、紅邊光(波長735 nm,帶寬10 nm)和近紅外光(波長790 nm,帶寬40 nm)4個波段。本次研究利用平臺傳感器進(jìn)行航線設(shè)定,并設(shè)定無人機(jī)飛行高度為50 m,空間分辨率為2.2 cm,航速5 m/s,飛行前采集白板數(shù)據(jù)用于后期的輻射校正[17]。無人機(jī)飛行時天氣晴朗,無風(fēng)少云,研究區(qū)棉花正處于花鈴期,長勢旺盛,此時生長狀況有代表性。
圖2 研究區(qū)現(xiàn)場無人機(jī)照片
在影像預(yù)處理階段,分別利用Pix4D mapper、ENVI 5.3、ArcGIS 10.2等軟件完成無人機(jī)近地圖像拼接、輻射校正及正射校正、圖像裁剪、空間校正等工作。預(yù)處理后得到綠光、紅光、紅邊和近紅外4個波段的圖像數(shù)據(jù),按采樣點(diǎn)GPS經(jīng)緯度信息將野外實(shí)測的采樣點(diǎn)位置導(dǎo)入研究區(qū)的假彩色合成波段圖像(圖3),確定其相應(yīng)像元,并提取該像元各波段棉花冠層反射率[17]。
1.2.2 葉片SPAD測量 在研究區(qū)均勻布設(shè)94個采樣點(diǎn)(圖3),采樣工具為SPAD-502型手持式葉綠素儀,在每個樣點(diǎn)隨機(jī)選取不同部位的5片棉花葉片,測定其SPAD值,每個葉片不同部位測量3次取平均值,最后計(jì)算5個葉片的平均值作為該樣點(diǎn)的SPAD值。SPAD測量與無人機(jī)飛行測量同步進(jìn)行。從94個樣點(diǎn)中隨機(jī)抽取62個作為建模集,32個作為驗(yàn)證集。
圖3 研究區(qū)假彩色合成波段影像以及樣點(diǎn)分布圖
將采樣點(diǎn)棉花SPAD的實(shí)測值與圖像各波段反射率進(jìn)行相關(guān)性分析,篩選出特征波段;進(jìn)而組合特征波段,如紅光+近紅、紅光×綠光等,得到27個光譜指數(shù)。背景信息對農(nóng)作物光譜特征有一定的影響,利用光譜指數(shù)可以降低背景信息的干擾,提高數(shù)據(jù)精度。本研究采用了相關(guān)性分析優(yōu)選特征光譜指數(shù)參與建模。
基于64個建模樣本的SPAD及優(yōu)選出的光譜指數(shù),分別采用BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)、多 元 逐 步 回 歸 (multiple stepwise regression,MSR)、支持向量機(jī)(support vector machine,SVM)等方法構(gòu)建棉花葉片SPAD反演模型。運(yùn)用SPSS 22軟件建立棉花葉片SPAD多元逐步回歸模型,在回歸分析的基礎(chǔ)上,讓系統(tǒng)自動篩除不顯著的因變量以提高精度[24-26];支持向量機(jī)是以核函數(shù)為構(gòu)成模塊,隱式地將數(shù)據(jù)映射到高維空間,采用訓(xùn)練集交叉驗(yàn)證和網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu)的算法,這里設(shè)定SVM類型為4(即v-SVR),核函數(shù)類型為2(即RBF),計(jì)算采用Matlab R2014a軟件的Libsvm 3.11工具箱實(shí)現(xiàn)[27];BP神經(jīng)網(wǎng)絡(luò)是按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),其優(yōu)勢是能夠?qū)W習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,并通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小,本研究設(shè)定BP神經(jīng)網(wǎng)絡(luò)模型網(wǎng)絡(luò)參數(shù)隱含層神經(jīng)個數(shù)設(shè)定為4,學(xué)習(xí)速率5%,將特征光譜指數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入層,棉花葉片SPAD作為輸出層,通過Matlab R2014a軟件實(shí)現(xiàn)[28-29]。
利用32個驗(yàn)證樣本檢驗(yàn)?zāi)P筒δP瓦M(jìn)行對比評價,用建模集決定系數(shù)(R2)和均方根誤差(root mean squares error,RMSE)評價建模精度 ;用驗(yàn)證集 R2、RMSE和相對分析誤差(the ratio of prediction to deviation,RPD)等指標(biāo)來評價預(yù)測精度,R2越接近1,RMSE越小,RPD越大,表明模型精度越高。RPD>2.0,則認(rèn)為所建模型具備較高可靠性,能夠用于模型分析[30]。根據(jù)模型精度指標(biāo),優(yōu)選基于無人機(jī)近地圖像的棉花葉片SPAD最佳模型和建模方法。
將研究區(qū)預(yù)處理后的遙感圖像代入最佳模型,利用ENVI 5.3和ArcGIS 10.2軟件進(jìn)行棉花葉片SPAD的空間分布反演,并根據(jù)田明璐等[17]棉花葉片SPAD分級標(biāo)準(zhǔn)進(jìn)行分級得到研究區(qū)SPAD空間分布圖,并與研究區(qū)實(shí)際狀況進(jìn)行對比分析。
全部94個樣本SPAD值介于17.1~ 68.2,平均值為43.315,中位數(shù)為 44,標(biāo)準(zhǔn)差為 8.338;62個建模集SPAD值在18.7~ 62.9,平均值為42.035,中位數(shù)為43.1,標(biāo)準(zhǔn)差為8.162;32個驗(yàn)證集SPAD值為17.1~ 68.2,平均值為45.793,中位數(shù)為47.8,標(biāo)準(zhǔn)差為8.224??梢?,研究區(qū)內(nèi)棉花SPAD整體較高,長勢較好,實(shí)際采樣時北部區(qū)域SPAD值略低于南部,南部長勢更優(yōu);建模集和驗(yàn)證集以及全部樣本集具有高度相似的統(tǒng)計(jì)分布,這樣既可以確保樣本具有代表性,又可避免在模型構(gòu)建和驗(yàn)證中的偏差估計(jì)。
將所有樣本SPAD從小到大排列,按照5.11為一個單位大小將SPAD的值域等分為10個梯度,獲得棉花冠層光譜反射率隨SPAD值的變化曲線(圖4)。由圖4可以看出棉花冠層4個波段反射率值域明顯不同,綠光波段為0.028~ 0.058,紅光波段為0.018~ 0.12,紅邊波段為0.13~ 0.28,近紅外波段為0.32~ 0.64??梢?,紅邊及近紅外波段為SPAD的高反射值區(qū)域;在變化趨勢上,紅光波段反射率表現(xiàn)為隨葉綠素梯度的增加而降低;而在紅邊、綠光和近紅外波段,反射率具體表現(xiàn)為隨SPAD升高,反射率略有升高。光譜波段與棉花葉片SPAD的相關(guān)性(表1)表現(xiàn)為紅光波段>紅邊波段>綠光波段>近紅外波段,其中紅光和紅邊波段通過了顯著性檢驗(yàn)。因此,紅光和紅邊可作為棉花葉片SPAD的特征波段,這與前人研究結(jié)果相一致[22]。
表1 敏感波段分析
圖4 棉花冠層光譜反射率隨SPAD變化關(guān)系圖
本次研究計(jì)算了27個光譜指數(shù),相關(guān)性分析見表2,SPAD與大部分光譜指數(shù)的相關(guān)性呈極顯著水平。在原始光譜波段以及27個光譜指數(shù)中,分別選擇相關(guān)性較高的波段和光譜指數(shù)[r、r*reg、(reg-r)/(reg+r)、r-g、作為特征光譜指數(shù)參與棉花葉片SPAD反演模型的構(gòu)建。
表2 光譜指數(shù)分析
基于62個建模樣本,分別采用多元逐步回歸、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)構(gòu)建SPAD定量反演模型,其中,以選取的6個特征光譜指數(shù)為自變量,SPAD為因變量。建模結(jié)果如表3所示。圖5為3種模型建模樣本實(shí)測值與估測值的散點(diǎn)圖。圖6為驗(yàn)證樣本實(shí)測值和估測值的散點(diǎn)圖。
圖5 建模集SPAD估測值與實(shí)測值擬合結(jié)果
圖6 驗(yàn)證集SPAD估測值與實(shí)測值擬合結(jié)果
表3 棉花SPAD反演模型
各模型的R2都高于0.6,表明基于無人機(jī)多光譜反演華北平原棉區(qū)棉花葉片SPAD是可行的。對比本次研究中的3種模型,BP神經(jīng)網(wǎng)絡(luò)模型精度最高,多元逐步回歸模型和支持向量機(jī)精度較為接近且均低于BP神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)模型建模R2高達(dá)0.747,驗(yàn)證R2為0.758,RPD為2.135且均方根誤差均為最低,說明該模型的穩(wěn)定性和預(yù)測能力相對較好,確定基于BP神經(jīng)網(wǎng)絡(luò)的棉花葉片SPAD模型為基于無人機(jī)近地圖像的棉花葉片SPAD最佳反演模型,BP神經(jīng)網(wǎng)絡(luò)為優(yōu)選的建模方法。
基于最佳模型,對研究區(qū)多光譜影像進(jìn)行反演,按照田明璐等[17]棉花葉片SPAD分級標(biāo)準(zhǔn)進(jìn)行分級得到研究區(qū)棉花葉片SPAD的反演估算結(jié)果(圖7),并對比94個樣本實(shí)測值與反演值統(tǒng)計(jì)特征(表4)。94個反演值與實(shí)測值中2組數(shù)據(jù)中小于40的分別是20個和23個,占比21.28%、24.47%,位于40~ 48之間的數(shù)據(jù)分別是56個和51個,占比59.57%、54.26%,大于48的數(shù)據(jù)分別是18個和20個,占比19.15%和21.28%??梢钥闯龇囱葜蹬c實(shí)測值較為一致,且集中在40~ 48之間。在反演圖中,本研究區(qū)棉花葉片SPAD反演值范圍在19.3~ 58.6之間;反演值低于28的區(qū)域成塊狀線狀分布,與研究區(qū)裸土與道路分布一致;北部反演值偏低,南部反演值較高,與研究區(qū)北部棉花葉片發(fā)黃、長勢較差,南部長勢較好的實(shí)際情況相一致。
圖7 基于最佳模型的棉花葉片SPAD反演圖
表4 實(shí)測值與反演值統(tǒng)計(jì)特征
(1)探明了華北平原棉花葉片SPAD的光譜特征主要體現(xiàn)在紅光和紅邊波段,紅光波段與棉花葉片SPAD呈極顯著負(fù)相關(guān),紅邊波段則為正相關(guān)波段,紅光波段相關(guān)性高于紅邊波段;基于相關(guān)性分析選取了棉花葉片SPAD的特征光譜指數(shù)為r、r*reg、(reg-r)/
(2)對比3種建模方法,BP神經(jīng)網(wǎng)絡(luò)(BPNN)建模R2最高,RMSE最低,模型RPD最高且大于2,模型精度最佳。支持向量機(jī)(SVM)模型與多元逐步回歸(MSR)模型精度較為接近且均低于BP神經(jīng)網(wǎng)絡(luò)模型。確定BP神經(jīng)網(wǎng)絡(luò)方法為華北平原地區(qū)花鈴期棉花葉片SPAD反演的最佳方法,其建模集R2、RMSE分別為0.747、4.568,驗(yàn)證集的R2、RMSE、RPD分別為 0.758、4.142、2.135。
本研究針對華北平原棉區(qū)探索了基于無人機(jī)多光譜的棉花葉片SPAD建模方法,研究結(jié)果可豐富棉田生長指標(biāo)的定量遙感理論,為華北平原棉田長勢定量監(jiān)測提供技術(shù)支持和數(shù)據(jù)支撐。
(1)本研究基于無人機(jī)近地多光譜,探明了華北平原地區(qū)棉花葉片SPAD的光譜特征,研究表明,紅光波段和紅邊波段與華北平原棉區(qū)的棉花葉片SPAD相關(guān)性最強(qiáng),其中紅光波段為極顯著負(fù)相關(guān)波段,紅邊波段為正相關(guān)波段。這一研究結(jié)果與依爾夏提·阿不來提[11]利用高光譜估測新疆棉花冠層SPAD所確定的特征波段相一致,但又略有不同:在新疆棉區(qū),紅邊波段較紅光波段的相關(guān)性更高,而在華北平原棉區(qū),棉花葉片SPAD在紅光波段相關(guān)系數(shù)絕對值高于紅邊波段,可見,棉花葉片SPAD的特征波段可確定為紅光和紅邊,但具體的相關(guān)性強(qiáng)弱有地域的差異。
(2)筆者嘗試用BP神經(jīng)網(wǎng)絡(luò)方法和支持向量機(jī)方法建立估算模型,結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型相較于支持向量機(jī)模型精度更高、更穩(wěn)定,這一結(jié)果與前人結(jié)論基本吻合[31-33]。這是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)模型具有較強(qiáng)的非線性映射能力,能夠更好地解決植物葉綠素含量等非線性問題;在權(quán)值之內(nèi),具有高度的自適應(yīng)及自學(xué)習(xí)能力,且容錯能力較強(qiáng),有助于提高模型的估算精度。但BP神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)選擇不一,不同的參數(shù)設(shè)置會產(chǎn)生不同的結(jié)果,要根據(jù)大量實(shí)驗(yàn)數(shù)據(jù)與分析確定BP模型網(wǎng)絡(luò)權(quán)值初始化中隱含層的賦值。
(3)目前,棉花葉片SPAD定量遙感反演還沒有統(tǒng)一的標(biāo)準(zhǔn)模型。本研究是針對華北平原地區(qū)花鈴期棉花葉片SPAD的遙感反演研究,所取得結(jié)果和結(jié)論對于其他區(qū)域以及其他生育期的研究是否適用有待進(jìn)一步研究探索。