国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的梭梭同化枝光合色素含量高光譜反演估算

2025-02-05 00:00:00黃軻盼楊雪梅劉志飛張忠王景瑞徐浩杰
草地學(xué)報(bào) 2025年1期
關(guān)鍵詞:高光譜梭梭

摘要:基于民勤干旱荒漠區(qū)地面實(shí)測(cè)的人工梭梭同化枝高光譜反射率與光合色素?cái)?shù)據(jù),經(jīng)光譜曲線處理和特征參數(shù)提取后,采用隨機(jī)森林(RF)、反向傳遞人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)、支持向量機(jī)(SVM)三種常見的機(jī)器學(xué)習(xí)模型模擬葉綠素a、葉綠素b和類胡蘿卜素含量,確定梭梭同化枝光合色素含量的最優(yōu)估算模型,揭示影響光合色素含量的光譜關(guān)鍵變量。結(jié)果表明,RF模型在模擬精度上表現(xiàn)最優(yōu),對(duì)三種光合色素的R2值介于0.73至0.77,RMSE介于0.023至0.302 mg·g-1。其中,RF對(duì)葉綠素b的預(yù)測(cè)精度最高,R2為0.77,RMSE為0.023 mg·g-1。不同光合色素對(duì)干旱脅迫的響應(yīng)各異,導(dǎo)致影響它們的光譜變量也不同。葉綠素a與葉綠素b的最優(yōu)模型受到吸收位置(Absorption position,AP)、紅邊位置(Red-edge position,REP)和紅邊拐點(diǎn)(Red-edge inflection point,REIP)的影響較多,而類胡蘿卜素的最優(yōu)模型更容易受REIP、Vogelmann紅邊指數(shù)(Vogelmann red-edge index 2,VOG2)與水波段指數(shù)(Water band index,WBI)的影響。該研究為基于高光譜遙感與機(jī)器學(xué)習(xí)模型反演梭梭同化枝光合色素含量提供依據(jù),服務(wù)于人工梭梭林的旱情監(jiān)測(cè)與撫育管理。

關(guān)鍵詞:梭梭;光合色素;高光譜;反射特性;模型模擬;變量重要性

中圖分類號(hào):TP79;Q945 " " " "文獻(xiàn)標(biāo)識(shí)碼:A " " " "文章編號(hào):1007-0435(2025)01-0250-12

Estimation of the Photosynthetic Pigment Content in Assimilated Branches of Haloxylon ammodendron Based on Hyperspectral Data and Machine Learning Methods

HUANG Ke-pan1, YANG Xue-mei2,3, LIU Zhi-fei1, ZHANG Zhong3, WANG Jing-rui3, XU Hao-jie1,4*

(1.State Key Laboratory of Herbage Improvement and Grassland Agro-ecosystems/Key Laboratory of Grassland Livestock Industry Innovation, Ministry of Agriculture and Rural Affairs/Engineering Research Center of Grassland Industry, Ministry of Education/College of Pastoral Agriculture Science and Technology, Lanzhou University, Lanzhou, Gansu Province 730020, China;2.Tourism School, Lanzhou University of Arts and Science, Lanzhou, Gansu Province 730010, China;3.Gansu Institute of desertification Control, Lanzhou, Gansu Province 733000, China;

4.Center for Remote Sensing of Ecological Environments in Cold and Arid Regions, Lanzhou University, Lanzhou, Gansu Province 730000, China)

Abstract:Based on the ground-measured hyperspectral reflectance and photosynthetic pigment data of assimilated branches of Haloxylon ammodendron in the Minqin desert area, the hyperspectral data were processed with noise reduction and feature parameter extraction. Three common machine learning models, including random forest (RF), back propagation-artificial neural networks, and support vector machine, were used to simulate chlorophyll a, chlorophyll b, and carotenoid contents. The optimal estimation model for photosynthetic pigment content in the assimilated branch of Haloxylon ammodendron was determined, and the key spectral variables affecting the photosynthetic pigment content were revealed.The results showed that the RF model had the best simulation accuracy, with R2 values ranging from 0.73 to 0.77 and RMSE ranging from 0.023 to 0.302 mg·g-1 for the three photosynthetic pigments. Among them, RF had the highest prediction accuracy for chlorophyll b with R2 value of 0.77 and 0.023 mg·g-1 RMSE. Different photosynthetic pigments had different responses to drought stress, resulting in different spectral variables affecting them. The optimal models of chlorophyll a and chlorophyll b were mostly affected by Absorption position (AP), Red-edge position (REP) and Red-edge inflection point (REIP); while the optimal model of carotenoids was more susceptible to the influence of REIP, Vogelmann red-edge index 2 (VOG2) and Water band index (WBI). This study established a foundation for retrieving photosynthetic pigment content in assimilated branches of Haloxylon ammodendron using hyperspectral remote sensing and machine learning models. It also contributed to the drought monitoring and rearing management of artificial Haloxylon ammodendron forests.

Key words:Haloxylon ammodendron;Photosynthetic pigment;Hyperspectral;Reflection characteristics;Model simulation;Variable importance

梭梭[Haloxylon ammodendron (C.A.Mey.) Bunge]是莧科、梭梭屬的灌木或小喬木,常見于寧夏西北部、甘肅西部、青海北部、新疆與內(nèi)蒙古等地,在中亞和西伯利亞也均有分布[1]。梭梭耐寒耐旱、抗鹽堿風(fēng)沙,既能改良土壤和恢復(fù)植被,又能保護(hù)其周邊的沙化草地,是防風(fēng)固沙林的首選樹種之一[2]。我國(guó)在干旱荒漠區(qū)大面積營(yíng)造梭梭林,但由于大氣干旱、土壤水分不足、地下水位低、種植密度過高等原因,梭梭連片衰落或死亡,嚴(yán)重威脅我國(guó)北方生態(tài)安全。

旱情監(jiān)測(cè)對(duì)梭梭林的保護(hù)和恢復(fù)至關(guān)重要。葉綠素是植物光合色素的重要組分,在水分脅迫下葉綠素易發(fā)生氧化和降解,嚴(yán)重的干旱脅迫甚至引發(fā)葉綠素組分變化和光合器官損傷,抑制植物光合作用[3]。類胡蘿卜素也是光合色素的一種,是植物體內(nèi)重要的抗氧化物,其合成代謝易受水分影響[4]。因此,葉綠素與類胡蘿卜素含量的變化可指示植物受水分脅迫的程度。植物光譜反射特征與光合色素含量密切相關(guān)。高光譜遙感具有波段多且寬度窄的特點(diǎn),基于高光譜反射曲線微小差異的量化分析,可為植物生理生態(tài)參數(shù)估算提供簡(jiǎn)便、快速、有效且非破壞性的方式[5-6]。由于葉綠素主要吸收藍(lán)紫光和紅橙光,反射綠光,而類胡蘿卜素主要吸收藍(lán)紫光,反射紅光,造成植物色素含量與可見光的綠光黃光及紅邊區(qū)域的反射率呈顯著負(fù)相關(guān)[7]。紅邊特性對(duì)植物色素含量也具有很高的靈敏度[8-10]。例如,紅邊位置與沼澤松枝條的葉綠素濃度呈正相關(guān)[11]?;诩t邊參數(shù)構(gòu)建的作物葉綠素含量估算模型的精度可達(dá)80%[12]。在近紅外波段,光合色素通過影響植物葉腔結(jié)構(gòu)和腔內(nèi)散射特性改變光譜反射率[13]。植物在短波紅外波段的反射率受葉片含水量的顯著影響,而葉片含水量對(duì)光合色素的組成和含量有重要作用。

盡管基于高光譜遙感技術(shù)能提取眾多的光譜特征參數(shù),但要使這些變量發(fā)揮出應(yīng)有的作用仍需構(gòu)建精準(zhǔn)有效的模型。由于單一的植被指數(shù)模型和多因子線性回歸模型的精度較低、穩(wěn)定性較差,機(jī)器學(xué)習(xí)模型已逐步取代傳統(tǒng)算法成為預(yù)測(cè)植物光合色素的主流方法[14]。機(jī)器學(xué)習(xí)模型是基于數(shù)據(jù)驅(qū)動(dòng)的,其自動(dòng)檢索和解釋數(shù)據(jù)的方法比較靈活,可用于任何訓(xùn)練任務(wù),準(zhǔn)確性更高。機(jī)器學(xué)習(xí)模型能估計(jì)多個(gè)變量間的復(fù)雜關(guān)系,與統(tǒng)計(jì)模型相比更具穩(wěn)健性,能有效提高模型的預(yù)測(cè)精度[15]。姚付啟等[16]基于紅邊參數(shù)反演植物葉綠素含量,發(fā)現(xiàn)ANN模型相比單變量模型其反演精度更高,唐源[17]分別使用5種模型對(duì)葉綠素含量進(jìn)行估測(cè),發(fā)現(xiàn)RF模型與SVR模型的預(yù)測(cè)精度都高于線性回歸算法。因此,機(jī)器學(xué)習(xí)模型在光合色素含量估算中能更多地利用光譜數(shù)據(jù)中的微弱差異,并提高模擬精度。

目前,已發(fā)表的基于高光譜參數(shù)與機(jī)器學(xué)習(xí)模型反演葉綠素含量的研究多是針對(duì)玉米(Zea mays L.)[18]、冬小麥(Triticum aestivum L.)[19]等農(nóng)作物,對(duì)荒漠植物(如梭梭、檉柳、白刺等)研究較少。如曹曉明等[20]運(yùn)用實(shí)測(cè)高光譜數(shù)據(jù)對(duì)梭梭同化枝葉綠素含量進(jìn)行估測(cè),但未使用機(jī)器學(xué)習(xí)模型進(jìn)行定量反演。鑒于防風(fēng)固沙林干旱脅迫監(jiān)測(cè)的重要性,本研究以民勤干旱荒漠區(qū)人工梭梭為研究對(duì)象,基于地面高光譜反射率數(shù)據(jù)提取與梭梭光合色素相關(guān)的特征參數(shù),并使用3種代表性的機(jī)器學(xué)習(xí)模型(RF,BP-ANN和SVM)對(duì)葉綠素a、葉綠素b與類胡蘿卜素的含量進(jìn)行反演估算,確定梭梭同化枝光合色素含量的最優(yōu)估算模型,揭示影響光合色素含量的光譜關(guān)鍵變量,為梭梭生長(zhǎng)響應(yīng)水分脅迫的區(qū)域化監(jiān)測(cè)提供方法支持,從而優(yōu)化梭梭林的水分管理措施,促進(jìn)人工梭梭林的生態(tài)恢復(fù)。

1 材料與方法

1.1 研究區(qū)概況

本文的研究區(qū)位于民勤綠洲老虎口防沙治沙示范區(qū)(圖1),該區(qū)域的人工梭梭林于2008年開始種植,現(xiàn)今種植密度為1350株·hm-2[21]。民勤綠洲位于河西走廊東北部的民勤縣境內(nèi),介于巴丹吉林沙漠與騰格里沙漠之間,地理范圍101°50′~104°15′ E,38°05′~39°26′ N,平均海拔1400 m。該地區(qū)地勢(shì)平坦,主要由沙漠、低山丘陵和平原組成。大陸性氣候特征明顯,年均溫約9℃,夏季炎熱,冬季寒冷,降水量稀少(僅110 mm左右)且主要集中在夏季,蒸發(fā)量高達(dá)2600 mm以上,表現(xiàn)為極端干旱的氣候特點(diǎn)。土壤以沙質(zhì)土和鹽漬土為主,植被覆蓋度相對(duì)較低,主要的植被類型為適應(yīng)沙漠環(huán)境的植物,如梭梭、白刺(Nitraria tangutorum Bobrov)、檉柳(Tamarix chinensis Lour.)等[22]。

1.2 數(shù)據(jù)采集

梭梭冠層光譜數(shù)據(jù)的采集使用美國(guó)Analytical Spectral Devices公司的FieldSpec4 H1500便攜式地物光譜儀,光譜測(cè)量范圍為350~2500 nm,采樣間隔1.1~1.4 nm,在350~700 nm的光譜分辨率為3 nm,其余波段的光譜分辨率為6 nm。地物光譜觀測(cè)在2022年8月12日進(jìn)行,時(shí)間選擇在晴朗無風(fēng)無云天氣下的10:00—14:00,測(cè)量前對(duì)儀器提前1 h預(yù)熱,采集高度為距離冠層1.0 m位置,采用25°視場(chǎng)角垂直觀測(cè),開始測(cè)定光譜前進(jìn)行白板校正和暗電流校正。本研究共設(shè)置2個(gè)大樣地,每個(gè)大小為200 m×200 m,兩個(gè)樣地距離250 m左右,土壤、氣象因素等基本相同。在兩個(gè)樣地內(nèi)隨機(jī)選取共100株不同年齡、生長(zhǎng)狀況不一的梭梭植株,每個(gè)梭梭植株在同一位置采集5次光譜曲線。比較5次光譜曲線,將偏離度較大的異常曲線排除后,取平均值作為1個(gè)光譜樣本,共得到93個(gè)有效光譜樣本。

1.3 光合色素測(cè)定

在樣地內(nèi)隨機(jī)選取不同長(zhǎng)勢(shì)的梭梭植株,分別測(cè)定其光合色素含量。為確保實(shí)驗(yàn)的準(zhǔn)確性,選取冠層部位的新鮮葉片,并仔細(xì)去除葉脈后剪碎。隨后,稱取0.4 g的葉片樣本,放入已預(yù)先加入提取液(丙酮與無水乙醇的體積比為1∶1)的離心管中,并緊密封口。處理好的樣品在避光條件下靜置24—48 h,期間定時(shí)搖晃震蕩,確保葉片與提取液充分接觸,以最大化提取光合色素。調(diào)零時(shí)以提取液作為對(duì)照,取上清液后,使用分光光度計(jì)分別測(cè)定波長(zhǎng)為665,649和470 nm處的吸光值,每組重復(fù)3次[23]。利用Lichtenthaler[24]提出的方法計(jì)算光合色素中各成分的含量。具體計(jì)算公式如下:

式中,chla,chlb和car分別為葉綠素a、葉綠素b與類胡蘿卜素;OD665,OD649和OD470分別代表在波長(zhǎng)665,649和470 nm處測(cè)得的吸光值;V代表提取液體積(mL);FW代表葉片鮮重(g);植物光合色素含量的單位為mg·g-1

1.4 光譜數(shù)據(jù)預(yù)處理與特征參數(shù)提取

為消除原始光譜數(shù)據(jù)中可能存在的噪聲,采用Savitzky-Golay卷積平滑法進(jìn)行降噪。本研究使用MATLAB 2022a中的sgolayfilt函數(shù)進(jìn)行平滑降噪處理。在平滑過程中,設(shè)置移動(dòng)窗口長(zhǎng)度為21,多項(xiàng)式次數(shù)為2,以確保在保持光譜特征的同時(shí)有效去除噪聲。

植被指數(shù)是根據(jù)植被的光譜特性將可見光和近紅外波段進(jìn)行組合,形成能夠反映植被生長(zhǎng)狀況的指標(biāo)。它是植被葉面積指數(shù)、蓋度、葉綠素含量、生物量以及被吸收的光合有效輻射的綜合體現(xiàn)。植被指數(shù)主要分為差值植被指數(shù)、比值植被指數(shù)、歸一化植被指數(shù)等,可以通過不同公式計(jì)算。窄波段植被指數(shù)已廣泛應(yīng)用于植被生長(zhǎng)狀況的定性和定量評(píng)價(jià)。

微分法被廣泛用于光譜曲線特征提取研究,它不但能凸顯光譜曲線的細(xì)微變化,并迅速確定細(xì)微變化的波長(zhǎng)位置,還能部分消除地面背景、光照等環(huán)境因素的影響,利于提取光譜吸收峰參數(shù)。在植被分布稀疏、地表混合光譜成分較多的荒漠區(qū),微分法能夠有效的消除背景噪聲,并提取光譜特征。

葉片色素含量主要與可見光波段緊密相關(guān),因此波段深度分析主要處理550~750 nm的光譜數(shù)據(jù),此波段包含色素強(qiáng)吸收的紅光區(qū)與紅邊波段范圍。首先,對(duì)光譜數(shù)據(jù)進(jìn)行連續(xù)統(tǒng)去除變換,校正由于波段依賴而引起的波段反射率極值點(diǎn)的偏移,有效增強(qiáng)吸收特征,增大各光譜曲線之間的差異[25]。連續(xù)統(tǒng)線定義為連接局部原始光譜反射率峰值點(diǎn)之間的線段。將反射率曲線上每個(gè)波長(zhǎng)的光譜反射率除以相應(yīng)波長(zhǎng)處連續(xù)統(tǒng)線上的值可以得到連續(xù)統(tǒng)去除光譜[26]。研究發(fā)現(xiàn),紅邊區(qū)域內(nèi)的一些吸收特征參量,如吸收位置、吸收深度、歸一化波段深度指數(shù)和波段深度比等,可以有效探測(cè)植物生理生化指標(biāo),比如葉綠素[27]。

表1羅列出應(yīng)用于梭梭同化枝葉綠素含量估測(cè)的57個(gè)光譜變量,包括40個(gè)植被指數(shù)、9個(gè)吸收波段、4個(gè)紅邊參數(shù)和4個(gè)吸收特征。

1.5 模型構(gòu)建

本文選擇3種常見的機(jī)器學(xué)習(xí)模型對(duì)梭梭同化枝光合色素含量進(jìn)行反演估算[28],分別是RF,BP-ANN和SVM。

RF模型是基于分類樹算法的1種算法。RF模型利用bootstrap進(jìn)行抽樣,抽出的樣本用于回歸樹的構(gòu)建。對(duì)訓(xùn)練樣本進(jìn)行連續(xù)篩選,得到最小殘差平方和,最后形成1棵完整的樹[29]。本研究首先在Rstudio中使用10折交叉法篩選重要變量,隨后在MATLAB 2022a中,通過自建代碼來構(gòu)建RF模型,在ntree中設(shè)置以100為間隔,從100開始增加到1000,共迭代10次,當(dāng)10折交叉驗(yàn)證誤差最小時(shí),確定為最優(yōu)trees,用于最終模型的構(gòu)建。模型設(shè)置決策樹數(shù)目為200,最小子葉數(shù)為5,循環(huán)次數(shù)為4000次。

BP-ANN模型是1種多層前饋神經(jīng)網(wǎng)絡(luò),主要由輸入層、隱藏層和輸出層組成。各層之間通過權(quán)值進(jìn)行連接,形成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)[30]。本研究通過MATLAB 2022a中自帶的神經(jīng)網(wǎng)絡(luò)工具箱完成BP神經(jīng)網(wǎng)絡(luò)建模及其驗(yàn)證,設(shè)置隱含層神經(jīng)元個(gè)數(shù)以10為間隔,從10增加到100,共迭代10次,取交叉驗(yàn)證誤差最小時(shí)的neuron個(gè)數(shù)為最優(yōu)neuron,構(gòu)建最終模型。模型設(shè)置隱含層神經(jīng)元個(gè)數(shù)為10,循環(huán)運(yùn)行500次以獲取最優(yōu)模型。

SVM是1種具有相關(guān)學(xué)習(xí)算法的監(jiān)督學(xué)習(xí)模型,由高維或無限維空間中的1組超平面構(gòu)成,可以用于分類、回歸和其他任務(wù)[31]。本研究在Visual Studio Code 2023中使用python自建代碼進(jìn)行SVM模型的構(gòu)建,選擇RBF(徑向基函數(shù))作為核函數(shù),采用10折交叉來尋找最佳cost(懲罰系數(shù))和epsilon(不敏感損失函數(shù)中的參數(shù))參數(shù),循環(huán)運(yùn)行500次以獲取最優(yōu)模型。

在機(jī)器學(xué)習(xí)中,分離訓(xùn)練集與驗(yàn)證集是1個(gè)至關(guān)重要的步驟,它有助于評(píng)估模型的性能并防止過擬合。其中,留出法是1種常用的方法。留出法直接將原始數(shù)據(jù)集劃分為2個(gè)互斥的集合:訓(xùn)練集和驗(yàn)證集。訓(xùn)練集用于訓(xùn)練模型,即讓模型學(xué)習(xí)數(shù)據(jù)的特征和規(guī)律;而驗(yàn)證集則用于評(píng)估模型的性能,即檢驗(yàn)?zāi)P蛯?duì)未見過的數(shù)據(jù)的預(yù)測(cè)能力。在使用留出法時(shí),按照一定比例(如60%的訓(xùn)練集和40%的驗(yàn)證集)將數(shù)據(jù)集劃分為訓(xùn)練集和驗(yàn)證集。訓(xùn)練集使模型能夠?qū)W習(xí)到數(shù)據(jù)的內(nèi)在規(guī)律和特征,而驗(yàn)證集則提供對(duì)模型泛化能力的客觀評(píng)估。

1.6 模型精度評(píng)價(jià)

本文同時(shí)對(duì)訓(xùn)練集和驗(yàn)證集評(píng)估模擬精度。首先,樣本的數(shù)量多少會(huì)影響模型的精度,訓(xùn)練集與驗(yàn)證集的樣本數(shù)目不同,精度自然會(huì)有差異;其次,對(duì)訓(xùn)練集評(píng)估精度,可以反映數(shù)據(jù)訓(xùn)練是否充分,對(duì)驗(yàn)證集評(píng)估精度,可以監(jiān)控模型是否發(fā)生過擬合。模型精度的評(píng)價(jià)指標(biāo)為決定系數(shù)(Coefficient of determination,R2)及均方根誤差(Root mean square error,RMSE)。具體計(jì)算公式如下:

式中,ERMS為RMSE,ˉy為實(shí)測(cè)均值;yi和y ?_i分別為y的預(yù)測(cè)值和實(shí)測(cè)值;n等于樣本量(訓(xùn)練集n=56,驗(yàn)證集n=37)。R2越高而ERMS越低,表明模型精度越高

2 結(jié)果與分析

2.1 葉綠素a的反演估算

從圖2中可以看出,RF模型在訓(xùn)練集和驗(yàn)證集上的表現(xiàn)良好。訓(xùn)練集與驗(yàn)證集的2個(gè)回歸方程的斜率接近,顯示模型在訓(xùn)練和驗(yàn)證數(shù)據(jù)上的穩(wěn)定性。同時(shí),R2分別為0.77和0.74,表明模型能夠較好地?cái)M合數(shù)據(jù)。此外,訓(xùn)練集和驗(yàn)證集的RMSE分別為0.046 mg·g-1和0.044 mg·g-1,也驗(yàn)證了模型的預(yù)測(cè)精度。本文還對(duì)比了BP-ANN和SVM 2種模型的預(yù)測(cè)結(jié)果。在訓(xùn)練集上,BP-ANN模型的R2為0.73,RMSE為0.041 mg·g-1;SVM模型的R2為0.6,RMSE為0.051 mg·g-1。在驗(yàn)證集上,BP-ANN模型的R2為0.72,RMSE為0.053 mg·g-1;而SVM模型的R2為0.48,RMSE為0.065 mg·g-1。這些數(shù)據(jù)顯示BP-ANN和SVM模型在預(yù)測(cè)能力上的差異。BP-ANN模型在訓(xùn)練集與驗(yàn)證集上的表現(xiàn)也都比較良好;而SVM模型在訓(xùn)練集上的表現(xiàn)尚可,但在驗(yàn)證集上性能有所下降。3種模型在訓(xùn)練集和驗(yàn)證集上都展現(xiàn)一定的預(yù)測(cè)能力。然而,需要注意的是,驗(yàn)證集上的性能通常更受關(guān)注,因?yàn)樗从衬P驮谖匆姅?shù)據(jù)上的泛化能力。上述結(jié)果表明,對(duì)于葉綠素a含量的模擬預(yù)測(cè)來說,本研究建立的RF模型預(yù)測(cè)值與實(shí)地測(cè)量的葉綠素a含量更加接近,可見RF模型優(yōu)于其他模型,模擬精度更高。

2.2 葉綠素b的反演估算

在葉綠素b含量的模擬上,RF模型的模擬性能較為突出(圖3)。在模型的訓(xùn)練集中,R2從高到低的順序?yàn)锽P-ANN(0.81),RF(0.75)和SVM(0.51),RMSE從低到高的順序?yàn)锽P-ANN(0.023 mg·g-1)、RF(0.029 mg·g-1)和SVM(0.033 mg·g-1)。在模型驗(yàn)證集中,R2從高到低的順序?yàn)镽F(0.77)、BP-ANN(0.63)和SVM(0.45),RMSE從低到高的順序?yàn)镽F(0.023 mg·g-1),BP-ANN(0.031 mg·g-1)和SVM(0.039 mg·g-1)。以上結(jié)果表明,盡管BP-ANN模型訓(xùn)練集的R2與RMSE都優(yōu)于RF模型,但其驗(yàn)證集散點(diǎn)較為分散,擬合效果較差,即BP-ANN模型在訓(xùn)練過程中存在過度擬合現(xiàn)象,模型過于緊密地?cái)M合訓(xùn)練數(shù)據(jù),導(dǎo)致對(duì)新數(shù)據(jù)的泛化能力受限。與RF和BP-ANN模型相比,無論是訓(xùn)練集還是驗(yàn)證集,SVM模型的R2均較低,表明其對(duì)數(shù)據(jù)的擬合效果較差,即SVM模型對(duì)于當(dāng)前數(shù)據(jù)集的特征捕捉和模式識(shí)別能力有限,或者需要進(jìn)一步的參數(shù)優(yōu)化和調(diào)整。因此,在預(yù)測(cè)梭梭同化枝葉綠素b含量時(shí),RF模型是更優(yōu)選擇。

2.3 類胡蘿卜素的反演估算

RF模型在模擬梭梭同化枝類胡蘿卜素含量方面的表現(xiàn)較為良好(圖4)。該模型在訓(xùn)練集與驗(yàn)證集上的R2均為0.73,表明RF模型能夠較為準(zhǔn)確地?cái)M合數(shù)據(jù),并呈現(xiàn)出穩(wěn)定的預(yù)測(cè)能力。同時(shí),訓(xùn)練集與驗(yàn)證集的RMSE分別為0.291 mg·g-1和0.302 mg·g-1,較低的誤差值進(jìn)一步驗(yàn)證RF模型在預(yù)測(cè)梭梭同化枝類胡蘿卜素含量時(shí)的精確性。BP-ANN模型的表現(xiàn)次之,SVM模擬精度最低,訓(xùn)練測(cè)試的結(jié)果比較分散,2個(gè)模型訓(xùn)練集與驗(yàn)證集的R2和RMSE分別為0.41,0.36,0.356 mg·g-1和0.395 mg·g-1。與SVM算法建立的模型相比,使用RF模型R2增加0.3左右,RMSE減少0.08 mg·g-1左右。以上結(jié)果說明,在建立梭梭類胡蘿卜素含量估算模型時(shí),RF比BP-ANN與SVM具有更好的適用性,可以明顯提高梭梭類胡蘿卜素含量估算的準(zhǔn)確性。

2.4 模型整體評(píng)價(jià)

將3種機(jī)器學(xué)習(xí)模型對(duì)梭梭同化枝3種光合色素含量的模擬結(jié)果進(jìn)行匯總后(表2),發(fā)現(xiàn)不同機(jī)器學(xué)習(xí)模型對(duì)不同光合色素模擬能力的差異。對(duì)所有模型而言,RF模型對(duì)梭梭同化枝3種光合色素的模擬精度最高。對(duì)不同光合色素而言,RF模型對(duì)梭梭同化枝葉綠素b的預(yù)測(cè)R2最高且RMSE最低。BP-ANN模型對(duì)3種光合色素的預(yù)測(cè)精度也較好,但其對(duì)葉綠素b和類胡蘿卜素的訓(xùn)練集高出驗(yàn)證集很多,這可能會(huì)影響模型的精準(zhǔn)度。SVM模型對(duì)于3種色素的預(yù)測(cè)精度都較低,適用程度不高。

2.5 光譜變量重要變量排序

RF模型對(duì)梭梭同化枝3種光合色素來說都是最優(yōu)模型。圖5展示RF模型中對(duì)梭梭同化枝葉綠素a、葉綠素b和類胡蘿卜素反演最重要的一些變量。結(jié)果表明,對(duì)葉綠素a而言,有14種變量被認(rèn)定為重要的影響因子。葉綠素b有20種,而類胡蘿卜素為9種。在這些變量中,AP,Carter1,MCARI,REIP,REP,SR0以及VOG2對(duì)于3種光合色素均具有重要影響,表明它們?cè)谡{(diào)控光合色素含量方面扮演著重要角色。盡管這些變量在影響3種光合色素方面具有共性,但每種光合色素也受到一些獨(dú)特因素的影響。例如葉綠素a與葉綠素b受到AP與REP的影響較多,但類胡蘿卜素更容易受VOG2與WBI的影響,這也說明控制不同光合色素含量的光譜變量不同。類胡蘿卜素的影響變量少于葉綠素a和b,原因是葉綠素a和b主要吸收紅光(約640~660 nm)和藍(lán)紫光(約430~450 nm),而類胡蘿卜素則主要吸收藍(lán)紫光,比葉綠素少了1個(gè)紅光波段。這種光譜差異導(dǎo)致影響葉綠素a和b的光譜指數(shù)比類胡蘿卜素多,相應(yīng)地影響類胡蘿卜素的變量的種類與數(shù)量都會(huì)少于葉綠素a和b。

3 討論

本研究采用隨機(jī)森林、反向傳遞人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)3種機(jī)器學(xué)習(xí)模型,結(jié)合高光譜數(shù)據(jù)、一階微分、波段深度分析與紅邊參數(shù)等多種特征,對(duì)梭梭同化枝葉綠素a、葉綠素b、類胡蘿卜素含量進(jìn)行模擬預(yù)測(cè)。通過對(duì)比分析各模型的預(yù)測(cè)性能,發(fā)現(xiàn)RF模型在預(yù)測(cè)梭梭同化枝光合色素含量方面表現(xiàn)出最高的R2,顯示出其優(yōu)越的預(yù)測(cè)效果。這與管鋮等[32]對(duì)蘆葦葉片葉綠素含量估測(cè)所得到的最優(yōu)模型一致,都為RF模型。相反,徐逸等[33]對(duì)太湖葉綠素a濃度反演的最優(yōu)模型為深度學(xué)習(xí)模型,而RF模型精度較低,這可能與反演的植物種類差異過大有關(guān)。RF模型之所以能夠在本研究中取得最佳的預(yù)測(cè)效果,可能得益于其以下幾個(gè)方面的優(yōu)勢(shì):一、RF模型能夠自動(dòng)處理多種復(fù)雜特征,有效提取與梭梭同化枝光合色素含量密切相關(guān)的信息;二、RF模型通過集成學(xué)習(xí)的方式,結(jié)合多個(gè)決策樹的預(yù)測(cè)結(jié)果,從而提高模型的穩(wěn)定性和泛化能力,減少過擬合的風(fēng)險(xiǎn);三、RF模型對(duì)噪聲和異常值具有一定的抗干擾能力,即具有魯棒性,能夠在一定程度上降低數(shù)據(jù)質(zhì)量問題對(duì)預(yù)測(cè)結(jié)果的影響[34-35]。除此之外,RF模型在訓(xùn)練完成后能夠提供各個(gè)特征對(duì)輸出的重要性評(píng)估,這使得模型的結(jié)果更容易解釋和理解。這些可能都是導(dǎo)致RF模型為最優(yōu)模型的原因。

影響梭梭同化枝光合色素含量的光譜變量既有相同之處,也有差異。REIP,即反射率一階微分曲線的紅邊拐點(diǎn),其數(shù)值的變化對(duì)3種光合色素的影響均極為重要,表現(xiàn)為光合色素含量越高,反射率一階微分曲線的紅邊拐點(diǎn)取值也相應(yīng)越高,這與閆曉斌等[36]的研究結(jié)果一致。對(duì)于葉綠素a與葉綠素b來說,REP都是其重要影響變量,高葉綠素含量的REP值會(huì)增加,即出現(xiàn)紅移[37]。AP指的是去包絡(luò)線后反射率最低處的波長(zhǎng),如果梭梭植株的葉綠素含量較高,那么其光譜曲線在特定波長(zhǎng)的吸收位置可能會(huì)表現(xiàn)出更明顯的吸收峰,從而影響AP的變化。而類胡蘿卜素對(duì)VOG2和WBI指數(shù)的變化較為敏感,這些指數(shù)與葉片水分含量密切相關(guān)。已有研究顯示,在長(zhǎng)期的干旱條件下,類胡蘿卜素相較于葉綠素對(duì)水分變化更為敏感[38],這與本文的研究結(jié)果相符。

除此以外,RF模型可以解釋梭梭同化枝光合色素含量73%~77%的變化,其中對(duì)于葉綠素b的解釋程度最高,達(dá)77%。但其中仍有部分未能完全解釋,這可能是由于有些數(shù)據(jù)特征未能納入到模型中去,例如每株梭梭的坡度坡向可能影響其水分含量,進(jìn)而影響光合色素含量[39];不同梭梭所處位置的土壤質(zhì)地不同,也會(huì)影響其水分與光合色素含量的變化[40]。此外,在不同時(shí)間采集光譜數(shù)據(jù),太陽高度角、植物生理狀況、環(huán)境因素等都會(huì)發(fā)生不同的變化,從而導(dǎo)致光譜數(shù)據(jù)產(chǎn)生變化。所以,本研究需要在1天之內(nèi)對(duì)梭梭的冠層光譜數(shù)據(jù)進(jìn)行觀測(cè)與記錄,記錄植物生長(zhǎng)期內(nèi)相同天數(shù)、相同環(huán)境因素下的梭梭光譜反射率,從而減少這種差異造成的影響。當(dāng)然,光合色素含量是一個(gè)動(dòng)態(tài)變化的過程,可能受到多種因素的影響而隨時(shí)間發(fā)生波動(dòng),模型難以完全捕捉到這種動(dòng)態(tài)變化,從而導(dǎo)致未能完全預(yù)測(cè)其含量。因此,分析地形與土壤因素等對(duì)梭梭同化枝光合色素含量的影響也是今后研究的重要內(nèi)容。

4 結(jié)論

基于民勤干旱荒漠區(qū)地面實(shí)測(cè)的人工梭梭同化枝光合色素含量和高光譜反射率數(shù)據(jù),對(duì)比分析3種機(jī)器學(xué)習(xí)模型對(duì)3種主要光合色素含量的預(yù)測(cè)精度。在3種機(jī)器學(xué)習(xí)方法中,RF模型是梭梭同化枝光合色素含量反演的最優(yōu)模型,對(duì)葉綠素a、葉綠素b、類胡蘿卜素的預(yù)測(cè)精度均較高,R2分別為0.74,0.77和0.73,RMSE分別為0.044 mg·g-1,0.023 mg·g-1和0.302 mg·g-1。由于3種光合色素對(duì)干旱脅迫的響應(yīng)及其敏感性存在差異,影響其含量變化的光譜關(guān)鍵變量不同。除紅邊拐點(diǎn)外,葉綠素a與葉綠素b的最優(yōu)模型受吸收位置與紅邊位置的影響較大,而類胡蘿卜素的最優(yōu)模型更容易受Vogelmann紅邊指數(shù)2與水波段指數(shù)的影響。盡管如此,光譜關(guān)鍵變量中包括大量基于紅光和近紅外波段組合的植被指數(shù),表明紅光與近紅外反射率對(duì)梭梭同化枝光合色素含量變化具有強(qiáng)烈響應(yīng)。

參考文獻(xiàn)

[1] 賈志清,盧琦,郭保貴,等. 沙生植物—梭梭研究進(jìn)展[J]. 林業(yè)科學(xué)研究,2004,17(1):125-132

[2] 郭泉水,譚德遠(yuǎn),劉玉軍,等. 梭梭對(duì)干旱的適應(yīng)及抗旱機(jī)理研究進(jìn)展[J]. 林業(yè)科學(xué)研究,2004,17(6):796-803

[3] 劉軍,齊廣平,康燕霞,等. 不同灌溉處理下紫花苜蓿光合特性、葉綠素?zé)晒鈪?shù)及生物量的變化[J]. 草地學(xué)報(bào),2019,27(6):1569-1576

[4] 張麗霞,郭曉彥,史鵬飛,等. 旺長(zhǎng)期水分脅迫對(duì)紅麻葉片中葉綠素和胡蘿卜素含量的影響[J]. 中國(guó)麻業(yè)科學(xué),2021,43(2):80-87

[5] VANE G,GOETZ A F H. Terrestrial imaging spectrometry: current status, future trends[J]. Remote Sensing of Environment,1993,44(2-3):117-126

[6] 葛昊,盧珊,趙云升. 葉片茸毛對(duì)葉片反射光譜及高光譜植被指數(shù)的影響研究[J]. 光譜學(xué)與光譜分析,2012,32(2):439-444

[7] 劉暢,孫鵬森,劉世榮. 基于反射光譜指數(shù)的銳齒櫟葉片色素含量估算[J]. 林業(yè)科學(xué)研究,2017,30(1):88-98

[8] STEVEN M D,MALTHUS T J,DEMETRIADES-SHAH T H,et al. High-spectral resolution indices for crop stress[M]//Application of Remote Sensing in Agriculture.Amsterdam:Butterworths-Heinemann,1990:209-227

[9] 宮兆寧,趙雅莉,趙文吉,等. 基于光譜指數(shù)的植物葉片葉綠素含量的估算模型[J]. 生態(tài)學(xué)報(bào),2014,34(20):5736-5745

[10] 宋開山,張柏,王宗明,等. 大豆葉綠素含量高光譜反演模型研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2006,22(8):16-21

[11] CURRAN P J,DUNGAN J L,GHOLZ H L. Exploring the relationship between reflectance red edge and chlorophyll content in slash pine[J]. Tree Physiology,1990,7(1-4):33-48

[12] 王震,李映雪,吳芳,等. 冠層光譜紅邊參數(shù)結(jié)合隨機(jī)森林機(jī)器學(xué)習(xí)估算冬小麥葉綠素相對(duì)含量[J]. 農(nóng)業(yè)工程學(xué)報(bào),2024,40(4):171-182

[13] 王紀(jì)華,趙春江,黃文江,等. 農(nóng)業(yè)定量遙感基礎(chǔ)與應(yīng)用[M]. 北京:科學(xué)出版社,2008:161

[14] ZHAO F,XU B,YANG X C,et al. Remote sensing estimates of grassland aboveground biomass based on MODIS net primary productivity (NPP):a case study in the xilingol grassland of Northern China[J]. Remote Sensing,2014,6(6):5368-5386

[15] MORAIS T G,TEIXEIRA R F M,F(xiàn)IGUEIREDO M,et al. The use of machine learning methods to estimate aboveground biomass of grasslands: A review[J]. Ecological Indicators,2021,130:108081

[16] 姚付啟,張振華,楊潤(rùn)亞,等. 基于紅邊參數(shù)的植被葉綠素含量高光譜估算模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2009,25(S2):123-129

[17] 唐源. 基于PROSAIL模型與機(jī)器學(xué)習(xí)的紫花苜蓿生理生態(tài)參數(shù)估測(cè)[D]. 蘭州:蘭州大學(xué),2023:44

[18] 王敬湧,張明珍,凌華榮,等. 干旱脅迫下玉米葉片葉綠素含量與含水量高光譜成像反演方法[J]. 智慧農(nóng)業(yè)(中英文),2023,5(3):142-153

[19] 王琪,常慶瑞,李鎧,等. 基于主成分分析和隨機(jī)森林回歸的冬小麥冠層葉綠素含量估算[J]. 麥類作物學(xué)報(bào),2024,44(4):532-542

[20] 曹曉明,馮益明,史建康,等. 運(yùn)用實(shí)測(cè)高光譜數(shù)據(jù)對(duì)梭梭同化枝葉綠素的估算[J]. 東北林業(yè)大學(xué)學(xué)報(bào),2020,48(1):56-61,67

[21] 張?jiān)D辏瑥埧∧?,許明,等. 民勤綠洲荒漠過渡帶梭梭種群的數(shù)量動(dòng)態(tài)及分布格局研究[J]. 綠色科技,2023,25(22):7-11

[22] 安富博,丁峰. 甘肅省民勤縣土地荒漠化的發(fā)展趨勢(shì)及其防治[J]. 干旱區(qū)資源與環(huán)境,2000,14(2):41-47

[23] 楊凱如,賈綺瑋,金佳怡,等. 水稻黃綠葉調(diào)控基因YGL18的克隆與功能解析[J]. 植物學(xué)報(bào),2022,57(3):276-287

[24] LICHTENTHALER H K. Chlorophylls and carotenoids:pigments of photosynthetic biomembranes[J]. Methods in Enzymology,1987,148:350-382

[25] 黃敬峰,王福民,王秀珍. 水稻高光譜遙感實(shí)驗(yàn)研究[M]. 杭州:浙江大學(xué)出版社,2010:59

[26] 鄭雯,明金,楊孟克,等. 基于波段深度分析和BP神經(jīng)網(wǎng)絡(luò)的水稻色素含量高光譜估算[J]. 中國(guó)生態(tài)農(nóng)業(yè)學(xué)報(bào),2017,25(8):1224-1235

[27] MUTANGA O,ADAM E,ADJORLOLO C,et al. Evaluating the robustness of models developed from field spectral data in predicting African grass foliar nitrogen concentration using WorldView-2 image as an independent test dataset[J]. International Journal of Applied Earth Observation and Geoinformation,2015,34:178-187

[28] 卜靈心,來全,劉心怡. 不同機(jī)器學(xué)習(xí)算法在草原草地生物量估算上的適應(yīng)性研究[J]. 草地學(xué)報(bào),2022,30(11):3156-3164

[29] 高金龍. 青藏高原東緣高寒天然草地牧草氮磷養(yǎng)分和生長(zhǎng)狀況的高光譜遙感研究[D]. 蘭州:蘭州大學(xué),2020:30-31

[30] 張玉超,錢新,錢瑜,等. 基于機(jī)器學(xué)習(xí)方法的太湖葉綠素a定量遙感研究[J]. 環(huán)境科學(xué),2009,30(5):1321-1328

[31] 孟新月,葛靜,侯蒙京,等. 基于機(jī)器學(xué)習(xí)的青藏高原天然草地蓋度時(shí)空變化特征研究[J]. 草地學(xué)報(bào),2022,30(10):2652-2662

[32] 管鋮,劉雅輝,張清文,等. 基于高光譜與機(jī)器學(xué)習(xí)算法的蘆葦葉片葉綠素含量估測(cè)[J]. 赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2023,39(10):51-56

[33] 徐逸,董軒妍,王俊杰. 4種機(jī)器學(xué)習(xí)模型反演太湖葉綠素a濃度的比較[J]. 水生態(tài)學(xué)雜志,2019,40(4):48-57

[34] 雷震. 隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D]. 上海:上海交通大學(xué),2012:20-24

[35] 王麗愛,馬昌,周旭東,等. 基于隨機(jī)森林回歸算法的小麥葉片SPAD值遙感估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(1):259-265

[36] 閆曉斌,王志剛,王亞新,等. 干旱脅迫對(duì)冬小麥光合色素含量影響的高光譜監(jiān)測(cè)[J]. 山西農(nóng)業(yè)科學(xué),2022,50(9):1269-1277

[37] 曹英麗,江凱倫,劉亞帝,等. 基于高光譜紅邊位置提取的水稻葉綠素反演研究[J]. 沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào),2021,52(6):718-728

[38] 王方琳,柴成武,趙鵬,等. 3種荒漠植物光合及葉綠素?zé)晒鈱?duì)干旱脅迫的響應(yīng)及抗旱性評(píng)價(jià)[J]. 西北植物學(xué)報(bào),2021,41(10):1755-1765

[39] 張澤民. 基于WorldView 2影像的礦區(qū)復(fù)墾地植被參數(shù)反演及影響因素分析[D]. 北京:中國(guó)地質(zhì)大學(xué),2016:35-40

[40] 王謙,李明蔚,李強(qiáng),等. 基于栓皮櫟幼苗葉綠素?zé)晒鈪?shù)的不同質(zhì)地土壤干旱脅迫指標(biāo)[J]. 中國(guó)水土保持科學(xué),2021,19(2):27-32

(責(zé)任編輯 "付 "宸)

猜你喜歡
高光譜梭梭
梭梭的建筑課
與生命賽跑的“沙漠植被之王”——梭梭
木壘縣沙漠區(qū)域提高梭梭成活率的幾點(diǎn)建議
沙漠梭梭的守望者
基于實(shí)測(cè)高光譜數(shù)據(jù)的太湖湖濱帶典型植被分
基于實(shí)測(cè)光譜的紅花葉綠素含量高光譜估算模型研究
一種基于引導(dǎo)濾波和MNF的高光譜遙感圖像分類方法
吐絲期玉米倒伏后地面高光譜特征參數(shù)分析
基于高光譜響應(yīng)的農(nóng)田大棚EVA棚膜拉伸強(qiáng)度估計(jì)
環(huán)保志愿者在阿拉善種梭梭固沙
襄城县| 临夏县| 闸北区| 日土县| 海口市| 巴彦淖尔市| 阜平县| 璧山县| 兰西县| 盐源县| 高阳县| 蚌埠市| 长沙县| 手机| 咸宁市| 申扎县| 清水河县| 江阴市| 曲阜市| 武冈市| 新野县| 仙居县| 南丰县| 天长市| 青田县| 察雅县| 克山县| 花莲市| 古蔺县| 武义县| 唐山市| 宁津县| 视频| 麻栗坡县| 喀喇沁旗| 津市市| 广河县| 昌吉市| 沈阳市| 桃园市| 寻甸|