趙翊含,侯蒙京,馮琦勝,高宏元,梁天剛*,賀金生,2,錢大文
(1. 蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,草地農(nóng)業(yè)生態(tài)系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)農(nóng)業(yè)農(nóng)村部牧草創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)草地農(nóng)業(yè)教育工程研究中心,甘肅 蘭州 730020;2. 北京大學(xué)城市與環(huán)境學(xué)院,北京 100871;3. 中國科學(xué)院西北高原生物研究所,青海 西寧 810008)
草地生物量是反映草地生長狀況和生態(tài)環(huán)境評(píng)估的一項(xiàng)重要指標(biāo)[1],準(zhǔn)確地估測(cè)草地產(chǎn)量一直是畜牧業(yè)科研工作者持續(xù)探索的目標(biāo)[2]。在高寒地區(qū),由于過度放牧等因素引起的草地退化、水土流失等環(huán)境惡化問題日益嚴(yán)重;并且生態(tài)系統(tǒng)受干擾后植物生長和恢復(fù)速度緩慢[3]。為了確保高寒地區(qū)畜牧業(yè)的可持續(xù)發(fā)展,對(duì)于準(zhǔn)確估算高寒草地地上生物量十分必要[4]。
傳統(tǒng)地面草地調(diào)查的方法耗費(fèi)成本太高[5],刈割法對(duì)草地的破壞性大,不利于草地的再生與可持續(xù)?;谶b感技術(shù)對(duì)草地資源監(jiān)測(cè)省時(shí)、省力,能快速且客觀地對(duì)草地生長現(xiàn)狀做出評(píng)估,適合大尺度估測(cè)草地地上生物量(above-ground biomass,AGB)。自20 世紀(jì)80 年代,有很多國內(nèi)外學(xué)者利用多源遙感數(shù)據(jù)開展AGB 估算研究。如姚興成等[6]利用中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)和地面實(shí)測(cè)資料,以云南省為例建立草地AGB 遙感估算模型,用草地植被群落特征優(yōu)化了模型精度;于惠等[7]構(gòu)建古浪縣生物量估算模型,結(jié)果表明基于MODIS 短波紅外波段的歸一化耕作指數(shù)(normalized difference tillage index,NDTI)與草地AGB 的相關(guān)性最好;馮琦勝等[8]基于青藏高原地面實(shí)測(cè)樣本數(shù)據(jù)與MODIS-NDVI 構(gòu)建生物量風(fēng)干重估算模型,研究表明MODIS-NDVI 的指數(shù)函數(shù)模型是最優(yōu)模型。盡管利用MODIS 遙感數(shù)據(jù)可以估測(cè)草地生物量,但是中分辨率影像存在空間分辨率較粗(大于250 m)和混合像元等問題,致使草地AGB 模型的精度不高,不適合縣域尺度高精度精細(xì)化的遙感監(jiān)測(cè)。
Landsat-8 OLI(operational land imager,OLI)于2013 年發(fā)射,空間分辨率達(dá)30 m,與MODIS 相比其空間分辨率有實(shí)質(zhì)性的提升,并且包含了9 個(gè)波段,其中包括一個(gè)15 m 的全色波段,適合對(duì)草地AGB 進(jìn)行更精細(xì)的遙感估算。Landsat-8 OLI 改進(jìn)了波段數(shù)量、光譜范圍及輻射分辨率等方面,在性能上相比之前幾代Landsat 衛(wèi)星擁有明顯改善,對(duì)草地AGB 估測(cè)的準(zhǔn)確性有提升作用[9]。李斌等[10]利用Landsat 8 遙感影像對(duì)不同處理階段[數(shù)字量化值(digital number,DN)、輻射定標(biāo)、大氣糾正]的歸一化植被指數(shù)(normalized difference vegetation index,NDVI)進(jìn)行對(duì)比研究,表明應(yīng)該采用經(jīng)過大氣校正后的值作為植被覆蓋的定量指標(biāo);Li 等[11]利用Landsat-8 增強(qiáng)型植被指數(shù)(enhanced vegetation index,EVI)建立了與植物干物質(zhì)含量的回歸模型,評(píng)價(jià)分析了整個(gè)青藏高原草甸和草原群落地上生物量的變化特點(diǎn),并比較了植物性狀。烏如汗[12]以內(nèi)蒙古正藍(lán)旗為試驗(yàn)區(qū),利用Landsat-8 OLI 遙感影像和地面實(shí)測(cè)數(shù)據(jù),確定了NDVI 植被指數(shù)的一元二次回歸模型作為草地地上生物量反演模型。以上研究表明Landsat-8 可以實(shí)現(xiàn)對(duì)草地AGB 的有效估測(cè)。然而,現(xiàn)有研究多采用傳統(tǒng)參數(shù)化回歸方法構(gòu)建模型,反演誤差相對(duì)較大,因此在提高草地AGB 監(jiān)測(cè)精度上仍然有必要進(jìn)一步開展深入研究。近年來,機(jī)器學(xué)習(xí)方法在植被遙感監(jiān)測(cè)方面取得了良好的效果[13]。它通?;谕暾墓庾V集進(jìn)行建模,能夠充分利用光譜信息,具有非線性、預(yù)測(cè)準(zhǔn)確率高、泛化能力強(qiáng)的特點(diǎn)[14],因此在遙感領(lǐng)域基于非參數(shù)化的機(jī)器學(xué)習(xí)算法估測(cè)AGB 逐漸受到重視[13]。
基于以上因素考慮,本研究利用Landsat-8 OLI 遙感數(shù)據(jù)結(jié)合青海省門源縣的地面實(shí)測(cè)數(shù)據(jù),將計(jì)算出的植被指數(shù)作為自變量,構(gòu)建傳統(tǒng)回歸模型和隨機(jī)森林模型,對(duì)比分析模型精度,確定遙感反演生物量的最佳模型,以期為當(dāng)?shù)夭莸刭Y源可持續(xù)利用和草畜科學(xué)管理提供理論依據(jù)。
研究區(qū)位于青海省海北藏族自治州門源回族自治縣,地處青藏高原腹地,地理位置為北緯37.5°-38.0°,東經(jīng)102.0°-102.5°(圖1)。門源回族自治縣地勢(shì)西北高,東南低,平均海拔2800 m 以上,屬于高原大陸性氣候,夏季涼爽短暫,冬季寒冷漫長,年平均氣溫-1.7 ℃,年平均降水500 mm。該地區(qū)天然草地類型主要為高寒草甸類,主要以莎草科牧草嵩草(Kobresia myosuroides)、黑褐苔草(Carex atrofusca)和禾本科牧草為優(yōu)勢(shì)種[15]。門源縣是河湟地區(qū)和河西走廊重要的水源涵養(yǎng)區(qū)和補(bǔ)給地,基于農(nóng)牧資源豐富的區(qū)位優(yōu)勢(shì),積極貫徹“立草為業(yè)、畜牧強(qiáng)縣”的發(fā)展方針,大力發(fā)展高寒地區(qū)現(xiàn)代高效畜牧業(yè)及很多特色種養(yǎng)業(yè)。
1.2.1實(shí)測(cè)數(shù)據(jù)獲取 本研究共獲得202 個(gè)地面實(shí)測(cè)調(diào)查樣本數(shù)據(jù),包括青海海北高寒草地生態(tài)系統(tǒng)國家野外科學(xué)觀測(cè)研究站(簡稱海北站)多年連續(xù)的觀測(cè)數(shù)據(jù)和全縣范圍內(nèi)開展的草地AGB 外業(yè)調(diào)查數(shù)據(jù)(圖1)。觀測(cè)站數(shù)據(jù)獲取時(shí)間為2019 年5-8 月、2020 年7 月和2021 年7-8 月,共得到178 個(gè)樣本數(shù)據(jù),全縣范圍內(nèi)AGB 外業(yè)調(diào)查共獲得24 個(gè)樣點(diǎn)數(shù)據(jù),調(diào)查時(shí)間為2021 年7 月1 日-7 月8 日。在對(duì)草地生長期內(nèi)的AGB 進(jìn)行采集時(shí),每個(gè)樣點(diǎn)選取3 個(gè)隨機(jī)樣方,樣方大小為50 cm×50 cm,齊地剪取地上生物量,并記錄各樣方測(cè)量時(shí)間、經(jīng)緯度、海拔、草地蓋度、草層高度、鮮重,將樣本裝袋編號(hào)帶回實(shí)驗(yàn)室進(jìn)行65 ℃烘干48 h 后稱重。最終,取3 個(gè)樣方的平均值作為樣本生物量,總計(jì)有202 個(gè)觀測(cè)樣本。
圖1 研究區(qū)海拔及采樣點(diǎn)空間分布Fig.1 Spatial distribution of altitude and sampling points in the study area
1.2.2遙感數(shù)據(jù)獲取 遙感影像數(shù)據(jù)選用Landsat-8 OLI 數(shù)據(jù),是美國陸地衛(wèi)星計(jì)劃的第8 顆衛(wèi)星,傳感器類型為陸地成像儀(OLI),時(shí)間分辨率為16 d,空間分辨率為30 m。下載的陸地產(chǎn)品級(jí)別為二級(jí)產(chǎn)品(Collection 2 Level-2),該產(chǎn)品已經(jīng)經(jīng)過輻射定標(biāo)、大氣校正和幾何精校正。為了使影像數(shù)據(jù)的成像時(shí)間與地面實(shí)測(cè)數(shù)據(jù)的調(diào)查時(shí)間差異較小,下載影像時(shí)選擇影像完全覆蓋樣地,成像時(shí)間與采樣時(shí)間最接近的影像。選取2019-2021 年的7-8 月覆蓋門源縣采樣點(diǎn)及全境、云量覆蓋<30%的Landsat-8 OLI 影像,總計(jì)7 景(表1)。研究區(qū)實(shí)測(cè)草地生物量樣本數(shù)據(jù)有202 個(gè),剔除受天氣狀況影響的樣本,實(shí)際參與模型構(gòu)建的樣本數(shù)為199 個(gè)。
表1 所用Landsat-8 OLI 影像信息Table 1 Landsat-8 OLI image information used
1.3.1單變量回歸模型建立 利用ArcGIS 10.2 軟件結(jié)合樣地經(jīng)緯度坐標(biāo),導(dǎo)出Landsat-8 OLI 波段2~7,并利用Extraction 工具提取與199 個(gè)地面采樣點(diǎn)對(duì)應(yīng)的像元值。根據(jù)公式計(jì)算29 種植被指數(shù)(表2)。分別構(gòu)建29種植被指數(shù)與AGB 的單因素回歸模型,將植被指數(shù)作為自變量,AGB 作為因變量,二者之間建立線性、對(duì)數(shù)、指數(shù)、乘冪4 種擬合模型;采用10-fold 交叉驗(yàn)證的方式對(duì)模型進(jìn)行精度評(píng)價(jià)。
表2 植被指數(shù)計(jì)算公式Table 2 Calculation formula of vegetation indexes
1.3.2變量篩選 為了篩選出合適的建模因子,本研究在RStudio 中利用“glmnet”程序包實(shí)現(xiàn)基于最小絕對(duì)收縮篩選方法(the least absolute shrinkage and selection operator,LASSO)的變量選擇。這種方法可以將變量的數(shù)量顯著減少,從而實(shí)現(xiàn)降維,被廣泛應(yīng)用于高維數(shù)據(jù)中選擇敏感變量[16]。LASSO 變量篩選方法以模型系數(shù)的絕對(duì)值函數(shù)作為懲罰項(xiàng)施加在普通最小二乘法的損失函數(shù)上,以此來壓縮模型系數(shù),使一些解釋因變量效果不好的系數(shù)變小甚至壓縮至0 從而移出模型,因此LASSO 方法可以提供一種稀疏解,能夠同時(shí)進(jìn)行變量篩選和參數(shù)估計(jì)[17-18]。
1.3.3隨機(jī)森林模型構(gòu)建 隨機(jī)森林算法(random forest,RF)是一種新型機(jī)器學(xué)習(xí)算法,是運(yùn)用多棵決策樹訓(xùn)練樣本并集成預(yù)測(cè)的一種非參數(shù)機(jī)器學(xué)習(xí)算法,是從原始樣本中,利用bootstrap 重抽樣技術(shù)隨機(jī)抽取數(shù)據(jù)后構(gòu)造多個(gè)樣本,然后對(duì)每個(gè)重抽樣樣本采用節(jié)點(diǎn)的隨機(jī)分裂技術(shù)構(gòu)造N 棵決策樹[19]。在每棵樹生長過程中,從全部特征變量中隨機(jī)抽選mtry 個(gè)進(jìn)行內(nèi)部節(jié)點(diǎn)劃分;最后,將N 棵決策樹的預(yù)測(cè)結(jié)果集合起來,采用投票的方式?jīng)Q定新樣本的類別[20]。ntree 參數(shù)值上限一般設(shè)置為1000,大量研究已證明該值對(duì)許多RF 程序有效[21]。利用“random forest”程序包實(shí)現(xiàn)隨機(jī)森林算法,需要定義2 個(gè)參數(shù):決策分類樹的數(shù)目(ntree)和節(jié)點(diǎn)分割的特征數(shù)目(mtry),參數(shù)影響著模型的精度,本研究采用的參數(shù)決策樹數(shù)量ntree 是500、特征個(gè)數(shù)mtry 是4。
1.3.4精度驗(yàn)證 為了比較分析傳統(tǒng)回歸模型和RF 模型對(duì)AGB 的反演效果,這兩種模型均采用十折交叉驗(yàn)證的方法[16],將所用的樣本數(shù)據(jù)隨機(jī)分成10 份,其中9 份作為訓(xùn)練集,1 份作為驗(yàn)證集,分別計(jì)算均方根誤差(root mean square error,RMSE)、決定系數(shù)(coefficient of determination,R2)評(píng)價(jià)AGB 估測(cè)模型的精度[22]。計(jì)算公式如下:
式中:Yi表示樣本實(shí)測(cè)值,Yi表示模型反演值,yi表示樣本生物量實(shí)測(cè)平均值,n表示樣本數(shù)量;RMSE 越小,表示擬合精度越好;R2越接近1,擬合程度越好,參考價(jià)值越高[1]。
2019-2021 年門源縣用于建模的199 個(gè)實(shí)測(cè)樣本的草地生物量統(tǒng)計(jì)結(jié)果見表3。從該表可以看出,海北觀測(cè)站 生物量最大值為4142 kg·hm-2,最小值為187.2 kg·hm-2,平均值 為2061 kg·hm-2,變異系 數(shù)(coefficient of variation,CV)為0.47。外業(yè)調(diào)查數(shù)據(jù)覆蓋門源縣主要草地類型,生物量最大值為4666.67 kg·hm-2,最小值為637.07 kg·hm-2,平均值為1824.01 kg·hm-2,變異系數(shù)(CV)為0.56。
表3 觀測(cè)樣本生物量匯總Table 3 Biomass statistics of observed samples
續(xù)圖2 單因素植被指數(shù)回歸模型預(yù)測(cè)值與實(shí)測(cè)值關(guān)系Continued Fig.2 Relationship between predicted value and measured value of single-factor vegetation indexes regression model(n=199)
從結(jié)果來看,NDVI 與AGB 的對(duì)數(shù)模型精度達(dá)到最優(yōu),驗(yàn)證集R2達(dá)0.50,RMSE 為702.89 kg·hm-2。單因素植被指數(shù)構(gòu)建的模型的驗(yàn)證集R2介于0.37~0.50,RMSE 介于702.89~792.95 kg·hm-2。所有植被指數(shù)最優(yōu)模型 統(tǒng) 計(jì) 分 析 的 結(jié) 果 表 明,NDVI、EVI、RVI、GNDVI、DVI、RDVI、SAVI、MSAVI、OSAVI、PVI、TVI、TVI2、MSR、GSAVI、GOSAVI、TSAVI、RGBVI、VDVI、GRVI、GCI、RBNDVI、BNDVI 最優(yōu)擬合模型為對(duì)數(shù),其他植被指數(shù)的最優(yōu)擬合模型為線性。圖2 為所有植被指數(shù)最優(yōu)模型預(yù)測(cè)值和實(shí)測(cè)值的關(guān)系。驗(yàn)證集R2較高的植被指數(shù)前10 個(gè)分別是NDVI、RBNDVI、TVI、GNDVI、MSR、TSAVI、GCI、GRVI、RVI、panNDVI。
圖2 單因素植被指數(shù)回歸模型預(yù)測(cè)值與實(shí)測(cè)值關(guān)系Fig.2 Relationship between predicted value and measured value of single-factor vegetation indexes regression model(n=199)
本研究對(duì)比了RF 模型變量篩選前后的模型精度。以29 種植被指數(shù)建立的模型,其驗(yàn)證集R2為0.61,RMSE為621.14 kg·hm-2(圖3a)。利用LASSO 變量篩選方法,采用十折交叉驗(yàn)證的方法確定模型均方誤差最小時(shí)λ0=0.25,并取距離λ0一個(gè)標(biāo)準(zhǔn)差位置的λ1(1.22)作為最終的懲罰系數(shù)(圖4)。從29 種植被指數(shù)中選出11 種植被指數(shù),其重要性排序分別是MNLI、MSAVI、GRNDVI、MVI、SAVI、GOSAVI、GRVI、RVI、RGBVI、GSAVI、GCI(圖5)。通過變量篩選所構(gòu)建的AGB 估測(cè)模型為最優(yōu),驗(yàn)證集R2為0.62,RMSE 為621.95 kg·hm-2(圖3b)。由此可見,在保證精度的基礎(chǔ)上LASSO 變量篩選對(duì)草地AGB 反演模型可以有效進(jìn)行降維和簡化。以上2 種RF 模型的精度均高于單因素回歸模型,其中最優(yōu)RF 模型的R2比最優(yōu)單因素模型提高0.12,RMSE 降低了80.95 kg·hm-2。
圖3 隨機(jī)森林模型預(yù)測(cè)值與實(shí)測(cè)值關(guān)系Fig.3 Relationship between predicted value and measured value of RF model
圖4 LASSO 篩選結(jié)果Fig.4 LASSO results
圖5 篩選出的植被指數(shù)的重要性Fig.5 The importance of screened vegetation indexes
經(jīng)過變量篩選的隨機(jī)森林草地AGB 估算模型最優(yōu),利用該模型對(duì)研究區(qū)2019-2021 年的AGB 進(jìn)行了反演(圖6)??梢钥闯觯莸谹GB 高值主要集中在西北部,東南部相對(duì)較低,總體呈中部高,四周低的趨勢(shì)。2019 年草 地AGB 值 主 要 在0~800 kg·hm-2和1500~2000 kg·hm-2;2020 年 主 要 在0~800 kg·hm-2和1000~1500 kg·hm-2;2021 年主要分布在1000~1500 kg·hm-2和1500~2000 kg·hm-2。2019-2021 年全縣天然草地總產(chǎn)草量介于4.2827 萬~8.9776 萬t,平均單產(chǎn)介于1063.49~1484.82 kg·hm-2。門源縣草地類型以山地草甸、溫性草原和高寒草甸三類為主,其中分布最廣泛的是高寒草甸,2019-2021 年產(chǎn)草量介于4.0825 萬~5.6653 萬t,平均AGB為1060.38~1471.94 kg·hm-2。 山 地 草 甸2019-2021 年 產(chǎn) 草 量 介 于973.7687~1571.6790 t,平 均AGB 介 于1036.81~1637.43 kg·hm-2;溫 性 草 原2019-2021 年產(chǎn)草量介于746.6281~1112.7140 t,平均AGB 介于1198.72~1786.63 kg·hm-2(圖7)。
圖6 門源縣2019(a)、2020(b)和2021(c)年天然AGB 空間分布Fig.6 Spatial distribution of AGB of natural grassland in 2019(a),2020(b)and 2021(c)in Menyuan County
圖7 門源縣3 種主要草地類型的平均地上生物量統(tǒng)計(jì)Fig. 7 Average aboveground biomass of three main grassland types in Menyuan County
現(xiàn)階段國內(nèi)外研究基于植被指數(shù)構(gòu)建生物量估算模型的方法較為常見,其數(shù)值可以代表植被活力,比單波段更具有靈敏性[23]。NDVI 是目前在遙感領(lǐng)域應(yīng)用最廣泛的一種植被指數(shù),可以捕獲植被整個(gè)生長季的動(dòng)態(tài),可用于植物生物量的預(yù)測(cè),在各類植被指數(shù)中,NDVI 可以較好反映AGB,對(duì)植被生長的相關(guān)信息敏感,如水分含量和植被覆蓋等[24]。從本研究對(duì)29 種植被指數(shù)單因素建模的研究結(jié)果來看,NDVI 用于草地AGB 的估測(cè)模型在傳統(tǒng)統(tǒng)計(jì)回歸模型中精度最優(yōu),這與許多學(xué)者[25-27]的研究結(jié)果一致。也有很多學(xué)者研究認(rèn)為SAVI 比NDVI 更適合估算草地地上生物量,因?yàn)镾AVI 適應(yīng)植被密度變化及消除土壤影響的能力較強(qiáng)[28-29]。但是,本研究區(qū)分布范圍最大的草地類型是高寒草甸,其植被覆蓋度較高且均一,所以土壤背景對(duì)植被估測(cè)的影響不如其他學(xué)者的研究區(qū)域明顯[4],并且這是單因素估算模型,其反演結(jié)果不如NDVI 與AGB 估測(cè)效果,這與楊鵬萬等[4]的研究結(jié)果類似。
除NDVI 以外,單因 素 回 歸 模 型R2較高的前10 個(gè)植被指數(shù)依次分 別 是NDVI、RBNDVI、TVI、GNDVI、MSR、TSAVI、GCI、GRVI、RVI、panNDVI。經(jīng)過LASSO 變量篩選后構(gòu)建研究區(qū)草地AGB 反演模型的植被指數(shù)有RVI、SAVI、MSAVI、MNLI、GSAVI、GOSAVI、RGBVI、GRVI、GCI、MVI、GRNDVI。由此可見,傳統(tǒng)回歸結(jié)果與RF 建模篩選出的變量有一定差異。值得一提的是,在29 種單因素植被指數(shù)回歸模型中,NDVI 與AGB 的相關(guān)性最高,但是在隨機(jī)森林模型構(gòu)建篩選變量的過程中NDVI 沒有被篩選出來,篩選出來的相近植被指數(shù)是GRNDVI。這是因?yàn)镚RNDVI 是基于NDVI 基礎(chǔ)上改進(jìn)的植被指數(shù),GRNDVI 與NDVI 具有較好的線性相關(guān)關(guān)系,利用這兩種植被指數(shù)估算葉綠素可以達(dá)到相似的精度[30]。GRNDVI、RVI、GRVI、GCI 在變量篩選中被篩選出來,同時(shí)也是單因素回歸模型中與生物量擬合精度較好的幾種植被指數(shù)。但在RF 模型中其他被篩選出的植被指數(shù)(SAVI、MSAVI、MNLI、GSAVI、GOSAVI、RGBVI、MVI),其單因素模型的精度并不高。多種植被指數(shù)性能具有交互影響和互補(bǔ)作用可能是導(dǎo)致這種現(xiàn)象的重要原因。兩種模型采用的是完全不同的變量篩選方法,單因素模型是植被指數(shù)各自分別與AGB 的相關(guān)性,不能涵蓋多種因素的綜合影響,基于單因素構(gòu)建的回歸模型的誤差偏大;而在RF 模型中是所有篩選出來的植被指數(shù)共同影響并決定了模型的精度,明顯優(yōu)于傳統(tǒng)回歸模型。
比較分析最優(yōu)RF 模型涉及的多種植被指數(shù),可以看出:1)基于近紅外和紅光波段組合計(jì)算的植被指數(shù),是反演草地AGB 的重要變量。本研究由LASSO 篩選出的11 個(gè)植被指數(shù)作為建模因子構(gòu)建了最優(yōu)RF 模型,其中,有4 個(gè)植被指數(shù)是基于Landsat-8 近紅外和紅光波段計(jì)算的,分別為RVI、SAVI、MSAVI、MNLI。已有研究表明,利用紅邊和近紅外光譜計(jì)算的植被指數(shù)可以最大限度地減少大氣和水分吸收等因素的影響[31],研究區(qū)具有高寒陰濕的氣候特點(diǎn),這可能是這類植被指數(shù)對(duì)高寒地區(qū)草地AGB 有顯著影響的關(guān)鍵因素之一。2)由綠波段參與構(gòu)建的植被指數(shù)對(duì)高寒草地AGB 也具有重要影響。大部分植被指數(shù)多基于近紅外和紅光波段反射率組合計(jì)算,然而近年來研究發(fā)現(xiàn)以近紅外光和綠光波段構(gòu)建的植被指數(shù)有時(shí)更加敏感[32-33]。本研究篩選出的GSAVI、GOSAVI、RGBVI、GRVI、GCI、GRNDVI 這幾種植被指數(shù)的計(jì)算均有綠波段,這表明基于綠波段構(gòu)建的植被指數(shù)對(duì)高寒地區(qū)的草地生物量的精準(zhǔn)估算也具有顯著影響。3)MVI 和MNLI 這兩個(gè)植被指數(shù)對(duì)干旱區(qū)的植被更為敏感,這可能與本研究區(qū)地處青藏高原腹地,屬半干旱地區(qū)密切相關(guān)。首先短波紅外波段參與構(gòu)建的植被指數(shù)對(duì)特定區(qū)域的草地植被的AGB 更為敏感。MVI 植被指數(shù)是基于紅光、近紅外和短波紅外波段計(jì)算的植被指數(shù),于惠等[7]研究表明短波紅外波段對(duì)干旱區(qū)草地植被更為敏感;此外,MNLI 是非線性植被指數(shù)的改進(jìn)指數(shù),它與葉綠素含量具有較高的相關(guān)性,在半干旱環(huán)境下,MNLI 可以將植被指數(shù)與地表生物物理參數(shù)的非線性化關(guān)系線性化[34]。故MVI 和MNLI 被篩選出來,對(duì)處于半干旱區(qū)的植被生物量估算也具有一定的作用。綜上所述,本研究通過變量篩選后,用選出的多種類型的植被指數(shù)建模,這不僅簡化了模型,也從葉綠素含量、消除水分影響、植被密度等方面綜合反映了植被特征,多種植被指數(shù)與草地AGB 之間具有顯著的相關(guān)性,并且不同植被指數(shù)之間也具有一定的互補(bǔ)性,從而可以綜合地反映草地生物量的狀況。
相較于傳統(tǒng)回歸分析方法,機(jī)器學(xué)習(xí)算法更適用于較復(fù)雜的運(yùn)算,可以更好地進(jìn)行變量篩選和組合,很大程度地提升草地AGB 估測(cè)模型的精度。隨機(jī)森林模型可以組合不同含義的變量特征,且有效解決“過飽和”和共線性的問題[35]。有很多學(xué)者利用隨機(jī)森林模型進(jìn)行了農(nóng)作物、森林、竹林的生物量估算和茶園提?。?6-37],均取得了不錯(cuò)的研究成果。但是,RF 模型也有其局限性,特別是在構(gòu)建回歸分類樹的方式上,會(huì)低估超出訓(xùn)練集范圍內(nèi)的高生物量值[32]。此外,機(jī)器學(xué)習(xí)基于數(shù)據(jù)驅(qū)動(dòng),通常需要大量的數(shù)據(jù),若研究的數(shù)據(jù)量較小,可能對(duì)模型準(zhǔn)確性造成一定的影響[38]。
Landsat-8 OLI 遙感數(shù)據(jù)因其相較于低分辨率衛(wèi)星具有更高的分辨率,相較于之前的Landsat 衛(wèi)星具有更多的波段和覆蓋范圍,有避免大氣吸收特征的干擾,可用于海岸帶觀測(cè)和云檢測(cè),近紅外波段、短波紅外波段與MODIS 對(duì)應(yīng)波段接近等優(yōu)勢(shì),在我國草地資源的監(jiān)測(cè)方面有較廣泛的應(yīng)用[22]。本研究通過機(jī)器學(xué)習(xí)算法和Landsat-8 OLI 數(shù)據(jù)提升了傳統(tǒng)草地生物量估算模型的精度,但是還存在一定的局限性。Landsat-8 OLI 的空間分辨率是30 m,比起MODIS 的影像空間分辨率(250~1000 m)高很多,但其時(shí)間分辨率是16 d。另外,研究區(qū)地處青藏高原,受云量和當(dāng)?shù)靥鞖庥绊戄^大,衛(wèi)星過境重訪周期長,不能很好地獲得高質(zhì)量的影像,可能會(huì)對(duì)模型精度和AGB 動(dòng)態(tài)監(jiān)測(cè)造成一定的影響。在未來研究中,可以獲取更高時(shí)間分辨率的Landsat 數(shù)據(jù),進(jìn)一步提高模型的精度。另外,草地生物量受地理位置、氣候、土壤、地形等多種因素的影響[39]。其中氣候因素包括光照、氣溫和降水等;土壤因素包括土壤營養(yǎng)元素、土壤結(jié)構(gòu)和肥力等。并且還受到草地類型與分布、物種多樣性等生物因素,以及放牧、圍欄封育、輪牧等管理因素的共同影響[40]。未來可以考慮土壤、地形、氣象因素等變量參與模型的構(gòu)建,優(yōu)化現(xiàn)有RF 模型。
本研究基于Landsat-8 OLI 遙感數(shù)據(jù),分別構(gòu)建并比較了29 個(gè)植被指數(shù)與草地AGB 的單因素回歸模型和RF模型,主要得出以下結(jié)論:1)綜合并確立了29 個(gè)國內(nèi)外廣泛應(yīng)用的植被指數(shù)與高寒草地AGB 的線性最優(yōu)關(guān)系,表明多種植被指數(shù)與草地AGB 之間均具有顯著的相關(guān)性。2)多種植被指數(shù)之間具有一定的互補(bǔ)性,機(jī)器學(xué)習(xí)算法可以更好地進(jìn)行變量篩選和組合,因此基于機(jī)器學(xué)習(xí)的多種植被指數(shù)的組合應(yīng)用在很大程度上可以提升草地AGB 模型的反演精度,從而更加精準(zhǔn)地反映草地生物量的時(shí)空變化狀況。3)得到了2019-2021 年門源縣30 m分辨率的草地AGB 分布??臻g分布特征為西北部較高,東南部相對(duì)較低;大體呈中部高,四周低的狀況,其中高寒草甸分布最多。