李坤 吳達(dá)勝 方陸明 劉建超
(浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室(浙江農(nóng)林大學(xué)),杭州,311300) (浙江農(nóng)林大學(xué)暨陽(yáng)學(xué)院)
森林是陸地生態(tài)系統(tǒng)的重要組成部分,在全球碳循環(huán)中起著至關(guān)重要的作用,全面快速地掌握森林信息對(duì)國(guó)民經(jīng)濟(jì)和綠色可持續(xù)發(fā)展有著積極作用。森林蓄積量是衡量森林質(zhì)量的一個(gè)重要因子,也是反映森林資源水平的一個(gè)基本指標(biāo),精準(zhǔn)估測(cè)森林蓄積量有助于監(jiān)測(cè)森林質(zhì)量,為林業(yè)資源管理決策提供科學(xué)依據(jù)。傳統(tǒng)的森林資源調(diào)查不僅費(fèi)時(shí)費(fèi)力,而且難以反映森林的動(dòng)態(tài)發(fā)展情況。因此,林業(yè)工作者及研究人員一直致力于探索如何利用飛速發(fā)展的遙感技術(shù)對(duì)蓄積量進(jìn)行估測(cè)[1-2]。
目前,遙感技術(shù)應(yīng)用于森林蓄積量估測(cè)主要體現(xiàn)在三方面:一是選取光學(xué)遙感影像,對(duì)其進(jìn)行主成分分析后選取主成分并提取紋理特征,探討不同分辨率不同窗口大小提取到的紋理特征與森林蓄積量的相關(guān)性;二是結(jié)合不同遙感數(shù)據(jù)源(光學(xué)遙感、雷達(dá)遙感)構(gòu)建估測(cè)模型;三是使用不同建模方法,從回歸模型發(fā)展至人工神經(jīng)網(wǎng)絡(luò)、k最近鄰算法等經(jīng)典機(jī)器學(xué)習(xí)模型[3]。劉明艷等[4]利用主成分分析法對(duì)老禿頂子自然保護(hù)區(qū)進(jìn)行蓄積量估測(cè),模型預(yù)估精度達(dá)到92.18%;楊明星等[5]利用多窗口遙感影像紋理特征對(duì)蓄積量進(jìn)行建模評(píng)估,使用隨機(jī)森林模型對(duì)蓄積量進(jìn)行建模評(píng)估,精度達(dá)到75.46%,估測(cè)效果較好;蔣馥根等[6]基于方差優(yōu)化K近鄰法對(duì)蓄積量進(jìn)行反演,該模型決定系數(shù)(R2)達(dá)到0.69,相對(duì)均方根誤差(RRMSE)為32.04%。機(jī)器學(xué)習(xí)模型為非參數(shù)模型,相較于傳統(tǒng)的經(jīng)驗(yàn)?zāi)P停粌H能夠克服特征因子之間的共線性問(wèn)題,而且具有更好的泛化能力,能夠?qū)︻悇e特征進(jìn)行處理,更適用于處理數(shù)據(jù)量大、特征繁多的林業(yè)數(shù)據(jù)。
國(guó)內(nèi)外學(xué)者通常運(yùn)用當(dāng)?shù)氐倪b感影像和外業(yè)調(diào)查數(shù)據(jù)對(duì)當(dāng)前區(qū)域的蓄積量進(jìn)行預(yù)測(cè)或者反演[7-9],很少將同一模型應(yīng)用于不同區(qū)域,檢驗(yàn)?zāi)P偷钠者m性;在選取特征建模時(shí),由于傳統(tǒng)經(jīng)驗(yàn)?zāi)P筒荒苤苯犹幚眍悇e特征,需要根據(jù)類別特征將數(shù)據(jù)劃分為不同的類別,再根據(jù)不同類別分別建立不同的模型[10-11],這樣的模型建立繁瑣,且適用性不強(qiáng)。
本研究從非參數(shù)模型泛化性能較強(qiáng)的特點(diǎn)出發(fā)[6,12],結(jié)合機(jī)器學(xué)習(xí)算法處理類別特征的能力[13],提出最小絕對(duì)收縮和選擇算子(Lasso)特征選擇方法的堆疊(Stacking)融合模型。根據(jù)Sentinel-2遙感影像、二類調(diào)查數(shù)據(jù)與數(shù)字高程模型(DEM)數(shù)據(jù),首先選擇K最近鄰算法(K-NN)、梯度提升迭代決策樹(GBDT)、極端梯度提升(XGBoost)、梯度增強(qiáng)集成分類器(CatBoost)4種單一模型進(jìn)行建模估測(cè),然后探討類別特征的加入對(duì)模型指標(biāo)的影響,最后建立堆疊(Stacking)融合模型。采用十折交叉驗(yàn)證法檢驗(yàn)?zāi)P托阅苤笜?biāo),比較融合模型與單一模型的精度,驗(yàn)證不同模型的普適性,探討類別特征對(duì)模型優(yōu)化的影響,為森林蓄積量估測(cè)中特征選取以及模型構(gòu)建提供新的思路。
淳安縣位于浙江省西部,地處北緯29°11′~30°2′,東經(jīng)118°20′~119°20′,陸域面積4 417.48 km2,屬中亞熱帶季風(fēng)氣候。全縣森林覆蓋率達(dá)65.00%,生物種類繁多、資源豐富,年平均溫度為17 ℃,年平均降水量1 430 mm,地形以丘陵山地為主,海拔50~1 500 m,土壤以紅壤、黃壤、巖性土、水稻土為主,其中紅壤為面積最大的土屬。
臨海市位于浙江省東南沿海,地處北緯28°40′~29°4′,東經(jīng)120°49′~121°41′,陸地總面積2 203 km2,屬亞熱帶季風(fēng)氣候,年平均氣溫17 ℃,年平均降水量1 550 mm,四季分明,適合植被生長(zhǎng),境內(nèi)森林覆蓋率為64.20%。地形以丘陵和山地為主,山地面積占總面積的70.7%,平原面積占22.8%,呈“七山一水兩分田”地貌。
本研究使用Sentinel-2遙感衛(wèi)星影像,成像時(shí)間為2017年11月27日,共12景,根據(jù)研究區(qū)行政區(qū)邊界裁剪拼接后的遙感影像如圖1(a)和圖1(c)所示。Sentinel-2號(hào)衛(wèi)星(Sentinel-2A、Sentinel-2B)攜帶一枚多光譜成像儀(MSI),可覆蓋13個(gè)光譜波段(見表1)。具有光學(xué)遙感衛(wèi)星常見的可見光、近紅外和短波紅外波段,還包含3個(gè)應(yīng)用在高光譜數(shù)據(jù)中的紅邊波段,具有不同的空間分辨率。Sentinel-2號(hào)數(shù)據(jù)是在紅邊范圍內(nèi)的3個(gè)波段對(duì)監(jiān)測(cè)植被的輻射強(qiáng)度非常有效[14-15]。
表1 Sentinel-2遙感影像波段信息
本研究中的地形數(shù)據(jù)來(lái)源于2017年研究區(qū)的二類調(diào)查數(shù)據(jù),以及30 m分辨率的數(shù)字高程模型(DEM)數(shù)據(jù)。根據(jù)研究區(qū)行政邊界拼接裁剪后的數(shù)字高程模型數(shù)據(jù)如圖1(b)和圖1(d)所示。
由于遙感影像、數(shù)字高程模型數(shù)據(jù)、二類調(diào)查數(shù)據(jù)坐標(biāo)系不同,在數(shù)據(jù)整合前需進(jìn)行坐標(biāo)系轉(zhuǎn)換,本研究統(tǒng)一使用CGCS_2000_3_Degree_GK_CM_120E坐標(biāo)系[16]。
光譜特征因子:Sentinel-2共包含13個(gè)波段,B1波段與B10波段與本研究無(wú)關(guān),故選取剩余11個(gè)單波段因子?;趩尾ǘ我蜃舆M(jìn)行波段運(yùn)算,提取12個(gè)常見植被指數(shù),即土壤調(diào)節(jié)植被指數(shù)、比值植被指數(shù)、非線性指數(shù)、歸一化水指數(shù)、歸一化植被指數(shù)、改進(jìn)的歸一化植被指數(shù)、歸一化紅外指數(shù)、歸一化差異綠度指數(shù)、增強(qiáng)型植被指數(shù)、差值植被指數(shù)、類胡蘿卜素反射指數(shù)、綠光葉綠素指數(shù)。根據(jù)Sentinel-2特有的紅邊波段提取7個(gè)植被指數(shù):比值紅邊植被指數(shù)、歸一化紅邊植被指數(shù)1、歸一化紅邊植被指數(shù)2(、改進(jìn)的歸一化紅邊植被指數(shù)、紅邊葉綠素指數(shù)、非線性紅邊指數(shù)、反轉(zhuǎn)紅邊葉綠素指數(shù)[17]。植被指數(shù)的具體計(jì)算公式見表2。
紋理特征因子:本研究采用灰度共生矩陣法提取遙感影像的紋理特征[19]。以B2、B3、B4和B8等4個(gè)10 m分辨率波段組合后進(jìn)行主成分分析,使用ENVI軟件提取第一主成分的8個(gè)紋理特征因子:均值、方差、協(xié)同性、對(duì)比度、相異性、熵、角二階矩、相關(guān)性。
表2 植被指數(shù)
地面數(shù)據(jù)特征因子:從二調(diào)數(shù)據(jù)中獲取每個(gè)小班的坡向、坡位、土層厚度、腐殖質(zhì)厚度、植被覆蓋度、群落、優(yōu)勢(shì)樹種、年齡、郁閉度等9個(gè)自變量因子,其中坡向、腐殖質(zhì)厚度、群落、優(yōu)勢(shì)樹種為類別特征因子。從數(shù)字高程模型數(shù)據(jù)中提取海拔、坡度和坡向等3個(gè)自變量因子。
本研究共提取50個(gè)特征因子(包含四個(gè)類別特征因子)。使用ArcMap軟件以森林資源細(xì)班為單元整合所有自變量因子,獲得淳安縣數(shù)據(jù)133 734條、臨海市數(shù)據(jù)59 636條。刪除字段缺失數(shù)據(jù),再根據(jù)3倍標(biāo)準(zhǔn)差原則去除部分?jǐn)?shù)據(jù),共獲得淳安縣研究數(shù)據(jù)40 216條、臨海市研究數(shù)據(jù)19 840條。
K最近鄰算法(K-NN算法):K最近鄰算法是比較成熟的非參數(shù)方法中最典型的方法之一。該算法通過(guò)數(shù)據(jù)所有的特征計(jì)算新數(shù)據(jù)與數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的距離(該距離通常采用歐式距離以及曼哈頓距離),按照距離遞增次序進(jìn)行排序,返回K個(gè)點(diǎn)的加權(quán)值作為預(yù)測(cè)值。該算法沒有過(guò)多的理論推導(dǎo)與步驟,實(shí)現(xiàn)較為方便。
圖1 研究區(qū)衛(wèi)星影像圖和數(shù)字高程模型數(shù)據(jù)
梯度提升迭代決策樹(GBDT):梯度提升迭代決策樹是一種集成學(xué)習(xí)算法,由決策樹和梯度提升組成,GBDT采用基函數(shù)的線性組合以及不斷減小訓(xùn)練過(guò)程產(chǎn)生的殘差(預(yù)測(cè)值與真實(shí)值的差值)來(lái)完成數(shù)據(jù)回歸。其核心是計(jì)算上一輪迭代的負(fù)梯度,減少殘差的梯度方向上建立新的決策樹,通過(guò)不斷迭代改進(jìn)來(lái)得到更準(zhǔn)確的預(yù)測(cè)結(jié)果。該算法很好地降低了多種因素之間的信息冗余程度。
極端梯度提升算法(XGBoost算法):極端梯度提升算法是一種基于決策樹的集成機(jī)器學(xué)習(xí)算法。XGBoost算法的基本思想是首先建立一個(gè)基分類/回歸器,逐步加入新的分類/回歸器,每加入一個(gè)分類/回歸器后,再次計(jì)算其目標(biāo)函數(shù)的值,保證在迭代過(guò)程中,目標(biāo)函數(shù)值逐步下降,以此不斷提升模型的表達(dá)效果。該算法有較強(qiáng)的泛化性能,能降低過(guò)擬合,適用性較強(qiáng),在速度和效率上都優(yōu)于其他梯度提升算法。
梯度增強(qiáng)集成分類器(CatBoost):傳統(tǒng)的梯度增強(qiáng)對(duì)樣本梯度計(jì)算依賴于樣本自身,噪聲點(diǎn)會(huì)帶來(lái)預(yù)測(cè)偏移,最終導(dǎo)致過(guò)擬合,為解決這一問(wèn)題,CatBoost首先對(duì)整個(gè)數(shù)據(jù)集進(jìn)行若干次排序,去除第i條數(shù)據(jù),針對(duì)前i-1條數(shù)據(jù),分別計(jì)算損失函數(shù)以及梯度,并建立殘差樹,最后將殘差樹累加到原模型上,有效避免了預(yù)測(cè)偏移,減少過(guò)擬合。而且CatBoost算法能自動(dòng)處理類別特征,并根據(jù)特征的內(nèi)在聯(lián)系將原有類別特征進(jìn)行組合,豐富特征維度,提升預(yù)測(cè)結(jié)果的精確性。
堆疊法(Stacking)模型融合:Stacking是一種集成學(xué)習(xí)方法,基于K折交叉驗(yàn)證的思想,通過(guò)元分類器或元回歸器來(lái)融合多個(gè)分類或回歸模型。首先基于完整的訓(xùn)練集對(duì)基礎(chǔ)模型進(jìn)行訓(xùn)練,然后將每個(gè)基礎(chǔ)模型的預(yù)測(cè)值作為元模型的訓(xùn)練集,用新的訓(xùn)練集對(duì)元模型進(jìn)行訓(xùn)練。Stacking通常會(huì)使用不同的機(jī)器學(xué)習(xí)算法來(lái)保證基礎(chǔ)模型的多樣性,并通過(guò)元模型以最優(yōu)方法對(duì)初步回歸結(jié)果進(jìn)行整合,可以充分利用基礎(chǔ)模型的預(yù)測(cè)結(jié)果,而且可以發(fā)現(xiàn)糾正基礎(chǔ)模型中的部分偏差,使得準(zhǔn)確率得到提高,同時(shí)降低過(guò)擬合的風(fēng)險(xiǎn)。本研究使用CatBoost和GBDT作為基礎(chǔ)模型,XGBoost作為元模型。
圖2 Stacking模型融合示意圖
Lasso特征選擇:最小絕對(duì)收縮和選擇算子(Lasso)是一種基于L1范式的特征選擇方法,屬于嵌入式特征選擇。Lasso通過(guò)加入L1懲罰項(xiàng),將一些不重要特征的系數(shù)壓縮為0,即剔除該特征,從而達(dá)到稀疏化和特征選擇的目的。與其他變量選擇方法比較,Lasso方法能夠較準(zhǔn)確地選擇出重要特征,而且還具備特征選擇的穩(wěn)定性。
類別特征編碼:本研究共選取四個(gè)類別特征。由于K-NN、GBDT和XGBoost不直接支持類別特征,因此需要對(duì)類別特征進(jìn)行編碼。根據(jù)類別特征屬性,本研究采用兩種類別編碼方式。
標(biāo)簽編碼:使用腐殖質(zhì)厚度、群落為定序變量,采用標(biāo)簽編碼,將類別特征依照特質(zhì)以數(shù)字劃分。將腐殖質(zhì)厚度的{“薄”,“中”,“厚”}、群落的{“簡(jiǎn)單”,“較完整”,“完整”}轉(zhuǎn)換為{0,1,2}。
獨(dú)熱編碼:使用坡向取值為{“陰坡”,“陽(yáng)坡”,“無(wú)坡向”}、優(yōu)勢(shì)樹種取值為{“杉木”,“馬尾松”,“闊葉混交林”等8種優(yōu)勢(shì)樹種}為定類變量,采用獨(dú)熱編碼,其方法是使用N位狀態(tài)寄存器來(lái)對(duì)N個(gè)狀態(tài)進(jìn)行編碼,每個(gè)狀態(tài)都有獨(dú)立的寄存器位,在任意時(shí)候,其中只有一位有效。坡向編碼結(jié)果如圖3所示。
圖3 獨(dú)熱編碼圖
因本文研究數(shù)據(jù)涉及到的自變量因子有46個(gè)(不包括4個(gè)類別特征),為了找出對(duì)森林蓄積量具有更大的影響作用的因子,進(jìn)一步提升模型的估測(cè)精度及其泛化能力。使用Lasso特征選擇方法,從繁多的特征因子中選取部分重要特征,建立K-NN、GBDT、XGBoost和CatBoost等4種單一模型,并使用控制變量法探索類別特征對(duì)模型指標(biāo)的影響,然后使用Stacking方法對(duì)單一模型進(jìn)行融合,分析比較融合模型與單一模型的優(yōu)劣。本文選用的Lasso特征選擇以及機(jī)器學(xué)習(xí)模型均通過(guò)網(wǎng)格搜索(GridSearchCV)進(jìn)行參數(shù)調(diào)優(yōu)。
建模的具體步驟如下:(1)將所有樣本按照7∶3的比例隨機(jī)劃分訓(xùn)練集與測(cè)試集;(2)通過(guò)網(wǎng)格搜索對(duì)4個(gè)單一模型進(jìn)行反復(fù)調(diào)參,建立最優(yōu)參數(shù)估測(cè)模型;(3)使用最優(yōu)參數(shù)模型對(duì)測(cè)試集進(jìn)行估測(cè),得到單一模型預(yù)測(cè)結(jié)果;(4)檢驗(yàn)類別特征對(duì)模型性能指標(biāo)的影響,分析模型的普適性;(5)使用Stacking方法融合多個(gè)單一模型,并與單一模型估測(cè)結(jié)果進(jìn)行對(duì)比。
本研究選用十折交叉驗(yàn)證的方式來(lái)評(píng)估模型的精度。采用的性能指標(biāo)有決定系數(shù)(R2)、均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均百分比誤差(MAPE),計(jì)算公式如下:
由于使用K-NN算法前需要對(duì)數(shù)據(jù)進(jìn)行歸一化,而樹模型并不需要對(duì)數(shù)據(jù)進(jìn)行歸一化,從而導(dǎo)致數(shù)據(jù)量綱不統(tǒng)一。使用不同量綱下的MAE和MSE不能體現(xiàn)模型之間的差異,故使用均方誤差與因變量平均值的比值(相對(duì)均方誤差)替代性能指標(biāo)的均方誤差,平均絕對(duì)誤差與因變量平均值的比值(相對(duì)平均絕對(duì)誤差)替代性能指標(biāo)的平均絕對(duì)誤差。
本文共提取數(shù)值特征46個(gè),類別特征4個(gè)。為了減少信息冗余,降低共線性,使用Lasso方法對(duì)46個(gè)數(shù)值特征進(jìn)行特征選擇。經(jīng)參數(shù)調(diào)優(yōu)后,參數(shù)阿爾法取值0.003,系數(shù)閾值0.05,并選取系數(shù)值大于0.05的自變量因子作為建模特征因子(包括郁閉度、比值紅邊植被指數(shù)、改進(jìn)的歸一化植被指數(shù)、年齡、方差、相關(guān)性、相異性和熵等特征因子)。
為比較類別特征(坡向、腐殖質(zhì)厚度、群落和優(yōu)勢(shì)樹種)對(duì)于模型性能指標(biāo)的影響,使用淳安縣數(shù)據(jù),在未加入類別特征的情況下,經(jīng)篩選后的8個(gè)數(shù)值特征進(jìn)行建模和運(yùn)用4個(gè)類別特征及篩選后的8個(gè)數(shù)值特征進(jìn)行建模,模型性能指標(biāo)見表3。
由表3可知,類別特征的加入對(duì)模型各項(xiàng)性能指標(biāo)的提升有著顯著影響。在加入類別指標(biāo)后,GBDT模型的R2提高了0.12,CatBoost模型的R2提高了0.16;GBDT模型的相對(duì)均方誤差從55.55%降低到32.19%,CatBoost模型的相對(duì)均方誤差從54.0%降低到26.7%;GBDT模型的相對(duì)平均絕對(duì)誤差從28.32%降低到20.17%,K-NN模型的相對(duì)平均絕對(duì)誤差從34.02%降低到24.47%;K-NN模型的平均百分比誤差從36.74%降低到33.75%,CatBoost模型的平均百分比誤差從36.07%降低到22.57%。因此,加入類別特征后,4種模型的各項(xiàng)性能指標(biāo)均有顯著改善,CatBoost模型總體表現(xiàn)最好,各項(xiàng)指標(biāo)優(yōu)于其他3種模型。加入類別特征后的4種模型估測(cè)結(jié)果散點(diǎn)圖如圖4所示。
表3 淳安縣森林蓄積量估測(cè)模型的性能指標(biāo)
由圖4可知,CatBoost、XGBoost、GBDT、K-NN等4種模型的R2逐漸下降,預(yù)測(cè)點(diǎn)與真實(shí)值之間差值越來(lái)越大,觀察點(diǎn)在回歸直線附近愈發(fā)稀疏,模型的可解釋性降低。
為探究模型跨空間普適能力,并進(jìn)一步驗(yàn)證類別特征的加入對(duì)模型性能指標(biāo)的影響是否具有普適性。將4種模型應(yīng)用于臨海市森林蓄積量估測(cè),估測(cè)結(jié)果性能指標(biāo)如表4所示。該結(jié)果進(jìn)一步驗(yàn)證了類別特征對(duì)模型的優(yōu)化作用具有一定的普適性,且XGBoost和CatBoost模型優(yōu)于K-NN以及GBDT模型。
圖4 4種模型對(duì)淳安縣森林蓄積量預(yù)測(cè)的擬合
表4 臨海市森林蓄積量估測(cè)模型的性能指標(biāo)
雖然4種模型的R2相較淳安縣的森林蓄積量估測(cè)結(jié)果有所下降,但是相對(duì)均方誤差,相對(duì)平均絕對(duì)誤差以及平均百分比誤差等3項(xiàng)指標(biāo)均好于淳安的估測(cè)結(jié)果,說(shuō)明模型具有一定的跨空間普適性,在不同地區(qū)均能取得較好表現(xiàn)。加入類別特征后的蓄積量估測(cè)散點(diǎn)圖如圖5所示。
為驗(yàn)證融合模型與單模型的優(yōu)劣,基于前述篩選的類別特征及數(shù)值特征,以CatBoost和GBDT為基礎(chǔ)模型,XGBoost為元模型,進(jìn)行Stacking模型融合,與相同情況下單模型中表現(xiàn)最好的CatBoost進(jìn)行對(duì)比(見表5)。由表5可知,模型融合后,除相對(duì)均方誤差外,其余性能指標(biāo)較CatBoost均有所改善,說(shuō)明融合模型的綜合效果優(yōu)于單一模型。
圖5 4種模型對(duì)臨海市森林蓄積量預(yù)測(cè)的擬合
遙感影像包含了更廣域的、動(dòng)態(tài)的地面覆蓋物信息,為森林蓄積量估測(cè)提供了范圍更廣、實(shí)時(shí)性更強(qiáng)的數(shù)據(jù)來(lái)源,結(jié)合DEM、森林資源二類調(diào)查數(shù)據(jù),為森林資源動(dòng)態(tài)監(jiān)測(cè)提供更為有效的支持。本研究使用2017年淳安縣及臨海市的Sentinel-2遙感影像、二類調(diào)查以及DEM數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)預(yù)處理以及特征選擇,建立了單模型和多模型融合的蓄積量預(yù)測(cè)模型。通過(guò)控制變量法探索類別特征對(duì)于模型指標(biāo)的影響,證明類別特征的加入能有效提高模型性能;實(shí)驗(yàn)中,使用臨海市森林資源數(shù),進(jìn)一步據(jù)驗(yàn)證模型的間普適性以及類別特征對(duì)模型精度的影響;Stacking融合模型與單模型相比,綜合指性能標(biāo)更佳,估測(cè)精度更高。
在所選取的特征因子中,獲取數(shù)值特征46個(gè),Lasso特征選擇方法有效減少了特征數(shù)量,使建模所用數(shù)值特征縮減到8個(gè),加快了模型訓(xùn)練速度、提高了模型泛化能力,并使模型具有更好的解釋性;類別特征的加入明顯優(yōu)化了模型,相比于常見的根據(jù)類別特征將數(shù)據(jù)劃分為不同類別,建立模型方法更加簡(jiǎn)便易用;單模型中,CatBoost綜合表現(xiàn)最佳,但融合模型Stacking的綜合性能指標(biāo)更優(yōu)于CatBoost模型;Sentinel-2遙感影像特有的三個(gè)紅邊波段對(duì)于森林蓄積量的估測(cè)結(jié)果有較大的影響,與前人研究結(jié)果一致[19-20]。
但受遙感影像精度及與二類調(diào)查數(shù)據(jù)獲取時(shí)間差異等資源的限制,本研究仍存在一些不足,需要進(jìn)行優(yōu)化改進(jìn):研究所選取的研究區(qū)域空間跨度較大,但是仍未超出省級(jí)界限,可選擇空間跨度更大的地區(qū)作為研究區(qū)域,進(jìn)一步分析模型的普適性;使用了Sentinel-2的單波段與基于部分波段提取的紋理特征因子,但是缺少對(duì)紋理特征因子的深入探究,可使用不同窗口大小、不同步長(zhǎng)、不同波段組合來(lái)提取紋理特征,探究不同紋理特征對(duì)模型精度的影響[21];本研究使用遙感影像分辨率為10 m,若能獲取更高分辨率的衛(wèi)星遙感影像和DEM數(shù)據(jù)進(jìn)行研究,則可以進(jìn)一步提高預(yù)測(cè)精度;除光學(xué)遙感外,雷達(dá)遙感影像也常被用來(lái)作為蓄積量估測(cè)的數(shù)據(jù)源,雷達(dá)遙感影像可穿透森林冠層,獲取植被垂直結(jié)構(gòu)參數(shù),可應(yīng)用于蓄積量預(yù)測(cè)[19],進(jìn)一步探討雷達(dá)影像對(duì)蓄積量估測(cè)模型精度的影響。