唐金灝,張加龍,陳立業(yè),程 滔
(1.西南林業(yè)大學(xué) 林學(xué)院,昆明 650224;2.芷江侗族自治縣林業(yè)局,湖南 懷化 419100;3.國家基礎(chǔ)地理信息中心,北京 100830)
森林地上生物量(Aboveground Biomass,AGB)是森林生態(tài)結(jié)構(gòu)優(yōu)劣和功能高低的最直接表現(xiàn),也是進(jìn)行森林碳循環(huán)和碳儲量及其變化分析的基礎(chǔ)[1]。研究森林地上生物量對于森林生態(tài)系統(tǒng)乃至全球碳循環(huán)有著極其重要的意義。隨著遙感技術(shù)的發(fā)展,遙感影像已成為對地觀測研究的主要數(shù)據(jù)源[2]。當(dāng)前森林生物量估算的主要方法有線性回歸和隨機(jī)森林[3-4]、梯度提升回歸樹[5]、偏最小二乘模型[6]、神經(jīng)網(wǎng)絡(luò)[7-8]、支持向量機(jī)[9]和K-最近鄰(K-nearest Neighbor,KNN)算法[10]等。多源遙感數(shù)據(jù)相比單一遙感數(shù)據(jù)能夠提供較多時間尺度和空間尺度的森林信息。通過對多源遙感影像尺度的轉(zhuǎn)換,可以獲得低成本、大范圍、高精度的森林生物量估算結(jié)果。
遙感影像的尺度轉(zhuǎn)換問題一直是地理學(xué)研究中的核心問題之一,尺度轉(zhuǎn)換作為遙感科學(xué)的研究熱點(diǎn)之一,是獲取目標(biāo)尺度影像的捷徑,尺度轉(zhuǎn)換問題對遙感影像數(shù)據(jù)的研究及發(fā)展有重要的現(xiàn)實(shí)意義及推動作用。現(xiàn)存的遙感數(shù)據(jù)在空間分辨率上存在一定的差異,導(dǎo)致對相同地物的表達(dá)產(chǎn)生誤差,對地物特征提取、空間格局和定量反演等結(jié)果產(chǎn)生影響[11-13]。遙感影像尺度轉(zhuǎn)換的研究成果可以為反演產(chǎn)品真實(shí)性提供理論與技術(shù)支持,對于真實(shí)性檢驗(yàn)的需要來說,尺度上推的研究更為重要[14]。本文以滇西北香格里拉市為研究區(qū),采用30m分辨率Landsat-8影像數(shù)據(jù)、10m分辨率Sentinel-2A影像數(shù)據(jù)和6m分辨率Spot-7影像數(shù)據(jù),分別用最鄰近像元法、雙線性內(nèi)插法、三次卷積插值法、局部平均法和像元聚合法將Sentinel-2A影像、Spot-7影像上推至30m分辨率,并結(jié)合研究區(qū)30m×30m外業(yè)調(diào)查樣地?cái)?shù)據(jù),采用隨機(jī)森林(Random Forest,RF)和梯度提升回歸樹(Gradient Boosted Regression Trees,GBRT)分別建立香格里拉地區(qū)高山松的生物量估測模型,最后與目標(biāo)尺度Landsat-8影像所建立的生物量估測模型進(jìn)行對比,研究不同尺度轉(zhuǎn)換方法升尺度后的影像對估測森林生物量精度的影響。
香格里拉市位于滇西北“三江并流”區(qū),隸屬迪慶藏族自治州,其地理范圍覆蓋北緯36°52′~28°52′,東經(jīng)99°20′~100°19′,總面積為11 613km2,其中有林地面積757 105.2hm2,森林覆蓋率達(dá)74.99%[15]。優(yōu)勢樹種主要有云杉(PiceaasperataMast.)、高山松(PinusdensataMast.)、高山櫟(QuercussemicarpifoliaSmith)、云南松(PinusyunnanensisFranch.)等[16],動植物資源豐富,在此展開生物量估測研究具有特殊的意義。
采用2018年在香格里拉研究區(qū)內(nèi)調(diào)查的30m×30m高山松純林樣地,共計(jì)40塊。樣地在高山松純林的中間地帶隨機(jī)布設(shè),以減小影像和樣地間疊加以及尺度轉(zhuǎn)換過程中產(chǎn)生的誤差,且任意2塊樣地間隔在3km以上。利用南方測繪的北極星X5手持式GPS定位樣方四角頂點(diǎn)坐標(biāo),對胸徑大于5cm的高山松進(jìn)行每木檢尺,記錄樹高和胸徑。
選取香格里拉研究區(qū)2018年無云或少云的Landsat-8影像數(shù)據(jù)3景、Sentinel-2A影像數(shù)據(jù)4景、Spot-7影像數(shù)據(jù)2景(表1)。其中Landsat-8和Spot-7影像數(shù)據(jù)的預(yù)處理工作基于ENVI 5.3平臺完成;Sentinel數(shù)據(jù)為L1C級別,預(yù)處理基于歐空局(ESA)發(fā)布的Sen2cor插件和SNAP平臺完成。
表1 獲取的研究區(qū)影像Tab.1 Obtained images of study area
高山松樣地地上生物量由樣地內(nèi)高山松的單木生物量匯總而來。單木生物量的計(jì)算采用香格里拉市高山松單木生物量模型計(jì)算,其模型預(yù)估精度(P)為87.941%[17]。樣木調(diào)查、取樣、測定以及單木生物量構(gòu)建過程詳見文獻(xiàn)[17],模型形式如下:
W=0.073×DBH1.739×H0.880
(1)
式中:W為單木生物量(kg);DBH為胸徑(cm);H為樹高(m)。
為了使樣地值與像元值對應(yīng)更為準(zhǔn)確,本文參考文獻(xiàn)[5]的方法,利用像元邊界分割樣地,以每個地塊重心位置的遙感因子值乘以所在地塊的面積,再將4個值相加后除以總面積即為此樣地對應(yīng)的遙感因子值。
2.5.1最鄰近像元法
直接將距離新像元最近的原像元值作為該像元的新值進(jìn)行計(jì)算[18],具有簡單、快速且影像光譜信息保持好的特點(diǎn),但轉(zhuǎn)換后影像的像元值空間連續(xù)性較差。
2.5.2雙線性內(nèi)插法
沿X軸和Y軸對未知像元分別進(jìn)行線性插值取樣,再得出其加權(quán)平均值,結(jié)果即為該像元的新值。該算法對于空間連續(xù)性較差的缺點(diǎn)有所改善,但會損失一些細(xì)小的特征,對影像柵格值有一定的改變[19]。
2.5.3三次卷積插值法
利用離映射位置最近的16個相鄰的像元值進(jìn)行加權(quán)平均,進(jìn)行3次插值計(jì)算后得到新的低分辨率影像的像元柵格值[20]。該算法較好地保留影像邊緣信息和紋理信息,考慮了相鄰像元間灰度值和其間的變化率。但計(jì)算量較大,會改變原始影像的柵格值。
2.5.4局部平均法
將一定大小窗口內(nèi)的像元合并,將其平均值作為合并后新像元的值。該算法運(yùn)算簡單,能較好的保持影像均值信息,但容易丟失部分細(xì)節(jié)信息[21]。
2.5.5像元聚合法
利用像元聚集使移動窗口內(nèi)的像元值向平均值進(jìn)行聚合,根據(jù)不同尺度上推倍數(shù)對輸出像元有貢獻(xiàn)的所有像元進(jìn)行加權(quán)平均。此算法簡單快速,但轉(zhuǎn)換結(jié)果使影像的局部方差下降,會丟失部分空間細(xì)節(jié)信息[11]。
分別提取由上述5種尺度轉(zhuǎn)換方法上推至30m分辨率的Sentinel-2A影像數(shù)據(jù)和Spot-7影像數(shù)據(jù),以及30m分辨率Landsat-8原始影像數(shù)據(jù)的遙感因子,分別為原始波段因子、植被指數(shù)因子、紋理因子,其中紋理因子按單波段分別用3×3,5×5,9×9 三種窗口提取。每幅影像共計(jì)提取104個遙感因子用于篩選建模,該操作在ENVI 5.3中完成。遙感因子變量如表2所示。
表2 遙感因子變量Tab.2 Remote sensing factor variables
采用皮爾遜相關(guān)系數(shù)來篩選建模因子,在SPSS軟件中分析提取的遙感因子與生物量數(shù)據(jù)之間相關(guān)性強(qiáng)弱關(guān)系,選取相關(guān)性顯著的因子作為自變量,文中因子選入的顯著性水平設(shè)定為P≤0.05,因子剔除的水平設(shè)置為P≥0.1(表3)。
表3 建模因子篩選Tab.3 Selection of modeling factors
2.8.1隨機(jī)森林
隨機(jī)森林(Random Forest,RF)[22]是一個集成學(xué)習(xí)模型,其中含有多個決策樹。它作為一種集成學(xué)習(xí)方法常被應(yīng)用于多領(lǐng)域的數(shù)據(jù)分類和非參數(shù)回歸[23]。本研究中隨機(jī)森林模型算法的實(shí)現(xiàn)基于Python語言“Sklearn”包中提供的“Random Forest Regressor”算法。本文采用RF方法分別對采用5種尺度轉(zhuǎn)換方法將尺度上推至30m分辨率后的Sentinel-2A影像和Spot-7影像數(shù)據(jù),以及30m分辨率Landsat-8原始影像數(shù)據(jù)構(gòu)建高山松生物量估測模型,對建模效果進(jìn)行比較。
2.8.2梯度提升回歸樹
梯度提升回歸樹(Gradient Boosted Regression Trees,GBRT)[24]是一種集成方法,通過合并多個決策樹,經(jīng)過多次迭代來構(gòu)建一個更為強(qiáng)大的模型,其被廣泛應(yīng)用于業(yè)界,是監(jiān)督學(xué)習(xí)中最強(qiáng)大也是最常用的算法之一。與隨機(jī)森林不同,梯度提升回歸樹對于參數(shù)的設(shè)置更為敏感,如果參數(shù)設(shè)置正確,模型精度更高。本文中此算法基于Python實(shí)現(xiàn)。
2.8.3精度評價方法
模型精度評價是表達(dá)預(yù)估方法準(zhǔn)確性的重要指標(biāo)。本文隨機(jī)抽取80%的數(shù)據(jù)進(jìn)行建模分析,剩余20%用于模型的精度評價,模型精度評價指標(biāo)有4個分別為決定系數(shù)R2、均方根誤差RMSE、相對均方根誤差rRMSE以及預(yù)測精度P,其計(jì)算公式如下:
(2)
(3)
(4)
(5)
使用5種尺度轉(zhuǎn)換方法將Spot-7影像分辨率上推至30m后,采用隨機(jī)森林和梯度提升回歸樹這2種方法分別建立高山松生物量估測模型,并與30m分辨率的Landsta-8原始影像所建立的高山松生物量估測模型進(jìn)行對比(表4)。
由表4可知,使用5種尺度轉(zhuǎn)換方法將Spot-7影像分辨率上推至30m后,采用隨機(jī)森林建立的高山松生物量估測模型中,最鄰近像元法上推后的影像數(shù)據(jù)所建立的模型估測精度與Landsat-8原始影像建立的生物量估測模型精度(R2=0.92,P=84.20%)最為接近,決定系數(shù)R2=0.86,預(yù)估精度P=76.65%。其余4種尺度轉(zhuǎn)換方法建模效果為:雙線性內(nèi)插法=(R2=0.86,P=63.94%);三次卷積插值法(R2=0.84,P=68.69%);局部平均法(R2=0.83,P=66.81%);像元聚合法(R2=0.82,P=68.20%)。
表4 Spot-7尺度上推后和Landsat-8建模結(jié)果對比Tab.4 Comparison of the modeling results of the Spot-7 scaling up images and Landsat-8 images
采用梯度提升回歸樹建立的高山松生物量估測模型中,同樣為最鄰近像元法上推后的影像數(shù)據(jù)所建立的模型估測精度與Landsat-8原始影像建立的生物量估測模型精度(R2=0.85,P=79.03%)最為接近,決定系數(shù)R2=0.85,預(yù)估精度P=75.55%。其余4種尺度轉(zhuǎn)換方法建模效果為:雙線性內(nèi)插法(R2=0.79,P=69.78%);三次卷積插值法(R2=0.81,P=69.06%);局部平均法(R2=0.74,P=69.74%);像元聚合法(R2=0.83,P=61.43%)。
使用5種尺度轉(zhuǎn)換方法將Sentinel-2A影像分辨率上推至30m后,采用隨機(jī)森林和梯度提升回歸樹分別建立高山松生物量估測模型,并與30m分辨率的Landsat-8原始影像所建立的高山松生物量估測模型進(jìn)行對比(表5)。
表5 Sentinel-2A尺度上推后和Landsat-8建模結(jié)果對比Tab.5 Comparison of the modeling results of Sentinel-2A scaling up images and Landsat-8 images
由表5可知,使用5種尺度轉(zhuǎn)換方法將Sentinel-2A影像分辨率上推至30m后,采用隨機(jī)森林建立的高山松生物量估測模型中,最鄰近像元法上推后的影像數(shù)據(jù)所建立的模型估測精度與Landsat-8原始影像建立的生物量估測模型精度(R2=0.92,P=84.20%)最為接近,決定系數(shù)R2=0.86,預(yù)估精度P=81.78%。其余4種尺度轉(zhuǎn)換方法建模效果為:雙線性內(nèi)插法(R2=0.83,P=73.92%);三次卷積插值法(R2=0.84,P=79.14%);局部平均法(R2=0.81,P=77.27%);像元聚合法(R2=0.77,P=73.46%)。
采用梯度提升回歸樹建立的高山松生物量估測模型中,同樣為最鄰近像元法上推后的影像數(shù)據(jù)所建立的模型估測精度與Landsat-8原始影像建立的生物量估測模型精度(R2=0.85,P=79.03%)最為接近,決定系數(shù)R2=0.63,預(yù)估精度P=72.74%。其余4種尺度轉(zhuǎn)換方法建模效果為:雙線性內(nèi)插法(R2=0.60,P=69.42%);三次卷積插值法(R2=0.39,P=64.78%);局部平均法(R2=0.40,P=61.03%);像元聚合法(R2=0.41,P=61.42%)。
1)通過對比兩種非參數(shù)生物量估測模型精度,發(fā)現(xiàn)各尺度上推后的影像與目標(biāo)尺度的影像存在一定的差異。導(dǎo)致這種差異的主要原因是尺度效應(yīng)的存在[14]。本次選取的5種尺度轉(zhuǎn)換方法均未反應(yīng)估測對象的物理現(xiàn)象和地學(xué)特性,對高分辨率影像像元之間存在的吸收和散射特性也未考慮[25],使得遙感信息在尺度上推之后發(fā)生偏差,最終導(dǎo)致生物量估測模型精度降低?;诖祟悊栴},出現(xiàn)了基于統(tǒng)計(jì)方法[26]和物理機(jī)制[27]的尺度轉(zhuǎn)換方法。但前者由于需要大量樣本數(shù)據(jù),參數(shù)物理意義不夠明確,后者由于實(shí)用性及模型適用性存在限制,都仍需進(jìn)一步完善。
2)本研究中隨機(jī)森林建模效果優(yōu)于梯度提升回歸樹,吳迪等[28]、孫雪蓮等[29]的研究也表明隨機(jī)森林模型可以有效地估算森林生物量,同時對于大區(qū)域的森林生物量估測也具有一定的優(yōu)勢。在后續(xù)研究中,要擴(kuò)大尺度上推范圍,對大尺度上推后的影像與真實(shí)影像進(jìn)行分析評估,以便更加全面完整地表現(xiàn)不同上推尺度對遙感影像的改變。除此之外,在尺度上推算法中應(yīng)該考慮不同地物的特性,根據(jù)不同研究對象構(gòu)建不同的校正因子,使升尺度轉(zhuǎn)換模型具有更好的適用性。
1)本次使用的5種尺度轉(zhuǎn)換方法中,采用最鄰近像元法進(jìn)行尺度上推后的Spot-7影像和Sentinel-2A影像,結(jié)合外業(yè)數(shù)據(jù)構(gòu)建的高山松生物量估測模型精度均高于其余4種方法,其中隨機(jī)森林的建模效果優(yōu)于梯度提升回歸樹。表明最鄰近像元法更適用于基于生物量估測的遙感影像尺度上推,隨機(jī)森林模型更適用于尺度上推后的影像進(jìn)行生物量估測。
2)通過對比Spot-7和Sentinel-2A影像經(jīng)最鄰近像元法尺度上推后利用RF構(gòu)建的模型精度發(fā)現(xiàn),采用Sentinel-2A影像的建模效果(R2=0.86,RMSE=13.24,P=81.78%,rRMSE=23.66)優(yōu)于Spot-7影像(R2=0.86,RMSE=13.67,P=76.65%,rRMSE=25.96),表明Sentinel-2A影像更適合尺度上推進(jìn)行森林生物量估測。