周 律 歐光龍 王俊峰 胥 輝
(西南林業(yè)大學 西南地區(qū)生物多樣性保育國家林業(yè)和草原局重點實驗室 昆明 650224)
森林生物量估測是當代林業(yè)生產(chǎn)和科研的熱點問題(王維楓等, 2008)。傳統(tǒng)基于地面調查的森林生物量估測需要進行大量實地調查,不僅耗時、耗力,而且還會對實物造成一定破壞(薛巍等, 2009); 而遙感對地觀測技術具有實時、動態(tài)、大面積同步監(jiān)測和信息豐富的特點(梅安新等, 2001),以電磁信息形式快速記錄環(huán)境條件、植被分布格局和活動以及土地利用等動態(tài)變化,其對植被光合有效輻射吸收的測定為估測植被生物量及動態(tài)變化提供了基礎(杜華強, 2012)。因此,遙感技術結合少量地面樣地調查數(shù)據(jù)可實現(xiàn)大范圍森林生物量時空動態(tài)估測,已成為當前森林生物量和碳儲量研究的重要技術方法之一(陳慶等, 2014)。
基于遙感技術的生物量估測存在不確定性等問題,其中光飽和點的不確定性尤為突出(于艷梅等, 2012),即當森林植被密度達到一定閾值時,遙感接收到的電磁輻射信息不再反映生物量的變化,遙感模型對高生物量分布區(qū)無法準確估測,從而造成生物量的光飽和點問題(付元元等, 2013)。為了解決該問題,國內外學者進行了大量有益探索,如Zhao等(2016)利用分層理論和半變異函數(shù)確定了浙江省6類森林的生物量光飽和點; Kasischke等(1997)基于AIRSAR和SIR-C數(shù)據(jù)對美國松樹林進行遙感估測,得出林分結構復雜的熱帶森林和單一樹種森林光飽和值分別為100 t·hm-2和250 t·hm-2。但是如何進一步確定不同類型森林光學遙感估測的光飽和點、提高森林生物量遙感估測精度、降低森林生物量遙感估測的不確定性仍然是研究的熱點和難點。
林業(yè)數(shù)據(jù)具有空間效應,森林植被在生長過程中會受到自身與周圍環(huán)境相互作用的影響,因此采用傳統(tǒng)統(tǒng)計學模型并不符合其對數(shù)據(jù)獨立性的要求(劉茜等, 2015; 張博等, 2016)??臻g回歸模型廣泛應用于公共衛(wèi)生、疾病預防、區(qū)域發(fā)展等領域(伍勁屹等, 2013; 黃秋蘭等, 2013; 溫海珍等, 2011; 付琦等, 2018),在林業(yè)方面也有涉及,如王爍等(2015)構建以最小二乘法為基礎的全局模型和以地理加權回歸模型為基礎的局域模型預估天然紅松(Pinuskoraiensis)的分布情況,結果發(fā)現(xiàn)地理加權回歸模型可有效解決樣地間空間異質性問題,有利于提高紅松分布的預測精度; 劉暢等(2014)采用普通最小二乘模型、線性混合效應模型和地理加權回歸模型分析不同尺度下黑龍江省森林碳儲量空間分布,得出地理加權回歸模型能夠很好解決空間效應問題并可提高擬合精度; 歐光龍等(2014)應用普通最小二乘模型和地理加權回歸模型構建思茅松(Pinuskesiyavar.langbianensis)單木樹干生物量、樹枝生物量、樹葉生物量和地上部分生物量,結果表明地理加權回歸模型估測森林地上生物量的精度更高,并在一定程度上克服了普通最小二乘模型擬合生物量時存在的異方差問題。但是如何考慮調查樣地的空間效應,采用空間回歸模型解決森林生物量光學遙感估測中光飽和點帶來的高值低估等不確定性問題的研究鮮見報道。
思茅松是云貴高原常見的主要針葉樹種之一,以該物種為優(yōu)勢種的森林是我國西部偏干性亞熱帶的典型代表群系,是南亞熱帶分布的具有代表性的暖溫性針葉林(歐光龍等, 2015)。本研究以云南省普洱市思茅松林為研究對象,基于Landsat8 OLI遙感影像數(shù)據(jù)和森林資源二類調查數(shù)據(jù),確定思茅松林生物量光學遙感估測的光飽和點,構建空間全局和局域遙感信息模型反演思茅松林生物量,以期為思茅松林生物量遙感估測提供參考。
普洱市位于云南省西南部,地理位置介于22°02′—24°50′N、99°09′—102°19′E之間,東臨紅河、玉溪,南接西雙版納,西北連臨滄,北靠大理、楚雄,東南與越南、老撾接壤,西南與緬甸毗鄰,境內群山起伏,全區(qū)山地面積占98.3%。北回歸線橫穿普洱市中部,受地形、海拔影響,垂直氣候特點明顯。普洱市海拔317~3 370 m,中心城區(qū)海拔1 302 m,年均氣溫15~20.3 ℃,森林覆蓋率超過67%。思茅松是普洱市主要用材樹種和造林樹種,面積達138萬km2。
2.1.1 遙感數(shù)據(jù)收集與處理 遙感數(shù)據(jù)為2016年3月Landsat8衛(wèi)星遙感影像數(shù)據(jù),從地理空間數(shù)據(jù)云網(wǎng)站下載得到。根據(jù)研究區(qū)行政區(qū)劃分布,覆蓋研究區(qū)的Landsat8影像數(shù)據(jù)7景,條帶號分別為129/044、129/045、130/043、130/044、131/043、131/044和131/045。對遙感影像數(shù)據(jù)進行影像地理配準、地形校正、輻射定標等處理后,裁剪拼接得到研究區(qū)衛(wèi)星影像,如圖1所示。
圖1 研究區(qū)衛(wèi)星影像Fig.1 Satellite images of study areaA.普洱市Landsat 8 OLI(4/3/2)波段合成遙感影像Landsat 8 OLI images of Pu’er city synthesized by 4/3/2 band; B.普洱市思茅松林分布Simao pine forest distribution of Pu’er city.
為了建立思茅松林生物量遙感估測空間模型,基于Landsat8 OLI遙感影像,選擇單波段(B1、B2、B3、B4、B5、B6、B7)以及主成分變換(PCA)、纓帽變換(KT)和植被指數(shù)[差值植被指數(shù)(DVI)、垂直植被指數(shù)(PVI)、土壤調節(jié)植被指數(shù)(SAVI)、歸一化植被指數(shù)(NDVI)、大氣阻抗植被指數(shù)(ARVI)等]等共31個遙感變量,如表1所示。
2.1.2 樣地數(shù)據(jù)收集與生物量計算 樣地數(shù)據(jù)為2016年普洱市森林資源二類調查小班數(shù)據(jù),因數(shù)據(jù)量較大,剔除異常小班數(shù)據(jù),最后篩選得到700塊小班進行分析。采用朱麗梅等(2009)構建的思茅松單木樹干、樹枝和樹葉生物量估算模型,基于林分平均胸徑計算小班生物量,以此作為小班林木的平均單木實測生物量:
W=WS+WB+WL=0.026 5D2.609 8+
0.002 1D3.3718+0.040 6D3.230 7。
(1)
式中:W為思茅松單木地上生物量(t·hm-2);WS為思茅松單木樹干生物量(kg);WB為思茅松單木樹枝生物量(kg);WL為思茅松單木樹葉生物量(kg);D為樹木胸徑(cm)。
通過小班單位面積林木株數(shù)計算得到小班單位面積地上生物量。
對思茅松生物量樣本數(shù)據(jù),隨機抽取約70%樣本(500個)用于建模,剩下約30%樣本(200個)用于模型驗證。
利用ArcGIS軟件提取每個小班遙感變量,采用SPSS軟件選擇皮爾遜相關系數(shù)分析生物量與各遙感變量的相關性; 選擇與生物量相關性顯著的遙感變量進行逐步線性回歸,以方差膨脹因子(VIF)小于10為標準進行變量共線性診斷,決定系數(shù)最高的模型用于后續(xù)光飽和點確定及建模采用變量。
采用二項式函數(shù)、冪函數(shù)2種方法擬合生物量與波段反射率之間的函數(shù)關系,通過計算函數(shù)所對應的拐點值確定生物量遙感估測的光飽和點值。
2.4.1 普通最小二乘模型 普通最小二乘模型(ordinary least squares,OLS)自變量X與因變量Y的關系可通過最小二乘方法表示:
Y=Xβ+ε。
(2)
式中:β為模型參數(shù);ε為模型殘差,且服從N(0,σ2)分布。
參數(shù)β采用因變量與預測值之間的離差平方和最小的方法來估計,可表示為矩陣形式:
(3)
OLS是一個全局模型,模型中常數(shù)和解釋變量的系數(shù)在不同研究區(qū)域間是相同的,不能體現(xiàn)各區(qū)域間的空間差異性。
表1 遙感變量①Tab.1 Remote sensing variables used in the study
①NDVI為歸一化植被指數(shù),SRI為比值植被指數(shù),SAVI為土壤調節(jié)植被指數(shù),PVI為垂直植被指數(shù),BVI為亮度植被指數(shù),GVI為綠度植被指數(shù),WVI為濕度植被指數(shù),IIVI為紅外植被指數(shù),DVI為差值植被指數(shù),ARVI為大氣阻抗植被指數(shù),TVI為轉換型植被指數(shù),MVI5為短紅外植被指數(shù),MVI7為中紅外植被指數(shù),Albedo為反照率; PCA1~PCA7為主成分變換,KT1、KT2、KT3為KT變換; 下同。NDVI is normalized difference vegetation index, SRI is simple ratio index, SAVI is soil adjusted vegetation index, PVI is plumb vegetation index, BVI is brightness vegetation index, GVI is greenness vegetation index, WVI is wetness vegetation index, IIVI is infrared index vegetation index, DVI is difference vegetation index, ARVI is atmospheric resistant vegetation index, TVI is transformed vegetation index, MVI5 is moisture vegetation index using Landsat’s band 5,MVI7 is moisture vegetation index using Landsat’s band 7,PCA is principal component analysis, KT is tasseled cap transformation. The same below.
2.4.2 空間滯后模型 空間滯后模型(spatial lag model,SLM)也稱空間自回歸模型。當解釋變量存在顯著空間依賴性,僅僅考慮其自身解釋變量不足以很好估計和預測該變量的變化趨勢時,可將空間滯后項作為新的解釋變量引入到經(jīng)典統(tǒng)計回歸模型中,再通過計算空間相關系數(shù)衡量空間相關的方向和大小。可見,SLM模型是通過在OLS模型中加入因變量y的空間滯后項來實現(xiàn)的:
Y=Xβ+ρWy+ε。
(4)
式中:Y為因變量;X為自變量;β為預估參數(shù);W為行標準化的空間權重矩陣;Wy為臨近樣地點y的加權平均值(即空間滯后項),可以評價空間自相關程度;ρ為空間自相關參數(shù),受W矩陣影響;ε為服從N(0,σ2I)正態(tài)分布的隨機誤差項。
2.4.3 空間誤差模型 當模型誤差項在空間上相關時,即為空間誤差模型(spatial error model,SEM)。SEM模型假設因變量之間不會直接產(chǎn)生影響,空間自相關來源于誤差,即將最小二乘法的模型誤差分為2部分,空間自相關帶來的誤差項和模型自身誤差:
Y=Xβ+λWε+ξ。
(5)
式中:Y為因變量;X為自變量;β為預估參數(shù);W為行標準化的空間權重矩陣;λ為空間自相關參數(shù);Wε為空間誤差項;ξ為服從N(0,σ2I)正態(tài)分布的隨機誤差項。
2.4.4 地理加權回歸模型 地理加權回歸模型(geographically weighted regression,GWR)尋找空間的局部變異,并通過在數(shù)據(jù)上移動的一個加權窗口在每個選擇點估計一組系數(shù)值。如果局部系數(shù)值在空間內變化,則表明其在此位置不穩(wěn)定。GWR模型的基本形式如下:
y(ui,vi)=β0(ui,vi)+β1(ui,vi)x1i+
β2(ui,vi)x2i+…+βn(ui,vi)xni+εi。
(6)
式中: (ui,vi)為i點處坐標;y(ui ,vi)為i點處的因變量;n為樣本個數(shù);xni為第n個變量在i點的值;β0為截距;βn為第n個變量的回歸參數(shù);εi為服從N(0,σ2I)正態(tài)分布的隨機誤差項。
采用決定系數(shù)(R2)和信息準則(AIC)評價4種模型(OLS、SLM、SEM和GWR)的擬合精度。選取總體相對誤差(RS)、平均相對誤差(EE)和總體相對誤差絕對值(RMA)對模型的獨立性進行檢驗(陶長琪等, 2014; 閭妍宇等, 2017)。
采用刀切法分組,將生物量進行分段處理,即0~50 t·hm-2、50~100 t·hm-2和大于100 t·hm-2,選取平均殘差(ME)和平均相對殘差(MRE)評價各模型在不同生物量大小等級的預估能力:
(7)
(8)
基于所構建的OLS、SLM、SEM和GWR模型,反演普洱市思茅松林生物量。
由表2可知,除了DVI外,其他遙感變量在0.01水平均與生物量具有顯著相關關系。為避免變量之間的共線性問題,采用逐步線性回歸最終篩選出B1、SAVI和PCA2等3個變量作為思茅松林生物量估算的遙感變量。
表2 遙感變量的相關性分析①Tab.2 Correlation analysis on remote sensing variables
①**表示在0.01水平顯著。** indicates a significant level of 0.01.
基于選擇的B1、SAVI和PCA2這3個遙感變量,采用二項式函數(shù)和冪函數(shù)求解思茅松林地上生物量與對應波段間的函數(shù)關系,函數(shù)在區(qū)間內的極值所對應的自變量即為思茅松林地上生物量估測的光飽和點。由表3可知,采用B1變量進行二項式函數(shù)擬合時具有最高的R2(0.284),故以其對應拐點作為普洱市思茅松林生物量的光飽和點,其值為106.3 t·hm-2(圖2)。
表3 思茅松林光飽和點估計結果Tab.3 Light saturation point estimation of Simao pine forest
圖2 二次項函數(shù)擬合思茅松林生物量光飽和曲線Fig.2 Biomass light saturation curve of Simao pine forest using quadratic function
3.3.1 帶寬確定 為在同一尺度下比較空間全局和局域模型,本研究通過ArcGIS軟件空間統(tǒng)計分析模塊中的增量自相關來確定最佳距離帶寬。在計算過程中,保證每個觀測點至少存在1個臨近點,采用ArcGIS進行臨近點距離分析,得出最大鄰近距離為34 312.046 m。進行增量空間自相關分析時,起始帶寬距離設為34 400 m。當帶寬距離為34 600 m時,Moran’sI為0.159 8,相對應的Z值為14.825 7,并通過了顯著性檢驗,說明該帶寬距離下思茅松林生物量呈極顯著正相關。而且,此距離時Moran’sI顯著且Z值到達第一峰值,因此將帶寬設為34 600 m,并作為思茅松林生物量空間回歸模型構建的最優(yōu)帶寬距離。
圖3 思茅松林生物量Moran’s I指數(shù)和Z值的變化Fig.3 Changes of Moran’s I index and Z value of biomass with the lag distance for Simao pine forest
3.3.2 模型擬合 借助GeoDa和GWR4.0軟件,選擇訓練樣本(500個)分別對OLS、SLM、SEM和GWR模型進行擬合。由表4可知,模型殘差的Moran’sI指數(shù)不獨立,即存在空間自相關性,不符合最小二乘模型的殘差獨立性要求,因此在構建思茅松林地上生物量遙感模型時,需要考慮以空間自相關為前提的空間回歸模型,從而定量探討遙感因子與思茅松林地上生物量間的關系。選擇帶寬距離34 600 m,構建SLM、SEM和GWR模型,SLM、SEM和GWR模型殘差的Moran’sI指數(shù)檢驗不顯著,說明其空間自相關不顯著,在一定程度上解決了OLS模型擬合時存在的空間自相關問題; 此外,SLM模型的穩(wěn)健拉格朗日乘數(shù)不顯著,且SEM模型較OLS和SLM模型的AIC小,R2增大,說明SEM模型可較好擬合數(shù)據(jù)的全局性結構。根據(jù)Fotheringham(2004)的評價標準,只要GWR模型與OLS模型的AIC之差大于3,即使將GWR 模型的復雜性考慮在內,GWR模型也比OLS模型執(zhí)行得更好。本研究AIC從OLS模型的4 628.7下降到4 577.8,差值大于3,R2達到0.373,說明GWR模型的解釋能力優(yōu)于OLS模型,即GWR模型擬合精度顯著優(yōu)于OLS模型,也優(yōu)于其他全局空間回歸模型。
表4 OLS、SLM、SEM和GWR模型比較Tab.4 Model comparison among OLS, SLM and SEM
此外,從GWR模型的方差分析結果可知,相比OLS模型,GWR模型有所改善,平方和殘差降低54 459.958,均方殘差降低1 689.435,表明OLS模型殘差存在顯著空間自相關和空間異質性,而GWR模型很好解釋了模型殘差存在的空間效應問題,使模型精度得以提高(表5)。
表5 GWR模型方差分析Tab.5 Variance analysis of GWR model
根據(jù)置信區(qū)間檢驗方法對比分析GWR和OLS模型自變量回歸參數(shù)平穩(wěn)性發(fā)現(xiàn),GWR模型截距上下四分位數(shù)的差值為30.134,大于OLS模型截距的標準誤1倍范圍(16.722); 變量SAVI上下四分位數(shù)的差值為0.000 002,等于OLS模型SAVI回歸參數(shù)標準誤1倍范圍(0.000 002); 變量PCA2上下四分位數(shù)的差值為0.029 04,大于OLS模型PCA2回歸參數(shù)標準誤1倍范圍(0.011 86); 變量B1上下四分位數(shù)的差值為0.066 4,大于OLS模型B1回歸參數(shù)標準誤1倍范圍(0.022 6)。這說明截距與自變量存在顯著的非平穩(wěn)性,其所選參數(shù)均為非全局參數(shù)(表6、7)。
表6 OLS模型全局回歸參數(shù)描述Tab.6 Descriptive statistics of the global regression parameters of OLS model
表7 GWR模型回歸參數(shù)描述Tab.7 Descriptive statistics of the local regression parameters of GWR model
3.3.3 模型檢驗 應用隨機抽樣的200個小班對OLS、SLM、SEM和GWR模型進行獨立性樣本檢驗(表8)。GWR模型預估思茅松林地上生物量的精度最高,SLM、SEM和GWR模型在總體相對誤差、平均相對誤差、總體相對誤差絕對值3個指標上均優(yōu)于OLS模型,其中SLM和SEM模型的總體相對誤差和平均相對誤差與GWR模型沒有顯著差異,GWR模型的總體相對誤差絕對值優(yōu)于SLM和SEM模型。
表8 4種模型獨立性檢驗Tab.8 The sample test of independence for the OLS, SLM, SEM and GWR models %
由刀切法殘差檢驗(表9)可以得出,OLS、SLM、SEM和GWR模型在低值階段(<50 t·hm-2)均出現(xiàn)明顯的低值高估現(xiàn)象,但GWR模型的平均殘差(ME)和平均相對殘差(MRE)的絕對值略低于OLS和SEM模型; OLS模型在大于光飽和值的高值階段(>100 t·hm-2)出現(xiàn)嚴重的高值低估現(xiàn)象(ME=65.653,MRE=1.467),而SLM、SEM和GWR模型的ME和MRE遠小于OLS模型,且GWR模型的ME和MRE均為最小。
基于OLS、SLM、SEM和GWR模型的思茅松林地上生物量反演結果如表10所示。4種模型反演的普洱市思茅松林單位面積地上生物量在66.496~69.222 t·hm-2之間,高于基于森林二類調查數(shù)據(jù)計算結果53.838 t·hm-2,其中GWR模型估測思茅松單位面積地上生物量為66.496 t·hm-2,地上總生物量為7.82×106t,其預估單位面積生物量值與實測生物量偏差最小,為23.511%。
4種模型反演的普洱市思茅松林生物量空間分布如圖4所示。OLS、SLM和SEM 3個全局模型反演思茅松林生物量分布比較均勻,而GWR模型反演思茅松林生物量在空間分布上有一定差異,高生物量(≥100 t·hm-2)主要分布在研究區(qū)的江城縣和思茅區(qū),低生物量(0~50 t·hm-2)主要集中于瀾滄縣、西盟縣和孟連縣。另外,GWR模型相較于OLS模型具有更大的估測范圍,說明GWR模型不僅對普洱市思茅松林生物量的估測更為準確,而且能在一定程度上解決高值低估和低值高估問題,減小光飽和點對遙感估測精度的影響。
表9 刀切法殘差檢驗Tab.9 Jackknife method test
表10 4種模型反演結果比較Tab.10 Model reversion results for OLS, SLM, SEM and GWR models
圖4 4種模型遙感估測反演結果Fig.4 Inversion result of remote sensing estimation of OLS(A), SLM(B), SEM(C)and GWR(D)models
從思茅松林生物量遙感估測的光飽和點來看,本研究通過二項式函數(shù)得出的普洱市思茅松林生物量光飽和點值低于Zhao等(2016)通過半變異函數(shù)計算的松類光飽和點值。這可能是因為生物量光飽和點受立地條件、森林結構和樹種組成等多種因素影響,普洱市地處南亞熱帶,山地地形復雜,立體氣候明顯,垂直差異大,有著更為豐富的氣候多樣性和生物多樣性,且林分結構繁復,森林異質性水平更高,使得普洱市思茅松林生物量光飽和點更接近Kasischke等(1997)計算的熱帶森林最高光飽和點。
從空間回歸模型的表現(xiàn)看,本研究采用OLS、SLM、SEM和GWR模型構建遙感信息模型估測思茅松林地上生物量,得到了較好效果。通過比較發(fā)現(xiàn),局域模型(GWR)的擬合效果和精度明顯高于全局模型(OLS、SLM、SEM),能夠減小殘差的空間自相關性,且可在一定程度上解決高值低估和低值高估問題。這是因為GWR模型是基于“局域模型”的地理統(tǒng)計方法,針對每個點都精選參數(shù)估計并提供空間權重,計算每個樣地的空間位置和相鄰變量之間的關系,從而使得該模型更加符合傳統(tǒng)統(tǒng)計模型中關于殘差間相互獨立的基本假設,進而減少低值高估和高值低估現(xiàn)象(Fotheringham, 2004),使得模型的擬合能力和預估能力都更加準確,該結論與閭妍宇等(2017)一致。
此外,本研究使用的地面數(shù)據(jù)為森林資源二類調查數(shù)據(jù),該數(shù)據(jù)具有分布范圍廣、數(shù)據(jù)量大等優(yōu)點,且其統(tǒng)計數(shù)據(jù)的精度與各小班的調查允許誤差直接相關(王雪軍等, 2014)。本研究基于普洱市森林資源二類調查小班數(shù)據(jù)估測思茅松林生物量光飽和點并構建遙感信息模型,由刀切法殘差檢驗可知,OLS模型在高值階段(>100 t·hm-2)出現(xiàn)明顯的高值低估現(xiàn)象,說明當生物量大于100 t·hm-2后,模型對更高生物量的估計誤差更大,在一定程度上與光飽和點的估計值106.3 t·hm-2相匹配,進一步說明森林資源二類調查數(shù)據(jù)作為森林生物量遙感估測光飽和點的地面數(shù)據(jù)源的可靠性。此外,4種模型的生物量反演結果較好解釋了思茅松林生物量的分布,與基于二類調查蓄積量數(shù)據(jù)轉換得到的生物量數(shù)據(jù)較為接近,表明森林資源二類調查小班數(shù)據(jù)在構建生物量遙感模型和森林生物量遙感估測的光飽和點確定方面的數(shù)據(jù)可用性。
1) 采用Landsat8 OLI B1變量進行二項式函數(shù)擬合,可用于估算思茅松林生物量光飽和點,其值為106.3 t·hm-2。
2) 基于篩選出的B1、SAVI和PCA2這3個遙感變量構建的空間回歸模型,思茅松林生物量估算精度均高于OLS模型,其中以GWR模型精度最高,R2和AIC分別為0.373和4 577.8,有效避免了模型殘差的空間自相關性。
3) GWR模型在各生物量分段上的平均殘差和平均相對殘差低于OLS、SEM和SLM模型,且在思茅松林地上生物量空間分布反演上具有更大的估測范圍,能夠在一定程度上解決高值低估和低值高估問題,提高思茅松林地上生物量遙感估測精度。