羅洪斌,舒清態(tài),龐 勇,王 強(qiáng),王冬玲
(1.西南林業(yè)大學(xué)林學(xué)院,昆明 650224;2.中國(guó)林業(yè)科學(xué)研究院資源信息研究所,北京 100091)
森林是陸地生態(tài)系統(tǒng)中的重要碳庫(kù),在全球碳循環(huán)中處于重要地位。森林生物量作為森林生產(chǎn)力的重要評(píng)價(jià)指標(biāo),在全球氣候變化的背景下,生物量的高效監(jiān)測(cè)對(duì)碳匯的研究和生態(tài)系統(tǒng)的保護(hù)具有重要的現(xiàn)實(shí)意義[1-2]。傳統(tǒng)的森林生物量調(diào)查一般以地面實(shí)測(cè)為主,效率低、成本高,而且獲取的只是小范圍的一些具有代表性的數(shù)據(jù),不利于大范圍的森林生物量研究[3]。遙感技術(shù)的發(fā)展,改變了傳統(tǒng)生物量估測(cè)小尺度、對(duì)植被具有破壞性以及不連續(xù)等局限性。為此,森林生物量遙感估測(cè)逐漸成為眾多學(xué)者研究的重要內(nèi)容。目前,森林生物量遙感估測(cè)主要依靠激光雷達(dá)、微波雷達(dá)、光學(xué)影像等遙感方式。其中,光學(xué)遙感很難穿透林木冠層,僅可以獲取林木冠層反射率信息,無(wú)法獲得樹(shù)木垂直結(jié)構(gòu)參數(shù),并且對(duì)環(huán)境因素極為敏感,受大氣、云層等的影響較為嚴(yán)重[4];微波雷達(dá)雖具有穿透性,可以獲得林分三維結(jié)構(gòu)信息,但容易受地形起伏的影響,極易出現(xiàn)后向散射信號(hào)飽和現(xiàn)象,在生物量較大地區(qū)也存在一定的局限性[5]。
機(jī)載激光雷達(dá)(Airborne Light Laser Detection and Ranging,LiDAR)是一種主動(dòng)的遙感技術(shù),具有強(qiáng)穿透性、主動(dòng)性、全天候以及高精度等獨(dú)特優(yōu)勢(shì),現(xiàn)在已越來(lái)越廣泛地應(yīng)用于森林生物量監(jiān)測(cè)和調(diào)查中。它可精準(zhǔn)、快速地獲取林分高度及垂直參數(shù)信息[6],極大地提高了森林生物量動(dòng)態(tài)監(jiān)測(cè)的效率和精度。早在20世紀(jì)80年代,Nelson等[7-8]研究指出,激光雷達(dá)可以用于林木高度的估測(cè);隨后,Popescu等[9]和Nsset等[10]利用機(jī)載激光雷達(dá)數(shù)提取林分高度信息和覆蓋度等信息,對(duì)森林地上生物量進(jìn)行估測(cè),并取得了較好的結(jié)果。在國(guó)內(nèi),龐勇等[11]對(duì)此也進(jìn)行了大量研究,證明機(jī)載激光雷達(dá)可以精確地估測(cè)森林地上生物量。
然而,研究發(fā)現(xiàn),從機(jī)載激光雷達(dá)點(diǎn)云數(shù)據(jù)中提取植被信息時(shí),如果采樣面積過(guò)大則不能有效反映出采樣區(qū)的植被信息,而取樣規(guī)模較小時(shí),則不足以產(chǎn)生精確的數(shù)字高程模型(DEM),從而影響森林地上生物量的估計(jì)精度[12]。其次,采樣大小的選擇與激光雷達(dá)數(shù)據(jù)的水平精度和GPS系統(tǒng)的誤差也有關(guān)系[13]。為此,Luo等[12,14]利用機(jī)載激光雷達(dá)數(shù)據(jù)估測(cè)玉米生物量和熱帶雨林物量時(shí),對(duì)機(jī)載激光雷達(dá)采樣大小進(jìn)行了研究,結(jié)果表明:5m大小的玉米方形樣地對(duì)應(yīng)的最佳采樣尺度為3m(R2=0.838),15m半徑大小的熱帶雨林圓形樣地對(duì)應(yīng)的最佳采樣半徑為22m(R2=0.893)。另外,Estornell等[15]還探究了不同點(diǎn)云密度和不同采樣大小下機(jī)載激光雷達(dá)數(shù)據(jù)對(duì)灌木生物量估測(cè)精度的影響,發(fā)現(xiàn)點(diǎn)云密度大于8個(gè)/m2時(shí)估測(cè)效果最佳,0.5m半徑大小的圓形樣地所對(duì)應(yīng)的最佳采樣半徑為1.5m(R2=0.73)??偠灾?利用激光雷達(dá)數(shù)據(jù)對(duì)森林地上生物量的估測(cè)精度受到采樣尺度大小的影響。此外,變量參數(shù)、植被類型、地理環(huán)境和激光雷達(dá)數(shù)據(jù)不同,最佳取樣大小也不同。為了提高激光雷達(dá)數(shù)據(jù)對(duì)森林參數(shù)的估計(jì)精度,必須根據(jù)研究區(qū)實(shí)際情況確定最優(yōu)采樣大小。
本研究以機(jī)載激光雷達(dá)飛行條帶內(nèi)的橡膠林地上生物量為研究對(duì)象,對(duì)21個(gè)不同尺寸大小的機(jī)載激光雷達(dá)數(shù)據(jù)進(jìn)行采樣,提取不同采樣尺寸下的激光雷達(dá)參數(shù),并與橡膠林地上生物量建立PLSR模型,就機(jī)載激光雷達(dá)數(shù)據(jù)采樣大小對(duì)橡膠林地上生物量估測(cè)精度的影響進(jìn)行研究。
機(jī)載激光雷達(dá)飛行條帶地處云南省景洪市,地理坐標(biāo)為:21°59′26″~22°4′28″N,100°41′35″~101°0′16″E,條帶總面積為118km2。研究區(qū)兼有大陸性氣候和海洋性氣候的優(yōu)點(diǎn)而無(wú)其缺點(diǎn),常年高溫酷暑,干濕季分明,日溫差較大,年溫差小,年平均氣溫在18.6°~21.9°C之間。年平均降水量為1 200~1 700mm,年平均日照時(shí)長(zhǎng)為1 800~2 300h。土壤以赤紅壤、磚紅壤為主,土層深厚,自然肥力高。植被類型主要有熱帶季節(jié)雨林、熱帶山地雨林、南亞熱帶季風(fēng)常綠闊葉林。由于溫度高、降水充沛、低風(fēng)速等自然條件,成為了橡膠林的主要分布區(qū)。研究區(qū)地理位置如圖1所示。
圖1 研究區(qū)地理位置Fig.1 The location of study area
機(jī)載LiDAR數(shù)據(jù)由中國(guó)林科院的LiCHy系統(tǒng)(LiDAR,CCD and Hyperspectral)中的RIEGL LMS-Q680i激光雷達(dá)傳感器獲取,時(shí)間為2014年4月,平均飛行高度為851m,掃描角度為±30°,最大脈沖發(fā)射頻率為400kHZ,點(diǎn)云密度為3.9個(gè)/m2。離散點(diǎn)云最終以LAS1.2格式存儲(chǔ),飛行區(qū)域長(zhǎng)32.1km、寬3.7km,6個(gè)航帶總面積為118km2。
本研究所用的44塊大小為30m×30 m的正方形樣地,數(shù)據(jù)獲取于2014年4月,為擬合機(jī)載LiDAR數(shù)據(jù)條帶范圍,在其飛行區(qū)域所覆蓋范圍選擇不同齡級(jí)、不同生物量大小的橡膠林作為地面樣地,以確保樣地?cái)?shù)據(jù)具有一定代表性。樣地信息主要包括:胸徑、樹(shù)高、坡度、坡向、GPS定位坐標(biāo)等。
2.1.1機(jī)載LiDAR數(shù)據(jù)處理
LiDAR數(shù)據(jù)處理主要分為前期處理和后期處理,數(shù)據(jù)的前期處理由數(shù)據(jù)提供商完成,數(shù)據(jù)的后期處理運(yùn)用北京數(shù)字綠土公司開(kāi)發(fā)的LiDAR360軟件完成。首先,為激光點(diǎn)云數(shù)據(jù)定義坐標(biāo)系以及點(diǎn)云去噪。其次,分離地面點(diǎn)和非地面點(diǎn)(將0~2m劃分為低植被點(diǎn);2~6m劃分為中等植被點(diǎn);6~30m劃分為高植被點(diǎn);30~150m劃分為建筑物點(diǎn)),其中還包括低于地表點(diǎn)的分類等過(guò)程。利用分離出來(lái)的地面點(diǎn)生成2m×2m的數(shù)字高程模型(Digital Elevation Model,DEM)對(duì)點(diǎn)云進(jìn)行歸一化處理,即所有植被的高度都是相對(duì)于地面的高度。
2.1.2樣地?cái)?shù)據(jù)處理
橡膠林樣地生物量由單株生物量匯總得到,橡膠樹(shù)單株地上生物量通過(guò)唐建維等[16]提出的西雙版納地區(qū)橡膠樹(shù)單株生物量模型計(jì)算得到,計(jì)算公式為:
WT=0.136D2.437
(1)
式中:WT為單株生物量(kg),D為胸徑(cm)。
樣地生物量概況匯總?cè)绫?所示。
表1 樣地實(shí)測(cè)生物量匯總Tab.1 Summary of measured ground biomass
本研究樣地大小為30m×30m,樣地范圍內(nèi)均進(jìn)行每木檢尺,而未對(duì)出樣地范圍外的林分進(jìn)行調(diào)查,因此本文僅對(duì)30m范圍內(nèi)激光雷達(dá)不同采樣大小對(duì)生物量估測(cè)結(jié)果的影響進(jìn)行研究。如圖2所示,研究以樣地為中心,建立了21組不同邊長(zhǎng)的正方形緩沖區(qū)作為采樣邊界范圍(邊長(zhǎng)從10m至30m,間隔為1m),通過(guò)LiDAR360軟件提取各個(gè)采樣范圍內(nèi)的歸一化點(diǎn)云,并根據(jù)每一個(gè)采樣尺度內(nèi)的歸一化點(diǎn)云提取激光雷達(dá)變量參數(shù)。參考目前已有的研究可知,激光雷達(dá)參數(shù)中高度變量、百分位變量較多地應(yīng)用于生物量的估測(cè)研究中,且效果較好。本文中使用LiDAR360自動(dòng)提取激光雷達(dá)變量參數(shù),包括高度變量參數(shù)、百分位高度變量參數(shù)共17個(gè)自變量參數(shù)(表2)。
1)高度變量參數(shù)。包括:最大高度(Hmax)、平均高度(Hmean)、高度標(biāo)準(zhǔn)差(Hstd)、高度變異系數(shù)(Hva)等4個(gè)變量。(例:Hmax為某一統(tǒng)計(jì)單元內(nèi),所有點(diǎn)Z值的最大值)。
2)百分位高度變量參數(shù)。包括(H10th,H20th,H25th,H30th,H40th,H50th,H60th,H70th,H75th,H80th,H90th,H95th,H99th等13個(gè)參數(shù)。百分位高度變量的間隔大小由軟件劃定,例:H10th代表植被回波點(diǎn)云的10%高度處的高度值。
表2 LiDAR量參數(shù)Tab.2 Variable parameter of LiDAR
圖2 采樣范圍示意圖Fig.2 Sample range schematic
回歸模型采用偏最小二乘回歸(Partial Least Squares Regression,PLSR)模型進(jìn)行生物量估測(cè),偏最小二乘回歸可以克服多個(gè)機(jī)載激光雷達(dá)變量之間的多重共線性問(wèn)題,且滿足樣本點(diǎn)個(gè)數(shù)較少的特點(diǎn)。其原理為:自變量(X1,X2,…,Xa)和單因變量Y,樣本數(shù)n;由此構(gòu)成自變量和因變量的矩陣X=[x1,x2,…,xa]n×a和Y=[y]n×1。分別在X與Y中提取第一對(duì)成分t1和u1。X和Y成分第一次被提取后,分別實(shí)施對(duì)t的回歸,若回歸方程精度達(dá)到滿意的程度,則終止算法。否則X和Y對(duì)t回歸后的殘余信息進(jìn)行下一輪成分提取,如此循環(huán),直至滿足既定的精度。在偏最小二乘回歸建模過(guò)程中,自變量的篩選使用變量投影重要性指標(biāo)(Variable Importance in Projection,VIP)作為選擇依據(jù),VIP值解釋了自變量對(duì)因變量的重要性,如果自變量對(duì)因變量的解釋能力越大,其VIP值也越大[17]。為了達(dá)到較好的建模效果,選取VIP值大于1的變量參與生物量模型的構(gòu)建。
不同采樣尺度下生物量估測(cè)模型的擬合效果通過(guò)決定系數(shù)(R2)、均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo)。采用留一交叉驗(yàn)證(Leave One Out Cross Validation,LOOCV)對(duì)生物量估測(cè)模型進(jìn)行預(yù)測(cè)評(píng)價(jià),其原理為:使用總樣本中的其中一個(gè)作為驗(yàn)證樣本,其余的用來(lái)作為測(cè)試樣本,直到每個(gè)樣本都被驗(yàn)證一次為止。根據(jù)交叉驗(yàn)證的結(jié)果計(jì)算得到估計(jì)精度(P)以及均方根誤差(RMSEcv)作為預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)。
(2)
(3)
(4)
(5)
變量因子的篩選使用SIMCA-P軟件計(jì)算各個(gè)變量的投影重要性指標(biāo)(VIP)值如圖3所示,根據(jù)(VIP)值的大小可以看出,所提取17個(gè)備選參數(shù)中,除了高度標(biāo)準(zhǔn)差(Hstd)、高度變異系數(shù)(Hva)、百分位高度(H10th)以外,其余14個(gè)變量(Hmax,Hmean,H20th,H25th,H30th,H40th,H50th,H60th,H70th,H75th,H80th,H90th,H95th,H99th)的VIP值均在1以上。本文在其飛行區(qū)域所覆蓋范圍內(nèi)選擇不同齡級(jí)、不同生物量大小的橡膠林作為地面樣地,結(jié)合林分構(gòu)造以及樣地調(diào)查數(shù)調(diào)查情況分析得出,樣地內(nèi)樹(shù)高差異不明顯,不同齡級(jí)之間變異程度較小,高度標(biāo)準(zhǔn)差(Hstd)、高度變異系數(shù)(Hva)、百分位高度(H10th)對(duì)生物量的影響較小,因此,選擇VIP大于1的變量參與橡膠林地上生物量估測(cè)模型的構(gòu)建。
圖3 自變量因子的篩選Fig.3 Selection of independent variable factor
樣地的實(shí)際大小為30m×30m,而激光雷達(dá)變量的采樣大小則是從10m×10m逐漸遞增,因此,根據(jù)樣地面積與采樣面積的比例,分別計(jì)算出各個(gè)采樣尺寸大小所對(duì)應(yīng)的橡膠林地上生物量(例:原始樣地面積為900 m2,10m采樣大小的采樣面積為100m2,因此10m采樣大小范圍對(duì)應(yīng)的生物量為原始樣地的1/9),以此作為因變量。采用偏最小二乘回歸(PLSR)模型,在Matlab2017b軟件下分別基于21組不同采樣大小下的機(jī)載激光雷達(dá)變量建立橡膠林地上生物量估測(cè)模型。通過(guò)不同采樣大小下的估測(cè)結(jié)果的比較,進(jìn)而確定較優(yōu)采樣大小。不同采樣大小下的擬合結(jié)果(圖4)與交叉驗(yàn)證結(jié)果如圖5所示。
從估測(cè)結(jié)果可以看出,估測(cè)模型決定系數(shù)(R2)大小介于0.700~0.718之間;預(yù)測(cè)均方根誤差(RMSEcv)介于18.874~19.556t/hm2之間;預(yù)測(cè)精度(P)介于82.117%~82.741%之間。當(dāng)采樣尺寸小于18m時(shí),估測(cè)精度隨著采樣尺寸的增大而增大;當(dāng)采樣尺寸大于18m時(shí),估測(cè)精度隨著采樣尺寸的增大而減小,進(jìn)而趨于平緩;當(dāng)采樣尺寸為18m時(shí),模型決定系數(shù)(R2)達(dá)到最大,為0.718,均方根誤差達(dá)到最小,RMSE為17.830t/hm2,RMSEcv為18.874t/hm2,交叉驗(yàn)證精度(P)為82.741%。其次,對(duì)比實(shí)際樣地尺寸(30m)和最佳采樣尺寸(18m)的估測(cè)結(jié)果發(fā)現(xiàn),當(dāng)采樣尺寸為30m時(shí),模型的決定系數(shù)(R2)僅為0.704,均方根誤差(RMSEcv)為19.380t/hm2,交叉驗(yàn)證精度(P)也僅為82.278%;當(dāng)采樣尺寸為18m時(shí),估測(cè)模型的R2提高了1.989%,RMSEcv降低了2.611%,預(yù)測(cè)精度(P)提高了0.463%。
圖4 不同采樣大小下的模型精度Fig.4 Model accuracy at different sample size
注:因變量的單位為噸(t),為了更直觀比較不同采樣尺度下的估測(cè)效果,均方根誤差(RMSE)統(tǒng)一轉(zhuǎn)換為“t/hm2”。
圖5 不同采樣大小下的交叉驗(yàn)證結(jié)果
Fig.5 Cross-validation results at different sample size
根據(jù)估測(cè)結(jié)果變化并結(jié)合生物量的估測(cè)方法分析得出,如果采樣尺寸較小,則不足以產(chǎn)生精確的數(shù)字高程模型(DEM),這直接影響歸一化點(diǎn)云的高度,從而影響森林地上生物量的估計(jì)精度[12];若采樣尺寸過(guò)大,則提取的變量不能真實(shí)反映樣地的實(shí)際情況,導(dǎo)致估測(cè)精度偏低。其次,采樣大小的選擇與激光雷達(dá)數(shù)據(jù)的水平精度和GPS系統(tǒng)的誤差也有關(guān)系[13]。激光雷達(dá)數(shù)據(jù)獲取過(guò)程中,由于環(huán)境條件的影響,若坐標(biāo)不夠精確則會(huì)導(dǎo)致與實(shí)際樣地位置不能完全匹配,此時(shí)激光雷達(dá)變量則不能完全反應(yīng)樣地真實(shí)情況,從而影響生物量的估測(cè)精度。因此,采樣大小的選擇有助于減小測(cè)量誤差帶來(lái)的影響,從而提高估測(cè)精度。就本研究而言,機(jī)載激光雷達(dá)對(duì)橡膠林地上生物量的估測(cè)精度受采樣尺寸大小的影響,最優(yōu)尺寸下的估測(cè)精度相較于實(shí)際樣地尺寸下的估計(jì)精度有一定提高,結(jié)果雖然呈現(xiàn)出一定的規(guī)律性,但是差異并不明顯。
本文就機(jī)載激光雷達(dá)采樣大小對(duì)橡膠林地上生物量估測(cè)精度的影響進(jìn)行了研究,對(duì)激光雷達(dá)數(shù)據(jù)進(jìn)行了21個(gè)不同尺寸采樣,并提取不同采樣尺寸下的機(jī)載激光雷達(dá)變量,利用不同采樣尺寸下的機(jī)載激光雷達(dá)變量與橡膠林地面樣地?cái)?shù)據(jù)建立PLSR估測(cè)回歸模型。研究結(jié)果表明:使用機(jī)載激光雷達(dá)數(shù)據(jù)對(duì)橡膠林地上生物量估測(cè)時(shí),估測(cè)結(jié)果受到機(jī)載激光雷達(dá)數(shù)據(jù)采樣尺寸大小的影響。就本研究而言,當(dāng)采樣尺寸小于18m時(shí),估測(cè)精度隨著采樣尺寸的增大而增大;而采樣尺寸大于18m時(shí),估測(cè)精度隨著采樣尺寸的增大而減小,進(jìn)而趨于平緩;當(dāng)采樣尺寸為18m時(shí),模型決定系數(shù)達(dá)到最大,R2為0.718,均方根誤差最小,RMSEcv為18.874t/hm2,交叉驗(yàn)證精度(P)等于82.741%。相較于實(shí)際樣地尺寸(30m)下的估測(cè)結(jié)果而言,當(dāng)采樣尺寸為18m時(shí),估測(cè)模型的R2提高了1.989%,RMSEcv降低了2.611%,估計(jì)精度(P)提高了0.463%,雖然估測(cè)結(jié)果的變化存在一定的規(guī)律性,但是總體差異不明顯。因此,在生物量估測(cè)過(guò)程中,需結(jié)合研究對(duì)象和研究區(qū)的實(shí)際情況對(duì)采樣尺寸進(jìn)行選擇。
機(jī)載激光雷達(dá)數(shù)據(jù)可以準(zhǔn)確地獲取森林三維結(jié)構(gòu)信息,利用機(jī)載激光雷達(dá)數(shù)據(jù)可以對(duì)森林地上生物量進(jìn)行精確高效地監(jiān)測(cè)。然而,采樣尺寸的大小成為了一個(gè)不確定性因素,以往的研究多是以樣地實(shí)際大小來(lái)確定機(jī)載激光雷達(dá)數(shù)據(jù)的采樣大小,而忽略了是否在實(shí)際采樣大小中獲得估測(cè)結(jié)果才是最好的。因此,Luo等[12]、Streutker等[13]對(duì)不同采樣尺寸下的估測(cè)效果進(jìn)行了對(duì)比研究,發(fā)現(xiàn)由于受坐標(biāo)的準(zhǔn)確性以及機(jī)載激光雷達(dá)點(diǎn)云數(shù)據(jù)在不同采樣大小產(chǎn)生的DEM準(zhǔn)確性等因素的影響,實(shí)際樣地大小對(duì)應(yīng)的采樣尺寸所獲的估測(cè)精度不一定是最優(yōu)的。其次,本研究的實(shí)測(cè)樣地大小為30m,而最佳的采樣尺寸為18m,說(shuō)明了機(jī)載激光雷達(dá)數(shù)據(jù)對(duì)橡膠林地上生物量的估測(cè)精度受采樣大小的影響,最佳的采樣尺寸與Luo,Wang[12,14],Estornell[15]的研究結(jié)果并不相同。這也從側(cè)面反映出了不同的研究區(qū)、不同的研究對(duì)象,其最優(yōu)的采樣尺寸也不一樣。就本研究而言,利用激光雷達(dá)數(shù)據(jù)估測(cè)橡膠林地上生物量時(shí)進(jìn)行采樣尺寸的選擇,有利于估測(cè)精度的提高。
本研究也有不足之處。首先,本文的采樣大小僅在30m以內(nèi),由于未對(duì)采樣邊界外林分進(jìn)行調(diào)查,因此采樣范圍沒(méi)有增加,僅研究了30m范圍以內(nèi)機(jī)載激光雷達(dá)采樣大小對(duì)橡膠林地上生物量估測(cè)精度的影響。其次,單木生物量計(jì)算公式的年份相差時(shí)間較長(zhǎng),PLSR生物量估測(cè)模型為線性模型,模型較為單一。