施鵬程,彭道黎
(北京林業(yè)大學(xué) 林學(xué)院,北京100083)
森林是國(guó)家建設(shè)的重要資源,森林蓄積量是衡量一個(gè)國(guó)家森林健康與否的重要指標(biāo)之一,同時(shí)森林蓄積量的消長(zhǎng)動(dòng)態(tài)還是林業(yè)經(jīng)濟(jì)效益的主要標(biāo)志[1-2]。因此研究森林蓄積量的 測(cè)定方法在林業(yè)系統(tǒng)中具有十分重要的意義。傳統(tǒng)的森林蓄積量的調(diào)查方法主要通過森林資源一類和二類調(diào)查來(lái)獲取信息,對(duì)標(biāo)準(zhǔn)地進(jìn)行調(diào)查,以標(biāo)準(zhǔn)木平均胸徑、樹高進(jìn)行估測(cè),人為影響較大。除此,傳統(tǒng)的調(diào)查方法勞動(dòng)強(qiáng)度大,調(diào)查周期長(zhǎng),耗費(fèi)大量的人力、物力和財(cái)力,而且不能及時(shí)反應(yīng)森林的動(dòng)態(tài)變化[3-4]。因此,為了及時(shí)掌握林業(yè)資源現(xiàn)狀及動(dòng)態(tài)變化,克服傳統(tǒng)的森林蓄積量調(diào)查所存在的缺點(diǎn),急需引進(jìn)新方法和新技術(shù)進(jìn)行森林資源調(diào)查。
近年來(lái),隨著高空間分辨率遙感技術(shù)的發(fā)展,GIS 和GPS 技術(shù)在森林資源調(diào)查和管理中的應(yīng)用不斷深入,國(guó)內(nèi)外不少學(xué)者借助GIS、GPS 和RS 及其集成技術(shù)進(jìn)行森林蓄積定量估測(cè)[5-8]。諸多研究結(jié)果表明,遙感影像灰度值及其經(jīng)線性組合構(gòu)成的植被指數(shù)與郁閉度和蓄積量等都有很好的相關(guān)關(guān)系[9-11],可作為定量因子參與方程估測(cè)森林蓄積量。本研究基于偏最小二乘回歸針對(duì)2006 年北京市密云縣森林蓄積量進(jìn)行遙感估測(cè),得到密云縣森林蓄積量遙感估測(cè)的最優(yōu)模型并進(jìn)行相關(guān)的精度評(píng)價(jià),為今后進(jìn)行森林資源的快速監(jiān)測(cè)及其實(shí)時(shí)變化分析提供理論基礎(chǔ)和重要的技術(shù)支持。
密云縣位于北京市的東北部(E116°39'33″-117°30'25″,N40°13'7″ -40°47'57″),屬于燕山山脈與華北平原的交接地,主要以山地為主,土壤類型以褐土為主。密云縣氣候?yàn)闇貛Ъ撅L(fēng)性半干旱氣候,具有四季分明、雨熱同期、干濕冷暖變化驟烈的特征。無(wú)霜期一般在183 ~186 d,年平均氣溫10.9 ℃。該縣平均降水量為660 mm,主要集中在6—8 月份,降雨強(qiáng)度大,侵蝕力強(qiáng)。密云縣森林植被主要是針闊混交林森林植被地帶,以人工林為主,常見的樹種主要為油松(Pinus tabulaeformis)、刺槐(Robinia pseudoacacia)、楊樹(Populus)、臭椿(Ailanthus altissima)、側(cè)柏(Platycladus orientalis Franco)及經(jīng)濟(jì)林等[12-13]。
調(diào)查數(shù)據(jù)為密云縣2006 年森林資源一類調(diào)查101 個(gè)樣地點(diǎn)。遙感影像(2006 年)覆蓋研究區(qū),綜合考慮了時(shí)相、季相、云量及其與一類清查數(shù)據(jù)的匹配性,影像空間分辨率為30 m。
利用ERDAS 和ARCGIS 等軟件,借助密云縣行政邊界、覆蓋研究區(qū)的DEM 數(shù)據(jù),對(duì)影像數(shù)據(jù)進(jìn)行輻射校正、幾何校正、波段組合和圖像裁剪等預(yù)處理,校正誤差控制在1 個(gè)像元以內(nèi)。
考慮到遙感因子和GIS 因子之間量綱不同的影響,將所有樣本數(shù)據(jù)進(jìn)行中心標(biāo)準(zhǔn)化,統(tǒng)一量綱[4],如式(1)所示,
偏最小二乘回歸是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)的分析方法,由Wola 和Albano 于1983 年首次提出,可以較好的解決自變量之間存在多重相關(guān)性的問題,集多元線性回歸分析、典型相關(guān)分析和主成分分析于一體的分析方法。
記因變量為Y=(y1,y2,…,yq),自變量為X =(x1,x2,…,xp),設(shè)因變量Y 與自變量X 均有n 個(gè)觀測(cè)值,由此構(gòu)成了數(shù)據(jù)表Xn×p和Yn×q。其中:X 為自變量矩陣;Y 為因變量矩陣;n 為樣本個(gè)數(shù),p 為自變量個(gè)數(shù),q 為因變量個(gè)數(shù)。通過成分提取的方法來(lái)達(dá)到有效建模的目的。該方法分別在自變量矩陣X和因變量矩陣Y 中提取成分t 和u,提取后的成分t 是x1,x2,...,xp的線性組合,而u 則是y1,y2,...,yq的線性組合。為了回歸分析的需要,偏最小二乘回歸在提取成分時(shí)加上了以下2 個(gè)目標(biāo)[14]:(a)t 和u盡可能多地?cái)y帶各自數(shù)據(jù)表中的變異信息;(b)t 和u 的相關(guān)程度能夠達(dá)到最大。滿足目標(biāo)(a)則t 和u可以盡可能好地代表數(shù)據(jù)表X 和Y,達(dá)到目標(biāo)(b)則自變量的成分t 對(duì)因變量的成分u 有很強(qiáng)的解釋能力。在對(duì)X 和Y 進(jìn)行一次成分提取后,分別實(shí)施X 對(duì)t 的回歸和Y 對(duì)t 的回歸。如果回歸方程已經(jīng)達(dá)到滿意的精度,則停止計(jì)算;否則,將X 關(guān)于t 回歸后的殘差矩陣與Y 關(guān)于t 回歸后的殘差矩陣進(jìn)行新一輪的成分提取。如此反復(fù),直至滿足交叉有效性原則規(guī)定的條件,最終確定提取潛變量成分的個(gè)數(shù),建立偏最小二乘回歸方程。
偏最小二乘回歸計(jì)算過程在MATLAB 軟件中進(jìn)行實(shí)現(xiàn)。
回歸自變量的篩選是建立回歸模型的關(guān)鍵之處。將總樣本中異常點(diǎn)進(jìn)行剔除,從中選取60 個(gè)樣本作為建模樣本,再抽取17 個(gè)樣本進(jìn)行模型的精度檢驗(yàn)。計(jì)算各因子與蓄積量之間的相關(guān)性、信息量及方差擴(kuò)大因子,除去與蓄積量相關(guān)性極低的部分因子,分析結(jié)果如表1 所示。可以看出,蓄積量與郁閉度呈極顯著相關(guān)(P≤0.01),與TM1 和TM2 呈顯著相關(guān)(P≤0.05),與其他因子的相關(guān)程度不高。可見遙感因子和GIS 因子對(duì)蓄積量的獨(dú)立解釋能力不強(qiáng)。除了海拔和坡度外其他因子的方差擴(kuò)大因子均大于10,可見因子之間存在嚴(yán)重的多重相關(guān)性。如果自變量間存在多重共線性,回歸系數(shù)對(duì)樣本數(shù)據(jù)的微小變化將變得非常敏感,如果利用這些因子直接建模,會(huì)使模型穩(wěn)定性變差,還會(huì)出現(xiàn)病態(tài)特征[15]。因此本文將采用偏最小二乘回歸降低變量之間的相關(guān)性,建立森林蓄積量估測(cè)模型。
表1 入選變量的相關(guān)信息Tab.1 Information table about the selected variables
在MATLAB 里進(jìn)行偏最小二乘回歸計(jì)算,得到常量及各變量的系數(shù)。建模提取了3 個(gè)最佳成分個(gè)數(shù),還原到原始變量的回歸方程系數(shù),方程為:
式(2)中,Y 表示森林蓄積量,單位:m3/hm2。
根據(jù)實(shí)測(cè)的數(shù)據(jù),可以得到蓄積量的均值,為44.49 m3/hm2(表2),將未參與建模的17 個(gè)檢驗(yàn)樣本的數(shù)據(jù)代入估測(cè)模型,偏最小二乘回歸估測(cè)均值為37.65 m3/hm2,兩者的絕對(duì)誤差為6.84 m3/hm2,(圖2)其中,樣地10 的偏差最大。偏最小二乘回歸主要針對(duì)整體進(jìn)行預(yù)估,對(duì)于單一樣本的精度還有待提高。對(duì)基于偏最小二乘回歸所建立的模型進(jìn)行總體精度驗(yàn)證:精度=1 -[實(shí)測(cè)值-估測(cè)值]/實(shí)測(cè)值。得到林分蓄積量的估測(cè)精度為84.63%。
將蓄積量的實(shí)測(cè)值與模型估測(cè)值進(jìn)行配對(duì)樣本T 檢驗(yàn)(表2),可以看出,實(shí)測(cè)蓄積量與模型反演蓄積量的相關(guān)系數(shù)為0.555,P=0.021 <0.050,因此認(rèn)為兩者存在相關(guān)性。回歸模型T 值雙尾檢驗(yàn)概率P=0.187 >0.05,故可認(rèn)為兩組數(shù)據(jù)之間不存在顯著差異,表明偏最小二乘回歸反演模型具有較強(qiáng)的適用性,可用于估測(cè)密云縣森林蓄積量。
表2 模型配對(duì)樣本T 檢驗(yàn)Tab.2 The paired samples T-test of the model
圖1 蓄積量模型估算值與實(shí)測(cè)值擬合圖Fig.1 The fitting figure of the estimated values and measured values
遙感數(shù)據(jù)能提供動(dòng)態(tài)的、綜合的植被覆蓋信息,它與系統(tǒng)的全國(guó)森林資源清查數(shù)據(jù)相結(jié)合豐富了森林資源經(jīng)營(yíng)管理的手段,并極大提高了工作效率[17]。本研究基于前人的研究,選取了與森林蓄積量關(guān)系較為密切的因子作為自變量,通過運(yùn)用偏最小二乘回歸得到森林蓄積量遙感估測(cè)模型。結(jié)果表明,該模型的穩(wěn)健性、適用性均優(yōu)于一般回歸模型,尤其是可以在確保精度的同時(shí)克服因子之間的相關(guān)性。
(1)優(yōu)選了16 個(gè)遙感因子和地形因子,利用偏最小二乘回歸構(gòu)建蓄積量模型,模型為:Y= -11.880 +85.701 郁閉度 -172.850TM1 -97.335TM2 +116.709TM3 +23.468TM4 -65.685TM5 +78.104TM7 -9.825NDVI +0.351RVI -0.630TM7/TM3 +2.778TM4/TM2 -6.656TM437 +4.176TM452 +0.008 海拔+0.309 坡度。
(2)經(jīng)配對(duì)樣本T 檢驗(yàn),偏最小二乘回歸估測(cè)精度為84.63%,實(shí)測(cè)蓄積量與模型反演蓄積量的相關(guān)系數(shù)為0.555,兩者存在相關(guān)性(P <0.050)。該精度基本滿足預(yù)測(cè)森林蓄積量模型的要求,因此,可以用少量的樣地資料進(jìn)行遙感蓄積估測(cè)代替森林資源一類調(diào)查。
[1]孫海鵬,包占青,姜志強(qiáng).林木蓄積量預(yù)測(cè)[J].內(nèi)蒙古林業(yè)調(diào)查設(shè)計(jì),1999,3:106 -109.
[2]程武學(xué),楊存建,周介銘,等.森林蓄積量遙感定量估測(cè)研究綜述[J].安徽農(nóng)業(yè)科學(xué),2009,37(16):1 -2.
[3]李崇貴,趙憲文,李春干,等.森林蓄積量遙感估測(cè)理論與實(shí)現(xiàn)[M].北京:科學(xué)出版社,2006.
[4]琚存勇,蔡體久.用泛化改進(jìn)的BP 神經(jīng)網(wǎng)絡(luò)估測(cè)森林蓄積量[J].林業(yè)科學(xué),2006,51(12):59 -62.
[5]陳楚,關(guān)澤群,張鵬林,等.利用RS 和G1S 的森林蓄積量偏最小二乘估測(cè)研究[J].湖北林業(yè)科技,2004,(4):5 -28.
[6]黃平,楊燕瓊,侯長(zhǎng)謀.基于RS、G1S 的杉木林分蓄積量判讀模型研究[J].中南林業(yè)調(diào)查規(guī)劃,2003,22(1):25 -27.
[7]李春干,譚必增.歷史調(diào)查數(shù)據(jù)參與森林調(diào)查因子遙感定量估測(cè)的研究[J].林業(yè)資源管理,2003,31(1):58 -61.
[8]袁凱先,陳玉山,包盈智,等.森林蓄積量的遙感估測(cè)[J].林業(yè)資源管理,1996,24(3):13 -17.
[9]叢沛桐,祖元?jiǎng)?,王瑞蘭,等.GIS 與ANN 整合技術(shù)在森林資源蓄積量預(yù)測(cè)中的應(yīng)用[J].地理科學(xué),2004,24(5):591-596.
[10]楊燕瓊,吳奕敏,黃平,等.基于RS、GIS 的林分蓄積量估測(cè)[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2003,24(3):73-77.
[11]劉志華,常禹,陳宏偉.基于遙感、地理信息系統(tǒng)和人工神經(jīng)網(wǎng)絡(luò)的呼中林區(qū)森林蓄積量估測(cè)[J]. 應(yīng)用生態(tài)學(xué)報(bào),2008,19(9):1891 -1896.
[12]石青.北京密云水庫(kù)集水區(qū)水源涵養(yǎng)林耗水規(guī)律研究[D].北京:北京林業(yè)大學(xué),2004.
[13]孫慶艷,余新曉,楊新兵,等.密云水庫(kù)集水區(qū)防護(hù)林不同樹種林冠截留研究[J].中國(guó)水土保持科學(xué),2009,7(3):73-78.
[14]王惠文,吳載斌,孟潔.偏最小二乘回歸的線性與非線性方法[M].北京:國(guó)防工業(yè)出版社,2006:97 -127.
[15]王力賓,顧光同.多元統(tǒng)計(jì)分析模型、案例及SPSS 應(yīng)用[M].北京:經(jīng)濟(jì)科學(xué)出版社,2010.