霍 鵬,岳彩榮
(西南林業(yè)大學(xué),云南 昆明 650224)
森林火災(zāi)是影響森林生態(tài)系統(tǒng)的一個重要的擾動因素[1]。林火的發(fā)生不僅會直接導(dǎo)致森林面積減少、森林結(jié)構(gòu)和生態(tài)系統(tǒng)平衡被破壞,而且樹木燃燒的過程中向大氣中釋放大量的CO2以及其他有害氣體對氣候產(chǎn)生了深遠的影響,也給當?shù)厣鐣?jīng)濟帶來了嚴重的損失。因此,森林火災(zāi)已成為森林資源和自然環(huán)境破壞的重大威脅,其發(fā)生原因復(fù)雜且難以預(yù)防。如何對森林火災(zāi)及其遭受的損失進行及時、準確和有效地監(jiān)測和事后損失評估,對預(yù)防火災(zāi)發(fā)生、減少災(zāi)害損失、維護生態(tài)平衡和保護森林資源都具有非常重要的現(xiàn)實意義[2]。
近年來,隨著遙感技術(shù)的逐步成熟,利用其空間分辨率高、監(jiān)測范圍廣、時效性強、成本較低的特點,將森林火災(zāi)受損狀況監(jiān)測與遙感技術(shù)結(jié)合起來,已成為我國森林火災(zāi)監(jiān)測的一個重要手段。決策樹算法是一種數(shù)據(jù)挖掘監(jiān)督分類方法,通過對訓(xùn)練樣本集進行數(shù)據(jù)挖掘和知識發(fā)現(xiàn)建立決策樹,利用規(guī)則對遙感影像進行分類[3]。不僅直觀簡單、運算速度快、分類精度高,而且能自動選取特征并融入影像以外的各種知識、能高效地處理大量數(shù)據(jù)和高維數(shù)據(jù)。傳統(tǒng)的決策樹分類在決策樹的建立、特征指數(shù)的選擇和閾值的設(shè)定上都較為煩瑣,即使有諸如CART決策樹能自動分類的決策樹,但在變量選擇時都是有偏的[4]。
QUEST算法是Loh和Shih于1997年提出的,該算法將分支變量和分割點的選擇分開進行,使其具有兼顧適用于連續(xù)型的變量和離散型的變量的特點。此外,它還克服了其他決策樹算法更傾向于選擇那些具有更多的潛在分割點的預(yù)測變量[5~8]。
CRUISE 2D算法是Kim和Loh于2001年提出的,它由FACT 算法改進而得來,它融合了FACT、QUEST 和CART 算法的思想。CRUISE 2D算法通過多分割減少樹的深度,并采用單因子或雙因子交互方法選擇預(yù)測變量,同時提高了樹的可讀性[9-10]。
這兩種決策樹分類方法皆可以快速、無偏、高效提取具有復(fù)雜地形的遙感影像的不同土地類型,與普通決策樹相比具有方便、快捷、分類精度高的特點[11]。在特征指數(shù)的適用性上也更趨近于較小的研究范圍,一般僅在火災(zāi)發(fā)生地的局部區(qū)域提取火燒跡地,對大尺度范圍內(nèi)的火燒跡地提取較少。根據(jù)指數(shù)適用的尺度范圍、林火發(fā)生后植被減少、燃燒殘留物沉積以及地形、紋理特征等,在已提出的修正植被指數(shù)、火燒跡地指數(shù)等指數(shù)中選取最佳指數(shù),為QUEST決策樹的建立提供堅實的基礎(chǔ)。
針對2006年云南省昆明市的“3·29”林火事件,由于該燃燒區(qū)從安寧市溫泉鎮(zhèn)西北部的古朗大箐下段森林蔓延至西山區(qū),因此本文采用QUEST算法、CRUISE 2D算法的決策樹以及最大似然法在大尺度范圍內(nèi)提取Landsat影像中的火燒跡地,并估測每種分類方法的精度,并選擇出最適合大尺度范圍內(nèi)火燒跡地提取的方法。結(jié)合2015年云南省昆明市的“3·02”林火事件驗證該方法的普適性。這為在中低分辨率的遙感影像中林火損失面積的自動提取、長時間大尺度范圍內(nèi)的森林火災(zāi)監(jiān)測、林火發(fā)生的時空規(guī)律、林火的預(yù)防等提供數(shù)據(jù)準備和參考。
本文實驗研究區(qū)為云南省昆明市,它地處我國云貴高原中部,地理位置介于東經(jīng)102°10′~103°40′,北緯24°23′~26°32′;平均海拔在 1 500 m~2 800 m之間,總體地勢北高南低,中部隆起,東西兩側(cè)較低(見圖1)。
昆明市屬北緯低緯度亞熱帶高原山地季風氣候,境內(nèi)大多數(shù)地區(qū)夏無酷暑,冬無嚴寒,四季如春,氣候宜人,素以“春城”之稱而享譽中外。按全年降水量分布分為干、濕兩季,每年的5月至10月為雨季,11月至次年的4月為干季。因整個干季降水量極少僅占全年降水量的3%~5%,每逢3月、4月份蒸發(fā)旺盛致使春季為林火多發(fā)季節(jié),昆明市曾多次發(fā)生森林火災(zāi)事件,因此選該地區(qū)為本實驗的研究區(qū)。
本文的研究數(shù)據(jù)主要為美國陸地衛(wèi)星(Landsat)影像和DEM數(shù)據(jù),所用數(shù)據(jù)皆取自于地理空間數(shù)據(jù)云平臺(http://www.gscloud.cn),其中Landsat數(shù)據(jù)產(chǎn)品為Level1T的地形校正數(shù)據(jù),其投影坐標為UTM/WGS84,空間分辨率為30 m;DEM數(shù)據(jù)是2009年采集的同為UTM/WGS84投影坐標的數(shù)字高程模型,其空間分辨率為30 m。
實驗數(shù)據(jù)選用是2005年和2006年云南省昆明市的Landsat TM數(shù)據(jù),驗證數(shù)據(jù)采用的是2015年1月和3月的Landsat8 OLI數(shù)據(jù)。由于從地理空間數(shù)據(jù)云獲取的數(shù)據(jù)為Level1T級地形校正數(shù)據(jù),已經(jīng)過系統(tǒng)輻射校正和地面控制點幾何校正,因此只需對研究區(qū)域做大氣校正、影像鑲嵌和裁切。
2.2.1 植被指數(shù)
針對大范圍內(nèi)的火燒跡地提取,對其他地物的分離度也要求較高。考慮到電磁波輻射、大氣、植被覆蓋土壤背景等因素的影響,本文主要對以下幾種植被指數(shù)進行研究,包括歸一化差值植被指數(shù)(Normalized Difference Vegetation,NDVI)、多時相差值植被指數(shù)(Multi-temporal Normalized Difference Vegetation,MNDVI)、土壤調(diào)節(jié)植被指數(shù)(Soil Adjusted Vegetation Index,SAVI)、修改型土壤調(diào)節(jié)植被指數(shù)(Modified Soil Adjusted Vegetation Index,MSAVI)、全球環(huán)境監(jiān)測指數(shù)(Global Environment Monitoring Index,GEMI)以及亮度植被指數(shù)(Bright Vegetation Index,BVI)、綠度植被指數(shù)(Green Vegetation Index,GVI)、濕度植被指數(shù)(Wetness Vegetation Index,WVI)。
經(jīng)過對不同指數(shù)進行比較發(fā)現(xiàn),NDVI對綠色植被表現(xiàn)最為敏感,即使在低密度的植被區(qū)域仍能很好地提取出來[12]。MNDVI是將同一區(qū)域的兩個不同時期的NDVI進行波段相減。對于小范圍內(nèi)的發(fā)生過火災(zāi)的區(qū)域,能很好的將植被和其他地類區(qū)分開來;但對于大范圍的地物提取,即使整景圖像中地類變化較小,但也可能會受到影像拍攝時間不同以及陰影等其他因素的影響,降低了整個區(qū)域中植被的提取精度。幾種植被指數(shù)中僅有MSAVI不受云層影響。MSAVI對火燒跡地區(qū)域的區(qū)分較為明顯,但是植被和城鎮(zhèn)會難以區(qū)分,且受陰影影響較大,而SAVI能將植被和城鎮(zhèn)較好的區(qū)分開,總體受陰影的影響較小。GEMI與NDVI相比,既保存了比NDVI指數(shù)相對低密度至濃密度覆蓋更大的動態(tài)范圍,又在不用改變植被信息的前提下減小了大氣影響,但仍受到裸土的亮度和顏色相當大的影響,對于稀疏或中密度植被覆蓋的區(qū)域?qū)χ脖坏奶崛⌒Ч^差[13]。而根據(jù)經(jīng)驗方法得到土壤亮度指數(shù)(BVI)、綠度植被指數(shù)(GVI)、黃度植被指數(shù)(YVI),雖然忽略了大氣、土壤、植被間相互作用,但就不同地類區(qū)分度來說,BVI和WVI植被和水體嚴重混分,GVI與GEMI區(qū)分效果相似,但受傳感器的影響因素較大。
2.2.2 水體指數(shù)
水體指數(shù)是同植被指數(shù)相似的在提取水體領(lǐng)域的一種指數(shù)。常見的水體指數(shù)主要包括歸一化差值水體指數(shù)(Normalized Difference Water Index,NDWI)、修改型歸一化差異水體指數(shù)(Modified Normalized Difference Water Index,MNDWI)、增強型水體指數(shù)(Enhanced Water Index,EWI)、新型水體指數(shù)(New Water Index,NWI)。
這四種水體指數(shù)中NDWI、EWI受云的影響較大。本研究采用影像大約為4月、5月左右,滇池的湖水邊緣生長了許多漂浮的水生植物,而EWI、NWI對水體中的植被比較敏感,在提取水體時對水質(zhì)要求較高。MNDWI在幾個植被指數(shù)中提取水體的效果最好,受云、城市影響較小,不受水質(zhì)的限制,但對陰影以及覆有大棚的農(nóng)田影響仍難以剔除[14]。除以上的水體指數(shù)以外,纓帽變換中的濕度植被指數(shù)對面積較大的水體提取較好,但對于大范圍中的水體提取,效果并不理想易與城市等其他地物發(fā)生混淆。
2.2.3 火燒跡地指數(shù)
用于林火跡地提取的遙感指數(shù)主要有歸一化燃燒率(Normalized Burn Ratio,NBR)、差值歸一化燃燒率(Difference Normalized Burn Ratio,dNBR)、燃燒面積指數(shù)(Burn Area Index,BAI)、碳土壤指數(shù)(The Char Soil Index,CSI)。對于顏色較深的水體,這幾種火燒跡地指數(shù)都難以將之與火燒跡地區(qū)分開來。dNBR比NBR受其他地物影響較少,區(qū)分度較高[15]。
2.2.4 特征融合
將全球環(huán)境監(jiān)測指數(shù)(GEMI)、修改型歸一化差異水體指數(shù)(MNDWI)差值歸一化燃燒率(dNBR)、灰度共生矩陣的對比度(contrast)以及數(shù)字高程數(shù)據(jù)(DEM)同Landsat 的多光譜影像做波段融合。
本實驗將研究區(qū)分為6種主要土地類型,包括林地、農(nóng)地、水體、城市、火燒跡地和裸地,并采用目視解譯的方法,在特征融合后的影像上選取訓(xùn)練樣本(550個感興趣區(qū),總計 82 836個像元)。目視解譯是在解譯者具備影像解譯專業(yè)知識、區(qū)域背景知識及遙感系統(tǒng)知識的基礎(chǔ)上,根據(jù)圖像基本解譯要素和解譯標志來識別目標地物。訓(xùn)練樣本的選取是構(gòu)建決策樹的關(guān)鍵部分,它的好壞直接影響后期分類精度。因此,在選取訓(xùn)練樣本時,考慮了其代表性、典型性及完備性,也就是說訓(xùn)練樣本代表了整個區(qū)域內(nèi)不同地類間的光譜特征差異。
為了驗證火燒跡地自動識別的精度,根據(jù)野外采集數(shù)據(jù)和目視解譯隨機選取550個驗證樣本點,分別計算QUEST決策樹、CRUISE決策樹和極大似然分類方法的分類精度,建立混淆矩陣進行精度評價,如表1所示。結(jié)果表明,QUEST決策樹的分類總體精度為84.5%,Kappa系數(shù)為0.8161;CRUISE 2D決策樹的分類總體精度為83.5%,Kappa系數(shù)為0.8041;最大似然分類的分類總體精度為80.0%,Kappa系數(shù)為0.7624。分類總體精度是分類器正確分類的像元總數(shù)與總像元數(shù)之比,若總體精度越大,分類器分類精度越高;Kappa系數(shù)是綜合了生產(chǎn)精度和用戶精度的指標,若Kappa系數(shù)越大,分類結(jié)果與真實參考之間差異越小,則分類器分類精度越高。相比其他兩種分類方法,火燒跡地的生產(chǎn)者精度和用戶精度也是3種方法中最高的。因此,QUEST決策樹在大尺度范圍內(nèi)提取火燒跡地的效果最為理想(圖2和表1)。
表1 QUEST決策樹、CRUISE決策樹和最大似然分類精度評價表
分類方法地類用戶精度生產(chǎn)者精度Kappa系數(shù)總體精度QUEST決策樹森林61%99%0.816184.5%水體99%91%城市86%79%火燒跡地99%98%裸地86%93%農(nóng)地88%82%CRUISE決策樹森林62%99%0.804183.5%水體95%93%城市90%84%火燒跡地98%96%裸地87%95%農(nóng)地96%80%最大似然分類森林63%99%0.762480.0%水體99%88%城市97%62%火燒跡地86%98%裸地69%96%農(nóng)地90%83%
3種分類方法中QUEST和CRUISE 2D分類精度相差較小,但在提取火燒跡地的面積上存在很大的差異。僅針對“3·29”事件發(fā)生區(qū)域,利用火燒跡地提取精度驗證公式(如公式(1)和公式(2))計算3種方法的火燒跡地提取精度。其中,QUEST決策樹的火燒跡地提取精度為97.9%;CRUISE 2D決策樹的火燒跡地提取精度為80.5%;最大似然分類的火燒跡地提取精度為64.8%。QUEST算法在提取局部火燒跡地與實際面積最為吻合,如圖3(a)所示。
圖2 分類結(jié)果
識別出的火燒跡地面積<實際面積時:
識別精度=識別面積/實際面積×100%
(1)
識別出的火燒跡地面積>實際面積時:
(2)
但是QUEST決策樹在大尺度范圍內(nèi)對火燒跡地提取的效果并不理想(如圖4),在分類時會產(chǎn)生與其他地類混分的現(xiàn)象,如火燒跡地與裸地混分較為嚴重,特別是因水土流失后的裸土,與林火發(fā)生后裸露的土壤區(qū)域在目視解譯上顏色較為相近;春季農(nóng)地焚燒的區(qū)域也會被提取出來,判斷是否是林火跡地還需有相關(guān)地類調(diào)查信息,如圖4中的(a)和(b)的紅框為以上兩種情況誤分的區(qū)域。此外,這3種方法在提取火燒跡地的過程中皆會產(chǎn)生通過分類后處理無法去除的大量的碎斑,這些碎斑需根據(jù)國家規(guī)定的森林火災(zāi)等級的面積,采用手動的方式對碎斑進行剔除。與其相比,最大似然分類雖在總體分類精度上與QUEST決策樹相當,且混分的地類較少,但提取局部區(qū)域的火燒跡地面積與實際面積差距巨大。
圖3 火燒跡地提取結(jié)果
由于自然修復(fù)或人為種植會使得火燒跡地在一定時間范圍內(nèi)緩慢恢復(fù),雖無法將生物量恢復(fù)為原來的數(shù)值,但超過一定的時間限制會使得在目視解譯上難以辨認,這就造成了火燒跡地提取的時效性。因此,本實驗方法僅可以識別出較短時間范圍內(nèi)火燒跡地的狀況,時間范圍的選取需根據(jù)研究區(qū)域的氣候環(huán)境以及林火災(zāi)后修復(fù)手段加以判斷。
本文選取2015年云南省昆明市的為驗證區(qū)域采用同樣的方法對研究區(qū)進行分類(如圖4),研究發(fā)現(xiàn)2015年的總體分類精度也達到97%,Kappa系數(shù)為0.957,提取火燒跡地的面積占實際精度的89%??梢婋m采用不同傳感器的同系列衛(wèi)星的產(chǎn)品,與Landsat TM影像相比的Landsat8 OLI影像多了一個波段,不僅能保證分類的精度,而且Landsat8 OLI數(shù)據(jù)的多種假彩色波段的組合更有利于通過目視解譯區(qū)分不同的地類。
兩個研究區(qū)在時間選取上的差異性對整個影像的分類具有一定的影響。Landsat5 TM影像采用的是2006年4月初的數(shù)據(jù),而Landsat8 OLI采用的是2015年3月初的數(shù)據(jù)。雖僅存在一月之差,但對于中國西南部的氣候來說,進入四月氣候轉(zhuǎn)暖快滇池等一些區(qū)域的水質(zhì)明顯下降,水生生物增多造成水體邊界模糊;又正值農(nóng)耕播種的季節(jié),3月初明顯未更耕種的農(nóng)地會被分成裸地,使得與火燒跡地間隙顏色接近的裸地被誤分的可能性增加,這使得在同一區(qū)域的不同時期的土地分類產(chǎn)生了差異。又因為決策樹的精度對感興趣區(qū)的選取有較高的依賴性,因此這對目視解譯人員有較高的要求。
圖4 大范圍火燒跡地提取圖
本文采用QUEST算法、CRUISE算法的決策樹以及最大似然分類法對大范圍內(nèi)的火燒跡地進行提取,經(jīng)實驗驗證QUEST算法的決策樹在三種分類方法中對分類精度最高、火燒跡地的提取的效果上最為理想。在實現(xiàn)大尺度范圍內(nèi)對火燒跡地自動提取方面,QUEST決策樹雖在這三種方法中效果最好,但仍有許多待改進之處。
但本實驗中的不足之處包括以下幾點:根據(jù)森林火災(zāi)中火種的蔓延特點,在提取火燒跡地的結(jié)構(gòu)中會有許多零散的誤分區(qū)域,還需要在分類后人工剔除,尚未實現(xiàn)火燒跡地提取的完全自動化;僅利用地物自身的生物特性和整體的生長特征,提取指標單一,檢測結(jié)果易受干旱、植被季節(jié)變化等影響;能否可以通過增加其他特征開降低某些顏色的裸土與火燒跡地混分的狀況;為了降低決策樹的深度,本文并未采用過多指數(shù)的波段融合,僅選取最佳指數(shù),過少的特征是否會影響分類提取的精度;在決策樹分到多少級時分類效果最佳等問題還需要以后的研究中逐步驗證。