劉 暢,劉昕岑,付 堯
(1.西南林業(yè)大學(xué) 林學(xué)院,昆明 650000;2. 玉溪師范學(xué)院 地理與國土工程學(xué)院,云南 玉溪653100)
植被是覆蓋地表的植物群落的總稱,包括森林、草地、農(nóng)作物、灌叢和沼澤等。它與氣候、土壤、地形、動(dòng)物界及水狀況等自然環(huán)境要素密切相關(guān)。植被覆蓋程度是研究區(qū)域生態(tài)系統(tǒng)環(huán)境變化的重要指標(biāo),對(duì)水文、生態(tài)、區(qū)域變化等都具有重要意義[1-3]。
植被分類是研究植被覆蓋的基礎(chǔ),運(yùn)用遙感影像分類是獲取植被信息的重要方式[4],決策樹分類法最常用。該方法最早產(chǎn)生于20世紀(jì)六七十年代,由Quinlan[5-6]最早在1986年提出ID3算法和1993年提出C4.5算法。目前,國內(nèi)外專家利用該方法進(jìn)行了大量研究,也取得了很多成果。Colstoun等[7]基于Landsat ETM+多時(shí)相衛(wèi)星數(shù)據(jù)探討了決策樹分類器應(yīng)用的可行性,而且對(duì)美國Delaware Water國家級(jí)公園里的11種土地覆蓋類型進(jìn)行了分類制圖,其研究結(jié)果表明,決策樹分類方法在土地覆蓋和森林制圖方面具有可行性。韓婷婷等[8]利用Landsat TM影像,采用決策樹方法研究云南省森林分類,抽取香格里拉縣建立決策樹模型,并進(jìn)行精度評(píng)價(jià)。白秀蓮等[9]對(duì)內(nèi)蒙古自治區(qū)赤峰市中部采用C5.0算法的決策樹分類方法進(jìn)行分類,研究表明C5.0決策樹能夠有效的利用各種輔助信息參與到遙感分類,從而不同程度地提高分類精度。楊正斌等[10]構(gòu)建了基于決策樹規(guī)則的滇南西雙版納森林覆蓋信息提取模型,進(jìn)行精度評(píng)價(jià)得到總體精度達(dá)99.08%,Kappa系數(shù)為0.923。與傳統(tǒng)分類方法相比發(fā)現(xiàn),采用決策樹方法提取森林信息的精度更高。申文明等[11]利用Landsat ETM+影像和GIS 數(shù)據(jù)對(duì)決策樹分類和傳統(tǒng)自動(dòng)分類進(jìn)行了對(duì)比,結(jié)果表明基于決策樹的分類方法相較于傳統(tǒng)分類方法具有更高的分類精度和適應(yīng)能力,易于實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)分類的流程化和自動(dòng)化。
基于此,本文運(yùn)用遙感技術(shù),通過分析各分類類型的光譜特性、紋理以及色彩等信息,建立決策樹模型,對(duì)整個(gè)德宏地區(qū)的地物進(jìn)行分類,再對(duì)分類結(jié)果進(jìn)行遙感制圖,以期為促進(jìn)德宏區(qū)生態(tài)建設(shè)和可持續(xù)發(fā)展,為研究德宏區(qū)生態(tài)環(huán)境提供參考。
德宏州地處我國西南邊陲,位于東經(jīng)97°31′~98°43′,北緯23°50′~25°20′之間,是云南省8個(gè)少數(shù)民族自治州之一。東和東北與保山市的龍陵、騰沖相鄰,南、西和西北三面與緬甸聯(lián)邦接壤,全州除梁河縣外其它縣市都有國境線,國境線總長503.8 km。地勢東北高西南低,全州海拔最高點(diǎn)在盈江北部大娘山,為3 404.6 m,海拔最低點(diǎn)也在盈江的西部那邦壩的羯羊河谷,海拔210 m。南亞熱帶季風(fēng)氣候,具有冬無嚴(yán)寒,夏無酷暑,雨量充沛,雨熱同期,干冷同季,年溫差小,日溫差大,霜期短、霜日少等特點(diǎn),年降水量1 400~1 700 mm,年均氣溫18.4~20 ℃。水系有“三江四河”,即怒江、大盈江、瑞麗江、芒市河、南畹河、戶撒河、芒東河。不同氣候帶森林植被類型和面積不盡相同:熱帶、北亞熱帶季風(fēng)氣候區(qū)森林面積占全州森林總面積5.4%;亞熱帶以闊葉林為主的森林面積占全州森林總面積57.2%;暖溫帶主要植被為常綠闊葉林以及油茶、核桃等經(jīng)濟(jì)林,面積約占全州森林36.1%;溫帶山地主要植被為鐵杉、高山櫟、杜鵑灌木叢等,面積約占全州森林1.3%。
圖1 研究區(qū)示意圖
1.2.1 基于專家知識(shí)的決策樹分類 基于專家知識(shí)的決策樹分類是基于遙感圖像數(shù)據(jù)及其他空間數(shù)據(jù),通過專家經(jīng)驗(yàn)總結(jié)、簡單的數(shù)學(xué)統(tǒng)計(jì)和歸納方法等,獲得分類規(guī)則并進(jìn)行遙感分類。分類規(guī)則易于理解,也符合人的認(rèn)知過程,最大的特點(diǎn)是利用多源數(shù)據(jù)。總體上分為4個(gè)過程:定義分類規(guī)則、構(gòu)建決策樹、執(zhí)行決策樹和評(píng)價(jià)分類結(jié)果。
決策樹方法分為自下而上和自上而下2類。自下而上方法的基本思想是將每個(gè)像素作為一個(gè)類,首先計(jì)算所有類別之間的距離,合并距離最近的兩類形成一個(gè)新類,然后計(jì)算新類和其他類別之間的距離,重復(fù)前面的工作,直到最終所有類別都合并為一個(gè)大類,形成整個(gè)樹結(jié)構(gòu)的根部。每次合并產(chǎn)生樹結(jié)構(gòu)中的一個(gè)結(jié)點(diǎn),分類樹由多個(gè)結(jié)點(diǎn)和分枝組成,最下面一層的結(jié)點(diǎn)稱為根結(jié)點(diǎn),最上面一層的結(jié)點(diǎn)稱為終端結(jié)點(diǎn),終端結(jié)點(diǎn)為一類。本研究采用自上而下的方法,該方法基本思想是將圖像作為一個(gè)大類,按照最大的差異性區(qū)分出兩個(gè)類別,對(duì)于區(qū)分出的類別同樣按照最大差異性繼續(xù)分類,直到達(dá)到工作要求。
決策樹分類包括訓(xùn)練和分類兩步,首先利用訓(xùn)練樣本對(duì)分類樹進(jìn)行訓(xùn)練,構(gòu)造分類樹結(jié)構(gòu),然后用訓(xùn)練好的分類樹對(duì)像素進(jìn)行逐級(jí)判定,最終確定其類別歸屬。當(dāng)分類出現(xiàn)類別混淆又難以解決時(shí),可以采取逐級(jí)分類的方法。先確定特征明顯的大類別,對(duì)每一大類再作出進(jìn)一步的劃分,此時(shí)可以更換分類方法,也可以更換分類使用的圖像特征,以提高這一類別的可分性。
1.2.2 光譜特征分析 地物光譜特性是指各種地物各自所具有的電磁波特性(發(fā)射輻射或反射輻射)。遙感圖像中灰度與色調(diào)的變化是遙感圖像所對(duì)應(yīng)的地面范圍內(nèi)電磁波譜特性的反映。將影像分為針葉、闊葉、針闊混交、灌木、草本、居民地、水體、濕地、荒地、旱地和水田11個(gè)類別,分別在每個(gè)類別中勾選出具有代表性和典型性的樣本,統(tǒng)計(jì)樣本的光譜均值,繪制地物光譜曲線,分析每個(gè)類別的光譜特性。
1.2.3 植被指數(shù) 植被指數(shù)是對(duì)地表植被狀況的簡單、有效和經(jīng)驗(yàn)的度量,廣泛地應(yīng)用在全球與區(qū)域土地覆蓋、植被分類,目前已經(jīng)定義了40多種植被指數(shù),本研究利用NDVI指數(shù)、DVI指數(shù)和MNDWI指數(shù)。
歸一化植被指數(shù)(NDVI)由Rouse等[13]人提出,可應(yīng)用于植被覆蓋度研究,消除大部分與儀器定標(biāo)、太陽角、地形、云陰影和大氣條件有關(guān)輻照度的變化,增強(qiáng)對(duì)植被的響應(yīng)能力。NDVI值范圍為-1~1,一般綠色植被區(qū)的范圍是0.2~0.8。其計(jì)算公式為:
(1)
其中,LNIR為近紅外波段,LR為紅波段。
差值植被指數(shù)(DVI)對(duì)土壤背景的變化極其敏感,能很好地消除土壤背景對(duì)植被造成的影響。其計(jì)算公式是:
IDVI=LNIR-LR
(2)
其中,LNIR為近紅外波段,LR為紅波段。
徐秋涵[14]在歸一化差異水體指數(shù)(NDWI)的基礎(chǔ)上,提出了改進(jìn)的歸一化差異水體指數(shù)(MNDWI),對(duì)比發(fā)現(xiàn)MNDWI更能揭示水體的微細(xì)特征,很容易地區(qū)分陰影和水體,解決了水體提取中難以消除陰影的難題。其計(jì)算公式是:
(3)
其中,LG為綠波段,LMIR為中紅外波段。
本文采用的數(shù)據(jù)有:德宏州隴川縣的二調(diào)數(shù)據(jù);覆蓋德宏區(qū)的Landsat8 OLI遙感影像(成像時(shí)間2017年11月14日,影像空間分辨率30 m,共1景影像,軌道號(hào)p132r43,共11個(gè)波段);GoogleEarth 影像。
本研究在Landsat8 OLI遙感影像上選取的針葉、闊葉、針闊混交林、灌木、草本、居民地、水、濕地、荒地、水田和旱地11個(gè)類別的樣本數(shù)量分別為140、155、137、113、105、160、140、22、81、52和150,并留取一部分樣本作為驗(yàn)證樣本。統(tǒng)計(jì)光譜均值,繪制樣本在Landsat8 OLI遙感影像多光譜2~8波段、3個(gè)植被指數(shù)、主成分分析的前4個(gè)分量以及纓帽變換的前3個(gè)分量共17個(gè)波段上的光譜均值曲線。圖2為典型地物的光譜均值曲線圖,其中B1~B7分別對(duì)應(yīng)Landsat8 OLI遙感影像的2~8個(gè)波段,NDVI、DVI、MNDWI分別對(duì)應(yīng)3個(gè)植被指數(shù)(即NDVI指數(shù)、DVI指數(shù)和MNDWI指數(shù)),PC1~PC4對(duì)應(yīng)主成分分析的前4個(gè)分量,KT1~KT3對(duì)應(yīng)纓帽變換的前3個(gè)分量(即亮度、綠度和濕度)。
從圖2可以看出,11個(gè)類別在B5、B6、B7、DVI、PC1、PC2、PC3、PC4、KT1、KT2、KT3等11個(gè)波段的光譜均值差距較大,因此可以結(jié)合這11個(gè)波段的光譜均值曲線和直方圖曲線,分析確定每一個(gè)類別的最佳分離閾值,逐步分離除水體外的10個(gè)類別。最后通過NDVI指數(shù)區(qū)分出植被與非植被,MNDWI指數(shù)區(qū)分出水體與非水體即可。
圖2 典型地物光譜均值曲線
2.2.1 決策樹模型 以NDVI指數(shù)、DVI指數(shù)、MNDWI指數(shù)和光譜特征為依據(jù),確定每種類別之間的最佳分離閾值。通過反復(fù)試驗(yàn),結(jié)果表明:NDVI大于0.7即為植被,反之即為非植被。在植被區(qū),B5大于3 671和B5大于1 446為闊葉,B6 大于1 395 和B5大于3 044為草本,PC1大于-517和B6大于1 257為灌木,PC3大于-25 和KT2大于-510為針葉,PC1大于-2 655為針闊混交林。 在非植被區(qū),MNDVI大于0.24即為水體,反之即為非水體,B6大于2 311、DVI大于1 575和PC3小于-362為荒地,PC4小于-77.223為居民地,PC1小于-2 864為旱地,DVI大于616和PC2大于690為濕地,MNDVI大于-0.2為水田。圖3為決策樹模型。
圖3 決策樹模型
2.2.2 分類結(jié)果圖 執(zhí)行決策樹模型后,對(duì)分類結(jié)果進(jìn)行Majority分析剔除小圖斑,生成德宏森林覆蓋圖(圖4)。
圖4 德宏森林覆蓋圖
從決策樹分類精度檢驗(yàn)表(表1)可以看出,基于決策樹的德宏森林覆蓋信息提取模型的總體精度為66.265 4%,Kappa系數(shù)為0.603 6。其中水體、居民地、闊葉、針闊混交的制圖精度都在70%以上,其他幾類的漏分精度都在50%以上。
表1 決策樹分類精度檢驗(yàn)表
本研究采用的分類方法是基于專家知識(shí)的決策樹分類方法,由于分類類別較為細(xì)致,因此在確定分離閾值的時(shí)候存在一定難度,持續(xù)時(shí)間較長,需要參考大量文獻(xiàn)反復(fù)試驗(yàn),以求的最佳分類結(jié)果。從分類精度來看,該模型的分類體系可以滿足德宏州的精度要求,但是分類結(jié)果中還是出現(xiàn)大量錯(cuò)分的情況。由于Landsat 8 OIL傳感器還沒有相應(yīng)的纓帽變換模型,而OIL影像的Band2~7波段和ETM+的6個(gè)多光譜影像波段范圍相近,因此在對(duì)經(jīng)過預(yù)處理之后的遙感影像進(jìn)行纓帽變換時(shí),可以選擇ETM+模型進(jìn)行纓帽變換[12]。
(1)利用NDVI指數(shù)可以很好的區(qū)分出植被與非植被,MNDWI指數(shù)可以很好的區(qū)分出水體與非水體。通過反復(fù)試驗(yàn)得到NDVI大于0.7即為植被,反之即為非植被。MNDVI大于0.24即為水體,反之即為非水體。
(2)建立混淆矩陣計(jì)算得到該模型的總體精度為66.265 4%,Kappa系數(shù)為0.603 6。其中水體、居民地、闊葉、針闊混交的分類精度較好,針葉、荒地、水田和旱地錯(cuò)分情況不多但是漏分精度較高,灌木、草本和濕地的錯(cuò)分和漏分精度較高。