摘 要:基于IKONOS遙感影像,采用決策樹(shù)分類(lèi)算法對(duì)南京的植被覆蓋進(jìn)行分類(lèi)。根據(jù)各種植被光譜特征建立知識(shí)庫(kù),確定決策樹(shù)規(guī)則與算法對(duì)植被進(jìn)行了有效分類(lèi)與識(shí)別,精度較高。
關(guān)鍵詞:遙感影像;植被分類(lèi);知識(shí)庫(kù);決策樹(shù);紋理
1 概述
植被作為生態(tài)系統(tǒng)的主要組成,是生態(tài)系統(tǒng)存在的基礎(chǔ),也是聯(lián)結(jié)土壤、大氣和水分的自然“紐帶”,它在陸地表面的能量交換過(guò)程、生物地球化學(xué)循環(huán)過(guò)程和水文循環(huán)過(guò)程中扮演著重要的角色,在全球變化研究中起著“指示器”的作用[1]。自然界的植被類(lèi)型復(fù)雜多樣,傳統(tǒng)的進(jìn)行實(shí)地調(diào)查的方法耗費(fèi)大量人力和物力,近年來(lái)日益成熟的遙感技術(shù)為植被的分類(lèi)和識(shí)別提供了一條新的途徑。遙感影像全面真實(shí)地記錄了地表植被與環(huán)境的信息,植被類(lèi)型的波譜特性在影像上表現(xiàn)為亮度值的不同,這使得對(duì)它們的區(qū)分成為可能。
目前對(duì)于植被類(lèi)型的識(shí)別方法很多,但是由于各種植被類(lèi)型相互摻雜,且受土壤濕度、同譜異物和同物異譜等多種因素的影響,傳統(tǒng)的分類(lèi)方法對(duì)于植被類(lèi)型識(shí)別的結(jié)果精度不高。植被的光譜特征可使其在遙感影像上有效地與其他地物相區(qū)別;植被指數(shù)也被廣泛用來(lái)定性和定量評(píng)價(jià)植被覆蓋及其生長(zhǎng)活力。與單波段相比,用植被指數(shù)探測(cè)綠色植被更具有靈敏性;決策樹(shù)分類(lèi)法具有靈活、直觀、清晰、健壯及運(yùn)算效率高等特點(diǎn),相對(duì)傳統(tǒng)的分類(lèi)方法而言,決策樹(shù)分類(lèi)法對(duì)于輸入數(shù)據(jù)空間特征和分類(lèi)標(biāo)識(shí)具有更好的彈性和魯棒性[2]。
本實(shí)驗(yàn)通過(guò)各種植被類(lèi)型的光譜特征統(tǒng)計(jì),得到各種植被類(lèi)型的光譜曲線和NDVI區(qū)間,并利用植被分布的紋理特征,通過(guò)比較與分析確定決策樹(shù)的規(guī)則,進(jìn)行植被分類(lèi)。
2 研究區(qū)概況和數(shù)據(jù)
本實(shí)驗(yàn)所選取的研究區(qū)為南京地區(qū)。該地區(qū)地處長(zhǎng)江下游的丘陵地區(qū),中心位于北緯31°56,東經(jīng)119°14;海拔高度20-448m,屬北亞熱帶季風(fēng)氣候區(qū),年平均氣溫15.1℃,年降水量1019mm。該地區(qū)的植被的特征和種類(lèi)具有較強(qiáng)的代表性。本實(shí)驗(yàn)所采用的數(shù)據(jù)為IKONOS遙感影像。影像成像于3月份,大小為400×400像素,影像的空間分辨率為4m,如圖1所示。
3 基于光譜信息的植被分類(lèi)
3.1利用NDVI進(jìn)行植被與非植被的區(qū)分
陳君穎、田慶久[3]經(jīng)過(guò)實(shí)地考察與土地利用現(xiàn)狀圖相結(jié)合,確定南京的植被類(lèi)型主要分為灌木林地、草地、農(nóng)田。由于本試驗(yàn)所用影像為3月份成像,考慮到植被的季相不同,例如豌豆等作物在影像上的表現(xiàn)接近于裸地,故而確定南京的植被類(lèi)型為灌木林地、草地、農(nóng)田、裸地,目視判讀如圖1所示。由于本研究的目的是對(duì)植被進(jìn)行分類(lèi),因此需要將植被與非植被分開(kāi)。已有很多研究證明,用歸一化植被指數(shù)(NDVI)進(jìn)行閾值分割可較精確地提取出植被信息。NDV I被定義為近紅外波段與可見(jiàn)光紅波段數(shù)值之差和這兩個(gè)波段數(shù)值之和的比值。即:
NDVI=(DNNIR-DNR)/(DNNIR+DNR)
本研究選取多個(gè)植被樣本,通過(guò)比較其N(xiāo)DVI值,確定了NDVI的閾值為0.5,即NDVI≥0.5的像元為植被,否則為非植被。
3.2 不同植被類(lèi)型光譜特征的統(tǒng)計(jì)
不同植被類(lèi)型具有不同的光譜特征,本試驗(yàn)對(duì)遙感影像中各種植被類(lèi)型進(jìn)行了光譜特征統(tǒng)計(jì)分析。陳君穎、田慶久[3]利用對(duì)所有樣本四個(gè)波段的DN值、NDVI值及紋理信息進(jìn)行決策樹(shù)進(jìn)行植被分類(lèi)取得了較好的分類(lèi)結(jié)果。本試驗(yàn)通過(guò)對(duì)不同植被類(lèi)型進(jìn)行采樣,共選擇了396個(gè)灌木林地樣本、721個(gè)草地樣本、497個(gè)農(nóng)田1樣本、423個(gè)農(nóng)田2樣本、398個(gè)裸地樣本。然后對(duì)所有的樣本實(shí)驗(yàn)得出各種植被類(lèi)型的紋理信息(利用Homogeneity指數(shù)[7]計(jì)算得到)、4個(gè)波段的DN值及NDVI進(jìn)行了統(tǒng)計(jì)分析,見(jiàn)表1,其中B1、B2、B3、B4、B5、B6分別代表紋理,近紅外波段、藍(lán)光波段、綠光波段、紅光波段、NDVI。B1利用Homogeneity指數(shù)計(jì)算得到,如圖2所示。
從統(tǒng)計(jì)資料表1與圖2比較分析得到:
(1)在B5(紅光)波段上,灌木林地相比于其它植被種類(lèi)DN值較大,因此可以用B5波段的DN值將灌林與農(nóng)田、草地、裸地分開(kāi);(2)從統(tǒng)計(jì)資料發(fā)現(xiàn),農(nóng)田1,農(nóng)田2,草地在B5(紅光)波段上的DN值農(nóng)田1相對(duì)較小,因此可以用B5波段的DN值將農(nóng)田1與農(nóng)田2、草地區(qū)分開(kāi);(3)農(nóng)田2與草地在B4(綠光)波段上DN值差別較大,因此可以用B4波段上的DN值區(qū)分開(kāi)農(nóng)田2與草地;(4)從各種植被類(lèi)型的光譜特征統(tǒng)計(jì)(表1)和B4(綠光)波段的紋理一致性圖(圖2)上我們通過(guò)比較分析,發(fā)現(xiàn)可能由于地物分布較為支離破碎,紋理并不能起到區(qū)分植被類(lèi)型的作用。
3.3 決策樹(shù)算法
決策樹(shù)(Decision tree)法是指根據(jù)影像的不同特征,以樹(shù)型結(jié)構(gòu)表示分類(lèi)或決策集合,產(chǎn)生規(guī)則和發(fā)現(xiàn)規(guī)律[4]。首先利用訓(xùn)練空間實(shí)體集生成判別函數(shù),其次根據(jù)不同取值建立樹(shù)的分支,在每個(gè)分支子集中重復(fù)建立下層結(jié)點(diǎn)和分支,最后形成決策樹(shù)[5]。決策樹(shù)由一個(gè)根結(jié)點(diǎn)(Root nodes)、一系列內(nèi)部結(jié)點(diǎn)(Internal nodes)和終極結(jié)點(diǎn)(Terminal nodes)組成,每個(gè)結(jié)點(diǎn)只有一個(gè)父結(jié)點(diǎn)和兩個(gè)或多個(gè)子結(jié)點(diǎn)。決策樹(shù)算法在遙感分類(lèi)中的應(yīng)用是依據(jù)規(guī)則把遙感數(shù)據(jù)集一級(jí)級(jí)往下細(xì)分作為決策樹(shù)的各個(gè)分支,終極結(jié)點(diǎn)則為分類(lèi)結(jié)果(圖3)。
3.4 基于光譜信息的植被分類(lèi)
本試驗(yàn)通過(guò)在3.2小節(jié)中對(duì)各種植被類(lèi)型的光譜信息與紋理信息的比較與分析,結(jié)合ENVI軟件的決策樹(shù)自動(dòng)生成模塊,對(duì)自動(dòng)生成的決策樹(shù)進(jìn)行了反復(fù)的試驗(yàn)與改進(jìn),最終確定如圖4的決策樹(shù)算法。
圖4中,B2、B3、B4、B5分別為近紅外、藍(lán)光、綠光、紅光波段的DN值, B6為植被的NDVI。
分類(lèi)過(guò)程為:
(1)計(jì)算影像的B5波段的DN值, 其中DN值小于等于291的提取為水體,DN值大于291的提取為植被、建筑、裸地;(2)計(jì)算影像的NDVI值,其中大于0.5的歸為植被類(lèi),小于等于0.5的劃分為建筑與裸地;(3)在植被類(lèi)型的區(qū)分中,B5波段DN值小于等于485的分為灌木林地類(lèi),大于485的提取為農(nóng)田1、農(nóng)田2、草地;(4)在建筑與裸地的去分中,B3波段DN值大于609的劃分為建筑2,小于等于609的提取為建筑1、建筑3與裸地;(5)在農(nóng)田1、農(nóng)田2、草地的區(qū)分中,B5波段的DN值小于等于606的劃分為農(nóng)田1,大于606的劃分為農(nóng)田2與草地;(6)在建筑1、建筑3、裸地的區(qū)分中,B2波段的DN值大于484的提取為建筑1,相反提取為裸地與建筑3;(7)在農(nóng)田2與草地的區(qū)分中,B4波段的DN值大于334的提取為農(nóng)田2,小于等于334的劃分為草地;(8)在裸地與建筑3的區(qū)分中,B5波段的DN值大于368的提取為裸地,小于等于368的劃分為建筑3。應(yīng)用該算法對(duì)影像進(jìn)行植被分類(lèi),并將建筑1、建筑2、建筑3、水體合并,得到的植被分類(lèi)結(jié)果如圖5所示。
3.5 分類(lèi)結(jié)果精度評(píng)價(jià)
為了對(duì)分類(lèi)結(jié)果精度進(jìn)行評(píng)價(jià),本研究通過(guò)遙感影像目視判讀,分別選取了71個(gè)建筑水體樣本,769個(gè)草地樣本、400個(gè)灌木林地樣本、520個(gè)農(nóng)田1樣本和460個(gè)農(nóng)田2樣本,457個(gè)裸地樣本,建立混淆矩陣,計(jì)算相關(guān)指標(biāo),得到分類(lèi)精度評(píng)價(jià),結(jié)果見(jiàn)表2。
由圖1目視判讀也可以看出,裸地易與建筑類(lèi)混淆,草地易與農(nóng)田2混淆。在表2中,就每種植被類(lèi)型的用戶(hù)精度而言,灌林和農(nóng)田1(見(jiàn)圖1)的分類(lèi)精度最高,裸地、農(nóng)田2和草地(見(jiàn)圖1)的分類(lèi)精度相對(duì)較低,這與目視判讀是一致的。從表2可知,測(cè)試樣本的總體分類(lèi)精度達(dá)到了81.3%,證明該植被分類(lèi)方法具有較好的分類(lèi)能力和可行性。
4 結(jié)束語(yǔ)
文章提出的植被分類(lèi)方法是基于各種植被類(lèi)型光譜特征的知識(shí)庫(kù)采用的決策樹(shù)分類(lèi)算法。研究結(jié)果表明,該植被分類(lèi)方法能有效地對(duì)植被進(jìn)行分類(lèi)與識(shí)別,精度較高。對(duì)于不同的數(shù)據(jù)源,如能綜合利用更多的地理信息,會(huì)進(jìn)一步提高分類(lèi)的精度。隨著遙感理論與技術(shù)的發(fā)展,應(yīng)用多種地理信息綜合分析,勢(shì)必會(huì)成為未來(lái)發(fā)展的主導(dǎo)方向。
參考文獻(xiàn)
[1]張?jiān)葡?,李曉兵,陳云?草地植被蓋度的多尺度遙感與實(shí)地測(cè)量方法綜述[J].地球科學(xué)進(jìn)展,2003,18(1):85-93.
[2]李爽,張二勛.基于決策樹(shù)的遙感影像分類(lèi)方法研究[J].地域研究與開(kāi)發(fā),2003,22(1):17-21.
[3]陳君穎,田慶久.高分辨率遙感植被分類(lèi)研究[J].遙感學(xué)報(bào),2007,11(2):221-227.
[4]Quinlan J. Introduction of Decision Trees[J].Machine Learning,1986(5):239-266.
[5]Li D R, Wang S L, LiD Y, etal. Theories and Technologies of Spatial Data Mining and Knowledge Discovery [J]. Geomantic and Information Science of Wuhan University,2002,27(3):221-233.
[6]Friedl M A,Brodeley C E. Decision Tree Classification of Land Cover from Remotely Sensed Data [J].Remote Sens.Environ,1997(61):399-409.
[7]Haralick R. Statistical and Structural Approaches to Texture [J].Proceedings of the IEEE,1979,67(5):786-804.
作者簡(jiǎn)介:張文靜(1984,3-),女,工程師,廣州市水務(wù)科學(xué)研究所,現(xiàn)主要從事測(cè)繪、地理信息系統(tǒng)技術(shù)有關(guān)的應(yīng)用研究、技術(shù)開(kāi)發(fā)、生產(chǎn)管理等方面工作。