国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹(shù)的多源遙感數(shù)據(jù)分類(lèi)

2015-03-03 06:24曾特林吳彩燕曾曉麗
關(guān)鍵詞:決策樹(shù)植被精度

曾特林 吳彩燕 曾曉麗

(西南科技大學(xué)環(huán)境與資源學(xué)院 四川綿陽(yáng) 621010)

?

基于決策樹(shù)的多源遙感數(shù)據(jù)分類(lèi)

曾特林 吳彩燕 曾曉麗

(西南科技大學(xué)環(huán)境與資源學(xué)院 四川綿陽(yáng) 621010)

遙感影像是獲取土地覆蓋信息的重要手段。分析了影響決策樹(shù)分類(lèi)的特征因子,并根據(jù)這些因子構(gòu)建分類(lèi)決策樹(shù)。結(jié)合中分辨率多源遙感數(shù)據(jù),對(duì)貢嘎山區(qū)進(jìn)行土地覆蓋分類(lèi),通過(guò)與最大似然法分析對(duì)比,基于決策樹(shù)的多源數(shù)據(jù)分類(lèi)對(duì)試驗(yàn)區(qū)的分類(lèi)精度(總體精度85.71%,Kappa系數(shù)0.83)遠(yuǎn)高于基于像素的最大似然法監(jiān)督分類(lèi)(總體精度63.56%,Kappa系數(shù)0.58)。

決策樹(shù)分類(lèi) 多源數(shù)據(jù) 貢嘎山區(qū) 中分辨率 遙感分類(lèi)

自20世紀(jì)90年代以來(lái),國(guó)內(nèi)外對(duì)土地覆蓋的遙感分類(lèi)方法主要為基于傳統(tǒng)的統(tǒng)計(jì)模式的分類(lèi)方法,如最大似然分類(lèi)法、最小距離分類(lèi)法、等距離混合法、ISODATA等。近年來(lái),傳統(tǒng)統(tǒng)計(jì)模式的分類(lèi)方法已經(jīng)不能滿足地物類(lèi)別的判讀精度,因此出現(xiàn)了越來(lái)越多的人工智能分類(lèi)方法,其中面向?qū)ο蟮臎Q策樹(shù)分類(lèi)方法得到諸多應(yīng)用。韓濤等利用單時(shí)相的MODIS數(shù)據(jù)構(gòu)建決策樹(shù)進(jìn)行自動(dòng)分類(lèi)[2],趙慧等研究了影響分類(lèi)精度的因素[3],楊曦光等使用決策樹(shù)方法對(duì)海島土地利用進(jìn)行了分類(lèi)研究[4]。這些研究結(jié)果都肯定了決策樹(shù)分類(lèi)方法在遙感影像分類(lèi)中的顯著效果,但對(duì)影像分辨率要求都比較高。基于決策樹(shù)的多源遙感影像分類(lèi)方法不同于基于像元、亞像元的分類(lèi)方法,是一種結(jié)合多源數(shù)據(jù)的面向?qū)ο蟮姆诸?lèi)法,本文通過(guò)結(jié)合多源數(shù)據(jù)的影像分割建立決策樹(shù)進(jìn)行分類(lèi),并與傳統(tǒng)的分類(lèi)方法監(jiān)督分類(lèi)(最大似然法)的分類(lèi)結(jié)果進(jìn)行對(duì)比分析。

1 研究方法

決策樹(shù)分類(lèi)法的原理是按照一定的規(guī)則把遙感數(shù)據(jù)集逐級(jí)往下細(xì)分,以確定決策樹(shù)的各個(gè)分支,分類(lèi)時(shí),地物可根據(jù)決策樹(shù)逐級(jí)決策,最終得到詳細(xì)的劃分(圖1)。分類(lèi)的導(dǎo)入數(shù)據(jù)除了TM各個(gè)波段(由于熱紅外波段不在研究范圍之列,因此移除了TM6和HJ-A/B 4個(gè)波段數(shù)據(jù))之外,還加入了ASTER DEM以及坡度、坡向數(shù)據(jù)。決策樹(shù)分類(lèi)主要包括4個(gè)步驟:⑴影像特征分析;⑵影像分割;⑶建立決策樹(shù)規(guī)則;⑷影像特征提取。

圖1 決策樹(shù)分類(lèi)流程Fig.1 Decision tree classification process

2 基于決策樹(shù)的多源數(shù)據(jù)分類(lèi)方法

2.1 研究區(qū)概況

貢嘎山(101° 40′ ~102°15′E , 29°20′ ~30°10′N(xiāo))位于青藏高原東南緣, 地處四川盆地向青藏高原過(guò)渡的大雪山的中段,主峰海拔7 514 m ,是我國(guó)典型海洋季風(fēng)型冰川的分布區(qū),也是植被垂直帶譜非常明顯的地區(qū)。該地區(qū)森林植被覆蓋率高 ,植物種類(lèi)較豐富。其海拔高差較大,植被垂直帶譜復(fù)雜多樣。研究區(qū)自上而下囊括了亞熱帶、暖溫帶、寒溫帶、亞寒帶、寒帶、寒冷帶、冰雪帶7個(gè)氣候區(qū),植被類(lèi)型包括了常綠闊葉林帶(1 000~2 200 m)、針闊葉混交林帶(2 200~2 500 m)、針葉林帶(2 500~3 600 m)、灌叢草甸帶(3 600~4 600 m)、高山流石灘稀疏植被帶(4 600~5 000 m)、永久冰雪帶(5 000 m以上)。

2.2 多源數(shù)據(jù)與數(shù)據(jù)處理平臺(tái)

研究區(qū)域內(nèi)的多源遙感影像數(shù)據(jù)是Landsat 2008年12月16日的TM影像以及環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)小衛(wèi)星星座HJ-1A 2010年3月20日CCD影像、HJ-1B 2011年6月5日的CCD影像、HJ-1A 2010年12月13日的CCD影像??臻g幾何數(shù)據(jù)為空間分辨率為30 m的ASTER DEM,投影為UTM/W- GS84。DEM產(chǎn)生的坡度、坡向圖提供了研究中會(huì)用到的影像對(duì)象中的地形因子。用于確定研究區(qū)域的是1:400萬(wàn)的基礎(chǔ)地理數(shù)據(jù),用于評(píng)價(jià)精度的是野外采集的照片和GPS采樣點(diǎn)。

數(shù)據(jù)處理平臺(tái)為ERDAS IMAGINE 9.2、ENVI4.5專(zhuān)業(yè)遙感圖像處理系統(tǒng)、ARCGIS 9.2 地理信息系統(tǒng)軟件以及德國(guó)Definiens imaging公司的Definiens Developer的面向?qū)ο蠓诸?lèi)軟件。

數(shù)據(jù)預(yù)處理包括:幾何校正、邊界裁剪、投影轉(zhuǎn)換從而產(chǎn)生研究區(qū)域的各子數(shù)據(jù)集。影像的幾何校正采用三階多項(xiàng)式糾正模型進(jìn)行控制點(diǎn)的選取、用最鄰近插值法重采樣[11],利用從1:50 000地形圖(高斯-克呂格1980年西安坐標(biāo)系投影)上選擇的25個(gè)地面控制點(diǎn)糾正得到的均方根誤差小于0.5。子數(shù)據(jù)集就是根據(jù)行政邊界和貢嘎山的范圍劃定研究區(qū)域后,再根據(jù)這個(gè)區(qū)域?qū)b感影像、DEM等數(shù)據(jù)進(jìn)行裁剪,并使用線性拉伸使圖像信息得到增強(qiáng)并且將投影統(tǒng)一為UTM-WGS84-48N的遙感圖像和DEM圖像。

2.3 決策樹(shù)分類(lèi)

2.1.1 影像特征分析

影像既有光譜特征,也有空間特征。分析影像特征旨在甄選出用于構(gòu)造決策樹(shù)規(guī)則的特征指標(biāo)。在影像上可以大致看出:植被的光譜特征在影像識(shí)別上占主要作用,而其它非植被類(lèi)型如居民地、耕地、河流等主要受空間特征影響,水體的光譜特征也比較強(qiáng),利用波段組合可以起到一定的作用(表1)。

表1 TM2+TM3-(TM4+TM5)的樣點(diǎn)值與均值Table 1 The sample values and mean values of TM2 + TM3 -(TM4 + TM5)

表2 針葉林與闊葉林特征值統(tǒng)計(jì)表Table 2 The eigenvalue statistics of Needle leaf Forests and Broadleaf Forests

目前應(yīng)用最廣泛的植被提取方法是歸一化植被指數(shù)法[7],歸一化植被指數(shù)(NDVI-Normal Different Vegetation Index)的計(jì)算公式:

NDVI=(NIR-R)/(NIR+R)

其中NIR為近紅外波段,R為紅波段,通過(guò)多次設(shè)定閾值,本研究區(qū)的NDVI值取0.15區(qū)分植被和非植被。

林、灌以及其他難以區(qū)分的植被,通過(guò)使用均值統(tǒng)計(jì)方法,結(jié)合二維空間散點(diǎn)圖與特征分布圖,確定決策樹(shù)規(guī)則中的變量[8-9]。根據(jù)表2,結(jié)合試驗(yàn)分析,最終采用TM4取35.8,提取出針葉林與闊葉林植被的光譜特征。

2.3.2 影像分割

影像分割是指一副影像分割成影像對(duì)象,以作為進(jìn)一步結(jié)合灰度和空間分類(lèi)的基礎(chǔ)。根據(jù)邊緣檢測(cè)法的分割方法[14],遙感影像分割結(jié)果的效果受到分割尺度、緊致度因子、形狀因子以及波段權(quán)重等的影響。圖像中每一個(gè)像素點(diǎn)都有其灰度尺度和空間尺度(Ahuja,1996),灰度尺度就是該像素點(diǎn)在被分割成的所在對(duì)象區(qū)域與周?chē)鷧^(qū)域的差異,而空間尺度是該點(diǎn)與對(duì)象區(qū)域邊緣的最短距離[10-11]。影像對(duì)象既有空間異質(zhì)性,又有光譜異質(zhì)性,它們構(gòu)成了影像對(duì)象的異質(zhì)性,由信息權(quán)重、異質(zhì)性值和用戶(hù)自定義的權(quán)重決定。eCognition軟件可以設(shè)置分割的尺度值和各因子的權(quán)重值。影像的像素決定了它的尺度參數(shù),形狀因子影響的是影像對(duì)象的邊緣平滑程度和對(duì)象的緊致度,這些因子的確定最終將影像對(duì)象互相區(qū)別開(kāi)來(lái)。實(shí)驗(yàn)對(duì)不同尺度和不同影響因子分別做了研究,最終確定的參數(shù)是分割尺度為6,形狀因子為0.1,緊致度因子為0.5,TM波段權(quán)重全為1,而其他波段權(quán)重為0 。

2.3.3 建立決策樹(shù)規(guī)則

根據(jù)貢嘎山植被群落的結(jié)構(gòu)和其他地物的特征,參照國(guó)家土地利用分類(lèi)標(biāo)準(zhǔn),實(shí)驗(yàn)研究區(qū)域最終被分為12類(lèi)。

張彤等[16]對(duì)決策樹(shù)的形式算法做了比較詳細(xì)的闡述,建立決策樹(shù)實(shí)際上就是根據(jù)邏輯判別式,不斷從父節(jié)點(diǎn)分叉產(chǎn)生根節(jié)點(diǎn),直至停止分叉的一個(gè)過(guò)程。決策樹(shù)分類(lèi)規(guī)則的建立是基于影像分割及其特征。首先,由決策樹(shù)的各個(gè)節(jié)點(diǎn)來(lái)建立一個(gè)邏輯結(jié)構(gòu),在此過(guò)程中會(huì)產(chǎn)生一些中間類(lèi),它們?cè)诜诸?lèi)過(guò)程中起到緩存的作用,最終將被一一歸到分類(lèi)系統(tǒng)中。自動(dòng)分類(lèi)的決策樹(shù)包含了分割、分類(lèi)、指數(shù)三大部分。由于影像特征的交叉性較強(qiáng)、混合像元無(wú)可避免,規(guī)則條件不可能完全將影像對(duì)象分成界限絕對(duì)清晰的兩類(lèi),所以分類(lèi)的部分還包括了適當(dāng)修剪的部分。分類(lèi)邏輯結(jié)構(gòu)是一個(gè)由多條規(guī)則構(gòu)成的系統(tǒng),一條規(guī)則由一個(gè)或多個(gè)邏輯語(yǔ)句構(gòu)成,規(guī)則之間不能交換順序,否則有可能使分類(lèi)結(jié)果混亂。規(guī)則里需要使用的變量放在決策樹(shù)的指數(shù)部分。決策樹(shù)的生長(zhǎng)與修剪是一個(gè)無(wú)法分割的過(guò)程,為了得到更加穩(wěn)定的分類(lèi)樹(shù),實(shí)驗(yàn)采用事后修剪,最終只有少部分的冰雪被誤分到裸地和稀疏植被中。

2.3.4 影像特征提取

規(guī)則通常是由好幾個(gè)特征參數(shù)和好幾個(gè)邏輯語(yǔ)句共同構(gòu)成的,如利用NDVI,MNDWI[12],TM4,DEM值來(lái)共同構(gòu)建一條得出的NDVI與云量較少的HJ3,4波段計(jì)算得出的NDVI的差值。這是因?yàn)閮煞N影像分別是植被生長(zhǎng)期和植被落葉期的影像,利用二者之間的差值,可以有效提取落葉與常綠的灌木;在冰川積雪、河流、湖泊、裸地、居民地的提取過(guò)程中,根據(jù)DEM和TM4確定出冰雪區(qū),但是這個(gè)過(guò)程中產(chǎn)生了中間類(lèi),而這個(gè)中間類(lèi)囊括了所有非植被中的非冰雪區(qū),而河流可直接利用海拔高度和TM2+TM3-TM4-TM5的范圍值提取,在提取河流時(shí)產(chǎn)生的中間類(lèi),可結(jié)合海拔與坡度等因子,將湖泊分出,但這時(shí)中間類(lèi)并未完全消失,因?yàn)樗寺愕嘏c居民地,要提取這兩種地物,需充分利用NDBI、坡度及DEM值來(lái)處理。當(dāng)幾個(gè)特征都在待選之列時(shí),可借助二維特征空間圖提取信息。

2.3.5 精度評(píng)價(jià)

傳統(tǒng)的基于像素的分類(lèi)使用的是最大似然算法分類(lèi)。為了確保一致性,實(shí)驗(yàn)時(shí)在這12個(gè)分類(lèi)范圍內(nèi)選取了50個(gè)與多源數(shù)據(jù)決策樹(shù)分類(lèi)方法的訓(xùn)練樣本基本一致的代表區(qū)域來(lái)進(jìn)行分類(lèi),最終這些區(qū)域的像元都分別被分到了概率最高的各類(lèi)別當(dāng)中。

利用分層采樣法,通過(guò)分類(lèi)結(jié)果圖中的類(lèi)別和野外采樣分布中對(duì)應(yīng)的類(lèi)別進(jìn)行對(duì)照,進(jìn)行精度評(píng)價(jià),采用混淆矩陣來(lái)表示,并采用用戶(hù)精度、生產(chǎn)者精度、總體分類(lèi)精度及Kappa系數(shù)評(píng)價(jià)分類(lèi)圖精度。貢嘎山區(qū)的土地覆蓋類(lèi)型分布不均,若采用隨機(jī)采樣法不能保證每個(gè)類(lèi)別的樣本數(shù)量,在選擇樣本的時(shí)候,考慮到了空間相關(guān)性。

3 結(jié)果與討論

基于決策樹(shù)的多源遙感數(shù)據(jù)分類(lèi)與基于像元的最大似然算法監(jiān)督分類(lèi)的精度評(píng)價(jià)結(jié)果見(jiàn)表3,分類(lèi)結(jié)果圖見(jiàn)圖2?;跊Q策樹(shù)的多源遙感數(shù)據(jù)分類(lèi),比基于像素的最大似然法監(jiān)督分類(lèi)具有更高的分類(lèi)精度(總體精度高出22.15 %,Kappa系數(shù)提高了 0.25%)。這表明,基于決策樹(shù)的多源遙感數(shù)據(jù)分類(lèi)為類(lèi)似貢嘎山區(qū)這樣土地覆蓋復(fù)雜的區(qū)域提供了一種較好的土地利用分類(lèi)方法。此分類(lèi)法有效地處理了“同譜異物”現(xiàn)象,例如光譜信息相似的居民地和冰川積雪;改善“同物異譜”現(xiàn)象,例如同為耕地;有效改善了“椒鹽現(xiàn)象”;充分利用了輔助數(shù)據(jù)和多時(shí)相遙感信息來(lái)參與分類(lèi),使分類(lèi)結(jié)果的精度不受影像分辨率嚴(yán)格控制。因此,本次研究的結(jié)果顯示出在缺乏高分辨率的土地類(lèi)型復(fù)雜的山區(qū),基于決策樹(shù)的多源遙感數(shù)據(jù)分類(lèi)方法的顯著優(yōu)勢(shì)和實(shí)用性。

表3 兩種分類(lèi)方法的精度評(píng)價(jià)結(jié)果對(duì)比Table 3 The accuracy of two classification methods evaluation results contrast

圖2 分類(lèi)結(jié)果圖Fig. 2 The classification result

[1] 賈坤, 李強(qiáng)子, 田亦陳,等. 遙感影像分類(lèi)方法研究進(jìn)展 [J]. 光譜學(xué)與光譜分析, 2011, 31(10): 2618-2623.

[2] 韓濤, 徐曉桃, 頡耀文. 基于單時(shí)相MODIS數(shù)據(jù)的決策樹(shù)自動(dòng)構(gòu)建及分類(lèi)研究[J]. 武漢大學(xué)學(xué)報(bào), 2009,34(2):191-194.

[3] 趙慧, 汪云甲. 影響ETM影像土地利用_覆蓋分類(lèi)精度因素的研究[J]. 遙感技術(shù)與應(yīng)用, 2012, 27(4):600-608.

[4] 楊曦光, 黃海軍, 嚴(yán)立文.等.基于決策樹(shù)方法的海島土地利用分類(lèi)研究[J].國(guó)土資源遙感, 2012,24(2):116-120.

[5] FOODY G M. Status of land cover classification accuracy assessment [J]. Remote Sensing of Environment, 2002, 80(1): 185-201.

[6] 李爽, 丁圣彥. 決策樹(shù)分類(lèi)法及其在土地覆蓋分類(lèi)中的應(yīng)用 [J]. 遙感技術(shù)與應(yīng)用, 2002, 17(1): 6-11.

[7] NALWA V S,BINFORD T O. On detecting edges[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1986,8(6):699-714.

[8] 陳華芳, 王金亮, 陳忠,等. 山地高原地區(qū) TM 影像水體信息提取方法比較——以香格里拉縣部分地區(qū)為例 [J]. 遙感技術(shù)與應(yīng)用, 2005, 19(6): 479-84.

[9] 李小曼, 王剛, 田杰. TM 影像中水體提取方法研究[J]. 西南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2006, 28(4): 580-582.

[10] AHUJA N. A transform for multiscale image segmentation by integrated edge and region detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996, 18(12): 1211-1235.

[11] TABB M, AHUJA N. Multiscale image segmentation by integrated edge and region detection [J]. Image Processing, IEEE Transactions on, 1997, 6(5): 642-655.

[12] XU Han-qiu. A study on information extraction of water body with the modified normalized difference water index (MNDWI)[J]. Journal of Remote Sensing, 2005, 9(5): 589-595.

[13] 張敏, 楊武年, 黃瑾,等. 汶川地震區(qū)航空影像地質(zhì)災(zāi)害自動(dòng)識(shí)別技術(shù) [J]. 地理與地理信息科學(xué), 2009, 24(6): 42-45.

[14] 陳志強(qiáng),陳健飛.基于NDBI指數(shù)法的城鎮(zhèn)用地影像識(shí)別分析與制圖[J].地球信息科學(xué),2006,8(2):137-140.

[15] 馮露, 岳德鵬, 郭祥. 植被指數(shù)的應(yīng)用研究綜述[J]. 林業(yè)調(diào)查規(guī)劃, 2009, 34(2): 48-52.

[16] 張彤, 潘和平. 決策樹(shù)的形式算法及其在地理信息學(xué)中的應(yīng)用[J]. 測(cè)繪通報(bào), 2002, (7): 51-53.

Multi-source Remote Sensing Data Classification Method Based on Decision Tree

ZENG Te-ling, WU Cai-yan, ZENG Xiao-li

(SchoolofEnvironmentalEngineeringandResources,SouthwestUniversityofScienceandTechnology,Mianyang621010,Sichuan,China)

Since it is an important approach to get land cover information, remote sensing provides services to resource surveys, environmental monitoring, etc. , the study of remote sensing image classification is significant. This paper analyzes the factors affecting the characteristics of decision tree classification, and then the decision tree to classify the image was built based on these factors. Combined with medium resolution multi-source remote sensing data, taking Gongga Mountain for instance, the comparisons to the maximum likelihood method were performed for the validation. The result demonstrates that the classification accuracy of the test area (overall accuracy 85.71%, Kappa coefficient of 0.83) is much higher than the pixel-based maximum likelihood classification (overall accuracy of 63.56%, kappa coefficient of 0.58), showing the advantages and prospects of the object-based multi-source data decision tree classification .

Multi-source data; Decision tree; Gongga Mountain; Moderate Resolution; Remote sensing classification

2014-12-27

國(guó)家自然科學(xué)基金(41301587)。

曾特林(1989—),女,碩士研究生。E-mail:zengteling@126.com.通訊作者:吳彩燕(1976—),女,副教授,研究方向?yàn)榈刭|(zhì)災(zāi)害評(píng)價(jià)與防治、地理信息系統(tǒng)的應(yīng)用與開(kāi)發(fā)。E-mail:wucaiyan@swust.edu.cn

P237

A

1671-8755(2015)02-0041-05

猜你喜歡
決策樹(shù)植被精度
基于植被復(fù)綠技術(shù)的孔植試驗(yàn)及應(yīng)用
熱連軋機(jī)組粗軋機(jī)精度控制
與生命賽跑的“沙漠植被之王”——梭梭
超高精度計(jì)時(shí)器——原子鐘
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
分析誤差提精度
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
基于DSPIC33F微處理器的采集精度的提高
綠色植被在溯溪旅游中的應(yīng)用
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別