国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于C4.5決策樹的多特征遙感分類方法

2016-04-11 01:43:16曹洪濤張拯寧李器宇
測繪工程 2016年3期
關(guān)鍵詞:植被指數(shù)決策樹土地利用

曹洪濤,張拯寧,李 明,李器宇,陳 浩

(天津航天中為數(shù)據(jù)系統(tǒng)科技有限公司,天津 300301)

?

基于C4.5決策樹的多特征遙感分類方法

曹洪濤,張拯寧,李明,李器宇,陳浩

(天津航天中為數(shù)據(jù)系統(tǒng)科技有限公司,天津 300301)

摘要:以錢塘江流域為研究區(qū)域,利用2010年ETM,MODIS和DEM多源數(shù)據(jù),進行土地利用分類研究。在分析土地類型的光譜特性和植被指數(shù)年度變化基礎(chǔ)上,運用光譜指數(shù)法和代數(shù)法從數(shù)據(jù)中提取各種土地覆被類型特征。利用WEKA軟件平臺下的C4.5決策樹算法構(gòu)建決策樹分類模型,對錢塘江流域土地覆被類型進行分類研究,取得較高的分類精度。

關(guān)鍵詞:多特征;C4.5決策樹;遙感影像;WEKA

遙感分類應(yīng)用中,傳統(tǒng)的監(jiān)督分類和非監(jiān)督分類方法都是根據(jù)地物光譜特性為基礎(chǔ)來區(qū)分不同類別。然而,由于存在“同譜異物、同物異譜”的現(xiàn)象,單純地利用光譜反射(輻射)特性或圖像亮度值來區(qū)分地物類別,尤其對于兩類光譜特性相似的地物,勢必會造成分類的混淆和錯誤。研究表明,結(jié)合多源數(shù)據(jù)以及輔助信息,增加判斷依據(jù),可大大提高分類精度和可靠性。

決策樹分類作為一種基于空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的監(jiān)督分類方法,通過對訓(xùn)練樣本進行歸納學(xué)習(xí),從無次序、無規(guī)則的事例樣本中推理出決策樹表示形式的分類規(guī)則,可以對未知事例進行預(yù)測分類。在遙感分類應(yīng)用中,決策樹能有效地處理大量數(shù)據(jù)和高維數(shù)據(jù),實現(xiàn)遙感影像數(shù)據(jù)和其他多種空間數(shù)據(jù)的結(jié)合,通過專家經(jīng)驗總結(jié)、簡單的數(shù)學(xué)統(tǒng)計和歸納方法等,獲得分類規(guī)則并進行遙感分類,有良好的穩(wěn)健性和魯棒性,分類結(jié)果可靠性高。本文嘗試?yán)媒?jīng)典的決策樹算法C4.5決策樹,對錢塘江流域地區(qū)進行土地利用類型分類研究。

1研究區(qū)及數(shù)據(jù)源

本文以錢塘江桐廬縣至杭州灣河段周邊市縣區(qū)域為研究區(qū),錢塘江是中國浙江省第一大河,古名“浙江”,發(fā)源于休寧縣海拔1 600 m的懷玉山主峰六股尖,流經(jīng)安徽、浙江兩省的14個縣市,注入杭州灣,河流全長688 km,流域面積5.56萬km2。錢塘江兩岸蘊藏著極其豐富的旅游資源,沿途地區(qū)經(jīng)濟比較發(fā)達,地形和植被覆蓋多樣化。

獲取2010年LANDSAT-7ETM光譜數(shù)據(jù),并考慮到植被指數(shù)可以反映不同的植被類型和土地覆被類型,以及研究區(qū)域地形多樣化,選用2010年MODIS增強型植被指數(shù)和DEM高程數(shù)據(jù)作為輔助數(shù)據(jù)。其中,選取采用ETM 30 m分辨率的Band1-Band5、Band7 6個波段,MODIS2010年1~12月的12個增強型植被指數(shù)EVI產(chǎn)品,1個ASTER的30 m分辨率的DEM數(shù)據(jù),共19個數(shù)據(jù)層。

2特征信息提取

在遙感數(shù)據(jù)中,不同的地類具有不同的光譜信息,不同的地類在一年中植被指數(shù)變化特征也有所不同,利用各種土地類型之間的光譜差異和植被指數(shù)變化差異,通過光譜指數(shù)法和代數(shù)法進行光譜波段組合運算和植被指數(shù)組合運算,提取土地利用類

型的特征信息。研究區(qū)土地利用類型劃分為城鎮(zhèn)及建設(shè)用地、農(nóng)田、水體、落葉林、常綠林、灌木叢和未利用地7種類型。各地類類型的ETM 波段DN值特征、年度EVI變化特征如圖1、圖2所示。

圖1 ETM波段DN值特征

圖2 年度EVI特征

2.1ETM光譜特征

1)有植被覆蓋地類T4的反射率大于T3反射率,選用歸一化植被指數(shù)為特征,能夠有效區(qū)分植被覆蓋類型和非植被覆蓋類型:NDVI=(T4-T3)/(T4+T3);

2)城鎮(zhèn)及建設(shè)用地和未利用地T5 波段比T4波段反射率有較大幅度的增高,以歸一化建筑指數(shù)NDBI為特征:NDBI=(T5-T4)/(T5+T4);

3)水體在T4、T5、T7波段較其他地類有非常低的反射率,T2波段反射率相對較高,選用T4+T5+T7和T2-T5為特征;

4)未利用地在T1、T2、T3、T5、T7反射率最高,以T1+T2+T3+T5+T7為特征。

2.2EVI年度變化特征

1)灌木叢和常綠林在5~7月份EVI值較高,以E5+E6+E7為特征;

2)水體EVI全年最低,城鎮(zhèn)及建設(shè)用地EVI次之,且兩者變化幅度很小,以E4+E6+E8+E10為特征;

3)常綠林EVI在冬季11、12、1月份較高,以E1+E11+E12為特征;

4)農(nóng)田EVI在5~7月大幅下降,7~8月回升,以E5-E7和E8-E7為特征。

按照選取的特征進行ETM波段、EVI的指數(shù)運算和代數(shù)運算得到組合特征值,由此,得到10組組合特征,并以ASTER的DEM數(shù)據(jù)作為高程特征,用于訓(xùn)練構(gòu)建C4.5決策樹模型。

3C4.5決策樹算法

C4.5算法是決策樹算法具代表性的一種,算法過程是從決策樹的根節(jié)點開始不斷的分治、遞歸、生長,直至得到最后的結(jié)果。根節(jié)點代表整個訓(xùn)練樣本集,通過在每個節(jié)點對某個屬性的測試驗證,將數(shù)據(jù)集分成更小的數(shù)據(jù)集,某一節(jié)點對應(yīng)的子樹對應(yīng)著原數(shù)據(jù)集中滿足某一屬性測試的部分?jǐn)?shù)據(jù)集。這個遞歸過程一直進行下去,直到某一節(jié)點對應(yīng)的子樹對應(yīng)的數(shù)據(jù)集都屬于同一個類為止。

C4.5算法采用信息增益(InforGain)作為分裂閾值的確定準(zhǔn)則,采用信息增益率(GainRatio)作為對分枝屬性的選擇準(zhǔn)則,選擇具有最大信息增益率的特征作為分裂特征。信息增益率表示由分枝產(chǎn)生的有用信息的比率,這個值越大,分枝包含的有用信息越多。設(shè)D為訓(xùn)練樣本集,類標(biāo)號有m個不同值,按照屬性A劃分D中的元素為V個不同類,計算過程如下:

1)對特征屬性的樣本取值進行排序;

2)以各個取值作為分割點將該特征下的樣本分成兩份,有N-1種分割形式(N為樣本個數(shù)),計算每個可能的分裂點的信息增益(InforGain)。

(1)

(2)

InforGain(A)=Info(D)-InfoA(D).

(3)

3)選擇信息增益(InforGain)最大的分裂點作為該屬性的最佳分裂點,即為分裂閾值;

4)計算最佳分裂點的信息增益率(GainRatio)作為特征屬性的GainRatio;

(4)

(5)

5)在所有特征屬性中,選擇Gain Ratio最大的特征屬性作為分裂屬性。

4構(gòu)建C4.5決策樹

研究中利用高分辨率影像提取2000個象元的土地類型典型樣本數(shù)據(jù),其中1000個訓(xùn)練樣本用于C4.5決策樹模型訓(xùn)練,另外1000個評價樣本用于分類結(jié)果的精度分析。本文基于Weka3.6.8數(shù)據(jù)挖掘系統(tǒng)為平臺,利用訓(xùn)練樣本對C4.5決策樹進行訓(xùn)練建模。利用C4.5決策樹算法對特征數(shù)據(jù)優(yōu)先性、分支閾值的自動計算,訓(xùn)練得到共有10個葉片、19個節(jié)點的C4.5決策樹,決策樹模型如圖3所示。

圖3 C4.5決策樹模型

5精度分析

利用訓(xùn)練構(gòu)建的C4.5決策樹模型對特征數(shù)據(jù)集每個象元進行所屬土地類型的判斷,得到實驗區(qū)土地利用類型分類結(jié)果。為驗證分類結(jié)果精度,利用精度分析樣本對C4.5決策樹分類結(jié)果(見圖4所示),進行精度評價和統(tǒng)計分析。各土地利用類型精度統(tǒng)計如表1所示。

在表1中,C4.5決策樹分類結(jié)果的各類精度相對穩(wěn)定、均衡,總體精度較為優(yōu)秀。對城鎮(zhèn)及建設(shè)用地、水體、農(nóng)田3類特征明顯的類別,分類精度達到90%以上;在植被類別中,落葉林、灌木叢以及未利用地易于混淆,通過多特征判斷分類精度良好,分別為0.78,0.77,0.80。

圖4 C4.5決策樹分類結(jié)果

精度分析項分類精度常綠林0.872城鎮(zhèn)及建設(shè)用地0.952農(nóng)田0.910落葉林0.784灌木叢0.776水體0.953未利用地0.802Kappa系數(shù)0.841總體精度86.84%

6結(jié)束語

基于C4.5決策樹的多特征遙感分類方法,結(jié)合多種遙感數(shù)據(jù),并提取土地類型的特征信息,實現(xiàn)研究區(qū)遙感影像的地物分類,分類精度達到86.8%。決策樹分類算法簡單易行,能從大量數(shù)據(jù)中自動挖掘出分類信息,便于結(jié)合多種土地利用類型特征構(gòu)建更精簡、更易理解的分類規(guī)則,能夠?qū)崿F(xiàn)對土地類型的較高精度的分類。

參考文獻:

[1]潘琛,林怡,陳映鷹.基于多特征的遙感影像決策樹分類[J].光電子:激光,2010(5):731-736.

[2]申文明,王文杰,羅海江,等.基于決策樹分類技術(shù)的遙感影像分類方法研究[J].遙感技術(shù)與應(yīng)用,2007(3):333-338.

[3]余晶,蔣平安,高敏華.基于決策樹的土地利用分類方法研究[J].新疆農(nóng)業(yè)科學(xué),2009(2):430-434.

[4]陳寶政,蔡德利,張有利,等.利用決策樹對TM遙感影像的分類研究[J].黑龍江八一農(nóng)墾大學(xué)學(xué)報,2010(1):79-82.

[5]陳秋曉,駱劍承,周成虎,等.基于多特征的遙感影像分類方法[J].遙感學(xué)報,2004(3):239-245.

[6]黃立賢,沈志學(xué).基于決策樹的Landsat多光譜影像分類方法[J].光電技術(shù)應(yīng)用,2011(3):49-52.

[7]潘琛,杜培軍,張海榮.決策樹分類法及其在遙感圖像處理中的應(yīng)用[J].測繪科學(xué),2008(1):208-211.

[8]齊樂,岳彩榮.基于CART決策樹方法的遙感影像分類[J].林業(yè)調(diào)查規(guī)劃,2011(2):62-66.

[9]秦臻,汪云甲,王行風(fēng),等.基于ENVI的決策樹方法在土地利用分類中的應(yīng)用[J].金屬礦山,2011(2):133-135.

[10] 孫艷玲,楊小喚,王新生,等.基于決策樹和MODIS數(shù)據(jù)的土地利用分類[J].資源科學(xué),2007(5):169-174.

[11] 高燕,周成虎,蘇奮振.基于OLI影像多參數(shù)設(shè)置的SVM分類研究[J].測繪工程,2014,23(6):1-5+10.

[12] 宋宏利.多源土地覆被遙感信息融合及數(shù)據(jù)重構(gòu)研究[D].北京:中國礦業(yè)大學(xué)(北京),2013.

[13] 高燕,周成虎,蘇奮振,等 基于多特征的人工海岸線提取方法[J].測繪工程,2014,23(5):1-5.

[14] 張樓香;阮仁宗.基于決策樹的洪澤湖濕地信息提取[J].測繪與空間地理信息,2015,38(2):87-91.

[責(zé)任編輯:張德福]

Remote sensing classification with multi-feature based on C4.5 decision tree method

CAO Hongtao,ZHANG Zhengning,LI Ming,LI Qiyu,CHEN Hao

(Tianjin Zhong Wei Aerospace Data System Technology Co.,Ltd,Tianjin 300301,China)

Abstract:Taking Qiantangjiang Basin as the study area,land-cover classification reseach is conducted in this paper using Landsat ETM,MODIS and DEM.Based on analysing spectral characteristics and annual changes in vegetation index,the land-cover classification of Qiantangjiang Basin has been done. Based on C4.5 decision tree method from software WEKA the land-cover type features from data are analyzed with the spectral index method and the algebraic method.Compared with the maximum likehood classification and Neural net classification,the results show that classification accuracy is better.

Key words:muti-feature;C4.5 decision tree classification;remote sensing images;WEKA

中圖分類號:TP751

文獻標(biāo)識碼:A

文章編號:1006-7949(2016)03-0073-04

作者簡介:曹洪濤(1988-),男,助理工程師.

收稿日期:2014-07-06;修回日期:2015-06-07

猜你喜歡
植被指數(shù)決策樹土地利用
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
AMSR_2微波植被指數(shù)在黃河流域的適用性對比與分析
決策樹和隨機森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
河南省冬小麥產(chǎn)量遙感監(jiān)測精度比較研究
土地利用生態(tài)系統(tǒng)服務(wù)研究進展及啟示
基于決策樹的出租車乘客出行目的識別
濱??h土地利用挖潛方向在哪里
主要植被指數(shù)在生態(tài)環(huán)評中的作用
西藏科技(2015年1期)2015-09-26 12:09:29
基于MODIS數(shù)據(jù)的植被指數(shù)與植被覆蓋度關(guān)系研究
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
格尔木市| 潞西市| 永福县| 沙田区| 葵青区| 屏东县| 康乐县| 澄城县| 茶陵县| 武山县| 井冈山市| 吴旗县| 旅游| 安平县| 普陀区| 花垣县| 象州县| 延安市| 温宿县| 综艺| 榆中县| 盐源县| 武汉市| 永修县| 滕州市| 清苑县| 静宁县| 泰州市| 葵青区| 台山市| 大城县| 郓城县| 汉阴县| 含山县| 南溪县| 高碑店市| 武城县| 麻城市| 连平县| 文昌市| 邵武市|