魏向祎 孔令然 肖磊
摘? 要:遙感圖像是獲取土地覆被信息的重要數(shù)據(jù)源,基于遙感數(shù)據(jù)的及時性、高效性、精準(zhǔn)性等優(yōu)點(diǎn)進(jìn)行土地覆被分類是當(dāng)前的研究熱點(diǎn)。文章采用決策樹分類技術(shù),將京津冀地區(qū)作為研究區(qū),結(jié)合京津冀地區(qū)土地覆被的分類特征,建立一套符合京津冀地區(qū)的圖像分類體系。以Landsat 8數(shù)據(jù)為原始數(shù)據(jù),基于不同類型的光譜特征構(gòu)建決策樹模型,獲取研究區(qū)地表覆被分類結(jié)果,所得結(jié)果直觀地反映了京津冀地區(qū)土地覆被的分布特征。
關(guān)鍵詞:決策樹;分類;遙感影像
中圖分類號:TP751? ? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)05-0041-04
Landsat Image Classification in Beijing-Tianjin-Hebei Region Based on Decision Tree
WEI Xiangyi1, KONG Lingran1, XIAO Lei2
(1.China Water Resources Beifang Investigation, Design and Research Co. Ltd., Tianjin? 300222, China;
2.Hydrology and Water Resources Management Center of Tianjin City, Tianjin? 300061, China)
Abstract: Remote sensing image is an important data source for obtaining land cover information. Land cover classification based on the advantages of timeliness, efficiency and accuracy of remote sensing data is a current research hotspot. In this paper, taking the Beijing-Tianjin-Hebei region as the study area, and combining the classification characteristics of the land cover in the Beijing-Tianjin-Hebei region, the decision tree classification technology is used to establish a set of image classification system that conforms to the Beijing-Tianjin-Hebei region. Taking Landsat8 data as the original data, a decision tree model is built according to different types of spectral characteristics to obtain the classification results of land cover in the study area. The obtained results directly reflect the distribution characteristics of land cover in Beijing-Tianjin-Hebei region.
Keywords: decision tree; classification; remote sensing image
0? 引? 言
高光譜遙感影像是一種高維圖像,它的數(shù)據(jù)反映了地物目標(biāo)的分布特征和光譜特性,且具有很大的數(shù)據(jù)信息量。遙感圖像中的地物由非單個像素的元素組成,相鄰像元間的相關(guān)性很高。對于高分辨率遙感數(shù)據(jù),利用傳統(tǒng)的分類方法,通過對地物的光譜提取,識別其分布特征和光譜特性來進(jìn)行分類,會造成大量的空間數(shù)據(jù)冗余?;跊Q策樹算法的分類方法可以有效地克服這種難題,建立有意義的分類知識庫,進(jìn)行較為穩(wěn)定且精確度較高的分類。
決策樹分類方法是監(jiān)督分類方法中一種普遍應(yīng)用的分類方法,通過構(gòu)建分類樹或分類規(guī)則來對遙感圖像進(jìn)行分類,突破了以往常用的方法。當(dāng)前,各種對遙感圖像的處理(如特征信息提取及土地覆被分類利用等)已經(jīng)開始利用決策樹分類方法。國外對運(yùn)用決策樹分類方法進(jìn)行遙感分類的研究表明,該分類方法的分類效果較好,在對土地特征信息提取、土地覆被分類、土地利用效果上都得到了顯著的提高。
1? 基于決策樹的遙感圖像分類
隨著遙感圖像技術(shù)的不斷發(fā)展,利用遙感圖像進(jìn)行分類逐漸應(yīng)用于各行業(yè)各領(lǐng)域。從人工翻譯分類,到基于光譜特性的分類,再到成為相關(guān)領(lǐng)域研究熱點(diǎn)的基于決策樹的計(jì)算機(jī)自動分類都與遙感圖像息息相關(guān)。
基于決策樹的遙感圖像分類通過對遙感圖像數(shù)據(jù)進(jìn)行處理,構(gòu)建決策規(guī)則并進(jìn)行圖像分類。利用決策樹進(jìn)行遙感分類時結(jié)合專家的經(jīng)驗(yàn),并加入了輔助因子,能夠?qū)崿F(xiàn)清晰的分類并提高分類精度。
決策樹分類算法具有規(guī)則簡單、處理靈活、精度較高等特點(diǎn),在高尺度的遙感圖像分類上有著很大的優(yōu)勢。我們可以通過提取目標(biāo)特征信息以及結(jié)合先驗(yàn)知識輔助決策來提高遙感圖像分類的分類效果,因此,在進(jìn)行土地分類時將決策樹算法與遙感影像系統(tǒng)相結(jié)合是提高穩(wěn)定性和分類精度的一個絕好方法,已成為相關(guān)領(lǐng)域的研究熱點(diǎn)。
2? 決策樹分類結(jié)果與分析
Landsat 8衛(wèi)星于2013年在美國空軍基地發(fā)射,它的軌道周期為99分鐘,重訪周期為16天。Landsat 8的OLI陸地成像儀具有9個波段,空間分辨率為30米,能夠很好地對地物目標(biāo)的特征進(jìn)行甄別。Landsat 8上的TIRS是目前最先進(jìn)、性能最好的衛(wèi)星載荷,其具有2個單獨(dú)的熱紅外波段。Landsat 8在空間分辨率和光譜方面都有很大的優(yōu)勢,包含11個波段。
2.1? 研究區(qū)概況
本文的研究區(qū)域?yàn)榫┙蚣降貐^(qū),總面積約為21.6萬平方千米。該地區(qū)的海拔高度由西北向東南逐漸降低,地形依次過渡為高原、山地、丘陵和平原,呈現(xiàn)出西北高東南低的地形特點(diǎn);京津冀地區(qū)地貌復(fù)雜多樣,主要以平原為主,其他地形有壩上高原、太原盆地、太行山丘陵等。緊傍渤海,多灘涂、濕地、海河流域。從氣候方面來看,該地區(qū)位處華北平原,屬溫帶季風(fēng)氣候,四季交替明顯,春季溫暖濕潤,夏季高溫多雨,秋季干爽清涼,冬季寒冷干燥。冀北高原草本植物分布較多,太行山燕山丘陵以灌木為主,冀西北盆地主要為森林,南部平原則多為耕地和人工植被。
2.2? 決策樹模型構(gòu)建
2.2.1? NDVI植被指數(shù)
NDVI是指歸一化植被指數(shù),也叫標(biāo)準(zhǔn)差異植被指數(shù)。為近紅外波段的反射值與紅光波段的反射值之差比上兩者之和,主要應(yīng)用于檢測植被的生長狀態(tài)、植被覆蓋度,消除部分輻射誤差等。其表達(dá)式為:
其中,nir表示近紅外波段的反射率值,red表示紅波段的反射率值。
NDVI能夠部分消除與大氣條件有關(guān)的輻射變化的影響。NDVI的值被限定在[-1,1]的范圍之間,數(shù)值過大或過小都會引起不必要的麻煩,其值小于0時,表示地面覆蓋為云、水、雪等,對可見光高反射;其值為0時,表示地面為巖石或裸土等;其值大于0時,表示有植被覆蓋,NDVI越大,表明植被覆蓋率也就越大。
2.2.2? 利用不同方式提取植被信息
本文以2018年京津冀地區(qū)遙感影像的太行山遙感影像作為訓(xùn)練樣本數(shù)據(jù),如圖1(a)所示,分別利用非決策樹的監(jiān)督分類法、非監(jiān)督分類法和決策樹分類方法對訓(xùn)練樣本植被的特征信息提取數(shù)據(jù)進(jìn)行了對比。實(shí)驗(yàn)過程中可以發(fā)現(xiàn):如圖1(b)所示,利用非決策樹監(jiān)督分類法對植被信息的提取首先要提取感興趣區(qū),非決策樹監(jiān)督分類只可識別訓(xùn)練樣本的定義類別,受人為因素影響較大,得出的結(jié)果內(nèi)容缺失較為嚴(yán)重,對分類結(jié)果和分類精度造成一定的影響。如圖1(c)所示,當(dāng)利用非監(jiān)督分類法對太行山地物目標(biāo)的信息進(jìn)行提取時,由于對特征信息的提取即是對整體的提取,對單一地物目標(biāo)的信息提取例如對植被信息的提取,需要進(jìn)行大量分析及處理,并且會出現(xiàn)“同物異譜”或“同譜異物”的問題,使得數(shù)據(jù)集與類別更難匹配,從而在一定程度上影響了分類結(jié)果和分類精度;而利用決策樹分類法提取影像數(shù)據(jù)的植被信息時,不需要提取感興趣區(qū),決策樹分類法也無須事先確定,其分類是非參數(shù)化密度正態(tài)分布的,提取數(shù)據(jù)的特征空間分布,只需構(gòu)建單一的決策樹結(jié)構(gòu)二叉樹規(guī)則,即可對地物目標(biāo)遙感圖像提取出相應(yīng)的數(shù)據(jù),如圖1(d)所示。
通過對這三種分類方法的比較發(fā)現(xiàn):決策樹分類法在提取地物信息方面更簡捷、高效,決策樹構(gòu)建的決策規(guī)則清晰明了,分類效果好,對于處理地物目標(biāo)的信息特征和分類具有更好的彈性,充分體現(xiàn)了決策樹在遙感圖像信息提取和分類方面的優(yōu)勢。
2.3? 構(gòu)建決策樹規(guī)則
首先按照NDVI定義根節(jié)點(diǎn),結(jié)合京津冀地區(qū)的實(shí)際情況,選取NDVI分為大于0.3、小于或等于0.3,這樣就完成了第一層節(jié)點(diǎn)的構(gòu)建。
根據(jù)NDVI值的不同劃分為植被和非植被兩個部分,構(gòu)建第一層決策樹節(jié)點(diǎn),進(jìn)一步分類則是根據(jù)坡度繼續(xù)劃分為緩坡植被和陡坡植被,構(gòu)建第二層決策樹節(jié)點(diǎn)。
采用同樣的方法,將所有規(guī)則輸入,最后選擇分類結(jié)果的名稱和顏色。
2.4? 結(jié)果與分析
通過決策樹分類得到本次實(shí)驗(yàn)京津冀地區(qū)的分類結(jié)果,如圖2所示,京津冀地區(qū)分類結(jié)果屬性表如表1所示,耕地類別共111 001 829個像元,林地類別共51 039 534個像元,草地類別共37 831 394個像元,水體類別共7 866 968個像元,建筑用地類別共30 739 428個像元,未利用地類別共1 857 409個像元。
通過計(jì)算可以得出各種類別用地的面積,如圖3所示,京津冀地區(qū)總面積216 302.816平方千米,耕地面積99 901.646 1平方千米,占京津冀地區(qū)總面積的46%;林地面積45 935.580 6平方千米,占京津冀地區(qū)總面積的21%;草地面積34 048.254 6平方千米,占京津冀地區(qū)總面積的16%;水體面積7 080.271 2平方千米,占京津冀地區(qū)總面積的3%;建筑用地面積27 665.395 2平方千米,占京津冀地區(qū)總面積的13%;未利用地面積1 671.668 1平方千米,占京津冀地區(qū)總面積的1%。
用戶精度評估表如表2所示。
從表2用戶精度評估表中各類型精度值可以看出,總體精度很高,達(dá)到了95.31%。耕地、林地、草地的分類效果不錯,但水體、建筑用地、未利用地的分類效果不是很理想。這三者有不同程度的誤差,存在錯分漏分。錯分即在分類圖上提取樣本圖時,被錯分為該類型(實(shí)際應(yīng)是其他類型);漏分即例如任取一個建筑用地樣本,圖像被錯誤地劃分為其他類型??傮w來說,決策樹的分類效果比較好。
3? 結(jié)? 論
本文基于決策樹為京津冀地區(qū)構(gòu)建一套以Landsat8遙感數(shù)據(jù)為源數(shù)據(jù)的分類體系。通過建立決策樹對京津冀地區(qū)的土地覆被進(jìn)行分類,并對分類結(jié)果進(jìn)行修正和精度評估,通過研究得出以下結(jié)論:
(1)與傳統(tǒng)自動分類方法相比,基于決策樹的遙感圖像土地覆被分類方法不需要事先假設(shè)數(shù)據(jù)集的正態(tài)分布,并且還可以使用GIS數(shù)據(jù)庫中多個源的信息。計(jì)算機(jī)自動分類的過程和自動化要求更高的精準(zhǔn)性和適應(yīng)性,不僅可以選擇最優(yōu)算法,還可以在分類過程中加入輔助因子數(shù)據(jù)來提高分類精度。在進(jìn)行遙感圖像分類時所加入輔助因子的分辨率必須與待分類影像的分辨率相近,否則無法提高分類效果和分類精度,甚至還會影響分類效果和分類精度。
(2)對遙感圖像進(jìn)行分類是解譯遙感圖像的重要方法,其技術(shù)也是如今的研究熱點(diǎn)。遙感圖像分類方法的選取與分類后的效果、精度息息相關(guān),遙感分類已成為遙感領(lǐng)域的一個重要研究方向。雖然傳統(tǒng)的監(jiān)督分類和非監(jiān)督分類方法在處理遙感分類問題上有自己獨(dú)特的優(yōu)點(diǎn),但隨著遙感技術(shù)的不斷發(fā)展,它們越來越無法滿足分類要求的高時效性、高精準(zhǔn)性。通過決策樹對遙感圖像進(jìn)行分類,要根據(jù)實(shí)際情況選擇合適的特征來構(gòu)建決策樹模型,這樣才能使分類效果達(dá)到最佳。因此,還需要對遙感分類和算法研究進(jìn)行更為深入的探索,改進(jìn)算法并將其應(yīng)用于遙感分類,改善分類效果,提高分類精度,實(shí)現(xiàn)更加高效、精準(zhǔn)的分類目標(biāo),滿足計(jì)算機(jī)自動化分類的要求。
(3)本文的決策樹分類體系是以京津冀地區(qū)的實(shí)際情況為前提而建立的,適用范圍限于京津冀研究區(qū)。
(4)本文研究發(fā)現(xiàn):通過決策樹算法對遙感圖像進(jìn)行分類的技術(shù)尚未成熟,其在遙感領(lǐng)域還處于探索研究的階段,很大程度上都是在理論的基礎(chǔ)上針對決策樹算法的自身特點(diǎn)進(jìn)行分類體系的探討,目前的研究成果不多。不同的特征變量組合有著不同的決策規(guī)則,相應(yīng)的分類結(jié)果精度也不相同,因此選擇最優(yōu)特征向量是關(guān)鍵。通過研究,本文認(rèn)為將決策樹算法與其他技術(shù)相結(jié)合,在進(jìn)行分類時加入輔助因子來提高分類精度和分類效率是現(xiàn)階段較為關(guān)鍵的一步。
參考文獻(xiàn):
[1] 張蓬濤,周雁,劉曉莊,等.人工神經(jīng)網(wǎng)絡(luò)在農(nóng)業(yè)自然資源研究中的應(yīng)用 [J].安徽農(nóng)業(yè)科學(xué),2007(27):8711-8713.
[2] 湯國安.遙感數(shù)字圖像處理 [M].北京:科學(xué)出版社,2004.
[3] 邸凱昌,李德仁,李德毅.基于空間數(shù)據(jù)發(fā)掘的遙感圖象分類方法研究 [J].武漢測繪科技大學(xué)學(xué)報,2000,25(1):42-48.
[4] 李爽,張二勛.基于決策樹的遙感影像分類方法研究 [J].地域研究與開發(fā),2003,22(1):17-21.
[5] 魏強(qiáng).基于MODIS和TM數(shù)據(jù)的京津冀地區(qū)土地覆被分類方法研究 [D].石家莊:河北師范大學(xué),2010.
[6] 賈濤,韓萌,王少峰,等.基于McDiarmid不等式的決策樹分類算法 [J].山西大學(xué)學(xué)報:自然科學(xué)版,2019,74(4):718-728.
作者簡介:魏向祎(1990—),女,漢族,河北石家莊人,工程師,碩士研究生,研究方向:攝影測量與遙感。
收稿日期:2022-10-17