于文婧,劉曉娜,孫丹峰※,姜宛貝,曲 葳(.中國農(nóng)業(yè)大學(xué)資源與環(huán)境管理學(xué)院,北京 0093; .北京市農(nóng)林科學(xué)院農(nóng)業(yè)綜合發(fā)展研究所,北京 00097)
?
基于HJ-CCD數(shù)據(jù)和決策樹法的干旱半干旱灌區(qū)土地利用分類
于文婧1,劉曉娜2,孫丹峰1※,姜宛貝1,曲葳1
(1.中國農(nóng)業(yè)大學(xué)資源與環(huán)境管理學(xué)院,北京 100193;2.北京市農(nóng)林科學(xué)院農(nóng)業(yè)綜合發(fā)展研究所,北京 100097)
摘要:為了實(shí)現(xiàn)干旱半干旱灌區(qū)地表信息低成本、高效率的動態(tài)監(jiān)測,利用HJ-CCD數(shù)據(jù)的多時(shí)相和多光譜信息,探討了平羅縣土地利用遙感分類方法。首先建立研究區(qū)內(nèi)典型地物的NDVI時(shí)間序列曲線,提取反映該區(qū)物候模式的時(shí)序特征參數(shù);然后對土壤信息豐富的3月份多光譜影像進(jìn)行主成分變換,選取第1主成分(PC1)作為光譜特征參數(shù),最后基于分類回歸樹(classification and regression tree,CART)算法進(jìn)行決策樹監(jiān)督分類??傮w分類精度達(dá)到92.26%,Kappa系數(shù)為0.91,比最大似然法分類結(jié)果精度提高了2.58%。研究表明:構(gòu)建的NDVI時(shí)間序列曲線對研究區(qū)內(nèi)的地類具有較強(qiáng)的代表性,提取的時(shí)間維和光譜維的分類參數(shù)對各地類均有很好地區(qū)分性,CART決策樹算法分類結(jié)果清晰準(zhǔn)確且精度較高。該方法為HJ小衛(wèi)星在干旱半干旱區(qū)等區(qū)域的深入應(yīng)用提供科學(xué)依據(jù)和實(shí)證基礎(chǔ)。
關(guān)鍵詞:土地利用;決策樹;分類;HJ-CCD;歸一化植被指數(shù)(NDVI);時(shí)間序列;干旱半干旱灌區(qū)
于文婧,劉曉娜,孫丹峰,姜宛貝,曲葳. 基于HJ-CCD數(shù)據(jù)和決策樹法的干旱半干旱灌區(qū)土地利用分類[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(2):212-219.doi:10.11975/j.issn.1002-6819.2016.02.031http://www.tcsae.org
Yu Wenjing, Liu Xiaona, Sun Danfeng, Jiang Wanbei, Qu Wei. Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(2): 212-219. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2016.02.031 http://www.tcsae.org
Email:yuwenjing1215@163.com
土地利用/覆被信息是研究全球及區(qū)域變化的前提和基礎(chǔ),遙感技術(shù)具有宏觀、時(shí)效、綜合、連續(xù)等特點(diǎn),成為獲取土地信息變化的重要手段。多數(shù)研究利用MODIS的植被指數(shù)時(shí)間序列和光譜信息進(jìn)行大范圍的土地利用分類[1-7],但是MODIS數(shù)據(jù)的空間分辨率較低,增加了選取樣本工作的復(fù)雜程度[8],大量混合像元的存在也限制了其在區(qū)域和高分辨尺度上的應(yīng)用[9]。TM和SPOT等中高分辨率數(shù)據(jù)受到重訪周期和經(jīng)濟(jì)成本等條件的限制,難以構(gòu)建完整的時(shí)間序列植被指數(shù)曲線[10],因此以中高分辨率數(shù)據(jù)輔助MODIS數(shù)據(jù)進(jìn)行多源遙感影像的土地利用分類的方法得到了一定的發(fā)展[11-14]。我國的HJ1-A衛(wèi)星和HJ1-B衛(wèi)星均搭載了2臺組合幅寬達(dá)到720 km的寬覆蓋多光譜CCD相機(jī),其空間分辨率為30 m,4個(gè)譜段的設(shè)置與TM傳感器基本一致,A、B雙星同軌道面形成2 d重訪的高時(shí)間分辨率,可實(shí)現(xiàn)多時(shí)相、大范圍的區(qū)域遙感監(jiān)測,已成為國內(nèi)具有廣闊應(yīng)用前景的中高時(shí)空分辨率數(shù)據(jù)之一。國內(nèi)已有的基于環(huán)境小衛(wèi)星數(shù)據(jù)進(jìn)行土地利用分類與驗(yàn)證的相關(guān)研究中,大多數(shù)沒有利用HJ-CCD數(shù)據(jù)的時(shí)間分辨率優(yōu)勢,只將其空間和光譜特征與MODIS時(shí)間序列相結(jié)合,部分基于HJ-CCD多時(shí)相數(shù)據(jù)的研究也沒有綜合考慮植被生長周期而構(gòu)建合理的時(shí)間序列,并提取有意義的時(shí)間特征參數(shù)[15-20]。因此如何將環(huán)境小衛(wèi)星作為主要數(shù)據(jù)源,充分利用其時(shí)間、空間和光譜維信息,采用有效的方法進(jìn)行土地利用分類需要更深入的研究,尤其是在農(nóng)業(yè)景觀與自然景觀相對復(fù)雜多樣的干旱半干旱灌區(qū)。平羅縣是寧夏干旱區(qū)北部的農(nóng)業(yè)大縣和中國重要的商品糧基地縣,長期大量引用黃河水的農(nóng)業(yè)灌溉方式導(dǎo)致土壤次生鹽漬化較嚴(yán)重,該區(qū)的自然景觀和土地利用方式也較為復(fù)雜。
決策樹歸納法是數(shù)據(jù)挖掘中獲取分類規(guī)則的主要方法之一。分類回歸樹(classification and regression tree,CART)是一種結(jié)構(gòu)清晰、實(shí)現(xiàn)簡單、運(yùn)行快速和準(zhǔn)確性高的決策樹構(gòu)建算法。國內(nèi)外許多學(xué)者基于不同數(shù)據(jù)源的特征參數(shù)探討了CART決策樹算法在區(qū)域土地利用分類中的優(yōu)勢[21-25],證明其適合不同尺度、類型的分類特征融合。
本文以平羅縣為研究區(qū),獲取2010年3月-11月共12景HJ-CCD影像,通過構(gòu)建NDVI時(shí)間序列,提取反映該區(qū)自然植被和作物等物候特征的時(shí)序特征參數(shù),并結(jié)合多光譜信息,進(jìn)行CART決策樹分類研究。旨在為環(huán)境小衛(wèi)星數(shù)據(jù)今后在干旱半干旱區(qū)范圍內(nèi)的土地利用和生態(tài)環(huán)境質(zhì)量監(jiān)測等方面的深入應(yīng)用提供方法和實(shí)證基礎(chǔ)。
平羅縣是石嘴山市唯一的建制縣,地處銀北平原中心,東臨黃河,西靠賀蘭山,位于105°58′~106°58′E,38°36′~39°51′N,地勢西南高東北低,自西向東分別為賀蘭山區(qū)、洪積扇區(qū)、碟形洼地、沖積平原、靈鹽臺地和河灘區(qū)。西部山區(qū)陡峭,植被稀疏,海拔在1 250~3 400 m;中部溝渠縱橫,湖泊繁多;東部黃河以東有部分沖積平原和沙漠,土壤主要以灌淤土、鹽土、堿土為主。該區(qū)屬于溫帶大陸性干旱氣候,春旱多風(fēng),夏熱多雨,秋季短暫,冬季干冷,年平均溫度8.8℃,年平均降水量173 mm,降水主要集中在7-9月,年平均蒸發(fā)量1 755 mm,蒸發(fā)量最多的是5月份。該縣的糧食作物種植面積占農(nóng)作物面積的80%左右,主要糧食作物為小麥、水稻和玉米,主要的種植模式是一年一熟,也有小麥套玉米等具有一定特點(diǎn)的套種模式。圖1為平羅縣2009年1:100 000土地利用現(xiàn)狀圖(無山區(qū)和沙地),由寧夏農(nóng)林科學(xué)院農(nóng)業(yè)科技信息研究所提供。
圖1 平羅縣土地利用現(xiàn)狀圖Fig.1 Land use map of Pingluo county
2.1HJ小衛(wèi)星CCD數(shù)據(jù)及預(yù)處理
遙感影像為2010年HJ-1A/1B CCD 數(shù)據(jù)2級產(chǎn)品,通過中國資源衛(wèi)星應(yīng)用中心查詢并免費(fèi)下載。研究區(qū)范圍內(nèi)的植被生長期主要集中在3月-11月,因此本文主要下載該時(shí)期內(nèi)包含研究區(qū)的成像清晰、無云覆蓋的影像。由于植被的最短生長周期至少為3周,所以影像的時(shí)間間隔均為20 d左右,共12景(表1)。
表1 HJ-CCD影像數(shù)據(jù)列表Table 1 HJ-CCD images data list
本文將所有影像裁剪為包含研究區(qū)的矩形區(qū)域,以1:100 000地形圖為基準(zhǔn),采用二次多項(xiàng)式變換和雙線性內(nèi)插方法對5月10日的影像做幾何精校正,在ENVI/IDL軟件平臺中通過編寫程序?qū)ζ渌麜r(shí)相的影像進(jìn)行自動幾何配準(zhǔn),RMS控制在0.5個(gè)像元以內(nèi);通過元數(shù)據(jù)文件中的定標(biāo)系數(shù)和公式對數(shù)據(jù)進(jìn)行輻射定標(biāo),利用ENVI4.8軟件中的FLAASH大氣校正模塊進(jìn)行大氣校正,基本參數(shù)從原始影像頭文件中獲取,波譜響應(yīng)函數(shù)從資源衛(wèi)星應(yīng)用中心下載;最后利用DEM數(shù)據(jù)將西部山區(qū)掩膜。
2.2NDVI的計(jì)算與時(shí)間序列的生成
根據(jù)NDVI的計(jì)算公式
式中ρNIR為近紅外波段反射率;ρR為紅光波段反射率。在ENVI軟件中利用band math功能計(jì)算12景影像的NDVI值,并進(jìn)行波段疊加,得到研究區(qū)的NDVI時(shí)間序列數(shù)據(jù)集。
本文通過分析研究區(qū)典型地類的NDVI時(shí)間序列曲線,提取能夠反映地類間差異的物候參數(shù),結(jié)合包含豐富土壤信息的光譜參數(shù),利用基于CART的決策樹法進(jìn)行土地利用分類,最后比較并分析該方法與傳統(tǒng)的監(jiān)督分類最大似然法(MLC,maximum likelihood classification)的精度和優(yōu)勢,研究流程見圖2。
3.1分類體系和樣本的選取
本文根據(jù)研究區(qū)的自然環(huán)境和土地利用特點(diǎn),綜合考慮土地利用圖的分類體系和遙感數(shù)據(jù)的分辨率,對研究區(qū)建立一級和二級結(jié)合的分類體系,將土地利用類型分為水澆地、水田、沙地、鹽堿地、林地、建設(shè)用地和水域,水澆地根據(jù)作物熟制又分為一年一熟和一年兩熟(表2)。
圖2 技術(shù)流程圖Fig.2 Technology flow cart
表2 土地利用分類體系Table 2 Classification system of land use
樣本的選擇對分類信息的獲取和分類規(guī)則的建立起關(guān)鍵作用,為確保樣本的準(zhǔn)確性,綜合以下方法均勻選取一定數(shù)量的樣本:1)分析歷史土地利用圖,確定各地類樣本的分布及比例;2)目視解譯HJ-1/CCD影像和Google Earth高分辨率影像,進(jìn)一步確認(rèn)樣本類型和區(qū)域;3)檢驗(yàn)HJ小衛(wèi)星NDVI時(shí)間序列曲線,對目視解譯仍無法確認(rèn)的樣本,通過地表的動態(tài)變化信息判定其最終的類別。樣本的采集遵循代表性和完備性的基本原則,樣本單元個(gè)數(shù)約占像元總數(shù)的2%,最后將樣本隨機(jī)分為2部分,比例為3:1,分別作為訓(xùn)練樣本和驗(yàn)證樣本。
各地類的典型NDVI時(shí)間序列曲線(圖3)表明,水域的NDVI值在0附近有較大波動,其他地類各時(shí)相的NDVI值均大于0;耕地的NDVI曲線在生長季有明顯的1或2個(gè)波峰,林地的生長季較長且NDVI曲線波峰幅度較小,各植被的生長周期、NDVI最大值、最小值和變化速率各不相同;除水域外,未利用地和建設(shè)用地等非植被的NDVI曲線都較平穩(wěn),沙地的NDVI均值和變化最小,鹽堿地和建設(shè)用地的曲線較相似?;贘effries-Matusita距離和轉(zhuǎn)換分離度(transformed divergence)計(jì)算所選樣本的可分離度,一般認(rèn)為樣本之間的最小距離大于1.8表示其可分離性好。各地類樣本在NDVI時(shí)間序列上的J-M距離除建設(shè)用地和鹽堿地只有1.44,其他均大于1.8,說明利用NDVI時(shí)間序列可以很好地區(qū)分大部分地類,但是其對于建設(shè)用地和鹽堿地的區(qū)分還有一定的難度。
圖3 各地類樣本的NDVI時(shí)間序列曲線Fig.3 NDVI time series curve of each land type
3.2時(shí)間序列特征參數(shù)提取
1)NDVI最大值(NDVImax):植被與非植被的NDVI最大值差別較大,植被均大于0.5,非植被均小于0.3。
2)NDVI最小值(NDVImin):水域的NDVI最小值小于0,其他地類均大于0。
3)NDVI極差值(NDVIrange):非植被的NDVI曲線無明顯波峰,極差值相比植被較小,沙地幾乎無植被覆蓋,極差值最小。
4)7月29日(第7時(shí)相)與5月10日(第3時(shí)相)的NDVI差值(NDVI7-3):5月10日,研究區(qū)的水稻秧田為水體和稻種的混合,水稻大田為翻耕后的裸土,兩者的NDVI值都接近于0,水田的生長速率最快,NDVI值在7月29日達(dá)到峰值,利用該參數(shù)可以將水田與其他地類區(qū)分開。林地與一年一熟制水澆地的NDVI值在第3時(shí)相均達(dá)到0.2以上,且兩者增長速率較慢,該參數(shù)值較?。灰荒陜墒熘扑疂驳氐腘DVI曲線在第7時(shí)相為2個(gè)生長周期之間的波谷,該參數(shù)值為負(fù)值。
5)10月4日(第10時(shí)相)與7月29日(第7時(shí)相)的NDVI差值(NDVI10-7):一年兩熟制水澆地的NDVI值在第7~第10時(shí)相從波谷到達(dá)第2個(gè)峰值,該參數(shù)值為正;其他作物在該時(shí)段處于成熟期至收獲期,NDVI曲線呈將下降趨勢,該參數(shù)值為負(fù);林地一直處于生長旺盛期,NDVI值變化不大,該參數(shù)值接近于0。
6)10月4日~11月8日(第10~12時(shí)相)的NDVI均值(NDVI10~12mean):林地由于生長周期長,NDVI曲線下降緩慢,該參數(shù)值最大;一年兩熟制水澆地在該時(shí)期處于第2個(gè)生長周期,與收獲期已結(jié)束的其他作物相比,該參數(shù)值較大。
3.3多光譜特征參數(shù)提取
NDVI主要反映地是植被信息,對非植被和低植被覆蓋區(qū)的區(qū)分性不強(qiáng),雖然建設(shè)用地和鹽堿地的NDVI特征參數(shù)都很相似,它們的土壤信息卻有很大差異,如鹽堿地在可見光近紅外波段的光譜反射率比建設(shè)用地高。在3月份,研究區(qū)地表幾乎無植被覆蓋,且正值返鹽高峰期,土壤信息較豐富,所以對3月份的多光譜影像進(jìn)行主成分變換,實(shí)現(xiàn)數(shù)據(jù)壓縮和信息增強(qiáng),變換后第1主成分PC1的貢獻(xiàn)率達(dá)到95.07%,說明其包含了絕大部分的地表信息。計(jì)算NDVI時(shí)間序列和PC1波段組合后各類樣本的J-M距離,建設(shè)用地和鹽堿地的可分離度達(dá)到1.73,其他地類之間的分離度也有不同程度的提高,說明多光譜特征參數(shù)PC1對地類的區(qū)分有重要作用,所以將其作為一個(gè)波段參與分類。
3.4CART決策樹分類
CART是由Breiman于1984年提出的一種決策樹算法,此后又得到了不斷地改進(jìn)。該算法的基本原理是通過對由測試變量和目標(biāo)變量構(gòu)成的訓(xùn)練數(shù)據(jù)集的循環(huán)二分形成二叉樹形式的決策樹結(jié)構(gòu)。CART決策樹在生長過程中,采用經(jīng)濟(jì)學(xué)中的基尼(Gini)系數(shù)作為選擇最佳測試變量和分割閾值的準(zhǔn)則,并采用交叉驗(yàn)證的方法進(jìn)行樹的修剪,最終生成一棵兼顧復(fù)雜度和錯(cuò)誤率的最優(yōu)二叉樹[26-27]?;嵯禂?shù)的數(shù)學(xué)定義如下
式中p(j/h)為從訓(xùn)練樣本集中隨機(jī)抽取一個(gè)樣本,當(dāng)某一測試變量值為h時(shí)屬于第j類的概率;nj(h)為訓(xùn)練樣本中該測試變量值為h時(shí)屬于第j類的樣本個(gè)數(shù);j為類別個(gè)數(shù)。本文以訓(xùn)練樣本作為目標(biāo)變量,用時(shí)序參數(shù)和PC1作為測試變量進(jìn)行學(xué)習(xí),得到的決策樹共102個(gè)葉節(jié)點(diǎn),該決策樹可以表示為“If-Then”形式的產(chǎn)生式規(guī)則(表3)。
表3 CART決策樹分類規(guī)則Table 3 CART decision tree classification rules
4.1分類結(jié)果
最終的分類結(jié)果如圖4所示(無山區(qū))。研究區(qū)內(nèi)的主要耕地類型為一年一熟制水澆地,集中分布在北部和中部;一年兩熟制水澆地?cái)?shù)量較少,主要分散在研究區(qū)北部和南部;建設(shè)用地主要為農(nóng)村居民點(diǎn)和西北部的城區(qū)、工礦用地;水域以黃河、湖泊和養(yǎng)殖水面為主;鹽堿地和沙地主要分布在研究區(qū)東部、北部以及水域周圍;水田主要分布在研究區(qū)西部和南部,黃河沿岸的部分水田對應(yīng)土地利用圖中的不穩(wěn)定耕地和鹽堿地,說明該區(qū)域的耕地土壤鹽漬化程度較高;林地主要分布在黃河西側(cè),與土地利用圖中的鹽堿地相對應(yīng),說明平羅縣為治理鹽堿地已開展了植樹造林的生態(tài)措施。從整體上看,分類結(jié)果圖與土地利用圖中相應(yīng)地類的分布區(qū)域和范圍基本一致,說明利用該方法對研究區(qū)進(jìn)行土地利用分類效果較好。
圖4 平羅縣土地利用分類圖Fig.4 Land use classification map of Pingluo county
4.2分類精度檢驗(yàn)
利用驗(yàn)證樣本建立混淆矩陣,對分類結(jié)果進(jìn)行精度驗(yàn)證(表4),總體分類精度達(dá)到92.26%,Kappa系數(shù)為0.91,水田的分類精度最高,達(dá)到98.23%,沙地、一年一熟制水澆地和水體的分類精度均在90%以上,一年兩熟制水澆地、林地、鹽堿地和建設(shè)用地的精度均大于80%。
混淆矩陣表明,林地被錯(cuò)分為耕地的情況比較明顯,這是由于林地主要種植在黃河沿岸土壤鹽漬化程度嚴(yán)重的區(qū)域,多數(shù)為灌木林和疏林地,受土壤、氣候等自然條件及種植密度的影響,生長季后期NDVI值較小,易與收割后的耕地相混淆;鹽堿地與建設(shè)用地的混分現(xiàn)象也較嚴(yán)重,由于兩者的NDVI時(shí)間序列曲線相似,且鹽堿地多分布在城市和工礦用地的附近,部分與農(nóng)村居民點(diǎn)相互交錯(cuò),形成大量混合像元,導(dǎo)致兩者之間容易被錯(cuò)分。部分耕地由于土壤質(zhì)量和灌溉條件等原因,也存在與其他地類的混分現(xiàn)象。
土地利用類型Land use types林地Forest land水田Paddy沙地Sand鹽堿地Saline-alkali soil水域Water一年兩熟制水澆地Double crops irrigated land建設(shè)用地Construction land一年一熟制水澆地One crop irrigated land樣本Samples精度Accuracy/%林地 609 0 0 3 0 16 4 77 709 85.90水田 0 3500 0 0 0 0 2 61 3563 98.23沙地 0 0 1491 49 0 0 0 0 1540 96.82鹽堿地 0 0 53 1376 0 0 232 11 1672 82.30水體 0 0 0 91 1390 0 0 0 1481 93.86一年兩熟制水澆地 10 0 0 0 0 383 15 32 440 87.05建設(shè)用地 0 0 0 237 1 0 1011 4 1253 80.69一年一熟制水澆地 3 72 0 42 0 23 79 3552 3771 94.19
4.3與其他方法的比較
相比僅利用NDVI時(shí)間序列參數(shù),加入PC1波段后的分類精度有顯著提高,總體分類精度提高6.05%,建設(shè)用地和鹽堿地的精度分別提高26.34%和12.14%。CART方法相比最大似然法(MLC),總體分類精度提高2.58%(表5)。最大似然法分類結(jié)果中的建設(shè)用地和水域均有一定程度的“擴(kuò)張”現(xiàn)象,CART方法的分類結(jié)果比最大似然法更精確,有效改善了最大似然法中的錯(cuò)分現(xiàn)象,兩種方法的局部對比如圖5。
表5 不同波段/方法分類精度比較Table 5 Classification accuracy comparison of different bands/method %
圖5 CART決策樹法與最大似然法分類結(jié)果局部對比Fig.5 Local contrast of CART and MLC classification results
本研究綜合利用HJ-CCD數(shù)據(jù)多時(shí)相和多光譜信息,利用決策樹方法,實(shí)現(xiàn)了對平羅縣快速、有效、經(jīng)濟(jì)的區(qū)域土地利用遙感分類,主要結(jié)論如下:
1)構(gòu)建的NDVI時(shí)間序列能夠準(zhǔn)確表達(dá)地表動態(tài)信息,通過橫向、縱向分析不同類型NDVI時(shí)序曲線的差異,提取反映區(qū)域物候信息的時(shí)間維特征參數(shù),對研究區(qū)地類具有很強(qiáng)的分異性。
2)研究區(qū)土壤鹽漬化程度嚴(yán)重,地表組成復(fù)雜交錯(cuò),3月份多光譜影像的第1主成分PC1包含豐富的土壤信息,引入該光譜維特征參數(shù)可以改善僅利用NDVI對低植被覆蓋區(qū)分類的不足。
3)CART算法能夠快速、有效地獲取特征參數(shù)的分類規(guī)則,生成樹的結(jié)構(gòu)合理清晰。決策樹方法比最大似然法的分類精度更高,結(jié)果表達(dá)更準(zhǔn)確。
HJ-CCD數(shù)據(jù)的處理、典型地類NDVI時(shí)間序列曲線的建立、時(shí)間維及光譜維分類參數(shù)的提取與CART方法的利用,都具有良好的適用性及穩(wěn)定性,可為HJ小衛(wèi)星數(shù)據(jù)在區(qū)域地表信息提取中的應(yīng)用提供一定的基礎(chǔ)與參考。本研究還存在一些不足之處,有待在今后的工作中加以完善。首先,NDVI易受土壤背景噪聲干擾,而增強(qiáng)型植被指數(shù)EVI能同時(shí)校正土壤和大氣影響,對植被的分辨能力更強(qiáng),所以本研究將進(jìn)一步探討2種植被指數(shù)的綜合應(yīng)用。其次,研究區(qū)地類復(fù)雜交錯(cuò),易形成混合像元,對分類結(jié)果的精度造成一定影響,所以利用光譜混合模型對混合像元進(jìn)行分解將成為本文今后研究的重點(diǎn)。
[參考文獻(xiàn)]
[1] 劉勇洪,牛錚,徐永明,等. 基于MODIS數(shù)據(jù)設(shè)計(jì)的中國土地覆蓋分類系統(tǒng)與應(yīng)用研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2006,22(5):99-104. Liu Yonghong, Niu Zheng, Xu Yongming, et al. Design of land cover classification system for China and its application based on MODIS data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2006, 22(5): 99-104. (in Chinese with English abstract)
[2] Brian D Wardlow, Stephen L Egbert, Jude H Kastens. Analysis of time-series MODIS 250m vegetation index data for crop classification in the U.S. Central Great Plains[J]. Remote Sensing of Environment, 2007, 108(3): 290-310.
[3] 孫艷玲,楊小喚,王新生,等. 基于決策樹和MODIS數(shù)據(jù)的土地利用分類[J]. 資源科學(xué),2007,29(5):169-174. Sun Yanling, Yang Xiaohuan, Wang Xinsheng, et al. Landuse classification based on decision tree using MODIS data[J]. Resources Science, 2007, 29(5): 169-174. (in Chinese with English abstract)
[4] 馬俊飛,呂昌河,王茜. 基于MODIS NDVI時(shí)序數(shù)列的柴達(dá)木盆地土地覆蓋分類研究[J]. 干旱區(qū)地理,2008,31(3):442-448. Ma Junfei, Lü Changhe, Wang Qian. Land-cover classification of the Qaidam Basin based on MODIS NDVI time series data[J]. Arid Land Geography, 2008, 31(3): 442-448. (in Chinese with English abstract)
[5] 鄭長春,王秀珍,黃敬峰. 多時(shí)相MODIS影像的浙江省水稻種植面積信息提取方法研究[J]. 浙江大學(xué)學(xué)報(bào):農(nóng)業(yè)與生命科學(xué)版,2009,35(1):98-104. Zheng Changchun, Wang Xiuzhen, Huang Jingfeng. Mapping paddy rice planting area in Zhejiang Province using multi-temporal MODIS images[J]. Journal of Zhejiang University: Agric & Life Sci, 2009, 35(1): 98-104. (in Chinese with English abstract)
[6] 劉慶鳳,劉吉平,宋開山. 基于MODIS/NDVI時(shí)序數(shù)據(jù)的土地覆蓋分類[J]. 中國科學(xué)院研究生院學(xué)報(bào),2010,27(2):163-169. Liu Qingfeng, Liu Jiping, Song Kaishan. Land cover classification based on MODIS/NDVI times series data[J]. Journal of the Graduate School of the Chinese Academy of Sciences, 2010, 27(2): 163-169. (in Chinese with English abstract)
[7] 王志慧,李世明,劉良云,等. 基于MODIS NDVI時(shí)間序列的土地覆蓋分層分類方法研究[J]. 遙感技術(shù)與應(yīng)用,2013,28(5):910-919. Wang Zhihui, Li Shiming, Liu Liangyun, et al. Hierarchical land cover classification based on MODIS NDVI time-series[J]. Remote Sensing Technology and Application,2013, 28(5): 910-919. (in Chinese with English abstract)
[8] 陳思寧,趙艷霞,申雙和. 基于波譜分析技術(shù)的遙感作物分類方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(5):154-160. Chen Sining, Zhao Yanxia, Shen Shuanghe. Crop classification by remote sensing based on spectral analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 154-160. (in Chinese with English abstract)
[9] 劉睿,馮敏,孫九林,等. 基于環(huán)境減災(zāi)衛(wèi)星CCD數(shù)據(jù)與決策樹技術(shù)的植被分類研究[J]. 地理科學(xué),2012,32(12):1488-1495. Liu Rui, Feng Min, Sun Jiulin, et al. The vegetation classification based on HJ-CCD data and decision tree[J]. Scientia Geographica Sinica, 2012, 32(12): 1488-1495. (in Chinese with English abstract)
[10] 郝鵬宇,牛錚,王力,等. 基于歷史時(shí)序植被指數(shù)庫的多源數(shù)據(jù)作物面積自動提取方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 123-131. (in Chinese with English abstract)
[11] 王莉雯,牛錚,衛(wèi)亞星. 基于MODIS NDVI的新疆土地覆蓋類型劃分與潛在荒漠化區(qū)域探測[J]. 干旱區(qū)地理,2007,30(4):573-578. Wang Liwen, Niu Zheng, Wei Yaxing. Land cover type classification and potential desertification area detecting in Xinjiang based on MODIS NDVI imagery[J]. Arid Land Geography, 2007, 30(4): 573-578. (in Chinese with English abstract)
[12] 郝衛(wèi)平,梅旭榮,蔡學(xué)良,等. 基于多時(shí)相遙感影像的東北三省作物分布信息提取[J]. 農(nóng)業(yè)工程學(xué)報(bào),2011,27(1):201-207. Hao Weiping, Mei Xurong, Cai Xueliang, et al. Crop planting extraction based on multi-temporal remote sensing data in Northeast China [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(1): 201-207. (in Chinese with English abstract)
[13] 潘耀忠,李樂,張錦水,等. 基于典型物候特征的MODIS-EVI時(shí)間序列數(shù)據(jù)農(nóng)作物種植面積提取方法:小區(qū)域冬小麥實(shí)驗(yàn)研究[J]. 遙感學(xué)報(bào),2011,15(3):578-594. Pan Yaozhong, Li Le, Zhang Jinshui, et al. Crop area estimation based on MODIS-EVI time series according todistinct characteristics of key phenology phases: A case study of winter wheat area estimation in small-scale area. Journal of Remote Sensing, 2011, 15(3): 578-594. (in Chinese with English abstract)
[14] 許青云,楊貴軍,龍慧靈,等. 基于MODIS NDVI多年時(shí)序數(shù)據(jù)的農(nóng)作物種植識別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(11):134-144. Xu Qingyun, Yang Guijun, Long Huiling, et al. Crop information identification based on MODIS NDVI time-series data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014,30(11): 134-144. (in Chinese with English abstract)
[15] 鄔明權(quán),王長耀,牛錚. 利用多源時(shí)序遙感數(shù)據(jù)提取大范圍水稻種植面積[J]. 農(nóng)業(yè)工程學(xué)報(bào),2010,26(7):240-244. Wu Mingquan, Wang Changyao, Niu Zheng. Mapping paddy fields inlarge areas, based on time series multi-sensors data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(7): 240-244. (in Chinese with English abstract)
[16] 王琳,景元書,楊沈斌. 基于多時(shí)相遙感數(shù)據(jù)提取水稻種植面積的研究[J]. 中國農(nóng)業(yè)資源與區(qū)劃,2013,34(2):20-25. Wang Lin, Jing Yuanshu, Yang Shenbin. Study on extraction of rice cropping area using multi-temporal remote sensing data[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2013, 34(2): 20-25. (in Chinese with English abstract)
[17] 賈明明,宗明,張柏,等. 綜合環(huán)境衛(wèi)星與MODIS數(shù)據(jù)的面向?qū)ο笸恋馗采w分類方法[J]. 武漢大學(xué)學(xué)報(bào)?信息科學(xué)版,2014,39(3):305-310. Jia Mingming, Zong Ming, Zhang Bai, et al. Land cover classification of compositing HJ-1 and MODIS data base on object-based method[J]. Geomatics and Information Science of Wuhan University, 2014, 39(3): 305-310. (in Chinese with English abstract)
[18] 杜娟,楊國范,翟光耀. 基于環(huán)境小衛(wèi)星的半干旱區(qū)土地利用信息提取[J]. 國土資源科技管理,2014,31(4):61-67. Du Juan, Yang Guofan, Zhai Guangyao. Land use information extraction of semi-arid region based on HJ satellites[J]. Scientific and Technological Management of Land and Resources, 2014, 31(4): 61-67. (in Chinese with English abstract)
[19] 仲波,馬鵬,聶愛華,等. 基于時(shí)間序列HJ-1/CCD數(shù)據(jù)的土地覆蓋分類方法[J]. 中國科學(xué):地球科學(xué),2014,44(5):967-977. Zhong Bo, Ma Peng, Nie Aihua, et al. Land cover mapping using time series HJ-1/CCD data[J]. Science China: Earth Sciences, 2014, 44(5): 967-977. (in Chinese with English abstract)
[20] 李鑫川,徐新剛,王紀(jì)華,等. 基于時(shí)間序列環(huán)境衛(wèi)星影像的作物分類識別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(2):169-176. Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop classification recognition based on time-series images from HJ satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013,29(2): 169-176. (in Chinese with English abstract)
[21] 趙萍,傅云飛,鄭劉根,等. 基于分類回歸樹分析的遙感影像土地利用/覆被分類研究[J]. 遙感學(xué)報(bào),2005,9(6):708-716. Zhao Ping, Fu Yunfei, Zheng Liugen, et al. Cart-based land use /cover classification of remote sensing images[J]. Journal of Remote Sensing, 2005, 9(6): 708-716. (in Chinese with English abstract)
[22] 王大鵬,王周龍,李德一,等. 綜合非光譜信息的荒漠化土地CART分類[J]. 遙感學(xué)報(bào),2007,11(4):487-492. Wang Dapeng, Wang Zhoulong, Li Deyi, et al. The extraction of desertification information using CART under Knowledge Guide[J]. Journal of Remote Sensing, 2007,11(4): 487-492. (in Chinese with English abstract)
[23] 劉建光,李紅,孫丹峰,等. MODIS土地利用/覆被多時(shí)相多光譜決策樹分類[J]. 農(nóng)業(yè)工程學(xué)報(bào),2010,26(10):312-318. Liu Jianguang, Li Hong, Sun Danfeng, et al. Land use/cover decision tree classification fusing multi-temporal and multi-spectral of MODIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(10): 312-318. (in Chinese with English abstract)
[24] 齊樂,岳彩榮. 基于CART決策樹方法的遙感影像分類[J].林業(yè)調(diào)查規(guī)劃,2011,36(2):62-66. Qi Le, Yue Cairong. Remote sensing image classification based on CART decision tree method[J]. Forest Inventory and Planning, 2011, 36(2): 62-66. (in Chinese with English abstract)
[25] 左玉珊,王衛(wèi),郝彥莉,等. 基于MODIS影像的土地覆被分類研究:以京津冀地區(qū)為例[J]. 地理科學(xué)進(jìn)展,2014,33(11):1556-1565. Zuo Yushan, Wang Wei, Hao Yanli, et al. Land cover classification based on MODIS images: Taking the Beijing-Tianjin-Hebei region as an example[J]. Progress in Geography, 2014, 33(11): 1556-1565. (in Chinese with English abstract)
[26] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[M]. California: Wadsworth International Group, 1984: 1-358.
[27] Yohannes Y, Hoddinott J. Classification and Regression Trees: An Introduction[M]. Washington D C: International Food Policy Research Institute, 1999.
Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method
Yu Wenjing1, Liu Xiaona2, Sun Danfeng1※, Jiang Wanbei1, Qu Wei1
(1. College of Resources ɑnd Environmentɑl Sciences, Chinɑ Agriculturɑl University, Beijing 100193, Chinɑ;
2. Institute of System Comprehensive Development, Beijing Acɑdemy of Agriculture ɑnd Forest Sciences, Beijing 100097, Chinɑ)
Abstract:HJ satellites with the characteristics of high temporal resolution, high spatial resolution and large coverage, can provide the regional land use/cover classification with high accuracy. Pingluo county is in the arid and semi-arid area of northwest China, the climate and human irrigation activities caused complicated land use/cover type and serious soil salinization in the study area. In order to achieve the dynamic monitoring of land surface information with low cost and high precision, a regional land use supervised classification based on the classification and regression tree (CART) algorithm was developed and discussed in Pingluo county using the multi-temporal and multi-spectral information of HJ satellite CCD data. Firstly, high quality HJ-1 CCD data (the interval was about 20 d) were selected, and preprocessed including geometric correction, radiometric calibration and atmospheric correction. The normalized difference vegetation index (NDVI) were calculated and overlapped together. Secondly, the land use types including double crops irrigated land, one crop irrigated land,paddy, sand, saline-alkali soil, forest land, construction land and water were adopted for the two-level classification system,and the training samples were selected to obtain the typical NDVI time-series curve of each land type. Then, the characteristic parameters (including maximum, minimum, range, the difference between the value of the July 29 and the May 10 phases, the difference between the value of the October 10 and the July 29 phases, the mean value of the October 4 to the November 8 phases) which could reflect the phonological pattern in the area were extracted through the analysis of the NDVI time-series curves. Thirdly, the principle component transform of a multi-spectral image in March with ample soil information was performed for improving the separation between the construction land and saline-alkali land when the first principal component (PC1) was chosen for a parameter band for classification. Finally, a CART decision tree classification was implemented by combining the multi-temporal and multi-spectral parameter bands in the area. The decision tree had a total of 102 leaf nodes and could be expressed as “If…Then…” forms. The results showed that the overall precision of this classification method was 92.26%. The Kappa coefficient was 0.91. The accuracy of the paddy field was the highest which reached 98.23%. The accuracies of sand, one crop irrigated land and water were all greater than 90%. Double crops irrigated land, forest land, saline-alkali land, construction land were all greater than 80%. The participation of PC1 had made great contributions in improving the classification accuracy, especially for construction land and saline-alkali land, their accuracy increased 26.34% and 12.14%, respectively. The overall accuracy of CART decision tree classification was increased 2.58% than maximum likelihood classification. The classification accuracy of vegetation improved the most. The results of CART decision tree classification were more accurate and meticulous than maximum likelihood classification (MLC), and it effectively correct the obvious wrong classification results in MLC. The study indicated that the established typical NDVI time series curves based on HJ-CCD data had strong representativeness for each land use type in this region. The extracted time and spectrum dimensional parameters could distinguish between most of the land categories well. The results of CART decision tree classification were more clear and accurate than MLC. The proposed methods in this study had certain feasibility and applicability, and could provide empirical basis for the further application of HJ-1 CCD data in land use/cover and environment monitoring in different scale area, and also give informational and technical supports for the multilevel and comprehensive land resources and environment management by using HJ satellite as the main data source.
Keywords:land use; decision trees; classification; HJ-CCD; NDVI; time series; arid and semi-arid irrigated area
通信作者:※孫丹峰,男,山東海陽人,博士,教授,主要從事資源環(huán)境信息技術(shù)與土地利用/覆被研究。北京中國農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,100193。Email:sundf@cau.edu.cn
作者簡介:于文婧,女,內(nèi)蒙古呼倫貝爾人,博士生,主要從事土地利用/覆被遙感應(yīng)用研究。北京中國農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,100193。
基金項(xiàng)目:國家自然科學(xué)基金資助面上項(xiàng)目(40871103,41071146)
收稿日期:2015-06-02
修訂日期:2015-11-10
中圖分類號:TP79;S127
文獻(xiàn)標(biāo)志碼:A
文章編號:1002-6819(2016)-02-0212-08
doi:10.11975/j.issn.1002-6819.2016.02.031