路開宇,宋 音
(1.河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京211100)
面向?qū)ο蟮拇袒绷纸】档燃?jí)分類方法
路開宇1,宋 音1
(1.河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京211100)
以高分辨率IKONOS影像為數(shù)據(jù)源,將呈區(qū)域性分布的刺槐林劃分為孤島、軍馬場(chǎng)和黃河故道3個(gè)地區(qū);采用面向?qū)ο蟮姆椒?,結(jié)合隨機(jī)森林算法,篩選出基于J-M距離確定的最佳窗口和方向的8個(gè)紋理特征及2個(gè)植被指數(shù)特征中較為重要的特征。結(jié)果表明,孤島地區(qū)的最佳分割尺度為3、軍馬場(chǎng)地區(qū)的最佳分割尺度為12,尺度9和3在黃河故道地區(qū)不同健康類型中有不同的優(yōu)越性;最佳紋理窗口為13×13,最佳紋理方向?yàn)?5°。結(jié)合實(shí)地樣方數(shù)據(jù)進(jìn)行精度評(píng)價(jià)得到孤島地區(qū)的總精度為91.15%、軍馬場(chǎng)地區(qū)為87.57%、黃河故道地區(qū)為91.57%,與實(shí)地樣方數(shù)據(jù)具有較好的一致性。該方法可為森林退化監(jiān)測(cè)制圖、防護(hù)林恢復(fù)及區(qū)域生態(tài)建設(shè)提供科學(xué)思路。
面向?qū)ο螅淮袒绷?;紋理信息;隨機(jī)森林
近年來,隨著遙感技術(shù)的發(fā)展,圖像分辨率越來越高,傳統(tǒng)的基于單個(gè)像元獲得統(tǒng)計(jì)信息的方法已不太適應(yīng)高分辨率遙感影像分類的需求。刺槐林的健康分布狀況是連續(xù)性片段的狀況,單個(gè)像元尺度已不能完整表示一定刺槐區(qū)域整體的健康狀況;而面向?qū)ο蟮姆诸惙椒梢猿浞掷孟裨目臻g、紋理、上下文等特征信息[1],形成以區(qū)域?qū)ο筇卣鳛樘幚韱卧男路椒?,突破了傳統(tǒng)影像分析方法以單個(gè)像元為處理單元的局限。
本文以高分辨率的IKONOS影像為數(shù)據(jù)源,以黃河三角洲人工刺槐林為研究對(duì)象,采用面向?qū)ο蟮姆椒?,結(jié)合光譜信息、實(shí)地樣方數(shù)據(jù)所確定的紋理信息,通過隨機(jī)森林算法選出較為重要的特征,再根據(jù)尺度信息創(chuàng)建的分類規(guī)則集對(duì)刺槐林健康狀況進(jìn)行等級(jí)分類,以期為黃河三角洲生態(tài)過程作用模式及其生態(tài)效應(yīng)的研究提供理論參考。
1.1 研究區(qū)概況
黃河三角洲位于渤海南部黃河入??谘匕兜貐^(qū),山東省東北部,總面積為5 400 km2,主要處于東營市境內(nèi)(圖1),屬溫帶大陸性季風(fēng)氣候,年平均降水量為551.6 mm[2]。研究區(qū)原生植被為禾草和灌木類,無喬木。刺槐具有一定的抗旱、耐鹽堿能力,是世界主要速生闊葉樹種之一,適應(yīng)力強(qiáng),生長快,材質(zhì)好,用途廣,繁殖容易,具有防風(fēng)固沙、水土保持的功能,是黃河三角洲地區(qū)主要的造林樹種之一[3]。研究區(qū)人工刺槐林主要分布在孤島、軍馬場(chǎng)、黃河故道和大汶流自然保護(hù)區(qū)4個(gè)地區(qū)。除了刺槐林,還種植有白楊、白蠟、榆樹、臭椿等喬木,但面積較小。
1.2 研究資料
1.2.1 遙感數(shù)據(jù)
本文采用2013-06-09獲取的IKONOS影像,包括4個(gè)波段多光譜影像和1個(gè)波段全色影像(空間分辨率分別為4 m和1 m),覆蓋研究區(qū)面積為140 km2。圖像質(zhì)量很好,無云覆蓋,無噪聲,該時(shí)間為刺槐生長季,光譜特征較明顯,適合健康等級(jí)劃分。
1.2.2 實(shí)測(cè)數(shù)據(jù)
5月、6月為刺槐的生長期,野外調(diào)查采樣時(shí)間為2013-05-15~2013-05-26和2014-05-29~2014-06-09。為了能更好地適應(yīng)影像,實(shí)地調(diào)查選取有代表性且能到達(dá)的3種健康類型的樣地進(jìn)行數(shù)據(jù)采集。在樣地選取時(shí),盡量選擇周圍刺槐林冠生長狀況近似的地區(qū),共采集了75個(gè)樣地的林冠調(diào)查數(shù)據(jù),其中健康或輕度枯梢樣地30個(gè),中度枯梢樣地21個(gè),重度枯梢或死亡樣地24個(gè)。野外調(diào)查采用雙層采樣方案:首先選取刺槐林生長狀況均一的30 m×30 m的正方形樣地為第一層樣方;再選取樣方內(nèi)的4個(gè)角以及正中間的5 個(gè)10 m×10 m的正方形作為第二層次樣方,總計(jì)375個(gè)次樣方(75×5 = 375),并用差分GPS定位每個(gè)樣方四角處的坐標(biāo)。根據(jù)美國林業(yè)局林冠健康分類指南[4],在每個(gè)樣方內(nèi)選擇一顆平均木,測(cè)量并計(jì)算活冠高、郁閉度、冠幅、葉片透光度、樹冠死亡率等5個(gè)表征林冠生長狀況的活力指標(biāo),再取5個(gè)次樣方的平均值作為該樣方活力指標(biāo)統(tǒng)計(jì)值。研究區(qū)及樣地調(diào)查位置分布和結(jié)構(gòu)示意圖如圖1所示。
圖1 研究區(qū)范圍及樣地調(diào)查范圍
2.1 刺槐林范圍的提取
利用IKONOS四個(gè)多光譜波段與全色波段融合后的影像計(jì)算歸一化植被指數(shù)(NDVI)和土壤調(diào)節(jié)植被指數(shù)(SAVI);再根據(jù)野外調(diào)查結(jié)果,定義相應(yīng)的閾值提取刺槐林地分布范圍,并在ArcGIS中修改;最后作掩膜提取IKONOS影像內(nèi)刺槐林地的范圍。
2.2 影像分割
應(yīng)用面向?qū)ο蟮姆椒▽?duì)高分辨率遙感影像進(jìn)行分類時(shí),首先要進(jìn)行影像分割,其實(shí)質(zhì)是產(chǎn)生一個(gè)類群[5]。eCognition提供了一個(gè)多尺度分割的有效方法:通過識(shí)別像元相似性,使相鄰相似像元合并,產(chǎn)生影像單元[6]。
本文利用控制變量法依次設(shè)置分割過程中的尺度參數(shù)、形狀參數(shù)以及緊致度參數(shù)。首先,基于局部方差和自相關(guān)性的比較,通過迭代算法[7]的最佳尺度評(píng)估工具(ESP)[8]來確定最佳分割尺度;而考慮到研究區(qū)中刺槐林主要集中分布在3個(gè)區(qū)域,各區(qū)域刺槐林的樹齡等情況不同,使得分割時(shí)確定的分割尺度參數(shù)有可能不同,所以將研究區(qū)刺槐按區(qū)域分割成孤島、軍馬場(chǎng)、黃河故道3部分,分別確定各區(qū)域的最佳分割尺度參數(shù)。然后,在確定最佳尺度參數(shù)的基礎(chǔ)上,對(duì)研究區(qū)的形狀參數(shù)和緊致度參數(shù)進(jìn)行設(shè)置。
2.3 特征提取
2.3.1 植被指數(shù)
植被指數(shù)是反映植物生長狀況的指標(biāo),可定量說明植被的生長狀況[9]。目前應(yīng)用最廣泛的植被指數(shù)是NDVI,而刺槐林地表尤其是重度枯梢地表所裸出的土壤會(huì)對(duì)NDVI產(chǎn)生一定的影響,為了修正土壤背景對(duì)NDVI的影響,Huete A R[10]通過改善與葉面積指數(shù)的線性關(guān)系,提出了SAVI。將這兩個(gè)植被指數(shù)相結(jié)合,可以更好地反映刺槐林枯梢退化的趨勢(shì)。
2.3.2 紋理特征
遙感影像的紋理信息不僅反映了影像的灰度統(tǒng)計(jì)信息,而且反映了地物本身的結(jié)構(gòu)特征和地物的空間排列關(guān)系[11]。紋理變量的選擇往往會(huì)對(duì)分類結(jié)果產(chǎn)生較大影響,合理地選擇分類變量可提高分類的精度[12]。在本文從多光譜波段中提取的刺槐林健康狀況的訓(xùn)練樣本的每個(gè)統(tǒng)計(jì)量中,波段4是區(qū)分健康等級(jí)的最佳波段。因此,本文利用基于波段4提取的灰度共生矩陣來描述刺槐林健康狀態(tài)的空間分布特征。
而紋理又是多尺度現(xiàn)象,較小窗口的紋理計(jì)算值能反映單個(gè)樹冠的健康狀況,而大的計(jì)算窗口則反映了樣方林冠信息[13]。此外,考慮到研究區(qū)刺槐林為人工種植,具有一定的規(guī)整性,不同方向的紋理特征同樣能反映出不同的信息?;跅l件概率理論的可分離性指標(biāo)J-M距離能夠合適地表達(dá)地物特征類的可分性[14],從而選擇最佳的紋理窗口大小和方向。
結(jié)合實(shí)地樣方信息,本文分別計(jì)算了3個(gè)地區(qū)不同健康等級(jí)之間的J-M距離,從而確定了紋理特征的最佳窗口大小和方向。
2.3.3 特征選擇
紋理及光譜特征可以提高遙感影像的分類精度,然而所提取的特征信息越多,產(chǎn)生的冗余量也就越大,降低了計(jì)算的效率。因此,選擇較少且有效的特征既可提高分類精度,又可提高計(jì)算效率。由于隨機(jī)森林算法可對(duì)變量進(jìn)行重要性評(píng)價(jià),掌握各變量的影響度[15],因此本文利用隨機(jī)森林算法對(duì)變量重要程度進(jìn)行排序,選取較為重要的特征參與分類。
3.1 分割參數(shù)的確定
以1為最小尺度,1為步長來運(yùn)行ESP工具,得到孤島、軍馬場(chǎng)、黃河故道3個(gè)區(qū)域的最佳分割尺度的曲線(圖2),當(dāng)曲線中顯示的局部方差較小且局部方差變化率最大時(shí)得到的就是最佳分割尺度。圖2a中顯示孤島地區(qū)的最佳分割尺度為3;圖2b中顯示軍馬場(chǎng)地區(qū)的最佳分割尺度為12;圖2c中顯示黃河故道地區(qū)最佳分割尺度為9,但在尺度為3的位置局部方差的變化率也存在一個(gè)較大的增長。
圖2 最佳分割尺度曲線
在確定分割尺度的基礎(chǔ)上,將形狀參數(shù)和緊致度參數(shù)分別分級(jí)為0.1~0.9,每個(gè)值對(duì)應(yīng)的分割結(jié)果與參考圖層疊加計(jì)算誤分割指數(shù)。對(duì)應(yīng)分割獲得的影像對(duì)象斑塊結(jié)果的誤分割圖斑個(gè)數(shù)與面積如圖3所示,圖 3a為總體的形狀參數(shù)為0.4,圖3b為總體的緊致度參數(shù)最佳值為0.5。
圖3 緊致度參數(shù)誤分割情況
3.2 紋理特征變量的選擇
本文采取控制變量的方法,選定任意一紋理變量后(本文以mean為例),以任意一紋理方向(135°)分別計(jì)算其不同窗口大小下的J-M距離,結(jié)果如表1所示。當(dāng)窗口大小為13×13時(shí),紋理變量顯示出最大的可分離性。在此窗體大小的基礎(chǔ)上,再次分別計(jì)算該紋理變量4個(gè)方向的J-M距離,結(jié)果如表2所示。4個(gè)方向的可分離性相差不大,但當(dāng)紋理方向?yàn)?5°時(shí),顯示出相對(duì)較大的可分離性。這樣的結(jié)果與前期WANG H[16]等通過不同預(yù)測(cè)變量的組合進(jìn)行隨機(jī)森林分類,并對(duì)不同變量分類結(jié)果進(jìn)行精度評(píng)價(jià)所確定的窗口大小和方向完全一致。
3.3 特征變量重要性排序
利用前向選擇程序?qū)?4個(gè)波段(4個(gè)多光譜、8 個(gè)紋理和2個(gè)植被指數(shù))進(jìn)行重要性排序。
從圖4可以看出,紋理變量的重要性相對(duì)都較靠前,可見紋理信息特征在研究區(qū)刺槐林健康等級(jí)劃分中有相當(dāng)重要的作用;2個(gè)植被指數(shù)也是反映刺槐生長狀況的最好光譜指標(biāo)。
表1 紋理窗口大小選擇情況
表2 紋理方向的選擇情況
圖4 基于光譜和紋理信息的隨機(jī)森林分類特征重要性排序
3.4 刺槐林健康等級(jí)分類
利用前向選擇的分割參數(shù)、光譜信息以及紋理特征構(gòu)建分類規(guī)則集,分別對(duì)3個(gè)地區(qū)的刺槐林進(jìn)行健康等級(jí)分類。其中,對(duì)黃河故道進(jìn)行分類時(shí),分別采用3和9兩個(gè)分割尺度來分類,并選擇結(jié)果中感興趣區(qū)域進(jìn)行精度評(píng)價(jià)(表3)??梢钥闯?,尺度為3時(shí)的總體精度遠(yuǎn)遠(yuǎn)大于尺度為9時(shí)的總體精度。但在尺度為9時(shí),健康刺槐林的用戶精度可達(dá)到100%。因此,本文先以尺度9來分類,提取健康刺槐種類;再以尺度3對(duì)中度枯梢、重度枯梢或死亡林地繼續(xù)進(jìn)行分層分割。最后,選擇3個(gè)地區(qū)刺槐林健康等級(jí)分類結(jié)果中感興趣區(qū)域進(jìn)行精度評(píng)價(jià)(表4),并將分類完成后的3個(gè)區(qū)域合并,得到黃河三角洲刺槐林健康等級(jí)的分類圖 (圖5)。
表3 黃河故道地區(qū)兩種不同尺度精度評(píng)價(jià)表
表4 3個(gè)地區(qū)精度評(píng)價(jià)匯總表
圖5 黃河三角洲刺槐健康分類圖
從圖5可知不同健康等級(jí)刺槐林的分布狀況,孤島地區(qū)總體健康,但其北部沿神仙溝一帶及西南部枯梢情況嚴(yán)重,出現(xiàn)死亡情況;黃河故道地區(qū)刺槐林分布破碎,呈條帶狀,總體枯梢程度相對(duì)嚴(yán)重,只有南部及東北部少數(shù)地區(qū)健康;軍馬場(chǎng)地區(qū)中南部較為健康,北部枯梢嚴(yán)重,幾乎全部死亡。
從表4中可以看出,采用面向?qū)ο蟮姆椒ㄟM(jìn)行分類,以特征區(qū)域?yàn)檠芯繉?duì)象,基本突破了基于像元分類方法不能充分利用高分辨率影像空間信息的局限,較前人的研究結(jié)果,明顯提高了分類精度。但軍馬場(chǎng)地區(qū)的分類精度還是相對(duì)較低,這是由于軍馬場(chǎng)地區(qū)刺槐林分布相對(duì)破碎,而尺度分割時(shí)也未曾出現(xiàn)合理的多尺度來進(jìn)行分層分割所造成的。
本文利用IKONOS影像,采用面向?qū)ο蟮姆椒▽?duì)黃河三角洲刺槐林健康等級(jí)進(jìn)行了分類,分類結(jié)果與實(shí)地樣方數(shù)據(jù)具有較好的一致性,充分說明了在監(jiān)測(cè)森林枯梢方面,面向?qū)ο蟮姆椒軌蚋行У赝诰蚋叻直媛视跋裥畔?。而本次研究主要選擇光譜和紋理特征來對(duì)刺槐林進(jìn)行分類,對(duì)不同健康程度刺槐林之間的空間關(guān)系特征研究較少,這也造成了在刺槐林分布較為破碎地區(qū)的分類精度較低的情況。因此,今后將進(jìn)一步挖掘空間關(guān)系特征的潛力,深化規(guī)則集的建立,以獲得精度更高的分類結(jié)果。
[1] 陳旭,徐佐榮,余世孝.基于對(duì)象的QuickBird遙感圖像多層次森林分類[J].遙感技術(shù)與應(yīng)用,2009,24(1):22-26
[2] 張建鋒,邢尚軍,郗金標(biāo),等.黃河三角洲可持續(xù)發(fā)展面臨的環(huán)境問題與林業(yè)對(duì)策[J].東北林業(yè)大學(xué)學(xué)報(bào),2002,30(6):115-119 [3] 梁玉堂,龍莊如.刺槐栽培理論與技術(shù)[M].北京:中國林業(yè)出版社,2010
[4] Schomaker M E. Crown Condition Classification: a Guide to Data Collection and Analysis[R].USDA Forest Service, Southern Research Station,USA,2007
[5] 陳云浩,馮通,史培軍,等.基于面向?qū)ο蠛鸵?guī)則的遙感影像分類研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2006,31(4):316-320
[6] 喬程,駱劍承,吳泉源,等.面向?qū)ο蟮母叻直媛视跋癯鞘薪ㄖ锾崛J].地理與地理信息科學(xué),2008,24(5):36-39
[7] Drǎgu? L, Tiede D, Levick S R. ESP: a Tool to Estimate Scale Parameter for Multiresolution Image Segmentation of Remotely Sensed Data[J]. International Journal of Geographical Information Science,2010,24(6):859-871
[8] Dr?gu? L, Csillik O, Eisank C, et al. Automated Parameterization for Multi-scale Image Segmentation on Multiple Layers[J].ISPRS J Photogram Remote Sensing,2014,88(100):119-127
[9] 李開麗,蔣建軍,茅榮正,等.植被葉面積指數(shù)遙感監(jiān)測(cè)模型[J].生態(tài)學(xué)報(bào),2005,25(6):1 491-1 496
[10] Huete A R.A Soil-adjusted Vegetation Index(SAVI)[J].Remote Sensing of Environment,1988,25(3):295-309
[11] 張策,臧淑英,金竺,等.基于支持向量機(jī)的扎龍濕地遙感分類研究[J].濕地科學(xué),2011,9(3):263-269
[12] 祝曉坤.Dempster-Shafer證據(jù)推理融合模型在遙感分類中的應(yīng)用[D].武漢:武漢大學(xué),2005
[13] Dye M, Mutanga O, Ismail R. Combining Spectral and Textural Remote Sensing Variables Using Rrandom Forests: Predicting the Age of Pinus Patula Forests in KwaZulu-Natal, South Africa[J].Journal of Spatial Science,2012,57(2):193-211
[14] 馬娜,胡云鋒,莊大方,等.基于最佳波段指數(shù)和J-M距離可分性的高光譜數(shù)據(jù)最佳波段組合選取研究:以環(huán)境小衛(wèi)星高光譜數(shù)據(jù)在東莞市的應(yīng)用為例[J].遙感技術(shù)與應(yīng)用,2010,25(3):358-365
[15] Strobl C, Zeileis A, Strobl C, et al. Danger: High Power! -Exploring the Statistical Properties of a Test for Random Forest Variable Importance[J].Proceedings in Computational Statistics,2008,2:59-66
[16] WANG H, ZHAO Y, PU R, et al. Mapping Robinia Pseudoacacia Forest Health Conditions by Using Combined Spectral, Spatial, and Textural Information Extracted from IKONOS Imagery and Random Forest Classifier[J]. Remote Sensing,2015,7(7):9 020-9 044
P237
B
1672-4623(2017)01-0090-05
10.3969/j.issn.1672-4623.2017.01.028
路開宇,碩士研究生,主要研究方向?yàn)榈乩硇畔⑾到y(tǒng)開發(fā)與遙感圖像模式識(shí)別。
2015-11-12。
項(xiàng)目來源:國家自然科學(xué)基金面上基金資助項(xiàng)目(41471419)。