胡 博,鞠洪波,劉 華,郝 瀧,劉 海
(中國林業(yè)科學(xué)研究院資源信息研究所,北京 100091)
基于遙感影像的大區(qū)域植被類型樣本快速提取方法研究
——以寒溫帶針葉林區(qū)域為例*
胡 博,鞠洪波**,劉 華,郝 瀧,劉 海
(中國林業(yè)科學(xué)研究院資源信息研究所,北京 100091)
[目的]利用遙感影像的宏觀性,基于植被分類資料數(shù)據(jù),依據(jù)實驗區(qū)域遙感影像及衍生影像本身特點,實現(xiàn)大區(qū)域樣本快速提取。[方法]實驗參考1∶100萬植被圖、WESTDC中國土地覆蓋圖,結(jié)合實驗區(qū)域2001年MODIS時序NDVI影像的非監(jiān)督分類結(jié)果,利用矢、柵數(shù)據(jù)的空間特征,將實驗影像非監(jiān)督分類的類型信息關(guān)聯(lián)為隨機樣點屬性,依據(jù)該屬性中包含的非監(jiān)督分類類型數(shù)和各類型的樣點比例,對比類別間樣本可分離性指標、標準差變化,實現(xiàn)樣本純化。[結(jié)果]純化后的植被樣本與WESTDC中植被空間分布基本一致,主要植被類型空間分布精確程度為84.82%。將純化前后的樣本輸入最大似然分類器,總體分類精度提高了32.52%。[結(jié)論]該采樣方法適用于宏觀大區(qū)域植被樣本數(shù)據(jù)的快速提取。同時,節(jié)省了大區(qū)域植被類型調(diào)查消耗的人力物力資源和時間,提高了采樣效率。
遙感;大區(qū)域;快速采樣;樣點純化
通過遙感手段提取大區(qū)域(國家級、省級)植被覆蓋信息多采用具有高時間分辨率、寬視域、對存儲介質(zhì)要求相對較低、獲取方式更便捷的中低分辨率遙感影像,如AVHRR、MODIS等。計算機自動提取方法以基于像元的非監(jiān)督分類方法和監(jiān)督分類方法為主,非監(jiān)督分類方法得到的分類結(jié)果精度相對較低,并依賴專家經(jīng)驗進行分類后的類型組合,如GLC2000[1]、DISCover全球1 km土地覆蓋產(chǎn)品等[2];監(jiān)督分類方法得到的分類結(jié)果精度相對較高,其中選擇具有代表性的樣本數(shù)據(jù)比修改分類算法本身對分類結(jié)果的影響更為重要。
當(dāng)前,國內(nèi)外常采用以下方法對遙感影像監(jiān)督分類的植被類型樣本進行采集:(1)參考資料數(shù)據(jù),依據(jù)專家經(jīng)驗,借助更高分辨率遙感影像的解譯結(jié)果或者植被圖、土地利用圖等先驗數(shù)據(jù)。Darren Pouliot等[3]采用MODIS數(shù)據(jù)監(jiān)測加拿大森林變化,參考了水文、高程、公路網(wǎng)等數(shù)據(jù)的同時,部分區(qū)域借鑒Google數(shù)據(jù)和TM等更高分辨率數(shù)據(jù)采樣;Igor Klein等[4]采用MODIS數(shù)據(jù)對中亞土地覆蓋變化檢測,主要依據(jù)TM影像解譯結(jié)果進行采樣;張永紅等[5]用MODIS數(shù)據(jù)生成全國土地覆蓋產(chǎn)品,輔助土地利用圖、植被圖和局部區(qū)域的TM、SPOT更高分辨率影像數(shù)據(jù)獲得訓(xùn)練樣本;左玉珊等[6]基于MODIS影像的京津冀區(qū)域土地覆被分類,輔助京津冀區(qū)域土地利用資料、TM遙感影像、DEM高程數(shù)據(jù);范應(yīng)龍等[7]基于TM影像通過決策樹分類提取熱帶森林覆蓋變化信息,訓(xùn)練樣本采用柬埔寨國家林業(yè)局野外調(diào)查數(shù)據(jù);張雨等[8]基于MODIS數(shù)據(jù)實現(xiàn)的遼寧省土地利用分類,通過分析遼寧省林地更新數(shù)據(jù)和一類樣點數(shù)據(jù)選取訓(xùn)練樣本。(2)結(jié)合調(diào)查數(shù)據(jù)的樣本采集方法。劉華等[9]基于四個時相的TM影像,根據(jù)外業(yè)調(diào)查信息以及研究區(qū)植被圖、濕地分布圖獲取的樣點數(shù)據(jù),提取濕地信息;陳巧等[10]基于兩期TM影像,參照研究區(qū)森林資源分布圖、土地利用圖以及外業(yè)調(diào)查數(shù)據(jù)進行訓(xùn)練樣區(qū)選擇,通過監(jiān)督分類結(jié)果監(jiān)測天保區(qū)植被變化;Kun Jia等[11]采用MODIS時序數(shù)據(jù)與TM影像融合提取了中國北部5個縣的森林覆蓋信息,訓(xùn)練樣本的選取借助于樣地調(diào)查和Google數(shù)據(jù);競霞等[12]采用兩期TM影像對密云山區(qū)植被分類研究,采用野外調(diào)查獲得的植被類型信息選取訓(xùn)練樣本。
從國內(nèi)外研究可知,遙感影像監(jiān)督分類的樣本選取方式大多憑借專業(yè)經(jīng)驗、資料數(shù)據(jù)或結(jié)合調(diào)查數(shù)據(jù)等目視判讀采樣,有關(guān)大區(qū)域遙感快速采樣方法的類似研究比較少。本研究利用遙感影像的宏觀性,基于植被分類資料數(shù)據(jù),依據(jù)實驗區(qū)域遙感影像及衍生影像本身特點,實現(xiàn)了大區(qū)域樣本快速提取。本實驗的創(chuàng)新體現(xiàn)在將實驗區(qū)資料數(shù)據(jù)與遙感影像相結(jié)合,依據(jù)統(tǒng)計分析實現(xiàn)植被樣本的快速提取。降低遙感監(jiān)督分類采樣過程中的人為干預(yù),提高大區(qū)域采樣效率,增強樣本的客觀性。實驗結(jié)果可以為快速提取實驗區(qū)植被覆蓋信息,提供可靠的樣本數(shù)據(jù)。
1.1 實驗數(shù)據(jù)
本實驗采用2001年23期時序MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid(簡稱MODIS13Q1)數(shù)據(jù),每期間隔16天,屬于陸地專題產(chǎn)品,是MODIS的L3級科學(xué)數(shù)據(jù)集產(chǎn)品之一。MODIS13Q1產(chǎn)品原始文件包含多個數(shù)據(jù)層,實驗選取第一層歸一化植被指數(shù)(Normalized Difference Vegetation Index, 簡稱NDVI)數(shù)據(jù)文件[13]。
本實驗采用2001年1∶100萬中國植被圖矢量數(shù)據(jù),可提供實驗區(qū)植被分布信息;中國植被區(qū)劃矢量數(shù)據(jù)提供實驗區(qū)范圍;2000年中國土地覆蓋1km柵格數(shù)據(jù)[14-15](簡稱WESTDC),可提供實驗區(qū)非植被分布信息。其中,WESTDC數(shù)據(jù)來源于國家自然科學(xué)基金委員會“中國西部環(huán)境與生態(tài)科學(xué)數(shù)據(jù)中心”(http://westdc.westgis.ac.cn)),該數(shù)據(jù)借鑒IGBP分類系統(tǒng),在保持了中國土地利用數(shù)據(jù)的總體精度的同時,補充了中國植被圖中對植被類型及植被季相的信息,更新了中國濕地圖,增加了中國冰川圖,融合了MODIS 2001年土地覆蓋產(chǎn)品。
以上矢量、柵格數(shù)據(jù)均具有空間坐標信息,且經(jīng)過影像配準,精度限制在一個像元內(nèi)。
1.2 實驗區(qū)概況
本研究選取寒溫帶針葉林區(qū)域作為實驗區(qū),實驗區(qū)處于127°20′E以西, 49°20 ′N以北的大興安嶺北部及其支脈伊勒呼里山地,總面積約為211 600 km2。植被覆蓋率高,地帶性植被為興安落葉松林,有少量灌木植被,是我國重要的木材產(chǎn)地。由于該區(qū)域的寒溫帶氣候,形成永久凍土層,水分下滲困難,形成零星水體,地表積水使?jié)竦貜V泛發(fā)育,其中草本沼澤分布在海拔900 m以下地帶。該區(qū)域平坦谷地區(qū)域有農(nóng)業(yè)分布但農(nóng)業(yè)不發(fā)達。
首先,通過ARCGIS軟件在寒溫帶針葉林區(qū)域內(nèi)隨機布點,生成的樣點具有中國植被區(qū)劃文件的空間信息,每個樣點在實驗影像上體現(xiàn)為一個像素,代表實際地物250 m×250 m的樣地范圍。參考1∶100萬中國植被圖和中國土地覆蓋數(shù)據(jù),分別賦予植被類樣點的類型屬性,包括:喬木、草地、濕地、灌木、農(nóng)田;非植被類樣點的類型屬性,包括:建筑物和水體。并對各類樣本的初始可分離性進行計算。
然后,對實驗區(qū)2001年23期MODIS時序NDVI影像數(shù)據(jù)產(chǎn)品,依據(jù)不同植被類型的NDVI特征向量不同,采用非監(jiān)督分類迭代算法[15]得到時序NDVI數(shù)據(jù)波段的集群聚類信息。結(jié)合該非監(jiān)督分類結(jié)果,依據(jù)矢、柵數(shù)據(jù)的空間特征,將非監(jiān)督分類
的類型信息作為各類樣本中的樣點屬性進行關(guān)聯(lián),統(tǒng)計各類樣本包含的非監(jiān)督分類類型和樣點個數(shù)(j,NRi),并將對應(yīng)類型的樣點比例作為權(quán)重值(PRi)。權(quán)重越大則越能夠代表該樣本類型,權(quán)重越小則越可能是該類樣本中的非純樣點,按照權(quán)重大小降序排列樣點(Descend(PRi))并計算累積百分比(PRacc)。其中,j為樣點個數(shù)、R為植被類型、i為非監(jiān)督分類類型。
大區(qū)域植被樣本快速提取總體思路,如圖1所示:
圖1 大區(qū)域植被類型樣本快速提取方法流程Fig.1 Methodological framework of quick sampling in large area
將初始7類樣本對應(yīng)的非監(jiān)督分類的結(jié)果,依據(jù)每一類樣本中包含的非監(jiān)督分類類型及樣點個數(shù),繪制分布直方圖,如圖2所示:
圖2 各類樣本非監(jiān)督分類類型屬性特點直方圖Fig.2 Histogram of samplings with unsupervised feature
統(tǒng)計結(jié)果表明,研究區(qū)域內(nèi)植被以喬木、草地、濕地類為主,灌木、農(nóng)田較少。該區(qū)域建筑物在非監(jiān)督分類中特征明顯,與其他地物很好的區(qū)分。水體零星分布,樣點較少。本研究以植被類樣本純化提取為主,建筑物和水體為非植被類型樣本不予討論。
依據(jù)像元類型權(quán)重信息和空間信息剔除各類樣本中不合要求的樣點,進行樣本純化[16]。保留權(quán)重大的更有代表性的樣點,剔除掉權(quán)重比例小于2.0%的樣點,剩余的樣點累積百分比為70%±5%,在此樣點比例范圍內(nèi)再結(jié)合可分離性指標進行樣點的取舍。
對保留樣點的非監(jiān)督分類類型、權(quán)重、累積百分比進行統(tǒng)計,如表1所示:
最后,從空間信息上判斷,地類邊界過渡區(qū)域的像元往往都是混合的非純像元,因此剔除相鄰類型邊界1 000 m范圍內(nèi)過渡區(qū)域內(nèi)的樣點。
表1 純化后樣本中非監(jiān)督分類類型及保留樣點的 權(quán)重和累積百分比Table 1 Unsupervised types with weight factor and accumulative percent of purified points %
3.1 純化前后樣點可分離性比較
如表2所示,對于可分離性指標小于1.8的樣本,認為樣本中混有其他類型樣點,因此,刪除此類樣本中權(quán)重比例小的干擾樣點,再計算可分離性指標。反復(fù)操作以上過程,并比較分析可分離性指標,決定樣點取舍。最終得到具有代表性的植被類型樣本。
表2 純化前后植被類樣本可分離性指標對比Table 2 Separabilities of purified and unpurified samples
對比純化前后的結(jié)果可以看出純化后各類樣本的可分離性指標提高到1.9以上,可分離性良好。只有濕地和草地類型可分離性指標值為1.78,認為濕地區(qū)域覆蓋的植被和草地區(qū)域覆蓋的植被多為草本植物,受實驗中特征影像制約辨識度不高。
3.2 初始樣點與純化后樣點的平均值、標準差比較
對比2001年MODIS全年數(shù)據(jù)的第33天、第145天、第257天、第353天的影像,純化前后的各植被樣本的平均值和標準差,如表3所示。
通過對比4個時相影像的統(tǒng)計結(jié)果可知,純化前后平均值的變化無顯著規(guī)律,純化后的樣本標準差大多縮小。純化后的樣本數(shù)據(jù)的分布曲線變窄,重疊變小,可分性增大,更易于類型間的區(qū)分。
3.3 純化后的植被樣本結(jié)果分析
3.3.1 純化后的植被樣本精度分析 中國植被圖表明實驗區(qū)植被覆蓋以喬木、草地和濕地為主。植被覆蓋率為喬木67.40%、草地18.04%和濕地12.48%。灌木0.97%,農(nóng)田1.08%兩類植被在實驗區(qū)域較少分布。
為驗證純化后樣本的空間分布狀況,統(tǒng)計各植被樣本在中國土地覆蓋圖上分布的混淆矩陣,如表3、4所示。
表4中喬木、草地純化后樣本與中國土地覆蓋類型中相應(yīng)植被類型的空間分布基本一致,精確程度達到87.53%和90.46%。濕地與草地均以草本植被覆蓋為主,兩種植被類型在實驗影像上不易區(qū)分,因此樣本代表性相對較差。喬木、草地、濕地三者空間分布的總體精確程度為84.82%。
表3 純化前后樣本的平均值和標準差Table 3 Mean and Stdev. values of purified and unpurified samples
表4 高覆蓋率植被樣本與WESTDC中植被類匹配的混淆矩陣Table 4 Compared the distribution of high coverage vegetation samples with WESTDC by confusion matrix
表5 低覆蓋率植被樣本與WESTDC中植被類型 匹配的混淆矩陣Table 5 Compared the distribution of less coverage vegetation samples with WESTDC by confusion matrix
表5中農(nóng)田樣本與中國土地覆蓋類型中相應(yīng)植被類型的空間分布基本一致,精確程度達到90.32%,由于實驗區(qū)灌木分布極少,覆蓋率僅為0.97%,同時中國土地覆蓋圖與中國植被圖中灌木類空間分布不一致,導(dǎo)致灌木樣本以WESTDC為參考的空間分布狀況精確程度較低。但灌木樣本可分離性指標高于1.9,不影響與其他類型的區(qū)分,故認為灌木樣本基本不會影響到各類植被覆蓋信息的表達。
實驗樣本中的植被空間分布與中國土地覆蓋圖中植被的空間分布相似度超過80%,因此認為純化后的樣本在該區(qū)域具有代表性。
3.3.2 純化后的植被樣本分類結(jié)果分析 將純化前后的樣本,分別輸入最大似然分類器,得到實驗區(qū)域的分類結(jié)果,對比中國植被圖圖3(a)中的植被分布,如圖3所示。
驗證樣點在中國植被圖和中國土地覆蓋圖中植被類型相同的區(qū)域隨機選取。純化后樣本的最大似然分類結(jié)果圖3(c),總體精度為76.78%;相比未經(jīng)過純化的初始樣本最大似然分類結(jié)果圖3(b),總體精度44.26%,提高了32.52%。
a.Test area in vegetation atlas of China; b.Maximum likelihood classification result with initial samples; c.Maximum likelihood classification result with purified samples圖3 樣本純化前后分類結(jié)果與中國植被圖中植被分布的比較分析Fig.3 Comparisons of classification results with (a) (b) (c)
由于特征影像、分類器選擇會對分類精度造成影響,驗證數(shù)據(jù)本身也與真實地物存在一定的精度局限性等,以上因素都可能降低實驗影像最終分類結(jié)果的精度。因此,在三者相同的情況下,純化后的樣本分類結(jié)果精度較大提高,純化后樣本的分類結(jié)果與中國植被圖中植被分布的總體趨勢能夠達到基本一致,認為采樣方法是可行的。
(1)以遙感監(jiān)督分類方法快速精準的提取大區(qū)域植被覆蓋信息為研究背景,本研究結(jié)合專家經(jīng)驗和實驗數(shù)據(jù)同質(zhì)特征向量的聚類信息,采用統(tǒng)計分析的方法,實現(xiàn)了針對宏觀大區(qū)域遙感影像快速提取植被樣本的方法。
(2)實驗方法增強了樣本的可分離性、縮小了樣本標準差,經(jīng)驗證純化后樣本對實驗區(qū)域的植被覆蓋信息具有代表性,采樣方法可行。所得樣本具有實驗影像時效特征,用于遙感監(jiān)督分類可以縮短大區(qū)域植被變化監(jiān)測時間間隔。
(3)實驗節(jié)省了大區(qū)域植被類型調(diào)查耗費的人力物力資源和時間,避免了引入多源數(shù)據(jù)造成的數(shù)據(jù)冗余和誤差影響,提高了采樣效率。
[1] Chandra Giri, Zhiliang Zhu, Bradley Reed. A comparative analysis of the Global Land Cover 2000 and MODIS land cover data set s[J]. Remote Sensing of Environment,2005, 94: 123-132.
[2] M.C.Hansen, B.Reed. A comparison of the IGBP DISCover and University of Maryland 1 km global land cover products [J].Remote Sensing, 2000, 21(6&7):1365-1373.
[3] Darren Pouliot, Rasim Latifovic, Natalie Zabcic,etal.Development and assessement of a 250 m spatial resolution MODIS annual land cover time series(2000-2011) for the forest region of Canada derived from change-based updating [J]. Remote Sensing of Environment,2014,140:731-743.
[4] Igro Klein, Ursula Gessner, Claudia Kuenzer. Regional land cover mapping and change detection in Central Asia using MODIS time-series[J]. Applied Geography,2012,35:219-234.
[5] 張永紅,張繼賢,郭 建,等.全球地圖第一版中國土地覆蓋產(chǎn)品的生成[J]. 武漢大學(xué)學(xué)報:信息科學(xué)版,2009,34(8):914-925.
[6] 左玉珊,王 衛(wèi),郝彥莉,等.基于MODIS影像的土地覆被分類研究——以京津冀地區(qū)為例[J]. 地理科學(xué)進展,2014,33(11):1556-1565.
[7] 范應(yīng)龍,譚炳香.兩種熱帶森林覆蓋變化檢測方法比較研究[J]. 林業(yè)科學(xué)研究,2015,28(3):325-331.
[8] 張 雨,林 輝,臧 卓,等.基于MODIS數(shù)據(jù)的遼寧省土地利用分類[J]. 西南林業(yè)大學(xué)學(xué)報,2014,34(1):52-57.
[9] 劉 華,鞠洪波,鄒文濤,等.長江源典型區(qū)濕地對區(qū)域氣候變化的響應(yīng)[J]. 林業(yè)科學(xué)研究,2013,26(4):406-413.
[10] 陳 巧,陳永富,鞠洪波.基于3S技術(shù)的天保區(qū)植被變化監(jiān)測方法研究[J]. 林業(yè)科學(xué)研究,2013,26(6):736-743.
[11] Kun Jia, Shunlin Liang, Lei Zhang,etal. Forest cover classification using Landsat ETM+ data and time series MODIS NDVI data[J]. International Journal of Applied Earth Observation and Geoinformation, 2014,33:32-38.
[12] 競 霞,王錦地,王紀華,等.基于分區(qū)和多時相遙感數(shù)據(jù)的山區(qū)植被分類研究[J]. 遙感技術(shù)與應(yīng)用,2008,23(4):394-398.
[13] 廖 靖,覃先林,周汝良.利用2種植被指數(shù)監(jiān)測中國6種典型森林生長期的比較研究[J]. 西南林業(yè)大學(xué)學(xué)報,2014,34(3):57-61.
[14] 冉有華,李 新,盧 玲.基于多源數(shù)據(jù)融合方法的中國1 km土地覆蓋分類制圖[J]. 地球科學(xué)進展,2009,24(2):192-203.
[15] 李俊祥,達良俊,王玉潔,等.基于NOAA-AVHRR數(shù)據(jù)的中國東部地區(qū)植被遙感分類研究[J]. 植物生態(tài)學(xué)報,2005,29(3):436-443.
[16] 吳健平,楊衛(wèi)星.遙感數(shù)據(jù)監(jiān)督分類中訓(xùn)練樣本的純化[J]. 國土資源遙感,1996,(27):36-41.
(責(zé)任編輯:彭南軒)
Quick Sampling Method for Large Area Vegetable Types Based on Remote Sensing Images: A Case Study for Cold Temperate Coniferous Forest Region
HUBo,JUHong-bo,LIUHua,HAOShuang,LIUHai
(Research Institute of Forestry Resource Information Techniques, Chinese Academy of Forestry, Beijing 100091, China)
[Objective]To realize the quick access of the separable and representative training samples on large area remote sensing images. [Method]Based on the macroscopical character of remote sensing images, referring to the 1∶1 000 000 vegetation map and China land cover map (WESTDC), and combining the unsupervised classification results of experimental region from the 2001 MODIS time series NDVI images, the spatial features of vector and raster data were used and associated the unsupervised classification results as the random sample properties. Based on the unsupervised classification types and the random point ratio of different classification types, the sample purification was realized. By comparing the difference of the standard deviation and the separability index before and after the sample purification of different vegetable samples, the points which had relatively larger contribution to the supervised classification were saved.[Result]The results showed that the land cover spatial distribution in survey area was consistent with the WESTDC map, the overall accuracy of main types was 84.82%. By using the purred samples and applying the maximum likelihood classification method, the overall accuracy was 32.52% higher than that from initial samples. [Conclusion]The sampling method is suitable for quick access of remote sensing images of large area and could reduce the time, manpower and material costs.
remote sensing; large area; quick sampling; sample purification
10.13275/j.cnki.lykxyj.2017.01.015
2016-02-04
國家863計劃課題(2012AA102001)。
胡 博(1985—),女,河北人,博士研究生,主要從事森林資源監(jiān)測技術(shù)研究
* 致謝:國家自然科學(xué)基金委員會“中國西部環(huán)境與生態(tài)科學(xué)數(shù)據(jù)中心”提供的WESTDC數(shù)據(jù)
** 通訊作者:鞠洪波(1956—),男,黑龍江人,研究員,博士生導(dǎo)師,林業(yè)信息技術(shù)
S771.8
A
1001-1498(2017)01-0111-06