李曉雅,田昕,段濤,曹曉明,楊凱捷,盧琦,王鋒
1.中國林業(yè)科學研究院荒漠化研究所,北京 100091;2.中國林業(yè)科學研究院資源信息研究所,北京 100091;3.中國科學院微電子研究所,北京 100029
溫帶疏林草原是中國半干旱區(qū)的重要生態(tài)系統(tǒng),是在中國北方森林、草原生態(tài)系統(tǒng)過渡區(qū)域發(fā)育于沙地的地帶性頂級群落(于順利,2011;史宇飛 等,2011)。榆樹疏林曾廣泛分布于松遼平原和內蒙古高原,由于生境的喪失,目前主要分布于內蒙古高原的渾善達克沙地、科爾沁沙地、呼倫貝爾沙地和毛烏素沙地等地,其中以渾善達克沙地和科爾沁沙地分布面積最廣,疏林草原景觀最為典型(于順利和陳宏偉,2007)。準確掌握疏林草原的分布及動態(tài),不僅有利于加深對中國溫帶疏林草原生態(tài)系統(tǒng)的理解,進一步也可為溫帶疏林草原的恢復和重建提供科學依據(jù)。
植被覆蓋度是定量化表征地表植物群落的重要指標,同時反映著區(qū)域生態(tài)環(huán)境的變化(DeFries等,2007;Yang 等,2012)。定量獲取疏林草原植被覆蓋度、準確反演植被動態(tài)變化規(guī)律,是實現(xiàn)疏林草原動態(tài)監(jiān)測與評估的前提。獲取植被覆蓋度的方法主要包括地面測量和遙感解譯兩種途徑。野外觀測獲得的植被覆蓋度信息是實現(xiàn)覆蓋度遙感反演的基礎,為覆蓋度遙感反演提供訓練數(shù)據(jù)及驗證信息。目前使用遙感手段進行覆蓋度反演的方主要包括植被指數(shù)、經驗模型、混合像元分解模型和機器學習方法,植被指數(shù)法通過建立植被指數(shù)與覆蓋度之間的關系反演植被覆蓋度(Harris等,2014;Wang 等,2020);經驗模型即建立波段信息與覆蓋度之間的經驗模型估算植被覆蓋度(岳健 等,2020),經驗模型對數(shù)據(jù)集的正態(tài)分布特性和波段信息的獨立性要求較高,僅適用于特定的區(qū)域及特定值被,使其在大尺度植被覆蓋度估算中具有一定的局限性(賈坤 等,2013);混合像元分解方法同樣被廣泛應用于半干旱地區(qū)植被覆蓋度的估測中(Cui 等,2019),該方法利用像元分解模型分解像元中各端元的亮度信息貢獻,獲得端元植被豐度以估算值被覆蓋度(Adams 等,1986)。混合像元分解方法前期對光譜端元的選取嚴重影響到像元分解的精度,植被覆蓋度估測能力不穩(wěn)定(李曉松 等,2010),且疏林草原具有較復雜的地表覆蓋情況,端元組合較為復雜。
機器學習方法是通過構建樣本數(shù)據(jù)集,結合地形、氣候、植被指數(shù)、光譜信息等預測變量,運用數(shù)據(jù)挖掘方法找出隱含在預測變量和分類樣本之間的相關關系,并自動建立估算模型,屬于遙感影像解譯中全監(jiān)督學習類方法(周培誠 等,2021)。由于機器方法更適合處理復雜海量的數(shù)據(jù)集(Brandt等,2016)并具有較高的計算效率與估算精度,在干旱半干旱區(qū)植被覆蓋類型圖的繪制以及植被覆蓋度反演等方面得到了廣泛的應用(Zhang等,2019;陳黔 等,2019;Hunter等,2020)。
疏林草原具有喬木、灌木和草本植被混合生長的特點,在植物斑塊化分布、高異質性景觀的疏林草原區(qū)域,利用中低分辨率衛(wèi)星遙感影像識別疏林草原,精度難以保證(Latifovic 和Olthof,2004)。近年來,覆蓋全球的高分辨率衛(wèi)星不斷涌現(xiàn),出現(xiàn)了覆蓋全球范圍的中高分辨率衛(wèi)星如哨兵(Sentinel)和國產高分(GF),為區(qū)域尺度的疏林草原植被覆蓋度估算提供了有利條件。
無人機飛行時間、靈活、可搭載多種類型傳感器,具有獲取植被結構特征、識別矮小植株的高空間分辨率優(yōu)勢(Kattenborn 等,2019),被廣泛應用到植被遙感分類和監(jiān)測中(韓東 等,2018;Wang等,2019;張順 等,2019;蔡棟 等,2019)。無人機近地遙感觀測技術的逐漸成熟,也帶動了遙感信息由過去地面監(jiān)測與衛(wèi)星遙感的“二維數(shù)據(jù)”到星—空—地“三維數(shù)據(jù)”的轉變,成為地面觀測與衛(wèi)星遙感之間重要的紐帶,為生態(tài)遙感的進一步發(fā)展提供了新的機遇(蔡宗磊 等,2019;郭慶華 等,2020;廖小罕 等,2019)。不過由于受到無人機續(xù)航時間的限制,通過無人機實現(xiàn)區(qū)域尺度的植被監(jiān)測還面臨較大的挑戰(zhàn)。
在利用不同空間尺度遙感數(shù)據(jù)時,較大的空間尺度可以反應區(qū)域上的規(guī)律,較精細的空間尺度可以揭示復雜的地表特征(萬昌君 等,2019)。最近出現(xiàn)的這些新數(shù)據(jù)源為我們帶來了啟示,是否可同時利用近地遙感和高分辨率衛(wèi)星遙感兩種高空間分辨率數(shù)據(jù)源,基于機器學習算法融合兩種數(shù)據(jù)源在植被遙感監(jiān)測中各自的優(yōu)勢,實現(xiàn)區(qū)域尺度溫帶疏林草原不同類型植物的高效精準識別和動態(tài)監(jiān)測?
因此,本研究探索了如何利用高分辨率衛(wèi)星(GF-6 和Sentinel-2)結合近地遙感獲取的超高分辨率影像,基于機器學習算法估算疏林草原上木本植物和草本植被的覆蓋度。具體目標為:(1)基于無人機正射影像,利用分類和回歸樹算法對疏林草原木本植物和草本植物進行自動精準分類;(2)利用隨機森林算法,實現(xiàn)從無人機正射影像到高分衛(wèi)星影像的疏林草原木本植物和草本植被覆蓋度的估算;(3)比較GF-6 和Sentinel-2 兩種高分辨率衛(wèi)星影像對疏林草原木本植物和草本植被覆蓋度估算的差異。
研究區(qū)位于中國內蒙古自治區(qū)錫林郭勒盟正藍旗渾善達克沙地榆樹疏林草原長期定位觀測大樣地,地理位置為42°57′34″N—42°58′15″N,115°57′E—115°58′E,平均海拔高度約為1300 m,面積為1 km×1 km(圖1)。該區(qū)域屬于干旱、半干旱大陸性氣候,年平均氣溫2.1 ℃,降水集中于7—9 月,年平均降水量為313 mm。疏林草原生態(tài)系統(tǒng)由喬木層、灌木層和草本層3 層垂直結構組成(于順利 等,2007)。將研究區(qū)內的唯一喬木種榆樹(Ulmus pumila)和伴生灌木如耬斗葉繡線菊(Spiraea aquilegifolia)、小紅柳(Salix microstachyavar.bordensis)、黃柳(Salix gordejevii)、柴樺(Betula fruticosa)等14種灌木種定義為木本植物。草本層則主要由多年生草本褐沙蒿(Artemisia intramongolica)和一年生草本叉分蓼(Polygonum divaricatum),羊草(Aneurolepidum chinense)等近190 種草本植物構成(韓東 等,2018)。
圖1 中國內蒙古自治區(qū)渾善達克沙地榆樹疏林草原長期定位監(jiān)測大樣地Fig.1 Long-term monitoring plot in Elm(Ulmus pumila)sparse forest grassland ecosystem in the Otindag sandy land(ESFOGE-Plot)Inner Mongolia,China
2.2.1 無人機影像數(shù)據(jù)
為了建立精準的疏林草原植被覆蓋度訓練數(shù)據(jù)集,選用配置1 cm 精度導航定位和具有2000 萬像素CMOS傳感器的小型多旋翼高精度航測無人機(精靈4 RTK,大疆,中國深圳),采集榆樹疏林草原長期定位觀測大樣地的無人機正射影像。本研究根據(jù)研究區(qū)的邊界設計無人機飛行方案進行航空影像采集,影像拍攝時間為2020 年7 月20 日,拍攝時長為2 h,共采集到1334 張原始航拍影像,無人機飛行參數(shù)設置見表1。利用實景三維建模軟件Agisoft Metashape(V1.6.5,Agisoft,俄羅斯)對原始航拍影像進行校正和拼接處理,最終獲取樣地的數(shù)字正射影像圖DOM(空間分辨率為2.41 cm/pixel,圖2(a))。
表1 榆樹疏林草原長期定位觀測大樣地無人機航拍飛行參數(shù)Table 1 Flight parameters of Unmanned Aerial Vehicle(UAV)aerial photogrammetry in the long-term monitoring plot in Elm Sparse Forest Grassland
圖2 榆樹疏林草原長期定位觀測大樣地無人機正射影像和高分衛(wèi)星影像(框圖部分為分類精度驗證區(qū)域)Fig.2 High resolution UAV and satellite images of long-term monitoring plot in Elm sparse forest grassland ecosystem(The area covered by a black box is the sample for validating the classification accuracy)
2.2.2 衛(wèi)星影像數(shù)據(jù)
選用GF-6 和Sentinel-2 作為衛(wèi)星影像數(shù)據(jù)。考慮衛(wèi)星過境時間及云量,分別選取2020 年7 月22 日GF-6 影像和2020 年7 月1 日Sentinel-2 影像。GF-6影像預處理過程包括輻射定標、大氣校正等。GF-6 衛(wèi)星輻射定標采用中國資源衛(wèi)星應用中心的系數(shù),并采用光譜超立方體的快速視線大氣分析(FLAASH)方法進行大氣校正。由歐洲航天局網(wǎng)站(https://scihub.copernicus.eu/[2021-01-08])下載的Sentinel-2 數(shù)據(jù)是經過輻射校正后的反射率產品,利用ESA 官方發(fā)布的大氣校正模型Sen2cor(V2.8,ESA)進行大氣校正。由于Sentinel-2 影像可見光波段與紅邊波段和紅外波段具有不同的空間分辨率,對10 m 分辨率的可見光波段進行重采樣,重采樣后的Sentinel-2影像空間分辨率為20 m。分別將無人機近地面遙感平臺獲取的數(shù)字正射影像重采樣到16 m 和20 m,以重采樣后的無人機正射影像為基準,基于一階多項式分別對GF-6 影像和Sentinel-2 影像進行精確的幾何配準,校正過后的誤差不超過一個像元,保證了后期處理中對無人機正射影像和衛(wèi)星影像疊加分析的準確性;最后,利用研究區(qū)邊界分別對影像進行裁剪,獲得兩景預處理后的研究區(qū)影像(圖2(b),2(c))。輻射校正、大氣校正與圖像裁剪等預處理在ENVI(V5.3)中完成。
本研究發(fā)展了一套基于高分辨率衛(wèi)星影像和機器學習算法估算疏林草原木本植物和草本植物的新方法。首先,(1)基于高分辨率的無人機正射影像,利用分類與回歸樹算法識別木本植物和草本植物,分別計算對應GF-6 和Sentinel-2 衛(wèi)星像元尺度的木本植物和草本植被覆蓋度,作為疏林草原木本植物和草本植物覆蓋度估算模型的訓練樣本;(2)提取衛(wèi)星影像的波段信息、植被指數(shù)以及紋理特征等參數(shù),作為疏林草原木本植物和草本植物覆蓋度估算模型的特征因子;(3)利用(1)和(2)的訓練樣本數(shù)據(jù)集,基于隨機森林算法,針對不同衛(wèi)星數(shù)據(jù)源訓練模型建立木本植物和草本植物覆蓋度估算模型;(4)利用已構建的疏林草原木本植物和草本植物覆蓋度估算模型,基于高分辨率衛(wèi)星影像計算疏林草原木本植物和草本植物覆蓋度(圖3)。
圖3 榆樹疏林草原木本植物和草本植物覆蓋度估算方法流程圖Fig.3 Flowchart of woody and herbaceous Fractional Vegetation Cover(FVC)estimation in Elm sparse forest grassland
3.1.1 分類訓練樣本的獲取
(1)基于無人機影像估算木本和草本植物覆蓋度。機器學習是一種通過數(shù)據(jù)挖掘方法找出隱含在預測變量和分類樣本間的相關關系,并自動建立預測模型的方法。分類與回歸樹(CART)算法是由Breiman 等(1984)提出的一種非參數(shù)的有效監(jiān)督學習方法,即從一系列有特征和標簽的數(shù)據(jù)中總結出決策規(guī)則,并用樹狀圖結構來呈現(xiàn)這些規(guī)則以解決分類和回歸問題的算法,能夠有效利用空間輔助信息,深度挖掘特征信息。利用分類與回歸樹算法對無人機正射影像進行地物分類,基于色彩空間拓展函數(shù),將正射影像各像元的RGB 信息進行擴展,將色彩空間拓展到包含RGB(紅,綠,藍)、HSV(色調,飽和度,明度)、Lab(亮度,坐標軸從紅色到綠色,坐標軸從藍色到紅色)和XYZ(CIE1931標準色度系統(tǒng))(Reinhard等,2001)共12 種特征作為CART 分類算法的特征因子(Wang等,2019)。
利用無人機正射影像RGB 信息建立色彩空間拓展函數(shù)作為分類與回歸樹模型的特征因子;基于地面調查數(shù)據(jù)和目視解譯方法,使用圖像編輯軟件(如ImageJ,Photoshop 等)分別選取2020 年正射影像中的木本、草本和裸地,建立研究區(qū)地表類型的樣本訓練集作為決策樹分類模型的分類樣本,生成決策樹分類模型。將地物類型劃分為木本植物,草本植物和沙地3 類,得到樣地木本、草本植物與裸沙地的地表類型圖。通過計算不同地物類型的像素數(shù)占植被分類圖中總像素數(shù)比例,獲取木本植物和草本植物的植被覆蓋度。
基于研究區(qū)無人機影像的地表類型分布圖(圖4(b)),利用GF-6衛(wèi)星影像和Sentinel-2 衛(wèi)星影像分別對木本植物和草本植物進行掩膜,統(tǒng)計落在衛(wèi)星像元窗口內的木本植物和草本植物像元總數(shù),并計算其占衛(wèi)星窗口像元總數(shù)的百分比(以下簡稱覆蓋度分類樣本),得到衛(wèi)星像元尺度的木本和草本植物覆蓋度作為疏林草原覆蓋度模型的分類樣本數(shù)據(jù)。每組GF-6影像為3903個樣本數(shù)據(jù),Sentinel-2影像為2497個樣本數(shù)據(jù)。
圖4 基于無人機正射影像的衛(wèi)星像元尺度木本和草本植物覆蓋度計算方法Fig.4 Methods of woody and herbaceous FVC at pixel-scale of satellite images calculated from DOM obtained by UAV
(2)分類結果驗證。為驗證分類與回歸樹模型對無人機正射影像的分類精度,在無人機正射影像中隨機選取4000 個像素點,將目視判別結果與模型分類結果進行對比,基于像素點建立混淆矩陣,并計算Kappa系數(shù)和總體誤差作為指標評價決策樹分類精度。
3.1.2 模型特征因子的選取
植被指數(shù)對植被的生物物理特征較為敏感。對于地表空間復雜的影像,提取影像的紋理特征可以獲取各種有用的信息,提高分類精度(劉龍飛等,2003)。本實驗選擇的特征包括3 類,分別是波段反射率、植被指數(shù)以及紋理特征(Haralick,1979)。首先,選擇衛(wèi)星像元波段反射率作為模型特征因子(表2);植被指數(shù)包括歸一化植被指數(shù)NDVI(Normalized Difference Vegetation Index),差值植被指數(shù)DVI(Difference Vegetation Index),歸一化綠度植被指數(shù)GNDVI(Green Normalized Difference Vegetation Index),綠波比指數(shù)GRI(Green Ratio Vegetation Index),紅邊指數(shù)(MTCI)和增強型植被指數(shù)EVI(Enhanced Vegetation Index);采用基于統(tǒng)計分析的灰度共生矩陣GLCM(Gray-Level-Co-occurrence Matrix)實現(xiàn)GF-6 和Sentinel-2衛(wèi)星各波段紋理特征的計算。植被指數(shù)和紋理特征的提取在ENVI(V5.3)中完成。GF-6衛(wèi)星模型特征因子選取8 個波段反射率、6 個植被指數(shù)和48個紋理特征,共計62個特征因子,Sentinel-2衛(wèi)星選取10 個波段反射率、6 個植被指數(shù)和60 個紋理特征,共計76個特征因子。
表2 榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子與描述Table 2 Features and description of woody and herbaceous FVC estimation model in Elm sparse forest grassland
3.1.3 疏林草原木本和草本植物覆蓋度估算模型建立
將影像波段反射率、6 種紋理特征和6 種植被指數(shù)作為特征因子,利用隨機森林算法建立疏林草原木本植物和草本植物覆蓋度估算模型。隨機森林是一個以分類與回歸樹算法為基礎,將決策樹作為弱模型的袋裝法集成算法,即通過構建多個相互獨立的訓練樣本子集訓練弱模型,然后對各預測結果取平均值作為最終預測結果。隨機森林在利用袋裝法對獨立樣本子集進行模型訓練時,對每個特征因子出現(xiàn)的次數(shù)、深度以及模型的準確率進行統(tǒng)計,并賦予每個特征一定的權重值,該權重值即為各特征因子的重要性(Breiman,2001)。
與復雜模型相比,優(yōu)先選擇特征因子較少且預測結果相對準確的模型(James 等,2013)。由于并非全部特征變量都與覆蓋度相關,利用所有特征因子建立隨機森林模型后,對特征因子進行優(yōu)選,以提高隨機森林的預測精度并簡化節(jié)點。特征因子優(yōu)選首先根據(jù)重要性得分對各特征因子進行排序,然后按照重要性排名依次疊加特征因子并訓練模型,利用10 倍交叉檢驗(Crossvalidation)(Breiman,2001)分別計算一定特征因子數(shù)量下隨機森林模型的相關系數(shù)范圍,并進行隨機森林穩(wěn)健性估計,當相關系數(shù)趨于穩(wěn)定后,排除對模型貢獻較小的變量,建立最優(yōu)性能下的隨機森林模型。
確定模型最佳特征因子后,通過10 倍交叉檢驗查看模型預測精度的變化趨勢,調整隨機森林模型中樹的數(shù)量和樹的深度等參數(shù)以獲取模型參數(shù)的最優(yōu)值,進一步優(yōu)化模型、提高模型預測精度。應用建立的模型對研究區(qū)木本植物和草本植物的覆蓋度進行估算。以上圖像處理、模型訓練、模型構建和圖像分類均利用Python(V3.7)語言完成。
為防止由空間自相關引起的空間過度擬合,建模之前在研究區(qū)內隨機且均勻選取25%的獨立樣本數(shù)據(jù)作為精度驗證數(shù)據(jù),以評估模型對覆蓋度的估算精度?;贕F-6影像的數(shù)據(jù)集包含978組獨立驗證數(shù)據(jù),基于Sentinel-2 影像的數(shù)據(jù)集包含626組獨立驗證數(shù)據(jù)。比較無人機正射影像分類得到的覆蓋度與模型估算得到的覆蓋度值以評估模型精度,選擇的精度驗證指標包括模型樣本的決定系數(shù)R2(式(1))、均方根誤差RMSE(式(2))和估算精度EA(式(3))。
式中,yi為基于正射影像分類得到的覆蓋度,為模型估算的第i個覆蓋度,N為樣本數(shù)。
4.1.1 無人機正射影像分類
通過比較研究區(qū)內部樣方的正射影像和分類圖,以目視判別方法評估分類的準確性。由圖5可見,木本植物、草本植物和裸沙地分類效果良好,草地和裸沙地中稀疏分布的灌木均被完整的提取,木本植物與草本植物邊界清晰,木本植物內部完整,準確排除樹冠間隙和樹冠陰影。目視判別與機器分類之間的誤差主要是由于草本植物與裸沙地的混合像元分類產生。表3為基于驗證像素點建立的木本植物,草本植物和裸沙地的分類結果混淆矩陣,決策樹分類總體精度為0.89,Kappa 系數(shù)為0.83,分類精度較高。生產者精度和用戶精度的準確性充分證明了基于分類與回歸樹算法的影像分類能夠準確劃分無人機正射影像像元類型。
表3 榆樹疏林草原長期定位觀測大樣地無人機正射影像像元分類精度評價Table 3 Accuracy evaluation in pixel-based classification of DOM in long-term monitoring plot in Elm sparse forest
4.1.2 模型特征因子選擇
不同特征因子數(shù)量下的隨機森林模型性能驗證結果如圖所示(圖6)。基于GF-6影像的木本植物覆蓋度估算模型在特征因子數(shù)量為14 時,模型趨于穩(wěn)健且預測精度較高,可作為平衡預測精度和簡化模型的最優(yōu)特征因子個數(shù),建立最優(yōu)性能的覆蓋度估算模型?;贕F-6 影像的草本植物覆蓋度模型最優(yōu)特征因子數(shù)量為17。基于Sentinel-2影像的木本和草本植物覆蓋度模型最優(yōu)特征因子數(shù)量分別為11和17。
圖6 不同特征因子數(shù)量下的隨機森林模型性能驗證結果Fig.6 Random forest model performance verification results under different number of feature factors
表4 和表5 分別統(tǒng)計了基于GF-6 和Sentinel-2影像的疏林草原木本植物和草本植物覆蓋度估算模型重要性排名前5 的特征因子?;贕F-6 影像的疏林草原木本植物包含DVI、EVI、NDVI、MTCI和GRVI,均為植被指數(shù)(表4);基于Sentinel-2影像的疏林草原木本植物覆蓋度估算模型特征因子包括了NDVI、GNDVI、GRVI這3個植被指數(shù)、以及紅波段和植被紅邊1 波段?;贕F-6 的草本植物覆蓋度估算模型特征因子包含黃色波段、紅邊2波段、植被指數(shù)MTCI、紅邊2 波段紋理信息的均值和紅邊2波段紋理信息的方差;基于Sentinel-2的估算模型特征因子包含綠色波段、植被紅邊1、2波段和短波紅外1波段,紋理信息為短波紅外的均值。
表4 基于GF-6影像的榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子Table 4 Top five preferred features ranking of woody and herbaceous FVC estimation model in Elm sparse forest grassland based on GF-6 image
表5 基于Sentinel-2影像的榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子Table 5 Top five preferred features ranking of woody and herbaceous FVC estimation model in Elm sparse forest grassland based on Sentinel-2 image
DVI 是基于GF-6 影像的木本植物覆蓋度估算模型中最重要的特征因子,而NDVI則是Sentinel-2影像的木本植物覆蓋度估算模型中最重要的特征因子。對兩個模型特征因子綜合分析可知,植被指數(shù)均對木本植物覆蓋度的估算起重要作用,基于Sentinel-2 影像的草本植物估算模型最佳預測因子為中心波長在705 nm 的植被紅邊1 波段,重要性達到0.60(表5),這與基于GF-6 的草本植物覆蓋度模型相似,除黃色波段外,模型特征因子的光譜特征和紋理特征同樣集中在紅邊波段(表4)。由此可知,GF-6 影像和Sentinel-2 影像在730—750 nm 處的反射率能有效反映草本植物植被覆蓋度。說明紅邊波段反射率對草本植物覆蓋度變化較為敏感。
4.1.3 模型精度驗證
將無人機影像分類得到的木本、草本植物覆蓋度樣本值與模型估算值進行對比(圖7)。基于GF-6 影像和Sentinel-2 影像估算的木本植物覆蓋度R2均為0.72,均方根誤差為6.76%和6.53%,估算精度分別為46.31%和54.30%?;贕F-6 影像比基于Sentinel-2 影像的木本植物覆蓋度估算值均方根誤差相比高0.23%,估算精低7.99%?;贕F-6影像和Sentinel-2影像估算的草本植物覆蓋度R2分別為0.66 和0.81,均方根誤差分別為10.69%和8.20%,估算精度分別為77.88%和83.17%?;贕F-6 影像比基于Sentinel-2 影像估算的草本植物覆蓋度R2低0.15,均方根誤差高2.49%,估算精度低5.29%。
圖7 基于衛(wèi)星影像與基于無人機正射影像估算的榆樹疏林草原長期定位觀測大樣地木本和草本植物覆蓋度結果比較Fig.7 Comparison of woody and herbaceous FVC in Elm sparse forest grassland estimated by satellite images and DOM of UAV
兩種衛(wèi)星影像對疏林草原木本植物覆蓋度估算精度總體差別較小,對草本植物覆蓋度估算精度Sentinel-2 影像略高于GF-6 影像。不論基于哪種衛(wèi)星影像,木本植物在0—20%區(qū)間的覆蓋度估算精度較高,而在20%—100%區(qū)間估算精度較低,原因可能由于木本植物覆蓋度在20%—100%區(qū)間的訓練樣本數(shù)量較少。
分別基于GF-6 影像和Sentinel-2 影像對研究區(qū)木本、草本植物覆蓋度進行制圖,并與基于無人機正射影像得到的木本、草本植物覆蓋度圖對比,如圖8所示。總體來看,基于高分辨率衛(wèi)星影像獲取的木本、草本植物覆蓋度,與基于無人機正射影像獲取的木本、草本植物覆蓋度空間分布一致?;贕F-6 衛(wèi)星像元尺度對正射影像分類結果進行統(tǒng)計,約3/4 的木本植物像元落在0—20%覆蓋度內、草本植物像元落在20%—80%覆蓋度范圍內;基于Sentinel-2 衛(wèi)星像元尺度對正射影像分類結果進行統(tǒng)計,約4/5 的木本植物像元落在0—20%覆蓋度內、草本植物像元落在20%—80%覆蓋度范圍內?;贕F-6 影像估算得到的覆蓋度3/4 的木本植物集中在0—20%,草本植物在25%—75%;基于Sentinel-2影像得到的覆蓋度4/5的木本植物集中在0—20%,草本植物在25%—75%。
圖8 基于高分衛(wèi)星影像和無人機正射影像的榆樹疏林草原長期定位觀測大樣地木本和草本植物覆蓋度空間分布圖Fig.8 Maps of woody and herbaceous FVC in Elm sparse forest grassland from satellite image(GF-6 and Sentinel-2)and classified DOM
研究區(qū)木本植物覆蓋度在50%以上僅占研究區(qū)總像元數(shù)的2%—4%,且集中在研究區(qū)西部地勢較低的區(qū)域。研究區(qū)草本植物覆蓋度分布較為均衡,覆蓋度高于70%的區(qū)域集中分布在研究區(qū)的東部,覆蓋度低于30%的區(qū)域集中分布在地勢較高的沙丘區(qū)域。
本研究探索了一種利用近地遙感和衛(wèi)星遙感影像,基于機器學習算法,估算疏林草原木本植物和草本植物覆蓋度的新方法。研究不僅實現(xiàn)了基于無人機正射影像不同地物類別的精準分類,獲取了清晰的不同植被類型生活型信息。同時利用重采樣升尺度的方法分別提取衛(wèi)星影像混合像元內的疏林草原木本、草本植物覆蓋度,構建了疏林草原木本、草本植物覆蓋度估算模型,實現(xiàn)了從無人機到衛(wèi)星的疏林草原木本植物和草本植被的覆蓋度精準估算。研究結果表明:(1)利用無人機遙感監(jiān)測平臺能夠實現(xiàn)疏林草原景觀尺度的精準植被分類與覆蓋度計算;(2)構建了基于GF-6 衛(wèi)星影像和Sentinel-2 衛(wèi)星影像的木本和草本植物覆蓋度估算模型,實現(xiàn)了基于高分辨率衛(wèi)星影像的疏林草原木本和草本植物覆蓋度估算;(3)基于Sentinel-2 衛(wèi)星影像的疏林草原木本和草本植物覆蓋度估算精度稍高于GF-6 衛(wèi)星,基于兩個衛(wèi)星影像的草本植物覆蓋度的估算精度都要顯著高于木本植物。
近年來,覆蓋全球的高分辨率衛(wèi)星不斷涌現(xiàn),通過融合不同分辨率的多源衛(wèi)星遙感數(shù)據(jù),基于定量遙感尺度轉換模型,監(jiān)測熱帶地區(qū)稀樹草原上木本植被狀況和動態(tài)是稀樹草原研究的熱點(Brandt等,2016;Tian等,2017)。González-Roglich和Swenson(2016)利用中巴地球衛(wèi)星(CBERS)影像與陸地衛(wèi)星(Landsat)影像,基于隨機森林算法估計阿根廷中部稀樹草原樹木覆蓋度。Herrmann等(2013)在西非塞內加爾使用軌道觀測衛(wèi)星(Orbview)高分辨率影像與中分辨率成像光譜儀(MODIS)的NDVI數(shù)據(jù),基于決策樹算法建立模型并反演木本覆蓋度。Higginbottom 等(2018)融合Landsat 影像與日本對地觀測衛(wèi)星(ALOS)高分辨率合成孔徑雷達數(shù)據(jù),基于隨機森林算法繪制出南非林波波省疏林草原地區(qū)木本植物覆蓋度圖。以上研究均應用機器學習方法結合多分辨率遙感影像實現(xiàn)了熱帶稀樹草原木本植物覆蓋度估算。中國溫帶疏林草原景觀與熱帶稀樹草原特征相似,在連續(xù)的草本層里鑲嵌有不連續(xù)的喬木和灌木植物,是中國半干旱區(qū)重要的生態(tài)系統(tǒng),也是世界上唯一分布于溫帶的疏林草原生態(tài)系統(tǒng)(于順利 等,2007)。本研究探索了將無人機近地遙感數(shù)據(jù)與高分辨率衛(wèi)星遙感數(shù)據(jù)相結合的新方法,以分布于中國內蒙古高原上的溫帶疏林草原為對象,實現(xiàn)了疏林草原上木本植物和草本植物的同步監(jiān)測。新方法為實現(xiàn)區(qū)域尺度溫帶疏林草原不同生活型植物的高效精準監(jiān)測提供了方法基礎。
本研究結果與同樣利用隨機森林方法,結合航空遙感數(shù)據(jù)與衛(wèi)星數(shù)據(jù),估算熱帶稀樹草原木本植物覆蓋度的驗證結果相比(Ludwig等,2019),具有更高的決定系數(shù)和更低的均方根誤差。Ludwig估測得到的木本植物覆蓋度估算模型決定系數(shù)R2為0.44,均方根誤差為11.6%;基于GF-6 影像和Sentinel-2 影像估算的木本植物覆蓋度估算模型決定系數(shù)R2均為0.72,均方根誤差為6.76%和6.53%。此外,基于隨機森林建立的植被覆蓋度模型預測值均高估了較低的植被覆蓋度值,而低估了高植被覆蓋度值,與隨機森林算法在預測結果時,對每棵回歸樹得到的預測變量求平均值作為預測結果的屬性相關(Prasad 等,2006)。隨機森林該屬性導致在覆蓋度預測中對于較低和較高的木本植物和草本植被覆蓋度估算誤差較大。
Higginbottom 等(2018)融合了Landsat衛(wèi)星數(shù)據(jù)和PALSAR 合成孔徑雷達數(shù)據(jù),并通過組合旱季、雨季多季節(jié)指標訓練模型。得到的木本植物覆蓋度驗證結果中,決定系數(shù)最高達0.77。該結論對模型的改進具有一定的啟發(fā)性,可以結合輔助數(shù)據(jù)并加入生長季的不同時期影像作為預測指標,進一步提高疏林草原木本植物和草本植物覆蓋度估算精度。
基于機器學習算法,融合無人機正射影像和高分辨率衛(wèi)星影像等多源數(shù)據(jù),充分發(fā)揮了近地遙感高空間分辨率和衛(wèi)星遙感區(qū)域大尺度覆蓋的特點。無人機正射影像為疏林草原木本、草本植被覆蓋度估算模型提供了高質量的訓練數(shù)據(jù),衛(wèi)星影像為探測區(qū)域尺度植被狀況提供了基礎數(shù)據(jù)源,機器學習的方法為兩種類型數(shù)據(jù)的融合搭建了橋梁。利用這一方法,未來可以實現(xiàn)中國溫帶疏林草原分布范圍的精確制圖,進一步利用多時相的衛(wèi)星遙感數(shù)據(jù)也可監(jiān)測疏林草原上木本植物和草本植物的長期變化特征。