孟 健 熊文豪 周 寒 張曉倩 劉天琦 高賢君
(1.中國礦業(yè)大學(北京)地球科學與測繪工程學院 北京 100083)(2.長江大學地球科學學院 武漢 430100)(3.內(nèi)蒙古自治區(qū)測繪地理信息中心 呼和浩特 010050)(4.新疆大學地質(zhì)與礦業(yè)工程學院 烏魯木齊 830047)
一直以來,沙漠治理和土地荒漠化治理都是環(huán)境治理關(guān)注的重點。為了更好地開展沙漠和土地荒漠化治理工程,需要對沙漠地區(qū)或荒漠化較為嚴重的地區(qū)進行必要的信息提取[1]。地表植被作為人類自然生態(tài)系統(tǒng)的一個重要組成部分,其生長狀態(tài)常常受某一地區(qū)的許多自然環(huán)境因素的影響,另外植被的變化情況也常被人們用來當作準確評價當?shù)厣鷳B(tài)環(huán)境氣候變化的一個重要科學指標。近年來,隨著遙感技術(shù)的不斷發(fā)展,其已經(jīng)能夠?qū)崟r提供大量的多時相數(shù)據(jù),在植被信息提取方面被廣泛的應用,目前已有研究探索沙漠地區(qū)的遙感植被提取方法,這對監(jiān)測沙漠區(qū)域的植被動態(tài)變化具有重要意義[2~3]。
為了更好地改善沙漠植被治理,需要對其植被生長信息進行精確分類提?。?]。在提取靠近沙漠或者其他荒漠化地區(qū)土地的生物植被狀態(tài)信息時,常用的分類方法主要包括目視信息解譯、監(jiān)督信息分類、非人工監(jiān)督信息分類、決策樹層和分層信息分類、神經(jīng)網(wǎng)絡自動信息提取等多種方法[5~6]。在當前的研究和實際應用中,通常采用其中的一種或多種方法結(jié)合進行分類提?。?]。呂利利等采用基于分類與回歸樹(Classification And Regression Tree,CART)決策樹分類的方法對民勤縣沙漠化信息進行提?。?]。魏艷輝等采用迭加替代自定義組織模式數(shù)據(jù)的采集分析算法(Iterative Selforganizing Data Analysis Techniques Algorithm,ISODATA)方法提取烏蘭布和沙漠白刺沙丘邊緣的地物信息[9]。劉勇采用決策樹分類對烏蘭布沙漠進行信息提取并輔以紋理分析[10]。王讓會等建立線性光譜混合分析模型,并計算歸一化植被指數(shù)(Normalized Differential Vegetation Index,NDVI)以提取古爾班通古特沙漠西緣的植被遙感信息[11]。目前利用遙感技術(shù)進行沙漠植被信息提取,多利用NDVI植被指數(shù)來區(qū)分研究區(qū)的地表狀態(tài)是否為植被[12]。但遙感影像中時常出現(xiàn)同譜異物或者異物同譜的現(xiàn)象,且分類過程中易受到人為主觀因素的影響,導致沙漠信息提取精度不高[13]。而且僅使用NDVI植被指數(shù)識別和檢測植被,精度有所限制,誤差也相對較大。針對此類問題,本文以榆林市毛烏素沙漠地區(qū)為例,將NDVI 指數(shù)和眾多監(jiān)督分類方法組合來提取研究區(qū)多個年份的植被生長變化狀況,通過對遙感圖像中的地物類別進行識別,將植被的譜識別問題轉(zhuǎn)變?yōu)閳D識別問題,并輔以多個年份實現(xiàn)研究區(qū)域植被信息的動態(tài)監(jiān)測。
監(jiān)督分類方法主要是通過劃分類別樣本,并對這些已知樣本進行訓練,根據(jù)已知樣本對其它未知類進行分類的過程。分類時,在確定了類別定義和特征判別后,需要對訓練區(qū)進行樣本確認,然后選擇合適的分類方法進行分類[14]。
ENVI 軟件提供了眾多監(jiān)督分類方法,包括最大似然法、神經(jīng)網(wǎng)絡法在內(nèi)的12 種[15]。其中,最大似然法利用了正態(tài)分布假設的基本原理,對每個像素所屬的似然估計值進行分類,從而得到最有可能的分類。平行六面體方法根據(jù)訓練樣本的亮度值形成n 維數(shù)據(jù)空間,并根據(jù)像元的光譜參數(shù)值,動態(tài)地劃分到相應的類別中。最小距離法主要原理是通過計算待分類像元與各個已知訓練樣本特征類空間中心的距離,選擇距離最小的樣本,將待分類像元進行歸類。馬氏距離分類是基于計算機在輸入速度圖像時得到各速度訓練樣本的馬氏距離,最終比較馬氏速度距離最小的,即為此值的類別。神經(jīng)網(wǎng)絡方法泛指現(xiàn)代計算機已經(jīng)模擬出了人腦的網(wǎng)絡結(jié)構(gòu),使用很多小的信息處理單元來模擬人腦神經(jīng)元,能夠基本模擬出人腦的信息識別、記憶、思考的整個過程,然后對像元進行影像分類[16]。支持向量機分類是一種建立在分類統(tǒng)計學基礎(chǔ)理論上的一種機器學習的方法,為了將不同類之間的信息間隔距離最大化,并同時保持較高的支分類識別準確率,SVM可自動的準確識別類并尋找對不同類具有較大信息區(qū)別處理能力的各種支持分類向量,自動構(gòu)造分類器,對像元進行圖像分類。
基于以上監(jiān)督分類方法的了解,本文以榆林市毛烏素沙漠為研究對象,將多種監(jiān)督分類方法應用在該地并進行精度分析,以探索出提取沙漠植被表現(xiàn)最優(yōu)的精度指標方法。
反向傳播(BP)是一種神經(jīng)網(wǎng)絡分析方法,利用最大誤差反向信息傳播算法。它采用最大誤差逆向傳播算法,通過采集仿真過程中的系統(tǒng)誤差,將其反饋給輸出,然后利用該誤差對神經(jīng)元權(quán)值進行調(diào)節(jié),使其“偏差”盡量減小,從而使神經(jīng)網(wǎng)絡模型與數(shù)據(jù)集達到最好的擬合效果[17]。前向傳輸和后向傳輸是BP神經(jīng)網(wǎng)絡的兩部分。神經(jīng)網(wǎng)絡結(jié)構(gòu)包括輸入層、隱含層、輸出第一層。在正向樣本傳播的整個過程中,輸入層首先傳入一個輸入層的樣本,由一個隱含層進行處理后,再將其傳向一個輸出樣本層。若信號輸出處理層的實際信號輸出與系統(tǒng)期望值輸出不符,則信號會自動轉(zhuǎn)向具有誤差的反向信號傳播下一階段。在反向快遞傳播的運行過程中,反向快遞傳播把預期誤差大的信號按原來正向快遞傳播的信號通路反向廣播傳回,進行多次預期修改,通過迭級換代的重復過程,對比各傳播節(jié)點的預期權(quán)重和誤差閾值,逐漸增大減小預期誤差,直到節(jié)點達到新的預期誤差要求。當輸入誤差參數(shù)小于某一參數(shù)相當小的輸入正數(shù)或迭代輸出誤差不再繼續(xù)減少時,即已經(jīng)完成了基于BP 模型網(wǎng)絡的誤差訓練、輸入與迭代輸出的誤差映射的基本確定。在誤差計算過程中,為使得誤差值達到最小,采用梯度下降法。
用戶在ENVI的用戶中可以采用一個優(yōu)化訓練函數(shù)(例如對數(shù)(Logistic)和雙曲線(Hyperbolic))以及針對輸入端的訓練函數(shù)貢獻一個閾定的值(0-1),用于對每個節(jié)點內(nèi)部權(quán)重的大小變化進行調(diào)節(jié)。訓練中的算法交互式地通過調(diào)整兩個節(jié)點間的響應權(quán)重和誤差閾值,從而可以讓節(jié)點輸出響應層和輸入響應層的誤差可以達到最小。還可以輸入所用隱藏層數(shù)來進行訓練調(diào)整。在迭代過程中,直至誤差達到最小,即可輸出正確分類(如圖1所示)。
圖1 神經(jīng)網(wǎng)絡原理圖
本文主要使用ENVI5.1 軟件進行圖像監(jiān)督分類(Classification),該模塊下的監(jiān)督圖像分類(Supervised Classification)工具可完成研究區(qū)的分類。監(jiān)督分類一般可以大致分為4 個基本過程:集中選取分類訓練樣本、執(zhí)行訓練分類、分類后處理和綜合評價分類結(jié)果。
分類前首先在研究區(qū)域的遙感影像上對3 種主要的類型土地資源選取每套訓練樣本中最感興趣的小區(qū)域(Region of Interest,ROI),進行訓練樣本的分類選取時,要選擇兩套訓練樣本,一套用于監(jiān)督分類的初始訓練樣本,另一套用作監(jiān)督分類后結(jié)果的樣本精度評價。選取觀測出一些具有最大典型性和最具代表性的規(guī)定訓練樣本,不僅能對其進行準確的分類,也能在一定量的程度上準確反映觀測出其與同類相對地物體的光譜物理特性的長期波動變化情況,訓練樣區(qū)的樣本數(shù)量也必須滿足一定的訓練要求,以確保能夠代表該類別的光譜特征。
樣本分離度評價:樣本分離度的大小可用來檢測選取的不同類別樣本之間是否具有一定的可區(qū)分性。該評價工具主要是通過ROI 可分工具條來計算,各樣本之間的分離度情況可以判斷各類別之間的差別程度,參數(shù)在1.8~2.0 之間說明樣本之間的分離性良好。通過分離度評價也可以繪制出樣本類別的平均光譜響應曲線。
執(zhí)行監(jiān)督分類:監(jiān)督分類方法眾多,本文選取了神經(jīng)網(wǎng)絡、最大似然、平行六面體、最小距離、馬氏距離和支持向量機在內(nèi)的6 種分類方法,通過這6 種方法的評價分類結(jié)果比較,選出精度最高的監(jiān)督分類方法。
評價分類結(jié)果:由于在前面實驗選取訓練樣本時,我們制作了了兩套訓練樣本,將另一套樣本采用混淆矩陣(Confusion Matrix)的方式對識別結(jié)果進行精度監(jiān)測,實現(xiàn)分類結(jié)果與實際樣本信息的對比。對這6 種結(jié)果進行精度評估,選擇在總體分類準確率、Kappa 系數(shù)等維度上表現(xiàn)最好的分類方法。
分類后處理:分類后處理是必要的步驟,因為監(jiān)督分類得到的初步結(jié)果往往難以滿足最終的應用需求。為了獲得符合要求的最終分類結(jié)果,需要對初始分類結(jié)果進行一系列的處理,包括更改分類顏色、合并類別、主次要分析和聚類分析等常見操作。
本文以陜西省榆林市定邊縣、靖邊縣、橫山區(qū)三地所代表毛烏素沙漠為研究區(qū)域。榆林市總面積43578 km2,界于東經(jīng)107°28′~111°15′,北緯36°57′~934′之間,接壤于陜甘寧蒙晉五?。▍^(qū))交界地帶[18]。
榆林市范圍內(nèi)的毛烏素沙漠海拔高度大約在1200m~1500m,其總面積18424.42km2,占榆林市總面積的五分之二。受其地理位置影響,該地區(qū)具有獨特的自然地理景觀、豐富的生物多樣性和典型的高原生態(tài)環(huán)境[19~20]。毛烏素沙漠不只有沙漠,草原地區(qū)分布有開闊草原、黃土地和丘陵,甚至有外水灌溉系統(tǒng)和內(nèi)陸大運河。除此之外,毛烏素沙漠中還分布有許多大型湖泊和天然濕地,這在中國的主要草原沙漠中可說是獨一無二的。榆林市由于毛烏素沙漠的存在,曾史上分布著最高達800 多個海子,還因此擁有一片大面積的天然綠洲、濕地、草原、牧場、農(nóng)田和魚塘。毛烏素沙漠地區(qū)是榆林市主要的農(nóng)、林、牧、漁業(yè)綜合發(fā)展示范基地,同時也認為是榆林市最重要的自然生態(tài)環(huán)境屏障[21~24]。
隨著全球氣候的不斷變暖,氣候災害的頻率和強度增加,以及人類活動的不斷增強,毛烏素沙漠的生態(tài)環(huán)境遭到了破壞和惡化,湖泊、濕地面積大幅減少,由此引起生物多樣性也急劇下降,嚴重影響了沙漠當?shù)剞r(nóng)、林、牧、漁業(yè)和可持續(xù)發(fā)展戰(zhàn)略的實施。
為了監(jiān)測毛烏素沙漠近些年來的植被變化情況,本文選取2013 年~2020 年長時間序列上的Landsat8 OLI遙感圖像進行研究。由于研究區(qū)四季變化情況明顯,不同季節(jié)植被覆蓋狀況可能有所不同,為了在長時間序列上來對比研究區(qū)的植被變化情況,本文僅選取2013年9月13日和2020年9月7日的遙感影像進行實驗。
針對不同年份年的遙感影像分別采用多種不同的監(jiān)督分類方法進行結(jié)果分類,并將分類處理得到的不同年份的結(jié)果與毛烏素沙漠原始真彩色影像進行對比,目視判斷植被信息提取效果最好的六類監(jiān)督分類方法展示如下。
觀察圖2、圖3 的分類結(jié)果,可以知道,自2013年~2020 年的變化過程中,不同的分類方法均表現(xiàn)出地表植被范圍增加的趨勢。只有最小距離法可能識別的沙漠區(qū)域較多,看起來存在一定誤差,經(jīng)調(diào)研發(fā)現(xiàn),最小距離法在進行監(jiān)督分類時存在一定的缺陷,該方法不會考慮不同類別內(nèi)部方差的差異,導致一些類別在邊界上出現(xiàn)過度檢測,從而引發(fā)分類誤差,沙漠地區(qū)的植被覆蓋情況較草原綠地本就略顯稀疏,因此利用該方法進行沙漠地區(qū)的植被信息提取會進一步放大分類誤差;另外圖中平行六面體方法和馬氏距離方法的分類結(jié)果又過于顯著,與實際情況可能會有些偏差,這是由于馬氏距離會夸大了小變量的影響,并且受到協(xié)方差矩陣不穩(wěn)定性的顯著影響。而平行六面體法考慮到n 維影響,對于很多沙漠地區(qū)像元本身都無法識別。
圖2 2013年不同監(jiān)督分類方法結(jié)果圖
圖4 監(jiān)督分類精度對比分析圖
單純從目視解譯來分析不同分類方法的優(yōu)劣存在一些不確定性,因此接下來對6 種監(jiān)督分類方法進行精度評價的對比分析。
通過精度評定對比分析表(如表1 所示)可以看出,神經(jīng)網(wǎng)絡方法在應用植被提取方面的精度非常高,其2013年總體精度約為90.48%,2020年總體精度更是達到了99.66%。
表1 監(jiān)督分類精度對比分析表
通過6 種分類方法的精度對比,神經(jīng)網(wǎng)絡方法在長時間序列上表現(xiàn)的分類精度較其他方法更高,這是因為該方法具備一定的非線性映射能力、自學習和自適應能力,在應用沙漠地區(qū)植被信息提取方面具有很大的優(yōu)勢。另外結(jié)合分類后的圖像效果以及其他像元內(nèi)部結(jié)構(gòu)或人為因素的影響,選擇神經(jīng)網(wǎng)絡方法作為毛烏素沙漠地區(qū)的植被提取方法是更加具有參考價值的。
本文以毛烏素沙漠為研究對象,在大量野外數(shù)據(jù)的基礎(chǔ)上,采用多種監(jiān)督分類方法方法對毛烏素沙漠的植被和非植被信息進行提取。經(jīng)目視解譯和精度評價,發(fā)現(xiàn)神經(jīng)網(wǎng)絡方法是毛烏素沙漠地區(qū)長時間序列植被信息提取表現(xiàn)效果最好的方法,它能夠?qū)D像進行深層特征的自動提取和分類,實現(xiàn)了機器的自動提取特征,對植被信息提取的時空變化研究,以及進一步實現(xiàn)植被遙感信息的高精度提取具有重要意義。
據(jù)中國林業(yè)局等相關(guān)報道,在經(jīng)過長時間的治理之后,毛烏素沙漠植被覆蓋率已經(jīng)達到了33%,治理率達到93.24%,境內(nèi)860萬畝流沙已經(jīng)全部實現(xiàn)了固定或者半固定的狀態(tài)。因此在長時間序列上表現(xiàn)的植被變化狀況是向好趨勢發(fā)展的,這也與本文研究結(jié)果相一致。故在后續(xù)監(jiān)測沙漠地區(qū)植被變化情況時,可借鑒本文神經(jīng)網(wǎng)絡方法來實現(xiàn)植被信息的遙感動態(tài)提取。