張兆鵬,李增元,田 昕
(1.自然資源部 第一大地測量隊,陜西 西安 710054;2.中國林業(yè)科學研究院 資源信息研究所,北京100091)
林業(yè)是生態(tài)建設(shè)的主體,履行著建設(shè)和保護 “三個系統(tǒng)、一個多樣性”(森林、濕地和荒漠生態(tài)系統(tǒng)及生物多樣性)的重要職能[1-2]。為了對林地資源進行科學管理和有效利用,尋找經(jīng)濟、高效、精確的林地資源信息獲取方法是林業(yè)工作的重點。航天遙感技術(shù)的快速發(fā)展,為國家林地資源信息獲取提供了有效手段。從不同來源、不同形式的遙感信息中準確快速、高質(zhì)高效地獲取林地類型精細信息,實現(xiàn)森林資源的定期,甚至實時監(jiān)測,為清查森林資源、預測預報森林火災、利用和保護森林資源提供了重要基礎(chǔ)和依據(jù)[3]。目前,國內(nèi)外學者利用不同遙感數(shù)據(jù),在林地類型提取方面通過不同的研究方法進行了大量的研究,以提高林地類型的分類精度[4-7]。隨著第1顆提供 “紅邊”波段的商業(yè)衛(wèi)星——RapidEye衛(wèi)星的發(fā)射,其獨特的光譜特征被國際各類遙感衛(wèi)星研究及應(yīng)用機構(gòu)認可與采用。國內(nèi)外學者通過將具有紅邊波段的RapidEye遙感衛(wèi)星數(shù)據(jù)應(yīng)用于森林脅迫時空監(jiān)測、農(nóng)業(yè)和植物分類等方面發(fā)現(xiàn),紅邊信息在一定程度上可提高監(jiān)測精度和分類精度[8-9]。中國自行研制的GF-6是一顆只攜帶一部相機實現(xiàn)超大寬幅(800 km)的高分辨率衛(wèi)星,且新增的紅邊、黃邊譜段對于大區(qū)域的森林、農(nóng)作物等植被生長狀況監(jiān)測、植被類型識別具有獨特的優(yōu)勢。利用紅邊波段對林地類型精細分類尚未見報道,因此本研究以內(nèi)蒙古自治區(qū)根河市根河森林生態(tài)站為例,以攜帶紅邊波段且有一定數(shù)據(jù)獲取量的RapidEye數(shù)據(jù)為主要數(shù)據(jù)源,采用基于EnMAP-Box的隨機森林和支持向量機的分析方法展開研究,通過尋優(yōu)參數(shù)選擇和分類器訓練等方面的優(yōu)化設(shè)計,將RapidEye數(shù)據(jù)所攜帶的紅邊信息應(yīng)用于林地類型分類,從獨特的波段信息運用和運行速率出發(fā),開展具有較高實際應(yīng)用價值的林地類型精細識別方法。同時以GF-1數(shù)據(jù)為對比研究數(shù)據(jù),探討攜帶紅邊波段信息的衛(wèi)星數(shù)據(jù)對林地類型精細分類的影響,為國產(chǎn)GF-6衛(wèi)星在林業(yè)資源調(diào)查方面的深入應(yīng)用提前探路,為高分辨率成果全面服務(wù)于中國林業(yè)發(fā)展和生態(tài)環(huán)境建設(shè)提供一定的技術(shù)參考。
根河市是內(nèi)蒙古自治區(qū)呼倫貝爾市北部的縣級市,地處大興安嶺北段。地理坐標為50°20′~52°30′N,120°12′~122°55′E,是中國緯度最高的城市之一,更是中國平均氣溫最低的旗市。根河市資源以森林資源為主體,森林覆蓋率為91.7%,森林面積達174.5萬hm2[10],樟子松Pinus sylvestris var.mongholi-ca,興安落葉松Larix spp.和白樺Betula platyphylla等是該區(qū)的主要樹種。本研究核心區(qū)域為包含內(nèi)蒙古首個森林生態(tài)觀測站——“大興安嶺森林氣候生態(tài)觀測站” 在內(nèi)的矩形區(qū)域(51°00′~51°45′N,121°23′~121°43′E), 位于根河市南部。
國產(chǎn)GF-1數(shù)據(jù)由中國資源衛(wèi)星應(yīng)用中心提供[11],RapidEye數(shù)據(jù)由高分辨率對地觀測系統(tǒng)重大專項(民用部分)科研項目(21-Y20A06-9001-17/18)提供。數(shù)據(jù)詳細信息見表1。
表1 衛(wèi)星數(shù)據(jù)信息表Table 1 The detailed information of satellite data
其他數(shù)據(jù)包括:①樣地調(diào)查數(shù)據(jù)。2016年8月1-30日,在根河市境內(nèi)進行實測,獲得3種類型樣地:Q樣地(19個)、復測樣地(27個)和航線樣地(71個),其中航線樣地包括13個方形樣地(30 m×30 m)和58個圓形樣地(直徑30 m);②輔助數(shù)據(jù)。大興安嶺根河生態(tài)站小班數(shù)據(jù)和二調(diào)森林資源分布圖作為輔助數(shù)據(jù),Landsat8 OLI數(shù)據(jù)作為基準影像數(shù)據(jù),來源于美國地質(zhì)勘探局(USGS)官網(wǎng)(http://landsat.usgs.gov/);③數(shù)字高程模型數(shù)據(jù)。根河市30 m分辨率的GDEMV2數(shù)據(jù),來源于地理空間數(shù)據(jù)云;④矢量數(shù)據(jù)。生態(tài)站矢量數(shù)據(jù)和研究區(qū)矢量數(shù)據(jù)作為影像裁剪數(shù)據(jù)。⑤檢驗樣本。結(jié)合外業(yè)調(diào)查數(shù)據(jù)和Google影像,在研究區(qū)共選取74個分布均勻的樣地(外業(yè)采集方形樣本大?。?0 m×30 m,自選方形樣本大小:20 m×20 m)作為驗證樣本,其中:闊葉林和針葉林各18個、灌木林12個、耕地、水體和建筑用地各6個、草地5個、裸地3個。
圖像預處理包括輻射定標、大氣校正、正射校正、圖像融合、地形校正和圖像配準等。其中:①大氣校正采用FLAASH大氣校正;②圖像融合。GF-1數(shù)據(jù)采用融合效果較好的NNDiffuse Pan sharpening法進行圖像融合,RapidEye數(shù)據(jù)不進行此處理;③地形校正。采用廣泛應(yīng)用的C校正模型進行地形校正;④圖像配準。以經(jīng)過輻射定標、大氣校正和正射校正的Landsat 8 OLI遙感影像(2017年7月)為基準影像,以GF-1和RapidEye遙感影像分別為待校正影像,通過圖像自動配準后的方法進行圖像配準處理,配準后GF-1和RapidEye遙感影像的總的均方根誤差(RMSE)分別達0.58個像元和0.56個像元,均滿足圖像配準要求,最終的數(shù)據(jù)預處理結(jié)果如圖1所示。
根據(jù)國家林業(yè)局頒發(fā)的《國家森林資源連續(xù)清查技術(shù)規(guī)定(2014)》[12]、研究區(qū)的地表覆蓋情況和應(yīng)用需求,本研究將主要地物類型劃分為針葉林、闊葉林、灌木林、草地、建筑用地、裸地、水體和耕地8類。
2.1.1 光譜特征 基于Rapid Eye和GF-1 PMS影像上8種地物類型的光譜特征(圖2),分析各類別在不同數(shù)據(jù)源、不同時相影像上的光譜差異和光譜域類別可分性。由圖2可知:RapidEye影像上紅邊波段(red edge,RE)處是植被光譜響應(yīng)的轉(zhuǎn)折點,差異性明顯;GF-1 PMS影像上,針葉林、闊葉林、灌木林、草地和耕地在近紅外波段(near infrared,NIR)表現(xiàn)出明顯的植被光譜響應(yīng)峰值。
2.1.2 紅邊特征 紅邊波段是介于紅光波段和近紅外波段之間的波段。植被葉片反射率在紅邊譜段范圍會發(fā)生突變,是植物曲線最為明顯的特征,是研究的重點光譜區(qū)域。紅邊與植被的各種理化參數(shù)緊密相關(guān),可以更好地應(yīng)用于林業(yè)和農(nóng)業(yè)等方面進行植被類型精細識別。歸一化紅邊指數(shù)(normalized difference red edge vegetation index,NDRE)是歸一化植被指數(shù)(NDVI)的改進型,它對葉冠層的微小變化、林窗片斷和衰老非常敏感,可用于精準農(nóng)業(yè)、森林監(jiān)測和植被脅迫性探測等。計算公式為:
圖2 RapidEye和GF-1影像不同地物光譜曲線Figure 2 Spectral curves of eight typical ground objects for RapidEye and GF-1 PMS images
式(1)中:INDRE表示歸一化紅邊指數(shù);ρNIR和ρRE分別表示近紅外波段(NIR)和紅邊波段(RE)的反射率。通常,-1<INDRE<1,且當0.2≤INDRE≤0.9時,表示為綠色植被區(qū)。
EnMAP-Box是由德國環(huán)境制圖與分析計劃項目組基于交互式數(shù)據(jù)語言(interactive data language,IDL)開發(fā)的一款對高光譜遙感數(shù)據(jù)處理與分析的工具包[13-14]。
ImageSVM是柏林洪堡大學地理實驗室開發(fā)的一種利用IDL語言對遙感影像進行支持向量機(support vector machine classification,SVM)分類和回歸分析的非商業(yè)產(chǎn)品工具[15]。支持向量機法是基于統(tǒng)計學理論,以結(jié)構(gòu)風險最小化為基礎(chǔ),通過最小化經(jīng)驗風險和置信區(qū)間,將神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇問題轉(zhuǎn)化為較容易的核函數(shù)選擇問題,對于樣本數(shù)量較少的研究,具有很好的優(yōu)勢[16]。SVM通過引入核函數(shù),將非線性問題轉(zhuǎn)化為線性問題,有效減小算法復雜度,避免經(jīng)典學習中過學習和維數(shù)災難等弊端[17],而且具有很好的通用性、魯棒性。本研究選用的核函數(shù)是目前廣泛應(yīng)用的徑向基函數(shù)。SVM的參數(shù)優(yōu)化功能是基于網(wǎng)格搜索算法,通過網(wǎng)格搜索法在可控范圍內(nèi)尋得適合模型的最優(yōu)的核函數(shù)參數(shù)g與懲罰系數(shù)C是SVM分類的關(guān)鍵[18-20]。EnMAP網(wǎng)格搜索尋優(yōu)時,核函數(shù)g的范圍為:0.0100~1000.0000,懲罰系數(shù)C的默認值為0.1,乘數(shù)(multiplie,M)的范圍為1<M≤10。一般情況下,設(shè)置g的最小值為0.01,最大值為10;C的最小值為1,最大值為1000,其對應(yīng)的乘數(shù)Mg和乘數(shù)Mc均為1.2~2.0。
ImageRF是一種基于IDL程序的遙感影像分類方法。隨機森林(random forests,RF)是利用bootstrap重抽樣方法從原始樣本中抽取多個樣本,對每個bootstrap樣本進行決策樹建模,然后將這些決策樹組合起來,通過投票得出最終的預測或者分類結(jié)果[20-21]。隨機森林進行分類時預選變量個數(shù)m和隨機森林中樹的個數(shù)n是進行參數(shù)調(diào)優(yōu)的關(guān)鍵。在ImageRF分類時選用的RFC(Random Forests Classification)模型是一種利用訓練樣本和內(nèi)部驗證的參考數(shù)據(jù)集進行參數(shù)優(yōu)化的分類模型[23-24]。EnMAP中隨機森林分類主要通過改變樹的數(shù)量(number of trees)來提高分類精度,其默認值為100,在大多數(shù)情況下。該默認值已可以達到很高的分類精度。
利用NDRE獨有的特性,將其參與支持向量機分類。首先,在波段計算器中對RapidEye影像數(shù)據(jù)通過公式(1)進行波段運算,得到RapidEye數(shù)據(jù)的歸一化紅邊指數(shù)圖像(單波段)。然后將所得到的單波段歸一化紅邊指數(shù)數(shù)據(jù)和RapidEye遙感數(shù)據(jù)的5個(藍、綠、紅、紅邊和近紅外)波段通過ENVI提供的“Layer Stacking”工具進行波段組合,最后將加入歸一化紅邊波段信息的RapidEye影像進行SVM分類處理。
經(jīng)過外業(yè)調(diào)查與遙感影像對應(yīng),針對在本研究區(qū)確定的8種不同的目標地物類型,利用影像上地物的特征 (形狀、大小、色調(diào)及紋理結(jié)構(gòu)等),來確定本研究區(qū)的訓練樣本。利用ENVI 5.4.1軟件中Compute ROI Separability工具計算任意2個類別間的差異性程度,即以任意類別間的統(tǒng)計距離來衡量訓練樣本的可分離性。結(jié)果表明:選擇的8種類型樣本間的可分離性較好,其中參數(shù)值大于1.90(合格樣本)的占 25/28, 在1.86~1.90的占3/28。
3.2.1 參數(shù)尋優(yōu)結(jié)果 利用SVM模型中的網(wǎng)格搜索法,尋得的RapidEye和GF-1遙感影像的最優(yōu)參數(shù)(g,C)如圖3所示。圖3右邊柱狀部分為圖例,表示最低精度和最高精度的值。觀察分析圖3可知:g值較小和C值較高時,精度值較高。
圖3 尋優(yōu)參數(shù)結(jié)果Figure 3 Optimum parameter result
3.2.2 影像分類結(jié)果 為了對比分析研究方法的分類效果,用傳統(tǒng)的最大似然法(MLC)和SVM法的分類結(jié)果為對比。最優(yōu)參數(shù)參與下的ImageSVM法分類和ImageRF法,以及MLC和SVM法的分類結(jié)果分別如圖4(RapidEye)和圖5(GF-1)所示。圖中A和B分別為ImageSVM法和ImageRF法的影像分類結(jié)果;圖4和圖5中C和D分別為傳統(tǒng)SVM和MLC法的分類結(jié)果。通過式(1)對Rapideye遙感影像進行波段計算,獲得單波段的歸一化植被指數(shù)圖像,如圖6所示。將其與5波段的RapidEye遙感影像通過波段重組(layer stacking),重新生成一個6波段的遙感影像,然后通過SVM分類法對重組后的遙感影像進行分類,得到NDRE參與下的SVM分類結(jié)果(圖7)。
圖4 RapidEye影像分類結(jié)果示意圖Figure 4 Classification results for RapidEye image
利用外業(yè)調(diào)查數(shù)據(jù)和選取的檢驗樣本,通過建立混淆矩陣對RapidEye和GF-1遙感影像不同分類方法的分類結(jié)果進行精度驗證,精度驗證結(jié)果分別見表2和表3所示。
圖5 GF-1遙感影像分類結(jié)果示意圖Figure 5 Classification results for GF-1 image
通過表2和表3可知:對于RapidEye和GF-1遙感影像,基于EnMAP-Box的隨機森林和支持向量機分類的總體分類精度和Kappa系數(shù)均高于傳統(tǒng)的SVM和MLC分類。其中:高分辨率的RapidEye和GF-1PMS遙感影像效果更明顯,ImageRF和ImageSVM的總體分類精度相對于傳統(tǒng)的SVM和MLC均提高了6%以上。
上述分析可知:ImageSVM和ImageRF法在復雜山區(qū)林地類型精細識別中精度和可信度高。針對這2種具有同等分類效果的方法,在運行效率和廣泛適用性方面進行對比研究,結(jié)果如表4所示。
由表4可知:在相同條件(影像類型相同、數(shù)據(jù)范圍相同、運行環(huán)境相同),ImageRF分類法相對于ImageSVM分類法,精度基本一致,但其費時少、效率快,是一種快速高效的分類方法。針對大區(qū)域林地類型精細識別而言,ImageSVM對運行環(huán)境的要求極高,花費時間也較長,廣泛適用性較差。同樣,對RapidEye遙感影像基于NDRE參與下的SVM分類結(jié)果進行精度驗證。結(jié)果如表5所示。
圖6 歸一化紅邊指數(shù)(單波段)Figure 6 NDRE(Single-band)
圖7 NDRE參與下的SVM法分類結(jié)果圖Figure 7 Classification result for SVM with NDRE
表2 RapidEye影像分類精度統(tǒng)計表Table 2 Classification accuracy table for RapidEye image
表3 GF-1影像分類精度統(tǒng)計表Table 3 Classification accuracy table for GF-1 image
表5和表2可知:歸一化紅邊指數(shù)NDRE參與下的支持向量機分類與傳統(tǒng)的支持向量機分類結(jié)果的分類精度由84.08%增長到91.69%,提高了7.61%。由此可知,紅邊波段信息對林地具有很好的區(qū)分性,可極大地提高林地類型的精細識別精度。
本研究面向國家森林資源監(jiān)測調(diào)查的行業(yè)重大需求,對復雜地形條件下高分辨率遙感影像林地類型精細識別方面展開了深入的研究與分析。主要結(jié)論如下:①本研究EnMap-Box支持下的ImageSVM和ImageRF分類方法相對于傳統(tǒng)的SVM和MLC分類方法具有較高的分類精度,是一種有效的林地類型信息精細識別方法,具有精度高和可信度高的優(yōu)勢,可滿足森林資源調(diào)查、變化監(jiān)測、數(shù)字更新等林業(yè)應(yīng)用需求。對于2016年的RapidEye影像,ImageSVM相對于SVM和MLC分類方法其總體分類精度分別提高了6.18%和7.06%,Kappa系數(shù)分別提高了0.07和0.08;ImageRF分別提高了5.93%和6.82%,Kappa系數(shù)分別提高了0.07和0.08,均能確保森林資源調(diào)查成果的精細化、準確性、高效性;尤其是具有紅邊波段的RapidEye遙感影像在林地類型精細識別方面的顯著優(yōu)勢,將在林地類型精準監(jiān)測、時空變化信息提取以及森林空間結(jié)構(gòu)分析等方面發(fā)揮重要作用,為國產(chǎn)GF-6衛(wèi)星數(shù)據(jù)在林地類型精細識別和精準監(jiān)測研究打下堅實的基礎(chǔ)。②相對于無紅邊波段的GF-1遙感數(shù)據(jù),攜帶紅邊波段的RapidEye數(shù)據(jù)對林地類型具有較高的識別精度和可分性。其中,ImageSVM法對各類影像的總體分類精度為 90.26%(RapidEye)>90.18%(GF-1); ImageRF 法為 90.73%(GF-1)>90.02%(RapidEye); SVM 法為 84.08%(RapidEye)>81.15%(GF-1); MLC 法為 90.26%(RapidEye)>90.18%(GF-1)。 相同方法, 不同數(shù)據(jù)情況下,RapidEye數(shù)據(jù)的總體分類精度均最優(yōu)。③以RapidEye遙感影像為數(shù)據(jù)源,通過對比傳統(tǒng)支持向量機分類和歸一化紅邊指數(shù)參與下的支持向量機分類精度驗證結(jié)果可知:分類精度提高了7.61%。紅邊波段信息對林地具有很好的區(qū)分性,可極大提高林地類型的精細識別精度。同時,對比基于樣本的面向?qū)ο蠓诸惙ê蛡鹘y(tǒng)SVM和MLC分類法的分類精度可知:該方法的分類精度均高于2種傳統(tǒng)的分類方法,滿足林地類型精細分類要求,但是其自動化程度低、費時費力、受人為因素影響較大,不適合大區(qū)域林地類型精細識別研究。
表4 同一范圍相同運行環(huán)境下數(shù)據(jù)運行效率對比研究Table 4 Comparative study on data operation efficiency under the same operating environment of the same range
本研究取得了一定的研究成果,同時也存在諸多的問題與不足:①林地類型的精細識別依賴于影像對象特征具有高度的可分性,但僅依靠影像對象顏色、紋理、幾何等低層次特征,還不足以對光譜特征極其相似的不同林地類型進行精細識別。對攜帶紅邊波段信息的遙感數(shù)據(jù),充分應(yīng)用歸一化紅邊指數(shù)、信息熵、波段均值等特征對林地類型進行精細識別。②根河市生態(tài)站具有典型性和代表性,以落葉松為主的針葉純林、以白樺和楊樹為主的落葉闊葉林以及天然灌木林具有明顯的時空特征。落葉闊葉林、灌木林及其他林地未進一步細分,且該區(qū)域火燒跡地經(jīng)過多年自然恢復均已變?yōu)楣嗄玖?,故未精細分出。本研究所采用的方法在其他區(qū)域的林地類型精細識別能力及實用性在其他林區(qū)還需要進一步的驗證與評估。