楊丹 李崇貴 常錚 李煜 雷田旺
(西安科技大學,西安,710054) (西安交通工程學院)
森林作為地球上最大的陸地生態(tài)系統(tǒng),對維系生態(tài)平衡起著至關(guān)重要的作用,也是人類賴以生存和發(fā)展的基礎(chǔ)條件[1],因此,對森林資源的調(diào)查和實時監(jiān)測顯得尤為重要。傳統(tǒng)的森林資源調(diào)查因時效性差、精度低、成本高,難以符合林業(yè)的可持續(xù)發(fā)展[2]。而遙感作為一門新技術(shù),能夠有效地提高林業(yè)資源調(diào)查的質(zhì)量與效率,具有重要的社會和經(jīng)濟意義[3]。近年來,各類衛(wèi)星不斷發(fā)射,其搭載的傳感器也越來越先進,對于開展低成本和高時效的植被分類提供了新的機遇[4]。眾多國內(nèi)外學者致力于森林植被遙感分類方法研究,探索有利于實際生產(chǎn)的分類方法。Agarwal et al.[5]以不同時相的SPOT影像為數(shù)據(jù)源,結(jié)合植被物候特性,構(gòu)建歸一化植被指數(shù)(NDVI)時間序列,對中南亞地區(qū)植被進行分類,效果較理想;郝衛(wèi)平等[6]采用了多時相的MODIS數(shù)據(jù)提取了主要作物分布的空間信息;溫一博等[7]利用分層分類思想,采用7景不同時相的TM遙感影像以及多種植被指數(shù)對優(yōu)勢樹種進行分類,精度比單一時相提高了16.42%;馬婷等[8]對落葉松分類時,加入植被指數(shù)時間序列的影像,提高了森林植被的分類精度。綜合來看,利用多時相的遙感影像并結(jié)合植被指數(shù)進行植被分類,考慮了植被生長規(guī)律,分類精度大幅度提高。目前,基于深度學習、專家知識、神經(jīng)網(wǎng)絡(luò)等智能分類算法的不斷推廣,為遙感植被分類發(fā)展提供了更為廣闊的空間。有很多學者將深度學習應(yīng)用到遙感領(lǐng)域,探究其在遙感分類中的適用性[9]。全卷積神經(jīng)網(wǎng)絡(luò)由Long et al.[10]提出的一種端到端的分類方法,可以實現(xiàn)像素級分類,即語義分割。同時,許多學者基于全卷積神經(jīng)網(wǎng)絡(luò)(FCN)在各領(lǐng)域?qū)ζ溥M行改進,開發(fā)出一系列語義分割網(wǎng)絡(luò)模型,如U-Net、DeepLab等,在遙感分類上得到了廣泛的應(yīng)用[11]。許慧敏等[12]將歸一化數(shù)字表面模型(nDSM)疊加在高分辨率遙感影像上,利用優(yōu)化的U-Net進行訓練并驗證,結(jié)果表明顯著提高了影像的分類精度;孫曉敏等[13]采用U-Net方法對“高分五號”高光譜影像進行土地類型分類,模型分類精度高于支持向量機(SVM)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法;王雅慧等[14]采用深度U-Net優(yōu)化方法,對高分辨率遙感影像森林分類,在原始波段上加入歸一化植被指數(shù)構(gòu)建網(wǎng)絡(luò),優(yōu)化后的精度高于未加入NDVI的精度,并且該方法精度高于支持向量機和隨機森林的精度。因此,U-Net網(wǎng)絡(luò)對于遙感影像進行語義分割具有一定的適用價值。
綜合來看,采用多時相影像并結(jié)合植被指數(shù)進行森林樹種分類,精度大大提高,而深度學習分類方法中,大部分采用高分辨率影像,對于Landsat-8多光譜影像進行分類的研究還相對較少,并且未充分利用森林植被物候特征。因此,本文以孟家崗林場為研究區(qū),基于多時相的Landsat-8影像,以森林二類調(diào)查數(shù)據(jù)和實地調(diào)查數(shù)據(jù)為樣地數(shù)據(jù),根據(jù)各森林類別多時相的光譜曲線確定分類的最佳時相。同時,進一步構(gòu)建多時相植被指數(shù)(差值植被指數(shù)(IDVI)、增強植被指數(shù)(IEVI)以及纓帽變換中的綠度植被指數(shù)(IGVI))特征,訓練分類模型并對森林植被進行分類,對比優(yōu)化后的U-Net模型以及最大似然法分別采用單一時相和多時相植被指數(shù)的精度,為后續(xù)森林植被分類提供參考依據(jù)。
黑龍江孟家崗林場位于樺南縣東北部,地理坐標為東經(jīng)130°32′42″~130°52′36″,北緯46°20′16″~46°30′50″,林場經(jīng)營面積為16 274 hm2,以經(jīng)營落葉松(Larixgmelinii(Rupr.) Kuzen.)樹種為主的人工林基地。地貌總體表現(xiàn)為低山丘陵,坡度較為平緩,東北部地勢較高,西南部較低,海拔170~575 m。氣候條件為東亞大陸性季風氣候,年平均溫度為7 ℃,年平均降水量550 mm。該林場主要森林樹種有落葉松、樟子松(Pinussylvestrisvar. Mongolica Litv.)、紅松(PinuskoraiensisSieb. et Zucc.)等。
采用的Landsat-8遙感影像在地理空間數(shù)據(jù)云中下載,其產(chǎn)品類型為Level 1T地形矯正影像。根據(jù)研究區(qū)森林植被的生長特點,選擇4—11月的影像,利用經(jīng)緯度范圍下載4景不同時相的影像,成像時間分別為2018年4月16日、2017年6月16日、2017年8月19日、2017年10月22日,行列號為115/28,影像質(zhì)量良好。
輔助數(shù)據(jù)包括孟家崗林場矢量邊界、研究區(qū)域2014年森林資源二類調(diào)查小班矢量數(shù)據(jù)以及2017年典型樣地實地調(diào)查數(shù)據(jù),結(jié)合Google Earth影像對其區(qū)域樹種進行更新,將其類別劃分為5類,分別為落葉松、樟子松、闊葉林、針闊混交林、其他(農(nóng)作物、耕地等),并根據(jù)小班數(shù)據(jù)中的屬性字段制作優(yōu)勢樹種分布圖,用于制作深度學習標簽(見圖1)。
圖1 研究區(qū)影像及部分Label標簽
利用ENVI5.3軟件,對分辨率30 m的Landsat-8多光譜影像進行輻射定標、大氣校正,對分辨率15 m的全色影像進行輻射定標,并采用SFIM融合算法對其進行融合,得到15 m的多光譜影像,并且對影像各波段進行歸一化。采用ARCGIS Pro2.3制作深度學習樣本,通過滑動采樣的方式將影像及標簽裁剪為256×256像元。為了避免影像中各類別樣本分布不均衡,適當?shù)膶?shù)據(jù)集進行重采樣、對樣本類別少的進行過采樣等,使樣本差異減小。在模型訓練時,將數(shù)據(jù)集分為訓練集、驗證集和測試集,其中60%影像(458張)用于模型訓練;20%影像(159張)用于驗證,訓練超參數(shù);20%的影像(157張)用于測試模型精度。
由于不同地物在不同時相表現(xiàn)的光譜曲線不一致,本研究根據(jù)采集的同一套訓練樣本數(shù)據(jù),分別在4景不同時相的影像下計算平均像元值,并且繪制各地物的光譜均值曲線,分析此次分類的最佳時相。
本文根據(jù)前人的研究以及進行大量的實驗,選取了3種植被指數(shù):差值植被指數(shù)(IDVI)、增強植被指數(shù)(IEVI)以及纓帽變換中的綠度植被指數(shù)(IGVI)。其中,差值植被指數(shù)可以很好地反映植被覆蓋度的變化;增強植被指數(shù)通過藍光波段來修正大氣對紅光波段的影響,以增強植被信息,適用于高植被覆蓋區(qū)的植被生長情況;纓帽變換中的綠度植被指數(shù)反映地面植被的綠度。計算公式如下:
IDVI=BNIR-BR;
IEVI=2.5×[(BNIR-BR)/(BNIR+6.0BR-7.5BB+1)];
IGVI=-0.294 2BB-0.243 0BG-0.542 4BR+0.727 6BNIR+
0.071 3BSWIR1-0.160 8BSWIR2。
式中:BR、BG、BB、BSWIR1、BSWIR2、BNIR分別為紅光、綠光、藍光、短波紅外1、短波紅外2以及近紅外波段的反射率。
U-Net模型是FCN的改進和延伸,它沿用了FCN進行圖像語義分割的思想,即利用卷積層、池化層進行特征提取,再利用反卷積層還原圖像尺寸。它是一種編碼解碼/下采樣上采樣的網(wǎng)絡(luò)架構(gòu),其中編碼/上采樣稱為收縮路徑,解碼/下采樣稱為擴張路徑。收縮路徑類似于經(jīng)典的卷積網(wǎng)絡(luò),能夠有效捕捉上下文信息,擴張路徑即上采樣,旨在恢復(fù)像素尺寸,擴張路徑能夠更為精準的進行分割位置定位。
如圖2所示,從左邊輸入圖像開始,每一層使用了兩個3×3的卷積核進行卷積操作,每次卷積都進行激活函數(shù)(ReLU)和步長為2的最大池化進行下采樣。經(jīng)過4次下采樣特征圖尺寸減小。然后進入到網(wǎng)絡(luò)的擴張路徑,使用2×2的反卷積核進行上采樣,特征圖的通道數(shù)減半。與此同時,將上采樣形成的特征圖和下采樣的特征圖進行合并,為保持尺寸不被擴大,再進行3×3的卷積操作。經(jīng)過四次上采樣、特征圖合并和3×3卷積逐漸使圖像達到語義分割,同時圖像也恢復(fù)到輸入尺寸大小。
圖2 U-Net網(wǎng)絡(luò)結(jié)構(gòu)
由于參數(shù)過多,進行模型訓練時,需要耗費大量的內(nèi)存和時間,導(dǎo)致模型復(fù)雜度上升,所以在U-Net模型的基礎(chǔ)上進行改進,減少了一定的卷積核數(shù)量,同時,在卷積層和ReLu激活函數(shù)之間加入了正則化的批標準化,減少權(quán)重值的影響,加速訓練并且避免過擬合。本次實驗是基于Tensorflow 2.0+Keras深度學習框架進行,采用Adam優(yōu)化算法訓練網(wǎng)絡(luò),學習率設(shè)置為0.001。實驗配置為Intel(R) Core(TM) i5-3230M CPU@2.60GHz,NVIDIA GeForce GT 740M。
最大似然分類法(MLC)是一種典型的基于貝葉斯準則并且應(yīng)用廣泛的監(jiān)督分類方法,主要依據(jù)光譜性質(zhì)相似來判別地物的類別。假設(shè)訓練樣本的光譜特征屬于隨機事件,各類的分布函數(shù)服從正態(tài)分布,根據(jù)訓練樣本的均值和方差,通過求出未知像元對各類別的歸屬概率,將該像元分到歸屬概率大的一類。本次實驗采用ENVI 5.3進行分類。
以外業(yè)調(diào)查樣本為各類別的真值,對分類結(jié)果進行檢驗,通過混淆矩陣計算總體分類精度、Kappa系數(shù),評判各分類方法的效果。本次實驗兩種方法均采用同一套驗證樣本進行驗證。
由圖3可知,4月16日影像,各森林植被處于生長初期,均發(fā)生在發(fā)芽階段,各類別的光譜變化曲線規(guī)律較為一致,并且各類別光譜值有一定的差異。6月16日的影像各森林植被與其他類型有明顯差異,而各森林植被之間處于生長期,光譜曲線變化類似,僅在近紅外波段能相對區(qū)分,其中闊葉林的光譜值最高,其他類別之間差異較小,區(qū)分度不高。8月19日的影像中,前4個波段很難區(qū)分各地物,近紅外波段有一定的差異,其中落葉松和針闊混交林差異較小,不易區(qū)分。10月22日獲取的影像處于生長末期,落葉松、闊葉樹均進入落葉階段,樟子松為全年常綠植被,光譜曲線值與其他時相基本一致,TM6、TM7有利于將樟子松、針闊混交林、其他類型和落葉松、闊葉林區(qū)分,TM5有利于區(qū)分落葉松和闊葉林,同時各森林類別在其他波段光譜曲線大體一致,且具有較小的差異,相比其他時相來說,最有利于分類。同時,前人研究也發(fā)現(xiàn)秋季影像更利于區(qū)分森林植被,因此,選取10月22日的影像進行單時相分類。
在單時相的基礎(chǔ)上,探索加入多時相植被指數(shù)U-Net分類效果,因此,計算各生長階段的植被指數(shù)并繪制曲線圖,分析各森林類別之間的差異,選取有利于分類的最佳特征組合。
由圖4所示,各森林植被差值植被指數(shù)值的變化趨勢,闊葉林在夏季具有較大的差值植被指數(shù)值;樟子松的差值植被指數(shù)值在各時相之間變化較小,四季常綠,均與其他類別有明顯差異;落葉松和針闊混交林在6—8月份差值植被指數(shù)變化趨勢相似,且差異較小,4月份與10月份兩者有明顯差異,但易與其他類別混分。6月19日的差值植被指數(shù),有利于將闊葉林、樟子松、其他農(nóng)作物和落葉松、針闊混交林區(qū)分開。
圖3 不同時相各類別光譜均值曲線
圖4 差值植被指數(shù)時間序列曲線
由圖5可知,各森林植被類別增強植被指數(shù)具有相似的變化趨勢,其他類別在6月份增強植被指數(shù)值較小,且易與其他森林類別區(qū)分;在6月份與10月份,森林植被增強植被指數(shù)差異明顯,各類別之間易于區(qū)分。因此,4月10日、6月19日和10月22日的增強植被指數(shù)參與分類,有利于提高分類精度,降低分類模型的不確定性。
由圖6可知,在夏季闊葉林的綠度植被指數(shù)值大于針葉;樟子松四季常綠,其綠度植被指數(shù)值在4個時相變化較?。宦淙~松和針闊混交林,在夏季綠度植被指數(shù)值基本一致,在4月份與10月份綠度值有明顯差異,可能落葉松處于生長初期和落葉階段,綠度植被指數(shù)較針闊混交林小。因此,6月19日的綠度植被指數(shù)有利于區(qū)分闊葉林、樟子松、其他與落葉松、針闊混交林。
圖5 增強植被指數(shù)時間序列曲線
圖6 綠度植被指數(shù)時間序列曲線
將單一時相影像和加入多時相植被指數(shù)影像分別采用優(yōu)化后的U-Net模型進行分類,比較該方法在兩種數(shù)據(jù)集中的表現(xiàn)效果。同時,采用最大似然法進行分類對比實驗。
將訓練集及驗證集影像按批次輸入到優(yōu)化的U-Net模型,經(jīng)過多次訓練,精度和損失率達到穩(wěn)定狀態(tài),通過訓練好的模型對測試數(shù)據(jù)進行驗證。由表1可知,采用U-Net方法分類時,結(jié)合多時相植被指數(shù)分類的總體精度為83.5%,Kappa系數(shù)為0.791 7,比采用單時相分類精度高6.1%;采用最大似然分類法時,加入多時相植被指數(shù)的分類精度為74.4%,比單一時相分類精度高2.3%。無論是采用單一時相還是多時相植被指數(shù),采用U-Net方法均比最大似然法精度高。
對測試集數(shù)據(jù)進行預(yù)測,隨機選取3張256×256像元大小的子圖,對比不同分類方法的效果(見圖7)。由圖7可知,最大似然分類結(jié)果地物較粗糙,存在較多細小錯分的現(xiàn)象,而U-Net分類結(jié)果較之精細。同時,通過對比發(fā)現(xiàn),加入多時相植被指數(shù)后的分類效果比未加入時要好,說明加入多時相植被指數(shù)利用了植被物候生長特性,在一定程度上可以提高分類精度。對比各森林類別的分類效果,發(fā)現(xiàn)闊葉林、落葉松、樟子松分別與針闊混交林存在誤分現(xiàn)象,主要是由于針闊混交林中存在部分闊葉林和落葉松,導(dǎo)致光譜值差異較小,容易造成誤分。整體來看,U-Net分類比最大似然分類效果要好,并且減少了“椒鹽”現(xiàn)象。
表1 分類結(jié)果精度評價
a為單時相最大似然分類法;b為多時相植被指數(shù)最大似然分類法;c為單時相U-Net方法;d為多時相植被指數(shù)U-Net方法;e為真實地物類別。
以多時相的Landsat-8影像為遙感源,根據(jù)森林植被的生長規(guī)律,結(jié)合多時相植被指數(shù),探究優(yōu)化后的U-Net模型對森林植被的分類效果,并與最大似然法進行對比試驗。通過實驗分析,加入多時相植被指數(shù)時,U-Net分類方法和最大似然分類法精度明顯都高于單一時相影像的分類精度,說明加入植被指數(shù),結(jié)合了植被的物候特性,有利于區(qū)分森林各類別;對比U-Net分類方法和最大似然法的分類精度,發(fā)現(xiàn)優(yōu)化后的U-Net分類方法比最大似然分類法精度高,說明該模型能夠有效地對森林植被進行分類。因此,隨著大數(shù)據(jù)、云計算以及人工智能的發(fā)展,深度學習方法的廣泛應(yīng)用,采用優(yōu)化的U-Net模型對提高森林植被分類精度有一定的參考價值。