董建康,連 懿,2,趙之江,張 虎,馮晨陽(yáng)
(1.天津師范大學(xué)地理與環(huán)境科學(xué)學(xué)院,天津 300387;2.中國(guó)科學(xué)院國(guó)家天文臺(tái),北京 100012)
林地具有緩解全球氣候變化、改善生態(tài)環(huán)境和維護(hù)生態(tài)平衡等生態(tài)系統(tǒng)服務(wù)功能.提取林地信息可以監(jiān)測(cè)林地變化、預(yù)測(cè)林地密度,有助于管理和維護(hù)林地生態(tài)系統(tǒng).傳統(tǒng)獲取林地信息的方法效率低、時(shí)效性差且成本較高,而遙感信息技術(shù)憑借實(shí)時(shí)、快速等優(yōu)勢(shì)成為獲取林地信息的重要手段[1-2],為林地提取提供了豐富的數(shù)據(jù)來(lái)源,如GF-1、MODIS、Sentinel-2和Landsat系列等中等空間分辨率衛(wèi)星影像數(shù)據(jù)以及IKONOS、QuickBird和WorldView系列等高空間分辨率衛(wèi)星影像數(shù)據(jù)[3].中等分辨率的影像數(shù)據(jù)空間分辨率較低,對(duì)零散林地的識(shí)別效果不佳,且難以及時(shí)獲得特定研究區(qū)域的高分辨率衛(wèi)星影像數(shù)據(jù).無(wú)人機(jī)遙感技術(shù)因具有低成本、低風(fēng)險(xiǎn)、高時(shí)效、高分辨率、不受云層影響和自由規(guī)劃航線等特點(diǎn),很好地解決了這些問(wèn)題[4],更適合特定區(qū)域遙感監(jiān)測(cè)的應(yīng)用場(chǎng)景[5-6].
近年來(lái),研究人員基于不同種類遙感影像數(shù)據(jù),采用多種方法開(kāi)展林地信息提取方法的研究[7-9].各類遙感數(shù)據(jù)中,衛(wèi)星影像和雷達(dá)數(shù)據(jù)已廣泛應(yīng)用于林地提取.Lu等[10]利用極化與干涉信息融合的SAR數(shù)據(jù)進(jìn)行林地提取;Dong等[11]基于中高分辨率的MODIS數(shù)據(jù)提出了一種林地提取方法.雷達(dá)數(shù)據(jù)雖然能夠獲取林地的三維特征信息,但處理過(guò)程較為復(fù)雜,所需成本較高;衛(wèi)星數(shù)據(jù)雖具有宏觀觀測(cè)的優(yōu)勢(shì),但由于空間分辨率的制約,其對(duì)小范圍特定研究區(qū)的提取精度有限,無(wú)人機(jī)遙感的發(fā)展有效解決了這些問(wèn)題.機(jī)器學(xué)習(xí)方法中,隨機(jī)森林法和支持向量機(jī)法均可以完成林地的識(shí)別.黃建文等[1]基于高分六號(hào)衛(wèi)星多光譜數(shù)據(jù)提出隨機(jī)森林的分層分類法用于人工林地提?。辉牡萚12]以高景一號(hào)遙感影像為數(shù)據(jù)源,基于支持向量機(jī)(support vector machines,SVM)分類器進(jìn)行林地提取.機(jī)器學(xué)習(xí)算法的優(yōu)點(diǎn)是算法簡(jiǎn)單,運(yùn)行速度快,但無(wú)法處理復(fù)雜的分類問(wèn)題,此外,面對(duì)大數(shù)據(jù)量的問(wèn)題時(shí)會(huì)表現(xiàn)出不穩(wěn)定性,識(shí)別結(jié)果的精度受到限制;而深度學(xué)習(xí)算法很好地解決了機(jī)器學(xué)習(xí)算法無(wú)法處理復(fù)雜分類的問(wèn)題,成為當(dāng)前的研究熱點(diǎn)[13].
基于多源遙感數(shù)據(jù)的林地提取研究有很多,但大多只考慮提取精度,對(duì)林地提取效率和成本方面的研究較少.本研究運(yùn)用數(shù)據(jù)降維思想[14],在綜合考慮效率和準(zhǔn)確度的基礎(chǔ)上,利用高空間分辨率無(wú)人機(jī)多光譜數(shù)據(jù)和深度學(xué)習(xí)方法提取林地,并對(duì)以無(wú)人機(jī)遙感作為數(shù)據(jù)源和深度學(xué)習(xí)算法的優(yōu)點(diǎn)進(jìn)行分析,提出了一種林地提取方法,并通過(guò)選擇特定研究區(qū)域來(lái)驗(yàn)證分析.
研究區(qū)位置以及樣本分布如圖1所示.由圖1可以看出,研究區(qū)為位于天津市西青區(qū)天津師范大學(xué)內(nèi)的部分區(qū)域(117°7′15″E~117°7′25″E,39°3′25″N~39°3′38″N).天津師范大學(xué)地處北半球中緯度亞歐大陸東岸,屬溫帶季風(fēng)氣候,四季分明,冷暖適中,年平均氣溫約14℃,適宜多種植物生長(zhǎng).研究區(qū)地形起伏較小,面積約為0.091 km2,區(qū)域內(nèi)植被覆蓋種類繁多,包含喬木、灌木、草地和稀疏草地等,林地類型主要為落葉闊葉林.此外,研究區(qū)貼近生活區(qū),方便觀察記錄,有助于研究的順利展開(kāi).
圖1 研究區(qū)位置示意圖和樣本分布情況Fig.1 Location of the studied area and distribution of samples
1.2.1 數(shù)據(jù)獲取
本研究使用的六旋翼無(wú)人機(jī)是一種具備垂直升降和懸停等靈活飛行性能優(yōu)勢(shì)的無(wú)人機(jī),它通過(guò)上下共軸放置的3組共6個(gè)電機(jī)提供升力,通過(guò)改變旋翼轉(zhuǎn)速來(lái)調(diào)整姿態(tài),進(jìn)一步實(shí)現(xiàn)位置控制,具有懸停性能優(yōu)異、移動(dòng)靈活、機(jī)械結(jié)構(gòu)緊湊和零部件可靠性高等優(yōu)點(diǎn)[15].無(wú)人機(jī)平臺(tái)搭載的傳感器為Tetracam公司生產(chǎn)的Micro MCA12 Snap多光譜攝相機(jī)陣列成像系統(tǒng),該系統(tǒng)質(zhì)量輕、體積小且能實(shí)現(xiàn)遠(yuǎn)程觸發(fā),適用于無(wú)人機(jī)搭載.傳感器各波段的波長(zhǎng)及波寬如表1所示.該相機(jī)可以同時(shí)獲取自由組合的12個(gè)波段的影像數(shù)據(jù),且能夠?qū)?shù)據(jù)實(shí)時(shí)記錄在大容量高速SD閃迪卡內(nèi),為成功獲取影像提供了保障.
表1 傳感器各波段波長(zhǎng)及波寬Tab.1 Wavelength and bandwidth of each band of the sensor
本次實(shí)驗(yàn)拍攝時(shí)間為2019年7月30日,此時(shí)段內(nèi)植被長(zhǎng)勢(shì)茂盛,天氣狀況良好,風(fēng)力影響較小.本研究利用搭載了傳感器的無(wú)人機(jī)拍攝,獲得了空間分辨率為0.05 m的無(wú)人機(jī)多光譜影像,包含490~950 nm的12個(gè)波段數(shù)據(jù),其中前8個(gè)位于可見(jiàn)光波段范圍,后4個(gè)位于近紅外波段范圍[16].
1.2.2 數(shù)據(jù)處理
無(wú)人機(jī)的數(shù)據(jù)處理主要包括幾何校正和輻射校正.數(shù)據(jù)處理工作中,將測(cè)得的一部分地面控制點(diǎn)數(shù)據(jù)作為控制點(diǎn)用于攝影測(cè)量處理時(shí)的幾何校正,另一部分作為檢查點(diǎn)用于驗(yàn)證無(wú)人機(jī)多光譜影像幾何校正的精度,利用檢查點(diǎn)的均方根誤差(root mean square error,RMSE)評(píng)價(jià)幾何校正的精度.對(duì)所有檢查點(diǎn)進(jìn)行誤差統(tǒng)計(jì)發(fā)現(xiàn),檢查點(diǎn)的平面誤差為0.2 m,高程誤差為0.4 m.參照《CH/Z 3003-2010低空數(shù)字航空攝影測(cè)量?jī)?nèi)業(yè)規(guī)范》[17]可知,較平坦地區(qū)的成圖比例尺為1∶500的數(shù)字正射影像圖平面檢查點(diǎn)誤差應(yīng)不大于0.5 m且高程檢查點(diǎn)誤差不大于0.4 m,因此本次幾何校正符合要求.
通過(guò)在研究區(qū)內(nèi)設(shè)置典型的定標(biāo)點(diǎn),利用ASD光譜儀進(jìn)行地面測(cè)量實(shí)驗(yàn),獲得目標(biāo)地物的純凈反射光譜值.通過(guò)線性回歸耦合無(wú)人機(jī)影像上對(duì)應(yīng)像元點(diǎn)的像元亮度值(digital number,DN),求出任意波段處的增益和偏移量,建立DN值與反射率之間的相互關(guān)系,實(shí)現(xiàn)無(wú)人機(jī)多光譜影像的輻射校正[16].具體步驟為:①假設(shè)圖像DN值與反射率間存在線性關(guān)系,r=gain·DN+bias,其中r為某一波段的地表反射率,gain和bias分別為相應(yīng)的增益和偏移;②確定地面測(cè)量區(qū)域與影像像元的空間對(duì)應(yīng)關(guān)系;③通過(guò)所測(cè)數(shù)據(jù)建立DN值與地物反射率的線性回歸關(guān)系;④用擬合優(yōu)度評(píng)價(jià)校正結(jié)果精度,并對(duì)評(píng)價(jià)結(jié)果進(jìn)行顯著性檢驗(yàn)[16].DN值與反射率間的關(guān)系如圖2所示,圖2中R2為度量擬合優(yōu)度的系數(shù),最大值為1,其值越接近1說(shuō)明回歸直線對(duì)觀測(cè)值的擬合程度越好.
圖2 DN值與地物反射率的關(guān)系Fig.2 Relationship between the DN value and the reflectivity of ground objects
表2為顯著性檢驗(yàn)結(jié)果,當(dāng)計(jì)算出的顯著性概率值P<0.05時(shí),說(shuō)明擬合關(guān)系顯著有效.由圖2可知,多光譜數(shù)據(jù)中多數(shù)波段的R2>0.9,只有少數(shù)波段的R2<0.9,但也接近,且表2中各波段P值均明顯小于0.05.由此可知,本研究方法進(jìn)行輻射校正的效果良好.
表2 顯著性檢驗(yàn)Tab.2 Significance test
為了更好地提取林地信息,本研究對(duì)處理后的影像進(jìn)行主成分分析降維和相關(guān)性分析.首先選取貢獻(xiàn)度高的主成分特征波段與相關(guān)性分析篩選后的特征波段進(jìn)行波段融合,再利用U-Net網(wǎng)絡(luò)實(shí)現(xiàn)區(qū)域的林地提取[18-19],最后評(píng)價(jià)提取結(jié)果的精度并針對(duì)分類中存在的問(wèn)題展開(kāi)討論,對(duì)應(yīng)的技術(shù)流程如圖3所示.
圖3 技術(shù)流程圖Fig.3 Technical flowchart
在林地識(shí)別的過(guò)程中,大量多光譜信息無(wú)疑會(huì)增加訓(xùn)練網(wǎng)絡(luò)的復(fù)雜性,利用原變量之間的相互關(guān)系以及降維的思想,使用較少的新變量代替原來(lái)較多的變量,能夠讓多個(gè)有用信息集中到少數(shù)幾個(gè)相互獨(dú)立的波段,對(duì)多光譜數(shù)據(jù)進(jìn)行波段篩選將極大地提升提取效率.本研究主要采用主成分分析和相關(guān)性分析的方法來(lái)實(shí)現(xiàn)分類特征的重構(gòu)和篩選.
2.2.1 主成分分析
本研究所用無(wú)人機(jī)多光譜影像波段數(shù)較多,造成影像的數(shù)據(jù)維度較大,給林地信息提取帶來(lái)諸多不便,為此需要運(yùn)用PCA對(duì)數(shù)據(jù)進(jìn)行降維處理[20].PCA又稱主分量分析或矩陣數(shù)據(jù)分析,它通過(guò)變量變換的方法把相關(guān)變量變?yōu)槿舾刹幌嚓P(guān)的綜合指數(shù)變量,實(shí)現(xiàn)對(duì)數(shù)據(jù)集的降維,從而簡(jiǎn)化問(wèn)題,是一種基本的數(shù)據(jù)降維方法,在多光譜數(shù)據(jù)壓縮、去相關(guān)和特征提取中發(fā)揮了重要作用[21].
2.2.2 相關(guān)性分析
相關(guān)性分析指對(duì)2個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,衡量2個(gè)變量因素的相關(guān)密切程度,確定元素間相關(guān)關(guān)系的存在、呈現(xiàn)的形態(tài)和方向及其密切程度.一般通過(guò)統(tǒng)計(jì)相關(guān)波段間的相關(guān)性系數(shù)來(lái)衡量波段間的冗余程度.相關(guān)性系數(shù)代表了波段間像元灰度值的重疊度,其值越大說(shuō)明波段間數(shù)據(jù)重疊度越高,冗余信息越多[21].為了減少多余信息,要盡可能選擇相關(guān)系數(shù)小的波段.
U-Net網(wǎng)絡(luò)框架是Ronneberger等[22]在2015年提出的,其最初是為了解決生物醫(yī)學(xué)圖像方面的問(wèn)題,后來(lái)被廣泛應(yīng)用于語(yǔ)義分割的各個(gè)方向.U-Net網(wǎng)絡(luò)結(jié)構(gòu)主要包含下采樣、上采樣和跳躍連接3個(gè)部分,結(jié)構(gòu)模型如圖4所示.網(wǎng)絡(luò)中較淺的高分辨率層可以用來(lái)解決像素定位問(wèn)題,較深層可以用來(lái)解決像素分類的問(wèn)題,從而實(shí)現(xiàn)圖像語(yǔ)義級(jí)別的分割.U-Net的結(jié)構(gòu)包括1個(gè)捕獲上下文信息的收縮路徑和一個(gè)允許精確定位的對(duì)稱拓展路徑.通過(guò)這種方法,使用非常少的數(shù)據(jù)即可完成端到端的訓(xùn)練,并獲得很好的效果[23].U-Net網(wǎng)絡(luò)模型具有跳躍連接的編碼和解碼結(jié)構(gòu),能夠融合不同層的特征,對(duì)特征較少的圖像分類也具有非常好的效果.
圖4 U-Net網(wǎng)絡(luò)模型Fig.4 U-Net network model
本研究對(duì)原始影像進(jìn)行主成分分析,結(jié)果如圖5所示.
圖5 主成分分析結(jié)果Fig.5 Results of principal component analysis
由圖5可以看出,少數(shù)幾個(gè)主成分因子能夠提取原始指標(biāo)變量的大部分信息,且彼此之間互不相關(guān).前3個(gè)分量特征具有約99.3%的特征信息,其中第一主成分包含圖像信息的84.8%,其他成分包含的有效信息較少.為了最大限度保留原始空間的主要信息,在不減少有效信息的前提下降低特征空間的維數(shù),提高數(shù)據(jù)表示效果,本研究選取第一主成分、第二主成分和第三主成分.
無(wú)人機(jī)多光譜數(shù)據(jù)的波段較多,而針對(duì)特定地物而言,波段間(尤其是非峰值波段之間)存在的冗余信息多,研究顯示相互間關(guān)聯(lián)性小的波段其相關(guān)性越小,波段的標(biāo)準(zhǔn)差越大,因此對(duì)各波段進(jìn)行相關(guān)性分析,結(jié)果如圖6所示.
圖6 相關(guān)性分析結(jié)果Fig.6 Correlation analysis results
由圖6可以看出,12個(gè)波段的相關(guān)性分為2大組:①波段1~8之間相關(guān)性系數(shù)偏高,相關(guān)性系數(shù)平均值由小到大依次排序?yàn)椋?<6<1<3<4<7<2<8;②波段9~12之間相關(guān)性系數(shù)偏高,相關(guān)性系數(shù)平均值由小到大依次排序?yàn)椋?2<9<10<11;③2個(gè)波段組間的相關(guān)性要明顯小于組內(nèi)各波段間的相關(guān)性.比較分析各波段與其他波段相關(guān)性大小可知,波段5和波段12是與其他波段相關(guān)性均值最小的波段,波段8和波段11則是與波段5和波段12相關(guān)性最小的波段.因此,綜合分析后本研究選取了波段5、波段8、波段11和波段12這4個(gè)相關(guān)性較小的波段與前3個(gè)主成分作為林地提取的數(shù)據(jù).
將相關(guān)性分析結(jié)果與PCA結(jié)果進(jìn)行組合,所得影像兼顧了波段的信息量和獨(dú)立性,波段組合信息量充足且相關(guān)性低,有利于林地信息的提取.
基于野外考察數(shù)據(jù)和無(wú)人機(jī)多光譜影像,將研究區(qū)分為訓(xùn)練區(qū)和驗(yàn)證區(qū),將目視解譯結(jié)果作為U-Net網(wǎng)絡(luò)模型的真實(shí)數(shù)據(jù),建立訓(xùn)練集和測(cè)試集,其中訓(xùn)練樣本共包括208個(gè)圖斑,共計(jì)2 636 953個(gè)像元.在此基礎(chǔ)上,利用U-Net網(wǎng)絡(luò)模型進(jìn)行10輪訓(xùn)練,每輪迭代次數(shù)為1 000次,總迭代次數(shù)為10 000次,并利用該模型對(duì)研究區(qū)進(jìn)行林地提取,結(jié)果如圖7所示,圖7中綠色部分為正確提取的林地,藍(lán)色部分為漏分的林地,紅色部分為錯(cuò)分的林地.由圖7可以看出,該模型有效實(shí)現(xiàn)了研究區(qū)林地信息的識(shí)別,對(duì)所有紋理復(fù)雜的林地信息均基本判斷準(zhǔn)確.
圖7 林地提取結(jié)果Fig.7 Results of forest land extraction
本研究的總體精度采用正確率、錯(cuò)分率和漏分率進(jìn)行表征.錯(cuò)分誤差(commission error,CE)指被分為林地,而實(shí)際上屬于其他類別的像元占林地提取結(jié)果的百分比.
式(1)中:Ns為林地提取結(jié)果的總像元數(shù);Nt為正確提取的林地像元數(shù).
漏分誤差(omission error,OE)指本屬于林地地類,但沒(méi)有被分為林地的像元數(shù)占林地提取結(jié)果的百分比.
式(2)中:Nr為驗(yàn)證樣本的像元個(gè)數(shù).本研究將人工識(shí)別所得樣本作為驗(yàn)證樣本.
總體精度(overall accuracy,OA)指被正確分類的像元數(shù)占總像元數(shù)的百分比.
研究區(qū)林地識(shí)別的正確率、錯(cuò)分率和漏分率分別為84.79%、15.21%和15.78%,基本滿足林地提取的需要,但也存在錯(cuò)分和漏分現(xiàn)象.圖7(a)所示的區(qū)域A中,對(duì)于一些零散單株樹(shù)木的提取效果不理想,主要原因是模型訓(xùn)練過(guò)程中零散樹(shù)木的樣本較少,訓(xùn)練樣本不足,其次是單株樹(shù)木所占面積較小,包含的林地信息較少,易造成漏分.區(qū)域B(圖7(b))中將部分草地錯(cuò)分為林地是由于該區(qū)域林地周圍的草地密集程度較高,且實(shí)地調(diào)查結(jié)果表明,該區(qū)域草地的生物多樣性比較豐富,而在圖像中的表征紋理相對(duì)復(fù)雜,導(dǎo)致該區(qū)域草地圖像表現(xiàn)的卷積特征與林地更加類似,容易造成錯(cuò)分.區(qū)域C(圖7(c))中錯(cuò)分為林地的地物是水體中的蘆葦,相比草地,蘆葦在高度和紋理復(fù)雜度上都更接近林地,因此在波段信息中與林地相似度更高,在研究區(qū)中是錯(cuò)分為林地最多的地物,在訓(xùn)練模型中沒(méi)能有效地區(qū)分蘆葦和林地,這是造成錯(cuò)分的主要原因.區(qū)域D(圖7(d))中林地邊緣的提取效果較差,在地物邊緣位置存在一些像元尺度錯(cuò)分和漏分的區(qū)域,這可能是由于高分辨率遙感影像上的信息高度細(xì)節(jié)化以及混合像元與隨機(jī)噪聲的影響導(dǎo)致對(duì)像元級(jí)林地邊緣的提取效果不理想.
本研究基于高空間分辨率無(wú)人機(jī)多光譜數(shù)據(jù),提出一種篩選特征波段結(jié)合卷積神經(jīng)網(wǎng)絡(luò)U-Net的方法,對(duì)影像進(jìn)行分割并提取林地信息,并通過(guò)深度學(xué)習(xí)算法構(gòu)建了基于U-Net的林地分割模型,對(duì)模型提取結(jié)果進(jìn)行精度驗(yàn)證和評(píng)價(jià)分析,得到以下結(jié)論:
(1)林地提取的總體分類精度為84.79%,說(shuō)明本方法能夠較好地區(qū)分林地和其他地物,達(dá)到較高的精度水平,表明此方法能夠?qū)崿F(xiàn)小尺度區(qū)域林地資源調(diào)查和變化監(jiān)測(cè),具有可行性、有效性和一定的應(yīng)用價(jià)值.
(2)本方法的優(yōu)勢(shì)主要體現(xiàn)在神經(jīng)網(wǎng)絡(luò)模型的選取和特征波段的篩選上.因神經(jīng)網(wǎng)絡(luò)一般需要依賴大量的樣本訓(xùn)練才能達(dá)到較高的精度,時(shí)間成本比較高,而U-Net使用較少的訓(xùn)練樣本即可達(dá)到良好的訓(xùn)練結(jié)果,相比其他網(wǎng)絡(luò)模型具有更高的訓(xùn)練效率.特征波段的選擇通過(guò)主成分分析減少了數(shù)據(jù)維度和數(shù)據(jù)冗余,通過(guò)相關(guān)性分析又進(jìn)一步減少了數(shù)據(jù)量,且在減少多余數(shù)據(jù)的基礎(chǔ)上充分利用了影像的光譜特征和紋理特征,避免了僅依靠單一特征提取林地造成的提取結(jié)果不準(zhǔn)確的問(wèn)題,對(duì)陰影也有較好的區(qū)分,提高了訓(xùn)練的效率和準(zhǔn)確度.
(3)本研究?jī)H利用無(wú)人機(jī)多光譜數(shù)據(jù)進(jìn)行林地信息提取,實(shí)現(xiàn)小范圍特定研究區(qū)的林地資源調(diào)查,具有一定的片面性,其他地區(qū)的提取精度能否達(dá)到較高水平還有待驗(yàn)證.因此,如何結(jié)合多源遙感數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)間的優(yōu)勢(shì)互補(bǔ),彌補(bǔ)無(wú)人機(jī)影像數(shù)據(jù)自身缺陷,實(shí)現(xiàn)更大尺度的林地監(jiān)測(cè),進(jìn)一步提高林地信息提取精度還有待進(jìn)一步研究.