沈成 王洋 王紅兵 蔣俊祎
(??诤Q蟮刭|(zhì)調(diào)查中心 海南省??谑?570100)
紅樹林是大自然最重要的生態(tài)系統(tǒng)之一,在海岸帶生態(tài)保護(hù)上有著不可替代的作用。我國紅樹林主要分布在沿海的河口、瀉湖和海灣等地區(qū),其面積在過去幾十年經(jīng)歷了“急劇減少-維持穩(wěn)定-緩慢增加”的變化過程[1]。紅樹林是汕頭濕地生態(tài)系統(tǒng)的重要組成部分,而流經(jīng)于此的韓江,則是我國海岸線最長、紅樹林面積最大的廣東省第二大河流,為我國六大三角洲之一。韓江三角洲地區(qū)的生態(tài)保護(hù)對沿海地區(qū)經(jīng)濟(jì)發(fā)展和生態(tài)安全具有重要意義[2]。
歷史上韓江三角洲地區(qū)紅樹林分布廣泛;改革開放初期,由于人為圍墾開發(fā),僅余一些次生林,面積縮減超過50%[3];自2000年開始,當(dāng)?shù)卣匾曆睾<t樹林生態(tài)環(huán)境問題,種植了一定規(guī)模的紅樹林,并引種了無瓣海桑等紅樹林樹種,現(xiàn)階段主要為人工林[4][5]。
近年來,遙感技術(shù)的不斷發(fā)展和機(jī)器分類算法的崛起加快了圖像識別的智能化進(jìn)程,當(dāng)前,已有許多先進(jìn)的機(jī)器集成算法和分類器已經(jīng)運(yùn)用到了遙感圖像分類。通過對遙感數(shù)據(jù)進(jìn)行充分挖掘和分析,不僅優(yōu)化了了傳統(tǒng)圖像分類上數(shù)據(jù)處理信息損失問題,還大大降低了人力消耗和人為主觀因素造成的誤差。近幾十年來,機(jī)器學(xué)習(xí)算法的發(fā)展從較為簡易的監(jiān)督分類、BP神經(jīng)網(wǎng)絡(luò)分類方法逐漸發(fā)展到RF(隨機(jī)森林)、CNN(卷積神經(jīng)網(wǎng)絡(luò))等高新的機(jī)器分類算法,這極大地提高了遙感影像分類的精度以及速率[6]。
我國也已有眾多學(xué)者將機(jī)器學(xué)習(xí)的圖像分類技術(shù)用于紅樹林的種間識別上,并取得了卓越的成績。馬云梅等[7]利用GF-2數(shù)據(jù),通過對光譜特征數(shù)據(jù)重構(gòu),基于支持向量機(jī)分類方法,對廣西海岸帶紅樹林開展種間精細(xì)分類研究;蒙良莉[8]等基于哨兵光學(xué)影像數(shù)據(jù),利用隨機(jī)森林算法進(jìn)行特征選擇,并構(gòu)建多種特征組合方案,成功的對區(qū)內(nèi)紅樹林進(jìn)行識別和提取;袁勝[9]利用GEE云平臺結(jié)合廣西沿海地區(qū)紅樹林實(shí)地調(diào)查數(shù)據(jù),基于像元的隨機(jī)森林方法識別、提取研究區(qū)紅樹林,驗(yàn)證了隨機(jī)森林在紅樹林識別上的優(yōu)勢?;诖?,本研究擬采用隨機(jī)森林和支持向量機(jī)的機(jī)器學(xué)方法,開展韓江東溪入??诩t樹林空間分布信息分類提取研究,并橫向?qū)Ρ绕浞诸惥取?/p>
研究區(qū)位于汕頭市澄海區(qū)韓江三角洲出???,由北港入海,東北接潮州市饒平縣,西北接潮州市,西南毗鄰汕頭市龍湖區(qū),東與南澳縣隔海相望,地理坐標(biāo)為東經(jīng)116°50-116°53',北緯23°26'- 23°30'。沿海潮汐為不正規(guī)半日潮,平均潮差約1m。沿海潮間帶以紅樹林為主,樹種主要為無瓣海桑、秋茄和少量桐花樹。如圖1所示。
圖1:研究區(qū)紅樹林分布圖
本文的遙感影像來自于美國地質(zhì)調(diào)查局(USGS)網(wǎng)站(https://glovis.usgs.gov/),云量低于5%,整體質(zhì)量較好,獲取日期為2021年2月22日(Landsat 8 OLI影像數(shù)據(jù))性。在ENVI5.3平臺,對影像數(shù)據(jù)進(jìn)行預(yù)處理,通過輻射定標(biāo)、大氣校正和正射校正,消除大氣吸收、大氣散射和地形起伏造成的誤差,得到可用于研究的數(shù)據(jù)。如圖2所示。
圖2:研究區(qū)區(qū)位圖和Landsat8遙感影像圖
隨機(jī)森林(RF)是由很多決策樹分類模型組成的組合分類模型,他的工作思路是:首先,利用bootstrap抽樣從原始訓(xùn)練集抽取k個樣本,且每個樣本的樣本容量都與原始訓(xùn)練集一樣;其次,對k個樣本分別建立k個決策樹模型,得到k種分類結(jié)果;最后,根據(jù)k種分類結(jié)果對每個記錄進(jìn)行投票表決決定其最終分類。其實(shí)質(zhì)是將樣本不斷放回并進(jìn)行多次取樣形成訓(xùn)練集,通過決策樹的組合對預(yù)測結(jié)果求平均來進(jìn)行預(yù)測,這種算法主要考慮決策樹數(shù)量以及分割結(jié)點(diǎn)的數(shù)量這2個參數(shù)。通常情況下,隨著決策樹數(shù)目的增加,分類的精度為先增加后趨于平穩(wěn)。
支持向量機(jī)是非線性模式分類算法中最先進(jìn)的算法之一,是一種建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)算法。支持向量機(jī)的基本思想是在特征空間中找到一個超平面,將不同類別的分離距離最大化,離該超平面距離最近的數(shù)據(jù)樣本為支持向量。由此構(gòu)造出分類器,可以將類與類之間的間隔最大化,因而有較好的推廣性和較高的分類準(zhǔn)確率。與其他分類算法相比,支持向量機(jī)對訓(xùn)練樣本的數(shù)量要求不高,如果樣本數(shù)量相對較少,支持向量機(jī)可以獲得更高的分類精度。
歸一化植被指數(shù)(NDVI)是紅光波段和近紅外波段的數(shù)學(xué)計算,主要用于監(jiān)測植被生長狀態(tài)、植被覆蓋度,是目前是應(yīng)用最為廣泛的指數(shù)之一。本研究在ENVI5.3上利用Landsat8近紅外和紅外波段進(jìn)行計算,公式如下:
式2.3中,b5為OLI數(shù)據(jù)的近紅外波段反射率值,b4為OLI數(shù)據(jù)的紅外波段反射率值。
此次研究,通過RF和SVM的分類方法,對韓江東溪入??诘募t樹林空間分布信息進(jìn)行自動分類提取,分類結(jié)果中不可避免地會產(chǎn)生一些面積很小的圖斑,為提高分類精度,利用Majority/Minority分析進(jìn)行類后處理,從而得到研究區(qū)紅樹林RF和SVM自動分類提取結(jié)果,如圖3。
圖3:研究區(qū)紅樹林自動分類結(jié)果(做:RF 右:SVM)
結(jié)合野外踏勘建立解譯標(biāo)志,利用高分辨率遙感影像進(jìn)行遙感解譯,得到紅樹林高精度分類結(jié)果圖,以此作為檢驗(yàn)樣本,通過利用秋茄和無瓣海桑的分類結(jié)果,構(gòu)建混淆矩陣。總體分類精度(OA)和Kappa(K)系數(shù)作為評價標(biāo)準(zhǔn),其中,總體分類精度等于被正確分類的像元總和除以總像元數(shù)。具體表達(dá)式如此下:
其中,n表示總的樣本點(diǎn)數(shù),對角線樣本為nii,ni+為某一類中地表真實(shí)像元總數(shù),n+i被分類像元總數(shù),k表示總的分類類別數(shù)目。
由表1可得出,利用RF分類模型對紅樹林空間分布信息的自動提取分類精度為94.5066% ,Kappa系數(shù)為0.6939,利用SVM分類模型對紅樹林空間分布信息的自動提取分類精度為92.9253% ,Kappa系數(shù)為0.6409,由此可得出,針對研究區(qū)利用RF分類模型的紅樹林空間分布的提取效果優(yōu)于SVM方法。結(jié)果顯示,兩種分類方法均對無瓣海桑有較好的提取精度,均優(yōu)于95%。針對秋茄的分類精度較低。
表1:基于RF和SVM的紅樹林分類結(jié)果精度評價
在分類中,錯分誤差和漏分誤差也是兩種比較重要的評價指標(biāo)。
由表2可知,無瓣海桑的分類誤差較低,秋茄由于光譜特征的弱特征性,易被識別為無瓣海桑及其他地物。
表2:基于RF和SVM的紅樹林分類結(jié)果誤差比較
上述對比結(jié)果表明, 隨機(jī)森林在分類結(jié)果上優(yōu)于支持向量機(jī)。因?yàn)镹DVI對于區(qū)分植被生長狀態(tài)有著良好的優(yōu)勢,為了進(jìn)一步提高隨機(jī)森林的分類結(jié)果準(zhǔn)確性,有效增加無瓣海桑和秋茄的光譜特征分異性,利用Landsat8數(shù)據(jù)計算研究區(qū)的NDVI,并作為分類指標(biāo)因子投入到RF模型中,利用機(jī)器學(xué)習(xí)對紅樹林進(jìn)行進(jìn)一步分類,分類結(jié)果如圖4。
圖4:結(jié)合NDVI的RF自動分類結(jié)果
構(gòu)建投入NDVI評價因子分類的混淆矩陣,評價結(jié)果如表3所示。
表3:投入NDVI進(jìn)行RF分類精度評價結(jié)果
由表3可知,在分類體系中加入NDVI評價因子后,自動提取分類精度為94.6046% ,Kappa系數(shù)為0.7009。相較于直接利用RF模型進(jìn)行分類提取,分類精度提高了0.098%,Kappa系數(shù)提高了0.007。結(jié)果顯示,投入NDVI評價因子參與紅樹林空間分布信息自動提取分類,精度有所提高,雖然增幅較低,但為提高紅樹林分類精度提供了一種可行性。
以汕頭市澄海區(qū)韓江東溪入海口紅樹林分布區(qū)為研究區(qū),利用Landsat8遙感影像,結(jié)合紅樹林實(shí)地調(diào)查數(shù)據(jù),分別采用隨機(jī)森林和支持向量機(jī)分類方法進(jìn)行紅樹林空間分布信息自動識別提取,并構(gòu)建混淆矩陣進(jìn)行精度驗(yàn)證及對比。研究結(jié)果表明:
(1)在光譜特征基礎(chǔ)上,利用多光譜遙感影像,基于機(jī)器學(xué)習(xí)方法對紅樹林空間分布進(jìn)行了自動分類和提取的方法是可行的。
(2)隨機(jī)森林算法對紅樹林的提取精度更高,對比支持向量機(jī)算法,隨機(jī)森林算法無論是總體分類精度還是kappa系數(shù)均高于支持向量機(jī),分類精度為94.5066% ,Kappa系數(shù)為0.6939,分類效果也顯著。
(3)在隨機(jī)森林算法加入NDVI評價因子,可有效提高隨機(jī)森林算法的分類精度。
通過此次研究,筆者認(rèn)為可選用濕度、溫度、紋理特征等更多的評價因子,投入到分類模型中,可進(jìn)一步提高隨機(jī)森林算法的分類精度。