帥 爽 ,張 志 ,張 天 ,張 焜 ,肖成志 ,陳 安
(1. 青海省青藏高原北部地質(zhì)過程與礦產(chǎn)資源重點實驗室,西寧 810300;2. 中國地質(zhì)大學(武漢)地球物理與空間信息學院,武漢 430074;3. 武漢輕工大學土木工程與建筑學院,武漢 430023;4. 中交第二公路勘察設(shè)計研究院有限公司,武漢 430056;5. 武漢市第十四中學,武漢 430000)
星載[1]與機載[2]高光譜遙感技術(shù)已廣泛應用于植被類型制圖,而利用遙感技術(shù)在干旱-半干旱區(qū)區(qū)分植被物種、評價各植被物種在區(qū)域尺度碳循環(huán)中的作用仍具有挑戰(zhàn)性[3]。2019 年9 月中國成功發(fā)射的資源一號O2D(ZY-1 02D)星同時搭載高光譜(Advanced HyperSpectral Imager,AHSI)傳感器和多光譜(Visible and Near Infrared Camera,VNIC)傳感器,可同步獲取高光譜和高空間分辨率數(shù)據(jù),有利于緩解稀疏植被與土壤背景構(gòu)成的混合像元效應,提升對植被類型精細識別與監(jiān)測的能力[4]。
結(jié)合使用遙感圖像光譜特征和紋理特征已經(jīng)成為遙感植被類型分類的常用方法[5-11]。以往的植被類型遙感圖像分類研究中,大多利用單一的紋理提取窗口大小[9-10]和窗口移動方向[7,9]提取圖像紋理特征,或?qū)Σ煌翱谝苿臃较蛴嬎愕募y理特征進行均值處理[5,9,11],少有研究利用不同窗口大小和窗口移動方向提取多尺度紋理特征參與圖像分類,并定量分析紋理提取窗口大小和窗口移動方向?qū)D像分類精度的影響。
高維光譜特征空間產(chǎn)生的休斯效應[12]是影響高光譜圖像分類效率和精度的因素之一,多尺度紋理特征的加入會增加分類特征空間的維度,進而加劇休斯效應。遺傳算法(genetic algorithm,GA)和粒子群優(yōu)化算法(particle swarm optimization,PSO)等傳統(tǒng)特征優(yōu)化算法已廣泛應用于高光譜波段選擇[13-14]。廣義正態(tài)分布優(yōu)化算法(generalized normal distribution optimization,GNDO)[7]、原子搜索算法(atom search algorithm,ASO)[15]和海洋捕食者算法(marine predators algorithm,MPA)[16]等仿生優(yōu)化算法在特征優(yōu)化領(lǐng)域顯示出優(yōu)于傳統(tǒng)算法的性能,但還少有應用于解決高光譜數(shù)據(jù)的特征優(yōu)化問題的研究。各特征優(yōu)化算法在初始化種群,隨機生成個體(波段組合方案)的基礎(chǔ)上,利用目標函數(shù)更新個體實現(xiàn)特征優(yōu)化的方式造成了特征優(yōu)選結(jié)果的隨機性[13,17],進而也造成分類精度的不確定性。
面向高維光譜紋理特征空間的降維和特征優(yōu)化算法結(jié)果的不確定性等問題,此次研究旨在結(jié)合特征優(yōu)化算法和圖像分類算法提出高光譜與多尺度紋理特征融合的遙感植被分類方法,以期為干旱區(qū)高光譜植被類型分類中的特征提取、特征優(yōu)化和分類方法的選擇提供新的思路。
研究區(qū)位于青海省海西蒙古族藏族自治州都蘭縣宗加鎮(zhèn)(96°24′~96°28′E,36°25′~36°31′N),平均海拔2 775 m,年平均氣溫4.3℃,屬于高原干旱大陸性氣候,年平均蒸發(fā)量(1 358~1 765 mm)遠大于降雨量。研究區(qū)南部為宗加鎮(zhèn)居民區(qū),主要植被類型包括人工種植的枸杞林和道路兩側(cè)的防風楊樹林,其中枸杞林可分為2018 年后種植的枸杞林(新)和2018 年前種植的枸杞林(老),研究區(qū)北部為戈壁荒漠與河流灘地,植被類型主要為梭梭林和河岸草地,其他地物類型為裸地和建筑用地(圖1)。
圖1 研究區(qū)影像圖與樣本位置Fig.1 Image of study area and location of samples
此次研究數(shù)據(jù)源主要為ZY-1 02D 多光譜數(shù)據(jù)(VNIC,包含單波段2.5 m 空間分辨率全色波段和8 波段10 m 空間分辨率多光譜波段)和高光譜數(shù)據(jù)(AHSI,166 波段,30 m 空間分辨率)。對AHSI 數(shù)據(jù)和VNIC 數(shù)據(jù)分別進行輻射定標、大氣校正處理,獲取地表反射率數(shù)據(jù);再對AHSI 數(shù)據(jù)、VNIC 數(shù)據(jù)多光譜波段和全色波段進行幾何校正,保證其空間位置配準。將VNIC 數(shù)據(jù)全色波段與多光譜波段進行圖像融合,獲取8 波段2.5 m 空間分辨率數(shù)據(jù)(圖1)用于選取訓練樣本和驗證樣本。
在選取地物類型訓練樣本和驗證樣本的基礎(chǔ)上,利用VNIC 全色波段影像提取多尺度紋理特征,與AHSI高光譜數(shù)據(jù)組成高維光譜紋理特征空間,利用不同算法分別構(gòu)建模型進行植被類型分類,并對比分類精度。
利用VNIC 融合圖像開展人工目視解譯并結(jié)合野外調(diào)查,選取枸杞林(老)、枸杞林(新)、草地、梭梭林、楊樹林、人工建筑和裸地樣本區(qū)55、64、54、66、70、30 和32 處,樣本區(qū)分布如圖1。以分層隨機抽樣的方式選擇各植被類型全部樣本區(qū)的50%作為訓練樣本數(shù)據(jù)集,其余50%的樣本區(qū)作為檢驗樣本集。為了排除各植被類型訓練像元數(shù)量不同對植被分類精度的影響,在各植被類型訓練樣本數(shù)據(jù)集中,以隨機采樣方式分別選取數(shù)量為200 像元的訓練樣本,應用于各分類模型的構(gòu)建。
本研究采用灰度共生矩陣方法,選擇均值、方差、同質(zhì)性、對比度、相異度、熵、二階矩和相關(guān)性8 種統(tǒng)計參量,對研究區(qū) VNIC 數(shù)據(jù)全色波段提取紋理圖像。按照 3×3 像元、5×5 像元、7×7 像元、9×9 像元、11×11像元 五種窗口大小和0°、45°、90°、135°四種窗口移動方向提取了160 組紋理圖像,與160 波段的AHSI 數(shù)據(jù)合并成320 波段的高維光譜、紋理特征空間。利用Jeffries-Matusita(J-M)距離[18]定量評價不同窗口大小、窗口移動方向提取的紋理圖像對研究區(qū)各植被類型間、植被與背景地物類型間的可分離性差異。
面向高維光譜紋理特征空間的降維、特征優(yōu)選和植被分類精度提升的問題,本研究將GA[19]、PSO[20]、GNDO[21]、ASO[15]和MPA[16]等特征優(yōu)化算法與RF[22]圖像分類算法相結(jié)合,以總體分類精度(overall accuracy,OA)提升為目標,提出GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 圖像分類算法,算法流程如下:
1)參數(shù)初始化設(shè)置。初始個體數(shù)量設(shè)置為20 個,即20 個特征組合方案,最大迭代次數(shù)均設(shè)置為200 次,迭代次數(shù)為t(t=1,2,…,200),適應度函數(shù)選擇隨機森林方法計算的OA;
2)輸入歸一化的光譜紋理特征空間數(shù)據(jù)和訓練樣本數(shù)據(jù);
3)當t≤200,運行特征優(yōu)化算法(GA、PSO、GNDO、MPA、ASO),獲得特征優(yōu)選結(jié)果,構(gòu)建分類模型,進行精度評價,獲得總體分類精度集(OAt);
4)當t>200,終止運算,計算總體分類精度集中最大值Max(OAt),輸出分類結(jié)果和特征選擇結(jié)果。
圖像分類精度評價是將各植被類型及地物樣本區(qū)中作為訓練樣本外的50%的樣本區(qū)作為檢驗樣本集進行混淆矩陣[23]計算,以獲取OA、Kappa 系數(shù)、生產(chǎn)者精度(producer’s accuracy,PA)和用戶精度(user’s accuracy,UA)等分類精度評價指標,對不同分類方法的分類結(jié)果進行精度評價。
各植被類型及背景地物在不同窗口大小、不同窗口移動方向提取的紋理特征中的J-M 距離如圖2 所示??梢姸喑叨燃y理中,建筑物與其他地物的可分性較好,J-M距離均大于1.80。草地與其他地物的可分性較差,J-M距離均小于1.65。在不同窗口大小提取的紋理中,各地物間的可分性也有較大差異,在3×3 像元窗口大小紋理圖像中,枸杞林(老)與枸杞林(新)、草地與枸杞林(新)間J-M 距離最大,分別為1.56 和1.65,而在11×11 像元窗口大小紋理圖像中,梭梭林與枸杞林(新)、梭梭林與枸杞林(老)、梭梭林與楊樹林、裸地與草地間的J-M 距離最大,分別為1.91、1.90、1.99和1.92。另外,在7×7 像元窗口大小紋理圖像中,楊樹林與建筑物的可分性最好,J-M距離為1.88。此外,在不同窗口移動方向提取的紋理中,各植被類型間的可分性也有較大差異,在0°窗口移動方向紋理圖像中,楊樹林、梭梭林與其他植被類型J-M距離分別大于1.87 和1.86,可分性最好;90°窗口移動方向紋理圖像中,草地與其他植被類型可分性最好,J-M距離均大于1.18;135°窗口移動方向紋理圖像中,楊樹林與梭梭林、建筑物與草地、裸地與建筑物J-M 距離最大,可分性最好。
圖2 各地物類型在不同窗口大小、不同窗口移動方向提取的紋理特征中的J-M 距離Fig.2 Jeffries-Matusita(J-M) distances for each land type in texture features extracted from different window sizes and different window movement directions
研究中利用傳統(tǒng)RF 算法分別對AHSI 高光譜反射率數(shù)據(jù)和光譜紋理特征空間數(shù)據(jù)構(gòu)建植被分類模型(RF(160)和RF(320)),同時分別利用此次提出的GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF算法對光譜紋理特征空間數(shù)據(jù)構(gòu)建分類模型,完成研究區(qū)植被類型圖像分類,各分類結(jié)果如圖3,精度評價結(jié)果如表1。從分類精度評價結(jié)果看,相較RF(160),RF(320)的OA 和Kappa 系數(shù)分別提升了8.02 個百分點和0.099。此次提出的GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 算法分類結(jié)果精度均優(yōu)于傳統(tǒng)RF算法分類結(jié)果(RF(320)),其中MPA-RF 算法分類結(jié)果獲得了最高的分類精度,OA 為88.92%,Kappa 系數(shù)為0.86。
表1 各分類方法的精度評價Table 1 Classification accuracy of each classification method
圖3 各方法的植被及地物類型分類結(jié)果圖Fig.3 Vegetation and objects classification results of different methods
不同窗口大小、窗口移動方向和統(tǒng)計參量提取的160 組多尺度紋理特征的J-M 距離評估結(jié)果顯示,不同窗口大小和窗口移動方向提取的紋理特征有利于區(qū)分不同的植被類型。表明根據(jù)圖像標準差大小選擇單一窗口大小提取紋理特征[8]和選擇單一窗口移動方向提取紋理特征參與植被分類[7,9]的方法可能會導致其他窗口大小提取的關(guān)鍵紋理特征的損失。從總體分類精度上看,加入了多尺度紋理特征的RF(320)的分類精度相較僅有光譜特征的RF(160)分類精度顯著提升。從單一植被類型分類精度上看,多尺度紋理特征加入后,枸杞林(老)、枸杞林(新)、建筑物、裸地和楊樹林的分類精度有效提升,PA 和UA 分別提升3.59~29.69 個百分點和0.51~32.21 個百分點,其中楊樹林的分類精度提升最大,其高大冠層和規(guī)則線性排布形成的圖像紋理增強了與其他地物類型可區(qū)分性。多尺度紋理特征的加入對梭梭林的分類精度提升不明確,相較RF(160),RF(320)的PA 升高,而UA 降低,這可能是紋理特征加入對分類精度的正向提升和特征維度增加引起休斯效應增強共同作用的結(jié)果。經(jīng)特征優(yōu)化后,梭梭林的PA 進一步升高,UA 大幅提高,優(yōu)于RF(160)。多尺度紋理特征加入后,草地的分類精度下降,UA 有所升高,而PA 大幅降低,經(jīng)特征優(yōu)化后PA 進一步降低,分類效果不佳,可能是由于紋理特征的加入導致草地像元與周邊裸地、梭梭林像元的可區(qū)分性減弱。
本文提出的GA-RF、PSO-RF、GNDO-RF、ASORF 和MPA-RF 方法與傳統(tǒng)RF 方法相比,OA 分別提升了1.41、1.32、1.41、1.65 和2.40 個百分點,有效緩解了特征優(yōu)化算法的隨機性。相較GA、PSO 等傳統(tǒng)算法,ASO 和MPA 算法對總體植被分類精度的提升更顯著。對于單一植被類型分類精度,相較RF 方法,本次提出各方法分類結(jié)果的枸杞林(老)、枸杞林(新)、建筑物、裸地和梭梭林的分類精度均有效提升。而特征優(yōu)化后,草地的PA 顯著下降,大量草地像元被誤分為裸地或梭梭林,原因是研究區(qū)內(nèi)草地的零星分布導致獲取的草地訓練樣本數(shù)量和質(zhì)量受限,同時混合像元效應對面積較小的草地識別影響嚴重。另外,GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 算法經(jīng)過特征優(yōu)化后的特征數(shù)分別為83、118、124、159 和57 個,其中MPARF 方法優(yōu)選的特征數(shù)量最少,降維性能最佳。綜合來看,MPA-RF 算法在特征降維和圖像分類精度提升方面均顯示出良好效果。
此次提出MPA-RF 方法對高維光譜紋理特征空間取得了最高的總體分類精度(88.92%),接近或高于WAN等[24]、帥爽等[7]、GEORGE 等[25]利用GF5 AHSI 數(shù)據(jù)、ZY1-02D AHSI 數(shù)據(jù)和Hyperion 數(shù)據(jù)進行香港紅樹林樹種分類、青海干旱區(qū)植被類型分類、喜馬拉雅西部植被類型分類時獲得的OA,驗證了本文提出方法對于高光譜植被類型分類的可行性。然而,此次研究獲得的最高OA 低于LIU 等[26]和LIU 等[27]利用更高空間分辨率高光譜數(shù)據(jù)(AVIRIS 數(shù)據(jù))和深度學習算法(3D-CNN)進行植被類型分類時獲得OA(93.41%和94.18%)。表明空間分辨率是制約星載高光譜數(shù)據(jù)的植被類型分類精度的因素之一,同時,深度學習算法相較傳統(tǒng)機器學習在遙感圖像分類領(lǐng)域顯示出優(yōu)勢,下一步研究中將基于深度學習框架,設(shè)計高光譜數(shù)據(jù)和高空間分辨率數(shù)據(jù)差異性學習和深度融合的植被分類模型,進一步提升分類精度。
本文針對多尺度紋理特征與高光譜數(shù)據(jù)構(gòu)建的高維光譜紋理特征空間降維、特征優(yōu)化算法隨機性等問題,將遺傳算法(genetic algorithm,GA)、粒子群優(yōu)化算法(particle swarm optimization,PSO)、廣義正態(tài)分布算法(generalized normal distribution optimization,GNDO)、原子搜索算法(atom search algorithm,ASO)和海洋捕食者算法(marine predators algorithm,MPA)等特征優(yōu)化算法與隨機森林分類算法(Random Forest,RF)相結(jié)合提出了GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF高光譜圖像分類算法,并應用于都蘭縣宗加鎮(zhèn)干旱區(qū)植被類型分類。主要取得了以下結(jié)論:
1)多尺度紋理特征的加入有效提升了高光譜植被分類精度,整體分類精度提升了8.02 個百分點;不同窗口大小、窗口移動方向提取的圖像紋理特征有利于區(qū)分不同的植被與地物類型。
2)此次提出的GA-RF、PSO-RF、GNDO-RF、ASORF 和MPA-RF 算法將高光譜特征優(yōu)化與圖像分類一體化結(jié)合,利用迭代優(yōu)化的方式,緩解了仿生優(yōu)化算法結(jié)果的隨機性,與傳統(tǒng)RF 方法相比,總體分類精度提升了1.32~2.40 個百分點,其中MPA-RF 方法取得了最高的圖像分類精度(OA 和 Kappa 系數(shù)分別為88.92%和0.86)。