劉艷艷 劉漢湖
摘? 要:利用遙感影像進行城市土地利用與土地覆被分類 (LULCC)是遙感的主要應用之一,但由于城市景觀的不均勻性和光譜響應的混雜性,對土地利用分類提出了挑戰(zhàn)。隨著人工智能的驚人創(chuàng)新進展,機器學習在遙感圖像開發(fā)中越來越受歡迎。使用目視判讀和經(jīng)過修改的美國地質(zhì)調(diào)查局 (USGS)土地利用與土地覆被1級分類方案選擇訓練區(qū)域;輸入數(shù)據(jù)包括10波段10m或20m可見光,近紅外和SWIR SMI波段圖像,導出NDVI和紋理層;基于隨機森林算法創(chuàng)建模型并生成土地利用類別預測。根據(jù)時間匹配的高分辨率谷歌地球Pro歷史圖像,評估得到的LULCC柵格地圖的準確性。結(jié)果發(fā)現(xiàn),基于隨機森林的土地利用及土地覆被分類表現(xiàn)較好。
關(guān)鍵詞:GIS應用? 機器學習? 土地利用與土地覆蓋分類? 隨機森林
中圖分類號:TP751? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2020)09(a)-0026-03
Abstract:Urban land use and cover classification from remotely sensed imagery is one of the major applications of remote sensing. However, due to the inhomogeneity of urban landscape and the confounding of spectral response, the classification of land use is challenged. With the amazing innovative advancements in artificial intelligence, machine learning has gained increased popularity in exploiting remote sensing imagery.Training areas were selected using visual interpretation and a modified USGS level-1 classification program for land use and land cover.? Input data include 10-band 10 m or 20 m visible, NIR and SWIR SMI band images, derived NDVI and textural layers. Based on the random forest algorithm, the model was created and the land use category prediction was generated. The accuracy of the resulting LULCC raster map was assessed against temporally matched high-resolution Google Earth Pro historical imagery. It was found that random forest based classifier achieved significantly higher overall accuracy and kappa value.
Key Words:GIS application;? Machine Learning;Land use and land cover classification;? Random Forest
機器學習方法通過結(jié)構(gòu)化數(shù)據(jù)來分析研究數(shù)據(jù),幫助了解目標圖像之間的差異,與傳統(tǒng)方法相比更為自動化,因此在分類研究領(lǐng)域有著廣泛的前景。本文基于隨機森林模型,研究機器學習在土地利用及土地覆被分類應用中的可行性,以佛羅里達西北部的彭薩科拉大都市圈為研究區(qū),根據(jù)USGS分類標準并結(jié)合研究區(qū)實際情況選取樣本進行分析,其Kappa系數(shù)為0.78,表明隨機森林在土地利用及土地覆被分類中表現(xiàn)較好。
1? 研究區(qū)概況
研究區(qū)位于佛羅里達州沿海平原的狹長地帶,處于北緯30°18′至31°,西經(jīng)86°38′至87°38′之間。研究區(qū)海拔高度較低、地勢整體平坦,整個研究區(qū)被無數(shù)河流切割,南部低洼地區(qū)由森林和混合硬木沼澤組成分割相對較少。
2? 數(shù)據(jù)和方法
2.1 數(shù)據(jù)來源
本文采用2018年4月5日和4月15日的歐洲環(huán)境衛(wèi)星哨兵2號(Sentinel-2B)1-C級影像且所有影像的云量均小于1%,影像條帶號分別為T16RDV、T16REV、T16RDU、T16REU。
2.2 研究方法與數(shù)據(jù)處理
對遙感影像進行預處理后選取訓練樣本,基于隨機森林分類模型[1]進行研究區(qū)土地利用及土地覆被分類分析。
2.2.1 遙感影像預處理
在本研究中借助Sen2Cor軟件,對哨兵2號的初級遙感影像進行大氣校正。通過輸入大氣數(shù)據(jù),對1-C級的遙感影像進行大氣校正、地形校正以及卷云校正(去除云霧遮擋),將1-C級的光譜反射率轉(zhuǎn)換為表面反射率,以減少大氣對傳感器接收的輻射量的影響。
隨后對大氣校正后的影像進行圖像融合,將哨兵2號10m分辨率與20m分辨率的圖像融合后再進行真彩色波段合成。后將影像條帶號分別為T16RDV(2018.04.05),T16REV(2018.04.05),T16RDU(2018.04.15),16REU(2018.04.15)的四景影像進行圖像鑲嵌,以研究區(qū)為邊界對鑲嵌處理后的影像進行裁剪。
2.2.2 訓練樣本選取
在進行土地利用與土地覆被分類時所選取的訓練樣本需要具有準確性、代表性及統(tǒng)計性的原則[2-3]。對于所選取的訓練樣本進行屬性編碼賦值,以1976年USGS出版編號為依據(jù)[4-5],根據(jù)研究區(qū)的實際情況以及采樣點的具體用地類型,對子分類進行合并調(diào)整為6個類型,分別為發(fā)展/人類活動用地、林地、灌木用地、草本用地、農(nóng)作物用地以及濕地/河流(如表1)。
2.2.3 土地利用及土地覆被分類
基于ArcGIS Pro2.5 平臺,輸入數(shù)據(jù)包括10個10m或20m可見光,近紅外和短波紅外波段圖像,導出NDVI。使用經(jīng)過調(diào)整的Breiman(2001)隨機森林創(chuàng)建分類模型進行土地利用與土地覆被分類預測[6]。
2.2.4 精度分析
基于隨機森林模型生成的土地利用與土地覆被分類柵格影像,以研究區(qū)為邊界隨機生成500個樣本參照點。通過對比谷歌地球Pro歷史圖像上采樣點的實際土地利用類型與隨機森林模型生成影像的類型,得出混淆矩陣等統(tǒng)計數(shù)據(jù),對隨機森林模型在研究區(qū)域內(nèi)的分類精度進行評價分析,評估了基于隨機森林分類的柵格地圖,其kappa值為0.78(見表2)。由于研究區(qū)自然環(huán)境保存完善,濕地及河流地區(qū)被大量的草本及灌木覆蓋,較難區(qū)分,且研究區(qū)為亞熱帶濕潤氣候,全年最低溫在0℃以上,研究選取的4月份遙感影像上的濕地表層仍有草本和灌木植被等覆蓋,造成濕地/河流分類精度欠佳。
3? 結(jié)語
(1) Sen2Cor大氣校正可信度較高,為分類操作打下良好基礎(chǔ)。基于隨機森林得到研究區(qū)LULCC圖kappa值為0.78。其中林地和發(fā)展/人類活動用地具有較高的精度;濕地/河流精確度很低,與農(nóng)作物用地等混雜。
(2) 錯分現(xiàn)象主要與美國人口稀疏,自然景觀保持較為完善相關(guān)。研究區(qū)分布著大面積林地和農(nóng)業(yè)用地,以及大規(guī)模的濕地和沼澤。這些區(qū)域在遙感影像上光譜變化并不明顯。通過觀察研究區(qū)的自然地理環(huán)境特點得出,不同土地利用類型的海拔高度是不同的。在今后研究中可與雷達影像與遙感影像結(jié)合,減少錯分現(xiàn)象。
(3) 有研究人員加入核函數(shù)的主成分分析 (KPCA)降低模型維度,以提高隨機森林模型的分類性能。在本文后續(xù)研究中,將與加入核函數(shù)的主成分分析 (KPCA)相結(jié)合,以提高最后的分類精度。
參考文獻
[1] 張潤,王永濱.機器學習及其算法和發(fā)展研究[J].中國傳媒大學學報:自然科學版,2016,23(2):10-18,24.
[2] 谷曉天,高小紅,馬慧娟,等.復雜地形區(qū)土地利用/土地覆被分類機器學習方法比較研究[J].遙感技術(shù)與應用,2019,34(1):57-67.
[3] 左曉慶,李瀟雨,劉懷鵬.基于隨機森林算法的城區(qū)土地覆蓋分類研究[J].河北省科學院學報,2020,37(1):8-16.
[4] Huang, B., Li, R., Ding, Z., et al. A new remote-sensing-based indicator for integrating quantity and quality attributes to assess the dynamics of ecosystem assets. [J]. Global Ecology and Conservation, 2020, 22, e00999.
[5] 何云,黃翀,李賀,等.基于Sentinel-2A影像特征優(yōu)選的隨機森林土地覆蓋分類[J].資源科學,2019,41(5):992-1001.
[6] 張曉羽,李鳳日,甄貞,等.基于隨機森林模型的陸地衛(wèi)星-8遙感影像森林植被分類[J].東北林業(yè)大學學報,2016,44(6):53-57,74.