郭 濤,王 思,劉泳伶,黃 平,李 疆
(四川省農(nóng)業(yè)科學(xué)院遙感與數(shù)字農(nóng)業(yè)研究所,成都610066)
我國(guó)自然資源缺乏,2017年中央全面深化改革領(lǐng)導(dǎo)小組正式審議通過(guò)《領(lǐng)導(dǎo)干部自然資源資產(chǎn)離任審計(jì)規(guī)定(試行)》,明確提出領(lǐng)導(dǎo)干部離任將對(duì)自然資源資產(chǎn)進(jìn)行審計(jì)。2020年國(guó)家出臺(tái)了《陸地生態(tài)系統(tǒng)生產(chǎn)總值(GEP)核算技術(shù)指南》為陸地生態(tài)系統(tǒng)資產(chǎn)化管理、生態(tài)功能區(qū)劃、生態(tài)補(bǔ)償決策等提供工作指南。其中陸地生態(tài)系統(tǒng)資產(chǎn)化評(píng)估主要涉及農(nóng)田、森林、草地等自然資源生態(tài)系統(tǒng)的供給、調(diào)節(jié)、支持和美學(xué)等生態(tài)價(jià)值,當(dāng)前,上述自然資源數(shù)據(jù)收集手段落后、要素不全、數(shù)據(jù)斷檔、數(shù)更新頻率不一致、無(wú)空間信息等問(wèn)題,要在一系列空間尺度上實(shí)現(xiàn)自然資源管理的績(jī)效評(píng)估存在長(zhǎng)時(shí)間滯后。因此,開(kāi)發(fā)一個(gè)自動(dòng)化、業(yè)務(wù)化運(yùn)行的自然資源動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)迫在眉睫。
隨著地理大數(shù)據(jù)、云計(jì)算的不斷發(fā)展,基于云地理空間信息分析平臺(tái)越來(lái)越成為國(guó)內(nèi)外學(xué)者重要研究?jī)?nèi)容之一,谷歌地球引擎(Google Earth Engine,GEE)借助于Google強(qiáng)大的云計(jì)算和存儲(chǔ)能力,可以大幅度減少數(shù)據(jù)獲取和處理的工作量,已經(jīng)成為海量遙感大數(shù)據(jù)科學(xué)研究的重要工具[1]。憑借云計(jì)算優(yōu)勢(shì)可實(shí)現(xiàn)對(duì)不同尺度的遙感大數(shù)據(jù)進(jìn)行快速處理、挖掘和分析,提升了遙感產(chǎn)品的生產(chǎn)效率和大范圍遙感影像處理提供了新的機(jī)遇[2]。
目前,應(yīng)用GEE云平臺(tái),國(guó)內(nèi)外學(xué)者已經(jīng)開(kāi)展了大量的科學(xué)研究工作,在全球森林分布和變化監(jiān)測(cè)、土地覆蓋/土地利用、農(nóng)作物結(jié)構(gòu)等方面進(jìn)行了大量的研究探索,并形成了較多成果[3-5]。Xiong等[6]利用Landsat、Sentinel-2、SRTDEM等數(shù)據(jù),基于9791個(gè)樣本點(diǎn),提取了非洲30 m的耕地?cái)?shù)據(jù),耕地總體精度達(dá)到了94%。Chen等[7]使用Landsat 7/8、Sentinel-1 A影像和DEM數(shù)據(jù)對(duì)中國(guó)紅樹(shù)林進(jìn)行了識(shí)別,制作了紅樹(shù)林分布圖。Dong等[8]應(yīng)用GEE云平臺(tái)對(duì)亞洲北部的水稻種植范圍進(jìn)行提取,并通過(guò)Google Earth和2萬(wàn)張實(shí)地拍攝照片進(jìn)行精度對(duì)比驗(yàn)證,其精度高達(dá)90%以上。Dong等[9]采用深度學(xué)習(xí)和樣本遷移技術(shù)等算法,生產(chǎn)了3 m分辨率地圖覆蓋制圖產(chǎn)品,總體解譯精度達(dá)到86%。柴旭榮等[10]基于GEE云平臺(tái)利用隨機(jī)森林監(jiān)督學(xué)習(xí)算法對(duì)山西省1990年、2000年、2010年和2017年土地覆蓋進(jìn)行了快速分類(lèi),分類(lèi)結(jié)果與CNLUCC、GlobalLand30和FROM-GCL等現(xiàn)有的產(chǎn)品相比,總體精度提升了5%~10%,達(dá)到了86%~94%。何昭欣等[11]基于GEE,計(jì)算了遙感指數(shù)、紋理特征和地形特征,使用了樸素貝葉斯、支持向量機(jī)、分類(lèi)回歸樹(shù)和隨機(jī)森林4種分類(lèi)器,并比較了各分類(lèi)器的分類(lèi)精度,提取了小麥與油菜的空間分布信息。何麗[12]基于GEE對(duì)湄公河流域資源環(huán)境關(guān)鍵要素進(jìn)行了自動(dòng)提取與動(dòng)態(tài)監(jiān)測(cè),并進(jìn)行了時(shí)空分析研究。董欣等[13]基于GEE云平臺(tái)隨機(jī)森林算法對(duì)2017—2019年京津冀地區(qū)影像進(jìn)行地物分類(lèi),并對(duì)其生態(tài)服務(wù)價(jià)值進(jìn)行了定量估算。
文章基于GEE提供的JavaScript API,高效構(gòu)建自然資源遙感云計(jì)算監(jiān)測(cè)服務(wù)平臺(tái),并利用計(jì)算得出的植被指數(shù)、水體指數(shù)等指標(biāo)提取、識(shí)別和記錄了地物輪廓以及特征,同時(shí)運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)其進(jìn)行訓(xùn)練,根據(jù)形成的樣本庫(kù)進(jìn)而對(duì)遙感影像進(jìn)行高精度解譯,最終通過(guò)Earth Engine Apps發(fā)布成果。該文構(gòu)建的自然資源遙感云計(jì)算監(jiān)測(cè)服務(wù)平臺(tái)采用系統(tǒng)自動(dòng)化方法,可以極大提高平臺(tái)的運(yùn)行效率,以期為西南地區(qū)甚至全國(guó)尺度的自然資源地物類(lèi)別識(shí)別、提取自然資源資產(chǎn)動(dòng)態(tài)監(jiān)測(cè)以及績(jī)效評(píng)估等業(yè)務(wù)化工作提供了技術(shù)路線參考。
GEE是構(gòu)建在云計(jì)算平臺(tái)基礎(chǔ)之上的地理空間數(shù)據(jù)挖掘和計(jì)算綜合性分析平臺(tái)。通過(guò)結(jié)合海量地理空間信息數(shù)據(jù),采取所寫(xiě)即所見(jiàn)的交互編程模式,幫助用戶可以基于平臺(tái)任意構(gòu)建自己的模型算法和思想。該平臺(tái)提供豐富的計(jì)算、處理和分析的API接口,技術(shù)人員可以根據(jù)實(shí)際需求快速完成對(duì)地物特征識(shí)別和變化趨勢(shì)分析等模塊的開(kāi)發(fā)工作。該文以自然資源遙感動(dòng)態(tài)變化監(jiān)測(cè)作為場(chǎng)景,開(kāi)發(fā)自然資源遙感云計(jì)算監(jiān)測(cè)服務(wù)平臺(tái),可以為國(guó)內(nèi)外后續(xù)相關(guān)研究思路提供參考和借鑒。
GEE作為在線遙感云計(jì)算平臺(tái),其平臺(tái)架構(gòu)設(shè)計(jì)主要包含4部分[14]。
(1)數(shù)據(jù)存儲(chǔ)服務(wù):這是GEE特色,GEE集成了PB級(jí)公共遙感影像產(chǎn)品,并對(duì)其進(jìn)行了預(yù)處理,用戶只需要在線調(diào)用已有的API接口即可快速完成地理空間數(shù)據(jù)分析且可以上傳自己本地的數(shù)據(jù)和代碼進(jìn)行相關(guān)分析。GEE提供了數(shù)據(jù)存儲(chǔ)服務(wù)和瓦片服務(wù),可在線調(diào)用相關(guān)數(shù)據(jù)和GIS服務(wù)。
(2)計(jì)算服務(wù):主要提供了實(shí)時(shí)計(jì)算服務(wù)和異步計(jì)算服務(wù)。本研究涉及的數(shù)據(jù)是四川省理縣近20年的遙感影像,數(shù)據(jù)量較大,GEE可以提供強(qiáng)大的底層算力作為快速機(jī)器學(xué)習(xí)的基礎(chǔ),這也是其特色和優(yōu)勢(shì)。
(3)API接口:GEE分別提供了Javascript版本和Python版本的API庫(kù),這些接口庫(kù)可以給用戶開(kāi)展數(shù)據(jù)分析工作提供強(qiáng)大的技術(shù)支持,進(jìn)一步提高了分析和可視化地理空間大數(shù)據(jù)的便利性,即無(wú)需用戶自己配備超級(jí)計(jì)算機(jī)設(shè)備,就可以完成任務(wù)。
(4)前臺(tái)調(diào)用,采用GEE自帶的編輯器Code Editor以及第三方的Web Apps,實(shí)現(xiàn)所寫(xiě)即所得,框架結(jié)構(gòu)如圖1所示。
圖1 GEE遙感平臺(tái)框架Fig.1 Remotesensing platform for GEE
該文主要采用Landsat OLI,MODIS和Sentinel-2等多源遙感數(shù)據(jù),用于自然資源指標(biāo)提取,具體情況可見(jiàn)表1。
表1 GEE共享數(shù)據(jù)集Table1 GEE shared data setsused in thestudy
通過(guò)時(shí)相、位置以及去云等預(yù)處理,通過(guò)GEE計(jì)算歸一化差異植被指數(shù)(NDVI)、增強(qiáng)型植被指數(shù)(EVI)、比值植被指數(shù)(RVI)、反射率之差計(jì)算(DVI)以及土壤調(diào)節(jié)植被指數(shù)(SAVI)[15-16],具體公式見(jiàn)表2所示?;贛ODIS數(shù)據(jù),分別基于250 m、500 m分辨率提取2000—2019年四川省理縣周、月和年NDVI、EVI、RVI、DVI和SAVI等植被指數(shù)數(shù)據(jù)產(chǎn)品。
表2 植被指數(shù)表達(dá)式Table2 Vegetation index expression
該文利用Landsat數(shù)據(jù),采用歸一化差異水體指數(shù)(NDWI)、歸一化差異水體指數(shù)(MNDWI)、NDWIGao等對(duì)水體進(jìn)行提取以及采用歸一化建筑指數(shù)(NDBI),具體表3所示[17-19]。
表3 水體指數(shù)表達(dá)式Table3 Water body index expression
該文采用3種不同分類(lèi)器進(jìn)行分類(lèi)和訓(xùn)練,分別是決策樹(shù)、隨機(jī)森林和支持向量機(jī)對(duì)自然資源地物地類(lèi)進(jìn)行提取。
(1)決策樹(shù)。決策樹(shù)方法是Breiman在1984年提出的一種決策樹(shù)學(xué)習(xí)分類(lèi)器[20]?;驹碇饕峭ㄟ^(guò)一種遞歸策略分割數(shù)據(jù)空間并在每個(gè)分區(qū)內(nèi)擬合一個(gè)預(yù)測(cè)模型來(lái)預(yù)測(cè)連續(xù)空間變量(回歸)和目標(biāo)變量(分類(lèi)),以達(dá)到從訓(xùn)練數(shù)據(jù)構(gòu)建模型的預(yù)測(cè)方法[21]。這種以二叉樹(shù)形式的決策模型結(jié)構(gòu)簡(jiǎn)單、運(yùn)行速度快,準(zhǔn)確率高,能夠有效處理大量數(shù)據(jù)和高維數(shù)據(jù)等優(yōu)點(diǎn)。
(2)隨機(jī)森林。隨機(jī)森林是通過(guò)構(gòu)建每顆分類(lèi)樹(shù)的集合,也是隨機(jī)森林算法的核心關(guān)鍵[22]。隨機(jī)選擇即從原始數(shù)據(jù)中以bootstrap抽樣策略選取訓(xùn)練樣本,并生成決策樹(shù)。剩下的樣本作為Out-of-bag數(shù)據(jù)用于交叉驗(yàn)證,用于評(píng)估隨機(jī)森林算法分類(lèi)精度,使用Gini系數(shù)確定決策樹(shù)的分裂條件,集合每顆決策樹(shù),構(gòu)建成隨機(jī)森林。隨機(jī)森林可以處理海量的遙感圖像數(shù)據(jù),處理速度快,適用于多類(lèi)別和多特征等復(fù)雜場(chǎng)景[11,23-24]。在算法設(shè)計(jì)過(guò)程中,重點(diǎn)對(duì)決策樹(shù)的數(shù)量和節(jié)點(diǎn)生長(zhǎng)時(shí)的特征參數(shù)的數(shù)量進(jìn)行了重點(diǎn)研究,主要目的是提高算法的泛化能力,避免過(guò)擬合。
(3)支持向量機(jī)。支持向量機(jī)是基于統(tǒng)計(jì)學(xué)理論尋求高維特征空間中最優(yōu)的分類(lèi)超平面,對(duì)復(fù)雜數(shù)據(jù)具有卓越的處理性能[25]。其主要是尋求數(shù)據(jù)間內(nèi)在關(guān)系,可以很好地處理非線性決策邊界,通過(guò)選擇核函數(shù)將線性學(xué)習(xí)器拓展成非線性學(xué)習(xí)器。支持向量機(jī)基本原理如下:①對(duì)于非線性可分?jǐn)?shù)據(jù),通過(guò)提升數(shù)據(jù)維度,把數(shù)據(jù)映射到高維空間,把非線性問(wèn)題轉(zhuǎn)換為線性可分問(wèn)題;②對(duì)于樣本特征空間通過(guò)核函數(shù)來(lái)實(shí)現(xiàn)超平面的劃分,實(shí)現(xiàn)樣本中不同類(lèi)型距離最大化。支持向量機(jī)適合具有一定樣本數(shù)量的數(shù)據(jù),其泛化能力強(qiáng),適用于遙感圖像的分類(lèi)[26-27]。
該文構(gòu)建的自然資源遙感云計(jì)算監(jiān)測(cè)服務(wù)平臺(tái),主要借助GEE平臺(tái)集成的海量地理空間數(shù)據(jù)、機(jī)器學(xué)習(xí)算法、可視化和分析計(jì)算能力。以四川省理縣為例,利用MODIS、Landsat和Sentinel-2等近20年植被指數(shù)、水體指數(shù)、建筑指數(shù)、干旱指數(shù)和自然資源地物分類(lèi)數(shù)據(jù)產(chǎn)品計(jì)算。
該文使用決策樹(shù)、隨機(jī)森林和支持向量機(jī)3類(lèi)分類(lèi)器,在GEE中實(shí)現(xiàn)四川省理縣自然資源地物分類(lèi)提取,驗(yàn)證精度采取交叉驗(yàn)證策略。具體流程:(1)在1 722個(gè)樣本點(diǎn)中獨(dú)立隨機(jī)生成10次,確保每次生成的樣本不重復(fù),具有隨機(jī)性;(2)將所有樣本劃分,按照7∶3比例作為訓(xùn)練樣本和測(cè)試,并對(duì)其精度驗(yàn)證;(3)將3個(gè)算法分類(lèi)結(jié)果與歐空局2020年10 m分辨率的全球土地覆蓋產(chǎn)品進(jìn)行對(duì)比分,該文3個(gè)算法總體驗(yàn)證精度在82%~87%,研究結(jié)果如圖2所示,在理縣受地形影像,在河谷平坦地帶裸露/稀疏植被、建筑區(qū)和灌木叢錯(cuò)綜交叉,存在錯(cuò)分漏分現(xiàn)象。
圖2 不同算法的自然資源遙感影像分類(lèi)結(jié)果:a.決策樹(shù),b.隨機(jī)森立,c.支持向量機(jī),d.歐空局Fig.2 Classification resultsof remotesensing imagesof natural resourcesbased on different algorithms
結(jié)合理縣生態(tài)系統(tǒng)特點(diǎn)和專(zhuān)家經(jīng)驗(yàn),構(gòu)建了理縣生態(tài)系統(tǒng)價(jià)值當(dāng)量,將分類(lèi)體系劃分為農(nóng)田(耕地)、森林(植被、灌木叢)、草地、城市用地(建筑區(qū))、水域(水體)、濕地(苔蘚)、裸地裸巖(裸露/稀疏植被)和其他類(lèi)型(冰雪)。并與土地利用現(xiàn)狀調(diào)查數(shù)據(jù)生態(tài)系統(tǒng)類(lèi)型統(tǒng)計(jì)面積結(jié)果比較(表4),決策樹(shù)、隨機(jī)森林和支持向量機(jī)與歐空局2020數(shù)據(jù)表現(xiàn)出較好的一致性,其中森林、草地和其他類(lèi)型相對(duì)誤差在1%~7%,城市用地、水域相對(duì)誤差在12%~20%,農(nóng)田系統(tǒng)在不同分類(lèi)算法下呈現(xiàn)出一定差異;決策樹(shù)、隨機(jī)森林、支持向量機(jī)、歐空局2020數(shù)據(jù)與土地利用現(xiàn)狀調(diào)查數(shù)據(jù)相比,森林分類(lèi)相對(duì)誤差為6.5%、6.9%、6.6%、4.9%,草地分類(lèi)相對(duì)誤差為29.2%、27.92%、29.1%、25.8%,整體上一致性較好。農(nóng)田生態(tài)系統(tǒng)中決策樹(shù)、歐空局?jǐn)?shù)據(jù)產(chǎn)品相對(duì)誤差為11.6%、13.7%;但城市、水域和其他類(lèi)型數(shù)據(jù)精度較低,可能由于選擇影像季節(jié)性差異和兩套數(shù)據(jù)所采用的分類(lèi)體系不一致造成的。
表4 不同分類(lèi)體系下生態(tài)系統(tǒng)類(lèi)型統(tǒng)計(jì)面積Table4 Statistical area of ecosystem typesunder different classification systems hm2
基于GEE平臺(tái)開(kāi)發(fā)的自然資源遙感云計(jì)算監(jiān)測(cè)服務(wù)平實(shí)現(xiàn)了“系統(tǒng)簡(jiǎn)介”“自然資源遙感動(dòng)態(tài)變化監(jiān)測(cè)計(jì)算”“夜光城市變化監(jiān)測(cè)”“地表溫度變化監(jiān)測(cè)”“建筑信息提取”、“水體信息提取”“生態(tài)服務(wù)價(jià)值評(píng)估”“遙感地物分類(lèi)”以及“2000—2019年NDVI變化趨勢(shì)”等功能。主界面如圖3所示,2000—2019年NDVI變化趨勢(shì)圖4所示。
圖3 自然資源遙感云平臺(tái)監(jiān)測(cè)服務(wù)平臺(tái)主界面Fig.3 Main interface of remotesensing cloud platform monitoring serviceplatform of natural resources
圖4 2000—2019年NDVI變化趨勢(shì)Fig.4 NDVIvariation tendency from 2000 to 2019
該文基于GEE開(kāi)發(fā)了一套自然資源動(dòng)態(tài)變化快速評(píng)估技術(shù),定量分析確定四川省理縣自然資源變化和演變,提取了植被、草地、耕地和灌木叢等關(guān)鍵地物類(lèi)別,為進(jìn)一步開(kāi)展研究區(qū)生態(tài)服務(wù)價(jià)值演變、自然資源資產(chǎn)管理績(jī)效評(píng)估以及資產(chǎn)負(fù)債等自動(dòng)化、業(yè)務(wù)化系統(tǒng)奠定了基礎(chǔ),同時(shí)對(duì)區(qū)域生態(tài)系統(tǒng)服務(wù)功能價(jià)值空間變異和年內(nèi)時(shí)間動(dòng)態(tài)變化分析,可為研究區(qū)生態(tài)環(huán)境與自然資源資產(chǎn)管理提供數(shù)據(jù)依據(jù)。此外,該文在GEE上最大限度地利用某一段時(shí)間內(nèi)的所有Landsat和Sentinel-2影像,通過(guò)決策樹(shù)、隨機(jī)森林和支持向量機(jī)算法識(shí)別與提取自然資源地物類(lèi)別,具有較好的分類(lèi)結(jié)果,但是仍存在一些客觀因素影像分類(lèi)結(jié)果精度。在接下來(lái)的研究中,還可結(jié)合多源數(shù)據(jù)和多種模型(例如概率圖模型、圖深度學(xué)習(xí)等[28])探索更智能的提取算法以提升分類(lèi)結(jié)果精度,進(jìn)一步提供自然資源地物分類(lèi)精度,為生態(tài)系統(tǒng)服務(wù)價(jià)值量核算提供參考。