陳 榮, 韓浩武, 傅佩紅, 楊雨菲, 黃 魏
基于多時(shí)相遙感影像和隨機(jī)森林算法的土壤制圖①
陳 榮, 韓浩武, 傅佩紅, 楊雨菲, 黃 魏*
(華中農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,武漢 430070)
獲取準(zhǔn)確的土壤–環(huán)境關(guān)系是數(shù)字土壤制圖的關(guān)鍵,目前遙感影像已作為環(huán)境因子應(yīng)用于土壤–環(huán)境知識(shí)的建立過程,但單幅遙感影像所包含的光譜信息差異難以將不同土壤類型區(qū)分開來。因此本文提出了一種基于多時(shí)相遙感影像的土壤制圖方法:選取紅安縣灄水河流域?yàn)檠芯繀^(qū),以母質(zhì)類型圖、等高線數(shù)據(jù)和多時(shí)相哨兵二號(hào)遙感影像為基礎(chǔ),提取與土壤形成有關(guān)的環(huán)境因子,通過隨機(jī)森林算法獲取土壤–環(huán)境關(guān)系,預(yù)測(cè)研究區(qū)各土壤類型的空間分布并成圖,利用野外實(shí)地分層采樣點(diǎn)驗(yàn)證推理圖的精度。結(jié)果表明:推理土壤圖總體分類精度高達(dá)86%,與原始土壤圖對(duì)比,各土壤類型的空間分布具有一定相似性,展現(xiàn)了更為詳細(xì)的空間細(xì)節(jié)信息,該研究成果可為更新土壤圖工作提供新方法。
土壤–景觀推理模型;隨機(jī)森林算法;遙感影像;數(shù)字土壤制圖
土壤普查是了解土壤資源空間分布及合理利用土壤資源的前提,是農(nóng)業(yè)生產(chǎn)的基礎(chǔ)。傳統(tǒng)的土壤普查主要是土壤學(xué)家以大比例尺航片和地形圖為底圖,通過實(shí)地采樣獲得土壤–景觀模型,以此判斷不同土壤類型的空間分布并手繪成圖[1-2]。此方法存在的精度低、人為主觀性強(qiáng)及時(shí)間和人工成本高[3]等問題推動(dòng)了數(shù)字土壤制圖的誕生與發(fā)展。與傳統(tǒng)土壤普查不同的是,數(shù)字土壤制圖方法是以空間分析和數(shù)學(xué)方法為技術(shù)手段,用柵格形式來表達(dá)土壤空間分布信息,此種方法可更好地表達(dá)出土壤分布的漸變特征[4-6]。土壤–環(huán)境知識(shí)的獲取和土壤空間推理方法的選擇是當(dāng)前精細(xì)數(shù)字土壤制圖的關(guān)鍵。
目前,數(shù)字土壤推理制圖過程常用到的協(xié)同因子多為由數(shù)字高程模型(digital elevation model,DEM)衍生的地形因子。遙感影像因其時(shí)效性強(qiáng)、數(shù)據(jù)分辨率高、易獲取及含有豐富的下墊面信息等優(yōu)勢(shì)逐漸應(yīng)用于土壤制圖,其包含的地表光譜信息可用于反演地物屬性、地物分類,提取的多種遙感指數(shù)可用于定量或定性地表述植被生長(zhǎng)狀況。遙感影像可以多種形式參與到土壤推理制圖過程中,如利用土壤有機(jī)質(zhì)的遙感響應(yīng)波段以實(shí)現(xiàn)其含量的估算[7],借助影像建立特定時(shí)段的地表動(dòng)態(tài)反饋模型[8-10],在時(shí)序遙感影像數(shù)據(jù)上提取植被的輪作模式[11-12],或直接在遙感影像數(shù)據(jù)中提取地物的分類特征[13-15]等。但在以往的研究中,土壤制圖使用的遙感影像多為單時(shí)相數(shù)據(jù)[16],不同時(shí)間點(diǎn)遙感影像產(chǎn)生的光譜信息具有較大差異,制圖結(jié)果也存在一定差異。且單一時(shí)間點(diǎn)的遙感數(shù)據(jù)易受天氣、季節(jié)等因素的影響,在遙感影像時(shí)期的選擇上也存在著人為主觀性,這些環(huán)節(jié)都將直接影響制圖結(jié)果。
土壤分類常用的數(shù)據(jù)挖掘算法主要有模糊聚類[17-18]、決策樹[19-20]、支持向量機(jī)[21]、判別分析[22]、隨機(jī)森林[23-24]等。其中,隨機(jī)森林算法可以有效避免原始數(shù)據(jù)的缺失及噪聲、異常值造成的精度低等問題,在分類和回歸等多方面具有一定的優(yōu)勢(shì),在國(guó)內(nèi)數(shù)字土壤制圖領(lǐng)域中該方法被廣泛應(yīng)用于獲取土壤類型[23]或?qū)傩訹25-27]的空間分布信息。本研究擬將多時(shí)相遙感影像數(shù)據(jù)和隨機(jī)森林算法應(yīng)用于土壤分類,為土壤分類提供新的技術(shù)與方法。
本研究使用圖斑面積加權(quán)法在傳統(tǒng)土壤圖上設(shè)計(jì)采樣點(diǎn),在母質(zhì)和地形等環(huán)境協(xié)同因子的基礎(chǔ)上,加入多時(shí)相遙感指數(shù),通過隨機(jī)森林算法建立土壤類型與環(huán)境協(xié)同因子組合的對(duì)應(yīng)關(guān)系,并推理得到研究區(qū)各土壤類型的空間分布信息,進(jìn)而對(duì)傳統(tǒng)土壤圖進(jìn)行更新,同時(shí)探究多時(shí)相遙感影像數(shù)據(jù)在土壤制圖中的可行性。
研究區(qū)域位于華家河鎮(zhèn)灄水河流域(圖1),隸屬于湖北省黃岡市紅安縣(114°23′ ~ 114°49′E,30°56′ ~ 31°35′N),地處大別山南麓,境內(nèi)地勢(shì)北高南低,為低山丘陵區(qū)。土地利用類型以林地和農(nóng)耕地為主。根據(jù)全國(guó)第二次土壤普查結(jié)果,研究區(qū)土壤類型共12種,母質(zhì)類型共6種,其中石英片巖、基性巖分別與硅沙泥田、烏沙泥田相對(duì)應(yīng),因此這兩種土壤類型不參與后續(xù)建模和推理過程。為方便后續(xù)隨機(jī)森林建模和預(yù)測(cè),數(shù)據(jù)預(yù)處理時(shí)將石灰?guī)r、片麻巖、近代河流沖積物、泥質(zhì)巖4種母質(zhì)分別編號(hào)為1、2、3、4。研究區(qū)各土壤類型和其對(duì)應(yīng)的母質(zhì)類型如表1所示。
表1 灄水河流域土壤類型和母質(zhì)類型
本研究使用的原始數(shù)據(jù)主要包括母質(zhì)類型圖、等高線、遙感影像和傳統(tǒng)土壤圖。根據(jù)紅安縣土壤圖和地質(zhì)圖及當(dāng)?shù)赝寥榔詹閷<业囊庖姡芯繀^(qū)域可以劃分成6種母質(zhì)類型。地形因子數(shù)據(jù)集是在湖北省測(cè)繪局的10 m等高距的等高線數(shù)據(jù)的基礎(chǔ)上衍生而來,在ArcGIS中內(nèi)插得到研究區(qū)的數(shù)字高程模型,提取常用的高程、坡度、坡向等地形因子。遙感影像數(shù)據(jù)來源于哨兵二號(hào)衛(wèi)星(https://scihub.copernicus.eu/),分辨率為10 m,選擇一個(gè)完整的作物生長(zhǎng)周期,成像時(shí)間由2016年11月至2017年10月,每月選擇一景遙感影像,借助ENVI軟件平臺(tái)計(jì)算歸一化植被指數(shù),具體成像時(shí)間如表2所示。
研究區(qū)原始土壤類型圖的比例尺為1︰50 000,由第二次全國(guó)土壤普查結(jié)果經(jīng)數(shù)字化后得到。傳統(tǒng)土壤圖是當(dāng)?shù)赝寥榔詹閷<疫M(jìn)行野外調(diào)查的制圖成果,其往往蘊(yùn)含著土壤學(xué)家的“隱性知識(shí)”[3],即土壤–環(huán)境知識(shí),利用決策樹、隨機(jī)森林等數(shù)據(jù)挖掘算法可有效提取隱性知識(shí)并加以利用,更新傳統(tǒng)土壤圖。
表2 哨兵二號(hào)影像獲取時(shí)間(年–月–日)
采樣點(diǎn)的設(shè)計(jì)方式對(duì)數(shù)字土壤制圖的結(jié)果具有重要影響。本研究中采樣點(diǎn)數(shù)據(jù)依據(jù)傳統(tǒng)土壤圖圖斑面積,采用面積加權(quán)法進(jìn)行布設(shè)采樣點(diǎn),并保證每個(gè)圖斑中最少采樣點(diǎn)數(shù)量不低于10個(gè),最后共生成采樣點(diǎn)數(shù)量6 686個(gè)。
隨機(jī)森林(random forest,RF)分類算法是Breiman[28]于2001年提出的一種機(jī)器學(xué)習(xí)方法,是一種以決策樹為基分類器的Bagging集成算法,廣泛應(yīng)用于回歸和分類。隨機(jī)森林算法基于自助采樣法(bootstrap sampling)[29],即有放回的采樣或重復(fù)采樣,從初始數(shù)據(jù)集中有放回的反復(fù)抽取數(shù)據(jù)作為訓(xùn)練樣本集,在采樣過程中約有36.8% 的數(shù)據(jù)始終沒有被抽中,這部分?jǐn)?shù)據(jù)為袋外(out-of-bag,OOB)數(shù)據(jù),用以對(duì)模型性能進(jìn)行估算,稱為袋外估計(jì)。OOB誤差是隨機(jī)森林模型泛化誤差的無偏估計(jì)[28]。隨機(jī)森林模型中有兩個(gè)重要參數(shù):節(jié)點(diǎn)分裂次數(shù)mtry和決策樹數(shù)量ntree,這兩個(gè)參數(shù)值的選擇直接決定了隨機(jī)森林模型的性能。
本研究利用橫截面采樣、主觀采樣和均勻采樣3種方式得到的264個(gè)驗(yàn)證點(diǎn)對(duì)推理制圖結(jié)果的準(zhǔn)確性進(jìn)行評(píng)價(jià)。驗(yàn)證點(diǎn)集包含研究區(qū)存在的所有土壤類型,且在整個(gè)研究區(qū)均有分布,如圖2所示。建立實(shí)地驗(yàn)證點(diǎn)與推理土壤圖的混淆矩陣,可得到總體分類精度、生產(chǎn)精度、用戶精度及Kappa系數(shù)等評(píng)價(jià)指標(biāo)。其中生產(chǎn)精度是預(yù)測(cè)土壤圖某土壤類型正確分類的點(diǎn)數(shù)與野外采樣點(diǎn)中該土壤類型的總點(diǎn)數(shù)的比值,而用戶精度是預(yù)測(cè)土壤圖某土壤類型正確分類的點(diǎn)數(shù)與預(yù)測(cè)土壤圖中該土壤類型的總點(diǎn)數(shù)之比[30]。
本研究提取的原始環(huán)境因子如表3所示,包括母質(zhì)類型、地形因子和遙感因子?;诓蓸狱c(diǎn)數(shù)據(jù)分別建立土壤類型與地形因子、遙感因子之間的關(guān)系(圖3和圖4)。從圖3可以看出,除高程、坡度和坡向這3個(gè)地形因子外,其余因子在不同土壤類型之間差異較小,因此本研究中僅選取高程、坡度和坡向參與到后續(xù)隨機(jī)森林建模和推理過程中。從圖4可以看到,不同土壤類型的全年植被指數(shù)變化規(guī)律相似,夏季7月和8月NDVI達(dá)到峰值,冬季則最低;林地細(xì)沙泥土(21)、林地沙泥土(31)和林地棕色石灰土(51)這3種土壤類型的歸一化植被指數(shù)全年均處于較高水平,這可能與其土地利用類型有關(guān);此外,4—6月及9—10月,各土壤類型對(duì)應(yīng)的NDVI值差異較大,可能是因?yàn)椴煌愋偷闹脖簧L(zhǎng)及秋季葉片凋謝的速度不一致,從而導(dǎo)致植被指數(shù)出現(xiàn)較大差異。
本研究通過R語(yǔ)言中random forest包來建立隨機(jī)森林模型,環(huán)境因子為輸入變量,土壤類型為輸出變量,采用遍歷的方式,以O(shè)OB誤差的大小來確定模型的最優(yōu)參數(shù)組合。由此得到mtry和ntree分別取6和600時(shí),隨機(jī)森林模型性能最佳,進(jìn)而利用該模型進(jìn)行預(yù)測(cè)。
對(duì)比原始土壤圖(圖5A)和隨機(jī)森林預(yù)測(cè)推理土壤圖(圖5B),整體上兩者的各類土壤空間分布具有一定相似性,林地沙泥土、沙泥土、細(xì)沙泥土、沙泥田、棕色石灰土等在兩個(gè)土壤圖中的空間分布基本一致,但棕色石灰土、淺潮沙田、沙泥土、沙泥田的面積有所減少。推理土壤圖的圖斑數(shù)量顯著增多,展現(xiàn)出更精細(xì)的土壤空間細(xì)節(jié)信息,且不同土壤類型之間不再存在明顯的“分界線”,過渡平滑,呈現(xiàn)出自然界中土壤空間分布的漸變特征。
為進(jìn)一步評(píng)價(jià)土壤分類的準(zhǔn)確性,我們采用野外獨(dú)立樣本點(diǎn)對(duì)推理后土壤圖進(jìn)行評(píng)價(jià)。評(píng)價(jià)結(jié)果以混淆矩陣的形式展示,其中包括總體分類精度、各土壤類型的生產(chǎn)精度和用戶精度及Kappa系數(shù)等精度評(píng)價(jià)指標(biāo),如表4所示??傮w來說,推理結(jié)果圖的總體分類精度達(dá)到了86%,分類結(jié)果較好;Kappa系數(shù)為83%,表現(xiàn)出高度一致性,這說明驗(yàn)證樣點(diǎn)與土壤圖之間的契合程度高,推理土壤圖所表達(dá)的土壤類型空間分布信息是可信的。大部分土壤類型的分類精度較高:除淺潮沙田外,其余土壤類型均有良好的用戶精度(≥70%);除棕色石灰土和細(xì)沙泥田外,其余土壤類型的生產(chǎn)精度良好(≥70%)。因此,基于多時(shí)相植被指數(shù)的土壤推理方法具有較好的制圖結(jié)果。
從混淆矩陣中可以看到,首先,林地沙泥土、林地棕色石灰土的生產(chǎn)精度和用戶精度均較高。這是由于這兩種土壤類型主要分布于研究區(qū)北部高程較大的丘陵處,土地利用類型為林地,與同母質(zhì)發(fā)育而來的其他土壤類型相比,其歸一化植被指數(shù)值較大,容易區(qū)分;沙泥田和潮沙田與研究區(qū)內(nèi)河流分布關(guān)系密切,土壤養(yǎng)分較豐富,肥力水平高,宜耕性強(qiáng),作物長(zhǎng)勢(shì)穩(wěn)健,亦具有較高的植被指數(shù),故分類精度較高。其次,淺潮沙田的生產(chǎn)精度和棕色石灰土的用戶精度均較低,混淆矩陣中可以看出,這兩種土壤類型容易被錯(cuò)分為同種母質(zhì)下的潮沙田和林地棕色石灰土,其原因可能是同一母質(zhì)發(fā)育而來的兩種土壤類型分布區(qū)域間地形起伏程度差異較小,且土地利用類型相近,作物生長(zhǎng)規(guī)律相似,在時(shí)序遙感影像上表現(xiàn)為數(shù)值相近、無明顯差異性的歸一化植被指數(shù),因此利用地形因子和多時(shí)相的遙感植被指數(shù)均不能有效區(qū)分,從而產(chǎn)生分類誤差。此外,細(xì)沙泥田的生產(chǎn)精度較低,分類時(shí)易與細(xì)沙泥土混淆,從而影響到整體分類精度。
綜上所述,經(jīng)264個(gè)野外獨(dú)立樣點(diǎn)驗(yàn)證結(jié)果表明,基于多時(shí)序遙感影像推理得到的土壤圖分類精度達(dá)到了86%,土壤圖斑更為破碎,數(shù)量變多,空間詳細(xì)程度更高,Kappa系數(shù)為83%,驗(yàn)證樣點(diǎn)與推理之間具有顯著的一致性水平,因此利用這種方法來推理得到研究區(qū)的土壤類型空間分布信息是可行的。
表4 實(shí)地驗(yàn)證點(diǎn)與推理土壤圖間的混淆矩陣
注:總264個(gè)驗(yàn)證點(diǎn),其中226個(gè)點(diǎn)分類正確,總體精度86%,Kappa系數(shù)為83%。
本研究提出了一種基于多時(shí)相遙感影像和隨機(jī)森林算法的土壤推理制圖方法。利用時(shí)序哨兵二號(hào)遙感影像數(shù)據(jù)提取歸一化植被指數(shù),作為遙感因子與常用的高程等地形因子、母質(zhì)類型組成完整的環(huán)境因子集,并通過隨機(jī)森林算法提取土壤–環(huán)境知識(shí)后推理制圖,經(jīng)野外獨(dú)立驗(yàn)證點(diǎn)驗(yàn)證其結(jié)果分類精度高達(dá)86%,更新后土壤圖表達(dá)出的研究區(qū)內(nèi)各土壤類型的分布信息可信度較高。
已有研究大多采用單時(shí)相遙感影像數(shù)據(jù),通過提取植被指數(shù)、紋理信息、主成分等遙感光譜指數(shù)用于土壤分類及土壤屬性制圖,并取得了較好的結(jié)果,但同時(shí)我們也應(yīng)看到不同季節(jié)影像的制圖結(jié)果具有較大的差異,且在影像時(shí)間的選擇上多存在主觀性。相比于單時(shí)相遙感影像數(shù)據(jù)易受天氣、季節(jié)等因素的影響,本研究采用多時(shí)序遙感影像數(shù)據(jù)參與土壤制圖,避免了依賴單時(shí)相遙感影像數(shù)據(jù)的局限性。周紫燕等[23]在同一區(qū)域的研究中,同樣采用了隨機(jī)森林算法進(jìn)行數(shù)據(jù)挖掘,但不同的是其使用的環(huán)境因子中除了常用的地形因子外,只加入了單時(shí)相的遙感因子,制圖精度為76%。與其相比,本研究加入的是多時(shí)相遙感因子,推理土壤圖的準(zhǔn)確性有了明顯提升,精度提高了10%。本研究結(jié)果具有較高的預(yù)測(cè)精度,各土壤類型空間分布的詳細(xì)程度有較大提升,可以滿足未來對(duì)高精度數(shù)字土壤制圖的要求,為土壤普查工作提供參考依據(jù)。
本研究雖取得了較好的分類精度,但仍有一些需要改進(jìn)的地方。在遙感影像的數(shù)據(jù)基礎(chǔ)上,僅提取了時(shí)序歸一化植被指數(shù),未對(duì)其他可從影像提取的光譜信息加以利用,而歸一化植被指數(shù)實(shí)際上由植被和土壤兩部分組成,土壤背景對(duì)歸一化植被指數(shù)干擾強(qiáng)烈,影響較大,且在植被稀疏的地方,歸一化植被指數(shù)的表征能力較差。未來可引入更多能間接反映土壤發(fā)生發(fā)育的遙感光譜指數(shù),同時(shí),為避免環(huán)境因子較多帶來的數(shù)據(jù)冗余現(xiàn)象,可采用主成分分析對(duì)因子進(jìn)行降維處理,以減少不必要的信息冗余;此外,可對(duì)研究區(qū)進(jìn)行地貌分區(qū),針對(duì)不同區(qū)域采用不同的推理協(xié)同因子組合和權(quán)重,分區(qū)制圖。
[1] Hudson B D.The soil survey as paradigm-based science[J].Soil Science Society of America Journal, 1992, 56(3): 836–841.
[2] Zhu A X, Hudson B, Burt J, et al.Soil mapping using GIS, expert knowledge, and fuzzy logic[J].Soil Science Society of America Journal, 2001, 65(5): 1463–1472.
[3] Shi X, Zhu A X, Burt J E, et al.A case-based reasoning approach to fuzzy soil mapping[J].Soil Science Society of America Journal, 2004, 68(3): 885–894.
[4] McBratney A B, Mendon?a Santos M L, Minasny B.On digital soil mapping[J].Geoderma, 2003, 117(1/2): 3–52.
[5] 孫福軍, 雷秋良, 劉穎, 等.數(shù)字土壤制圖技術(shù)研究進(jìn)展與展望[J].土壤通報(bào), 2011, 42(6): 1502–1507.
[6] 朱阿興, 楊琳, 樊乃卿, 等.數(shù)字土壤制圖研究綜述與展望[J].地理科學(xué)進(jìn)展, 2018, 37(1): 66–78.
[7] 王琪, 吳成永, 陳克龍, 等.基于多光譜遙感圖像的青海湖流域土壤有機(jī)質(zhì)估算初探[J].土壤, 2019, 51(1): 160–167.
[8] 劉峰, 朱阿興, 李寶林, 等.利用陸面反饋動(dòng)態(tài)模式來識(shí)別土壤類型的空間差異[J].土壤通報(bào), 2009, 40(3): 501–508.
[9] Zhu A X, Liu F, Li B L, et al.Differentiation of soil conditions over low relief areas using feedback dynamic patterns[J].Soil Science Society of America Journal, 2010, 74(3): 861–869.
[10] Zeng C Y, Zhu A, Liu F, et al.The impact of rainfall magnitude on the performance of digital soil mapping over low-relief areas using a land surface dynamic feedback method[J].Ecological Indicators, 2017, 72: 297–309.
[11] 宋敏, 楊琳, 朱阿興, 等.輪作模式在農(nóng)耕區(qū)土壤有機(jī)質(zhì)推測(cè)制圖中的應(yīng)用[J].土壤通報(bào), 2017, 48(4): 778–785.
[12] Yang L, Song M, Zhu A, et al.Predicting soil organic carbon content in croplands using crop rotation and Fourier transform decomposed variables[J].Geoderma, 2019, 340: 289–302.
[13] Mulder V L, de Bruin S, Schaepman M E, et al.The use of remote sensing in soil and terrain mapping—A review[J].Geoderma, 2011, 162(1/2): 1–19.
[14] Sreenivas K, Dadhwal V K, Kumar S, et al.Digital mapping of soil organic and inorganic carbon status in India[J].Geoderma, 2016, 269: 160–173.
[15] 韓浩武, 許偉, 黃魏, 等.基于遙感影像和決策樹算法的土壤制圖[J].土壤通報(bào), 2019, 50(1): 8–14.
[16] 劉煥軍, 楊昊軒, 徐夢(mèng)園, 等.基于裸土期多時(shí)相遙感影像特征及最大似然法的土壤分類[J].農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(14): 132–139, 304.
[17] 朱阿興, 李寶林, 楊琳, 等.基于GIS、模糊邏輯和專家知識(shí)的土壤制圖及其在中國(guó)應(yīng)用前景[J].土壤學(xué)報(bào), 2005, 42(5): 142–149.
[18] 楊琳, Fahmy S, Hann S, 等.基于土壤–環(huán)境關(guān)系的更新傳統(tǒng)土壤圖研究[J].土壤學(xué)報(bào), 2010, 47(6): 1039– 1049.
[19] 周斌, 王繁, 王人潮.運(yùn)用分類樹進(jìn)行土壤類型自動(dòng)制圖的研究[J].水土保持學(xué)報(bào), 2004, 18(2): 140–143,147.
[20] 黃魏, 羅云, 汪善勤, 等.基于傳統(tǒng)土壤圖的土壤–環(huán)境關(guān)系獲取及推理制圖研究[J].土壤學(xué)報(bào), 2016, 53(1): 72–80.
[21] 石偉, 南卓銅, 李韌, 等.基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究[J].土壤學(xué)報(bào), 2011, 48(3): 461–469.
[22] 邱琳, 李安波, 趙玉國(guó).基于Fisher判別分析的數(shù)字土壤制圖研究[J].土壤通報(bào), 2012, 43(6): 1281–1286.
[23] 周紫燕, 黃魏, 許偉, 等.基于隨機(jī)森林算法的原始土壤圖更新研究[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2019, 38(3): 53–59.
[24] 韓杏杏, 陳杰, 王海洋, 等.基于隨機(jī)森林模型的耕地表層土壤有機(jī)質(zhì)含量空間預(yù)測(cè)——以河南省輝縣市為例[J].土壤, 2019, 51(1): 152–159.
[25] 姜賽平, 張懷志, 張認(rèn)連, 等.基于三種空間預(yù)測(cè)模型的海南島土壤有機(jī)質(zhì)空間分布研究[J].土壤學(xué)報(bào), 2018, 55(4): 1007–1017.
[26] 盧宏亮, 趙明松, 劉斌寅, 等.基于隨機(jī)森林模型的安徽省土壤屬性空間分布預(yù)測(cè)[J].土壤, 2019, 51(3): 602–608.
[27] 袁玉琦, 陳翰閱, 張黎明, 等.基于多變量與RF算法的耕地土壤有機(jī)碳空間預(yù)測(cè)研究——以福建亞熱帶復(fù)雜地貌區(qū)為例[J].土壤學(xué)報(bào), 2021, 58(4): 887–899.
[28] Breiman L.Random forests[J].Machine Learning, 2001, 45(1): 5–32.
[29] Efron B, Tibshirani R J.Introduction//An Introduction to the Bootstrap[M].Boston, MA: Springer US, 1993: 1–9.
[30] 朱阿興.精細(xì)數(shù)字土壤普查模型與方法[M].北京: 科學(xué)出版社, 2008.
Soil Mapping Based on Multi-temporal Remote Sensing Images and Random Forest Algorithm
CHEN Rong, HAN Haowu, FU Peihong, YANG Yufei, HUANG Wei*
(College of Resources and Environment, Huazhong Agricultural University, Wuhan 430070, China)
Extracting accurate soil-environment relationship is the key to digital soil mapping.Nowadays, remote sensing images have been used as the indicators of environmental factors in the process of obtaining soil-environment knowledge.However, the spectral differences in mono-temporal image are difficult to be used to distinguish soil types.In this study, we proposed a soil mapping method based on multi-temporal remote sensing images.The Sheshui River Basin in Huajiahe Town, Hongan County, Huanggang City of Hubei Province was selected as the study area, and the parent-material-type map, the multi-temporal sentinel-2 remote sensing images, and contour data were used to extract environmental factors related to soil properties.Soil environment relationships were obtained to infer the spatial distribution of soil types using the random forest algorithm.The field sampling points in the study area were used for validation, and the confusion matrix and Kappa coefficient of inferenced soil map were calculated to evaluate the map accuracy.The results demonstrated that the overall classification accuracy of the inferred soil map was as high as 86%.The soil type map obtained by inference was similar to the traditional soil map in the spatial distribution, but it could display more detailed information than the traditional soil map.This research can provide an effective alternative for updating the traditional soil map.
Soil land inference model; Random forest algorithm; Remote sensing images; Digital soil mapping
S159
A
10.13758/j.cnki.tr.2021.05.026
陳榮, 韓浩武, 傅佩紅, 等.基于多時(shí)相遙感影像和隨機(jī)森林算法的土壤制圖.土壤, 2021, 53(5): 1087–1094.
國(guó)家自然科學(xué)基金項(xiàng)目(41877001)、國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFD0202000)和中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(2662019PY074)資助。
通訊作者(ccan@mail.hzau.edu.cn)
陳榮(1996—),女,湖北咸寧人,碩士研究生,主要從事精細(xì)數(shù)字土壤制圖研究。E-mail: charlottechen@webmail.hzau.edu.cn