趙彥鋒 李豪杰 陳 杰 孫志英 梁思源
(1 鄭州大學(xué)水利與環(huán)境學(xué)院地理信息科學(xué)系,鄭州 450001)
(2 河南省國土資源調(diào)查規(guī)劃院,鄭州 450016)
(3 鄭州大學(xué)公共管理學(xué)院,鄭州 450001)
由于土壤—成土因子之間的多尺度、非線性關(guān)系,基于詹尼方程和傳統(tǒng)數(shù)學(xué)預(yù)測土壤屬性具有較大局限性;1950—2000年,假設(shè)土壤類型與其屬性的對應(yīng)關(guān)系,土壤類型連接法是進(jìn)行土壤有機(jī)碳密度(Soil organic carbon density,SOCD)和碳儲量估算的常用方法[1-7]。隨著現(xiàn)代數(shù)學(xué)發(fā)展,以及數(shù)字高程、遙感等制圖輔助變量的類型日益廣泛和易得,以數(shù)字土壤制圖(Digital soil mapping,DSM)方式進(jìn)行土壤有機(jī)碳密度制圖和儲量估算成為主流。當(dāng)前,土壤有機(jī)碳的DSM方法總體分為三類[8]:第一,純粹的空間方法,即地統(tǒng)計(jì)學(xué)方法。第二,確定性關(guān)系建模方法。最初這類方法主要指線性回歸,現(xiàn)在則廣泛地包括空間地理回歸、人工神經(jīng)網(wǎng)絡(luò)、回歸樹等現(xiàn)代數(shù)學(xué)方法[9-16]。第三,混合模型方法?;旌夏P椭饕腔貧w克里格概念的延伸:回歸可以是線性回歸,也可以是以土壤或土地類型單元提取的趨勢(均值或中值),也可以是各種機(jī)器學(xué)習(xí)算法的結(jié)果。也即在各種算法基礎(chǔ)上,對預(yù)測殘差進(jìn)一步應(yīng)用克里格插值的方法均被稱為回歸克里格[17-20]。
盡管土壤有機(jī)碳的DSM技術(shù)發(fā)展較快,但由于大空間尺度土壤碳密度的影響因素復(fù)雜,同時(shí)由于剖面深層土壤碳密度與地形、遙感等環(huán)境協(xié)變量的關(guān)系減弱[21-22],使得1m土體碳密度制圖的DSM模型并不總能取得理想精度。因此,土壤類型連接法在大、中尺度土體的碳密度制圖方面仍具有較強(qiáng)的實(shí)踐價(jià)值[23]。同時(shí),土壤類型連接法在土壤碳密度制圖和碳儲量估算方面已取得不少成果,應(yīng)將其與DSM法系統(tǒng)對比,以便更加客觀看待之。對于現(xiàn)有的DSM方法而言,一些比較研究中強(qiáng)調(diào)模型法較克里格法有效[24],或者回歸克里格方法能有效結(jié)合模型方法和空間方法的優(yōu)勢等[16-19]。Brungard等[25]比較11種機(jī)器學(xué)習(xí)算法,發(fā)現(xiàn)隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等復(fù)雜的建模方法一般優(yōu)于k臨近距離、多元邏輯回歸等簡單建模方法。顯然,上述研究者傾向于認(rèn)為更復(fù)雜和精密的方法對提高土壤制圖效果具有重要意義,但該觀點(diǎn)并不全面。如Heung等[26]比較了10種機(jī)器學(xué)習(xí)算法在數(shù)字土壤制圖中的效果,發(fā)現(xiàn)k鄰近距離法和支持向量機(jī)法優(yōu)于人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等其他方法;而Taghizadeh-Mehrjardi等[27]在類似的研究中表明人工神經(jīng)網(wǎng)絡(luò)和決策樹法優(yōu)于支持向量機(jī)、K鄰近距離和隨機(jī)森林;上述結(jié)論存在矛盾之處。一些研究認(rèn)識到研究條件對結(jié)果的制約,如對于不同類型區(qū)或者參數(shù)組合不同,隨機(jī)森林方法效果差異較大;而Martin等[15]發(fā)現(xiàn)當(dāng)更有效的土壤有機(jī)碳驅(qū)動因子被代入BRT(Boosted regression trees,BRT)模型,再進(jìn)行殘差克里格的實(shí)際意義不大。
可見,土壤預(yù)測制圖效果并不完全取決于方法的精密性和復(fù)雜性。更本質(zhì)的原因,應(yīng)從土壤變異性被制圖方法揭示的程度探究。這可能涉及本底數(shù)據(jù)的詳細(xì)性(如土壤類型)、關(guān)鍵協(xié)變量的應(yīng)用、方法對關(guān)鍵變量的利用效率等多種因素。本文以南陽市1m土體土壤有機(jī)碳密度制圖為例,擬通過對土壤類型連接法、普通線性回歸、空間地理回歸、隨機(jī)森林、普通克里格、回歸克里格等的系統(tǒng)對比,分析土壤變異解釋機(jī)制對制圖效果的影響。
研究區(qū)位于河南省西南部(圖1),面積2.66萬 km2,北亞熱帶氣候,年降雨量800 mm;西北部為中山、低山,東部為低山丘陵,中南部為河流沖積平原,東南續(xù)接桐柏山地。按發(fā)生分類體系,土壤可分為10個(gè)土類(圖2a)、19個(gè)亞類、37個(gè)土屬。
收集第二次土壤普查時(shí)期土壤剖面數(shù)據(jù)488個(gè),隨機(jī)抽取其中90%,即439個(gè)樣點(diǎn)為訓(xùn)練練據(jù)進(jìn)行1m土體SOCD制圖,其余49個(gè)剖面作為驗(yàn)證數(shù)據(jù)(圖1)。土壤剖面樣點(diǎn)記錄了特征土層深度區(qū)間、每層的土壤有機(jī)質(zhì)、容重、礫石含量和砂姜含量等數(shù)據(jù),按下式計(jì)算SOCD[3-7],
圖1 研究區(qū)及土壤樣點(diǎn)分布圖Fig. 1 Distribution of the study area and soil samples
式中,SOCD為土壤剖面有機(jī)碳密度(kg m-2);θi為第i層>2 mm礫石(砂姜作為礫石對待)含量(%);ρi為第i層土壤容重(g cm-3);Ci為第i層土壤有機(jī)碳含量(g kg-1),由有機(jī)質(zhì)含量×0.58換算得到;Ti為第i層土層的厚度(cm);n為參與計(jì)算的土壤層次總數(shù);100為用于單位換算的常數(shù)。訓(xùn)練數(shù)據(jù)在土壤表層的有機(jī)質(zhì)(organic matter,OM)含量和1m土體的SOCD統(tǒng)計(jì)見表1。
表1 1m土體土壤有機(jī)碳密度和表層土壤有機(jī)質(zhì)的統(tǒng)計(jì)特征Table 1 Statistical features of SOCD(soil organic carbon density )of 1 m thickness soil body and OM content of topsoil
圖2 南陽市土壤類型(a)和土壤表層有機(jī)質(zhì)含量(b)示意圖Fig. 2 Soil map(a)and topsoil OM content map(b)of Nanyang City
地形變量:收集該區(qū)30 m分辨率數(shù)字高程,取高程、坡度、坡向、平面曲率、剖面曲率、復(fù)合地形指數(shù)作為預(yù)測土壤有機(jī)碳的地形變量。
土壤表層有機(jī)質(zhì)數(shù)據(jù):土壤剖面最上部土層的有機(jī)質(zhì)含量數(shù)據(jù)結(jié)構(gòu)性變異比例為67.5%,將其Kriging插值圖(圖2b)作為預(yù)測土壤1m 土體SOCD的變量之一。
遙感數(shù)據(jù):南陽市第二次土壤普查工作主要在1980—1983年間開展,各縣并不一致,遙感影像年份無法做到與土壤樣本采集時(shí)間的完全對應(yīng)。因此,遙感影像數(shù)據(jù)的應(yīng)用定位為對土壤母質(zhì)、土壤相對濕度、山區(qū)自然植被差異等信息的補(bǔ)充,上述信息受人為土地利用干擾相對較少,可放寬對遙感時(shí)效的要求。特在可得數(shù)據(jù)源中選擇了1990年5月2日云量為0%的TM影像(通過地理空間數(shù)據(jù)云平臺下載),當(dāng)?shù)刂饕r(nóng)作物——小麥此時(shí)已成熟,影像數(shù)據(jù)更利于反映自然植被類型差異和土壤差異。提取TM1-7波段、歸一化植被指數(shù)、穗帽變換(Tasseled cap transformation,TC)的3個(gè)成分亮度、綠度、濕度(Wetness of TC,TCW)等作為土壤有機(jī)碳密度制圖的環(huán)境協(xié)變量。
基于南陽市1∶5萬數(shù)字化土壤圖,按土屬、亞類、土類3個(gè)分類級別進(jìn)行概括,依次得到土屬圖、亞類圖和土類圖;分別采用均值連接法(Mean法)、中值連接法(Median法)將土壤剖面計(jì)算得到的碳密度值連接到土壤圖圖斑。
WLS回歸:即加權(quán)最小二乘法線性回歸。在普通最小二乘法回歸(OLS)公式Y(jié)=XB+μ基礎(chǔ)上(其中Y為因變量,X為自變量,B為回歸系數(shù),μ為隨機(jī)誤差),構(gòu)建權(quán)重矩陣W=DDT,使D-1Y=D-1XB+D-1μ,按 ?B=(XTW-1X)-1XTW-1Y計(jì)算回歸系數(shù),即為WLS回歸。WLS回歸改變了OLS回歸中所有變量貢獻(xiàn)相同的假設(shè),而使變異較大的觀察值對分析的影響小、變異小的觀察值對分析的影響大,可取得更理想的回歸模型。本研究采用變量乘冪的導(dǎo)數(shù)為權(quán)重值,冪值在SPSS中根據(jù)最大似然法估計(jì)λ的最優(yōu)值。得到WLS方程后,在ArcGIS10.3中進(jìn)行計(jì)算,實(shí)現(xiàn)SOCD的預(yù)測。
GWR回歸:即地理權(quán)重最小二乘法回歸[10,28]。其公式為其中(μi,νi)表示第i個(gè)采樣點(diǎn)坐標(biāo),βj(μi,νi)為第i個(gè)采樣點(diǎn)的第j個(gè)自變量xij的回歸系數(shù),εi為該點(diǎn)的回歸誤差。GWR回歸中,周圍采樣點(diǎn)根據(jù)其距離預(yù)測點(diǎn)i的距離計(jì)算其進(jìn)入回歸方程時(shí)的權(quán)重,每個(gè)采樣點(diǎn)相對于其他采樣點(diǎn)均有一個(gè)權(quán)重系數(shù),n個(gè)采樣點(diǎn)就構(gòu)成n×n空間權(quán)重對角矩陣,本文采用二次距離衰減函數(shù)擬合權(quán)重系數(shù),公式為wij=[1-(dij/h)2]2∣dij<h,wij=0∣dij>h,其中dij為兩點(diǎn)間的歐氏距離,h為衰減函數(shù)的帶寬,超出h認(rèn)為樣點(diǎn)的作用權(quán)重為0。帶寬的確定一般有固定內(nèi)核和自適應(yīng)內(nèi)核兩種方法,前者給出確定性帶寬,后者則根據(jù)樣點(diǎn)密度分布進(jìn)行自動調(diào)整,本文采用自適應(yīng)內(nèi)核。通過計(jì)算wij構(gòu)造權(quán)重矩陣W(μi,νi),進(jìn)而估算回歸系數(shù) ?B=(XTW(μi,νi)X)-1XTW(μi,νi)Y。應(yīng)用ArcGIS 10.3地理回歸工具模塊進(jìn)行計(jì)算。
隨機(jī)森林(Random Forest,簡寫為RF):由Breiman[29]改進(jìn)分類樹算法而來,是一種機(jī)器學(xué)習(xí)算法。其優(yōu)點(diǎn)是:可以避免過擬合、能同時(shí)利用名義變量(如土壤類型)和數(shù)值變量;每次運(yùn)行隨機(jī)森林,均隨機(jī)抽取1/3的數(shù)據(jù)不參與建模,被稱為范圍外數(shù)據(jù)(Out of Bag,簡稱OOB),模型自動對OOB數(shù)據(jù)實(shí)測值和模型運(yùn)算值交叉檢驗(yàn),計(jì)算OOB數(shù)據(jù)變異的解釋比例,是對整個(gè)訓(xùn)練數(shù)據(jù)變異解釋比的無偏估計(jì)。
根據(jù)驗(yàn)證數(shù)據(jù)集驗(yàn)證和訓(xùn)練數(shù)據(jù)集交叉驗(yàn)證的相關(guān)系數(shù)(r)、平均預(yù)測誤差(ME)、均方根預(yù)測誤差(RMSE)、變異解釋比(Varex)對SOCD預(yù)測結(jié)果進(jìn)行評判[11-12]。其中
式中,ε為預(yù)測誤差,為預(yù)測誤差均值,z為實(shí)測有機(jī)碳儲量,為實(shí)測有機(jī)碳儲量均值。
隨機(jī)森林的范圍外數(shù)據(jù)分析可提供SOCD關(guān)鍵協(xié)變量解釋力無偏估算途徑,當(dāng)訓(xùn)練樹足夠多時(shí),結(jié)果具有高度的重復(fù)性(表2)。由表2可知:第1,土屬對SOCD變異的解釋能力最強(qiáng),其次是亞類、土類、有機(jī)質(zhì),3次隨機(jī)計(jì)算的平均解釋力分別達(dá)到40.8%、37.9%、37.0%和21.9%。第2,土屬與土壤OM組合達(dá)到了57.5%的變異解釋比,附加其他變量過多又導(dǎo)致變異解釋比降低,所有變量全部應(yīng)用僅達(dá)到52.7%的變異解釋比。第3,排除土壤OM和土壤類型信息,其他變量對SOCD變異的綜合解釋能力不超過2%。第4,高程、坡度和濕度指數(shù)(TCW)等單獨(dú)使用對SOCD變異的解釋力為負(fù),即完全沒有規(guī)律性,但與一些重要變量結(jié)合,則提高原有變量的解釋力,如OM+TCW解釋力上升為28.9%。上述結(jié)果定量說明:(1)在預(yù)測SOCD方面土壤類別是最重要的變量,其次是土壤表層OM。(2)所有變量共同參與建模并不能達(dá)到最高的解釋力,可見非重要變量進(jìn)入模型增加了噪聲。(3)高程、坡度、TCW等的作用效果是依附主要變量的,即主要參與對主要變量預(yù)測結(jié)果進(jìn)一步細(xì)分,可以認(rèn)為它們只解釋局部的數(shù)據(jù)變異性。
純空間方法不需借助協(xié)變量,而是從空間相關(guān)性的角度對土壤SOCD變異性進(jìn)行解釋。盡管SOCD空間相關(guān)性與其關(guān)鍵協(xié)變量在空間上的變化規(guī)律可能有關(guān),但就數(shù)學(xué)原理而言,它們提供了完全不同的解釋機(jī)制。變異函數(shù)分析表明,SOCD在14 400 m變程范圍內(nèi)具有40.5%的空間變異結(jié)構(gòu)性(圖3a),即可由空間相關(guān)性解釋的總方差為40.5%,這一數(shù)值低于關(guān)鍵參數(shù)組合所能達(dá)到的最大變異解釋力,而與土壤類型對SOCD變異的解釋力接近。
回歸Kriging模型對土壤SOCD變異的解釋可分為趨勢模型和殘差變異函數(shù)特征兩個(gè)部分。很顯然,趨勢和殘差不是互相獨(dú)立的,不同方法提取趨勢值后殘差的空間變異結(jié)構(gòu)性顯著不同。以土壤類型均值、中值提取趨勢值后的的SOCD殘差呈現(xiàn)較強(qiáng)的隨機(jī)變異特征,理論上不能再借助空間相關(guān)性途徑獲得補(bǔ)充性的變異解釋;采用土壤類型和土壤表層OM等關(guān)鍵變量組合進(jìn)行隨機(jī)森林建模計(jì)算的結(jié)果殘差亦如此;而WLS、GWL和RF(OM+TCW)方法提取趨勢后的殘差空間變異結(jié)構(gòu)性達(dá)到33.1%、25.0%和25.9%,殘差可提供額外的變異解釋。
表2 基于隨機(jī)森林的預(yù)測變量對SOCD變異的解釋力Table 2 Variance explanation of covariates for predicting SOCD of 1m thickness soil body based on RF model
土類、亞類、土屬的Mean連接法結(jié)果見圖3。土類圖、亞類圖、土屬圖斑數(shù)分別為2 213、2 866、4 057,從亞類~土屬的圖斑詳細(xì)度增加較大,制圖細(xì)節(jié)的變化也主要發(fā)生在亞類~土屬的變化。驗(yàn)證數(shù)據(jù)集參數(shù)的改善也主要體現(xiàn)這一特征(表3):其數(shù)據(jù)集驗(yàn)證的r分別為0.51、0.51和0.58,Varex為0.29、0.30和0.35。ME為-0.41、-0.43、-0.31;Median連接法具有類似規(guī)律,但驗(yàn)證集中Median法的r值和Varex普遍略低于同分類級別的Mean法的r值和Varex,說明對土壤類型估值而言,本例中均值較中值可能更有代表性。土壤類型連接法的突出特征還表現(xiàn)在圖斑邊界線兩側(cè)的突變明顯,空間變異的漸變性表現(xiàn)不佳。
圖3 基于土壤類型連接法的SOCD制圖Fig. 3 SOCD maps based on soil category linkage method
表3 有機(jī)碳密度制圖的結(jié)果驗(yàn)證Table 3 Verification of the SOCD maps
用逐步回歸篩選出土壤表層OM和TCW構(gòu)成對SOCD的最佳解釋變量組合,其他變量則由于多重共線性而被排除。WLS回歸系數(shù)r為0.45,關(guān)系式為
WLS回歸預(yù)測的SOCD表現(xiàn)明顯的平滑效應(yīng),且出現(xiàn)最小值為負(fù)的極端推論(圖4a)。其驗(yàn)證數(shù)據(jù)集r系數(shù)為0.20(表3),Varex為0.04,實(shí)際預(yù)測效果明顯不如土壤類型連接法。
同樣采用OM和TCW變量進(jìn)行SOCD的GWR回歸,制圖效果較WLS回歸平滑效應(yīng)小、局部細(xì)節(jié)變異獲得較好擬合(圖4b),驗(yàn)證數(shù)據(jù)的r為0.42,Varex為0.16,較WLS回歸明顯改善(表3)。從制圖形式上GWR結(jié)果更接近土壤類型連接法,但對驗(yàn)證數(shù)據(jù)集的預(yù)測效果仍不如后者。
圖4 基于WLS(a)和GWR(b)的SOCD制圖Fig. 4 SOCD maps based on WLS regression(a)and GWR regression(b)
基于O M和T C W的隨機(jī)森林制圖,即R F(OM+TCW)結(jié)果見圖5a,其驗(yàn)證數(shù)據(jù)的r為0.41,Varex為0.15,精度與GWR法相當(dāng)。
OM+Genus(土屬)、 OM+Genus+TCW(圖5b)、“所有變量”等3種組合方式下的RF預(yù)測結(jié)果相似,文中只列出一種。比較可知,較之土壤類型法和其他模型法,結(jié)合了土壤類型和土壤OM的RF結(jié)果既避免了土壤圖斑邊界兩側(cè)的突變,也較大程度避免了平滑效應(yīng)、突出了空間變異的細(xì)節(jié),并防止了WLS和GWR的過度外推。其驗(yàn)證數(shù)據(jù)集的r分別達(dá)到0.62、0.65、0.65,Varex為0.32、0.37、0.35,檢驗(yàn)指標(biāo)優(yōu)于土壤類型連接法、GWR回歸和WLS回歸。
對土壤有機(jī)碳密度進(jìn)行普通Krging插值的結(jié)果(圖6a)在宏觀趨勢方面與土壤類型法、RF(OM+Genus+TCW)均較接近,但在細(xì)節(jié)表達(dá)方面稍欠佳。表現(xiàn)為驗(yàn)證數(shù)據(jù)檢驗(yàn)的r為0.53,與土壤類型連接法相當(dāng),而Varex為0.23,略低于后者。然而,在趨勢和細(xì)節(jié)表達(dá)方面,普通Kriging結(jié)果均較WLS和GWR結(jié)果好。
土壤類型連接法、隨機(jī)森林法、GWR法的交叉驗(yàn)證結(jié)果均顯示(表3),它們的制圖結(jié)果與訓(xùn)練數(shù)據(jù)的擬合程度較好,因此它們的殘差呈隨機(jī)性變異的可能性更大。此外,不同的趨勢提取方法也影響到殘差的計(jì)算,最終的變異函數(shù)計(jì)算表明:僅對WLS、GWR和RF(OM+TCW)的計(jì)算結(jié)果執(zhí)行殘差Kriging具有實(shí)際意義。數(shù)據(jù)集檢驗(yàn)的結(jié)果顯示:盡管WLS原始結(jié)果表現(xiàn)最差,但通過殘差Kriging其預(yù)測效果得到的補(bǔ)償最為顯著,最終WLS+RK的效果優(yōu)于GWR+RK,而RF(OM+TCW)+RK的效果最差(表3)。
圖5 基于隨機(jī)森林的SOCD制圖Fig. 5 SOCD maps based on RF models
圖6 基于普通Kriging(a)和回歸Kriging的SOCD制圖(b:WLS回歸+殘差Kriging)Fig. 6 SOCD maps based on ordinary kriging(a)and regression kriging(b:WLS regression+residual kriging )
與普通Kriging類似,WLS+RK在趨勢方面與土壤類型Mean連接法和RF(OM+Genus+TCW)的結(jié)果很相似(圖6b),但在細(xì)節(jié)方面略遜,表現(xiàn)為驗(yàn)證數(shù)據(jù)集的r和Varex略低。盡管以殘差Kriging進(jìn)行了補(bǔ)償,GWR+RK、RF(OM+TCW)+RK的效果未達(dá)到普通Kriging和土壤類型連接法的同等效果。必須指出,較之土壤類型連接法和其他模型法,回歸Kriging使訓(xùn)練數(shù)據(jù)交叉檢驗(yàn)的參數(shù)r、RMSE和Varex均顯著改善,這顯然是由于在訓(xùn)練點(diǎn)位置殘差得到補(bǔ)償?shù)慕Y(jié)果,制圖效果和驗(yàn)證數(shù)據(jù)集的檢驗(yàn)均表明這種改善的“預(yù)測意義”不大。
制圖效果取決于制圖模型是否充分利用了訓(xùn)練數(shù)據(jù)中關(guān)鍵預(yù)測變量、空間變異函數(shù)或者它們的組合所蘊(yùn)含的解釋力,方法復(fù)雜性的影響則在其次。在南陽地區(qū),土壤表層有機(jī)質(zhì)含量對1m土體SOCD變異的解釋力為21.9%;土類、亞類、土屬所能解釋的1m土體SOCD變異為37.0%~40.8%;土屬與土壤表層OM對SOCD變異的聯(lián)合解釋能力為57.5%;變異函數(shù)提供的空間相關(guān)性對SOCD變異的解釋力為40.5%。各類SOCD制圖方法的效果與其所用參數(shù)的解釋力關(guān)系密切:同時(shí)利用土壤類型和土壤表層OM的隨機(jī)森林RF(OM+Genus)或RF(OM+Genus+TCW)等效果較好;土壤類型連接法、普通Kriging插值的效果次之;GWR和RF(OM+TCW)采用非線性回歸方式進(jìn)行建模的效果明顯優(yōu)于WLS,但由于僅利用到關(guān)鍵參數(shù)OM,它們的總體效果顯著低于前述方法??臻g相關(guān)性與關(guān)鍵協(xié)變量建模是兩種不同的解釋機(jī)制,它們所能解釋的土壤變異可能包含或交叉重疊,并不能保證回歸Kriging是最優(yōu)方法,本例中WLS、GWR和RF(OM+TCW)得到殘差補(bǔ)償后并沒有使其制圖效果達(dá)到RF(OM+Genus)或RF(OM+Genus+TCW)的精度水平。并且趨勢性建模方式也不可避免影響到殘差變異結(jié)構(gòu)的計(jì)算:WLS、GWR和RF(OM+TCW)在原始模型中對訓(xùn)練數(shù)據(jù)的擬合效果依次升高,但其RK結(jié)果的優(yōu)劣排序則相反。
[1] Bohn H L. Estimate of organic carbon in world soils.Soil Science Society of America Journal,1982,46:1118—1119
[2] Batjes N H. Total carbon and nitrogen in the soils of the world. European Journal of Soil Science,1996,47(2):151—163
[3] 解憲麗,孫波,周慧珍,等. 中國土壤有機(jī)碳密度和儲量的估算與空間分布分析. 土壤學(xué)報(bào),2004,41(1):35—43 Xie X L,Sun B,Zhou H Z,et al. Organic carbon density and storage in soils of China and spatial analysis(In Chinese). Acta Pedologica Sinica,2004,41(1):35—43
[4] Shi X Z,Yu D S,Warner E D,et al. Soil database of 1∶1 000 000 digital soil survey and reference system of the Chinese genetic soil classification system. Soil Survey Horizon,2004,45(4):129—136
[5] 于東升,史學(xué)正,孫維俠,等. 基于1∶100 萬土壤數(shù)據(jù)庫的中國SOCD及儲量研究. 應(yīng)用生態(tài)學(xué)報(bào),2005,16(12):2279—2283 Yu D S,Shi X Z,Sun W X,et al. Estimation of China soil organic carbon and density based on 1∶1000 000 soil database(In Chinese). Chinese Journal of Applied Ecology,2005,16(12):2279—2283
[6] 張勇,史學(xué)正,于東升,等. 屬性數(shù)據(jù)與空間數(shù)據(jù)連接對土壤有機(jī)碳儲量估算的影響. 地球科學(xué)進(jìn)展,2008,23(8):840—847 Zhang Y,Shi X Z,Yu D S,et al. Effects of the linkage between spatial data and attribute data on estimates of soil organic carbon(In Chinese). Advances in Earth Science,2008,23(8):840—847
[7] 支俊俊,荊長偉,張操,等. 利用1∶5 萬土壤數(shù)據(jù)庫估算浙江省土壤有機(jī)碳密度及儲量. 應(yīng)用生態(tài)學(xué)報(bào),2013,24(3):683—689 Zhi J J,Jing C W,Zhang C,et al. Estimation of soil organic carbon density and storage in Zhejiang Province by using 1∶50 000 soil database(In Chinese).Chinese Journal of Applied Ecology,2013,24(3):683—689
[8] Minasy B,Mcbratney A B,Malone B,et al. Digital mapping of soil carbon. Advances in Agronomy,2013,118(118):1—47
[9] Ratnayake R R,Karunaratne S B,Lessels J S,et al.Digital soil mapping of organic carbon concentration in paddy growing soils of Northern Sri Lanka. Geoderma Regional,2016,7(2):167—176
[10] 王庫. 基于地理權(quán)重回歸模型的土壤有機(jī)質(zhì)空間預(yù)測.土壤通報(bào),2013,44(1):21—28 Wang K. Spatial estimation of soil organic matter by using geographically weighted regression model(In Chinese). Journal of Chinese Journal of Soil Sciecne,2013,44(1):21—28
[11] Wiesmeier M,Barthold F,Blank B,et al. Digital mapping of soil organic matter stocks using Random Forest modeling in a semi-arid steppe ecosystem. Plant Soil,2011,340(1):7—24
[12] 王茵茵,齊雁冰,陳洋,等. 基于多分辨率遙感數(shù)據(jù)與隨機(jī)森林算法的土壤有機(jī)質(zhì)預(yù)測研究. 土壤學(xué)報(bào),2016,53(2):342—354 Wang Y Y,Qi Y B,Chen Y,et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm(In Chinese). Acta Pedologica Sinica,2016,53(2):342—354
[13] Mansuy N,Thiffault E,Paré D,et al. Digital mapping of soil properties in Canadian managed forests at 250 m of resolution using the k-nearest neighbor method. Geoderma,2014,235/236(4):59—73
[14] Tiwari S K,Saha S K,Kumar S. Prediction modeling and mapping of soil carbon content using artificial neural network,hyperspectral satellite data and field spectroscopy. Advances in Remote Sensing,2015,4(1):63—72
[15] Martin M P,Orton T G,Lacarce E. Evaluation of modelling approaches for predicting the spatial distribution of soil organic carbon stocks at the national scale. Geoderma,2014,223/225:97—107
[16] Sandeep K. Estimating spatial distribution of soil organic carbon for the Midwestern United States using historical database. Chemosphere,2015,127:49—57
[17] Doetterl S,Stevens A,van Oost K,et al. Spatiallyexplicit regional-scale prediction of soil organic carbon stocks in cropland using environmental variables and mixed model approaches. Geoderma,2013,204/205(4):31—42
[18] Somarathna P D S N,Malone B P,Minasny B. Mapping soil organic carbon content over New South Wales,Australia using local regression kriging. Geoderma Regional,2016,7(1):38—48
[19] Guo P T,Li M F,Luo W,et al. Digital mapping of soil organic matter for rubber plantation at regional scale:An application of random forest plus residuals kriging approach. Geoderma,2015,237/238:49—59
[20] Ungaro F,Staffilanii F,Tarocco P. Assessing and mapping topsoil organic carbon stock at regional scale:A scorpan kriging approach conditional on soil map delineations and land use. Land Degradation &Development,2010,21(6):565—581
[21] Taghizadeh-Mehrjardi R,Nabiollahi K,Kerry R.Digital mapping of soil organic carbon at multiple depths using different data mining techniques in Baneh region,Iran. Geoderma,2016,266:98—110
[22] Miller B A,Koszinski S,Hierold W,et al. Towards mapping soil carbon landscapes:Issues of sampling scale and transferability. Soil & Tillage Research,2015,156:194—208
[23] 顧成軍,史學(xué)正,于東升,等. 省域土壤有機(jī)碳空間分布的主控因子-土壤類型與土地利用比較. 土壤學(xué)報(bào),2013,50(3):425—432 Gu C J,Shi X Z,Yu D S,et al. Main contributing SOC spatial distribution at the province scale as affected by soil type and land use(In Chinese). Acta Pedologica Sinica,2013,50(3):425—432
[24] 郭治興,袁宇志,郭穎,等. 基于地形因子的土壤有機(jī)碳最優(yōu)模型. 土壤學(xué)報(bào),2017,54(2):331—343 Guo Z X,Yuan Y Z,Guo Y,et al. Optimal estimation model of soil organic carbon based on the terrain factor(In Chinese). Acta Pedologica Sinica,2017,54(2):331—343
[25] Brungard C W,Boettinger J L,Duniway M. Machine learning for predicting soil classes in three semi-arid landscapes. Geoderma,2015,239/240:68—83
[26] Heung B,Chak Ho H,Zhang J,et al. An overview and comparison of machine-learning techniques for classification purposes in digital soil mapping.Geoderma,2016,265:62—77
[27] Taghizadeh-Mehrjardi R,Nabiollahi K,Minasny B,et al. Comparing data mining classifiers to predict spatial distribution of USDA-family soil groups in Baneh region,Iran. Geoderma,2015,253/254:67—77
[28] Fotheringham A S,Brunsdon C,Charlton M E.Geographically weighted regression. England:John Wiley and Sons,LTD. Sussex. 2002:27—64
[29] Breiman L. Random forest. Machine Learning,2001,45:5—32