關(guān)文昊,劉志剛,何國興,紀童,李強,楊軍銀,柳小妮
(甘肅農(nóng)業(yè)大學(xué)草業(yè)學(xué)院,草業(yè)生態(tài)系統(tǒng)教育部重點實驗室,甘肅省草業(yè)工程實驗室,中‐美草地畜牧業(yè)可持續(xù)發(fā)展研究中心,甘肅 蘭州 730070)
土壤有機質(zhì)(Soil organic matter,SOM)含量是衡量土壤肥力的重要指標[1],土壤SOM可以改善土壤結(jié)構(gòu),積蓄土壤水分,增加土壤養(yǎng)分,促進土壤團聚體形成,對作物生長、土壤肥力的保持、環(huán)境保護及農(nóng)、林、牧業(yè)可持續(xù)發(fā)展都有極重要的意義[2]。但用傳統(tǒng)方式對SOM野外大面積調(diào)查時,需要人工采集大量樣品帶回實驗室后使用化學(xué)方法測定,工作效率低、工作量大且耗費時間久[3]。高光譜技術(shù)具有快速、連續(xù)、無損等特點,可用于野外或?qū)嶒炇铱焖俚夭杉脖?、土壤、水體等地物光譜信息,不受試驗地區(qū)的制約,可以動態(tài)地監(jiān)測地區(qū)的高光譜信息[4]。同時,現(xiàn)階段高光譜技術(shù)有納米級的分辨率,能夠反映出不同理化性質(zhì)研究對象的光譜特征,因而為土壤SOM含量的監(jiān)測和反演提供了技術(shù)與理論支持[5]。自1960年以來,對于土壤物理化學(xué)性質(zhì)的高光譜研究已經(jīng)受到國內(nèi)外專家學(xué)者的廣泛關(guān)注[6]。
近年來,隨著先進的光譜科學(xué)技術(shù)、計算機科學(xué)技術(shù)、工業(yè)科學(xué)技術(shù)及物理和化學(xué)計量科學(xué)快速進步和發(fā)展,光譜儀的分辨率和信噪比也越來越高,對土壤物理化學(xué)特性的高光譜研究以及它們的反演模式在精準農(nóng)業(yè)尤其是土壤遙感監(jiān)控中的作用愈加明顯[8]。閆姍姍[9]、沙晉明[10]、盧艷麗[11]、賀軍 亮[12]、周萍[13]和 Gunsaulis等[14]研究結(jié)果表明,SOM 含量與土壤光譜反射率R的紅光波段之間具有較強的相關(guān)性。但土壤原始光譜反射率R含有較多的冗余信息,將R經(jīng)過一系列數(shù)學(xué)轉(zhuǎn)換后,可以放大波段特征信息,在進行模型的建立時可以有效提高反演模型的精度。于士凱[15]等研究表明,利用經(jīng)一階微分R’、倒數(shù)的對數(shù)log(1/R)等數(shù)學(xué)處理后的光譜數(shù)據(jù)所建模型的精度高于使用原始光譜反射率R建模的精度。何挺[16]、張娟娟等[17]和李偉等[18]分別建立了不同數(shù)學(xué)轉(zhuǎn)換后光譜數(shù)據(jù)與SOM的反演模型,模型效果良好。
目前有很多基于土壤高光譜數(shù)據(jù)建立SOM反演模型的方法[19],不同建模方法優(yōu)缺點各不相同,其中多元逐步回歸(Stepwise multiple linear regression,SMLR)模型能反映光譜數(shù)據(jù)之間的自相關(guān)問題,已被廣泛應(yīng)用于SOM含量的建模[20];支持向量機(Sup‐port vector machine,SVM)避免高維空間的復(fù)雜性,直接在高維空間解決相應(yīng)的決策問題,具有較好的泛化推廣能力[21];決策樹法(Decision Tree,DT) 在衛(wèi)星和機載高光譜數(shù)據(jù)圖譜的綜合提取中發(fā)揮著很好的作用[22];而隨機森林(Random forest,RF)可以使建立的模型難以陷入過度擬合[23]。因此,SMLR、SVM、DT和RF均可用于土壤SOM含量的模擬反演。
三江源地區(qū)不同土壤的質(zhì)地、含水量及成土母質(zhì)等因素不盡相同,其光譜敏感波段與最優(yōu)模型也不盡相同[24]。本研究以三江源地區(qū)普遍退化的高寒草原為背景,利用ASD地物光譜儀對不同退化程度的高寒草原土壤光譜數(shù)據(jù)進行測量,分析光譜數(shù)據(jù)與SOM含量的關(guān)系,并運用不同光譜數(shù)據(jù)轉(zhuǎn)換方法,確定三江源區(qū)最適宜的SOM反演模型,探討基于土壤反射光譜特性的SOM估測,為三江源區(qū)高寒草地土壤養(yǎng)分含量的快速測量,及其恢復(fù)與重建提供技術(shù)支持。
試驗地位于青海省三江源區(qū)果洛藏族自治州西北部的瑪多縣,地理坐標 N 33°50′~35°40′,E96°50′~99°20′,平均海拔 4 200 m,屬高寒草原氣候,年平均氣溫-4.1 ℃,除5~9月,其他月平均氣溫均在-3.0 ℃以下,全年無絕對無霜期。試驗地草地類型為高寒草原,優(yōu)勢植物主要為紫花針茅(Stipa purpurea)、線葉嵩草(Kobresia capillifolia)、草地早熟禾(Poa praten?sis)、多莖委陵菜(Potentilla multicaulis)、弱小火絨草(Leontopodium pusillum)等。
2019年7 月在5個不同退化程度[25]樣地中(表1),用隨機采樣法于每個樣地中各取3個點,每個點用環(huán)刀分別采集0~30 cm土樣各6份,共計90份土樣。去除石子、植物根系等雜質(zhì),放入自封袋中封口,貼好標簽,冷藏并帶回實驗室采集光譜數(shù)據(jù)、測定SOM含量。
光譜數(shù)據(jù)選用 ASD(ASD FieldSpec?4 Hi-Res NG,USA)地物光譜儀采集。該儀器的波長在350~2 500 nm,光譜分辨率為3 nm@700 nm和6 nm@1 400/2 100 nm,具有節(jié)能、便攜、高效、光譜數(shù)據(jù)精確等特點。在黑暗、無光的室內(nèi)環(huán)境采集土壤樣品的反射光譜。將12 V、50 W鹵素光源固定在距土壤樣品60 cm、地面夾角60°的位置,以減小陰影的影響。每個土壤樣本重復(fù)測定10次,每測1次使用標準板校準1次。
SOM含量采用重鉻酸鉀氧化法測定[25],并計算SOM含量的變異系數(shù)(Coefficient of Variation,Cv),Cv≤0.1為弱變異,0.1 1.3.1 數(shù)據(jù)處理和光譜特征波段選取 使用ASD光譜儀自帶的ViewSpecpro軟件預(yù)覽光譜數(shù)據(jù),剔除異常波段,取重復(fù)樣本的平均值作為標準光譜,并對標準光譜進行Savitzky Golay濾波平滑,將平滑后的光譜作為原始光譜反射率R。為了增強特征波段信息,提高建模精度,在原始光譜反射率R的基礎(chǔ)上,進行一階微分R’、倒數(shù)的對數(shù)log(1/R)、倒數(shù)一階微分[log(1/R)]’[27]變換。 將SOM含量與原始光譜反射率R、倒數(shù)對數(shù)log(1/R)、一階微分 R’、倒數(shù)對數(shù)一階微分[log(1/R)]’的相關(guān)性作為選取特征波段的依據(jù)。使用4種不同光譜曲線分別與SOM含量進行皮爾森相關(guān)分析,然后對得出的4種相關(guān)系數(shù)分別進行P<0.01水平下的顯著性檢驗,并繪制相關(guān)關(guān)系曲線圖,確定顯著波段的位置,再次進行P<0.001水平下的顯著性檢驗,根據(jù)相關(guān)系數(shù)(P<0.001)挑選用于建模的光譜波段。 1.3.2 模型的建立及精度評估 使用1種線性模型多元逐步回歸(MLSR)方法和3種非線性模型:支持向量機(SVM)、決策樹(DT)、隨機森林(RF)方法進行模型的建立,在建模過程中,隨機抽取70%的數(shù)據(jù)作為建模組,30%作為檢驗組。選用決定系數(shù)(R2)和均方根誤差(RMSE)作為精度評價指標。R2用來評價回歸模型系數(shù)的擬合優(yōu)度,取值范圍為0~1,越接近1,擬合度越好。RMSE用于測量預(yù)測值和觀測值之間的偏差,RMSE越小,說明預(yù)測效果越好。若建模組跟檢驗組精度評價指標都好,證明反演模型較理想[28-29]。決定系數(shù)R2與均方根誤差RMSE的公式如下: 式 中 :yi表 示 實 測 值 ,?表 示 預(yù) 測 值表 示 平均值。 原始光譜反射率預(yù)處理以及倒數(shù)對數(shù)log(1/R)、一階微分 R’、倒數(shù)對數(shù)一階微分[log(1/R)]’處理均在ASD光譜儀配套的數(shù)據(jù)處理軟件ViewSpecpro中處理,原始光譜反射率、倒數(shù)對數(shù)log(1/R)、一階微分R’、倒數(shù)對數(shù)一階微分[log(1/R)]’與土壤SOM含量的相關(guān)性分析、顯著性分析及繪圖均在Excel 2010和SPSS 21中進行。多元逐步回歸(MLSR)、支持向量機(SVM)、決策樹(DT)、隨機森林(RF)建模及檢驗在RStudio中進行。 研究區(qū)80個樣本總體平均值為19.559 7 g/kg,變異系數(shù)為45.25%,屬于中等變異,有機質(zhì)含量較高,變化范圍較大。各退化程度中有機質(zhì)平均值大小為ND>LD>HD>MD>ED,各個退化程度變異系數(shù)大小為HD>MD>ND>ED>LD(表2)。各退化程度中LD變異系數(shù)最小,為弱變異,剩余退化程度皆為中等變異。 表2 SOM含量基本統(tǒng)計特征Table 2 SOM basic features 2.2.1 土壤光譜特征 對不同處理下的光譜曲線(圖1)分析發(fā)現(xiàn):不同退化程度反射光譜曲線形狀變化基本一致,反射光譜區(qū)間在350~780 nm時,反射率快速上升;在780~1 790 nm時,反射率上升較緩慢。ND的平均SOM含量最高,對應(yīng)的反射光譜曲線最低;ED與之相反(圖1‐A)。倒數(shù)對數(shù)變換后,光譜曲線在350~780 nm時,隨著SOM含量的增加,倒數(shù)對數(shù)快速下降,780 nm以后導(dǎo)數(shù)對數(shù)變化趨于平緩(圖1‐B)。ND的平均SOM含量最高,對應(yīng)的導(dǎo)數(shù)對數(shù)光譜曲線最高;ED與之相反。用一階微分和倒數(shù)對數(shù)一階微分對土壤光譜進行處理后的光譜曲線在正值與負值之間波動,并不穩(wěn)定(圖1‐C,圖1‐D)。 圖1 不同退化程度土壤的光譜曲線Fig.1 Spectral curve relative to soil type 2.2.2 特征波段篩選 SOM含量與土壤光譜反射率R負相關(guān),土壤光譜反射率367 nm前呈下降趨勢,367~1 100 nm相呈上升趨勢,關(guān)系曲線在1 100 nm后變化不大。SOM含量與log(1/R)轉(zhuǎn)化下的土壤光譜反射率在全波段成正相關(guān),變化趨勢與R曲線相反。R’在750 nm前呈負相關(guān)(圖2‐A),750~900 nm呈正相關(guān),隨后不斷波動,[Log(1/R)]’變化趨勢大體與R’相似(圖2‐B)。 圖2 SOM含量與光譜反射率相關(guān)性(P=0.01)Fig.2 Correlation between SOM content and spectral reflectance (P=0.01) 為了進一步的選擇更準確的光譜波段,再次進行P<0.001水平下的顯著性檢驗(圖3),P<0.001水平的光譜波段主要集中在600 nm左右,據(jù)此挑選出6個P<0.001水平的特征波段(表3)。 圖3 SOM含量與光譜反射率相關(guān)性(P=0.001)Fig.3 Correlation between SOM content and spectral reflectance (P=0.001) 從表3可知,原始光譜反射率R在波長657 nm時相關(guān)系數(shù)絕對值最大,為0.546,倒數(shù)對數(shù)log(1/R)在波長597 nm時相關(guān)系數(shù)最大,為0.645 9,一階微分R’在波長852 nm時相關(guān)系數(shù)絕對值最大,為0.702 1,倒數(shù)對數(shù)一階微分[log(1/R)]'在波長892 nm時相關(guān)系數(shù)絕對值最大,為0.705 9。3種經(jīng)過處理的光譜數(shù)據(jù)與SOM含量相關(guān)性對比原始光譜反射率R與SOM含量相關(guān)性有了顯著提高。 表3 相關(guān)系數(shù)Table 3 Correlation coefficient 2.2.3 基于光譜特征波段的SOM 模擬估算 支持向量機(SVM)、決策樹(DT)、隨機森林(RF)3種模型的決定系數(shù)(R2)明顯比多元逐步回歸(MLSR)的高,均方根誤差(RMSE)低(表4),這意味使用非線性模型估測效果要優(yōu)于線性模型多元逐步回歸(MLSR),隨機森林(RF)模型估測的效果較好,其決定系數(shù)(R2)均高于另外3種方法所建立的反演模型,均方根誤差(RMSE)均低于另外3種方法所建立的反演模型,檢驗組同樣也是如此。 表4 模型精度對比Table 4 Model accuracy comparison 同一模型下的不同光譜處理中,倒數(shù)對數(shù)Log(1/R)和倒數(shù)對數(shù)一階微分[Log(1/R)]’處理下模型的決定系數(shù)(R2)明顯高,均方根誤差(RMSE)明顯低。倒數(shù)對數(shù)Log(1/R)、倒數(shù)對數(shù)一階微分[Log(1/R)]’之間差別不大,原始光譜反射率R、一階微分R’之間差別不大。隨機森林(RF)方法建立的Log(1/R) -RF、[Log(1/R)]’- RF模型的預(yù)測效果較好,其建模組的決定系數(shù)(R2)和均方根誤差(RMSE)分別為0.949 1、0.252 7和0.948 0、0.253 2,檢驗組的決定系數(shù)(R2)和均方根誤差(RMSE)分別為 0.717 2、0.496 9和0.703 0、0.515 5。 原始光譜反射率R和倒數(shù)對數(shù)R’回歸模型預(yù)測值與實測值之間存在著很大的偏離,樣本點數(shù)分散,樣點距直線距離遠,模型的效果不好;倒數(shù)對數(shù)Log(1/R)和倒數(shù)對數(shù)一階微分[Log(1/R)]’ 回歸模型預(yù)測值與實測值較均勻的分布在直線兩側(cè)(圖4)。模型的精度指標和圖形擬合效果表明,用隨機森林方法建立的Log(1/R)-RF模型優(yōu)于[Log(1/R)]’- RF模型,并且明顯高于用另外兩種光譜數(shù)據(jù)數(shù)學(xué)處理建立的模型。 圖4 SOM含量的實測值與預(yù)測值比較Fig.4 Correlation between SOM measured and predicted SOM contents SOM含量很大程度上決定著土壤光譜反射率的大小。本研究中,不同退化程度高寒草原土壤的光譜反射率不同,隨著土壤樣品SOM含量的升高,土壤原始光譜反射率相對降低,與玉米提·買明等[30]的研究結(jié)果一致,這是由于土壤光譜反射率與土壤質(zhì)地、成土母質(zhì)、水分、有機質(zhì)、氮、磷、鉀等土壤理化性質(zhì)息息相關(guān)。Bowers[31]指出,土壤的各類物理、化學(xué)性質(zhì)和有機質(zhì)含量是影響土壤反射率的主要因素,牛芳鵬[8]研究也表明土壤光譜反射率與土壤SOM呈極顯著負相關(guān)。 原始光譜反射率R經(jīng)數(shù)學(xué)轉(zhuǎn)換后,可以有效地縮小、放大光譜數(shù)據(jù)特征峰反射率,并且提高光譜數(shù)據(jù)的識別概率[32]。本研究發(fā)現(xiàn),利用SOM含量與原始光譜反射率R、倒數(shù)對數(shù)log(1/R)、一階微分R’、倒數(shù)對數(shù)一階微分[log(1/R)]’所挑選出的敏感波段建立的反演模型中,通過數(shù)學(xué)轉(zhuǎn)換后的反演模型精度有了明顯提升,土壤特征波段光譜數(shù)據(jù)與土壤SOM含量的相關(guān)性大大提高,這與史舟[33]、趙明松[34]等的研究結(jié)果一致。這是因為原始光譜反射率經(jīng)數(shù)學(xué)轉(zhuǎn)換后可以起到增強波段信息,從而提高反演模型精度[35]。鄭立華[36]、王永敏[37]等也分別利用經(jīng)數(shù)學(xué)轉(zhuǎn)換后的光譜數(shù)據(jù)建立了有機質(zhì)等養(yǎng)分元素的預(yù)測模型,決定系數(shù)均達到0.8。 利用高光譜數(shù)據(jù)構(gòu)建反演模型從而對土壤SOM含量進行快速估測已經(jīng)得到一致認可[38-39],趙瑞等[40]結(jié)合遙感影像進行土壤SOM反演模型也取得了滿意的結(jié)果。本試驗中,通過隨機森林法建立的模型精度遠高于其他3種方法,這是因為隨機森林法是隨機的引入2個變量,避免了模型陷入過擬合。所建立的16個反演模型中,隨機森林倒數(shù)對數(shù)處理建立的Log(1/R)- RF模型的預(yù)測精度和穩(wěn)定性較好,該模型可以有效的增強或減弱光譜波段特征峰,且降低數(shù)據(jù)之間的擬合性,提高建模精度,可為三江源地區(qū)土壤SOM含量預(yù)測,以及草地生態(tài)系統(tǒng)的恢復(fù)與重建提供理論依據(jù)。 由于土壤理化性質(zhì)復(fù)雜多變,不同地區(qū)土壤理化性質(zhì)不同,同一地區(qū)不同土壤理化性質(zhì)也不盡相同,導(dǎo)致建立的土壤SOM含量反演模型的適用性需進一步研究與驗證。因此,需要進一步采集三江源不同地區(qū)、不同種類土壤樣本,進行更多的研究,為三江源地區(qū)生態(tài)系統(tǒng)的恢復(fù)與重建提供數(shù)據(jù)支持。 1) 試驗地土壤有機質(zhì)(SOM)含量為41.659 4~8.761 3 g/kg,樣本平均值為19.559 7 g/kg,變異系數(shù)是45.25 %,屬于中等變異。不同退化程度土壤光譜曲線變化趨勢大體一致,且隨著SOM含量的增加,原始光譜反射率曲線降低,呈負相關(guān)變化。 2) 通過對不同光譜轉(zhuǎn)換方式與土壤SOM含量相關(guān)性關(guān)系的分析可知,原始光譜反射率通過倒數(shù)對數(shù)、一階微分、倒數(shù)對數(shù)一階微分轉(zhuǎn)換后與土壤SOM含量的相關(guān)系數(shù)有了顯著提升,說明光譜數(shù)據(jù)的數(shù)學(xué)轉(zhuǎn)換可以擴大光譜的一些吸收特征。 3) 跟其他模型相比,Log(1/R)-RF具有更高的預(yù)測精度和穩(wěn)定性,可以較準確的估測本試驗區(qū)土壤SOM含量。1.3 SOM含量的模擬估算
1.4 統(tǒng)計數(shù)據(jù)處理與分析
2 結(jié)果與分析
2.1 不同退化程度高寒草原的土壤有機質(zhì)含量
2.2 SOM含量的模擬估算
3 討論
4 結(jié)論