韓兆迎, 朱西存, 2*, 劉 慶, 房賢一, 王卓遠
(1 山東農業(yè)大學資源與環(huán)境學院, 山東泰安 271018; 2 土肥資源高效利用國家工程實驗室, 山東泰安 271018;3 山東省黃河三角洲生態(tài)環(huán)境重點實驗室(濱州學院), 山東濱州 256603)
黃河三角洲以山東省東營市墾利縣寧海為軸點,北起套爾河口,南至淄脈河口,向東散開的扇狀地形,海拔高程低于15 m,面積達54.5×104hm2。本研究區(qū)為東營市墾利縣,位于東北部黃河入??谔帯|瀕渤海,南接東營市東營區(qū),西、 北與利津縣隔河相望,東北部與東營市河口區(qū)接壤。屬暖溫帶季風氣候,光熱資源較為豐富,降水少,且年際年內分配不均,蒸降比較大,春旱及夏澇災害頻繁。研究區(qū)有潮土、 鹽土兩大土類,土壤母質為黃河沖積物。土壤多為黃河泥沙經長途搬運、 分選、 河床淤積的細小顆粒,表層質地偏輕,砂壤占24.2%、 輕壤占46.1%、 中壤占14.8%、 重壤10.1%、 粘土4.8%,由此可見,砂、 輕壤面積占總面積的70.3%。
光譜測定在等同于暗室的條件下進行。將盛樣皿內裝滿的土壤刮平后,放在反射率近似為0的黑色橡膠墊上。采用功率為50 W鹵化燈作為光源,探頭視場角為25°,光源入射角度為45°,光源距離為30 cm,探頭距離為15 cm。每次采集目標光譜前后都要進行參考板校正,重復測量10次,為降低土樣光譜各向異性的影響,測量時轉動盛樣皿3次,每次轉動角度約90°,共獲取4個方向的土樣光譜,取算術平均后得到該土樣的反射光譜數(shù)據(jù)。
將測定完光譜的土樣再進行有機質含量的測定。有機質含量的測定采用重鉻酸鉀容量法—外加熱法[24]。
60個土壤樣本有機質含量檢測結果如表1 所示。
對60個土樣的光譜進行去包絡線處理。包絡線法最早由Roush 和Clark 提出,定義為逐點直線連接隨波長變化的吸收或反射凸出的“峰”點,并使折線在“峰”值點上的外角大于180°[25]。去包絡線法是常用的光譜分析方法之一,可以明顯的突出光譜曲線的反射和吸收特征,并且將其歸一到一個一致的光譜背景上,有利于和其他光譜曲線進行特征數(shù)值的比較,從而有利于提取特征波段。
具體算法為:Rc(λ)=Rcr(λ)-R(λ)
(1)
其中,Rc、 Rcr和R分別為去包絡(特征吸收)、 包絡線和光譜反射率值,λ為波長。
表1 樣本有機質含量特征統(tǒng)計量
對60個樣本的有機質含量與去除包絡線后的光譜數(shù)據(jù)逐波長地進行相關性分析,計算出每個波長與SOM含量的相關系數(shù),選取相關系數(shù)較高或突變的波長作為敏感波長。相關性分析的公式下:
(2)
60個土樣中隨機抽取40個土樣,用于建立SOM含量的反演模型,其余20個土樣用于模型驗證。土壤有機質估測模型的估測精度采用估測值和實際值的決定系數(shù)R2、 Durbin-Watson統(tǒng)計量和相對分析誤RPD(檢驗樣本標準差SD與預測均方根誤差RMSE的比值)來衡量。模型的決定系數(shù)R2越大、 Durbin-Watson統(tǒng)計量越接近2,說明模型的精度越高。另外,當RPD>2 時表明模型具有極好的預測能力,當1.4 圖1 土壤光譜反射率曲線Fig.1 Reflectance curves of the soil samples 將原始光譜反射率與土壤有機質的含量進行相關性分析,其相關系數(shù)如圖2所示。從圖中可以看出,原始土壤光譜反射率與有機質含量的相關系數(shù)小于0.1,并且整條曲線比較平滑,很難選出與SOM具有良好相關性的敏感波長。為突出光譜曲線的反射和吸收特征,利用去除包絡線后的光譜與有機質含量進行相關分析,結果見圖3??梢钥闯鋈コj線的光譜數(shù)據(jù)與有機質含量的相關性有了顯著的提高,相關性較好的波段主要集中在近紅外波段,特別是在波長1278 nm處,其相關性達到了0.88,另外在波長1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm處,其相關性分別為0.77、 0.77、 0.78、 0.83、 0.77、 0.76。因此,選取這7個波長為反映土壤有機質的敏感波長。 圖2 光譜反射率與有機質含量的相關性Fig. 2 Correlation between the soil organic matter and spectral reflectivity 圖3 去包絡線的光譜與有機質含量的相關性Fig.3 Correlation between the soil organic matter and removed the envelope spectral data 將選取的7個敏感波長,運用主成分回歸、 二次多項式逐步回歸、 多元線性回歸和支持向量機回歸方法,分別建立有機質含量的高光譜反演模型。 主成分回歸法是通過線性變換,將原來的多個指標組合成相互獨立的少數(shù)幾個能充分反映總體信息的主成分,從而在不丟掉重要信息的前提下,避開變量間的共線性,便于進一步分析。在主成分分析中提取出的每個主成分都是原來多個指標的線性組合。主成分回歸包含兩步:一是將自變量重新線性組合;二是在新的組合變量中去掉那些變差小的而留下主成分。 利用選取的7個敏感波長建立主成分回歸模型的過程中,根據(jù)方差貢獻率確定主成分個數(shù)。當選用2個主成分時,累積方差貢獻率達到了94%。因此本研究選取2個主成分,建立主成分回歸模型: y=-151+137×X1+6.13×X2+0.688×X3+3.18×X4+14.7×X5-2.48×X6-6.08×X7 (3) 二次多項式逐步回歸是基于最小二乘法原理,通過逐步回歸剔除對因變量不起作用或作用極小的因子,挑選出顯著性因子,最終得出最優(yōu)回歸模型的經典數(shù)理統(tǒng)計方法。建立模型時,首先在0.1的置信度下挑選自變量,并調整F值進行逐步回歸(引入顯著的變量,剔除不顯著的變量),對模型進行優(yōu)化,最終得到二次多項式逐步回歸模型。 二項式逐步回歸分析模型為: y=1.34×104-2.72×104×X1+1.37×104×X1×X1-39.1×X2×X6+53.5×X5×X7 (4) 方程(4)中:y為土壤有機質含量; X1、 X2、 X5、 X6、 X7分別為去除包絡線后1278 nm、 1307 nm、 1328 nm、 1334 nm、 1343 nm敏感波長對應的光譜數(shù)據(jù)。 線性回歸(Linear Regression)是利用線性回歸方程的最小平方函數(shù)對一個或多個自變量和因變量之間的關系進行建模。 線性回歸分析模型方程為: y=-156+132×X1-39.6×X2-2.67×X3+19.2×X4+49.9×X5-28.8×X6+28.2×X7 (5) 方程(5)中:y為土壤有機質含量; X1、 X2、 X3、 X4、 X5、 X6、 X7分別去除包絡線后1278 nm、 1307 nm、 1314 nm、 1322 nm、 1 328 nm、 1 334 nm、 1 343 nm敏感波長對應的光譜數(shù)據(jù)。 支持向量機(SVM)最初于20世紀90年代由Vapnik提出,包括支持向量機分類(SVC)和支持向量回歸(SVR),是目前發(fā)展最快的機器學習方法。選取了去除包絡線后1278 nm、 1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm敏感波長對應的光譜數(shù)據(jù)為自變量,有機質含量作為決策屬性,經過參數(shù)優(yōu)選(表2),通過多次訓練,最終確定支持向量機類型為EPSILON-SVR,核函數(shù)類型為RBF。 表2 支持向量機回歸模型的參數(shù) 從運用不同方法反演土壤有機質(SOM)含量的診斷系數(shù)(表3)可以看出,四種模型校正集的決定系數(shù)R2都大于0.8,表明四種模型的擬合效果都較好。相比較而言,二次多項式逐步回歸模型的校正集決定系數(shù)僅次于支持向量機回歸模型,其Durbin-Watson統(tǒng)計量d=2.14。 表3 土壤有機質反演模型的診斷系數(shù) 圖4 土壤有機質實測值與預測值的散點圖Fig. 4 Scatter plot of the measured values and predicted values of soil organic matter 利用驗證集的20個樣本對這四種模型進行精度驗證,驗證結果見表3和圖4。從表3和圖4中可以看出,基于主成分回歸、 多元線性回歸、 二次多項式逐步回歸和支持向量機回歸分析,建立的土壤有機質(SOM)含量的高光譜反演模型的預測效果均較好,其中二次多項式逐步回歸模型的驗證集的決定系數(shù)最高,相對分析誤差RPD最大。 因為二次多項式逐步回歸模型的校正集的決定系數(shù)較高以及其Durbin-Watson統(tǒng)計量d=2.14最接近2,并且其驗證集的決定系數(shù)最高、 RPD最大,所以基于二次多項式逐步回歸分析建立的土壤有機質的高光譜反演模型的擬合效果要優(yōu)于主成分回歸、 線性回歸分析和支持向量機回歸分析建立的高光譜反演模型。 由于土壤光譜反射率受光譜測試環(huán)境以及土壤自身理化性質的影響,對土壤樣本進行風干、 研磨等處理,可在一定程度上消除非有機質特性對土壤光譜的影響。對原始光譜數(shù)據(jù)進行去包絡線處理,使其歸一到一個一致的光譜背景上,有利于和其他光譜曲線進行特征數(shù)值的比較[27]。本研究結果表明,近紅外區(qū)是反演土壤有機質含量的敏感波段,與前人得出的土壤有機質含量的敏感波段在可見光和近紅外區(qū)的研究結果基本一致[9,11,18-22]。由于高光譜的單個波長能量較低,而前人研究多以單波長反射率建立土壤有機質含量反演模型[28],其容易受到環(huán)境影響而產生較大的差異,因此建立的模型穩(wěn)定性較差。本文選取了與土壤有機質含量相關性較高的7個波長建立了反演模型,提高了模型的穩(wěn)定性。 在室內幾何條件基本一致的情況下,獲取了黃河三角洲土壤樣品高光譜反射率,去除包絡線后的光譜數(shù)據(jù)與土壤有機質含量的相關性有了明顯的提高,確定了1278 nm、 1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm波長為診斷有機質含量的敏感波長。建立的主成分回歸、 多元線性回歸、 二次多項式逐步回歸和支持向量機回歸的有機質含量的高光譜反演模型,都可以實現(xiàn)對黃河三角洲土壤有機質含量的反演。經驗證,二次多項式逐步回歸模型驗證方程的決定系數(shù)最高、 均方根誤差最小、 RPD最高,其擬合效果最好,并且這種模型還具有較高的穩(wěn)定性。因此,二次多項式逐步回歸模型對黃河三角洲土壤有機質含量的反演效果最好。 利用從60個土樣中隨機選取的40個樣本,建立了支持向量機回歸模型,其建模方程的決定系數(shù)達到了0.91,但是當用剩余的20個樣本進行檢驗時,其決定系數(shù)僅為0.78。經對建模的參數(shù)進行多次調整之后,得到了新的回歸模型,新模型驗證集的決定系數(shù)達到了0.807,但是校正的決定系數(shù)降到了0.866。因此,如何通過合理的調整模型參數(shù),使得在不降低建模方程決定系數(shù)的前提下,提高驗證方程的決定系數(shù),以及如何合理的選擇校正集和驗證集,使得所建立的模型能夠解釋所有土壤有機質的變異,從而提高模型的預測精度,將有待于進一步的研究。 本研究以黃河三角洲的土壤為研究對象,獲取的土壤光譜反射率是該區(qū)土壤母質、 土壤有機質、 鹽分、 氧化物、 土壤質地、 結構、 顏色等多種因素的內在理化性質的綜合反映,因此這些因素會對有機質含量的反演產生影響即影響模型的精度。這些因素如何影響光譜反射率以及如何提高反演模型的精度,有待深入分析,所建立的土壤有機質反演模型對其他地區(qū)的土壤是否適用,有待于進一步驗證。 參考文獻: [1] 科技日報. 渤海糧倉科技示范工程啟動計劃到2020年增糧100億斤[EB/OL]. http://www.most.gov.cn/kjbgz/201310/t20131030_110069.htm, 2013-4-10. Journal of science and technology. The bohai sea granary demonstrative project of science and technology initiative to increased 10 billion catties of grain by 2020 [EB/OL]. 2013-4-10.http://www.most.gov.cn/kjbgz/201310/t20131030_110069.htm, 2013-4-10. [2] 蒲智, 于瑞德, 尹昌應, 陸亦農.干旱區(qū)典型鹽堿土壤含鹽量估算的最佳高光譜指數(shù)研究[J]. 水土保持通報, 2012, 32(6):129-133. Pu Z, Yu R D, Yin C Y, Lu Y N. Optimal hyperspectral indices for soil salt content estimation on typical saline soil in arid areas[J]. Bulletin of Soil and Water, 2012, 32(6):129-133. [3] 陳紅艷, 趙庚星, 李希燦, 等. 小波分析用于土壤速效鉀含量高光譜估測研究[J]. 中國農業(yè)科學, 2012, 45(7):1425-1431. Chen H Y, Zhao G X, Li X Cetal. Application of wavelet analysis for estimation of soil available potassium content with hyperspectral reflectance[J]. Scientia Agricultura Sinica, 2012, 45(7):1425-1431. [4] 徐麗華, 謝德體, 魏朝富, 李兵. 紫色土土壤全氮和全磷含量的高光譜遙感預測[J]. 光譜學與光譜分析, 2013, 33(3):723-727. Xu L H, Xie D T, Wei C F, Li B. Prediction of total nitrogen and total phosphorus concentrations in purple soil using hyperspectral data[J]. Spectroscopy and Spectral Analysis, 2013, 33(3):723-727. [5] 姚艷敏, 魏娜, 唐鵬欽, 等. 黑土土壤水分高光譜特征及反演模型[J]. 農業(yè)工程學報, 2011, 27(8):95-100. Yao Y M, Wei N, Tang P Qetal. Typer-spectral characteristics and modeling of black soil moisture content[J]. Transactions of the CSAE, 2011, 27(8):95-100. [6] 彭玉魁, 張建新, 何緒生, 盧恩雙. 土壤水分、 有機質和總氮含量的近紅外光譜分析研究[J]. 土壤學報, 1998, 35(4):553-559. Peng Y K, Zhang J X, He X S, Lu E S. Analysis of soil moisture, organic matter and total nitrogen content in loess in China with near infrared spectroscopy[J]. Acta Pedologica Sinica, 1998, 35(4):553-559. [7] 盧艷麗, 白由路, 楊俐蘋, 等. 東北平原不同類型土壤有機質含量高光譜反演模型同質性研究[J]. 植物營養(yǎng)與肥料學報, 2011, 17(2):456-463. Lu Y L, Bai Y L, Yang L Petal. Homogeneity of retrieval models for soil organic matter of different soil types in Northeast Plain using hyperspectral data[J]. Plant Nutrition and Fertilizer Science, 2011,17(2):456-463. [8] 王小攀, 鄭曉坡, 劉福江, 等. 高光譜遙感土壤有機質含量信息提取與分析[J]. 地理空間信息, 2012, 10(5):75-78. Wang X P, Zheng X P, Liu F Jetal. Analysis and extraction soil organic matter information based on hyperspectral remote sensing[J].Geospatial Information, 2012, 10(5):75-78. [9] 徐彬彬, 季耿善, 朱永豪. 中國陸地背景和土壤光譜反射特性的地理分區(qū)的初步研究[J]. 環(huán)境遙感, 1991, 6(2):142-151. Xu B B, Ji G S, Zhu Y H. A preliminary research of geographic regionalization of China land background and spectral reflectance characteristics of soil[J]. Remote Sensing of Environment, 1991, 6(2):142-151. [10] 程朋根, 吳劍, 李大軍, 何挺. 土壤有機質高光譜遙感和地統(tǒng)計定量預測[J]. 農業(yè)工程學報, 2009, 25(3):142-147. Cheng P G, Wu J, Li D J, He T. Quantitative prediction of soil organic matter content using hyper spectral remote sensing and geo-statistics[J]. Transactions of the CSAE, 2009, 25(3):142-147. [11] 盧艷麗, 白由路, 楊俐蘋, 王紅娟. 基于高光譜的土壤有機質含量預測模型的建立與評價[J]. 中國農業(yè)科學, 2007, 40(9):1989-1995. Lu Y L, Bai Y L, Yang L P, Wang H J. Prediction and validation of soil organic matter content based on hyperspectrum[J]. Scientia Agricultura Sinica, 2007, 40(9):1989-1995. [12] Hummel J W, Sudduth K A, Hollinger S E. Soil moisture and organic matter prediction of surface and subsurface soils using an NIR soil sensor[J]. Computers and Electronics in Agriculture, 2001, 32(2):149-165. [13] Krishnan P, Alexander J D, Butler B J, Hummel J W. Reflectance technique for predicting soil organic matter[J]. Soil Science Society of America Journal, 1980, 44(6):1282-1285. [14] Chang C W, Laird D A. Near-infrared reflectance spectroscopic analysis of soil C and N[J]. Soil Science, 2002, 167(2):110-116. [15] 曾志遠. 土壤肥力的衛(wèi)星遙感探測[J]. 土壤, 1987, 19(2):73-78. Zeng Z Y. Satellite remote sensing survey of soil fertility[J]. Soils, 1987, 19(2):73-78. [16] 廖欽洪, 顧曉鶴, 李存軍, 等. 基于連續(xù)小波變換的潮土有機質含量高光譜估算[J]. 農業(yè)工程學報, 2012, 28(23):132-139. Liao Q H, Gu X H, Li C Jetal. Estimation of fluvo-aquic soil organic matter content from hyperspectral reflectance based on continuous wavelet transformation[J]. Transactions of the CSAE, 2012, 28(23):132-139. [17] 賀軍亮, 蔣建軍, 周生路, 等. 土壤有機質含量的高光譜特性及其反演[J]. 中國農業(yè)科學, 2007, 40(3):638-643. He J L, Jiang J J, Zhou S Letal. The hyperspectral characteristics and retrieval of soil organic matter content[J]. Scientia Agricultura Sinica, 2007, 40(3):638-643. [18] 盧艷麗, 白由路, 楊俐蘋, 等. 基于主成分回歸分析的土壤有機質高光譜預測與模型驗證[J]. 植物營養(yǎng)與肥料學報, 2008, 14(6):1076-1082. Lu Y L, Bai Y L, Yang L Petal. Application of hyperspectral data for soil organic matter estimation based on principle components regression analysis[J]. Plant Nutrition and Fertilizer Science, 2008, 14(6):1076-1082. [19] 張娟娟, 田永超, 朱艷, 等.不同類型土壤的光譜特征及其有機質含量預測[J]. 中國農業(yè)科學, 2009, 42(9):3154-3163. Zhang J J, Tian Y C, Zhu Yetal. Spectral characteristics and estimation of organic matter contents of different soil types[J]. Scientia Agricultura Sinica, 2009, 42(9):3154-3163. [20] 田永超, 張娟娟, 姚霞, 等. 基于近紅外光聲光譜的土壤有機質含量定量建模方法[J]. 農業(yè)工程學報, 2012, 28(1):145-152. Tian Y C, Zhang J J, Yao Xetal. Quantitative modeling method of soil organic matter content based on near-infrared photoacoustic spectroscopy[J]. Transactions of the CSAE, 2012, 28(1):145-152. [21] 劉磊, 沈潤平, 丁國香. 基于高光譜的土壤有機質含量估算研究[J]. 光譜學與光譜分析, 2011, 31(3):762-766. Liu L, Shen R P, Ding G X. Studies on the estimation of soil organic matter content based on hyper-spectrum[J]. Spectroscopy and Spectral Analysis, 2011, 31(3):762-766. [22] 徐明星, 周生路, 丁衛(wèi), 等. 蘇北沿海灘涂地區(qū)土壤有機質含量的高光譜預測[J]. 農業(yè)工程學報, 2011, 27(2):219-223. Xu M X, Zhou S L, Ding Wetal. Hyperspectral reflectance models for predicting soil organic matter content in coastal tidal land area, northern Jiangsu[J]. Transactions of the CSAE, 2011, 27(2):219-223. [23] Hartmann H P, Appel T. Calibration of near infrared spectra for measuring decomposing cellulose and green manure in soils[J]. Soil Biology and Biochemistry, 2006, 38:887-897. [24] 鮑士旦. 土壤農化分析[M]. 北京:中國農業(yè)出版社,1999. 30-34. Bao S D. Soil Agricultural Chemistry Analysis[M]. Beijing:China Agriculture Press, 1999. 30-34. [25] Clark R N, Roush T L. Reflectance spectroscopy:Quantitative analysis techniques for remote sensing application[J]. Journal of Geographical Research,1984,89(7):6329-6340. [26] 黃應豐, 劉騰輝. 華南主要土壤類型的光譜特性與土壤分類[J]. 土壤學報, 1995, 32(1):58-68. Huang Y F, Liu T H. Spectral characteristics of main types of soils in southern China and soil classification[J]. Acta Pedologica Sinica, 1995, 32(1):58-68. [27] 謝伯承, 薛緒掌, 劉偉東, 等. 基于包絡線法對土壤光譜特征的提取及分析[J]. 土壤學報, 2005, 42(1):171-175. Xie B C, Xue X Z, Liu W Detal. Lull-curve-method-based extraction and analysis of soil spectral characteristics[J]. Acta Pedologica Sinica, 2005, 42(1):171-175. [28] 劉煥軍, 張新樂, 鄭樹峰, 等. 黑土有機質含量野外高光譜預測模型[J]. 光譜學與光譜分析, 2010, 12(30):3355-3358. Liu H J, Zhang X L, Zheng S Fetal. Black soil organic matter predicting model based on field hyperspectral reflectance[J]. Spectroscopy and Spectral Analysis, 2010, 12(30):3355-3358.2 結果與分析
2.1 土樣的光譜特征分析
2.2 土壤有機質光譜響應的敏感波長
2.3 有機質含量反演模型的建立
2.4 模型的比較和驗證
3 討論與結論