王德彩+張俊輝
摘 要:為快速、準(zhǔn)確地獲取土壤質(zhì)地信息,提出了應(yīng)用Vis-NIR光譜結(jié)合BP神經(jīng)網(wǎng)絡(luò)的建模方法。以河南封丘縣的86個(gè)土壤樣本為研究對(duì)象,以原始光譜和微分光譜主成分為輸入變量,建立土壤粘粒和砂粒的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并將其預(yù)測(cè)結(jié)果與多元線性逐步回歸模型進(jìn)行比較。結(jié)果表明:基于原始光譜主成分的BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果最好,優(yōu)于多元逐步回歸模型,預(yù)測(cè)粘粒和砂粒的RMSE分別為1.62和6.52。BP神經(jīng)網(wǎng)絡(luò)所建模型訓(xùn)練時(shí)間短、準(zhǔn)確度也較高,能實(shí)現(xiàn)對(duì)土壤質(zhì)地的高效預(yù)測(cè)。
關(guān)鍵詞:Vis-NIR光譜; BP神經(jīng)網(wǎng)絡(luò);主成分分析;土壤質(zhì)地
中圖分類號(hào):S153 文獻(xiàn)標(biāo)識(shí)碼:A DOI 編碼:10.3969/j.issn.1006-6500.2015.08.002
土壤質(zhì)地是影響土壤肥力的一個(gè)重要因素,同時(shí)土壤質(zhì)地影響一系列陸面及大氣過程,如土壤—植物—大氣相互作用、土壤侵蝕過程、土壤溶質(zhì)遷移過程等[1-2]??焖佾@取土壤質(zhì)地信息,對(duì)現(xiàn)代農(nóng)業(yè)管理和生態(tài)環(huán)境治理具有重要意義。土壤反射光譜特性與土壤的理化性質(zhì)有著密切的關(guān)系,土壤組成物質(zhì)的多樣性以及土壤中每種組成物質(zhì)的獨(dú)特光譜特性,使各類土壤的光譜曲線都具有自己的特征[3]。隨著光譜技術(shù)的發(fā)展,為土壤屬性的快速獲取提供了新的途徑。近紅外光譜和可見光近紅外(Vis-NIR)光譜被廣泛用于快速測(cè)試土壤質(zhì)地、有機(jī)質(zhì)等[4-9]。目前,基于土壤光譜的土壤屬性預(yù)測(cè),大多采用偏最小二乘回歸、多元逐步回歸等線性預(yù)測(cè)方法,而土壤質(zhì)地與反射光譜之間的關(guān)系復(fù)雜,存在隨機(jī)性和非線性。簡(jiǎn)單的線性回歸模型難以模擬土壤質(zhì)地和反射光譜信息間存在的復(fù)雜關(guān)系,一定程度上會(huì)限制預(yù)測(cè)精度的提高。
人工神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元連接而成的非線性系統(tǒng), 具有并行分布處理、 自組織、自適應(yīng)、 自學(xué)習(xí)的特點(diǎn), 適于處理動(dòng)態(tài)的、隨機(jī)性、 非線性數(shù)據(jù)[10],將神經(jīng)網(wǎng)絡(luò)應(yīng)用于Vis-NIR光譜土壤質(zhì)地預(yù)測(cè)模型建立的研究尚不多見。本研究采用人工神經(jīng)網(wǎng)絡(luò)方法,建立土壤質(zhì)地?cái)?shù)據(jù)的Vis-NIR光譜預(yù)測(cè)模型,同時(shí)探討不同光譜預(yù)處理形式對(duì)預(yù)測(cè)結(jié)果的影響,可為土壤質(zhì)地?cái)?shù)據(jù)的快速獲取提供方法參考。
1 材料和方法
1.1 研究區(qū)與采樣分析
封丘縣處于北緯34°53′ ~ 35°14′、東經(jīng)114°14′ ~ 114°46′之間,暖溫帶大陸性季風(fēng)氣候,年平均氣溫16.0 ℃,年平均降水量615.1 mm。封丘地勢(shì)平坦,海拔65~72.5 m。主要土壤類型有風(fēng)沙土、兩合土和淤土等。在研究區(qū),按照3 km × 3 km正交網(wǎng)格布設(shè)樣點(diǎn),采樣深度為0~20 cm,共采集樣品101個(gè)。土壤質(zhì)地采用激光衍射法 (Beckman Coulter LS230,USA,測(cè)試粒徑范圍0.04~2 000 μm測(cè)定[11], 按美國(guó)制進(jìn)行分級(jí):砂粒 (2~0.05 mm),粉粒 (0.05~0.002 mm),粘粒 (< 0.002 mm)。
1.2 土壤光譜測(cè)量及預(yù)處理
運(yùn)用美國(guó)ASD 公司的FieldSpec 3地物高光譜儀測(cè)量土壤樣品的反射光譜數(shù)據(jù),操作過程在黑暗環(huán)境的實(shí)驗(yàn)室進(jìn)行,每個(gè)樣品旋轉(zhuǎn)4次,每個(gè)角度掃描5次,共20次,取平均值作為樣本光譜。每次測(cè)量前進(jìn)行標(biāo)準(zhǔn)白板校正。因?yàn)?50~380 nm、2 400~2 500 nm之間的數(shù)據(jù)信噪比比較低[12],所以本研究只對(duì)380~2 400 nm波段的反射光譜進(jìn)行分析。本研究光譜變換形式包括一階微分和二階微分。微分變換均采用Savitzky-Golay 多項(xiàng)式,在Unscrambler 軟件中完成。對(duì)原始光譜和經(jīng)一階微分和二階微分處理后的數(shù)據(jù),提取主成分,選取分析后的多個(gè)主成分作為初始輸入變量,進(jìn)行建模以及模型驗(yàn)證,主成分分析在SPSS19.0中完成。
1.3 模型建立
采用分層機(jī)械取樣法,樣本數(shù)據(jù)分成光譜建模數(shù)據(jù)集和光譜模型預(yù)測(cè)數(shù)據(jù)集。研究區(qū)共有101個(gè)樣本點(diǎn),將其分為2個(gè)數(shù)據(jù)集,其中建模樣品數(shù)占2/3,驗(yàn)證樣品數(shù)占1/3。對(duì)于質(zhì)地?cái)?shù)據(jù),根據(jù)3倍標(biāo)準(zhǔn)差法去除質(zhì)地?cái)?shù)據(jù)中的異常數(shù)據(jù)。砂粒、粘粒含量具體建模樣點(diǎn)見表1。
1.3.1 BP人工神經(jīng)網(wǎng)絡(luò) BP人工神經(jīng)網(wǎng)絡(luò)的建立在Matlab軟件中實(shí)現(xiàn),采用人工神經(jīng)網(wǎng)絡(luò)工具箱中的3層BP神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)有輸入層、隱含層、輸出層組成,隱含層采用“S”型logsig函數(shù),輸出層采用線性傳遞函數(shù)。對(duì)所建模型進(jìn)行訓(xùn)練,以確定模型的權(quán)值矩陣和閾值矩陣。為確定適宜的模型結(jié)構(gòu),取不同的隱含層神經(jīng)元數(shù)和訓(xùn)練迭代次數(shù)進(jìn)行訓(xùn)練。
1.3.2 多元逐步回歸模型 借助SPSS軟件,采用多元線性逐步回歸分析(MLSR)方法,建立土壤質(zhì)地含量高光譜預(yù)測(cè)模型。多元逐步回歸模型主要用于與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行精度比較。
1.4 模型評(píng)價(jià)指標(biāo)
評(píng)價(jià)所采用的指標(biāo)有平均誤差(Mean Error, ME),平均絕對(duì)誤差(Mean absolute error, MAE),均方根誤差(Root mean of squared error, RMSE),測(cè)定值標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)預(yù)測(cè)誤差的比值RPD(Ratio of standard deviation to standard error of prediction)為模型評(píng)價(jià)參數(shù)。當(dāng)RPD>2時(shí),表明模型具有極好的預(yù)測(cè)能力;當(dāng)1.4 2 結(jié)果與分析 2.1 土壤粘粒含量和砂粒含量統(tǒng)計(jì)特征分析 如表1所示,粘粒含量和砂粒含量全部樣本平均值分別為10.95%,21.52%。粘粒含量和砂粒含量建模樣本均包含了全部樣本的數(shù)據(jù)分布范圍,代表性好。這6組樣本偏度和峰度均在0~1.18之間,樣本土壤粘粒含量和砂粒含量數(shù)據(jù)接近正態(tài)分布。
2.2 BP神經(jīng)網(wǎng)絡(luò)建模結(jié)果
用BP人工神經(jīng)網(wǎng)絡(luò)的方法,輸入層分別為原始光譜、光譜一階微分、光譜二階微分的主成分,對(duì)每個(gè)模型經(jīng)過多次訓(xùn)練,3種光譜形式的神經(jīng)網(wǎng)絡(luò)模型中,除“PCS”砂粒原始光譜模型的隱層數(shù)為2,其余模型隱層數(shù)均為1。各自最佳模型如表2。
由表2可知,粘粒模型中,RPD均大于1.40,其中原始光譜模型RPD最大,為2.21,原始光譜模型RMSE最低,為1.62;砂粒模型中,砂粒的3個(gè)模型RPD均小于2,原始光譜模型RPD最大,其中砂粒二階微分模型的相對(duì)分析誤差為1.35,(小于1.40)表明模型無法對(duì)樣品進(jìn)行預(yù)測(cè),原始光譜模型RMSE最小,為6.52,遠(yuǎn)低于光譜二階微分模型的9.24。綜合RMSE、RPD、ME、MAE這些指標(biāo)來看,粘粒和砂粒原始光譜模型效果較佳。圖1給出了最佳模型對(duì)應(yīng)的粘粒含量和砂粒含量預(yù)測(cè)值與實(shí)測(cè)值1∶1線散點(diǎn)圖,實(shí)測(cè)值和預(yù)測(cè)值沿1∶1線具有較好的分布規(guī)律,顯示了較好的預(yù)測(cè)精度。土壤質(zhì)地之所以能影響土壤的光譜反射率,一方面是因?yàn)橥寥李w粒大小本身對(duì)土壤光譜的影響,另一方面是由于粘粒礦物的波譜差異[14]。在微分處理過程中,可能消除掉了原始光譜所獲取的因土壤顆粒大小引起的細(xì)微特征差異,因此并不能提升質(zhì)地預(yù)測(cè)精度,適應(yīng)于土壤質(zhì)地預(yù)測(cè)的新的光譜預(yù)處理方式有待進(jìn)一步研究。
2.3 PLSR建模及預(yù)測(cè)結(jié)果
以原始光譜的主成分為輸入變量,采用多元逐步回歸的方法,建立模型并獲得模型預(yù)測(cè)結(jié)果,如表3所示。
粘粒含量和砂粒含量多元逐步回歸模型中粘粒模型R2均較高(大于0.60),但粘粒含量和砂粒含量預(yù)測(cè)誤差指標(biāo),RMSE、ME、MAE均高于基于原始光譜主成分的BP人工神經(jīng)網(wǎng)絡(luò)模型,尤其粘粒含量預(yù)測(cè)RMSE為3.31,遠(yuǎn)高于1.62(BP人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)RMSE),且RPD小于1.4,表明模型不適于預(yù)測(cè)粘粒含量。因此,BP人工神經(jīng)網(wǎng)絡(luò)在土壤高光譜土壤質(zhì)地預(yù)測(cè)中優(yōu)于多元逐步回歸。
3 結(jié) 論
通過實(shí)測(cè)得到封丘縣101個(gè)土壤樣本的高光譜反射率和土壤質(zhì)地,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)和多元逐步回歸方法建立粘粒、砂粒含量的反演模型。BP神經(jīng)網(wǎng)絡(luò)模型優(yōu)于多元逐步回歸,是一種高效的預(yù)測(cè)方法;研究還表明,相比一階微分和二階微分光譜,原始光譜保存了更豐富的信息,更適于預(yù)測(cè)土壤質(zhì)地。
參考文獻(xiàn):
[1] 吳龍剛, 王愛慧, 盛炎平. 土壤質(zhì)地對(duì)中國(guó)區(qū)域陸面過程模擬的影響[J]. 氣候與環(huán)境研究, 2014, 19(5):559-571.
[2] 朱衛(wèi)紅, 鐵雙貴, 孫建軍,等. 不同土壤質(zhì)地及播種深度對(duì)甜玉米出苗潛勢(shì)的影響[J]. 河南農(nóng)業(yè)科學(xué), 2005(11):35-36.
[3] Ben-Dor E. Quantitative remote sensing of soil properties [J]. Advances in Agronomy, 2002, 75:173-243.
[4] 曾慶猛, 孫宇瑞, 嚴(yán)紅兵. 土壤質(zhì)地分類的近紅外光譜分析方法研究[J]. 光譜學(xué)與光譜分析, 2009, 29(7): 1 759- 1 763.
[5] 白燕英,魏占民,劉全明,等. 基于高光譜的河套灌區(qū)農(nóng)田表層土壤質(zhì)地反演研究[J].地理與地理信息科學(xué),2013,29(5):68-71.
[6] 王德彩,鄔登巍, 趙明松,等. 平原區(qū)土壤質(zhì)地的反射光譜預(yù)測(cè)與地統(tǒng)計(jì)制圖[J].土壤通報(bào),2012,43(2):257-262.
[7] 何緒生.近紅外反射光譜分析在土壤學(xué)的應(yīng)用及前景[J].中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2004,6(4):71-76.
[8] 徐永明,藺啟忠,王璐, 等.基于高分辨率反射光譜的土壤營(yíng)養(yǎng)元素估算模型[J].土壤學(xué)報(bào),2006,43(5):709-716.
[9] 郭斗斗,黃紹敏,張水清,等.多種潮土有機(jī)質(zhì)高光譜預(yù)測(cè)模型的對(duì)比分析[J].農(nóng)業(yè)工程學(xué)報(bào),2014(21):192-200.
[10] 朱大奇. 人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J].江南大學(xué)學(xué)報(bào):自然科學(xué)版, 2004, 3(1):103-110.
[11] 李學(xué)林, 李福春, 陳國(guó)巖,等. 用沉降法和激光法測(cè)定土壤粒度的對(duì)比研究[J].土壤,2011,43 (1):130-134.
[12] 何挺,王靜,林宗堅(jiān),等. 土壤有機(jī)質(zhì)光譜特征研究[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版, 2006(11): 975-980.
[13] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J].Soil Science Society of America Journal,2001,65 (2):480-490.
[14] Waiser T H, Morgan C L S, Brown D J, et al. In situ characterization of soil clay content with visible near-Infrared diffuse reflectance spectroscopy [J]. Soil Science Society of America Journal, 2007, 71 (2):389-396.