国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用BPNN及可見-近紅外光譜檢測土壤有機(jī)碳

2021-05-28 12:37曾凱翔陳奕鴻黃佳麗周偉東薛秀云
現(xiàn)代計算機(jī) 2021年10期
關(guān)鍵詞:光譜樣本建模

曾凱翔,陳奕鴻,黃佳麗,周偉東,薛秀云

(華南農(nóng)業(yè)大學(xué)電子工程學(xué)院、人工智能學(xué)院,廣州510642)

0 引言

土壤有機(jī)碳是土壤養(yǎng)分中一項重要的指標(biāo),快速檢測土壤有機(jī)碳含量是現(xiàn)在精準(zhǔn)農(nóng)業(yè)、測土配方施肥的關(guān)鍵。傳統(tǒng)的土壤有機(jī)碳(OC)含量分析方法為實驗室化學(xué)分析法,使用儀器一般為原子吸收光譜儀、色譜儀等光譜分析儀器,測量前期準(zhǔn)備長,數(shù)據(jù)處理復(fù)雜,測量時效性差[1]。從上世紀(jì)開始,國外便有利用可見-近紅外光譜分析土壤有機(jī)碳的探索研究,可見-近紅外光譜分析法具有簡便、快速、時效性強(qiáng)等優(yōu)點,應(yīng)用前景廣泛。隨著新的儀器和新的光譜分析算法出現(xiàn),利用光譜分析技術(shù)對農(nóng)田土壤有機(jī)碳含量進(jìn)行分析的能力逐漸提高[2-3]。國內(nèi)外學(xué)者利用光譜分析土壤有機(jī)碳的研究,證明了VNIRS分析技術(shù)可用于土壤有機(jī)碳的快速檢測[4],從理論和工程兩方面為建立較為準(zhǔn)確的土壤有機(jī)碳含量檢測模型奠定了基礎(chǔ)。

土壤有機(jī)碳含量檢測模型一般利用某一特定時間、特定地點、特定土壤類型的樣本進(jìn)行建模訓(xùn)練,而當(dāng)其中某一條件變化時,土壤樣本與建模樣本不匹配,模型檢測效果減弱。模型傳遞能力是目前阻礙可見-近紅外光譜檢測技術(shù)應(yīng)用的難點[5]。本文利用BPNN建立土壤有機(jī)碳含量檢測模型,并與PLS、SVM模型對比,應(yīng)用GA提取光譜特征波長,通過對不同類型土壤進(jìn)行建模,分析模型的傳遞能力。

1 材料與方法

1.1 LUCAS土壤數(shù)據(jù)庫

數(shù)據(jù)采用LUCAS土壤數(shù)據(jù)進(jìn)行。LUCAS數(shù)據(jù)庫是歐盟在2008-2012年間開展的歐洲土地利用及覆蓋統(tǒng)計調(diào)查所收集的數(shù)據(jù)集[6],其中包括19036個土壤樣本及其相關(guān)理化性質(zhì)數(shù)據(jù),樣本點分布于歐洲23個國家,土地類型耕地、林地、草地等。土壤樣本的OC含量根據(jù)ISO 10694-1995干燒法進(jìn)行檢測,對土壤樣本進(jìn)行風(fēng)干、過篩等預(yù)處理后,使用FOSS XDS近紅外光譜分析儀對其光譜反射率進(jìn)行測量,光譜波段為400-2500nm,波長間隔為0.5nm。研究選取LUCAS數(shù)據(jù)庫中3個不同區(qū)域不同種類的土壤樣本集進(jìn)行研究分析,其中土壤樣本數(shù)量分別為107(樣本集1)、107(樣本集2)、101(樣本集3),土壤樣本集中有機(jī)碳含量基本信息統(tǒng)計見表1。

1.2 數(shù)據(jù)處理方法

土壤有機(jī)碳含量檢測模型的建立如圖1所示,主要分為異常樣本剔除、數(shù)據(jù)預(yù)處理、特征波長提取、建模分析四個部分。

圖1 檢測模型結(jié)構(gòu)

(1)異常樣本剔除

在光譜獲取以及土壤有機(jī)碳含量檢測的過程中,光譜儀本身誤差或人為測量誤差等會造成個別土壤樣本光譜數(shù)據(jù)或土壤有機(jī)碳含量與其他正常樣本存在較大誤差,剔除此類異常樣本能有效提升模型的檢測精度[7]。主成分分析法(PCA)是一種常用降維算法,能有效保存原始光譜信息的同時對數(shù)據(jù)進(jìn)行降維,從而易于判斷出異常樣本。

圖2為對樣本集3的光譜數(shù)據(jù)進(jìn)行PCA后的效果圖,設(shè)置0.95的置信區(qū)間,超出置信區(qū)間的樣本判斷為異常樣本;土壤有機(jī)碳含量數(shù)據(jù)異常樣本利用3倍標(biāo)準(zhǔn)差法進(jìn)行剔除。對異常樣本進(jìn)行剔除后,獲得原始樣本集。

圖2 PCA效果圖

(2)數(shù)據(jù)預(yù)處理

有機(jī)碳含量模型檢測精度與光譜信息的質(zhì)量密切相關(guān),環(huán)境因素的影響、土壤本身的結(jié)構(gòu)狀態(tài)和光譜儀的工作質(zhì)量都會對光譜信息產(chǎn)生影響,光譜的預(yù)處理能夠有效減輕這些影響[8]。光譜的預(yù)處理主要針對三個方面:隨機(jī)噪聲、基線漂移與譜峰重疊、光散射。

Savitzky-Golay濾波(SG平滑)是針對隨機(jī)噪聲的一種常用算法[9],SG平滑方法本質(zhì)上是利用一個局部多項式回歸來確定各個數(shù)據(jù)點的平滑值,能夠有效地保留光譜數(shù)據(jù)的譜峰高度和寬度等特征。一階微分算法可以消除光譜測量背景的干擾,解決基線漂移與譜峰重疊的問題,同時增強(qiáng)光譜數(shù)據(jù)的特征信息。

(3)特征波長提取

光譜儀在收集光譜數(shù)據(jù)的過程中冗雜數(shù)據(jù)也被加以收集,光譜數(shù)據(jù)特征波段的提取是為了找出波長中與待測土壤有機(jī)碳含量變化最為敏感的波段,避免冗雜數(shù)據(jù)對建模精度與效率帶來影響。常用的特征波長提取算法有連續(xù)投影算法(SPA)、競爭性自適應(yīng)重加權(quán)算法(CARS)、遺傳算法(GA)等。

本文采用遺傳算法(GA)進(jìn)行特征波長提取。遺傳算法是一種模擬自然進(jìn)化選擇過程隨機(jī)搜索最優(yōu)解的方法,可以有效地選取出與目標(biāo)組分最具相關(guān)性的波段,降低建模難度與模型復(fù)雜度,提高建模精度與建模效率。

(4)模型建立方法

多元校正計量學(xué)方法是可見-近紅外光譜分析技術(shù)常用建模方法[10],其中包括多元線性回歸(MLR)、主成分回歸(PCR)、偏最小二乘法(PLS)、機(jī)器學(xué)習(xí)算法最小二乘支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)BPNN等。

本文采用BPNN算法對土壤樣本的光譜數(shù)據(jù)進(jìn)行檢測模型建立,并通過與PLS、SVM對比分析模型效果。最后利用交叉檢測的方法分析模型的傳遞能力。

(5)模型評價方法

模型評價指標(biāo)包括決定系數(shù)(R2)和均方根誤差(RMSE),其中決定系數(shù)(R2)越接近1,說明模型的檢測能力越強(qiáng),均方根誤差(RMSE)越小,說明模型檢測效果越好[11]。本文采用交叉驗證的方法對模型進(jìn)行驗證并得出評價指標(biāo)。

2 結(jié)果與評價

2.1 土壤光譜數(shù)據(jù)分析

計算3種樣本集的平均譜,由圖3可知,土壤平均光譜曲線整體趨勢相似,但由于土壤類型不同,樣本集光譜吸光度存在一定差異,光譜曲線間存在交錯。

圖3 3種樣本集的平均光譜

將光譜數(shù)據(jù)進(jìn)行SG平滑處理,通過對比不同的窗口寬度與多項式階數(shù)對模型的精確度的影響,選擇窗口寬度為11和多項式階數(shù)為3作為最終平滑參數(shù)。對平滑后的光譜數(shù)據(jù)進(jìn)行一階微分處理,得到一階微分光譜。取光譜800nm-1200nm進(jìn)行放大,由圖4、圖5對比可以看出,經(jīng)過一階微分后的光譜特征變得明顯,土壤有機(jī)碳含量越高,吸光度變化趨勢越大。將處理后的光譜數(shù)據(jù)作為原始光譜進(jìn)行建模。

圖4 局部波段平均譜

2.2 校正模型建立及其對比

對預(yù)處理后的光譜數(shù)據(jù)利用PLS建立校正模型,通過選用不同的潛變量(LVs)進(jìn)行對比,得到各樣本集校正模型的最佳潛變量個數(shù),采用最佳潛變量個數(shù)的3種樣本集PLS模型效果如表2所示。樣本集的PLS模型交叉驗證效果如圖6所示。

圖5 局部波段一階微分譜

圖6 PLS模型效果圖

SVM、BPNN模型以PCA主成分作為輸入變量。將預(yù)處理后的光譜數(shù)據(jù)利用主成分分析算法(PCA)進(jìn)行降維,得到主成分變量。取光譜數(shù)據(jù)PCA前7個主成分進(jìn)行SVM、BPNN建模訓(xùn)練。SVM模型采用徑向基核函數(shù)(RBF kernel function)作為核函數(shù)進(jìn)行模型訓(xùn)練,選用不同的SVM模型懲罰系數(shù)C和γ進(jìn)行建模,將精確度最高的一組C和γ作為模型的最佳參數(shù)。通過對比,最終選擇C=100;γ=0.01進(jìn)行SVM建模訓(xùn)練。BPNN模型訓(xùn)練函數(shù)選擇trainlm函數(shù),采用5層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,激活函數(shù)選擇tanh函數(shù),設(shè)置模型最大迭代系數(shù)為10000次、模型學(xué)習(xí)率為0.125。不同樣本集的SVM、BPNN模型效果如表2。各樣本集的SVM、BPNN模型交叉驗證效果如圖7、圖8所示。

圖7 SVM模型效果圖

圖8 BPNN模型效果圖

從不同樣本集有機(jī)碳含量檢測模型可以看出,PLS、SVM、BPNN三種模型均有較好的檢測效果,能夠?qū)ν寥烙袡C(jī)碳含量進(jìn)行較為精確的定量檢測,其中PLS的R2分別為0.832、0.924、0.968,RMSEV分別為3.36、3.74、5.53;SVM的R2分別為0.851、0.935、0.983,RMSEV分別為3.30、3.49、4.12;BPNN的R2分別為0.866、0.950、0.980,RMSEV分別為2.99、3.04、4.37??傮w而言,BPNN模型檢測效果較佳,能夠有效地提高土壤有機(jī)碳含量檢測模型精度、降低模型的RMSEV,SVM模型效果僅次于BPNN;相比SVM,BPNN在樣本集1和樣本集2中表現(xiàn)更好,而SVM在樣本集3中表現(xiàn)更好,這是不同種類土壤間存在的差異所造成的,說明不同種類土壤樣本的最佳檢測模型會有所不同。具體建模過程中,由于BPNN、SVM需要進(jìn)行模型迭代訓(xùn)練,算法更復(fù)雜、運行速度較慢;PLS模型檢測效果相對較差,但相比BPNN模型和SVM模型算法,PLS具有算法更簡單、運算速度更快的優(yōu)勢,在對檢測精度要求相對較低而時效性要求更高的前提下,PLS模型優(yōu)勢明顯。相比于土壤樣本集2、3,土壤樣本集1的精度較差,RMSEV卻更低,這是由于土壤樣本集1中的土壤有機(jī)碳含量數(shù)值更為集中。

表2 3種樣本集建模效果

2.3 GA提取特征波長及其效果

將原始光譜數(shù)據(jù)作為輸入利用GA進(jìn)行特征波長選取,GA主要參數(shù)設(shè)置為:最大繁殖代數(shù)100,交叉概率0.5,變異概率0.01。由于GA作為一種全局概率搜索算法在運算過程中依賴隨機(jī)數(shù)的產(chǎn)生,本文利用GA進(jìn)行多次特征波長選取,以消除隨機(jī)性對選取效果的影響,最終獲得提取特征變量后的光譜數(shù)據(jù)。

GA在提取過程中對原始光譜各波段的選取頻率如圖9所示,對篩選后的光譜數(shù)據(jù)分別進(jìn)行PLS、SVM、BPNN建模,模型效果如表3所示。由結(jié)果分析可知,提取特征波段后的光譜數(shù)據(jù)量僅為原始光譜數(shù)據(jù)量的25%,極大地減小的模型的復(fù)雜度,提高計算機(jī)運算效率;同時,GA不僅能將原始光譜中的冗雜波段剔除,對模型的效果也有所提升,其中GA-PLS的R2分別為0.835、0.942、0.971,RMSEV分別為3.32、3.24、5.25;GA-SVM的R2分別為0.860、0.987、0.985,RM-SEV分別為3.19、1.65、4.01;GA-BPNN的R2分別為0.875、0.965、0.984,RMSEV分別為2.89、2.52、3.93。經(jīng)過GA提出光譜特征波段后,檢測模型的R2提高,RMSEV減小,精度提升效果明顯。

表3 提取特征波長后建模效果

圖9 GA對各波段的選取頻率

2.4 模型傳遞能力分析

為了研究檢測模型對不同種類土壤的有機(jī)碳含量是否同樣具有檢測能力,分析檢測模型的傳遞能力。利用土壤樣本集的PLS、SVM、BPNN模型對剩余兩個土壤樣本集的有機(jī)碳含量進(jìn)行交叉檢測,檢測結(jié)果如表4所示。

表4 交叉檢測結(jié)果

由結(jié)果分析可以看出,由于不同地區(qū)土壤的類型、性質(zhì)等不同,原土壤有機(jī)碳含量檢測模型對其檢測能力較差。BPNN模型相對于SVM、PLS模型適用性更高,模型傳遞能力更強(qiáng),說明模型的傳遞能力與原模型的精度有關(guān),原模型的檢測能力越強(qiáng),模型的傳遞能力也相對越強(qiáng)。研究表明,根據(jù)具體種類的土壤光譜數(shù)據(jù)進(jìn)行建模分析,是獲得高精度、誤差小的土壤有機(jī)碳含量檢測模型更為有效的方法。

3 結(jié)語

過去的相關(guān)研究中,利用可見-近紅外光譜檢測土壤有機(jī)碳含量存在研究樣本種類單一、模型傳遞能力研究不足等問題[12]。本文利用土壤種類豐富的LUCAS數(shù)據(jù)庫,對可見-近紅外光譜檢測土壤有機(jī)碳含量及其模型傳遞能力進(jìn)行研究,主要結(jié)論如下:

(1)恰當(dāng)?shù)墓庾V預(yù)處理能有效提高對土壤有機(jī)碳含量的檢測精度。其中,SG平滑算法結(jié)合一階微分算法對光譜數(shù)據(jù)進(jìn)行預(yù)處理效果良好,能夠有效地降低光譜的隨機(jī)噪聲,突出光譜特征信息。

(2)BPNN、PLS、SVM模型對土壤有機(jī)碳含量的檢測均有較好效果。SVM、BPNN作為機(jī)器學(xué)習(xí)算法,在檢測能力上優(yōu)于PLS,而在模型復(fù)雜度與運算速度上,PLS優(yōu)于SVM、BPNN。

(3)GA算法可以有效地提取出光譜的特征波長,在大量降低光譜數(shù)據(jù)量、減小建模復(fù)雜度的同時,有效提升模型的精度,減小檢測誤差。

(4)PLS、SVM、BPNN模型傳遞能力不佳,對于不同種類的土壤有機(jī)碳含量均難以獲得良好檢測效果。BPNN、SVM由于本身模型精度較高,傳遞能力優(yōu)于PLS,模型傳遞能力與原模型精度相關(guān)。根據(jù)具體土壤類型光譜數(shù)據(jù)進(jìn)行建模分析是獲取精度更高、誤差更小的土壤有機(jī)碳含量檢測模型的有效方案。

猜你喜歡
光譜樣本建模
煤炭礦區(qū)耕地土壤有機(jī)質(zhì)無人機(jī)高光譜遙感估測
物理建模在教與學(xué)實踐中的應(yīng)用
在經(jīng)歷中發(fā)現(xiàn)在探究中建模
思維建模在連續(xù)型隨機(jī)變量中的應(yīng)用
求距求值方程建模
郭守敬望遠(yuǎn)鏡獲取光譜數(shù)破千萬
淺析光譜技術(shù)在200 nm以上和以下尺度范圍內(nèi)的不同
隨機(jī)微分方程的樣本Lyapunov二次型估計
基于支持向量機(jī)的測厚儀CS值電壓漂移故障判定及處理
靖安县| 南郑县| 新乡县| 凤凰县| 龙江县| 元朗区| 德格县| 昆山市| 福泉市| 屏南县| 墨竹工卡县| 三穗县| 泰兴市| 南川市| 鄂温| 北票市| 鸡东县| 上犹县| 蕉岭县| 德阳市| 和田县| 阿合奇县| 鹿泉市| 鲜城| 马龙县| 年辖:市辖区| 韩城市| 芒康县| 安顺市| 泰安市| 如皋市| 沧州市| 盐津县| 延寿县| 屯昌县| 五台县| 乐业县| 舟曲县| 黄陵县| 阿坝| 孟村|