国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于近紅外光譜的玉米水分含量快速檢測研究

2022-08-29 08:40:00王超王春圻徐黎莉劉金明
關鍵詞:個數(shù)波長預處理

王超,王春圻,徐黎莉,劉金明

(黑龍江八一農(nóng)墾大學,大慶 163319)

玉米是我國主要的大田作物之一,其年產(chǎn)量占我國谷物總產(chǎn)量的25%以上,具有分布范圍廣、營養(yǎng)價值高、市場需求量大等特點,已經(jīng)發(fā)展成為我國重要的糧食、飼料和工業(yè)原料作物[1]。玉米的蛋白質、脂肪、糖類和水分是玉米廠商在收購玉米時十分重視的檢測指標,它直接決定著玉米質量的好壞。其中,玉米的水分含量決定著玉米的儲存時間,在玉米的購回和儲存過程中急需快速有效的檢測方法。但采用傳統(tǒng)烘箱恒重法檢測玉米水分存在測試速度慢、損壞樣品等問題。

近紅外光譜(near-infrared reflectance spectroscopy,NIRS)能夠基于被測物質所含C-H、N-H、O-H 基團的振動信息來進行樣品成分檢測,具有操作便捷、采樣速度快、樣品無損等優(yōu)點,已成為農(nóng)產(chǎn)品檢測的重要手段之一[2-3]。但光譜數(shù)據(jù)采集時易受到隨機噪聲、基線漂移、光譜變異等因素的干擾,從而導致最終建立的回歸模型預測精度下降[4]。因此,建模前需要對光譜數(shù)據(jù)進行預處理,以提高光譜數(shù)據(jù)的分辨率和信噪比。同時,光譜數(shù)據(jù)中還包含大量與待測目標間無關波長變量,這些無關波長變量不僅影響校正模型的建模速度,還影響了模型精度[5]。因此有必要采用特征波長優(yōu)選方法對高相關性波長變量進行優(yōu)選,以獲取有效建模波長變量[6]。

因此,文章探討了NIRS 結合化學計量學方法快速檢測玉米水分的可行性,基于偏最小二乘(partial least squares,PLS)的交叉驗證均方根誤差(root mean squared error of cross-validation,RMSECV)對光譜數(shù)據(jù)預處理方法進行了優(yōu)選,采用聯(lián)合區(qū)間偏最小二乘法(synergy interval PLS,SiPLS)和后向區(qū)間偏最小二乘法(backward interval PLS,BiPLS)優(yōu)選玉米水分對應的特征譜區(qū),以確定了最佳光譜預處理方法和特征波長選擇方法,為玉米水分含量的在線檢測設備的開發(fā)與應用提供了理論依據(jù)。

1 材料與方法

1.1 樣本數(shù)據(jù)來源

研究采用的玉米樣品光譜數(shù)據(jù)來自于艾根維克托檔案館,網(wǎng)址為https://eigenvector.com/resources/data-sets/。由80 個玉米樣品組成的數(shù)據(jù)集,研究數(shù)據(jù)包括樣品的水分、脂肪、蛋白質和淀粉含量,采樣間隔為2 nm,波長范圍為1 100~2 498 nm 的700 個波長變量。研究采用玉米水分含量作為研究對象,開展基于NIRS 的玉米水分含量快速檢測方法研究。

1.2 光譜預處理

在對樣品進行NIRS 掃描過程中,樣品光譜數(shù)據(jù)的質量易受儀器響應情況、環(huán)境條件變化、樣品自身特性等因素的影響,使采集的NIRS 數(shù)據(jù)存在基線漂移、隨機噪聲、光譜變異等問題,造成準確度下降。為了解決上述問題,研究采用Savitzky-Golay(SG)光譜平滑[7]、多元散射校正(multivariate scattering correction,MSC)[8]、標準正則變換(standard normal variate,SNV)[9]、一階導數(shù)(first derivative,F(xiàn)D)[10]及其組合方法對NIRS 數(shù)據(jù)進行變換和處理,以提高光譜數(shù)據(jù)的分辨率和信噪比,進而提高建模性能。

1.3 特征波長優(yōu)選

SiPLS 是在區(qū)間偏最小二乘的基礎上發(fā)展而來的一種特征譜區(qū)優(yōu)選算法[11]。SiPLS 將整個譜區(qū)劃分為k 個等寬的子區(qū)間后,隨機選擇j(2

BiPLS 將整個譜區(qū)劃分為k 個等寬的子區(qū)間后,首先剔除k 個區(qū)間中RMSECV 最大的子區(qū)間(相關性最差),對k-1 個區(qū)間建立PLS 模型,并計算相應的RMSECV。然后再次剔除剩余k-1 個區(qū)間中相關性最差的區(qū)間,對剩余k-2 個區(qū)間建立PLS 模型,并計算相應的RMSECV,以此類推,直到只剩下一個區(qū)間為止。以每次PLS 模型的RMSECV 為評價指標,并選擇RMSECV 最小時對應的多個子區(qū)間組合作為優(yōu)選后的特征譜區(qū)[13]。

1.4 模型的建立與評價

研究在建立玉米水分含量NIRS 快速檢測模型時,先使用SG、MSC、SNV、FD 及其組合方法進行光譜預處理,并建立全譜下的PLS 回歸模型,計算不同預處理方法下的回歸模型性能,并基于k 折RMSECV 確定光譜最佳預處理方法;在對光譜數(shù)據(jù)進行預處理后,使用Kernard-Stone(KS)法[14]將預處理后光譜數(shù)據(jù)按3∶1 比例劃分成校正集樣本和驗證集樣本,并使用SiPLS 和BiPLS 進行特征波長優(yōu)選;在基于蒙特卡洛交叉驗證(Monte-Carlo cross-validation,MCCV)的PLS 回歸模型的預測殘差平方和(prediction residual error sum of squares,PRESS)最小確定最佳主成分(principal components,PCs)個數(shù)后,分別建立全譜和優(yōu)選的特征波長對應的PLS 回歸校正模型,并基于校正決定系數(shù)(R2c)、驗證決定系數(shù)(R2p)、校正均方根誤差(root mean squared error of calibration,RMSEC)、預測均方根誤差(root mean squared error of prediction,RMSEP)和殘余預測偏差(residual predictive deviation,RPD)對回歸校正模型的性能進行評價。

算法包括樣品集劃分、光譜預處理、特征波長優(yōu)選、PLS 回歸模型構建等全部在Matlab R2016b 軟件平臺中實現(xiàn),其中BiPLS 和SiPLS 基于Lars Nφrgaard開發(fā)的iToolbox 工具箱實現(xiàn)[15]。

2 結果與分析

2.1 數(shù)據(jù)分析與處理

對80 個玉米樣品的水分含量進行統(tǒng)計分析,并繪制統(tǒng)計直方圖和箱線圖,如圖1 所示。經(jīng)檢驗發(fā)現(xiàn),樣本水分含量基本呈正態(tài)分布,水分含量在10%~10.5%區(qū)域占比較大。

圖1 玉米水分含量統(tǒng)計直方圖和箱線圖Fig.1 Statistical histogram and of moisture content in corn

在分析過程中,樣品的近紅外光譜會存在噪聲信息,造成吸收光譜出現(xiàn)基線偏移、漂移等情況,這主要是由于樣品的粒度、表面散射等因素。因此,光譜數(shù)據(jù)在使用前還需進行預處理,減少其它因素的影響。研究擬采用先使用SG、MSC、SNV、FD 及其組合的方法進行光譜預處理,通過校正集PLS 回歸模型的k 折RMSECV 的結果確定最佳預處理方法。經(jīng)計算比較后確定玉米水分含量回歸模型光譜數(shù)據(jù)的預處理方法為SG+FD。通過不同預處理方法建立的回歸模型得性能如表1 所示。

表1 不同光譜預處理方法對水分校正模型的影響Table 1 Effect of different spectral pretreatment methods on moisture calibration model

玉米樣品光譜數(shù)據(jù)如圖2 所示。由圖2(a)可知,原始光譜數(shù)據(jù)存在基線漂移現(xiàn)象。由圖2(b)可知,通過SG 平滑和FD 相結合對原始光譜進行預處理,修正了因掃描時間、周邊環(huán)境、設備狀態(tài)的不同導致的基線漂移和噪聲干擾等問題,有效提高了光譜數(shù)據(jù)的分辨率和信噪比。其中,SG 用于去除光譜掃描時儀器本身產(chǎn)生的隨機高頻噪聲,在一定程度上提高光譜的信噪比[16]。FD 常用來消除光譜基線不平對建模性能的影響[17],但導數(shù)處理在求導過程中會放大儀器產(chǎn)生的高頻噪聲,從而降低光譜數(shù)據(jù)信噪比。SG與FD 相結合能夠有效避免導數(shù)處理放大儀器噪聲的問題。

圖2 樣品光譜數(shù)據(jù)Fig.2 Spectral data of sample

對NIRS 數(shù)據(jù)進行預處理后,使用KS 法進行樣本集分組(比例為3∶1),得到校正集樣本60 個、驗證集樣本20 個。樣品中水分含量測量結果如表2 所示。變異系數(shù)為標準差與均值的比值,指標可以有效消除因單位不同或平均值差異對建模性能產(chǎn)生的不利影響。校正集的變異系數(shù)是3.943%,驗證集的變異系數(shù)范圍是2.816%,較大的變異系數(shù)有利于建立高魯棒性的回歸校正模型[18]。

表2 樣品中水分含量Table 2 Protein content in samples

用PCA 對預處理后的NIRS 數(shù)據(jù)進行計算,依次得到82.02%、11.30%和4.68%前3 個PCs 的貢獻率值,可知前3 個PCs 的累積貢獻率達98.00%。樣本主成分空間分布情況如圖3 所示。

圖3 樣本主成分空間分布Fig.3 Spatial distribution of sample principal components

由表2 和圖3 可知,驗證集基本處于校正集中,而且二者都均勻分布在PCs 空間上,由此說明,可以用樣本劃分方法進行NIRS 建模。

2.2 特征波長優(yōu)選

2.2.1 基于SiPLS 的特征譜區(qū)優(yōu)選

為了研究區(qū)間劃分個數(shù)對波長選擇及建立模型性能的影響,在使用SiPLS 優(yōu)化濕度特征譜時,將譜分為10~5 個子區(qū)間(步長為1),選取2~4 個子區(qū)間組成的總區(qū)間作為候選區(qū)間。根據(jù)RMSECV 分別作為SiPLS 優(yōu)選的特征光譜區(qū),其優(yōu)選結果如表3 所示。

表3 SiPLS 優(yōu)選譜區(qū)結果Table 3 Results of optimal moisture SiPLS spectrum

通過RMSECV 確定劃分11 個子區(qū)間,對應的最佳組合區(qū)間[1 6 7 8]作為優(yōu)選的水分特征譜區(qū),其中水的-OH 基團的二級倍頻對應區(qū)域為1 100~1 226 nm;水的-OH 基團的一級倍頻對應區(qū)域為1 742~1 995 nm區(qū)域對應著水分;水的-OH 基團的組合頻對應區(qū)域為1 997~2 121 nm。

2.2.2 基于BiPLS 的特征譜區(qū)優(yōu)選

在使用BiPLS 算法進行NIRS 特征譜區(qū)優(yōu)選時,區(qū)間劃分個數(shù)的選擇很重要。為了遴選最佳化分區(qū)間數(shù),將預處理后的樣本光譜數(shù)據(jù)劃分為k(k=10,20,30,40,50)個子區(qū)間,利用BiPLS 計算每個k值對應的最佳特征譜區(qū),完成劃分區(qū)間個數(shù)的初選(如表4 所示)。

表4 BiPLS 優(yōu)化光譜特征區(qū)間初選結果Table 4 Primary results of BiPLS optimization of spectral feature interval

由表4 可知,k=30 時,水分BiPLS 回歸模型的RMSECV 最??;k=40 時,其RMSECV 取次最小值,因此可以推測水分最佳譜區(qū)劃分個數(shù)在30~40 之間。為獲得水分最佳譜區(qū)劃分個數(shù),采用BiPLS 計算區(qū)間個數(shù)從31 到39 對應的最佳特征譜區(qū)(如表5 所示)。

表5 BiPLS 最佳特征譜區(qū)篩選結果Table 5 Results of BiPLS optimal feature spectrum screening

由表5 可知,區(qū)間劃分個數(shù)為34 時,BiPLS 優(yōu)選出13 個水分特征譜區(qū)對應的RMSECV 最小(0.008 7),對應區(qū)間列表為[2 3 6 13 15 16 17 20 21 22 23 24 25],選中的特征波長點為267 個。其中,水分-OH 基團的二級倍頻對應著1 142~1 224 nm 區(qū)域;水分-OH 基團的一級倍頻對應著1 690~1 814 nm 區(qū)域,水分-OH基團的組合頻對應著1 900~2 139 nm 區(qū)域。繪制SiPLS 和BiPLS 優(yōu)選的水分特征譜區(qū)(灰色陰影區(qū)域)與光譜數(shù)據(jù)對比圖(如圖4 所示)。

圖4 SiPLS 和BiPLS 優(yōu)選光譜特征譜區(qū)Fig.4 Spectral characteristic regions selected by SiPLS and BiPLS

2.3 回歸模型評價與分析

2.3.1 最佳PCs 個數(shù)的確定

PLS 回歸模型的最佳PCs 個數(shù)對建模性能具有重要影響。PCs 個數(shù)太多,將出現(xiàn)過擬合,PCs 中將含有校正集的部分冗余信息,導致模型的預測能力下降。PCs 個數(shù)太少,將出現(xiàn)欠擬合,選用的PCs 難以反應校正集的足夠信息,導致模型的解釋能力不夠,進而影響預測能力。合理的PCs 個數(shù)既可以提高PLS回歸模型的預測精度,又可以提高模型的穩(wěn)定性。文章在基于校正集MCCV 的PLS 回歸模型PRESS 確定最佳PCs 個數(shù)時,設PCs 個數(shù)的搜索范圍為1~30,步長為1,分別建立不同PCs 個數(shù)下的PLS 回歸模型,并計算每個PLS 回歸模型的PRESS,選取PRESS 值最小時對應的PCs 個數(shù)作為最佳PCs 個數(shù)。以預處理后的NIRS 全譜699 個波長點建立PLS 回歸模型,繪制PRESS 隨PCs 個數(shù)變化情況如圖5 所示。

圖5 PRESS 與PCs 關系圖Fig.5 Relation Diagram between PRESS and PCS

由圖5 可知,隨著PCs 個數(shù)的增加,PRESS 呈先迅速減少,后趨于平緩的趨勢。圖中箭頭所示紅色圓點的PRESS 值最?。?.018 2),PCs 的個數(shù)為18,說明這18 個PCs 的解釋能力最強。

2.3.2 回歸模型性能分析

按上述最佳PCs 個數(shù)據(jù)確定方法分別建立全譜和SiPLS 和BiPLS 優(yōu)選后譜區(qū)對應的PLS 回歸校正模型,以確定玉米水分NIRS 校正模型的最佳特征波長。不同回歸模型的性能如表5 所示。

由表6 可知,SiPLS 優(yōu)選特征譜區(qū)建立的玉米水分NIRS 回歸模型的性能最優(yōu),其R2P為0.994,RMSEP 為0.023,RPD 為12.777。模 型 的R2P≥0.99,RPD≥12.77,說明SiPLS 回歸模型具有杰出的性能,能夠滿足水分含量快速檢測的需求[19]。SiPLS 和BiPLS作為兩種最典型特征光譜區(qū)間搜索方法,在特征譜區(qū)優(yōu)選方面都具有良好的性能。選擇SiPLS 作為水分特征譜區(qū)優(yōu)選算法的主要原因在于:SiPLS 選擇固定數(shù)量的子區(qū)間作為備選光譜區(qū)域,BiPLS 通過去除相關度較低的子區(qū)間,尋找RMSECV 最小子區(qū)間的組合作為光譜特征,SiPLS 更適合于解決波長分布特征較多的問題[20]。水分對應著譜區(qū)中的吸收峰在整個譜區(qū)分布比較集中,適合采用SiPLS 進行特征譜區(qū)優(yōu)選。因此,SiPLS 優(yōu)選特征波長建立的玉米水分PLS回歸模型的預測性能優(yōu)于BiPLS 特征波長優(yōu)選方法建立的PLS 回歸模型。選取SiPLS 作為玉米水分特征波長優(yōu)選的最佳方法,以最終的特征波長建立PLS回歸模型,并進行建模分析分析,其結果如圖6 所示。

表6 水分回歸模型評價指標Table 6 Evaluation indexes of moisture regression model

圖6 水分實測值與預測值分布Fig.6 Distribution of measured and predicted water content

由圖6 可知,玉米水分含量的實測值與預測值點基本呈對角線分布,且擬合線基本與1∶1 線基本重合,經(jīng)檢驗發(fā)現(xiàn)各參數(shù)的預測值與實測值無顯著性差異。說明基于SiPLS 優(yōu)選特征譜區(qū)建立的PLS 回歸模型能夠滿足玉米水分含量的實際快速檢測需求。

3 結論

探討了基于近紅外光譜結合化學計量學方法進行的玉米水分含量快速檢測的可行性。為提高NIRS回歸模型的準確性和高效性,分別應用SiPLS 和Bi-PLS 算法進行水分含量的特征波長優(yōu)選,建立了相應的PLS 回歸校正模型,并評測了各種特征波長優(yōu)選方法的建模性能?;赟G 結合FD 光譜預處理、MCCV結合PRESS 確定最佳主成分個數(shù)和SiPLS 優(yōu)選特征譜區(qū)建立的玉米水分含量NIRS 快速檢測模型的R2P為0.994 1,RMSEP 為0.022 6,RPD 為12.776 6,能夠滿足玉米水分含量的實際檢測需求。光譜預處理和敏感波長變量的優(yōu)化有效地提高了近紅外光譜預測模型的準確性和魯棒性,為快速準確地測量玉米水分提供了一種新方法。

猜你喜歡
個數(shù)波長預處理
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
怎樣數(shù)出小正方體的個數(shù)
等腰三角形個數(shù)探索
怎樣數(shù)出小木塊的個數(shù)
怎樣數(shù)出小正方體的個數(shù)
基于預處理MUSIC算法的分布式陣列DOA估計
制導與引信(2017年3期)2017-11-02 05:16:56
雙波長激光治療慢性牙周炎的療效觀察
日本研發(fā)出可完全覆蓋可見光波長的LED光源
中國照明(2016年4期)2016-05-17 06:16:15
淺談PLC在預處理生產(chǎn)線自動化改造中的應用
絡合萃取法預處理H酸廢水
安化县| 沁阳市| 社旗县| 含山县| 景宁| 上蔡县| 丹东市| 玉林市| 斗六市| 淮安市| 洛浦县| 襄城县| 华容县| 永仁县| 拉萨市| 莆田市| 花垣县| 淅川县| 武城县| 桐庐县| 靖江市| 岢岚县| 永和县| 乌鲁木齐市| 新巴尔虎右旗| 潞城市| 于田县| 保康县| 怀安县| 新乡县| 五家渠市| 名山县| 昔阳县| 五莲县| 墨江| 郑州市| 内江市| 宜良县| 九龙坡区| 广州市| 樟树市|