国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于無參數(shù)高效算法的近紅外光譜模型傳遞研究

2023-03-07 06:22:46劉翠玲徐金陽孫曉榮張善哲昝佳睿
關(guān)鍵詞:酸值標(biāo)樣方根

劉翠玲 徐金陽 孫曉榮 張善哲 昝佳睿

(1.北京工商大學(xué)人工智能學(xué)院,北京 100048;2.北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗室,北京 100048)

0 引言

近紅外(Near infrared,NIR)[1-2]光譜技術(shù)因其快捷、無損、綠色等特點(diǎn),目前已廣泛應(yīng)用于食品[3-5]、醫(yī)藥[6]和農(nóng)業(yè)[7]等領(lǐng)域。但是,隨著近紅外光譜儀發(fā)展的多樣性,不同光譜儀間的多元校正模型無法實(shí)現(xiàn)共享,重新建立校正模型需要大量的人力和財力。解決這類問題的方法稱為模型傳遞[8](Calibration transfer),其核心思想是消除樣本在不同光譜儀器間測量信號的差異,從而實(shí)現(xiàn)校正模型的共享。

模型傳遞分為有標(biāo)樣傳遞與無標(biāo)樣傳遞[9]。近年來,國內(nèi)外學(xué)者對有標(biāo)樣模型傳遞算法應(yīng)用進(jìn)行了研究。溫曉燕等[10]利用直接標(biāo)準(zhǔn)化(Direct standardization,DS)和分段直接標(biāo)準(zhǔn)化(Piecewise direct standardization,PDS)算法對甲醇汽油進(jìn)行模型傳遞研究;BROUCKAERT等[11]采用斜率偏差校正法(Slope/bias,S/B)對工業(yè)液體洗滌劑的成分進(jìn)行模型傳遞研究。其次,國內(nèi)外學(xué)者也對無標(biāo)樣模型傳遞算法的應(yīng)用進(jìn)行了研究。宋海燕等[12]將有限脈沖響應(yīng)(Finite impulse response,F(xiàn)IR)算法應(yīng)用到土壤有機(jī)質(zhì)的模型傳遞研究;WANG等[13]將穩(wěn)定競爭自適應(yīng)重加權(quán)采樣(Stability competitive adaptive reweighted sampling,SCARS)算法應(yīng)用在樹葉葉綠素濃度模型傳遞的研究。以上算法均實(shí)現(xiàn)模型傳遞,但方式相對單一且獨(dú)立,只能選擇有標(biāo)樣傳遞或無標(biāo)樣傳遞的其中一種方式實(shí)現(xiàn),無法將兩種方式聯(lián)合應(yīng)用,導(dǎo)致傳遞模型的適用范圍較小。

無參數(shù)高效模型傳遞算法(Parameter-free and efficient calibration enhancement,PFCE)[14]根據(jù)有無標(biāo)準(zhǔn)樣品分為無標(biāo)樣傳遞PFCE(Non-supervised PFCE,NS-PFCE)算法和有標(biāo)樣傳遞PFCE(Full-supervised,F(xiàn)S-PFCE)算法。PFCE算法將兩種傳遞方式聯(lián)合應(yīng)用,具有效率高、設(shè)置簡單的優(yōu)點(diǎn),并成功應(yīng)用于藥品[14]、植物葉片[15]、水果[16]模型傳遞的研究。

本文采用PFCE算法結(jié)合偏最小二乘回歸(Partial least squares,PLS)建立傳遞模型,分別實(shí)現(xiàn)食用油酸值與過氧化值的有標(biāo)樣與無標(biāo)樣傳遞。并與經(jīng)典的3種有標(biāo)樣傳遞算法和2種無標(biāo)樣傳遞算法進(jìn)行對比,以期將模型傳遞更好地應(yīng)用于近紅外光譜檢測。

1 材料與方法

1.1 實(shí)驗儀器

實(shí)驗在北京工商大學(xué)光譜技術(shù)與品質(zhì)檢測實(shí)驗室完成,光譜檢測儀器為Bruker公司的VERTEX-70型傅里葉紅外光譜儀和MATRIX-F型傅里葉紅外光譜儀。儀器參數(shù)見表1。

表1 光譜儀器和參數(shù)

主機(jī)和從機(jī)分別對同一樣品進(jìn)行光譜采集,采集范圍為9 000~5 000 cm-1;光譜采集參數(shù)設(shè)置:樣本掃描次數(shù)為32;背景掃描次數(shù)為32;光闌 6 mm;掃描頻率10 kHz。

1.2 實(shí)驗材料

為了構(gòu)建食用油通用模型,選取北京古船食品有限公司的5種食用油樣品,共計129個,其中包含19個玉米油、25個芝麻香油、56個大豆油、5個橄欖油、24個小磨香油樣本。并依據(jù)文獻(xiàn)[17-18]測定所有食用油樣本酸值與過氧化值。

1.3 樣品劃分

在近紅外光譜模型傳遞分析中,通常把樣本劃分成訓(xùn)練集和預(yù)測集。光譜-理化值共生距離(Sample set partitioning based on joint x-y distances,SPXY)[19]是一種有效的樣品集劃分方法,原理是分別采用光譜數(shù)據(jù)和樣本理化值作為參數(shù)特征計算樣品間距離,以保證最大程度表征樣本分布,增加樣本間差異性和代表性,并提高模型穩(wěn)定性和準(zhǔn)確性。

1.4 PFCE模型傳遞算法

根據(jù)使用場景不同,無參數(shù)高效模型傳遞算法(PFCE)分為NS-PFCE無標(biāo)樣模型傳遞算法和FS-PFCE有標(biāo)樣模型傳遞算法。NS-PFCE僅使用食用油樣本光譜信息實(shí)現(xiàn)模型傳遞,而FS-PFCE則需要食用油樣本的光譜信息與理化值信息共同作用實(shí)現(xiàn)模型傳遞。

1.4.1主機(jī)PLS多元校正模型建立

偏最小二乘回歸(PLS)[20]是一種經(jīng)典的統(tǒng)計學(xué)方法,已經(jīng)成為衡量校正模型效果的最佳標(biāo)準(zhǔn)。采用PLS方法建立食用油的多元校正模型,并通過選擇最佳潛在變量的數(shù)量來優(yōu)化模型。

主機(jī)光譜儀采集的樣品光譜數(shù)據(jù)記為Xmaster并與樣本理化值y建立主機(jī)的線性回歸模型,并得到預(yù)測值,即

(1)

式中b0,master——主機(jī)模型截距

bmaster——主機(jī)模型回歸系數(shù)

e——和y之間的預(yù)測誤差

1.4.2NS-PFCE無標(biāo)樣模型傳遞算法

從機(jī)光譜儀采集的樣品光譜數(shù)據(jù)記為Xslave,將主機(jī)模型截距b0,master和回歸系數(shù)bmaster代入NS-PFCE算法的成本函數(shù),使從機(jī)模型盡可能接近主機(jī)模型,即:主機(jī)模型預(yù)測值與從機(jī)模型預(yù)測值誤差最小,從而尋找最優(yōu)的從機(jī)模型截距b0,slave和回歸系數(shù)bslave,即

(2)

式中 corr(·)——bmaster和bslave間的相關(guān)系數(shù)運(yùn)算函數(shù)

rthres——約束閾值

為了加快函數(shù)收斂速度并減少搜尋空間,在主機(jī)模型與從機(jī)模型的回歸系數(shù)間施加相關(guān)系數(shù)的約束閾值rthres,且為了防止出現(xiàn)欠擬合與過擬合的情況,將rthres設(shè)置為0.98。

1.4.3FS-PFCE有標(biāo)樣模型傳遞算法

相比NS-PFCE無標(biāo)樣模型傳遞算法,F(xiàn)S-PFCE有標(biāo)樣模型傳遞算法不僅需要主機(jī)光譜數(shù)據(jù)Xmaster與從機(jī)光譜數(shù)據(jù)Xslave,還要食用油樣本理化值真實(shí)值y。相似地,通過FS-PFCE算法的成本函數(shù)得到最優(yōu)的從機(jī)模型的截距b0,slave和回歸系數(shù)bslave,即

(3)

FS-PFCE算法的成本函數(shù)不僅計算了主機(jī)光譜與從機(jī)光譜的預(yù)測誤差,還計算了真實(shí)值與從機(jī)預(yù)測值的誤差。同樣,防止出現(xiàn)欠擬合與過擬合的情況,將rthres設(shè)置為0.98。

1.5 模型傳遞評價指標(biāo)

模型的評價指標(biāo)選擇決定系數(shù)(Correlation coefficient of cross-validation,R2)、訓(xùn)練集均方根誤差(Root mean square error of calibration,RMSEC)和預(yù)測集均方根誤差(Root mean square error of prediction,RMSEP)。R2越接近1且RMSEC與RMSEP越小,表明模型傳遞效果越好。

2 結(jié)果與分析

如圖1所示,主機(jī)和從機(jī)所采集的食用油樣品的平均吸光度在波段9 000~5 000 cm-1之間,共2 074個波數(shù)點(diǎn)??梢钥闯鲋鳈C(jī)光譜和從機(jī)光譜存在明顯的非線性差異,吸光度差值在波段 9 000~8 750 cm-1存在較大偏差。

圖1 主、從機(jī)的食用油平均吸光度及光譜差值

2.1 樣本劃分

采用SPXY算法按照比例3∶1選取97個食用油樣本作為訓(xùn)練集,32個樣本食用油作為驗證集,用于建立酸值和過氧化值定量分析模型。食用油樣本酸值和過氧化值的數(shù)據(jù)集劃分如表2所示,其中預(yù)測集的數(shù)值范圍均在訓(xùn)練集之內(nèi),表明預(yù)測集可以對模型的性能進(jìn)行驗證。

表2 食用油樣品數(shù)據(jù)集劃分

2.2 主機(jī)模型預(yù)測結(jié)果

為了消除噪聲干擾等因素對建模效果的影響,分別采用Savitzky-Golay(S-G)平滑卷積[21]、多元散射校正(Multiplicative scatter correction,MSC)[22]、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normalized variate,SNV)[23]、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)[24]共5種預(yù)處理算法處理光譜數(shù)據(jù)。選擇最優(yōu)預(yù)處理算法后建立主機(jī)酸值與過氧化值偏最小二乘校正模型,不同預(yù)處理條件下主機(jī)PLS校正模型預(yù)測結(jié)果如表3、4所示。

表3 不同預(yù)處理條件下主機(jī)PLS校正模型酸值預(yù)測結(jié)果

表4 不同預(yù)處理條件下主機(jī)PLS校正模型過氧化值預(yù)測結(jié)果

從表3、4可看出,采用5種不同預(yù)處理算法處理食用油光譜的建模效果比直接使用原始光譜的建模效果均有提升。其中,主機(jī)酸值模型MSC算法預(yù)處理效果最優(yōu),預(yù)測集決定系數(shù)R2達(dá)0.948,預(yù)測值均方根誤差RMSEP為0.249 mg/g。主機(jī)過氧化值模型SNV算法預(yù)處理效果最優(yōu),預(yù)測集決定系數(shù)R2達(dá)0.954,預(yù)測值均方根誤差RMSEP為7.749 mmol/kg。

MSC和SNV算法的本質(zhì)是消除樣品表面散射和光程變化等因素對光譜產(chǎn)生的影響,故二者算法不同程度地消除了食用油因液體表面張力引起的散射,所以預(yù)測效果優(yōu)于其他算法,也有效提高了模型預(yù)測精度。

2.3 PFCE算法模型傳遞及預(yù)測結(jié)果

按照PFCE算法分類進(jìn)行NS-PFCE無標(biāo)樣模型傳遞算法與FS-PFCE有標(biāo)樣模型傳遞算法。利用NS-PFCE與FS-PFCE算法得到的最優(yōu)截距和回歸系數(shù)分別構(gòu)建從機(jī)預(yù)測模型,并將從機(jī)的32個食用油樣本分別代入以上兩種模型進(jìn)行預(yù)測,預(yù)測的食用油酸值散點(diǎn)圖如圖2、3所示,預(yù)測的食用油過氧化值散點(diǎn)圖如圖4、5所示。

圖2 主機(jī)與NS-PFCE算法預(yù)測食用油酸值散點(diǎn)圖

圖3 FS-PFCE算法預(yù)測食用油酸值散點(diǎn)圖

圖4 主機(jī)與NS-PFCE算法預(yù)測食用油過氧化值散點(diǎn)圖

圖5 FS-PFCE算法預(yù)測食用油過氧化值散點(diǎn)圖

食用油酸值與過氧化值建模及預(yù)測結(jié)果見表5。由表5可知,當(dāng)從機(jī)樣品集未進(jìn)行模型傳遞直接代入主機(jī)模型進(jìn)行預(yù)測時,酸值預(yù)測集均方根誤差從原先的0.249 mg/g上升到0.613 mg/g,過氧化值預(yù)測集均方根誤差從原先的7.749 mmol/kg上升到16.153 mmol/kg,預(yù)測結(jié)果偏差較大,表明從機(jī)樣本不能直接應(yīng)用于主機(jī)模型,需要對從機(jī)樣本進(jìn)行模型傳遞。

表5 食用油酸值與過氧化值建模及預(yù)測結(jié)果

分別采用NS-PFCE無標(biāo)樣模型傳遞算法與FS-PFCE有標(biāo)樣模型傳遞算法進(jìn)行傳遞后,模型預(yù)測效果均有明顯提升。NS-PFCE算法傳遞后,酸值的RMSEP下降到0.275 mg/g,過氧化值的RMSEP下降到9.523 mmol/kg。而FS-PFCE算法傳遞后,酸值的RMSEP下降到0.274 mg/g,過氧化值的RMSEP下降到8.945 mmol/kg。經(jīng)兩種算法傳遞后的模型預(yù)測效果均有所改善,說明PFCE算法使得從機(jī)樣本能更好地適用于主機(jī)模型。且相比之下,F(xiàn)S-PFCE有標(biāo)樣模型傳遞算法的傳遞效果優(yōu)于NS-PFCE無標(biāo)樣模型傳遞算法,說明有無標(biāo)準(zhǔn)樣品成為PFCE算法傳遞效果的關(guān)鍵。

2.4 標(biāo)準(zhǔn)化樣品數(shù)目對模型傳遞的影響

為了進(jìn)一步探究標(biāo)準(zhǔn)化樣品數(shù)目對PFCE算法模型傳遞效果的影響,采用SPXY算法依次從原批次食用油樣本的訓(xùn)練集中選取20、40、60、80、100個標(biāo)準(zhǔn)化樣品集,食用油酸值與過氧化值建模效果與預(yù)測均方根誤差如圖6所示。

從圖6a可知,經(jīng)NS-PFCE和FS-PFCE算法傳遞后的酸值預(yù)測均方根誤差均與訓(xùn)練集標(biāo)準(zhǔn)化樣品數(shù)目有關(guān),且隨著標(biāo)準(zhǔn)化樣本數(shù)目的增加,預(yù)測集均方根誤差越小。當(dāng)標(biāo)準(zhǔn)化樣品個數(shù)為100時,預(yù)測均方根誤差達(dá)到最小值,經(jīng)NS-PFCE算法和FS-PFCE算法傳遞后酸值的RMSEP分別下降到0.283、0.276 mg/g。由圖6b可知,經(jīng)以上兩種算法傳遞后過氧化值預(yù)測均方根誤差與訓(xùn)練集標(biāo)準(zhǔn)化樣品數(shù)目呈相同規(guī)律,且當(dāng)標(biāo)準(zhǔn)化樣品個數(shù)為100時,預(yù)測均方根誤差也達(dá)到最小值,傳遞后過氧化值RMSEP分別下降到9.498、8.945 mmol/kg。

圖6 不同標(biāo)準(zhǔn)化樣品數(shù)目預(yù)測均方根誤差

相比之下,經(jīng)FS-PFCE算法傳遞后的預(yù)測集均方根誤差均小于NS-PFCE算法,說明FS-PFCE有標(biāo)樣模型傳遞算法的傳遞效果優(yōu)于NS-PFCE無標(biāo)樣模型傳遞算法。

2.5 PFCE算法傳遞效果比較

為了評估PFCE算法的模型傳遞效果,研究比較S/B、DS和PDS有標(biāo)樣模型傳遞算法,同時也比較FIR和SCARS無標(biāo)樣模型傳遞算法。將從機(jī)32個樣本集分別代入以上經(jīng)不同算法傳遞后的校正模型進(jìn)行預(yù)測,4種有標(biāo)樣模型傳遞算法與3種無標(biāo)樣模型傳遞算法預(yù)測結(jié)果如表6、7所示。

表6 4種有標(biāo)樣模型傳遞算法酸值與過氧化值模型預(yù)測結(jié)果

對比4種有標(biāo)樣模型傳遞算法,均有效地降低酸值和過氧化值預(yù)測集均方根誤差,提升從機(jī)樣本對主機(jī)模型的適應(yīng)能力。其中NS-PFCE算法傳遞效果最優(yōu),對比3種無標(biāo)樣模型傳遞算法,也都有效地降低了酸值和過氧化值預(yù)測集均方根誤差。FS-PFCE算法傳遞效果仍是最優(yōu)。

表7 3種無標(biāo)樣模型傳遞算法酸值與過氧化值模型預(yù)測結(jié)果

2.6 討論

PFCE算法包含無標(biāo)樣模型傳遞算法和有標(biāo)樣模型傳遞算法,其傳遞效果均優(yōu)于經(jīng)典有標(biāo)樣和無標(biāo)樣算法,使模型傳遞算法不再局限于其中一種傳遞方式,提高了模型傳遞適用性和包容性。且相比之下,有標(biāo)樣模型傳遞算法的傳遞效果優(yōu)于無標(biāo)樣模型傳遞算法,說明有無標(biāo)準(zhǔn)樣品成為模型傳遞算法效果的關(guān)鍵。另外,PFCE算法無參數(shù),只需設(shè)置相關(guān)系數(shù)的閾值,模型傳遞效率高,使得從機(jī)樣本更接近于主機(jī)模型,從而實(shí)現(xiàn)了不同儀器間多元校正模型的共享。

3 結(jié)論

(1)經(jīng)NS-PFCE算法傳遞后的從機(jī)樣本酸值預(yù)測模型RMSEP從0.613 mg/g降低到0.275 mg/g,過氧化值的RMSEP從16.153 mmol/kg降低到9.523 mmol/kg;而FS-PFCE算法傳遞后的從機(jī)樣本酸值預(yù)測模型的RMSEP降低到0.274 mg/g,過氧化值的RMSEP降低到8.945 mmol/kg。分別對比其余4種有標(biāo)樣模型傳遞與3種無標(biāo)樣模型傳遞,PFCE算法的預(yù)測效果最優(yōu),且FS-PFCE算法均優(yōu)于NS-PFCE算法。此外,PFCE算法隨著標(biāo)準(zhǔn)化樣本數(shù)目的增加,預(yù)測集均方根誤差減小。

(2)聯(lián)合模型傳遞的有標(biāo)樣傳遞算法和無標(biāo)樣傳遞算法,采用PFCE中NS-PFCE無標(biāo)樣算法和FS-PFCE有標(biāo)樣算法分別實(shí)現(xiàn)了食用油的酸值與過氧化值在不同儀器間的傳遞。并與DS、PDS、S/B的有標(biāo)樣算法和FIR、SCARS無標(biāo)樣算法進(jìn)行對比研究。PFCE算法有效地降低主機(jī)與從機(jī)之間的光譜差異,提高了從機(jī)樣本在主機(jī)模型的適應(yīng)度,實(shí)現(xiàn)了不同光譜儀間的模型共享。

猜你喜歡
酸值標(biāo)樣方根
方根拓展探究
火花源原子發(fā)射光譜法檢測鋼中硫元素時分析精度降低的原因探究和問題改善
自制標(biāo)樣提高X射線熒光光譜儀壓片法曲線的準(zhǔn)確度
化工管理(2021年4期)2021-02-27 07:34:08
柴油酸度和酸值測定結(jié)果差異性研究
云南化工(2020年11期)2021-01-14 00:50:56
優(yōu)質(zhì)橄欖油如何購買
均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
揭開心算方根之謎
數(shù)學(xué)魔術(shù)
Al2(SO4)3/SiO2催化高酸值生物柴油原料降酸值研究
淺談化學(xué)檢測中標(biāo)樣量值的準(zhǔn)確性
化工科技(2014年5期)2014-06-09 06:11:24
甘德县| 文山县| 伊金霍洛旗| 阳东县| 大安市| 富平县| 肥西县| 灵山县| 临潭县| 芮城县| 淳安县| 龙南县| 肥西县| 双城市| 宜城市| 平原县| 海安县| 舟山市| 浦东新区| 岳西县| 五河县| SHOW| 绥江县| 沂南县| 民和| 祁东县| 肃南| 朔州市| 临高县| 盐池县| 中牟县| 澎湖县| 蒙城县| 泌阳县| 汕头市| 延安市| 温宿县| 综艺| 德昌县| 大冶市| 枣阳市|