常瑞紅,邵高超,李 娜,蔡 闖,畢研芳
(江蘇洋河酒廠股份有限公司,江蘇宿遷 223800)
近紅外光譜(near infrared spectroscopy,NIS)分析技術(shù)是一種光譜學(xué)與化學(xué)計量學(xué)相結(jié)合的一種現(xiàn)代化分析技術(shù),是通過對物質(zhì)的透射或者反射光譜來分析其分子結(jié)構(gòu)特點及其化學(xué)組成[1]。從近紅外光譜圖中可以得到樣品物質(zhì)的結(jié)構(gòu)、組成、濃度等化學(xué)信息,可實現(xiàn)對樣品便捷、快速、無損、高效、定性/定量分析,現(xiàn)已廣泛應(yīng)用于食品[2-3]、農(nóng)業(yè)[4-5]、化工[6]等行業(yè)。
由于近紅外光譜譜區(qū)的吸收強度較弱,信噪比低,同時受樣品均勻度、儀器等噪聲干擾,光譜易發(fā)生重疊和基線的漂移現(xiàn)象。因此,在建立模型時,采用適當(dāng)?shù)墓庾V預(yù)處理方法可有效消除背景噪音,提高譜圖與化學(xué)成分之間的相關(guān)性,大大提高模型預(yù)測能力[7]。對于液體樣品,常用的光譜預(yù)處理方法有平滑處理、求導(dǎo)、標(biāo)準(zhǔn)正態(tài)變量校正等,平滑處理是消除噪聲的常用方法;標(biāo)準(zhǔn)正態(tài)變量校正(SNV)用于校正樣品散射引起的光譜誤差;求導(dǎo)處理可有效消除背景干擾,其中一階導(dǎo)數(shù)處理可去除部分線性或接近線性的背景、噪聲光譜對目標(biāo)光譜的影響[8]。但由于導(dǎo)數(shù)處理可能使信噪比降低,因此在對光譜做導(dǎo)數(shù)預(yù)處理時先對其進行平滑預(yù)處理。
偏最小二乘法(PLS)和主成分回歸法(PCR)是兩種不同的建模方法,都能實現(xiàn)對光譜數(shù)據(jù)降維的目的,是近紅外光譜建模分析中常用的化學(xué)計量學(xué)方法[9]。目前近紅外光譜分析中定量模型構(gòu)建比較單一,采用不同的化學(xué)計量學(xué)方法構(gòu)建模型的研究相對較少。本實驗運用近紅外光譜技術(shù)檢測葡萄酒中的酒精度,采用不同光譜預(yù)處理,并運用PLS和PCR兩種化學(xué)計量學(xué)算法建立模型,對比分析兩種方法建模的差異,并根據(jù)決定系數(shù)(R2)、校正均方根誤差(RMSEC)和預(yù)測均方根誤差(RMSEP)3個指標(biāo)來評價模型的預(yù)測能力,旨在明確兩種化學(xué)計量學(xué)在建模中的差異,為今后模型構(gòu)建提供理論支持。
酒樣:116個葡萄酒樣品,江蘇東帝星徽國際貿(mào)易有限公司提供。
儀器設(shè)備:NIRMaster傅里葉變換近紅外光譜儀(配有高性能樣品杯和透反射蓋),瑞士BUCHI公司;溫度計和酒精計,冀州市耀華器械儀表廠;500~800 W電爐,弗恩森(北京)電爐有限公司。
葡萄酒酒精度的測定按照GB/T 15038—2006葡萄酒、果酒通用分析方法。
將葡萄酒樣品搖勻后,先用待測樣清洗高性能樣品杯3次,隨后緩緩倒入約20 mL待測樣于樣品杯中,再小心將透反射蓋蓋上(防止樣品杯底部有液泡產(chǎn)生)。使用NIRWare Opreator軟件進行光譜采集;NIRCal軟件進行建模;測量池選擇NIRFlex Liquid液體測量池;近紅外光譜測量波長范圍10000~4000 cm-1;以空氣為內(nèi)參比;光譜掃描32次,儀器分辨率8 cm-1;每個樣品重復(fù)采集3次,取平均光譜為最終分析光譜。
在建模時,為了去除噪聲、提高譜圖中的有效信息,選擇合適的光譜預(yù)處理非常必要。常用的光譜預(yù)處理方法為平滑處理、求導(dǎo)、標(biāo)準(zhǔn)正態(tài)變量校正等。本研究通過多次試驗,選取幾種較好的預(yù)處理方式,并且基于PLS和PCR計算方法,在不同光譜預(yù)處理方法下建立葡萄酒酒精度模型,通過比較模型結(jié)果及預(yù)測盲樣的效果對兩種算法下的模型進行評價。
近紅外光譜圖不僅包含了樣品的吸收信息,也包含了一些與樣品性質(zhì)無關(guān)的噪聲信息,如光散射、儀器影響、樣品不均勻等引起的干擾信息,導(dǎo)致近紅外光譜基線傾斜、漂移等現(xiàn)象。圖1為采集到的116個葡萄酒樣品的原始光譜圖,由圖1可知,在10000~4000 cm-1光譜范圍內(nèi)葡萄酒樣品有獨特的吸收特性,且樣品近紅外譜圖都較相似,但在整個光譜波段區(qū)域吸收峰存在一定重疊、平移等現(xiàn)象,不能有效反映樣品相關(guān)性信息。因此,在定量建模時,為了消除來自高頻隨機噪聲、樣本不均勻、基線漂移、光散射等的影響[10]。采用合理的光譜預(yù)處理方法,構(gòu)建穩(wěn)健性和預(yù)測能力都較強的模型,可有效提高樣品分析的準(zhǔn)確度和精確度[11]。
圖1 葡萄酒樣品的原始近紅外光譜圖
葡萄酒為質(zhì)地均勻的液體樣品,本實驗采用不同光譜預(yù)處理方式進行多次嘗試,選取相對較好的光譜預(yù)處理方法應(yīng)用PLS和PCR算法建模,結(jié)果見表1。
表1 不同光譜處理方法應(yīng)用PLS和PCR算法建模結(jié)果
由表1可知,基于PLS和PCR算法下,采用不同光譜預(yù)處理均可得到評價模型較好的參數(shù),表明所建模型均具有一定的準(zhǔn)確性和穩(wěn)定性。在PLS算法下,經(jīng)過光譜預(yù)處理建模的結(jié)果優(yōu)于未經(jīng)過預(yù)處理的,且3種光譜預(yù)處理方法建立的模型結(jié)果接近,相比較而言,平滑處理和求導(dǎo)的效果最好,其F1為5,R2最接近1,RMSEC和RMSEP最小且最相近;而在PCR算法下,平滑處理和求導(dǎo)處理后建立的模型效果是最差的,而經(jīng)過SNV處理后建立的模型是較好的,F(xiàn)1為7,比PLS模型下的大,說明采用PCR模型運算量較大,且模型相對復(fù)雜[12]。R2最接近1,RMSEC和RMSEP最小。綜合比較,采用光譜預(yù)處理建立的模型不一定優(yōu)于未經(jīng)過光譜預(yù)處理的,需多次試驗,尋求最合適的預(yù)處理方法,以建立穩(wěn)健性較好的模型。
經(jīng)過試驗選取,得到的最優(yōu)預(yù)處理光譜圖見圖2,由圖2可知,經(jīng)過預(yù)處理后的近紅外光譜,可有效消除原始光譜中的漂移,強化了譜帶特征,為獲得穩(wěn)健模型奠定了基礎(chǔ)。
從上述不同預(yù)處理方法建立的葡萄酒酒精度的模型中,選取最優(yōu)回歸模型,結(jié)果見圖3。
圖2 預(yù)處理后的光譜
圖3 酒精度的回歸模型
由圖3可知,橫坐標(biāo)表示葡萄酒酒精度的真值,縱坐標(biāo)表示葡萄酒酒精度的預(yù)測值,兩種算法下的擬合曲線都較好,其中PLS模型的R2為0.9657,RMSEC 為 0.0862,RMSEP 為 0.0892,PCR模型的R2為0.9594,RMSEC為0.0935,RMSEP為0.0999,通過比較模型評價指標(biāo)可知,兩種算法下建立的模型效果均較好,但PLS構(gòu)建模型的R2、RMSEC、RMSEP均優(yōu)于PCR構(gòu)建模型,且RM-SEC、RMSEP越小預(yù)測結(jié)果越準(zhǔn)確。所以,PLS模型預(yù)測精度高于PCR模型。
表2 預(yù)測集樣本的預(yù)測值
利用建立的葡萄酒酒精度定量模型預(yù)測11個盲樣,結(jié)果見圖4和表2,由圖4可知,兩種模型的預(yù)測值與化學(xué)測量值相關(guān)性都可接受,但PLS算法下建立的模型R2值(0.9757)高于PCR算法下R2值(0.9037);由表2可知,比較兩個模型的相對誤差,PLS的較集中,模型穩(wěn)定性好,PCR相對離散,PLS的相對誤差整體上小于PCR的,說明PLS預(yù)測準(zhǔn)確度高于PCR的,表2中PLS模型的RMSEP為0.2691,PCR模型的RMSEP為0.3485,說明PLS建立的模型預(yù)測效果優(yōu)于PCR。將預(yù)測值和化學(xué)實測值進一步做t檢驗,在0.05顯著性水平下,兩個模型預(yù)測值與化學(xué)測定值均無顯著性差異,說明兩種模型均具有可接受的預(yù)測能力,滿足常規(guī)分析精度的要求。綜合比較兩種模型,PLS模型的預(yù)測精度較高,所以,采用PLS算法構(gòu)建的葡萄酒酒精度模型預(yù)測效果較好。
圖4 預(yù)測值與化學(xué)值相關(guān)圖
本研究采用傅里葉變換近紅外光譜結(jié)合兩種化學(xué)計量學(xué)方法(PLS和PCR)分別建立葡萄酒酒精度的定量模型。結(jié)果表明,同一光譜預(yù)處理方法對兩種模型的影響不同,建模時需多次實驗以便選擇合適預(yù)處理方法;兩種算法構(gòu)建模型結(jié)果均較好,采用PLS構(gòu)建的模型R2為0.9657,RMSEC為0.0862,RMSEP為0.0892,采用PCR構(gòu)建的模型R2為0.9594,RMSEC為0.0935,RMSEP為0.0999;兩種模型預(yù)測效果均可接受,其R2均大于0.9,且與化學(xué)測量方法無顯著性差異(0.05水平下),但PLS模型的精度和穩(wěn)定性稍優(yōu)于PCR。由以上可知,近紅外光譜結(jié)合PLS和PCR算法構(gòu)建的模型都可預(yù)測得到葡萄酒酒精度的理想結(jié)果,但采用PLS算法建立的模型預(yù)測效果更好,模型具有較高的可靠性和精密性,能實現(xiàn)葡萄酒生產(chǎn)中對酒精度的快速檢測需求。
[1]YAN L,ZHAO L L,ZHANG L D.Application of near infrared spectroscopy[M].Beijing:China Light Industry Press,2005.
[2]彭幫柱,岳田利,袁亞宏,等.蘋果酒發(fā)酵過程中糖度近紅外光譜檢測模型的建立[J].光譜學(xué)與光譜分析,2009,29(3):652-655.
[3]DAMBERGS R G,KAMBOURIS A,FRANCIS I L,et al.Rapid analysis of methanol in grape-derived distillation products using near-infrared transmission spectroscopy[J].Agric food chem,2002,50(11):3079-3084.
[4]李毅念,姜丹,劉瓔瑛,等.基于近紅外光譜的雜交水稻種子發(fā)芽率測試研究[J].光譜學(xué)與光譜分析,2014,34(6):1528-1532.
[5]吳軍,白琪林,蘇勝寶,等.近紅外反射光譜法分析玉米秸稈纖維素含量的研究[J].分析化學(xué),2005,33(10):1421-1423.
[6]JOHNSO T J,MASIELLOT,SHARPE S W.The quantitative infrared and NIR spectrum of CH2I2 vapor:vibrational assignments and potential for atmospheric monitoring[J].Atmospheric chemistry and physics,2006,9(6):2581-2591.
[7]尼珍,胡昌勤,馮芳.近紅外光譜分析中光譜預(yù)處理方法的作用及其發(fā)展[J].藥物分析雜志,2008,28(5):824-829.
[8]浦瑞良,宮鵬.高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2000.
[9]褚小麗.化學(xué)計量學(xué)方法與分子光譜分析技術(shù)[M].北京:化學(xué)工業(yè)出版社,2011.
[10]田海清,應(yīng)義斌,徐惠榮,等.西瓜可溶性固形物含量近紅外透射檢測技術(shù)[J].農(nóng)業(yè)機械學(xué)報,2007,38(5):111-113.
[11]黃莊榮,沙莎,榮正勤,等.基于近紅外技術(shù)快速無損分析整粒棉籽中的脂肪酸含量[J].分析化學(xué),2013,41(6):922.
[12]楊春梅,李寧,趙學(xué)玒,等.用于果蔬內(nèi)部品質(zhì)無損檢測的NIRS技術(shù)新進展[J].激光與紅外,2009,39(11):1137-1141.