彭 丹,聶慶琛,侯歡歡,楊國(guó)龍,孫尚德
(河南工業(yè)大學(xué) 糧油食品學(xué)院,河南 鄭州 450001)
隨著人們生活水平的提高,乳制品的需求量逐年增加.近來(lái)年,盡管各部門(mén)不斷加大對(duì)乳品安全監(jiān)管的力度,但仍有劣質(zhì)乳品的頻繁出現(xiàn),如無(wú)抗奶事件、三聚氰胺事件、皮革奶事件、激素門(mén)事件等,無(wú)不引發(fā)社會(huì)的廣泛關(guān)注.在事故處理過(guò)程中,暴露出奶源質(zhì)量檢測(cè)技術(shù)的不足.因此,簡(jiǎn)便、快捷、準(zhǔn)確的檢測(cè)技術(shù)是現(xiàn)代乳品企業(yè)及有關(guān)監(jiān)管部門(mén)的迫切需求.
在奶源質(zhì)量檢測(cè)領(lǐng)域,有多種檢測(cè)方法如化學(xué)法、中紅外光譜法、高效液相色譜法、質(zhì)譜法等,但無(wú)法滿足原料乳實(shí)時(shí)、在線、連續(xù)監(jiān)測(cè)的要求.近紅外光譜技術(shù)作為一種快速、簡(jiǎn)便、無(wú)損的定性和定量分析方法,已成為乳品質(zhì)量安全檢測(cè)的最佳方式.近紅外光譜技術(shù)是利用分析物對(duì)光的特異性吸收光譜數(shù)據(jù)來(lái)進(jìn)行定性分析或定量檢測(cè)技術(shù).然而,光譜數(shù)據(jù)中不僅含有分析物的有用信息,還包含噪聲、背景、雜散光等無(wú)關(guān)信息,結(jié)果導(dǎo)致校正模型不穩(wěn)定、適應(yīng)性不好、分析精度難以提高等問(wèn)題[1].因此,有效消除無(wú)關(guān)信息的干擾對(duì)建立預(yù)測(cè)精度高、穩(wěn)定性好的校正模型至關(guān)重要.目前,消除無(wú)關(guān)信息干擾的方法主要有3 種:(1)采用預(yù)處理方法剔除光譜中的無(wú)關(guān)信息,如多元散射校正[2]、標(biāo)準(zhǔn)正交變換法[3-4]和正交信號(hào)校正法[5]等;(2)通過(guò)抵償法扣除光譜中的無(wú)關(guān)信息,如扣標(biāo)準(zhǔn)液校正法[6]等;(3)利用頻譜特性消除光譜中的無(wú)關(guān)信息,如小波變換[7-8]等.筆者以牛奶中脂肪和蛋白質(zhì)含量的檢測(cè)為例,嘗試采用干擾校正組合方法對(duì)無(wú)關(guān)信息進(jìn)行消除,提高牛奶成分的測(cè)量精度,同時(shí)探討不同校正方法的優(yōu)劣.
1.1.1 擴(kuò)展多元散射校正
擴(kuò)展多元散射校正(extended multiplicative signal correction,EMSC)是多元散射校正的推廣,與MSC 法只考慮信號(hào)的處理不同,EMSC 對(duì)光譜中的信號(hào)和噪聲同時(shí)進(jìn)行處理.這里把物質(zhì)成分的吸收信息作為信號(hào),而由粒子大小等物理信息引起的無(wú)關(guān)信息作為噪聲,通過(guò)對(duì)信號(hào)與噪聲分離,即分別用不同的參數(shù)來(lái)表示吸收和散射影響的方式,達(dá)到提取有用信息的目的.
1.1.2 標(biāo)準(zhǔn)正交變換
標(biāo)準(zhǔn)正交變換(standard normal variate,SNV)是一種用來(lái)消除樣品尺寸、顆粒大小與均勻性、表面散射以及光程長(zhǎng)變化對(duì)光譜影響的方法,它是基于光譜陣列對(duì)一組光譜進(jìn)行標(biāo)準(zhǔn)化處理,處理后的光譜xSMV可表示為:
1.1.3 正交信號(hào)校正
正交信號(hào)校正(orthogonal signal correction,OSC)的基本原理是將光譜陣X 與濃度陣Y 正交,濾除光譜中與濃度陣無(wú)關(guān)的信號(hào),然后進(jìn)行多元校正,達(dá)到提高模型預(yù)測(cè)能力的目的.其具體算法如下:
(1)將原始校正集光譜矩陣X 和濃度矩陣Y進(jìn)行均值化、中心化或標(biāo)準(zhǔn)化處理;
(2)計(jì)算M=1-XTY(YTXXTY)-1YTX;
(3)得到權(quán)重向量W=λ-0.5MXTp,其中p 為XM(XM)T的第一主成分,λ 為特征值;
(4)求出載荷向量p*=XTt*/((t*)Tt*),其中t*=t-Y(YTY)-1YTt;
(5)在X 中將正交信號(hào)減去XOSC=X-t*(p*)T.當(dāng)計(jì)算第二主成分時(shí),XOSC代替X,重復(fù)步驟(2)~(5),直至所需的OSC 因子被移除.對(duì)于預(yù)測(cè)向量Xnew,由權(quán)重和載荷求出校正后的光譜.
扣標(biāo)準(zhǔn)液校正是用一種與樣品基體相似、濃度恒定的標(biāo)準(zhǔn)液為背景,在每次測(cè)量分析樣品之前測(cè)定該背景標(biāo)準(zhǔn)液,然后從分析樣品的近紅外光譜中扣除此背景標(biāo)準(zhǔn)液的近紅外光譜.該法通過(guò)對(duì)原始光譜數(shù)據(jù)的校正,消除待測(cè)樣品中其他成分相互作用帶來(lái)的干擾,提高光譜測(cè)量的精度,從而提高模型的預(yù)測(cè)精度及適用性.
小波變換(wavelet transform,WT)是把信號(hào)分解為不同尺度和頻率的小波子空間,具體理論參見(jiàn)文獻(xiàn)[8].目前多采用Mallat 算法的小波變換對(duì)信號(hào)進(jìn)行處理,得到的小波系數(shù)中逼近系數(shù)反映了原始信號(hào)的“骨架”信息,在信號(hào)輪廓上更逼近原始信號(hào);細(xì)節(jié)系數(shù)則反映了信號(hào)的局部細(xì)微信息.本研究通過(guò)閾值法去除小波系數(shù)中被認(rèn)為是噪聲的元素,經(jīng)處理后的小波系數(shù)再進(jìn)行反變換即可得到濾噪后的光譜信號(hào).
采用瑞士Buchi 公司NIRFlex N-500 傅立葉變換紅外光譜儀,InGaAs 檢測(cè)器,光譜采集范圍1 000~2 500 nm,掃描分辨率8 cm-1,波長(zhǎng)精度±0.2 cm-1,掃描次數(shù)為8.
樣品由河南奶牛中心提供,共100 個(gè)樣品,其中80 個(gè)樣品作為校正集,20 個(gè)作為驗(yàn)證集樣品.牛奶中脂肪、蛋白質(zhì)和乳糖的參考值由丹麥FOSS公司生產(chǎn)的乳品綜合成分指標(biāo)分析儀測(cè)定,測(cè)量結(jié)果見(jiàn)表1.
表1 校正和驗(yàn)證集中牛奶樣品的信息
擴(kuò)展多元散射校正、小波變換、標(biāo)準(zhǔn)正交變換、正交信號(hào)校正的數(shù)據(jù)處理程序均由Matlab7 編寫(xiě).利用CAMO 公司的Unscrambler 7.8 軟件建立PLS 校正模型.模型性能通過(guò)相關(guān)系數(shù)(Corr.)、校正集標(biāo)準(zhǔn)偏差(root mean squared error of calibration,RMSEC)和驗(yàn)證集標(biāo)準(zhǔn)偏差(root mean standard error of prediction,RMSEP)來(lái)評(píng)價(jià).
圖1 為牛奶的近紅外透射光譜圖,在1 000~2 500 nm 譜區(qū)內(nèi)包含有脂肪、蛋白質(zhì)中含氫基團(tuán)(包括C—H、O—H、N—H 等)一級(jí)、二級(jí)倍頻及合頻吸收信息.由于牛奶中脂肪存在顆粒的不均勻性,使其對(duì)光具有很強(qiáng)的散射作用[9],本試驗(yàn)分別采用EMSC、SNV 和OSC 處理光譜數(shù)據(jù),其結(jié)果如圖2、圖3 和圖4 所示.
圖1 牛奶近紅外透射光譜圖
經(jīng)EMSC、SNV 和OSC 處理后,光譜形狀總體上與處理前的光譜沒(méi)有差別,EMSC、SNV 處理后的光譜離散程度均明顯降低,使光譜中富含有用信息的部分凸顯出來(lái),而OSC 法去除了與濃度陣Y正交的無(wú)用信息,這說(shuō)明EMSC、SNV 和OSC 法均能濾除牛奶光譜中的干擾信息(如噪聲、背景、散射干擾等),保留光譜中主要信息,以簡(jiǎn)化模型,提高模型的預(yù)測(cè)精度.
圖2 經(jīng)EMSC 處理后的牛奶近紅外透射光譜圖
圖3 經(jīng)SNV 處理后的牛奶近紅外透射光譜圖
圖4 經(jīng)OSC 處理后的牛奶近紅外透射光譜圖
背景標(biāo)準(zhǔn)液的確定沒(méi)有規(guī)律可循,只能根據(jù)分析結(jié)果進(jìn)行篩選.對(duì)于牛奶這樣的復(fù)雜樣品,通常選擇與樣品基體相似、濃度恒定的溶液作為背景標(biāo)準(zhǔn)液.本試驗(yàn)分別采用同一品牌的全脂牛奶、低脂牛奶、脫脂牛奶以及水作為背景,結(jié)合PLS 分析脂肪和蛋白質(zhì)含量,其結(jié)果見(jiàn)表2.
表2 不同背景標(biāo)準(zhǔn)液脂肪和蛋白質(zhì)分析結(jié)果
從表2 可以看出,水作為背景標(biāo)準(zhǔn)液時(shí),脂肪和蛋白質(zhì)的分析精度最佳,與無(wú)背景標(biāo)準(zhǔn)液模型相比,脂肪和蛋白質(zhì)的預(yù)測(cè)精度分別提高了13.3%和19.7%;而采用脫脂、低脂和全脂牛奶作為背景標(biāo)準(zhǔn)液時(shí),分析精度較差,經(jīng)處理后的牛奶樣品中脂肪球雖然變小,但對(duì)入射光仍有一定的散射.因此,本研究選用水作為背景標(biāo)準(zhǔn)液.
對(duì)光譜進(jìn)行WT 時(shí),需要人為選擇一些合適的參數(shù),其中母小波和分解水平是小波變換的主要參數(shù).本研究考察Haar 小波、Daubechies 小波系列(階數(shù)分別為2、4、6、8)、Coiflets 小波系列(階數(shù)分別為1、2、3、4)以及Symlets 小波系列(階數(shù)分別為2、4、6、8)對(duì)脂肪和蛋白質(zhì)含量分析結(jié)果的影響.結(jié)果表明:4 階的Daubechies 小波(db4)作為母小波,其分析精度最佳.分解水平的確定應(yīng)考慮到光譜數(shù)據(jù)的維數(shù),本研究選8 作為小波分解水平.
分別采用預(yù)處理(EMSC、SNV 和OSC)方法、扣標(biāo)準(zhǔn)液校正法以及WT 法對(duì)光譜進(jìn)行處理,結(jié)合PLS 分析脂肪和蛋白質(zhì)含量,結(jié)果見(jiàn)表3.結(jié)果表明,EMSC 和SNV 可強(qiáng)化有用信息,減弱無(wú)用信息的干擾(見(jiàn)圖2 和圖3),使模型的預(yù)測(cè)精度有了較大幅度提高,脂肪和蛋白質(zhì)的最佳預(yù)測(cè)精度分別為0.205 7%和0.202 3%;而OSC 法忽略不完全正交的無(wú)用信息,模型不但沒(méi)有得到改善,反而使模型的預(yù)測(cè)精度下降.WT 法將光譜分解為不同時(shí)頻的信號(hào),根據(jù)不同時(shí)頻的信號(hào)的屬性來(lái)消除無(wú)關(guān)信息的影響,與校正前相比脂肪和蛋白質(zhì)模型的預(yù)測(cè)精度分別提高了35.3%和32.6%.牛奶是一種復(fù)雜的多分散系統(tǒng),它既含有乳糖、鹽類等溶解態(tài)物質(zhì),又含有蛋白質(zhì)等膠體態(tài)物質(zhì),還含有脂肪這樣的懸浮態(tài)物質(zhì),因此對(duì)于如此復(fù)雜的分析體系,僅用一種校正方法往往不能得到最佳的結(jié)果,這時(shí)可將不同校正方法結(jié)合使用,以獲得預(yù)期的結(jié)果[10].
表3 不同干擾校正方法模型預(yù)測(cè)結(jié)果的比較
作者嘗試用預(yù)處理方法(EMSC、SNV)、扣標(biāo)準(zhǔn)液法和WT 法組合方法進(jìn)行校正,其結(jié)果見(jiàn)表4.
表4 不同校正組合方法預(yù)測(cè)結(jié)果的分析
從表4 可以看出,采用EMSC 和WT 組合校正方法,模型具有最佳的預(yù)測(cè)精度.與最佳單一方法(表3)相比,脂肪的預(yù)測(cè)精度提高了31.6%,蛋白質(zhì)的預(yù)測(cè)精度提高了30.0%,但不同組合方式的預(yù)測(cè)結(jié)果相差較大.因此,該方法還需進(jìn)一步完善才能在光譜預(yù)處理中得到更好的應(yīng)用.
近紅外光譜法作為一種依靠模型對(duì)物化性質(zhì)進(jìn)行分析的技術(shù),光譜數(shù)據(jù)的準(zhǔn)確性是得到可靠分析結(jié)果的前提.但是光譜中無(wú)關(guān)信息的存在會(huì)直接影響校正模型的準(zhǔn)確性,從而影響模型的預(yù)測(cè)效果.作者利用預(yù)處理法、扣標(biāo)準(zhǔn)液法和WT法,對(duì)測(cè)得的近紅外牛奶光譜進(jìn)行了無(wú)關(guān)信息的剔除.試驗(yàn)結(jié)果表明,干擾校正組合方法能有效消除無(wú)關(guān)信息的干擾,其效果遠(yuǎn)優(yōu)于單一干擾校正方法,并且該方法具有數(shù)值穩(wěn)定性好、校正效率高等特點(diǎn),非常適用于在線分析和其他復(fù)雜物質(zhì)檢測(cè)中無(wú)關(guān)信息的消除.
[1]Seasholtz M B,Kowalski B R.The parsimony principle applied to multivariate calibration[J].Anal Chim Acta,1993,277:165-177.
[2]Woo Y A,Terazawa Y,Chen J Y,et al.Development of a new measurement unit(milkspec-1)for rapid determination of fat,lactose,and protein in raw milk using near-infrared transmittance spectroscopy[J].Applied Spect-roscopy,2002,56(5):599-604.
[3]馬廣,傅霞萍,周瑩,等.大白桃糖度的近紅外漫反射光譜無(wú)損檢測(cè)試驗(yàn)研究[J].光譜學(xué)與光譜分析,2007,27(5):907-910.
[4]陳華才,呂進(jìn),俸春紅,等.近紅外光譜法測(cè)定茶多酚中總兒茶素含量[J].中國(guó)計(jì)量學(xué)院學(xué)報(bào),2005,16(1):17-20.
[5]Blanco M,Coello J,Montoliu I,et al.Orthogonal signal correction on near infrared calibration[J].Anal Chim Acta,2001,434:125-132.
[6]劉蓉,谷筱玉,徐可欣.近紅外光譜無(wú)創(chuàng)血糖測(cè)量中背景扣除方法的研究[J].光譜學(xué)與光譜分析,2008,28(8):1772-1775.
[7]Barclay V J,Bonner R F.Application of wavelet transforms to experimental spectra:smoothing,denoising,and data Set compression[J].Anal Chem,1997,69(1):78-90.
[8]田高友,袁洪福,劉慧穎.近紅外光譜的小波特性研究[J].光譜學(xué)與光譜分析,2006,26(8):1441-1444.
[9]彭丹,徐可欣.響應(yīng)量轉(zhuǎn)化近紅外檢測(cè)技術(shù)在強(qiáng)散射介質(zhì)中的應(yīng)用研究[J].光譜學(xué)與光譜分析,2010,30(2):318-322.
[10]褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長(zhǎng)選擇方法進(jìn)展與應(yīng)用[J].化學(xué)進(jìn)展,2004,16(4):528-542.