何佳艷,李亭,郭長(zhǎng)凱,胡蝶,鄒婷婷*,王瑩
1(北京工商大學(xué) 北京市食品風(fēng)味化學(xué)重點(diǎn)實(shí)驗(yàn)室/食品添加劑與配料北京高校工程研究中心,北京,100048)2(吉林省食品檢驗(yàn)所,吉林 長(zhǎng)春,130022)
近紅外光譜法快速無(wú)損測(cè)定奶粉的脂肪含量
何佳艷1,李亭1,郭長(zhǎng)凱1,胡蝶1,鄒婷婷1*,王瑩2
1(北京工商大學(xué) 北京市食品風(fēng)味化學(xué)重點(diǎn)實(shí)驗(yàn)室/食品添加劑與配料北京高校工程研究中心,北京,100048)2(吉林省食品檢驗(yàn)所,吉林 長(zhǎng)春,130022)
將11種奶粉原樣配制及組成77個(gè)奶粉樣本,以脂肪含量為檢測(cè)指標(biāo),結(jié)合偏最小二乘法開展近紅外光譜定量分析研究。2次異常光譜剔除,識(shí)別出異常樣本(14,52,76)并予以剔除。74個(gè)奶粉樣本進(jìn)行平滑、導(dǎo)數(shù)和標(biāo)準(zhǔn)變量變換等6種光譜預(yù)處理,確定標(biāo)準(zhǔn)正態(tài)變量變換結(jié)合Norris一階導(dǎo)為最佳光譜預(yù)處理方式,其交叉驗(yàn)證均方根誤差為0.354 7,交叉驗(yàn)證相關(guān)系數(shù)平方達(dá)到0.990 8;最佳前處理光譜結(jié)合3種波段選擇方法優(yōu)化模型性能,與全光譜模型形成對(duì)比,確定隨機(jī)蛙跳(random frog,RF)為最佳波段選擇方式,其模型的訓(xùn)練集和測(cè)試集相關(guān)系數(shù)平方分別為0.997 2和0.997 0,訓(xùn)練集和測(cè)試集均方根誤差分別為0.186 2和0.198 2。結(jié)果表明:采用蒙特卡羅異常光譜剔除(Monte-Carlo sampling,MCS),光譜預(yù)處理結(jié)合隨機(jī)蛙跳波段優(yōu)化技術(shù)可提高奶粉脂肪近紅外定量模型的泛化性和預(yù)測(cè)能力。
近紅外光譜技術(shù);無(wú)損檢測(cè);脂肪;蒙特卡羅異常光譜剔除(Monte-Carlo sampling,MCS);隨機(jī)蛙跳(random frog,RF)
奶粉營(yíng)養(yǎng)豐富,包含人體所需的蛋白質(zhì)(氨基酸)、脂肪酸、碳水化合物和維生素等營(yíng)養(yǎng)物質(zhì),而且易被人體消化和吸收,奶粉還可長(zhǎng)期貯藏、攜帶便利,備受大眾青睞。脂肪是奶粉中重要的營(yíng)養(yǎng)成分,也是直接反映奶粉質(zhì)量的重要指標(biāo),測(cè)定奶粉中脂肪含量是保證奶粉質(zhì)量的重要內(nèi)容。近幾年來(lái),頻頻曝光的乳制品質(zhì)量問題,使得廣大消費(fèi)者對(duì)乳制品安全憂心忡忡。所以,高效快速地檢測(cè)乳制品品質(zhì),控制乳制品質(zhì)量是解決問題的關(guān)鍵。目前,奶粉脂肪含量測(cè)定的常規(guī)方法多為化學(xué)檢測(cè)技術(shù),此類方法雖然精度高,但耗時(shí)費(fèi)力,操作過(guò)程相對(duì)復(fù)雜,而且會(huì)對(duì)樣品造成破壞。與化學(xué)分析方法相比,近紅外光譜技術(shù)具有快速無(wú)損分析、無(wú)污染綠色環(huán)保等特點(diǎn),在食品領(lǐng)域得到廣泛應(yīng)用[1-7],其中也應(yīng)用于乳制品領(lǐng)域的研究[8-11],包括乳制品中營(yíng)養(yǎng)成分檢測(cè)的研究,例如脂肪酸及多不飽和脂肪酸含量[12-15]、蛋白質(zhì)和脂肪含量等研究[16-19]。
近紅外光譜法(near infrared spectroscopy,NIR)是指波數(shù)在12 800~4 000cm-1的電磁波,對(duì)物質(zhì)分子中C—H,N—H,O—H等含氫基團(tuán)的倍頻和合頻吸收。長(zhǎng)波近紅外光譜采集波數(shù)范圍10 000~4 000 cm-1的樣品光譜,所得譜圖包含豐富的樣品信息和噪音信號(hào)(如儀器噪音、環(huán)境干擾等),譜圖復(fù)雜,重疊嚴(yán)重,通常將結(jié)合化學(xué)計(jì)量學(xué)提取樣本特征信息,并可采取異常值剔除、光譜預(yù)處理等方法進(jìn)行模型優(yōu)化。全光譜數(shù)據(jù)通常包含幾千個(gè)變量進(jìn)行PLS模型構(gòu)建,其數(shù)據(jù)量大,即包含所有相關(guān)和無(wú)關(guān)數(shù)據(jù)信息,相對(duì)耗時(shí)長(zhǎng),其模型準(zhǔn)確性受無(wú)關(guān)信息變量影響。有效波段的選擇[20-25],能簡(jiǎn)化建模數(shù)據(jù),提取關(guān)鍵特征波段信息,改善預(yù)測(cè)性能。波數(shù)篩選方法包括蒙特卡羅無(wú)信息變量消除(Monte Carlo uninformative variable elimination,MC-UVE),隨機(jī)蛙跳(random frog)和競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣(competitive adaptive reweighted sampling,CARS)算法等。
本文結(jié)合近紅外光譜和偏最小二乘法檢測(cè)奶粉中脂肪含量,首先采用蒙特卡洛奇異光譜剔除,然后,進(jìn)行平滑、導(dǎo)數(shù)等光譜前處理,最后對(duì)最優(yōu)光譜進(jìn)行波段篩選,壓縮建模數(shù)據(jù)量,從而實(shí)現(xiàn)快速分析,并且提高模型的穩(wěn)健性和預(yù)測(cè)能力。
不同品牌不同種類不同批次的奶粉原樣共11個(gè)樣品,購(gòu)于大型超市,奶粉原樣脂肪測(cè)定值見表1。脂肪含量以中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB 5413.3—2010測(cè)定值為參考值。
表1 不同品牌奶粉脂肪含量表Table 1 Fat content of different brands of milk powder
將11個(gè)奶粉原樣以不同比例混合制成66個(gè)樣品,包括奶粉原樣總計(jì)得到77個(gè)樣本,樣本濃度為16.70~28.46 g/100g,平均值為21.84 g/100g。
尼高力6700傅立葉紅外光譜儀(配有積分球、光纖漫反射探頭、樣品杯等附件及OMNIC和TQ Analyst軟件)賽默飛世爾科技公司。光譜數(shù)據(jù)處理采用Matlab-R2010軟件和libPLS代碼包,libPLS代碼由公共平臺(tái)下載:http://www.libpls.net/.
近紅外光譜儀開機(jī)并預(yù)熱穩(wěn)定1 h,保持實(shí)驗(yàn)室的溫度和濕度穩(wěn)定,溫度一般控制在25 ℃;采用漫反射光譜法,將樣品置于樣品杯:設(shè)置光譜儀測(cè)定參數(shù):光源為白光,光柵為12,波數(shù)范圍10 000~4 000 cm-1,分束器CaF2,采集次數(shù)為64次,分辨率8 cm-1。取平均值作為該樣本的原始光譜。圖1-a為77個(gè)樣本的近紅外原始光譜圖,沒有基線分離和銳峰的譜峰,每個(gè)近紅外譜圖都是若干個(gè)不同基頻的合頻和倍頻譜帶的組合,大量的是重疊譜峰和肩峰。最終從近紅外光譜譜圖提取的是弱信息,需進(jìn)行光譜預(yù)處理和波段篩選并結(jié)合化學(xué)計(jì)量學(xué)方法。
圖1 77個(gè)奶粉樣品的近紅外漫反射光譜圖(a)和74個(gè)經(jīng)Norris一階導(dǎo)前處理的奶粉樣品光譜圖(b)Fig.1 The raw spectra of 77 milk powder samples (a) and preprocessed spectra using Norris+1st derivative of 74 milk powder samples (b)
構(gòu)造穩(wěn)健的奶粉脂肪含量模型,依賴于精準(zhǔn)的光譜數(shù)據(jù)。首先,最重要的是光譜數(shù)據(jù)中奇異樣本的剔除。校正模型建立時(shí),異常樣本的存在嚴(yán)重影響模型的預(yù)測(cè)精度。所謂的異常樣本是指樣本光譜或濃度標(biāo)準(zhǔn)值具有較大誤差的樣本。剔除異常樣本能有效提高模型的穩(wěn)健性、范化和預(yù)測(cè)能力,所以,剔除異常值是近紅外光譜法定量分析過(guò)程中模型建立的重要環(huán)節(jié)。常用的異常值剔除方法有:濃度殘差剔除、馬氏距離(mahalanobis distance,MD)、蒙特卡洛采樣算法(Monte-Carlo sampling,MCS)、杠桿值法(leverage)等。其中,MCS算法是一種基于預(yù)測(cè)殘差的異常樣本識(shí)別方法,通過(guò)預(yù)測(cè)殘差對(duì)異常樣本的敏感特性,降低異常樣本的掩蔽效應(yīng)。文中根據(jù)樣品的預(yù)測(cè)殘差分布圖進(jìn)行異常樣本的剔除。通常,MCS算法將異常樣本分為三類:第一,Y軸方向上的獨(dú)立變量點(diǎn),遠(yuǎn)離正常的Y軸上的點(diǎn)分布,造成較大的誤差平方和;第二、X軸方向上的獨(dú)立變量點(diǎn),遠(yuǎn)離X軸上正常點(diǎn)的分布;第三、同時(shí)遠(yuǎn)離X和Y軸方向的異常點(diǎn)。
采用蒙特卡洛采樣(Monte-Carlo sampling,MCS)診斷奇異樣本,通過(guò)各樣本標(biāo)準(zhǔn)偏差和預(yù)測(cè)誤差平均值對(duì)近紅外光譜數(shù)據(jù)進(jìn)行異常值檢驗(yàn),位于高均值或高標(biāo)準(zhǔn)偏差的樣本最有可能是奇異樣本。文中共隨機(jī)采樣1 000次,各樣本均得到一組預(yù)測(cè)殘差,計(jì)算各樣本預(yù)測(cè)殘差的均值和方差,繪制均值-方差分布圖,如圖2所示。
a:一次MCS;b:二次MCS圖2 樣本均值-方差分布圖Fig.2 The result of variance of residuals versus mean of residuals on milk powder
圖2-a顯示,1個(gè)樣本光譜(76)被判斷為異常值,屬于第三類異常值,同時(shí)遠(yuǎn)離X軸和Y軸正常分布點(diǎn),具有較大的預(yù)測(cè)誤差均值和方差。為進(jìn)一步剔除潛在異常值,進(jìn)行了二次異常樣本剔除,結(jié)果表明,一次異常樣本的剔除并未剔除所有的異常值,如圖2-b所示,其中包含了兩類異常值,樣本52屬于遠(yuǎn)離Y軸正常分布點(diǎn)的異常樣本,樣本14屬于遠(yuǎn)離X軸正常分布點(diǎn)的樣本,都應(yīng)予以剔除。因此,經(jīng)2次異常樣本剔除,共剔除3個(gè)異常值,將采用74個(gè)樣本進(jìn)行以下的分析。
74個(gè)樣本隨機(jī)分成2組,一組為訓(xùn)練集(training set,50個(gè)),另一組為測(cè)試集(test set,24個(gè)),保證2組樣品濃度均勻。訓(xùn)練集和測(cè)試集樣本濃度分布情況見表2,訓(xùn)練集濃度范圍16.70~28.46 g/100g,平均值為21.78 g/100g,測(cè)試集濃度范圍16.90~28.46 g/100g,平均值為21.99 g/100g。
表2 訓(xùn)練集和測(cè)試集奶粉脂肪含量分布表 單位:g/100gTable 2 Fat content of training set and test set
除了有用的光譜信息,光譜還包含一些噪音信息,如樣本本身,儀器、環(huán)境等造成的基線漂移,光散射等干擾信息。為了建立可靠的光譜模型,通常進(jìn)行光譜前處理進(jìn)行干擾信息的削弱和有用信息的篩選。文中共采用6種光譜前處理方法,主要是平滑和導(dǎo)數(shù)處理。其中,平滑是最常用的降噪方法,其實(shí)質(zhì)是一種加權(quán)平均法,強(qiáng)調(diào)中心點(diǎn)的中心作用,常用的有Savitzky-Golay平滑(S-G平滑)和Norris平滑。Savitzky-Golay卷積平滑可以降低譜圖的數(shù)據(jù)分辨率,并平滑掉小的譜峰。Norris平滑常用于增加被寬譜帶覆蓋的尖峰。導(dǎo)數(shù)光譜可有效地消除基線和其他背景的干擾,分辨重疊峰,提高分辨率和靈敏度,常用的有光譜的一階導(dǎo)數(shù)(FD)和二階導(dǎo)數(shù)(SD)。
訓(xùn)練集50個(gè)奶粉樣品的原始光譜,不同的光譜前處理方法結(jié)果如表3所示,其中,標(biāo)準(zhǔn)正態(tài)變量變換結(jié)合Norris一階導(dǎo)(SNV+N+FD)是最佳的預(yù)處理方式,模型相關(guān)系數(shù)平方達(dá)到了0.9908,交叉驗(yàn)證均方根誤差為0.3547,最佳主成分?jǐn)?shù)為6,模型泛化能力較強(qiáng)。圖1-b是Norris一階導(dǎo)光譜圖,顯然強(qiáng)化了特征峰,特征峰主要集中于波數(shù)為4 400 cm-1和5 800 cm-1附近。
表3 近紅外光譜預(yù)處理結(jié)果Table 3 The results of different data preprocessing
注:(1) FD、SD:一階、二階導(dǎo)數(shù);(2) SNV:標(biāo)準(zhǔn)正態(tài)變量變換;(3)SG、N:Savitzky-Golay卷積平滑、Norris平滑。
蒙特卡羅無(wú)信息變量消除將蒙特卡羅過(guò)程和無(wú)信息變量消除相結(jié)合,充分利用樣本之間的內(nèi)部相關(guān)性,對(duì)高維光譜數(shù)據(jù)中波長(zhǎng)變量的貢獻(xiàn)進(jìn)行評(píng)價(jià),根據(jù)每個(gè)波長(zhǎng)的貢獻(xiàn)值設(shè)定一閾值,消除其中無(wú)信息的波長(zhǎng)。CARS算法根據(jù)達(dá)爾文的“適者生存”原則,經(jīng)多次自適應(yīng)加權(quán)采樣技術(shù)(ARS)篩選出模型中回歸系數(shù)絕對(duì)值大的波長(zhǎng)點(diǎn),去除權(quán)重小的波長(zhǎng)點(diǎn),最后通過(guò)交叉驗(yàn)證(CV)選出交叉驗(yàn)證均方差值最低的子集。隨機(jī)蛙跳算法基于利用少數(shù)變量多次迭代高維數(shù)據(jù),計(jì)算每個(gè)變量的選擇頻率,決定該變量的重要性,有效建立預(yù)測(cè)模型。與全光譜數(shù)據(jù)建模相比,具有以下特點(diǎn):(1)改善了預(yù)測(cè)性能;(2)減少了建模波數(shù)變量數(shù);(3)突出變量與濃度相關(guān)性大的變量。結(jié)果如表4和圖3所示。
表4 不同變量篩選方法的模型參數(shù)比較Table 4 Comparison of parameters with different variable selection method
圖3 不同波長(zhǎng)選擇方法選擇的變量分布圖Fig.3 The distribution of the selected variables obtained variables using different wavelength selection methods
如表4所示,MC-UVE算法從全光譜3 112個(gè)建模變量中提取57個(gè)關(guān)鍵變量用于建模,訓(xùn)練集交叉驗(yàn)證均方根誤差和交叉驗(yàn)證相關(guān)系數(shù)平方分別為0.371 9和0.989 8,校正模型校正均方根誤差和校正相關(guān)系數(shù)平方分別為0.286 9和0.993 2。CARS算法從全光譜3 112個(gè)建模變量中提取233個(gè)關(guān)鍵變量用于建模,訓(xùn)練集交叉驗(yàn)證均方根誤差和交叉驗(yàn)證相關(guān)系數(shù)平方分別為0.229 0和0.996 1,校正模型校正均方根誤差和校正相關(guān)系數(shù)平方分別為0.069 1和0.999 6。如圖3所示,雖然CARS算法選取的波數(shù)點(diǎn)較多,但其獨(dú)立選點(diǎn)的特點(diǎn)使結(jié)果優(yōu)于UVE算法的連續(xù)選點(diǎn)。如表4所示,RF算法僅使用10個(gè)變量建模,訓(xùn)練集交叉驗(yàn)證均方根誤差和交叉驗(yàn)證相關(guān)系數(shù)平方分別為0.213 1和0.996 7,校正模型校正均方根誤差和校正相關(guān)系數(shù)平方分別為0.186 2和0.997 2。如圖3所示,雖然RF算法選取的波數(shù)點(diǎn)較少,但其結(jié)果最佳,表明其選取了最佳的波數(shù)點(diǎn)進(jìn)行建模。綜上所述,與MC-UVE和CARS算法相比, RF算法使建模變量數(shù)顯著較少,剔除了高維變量中的無(wú)關(guān)信息變量,優(yōu)化了建模過(guò)程,簡(jiǎn)化了模型。
測(cè)試集作為未知樣品對(duì)校正模型性能的驗(yàn)證是近紅外光譜模型泛化性評(píng)估的必備步驟。圖4-a是最佳光譜前處理全光譜(SNV+Norris一階導(dǎo)+3 112個(gè)波數(shù)點(diǎn))的校正集和測(cè)試集模型參考值和預(yù)測(cè)值相關(guān)性圖,圖4-b是最佳光譜前處理結(jié)合最佳波段選擇(SNV+Norris一階導(dǎo)+RF算法)的校正集和測(cè)試集模型參考值和預(yù)測(cè)值相關(guān)性圖。顯而易見,RF算法使模型的預(yù)測(cè)精度更高。
a:全光譜模型;b:采用隨機(jī)蛙跳選擇10個(gè)波數(shù)點(diǎn)圖4 脂肪含量參考值與預(yù)測(cè)值關(guān)系圖Fig.4 The correlation between the predicted values and measured values
本文將快速高效、綠色無(wú)損的近紅外光譜技術(shù)結(jié)合偏最小二乘法測(cè)定奶粉中的脂肪含量,研究結(jié)果表明,蒙特卡羅異常光譜剔除、光譜預(yù)處理結(jié)合隨機(jī)蛙跳波段優(yōu)化技術(shù)后,最終模型結(jié)果具有最高的交叉驗(yàn)證相關(guān)系數(shù)和最低的交叉驗(yàn)證均方根誤差,建模數(shù)據(jù)量大大減少,克服了高維數(shù)據(jù)空間的繁瑣,模型性能得到優(yōu)化,模型更加可靠穩(wěn)健。
[1] 陳辰,魯曉翔,張鵬,等. 玫瑰香葡萄貯藏期間糖酸品質(zhì)的近紅外檢測(cè)[J]. 食品與發(fā)酵工業(yè), 2015, 41(6):175-180.
[2] 鄒婷婷,何佳艷,齊慶璇,等. 采用正交投影偏最小二乘法快速無(wú)損分析乳粉蛋白質(zhì)含量[J]. 食品與發(fā)酵工業(yè), 2016, 42(4):179-182.
[3] 馮敘橋,匡立學(xué),宮元娟,等. 近紅外無(wú)損檢測(cè)寒富蘋果可溶性固形物含量(TSS)[J]. 食品與發(fā)酵工業(yè), 2013, 39(4):200-204.
[4] 王雁飛. 近紅外漫反射光譜法快速定量分析八角茴香中八角茴香油[D]. 長(zhǎng)春:吉林大學(xué), 2010.
[5] 孫通, 江水泉. 基于可見/近紅外光譜和變量?jī)?yōu)選的南水梨糖度在線檢測(cè)[J]. 食品與機(jī)械, 2016, 32(3):69-72.
[6] YUN Yong-huan, WEI Yang-chao, ZHAO Xing-bin, et al. A green method for the quantification of polysaccharides in Dendrobium officinale[J]. Rsc Advances, 2015, 5(127):105 057-105 065.
[7] YANG Mei-yan, NIE Shao-ping, LI Jing, et al. Near-infrared spectroscopy and partial least-squares regression for determination of arachidonic acid in powdered oil[J]. Lipids, 2010, 45(6):559-565.
[8] 褚瑩. 基于近紅外光譜技術(shù)實(shí)現(xiàn)羊奶新鮮度檢測(cè)及摻假檢測(cè)的研究[D]. 楊凌:西北農(nóng)林科技大學(xué), 2012.
[9] MELFSEN A, HARTUNG E, HAEUSSERMANN A. Accuracy of milk composition analysis with near infrared spectroscopy in diffuse reflection mode[J]. Biosystems Engineering, 2012, 112(3):210-217.
[10] INGLE P D, CHRISTIAN R, PUROHIT P, et al. Determination of protein content by NIR spectroscopy in protein powder mix products.[J]. Journal of Aoac International, 2016, 99(2):360-363.
[11] MADALOZZO E S, SAUER E, NAGATA N. Determination of fat, protein and moisture in ricotta cheese by near infrared spectroscopy and multivariate calibration.[J]. Journal of Food Science and Technology, 2015, 52(3):1 649-1 655.
[12] 穆同娜, 莊勝利, 趙玉琪,等. 近紅外光譜法快速檢測(cè)嬰兒配方奶粉中的脂肪酸含量[J]. 現(xiàn)代食品科技, 2015, 31(4):278-281.
[13] 莊勝利, 孫繼紅, 穆同娜,等. 應(yīng)用近紅外光譜結(jié)合偏最小二乘法快速測(cè)定乳粉中多不飽和脂肪酸的含量[J]. 食品科技, 2014, 39(6):267-271.
[14] WANG Yan-wen, WU Ding, KOU Li-ping, et al. A Non-destructive method to assess freshness of raw bovine milk using FT-NIR spectroscopy[J]. Journal of Food Science and Technology, 2015, 52(8):1-6.
[16] 張華秀,李曉寧,范偉,等. 近紅外光譜結(jié)合CARS變量篩選方法用于液態(tài)奶中蛋白質(zhì)與脂肪含量的測(cè)定[J]. 分析測(cè)試學(xué)報(bào),2010, 29(5):430-434.
[17] 朱向榮, 單楊, 李高陽(yáng),等. 近紅外光譜法快速測(cè)定液態(tài)奶中蛋白質(zhì)和脂肪含量[J]. 食品科學(xué), 2011, 32(12):191-195.
[18] 匡靜云, 管驍, 劉靜. 原料乳中蛋白質(zhì)與脂肪的近紅外光譜快速定量研究[J]. 分析科學(xué)學(xué)報(bào), 2015, 31(6):783-786.
[19] 張華秀. 近紅外光譜法快速檢測(cè)牛奶中蛋白質(zhì)與脂肪含量[D]. 長(zhǎng)沙:中南大學(xué), 2010.
[20] 劉智超, 蔡文生, 邵學(xué)廣. 蒙特卡洛交叉驗(yàn)證用于近紅外光譜奇異樣本的識(shí)別[J]. 中國(guó)科學(xué):化學(xué), 2008, 38(4):316-323.
[21] BIN Jun, AI Fang-fang, FAN Wei, et al. An efficient variable selection method based on variable permutation and model population analysis for multivariate calibration of NIR spectra[J]. Chemometrics& Intelligent Laboratory Systems, 2016, 158(15):1-13.
[22] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1):77-84.
[23] WU Di, PENG Cheng-nie, He Yong, et al. Determination of calcium content in powdered milk using near and mid-infrared spectroscopy with variable selection and chemometrics[J]. Food and Bioprocess Technology, 2012, 5(4):1 402-1 410.
[24] 陳立旦, 趙艷茹. 可見-近紅外光譜聯(lián)合隨機(jī)蛙跳算法檢測(cè)生物柴油含水量[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(8):168-173.
[25] YUN Yong-huan, LI Hong-dong, WOOD L R, et al. An efficient method of wavelength interval selection based on random frog for multivariate spectral calibration[J]. SpectrochimicaActa Part A Molecular &Biomolecular Spectroscopy, 2013, 111(7):31-36.
Rapidnondestructivedeterminationofmilkpowerfatcontentbynear-infraredspectroscopy(NIR)
HE Jia-yan1,LI Ting1,GUO Chang-kai1,HU Die1,ZOU Ting-ting1*,WANG Ying2
1(Beijing Key Laboratory of Flavor Chemistry/Beijing Higher Institution Engineering Research Center of Food Additives and Ingredients,Beijing Technology and Business University, Beijing 100048,China)2(Jilin Institute For Food Control,Changchun 130022,China)
Eleven milk powers were diluted into 77 samples. Choosing fat content as the index, the near-infrared spectrum quantitative analysis combined with the partial least squares method were used. Abnormal samples (14, 52 and 76) shall be recognized and removed through twice abnormal spectrum removals. Seventy four milk power samples were studied by six spectrum pretreatments such as smoothing, derivative and standard variable transformation. The best pretreatment method was the standard normal variable transformation combined with Norris first order derivative, which root-mean-square error of cross validation was 0.354 7 and correlation coefficient square of cross validation reached 0.990 8. The established model performance improved by optimal pretreatment spectrum with three band selections. Random Frog (RF) was the optimal band selection method after comparing with the full-spectrum model, which correlation coefficient square of training set and test set were 0.997 2 and 0.997 0 respectively. The root-mean-square of training set and test set were 0.186 2 and 0.198 2 respectively. The result is that Monte-Carlo sampling (MCS), spectrum pretreatment and band optimization technology can improve the generalization and prediction in milk power fat dectection near-infrared quantitative model.
near-infrared spectroscopy; non-destructive testing; fat; Monte-Carlo sampling(MCS) outlier detection; random frog(RF)
10.13995/j.cnki.11-1802/ts.013921
碩士研究生(鄒婷婷為通訊作者,E-mail:zou2010@aliyun.com)。
2017-01-23,改回日期:2017-05-08