李尚科 杜國榮,3 丁勝華 單 楊蔣立文 劉 霞 李 跑,
(1. 湖南農(nóng)業(yè)大學食品科學與技術學院食品科學與生物技術湖南省重點實驗室,湖南 長沙 410128;2. 湖南省農(nóng)業(yè)科學院 湖南省農(nóng)產(chǎn)品加工研究所,湖南 長沙 410125;3. 上海煙草集團有限責任公司技術中心北京工作站,北京 101121)
燕麥(Oats),禾本科植物,燕麥屬[1]。燕麥富含蛋白質(zhì)、淀粉、維生素等營養(yǎng)物質(zhì),其中麩皮中蛋白質(zhì)的含量更是高于一般谷物類[2-3]。燕麥所含的營養(yǎng)成分對人體有著積極作用,可以降血糖、降血脂、抗氧化、提高人體免疫力、降低心血管疾病的風險[4]。由于生活節(jié)奏的加快,燕麥片這類易于烹飪的食品越來越受民眾歡迎,但也隨之出現(xiàn)了一些不法廠商以次充好,以國內(nèi)品牌假冒進口品牌,嚴重損害了消費群體的利益。國內(nèi)外對于燕麥的研究分析方法常為感官評價法[5]和高效液相色譜法[6]、氣相色譜法[7]等化學方法。然而,感官評價法易受到主觀上以及外界客觀因素的影響;化學方法雖然相較于感官評價法精確度更高,但同樣對待檢測的樣品有所損耗,同時耗費的人力物力也較大。 因此,研究和開發(fā)檢測燕麥的新方法的重要性是不言而喻的。
近紅外光譜技術是電磁波技術,主要介于中紅外光譜區(qū)和可見光譜區(qū)之間。近紅外光譜技術擁有成本較低、效率高、檢測簡易、重現(xiàn)性優(yōu)等特點,已然發(fā)展成為一種新型的研究與分析手段[8],在食品領域主要應用于食品溯源[9-10]、品種分析[11-15]、構(gòu)成成分檢測[16-19]等方面。國內(nèi)外應用近紅外技術對燕麥的相關研究中,趙秀芳等[20]基于近紅外漫反射光譜對不同生長周期及相應品種燕麥稻桿的纖維含量進行了檢測。得出多元散射校正+二階導數(shù)+平滑處理3種預處理方法的結(jié)合使預測結(jié)果達到最優(yōu)值的結(jié)論。陰佳鴻等[21]測試了不同含水量的燕麥種子。 結(jié)果顯示,采用多元散射校正預處理方法,所建的近紅外定量模型最佳,對預測集和校準集樣本的鑒別率可以達到100%。Albanell等[22]通過近紅外光譜技術來測定燕麥無麩質(zhì)面粉及面團含有的谷蛋白含量。結(jié)果表明,在決定系數(shù)分別為985%和7%時,燕麥無麩質(zhì)面粉和面團中的谷蛋白含量的定量模型達到最優(yōu)。然而,在關于不同品牌、劣質(zhì)燕麥的鑒別等研究基本沒有。
在近紅外光譜中明顯的基線漂移和光譜信息重疊的主要原因是樣品的固有特性,光散射,雜散光和儀器本身的響應。 因此,原始光譜的預處理是有效的[23]。連續(xù)小波變換(Continuous wavelet transform, CWT)可以對數(shù)據(jù)進行壓縮、平滑降噪、減少基線漂移和識別重疊信號[24-26]。另外,冗余波長是近紅外模型不穩(wěn)定的主要原因[27]。 波長篩選可以很好消除此影響。本研究前期[28]提出了一種基于標準偏差(Standard deviation, SD)與相對標準偏差(Relative standard deviation, RSD)的變量篩選方法,通過結(jié)合近紅外光譜,有效實現(xiàn)了不同廠家藥品阿奇霉素的快速鑒別。因此,本試驗擬基于CWT技術與變量篩選方法對5種國內(nèi)外品牌燕麥和劣質(zhì)燕麥的近紅外光譜進行處理,實現(xiàn)了對不同品牌以及劣質(zhì)燕麥的有效鑒別分析。
2種國產(chǎn)燕麥產(chǎn)品:分別是產(chǎn)自山西省山陰縣的A燕麥品牌、產(chǎn)自內(nèi)蒙古的B燕麥品牌,每個品牌收集了3個不同批次,對同一批次的燕麥再細分為5個樣品,共30個樣品;
3種進口燕麥產(chǎn)品(C品牌、D品牌和E品牌):不同批次各買3種,依舊對同一批次燕麥分為5個樣品,共45個樣品,最后在購得未經(jīng)加工過的燕麥記為F劣質(zhì)燕麥[29]。
近紅外光譜儀:QuasIR 4000型,美國Galaxy Scientific公司;
MATLAB:R2010b型,美國Natick公司;
電子天平:AB104-N型,上海第二天平儀器廠。
在波數(shù)范圍為12 000~4 000 cm-1間,最小間隔約為4 cm-1,采用積分球漫反射模式采集全部光譜,共采集2 098 個數(shù)據(jù)點。同一樣品測量3次,采集3條平行光譜,取平均值作為該樣本的原始光譜。
利用CWT消除背景噪聲的干擾,并選用了“Haar”小波基,尺度參數(shù)為25。此外,在平均值≥1%的波長基礎上,選取SD≥5‰與RSD較大的波長點作為特征波數(shù)。最后運用主成分分析法(Principal compoent analysis, PCA)用于聚類分析。因此,對6類燕麥樣品進行聚類分析采用PCA方法。
由圖1可知,譜線大致趨勢一致,大部分譜線重合,具有相似的吸收峰。同時,發(fā)現(xiàn)6種不同燕麥樣品在一定波數(shù)范圍內(nèi)有差異,11 200~10 800,10 400~9 800,8 600~7 800,7 200~6 400,6 000~5 400,5 300~5 000,4 950~4 500,4 500~4 200 cm-1分別屬于CH的第3倍頻和OH的第2倍頻、NH的第2倍頻、CH第2倍頻、NH的第2倍頻和OH的第1倍頻、CH的第1倍頻、CO的第2倍頻和OH的組合頻和NH的第1倍頻、NH和OH的組合頻、CH+CH的組合頻。然而光譜仍存在明顯的背景干擾和基線漂移。因此無法確定燕麥樣品中所存在的差異是由哪一具體物質(zhì)引起的。
圖1 6類燕麥原始光譜圖Figure 1 Original spectra of six varieties of oat samples
為了區(qū)分不同品牌的燕麥以及劣質(zhì)燕麥,采用PCA方法對原始光譜數(shù)據(jù)進行聚類分析。由于前2個主成分(PC1和PC2)的方差貢獻率之和在90%以上,故選取PC1和PC2進行PCA分析。圖2代表了不同品牌燕麥和劣質(zhì)燕麥直接測量的聚類分析結(jié)果,由圖2可知,E跟F和A組分被有效地分隔開來,D與F也未重疊,然而其他組分均有一定程度的重疊,可能是背景干擾和基線漂移導致的。因此,僅使用原始光譜進行聚類分析無法實現(xiàn)對不同品牌燕麥以及劣質(zhì)燕麥的準確鑒別分析。
圖2 6類燕麥原始光譜的PCA圖Figure 2 PCA result of the six varieties of oat original Spectra
為了消除其他因素對數(shù)據(jù)信息的影響,采取了CWT的預處理方法來消除背景干擾和基線漂移。圖3為CWT處理后的光譜。與圖1相比較可知,經(jīng)CWT處理后變動的背景被有效地消除,有效信息被成功提取出來??芍珻WT預處理確實具有除去背景干擾和減少基線漂移的功能。
圖3 連續(xù)小波變換處理后的光譜Figure 3 Spectra after CWT
由圖3可知,通過CWT預處理后,光譜的特征譜峰增多且突出,復雜信號信息被解析出來。較高吸收峰在11 100 cm-1左右,對應為蛋白質(zhì)和CH3伸縮振動吸收波段;10 400 cm-1左右存在波峰峰值較低,出現(xiàn)吸收峰對應為ROH和H2O伸縮振動吸收波段;在8 000~8 700 cm-1波段中出現(xiàn)了連續(xù)的小波峰,存在2個峰值對應為CH、CH2、CH3、HC═CH等官能團的伸縮振動吸收波段;在7 100 cm-1左右同樣存在較高的峰值,該處峰值表明了ROH的第2倍頻伸縮振動和CH2官能團伸縮振動和變形振動的存在;在5 900 cm-1處也出現(xiàn)了較明顯的吸收峰,且該吸收峰范圍內(nèi)近紅外光譜譜線存在一定程度的差異,而該處對應的官能團為CH3第2倍頻伸縮振動吸收波段,說明了在5 900 cm-1左右含有碳氫官能團的物質(zhì)存在差異,可能原因在于碳水化合物、蛋白質(zhì)、脂質(zhì)類物質(zhì)含量和種類存在差異導致的。
4 500~5 400 cm-1范圍中存在連續(xù)的強吸收峰,5 300 cm-1左右的峰值對應為淀粉的信息。圖3中看出,5 050 cm-1左右同樣含有含量較高的反向吸收峰,對應為蛋白質(zhì)信息,而4 600~5 050 cm-1波段中出現(xiàn)明顯的不重合,在4 900 cm-1處的波峰存在較大的差異,該處對應為蛋白質(zhì)的吸收波段,推測是該處的蛋白質(zhì)含量或種類存在較明顯差異導致;在4 700 cm-1左右同樣存在反向波峰,與之對應的結(jié)構(gòu)為氨基酸的信息,且在4 700 cm-1處近紅外光譜譜線存在十分明顯的差異,推測是可能是該處氨基酸種類以及含量差異導致;在4 500 cm-1左右存在HC═CH的官能團吸收峰;而在4 300 cm-1存在1個明顯的差異較大的反向連續(xù)小波峰,對應了CH2官能團的伸縮和變形振動,在4 100 cm-1左右處還存在1個吸收波峰,對應為淀粉的吸收波段。結(jié)合圖1與圖3可以發(fā)現(xiàn),燕麥的主要吸收峰位于蛋白質(zhì)、氨基酸、淀粉和含有CH以及OH官能團物質(zhì)處,主要差異是由蛋白質(zhì)及氨基酸含量跟種類差異所導致。
為進一步提高聚類分析的結(jié)果,將經(jīng)過CWT處理過的光譜進行PCA分析得到圖4。由圖4可知,CWT預處理后的結(jié)果優(yōu)于圖2中不經(jīng)過預處理的。劣質(zhì)燕麥與品牌燕麥被完全有效地鑒別開來,并且差異還十分顯著。因此可以推斷出劣質(zhì)燕麥與品牌燕麥在成分構(gòu)成上存在較大的差異。而經(jīng)過CWT處理后其他品牌未獲得良好的鑒別結(jié)果。結(jié)果表明:在使用CWT處理變動的背景被有效地消除后,可以使劣質(zhì)燕麥與品牌燕麥完全鑒別開來,然而國產(chǎn)品牌與進口品牌的燕麥仍無法實現(xiàn)較好地鑒別。
通過篩選出光譜的特征波長可以極大增加模型的穩(wěn)健性。一般認為SD≤5‰是由人為誤差引起的波動,所以在平均值≥1%的波長基礎上,剔除那些SD≤5‰的波長,對全部波數(shù)進行了一次初篩,有效波數(shù)范圍縮小到6 500~4 000 cm-1。
圖4 小波變換處理后的PCA圖Figure 4 PCA result after CWT
圖5 小波變換處理后的RSD圖Figure 5 RSD result after CWT
由圖5可知,RSD值均≤0.5,且15個點數(shù)落在4 600~4 750,5 050~5 150,5 300~5 400 cm-1附近。結(jié)合圖3可知,4 600~4 750 cm-1對應的波長處為氨基酸的信息;在5 050~5 150 cm-1處對應的為CONH、蛋白質(zhì)信息;5 300~5 400 cm-1對應為淀粉信息。由此可推測出不同燕麥品牌間的差異可能源于蛋白質(zhì)、氨基酸、淀粉含量和種類的不同。
從圖4可知,通過CWT預處理后可以很好地鑒別劣質(zhì)燕麥與品牌燕麥,而中國燕麥與進口燕麥仍無法準確鑒別。首先剔除SD≤5‰的波數(shù)點,在此類波長點下的波動究其原因應該是因為之前重復試驗中操作的誤差引起的,然后再挑選RSD值較高的波數(shù)來聚類分析。因為RSD值越大,所選樣本差別也會相應增加。最后,可以只通過幾個或幾十波數(shù)便可得到較優(yōu)的聚類結(jié)果。因此選取15個波數(shù)點進行分析,圖6代表了只通過15個波數(shù)點的聚類分析結(jié)果。
結(jié)合圖4、6可知,劣質(zhì)的燕麥的確與A、B、C、D、E類品牌存在很大差異,可能是劣質(zhì)燕麥片未經(jīng)過精加工,添加營養(yǎng)物質(zhì)等導致的。同時,A、B燕麥品牌與C、D、E燕麥品牌沒有重疊部分,且A、B是國產(chǎn)燕麥,C、D、E是進口燕麥。說明國產(chǎn)燕麥和進口燕麥之間也存在一定程度上的差異,可能是由于燕麥不同生長環(huán)境和加工過程所導致的。 無法鑒定出2種國產(chǎn)燕麥, A和 B, 并且無法鑒定出3種進口燕麥, C, D和 E。說明進口燕麥品牌之間、國產(chǎn)燕麥品牌之間在營養(yǎng)成分上大同小異,并無本質(zhì)區(qū)別。因此,當使用了背景扣除和波長篩選預處理,通過對燕麥片近紅外光譜分析實現(xiàn)了劣質(zhì)燕麥、國產(chǎn)品牌燕麥、進口品牌燕麥片的鑒別分析。
本試驗利用近紅外光譜技術與化學計量學方法相輔助用于燕麥片的快速分析,結(jié)果表明:單純使用原始光譜的確很難鑒別不同品牌以及偽劣的燕麥片,在CWT預處理和波長篩選的幫助下,可以推斷出不同品牌燕麥之間的差異是由蛋白質(zhì)、氨基酸、淀粉類物質(zhì)含量和結(jié)構(gòu)的差異導致的。同時,通過PCA方法獲得了滿意的聚類分析結(jié)果,鑒別出國產(chǎn)燕麥、進口燕麥以及劣質(zhì)燕麥3者之間的差異。然而,仍無法實現(xiàn)國產(chǎn)燕麥品牌之間以及進口燕麥品牌之間的良好鑒別。還需要結(jié)合更多的計量學方法加以討論。
圖6 CWT和波長篩選后的PCA圖Figure 6 PCA result after CWT and wavelength screening