于慧春 付曉雅 殷 勇 劉云宏 白喜婷
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽 471003)
反式脂肪酸(trans fatty acids,TFAs)是順式脂肪酸在一定條件下發(fā)生異構(gòu)化所形成的至少含有一個反式構(gòu)型雙鍵的不飽和脂肪酸的總稱,被稱為“餐桌上的定時炸彈”[1-2],存在于高溫煎炸后的食用植物油、氫化產(chǎn)品、速溶產(chǎn)品、反芻動物的肉脂肪組織及乳脂中[3]。TFAs是食用油高溫加熱過程中不可忽視的產(chǎn)物,其對健康的危害可能比氫化產(chǎn)品中的TFAs 更大[4]。因此,開展食用油TFAs的檢測研究,對食品安全及制定油品的行業(yè)標(biāo)準(zhǔn)有著積極的意義。
目前,食用油中TFAs的常規(guī)檢測方法主要包括氣相色譜法[5]、液相色譜[6]和紅外吸收光譜法[7]等,這些分析方法檢測精度較高,但預(yù)處理過程復(fù)雜,耗時較長[8],且預(yù)處理過程直接影響最終檢測結(jié)果,難以滿足實(shí)際生產(chǎn)及市場監(jiān)管的需求[9],而拉曼光譜技術(shù)(raman spectrocscopy technology,RAMAN)采用非彈性散射對樣品進(jìn)行分析,無需前處理,簡單方便。近年來,RAMAN 在農(nóng)產(chǎn)品、食品品質(zhì)檢測及真?zhèn)舞b定方面引起越來越多的關(guān)注。在食用油檢測方面,主要是通過提取拉曼光譜的特征峰,建立食用油中與其品質(zhì)相關(guān)的某些組分的預(yù)測模型,如飽和脂肪酸、油酸、亞油酸[10]及其他單不飽和脂肪酸(monounsaturated fatty acids,MUFA)和多不飽和脂肪酸(polyunsaturated fatty acids,PUFA)[11-12]等,通過對組分的預(yù)測,從而實(shí)現(xiàn)對食用油品質(zhì)的快速檢測及鑒別。此外,運(yùn)用激光拉曼檢測時,由于樣品的性質(zhì)通常是由各組成成分聯(lián)合影響所決定,所以只對個別峰進(jìn)行分析不足以體現(xiàn)樣品的性質(zhì),因此,需要綜合考慮一些峰的峰面積、形狀或移頻等特征[13],但當(dāng)被測樣品光譜數(shù)據(jù)量較大,峰值較多時,直接對所有光譜的峰值特征進(jìn)行分析建模,會增加模型的復(fù)雜性,影響模型的穩(wěn)定性[14]。所以,在建立模型時需要對拉曼光譜的有效信息進(jìn)行準(zhǔn)確的提取,而關(guān)于這方面的研究報道較少。目前,有關(guān)激光拉曼技術(shù)對食用油中TFAS含量的檢測研究報道較少,尤其是針對長時間加熱后食用油中TFAS含量變化方面的檢測研究更少。因此,本研究嘗試采用無信息變量消除法(uninformative variable elimination,UVE)對拉曼光譜信息進(jìn)行變量篩選,剔除對模型沒有貢獻(xiàn)的光譜,然后使用Fisher 判別分析(fisher discriminant analysis,FDA)方法對其進(jìn)行定性判別分析,隨后運(yùn)用支持向量回歸機(jī)(support vector regression,SVR)、BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)、偏最小二乘回歸(partial least-squares regression analysis,PLSR)方法分別建立基于篩選變量和全譜數(shù)據(jù)的不同食用油和不同加熱時間的TFAS含量的預(yù)測模型,并對結(jié)果進(jìn)行對比分析,以期為長時間使用的煎炸油中TFAS含量的定性及定量研究提供借鑒。
福臨門菜籽油、道道全大豆油和福臨門玉米油均購于大張超市,規(guī)格900 mL 瓶裝。檢測時取30 mL 油樣,倒入陶瓷坩堝中,在電爐上加熱,用水銀溫度計(jì)測量其溫度。當(dāng)溫度達(dá)到190℃時,開始計(jì)時并調(diào)節(jié)電路電壓,使溫度波動不超過±5℃。分別在加熱時間為0、30、60、90、120、150 min時,取油樣5 mL 并冷卻至室溫,于-20℃條件下保存?zhèn)溆谩?/p>
參考GB 5009.257-2016[15]的測定方法。
采用XploRA ONE 共焦顯微拉曼光譜儀(法國),激光光源波長785 nm,功率375 mW,光譜采集范圍200~3 500 cm-1,激光功率50%,掃描點(diǎn)數(shù)36個,于室溫(20~25℃)條件下測定樣品的拉曼光譜圖。6個加熱時間段的樣品,每個樣品設(shè)3 次重復(fù)。為了盡可能全面的獲取樣品信息,每個樣品分別均勻采集36個點(diǎn),即每個樣品得到36 條拉曼光譜,進(jìn)而使用激光拉曼儀器自帶的LabSpec 6 數(shù)據(jù)處理軟件對光譜基線進(jìn)行多項(xiàng)式擬合,以去除熒光背景。
1.4.1 無信息變量消除 UVE是基于分析PLSR 系數(shù)的算法,能夠有效去除無關(guān)波長變量。在PLSR 模型中,拉曼光譜矩陣變量X和TFAS含量矩陣Y存在如下關(guān)系[16]:Y=Xb+e,其中,b為回歸系數(shù)向量,e為誤差向量。將與拉曼光譜矩陣變量數(shù)目相同的隨機(jī)變量矩陣加入到光譜矩陣中,通過PLSR 交叉驗(yàn)證剔除無關(guān)變量,得到回歸系數(shù)矩陣,利用回歸系數(shù)向量的平均值與其對應(yīng)的標(biāo)準(zhǔn)差相除,進(jìn)而確定篩選變量閾值,大于閾值的篩選變量即為優(yōu)選特征變量[17]。
1.4.2 Fisher 判別分析 為了說明篩選變量能夠有效提高拉曼光譜對加熱食用油的鑒別能力,選用FDA方法作為模式判別工具[18],并用FDA對不同加熱時間的3種食用油樣品進(jìn)行判別分析,通過對其訓(xùn)練集及其預(yù)測集鑒別正確率的分析與對比,來表明變量篩選的必要性。
1.4.3 支持向量機(jī)回歸 SVR是一種較新的多元統(tǒng)計(jì)分析方法,最初用于解決模式識別中的分類問題[19],隨著VAPNIK對ε 不敏感損失函數(shù)的引入,支持向量機(jī)已被推廣到非線性系統(tǒng)的回歸估計(jì),通過核函數(shù)的選擇進(jìn)一步提高其學(xué)習(xí)性能[20]。分別以篩選后的3種食用油的拉曼光譜作為輸入,以樣品中TFAS含量為輸出,建立SVR 預(yù)測模型,對樣品中TFAS含量進(jìn)行預(yù)測。
1.4.4 偏最小二乘回歸 PLSR分析在建模過程中集中了主成分分析、典型相關(guān)分析和線性回歸分析的特點(diǎn),預(yù)測能力強(qiáng)且模型簡單[21]。采用PLSR方法,對樣品的拉曼光譜矩陣X和TFAS含量矩陣Y同時進(jìn)行分解,有效消除多個變量之間的共線性,從而獲得最佳的校正模型[22]。
1.4.5 BP 神經(jīng)網(wǎng)絡(luò) BPNN 模型結(jié)構(gòu)包括輸入層、隱層和輸出層,是對人腦活動的抽象、簡化和模擬,能學(xué)習(xí)和存貯輸入信號與輸出信號之間的非線性映射關(guān)系[23]。BPNN 輸入層的神經(jīng)元數(shù)等于每種食用油篩選出的拉曼光譜數(shù),輸出層的神經(jīng)元數(shù)為1,而隱層需采用試湊法進(jìn)行多次嘗試,建立基于BPNN的TFAS含量預(yù)測模型。
在進(jìn)行TFAS含量檢測時,以反式亞油酸含量、反式亞麻酸含量和反式油酸含量的總和表示總TFAS含量。由表1可知,隨著加熱時間的延長,菜籽油、大豆油、玉米油中TFAS含量均逐漸增加。食用油中不同的TFAs的形成和含量的改變與其脂肪酸組成有關(guān)[24]。順式脂肪酸含量較多的食用油經(jīng)過加熱后對
表1 3種食用油中的反式脂肪酸含量Table1 TFAs content in three vegetable oils/(g·100g-1)
應(yīng)的TFAs含量也會變多[25]。而大豆油中含有豐富的油酸、亞油酸與少量的亞麻酸,其中亞油酸的含量超過總脂肪含量的50%,且在加熱過程中生成TFAs的難易程度(從易到難)依次為反式亞麻酸>反式亞油酸>反式油酸[26],因此大豆油中TFAS含量增加明顯。
由圖1可知,食用油拉曼光譜存在較強(qiáng)的熒光背景,為了去除熒光背景的干擾,使用激光拉曼儀器自帶的軟件處理系統(tǒng),采用迭代多項(xiàng)式擬合基線矯正方法對光譜基線進(jìn)行擬合、去除熒光背景,再使用MATLAB(R2014a)軟件進(jìn)行標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variable,SNV)。由圖2可知,SNV 有效消除了背景信息的干擾,增強(qiáng)了光譜與TFAs 成分相關(guān)的光譜信息。
圖1 激光拉曼采集的648 條原始圖譜Fig.1 Laser raman acquisition of 648 original spectra
圖2 預(yù)處理后的648 條拉曼圖譜Fig.2 648 raman spectra after pretreatment
表2為圖2中食用油各譜峰所代表組分的官能團(tuán)信息。其中,969 cm-1與trans(C=C)的彎曲振動相關(guān)[27],870 cm-1和1 080 cm-1是-CH2長鏈骨架的伸縮振動峰,1 302 cm-1是-CH2的卷曲振動,1 438 cm-1代表-CH2的剪式振動,1 263 cm-1和1 656 cm-1分別是不飽和脂肪酸cis(=C-H)和cis(C=C)的基團(tuán)振動峰,1 745 cm-1譜峰是酯鍵羰基的伸縮振動峰[28]。上述幾個特征峰幾乎是所有食用油拉曼譜圖的共同特征,不同油脂的拉曼譜圖只是在1 656、1 263、969 cm-1處的譜峰相對強(qiáng)度有細(xì)微變化。由于TFAs中含有大量C-C 化學(xué)鍵,因此,在拉曼光譜中有較強(qiáng)的吸收信息。此外,反式雙鍵的存在,使得TFAs 在分子結(jié)構(gòu)上與飽和脂肪酸、順勢不飽和脂肪酸等存在不同[29]。分子結(jié)構(gòu)的變化會在吸收光譜中表現(xiàn)出來,相關(guān)研究表明,油脂中的TFAs和順式脂肪酸的拉曼位移不同[30]。
表2 拉曼位移信息Table2 Raman shift information
為優(yōu)化預(yù)測模型,增加預(yù)測模型的穩(wěn)定性,采用UVE方法對預(yù)處理后的全譜數(shù)據(jù)進(jìn)行變量篩選,將無信息的變量去除,針對菜籽油、大豆油和玉米油分別從全部波長中篩選出75、153和23個波長變量作為特征變量進(jìn)行定性和定量分析。
圖3-A為菜籽油篩選出的75個變量(特征波長)。研究表明,菜籽油中TFAs 主要由反式亞麻酸與少量的反式亞油酸組成,在加熱過程中二者的含量均明顯增加,所以變量主要集中在969、1 263、1 302、1 656 cm-1附近。圖3-B為大豆油篩選出的153個變量。新鮮的大豆油中不含有反式油酸,僅含有少量的反式亞油酸與反式亞麻酸,在加熱過程中TFAs 主要由反式亞油酸與反式亞麻酸組成,隨著加熱時間的延長也會出現(xiàn)少量的反式油酸,所以變量主要集中在969、1 263、1 302、1 438、1 656 cm-1附近。圖3-C為玉米油所篩選的23個變量。玉米油中TFAs 主要為反式油酸、反式亞油酸和反式亞麻酸3種,隨著加熱時間的延長,反式亞油酸與反式亞麻酸的含量明顯增加,所以變量主要集中在969、1 263、1 302、1 656 cm-1附近。此外,969 cm-1為trans RHC=CHR 彎曲振動的特征峰,可以作為反式脂肪的特征峰;1 263 cm-1為Cis c-HR 伸縮振動的特征峰;1 302 cm-1為-CH2扭曲振動的特征峰;1 438 cm-1為-CH2剪式彎曲振動的特征峰;1 656 cm-1為Cis RHC=CHR 伸縮振動的特征峰。
將通過UVA 篩選出的變量,分別作為FDA的輸入變量,進(jìn)行分析,其中,每個樣品的36 條拉曼光譜中24 條作為訓(xùn)練集,12 條作為測試集,結(jié)果見圖4-A-2、-B-2、-C-2。為對比分析,將全波段(200~3 500 cm-1)激光拉曼光譜作為FDA的輸入變量,進(jìn)行分析,結(jié)果見圖4-A-1、-B-1、-C-1。通過對比可知,不同加熱時間(0、30、60、90、120、150 min)下,采用全譜信息,菜籽油、大豆油、玉米油3種油不同加熱時間的樣品重疊嚴(yán)重,而經(jīng)UVA方法變量篩選后,3種食用油的樣品均有較好的分類效果,同類間聚集度較高,表明分類效果有所提高。由表3可知,不同加熱時間下,經(jīng)變量篩選后,大豆油、玉米油和菜籽油的FDA 判別平均正確率均在90%以上,明顯高于基于全譜的FDA 判別平均正確率。
分別應(yīng)用SVR、BPNN和PLSR方法建立基于全部變量及特征變量對菜籽油樣品中TFAs含量的預(yù)測模型,其最優(yōu)模型見圖5。對于BPNN,其訓(xùn)練函數(shù)為trainscg 函數(shù),隱層神經(jīng)元函數(shù)為logsig 函數(shù),輸出層神經(jīng)元函數(shù)為tansig 函數(shù),隱層神經(jīng)元的個數(shù)為10時,訓(xùn)練結(jié)果較好。由表4可知,基于全部變量信息菜籽油中TFAs的預(yù)測模型,訓(xùn)練集R2與測試集R2相差較大,存在過擬合現(xiàn)象。使用UVE 篩選的75個變量建立SVR、BPNN與PLSR 預(yù)測模型,測試集R2較全部變量模型均有不同程度的提高。其中,UVE-SVR 預(yù)測模型的測試集R2相對最高,且RMSEC和RMSEP 更低,其預(yù)測模型性能優(yōu)于其他2個預(yù)測模型。
同樣建立大豆油不同加熱時間后TFAs含量的預(yù)測模型,最優(yōu)預(yù)測模型見圖6。由表5可知,采用全部變量建模時,3種預(yù)測模型均達(dá)到了較好的預(yù)測效果,其中SVR與PLSR 預(yù)測結(jié)果均達(dá)到90%以上,SVR 模型和PLSR 模型的預(yù)測相關(guān)系數(shù)相近,但前者測試集的RMSEP (0.004 8) 小于后者測試集的RMSEP(0.008 1),說明SVR 預(yù)測精度高于PLSR 模型。采用UVE 篩選過后的153個變量建模時,SVR 模型測試集的R2(0.954 8)高于PLSR 模型的R2(0.920 2)和BPNN 模型的R2(0.906 0),且SVR的RMSEP(0.001 9)遠(yuǎn)低于其他2種模型。表明基于特征變量的SVR模型預(yù)測效果優(yōu)于PLSR 模型與BPNN 模型。
圖3 食用油篩選出的特征波長Fig.3 Characteristic wavelength of edible oil screening
玉米油中反式脂肪酸最優(yōu)建模結(jié)果見圖7。結(jié)合表6可知,在全部特征變量下,訓(xùn)練集的R2較高,但測試集的R2較低,說明試驗(yàn)建立的模型存在過擬合現(xiàn)象,而3種預(yù)測模型的RMSEP 均較大,說明模型的穩(wěn)定性有待進(jìn)一步提高。采用篩選的23個特征變量建模時,SVR與BPNN 預(yù)測模型的R2相近,但SVR 模型測試集的RMSEP(0.014 5)小于BPNN 模型測試集的RMSEP(0.080 2),其預(yù)測精度高于BPNN,說明基于特征變量的SVR 模型預(yù)測效果優(yōu)于PLSR 模型與BPNN 模型。
圖4 食用油全部變量篩選變量后FDA 預(yù)測集Fig.4 Prediction set of FDA after all variables and selected variables of edible oil
表3 3種食用油FDA 判別正確率Table3 Three edible oil FDA classification results /%
表4 菜籽油預(yù)測模型結(jié)果Table4 Results of rapeseed oil prediction model
表5 大豆油預(yù)測模型結(jié)果Table5 Results of soybean oil prediction model
圖6 大豆油UVE-SVR 訓(xùn)練集與預(yù)測集結(jié)果Fig.6 Soybean oil UVE-SVR training set and prediction set results
圖7 玉米油UVE-SVR 訓(xùn)練集與預(yù)測集結(jié)果Fig.7 Corn oil UVE-SVR training set and prediction set results
表6 玉米油的預(yù)測模型結(jié)果Table6 Results of corn oil prediction model
本研究將激光拉曼技術(shù)應(yīng)用于不同加熱時間下食用油TFAs含量的檢測,為食用油TFAs的快速檢測方法研究提供借鑒。本試驗(yàn)結(jié)果表明,隨著加熱時間的延長,食用油(菜籽油、大豆油、玉米油)中TFAs含量也隨之增加,尤其順式脂肪酸含量較多的食用油,經(jīng)加熱后其TFAs含量增加更明顯。與玉米油和菜籽油相比,大豆油含有豐富的油酸、亞油酸及少量的亞麻酸,其中亞油酸含量超過總脂肪含量的50%,因此,大豆油中TFAs含量增加明顯,這與蘇德森等[31]的研究結(jié)論一致。在檢測方法上,Li 等[32]和董晶晶等[33]分別采用近紅外光譜對食品油中TFAs含量進(jìn)行檢測,并且分別基于全光譜或部分光譜信息建立TFAs含量的預(yù)測模型,但未對有效光譜信息進(jìn)行篩選,故數(shù)據(jù)量大,計(jì)算繁瑣。孫通等[34]利用UVE對全波段光譜進(jìn)行變量篩選,建立食用植物油中腐霉利含量的分類模型,判別正確率提高至98.7%,取得了良好的分類效果。因此,本研究嘗試將UVE與SVR 相結(jié)合的方法,進(jìn)行食用油中TFAS含量的預(yù)測。為提高模型的穩(wěn)健性,將UVE 用于拉曼光譜信息的分析處理,對3種食用油的拉曼光譜信息進(jìn)行特征篩選,不僅簡化了計(jì)算,還明顯提高了模型的定性與定量分析能力。
本研究僅對不同種類食用油不同加熱時間后的激光拉曼光譜特征進(jìn)行了分析,未對其特征峰所生成的映射圖進(jìn)行考查,其映射圖可能還含有豐富的有用信息,可對其作進(jìn)一步研究。如,先融合樣品的拉曼光譜和圖像信息,再結(jié)合適合的建模方法,以達(dá)到進(jìn)一步提高模型精度和穩(wěn)健性的目的。
本研究利用激光拉曼技術(shù)對不同加熱時間下食用油TFAs含量進(jìn)行快速定性和定量檢測分析,并通過光譜預(yù)處理、變量選擇及建模方法對預(yù)測模型進(jìn)行優(yōu)化。結(jié)果表明,在定性分析中,采用UVE 分別篩選菜籽油、大豆油和玉米油的特征變量,基于篩選特征變量的3種油的FDA 判別平均正確率均在90%以上,明顯高于基于全譜數(shù)據(jù)的FDA 判別平均正確率,表明了對拉曼光譜所采集信息進(jìn)行優(yōu)化篩選的必要性。在定量預(yù)測中,基于篩選變量的菜籽油、大豆油和玉米油最優(yōu)預(yù)測模型(SVR)的訓(xùn)練集R2分別為0.990 3、0.992 4和0.988 4,測試集R2分別為0.952 6、0.954 8和0.958 5,進(jìn)一步證實(shí),去除冗余信息可以有效提高模型的穩(wěn)健性和精度。本研究為不同加熱時間食用植物油中TFAs含量的快速無損定量檢測研究提供了參考。