雷春妮, 王 波, 解迎雙, 孫苗苗, 齊安安
(蘭州海關1,蘭州 730010) (山東大學2,青島 266237)
食用植物油是人們膳食結構中不可或缺的重要組成部分。脂肪酸是植物油中最重要的質量指標之一[1],不同植物油的脂肪酸種類和含量存在差異,其營養(yǎng)價值和市場價格也有很大差別。不法廠商為了謀求高額利潤,侵害消費者權益和健康,以廉價的植物油充當優(yōu)質植物油,影響食用植物油的質量和安全。化學計量學是多元數據處理、提取復雜體系中隱藏信息不可或缺的工具,因此被越來越多地應用于數據挖掘和分類,如陳通等[2]基于GC-MS三維譜中對應揮發(fā)性有機物質的特征峰強度進行主成分信息降維,采用k最近鄰算法建立植物油種類的判別模型,訓練集的識別率達到100%;蔣萬楓等[3]以7種植物油的易揮發(fā)成分為指標,通過主成份分析、偏最小二乘判別分析,建立了分類預測模型,分類模型訓練和模型驗證準確率均為100%;張方圓等[1]對6種植物油脂肪酸數據處理,采用遺傳-偏最小二乘法、主成分分析法、線性判別分析和最小二乘-支持向量機進行建模分析,結果表明,主成分分析法能夠較好地區(qū)分六類植物油,而在植物油種類判別分析中,線性判別分析的預報結果最佳。目前,尚未見到以12種食用植物油脂肪酸為指標進行主成分分析、系統聚類、K-平均值聚類和判別分析的研究。
采用氣相色譜法對12種植物油(棉籽油、大豆油、芝麻油、亞麻籽油、核桃油、葵花籽油、橄欖油、一般菜籽油、低芥酸菜籽油、花生油、花椒油、玉米胚芽油)的脂肪酸組成進行分析,利用峰面積歸一化法進行定量,采用主成分分析通過對原始變量不同權重的提取組建新的變量從而以全新的角度觀察樣品,利用主成分分析數據,依次進行系統聚類、K-平均值聚類和判別分析,建立判別函數,有效鑒別食用油的種類,旨在為食用油的摻雜摻假問題提供參考。
Clarus 600氣相色譜儀,配備氫火焰離子化檢測器;37種脂肪酸甲酯混合標準品;氫氧化鉀、甲醇均為分析純;12種食用植物油均市售,于0~4 ℃的條件下保存?zhèn)溆谩?/p>
1.2.1 實驗前處理
按照GB 5009.168—2016[4]處理:稱取60.0 mg試樣至具塞試管中,加入4 mL異辛烷溶解試樣,必要時可以微熱使試樣溶解后加200 μL 2%氫氧化鉀甲醇溶液,蓋上玻璃塞猛烈振搖30s后靜置至澄清。加入約1g硫酸氫鈉,猛烈振搖,中和氫氧化鉀。待鹽沉淀后,將上層溶液移至進樣小瓶中,待測。
1.2.2 氣相色譜條件
色譜柱:HP-88毛細管柱(100 m×0.250 mm×0.20 μm);程序升溫:120 ℃保持1 min,以10 ℃/min升至175 ℃,保持10 min,以5 ℃/min升至210℃,保持5 min,再以5 ℃/min升至230 ℃,保持25 min;進樣口溫度:250 ℃;載氣:高純氮氣(純度≥99.999%),分流比為100∶1,流速為1.0 mL/min;FID檢測器溫度:300 ℃;進樣量:1.0 μL。
1.2.3 數據處理
將樣品氣相色譜圖的保留時間與37種脂肪酸甲酯標準品色譜圖進行對比,確認樣品為脂肪酸甲酯。定量分析植物油樣品中各脂肪酸甲酯的含量,采用面積歸一化法,依據峰面積計算各種脂肪酸甲酯的相對含量。再利用 SPSS 22.0 統計軟件進行主成分分析、系統聚類、 K-平均值聚類及判別分析。
對12種植物油(共計196個樣品)進行氣相色譜分析,每一個樣品平行測定3次,以保留時間定性,用面積歸一化法定量,最終數據取實測每種食用植物油樣品(花生油18個、玉米胚芽油9個、鮮花椒油9個、葵花籽油18個、大豆油19個、芝麻油18個、低芥酸菜籽油18個、核桃油16個、亞麻籽油18個、橄欖油18個、棉籽油17個、一般菜籽油18個)的平均值±標準偏差,見表1。
表1 12種植物油脂肪酸質量分數/%
從表1可以得出,12種植物油的主要脂肪酸成分相同,即油酸(15.635%~66.569%)和亞油酸(10.521%~58.227%)。由表1可以看出,不同種類的植物油各脂肪酸的種類和含量均不相同。油酸在12種植物油中的質量分數在15.635%~66.569%范圍內,在橄欖油中的質量分數最高(66.569%),而在棉籽油中最低(15.635%),其具有降低低密度蛋白膽固醇水平的功效[5]。亞油酸在12種植物油中的質量分數在10.521%~58.227%之間,在葵花籽油中的質量分數最高(58.227%),而在橄欖油中含量最低(10.521%),亞油酸具有預防心血管疾病的功效。除油酸和亞油酸外,核桃油和亞麻籽油脂肪酸質量分數較高的還有有亞麻酸(分別為10.661%、52.537%)、棕櫚酸(分別為6.709%、5.332%),其亞麻籽油中的亞麻酸在12種植物油中含量最高(52.537%),在葵花籽油中含量最低(0.038%);鮮花椒油脂肪酸含量較高的還有γ-亞麻酸(11.750%)、亞麻酸(4.587%)、花生酸(4.385%),且γ-亞麻酸是花椒油獨有的,其具有降血脂、降血糖、抗心血管疾病、抗癌、美白和抗皮膚老化等作用[6]。低芥酸菜籽油和一般菜籽油脂肪酸含量較高的還有亞麻酸(分別為7.498%、9.010%)、棕櫚酸(分別為3.163%、4.403%),動物實驗證明大量攝入含芥酸高的菜籽油,可致心肌纖維化引起心肌病變[7],而GB/T 1536—2004標準規(guī)定低芥酸菜籽油中芥酸含量不大于3%,芥酸含量較一般菜籽油大大降低[8];大豆油脂肪酸含量較高的還有棕櫚酸(10.214%)、亞麻酸(5.989%)、硬脂酸(4.039%);棉籽油、芝麻油、葵花籽油、橄欖油、花生油、玉米胚芽油脂肪酸含量較高的還有棕櫚酸、硬脂酸。
植物油中的脂肪酸主要分為飽和脂肪酸(SFA)、單不飽和脂肪酸(MUFA)和多不飽和脂肪酸(PUFA)。美國國家膽固醇教育小組(NCEP)推薦,膳食中SFA、MUFA、PUFA供能比為1∶(1.5~2)∶ 1[9];美國心臟病協會(AHA)推薦SFA、MUFA、PUFA供能比為1∶1.5∶1[10];中國營養(yǎng)學會建議SFA、MUFA、PUFA供能比小于1∶1∶1[11]。由表1可以看出,12種植物油中沒有任何一種植物油脂肪酸成分能達到推薦比例。此外棉籽油(16.285%)中單不飽和脂肪酸含量最低,橄欖油(67.628%)含量最高;橄欖油(11.284%)中多不飽和脂肪酸含量最低,核桃油(67.167%)含量最高,其中人體不能合成亞油酸和亞麻酸,必須從膳食中補充。不飽和度(U/S)是植物油中總不飽和脂肪酸含量與總飽和脂肪酸含量的比值,是衡量植物油脂品質的重要標準之一[5]。由表1 可以看出,植物油中不飽和度最小為棉籽油3.235,最大為低芥酸菜籽油14.672。
KMO檢驗統計量是用于比較變量間簡單關系數和偏相關系數的指標,KMO值越接近1,意味著變量間的相關性越強,原有變量越適合做因子分析[12]。利用SPSS20.0軟件對12種植物油脂肪酸成分的相對含量進行主成分分析,KMO值為0. 668(見表2),可得出本實驗數據適合做因子分析。從表3獲得第1成分的貢獻率為28.866%,第2成分的貢獻率為19.238%,第3成分的貢獻率為17.235%,第4成分的貢獻率為13.840%,第5成分的貢獻率為7.530%,其累計方差貢獻率為86.708%,可見5個主成分能代表該數據的絕大部分信息,根據主成分貢獻大小將其表示為PC1、PC2、PC3、PC4、PC5,圖1為三維載荷圖。
表2 KMO和巴特利特球形度檢驗
表3 5個主成分的特征值及其貢獻率(總方差解釋)
注:a1~a21代表脂肪酸組成。圖1 三維載荷圖
某一主成分與變量的聯系系數絕對值越大,則表示該主成分與變量關系越接近[13]。由表4可知,第1主成分與二十碳二烯酸(0.919)、二十四碳一烯酸(0.833)、芥酸(0.819)、二十二碳二烯酸(0.814)高度正相關;第2主成分與棕櫚酸(0.744)、十七碳一烯酸(0.621)呈正相關,與亞麻酸(-0.604)呈負相關;第3主成分與γ-亞麻酸(0.737)、十五碳酸(0.732)、二十碳三烯酸(0.732)正相關;第4主成分與棕櫚油酸(-0.711)呈負相關;第5主成分與油酸(-0.656)呈負相關。由表3可知累積貢獻率60%以上的貢獻率來自第1、第2和第3主成分。因此可認為二十碳二烯酸、二十四碳一烯酸、芥酸、二十二碳二烯酸、棕櫚酸、十七碳一烯酸、亞麻酸、γ-亞麻酸、十五碳酸、二十碳三烯酸是12種植物油脂肪酸主成分中相關性較強的組分。
表4 主成分載荷矩陣
為進一步探究12種植物油的脂肪酸成分是否有更多的內在聯系與規(guī)律,采用SPSS22.0軟件對12種植物油的脂肪酸含量進行聚類分析。聚類分析是一種重要的數據挖掘算法,它是將具有相同或相似性質的對象放于同一集合中,把不同性質的對象放于不同集合中,達到物以類聚的效果[14]。由脂肪酸指標所獲得的主成分數據PC1、PC2、PC3、PC4、PC5作為變量值,進行系統聚類和K-平均值聚類。
2.4.1 系統聚類
以主成分分析獲得的5個主成分為變量值,以組之間的連接法為聚類方法,以平方Euclidean距離為度量準則,用 SPSS 22. 0軟件對196個植物油樣品進行系統聚類分析,聚類分析結果見圖3。
從圖2可知,所有植物油樣品采用SPSS 22.0軟件進行系統聚類累計9次分類,第1次分類:一類只由花生油樣品組成,另一類由玉米胚芽油、鮮花椒油、葵花籽油、大豆油、芝麻油、低芥酸菜籽油、核桃油、亞麻籽油、橄欖油、棉籽油、一般菜籽油11種樣品組成,分類結果可知花生油與其他11種食用油在脂肪酸組成上差別較大,第1次分類就可區(qū)分。第2次分類:一類只由一般菜籽油樣品組成,另一類由玉米胚芽油、鮮花椒油、葵花籽油、大豆油、芝麻油、低芥酸菜籽油、核桃油、亞麻籽油、橄欖油、棉籽油10種樣品組成,分類結果可知一般菜籽油與其他10種植物油在脂肪酸組成上差別較大。油用植物菜籽的高芥酸會降低菜籽油的品質[15],長期食用富含芥酸的菜籽油,會因芥酸過多積蓄而容易引起血管壁增厚和心肌脂肪沉積,不利于人體健康。第3次分類:一類只由棉籽油樣品組成,另一類由玉米胚芽油、鮮花椒油、葵花籽油、大豆油、芝麻油、低芥酸菜籽油、核桃油、亞麻籽油、橄欖油9種樣品組成,此次分類將棉籽油與其他9種食用油分開。第4次分類:一類只由橄欖油樣品組成,另一類由玉米胚芽油、鮮花椒油、葵花籽油、大豆油、芝麻油、低芥酸菜籽油、核桃油、亞麻籽油8種樣品組成,此次分類將橄欖油與其他8種食用油分開。第5次分類:一類由亞麻籽油和核桃油樣品組成,另一類由玉米胚芽油、鮮花椒油、葵花籽油、大豆油、芝麻油、低芥酸菜籽油6種樣品組成。將亞麻籽油和核桃油進行第六次分類可分類區(qū)分,分類結果說明亞麻籽油和核桃油的脂肪酸組成具有較大相似處,也有不同之處。將其他6種植物油進行第6次分類:一類由玉米胚芽油和鮮花椒油樣品組成,另一類葵花籽油、大豆油、芝麻油、低芥酸菜籽油4種樣品組成;玉米胚芽油和鮮花椒油經第7次聚類可分類;葵花籽油、大豆油、芝麻油、低芥酸菜籽油經第七次分類,可將葵花籽油與大豆油、芝麻油、低芥酸菜籽油分類。大豆油、芝麻油、低芥酸菜籽油進行第8次分類,大豆油與芝麻油、低芥酸菜籽油區(qū)分。芝麻油和低芥酸菜籽油經第9次分類可區(qū)分。
2.4.2 K-平均值聚類
以主成分分析獲得的5個主成分為變量值,用SPSS 22.0進行K-平均值聚類分析,最大迭代次數為10,使用運行平均值,最終在SPSS 22.0中聚類成功,獲得最終聚類中心(表5)。從最終聚類中心之間的距離可看出2個聚類中心無重合點。
表5 最終聚類中心
系統聚類、 K-平均值聚類結果與主成分分析結果一致,表明12種植物油脂肪酸成分具有明顯差異,其結果對12種植物油真?zhèn)舞b別具有一定的指導性作用。
應用SPSS 22.0軟件通過主成分分析得到的5個主成分作為判別分析的自變量,K-平均值聚類中得到的聚類號作為判別分析的分組變量,進行判別模型的擬合,數據輸出得到規(guī)范判別函數特征值,結果如表6所示,其中累計方差貢獻率100% ,表明5個主成分所得到的模型數據能夠對12種植物油進行判別。
表6 特征值
依據標準規(guī)范判別式函數系數,得到3個典則判別式函數,其標準規(guī)范判別式函數系數見表7,第一個判別函數解釋了91.4%的方差,第二判別函數解釋了8.0%的方差,第三判別函數解釋了0.7%的方差,三個判別函數解釋了全部方差,其判別函數見函數1、函數2、函數3。
表7 標準規(guī)范判別式函數系數
Y1=-0.517×PC1+0.520×PC2+0.830×PC3+0.596×PC4+0.577×PC5(函數1)
Y2=-0.069×PC1+0.560×PC2-0.526×PC3+0.534×PC4-0.213×PC5(函數2)
Y3=0.214×PC1-0.385×PC2+0.289×PC3+0.541×PC4-0.555×PC5(函數3)
表8是Fisher判別函數有效性檢驗結果。該檢驗的原假設是不同組的平均Fisher判別函數值不存在顯著差異。
表8 Fisher判別函數有效性檢驗結果
從表8可知顯著性<0.05,說明在0.05的顯著性水平下有理由拒絕原假設。1到 3 表示沒有函數被移去,拒絕原假設,表明兩個判別函數能將各組樣品分開;2到 3 表示沒有函數被移去,拒絕原假設,表明兩個判別函數能將各組樣品分開;3表示排除了第1個判別函數和第2個判別函數后的顯著性檢驗,拒絕原假設,第3個判別函數也能將各組樣品分開。利用得到的3個典則判別函數對12種植物油樣品進行驗證判別,交叉驗證結果可將12種食用動物油區(qū)分開,且對應的驗證準確度為100%。故可用典則判別函數1、函數2、函數3對12種植物油的未知油脂樣品進行分析判別。
采用氣相色譜法測定了12種食用植物油(棉籽油、大豆油、芝麻油、亞麻籽油、核桃油、葵花籽油、橄欖油、一般菜籽油、低芥酸菜籽油、花生油、花椒油、玉米胚芽油)的脂肪酸成分和含量,應用 SPSS 22. 0 數據分析軟件進行數據處理,系統聚類、 K-平均值聚類結果與主成分分析結果一致,12種植物油肪酸成分具有明顯差異,最終通過判別分析建立了3個典則判別函數,不同植物油的分類和判別的效果良好。據植物油脂肪酸的指標對不同種類的植物油進行分類和判別是可行的,為食用植物油類型判別提供參考。