国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

核磁共振氫譜結(jié)合PCASVM算法分類鑒別食用植物油

2018-05-01 20:37:24楊紅梅賈婧怡
食品工業(yè)科技 2018年8期
關鍵詞:植物油食用分類

李 瑋,姜 潔,楊紅梅,王 浩,賈婧怡

(北京市食品安全監(jiān)控和風險評估中心,北京 100041)

食用植物油是人們?nèi)粘o嬍巢豢扇鄙俚氖澄镏?是我國居民維生素E的首要來源[1]。目前市場上的食用油種類繁多,食用油因其種類不同、營養(yǎng)價值不同而價格差異很大。一些不法商家為謀取個人利益,常以菜籽油、棕櫚油等廉價植物油摻兌優(yōu)質(zhì)、高價油品中以降低生產(chǎn)成本,從中謀取暴利。更有生產(chǎn)廠家甚至將非食用油脂(俗稱“地溝油”)按一定比例勾兌到正規(guī)廠家生產(chǎn)的優(yōu)質(zhì)油品中,嚴重地損害消費者的利益和危害消費者的身體健康[2]。為保護合法生產(chǎn)經(jīng)營者和消費者的利益,有必要進行食用油種類的鑒別。

目前,對食用植物油分類多采用氣相色譜法、紅外、拉曼光譜結(jié)合聚類分析、辨別分析等化學計量學的方法,但這些方法都存在各自的缺點[3-7]。例如,氣相色譜法需要對樣品進行衍生化,前處理繁瑣、檢測時間長;紅外、拉曼等光譜法由于受其檢測原理所限,其圖譜對食用植物油混合物體系內(nèi)各成分解釋能力有限。另外,聚類、辨別分析等傳統(tǒng)的化學計量學方法在處理分類問題時,一般需要事先知道樣本的先驗分布,并要求有足夠多的樣本數(shù)據(jù),而這些要求在實際應用中往往難以達到。所以,在實際工作中應選用適合小樣本集的數(shù)據(jù)處理分析方法。支持向量機(support vector machine,SVM)是統(tǒng)計學習理論中最實用的部分,其在分類問題中既考慮分類誤差最小,又考慮分類線的結(jié)構,提高了機器學習的泛化能力。此外,SVM還通過引入核函數(shù)的方法使計算的復雜度不再取決于空間維數(shù),而是取決于樣本數(shù)量,尤其是樣本中的支持向量數(shù),特別適合小樣本集數(shù)據(jù)的分類[8-11]。

核磁共振(nuclear magnetic resonance,NMR)是鑒定有機化合物結(jié)構和研究化學動力學等的極為重要的手段,具有前處理簡單,不損傷樣品,結(jié)構信息豐富等優(yōu)點。NMR技術在食品領域的應用初期主要采用低場技術研究水在食品中的狀態(tài)[12],但隨著超導技術、計算機技術和脈沖傅立葉變換波譜儀的迅速發(fā)展,其在食品領域的研究及應用領域逐漸擴大[13-15]。近年來,國內(nèi)外研究者采用高場NMR技術結(jié)合化學計量學方法,在食品的真?zhèn)舞b別、產(chǎn)地溯源等領域展開了大量的研究與應用[16-19],但這些研究多采用聚類、辨別分析等傳統(tǒng)的化學計量學方法,少見采用SVM結(jié)合NMR的分類方法報道。

本研究對市售大豆油、花生油、玉米油、葵花籽油、橄欖油、芝麻油、菜籽油這7種市面上常見食用植物油的1H-NMR圖譜進行測定,結(jié)合PCA-SVM算法建立分類模型。隨機選取已知食用油種類的預測樣本對模型進行檢驗,根據(jù)預測結(jié)果分析模型的可靠性,并與傳統(tǒng)的簇類獨立軟模式法(soft independent modeling of class analogies,SIMCA)算法建立的分類模型進行對比。

1 材料與方法

1.1 材料與儀器

7種食用植物油 共119個樣品,超市,其中大豆油19個,花生油18個,玉米油19個,葵花籽油17個,橄欖油17個,芝麻油17個,菜籽油10個;氘代氯仿(CDCl3) 氘代度:99.8%,美國CIL公司;Norell 5 mm核磁管 美國Norell公司。

AVANCE 600 MHZ超導傅里葉變換NMR儀 配有CPBBO探頭,Topspin 3.2處理軟件及60位自動進樣器,瑞士Bruker公司。

1.2 實驗方法

1.2.1 樣品溶液的制備 吸取植物油樣品200 μL于2 mL的EP管中,加入800 μL CDCl3,渦旋30 s,使樣品與試劑混合均勻。取600 μL混合溶液于5 mm核磁管中,待測。

1.2.2 訓練集與測試集樣本的確定 在Matlab中用randperm函數(shù)隨機將每種食用植物油樣品分為兩組,一組為訓練集(training set)樣本,一組為測試集(testing set)樣本,保證訓練集與測試集樣本數(shù)量比約為3∶2,于是得到75個樣本的訓練集和42個樣本的測試集。

1.2.3 儀器條件 NMR儀1H載波頻率為600.13 MHz,采用Bruker標準脈沖zg30,檢測溫度為298 K,1H的90°脈沖寬度為11.90 μs,譜寬為12019.23 Hz,中心頻率為3600.78 Hz,脈沖延遲時間為4 s,掃描次數(shù)為32,空掃次數(shù)為2。

1.2.4 樣品測定及譜圖處理 在1.2.2項實驗條件下,調(diào)整儀器參數(shù)、調(diào)諧、控溫、勻場、采樣及傅里葉變換,得到1H-NMR圖譜。測得譜使用Bruker Topspin 3.2軟件處理,變換點數(shù)為65536,線寬因子為1.00 Hz,用指數(shù)窗函數(shù)處理,基線和相位校正均采用手動方式進行,四甲基硅烷(TMS)為內(nèi)標信號(δ0.00)。

1.2.5 分類模型的建立 處理后的圖譜用MestReNova(version 6.0.1,Spain)軟件,以δ0.005積分段對化學位移區(qū)間δ0.15~10.00進行分段積分,去除譜中δ 7.21~7.30區(qū)域的信號后進行面積歸一化處理,得到樣品核磁圖譜轉(zhuǎn)換形成的典型二維矩陣,其中每行代表一個樣本,每列代表樣本在同一化學位移內(nèi)的強度積分相對值。分別采用PCA-SVM和SIMCA法,對訓練集數(shù)據(jù)進行分類模型的建立,用得到的模型預測測試集。程序采用Matlab(V7.0.4,Mathworks Inc,USA)軟件編寫、運行。

2 結(jié)果與分析

2.1 7種食用植物油的典型1H-NMR圖譜分析

食用植物油中主要成分為甘油三酯,圖1所示為7種食用植物油典型的1H-NMR(CDCl3)譜圖,圖譜顯示主要存在9組信號峰,參考文獻[20-21],對這9組主要信號峰進行了信號歸屬(表1)。圖譜中所示,δ0.84~0.92信號為脂肪鏈末端甲基質(zhì)子信號,δ1.22~1.39信號為長鏈脂肪酸一般性亞甲基質(zhì)子信號,δ1.56~1.66信號為脂肪鏈上與羰基相隔一個亞甲基的亞甲基上的質(zhì)子信號,δ1.96~2.09信號為與脂肪鏈上雙鍵相連的亞甲基質(zhì)子信號,δ2.27~2.36信號為脂肪鏈上與羰基直接相連的亞甲基質(zhì)子信號,δ2.74~2.80信號為脂肪鏈上兩個雙鍵之間亞甲基質(zhì)子信號,δ4.10~4.32和δ5.24~5.29信號分別為甘油三酯中丙三醇的亞甲基和次甲基質(zhì)子信號,δ5.30~5.41信號為非共軛脂肪酸不飽和質(zhì)子信號。

表1 食用植物油中脂類成分1H-NMR主要化學位移歸屬Table 1 1H-NMR major chemical shift assignments of fat in edible oils

圖1 7種常見植物油的典型1H-NMR譜圖(CDCl3)Fig.1 1H-NMR spectrum of edible oils(CDCl3)注:a為大豆油;b為花生油;c為玉米油;d為葵花籽油;e為橄欖油;f為芝麻油;g為菜籽油。

2.2 PCA-SVM分類模型的建立

2.2.1 自變量的降維 經(jīng)數(shù)據(jù)處理后的訓練集數(shù)據(jù)是由75個樣本,1950個變量(圖譜分段積分獲得)構成的75×1950的一個矩陣,其中每行代表一個樣本,每列代表樣本在同一化學位移內(nèi)的強度積分相對值。當過多的自變量因子輸入分類模型時,不僅會影響到模型的運算速度,還會引入噪音,影響了模型的預測精度。為解決訓練集自變量過多問題,在建立模型前,首先采用PCA分析方法,將訓練集數(shù)據(jù)自變量降維,得到新的特征變量的潛在變量數(shù)為2,累計貢獻率在95%以上。因此,在建立分類模型時,以PCA分析得到的新特征變量代替原有的自變量作為模型建立的輸入自變量。

2.2.2 懲罰參數(shù)c和核函數(shù)參數(shù)g的優(yōu)化 SVM對模型參數(shù)的選擇很敏感,為了得到比較理想的分類準確率,需要調(diào)節(jié)相關的懲罰參數(shù)c和核函數(shù)參數(shù)g。懲罰參數(shù)c代表模型對誤差的寬容度,過高的c會導致過學習狀態(tài)的發(fā)生,即訓練集準確率很高而測試集準確率很低,而c過小將導致訓練不完全。核函數(shù)參數(shù)g是徑向基函數(shù)自帶的一個參數(shù),它決定了數(shù)據(jù)映射到新的特征空間后的分布。模型中這兩個參數(shù)對支持向量個數(shù)、模型計算的復雜度和精確度都有很大的影響[22]。因此,為了提高模型的準確度和降低模型的復雜度,本研究分別采用網(wǎng)格劃分法(Grid)和粒子群優(yōu)化算法(PSO)對模型的懲罰參數(shù)c和核函數(shù)參數(shù)g進行了優(yōu)化。表2結(jié)果顯示,在建立SVM分類模型時,采用Grid法優(yōu)化得到的c和g值,對測試集的預測的正確率更高,因此選用Grid法優(yōu)化的c和g的值作為SVM分類模型的建模參數(shù)。

表2 兩種優(yōu)化方法所建校正模型對訓練集和測試集樣本進行分類判別的結(jié)果比較Table 2 Comparison of the correct recognition and prediction ability of the calibration models developed by Grid and POS

2.2.3 PCA-SVM分類模型的建立 采用2.2.1中得到的訓練集數(shù)據(jù)新特征變量作為輸入自變量,以食用植物油種類作為因變量,以2.2.2中得到的最優(yōu)c,g值作為模型參數(shù),建立PCA-SVM分類模型。采用測試集樣品對模型的分類準確率進行評價,結(jié)果見表2中Grid項結(jié)果。結(jié)果顯示,建立的PCA-SVM分類模型對訓練集和測試集的分類正確率均為100%。SVM是一種有監(jiān)督的機器學習方法,該方法在小樣本、非線性和高維數(shù)據(jù)空間的模式識別問題上擁有傳統(tǒng)模式識別方法所不具備的獨特優(yōu)勢,特別適用于小樣本量的復雜體系分析及數(shù)據(jù)挖掘。因此,在原理上,在樣本量增加情況下,分類的準確率應不會有顯著降低,但實際結(jié)果,還應通過增加樣品量來驗證。

2.3 PCA-SVM分類模型與SIMCA分類模型的分類結(jié)果對比

2.3.1 SIMCA分類模型的建立 采用1.2.2中得到的訓練集數(shù)據(jù)建立SIMCA分類模型,選用中心化法(Center,Ctr)進行數(shù)據(jù)標度換算。優(yōu)選的主成分數(shù)分別是4、4、4、3、4、5、2時,7種食用植物油被100%聚類識別。在利用訓練集樣本建立的SIMCA辨別模型對測試集樣本進行驗證,結(jié)果見表3。

表3 PCA-SVM和SIMCA分類模型的結(jié)果對比Table 3 Comparison of the correct recognition and prediction ability of the calibration models constructed by PCA-SVM and SIMCA

2.3.2 兩種分類模型效果對比 分別采用PCA-SVM和SIMCA兩種方法建立7種食用植物油的分類模型,分別對測試集數(shù)據(jù)進行預測,結(jié)果見表3。結(jié)果顯示,PCA-SVM法和SIMCA法模型的訓練集的分類正確率相同,均為100%,但對測試集的進行分類時,PCA-SVM模型要的正確率要遠遠高于SIMCA模型。

SIMCA是一種基于主成分分析的有監(jiān)督模式識別方法,其核心思想是對訓練集中的每個樣本分類分別建立一個主成分分析模型以對其進行描述。該方法以經(jīng)典的統(tǒng)計學數(shù)學理論為依據(jù)的,著眼于最大似然的基點,要求“殘差平方和”最小,因而通常需要訓練樣本數(shù)目接近無限大時其有效性才能被真確的顯露出來。SVM是一種有監(jiān)督的機器學習方法,該方法在小樣本、非線性和高維數(shù)據(jù)空間的模式識別問題上擁有傳統(tǒng)模式識別方法所不具備的獨特優(yōu)勢,因此目前在涉及統(tǒng)計分類以及回歸分析的諸多相關領域中得到了廣泛的應用,特別適用于復雜體系分析及數(shù)據(jù)挖掘。但因在實際的食品檢測工作中所能獲得的樣本數(shù)量往往非常有限,因此SVM法更適合實際監(jiān)測工作的要求。

3 結(jié)論

本研究采用1H-NMR結(jié)合PCA-SVM對7種市面上常見的食用植物油進行了分類研究。采用網(wǎng)格劃分法優(yōu)化得到模型最優(yōu)核函數(shù)參數(shù)為1.7411,最優(yōu)懲罰參數(shù)為0.3299。本研究結(jié)果顯示,采用PCA-SVM算法建立的分類模型對測試集樣品分類的正確率要遠高于SIMCA分類模型,因此SVM法更適合實際監(jiān)測工作中建模樣本量小的要求,適于食用植物油的快速分類鑒別,可以快速、有效的鑒別食用植物油種類,適合實際食品檢測工作中建模樣本有限的實際,為食用植物油的品質(zhì)鑒別和質(zhì)量控制提供分析方法。

[1]馬冠生,郝利楠,李艷平,等. 中國成年居民食用油消費現(xiàn)狀[J].中國食物與營養(yǎng),2008(9):29-32.

[2]王樂,劉堯剛,陳鳳飛,等. 地溝油的污染及變質(zhì)情況研究[J].武漢工業(yè)學院學報,2007,26(4):1-4,12.

[3]林晨,張方圓,吳凌濤,等. 氣相色譜結(jié)合化學計量學分析4 種食用植物油的指紋圖譜[J]. 分析測試學報,2016,35(4):454-459.

[4]王同珍,陳孝建,安愛,等. 氣相色譜-質(zhì)譜技術結(jié)合化學計量學對5種動物油進行判別分析[J]. 分析測試學報,2016,35(5):557-562.

[5]李娟,范璐,畢艷蘭,等.紅外、近紅外光譜-簇類的獨立軟模式方法識別植物調(diào)和油脂[J]. 分析化學,2010,38(4):475-482.

[6]黃曉東,謝飛飛,尤勇,等.食用植物油傅里葉變換紅外光譜鑒別的研究[J]. 安徽工程大學學報,2014,29(4):4-7.

[7]趙薇,劉翠玲,孫曉榮,等. 應用拉曼光譜技術識別食用油的種類[J]. 食品科技,2015,40(3):274-277.

[8]Blanco M,Coello J,Iturriaga H,et al. Calibration in non-linear near infrared reflectance spectroscopy:A comparison of several methods[J].Analytica Chimica Acta,1999,384(2):207-213.

[9]Despagne F,Massart D L,Chabot P. Development of a Robust Calibration Model for Nonlinear In-Line Process Data[J]. Analytical Chemistry,2000,72(7):1657-1665.

[10]Blanco M,Pages J. Classification and quantitation of finishing oils by near infrared spectroscopy[J]. Analytica Chimica Acta,2002,463(2):295-303.

[11]王春艷,史曉鳳,李文東,等.基于主成分和支持向量機濃度參量同步熒光光譜油種鑒別[J].分析測試學報,2014,33(3):289-294.

[12]R H inrichs,J Gotz,H Weisser. Water-Holding Capacity and Structure of Hydrocolloid-gels WPC-gels and Yogurts Characterised by means NMR[J]. Food Chemistry,2003,82(1):155-160.

[13]李瑋,姜潔,路勇,等.NMR氫譜定量測定奶酪中總共軛亞油酸的含量[J]. 食品科學,2015,36(10):134-138.

[14]姜潔,李瑋,路勇,等. 核磁共振脈沖寬度法測定嬰幼兒乳粉中乳糖、蔗糖含量[J]. 食品工業(yè)科技,2015,36(8):68-71,77.

[15]李瑋,賈婧怡,姜潔,等. NMR氫譜法分析市售奶油中的脂肪酸[J]. 食品工業(yè)科技,2016,37(23):319-323.

[16]李瑋,賈婧怡,李龍,等. 核磁共振代謝組學技術鑒別天然奶油與人造奶油[J]. 食品科學,2017,38(12):278-285.

[17]Andreotti G,Trivellone E,Lamanna R,et al. Milk identification of different species:13C-NMR spectroscopy of triacylglycerols from cows and buffaloes’ milks[J]. Journal of Dairy Science,2000,83(11):2432-2437.

[18]G Vigli,Angelos P,Apostolos S,et al. Classification of edible oils by employing31P and1H NMR spectroscopy in combination with multivariate statistical analysis. A proposal for the detection of seed oil adulteration in virgin olive oils[J]. Journal of Agricultural Food Chemistry,2003,51:5715-5722.

[19]Zou X Q,Huang J H,Jin Q Z,et al. Lipid composition analysis of milk fats from different mammalian species:potential for use as human milk fat substitutes[J]. Journal of Agricultural Food Chemistry,2013,61:7070-7080.

[20]Raffaele S,Francesco A,Livio P.1H and of Virgin Olive Oil.13C NMR An Overview[J]. Magnetic Resonance in Chemistry,1997,35:S133-S145.

[21]Maria L I,Sopelana P,Maria D G.1H Nuclear Magnetic Resonance monitoring of the degradation of margarines of varied compositions when heated to high temperature[J]. Food Chemistry,2014,165:119-128.

[22]李盼池,許少華. 支持向量機在模式識別中的核函數(shù)特性分析[J]. 計算機工程與設計,2005,26(2):2302-2304.

猜你喜歡
植物油食用分類
QuEChERS-氣相色譜-質(zhì)譜法測定植物油中16種鄰苯二甲酸酯
分類算一算
辣椒食用也有禁忌
冷凍食品,如何選購和食用?
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
中國食用植物油供需平衡表
食用芹菜六注意
等離子體聚合廢植物油及其潤滑性能
巩留县| 始兴县| 鄱阳县| 濮阳县| 清水河县| 呼玛县| 甘德县| 梁山县| 平果县| 巧家县| 和田市| 五家渠市| 枣庄市| 尼勒克县| 建昌县| 洛阳市| 湖北省| 玉山县| 商河县| 鄄城县| 东辽县| 海伦市| 张家川| 汉中市| 黄龙县| 新干县| 岳普湖县| 琼海市| 鄂温| 遂昌县| 富川| 太仆寺旗| 汨罗市| 高雄市| 富裕县| 平度市| 都江堰市| 克东县| 元江| 松潘县| 泰宁县|