徐 婧,王玉田,吳希軍,趙 旭
植物油熒光光譜有效信息提取及其自動分類
徐 婧*,王玉田,吳希軍,趙 旭
(燕山大學(xué) 河北省測試計量技術(shù)與儀器重點實驗室,河北 秦皇島 066004)
植物油市場中出售的芝麻油、玉米油和花生油有多種品牌,不同品牌間價格差距較大,且存在假冒的現(xiàn)象,利用熒光光譜技術(shù)可以無損地鑒別購買油種是否為標(biāo)簽所標(biāo)種類。主成分分析方法及平行因子方法可對這3種油種進(jìn)行人工分類,但其存在類間距離相比于類內(nèi)距離過小的不足,在結(jié)合傳統(tǒng)的聚類分析方法時,會造成誤分類現(xiàn)象。本文以提高類間距離、達(dá)到正確聚類為目標(biāo),經(jīng)過比較分析,選擇均值、標(biāo)準(zhǔn)差、光譜重心坐標(biāo)、二階混合中心距、相關(guān)系數(shù)、等價橢圓二倍傾角正切值、在重心激發(fā)波長處的發(fā)射光譜的偏度系數(shù)和峰度系數(shù)作為統(tǒng)計參數(shù),相比于直接使用聚類方法,芝麻油分類的正確率從92.3%提高到100%,玉米油分類的正確率從75%提高到100%,花生油從57.1%提高到100%。用偏最小二乘判別分析方法驗證了本文方法的合理性。本文方法可以用于植物油檢測儀器的自動分類,利于市場監(jiān)管及指導(dǎo)人們?nèi)粘OM。
光譜學(xué); 植物油分類; 統(tǒng)計參數(shù); 類間距離
植物油中含有豐富的不飽和脂肪酸和人體所需的必須脂肪酸,食用植物油有利于人的身體健康。植物油的主要成分是甘油三酯(95%~98%),同時含有少量多種類別的其他成分[1],很多學(xué)者采用不同的方法對植物油進(jìn)行了研究[2-14]。
熒光光譜結(jié)合化學(xué)計量學(xué)技術(shù)可以有效區(qū)分未知植物油的種類以及用于植物油的摻雜檢測研究。在食品加工及植物油市場監(jiān)管中,利用熒光方法,可以非接觸、快速地進(jìn)行植物油質(zhì)量檢測。對于一些有經(jīng)驗的人士,可以從植物油的味道、顏色及一些其他物理屬性對不同的植物油區(qū)分,由于生產(chǎn)產(chǎn)地、批次的不同,這些性質(zhì)會有一定不同,同時使用食品添加劑等手段也可以有效改變植物油的物理性質(zhì),從而影響人們對植物油種類的辨別。因此,需要一種有效的檢測方法給消費者提供可靠的參考。
芝麻油、玉米油、花生油是超市中常見的3種植物油,它們具有不同的價格和營養(yǎng)價值。即使是同一種類的植物油,不同廠家生產(chǎn)的產(chǎn)品,其價格也具有很大差距。有些不良商家為了牟取暴利,會利用廉價植物油添加一些添加劑,假冒高價格的植物油。隨著食品添加劑的發(fā)展,一些常規(guī)的物理快速識別方法已難以有效對植物油種類進(jìn)行判斷,而采取化學(xué)方法進(jìn)行判斷又需要一些專業(yè)的儀器及經(jīng)過培訓(xùn)的專業(yè)人員,難以適用于廣大消費者。因此研究一種簡單、不需復(fù)雜的化學(xué)前處理的熒光植物油種類區(qū)分的方法,使不經(jīng)過專業(yè)培訓(xùn)的普通消費者也可以有效區(qū)分不同種類的植物油,讓每個人都可以成為植物油市場的監(jiān)管者,對進(jìn)一步規(guī)范植物油市場有一定價值。
主成分分析法(PCA)及平行因子分析法(PARAFAC)是目前最常用的熒光分析方法,有一些學(xué)者已經(jīng)應(yīng)用熒光光譜結(jié)合化學(xué)計量學(xué)方法對植物油的分類及摻雜進(jìn)行了研究并取得了很好的效果。Yvon將主成分分析方法(PCA)應(yīng)用于植物油的特征識別[15]。Giancarlo采用PCA進(jìn)行柴油摻雜檢測[16]。Krzysztof 利用PCA結(jié)合偏最小二乘方法(PLS)對特級初榨橄欖油混合物進(jìn)行分析[17]。Noelia利用平行因子方法(PARAFAC)對初榨橄欖油的化學(xué)改變進(jìn)行分析[18]。
本文首先利用聚類分析、PCA及PARAFAC方法對3種常見植物油進(jìn)行分類。對于PCA及PARAFAC的分析結(jié)果,需要有一定相關(guān)知識的人員才能進(jìn)行分析,不利于應(yīng)用于自動化檢測儀器。因此,在分析分類結(jié)果的基礎(chǔ)上,本文提出一種特征參數(shù)提取結(jié)合聚類分析的方法,對3種植物油進(jìn)行分類。
對于不同種類的植物油,提取合理的特征參數(shù)是正確分類的保證,本文采購了超市中常見種類的植物油,對其進(jìn)行分析,通過比較選擇,選出適用于這3種植物油分類的特征參數(shù)。最后利用偏最小二乘判別分析(PLSDA)驗證了所選參數(shù)的有效性。
由于PCA及PARAFAC為較成熟方法,此處不做過多說明,僅對本文所選特征參數(shù)進(jìn)行說明。通過比較分析,最終選定的適用于3種植物油分類的統(tǒng)計參數(shù)包括均值、標(biāo)準(zhǔn)差、光譜重心坐標(biāo)、二階混合中心距、相關(guān)系數(shù)、等價橢圓二倍傾角正切值、在重心激發(fā)波長處的發(fā)射光譜的偏度系數(shù)和峰度系數(shù)。
式(1)為均值表達(dá)式,其中zxy是在點(x,y)處的熒光強度,x為發(fā)射波長,y為激發(fā)波長,E表示求數(shù)學(xué)期望:
(1)
式(2)為標(biāo)準(zhǔn)偏差表達(dá)式:
(2)
式(3)為求解重心坐標(biāo)表達(dá)式:
(3)
式(4)為二階混合中心距表達(dá)式:
g=E[(x-mx)2]·E[(y-my)2].
(4)
式(5)為相關(guān)系數(shù)表達(dá)式:
(5)
式(6)為等價橢圓表達(dá)式:
(6)
式(7)為橢圓一般方程:
Ax2+Bxy+Cy2+Dx+Ey+1=0.
(7)
式(8)為一般等價橢圓二倍角正切值表達(dá)式:
(8)
結(jié)合式(6)、(7)、(8),可以推導(dǎo)出等價橢圓二倍角正切值的表達(dá)式:
(9)
重心坐標(biāo)激發(fā)波長對應(yīng)發(fā)射光譜偏度系數(shù)表示為
(10)
重心坐標(biāo)激發(fā)波長對應(yīng)發(fā)射光譜峰度系數(shù)表示為
(11)
PARAFAC方法應(yīng)用于掃描得到的熒光數(shù)據(jù)組成的熒光數(shù)據(jù)矩陣。PCA方法及特征參數(shù)提取結(jié)合聚類分析方法應(yīng)用于重排矩陣,即將每個樣本光譜的發(fā)射光譜沿激發(fā)波長增加方向進(jìn)行重排,由矩陣形式變?yōu)橄蛄啃问健?/p>
實驗樣本為從超市中選購的21瓶不同品牌植物油,包括芝麻油、玉米油、花生油3個品種。這3種植物油產(chǎn)自不同生產(chǎn)廠家,數(shù)量眾多且難于區(qū)分優(yōu)劣,因此分析這3種植物油更有利于消費者進(jìn)行比較選購。 在此不對各品牌植物油進(jìn)行標(biāo)明,僅以序號進(jìn)行區(qū)分,標(biāo)號1~13為芝麻油,標(biāo)號14~17為玉米油,標(biāo)號18~21為花生油。
實驗采用FS920熒光光譜儀測試樣品的熒光光譜,所有的樣本不經(jīng)前期處理,直接放入比色皿中進(jìn)行光譜掃描,積分時間為0.2 s,激發(fā)和發(fā)射狹縫均調(diào)節(jié)為1.11 mm。激發(fā)光范圍為250~550 nm,激發(fā)步長為10 nm;發(fā)射掃描范圍為260~750 nm,發(fā)射步長為2 nm。
某品牌的3種植物油的熒光光譜如圖1所示。從圖1中可以看出芝麻油有5個熒光峰,其激發(fā)/發(fā)射光譜范圍分別為500~520/560~590 nm,540/660~680 nm,510/660~680 nm,420/660~680 nm 和 440/650~670 nm。玉米油有一個熒光峰,其激發(fā)/發(fā)射光譜范圍為360~380/400~440 nm?;ㄉ陀袃蓚€熒光峰,其激發(fā)/發(fā)射光譜范圍為360~380/400~440 nm 和 400~420/660~690 nm。由參考文獻(xiàn)[15-18]可知,在激發(fā)/發(fā)射波長范圍為 360~380/400~440 nm 處是不飽和脂肪酸(如油酸和亞油酸)的熒光峰。在激發(fā)/發(fā)射波長范圍為 500~520/560~590 nm,540/660~680 nm 和 510/660~680 nm 處是維生素E及其衍生物的熒光峰。在激發(fā)/發(fā)射波長范圍為 420/660~680 nm,440/650~670 nm 和 400~420/660~690 nm 處是色素(如葉綠素和類胡蘿卜素)熒光峰。從圖中可以看出芝麻油包含色素、維生素E及其衍生物;玉米油包含脂肪酸;花生油包含脂肪酸和色素。3種植物油熒光光譜形狀上的差異可以用于對其進(jìn)行分類。
下面采用直接聚類分析法、主成分分析結(jié)合聚類分析法、平行因子結(jié)合聚類分析方法及特征參數(shù)結(jié)合聚類分析方法對3種植物油進(jìn)行分類,并比較分類結(jié)果。
首先采用直接聚類分析方法對3種植物油進(jìn)行直接聚類分析,具體方法為:將每個樣本的熒光光譜矩陣重排后,直接進(jìn)行聚類分析,結(jié)果如圖2所示。從圖中可以看出,芝麻油樣本10沒有被正確分類,分類正確率為92.3%;花生油樣本20未能與樣本18、19、21分為一類,分類正確率為75%;玉米油與大部分花生油分為一類,在該類別中玉米油含量為57.1%。各種植物油中含有相似的熒光組分,致使熒光光譜具有一定的相似性,直接采用聚類分析方法利用所有光譜信息,降低了種類間差異信息在總信息中的比例,致使分類結(jié)果并不理想。
圖1 芝麻油(a)、玉米油(b)、花生油(c)的熒光指紋圖。Fig.1 Contour plots of sesame oil (a),corn oil (b) and peanut oil (c),respectively.
然后,采用主成分分析結(jié)合聚類分析方法進(jìn)行分類。將每個樣本的熒光光譜矩陣重排后,進(jìn)行PCA分析。各因子數(shù)的解釋變量依次為:0.488 2,0.671 3,0.780 5,0.862 4,0.905 0,0.921 3,0.935 3,0.945 6,0.953 8,0.961 4,0.968 8,0.975 9,0.982 2,0.987 7,0.992 5,0.994 9,0.996 5,0.997 9,0.999 0,1.000 0。PC1和PC2的得分圖如圖3(a)所示,PC3和PC4的得分圖如圖3(b)所示。其中用紅色的“o”表示芝麻油,綠色的“◇”表示玉米油,用黑色的“*”表示花生油。從解釋變量可以看出,4個主成分的解釋變量可達(dá)86%,包含較多信息,利用前2個主成分進(jìn)行聚類分析的結(jié)果如圖3(c)所示,利用前4個主成分進(jìn)行聚類分析的結(jié)果如圖3(d)所示。
圖2 直接進(jìn)行聚類分析結(jié)果Fig.2 Cluster analysis results
PC1和PC2的解釋變量可達(dá)0.671 3,從圖中可以看出,通過兩個主成分可以將3種不同的植物油劃分到3個不同的區(qū)域,不存在混疊現(xiàn)象。在圖2中,芝麻油的PC1均顯示為負(fù)值,玉米油和花生油的PC1均為正值,通過PC1的正負(fù),可以有效地將芝麻油與另外兩種進(jìn)行區(qū)分。從3種植物油的成分考慮,PC1應(yīng)代表脂肪酸。玉米油的PC2值小于-15,花生油的PC2的值大于-15,因此通過PC2與-15比較大小,可以有效區(qū)分玉米油與花生油。由3種植物油的成分推斷,PC2應(yīng)該表示色素。同時,芝麻油樣本5、8、9、11在激發(fā)/發(fā)射波長范圍420/660~680 nm、440/650~670 nm 和400~420/660~690 nm處都有較低的熒光強度,也從另一方面印證了關(guān)于PC2的推斷。各不同油種的PC3、PC4得分較為相近,不具有區(qū)分性。
從圖3(c)可以看出,利用前兩個主成分可以對芝麻油進(jìn)行正確分類,但是不能正確區(qū)分玉米油和花生油,花生油樣本20未能與樣本18、19、21分為一類,分類正確率為75%;玉米油與大部分花生油分為一類,在該類別中玉米油含量為57.1%。
圖3 (a)PC1和PC2的得分圖;(b)PC3和PC4的得分圖;(c)利用2個主成分聚類分析結(jié)果;(d)利用4個主成分聚類分析結(jié)果。Fig.3 (a) Score plot of PC1 and PC2.(b) Score plot of PC3 and PC4.(c)Cluster analysis results using two principal components.(d)Cluster analysis results using four principal components.
從圖3(d)可以看出,利用4個主成分進(jìn)行分類時,3種油均會產(chǎn)生誤分類,芝麻油樣本10未能正確分類到芝麻油類別中,分類正確率為92.3%;花生油樣本20未能與樣本18、19、21分為一類,分類正確率為75%,玉米油被誤分到芝麻油和花生油類別中。從中可以看出,采用更多的信息并不能改善分類結(jié)果,反而由于加入了對分類不具有區(qū)分性的主成分3和4,降低了有效分類信息的比例,使分類結(jié)果變差,說明了合理選擇進(jìn)行有效分類信息的必要性。在本試驗樣本中,雖然4個主成分的解釋量較大,但并不適用于正確分類。本文所提出的統(tǒng)計參數(shù)的選擇則很好地解決了合適信息量提取的問題。
圖2清晰地說明了利用PCA得到的兩個主成分具有的區(qū)分3種不同植物油的能力,但也顯示出了不足,即需要有經(jīng)驗的人員來進(jìn)行區(qū)分,不同油種間的區(qū)分需要一定的先驗知識。相比于類間距,類內(nèi)距離過大,不利于利用聚類分析等方法自動分類,常會導(dǎo)致誤分類的情況發(fā)生,如圖3(c)所示。
下面采用PARAFAC方法結(jié)合聚類分析方法對3種油種進(jìn)行分類。首先利用PARAFAC方法,分析三維熒光陣列,將光譜矩陣分解為特征組分光譜的線性組合,采用核一致方法確定正確的因子數(shù)。核一致結(jié)果如圖4所示。
從圖中看出合適的因子數(shù)是4個。圖5顯示了分解得到的相應(yīng)激發(fā)和發(fā)射光譜圖。因子1和因子2的得分圖如圖6(a)所示,因子3和因子4的得分圖如圖6(b)所示。其中用紅色的“o”表示芝麻油,綠色的“*”表示玉米油,用黑色的“◇”表示花生油。利用4個因子進(jìn)行聚類分析的結(jié)果如圖6(c)所示。
圖5顯示因子3的激發(fā)/發(fā)射熒光峰的位置是520 nm/580,662 nm,因子1的激發(fā)/發(fā)射熒光峰的位置是360 nm/418 nm,因子4的激發(fā)/發(fā)射熒光峰的位置是440,460 nm/520,674 nm,因子2的激發(fā)/發(fā)射熒光峰的位置是 390 nm/455,674 nm。根據(jù)之前的分析,假設(shè)因子1是不飽和脂肪酸,因子2是植物油的氧化產(chǎn)物和葉綠素,因子3為維生素E及其衍生物,因子4是脂肪酸氧化產(chǎn)物。
圖4 核一致分析結(jié)果圖Fig.4 Result of core consistency diagnostic
圖5 (a) 因子激發(fā)光譜圖;(b)因子發(fā)射光譜圖。Fig .5 (a) Excitation spectra of the factors.(b) Emission spectra of the factors.
圖6 (a) 因子1和因子2的得分圖;(b)因子3和因子4的得分圖;(c)利用平行因子得分聚類分析結(jié)果圖。Fig.6 (a) Score plot of Fac.1 and Fac.2.(b) Score plot of Fac.3 and Fac.4.(c) Cluster analysis results using scores of PARAFAC.
圖6顯示芝麻油有低的因子1和因子2得分和高的因子3和因子4的得分。玉米油有低的因子3的得分,花生油有有較高的因子3和因子4的得分。從中可以看出,通過各因子的不同得分可以區(qū)分3種不同的植物油。芝麻油的因子1和因子2的得分均較低,小于0.5。玉米油的因子1和因子2的得分均大于0.5且因子3的得分小于1.5?;ㄉ偷囊蜃?和因子2的得分高于0.5且因子4的得分高于5。圖5 顯示PARAFAC方法有能力區(qū)分3種不同類型的植物油。
圖6(c)中芝麻油樣本10未能正確分類到芝麻油類別中,分類正確率為92.3%?;ㄉ碗m然全被分到一類中,但是所分類別中含有芝麻油和玉米油,未能與其進(jìn)行有效區(qū)分,類別中,花生油僅占57.1%,玉米油未能明顯聚為一類。與PCA方法一樣,PARAFAC方法的一個不足是類內(nèi)距離相比于類間距離過大,不利于利用傳統(tǒng)的聚類分析方法對其進(jìn)行自動分類。
最后,采用本文提出的統(tǒng)計參數(shù)提取結(jié)合聚類分析方法進(jìn)行植物油的分類,首先重排熒光光譜矩陣,從每個重排的光譜中提取9個統(tǒng)計參數(shù)作為聚類分析的依據(jù)。采用最大Bullock距離進(jìn)行聚類。聚類結(jié)果如圖7所示。
圖7 聚類分析聚類樹結(jié)果圖Fig.7 Cluster tree of cluster analysis
圖7顯示,3種不同種類植物油均被正確分類。由于玉米油和花生油相比于芝麻油有更加相似的光譜,所以玉米油和花生油先于芝麻油聚成一類。正確的分類說明此時類間距離明顯大于類內(nèi)距離,提取的統(tǒng)計參數(shù)可以有效改善分類結(jié)果。
為了便于比較,表1列出5種方法的分類結(jié)果。
表1 5種方法植物油分類正確率結(jié)果比較Tab.1 Comparison of classification accuracy rate of five kinds of classification methods of vegetable oils
從表1中可以看出,各種方法對芝麻油的分類均較為理想,分類結(jié)果均可達(dá)到90%以上,其主要原因是由于芝麻油組分與其余兩種植物油差別較大?;ㄉ头诸惤Y(jié)果均可達(dá)到50%以上。采用前幾種方法的玉米油的分類效果最差,在某些情況下不能單獨聚類,被分類到其余兩種植物油種類中。經(jīng)過本文選擇的特征參數(shù)提取后,再進(jìn)行分類,各種植物油均可正確分類,這是有效提取了其光譜差異信息的結(jié)果,突出光譜形狀的特異性信息在總信息中的比例,從而提高分類正確率。
最后,應(yīng)用PLSDA來驗證方法的正確性。從每種植物油中選擇一個作為未知樣本,將其余樣本用于建模,計算PLSDA的最佳組分?jǐn)?shù)。參數(shù)分別為“autoscaling”,“bates”,“venetian blinds”數(shù)選擇為5。結(jié)果顯示,組分?jǐn)?shù)選擇為3是合適的。分類結(jié)果顯示,誤差率是0.00,精度為1.00。分類的方差和系數(shù)圖如圖8所示。
從圖8可以看出,本文所選9個統(tǒng)計參數(shù)對分類均有作用,不同統(tǒng)計參數(shù)在不同的分類中具有不同的作用。正確地使用統(tǒng)計參數(shù)可以保證正確分類。文中3個未知樣本均被正確分類。
圖3和圖6表明,PCA和PARAFAC均可用于不同種類植物油的分類,但同時也有一點不足,即類間距離相比于類內(nèi)距離過小,不利于采用聚類分析方法對其進(jìn)行自動分類,容易產(chǎn)生錯分類的現(xiàn)象。經(jīng)驗證,統(tǒng)計參數(shù)結(jié)合聚類分析方法是一種可以正確分類植物油的可行方法,通過正確地選擇統(tǒng)計參數(shù),使得類間距離相比于類內(nèi)距離變大,在使用聚類分析時,可以減小誤分類的概率。
圖8 類1(a)、類2(b)和類3(c)的方差和系數(shù)圖。Fig .8 Plot of variables and coefficients for class 1(a),class 2(b) and class 3(c),respectively.
由于不同的化學(xué)組分決定了不同的光譜形狀,從而使光譜曲線具有不同的統(tǒng)計參數(shù),因此通過統(tǒng)計參數(shù)的合理選擇可以區(qū)分不同種類的熒光物質(zhì)。
本文經(jīng)過比較后確定了適合3種植物油的統(tǒng)計參數(shù)。由于不同種類植物油光譜的特異性,本文所選特征參數(shù)僅針對該3種植物油,對于其余種類的植物油分類可能需要增加、減少或替換其中一些統(tǒng)計參數(shù)。針對特殊需要,需要進(jìn)行具體分析,才可以達(dá)到最佳效果。但本文給出的統(tǒng)計參數(shù)可為其余油種分類提供參考。在此基礎(chǔ)上,依據(jù)具體特征進(jìn)行改進(jìn)。因此,本文所選特征參數(shù)具有一定的指導(dǎo)意義。
針對芝麻油、玉米油、花生油的21個樣本,分別采用直接聚類分析、PCA對重排光譜進(jìn)行分類、PARAFAC對三維陣列進(jìn)行分類、統(tǒng)計參數(shù)提取結(jié)合聚類分析對重排光譜進(jìn)行分類。結(jié)果表明,PCA和PARAFAC方法有能力區(qū)分3種植物油,但具有一個缺點,即類間距離相對于類內(nèi)距離較短,不利于自動分類。在選擇了均值、標(biāo)準(zhǔn)差、光譜重心坐標(biāo)、二階混合中心距、相關(guān)系數(shù)、等價橢圓二倍傾角正切值、在重心激發(fā)波長處的發(fā)射光譜的偏度系數(shù)和峰度系數(shù)作為統(tǒng)計參數(shù)后,可以明顯改進(jìn)這種不足,相比于直接使用聚類方法,芝麻油分類的正確率從92.3%提高到100%,玉米油分類的正確率從75%提高到100%,花生油從57.1%提高到100%,有效減小了誤分類的可能性,可對3種油進(jìn)行自動分類,為基于熒光光譜技術(shù)的便攜式儀器的開發(fā)使用提供了理論和算法基礎(chǔ)。對于其他種類的熒光物質(zhì),由于其組分的特異性,可能需要增加、減少或替換相應(yīng)合適的統(tǒng)計參數(shù)。
[1] SIKORSKA E,ROMANIUK A,KHMELINSKII I V,etal..Characterization of edible oils using total luminescence spectroscopy [J].J.Fluoresc.,2004,14(1):25-35.
[2] TANKEU S,VERMAAK I,KAMATOU G,etal..Vibrational spectroscopy as a rapid quality control method forMelaleucaalternifoliacheel (tea tree oil) [J].Phytochem.Anal.,2014,25(1):81-88.
[3] YUAN J J,WANG C Z,CHEN H X,etal..Prediction of fatty acid composition inCamelliaoleiferaoil by near infrared transmittance spectroscopy (NITS) [J].FoodChem.,2013,138(2-3):1657-1662.
[4] LERMA-GARCA M J,RAMIS-RAMOS G,HERRERO-MARTNEZ J M,etal..Authentication of extra virgin olive oils by Fourier-transform infrared spectroscopy [J].FoodChem.,2010,118(1):78-83.
[5] PEREIRA A F C,PONTES M J C,NETO F F G,etal..NIR spectrometric determination of quality parameters in vegetable oils usingipls and variable selection [J].FoodRes.Int.,2008,41(4):341-348.
[6] ARMENTA S,GARRIGUES S,DA LA GUARDIA M.Determination of edible oil parameters by near infrared spectrometry [J].Anal.Chim.Acta,2007,596(2):330-337.
[7] YANG H,IRUDAYARAJ J,PARADKAR M M.Discriminant analysis of edible oils and fats by FTIR,FT-NIR and FT-Raman spectroscopy [J].FoodChem.,2005,93(1):25-32.
[9] GONZAGA F B,PASQUINI C.A new method for determination of the oxidative stability of edible oils at frying temperatures using near infrared emission spectroscopy [J].Anal.Chim.Acta,2006,570(1):129-135.
[10] MUIK B,LENDL B,MOLINA-DAZA A,etal..Direct,reagent-free determination of free fatty acid content in olive oil and olives by Fourier transform Raman spectrometry [J].Anal.Chim.Acta,2003,487(2):211-220.
[11] BARTHUS R C,POPPI R J.Determination of the total unsaturation in vegetable oils by Fourier transform Raman spectroscopy and multivariate calibration [J].Vib.Spectrosc.,2001,26(1):99-105
[12] 原姣姣.近紅外光譜法對茶油化學(xué)成分及快速鑒偽的研究 [J].生物質(zhì)化學(xué)工程,2013,47(2):64.YUAN J J.Analysis of chemical content and adulteration of camellia oleifera oil by near infrared spectroscopy (Abstract) [J].BiomassChem.Eng.,2013,47(2):64.(in Chinese)
[13] 馮巍巍,付龍文,孫西艷,等.典型食用油的熒光光譜特性與拉曼光譜特性研究 [J].現(xiàn)代科學(xué)儀器,2012(3):57-59.FENG W W,FU L W,SUN X Y,etal..Study on fluoresces spectrum and Raman spectrum for typical cooking oil [J].Mod.Sci.Instrum.,2012(3):57-59.(in Chinese)
[14] 周志琴,陳斌,顏輝.二維相關(guān)近紅外光譜快速鑒別食用植物油種類 [J].中國糧油學(xué)報,2011,26(9):115-118.ZHOU Z Q,CHEN B,YAN H.Identification of edible vegetable oil by two dimensional correlation near-infrared spectroscopy [J].J.Chin.Cereal.OilsAssoc.,2011,26(9):115-118.(in Chinese)
[15] KONGBONGA Y G M,GHALILA H,ONANA M B,etal..Characterization of vegetable oils by fluorescence spectroscopy [J].FoodNutr.Sci.,2011,2(7):692-699.
[16] TOMAZZONI G,MEIRA M,QUINTELLA C M,etal..Identification of vegetable oil or biodiesel added to diesel using fluorescence spectroscopy and principal component analysis [J].J.Am.OilChem.Soc.,2014,91(2):215-227.
[18] TENA N,APARICIO R,GARCA-GONZLEZ D L,etal..Chemical changes of thermoxidized virgin olive oil determined by excitation-emission fluorescence spectroscopy (EEFS) [J].FoodRes.Int.,2012,45(1):103-108.
徐婧(1989-),女,山東昌邑人,博士,2017年于燕山大學(xué)獲得博士學(xué)位,主要從事熒光光譜分析、海洋遙感方面的研究。
E-mail: ysuxujing@163.com
Effective Information Extraction of Vegetable Oil Fluorescence Spectrum and Its Automatic Classification
XU Jing*,WANG Yu-tian,WU Xi-jun,ZHAO Xu
(MeasurementTechnologyandInstrumentionKeyLaboratoryofHebeiProvince,YanshanUniversity,Qinhuangdao066004,China)
There are many brands of sesame oil,corn oil and peanut oil in the vegetable oil market.There is a big difference among the price of different brands,and the phenomenon of counterfeiting is existing.Fluorescence spectroscopy can be used to identify the real label of the oil species.Principal component analysis and parallel factor method can classify manually three species of oils,but there is a problem that the distance between classes is too small compared to the in-class distance,and it is easy to cause misclassification when the traditional clustering analysis method is used.In order to improve the distance between classes to achieve the correct clustering,the mean,standard deviation,gravity coordinates of spectral center,second-order mixed center distance,correlation coefficient,equivalent elliptical double diagonal tangent,the skewness coefficient and the kurtosis coefficient of the emission spectrum at gravity excitation wavelength are selected as statistical parameters after the comparative analysis.Compared to the traditional clustering methods,the accuracy rate of sesame oil classification increased from 92.3% to 100%,and the accuracy of corn oil classification increased from 75% to 100% and the accuracy of the peanut oil classification increased from 57.1% to 100%.Finally,partial least squares discriminant analysis is used to verify the validity of the selected method.The method used here can be used for automatic classification of vegetable oil in detection equipment,which will help regulate the market and guide people’s daily consumption.
spectroscopy; vegetable oil classification; statistical parameters; distance between classes
2017-01-23;
2017-04-10
國家自然科學(xué)基金(61471312);河北省研究生創(chuàng)新項目(2016SJBS021);河北省自然科學(xué)基金(F2015203072,C2014203212)資助項目
1000-7032(2017)09-1240-09
TP394.1; TH691.9
A
10.3788/fgxb20173809.1240
*CorrespondingAuthor,E-mail:ysuxujing@163.com
Supported by National Natural Science Foundation of China (61471312); Graduate Student Innovation Fund Project in Hebei (2016SJBS021); National Natural Science Foundation of Hebei (F2015203072,C2014203212)