黃 煒, 夏阿林, 侯泰東, 雷淵雄
(邵陽學院 食品與化學工程學院,湖南 邵陽422000)
核桃油是一種食用價值很高的植物油脂,富含多不飽和脂肪酸,具有增強腦部記憶力[1-3]、抗氧化、預防心腦血管疾病、降低膽固醇、緩解2型糖尿病、抗腫瘤等生理功能[4-10],深受消費者的喜歡,擁有廣闊的市場前景。消費者在購買核桃油時一般注重品牌和產地,這也驅使不良商家在這兩個方面費盡心思,偽造品牌商標或虛假宣傳來欺騙消費者。因此,迫切需要建立溯源監(jiān)督系統(tǒng),能快速對核桃油的品牌和產地進行識別,提供消費者作為維權依據(jù)并易于廠家打假。
建立溯源監(jiān)督系統(tǒng)需要一定的技術支持,近年來,發(fā)展出不同的光譜檢測手段(近紅外光譜[11-12],低場核磁共振技術[13],熒光光譜[14],紫外-可見光譜[15])和化學識別模式相結合的植物油識別方法;但是,這些光譜技術大部分的研究方向集中于植物油的摻假判別,而對于品牌和產地的識別研究較少。三維熒光光譜技術相對于上述檢測手段具有更高的靈敏度、選擇性,且提供更豐富的化學信息,具有很強的分辨優(yōu)勢,適合于復雜體系的多元分辨。本文采集了同一加工方式的不同品牌、不同產地的4種核桃油的三維熒光光譜,光譜數(shù)據(jù)經主成分分析(PCA)進行特征選取,經篩選的熒光光譜結合兩種化學識別模式(偏最小二乘和人工神經網絡),分別建立品牌識別模型和產地識別模型,以期為發(fā)展核桃油溯源監(jiān)督系統(tǒng)提供技術支持。
冷榨一級核桃油,購于某大型超市,4個品牌3個產地3批次,平均每批次每個品牌25個樣品,共300個樣品,各個品牌容量都為110 mL,帶有防偽標識,樣品具體情況見表1。不同品牌的核桃油都為淡黃色的透明油狀物,帶有淡淡的植物清香,消費者很難通過感官進行區(qū)分。
表1 冷榨一級核桃油樣品具體情況
石油醚(分析純),天津市鑫宇精細化工有限公司。Cary Eclipse熒光分光光度計(配套10 mm的石英比色皿),美國安捷倫科技有限公司。
1.2.1 植物油熒光光譜采集
取1 mL核桃油樣品于10 mm的石英比色皿,放入樣品室,調整參數(shù),進行熒光光譜采集,測下個樣品之前,比色皿需用石油醚潤洗2~3次。另外,樣品開封儲存1個月后,以同樣的操作步驟再采集1次熒光光譜。光譜采集參數(shù):激發(fā)波長選取區(qū)域為200~580 nm,波長間隙10 nm,狹縫間隙10 nm;發(fā)射波長選取區(qū)域為250~700 nm,波長間隙5 nm,狹縫間隙10 nm;掃描速度24 000 nm/min;響應時間0.125 s;電壓400 V。
1.2.2 主成分分析降維
主成分分析(PCA)是常用于特征提取的方法之一,即數(shù)據(jù)的降維和壓縮,降維后的數(shù)據(jù)集保存著原始數(shù)據(jù)的變量,代表著原始數(shù)據(jù)的主要信息[16]。由1.2.1的操作獲取600組激發(fā)-發(fā)射熒光光譜數(shù)據(jù),大小為39(激發(fā))×91(發(fā)射)×600的三維數(shù)據(jù)矩陣。運用PCA在發(fā)射光譜方向進行特征提取,分別選取同品牌或同產地樣品的主成分1組成新的數(shù)據(jù)集,對應建立品牌識別模型和產地識別模型。
1.2.3 偏最小二乘判別(PLS-DA)
偏最小二乘判別是一種融合了偏最小二乘回歸和分類判別能力的線性監(jiān)督分類方法[17],可以用于模式識別。偏最小二乘判別分析是把已知類別的響應變量,設為多個整數(shù)(…,-1,0,1,…),建立模型后,通過預測值的情況進行判別。
核桃油品牌識別時,將其響應變量設計為:“-1”設計為品牌1,“0”設計為品牌2,“1”設計為品牌3,“2”設計為品牌4。建立品牌識別模型后,根據(jù)預測值yi按自設的區(qū)間進行品牌識別。yi<-0.5,歸屬品牌1;-0.5≤yi<0.5,歸屬品牌2;0.5≤yi≤1.5,歸屬品牌3;yi>1.5,歸屬品牌4。
產地識別時,響應變量設計的“-1”“0”“1”分別為吉林、山東、山西,建立產地識別模型后,根據(jù)預測值yi按自設的區(qū)間進行產地識別。其中:yi<-0.5,歸屬吉林;-0.5≤yi≤0.5,歸屬山東;yi>0.5,歸屬山西。
1.2.4 人工神經網絡判別(BP-ANN)
人工神經網絡從本質上看,其實是受到大腦中神經元功能啟發(fā)而建立的數(shù)學模型[18],通過人為賦值把性質相近的特征轉化為啞變量,達到分類目的。對于此次核桃油品牌和產地識別時,把期望輸出值設計為“-1”“0”“1”“2”分別對應品牌1、2、3、4,對應的判別區(qū)間與偏最小二乘設計相同。產地識別時,期望值“-1”設計為吉林產地,期望值“0”設計為山東產地,期望值“1”設計為山西產地,判別區(qū)間的設定也與偏最小二乘設計相同。
1.2.5 數(shù)據(jù)處理
主成分降維算法、偏最小二乘算法、人工神經網絡算法在MATLAB 軟件平臺上自編和運行。采用Origin軟件作圖。
600組光譜數(shù)據(jù)經PCA算法在發(fā)射光譜方向降維后,由原來的三維數(shù)據(jù)集轉換為二維數(shù)據(jù)集,所有樣品的三維熒光主成分降維圖如圖1所示。由圖1可見,經過特征篩選后的600組光譜,因產地或品牌的原因光譜有所差異,但仍然重疊嚴重,肉眼難以區(qū)分。
圖1 所有樣品的三維熒光主成分降維圖
4個品牌不同批次的300個冷榨一級核桃油樣品,隨機挑選200個樣品共400組數(shù)據(jù)為訓練集樣品,100個樣品共200組數(shù)據(jù)為預測集樣品,用于核桃油品牌識別;3個產地的225個冷榨一級核桃油樣品(產地相同的品牌2、3隨機共挑選75個,品牌1、4各挑選75個),隨機挑選150個樣品共300組數(shù)據(jù)為訓練集,75個樣品共150組數(shù)據(jù)為預測集,用于核桃油產地識別。
2.2.1 PLS-DA和BP-ANN的冷榨一級核桃油品牌識別
訓練集及預測集冷榨一級核桃油PLS-DA(a1,b1)和BP-ANN(a2,b2)方法品牌識別結果如圖2所示,PLS-DA和BP-ANN方法冷榨一級核桃油品牌識別結果見表2。從圖2可見:PLS-DA法的訓練集和預測集樣品的預測值與響應變量高度吻合,都能準確落于各自對應的判別區(qū)間,并且其預測值與設定的響應變量高度一致;BP-ANN法與PLS-DA法結果相同,訓練集和預測集樣品都歸屬于對應的品牌區(qū)間,獲得很好的識別結果。由表2可知,PLS-DA法和BP-ANN法對核桃油的品牌識別率都能達到100%,都能準確識別出對應的核桃油品牌。實驗結果表明,使用BP-ANN 法和PLS-DA法對核桃油品牌進行識別分析,可以得到準確、有效、高識別率的結果。
圖2 訓練集及預測集冷榨一級核桃油樣品PLS-DA(a1 ,b1)和BP-ANN(a2,b2)方法品牌識別結果
表2 PLS-DA和BP-ANN方法冷榨一級核桃油品牌識別結果
2.2.2 PLS-DA和BP-ANN的冷榨一級核桃油產地識別
訓練集及預測集冷榨一級核桃油PLS-DA(a1,b1)和BP-ANN(a2,b2)方法產地識別結果如圖3所示。PLS-DA 和BP-ANN方法冷榨一級核桃油產地識別結果見表3。
圖3 訓練集及預測集冷榨一級核桃油樣品PLS-DA(a1 ,b1)和BP-ANN(a2,b2)方法產地識別結果
表3 PLS-DA和BP-ANN方法冷榨一級核桃油產地識別結果
由圖3可看出,由兩種方法得到訓練集和預測集的預測值都準確落于對應設定的產地判別區(qū)間內,特別是PLS-DA判別方法,得到的預測值與設定的響應變量高度吻合,產地歸屬性非常好。由表3可看出,兩種識別方法對于核桃油的產地識別率都高達100%。因此,PLS-DA和BP-ANN方法可以用于核桃油的產地識別。
本實驗選取4個品牌的冷榨一級核桃油用于構建品牌識別模型,共計300 個樣品,分兩個時間段(間隔1個月)采集其熒光光譜數(shù)據(jù);同時,將這4個品牌共3個產地核桃油樣品用于構建產地識別模型,共計225 個樣品,分兩個時間段(間隔1個月)采集熒光光譜數(shù)據(jù)。得到的600組光譜數(shù)據(jù),運用PCA降維,再與PLS-DA和BP-ANN方法相結合,分別建立品牌和產地識別模型。結果表明:三維熒光與PLS-DA和BP-ANN方法相結合,構建的品牌和產地識別模型,所對應的品牌和產地識別率都能達到100%,識別效果很好。本方法同樣可以滿足更多類型的核桃油品牌和產地的識別。