黃文萍,趙依琳,楊如玲,韋 濤,孟 玥,張正勇
(南京財經(jīng)大學 管理科學與工程學院,江蘇 南京 210023)
在全面建設社會主義現(xiàn)代化國家的新征程中,人們?nèi)找嬖鲩L的高品質食品需求與潛在的制假售假間的矛盾成為食品質量安全管理領域關注的核心問題之一,鑒別技術是解決這一問題的關鍵支撐。乳制品作為食品的重要組成部分,受2008 年三聚氰胺等事件影響,時至今日,其仍舊是質量安全監(jiān)管部門和消費者關注的重點對象[1-2]?,F(xiàn)有的鑒別方法主要包括以下4 種類型:① 感官檢驗,主要是依靠人的感覺器官進行判斷,具有一定的主觀性;② 理化檢測法,主要依據(jù)一些物理特性值如旋光性[3],或者一些特征化學成分如氨基酸、同位素[4-7]進行鑒別;③ 生化檢測法,主要是依據(jù)乳品基因序列進行判別[8-9];④ 計算機智能鑒別算法與譜圖數(shù)據(jù)相結合進行模式識別[10-12],較之前的3 種方法,計算機輔助鑒別技術具有運算速度快、結果評價客觀等優(yōu)勢,成為鑒別技術研發(fā)的熱點。
譜圖數(shù)據(jù)可以表征乳制品的化學質量特性,并作為智能鑒別算法的數(shù)據(jù)輸入,經(jīng)過判別函數(shù)運算構建鑒別模型,用以未知樣品類別歸屬測算。本實驗選用可以高效表征乳制品分子振動特性并具有采集速度快、可無損檢測等優(yōu)勢的拉曼光譜,開展譜圖數(shù)據(jù)小波變換處理等研究,以期為挖掘譜圖數(shù)據(jù)信息,提高鑒別模型適應性提供技術參考。
實驗用乳酪制品均購置于南京蘇果超市,原味口味,選取3 個品牌,分別標記為品牌xx(a),品牌yy(b)和品牌zz(c),每個品牌25 個樣品,共計75 個樣品。
Prott-ezRaman-D3 型激光拉曼光譜儀:美國Enwave Optronics 公司;96 孔板:美國Corning Incorporated 公司。
取一定量的乳酪制品置于96 孔板的各獨立小孔內(nèi),使得小孔恰好被樣品充滿。將激光拉曼光譜儀的探頭固定于小孔上方(恰好直射樣品)。激光拉曼光譜儀控制參數(shù):激光波長為785 nm,激光最大功率約為450 mW,CCD 檢測器,溫度為-85 ℃,樣品采集積分時間為80 s,掃描次數(shù)為1 次,光譜波數(shù)收集范圍為250~2 000 cm-1,光譜分辨率為1 cm-1。
測試獲得樣品譜圖數(shù)據(jù)后,使用光譜儀自帶的SLSR Reader V8.3.9 軟件進行基線校正,校正后的譜圖數(shù)據(jù)歸一化處理使用mapminmax 函數(shù),歸一化至[0,1]區(qū)間。小波軟閾值降噪使用wden 函數(shù),小波增強使用wavedec 函數(shù)進行譜圖數(shù)據(jù)小波分解,而后使用waverec 函數(shù)進行小波重構。小波變換處理、歸一化、k 近鄰算法的運算平臺采用Matlab 軟件(美國MathWorks 公司,版本為2016 a)。
實驗采集的乳酪制品為乳黃色含水分的近似固體,可以直接上樣測試,無需樣品前處理,且由于水分子的拉曼散射界面較小,無明顯拉曼信號也不影響拉曼測試。實驗采集的3 種不同品牌乳酪制品的拉曼光譜圖如圖1 所示。由圖1 可以看出,3 個品牌乳酪制品的拉曼光譜在同一個波數(shù)附近都出現(xiàn)了波峰,起伏程度也十分接近,且有相似性,結合已有文獻報道[13-15]可知,該類波峰的產(chǎn)生主要源于乳制品中糖類、脂肪、蛋白質分子相關的變形振動、伸縮振動與扭曲振動等。3 個品牌乳酪制品的拉曼光譜在800~1 800 cm-1區(qū)間振動較為劇烈,出峰明顯。其中:與糖類有關的拉曼譜峰有850 cm-1,源于C—C—H 變形振動和 C—O—C 變形振動;940 cm-1處的峰,源于C—O—C 變形振動、C—O—H 變形振動以及C—O 伸縮振動;1 079 cm-1和1 145 cm-1處的峰,源于C—O—H 變形振動、C—O 伸縮振動以及C—C 伸縮振動;與脂肪有關的峰有1 314 cm-1,源于脂肪酸的—CH2扭曲振動;1 760 cm-1處的峰,源于C ═O 伸縮振動;與蛋白質有關的峰有1 019 cm-1處的,源于苯丙氨酸的環(huán)振動即環(huán)內(nèi)C—C 對稱伸縮振動;最高峰1 457 cm-1則是源自糖類和脂肪分子—CH2變形振動;以及1 670 cm-1是源自蛋白質的酰胺I 鍵C ═O 伸縮振動和不飽和脂肪酸C ═C 伸縮振動??梢?,拉曼光譜表征出豐富的乳酪制品分子信息,但由于譜圖信號較為相似,僅憑裸眼難以實現(xiàn)高效分類鑒別,需要借助計算機識別算法開展進一步判別分析。
將采集獲得的乳酪制品拉曼光譜數(shù)據(jù)導入k 近鄰算法,判別條件為馬氏距離,k = 1,隨機選擇80%的樣品數(shù)據(jù)為訓練集,余下20%的樣品數(shù)據(jù)為測試集[16],重復隨機循環(huán)測試100 次,計算得出測試平均值,記為識別率,結果為82.27%。由于實驗樣品的拉曼譜圖較為相似,直接使用原始數(shù)據(jù)進行類別判別,識別率有限;而且拉曼光譜原始數(shù)據(jù)中含有隨機噪聲、冗余信息,制約了鑒別模型的準確性。因此,實驗進一步運用小波變換方法的多尺度、多分辨特性,首先進行了小波降噪處理,基本思路是將拉曼光譜信號進行小波分解,保留高于閾值的小波系數(shù),濾除小于閾值的噪聲系數(shù),而后通過逆小波重構獲得降噪后的譜圖數(shù)據(jù)。實驗采用wden 函數(shù),綜合比較分析了小波基(wname)、分解尺度(n)、閾值處理噪聲水平(scal)、函數(shù)選擇閾值使用方式(sorh)以及閾值選擇標準(tptr)參數(shù)條件下的模型識別率。實驗采用小波軟閾值去噪法,因此在考慮閾值使用方式(sorh)時,設定sorh = s,(注:sorh = s,為軟閾值;sorh = h,為硬閾值)。設置tptr 的變量為4 個,分別為:rigrsure、heursure、sqtwolog 和minimaxi;設置scal 的變量為3 個,分別為:one、sln 和mln;設置分解尺度為5個,即n=1、2、3、4、5,研究了4 類小波中各5 個常見小波基,分別為Biorthogonal 小波系中bior1.1、bior1.5、bior2.2、bior2.4 與bior3.1,Coiflet 小波系中的coif1、coif2、coif3、coif4 與coif5,Daubechies 小波系中db1、db2、db3、db4 和db5,Symlets 小波系中sym1、sym2、sym3、sym4 和sym5。最終選擇了tptr= heursure,sorh = s,scal = mln,n = 4,wname = coif1為小波降噪條件,降噪后的乳酪制品拉曼光譜結果如圖2 所示,識別率為86%。此結果表明,運用合適的小波降噪方法,可以有效降低隨機噪聲,改善譜圖質量,還可以減少噪聲對模型識別效果的影響,一定程度上提高了分類算法的準確率。
小波降噪后分類算法識別率有所上升,提示譜圖各波段對于識別結果的影響有所不同,進一步開展特征提取實驗。首先采用小波增強方法,增強有效貢獻信號,基本思路是采用小波函數(shù)對譜圖數(shù)據(jù)進行分解,而后對分解系數(shù)進行選擇性增強與削弱,再通過小波重構獲取處理后譜圖。選用sym5 小波函數(shù)對前述拉曼光譜數(shù)據(jù)進行了2 層分解,對于>100 的小波分解系數(shù)賦予2 倍增強,對于≤100的小波分解系數(shù)賦予0.5 倍削弱,在融合后系數(shù)基礎上進行了譜圖重構,結果如圖3 所示,識別率為87.07%。此結果表明,小波增強法進一步凸顯了特征波段,一定程度上提高了識別率。進一步將圖3所示譜圖波段劃分為10 個特征波段區(qū)間,計算得到對應的識別率如表1 所示。各波段對識別率影響不同,進一步開展融合分析。將10 個特征波段區(qū)間融合,識別結果為86.8%。而當1 240 ~1 400 cm-1與1 595 ~1 710 cm-1波段融合后,識別率可以達到88.6%,運算時間由全波段數(shù)據(jù)小波增強處理后的1.15 s 減少到0.60 s,提高了約48%的運算效率。
表1 基于乳酪制品拉曼光譜的特征波段及對應識別結果
實驗進一步研究了歸一化處理對模型識別效果的影響,通過歸一化處理可以消除量綱的影響,減少數(shù)據(jù)的分散性,提高識別效率[17]。k 近鄰算法設置同前,乳酪制品拉曼光譜數(shù)據(jù)經(jīng)coif1 小波降噪及歸一化處理后導入分類算法,實驗數(shù)據(jù)歸一化至[0,1]區(qū)間,識別率為93.73%,識別率較前有較大提高。進一步進行小波增強,實驗條件為選用sym5 小波函數(shù)對拉曼光譜數(shù)據(jù)進行了2 層分解,對于>0.2 的小波分解系數(shù)賦予1 倍增強,對于≤0.2的小波分解系數(shù)賦予0.5 倍削弱,在融合后系數(shù)基礎上進行譜圖重構,識別結果為94.4%。進一步將小波增強后的拉曼光譜譜圖波段,劃分為10 個特征波段區(qū)間,計算得到對應的識別率如表2 所示。結果也表明不同波段對識別率的影響不同,且經(jīng)過歸一化后,識別率最高波段為波段1 595 ~1 710 cm-1不同于未做歸一化處理時的波段1 240 ~1 400 cm-1。進一步開展融合分析,將10 個特征波段區(qū)間融合,識別結果為92.6%。而當1 415~1 515 cm-1與1 595~1 710 cm-1波段融合后,識別率可以達到95.4%,運算時間也減少到0.60 s。
表2 基于乳酪制品歸一化拉曼光譜的特征波段及對應識別結果
實驗采集了不同品牌乳酪制品的拉曼光譜數(shù)據(jù),與k 近鄰算法聯(lián)用,研究討論了不同譜圖處理條件下鑒別算法的識別準確率,并建立起了一套基于譜圖數(shù)據(jù)處理的鑒別算法優(yōu)化流程。研究結果表明,小波變換處理可以有效實現(xiàn)譜圖數(shù)據(jù)的噪聲濾除與特征信號增強。拉曼光譜數(shù)據(jù)未經(jīng)處理時,鑒別算法識別率僅為82.27%;經(jīng)coif1 小波降噪處理、歸一化處理、sym5 小波增強以及波段1 415~1 515 cm-1與1 595 ~1 710 cm-1融合處理后,識別率可達到95.4%。