潘 釗,李瑞航,吳希軍*,崔耀耀
1. 燕山大學(xué)河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004 2. 燕山大學(xué)信息科學(xué)與工程學(xué)院,河北 秦皇島 066004
芝麻油又稱香油,含有豐富的營(yíng)養(yǎng)。因市場(chǎng)價(jià)格較高,摻假現(xiàn)象嚴(yán)重。違法商販用菜籽油、大豆油、玉米油等廉價(jià)油勾兌芝麻香精降低成本進(jìn)行銷售,嚴(yán)重?fù)p害了消費(fèi)者權(quán)益和市場(chǎng)健康[1],因此鑒別摻偽芝麻油具有重要應(yīng)用意義。
摻假芝麻油與芝麻油氣味、顏色等物理特性相近,無(wú)法肉眼區(qū)分。目前植物油的鑒別方法主要有紅外光譜法[1-2]、拉曼光譜法[3]、色譜法[4]、熒光光譜法[5]及太赫茲法[6]等。熒光光譜法以其靈敏度高、操作簡(jiǎn)單、分析快速等優(yōu)點(diǎn)在植物油鑒別領(lǐng)域具備一定的優(yōu)勢(shì)[5]。經(jīng)典熒光分析方法結(jié)合主成分分析[7]、平行因子[8]、交替三線性分解[9]及偏最小二乘[10]等算法提取或分離熒光光譜的特征進(jìn)行定性或定量分析取得了很好的效果。近年來(lái),圖像矩法被引用到三維光譜,被證明是定性或定量分析的強(qiáng)大工具[11-13]。但目前在三維光譜領(lǐng)域,有關(guān)圖像矩法的相關(guān)報(bào)道較少,且缺乏較為全面的定性或定量的規(guī)律性分析。圖像矩是從整個(gè)圖像空間計(jì)算得到,反映目標(biāo)的全局信息,包含豐富的光譜信息。通過(guò)找到樣本分類的有效矩值,利用有效矩值即可將樣本準(zhǔn)確分類。矩值法計(jì)算量大,高階矩嚴(yán)重敏感于噪聲是矩值法在應(yīng)用時(shí)的弊端[11]。
本文將小波矩引入三維熒光光譜的定性分析。將三維熒光光譜視為灰度圖,利用小波矩提取光譜形狀的幾何信息。利用多尺度分解(multiresolution signal decomposition, MRSD)一階逼近重構(gòu)光譜構(gòu)造小波矩,在一定程度上克服了矩值法計(jì)算量大、高階矩受噪聲影響嚴(yán)重的弊端,實(shí)現(xiàn)了摻偽芝麻油簡(jiǎn)單快速鑒別。研究小波前兩階矩值的分類效果,結(jié)果表明,前兩階小波矩即可鑒別摻偽芝麻油; 結(jié)合鄧恩分類指數(shù)(Dunn’s cluster validity index, DVI),研究了同階小波矩分類效果及規(guī)律,確定了同階矩中摻假芝麻油定性分析的有效及最佳矩值; 進(jìn)而研究各階小波矩的分類效果及規(guī)律,確定了可以用于摻偽麻油鑒別的各階矩中的目標(biāo)矩值及最佳目標(biāo)矩值。所確定的有效矩值是針對(duì)摻偽芝麻油定性分析的有效特征,計(jì)算任一有效特征,進(jìn)行譜系聚類,即可鑒別摻偽芝麻油。該方法簡(jiǎn)單、快速,可實(shí)現(xiàn)在線測(cè)量。文中研究思路及結(jié)論,為植物油特征提取和分類鑒別提供參考,為保障消費(fèi)者權(quán)益和市場(chǎng)健康提供手段。
從市場(chǎng)隨機(jī)購(gòu)買不同品牌、同品牌不同批次芝麻油樣本Z1—Z16、菜籽油樣本C1、玉米油樣本Y1、大豆油樣本D1和芝麻香精樣本J1。樣品質(zhì)量均由品牌商保證。在實(shí)驗(yàn)室將菜籽油、玉米油、大豆油樣本分別與芝麻香精樣本按不同體積比例(10%~90%)混合,得到菜籽油摻偽樣本JC1—JC9、玉米油摻偽樣本JY1—JY9和大豆油摻偽樣本JD1—JD9。將所有樣本混合后放在攪拌機(jī)上攪拌10 min,而后立刻進(jìn)行熒光光譜采集。樣本信息如表1所列。
表1 樣本信息表Table 1 Reagents and samples
圖1 Z1的三維熒光光譜(a)及灰度圖(b)Fig.1 The 3D fluorescence spectrum (a) andgrayscale map (b) of Z1
設(shè)定FS920熒光光譜儀激發(fā)區(qū)間250~550 nm,步長(zhǎng)為10 nm,發(fā)射波長(zhǎng)260~750 nm,步長(zhǎng)為2 nm,狹縫寬度1.1 mm,對(duì)應(yīng)光譜分辨率為2 nm,采集得到43個(gè)樣本三維光譜數(shù)據(jù)(246×31×43)。每個(gè)樣本的熒光光譜采集三次平均得到最終結(jié)果。將獲得的熒光光譜進(jìn)行激發(fā)發(fā)射校正預(yù)處理。數(shù)據(jù)操作皆在MATLAB R2014a環(huán)境下完成。芝麻油Z1三維熒光光譜圖及對(duì)應(yīng)灰度圖如圖1所示。
1.1.1 小波多尺度分析
小波多尺度分析的嚴(yán)格和完整的介紹參見(jiàn)文獻(xiàn)[14]。以下作理論簡(jiǎn)述:
設(shè){V}j∈Z是L2(R2)的一個(gè)二維多尺度分析(multi-resolution analysis, MRA),尺度函數(shù)為φ,二維尺度空間為Vj=Vj?Vj,定義小波空間Wj,Vj+1=Vj?Wj。定義三個(gè)小波函數(shù):
(1)
(2)
(3)
構(gòu)成小波子空間Wj規(guī)范正交基,其收縮平移是L2(R2)的一個(gè)標(biāo)準(zhǔn)正交基。將二維圖像f(x,y)∈L2(R2)多尺度小波分解得到
(4)
式中
將樣本光譜矩陣的相對(duì)熒光強(qiáng)度看作灰度值,則熒光光譜數(shù)據(jù)矩陣可表示為一幅灰度圖。對(duì)于二維平面上的灰度圖像f(x,y),它的p+q階幾何矩定義為
(5)
如果共軛濾波器H(ω)在零點(diǎn)處有R+1次平滑性。將圖像f(x,y)在尺度函數(shù)φ(x,y),小波函數(shù)Ψ(x,y)上展開,其逼近系數(shù)為{am,n(j)},則當(dāng)p+q≤R時(shí),以小波變換逼近系數(shù)所表達(dá)的p+q階小波矩成立[15]
(6)
譜系聚類又稱層次聚類,是效果較好、經(jīng)常使用的聚類算法之一。其基本原理如下[16]:
設(shè)待分類的模式特征矢量為{x1,x2,…,xN},GN表示第k次合并時(shí)的第i類。則譜系聚類算法基本步驟為:
② 計(jì)算各類間距離Dij,由此生成一個(gè)對(duì)稱的距離矩陣D(k)=(Dij)m×m,其中m為類的個(gè)數(shù)(初始時(shí)m=N)。
④ 檢查類的個(gè)數(shù),如果m大于2,轉(zhuǎn)至步驟②; 否則停止。
結(jié)合鄧恩分類指數(shù)(Dunn’s cluster validity index,DVI)評(píng)價(jià)聚類結(jié)果[17]。設(shè)樣本被分為K類,分別用Y1,Y2, …,Ym, …,Yn, …,YK各表示所劃分的K個(gè)樣本空間,那么DVI可表示為
(7)
即,DVI越大,則聚類樣本的類間距越大,同時(shí)類內(nèi)距越小,整體分類效果越好。
用db2小波將熒光光譜進(jìn)行MRSD分解。利用任一尺度逼近皆可用來(lái)構(gòu)造小波矩,但由于存在吉布斯效應(yīng),隨著分解尺度的增加會(huì)產(chǎn)生積分誤差[15]。因此,選擇第一尺度逼近系數(shù)重構(gòu)光譜。為了增強(qiáng)實(shí)時(shí)性,將重構(gòu)光譜歸一化到0~1范圍內(nèi)。以芝麻油Z1為例,重構(gòu)光譜及原光譜的指紋圖如圖2(a)和(b)所示,發(fā)射圖如圖2(c)和(d)所示。
圖2 Z1的光譜圖和第一尺度重構(gòu)光譜圖Fig.2 The original spectrum and the reconstructed spectrum of Z1
圖3 樣本矩集圖示(Wp≤2,q≤2)Fig.3 The graphical of the moments (Wp≤2,q≤2)
小波矩提取光譜形狀的幾何信息,不同的小波矩值表征光譜不同層面的信息。構(gòu)造樣本的前兩階矩值小波矩:W0,0,W1,0,W1,1,W0,1,W2,0,W2,1,W3,2,W1,2,W0,2。將矩值Z-score標(biāo)準(zhǔn)化,圖示化如圖3所示: 芝麻油和摻偽芝麻油樣本矩值特征W0,0,W1,0,W1,1,W0,1,W2,0存在重疊,無(wú)法通過(guò)譜系聚類法分類; 而矩值W2,1,W2,2,W1,2,W0,2相互分離,存在鑒別的可能性; 隨著矩階數(shù)增加,芝麻油與摻偽樣本類間距有增加趨勢(shì)。
定義樣本間距歐式距離,類間距離差平方和。分別用九個(gè)矩值將樣本進(jìn)行譜系聚類。結(jié)果表明: 矩值W0,0,W1,0,W1,1,W0,1,W2,0無(wú)法鑒別摻偽樣本; 矩值W2,1,W2,2,W1,2,W0,2皆可鑒別摻偽樣本。以W2,2為例,其聚類樹形圖如圖4所示: 芝麻油在1.26上聚成一類,三類摻偽芝麻油在2.78上聚成一類,合并兩類則需8.45以上。結(jié)果表明,小波矩可以提取樣本的有效分類特征,可實(shí)現(xiàn)摻偽芝麻油的分類鑒別。計(jì)算前兩階小波矩W2,1,W2,2,W1,2,W0,2中任一矩值作為特征進(jìn)行譜系聚類,即可鑒別摻偽芝麻油。
圖4 樣本的聚類樹形圖(W2,2)Fig.4 The cluster tree of the samples (W2,2)
隨著矩階數(shù)的增加,芝麻油和摻偽芝麻油矩值特征的類間距有增加趨勢(shì)(圖3)。低階小波矩提取光譜的整體性特征,高階矩提取細(xì)節(jié)特征。階數(shù)低,提取的細(xì)節(jié)信息量不足,但階數(shù)過(guò)高,也會(huì)因高階矩敏感于噪聲和微小誤差造成分類效果差。
同階小波矩組成的矩集表征著光譜的同一幾何信息,其所包含的各矩值為該幾何信息的分量。計(jì)算樣本各階小波矩集進(jìn)行譜系聚類,觀察聚類結(jié)果,并計(jì)算DVI。以十階矩各矩值DVI為例,十階小波矩各矩值圖示化如圖5(a)所示,其DVI值如圖5(b)所示。
結(jié)果表明,當(dāng)p,q如圖5中方式排列時(shí),同階小波矩分類效果呈現(xiàn)規(guī)律性,但低階(階數(shù)n≤4)和高階(階數(shù)n≥5)規(guī)律不一致。高階: 如圖5(b),同階矩DVI隨著q的增大,p的減小有增大趨勢(shì),即相同階矩q值越大分類效果越好,p值越小分類效果越好。p值過(guò)大同時(shí)q值小會(huì)造成分類失敗,失敗案例如圖5(b)中所示。其他高階小波矩在譜系聚類時(shí)有相同規(guī)律。矩值Wp≤10, q≥2可以鑒別摻偽芝麻油稱有效矩值,其中最佳有效矩值為W0,10。W0,n(n≥5)為高階小波矩定性分析的最佳表征。低階: 同階矩DVI隨著q的增大,p的減小呈先增后減的趨勢(shì)。0階和1階無(wú)有效矩值。2,3和4階的最佳有效矩值分別為W2,2,W3,3,W2,4。
不同階矩值表征著光譜不同層面的幾何信息。計(jì)算各階小波矩的最佳有效矩值,以各階最佳有效矩值為特征將樣本進(jìn)行譜系聚類,并計(jì)算DVI。矩值圖示化如圖6(a)所示,DVI值如圖6(b)所示。
如圖6(a)所示,隨著矩階數(shù)的增加,樣本Z3和Z5的矩值特征與其他芝麻油樣本差異逐漸增大,導(dǎo)致高階小波矩分類效果不佳。高階矩提取細(xì)節(jié)特征,對(duì)噪聲和微小差異存在放大作用。如圖6(b)所示,DVI隨著階數(shù)的增加先增加后減小,最后趨于穩(wěn)定。隨著階數(shù)的增加,分類效果漸佳,但階數(shù)過(guò)高會(huì)造成樣本Z3和Z5與其他芝麻油樣本差異化,造成分類效果變差。W0,q≥2可以鑒別摻偽芝麻油,稱為目標(biāo)矩值,其中W0,6為最佳目標(biāo)矩值。W0,6聚類樹形圖如圖7所示: 芝麻油1.24以上聚成一類,三類摻偽芝麻油1.13以上聚成一類,合并兩類則需8.94以上。文中所確定的小波矩的有效及目標(biāo)矩值是鑒別摻偽芝麻油樣本的有效特征,直接計(jì)算樣本的任一有效特征進(jìn)行譜系聚類,即可準(zhǔn)確鑒別摻偽芝麻油。
圖5 十階小波矩各矩值分類效果及規(guī)律Fig.5 The DVI of the tenth order wavelet moments
圖6 不同階小波矩分類效果及規(guī)律Fig.6 The DVI of different order wavelet moments
圖7 各階小波矩中最佳有效矩值W0,6聚類樹形圖Fig.7 The cluster tree of optimal target WMs (W0,6)
提出將小波矩應(yīng)用到三維熒光光譜,以有效矩值為特征進(jìn)行譜系聚類,實(shí)現(xiàn)了摻偽芝麻油樣本的鑒別。以MRSD的一階逼近重構(gòu)光譜,去除了噪聲,減少光譜數(shù)據(jù)量72.4%,增加了矩值法的抗噪穩(wěn)定性和實(shí)時(shí)性。通過(guò)研究同階矩及各階矩分類效果及規(guī)律,確定了可以鑒別摻偽芝麻油的小波矩值。該方法簡(jiǎn)單快速有效,利用任一有效特征即可鑒別摻偽麻油。研究思路及結(jié)論為矩值法應(yīng)用到三維熒光光譜提供參考。為質(zhì)監(jiān)部門及生產(chǎn)企業(yè)提供油品檢測(cè)和鑒定手段。