王 鴻,程林琳,陳明舉,熊興中,李 蘭
(1.四川輕化工大學(xué)人工智能四川省重點實驗室,四川宜賓 644000;2.四川輕化工大學(xué)自動化與信息工程學(xué)院,四川宜賓 644000)
白酒作為我國幾千年傳統(tǒng)文化的結(jié)晶,釀造技術(shù)及材料成分十分復(fù)雜,其微量成分決定白酒的風(fēng)味與風(fēng)格。在釀造過程中,即使在使用相同的原材料、發(fā)酵環(huán)境及發(fā)酵劑的情況下,釀造酒顏色、香味及風(fēng)格也會存在一定的差異。當(dāng)前,白酒基酒的特性主要是通過品酒師感官評定,但由于感官分辨的精度有限、主觀判斷的差異等因素,無法實現(xiàn)白酒品質(zhì)判別的準(zhǔn)確性與客觀性。
近年來,隨著傳感器技術(shù)的進(jìn)步,基于圖譜檢測技術(shù)的白酒識別技術(shù)逐漸應(yīng)用于白酒的分類與識別中,如電子舌、紅外光譜、氣相色譜-質(zhì)譜、熒光光譜技術(shù)等以及核磁圖譜等圖譜技術(shù)。宋丹丹等利用氣相色譜-質(zhì)譜聯(lián)動儀對六大蒸餾酒的揮發(fā)性成分進(jìn)行比較分析,為酒體的質(zhì)量評估奠定基礎(chǔ);張曉磊等研究氣相色譜-質(zhì)譜技術(shù)在白酒質(zhì)量控制中的廣泛應(yīng)用。核磁共振(nuclear magnetic resonance,NMR)利用電磁波對磁場中自旋不為零的原子核的物質(zhì)進(jìn)行激發(fā),在食品科學(xué)物質(zhì)領(lǐng)域發(fā)揮其優(yōu)勢。相比于其他傳統(tǒng)的分析方法,NMR 技術(shù)不僅能夠?qū)崿F(xiàn)反映酒體成分質(zhì)子的無偏檢測,且操作簡單快速,實現(xiàn)樣品無損檢測。欒曉菲等采用H-NMR 技術(shù)對4 種品牌啤酒進(jìn)行檢測,獲取啤酒的NMR 譜輪廓,結(jié)合統(tǒng)計方法研究不同品牌啤酒主要成分之間的差異;劉恩滿等建立了核磁共振氫譜測定白酒酒精度的檢測方法,操作簡單,為企業(yè)及檢測部門提供了一種快捷方法。
本研究利用NMR 獲取不同等級白酒基酒的核磁圖譜,對比分析主成分與核主成分實現(xiàn)核磁圖譜數(shù)據(jù)去相關(guān)與降維的性能,在核主成分空間建立不同等級白酒基酒的點云概率模型,并建立鑒定詞語關(guān)聯(lián)。建立的白酒基酒點云模型能實現(xiàn)基酒的準(zhǔn)確鑒定與分類,為通過NMR 圖譜技術(shù)實現(xiàn)白酒的分類識別奠定良好的理論基礎(chǔ)。
酒樣:本實驗的基酒樣品是從知名白酒企業(yè)和XX 市基酒交易中心等單位挑選的36 種不同品質(zhì)等級的基酒樣品。
試劑:重水、磷酸二鉀、磷酸配制成pH 值為2.0的緩沖液;用HCL和NaOH調(diào)節(jié)緩沖液的pH值。
儀器設(shè)備:AVANCEIIIHD 600MHz 核磁共振波 譜 儀,Bruker 公司;10~100 μL 移液槍,100~1000 μ L 移液槍,100 μ L 移液槍,1000 μ L 移液槍,Dragon Laboratory Instruments;5 mm 核磁管,NORELL公司。
在磁場中研究原子核對射頻輻射吸收所做運(yùn)動的方法稱為核磁共振波譜法,本次實驗中所用的H NMR 譜中,可依據(jù)核磁譜儀釋放的能量,追蹤其在待檢測樣品中的具體衰減情況,進(jìn)而推測原子核的種類及位置。白酒是一種內(nèi)含多種化學(xué)成分的混合物,主要成分是HO 和CHOH。但是,就基酒的核磁指紋波譜研究而言,雖然HO、CHOH的含量相當(dāng)高,但并不具有分類特征。因此,抑制或消除HO 和CHOH 的圖譜信號是獲取理想基酒H NMR指紋圖譜的關(guān)鍵環(huán)節(jié)。
白酒基酒樣品核磁測試方法如下:
(1)校正核磁參數(shù),使線性和靈敏度達(dá)到核磁安裝要求。
(2)采用重水、磷酸二鉀、磷酸配制緩沖溶液,pH2.0,取100 μ L 緩沖溶液加入到900 μ L 基酒樣品中,混合均勻,使用HCl 及NaOH 將緩沖溶液的pH值調(diào)節(jié)至4.0 左右。準(zhǔn)確取500 μ L 混合液,轉(zhuǎn)移到5 mm NMR測試管,待測。
(3)測量采用自動進(jìn)樣器無規(guī)上樣,測試完成后采用topspin 軟件對核磁圖譜圖進(jìn)行傅里葉變換,基線校正,調(diào)整相位,設(shè)置積分區(qū)間,將白酒基酒核磁指紋圖譜數(shù)據(jù)導(dǎo)入Excel數(shù)據(jù)中。
PCA 是一種常用的線性降維方法,在去除冗余的同時,盡量減少原指標(biāo)所包含的信息量的損失,進(jìn)而對數(shù)據(jù)進(jìn)行全面的分析處理。不同特性的白酒圖譜數(shù)據(jù)之間通常存在非線性關(guān)系,采用PCA技術(shù)通常不能有效地實現(xiàn)不同類別的白酒圖譜數(shù)據(jù)分離。KPCA 是對PCA 算法的非線性擴(kuò)展,通過引入核函數(shù)(kernel),將低維數(shù)據(jù)的非線性關(guān)系轉(zhuǎn)換到高維空間的線性關(guān)系,從而實現(xiàn)白酒圖譜數(shù)據(jù)的有效分離。
由多樣本的圖譜數(shù)據(jù)組成的樣本集合數(shù)據(jù)為X(×維),現(xiàn)將X映射到高維空間(x)中有:
為了便于公式(3)的求解,引入核函數(shù)K。
記K 的特征向量為u,特征值為。求得特征值,特征向量有:
對式(5)左右兩邊同時左乘一個X有:
又因為(n-1)·C=XX 所以我們發(fā)現(xiàn)矩陣K 和C的特征值是相同的,都為,C 的特征向量為Xu。對其做單位化可得式(8)。
求在上的投影
按從大到小的順序?qū)撕瘮?shù)的特征值進(jìn)行排序,每個特征值所占特征值總和之比作為貢獻(xiàn)率,即第i個主成分的貢獻(xiàn)率a表達(dá)式為:
對應(yīng)的累計貢獻(xiàn)率β為每個特征值占特征值總和的比例和,其表達(dá)式為:
將模糊現(xiàn)象的理論方法與統(tǒng)計學(xué)中現(xiàn)象的隨機(jī)性相結(jié)合,使定性描述和定量描述一一對應(yīng)形成映射關(guān)系的數(shù)學(xué)方法稱之為云模型。將集合X稱為論域,且有X={},若任意元素都存在一個有穩(wěn)定傾向的隨機(jī)數(shù)Uα(),那么A 便是論域X 的模糊集,而Uα()合稱為對A的隸屬度。如果論域中的元素是簡單有序的或者可以根據(jù)某個法則,將X 映射到另一個有序的論域X 上。這一過程中的有序論域X 為基礎(chǔ)變量,隸屬度在X 上的分布叫做隸屬云。
多個數(shù)據(jù)通過隨機(jī)分布產(chǎn)生多個云滴,從而構(gòu)成分布云模型,該模型的建立主要通過期望x、熵n 和超熵e 這三個數(shù)字特征。云模型通過判斷某一云滴重心所處的區(qū)域,即可確定該云滴區(qū)域期望x,即本實驗中白酒基酒品質(zhì)信息的中心位置。云模型中用熵n 來反應(yīng)數(shù)域范圍,表示了該定性概念的模糊性。超熵e 是對熵n 的不確定性的度量,用來評價語言的可信度即某云滴團(tuán)的凝聚性及其凝聚程度,用來反應(yīng)云滴團(tuán)的隸屬度。
在云模型中正向云生成器將定性概念轉(zhuǎn)換為定量值,逆向云生成器則是將定量值轉(zhuǎn)換為定性概念,獲得反映物質(zhì)信息的數(shù)字特征(x、n 和e)。逆向云生成器的工作過程具體步驟如下:
首先,計算輸入的每組數(shù)據(jù)樣本的平均值:
其中n 是實驗重復(fù)的次數(shù),x是第個數(shù)據(jù)樣本。
根據(jù)樣本數(shù)組的平均值計算一階樣本的絕對中心距離:
然后,計算這組數(shù)據(jù)的樣本方差
最后,可得物質(zhì)樣本信息的平均值Ex,En 和He 分別為物質(zhì)信息的模糊性和不確定性,其公式如下:
根據(jù)逆向云生成器的公式,可以將從物質(zhì)數(shù)據(jù)中獲得的m 維的Ex,En 和He 輸入到正向云生成器,隨機(jī)生成n 個具有正態(tài)分布特性的隨機(jī)數(shù)。n個數(shù)據(jù)通過隨機(jī)分布產(chǎn)生云滴,并且最終表達(dá)出定性概念信息,從而構(gòu)成分布云模型。
本實驗的濃香型白酒感官評價標(biāo)準(zhǔn)參考了國家標(biāo)準(zhǔn)GB/T 10345—2007《白酒分析方法》,感官品評小組成員由瀘州某知名白酒公司的員工和一名國家級品酒師組成。按總分100 分的標(biāo)準(zhǔn),采用編號順位暗評的方法對白酒基酒樣品進(jìn)行評價,按色澤、香氣、口味、風(fēng)格分別為10 分、25 分、50 分、15分的分值進(jìn)行綜合評定,然后對所有的品酒師給出的分?jǐn)?shù)求平均值,即得到該白酒基酒質(zhì)量得分。認(rèn)定93.0~100.0 分為特級,88.0~92.9 分為優(yōu)級,80.0~87.9 分為一級,70.0~79.9 分為二級,其余70.0 分以下為其他級別。要求不能公示具體廠家的信息,將相關(guān)核磁圖譜采集的基酒信息進(jìn)行編號,部分測試基酒的結(jié)果如表1所示。
從表1 可以總結(jié)出:一級白酒基酒具有香差、有酸味泥味、口感略澀、整體欠協(xié)調(diào)、酒體單薄等特點;二級白酒基酒具有香料味濃、味雜、口感澀、整體欠協(xié)調(diào)的特點;優(yōu)級白酒基酒具有窖香、味微陳略雜、入口較醇厚、整體較協(xié)調(diào)、酒體濃的特點;特級白酒基酒具有醇香、味較陳后味長、入口醇甜、酒體濃厚、有風(fēng)格等特點。
表1 核磁圖譜基酒品評結(jié)果
使用PCA 及KPCA 分別對白酒基酒核磁圖譜數(shù)據(jù)降維,減少訓(xùn)練集數(shù)據(jù)的維數(shù),并搭建云模型來表達(dá)白酒基酒的等級信息,研究它們之間的關(guān)系。數(shù)據(jù)分析使用MATLAB R2018b軟件。
圖譜數(shù)據(jù)分析處理發(fā)現(xiàn),PCA 與KPCA 的前兩個主成分的累積貢獻(xiàn)率達(dá)到90 %以上,兩個主成分能體現(xiàn)核磁指紋圖譜數(shù)據(jù)中的主要信息。分別計算PCA 前兩個主成分PC1、PC2 與KPCA 的前兩個主成分KPC1、KPC2 的信息特征值Ex、En 與He,以獲得反映白酒基酒等級信息的數(shù)字特征,其結(jié)果如表2 與表3 所示。由表2 與表3 可看出,在PCA域與KPCA 域,不同等級的白酒基酒的平均值Ex差距較大,其對應(yīng)的模糊性En遠(yuǎn)小于平均值Ex,由此可知,在PCA域與KPCA域都能較好地實現(xiàn)不同等級的白酒基酒的區(qū)分。比較不同的等級基酒的Ex 的差值△Ex 發(fā)現(xiàn),PCA 域不同等級的△Ex 值小于KPCA 域的△Ex 值,說明在KPCA 域,不同等級的主成分之間的距離更大,更有利于不同等級的白酒的區(qū)分。
表2 以PCA為基礎(chǔ)不同等級白酒基酒特征值
從表3 可以看出,特級白酒基酒的KPC1 和KPC2 所對應(yīng)特征值均為最小,與其他等級白酒特征值相差較大,由此可以推斷出其等級與其他白酒的品質(zhì)有一定的差距。對于熵值來說,優(yōu)級與二級白酒基酒的熵值相差不大,可以得出它們的模糊程度相似。4種白酒中一級與二級白酒基酒的超熵值相近,說明兩種品質(zhì)白酒基酒等級信息概念有一定的模糊性,兩種等級白酒基酒的品質(zhì)不易辨別。將4種等級白酒的特征值分別輸入到二維正向云發(fā)生器中,分別恢復(fù)等級評估結(jié)果。
表3 以KPCA為基礎(chǔ)不同等級白酒基酒特征值
分別以PCA、KPCA 的前兩個主成分為水平坐標(biāo),He 為垂直坐標(biāo),得到不同等級白酒的隸屬度三維坐標(biāo),如圖1(a)、(b)所示。從圖中可以看出,特級、優(yōu)級、一級酒的云滴均具高斯分布特征,二級白酒基酒云滴的隸屬度波動較小,各個等級的點云不存在重疊。比較圖1(a)、(b)發(fā)現(xiàn),在KPCA 域的點云更集中,且不同等級之間的距離更遠(yuǎn),再次說明在KPCA 域能更好地體現(xiàn)不同等級白酒基酒的特性,更有利于白酒基酒的分類。
圖1 PCA與KPCA域的不同等級白酒基酒云模型
根據(jù)上述分析,通過KPCA 更能體現(xiàn)不同等級白酒的特性,更有利于不同特性白酒的區(qū)分,在KPCA 域構(gòu)建白酒基酒的云模型將更能體現(xiàn)白酒的特性。將在KPCA構(gòu)建白酒基酒的云模型。
根據(jù)上述白酒感知詞語與基酒等級信息云滴范圍的關(guān)聯(lián)公式,分別取正態(tài)分布概率20 %、40%、60%、80%、90%內(nèi)的值來確定云滴范圍,從而搭建基于KPC1 與KPC2 白酒基酒等級信息劃分的相應(yīng)區(qū)域,并得出云滴區(qū)域與鑒評詞語的相關(guān)結(jié)果,如表4 所示。在圖2 中,在KPC1 與KPC2 坐標(biāo)系按不同概率搭建白酒基酒等級區(qū)域,得到不同橢圓組成的白酒基酒等級區(qū)域。從圖2 可以看出,每種等級白酒基酒被橢圓線所分割,每個區(qū)域?qū)?yīng)相應(yīng)的評鑒詞語。在KPCA 域中,各個等級基酒云模型相聚較遠(yuǎn),未發(fā)生重合。
表4 以KPCA 為基礎(chǔ)不同等級白酒基酒云滴范圍
圖2 以KPCA為基礎(chǔ)的不同等級白酒基酒云模型區(qū)域圖
利用核磁圖譜技術(shù)獲取白酒基酒的圖譜數(shù)據(jù),采用核主成分降維技術(shù)實現(xiàn)對不同等級白酒基酒特性提取并進(jìn)行分析,建立基于核主成分降維技術(shù)的白酒基酒核磁圖譜云模型。在分析中發(fā)現(xiàn),不同等級白酒基酒的核磁圖譜數(shù)據(jù)通過降維處理后在核主成分空間的分布距離大于主成分空間的分布,在核主成分空間更易實現(xiàn)不同等級的白酒基酒的分類。在核主成分空間建立白酒基酒的點云模型,該模型不僅劃分不同等級白酒的點云空間,且在各個等級空間中詳細(xì)劃為各個等級白酒基酒的概率
范圍,并進(jìn)行鑒定詞語分析。本文建立的基于核磁圖譜技術(shù)的白酒基酒等級云模型,不僅有利于白酒基酒等級的鑒定,而且分析方法可應(yīng)用于食品檢測、中藥鑒定與化學(xué)試劑等相關(guān)圖譜分析技術(shù)領(lǐng)域,研究成果具有重要的應(yīng)用價值。