陳明舉,周 迪,王 鴻,熊興中
(1.四川輕化工大學(xué) 人工智能四川省重點(diǎn)實(shí)驗(yàn)室,四川 宜賓 644000;2.四川輕化工大學(xué) 自動化與信息工程學(xué)院,四川 宜賓 644000)
白酒主要是以糧食谷物為主要釀造原材料,其釀造工藝及成分紛繁復(fù)雜,在相同的原材料、發(fā)酵劑和發(fā)酵環(huán)境,白酒的香型、口感和質(zhì)量也可能會存在差異。目前,白酒的特性主要是通過品酒師的感官器官對白酒進(jìn)行色、香、味進(jìn)行的評價(jià)[1]。由于感官分辨的精度有限、評價(jià)指標(biāo)不一致等因素,使得白酒品質(zhì)難以界定、等級難以分辨。建立一個科學(xué)、有效的白酒質(zhì)量評價(jià)方法與客觀標(biāo)準(zhǔn)是當(dāng)前研究的熱點(diǎn)問題[2]。
一些學(xué)者將圖譜技術(shù)應(yīng)用到白酒的特性的識別研究中,建立一些基于圖譜技術(shù)的白酒分類與識別方法,如氣相色譜法[3]、液相色譜法[4]、氣質(zhì)聯(lián)用(gas chromatographymass spectrometer,GC-MS)[5]、紅外光譜法[6]、電子鼻[7]、核磁共振法[8]等方法。在眾多的白酒圖譜識別技術(shù)中,氣相色譜-質(zhì)譜聯(lián)用儀綜合了色譜法的分離能力和質(zhì)譜的定性能力,可在較短的時間內(nèi)對多組分混合物進(jìn)行定性分析,從而有效地體現(xiàn)微量組成成分[9]。GC-MS圖譜技術(shù)在白酒分類識別中獲得較好的性能,栗新峰等[10]將GC-MS色譜技術(shù)應(yīng)用于濃香型白酒基酒質(zhì)量等級評價(jià),建立一個白酒基酒等級分類模型;張丹丹等[11]利用GC-MS分析不同白酒中的微量組分,實(shí)現(xiàn)對白酒特性的更深層次分析與識別。錢宇等[12]對市售暢銷的7個品牌、不同等級的濃香型白酒為研究對象,利用主成分(principal component analysis,PCA)降維GC-MS圖譜數(shù)據(jù),實(shí)現(xiàn)不同品牌、不同產(chǎn)地白酒的分類。
當(dāng)前,基于GC-MS的白酒圖譜數(shù)據(jù)主要采用PCA降維處理,實(shí)現(xiàn)圖譜數(shù)據(jù)的主要特征的提取[14]。PCA通過幾個正交主成分來表示白酒圖譜數(shù)據(jù)的完整信息,在數(shù)據(jù)信息最大限度保留的基礎(chǔ)上,達(dá)到數(shù)據(jù)降維的目的[16-17]。近年來,隨著稀疏表示理論的完善,稀疏表示技術(shù)逐步應(yīng)用于白酒圖譜的識別中[18]。為了更好地實(shí)現(xiàn)數(shù)據(jù)的稀疏分解,并體現(xiàn)各組分的權(quán)重,將稀疏性與PCA相結(jié)合使用,建立稀疏主成分分析(sparse principal component analysis,SPCA)。SPCA運(yùn)用聚集數(shù)據(jù)稀疏性的方法來區(qū)別主成分,實(shí)現(xiàn)每個主成分所對應(yīng)的單位特征向量能夠讓盡可能多的零來填充代替,實(shí)現(xiàn)用更少的變量線性組合來表示原始數(shù)據(jù),從而更好地實(shí)現(xiàn)數(shù)據(jù)降維分析[19]。SPCA已應(yīng)用于機(jī)械故障的診斷[20]、人臉圖像[21-22]以及股票分析[23]等行業(yè)中。
鑒于此,本研究將SPCA應(yīng)用于白酒GC-MS圖譜分析中,建立基于SPCA與GC-MS的濃香型白酒評判模型,并通過實(shí)驗(yàn)驗(yàn)證該方法的有效性[24]。首先采用氣相色譜-質(zhì)譜聯(lián)用儀對濃香型白酒中的46種微量成分進(jìn)行定量測試[25],采用SPCA對白酒進(jìn)行降維分析,獲得白酒GC-MS圖譜數(shù)據(jù)的稀疏主成分,最后結(jié)合感官評價(jià)結(jié)果,通過回歸分析建立濃香型白酒等級評價(jià)模型,從而實(shí)現(xiàn)對濃香型白酒的客觀評判[26]。
1.1.1 白酒樣品
濃香型白酒樣品:選取川南地區(qū)濃香型白酒樣品,白酒經(jīng)過感官評定后,選取特級(編號為T1、T2、T3、T4、T5)、優(yōu)級(編號為S1、S2、S3、S4、S5)、一級(編號為Y1、Y2、Y3、Y4、Y5)、二級(編號為R1、R2、R3、R4、R5)四個等級的白酒各5個,共20個酒樣。
1.1.2 化學(xué)試劑
C7~C40正構(gòu)烷烴標(biāo)準(zhǔn)品(均為色譜純):北京曼哈格生物科技有限公司;無水乙醇(純度99.5%):上海阿拉丁生化科技股份有限公司;甲醇(純度99.9%):上海阿達(dá)瑪斯試劑有限公司。
TIC-6800型氣相色譜-質(zhì)譜聯(lián)用儀:江蘇天瑞儀器股份有限公司;DB-WAXMS 色譜柱(30 m×0.25 mm×0.25 μm):安捷倫科技(中國)有限公司。
1.3.1 白酒中揮發(fā)性風(fēng)味成分的GC-MS分析
白酒中揮發(fā)性風(fēng)味成分的檢測采用GC-MS法[10]。GC條件:采用DB-WAXMS 色譜柱(30 m×0.25 mm×0.25 μm)。進(jìn)樣量為1 μL,分流比為20∶1,進(jìn)樣口溫度為250 ℃;載氣為高純氦氣(He),流速1mL/min;初始溫度40℃,然后以10℃/min升溫到120 ℃,120 ℃時的保留時間為2 min;再以10 ℃/min升溫到200 ℃,保留時間為2 min[12];最后以10 ℃/min升溫到250 ℃,250 ℃時的保留時間為2 min。MS條件:接口溫度:280 ℃;電離方式為電子電離(electronic ionization,EI)源,電子能量70 eV;離子源溫度230 ℃;掃描質(zhì)量范圍29~500 m/z。
風(fēng)味物質(zhì)定性分析:對酒樣進(jìn)行GC-MS分析,利用美國國家標(biāo)準(zhǔn)與技術(shù)研究院(national institute of standards and technology,NIST)12數(shù)據(jù)庫及相對保留時間指數(shù)對白酒中的風(fēng)味成分進(jìn)行定性分析。相對保留時間指數(shù):將C7~C40的正構(gòu)烷烴標(biāo)準(zhǔn)品與酒樣相同實(shí)驗(yàn)條件下進(jìn)行分析,根據(jù)各正構(gòu)烷烴的保留時間計(jì)算相應(yīng)的保留時間指數(shù)(retention index,RI),其計(jì)算公式如下:
式中:RIx表示待測組分的保留指數(shù);T(i)表示待測組分的保留時間,min;n和n+1分別表示正構(gòu)烷烴的碳原子個數(shù),個。
樣品測定及定量分析:準(zhǔn)確量取5 mL白酒樣品,加入體積分?jǐn)?shù)為60%的乙醇溶液配制的3種混合內(nèi)標(biāo)溶液100 μL(乙酸正戊酯15.10 g/L、叔戊醇15.19 g/L、2-乙基丁酸15.09 g/L),混勻后自動上機(jī)進(jìn)行GC-MS檢測。實(shí)驗(yàn)中分別利用乙酸正戊酯、叔戊醇和2-乙基丁酸計(jì)算酒樣中酯類、醇類和酸類及其他風(fēng)味物質(zhì)的校正因子含量。參考國標(biāo)GB/T 10345—2007《白酒分析方法》中的內(nèi)標(biāo)法,根據(jù)內(nèi)標(biāo)峰面積計(jì)算各風(fēng)味成分的含量。
1.3.2 白酒樣品的感官評價(jià)及分級
濃香型白酒感官評價(jià)參考國家標(biāo)準(zhǔn)GB/T 10345—2007《白酒分析方法》[29]進(jìn)行。感官評價(jià)人員組成是由川南區(qū)域品酒員組成。采用編號順位暗評品評法對白酒進(jìn)行評價(jià),按照色、香、味、格分別為5分、25分、60分、10分的評分配比進(jìn)行綜合評定,總分為100分,對各品酒師所打分求平均值,即為該白酒品評得分。其中得分93.0~100.0分為特級,88.0~92.9分為優(yōu)級,80.0~87.9分為一級,70.0~79.9分為二級,70.0分以下為其他。
1.3.3 基于SPCA白酒質(zhì)量評價(jià)模型的建立
SPCA運(yùn)用聚集數(shù)據(jù)稀疏性降維實(shí)現(xiàn)圖譜數(shù)據(jù)的主成分提取,與PCA相比,SPCA每個主成分所對應(yīng)更少原始圖譜數(shù)據(jù),更好地體現(xiàn)白酒微量與白酒品質(zhì)的相關(guān)性[30-31]。采用稀疏主成分分析方法來搭建一個基于不同等級的濃香型白酒的質(zhì)量評判模型,將更能體現(xiàn)白酒微量成分與白酒特性的關(guān)系。本研究將通過對白酒中微量成分進(jìn)行SPCA降維處理,建立綜合指標(biāo)因子,并與感官評價(jià)相結(jié)合,尋求更科學(xué)、客觀與準(zhǔn)確的濃香型白酒的評價(jià)模型。整個評價(jià)模型建立方法如下:
(1)圖譜數(shù)據(jù)的初始化與標(biāo)定
對于第i個樣本的GC-MS圖譜的積分峰面積向量記為Xi,構(gòu)建n(n=46)個白酒樣品的積分峰面積矩陣X={X1,X3,X3,……Xn},其對應(yīng)白酒品質(zhì)等級主觀評分的數(shù)據(jù)集為U={u1,u2,u3,……un}(ui范圍0~100)。
(2)SPCA分解與綜合指標(biāo)的確定
分別計(jì)算積分峰面積矩陣的前m個主成分(這里m=10),以及前m個主成分所對應(yīng)的特征向量,從而分別得到特征向量矩陣A=(α1,α2,…αm)。
對于給定的積分峰面積矩陣X的特征向量矩陣A=(α1,α2,…αm),計(jì)算基于彈性網(wǎng)懲罰結(jié)構(gòu)的稀疏主成分問題:
得到積分峰面積的稀疏主成分向量D=(d1,d2,…dm)=與稀疏主成分方差貢獻(xiàn)率向量R=(R1,R2,…,Rm)。
積分峰面積的稀疏主成分可以通過稀疏主成分向量與圖譜積分峰面積線性組合得到:
通過最大峰值數(shù)據(jù)構(gòu)建的白酒特性的綜合指標(biāo)G,G為稀疏主成分Fj與貢獻(xiàn)率Rj的乘積之和。
(3)感官分值的數(shù)學(xué)模型的建立
以綜合指標(biāo)G作為自變量,把感官評分產(chǎn)生的分值U作為因變量進(jìn)行回歸分析處理,建立的白酒的感官分值的數(shù)學(xué)模型U=f(G)。
采用上述氣相色譜測試條件對濃香型白酒樣品中的揮發(fā)性風(fēng)味成分進(jìn)行測定,代表白酒樣品的揮發(fā)性風(fēng)味成分GC-MS分析的總離子流色譜圖見圖1,各化合物含量見表1。
圖1 濃香型白酒代表樣品揮發(fā)性風(fēng)味成分GC-MS分析總離子流色譜圖Fig.1 Total ion chromatogram of volatile flavour compounds in representative strong-flavor Baijiu sample analysis by GC-MS
表1 濃香型白酒代表樣品揮發(fā)性風(fēng)味成分GC-MS分析結(jié)果Table 1 GC-MS analysis results of volatile flavour compounds in representative strong-flavor Baijiu sample
由表1可知,共篩選得到46種共有化合物,酯類18種,醇類10種,醛酮類7種,酸類9種,苯類2種。酒樣中含量較高的風(fēng)味物質(zhì)主要為酯類,其中乙酸乙酯、乙酸丙酯、丁酸乙酯、亞油酸乙酯、正己酸乙酯、乳酸乙酯、己酸乙酯、己酸、十八酸乙酯和異丁酸乙酯明顯高于其它風(fēng)味物質(zhì)。
20個濃香型白酒樣品感官品評分見表2。由表2可知,選取的特級、優(yōu)級、一級與二級四個等級的樣品酒各5個,其評分值在70~100分之間均勻分布,這有利于提取代表白酒等級特性的主成分信息,以便建立準(zhǔn)確的客觀評價(jià)模型。
表2 20個白酒樣品的感官品評結(jié)果Table 2 Results of sensory evaluation of 20 Baijiu samples
對20個白酒中的46種揮發(fā)性風(fēng)味成分物質(zhì)構(gòu)成20×46矩陣采用稀疏主成分的方法進(jìn)行因子分析[32],剔除成分矩陣中特征值小于1的成分中特征向量對應(yīng)的變量,然后重新進(jìn)行因子分析,結(jié)果保留了30個能夠代表白酒區(qū)分等級的成分。通過凱撒正態(tài)化最大方差法進(jìn)行旋轉(zhuǎn)[33],再利用SPCA處理,得到前10個稀疏主成分特征值、方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率見表3。
表3 10個稀疏主成分的特征值、方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率Table 3 Eigenvalues,variance contribution rates and cumulative variance contribution rates of 10 sparse principal components
由表3可知,前7個稀疏主成分的累計(jì)方差貢獻(xiàn)率達(dá)到93.579%,即前7個主成分能夠代表白酒數(shù)據(jù)中93.579%的白酒信息特性。前7個稀疏主成分向量矩陣如表4所示。通過表4可得到前7個主成分F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5,F(xiàn)6,F(xiàn)7的標(biāo)準(zhǔn)線性組合關(guān)系如公式(5)所示,其中X1,X2,X3,……X30為30個共有峰的峰面積,構(gòu)建的白酒成分特性的綜合指標(biāo)G為稀疏主成分與貢獻(xiàn)率的乘積之和(公式6)。
表4 前7個稀疏主成分向量矩陣Table 4 Vector matrix of first seven sparse principal components
其中,F(xiàn)的系數(shù)為對應(yīng)的累計(jì)方差貢獻(xiàn)率,X的系數(shù)為系數(shù)主成分微量成分值。
將綜合指標(biāo)G與各個白酒的感官評分U結(jié)合分析,如表5所示。從表5對特級、優(yōu)級、一級、二級四級表述可以看出,綜合指標(biāo)G在數(shù)值上與感官評分結(jié)果基本一致,由此可見,綜合指標(biāo)G越大,感官評分的綜合得分就會越高,質(zhì)量等級就會越好。
表5 20個樣本的綜合指標(biāo)值Table 5 Comprehensive index values of 20 samples
以綜合指標(biāo)G作為自變量,感官評分U作為因變量進(jìn)行回歸分析處理,依次對白酒數(shù)據(jù)作對數(shù)回歸、線性回歸、二次方回歸、三次方回歸四種回歸分析方法,所產(chǎn)生數(shù)據(jù)的回歸分析結(jié)果如圖2所示,感官評分分?jǐn)?shù)與綜合指標(biāo)的回歸分析關(guān)鍵見表6所示。
圖2 回歸分析結(jié)果Fig.2 Results of regression analysis
表6 感官評分分?jǐn)?shù)與綜合指標(biāo)間的回歸分析Table 6 Regression analysis between sensory score and comprehensive index
比較表6中四種不同的回歸分析方法得到的相關(guān)系數(shù)R2可知,三次回歸分析擬合度高達(dá)99.3%,能準(zhǔn)確反應(yīng)酒樣中綜合指標(biāo)G與感官評分分值U之間的關(guān)系。因此,本研究建立的基于SPCA與GC-MS的濃香型白酒評價(jià)模型為:
另選用的20個白酒樣本,采用本文建立的白酒評價(jià)模型(公式5)進(jìn)行模型驗(yàn)證,得到20個白酒樣本客觀評分結(jié)果與感官評分對比結(jié)果見表7所示,模型驗(yàn)證結(jié)果見表8。
由表7可知,客觀評判模型評價(jià)的結(jié)果與感官評分雖然存在差異,但差值的絕對誤差小于3,兩者的鑒定結(jié)果基本一致。由表8可知,采用本文模型等級評價(jià)結(jié)果與感官評分結(jié)果相符率達(dá)到94%。因此,本文建立的基于SPCA與GC-MS白酒質(zhì)量評價(jià)模型能夠準(zhǔn)確性實(shí)現(xiàn)白酒等級的評判,具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值。
表7 等級評價(jià)模型評分結(jié)果Table 7 Score results of grade evaluation model
表8 模型驗(yàn)證結(jié)果Table 8 Validation results of model
本研究以濃香型白酒為研究對象,利用GC-MS圖譜分析技術(shù)對白酒的微量成分進(jìn)行有效的檢測,采用SPCA數(shù)據(jù)處理與回歸分析方法建立白酒質(zhì)量評價(jià)模型。利用建立的白酒質(zhì)量評價(jià)模型對白酒質(zhì)量進(jìn)行客觀評分,在實(shí)現(xiàn)特級、一級、二級、優(yōu)級四級白酒的等級評判中,準(zhǔn)確率達(dá)到94%。可見本研究建立的基于GC-MS與SPCA技術(shù)的白酒質(zhì)量評價(jià)模型具有較好的學(xué)術(shù)參考與實(shí)際應(yīng)用價(jià)值。另外,由于樣品酒有限,加之樣品標(biāo)注的信息不全,本研究僅對白酒的質(zhì)量等級進(jìn)行研究,未對白酒年代、產(chǎn)地、品牌以及價(jià)格等特性進(jìn)行研究,下一步工作將GC-MS與SPCA技術(shù)應(yīng)用于白酒年代、產(chǎn)地、品牌等其它特性研究中,并建立相應(yīng)的判別模型。