李慧星,姚涵譯,許 彬,羅建成
(1.南陽理工學(xué)院 河南省工業(yè)微生物資源與發(fā)酵重點實驗室,河南 南陽 473004;2.南陽理工學(xué)院 生物與化學(xué)工程學(xué)院,河南 南陽 473004;3.南陽理工學(xué)院 張仲景國醫(yī)國藥學(xué)院,河南 南陽473004)
我國白酒含有豐富多樣的風(fēng)味成分,包括醇類、酯類、酸類、醛酮類、縮醛類、芳香族類、含氮類和呋喃類等化合物[1]。白酒的風(fēng)味成分主要來自酒醅的發(fā)酵過程,風(fēng)味成分的形成受糧食原料[2]、酒曲[3-4]、工藝[5]、自然環(huán)境[6-7]、微生物[8-10]等多種因素影響。有研究表明,酒醅微生物豐度與風(fēng)味成分含量具有關(guān)聯(lián)性,馬冰濤等[11]以不同發(fā)酵時間下的老白干香型酒醅為研究對象,分別提取酒醅微生物相對豐度和微量成分相對含量的第一主成分進行相關(guān)性分析,發(fā)現(xiàn)微生物與微量成分具有顯著相關(guān)性(R2=0.602,P<0.05),得出乳桿菌屬(Lactobacillus)、芽孢桿菌屬(Bacillus)、鐮刀菌屬(Fusarium)、大洋芽胞桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、Thelebolus和魏斯氏菌屬(Weissella)形成的微生物群對微量成分貢獻較大;王鵬等[12]研究了不同發(fā)酵時間下酒醅中的核心微生物和風(fēng)味物質(zhì),發(fā)現(xiàn)核心微生物群與風(fēng)味輪廓的演變具有極顯著的相關(guān)性(R2=0.627,P<0.001),揭示出白酒發(fā)酵過程中的關(guān)鍵微生物群由10個核心微生物屬組成;劉凡等[13]研究了不同發(fā)酵時間下酒醅中微生物與己酸、乙酸、丁酸和乳酸的相互關(guān)系,共揭示出7個與四大乙酯合成密切相關(guān)的屬水平核心微生物。但這些研究都是以單一來源的酒醅為樣本,對發(fā)酵過程中微生物與風(fēng)味物質(zhì)的關(guān)聯(lián)性進行定性研究,并未揭示核心微生物群中微生物與風(fēng)味成分之間的定量關(guān)系。
酯類在濃香型白酒風(fēng)味物質(zhì)中占據(jù)首位[1],其主要來自出窖酒醅,而出窖酒醅中的酯類一方面是發(fā)酵前期和中期由產(chǎn)酯微生物代謝或酯化酶催化形成的,另一方面是發(fā)酵后期通過有機化學(xué)反應(yīng)生成的[14]。從酯類的形成機制上看,出窖酒醅中酯類并不完全取決于同時期的微生物,但兩者可能存在關(guān)聯(lián)性。建立出窖酒醅中微生物與酯類成分的數(shù)學(xué)模型有助于從微生物角度控制出窖酒醅酯類成分的相對含量,進而控制出窖酒醅的品質(zhì)。
本研究利用偏最小二乘(partial least squares,PLS)法建立出窖酒醅中微生物與酯類成分之間的定量數(shù)學(xué)模型。為保證建模樣本的代表性,本研究從4個濃香型白酒生產(chǎn)企業(yè)采樣,共獲得8個樣本。首先經(jīng)兩輪變量篩選,保留相關(guān)且能夠解釋的變量;然后評價模型變量的重要性,最終得到窖酒醅中優(yōu)勢微生物屬相對豐度與酯類相對含量之間的PLS模型,以期為從微生物角度控制出窖酒醅香氣提供指導(dǎo),同時驗證PLS建模方法在酒醅成分與微生物關(guān)聯(lián)性分析中的可行性。
酒醅樣品:4個南陽地區(qū)白酒生產(chǎn)企業(yè)提供,4個企業(yè)均采用高粱、玉米、小麥和糯米為釀造原料,以大曲為釀造用曲,采用續(xù)糟發(fā)酵工藝發(fā)酵酒醅。每個企業(yè)選取2個發(fā)酵期為60 d的窖池,每個窖池取窖池中心處上層、中層、下層的出窖酒醅,共8個來源24個樣品。
E.Z.N.A.Soil脫氧核糖核酸(deoxyribonucleic acid,DNA)Kit:美國OMEGA公司;TaqDNA聚合酶(5 U/μL):南京諾唯贊生物科技有限公司;Qubit 2.0 DNA檢測試劑盒:美國Life公司;SanPrep柱式DNA膠回收試劑盒:生工生物工程(上海)股份有限公司;瓊脂糖(生化試劑):西格瑪奧德里奇(上海)貿(mào)易有限公司;氯化鈉(分析純):天津市科密歐化學(xué)試劑有限公司。其他試劑均為國產(chǎn)分析純。
Scion SQ-451GC氣相色譜-質(zhì)譜聯(lián)用(gas chromatography-mass spectrography,GC-MS)儀、SHS-40 SL頂空進樣系統(tǒng)、BR-swax毛細管色譜柱(30 m×0.32 mm,0.25 μm):美國布魯克道爾頓公司;Pico-21臺式離心機:賽默飛世爾科技(中國)有限公司;GL-88B漩渦混合器:海門市其林貝爾儀器制造有限公司;TND03-H-H混勻型干式恒溫器:深圳拓能達科技有限公司;DYCZ-2電泳槽:北京市六一儀器廠;ChemiDoc510凝膠成像系統(tǒng):美國UVP公司;Q32866 Qubit?2.0熒光計:美國Invitrogen公司;T100聚合酶鏈式反應(yīng)(polymerase chain reaction,PCR)儀:美國BIO-RAD公司。
1.3.1 濃香型白酒酒醅酯類成分的檢測
樣品處理及頂空萃?。簩⑼粊碓吹?個酒醅等量混合,8個來源的樣品分別編號為P1、P2、N1、N2、R1、R2、S2、S3。精確稱取混勻后的酒醅5.000 0 g放入20 mL頂空瓶中,加入6 mL蒸餾水、2.2 g NaCl,混勻,壓緊瓶蓋,50 ℃頂空萃取45 min。
色譜條件:BR-swax毛細管色譜柱(30 m×0.32 mm,0.25 μm);進樣口溫度250 ℃;升溫程序為初始溫度35 ℃保持4 min,以3 ℃/min升至150 ℃保持4 min,以5 ℃/min升至220 ℃保持20 min;載氣為氦氣(He),流速2.0 mL/min,分流比10∶1,進樣量0.25 mL。
質(zhì)譜條件:電子電離(electron ionization,EI)源,電子能量70 eV;離子源溫度250 ℃;傳輸線溫度250 ℃;質(zhì)量掃描范圍40~350 m/z;數(shù)據(jù)采集掃描模式為全掃描模式;溶劑延遲時間0.5 min。
1.3.2 濃香型白酒酒醅微生物檢測
采用高通量測序法測定濃香型白酒酒醅的微生物,實驗方法和數(shù)據(jù)分析參考文獻[15]。PCR所用的引物已經(jīng)融合了Miseq測序平臺的V3-V4通用引物:341F引物(5'-CC CTACACGACGCTCTTCCGATCTG(barcode)CCTACGGGNGGCWGCAG-3')、805R引物(5'-GACTGGAGTTCCTTGGCACCCGAGAATTCCAGACTACHVGGGTATCTAATCC-3')。
1.3.3 數(shù)據(jù)處理與分析
由于不同來源的樣品在微生物種屬豐度和酯類成分含量兩個方面均存在較大差異,為消除數(shù)量級的影響,采用歸一化法,計算酯類在揮發(fā)性成分峰面積中的相對百分比[11,16]以及微生物屬的相對豐度。取在單個樣本中相對百分含量>0.01%的酯類(主要酯類)作為建模因變量,取在單個樣本中相對豐度>1%的優(yōu)勢微生物屬[13]作為建模自變量。使用R3.6.1中的corr.test函數(shù)計算相關(guān)系數(shù)和相關(guān)系數(shù)的顯著性,使用SIMCA13.0建立PLS模型。利用Ggplot2程序包繪制熱圖、散點圖、柱形圖、氣泡圖和南丁格爾玫瑰圖,進行數(shù)據(jù)可視化。
濃香型白酒酒醅中主要酯類成分及優(yōu)勢微生物檢測結(jié)果分別見表1、表2。
表1 濃香型白酒酒醅樣品中主要酯類成分的檢測結(jié)果Table 1 Determination results of the main ester components in the fermented grains sample of strong-flavor Baijiu
續(xù)表
續(xù)表
表2 濃香型白酒酒醅樣品中優(yōu)勢微生物屬的檢測結(jié)果Table 2 Determination results of the dominant microorganisms in the fermented grains sample of strong-flavor Baijiu at genus level
由表1及表2可知,從濃香型白酒酒醅樣品中共檢測到26種主要酯類成分,7個優(yōu)勢細菌屬和24個優(yōu)勢真菌屬。
2.2.1 第一輪變量篩選
PLS適用于變量間存在高度相關(guān)的數(shù)據(jù)回歸分析[17]。本研究以26種主要酯類的相對百分含量為因變量,31個優(yōu)勢微生物屬的相對豐度為自變量,通過變量間相關(guān)性分析進行第一輪變量篩選,以剔除無相關(guān)變量。因變量間、自變量間、自變量和因變量間的相關(guān)系數(shù)顯著性分析熱圖見圖1。
圖1 變量間相關(guān)系數(shù)顯著性分析熱圖Fig.1 Heatmap for significance analysis of correlation coefficients between variables
本研究中樣本自由度為6,當(dāng)相關(guān)系數(shù)絕對值>0.707時即可以認為兩個變量顯著相關(guān)(P<0.05)[18]。由圖1a可知,樣品中大部分主要酯類相對百分含量間存在顯著相關(guān)性(P<0.05),僅有異丁酸丙酯、丙酸丁酯和乙酸異戊酯3種酯類與任何酯類間的相關(guān)性不顯著(P>0.05)。由圖1b可知,樣品中大部分優(yōu)勢微生物屬間存在顯著相關(guān)性(P<0.05),但畢赤酵母屬(Pichia)、曲霉屬(Aspergillus)和假絲酵母屬(Candida)3種微生物屬與其他微生物屬間的相關(guān)性不顯著(P>0.05)。剔除無相關(guān)酯類和無相關(guān)微生物屬后,得到酯類相對百分含量與微生物屬相對豐度間的相關(guān)性。由圖1c可知,青霉屬(Penicillum)與各酯類相關(guān)性不顯著(P>0.05),己酸丙酯、乳酸乙酯、己酸丁酯、己酸己酯、丁二酸二乙酯與各微生物屬相關(guān)性不顯著(P>0.05)。
綜上,剔除無相關(guān)性的變量,即優(yōu)勢微生物屬變量中刪除Pichia、Aspergillus、Candida、Penicillum4種微生物屬,主要酯類變量中刪除異丁酸丙酯、丙酸丁酯、乙酸異戊酯、己酸丙酯、乳酸乙酯、己酸丁酯、己酸己酯、丁二酸二乙酯8種酯類。剔除無相關(guān)變量后,對含有27個優(yōu)勢微生物屬(自變量)和18種主要酯類(因變量)的數(shù)據(jù)進行初步PLS建模分析。以自變量中提取的第一主成分t1為橫坐標,以因變量中提取的第一主成分u1為縱坐標,繪制t1與u1的相關(guān)性圖,結(jié)果見圖2。
圖2 優(yōu)勢微生物第一主成分與主要酯類第一主成分間的相關(guān)性Fig.2 Correlations between dominant microorganisms first major component and ester components first major component
由圖2可知,t1與u1之間存在顯著的線性關(guān)系(P<0.05),R2=0.891,說明自變量和因變量有顯著的相關(guān)關(guān)系。因此,采用剩余的變量建立出窖酒醅中優(yōu)勢微生物屬相對豐度與主要揮發(fā)性酯類相對百分含量的PLS模型是合理的[17]。
2.2.2 第二輪變量篩選
利用剩余變量建立主成分數(shù)n=3的PLS模型。首先根據(jù)模型的變量重要性投影(variable importance in projection,VIP)值進行自變量篩選,根據(jù)VIP值是否大于1判斷自變量對模型的解釋程度是否重要[19],各自變量的VIP值見圖3。
由圖3可知,16個自變量的VIP值>1,基于此重新建立n=3的PLS模型,模型系數(shù)的顯著性見圖4。
圖3 各自變量的變量重要性投影值Fig.3 Variable importance in projection values of independent variables
圖4 模型系數(shù)顯著性分析的氣泡圖Fig.4 Bubble diagram of significance analysis of model coefficients
根據(jù)各因變量模型系數(shù)的顯著性進行因變量篩選。由圖4可知,丙酸乙酯、2-甲基丙酸乙酯、羥基乙酸乙酯、異丁酸異丙酯、丁酸丙酯、丁酸丁酯、丁酸己酯的模型系數(shù)均不顯著(P>0.05),說明這7種酯類物質(zhì)的相對百分含量不能用優(yōu)勢微生物屬相對豐度進行解釋。因此從因變量中剔除這7種酯類。
綜上,最終得到的PLS模型自變量包括:X1-毛孢子菌屬(Trichosporon)、X2-鐮刀菌屬(Fusarium)、X3-unclassified_Fungi、X4-地絲菌屬(Geotrichum)、X5-鏈格孢屬(Alternaria)、X6-unclassified_Leotiomycetes、X7-織球殼菌屬(Plectosphaerella)、X8-unclassified_Tremellales、X9-橫梗霉屬(Lichtheimia)、X10-平革菌屬(Phanerochaete)、X11-unclassified_Saccharomycetales、X12-棲熱菌屬(Thermus)、X13-梭菌屬(Clostridium)_sensu_stricto_12、X14-鏈球菌屬(Streptococcus)、X15-Incertae_Sedis、X16-乳桿菌屬(Lactobacillus);PLS模型因變量包括:Y1-乙酸乙酯、Y2-乙酸異丁酯、Y3-丁酸乙酯、Y4-丁酸戊酯、Y5-戊酸乙酯、Y6-丁酸丁酯、Y7-己酸乙酯、Y8-乙酸己酯、Y9-庚酸乙酯、Y10-辛酸乙酯、Y11-己酸異戊酯。
模型保留的因變量中包含了濃香型白酒中的特征酯類成分,如乙酸乙酯、丁酸乙酯、己酸乙酯、庚酸乙酯、辛酸乙酯[20],但乳酸乙酯在變量篩選時被剔除。這可能是由于出窖酒醅中乳酸乙酯以及其他被剔除酯類的相對百分含量與出窖微生物屬的相對豐度間的關(guān)系不滿足線性方程。
由PLS方法建立的優(yōu)勢微生物與主要酯類的模型形式為Y=XB+F。其中Y為因變量(主要酯類),X為自變量(優(yōu)勢微生物),B為模型系數(shù),F(xiàn)為模型常數(shù)項。最終含有16個自變量和11個因變量的PLS模型(n=3)模型系數(shù)和常數(shù)項見表3。模型系數(shù)為正值說明該微生物屬相對豐度對相應(yīng)酯的相對百分含量產(chǎn)生正向影響,模型系數(shù)為負值說明該微生物屬相對豐度對相應(yīng)酯的相對百分含量產(chǎn)生負向影響。
表3 PLS模型的系數(shù)和常數(shù)項Table 3 Coefficient and constant term of the PLS model
續(xù)表
根據(jù)表3得到模型的表達式,以乙酸乙酯為例,模型表達式為Y1=1.480+0.123X1+0.081X2+0.119X3+0.123X4+0.078X5+0.075X6+0.085X7+0.078X8+0.091X9+0.089X10-0.106X11+0.037X12+0.029X13+0.035X14+0.058X15-0.056X16。其中X11和X16的系數(shù)為負值,說明這兩種微生物屬相對豐度越高,乙酸乙酯的相對含量越低。
利用樣本主成分得分與自變量之間的相關(guān)系數(shù)的顯著性評價自變量在模型中的重要性[17]。樣本主成分得分與自變量的相關(guān)系數(shù)及其顯著性見圖5。
圖5 樣品主成分得分與自變量相關(guān)系數(shù)的顯著性Fig.5 Significance of correlation coefficient between principal component score of samples and independent variable
由圖5可知,鐮刀菌屬(Fusarium)(X2)、unclassified_Fungi(X3)、鏈格孢屬(Alternaria)(X5)、unclassified_Leotiomycetes(X6)、織球殼菌屬Plectosphaerella(X7)、unclassified_Tremellales(X8)、棲熱菌屬(Thermus)(X12)、梭菌屬(Clostridium)_sensu_stricto_12(X13)、鏈球菌屬(Streptococcus)(X14)、Incertae_Sedis(X15)、乳桿菌屬(Lactobacillus)(X16)與第一主成分(t1)顯著相關(guān)(P<0.05),其中Lactobacillus(X16)與t1成負相關(guān),unclassified_Saccharomycetales(X11)與t1相關(guān)性較顯著(0.05<P<0.1)[18];毛孢子菌屬(Trichosporon)(X1)、橫梗霉菌屬(Lichtheimia)(X9)、平革菌屬(Phanerochaete)(X10)與第二主成分(t2)顯著相關(guān)(P<0.05);地絲菌屬(Geotrichum)(X4)與第三主成分3(t3)顯著相關(guān)(P<0.05)。結(jié)果表明,所有自變量與提取的3個主成分存在顯著相關(guān)關(guān)系,因此,當(dāng)主成分數(shù)取3時能夠提取較完整的自變量信息。
在最終建立的主成分數(shù)n=3的PLS模型中,所保留的自變量均能夠用選取的主成分進行解釋,說明模型中保留的變量是重要的。模型對自變量和因變量的解釋率分別為RX2=0.926、RY2=0.894(均>0.6)、模型的預(yù)測率Q2=0.679(>0.5),說明該模型質(zhì)量良好[17]。
本研究建立的模型中,Trichosporon是濃香型白酒酒曲與窖泥中的優(yōu)勢酵母菌[21-22],Trichosporon產(chǎn)生的醇酰基轉(zhuǎn)移酶是酵母合成乙酸酯類(如乙酸乙酯、乙酸異戊酯等)的關(guān)鍵酶[23]。Clostridium_sensu_stricto_12[24]、Lactobacillus[9]是窖泥中的優(yōu)勢菌屬,它們都直接影響酒醅香氣,而且在王鵬等[12]的研究中也發(fā)現(xiàn)Lactobacillus屬于白酒發(fā)酵過程中風(fēng)味演替的主要推動者。Lichtheimia是濃香型大曲中存在的產(chǎn)酯酶微生物,具有較高的產(chǎn)酯活性[25]。還有部分微生物雖然并非產(chǎn)酯微生物,但他們對酒醅發(fā)酵產(chǎn)香起到了貢獻作用。如Fusarium能產(chǎn)內(nèi)切葡聚糖酶、β-葡萄糖苷酶[26-28],Thermus能夠代謝產(chǎn)纖維素酶和木聚糖酶[29-30],Phanerochaete能夠降解木質(zhì)素[31],它們能夠為發(fā)酵產(chǎn)香微生物提供代謝底物;Streptococcus代謝產(chǎn)酸[32],為酯化反應(yīng)提供前體。本研究的結(jié)果同時說明酒醅中酯香成分是由多種微生物協(xié)同作用產(chǎn)生的,這與郭霞[33]的研究結(jié)果一致。
一些報道中發(fā)現(xiàn)的對香氣有重要貢獻的微生物,如Pichia、Candida、Aspergillus、Saccharomyces等[12-13],在本研究建立的模型相關(guān)性篩選和變量篩選中被剔除。這可能是由于在出窖酒醅樣品中,這些微生物屬的相對豐度的差異與樣品中酯類相對百分含量的差異無關(guān)聯(lián)性,即這些微生物可能對整個發(fā)酵過程中風(fēng)味的形成有貢獻,但到發(fā)酵終期它們對酒醅風(fēng)味不再起決定作用。
經(jīng)兩輪變量篩選建立了關(guān)于酒醅中主要揮發(fā)性酯類物質(zhì)相對百分含量和優(yōu)勢微生物屬相對豐度間的PLS模型(n=3),該模型含有11個因變量(乙酸乙酯、乙酸異丁酯、丁酸乙酯、丁酸戊酯、戊酸乙酯、丁酸丁酯、己酸乙酯、乙酸己酯、庚酸乙酯、辛酸乙酯、己酸異戊酯)和16個自變量(Trichosporon、Fusarium、unclassified_Fungi、Geotrichum、Alternaria、unclassified_Leotiomycetes、Plectosphaerella、un classified_Tremellales、Lichtheimia、Phanerochaete、unclassified_Saccharomycetales、Thermus、Clostridium_sensu_stricto_12、Streptococcus、Incertae_Sedis、Lactobacillus)。所得模型能夠解釋92.6%的自變量信息和89.4%的因變量信息,預(yù)測率為0.679,質(zhì)量良好,可以定量解釋出窖酒醅微生物與酯類之間的關(guān)聯(lián)性,為預(yù)測、控制酒醅香氣成分提供技術(shù)支持。