朱敏,孫婷,白直真,羅惠波,田建平,黃丹*
1(四川輕化工大學(xué) 生物工程學(xué)院,四川 宜賓,644000)2(四川輕化工大學(xué) 機械工程學(xué)院,四川 宜賓,644000)
被譽為世界六大蒸餾酒之一的中國白酒[1],根據(jù)生產(chǎn)工藝的差異可分為4種基本香型,包括濃香型、醬香型、清香型及米香型,其中濃香型白酒的產(chǎn)量及市場份額占據(jù)整個白酒行業(yè)的70%以上[2]。宜賓五糧液、瀘州老窖作為濃香型白酒的典型代表,以其芳香濃郁、綿柔甘洌、香味協(xié)調(diào)、入口甜、落口綿、尾凈余長等風(fēng)格特點深受消費者喜愛。入窖發(fā)酵是整個白酒生產(chǎn)工藝中的關(guān)鍵工序,窖池中大量生香產(chǎn)酯微生物之間復(fù)雜的相互作用關(guān)系,使得最終形成以己酸乙酯為風(fēng)味主體的濃香型大曲酒。趙東等[3]利用氣質(zhì)聯(lián)用技術(shù)研究了五糧液不同空間層次的出窖糟醅與窖泥之間的關(guān)系,結(jié)果表明窖邊糟的香氣成分明顯高于中心糟,且與窖泥優(yōu)勢成分具有高度的相似性。此外,據(jù)相關(guān)報道,窖泥來源的微生物占據(jù)糟醅總微生物的14%以上,并且多數(shù)屬于厭氧菌[4]。說明沒有好的窖泥,就不能生產(chǎn)上乘的濃香型優(yōu)質(zhì)大曲酒。然而窖泥長期面臨酸化、老化等諸多問題[5],給人工養(yǎng)護窖泥帶來重大挑戰(zhàn)。窖泥老化的一個重要原因就是累積發(fā)酵帶來的酸度偏大,嚴重影響己酸菌、丁酸菌等有益微生物的生長代謝活動,從而使得窖泥穩(wěn)定的微生物體系被打破,造成窖泥質(zhì)量的下降。而適當?shù)乃岫炔粌H可以促進酒精發(fā)酵,還可以促進風(fēng)味及前體物質(zhì)的合成。因此窖泥總酸的快速檢測是評估窖泥質(zhì)量的一項重要指標,對防止窖泥酸化具有重要意義。目前的窖泥總酸測定普遍采用酸堿中和法或者pH電位法,此方法耗時耗力,破壞性強,屬于單點檢測,不能直觀展示指標含量的二維分布狀況,并且檢測結(jié)果往往滯后于實際生產(chǎn),不能對相關(guān)工作起到根本性的指導(dǎo)作用。
高光譜成像技術(shù)是一種新興的、非破壞性的、先進的光學(xué)技術(shù)。它將機械視覺與光譜技術(shù)相結(jié)合,探測目標對象的二維空間和一維光譜信息,從而獲取高分辨率的圖像和光譜數(shù)據(jù)。這種技術(shù)能夠?qū)嵤┐笠?guī)??焖贆z測,同時也能夠最大程度上保留物體對象的完整性,已經(jīng)廣泛應(yīng)用于天文學(xué)[6]、法醫(yī)檢驗[7-8]、犯罪現(xiàn)場勘察[9-10]、文物保護[11-12]、醫(yī)學(xué)[13-14]、植物和水源保護[15-16],遙感測繪[17]等方面。ZHU等[18]應(yīng)用高光譜技術(shù),快速辨別醋醅在發(fā)酵過程中表征指標的分布情況,有利于及時發(fā)現(xiàn)問題,快速調(diào)整生產(chǎn)工藝,保證產(chǎn)品品質(zhì)。說明將高光譜圖像技術(shù)應(yīng)用于固態(tài)發(fā)酵過程中表征指標的快速檢測是可行的。目前,國內(nèi)外還沒有將高光譜圖像技術(shù)應(yīng)用于濃香型白酒領(lǐng)域快速檢測的相關(guān)報道。因此,本文研究一種基于高光譜成像技術(shù)的窖泥總酸的檢測方法,實現(xiàn)對酸度的在線無損監(jiān)測,幫助白酒企業(yè)快速發(fā)現(xiàn)問題,及時調(diào)整工藝,防止窖泥酸化和老化現(xiàn)象的發(fā)生。
1.1.1 樣品來源
窖泥樣品采自四川省宜賓市某知名酒廠(位于四川省中南部,北緯26°03′~34°19′,東經(jīng)97°21′~108°31′),窖泥樣品分別來自5個不同的窖齡(6、12、15、23、30),每個窖齡對應(yīng)4口窖池,同一窖齡中產(chǎn)酒質(zhì)量較好的窖池作為每口窖池的選擇依據(jù)。采樣時工人用鐵鏟刨開遺漏的酒糟,以黃水為分界線,收集來自同一窖池四周的窖泥,將其混勻用取樣袋封好即成1個樣本,同一窖池的采樣部位包括窖帽、窖中和窖底泥3層,共3個樣。以此方式獲得不同窖齡的窖泥總計60份。采樣完畢后,放置于冰盒運回實驗室并迅速開展試驗。
1.1.2 試劑與儀器
NaOH,酚酞(分析純),成都市科龍化工試劑廠;鄰苯二甲酸氫鉀(分析純),天津市科密歐化學(xué)試劑開發(fā)中心。
CP214電子天平、pH計,奧豪斯儀器上海有限公司;78HW-1恒溫磁力攪拌器,金壇市醫(yī)療儀器廠;101定性濾紙,撫順市民政濾紙廠。
FX系列高光譜相機,精密電控載物臺,計算機軟硬件,芬蘭SPECIM公司;160W的Y型光纖鹵素?zé)?,美國DolanJenner Industries公司;高光譜采集系統(tǒng)。
1.2.1 試驗方法
本文的方法分為試驗方法和數(shù)據(jù)分析方法兩部分,試驗方法包括參數(shù)的標定、高光譜數(shù)據(jù)的采集、提取感興趣區(qū)域(region of interest,ROI)以及黑白校正處理、窖泥總酸的檢測,數(shù)據(jù)處理包括預(yù)處理、特征變量篩選、建模以及可視化等,具體的試驗設(shè)計流程如圖1所示。
圖1 試驗設(shè)計流程圖Fig.1 A flow chart of experimental design注:ROI,感興趣區(qū)域;SNV,標準正態(tài)變量;SPA,連續(xù)投影算法;PLSR,偏最小二乘回歸;LS-SVM,最小二乘支持向量機;R2,決定系數(shù);RMSE,均方根誤差
1.2.1.1 參數(shù)設(shè)置
為使樣品運行速率與相機的采集頻率和曝光時間相匹配,保證圖像信息的完整性,因此針對窖泥樣品,本研究的具體參數(shù)標定如表1所示。
表1 高光譜相機參數(shù)設(shè)置Table 1 Parameter setting of hyperspectral camera
1.2.1.2 高光譜數(shù)據(jù)采集
用勺子舀取一定量窖泥樣品于石英器皿中,填充至與邊緣齊平的位置。將裝好窖泥樣品并鋪平的石英器皿放置于載物臺中心位置,樣品跟隨載物臺從預(yù)設(shè)的起始位置移動到終止位置,這時樣品數(shù)據(jù)采集完畢,電控載物臺又迅速回歸到初始位置,等待下一個樣的采集。為最大程度保證數(shù)據(jù)采集的準確性,事先準備10個規(guī)格一致的石英器皿,1個樣品平行采集10次,待10次采集完畢后取出,用紙巾擦拭器皿中殘留的窖泥,以此保證石英器皿的清潔,用同樣的方式采集下一個樣品的高光譜數(shù)據(jù)。以此類推,最終分別獲得600份近紅外區(qū)域下(900~1 700 nm)大小為143 pixel×640 pixel×224 pixel以及可見光區(qū)域下(400~1 000 nm)大小為216 pixel×1 024 pixel×448 pixel的窖泥高光譜圖像數(shù)據(jù)塊。
采用Kennard-Stone(K-S)算法,將60份樣品按照5∶1的比例隨機劃分為訓(xùn)練集和測試集。由于每個樣品平行采集10次,因此將50份樣品對應(yīng)的500個數(shù)據(jù)作為訓(xùn)練集,用于模型的訓(xùn)練,其余10個樣品對應(yīng)的100個數(shù)據(jù)作為測試集,用于檢驗?zāi)P偷念A(yù)測性能,根據(jù)性能好壞篩選最優(yōu)模型。
1.2.1.3 黑白校正
利用ENVI5.2手動提取ROI(100×100)的平均光譜信息,獲得一條全波段下的平均光譜曲線。進行系統(tǒng)黑白校正,得到相對穩(wěn)定的光譜反射率曲線。具體的校正計算如公式(1)所示:
(1)
式中:R,光譜反射率;I,校正前的光譜數(shù)據(jù);D,暗電流數(shù)據(jù);W,標定板數(shù)據(jù)。
1.2.1.4 窖泥總酸的測定
窖泥總酸的測定部位與ROI一致,可以提高后期建模的精度以及預(yù)測性能。因此選擇ROI(100×100)內(nèi)的樣品進行總酸度的測定。測定方法參考GB/T 12456—2008中pH電位法。具體步驟為稱取10 g(精確至0.001 g)不同窖齡的窖泥樣品,放入裝有100 mL蒸餾水的250 mL燒杯中。將溶液間歇攪拌并在室溫下浸出30 min。接著,過濾后收集25 mL濾液于150 mL燒杯中,加入25 mL蒸餾水。用0.1 mol/L NaOH標準溶液進行滴定,當pH計讀數(shù)顯示為8.2,停止滴定,并記錄標液消耗的體積(V1),同時做空白實驗,記錄體積(V2)。試樣中的總酸含量(X)計算如公式(2)所示:
(2)
式中:X,總酸含量,g/kg;c,NaOH標準溶液的濃度,mol/L;V1,為樣品溶液消耗NaOH的體積,mL;V2,空白溶液消耗NaOH的體積,mL;K,酸的換算系數(shù);F,樣品的稀釋倍數(shù);m,樣品的質(zhì)量,g;1 000,單位換算系數(shù)。計算結(jié)果保留到小數(shù)點后兩位。精密度為同一樣品兩次測定結(jié)果之差,不能超過算術(shù)平均值的2%。
1.2.2 數(shù)據(jù)分析方法
1.2.2.1 預(yù)處理
數(shù)據(jù)采集過程中產(chǎn)生的噪聲、基線漂移等不相關(guān)因素的光譜信號會降低數(shù)據(jù)采集的準確度。因此需要對ROI內(nèi)的平均光譜反射率曲線進行預(yù)處理來消除這方面的影響。由于標準正態(tài)變量變換(standard normal variable correction,SNV)能高效地去除高頻噪音,防止基線變化,優(yōu)化光譜信號[19-20]。因此本研究選用的預(yù)處理方法是SNV,即通過樣品間的平均值和方差來校正光譜信息,從而消除基線變化的影響。
1.2.2.2 特征變量篩選
不同分子結(jié)構(gòu)式所含的基團對不同波長光的吸收具有選擇性,而獲得的數(shù)據(jù)信息可能是來自于多種化學(xué)物質(zhì)光譜信號重疊的結(jié)果,為了提高模型的魯棒性和泛化性能,保證模型的準確度,因此需要通過一些變量篩選方法篩選與表征指標密切相關(guān)的特征波段,消除不相關(guān)波段的影響。本文采用連續(xù)投影算法(successive projection algorithm,SPA)進行窖泥指標特征變量的篩選,同時做全光譜對照。
1.2.2.3 模型的建立
通過機器學(xué)習(xí)算法將提取出來的光譜信息結(jié)合前期的基礎(chǔ)數(shù)據(jù)建立一種自變量與因變量之間的函數(shù)關(guān)系,以便后期對未知樣品進行快速預(yù)測分析。常用的數(shù)學(xué)建模方法有偏最小二乘回歸(partial least squares regression,PLSR)、最小二乘支持向量機(least squares-support vector machine,LS-SVM)、反向傳播人工神經(jīng)網(wǎng)絡(luò)(back propagation-artificial neural network,BP-ANN)。本文選取前兩種方法用于窖泥總酸模型的構(gòu)建。
1.2.2.4 模型的評價方法
模型常用的評價方法是比較訓(xùn)練集和測試集的決定系數(shù)(R2)以及均方根誤差(root mean square error,RMSE)的大小,當決定系數(shù)越接近于1,均方根誤差越接近于0,說明所建訓(xùn)練集樣本模型的精度越高,預(yù)測性能越好[21]。本文通過對比分析模型在訓(xùn)練集和測試集數(shù)據(jù)上的表現(xiàn)性能,篩選出窖泥總酸預(yù)測的最優(yōu)模型。
1.2.2.5 可視化分布圖
將ROI內(nèi)每個像素點的平均光譜數(shù)據(jù)帶入以上獲得的最佳模型,得到每個像素點的總酸預(yù)測值,將其拉伸到0~255灰度值以獲得與總酸含量值相對應(yīng)的灰度值,再通過云圖進行偽彩色處理,最終獲得窖泥總酸指標的可視化分布圖,直觀顯示出總酸含量的二維分布情況,從而實現(xiàn)對窖泥總酸分布均一性的快速判定。
窖泥中的總酸物質(zhì)主要包括己酸、乳酸、丁酸等,酸類物質(zhì)的含量變化是窖泥中產(chǎn)酸菌共同作用的結(jié)果,酸性環(huán)境的改變又反作用于窖泥中生香產(chǎn)酯微生物的生長代謝活動,對窖泥復(fù)雜的微生態(tài)體系起到重要的調(diào)節(jié)作用。本文參照GB/T 12456—2008中pH電位法測得的不同窖齡窖泥總酸度的統(tǒng)計量,如表2所示。
由表2可知,每個窖齡4口窖池不同層次的12份窖泥按照5∶1隨機劃分給訓(xùn)練集和測試集,由此得到50份樣品用于訓(xùn)練,10份用于預(yù)測。此外,窖泥總酸含量維持在1.05~2.01 g/kg,隨著窖齡的增長,老窖泥的總酸含量略高于新窖泥,但變化較小。窖泥總酸實測值為后續(xù)模型的訓(xùn)練以及性能評估提供基礎(chǔ)數(shù)據(jù)。
表2 不同窖齡窖泥總酸含量統(tǒng)計表Table 2 Statistical table of total acid in pit mud of different ages
利用ENVI5.2提取ROI內(nèi)像素點的平均光譜信息,通過黑白校正將其轉(zhuǎn)換成平均光譜反射率,從而分別得到600條近紅外以及可見光區(qū)域下的全波段光譜反射率曲線,F(xiàn)X17型號相機采集的光譜波段范圍為近紅外光譜波段(900~1 700 nm),一共有224個波長。FX10型號所采用的光譜波段范圍為可見光波段(400~1 000 nm),一共有448個波長。如圖2所示。
A-近紅外下的原始圖像;B-近紅外下的原始光譜;C-近紅外下的預(yù)處理光譜;D-可見光下的原始圖像;E-可見光下的原始光譜;F-可見光下的預(yù)處理光譜圖2 原始光譜的提取和預(yù)處理Fig.2 Extraction and pretreatment of primary spectrum
為方便觀察,本文以2個窖池的窖泥為例,闡述不同窖齡窖泥在近紅外和可見光波段下光譜反射率曲線的差異,選取了6條分別包含近紅外全波段(224個波長)以及可見光全波段(448個波長)的光譜反射率曲線,如圖3所示。
圖3中一個是6年新窖池的上中下層窖泥,一個是23年老窖的上中下層窖泥,23年的窖泥光譜反射率普遍高于6年的光譜反射率,不同層級的窖泥光譜反射率曲線也明顯不同,說明高光譜技術(shù)對不同年份不同層級的窖泥進行快速識別是可行的。
A-近紅外波段;B-可見光波段圖3 近紅外和可見光波段下的窖泥光譜反射率曲線Fig.3 Spectral reflectivity curves of pit mud in near-infrared and visible wavebands
運用SPA算法分別從近紅外以及可見光波段下篩選出與總酸緊密相關(guān)的特征波段,經(jīng)過SPA算法處理后,分別從近紅外全光譜中得到166個特征波段,可見光全光譜下得到345個特征波段。盡管篩選后的特征波段數(shù)仍較多,但可以避免重要信息的遺漏,在保證模型精度的條件下,減少數(shù)據(jù)處理過程中的計算量,提高工作效率??偹崽卣魑展庾V的產(chǎn)生主要來源于羧酸所帶分子鍵以及含氫基團(C—H、O—H等)合頻和倍頻的伸縮、彎曲振動[22],在所有能產(chǎn)生特征吸收的分子鍵中,X—H鍵的活性較高,產(chǎn)生的吸收較強。
通過機器學(xué)習(xí)算法,結(jié)合訓(xùn)練集樣本的窖泥總酸實測值,建立近紅外光譜下(900~1 700 nm)的全波段以及特征波段的定量預(yù)測模型(PLSR、LS-SVM),共計4種模型如表3所示。
表3 近紅外光譜下的模型性能統(tǒng)計表Table 3 Statistical table of model performance in near-infrared spectroscopy
由表3可知,無論是從模型的魯棒性還是預(yù)測性能來看,SVM模型都優(yōu)于PLSR,因此被認為是一種相對較好的訓(xùn)練模型。其次,在SVM模型的基礎(chǔ)上比較全光譜和特征光譜的建模效果,從表中可以看出,盡管全光譜略優(yōu)于特征光譜,但兩者的模型精度和對未知樣品的預(yù)測能力都相對較高,在保證模型精度的前提下,采用特征變量建模,可以減少計算量,提高工作效率。因此在近紅外波段下的SNV-SPA-SVM被視為窖泥總酸的優(yōu)選模型。
接下來遵循同樣的方法,建立可見光光譜下(400~1 000 nm)的全波段以及特征波段的定量預(yù)測模型(PLSR、LS-SVM),共計4種模型如表4所示。
表4 近紅外光譜下的模型性能統(tǒng)計表Table 4 Statistical table of model performance in visible spectroscopy
由表4可知,SVM模型的穩(wěn)健性和泛化性能還是要優(yōu)于PLSR。其次,基于SVM模型比較分析全光譜和特征光譜的建模效果,基于全波段的SVM模型,在訓(xùn)練集和測試集上的樣本預(yù)測值與實測值之間的相關(guān)程度均很高,但相比特征光譜模型,均方根誤差也比較大,因此判定可能出現(xiàn)過擬合現(xiàn)象。相對而言,特征光譜建立的SVM模型具有較好的穩(wěn)定性和預(yù)測能力。因此可見光波段下的SNV-SPA-SVM被視為相對較好的模型。
近紅外和可見光隸屬于2個不同的區(qū)域范圍,根據(jù)特征光譜產(chǎn)生機理,化學(xué)組分對不同波段的光譜吸收能力存在明顯的差異,因此接下來對比分析窖泥總酸指標在兩個波段下的模型性能,優(yōu)選出適用于窖泥總酸快速檢測的最佳模型。對比表3和表4的結(jié)果,可以得出,可見光波段下的SNV-SPA-SVM模型泛化性能更強,更適合于對新鮮樣本的預(yù)測,且預(yù)測值與實測值之間的誤差較小。該模型在訓(xùn)練集和測試集上的擬合效果如圖4所示。
A-訓(xùn)練集;B-測試集圖4 模型在訓(xùn)練集和測試集上的擬合效果圖Fig.4 Fitting effect of the model on calibration and prediction set
將ROI中每個像素點的光譜數(shù)據(jù)帶入到最優(yōu)模型中,計算出窖泥總酸含量的預(yù)測值,然后進行偽彩色處理,得到可視化分布圖,仍以兩個窖齡的窖泥為例,如圖5所示。
A-6年的窖帽泥;B-6年的窖中泥;C-6年的窖底泥;D-23年的窖帽泥;E-23年的窖中泥;F-23年的窖底泥圖5 不同窖齡窖泥的總酸分布圖Fig.5 The distribution map of total acid in pit mud of different years
由圖5可知,同一窖池上中下層窖泥的總酸含量存在明顯不同,中層含酸量略高于上層和池底,而上層又高于窖池底部。此外,23年的窖泥總酸含量普遍略高于6年,且分布較為均勻,可能是由于窖池內(nèi)特殊的生長環(huán)境使微生物群落不斷演替,經(jīng)過長期的自然篩選,最終得以馴化,大部分有利于發(fā)酵的酵母以及產(chǎn)酸菌幸存下來,使得整個窖池空間內(nèi)的微生物群落結(jié)構(gòu)更加穩(wěn)定,從而代謝物分布更加均勻。
本文通過搭建高光譜采集平臺,探討了窖泥樣品在近紅外以及可見光下的光譜特征,并對總酸含量分布進行了可視化,說明高光譜技術(shù)對窖泥總酸分布的快速評估是可行的,本研究為窖泥質(zhì)量在線檢測平臺的搭建奠定了理論基礎(chǔ),為白酒機械化、智能化的升級提供了技術(shù)支撐。但也有不足之處,希望在后期研究中加以改進。一方面,由于精力有限,訓(xùn)練的樣本量較少,希望后期加大樣本量,提高對數(shù)據(jù)預(yù)測的準確率。另一方面,涉及到光譜解析,通過算法篩選出的特征波段對應(yīng)的光譜信息不一定全部來自于該表征指標,可能是多種化學(xué)組分的重疊,如何剔除其他組分引起的干擾信號,達到優(yōu)化特征光譜的目的是接下來的一個重要研究方向。