馬卉芳
(1.開(kāi)封文化藝術(shù)職業(yè)學(xué)院,河南 開(kāi)封 475004;2.西北工業(yè)大學(xué),西安 710072)
醋的歷史由來(lái)已久,其風(fēng)味獨(dú)特、口感醇厚,因此作為家喻戶曉的一種調(diào)味品,深受人們喜愛(ài)。香醋是其典型代表之一,經(jīng)過(guò)其獨(dú)特的發(fā)酵工藝,所得成品醋具有“酸甜適中、存久留香”的特點(diǎn)[1]。但是,醋的發(fā)酵過(guò)程尤其復(fù)雜,而目前對(duì)于香醋指標(biāo)檢測(cè)最常用的方法是近紅外光譜法,也存在著較大的誤差,可能和香醋真實(shí)指標(biāo)狀況相距較遠(yuǎn)。如果能精確檢測(cè)香醋中總酸含量的分布,進(jìn)而及時(shí)指導(dǎo)生產(chǎn)者調(diào)整生產(chǎn)工藝[2],無(wú)疑對(duì)改進(jìn)香醋品質(zhì)有著重要的科學(xué)價(jià)值。
高光譜圖像檢測(cè)技術(shù)是近幾年研發(fā)出的一種新型產(chǎn)品檢測(cè)方法,在使檢測(cè)產(chǎn)品狀態(tài)無(wú)損的情況下能完整地測(cè)出其圖像信息和光譜信息,即可以集圖像技術(shù)和光譜技術(shù)于一體。其中圖像技術(shù)能夠反映出所測(cè)物質(zhì)的形態(tài)學(xué)特征,而光譜信息則可反映被測(cè)物的結(jié)構(gòu)和組成成分等[3-5]。高光譜圖像檢測(cè)技術(shù)自研發(fā)使用以來(lái)能夠很好地滿足食品檢測(cè)領(lǐng)域中對(duì)于產(chǎn)品多特征信息提取的需要,因此目前已被廣泛地應(yīng)用于食品行業(yè)的質(zhì)量檢測(cè)、損傷程度識(shí)別和食品安全檢測(cè)等方面[6]。
本研究擬對(duì)香醋各個(gè)發(fā)酵階段的總酸含量進(jìn)行快速無(wú)損分析[7],分析這兩種光譜波長(zhǎng)篩選方法對(duì)香醋總酸含量預(yù)測(cè)模型的影響,以期實(shí)現(xiàn)對(duì)香醋總酸含量的快速預(yù)測(cè)。
糯米:河南恒順米業(yè)有限公司,產(chǎn)地江蘇鎮(zhèn)江;大曲、快曲、種子醅:江蘇恒順醋業(yè)股份有限公司;釀酒酵母:安琪酵母股份有限公司;醋酸菌:中國(guó)菌種保藏室;氫氧化鈉、酚酞等均為國(guó)產(chǎn)分析純[8]。
恒溫培養(yǎng)箱、電子恒溫水浴鍋 河南國(guó)健醫(yī)療設(shè)備有限公司;pH計(jì)、磁力攪拌器 嘉興艾博實(shí)業(yè)股份有限公司;滅菌鍋 蘇州阿爾法生物實(shí)驗(yàn)器材有限公司;圖像光譜儀 芬蘭奧盧光譜圖像有限公司;鹵鎢燈光源(35 W) 北京卓立漢光儀器有限公司;酸度計(jì)、堿式滴定管 上海普銳斯儀器有限公司。
1.3.1 香醋釀造工藝流程
糯米→粉碎→糖化處理→前發(fā)酵(酒精發(fā)酵)→后發(fā)酵(醋酸發(fā)酵)→熏醅→淋醋。
前處理:將粉碎后的糯米加水,浸泡24 h,然后進(jìn)行蒸煮處理。
糖化處理:向蒸煮晾涼后的原料中加大曲攪拌均勻。
前發(fā)酵:將糖化后的原料放入發(fā)酵瓶中,瓶口使用8層紗布封口,發(fā)酵3 d,第4天密封,進(jìn)行厭氧發(fā)酵,持續(xù)6 d。
后發(fā)酵:酒精發(fā)酵結(jié)束后,原料混合麩皮等,進(jìn)行醋酸發(fā)酵,發(fā)酵9 d。
熏醅:將發(fā)酵結(jié)束后的醋醅按3∶7進(jìn)行高溫熏醅。
淋醋:醋醅加入4倍水,浸泡12 h,淋醋得到成品香醋。
1.3.2 高光譜無(wú)損檢測(cè)系統(tǒng)
高光譜無(wú)損檢測(cè)系統(tǒng)主要由兩部分組成:高光譜采集系統(tǒng)和高光譜數(shù)據(jù)處理系統(tǒng),即硬件系統(tǒng)和軟件系統(tǒng)。硬件系統(tǒng)主要包括:高光譜攝像儀、光纖鹵素?zé)?2個(gè))、控制箱(SC100,北京光學(xué)儀器廠)、電控位移臺(tái)(北京光學(xué)儀器廠)、計(jì)算機(jī)等[9-10]。
1.4.1 采集裝置
高光譜信息采集裝置見(jiàn)圖1。光譜儀測(cè)定范圍為400~950 nm,光譜圖像分辨率為2.8 nm,在進(jìn)行樣品的光譜信息采集時(shí),所得圖像的分辨率為778×1 625像素。
圖1 高光譜圖像采集裝置Fig.1 Hyperspectral image acquisition device
1.4.2 采集步驟
在開(kāi)始采集前,為了保證采集圖像的清晰度,需要進(jìn)行預(yù)實(shí)驗(yàn)。由預(yù)實(shí)驗(yàn)得出試驗(yàn)臺(tái)工作參數(shù):輸送速度 1.25 mm/s,照相機(jī)的曝光率為50 s。具體采集步驟如下:
(1)打開(kāi)所有實(shí)驗(yàn)設(shè)備;
(2)光纖燈預(yù)熱10 min;
(3)載物臺(tái)放于中間位置,然后調(diào)節(jié)輸送裝置的運(yùn)動(dòng)方向,使其緩慢經(jīng)過(guò)相機(jī)下方,操作采集平臺(tái)來(lái)把控整個(gè)采集流程,及時(shí)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行保存。用同樣的方法采集黑板和樣品的高光譜信息[11-12]。
圖2 高光譜反射圖像采集系統(tǒng)Fig.2 Hyperspectral reflection image acquisition system
結(jié)束采集后,需要對(duì)采集得到的光譜圖像進(jìn)行黑白標(biāo)定。在與樣品采集相同的條件下,計(jì)算公式如下[13]:
式中:Rλ為光譜反射率;Iλ為校正前的光譜數(shù)據(jù);Bλ為暗電流數(shù)據(jù);Wλ為標(biāo)定板數(shù)據(jù)。
1.5.1 香醋總酸的測(cè)定
參照 GB 18187-2000中氫氧化鈉滴定法進(jìn)行總酸的測(cè)定,改動(dòng)后具體實(shí)驗(yàn)步驟:選取不同發(fā)酵階段的香醋樣液,分別吸取5 mL到100 mL容量瓶中,加水至刻度線混勻。吸取20 mL稀釋液于200 mL燒杯中,加60 mL蒸餾水,用0.05 mol/L的NaOH標(biāo)準(zhǔn)溶液滴定,以pH計(jì)測(cè)定pH 8.2為終點(diǎn),記錄消耗氫氧化鈉標(biāo)準(zhǔn)溶液的體積。同時(shí)做試劑空白實(shí)驗(yàn)。
試樣中總酸的含量(以乙酸計(jì))按公式計(jì)算:
式中:X為樣品總酸含量(以乙酸計(jì)),g/dL;V1為試樣測(cè)定所消耗氫氧化鈉標(biāo)準(zhǔn)滴定溶液的體積,mL;V2為空白實(shí)驗(yàn)消耗氫氧化鈉溶液的體積,mL;C為氫氧化鈉溶液濃度,mol/L;0.060為與1.00 mL氫氧化鈉標(biāo)準(zhǔn)溶液相當(dāng)?shù)囊宜豳|(zhì)量,g;V為樣品體積,mL。
1.5.2 香醋pH值的測(cè)定
選取上述相同樣品,進(jìn)行 pH 值的測(cè)定。取 50 mL上述測(cè)定總酸定容的樣品液,將酸度計(jì)直接插入濾液中測(cè)得 pH 值,并記錄數(shù)據(jù)。
1.6.1 數(shù)據(jù)的采集與預(yù)處理
由于采集到的高光譜數(shù)據(jù)還存在由儀器引起的機(jī)器噪聲、基線漂移等情況,從而造成數(shù)據(jù)信號(hào)具有波段多、信息量大、冗雜性強(qiáng)等特點(diǎn),或者選取的樣品成分分布不均,從而導(dǎo)致測(cè)定結(jié)果存在一定差異。因此,若直接對(duì)原始光譜數(shù)據(jù)進(jìn)行建模,可能會(huì)產(chǎn)生較大誤差,導(dǎo)致建模效率低、模型性能差,為了避免此情況,在建模之前需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理及優(yōu)化,以便于提高模型的檢測(cè)精度和穩(wěn)定性[14]。
預(yù)處理工作主要分為兩方面:一方面,運(yùn)用多元散射校正法從全部光譜中選取信息量大、噪聲小、代表性強(qiáng)的波段用于數(shù)據(jù)分析。另一方面,通過(guò)標(biāo)準(zhǔn)正態(tài)變量變換法將選取出的波段進(jìn)行壓縮,盡可能多地將樣本的有用信息壓縮在某一區(qū)域,然后截去其他波段。運(yùn)用PCA法分析,選取合適的圖像信息,根據(jù)主成分圖像在各波段下對(duì)應(yīng)的權(quán)重系數(shù)圖,選出特征波長(zhǎng)[15]。將分散的光譜集中,可以有效實(shí)現(xiàn)對(duì)基線的校正。分析所得高光譜數(shù)據(jù),找出最能代表香醋總酸分布規(guī)律的樣本指標(biāo)的特征圖像,以提高后期數(shù)據(jù)處理的速度,同時(shí)去除多余信息[16]。
在光譜系統(tǒng)中選取每份樣品中心位置30×30的矩形區(qū)域作為研究目標(biāo),矩形區(qū)域的選擇要保證總酸真實(shí)值的測(cè)定區(qū)域與光譜波段區(qū)域一致。通過(guò)計(jì)算得出各個(gè)區(qū)域內(nèi)的光譜響應(yīng)值,從而估算樣品的相對(duì)反射率。選取的180份樣品共獲得 180條反射光譜,由于每個(gè)樣品均有3次平行實(shí)驗(yàn),故選擇60條光譜進(jìn)行分析。
(a)感興趣區(qū)域 (b)原始光譜
1.6.2 模型的建立
1.6.2.1 聯(lián)合區(qū)間偏最小二乘法(siPLS)
偏最小二乘法原理:選擇區(qū)域內(nèi)相對(duì)精度較高的幾個(gè)局部模型所在的子區(qū)間進(jìn)行聯(lián)合,然后通過(guò)計(jì)算得出香醋總酸的分布規(guī)律。根據(jù)上述預(yù)處理方法將整個(gè)高光譜圖像檢測(cè)區(qū)域分別劃分為1,2,3,…,10個(gè)子區(qū)間,最優(yōu)模型中所采用的波數(shù)點(diǎn)數(shù)目減少很多,極大地簡(jiǎn)化了建模過(guò)程。然后將幾個(gè)局部模型所在的子區(qū)間聯(lián)合起來(lái),得到共同預(yù)測(cè)模型[17]。
偏最小二乘算法的計(jì)算過(guò)程如下:
(1)矩陣分解:
Y=UQ+F;
X=TP+E。
式中:Q為Y的載荷矩陣;P為X的載荷矩陣;U為Y的得分矩陣;T為X的得分矩陣;F為X的殘差矩陣;E為Y的殘差矩陣。
(2)線性回歸模型的建立:
U=TB;
B=(TTT)-1TTY。
式中:B是關(guān)聯(lián)系數(shù)矩陣。
(3)對(duì)未知樣本的預(yù)測(cè):
y=xBQ。
式中:y為未知樣本預(yù)測(cè)值;x為未知樣本矩陣。
1.6.2.2 逐步線性回歸模型
本實(shí)驗(yàn)采用多元線性回歸法,以PCA分析得到的數(shù)據(jù)作為輸入量,并將其運(yùn)用到SMLR模型中,從而得到主成分與總酸實(shí)測(cè)值的分析模型。為了使模型更實(shí)用簡(jiǎn)化,同時(shí)能夠較準(zhǔn)確地得到香醋總酸的預(yù)測(cè)分布,得到線性方程:
y=b0+b1x1+b2x2+…+bkxk+e。
式中:k為變量個(gè)數(shù);b0為常數(shù);b1,b2,…,bk為偏回歸系數(shù);e為誤差項(xiàng)。
(∑e2)為最小的前提下,用最小二乘法求解偏回歸系數(shù)。
為減小實(shí)驗(yàn)誤差,將所選樣品隨機(jī)分成3份,其中2份(66%)為預(yù)測(cè)模型,1份(34%)用于驗(yàn)證。將2個(gè)預(yù)測(cè)模型進(jìn)行比較分析。通過(guò)決定系數(shù)(R2)、預(yù)測(cè)均方根偏差(RMSEP)、以及相對(duì)分析誤差(RPD)和最佳因子數(shù)來(lái)評(píng)價(jià)模型的穩(wěn)定性。當(dāng)R2接近于1,RPD>3時(shí),建立的模型效果較好,建模結(jié)果分析見(jiàn)表1。
表1 建模結(jié)果分析Table 1 Analysis of modeling results
2.1.1 總酸含量的變化
總酸反映的是發(fā)酵過(guò)程中有機(jī)酸物質(zhì)總量,是香醋中酸味的主要來(lái)源,也是評(píng)價(jià)食醋的重要指標(biāo)。在整個(gè)香醋的發(fā)酵過(guò)程中,總酸百分含量的整體變化趨勢(shì)為前 9 d 持續(xù)增加,最高為 4.09%,9~15 d增速減緩,并持續(xù)增加至7.15%,在15~18 d基本穩(wěn)定在7.5%~8.5%之間。每個(gè)樣品分別設(shè)定3組平行實(shí)驗(yàn),平行測(cè)定的最大相對(duì)誤差不大于3%的總酸含量的統(tǒng)計(jì)結(jié)果見(jiàn)表2。
表2 樣本總酸含量統(tǒng)計(jì)Table 2 Statistics of total acid content of samples
2.1.2 pH值的變化
pH值反映的是電離酸物質(zhì)的 H+濃度,其在一定程度上表示產(chǎn)品酸味的強(qiáng)弱。其測(cè)定結(jié)果范圍統(tǒng)計(jì)見(jiàn)表3。發(fā)酵過(guò)程中香醋pH變化的整體趨勢(shì)為起先隨著發(fā)酵時(shí)間的增加,pH逐漸降低,可能是在醋酸發(fā)酵過(guò)程中醋酸菌產(chǎn)生了作用,從第6天~第9天,pH值降至3.59左右,之后變化不大,保持平穩(wěn),15 d之后逐漸有緩慢增長(zhǎng)的趨勢(shì)。
表3 樣本pH統(tǒng)計(jì)Table 3 Statistics of pH of samples
2.2.1 偏最小二乘法預(yù)測(cè)模型的建立
運(yùn)用siPLS法對(duì)香醋總酸分布預(yù)測(cè)結(jié)果進(jìn)行模型建立,將預(yù)處理的光譜和實(shí)測(cè)值劃分為校正集和預(yù)測(cè)集,然后進(jìn)行模型建立,結(jié)果見(jiàn)表4。
表4 總酸、pH值的siPLS預(yù)測(cè)模型建立結(jié)果Table 4 Establishment results of siPLS prediction model for total acid and pH value
在聯(lián)合區(qū)間數(shù)為4,主成分為8,聯(lián)合區(qū)間[5 9 12 14],光譜范圍分別是577.98~620.45 nm,735~755 nm,810.1~824.5 nm,845.3~868.4 nm時(shí),醋醅中總酸含量的 siPLS 模型的結(jié)果最佳,其Rc和均方根誤差分別為0.845 2和0.521。Rp和均方根誤差分別為0.812 3和0.695,該模型精度最高,預(yù)測(cè)能力最強(qiáng)。同時(shí)利用模型對(duì)香醋pH值進(jìn)行預(yù)測(cè),當(dāng)聯(lián)合區(qū)間為4、主成分?jǐn)?shù)為6、區(qū)間數(shù)為[4 8 11 13]時(shí),獲得的模型最佳。此時(shí)訓(xùn)練集的相關(guān)系數(shù)為0.936 6,均方根誤差為0.056 2。Rp和均方根誤差分別為0.921 7和0.053 1。由結(jié)果分析可知,將精度較高的幾個(gè)局部模型聯(lián)合起來(lái)建立香醋發(fā)酵過(guò)程中總酸的預(yù)測(cè)模型是可行的。該模型在所有模型中精度最高,預(yù)測(cè)能力最強(qiáng)。
2.2.2 主成分分析
高光譜圖像采集系統(tǒng)搜集到的波長(zhǎng)有很多,形成了一個(gè) M×N×λ 的三維數(shù)據(jù)。為了進(jìn)行主成分分析,需將所有數(shù)據(jù)按某一維度展開(kāi),列為矢量。
由于測(cè)定總酸所使用的樣品與高光譜采集樣品相同,因此可以通過(guò)直接計(jì)算各個(gè)主成分圖在該位置的平均灰度值,然后按照平均灰度值和對(duì)應(yīng)的總酸含量進(jìn)行相關(guān)性分析。利用得到的主成分系數(shù)矩陣與原校正集的光譜矩陣相乘,再取轉(zhuǎn)置后即得到了醋醅光譜的主成分。每個(gè)樣品選取10個(gè)主成分。其他成分相關(guān)系數(shù)較低,與總酸含量都呈極弱或無(wú)相關(guān)性,難以用來(lái)做模型預(yù)測(cè)分析。使用SPSS分析軟件對(duì)數(shù)據(jù)進(jìn)行處理,建立主成分與總酸實(shí)測(cè)值的模型。以主成分作為變量,多元回歸所得結(jié)果見(jiàn)表5。
表5 基于主成分的模型預(yù)測(cè)結(jié)果Table 5 Model prediction results based on principal components
由表5可知,校正集R為0.814 3,均方根誤差為0.594,預(yù)測(cè)集R為0.825 5,均方根誤差為0.624。
通過(guò)高光譜圖像檢測(cè)技術(shù),篩選相同樣品條件下,香醋總酸和pH值分別對(duì)應(yīng)的最優(yōu)特征變量;將其作為輸入量,采用不同的建模方法,建立指標(biāo)含量的定量模型,然后通過(guò)比較各模型得到預(yù)測(cè)結(jié)果。結(jié)果表明,高光譜圖像檢測(cè)技術(shù)在對(duì)香醋指標(biāo)含量的快速測(cè)定過(guò)程中起著重要作用,可以建立精確度高的預(yù)測(cè)模型,且模型準(zhǔn)確、簡(jiǎn)便,穩(wěn)定性強(qiáng)。
本研究主要通過(guò)高光譜圖像對(duì)香醋的總酸分布進(jìn)行檢測(cè),從而預(yù)測(cè)分析香醋的總酸分布規(guī)律。通過(guò)采集不同發(fā)酵香醋的光譜波長(zhǎng),并分析發(fā)酵過(guò)程中總酸百分含量和pH值的變化情況;結(jié)合選取的最優(yōu)波段的光譜信息,建立最優(yōu)的預(yù)測(cè)模型,通過(guò)對(duì)聯(lián)合區(qū)間內(nèi)精度較高的波長(zhǎng)信號(hào)源進(jìn)行選取,得到結(jié)果:總酸、pH 值的校正集相關(guān)系數(shù)分別為0.845 2和0.812 3,預(yù)測(cè)集的均方根誤差分別為0.695和0.053 1;結(jié)合主成分分析和逐步線性回歸模型研究香醋中的總酸分布規(guī)律。結(jié)果表明,利用高光譜圖像檢測(cè)方法來(lái)預(yù)測(cè)香醋中的總酸分布規(guī)律具有可行性,能夠?yàn)楦倪M(jìn)發(fā)酵產(chǎn)品生產(chǎn)工藝提供一定的理論研究基礎(chǔ),同時(shí)也為科學(xué)智能化地檢測(cè)食品奠定了實(shí)質(zhì)性基礎(chǔ)。