熊雅婷,李宗朋,王 健*,馮斯雯,李子文,尹建軍,宋全厚(中國食品發(fā)酵工業(yè)研究院,北京 1000 15)
?
基于最小二乘支持向量機(jī)的白酒酒醅成分定量分析
熊雅婷,李宗朋,王 健*,馮斯雯,李子文,尹建軍,宋全厚
(中國食品發(fā)酵工業(yè)研究院,北京1000 15)
摘 要:利用近紅外光譜技術(shù)實(shí)現(xiàn)對白酒發(fā)酵過程中酒醅主要成分的質(zhì)量控制,并進(jìn)行模 型優(yōu)化,提高性能。采用偏最小二乘法提取的潛在變量作為最小二乘支持 向量機(jī)的輸入變量,先后建立了白酒酒醅中酒精度、淀粉、水分、酸度 的近紅外定量模型,并與經(jīng)無信息變量消除法波段篩選后建立的偏最小二乘 模型結(jié)果進(jìn) 行比較。結(jié)果表明:與偏最小二乘模型相比,4 個(gè)指標(biāo)的最小二乘支持向量機(jī)定量模型的相關(guān)系數(shù)(R2)、預(yù)測均方根誤差以及相對分析誤差3 個(gè)評價(jià)參數(shù)均有更優(yōu)表現(xiàn);對未知樣品進(jìn)行預(yù)測時(shí),最小二乘支持向量機(jī)模型的預(yù)測準(zhǔn)確度明顯高于偏最小二乘模型。說明最小二乘支持向量機(jī)模型的準(zhǔn)確度、穩(wěn)定性及預(yù)測性能均優(yōu)于偏最小二乘法模型,為白酒酒醅的品質(zhì)分析方法研究提供了新的思路。
關(guān)鍵詞:白酒酒醅;最小二乘支持向量機(jī);潛在變量;偏最小二乘法;波段篩選
熊雅婷, 李宗朋, 王健, 等. 基于最小二乘支持向量機(jī)的白酒酒醅成分定量分析[J]. 食品科學(xué), 2016, 37(12): 163-168. DOI:10.7506/spkx1002-6630-201612029. http://www.spkx.net.cn
XIONG Yating, LI Zongpeng, WANG Jian, et al. Quantitative analysis of chemical compositions of fermented grains of chinese liquor based on least squares support vector machine (LS-SVM)[J]. Food Science, 2016, 37(12): 163-168. (in Chinese with E nglish abstract) DOI:10.7506/spkx1002-6630-201612029. http://www.spkx.net.cn
酒醅發(fā)酵是白酒釀造過程的重要環(huán)節(jié),酒醅在窖池環(huán)境中充當(dāng)著物質(zhì)循環(huán)、能量流動(dòng)、信息傳遞的“三流運(yùn)轉(zhuǎn)”規(guī)律的載體[1],酒醅中的淀粉、水分、總酸以及酒精等主要成分,是影響白酒品質(zhì)和風(fēng)格的主要物質(zhì)[2],因此,酒醅發(fā)酵直接影響白酒釀造的產(chǎn)量與質(zhì)量。目前,常規(guī)的檢測方法普遍操作復(fù)雜,分析時(shí)間長、消耗試劑,并且存在污染環(huán)境的風(fēng)險(xiǎn),發(fā)酵過程質(zhì)量變化也難以及時(shí)準(zhǔn)確把握[3]。
近年來,近紅外光譜檢測技術(shù)憑借操作簡單、分析迅速、無損檢測、重現(xiàn)性好且環(huán)保無污染等優(yōu)勢[4],逐漸引入到中國傳統(tǒng)的釀酒行業(yè)中,在白酒品質(zhì)檢測及組分定量分析方面發(fā)揮了重要的作用[5]。彭幫柱[6]、陳妍[7]等分別利用人工神經(jīng)網(wǎng)絡(luò)、最小二乘法回歸等方法,實(shí)現(xiàn)了白酒總酸、總酯、乙醇、乙酸乙酯等關(guān)鍵指標(biāo)含量的快速檢測。楊國強(qiáng)等[8]通過近紅外透射光譜分析技術(shù)對汾陽王酒進(jìn)行了真假鑒別,準(zhǔn)確率可達(dá)100%。但是,目前多數(shù)研究以成品白酒為對象,關(guān)于近紅外光譜技術(shù)在白酒釀造酒醅發(fā)酵過程控制中的應(yīng)用研究較為少見。
綜合濃香型、白干型和芝麻香型等多種香型的白酒酒醅,分別采用偏最小二乘(partial least squares,PLS)法及最小二乘支持向量機(jī)(least squares-support vector machine,LS-SVM)兩種算法觀察白酒酒醅中酒精度、淀粉含量、水分、酸度等多個(gè)指標(biāo)的近紅外檢測模型性能改善情況。建立白酒酒醅主要成分快速檢測模型,并結(jié)合波段篩選方法,提高模型運(yùn)算速度、穩(wěn)定性、準(zhǔn)確性以及模型預(yù)測能力,為白酒發(fā)酵過程質(zhì)量控制提供參考。
1.1材料
選用濃香型(290 個(gè))、白干型(275 個(gè))和芝麻香型(260 個(gè))酒醅樣品共825 個(gè),由某白酒企業(yè)提供。
1.2儀器與設(shè)備
傅里葉變換近紅外光譜儀瑞士步琪有限公司;光譜儀光源為鹵鎢燈,檢測器為溫控InGaAs,配有固體測量池。光譜范圍為10 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32 次;利用配套軟件NIRWare Operator采集樣品的近紅外光譜信息,采用UnscramblerX10.3光譜分析軟件(挪威CAMO公司)進(jìn)行光譜預(yù)處理、PLS計(jì)算及潛在變量(latent variable,LV)提取,無信息變量消除(uninformative variables elimination,UVE)法、LSSVM等程序均在MATLAB環(huán)境下運(yùn)行。
1.3方法
1.3.1基礎(chǔ)數(shù)據(jù)采集
為保證實(shí)驗(yàn)可靠性及模型準(zhǔn)確性,對酒醅樣品進(jìn)行3 次采樣,采用漫反射方式掃描采集酒醅近紅外光譜,并對光譜進(jìn)行平均。對獲得的酒醅樣品光譜進(jìn)行預(yù)處理,剔除掉個(gè)別的異常光譜,最終剩余實(shí)驗(yàn)用光譜數(shù)量為816 個(gè)。酒醅水分實(shí)測值測定:采用GB 5009.3—2010《食品中水分的測定》中的直接干燥法;淀粉測定:采用GB/T 5009.9—2008《食品中淀粉的測定》中的酶水解法;酸度測定:采用GB/T 5517—2010《糧油檢驗(yàn):糧食及制品酸度測定》。
1.3.2樣本集劃分
本實(shí)驗(yàn)采用Kennard-Stone(K-S)法來進(jìn)行樣本集劃分,其原理為:選擇馬氏距離最遠(yuǎn)的2 個(gè)樣本加入建模集,計(jì)算剩余的每個(gè)樣本到建模集中每個(gè)已選樣本的距離,找出最大和最小距離值樣本,加入建模集,重復(fù)操作,直至建模集樣本數(shù)目滿足要求為止[9]。本實(shí)驗(yàn)最終選擇500 個(gè)酒醅樣本作為校正集,250 個(gè)樣品作為驗(yàn)證集,其余66 個(gè)酒醅樣品不參與建模分析,作為預(yù)測集樣品,用于預(yù)測模型效果。其統(tǒng)計(jì)信息如表1所示。
表1 校正集與驗(yàn)證集數(shù)據(jù)統(tǒng)計(jì)結(jié)果Table 1 Statistical results for calibration set and validation set
1.3.3UVE法
UVE是一種基于回歸系數(shù)穩(wěn)定性分析的變量選擇方法,可以有效消除冗余信息變量,減少模型運(yùn)算量,提高模型適用性[10]。
1.3.4PLS模型及LV
根據(jù)UVE優(yōu)選的波段,以樣品光譜吸光度作為模型輸入,分別對酒醅的酒精度、淀粉、水分、酸度4 個(gè)指標(biāo)建立PLS模型。作為對比,同時(shí)基于全光譜數(shù)據(jù)作為模型輸入,建立全光譜PLS模型。
在建立PLS模型時(shí),選取最優(yōu)LV個(gè)數(shù)提高有效信息率。類似于PCA中的主成分,LV的貢獻(xiàn)率第一個(gè)最大,依次減小,若選擇的建模用LV數(shù)目過少,則不能全面體現(xiàn)光譜特性,模型精度較差,預(yù)測能力降低;反之,若LV個(gè)數(shù)過多則會(huì)引入噪聲,降低模型性能[11]。
1.3.5LS-SVM校正模型
LS-SVM[12-15]是基于SVM擴(kuò)展的一種新興的非線性定量校正方法,把SVM中的不等式約束轉(zhuǎn)化為等式約束,降低了計(jì)算的復(fù)雜性,從而提高了建模效率,可以極大改善近紅外光譜定性、定量模型的預(yù)測能力,已廣泛應(yīng)用于模式識別、函數(shù)逼近、人臉檢測和數(shù)據(jù)挖掘等領(lǐng)域。
采用PLS降維提取的潛在變量作為LS-SVM模型的輸入變量,建立酒醅酒精度、淀粉、水分、酸度4 個(gè)指標(biāo)模型。
1.3.6模型評價(jià)標(biāo)準(zhǔn)
模型的評價(jià)指標(biāo)主要有決定系數(shù)R2、預(yù)測集均方根誤差(root mean square error of prediction,RMSEP)和相對分析誤差(relative percent difference,RPD)。通常,R2越接近1,則模型相關(guān)性越好,預(yù)測效果好;RMSEP越小,表明模型預(yù)測精度越高,誤差越小。RPD越大,模型分辨能力越強(qiáng),準(zhǔn)確度越高,當(dāng)RPD>3時(shí),認(rèn)為模型效果良好[16-18]。
[1]There are plenty of differences between China’s supply-siders and those who shaped Mr Reagan’s programme,not least in their diagnosis of their respective economies’ills.(2016-01-02)
2.1光譜波段優(yōu)選
UVE波段選擇變量穩(wěn)定性分析結(jié)果如圖1所示。豎直實(shí)線左邊是波長變量,右邊為引入的系統(tǒng)噪音變量。虛線表示變量穩(wěn)定性的上下閾值,處于兩閾值之間的變量可認(rèn)為是無關(guān)的信息量,超出閾值的部分為有用信息波長變量[19]。
圖1 UVE變量穩(wěn)定性分析結(jié)果Fig. 1 Results of UVE variable stability analysis
酒精度、淀粉、水分、酸度4 個(gè)指標(biāo)經(jīng)UVE篩選后分別得到635、928、1 028、835 個(gè)波長點(diǎn)數(shù),相較于原始光譜1 501 個(gè)波長點(diǎn),變量數(shù)顯著減少,并且保留了各指標(biāo)的特征官能團(tuán)倍頻及組合頻的所在波段位置,如9 960、6 897、6 711、5 155 cm-1等,有效地簡化了模型,并為后續(xù)建模準(zhǔn)確性提供了保障。
2.2PLS法建立定標(biāo)模型
在UVE波段篩選結(jié)果的基礎(chǔ)上,分別對酒醅酒精度、淀粉、水分、酸度4 個(gè)指標(biāo)進(jìn)行PLS建模,并以全光譜的PLS模型作為對照,結(jié)果如表2所示。經(jīng)UVE篩選波段能有效提高模型性能,R2、RPD均有提高,RMSEP明顯減小,模型的穩(wěn)定性及準(zhǔn)確度都有顯著改善,說明UVE波段選擇方法能夠在減少建模運(yùn)算用變量數(shù)、簡化模型的同時(shí),優(yōu)化模型性能,提取有效信息。
表2 白酒酒醅4 個(gè)指標(biāo)PLS建模結(jié)果Table 2 Result of PLS models for the four properties
2.3LV個(gè)數(shù)選擇
建立PLS模型時(shí),確定合理的LV個(gè)數(shù)對提高模型準(zhǔn)確度和穩(wěn)定性十分重要[20],通過觀察RMSEP值隨LV個(gè)數(shù)的變化情況可以優(yōu)選出最佳LV個(gè)數(shù)。如圖2所示,隨著LV個(gè)數(shù)的增加,RMSEP呈下降趨勢,當(dāng)達(dá)到最低點(diǎn)后平緩上升并趨于穩(wěn)定。計(jì)算潛在變量數(shù)是對數(shù)據(jù)壓縮優(yōu)化的過程,為了提高模型光譜數(shù)據(jù)的有效信息率,選擇RMSEP最低時(shí)對應(yīng)的LV個(gè)數(shù)為最佳潛在變量數(shù)[21],此時(shí)模型預(yù)測效果達(dá)到最佳,能充分實(shí)現(xiàn)光譜數(shù)據(jù)“少而精”的目的。因此,酒醅酒精度、淀粉、水分、酸度的LV個(gè)數(shù)分別選擇為11、9、9、10 個(gè)。
圖2 潛在變量與RMSEP的關(guān)系Fig. 2 Relationship between latent variables and RMSEP
表3 4種指標(biāo)潛在變量累計(jì)貢獻(xiàn)率Table 3 The explained variance of the first 11 LVs for the four properties by the best PLS models
2.4基于LV建立LS-SVM定標(biāo)模型
將PLS降維得到的LV分別作為酒精度、淀粉、水分、酸度LS-SVM模型的輸入。本實(shí)驗(yàn)選取RBF核函數(shù)作為LS-SVM建模的核函數(shù),以此減少訓(xùn)練過程的計(jì)算復(fù)雜性。此外,建立LS-SVM模型仍需兩個(gè)重要調(diào)節(jié)參數(shù):γ 和σ2,這兩個(gè)參數(shù)對模型的學(xué)習(xí)能力和預(yù)測能力具有很大的決定性[22]。其中,γ是正規(guī)參數(shù),取決于訓(xùn)練誤差最小化和估計(jì)函數(shù)平滑的權(quán)衡,對提高模型的泛化性起重要作用。σ2是核函數(shù)參數(shù),控制模型回歸誤差,反映模型的靈敏度[23-25]。目前,對于γ和σ2參數(shù)的選擇沒有一定的模式,本實(shí)驗(yàn)采用10 倍交叉驗(yàn)證的方法分析以確定優(yōu)化參數(shù)。建模結(jié)果如表4所示。
表4 白酒酒醅4 個(gè)指標(biāo)LS-SVM建模結(jié)果Table 4 Results of LS-SVM models for the four properties
由表4可見,LS-SVM模型效果較好,4 個(gè)指標(biāo)的RPD值均大于3,說明模型分析的分辨能力較高,同時(shí)R2與RMSEP均有較好表現(xiàn),說明LS-SVM模型的穩(wěn)健型、準(zhǔn)確度均達(dá)到較高水平。并且,以LV作為LS-SVM模型的輸入,不僅保留了準(zhǔn)確的光譜有效信息,而且顯著地降低模型復(fù)雜度,提高了模型的運(yùn)算速度與性能。
2.5UVE-PLS模型與LS-SVM模型建模效果比較
圖3 PLS模型與LS-SVM模型性能參數(shù)對比圖Fig. 3 Comparison of performance parameters between PLS models and LS-SVM models
對比PLS模型與LS-SVM模型效果,結(jié)果如圖3所示,無論是R2還是RMSEP,LS-SVM模型都取得了最優(yōu)效果,模型的精度與性能都有較大改善。
2.6UVE-PLS模型與LS-SVM模型預(yù)測效果比較
為比較模型的預(yù)測性能,分別將測試用66 個(gè)未參與建模的酒醅樣品帶入已建立LS-SVM模型和PLS模型中進(jìn)行驗(yàn)證,計(jì)算預(yù)測結(jié)果與理化檢測值的相對偏差并繪制箱線圖。由圖4可知,與PLS模型相比,LS-SVM模型的預(yù)測結(jié)果相對偏差極值差異更小,中位數(shù)接近0值,且樣品相對偏差分布更為集中,說明LS-SVM模型預(yù)測結(jié)果與理化檢驗(yàn)測量值更為接近,直觀地表明了LS-SVM模型在實(shí)際檢測應(yīng)用中具有更強(qiáng)的預(yù)測性能。
圖4 PLS模型與LS-SVM模型預(yù)測結(jié)果對比圖Fig. 4 Comparison of predicted results obtained with PLS models and LS-SVM models
由于白酒酒醅本身是一種成分復(fù)雜的不均勻物質(zhì)體系,體系中各組分的相互作用、噪聲及基線漂移等因素會(huì)對光譜測量造成影響,因此需要更為穩(wěn)健準(zhǔn)確的多元校正方法來實(shí)現(xiàn)其主要成分的測量。LS-SVM作為一種基于SVM算法簡化改良的非線性定量校正方法,與線性的PLS算法相比 較,具有更強(qiáng)的對復(fù)雜樣品的處理能力,可以使?jié)撛谧兞颗c濃度之間的相關(guān)性增強(qiáng)[9]。
此外,在建模時(shí),通過潛在變量將PLS和LS-SVM有機(jī)結(jié)合了起來,在線性模型基礎(chǔ)上補(bǔ)償了 酒醅體系的非線性,因此,基于LV的LS-SVM建模方法更適用于白酒酒醅等復(fù)雜的非線體系的準(zhǔn)確分析,能夠更明顯提高預(yù)測精確度,降低誤差率,簡化模型復(fù)雜度。
基于近紅外光譜技術(shù),對白酒酒醅的酒精度、淀粉、水分和酸度4 個(gè)指標(biāo)的定量分析進(jìn)行了深入研究。利用UVE算法優(yōu)選了有效特征波段,并通過潛在變量將PLS與LS-SVM兩種算法結(jié)合了起來,建立了更為簡化、高效的LS-SVM模型。
經(jīng)比較發(fā)現(xiàn):LS-SVM所建模型的酒精度、淀粉、水分和酸度的相關(guān)系數(shù)R2、RMSEP以及RPD均表現(xiàn)良好,相比PLS模型有突出的優(yōu)化效果。經(jīng)待測樣品進(jìn)行驗(yàn)證,LS-SVM模型也具有更強(qiáng)的預(yù)測能力,預(yù)測結(jié)果更為準(zhǔn)確。說明基于LV的L S-SVM建模方法能夠明顯提高預(yù)測精確度,降低誤差率,簡化模型復(fù)雜度并適用于白酒酒醅的實(shí)際生產(chǎn)應(yīng)用。
考慮到白酒酒醅的復(fù)雜性以及LS-SVM算法優(yōu)越 的非線性校正特性,證明了在實(shí)際生產(chǎn)應(yīng)用中,LS-SVM算法具有良好的可行性, 且模型檢測性能穩(wěn)定,可用于白酒釀造過程酒醅的主要成分的檢測。為白酒酒醅及相似的復(fù)雜體系物質(zhì)的品質(zhì)分析方法研究提供了新 的思路,同時(shí),為近紅外光譜技術(shù)在白酒生產(chǎn)過程的應(yīng)用提供了技術(shù)借鑒。
參考文獻(xiàn):
[1] 黃治國, 侯海波, 羅惠波, 等. 濃香型白酒酒醅發(fā)酵過程中 淀粉和還原糖的變化規(guī)律研究[J]. 中國釀造, 2012, 31(7): 107-110. DOI:10. 3969/j.issn.0254-5071.2012.07.028.
[2] 郝建國, 任晶婧. 近紅外光譜測定酒醅[J]. 釀酒科技, 201 1(5): 106-107.
[3] 周楊, 劉杰, 王紀(jì)元. 中國釀酒行業(yè)中近紅外光譜技術(shù)的應(yīng) 用進(jìn)展[J].食品安全質(zhì)量檢測學(xué)報(bào), 2014(4): 1100-1104.
[4] 邵春甫, 李長文, 王珊, 等. 紅外光 譜技術(shù)在中國釀酒行業(yè)中的應(yīng)用研究進(jìn)展[J]. 中國釀造, 2013, 32(4): 1 5-19. DOI:10.3969/ j.issn.0254-5071.2013.04.004.
[5] 魏 赫楠, 譚紅, 楊昌彪, 等. 近紅外光譜技術(shù)在白酒行業(yè)的應(yīng)用現(xiàn)狀及展望[J]. 釀酒科技, 2013(11): 85-87.
[6] 彭幫柱, 龍明華, 岳田利, 等. 傅立葉變換近紅外光譜法檢測白酒總酸和總酯[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2006(12): 216-219. DOI:10.3321/ j.issn:1002-6819.2006.12.045.
[7] 陳妍, 胡慧, 汪鳳祖. 近紅外光譜法快速分析白酒中的關(guān)鍵指標(biāo)[J].釀酒科技, 201 0(11): 90-94.
[8] 楊國強(qiáng), 張淑娟, 趙艷茹. 基于近紅外透射光譜的汾陽王酒快速鑒別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2013(增刊1): 189-193. DOI:10.6041/ j.issn.1000-1298.2013.S1.034.
[9] 褚 小立. 化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)[M]. 北京: 化學(xué)工業(yè)出版社, 2011: 61-83.
[10] 李倩倩. 無信息變量消除法在三種譜學(xué)方法中的定量分析研究[D].北京: 中國農(nóng)業(yè)大學(xué), 2014.
[11] 王莉, 何勇, 劉飛, 等. 應(yīng)用光譜技術(shù)和支持向量機(jī)分析方法快速檢測啤酒糖度和pH值[J]. 紅外與毫米波學(xué)報(bào), 2008, 27(1): 51-55. DOI:10.3321/j.issn:1001-9014.2008.01.012.
[12] 張德虎, 田海清, 劉超, 等. 可見近紅外光譜檢測河套蜜瓜糖度和硬度研究: 基于LS-SVM[J]. 農(nóng)機(jī)化研究, 2014(2): 10-14.
[13] 安欣, 徐碩, 張錄達(dá), 等. 多因變量LS-SVM回歸算法及其在近紅 外光譜定量分析中的應(yīng)用[J]. 光譜學(xué)與光譜分析, 2009, 29(1): 127-130. DOI:10.3964/j.issn.1000-0593(2009)01-0127-04.
[14] 孫俊, 毛罕平, 羊一清, 等. 基于GA-LS-SVM的水稻葉片含氮率預(yù)測[J]. 江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 31(1): 6-10. DOI:10.3969/ j.issn.1671-7775.2010.01.002.
[15] 劉燕德, 周延睿. 基于GA-LS-SVM的蘋果糖度近紅外光譜檢測[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 41(7): 229-234.
[16] 高玨, 王從慶. 基于LS-SVM的蘋果近紅外光譜回歸模型的研究[J].計(jì)算機(jī)測量與控制, 2011, 19(1): 176-191.
[17] ZHENG Hong, LU Hongfei. A least-squares support vector machine (LS-SVM) based on fractal analysis and CIELab parameters for the detection of browning degree on mango (Mangifera indica L.)[J]. Computers and Electronics in Agriculture, 2012, 83: 47-51. DOI:10.1016/j.compag.2012.01.012.
[18] GHAEDI M, GHAEDI A M, HOSSAINPOUR M, et al. Least squaresupport vector (LS-SVM) method for modeling of methylene blue dye adsorption using copper oxide loaded on activated carbon: kinetic and isotherm study[J]. Journal of Industrial and Engineering Chemistry, 2014, 20(4): 1641-1649. DOI:10.1016/j.jiec.2013.08.011.
[19] 周林峰. 黃酒主要品質(zhì)的近紅外光譜檢測模型建立與轉(zhuǎn)移的研究[D].杭州: 中國計(jì)量學(xué)院, 2013: 1-82.
[20] 楊曉雷. LSSVM優(yōu)化方法的研究[D]. 南寧: 廣西大學(xué), 2012.
[21] 王義峰, 張中衛(wèi). LSSVM在酒類近紅外光譜檢測中的應(yīng)用[J]. 信息技術(shù), 2009(11): 90-92. DOI:10.3969/j.issn.1009-2552.2009.11.026.
[22] NIAZI A, SHARIfiS, AMJADI E. Least-squares support vector machines for simultaneous voltammetric determination of lead and tin: a comparison between LS-SVM and PLS in voltammetric data[J]. Journal of Electroanalytical Chemistry, 2008, 623(1): 86-92. DOI:10.1016/j.jelechem.2008.06.021.
[23] 孫鑫. 基于LS-SVM建立發(fā)酵過程動(dòng)態(tài)模型及其參數(shù)優(yōu)化[D]. 北京:北京工業(yè)大學(xué), 2013.
[24] SHAHLAEI M, FASSIHI A, SAGHAIE L. Application of PCANN and PC-LS-SVM in QSAR of CCR1 antagonist compounds: a comparative study[J]. European Journal of Medicinal Chemistry, 2010, 45(4): 1572-1582. DOI:10.1016/j.ejmech.2009.12.066.
[25] SUN Tong, LIN Hongjian, XU Huirong, et al. Effect of fruit moving speed on predicting soluble solids content of ‘Cuiguan’ pears (Pomaceae pyrifolia Nakai cv. Cuiguan) using PLS a nd LS-SVM regression[J]. Postharvest Biology and Technology, 2009, 51(1): 86-90.
Quantitative Analysis of Chemical Compositions of Fermented Grains of Chinese Liquor Based on Least Squares Support Vector Machine (LS-SVM)
XIONG Yating, LI Zongpeng, WANG Jian*, FENG Siwen, LI Ziwen, YIN Jianjun, SONG Quanhou
(China National Research Institute of Food and Fermentation Industries, Beijing100015, China)
Abstract:Near infrared spectroscopy was used to predict the main chemical ingredients of fermented grains of Chinese liquor by modeling. The established models were optimized for improved prediction performance. Latent variables (LVs) were extracted by partial least squares (PLS) and used as the input variables of least squares support vector machine (LSSVM) for the establishment of NIR quantitative models to predict the alcohol, starch, moisture contents and acidity of fermented grains. Furthermore, a comparison with the PLS models built with waveband selection using uninformative variable elimination (UVE) was carried out. The results showed that compared with the PLS models, quantitative correlation coefficients (R2), root mean square errors of prediction (RMSEP), and relative percent differences (RPD) of alcohol, starch, moisture and acidity showed better performances in the LS-SVM models, respectively. The accuracy of the LS-SVM models in predicting unknown samples was significantly higher than that of the PLS models. In summary, the accuracy, stability and prediction performance of the LS-SVM models were better than those of the PLS ones. This study can provide a new way for quantitative analysis of fermented grains of Chinese liquor.
Key words:fermented grains of Chinese liquor; least squares support vector machines (LS-SVM); latent variables (LVs); partial least squares (PLS); waveband selection
收稿日期:2015-08-10
作者簡介:熊雅婷(1990—),女,碩士研究生,研究方向?yàn)槭称窡o損檢測。E-mail:xiongyating1130@163.com
*通信作者:王?。?973—),男,高級工程師,博士,研究方向?yàn)槭称窡o損檢測。E-mail:onlykissjohn@hotmail.com
DOI:10.7506/spkx1002-6630-201612029
中圖分類號:TS261.7
文獻(xiàn)標(biāo)志碼:A
文章編號:1002-6630(2016)12-0163-06引文格式: