袁彥彥,王興芬
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
基于SVM的生鮮食品貨架期預(yù)測(cè)
袁彥彥,王興芬
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
采用支持向量機(jī)(SVM)的方法對(duì)零售商生鮮食品的貨架期預(yù)測(cè)問(wèn)題進(jìn)行了研究,建立了貨架期預(yù)測(cè)模型,以速凍水餃為例,在Matlab環(huán)境下對(duì)該模型進(jìn)行了仿真實(shí)驗(yàn),并與BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)值比較,結(jié)果表明該模型預(yù)測(cè)得到的貨架期與實(shí)際值有更好的擬合度,提高了預(yù)測(cè)的準(zhǔn)確性,為生鮮食品的貨架期預(yù)測(cè)提供了新途徑。
支持向量機(jī);生鮮食品;貨架期;預(yù)測(cè)
隨著生活水平的提高,人們無(wú)論是對(duì)食品的品質(zhì)還是安全性,都提出了更高的要求。其中生鮮食品屬于溫度敏感貨物,不可避免地存在著腐敗變質(zhì)的風(fēng)險(xiǎn)。貨架期是指貨物能滿足顧客對(duì)食品質(zhì)量要求的時(shí)間期限,當(dāng)食品自身的某種特性達(dá)到不可接受時(shí),即為該貨物的貨架期終點(diǎn)[1]。近年來(lái),針對(duì)生鮮食品貨架期的研究成為食品安全領(lǐng)域的熱點(diǎn)之一,且多以易腐食品為研究對(duì)象,在低溫范圍內(nèi)或波動(dòng)溫度條件下進(jìn)行實(shí)驗(yàn),試圖通過(guò)可觀測(cè)的食品變化的特征指標(biāo),來(lái)反映食品的品質(zhì)變化,從而確定生鮮食品的貨架期,但由于低溫導(dǎo)致食品衰敗的機(jī)制比較復(fù)雜,構(gòu)建模型所采用的方法大多數(shù)都有一定的適用范圍和對(duì)象。而本文采用的SVM方法適用范圍廣、穩(wěn)定性高,用于解決生鮮食品構(gòu)建貨架期預(yù)測(cè)模型的問(wèn)題,不僅能為生鮮貨架期預(yù)測(cè)提供新途徑,也可以為生鮮食品的銷售管理提供參考依據(jù)。
在生鮮食品的腐敗過(guò)程中,始終伴隨著各種物理化學(xué)反應(yīng)和體內(nèi)微生物的活動(dòng),間接或直接地影響著生鮮食品的貨架期,影響生鮮食品貨架期的因素主要可分為感官指標(biāo)、理化指標(biāo)和微生物指標(biāo),其中感官指標(biāo)又包括顏色、風(fēng)味、形態(tài)、質(zhì)地、持水力等;理化指標(biāo)包括溫度、水分含量、PH、酶、TVBN、葉綠素等;微生物指標(biāo)包括特種菌含量、菌落總數(shù)等。根據(jù)這些指標(biāo),當(dāng)前生鮮食品的貨架期預(yù)測(cè)模型的構(gòu)建方法主要有微生物學(xué)法、Arrhenius法、神經(jīng)網(wǎng)絡(luò)方法、威布爾危害分析法以及Q10模型[2-17],方法及其特點(diǎn)見表1。
通過(guò)上述分析以及文獻(xiàn)的調(diào)研,從指標(biāo)來(lái)看,以往研究多以某種特定指標(biāo)比如特種菌、揮發(fā)性鹽基氮,作為建立貨架期的衡量指標(biāo),實(shí)驗(yàn)中食品品質(zhì)指標(biāo)間關(guān)聯(lián)度以及品質(zhì)指標(biāo)與貨架期之間的關(guān)系研究不足,影響了預(yù)測(cè)結(jié)果的準(zhǔn)確性[2-8];從貨架期模型的構(gòu)建方法來(lái)看,主要是基于特定的研究對(duì)象,選用適合的方法構(gòu)建貨架期模型,這樣的模型存在針對(duì)性和適用范圍的限制性[2-17],并且在所使用的Arrhenius方法中,因貨架期是伴隨著化學(xué)反應(yīng)發(fā)生的,與溫度有關(guān),大多數(shù)研究者通過(guò)實(shí)驗(yàn)獲取該方法中公式的參數(shù)并設(shè)定為常數(shù),但實(shí)際上參數(shù)是與溫度存在關(guān)系的,間接地影響結(jié)果的準(zhǔn)確性[18]。而支持向量機(jī)方法已經(jīng)在其他領(lǐng)域得到了較廣的應(yīng)用[19-22],且在貨架期預(yù)測(cè)模型的研究中采用該方法的研究尚少,本文則采用該方法對(duì)生鮮食品貨架期進(jìn)行研究,構(gòu)建生鮮食品的貨架期預(yù)測(cè)模型。
表1 貨架期模型構(gòu)建方法
在統(tǒng)計(jì)學(xué)理論和數(shù)學(xué)基礎(chǔ)上發(fā)展起來(lái)的支持向量機(jī)(Support Vector Machines,SVM)是一種新的機(jī)器學(xué)習(xí)方法,適用范圍廣,穩(wěn)定性高,具有較好的“魯棒”性,已非常成功地處理回歸和模式識(shí)別等諸多問(wèn)題,其中支持向量機(jī)回歸算法(Support Vector Machines Regression,SVMR)可以解決線性或非線性回歸問(wèn)題,進(jìn)行時(shí)間序列預(yù)測(cè)或非線性建模與預(yù)測(cè)。本文采用支持向量機(jī)的回歸算法進(jìn)行預(yù)測(cè),其基本思想是通過(guò)非線性變換?,將輸入空間變換到一個(gè)高維數(shù)的特征空間,并在這個(gè)空間中進(jìn)行線性回歸,這樣在高緯特征空間的線性回歸就對(duì)應(yīng)于低維輸入空間的非線性回歸。主要的操作是通過(guò)定義適當(dāng)?shù)暮撕瘮?shù)K(x,y)=?(x)??(y)來(lái)實(shí)現(xiàn)這個(gè)非線性變換。在實(shí)際應(yīng)用中,常用的核函數(shù)包括線性核函數(shù)、徑向基核函數(shù)、多項(xiàng)式內(nèi)積核函數(shù)。
根據(jù)SVM回歸理論建立生鮮食品貨架期預(yù)測(cè)模型,如圖1所示。
圖1 貨架期預(yù)測(cè)的SVM模型
在預(yù)測(cè)模型的建立過(guò)程中,設(shè)生鮮食品貨架期預(yù)測(cè)的指標(biāo)數(shù)據(jù)樣本集為{(yi,xi),i=1,2,...,n},其中x∈Rn,y∈Rn,xi是模型的輸入數(shù)據(jù),表示與生鮮食品腐敗高相關(guān)的因變量指標(biāo),比如風(fēng)味、總體接受性、水分含量、過(guò)氧化值、酸價(jià)、菌落數(shù)等;yi是預(yù)測(cè)模型的輸出數(shù)據(jù),表示作為衡量貨架期的結(jié)果指標(biāo),比如有效積溫、揮發(fā)性鹽基氮、微生物含量等。那么回歸預(yù)測(cè)模型用下列方程表示:
式中,w為權(quán)向量,φ(x)為非線性映射函數(shù),b為閾值。
式中 αi、為拉格朗日因子。根據(jù)生鮮食品的指標(biāo)值,由上式即可以對(duì)生鮮食品的貨架期進(jìn)行預(yù)測(cè)。
本文仿真實(shí)驗(yàn)數(shù)據(jù)來(lái)源于文獻(xiàn)[9],其中數(shù)據(jù)是該文獻(xiàn)作者在-28~-12℃溫度波動(dòng)下進(jìn)行實(shí)驗(yàn)以及感官評(píng)價(jià)獲得的,并且還設(shè)定了將貯藏有效積溫40 332h·℃作為速凍水餃貨架期終點(diǎn),具體數(shù)據(jù)見表2。在文獻(xiàn)[9]中利用BP神經(jīng)網(wǎng)絡(luò)建立生鮮食品速凍水餃的貨架期預(yù)測(cè)模型,通過(guò)預(yù)測(cè)水餃的有效積溫計(jì)算得到水餃距貨架期終點(diǎn)的時(shí)間,即剩余貨架期。在Matlab環(huán)境下,對(duì)建立的基于SVM的預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn),并與參考文獻(xiàn)的實(shí)驗(yàn)結(jié)果進(jìn)行比較,最后為驗(yàn)證本文所用方法的有效性,又進(jìn)行了組合指標(biāo)的預(yù)測(cè)。
對(duì)應(yīng)圖1所示模型,輸入數(shù)據(jù)x即為風(fēng)味、總體接受性、水分含量、亨特白度、酸價(jià)和過(guò)氧化值,輸出數(shù)據(jù)y即為有效積溫。本次實(shí)驗(yàn)中在Matlab的環(huán)境下進(jìn)行生鮮食品貨架期的SVM預(yù)測(cè)模型的仿真實(shí)驗(yàn)。其步驟為:
(1)按照格式要求準(zhǔn)備數(shù)據(jù)集。同文獻(xiàn)[9]一致,選取表中16組作為訓(xùn)練數(shù)據(jù),其余5組(9、12、13、16、17)數(shù)據(jù)作為測(cè)試數(shù)據(jù)。輸出為有效積溫(y),其余為輸入變量。
(2)將模型訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都進(jìn)行歸一化處理;然后采用交叉驗(yàn)證對(duì)主要參數(shù)c與g(懲罰參數(shù)c和核函數(shù)參數(shù)g)進(jìn)行尋優(yōu),精細(xì)化尋優(yōu)后c和g的范圍為2-4到24,步長(zhǎng)為3,通過(guò)參數(shù)迭代,尋找出使得模型訓(xùn)練誤差值最小的c、g參數(shù)組合,結(jié)果如圖2所示,c值為16,g值為0.203 06,此時(shí)交叉驗(yàn)證的均方誤差(MSE)為0.000 387 62。
表2 各測(cè)試指標(biāo)數(shù)值
圖2SVM參數(shù)優(yōu)化3D視圖
(3)利用上面得到的最佳參數(shù)對(duì)SVM進(jìn)行訓(xùn)練,建立預(yù)測(cè)模型model,為判斷模型的有效性,首先對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了回歸預(yù)測(cè),得到的預(yù)測(cè)效果較好,然后對(duì)測(cè)試數(shù)據(jù)集進(jìn)行測(cè)試和預(yù)測(cè),預(yù)測(cè)結(jié)果如圖3所示,相關(guān)系數(shù)為0.991 3,MSE為0.01%。
圖3 測(cè)試樣本模型預(yù)測(cè)結(jié)果
根據(jù)上述預(yù)測(cè)結(jié)果,將參考文獻(xiàn)中所用的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型與本文采用的SVM預(yù)測(cè)模型以及實(shí)際測(cè)定值相比較,見表3,其中距貨架期終點(diǎn)積溫=終點(diǎn)積溫-有效積溫預(yù)測(cè)值,并計(jì)算距貨架期終點(diǎn)積溫的相對(duì)誤差。
表3 有效積溫預(yù)測(cè)值及驗(yàn)證
從表3可以我們看出,平均相對(duì)誤差SVM模型要比BP神經(jīng)網(wǎng)絡(luò)模型小0.392,且平均絕對(duì)誤差也相應(yīng)的小81.6。再對(duì)這兩種方法再進(jìn)行誤差評(píng)估,計(jì)算兩種預(yù)測(cè)模型的有效積溫預(yù)測(cè)值與實(shí)際值的誤差均方差,得到BP神經(jīng)網(wǎng)絡(luò)的誤差均方差為497.5,而SVM的誤差均方差為228.1,明顯要小于前者。所以基于統(tǒng)計(jì)理論和數(shù)學(xué)為基礎(chǔ)的支持向量機(jī)回歸模型,要比BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果更理想。根據(jù)文獻(xiàn)[9]中有效積溫的計(jì)算公式(其中K為有效積溫h·℃,T為實(shí)測(cè)的冷藏溫度℃,C是相對(duì)零點(diǎn),N是冷藏時(shí)間),假定測(cè)試樣本數(shù)據(jù)是在恒定溫度-15℃下測(cè)定,對(duì)SVM模型預(yù)測(cè)結(jié)果和文獻(xiàn)[9]BP神經(jīng)網(wǎng)絡(luò)模型所預(yù)測(cè)結(jié)果分別計(jì)算貨架期,并進(jìn)行比較,見表4。
表4 BP神經(jīng)網(wǎng)絡(luò)與SVM貨架期預(yù)測(cè)結(jié)果比較
從預(yù)測(cè)值來(lái)看,兩種預(yù)測(cè)模型所得結(jié)果的平均相對(duì)誤差中,SVM要比BP小0.4,雖然兩者的絕對(duì)誤差相等,但對(duì)其再進(jìn)行誤差評(píng)估,得到BP神經(jīng)網(wǎng)絡(luò)模型的誤差均方差(1.58)要大于SVM的誤差均方誤差(0.836)。
上面所述是將有效積溫作為貨架期的終結(jié)指標(biāo),而過(guò)氧化值也是一種檢測(cè)食品質(zhì)量和變質(zhì)程度的指標(biāo),產(chǎn)品的衛(wèi)生標(biāo)準(zhǔn)規(guī)定,過(guò)氧化值不得大于0.2%,即15.76meq/kg,則利用SVM模型對(duì)有效積溫和過(guò)氧化值進(jìn)行組合預(yù)測(cè),不但可以對(duì)貨架期進(jìn)行預(yù)測(cè),還可以起到一定程度的預(yù)警作用。重新隨機(jī)選取訓(xùn)練及測(cè)試數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。在進(jìn)行實(shí)驗(yàn)之前,利用SPSS軟件對(duì)預(yù)測(cè)指標(biāo)進(jìn)行簡(jiǎn)單相關(guān)性分析,兩者相關(guān)性系數(shù)r=0.94,p<0.01顯著相關(guān),再對(duì)其進(jìn)行偏相關(guān)分析,即在控制其他變量的情況下,分析有效積溫和過(guò)氧化值之間的相關(guān)性,結(jié)果見表5。
表5 相關(guān)性分析結(jié)果
結(jié)果表明,兩者相關(guān)系數(shù)r=0.109<0.3,存在弱相關(guān),且p= 0.689>0.05,兩者之間不存在顯著的相關(guān)關(guān)系,最后對(duì)有效積溫和過(guò)氧化值進(jìn)行基于SVM模型的組合預(yù)測(cè),結(jié)果見表6。
表6 SVM模型對(duì)有效積溫和過(guò)氧化值的組合預(yù)測(cè)結(jié)果及驗(yàn)證
從表6可知,SVM模型的預(yù)測(cè)結(jié)果中有效積溫的最大相對(duì)誤差為5.01%,平均相對(duì)誤差為2.706%,過(guò)氧化值的最大相對(duì)誤差為6.39%,平均相對(duì)誤差為3.406%,說(shuō)明此模型可有效地進(jìn)行組合預(yù)測(cè)貨架期,也說(shuō)明了預(yù)測(cè)模型的實(shí)用性和有效性。
SVM使用范圍廣,可以較好地解決小樣本、非線性、高維數(shù)、局部極小值等實(shí)際問(wèn)題且具有良好的推廣價(jià)值,本文采用該方法對(duì)生鮮食品貨架期預(yù)測(cè)進(jìn)行了研究,建立了模型,且以參考文獻(xiàn)[9]中的速凍水餃為例,利用Matlab對(duì)該模型進(jìn)行仿真實(shí)驗(yàn),并將結(jié)果與參考文獻(xiàn)[9]所用的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行了比較,結(jié)果顯示本文SVM模型的預(yù)測(cè)值與實(shí)際值的相對(duì)誤差最大為3.1%,比BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果更能接近實(shí)際情況,更為理想。最后又通過(guò)將速凍水餃的指標(biāo)組合預(yù)測(cè),再次說(shuō)明了SVM模型的可用性和有效性,以及可以更好地為生鮮食品貨架期管理提供有效的參考依據(jù),并為生鮮食品的貨架期預(yù)測(cè)提供新途徑。
[1]胡位歆,金王平,劉東紅.冷鏈?zhǔn)称菲焚|(zhì)(貨架壽命)預(yù)測(cè)模型的建立方法[J].中國(guó)食物與營(yíng)養(yǎng),2014,20(5):45-49.
[2]宋晨,劉寶林,王欣,等.冷凍羊肉剩余貨架期預(yù)測(cè)模型研究[J].食品科學(xué),2010,31(6):279-282.
[3]Alejandra Tomaca,Rodolfo Horacio Mascheronib,María Isabel Yeannes.Modelling the effect of gamma irradiation on the inactivation and growth kinetics of psychrotrophic bacteria in squid rings during refrigerated storage.Shelf-life predictions[J].Journal of Food Engineering,2013,117(2):211-216.
[4]Stefanie Bruckner,Antonia Albrecht,Brigitte Petersen.A predictive shelf life model as a tool for the improvement of quality management in pork and poultry chains[J].Food control,2013,29(2):451-460.
[5]佟懿,謝晶.鮮帶魚不同貯藏溫度的貨架期預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(6):301-305.
[6]范新光.鮮切西蘭花減壓冷藏保鮮技術(shù)與貨架期預(yù)測(cè)模型的研究[D].煙臺(tái):煙臺(tái)大學(xué),2014.
[7]李汴生,黃智君,張曉銀,等.冷配送萵筍菜肴的貨架期預(yù)測(cè)模型建立與評(píng)價(jià)[J].現(xiàn)代食品科技,2015,31(3):177-183.
[8]謝晶,張利平,高志立,等.雞毛菜的品質(zhì)動(dòng)力學(xué)分析及貨架期預(yù)測(cè)模型[J].食品科學(xué),2014,35(10):268-272.
[9]潘治利,張卓,黃忠民,等.BP神經(jīng)網(wǎng)絡(luò)結(jié)合有效積溫預(yù)測(cè)速凍水餃變溫冷藏貨架期[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(22):276-281.
[10]Sumit Goyal,Gyanendra Kumar Goyal.Cascade Artificial Neural Network Models for Predicting Shelf Life of Processed Cheese[J].Journal of Advances in Information Technology,2013,4(2):80-83.
[11]Ubonrat Siripatrawan,Pantipa Jantawat.A novel method for shelf life prediction of a packaged moisture sensitive snack using multilayer perceptron neural network[J].Expert Systems with Applications,2008, 34(2):1 562-1 567.
[12]蔡超.酸奶在貯存期間參數(shù)的變化和對(duì)貨架壽命預(yù)測(cè)模型的研究[D].武漢:華中農(nóng)業(yè)大學(xué),2012.
[13]張麗平,余曉琴,童華榮.Weibull模型在板鴨貨架壽命預(yù)測(cè)中的應(yīng)用[J].食品科技,2010,35(2):111-113.
[13]W S Duyvesteyn,E Shimoni,T P Labuza.Determination of the End of Shelf-life for Milk using Weibull HazardMethod[J].LWT-Food Science and Technology,2001,34(3):143-148.
[14]顧海寧.冷卻豬肉貯存中的品質(zhì)變化及貨架期預(yù)測(cè)[J].現(xiàn)代食品科技,2013,29(11):2 621-2 626.
[15]劉春芝,許洪高,李紹振,等.柑橘類果汁貨架期研究進(jìn)展[J].食品科學(xué),2012,33(13):292-298.
[16]S Limbo L,Torri N,Sinelli L,Franzetti E.Casiraghi.Evaluation and predictive modeling of shelf life of minced beef stored in high-oxygen modified atmosphere packaging at different temperatures[J].Meat Science,2010,84(1):129-136.
[17]Wenli Dong,Xue Gong,Jing Dong etc.Oxidation kinetics of hazelnut shelf-life prediction model[J].Applied Mechanics and Materials, 2012,200:466-469.
[18]陳海建,滕克難,等.基于修正Arrhenius方法的SRM藥柱儲(chǔ)存壽命預(yù)估[J].彈簧與制導(dǎo)學(xué)報(bào),2011,31(4):232-235.
[19]聶銘,周冀衡,等.基于MIV-SVM的烤煙評(píng)吸質(zhì)量預(yù)測(cè)模型[J].中國(guó)煙草學(xué)報(bào),2014,20(6):56-62.
[20]秦永寬,黃聲享,趙卿.基于小波消噪和LS-SVM的混沌時(shí)間序列預(yù)測(cè)模型及其應(yīng)用[J].大地測(cè)量與地球動(dòng)力學(xué),2008,28(6):96-99.
[21]劉俊娥,慕檸嚀,劉丙午.固有模態(tài)SVM預(yù)測(cè)模型在零售銷量預(yù)測(cè)中的應(yīng)用[J].物流技術(shù),2013,23(11):76-78.
[22]曹秋勤.基于支持向量機(jī)的蔬菜質(zhì)量安全預(yù)測(cè)及溯源模型的研究與應(yīng)用[D].廣州:華南理工大學(xué),2014.
Study on Fresh Food Shelf Life Forecasting Based on SVM
Yuan Yanyan,Wang Xingfen
(School of Information Management,Beijing University of Information Technology,Beijing 100192,China)
In this paper,we used the support vector machine to forecast the shelf life of the fresh food of a retailer,built the shelf life forecasting model,then in the case of the quick-frozen dumpling,conducted a simulation experiment of the model under the Matlab environment;next we compared the result yielded with that by the BP neural network model and demonstrated that the model established in this paper fitted more closely with the actual value and was thus more accurate.
SVM;fresh food;shelf life;forecasting
TS207;TP399
A
1005-152X(2015)10-0064-04
2015-07-01
北京市教委科技重點(diǎn)項(xiàng)目“電子商務(wù)平臺(tái)交易糾紛規(guī)避的若干支撐技術(shù)研究”(KZ201411232036)
袁彥彥(1988-),女,山東臨沂人,北京信息科技大學(xué)信息管理學(xué)院碩士研究生,研究方向:物流工程;王興芬(1968-),女,教授,博士,研究方向:物流管理、電子商務(wù)與WEB安全。
10.3969/j.issn.1005-152X.2015.10.019