逄 濱
(青島農(nóng)業(yè)大學(xué)食品科學(xué)與工程學(xué)院,山東青島 266109)
目前,我國鵝肥肝質(zhì)量分級(jí)主要包括感官指標(biāo)分級(jí)、重量分級(jí)、理化指標(biāo)分級(jí)等。其中感官指標(biāo)分級(jí)主要根據(jù)鵝肥肝的色澤等級(jí)并輔之以彈性、損征和氣味等進(jìn)行人工評(píng)級(jí)。這種人工分級(jí)方法依賴評(píng)級(jí)員的感官和經(jīng)驗(yàn),具有很強(qiáng)的主觀性和不一致性,而且評(píng)級(jí)效率低,不能滿足現(xiàn)代鵝肥肝產(chǎn)業(yè)的發(fā)展要求。
采用機(jī)器視覺技術(shù)實(shí)現(xiàn)農(nóng)產(chǎn)品品質(zhì)檢測與自動(dòng)分級(jí)應(yīng)用已成為近年來農(nóng)產(chǎn)品加工與檢測領(lǐng)域的研究熱點(diǎn),主要涉及了農(nóng)產(chǎn)品顏色[1-7]、面積大小及形狀[8-13]、表面損傷及缺陷檢測[14-16]等。目前應(yīng)用機(jī)器視覺技術(shù)進(jìn)行鵝肥肝色澤自動(dòng)分級(jí)的研究較少,但在其他肉類(牛肉、豬肉等)顏色分級(jí)領(lǐng)域的研究已經(jīng)較為成熟。在牛肉顏色分級(jí)研究方面,陳坤杰等[1]采用計(jì)算機(jī)圖像處理技術(shù),計(jì)算得到了牛肉肌肉區(qū)域的R、G、B、H、S、I顏色特征分量,并分析了這些顏色特征分量在牛肉儲(chǔ)藏期間的變化規(guī)律;陳坤杰等[2]以這些顏色特征分量的參數(shù)值作為輸入,構(gòu)建了基于BP神經(jīng)網(wǎng)絡(luò)的牛肉肌肉顏色等級(jí)預(yù)測模型,模型的預(yù)測準(zhǔn)確率可達(dá)95%;CHEN等[3]提取了牛肉眼肌切面的皮下脂肪區(qū)域的12個(gè)脂肪顏色特征,并以12個(gè)顏色特征參數(shù)為輸入、脂肪顏色等級(jí)為輸出,建立了一個(gè)最優(yōu)支持向量機(jī)(SVM)分級(jí)模型,模型的預(yù)測準(zhǔn)確率為97.4%;SUN等[4]分析并提取了21個(gè)牛肉精肉圖像的顏色特征,并分別利用多元線性回歸法(MLR)和支持向量機(jī)法(SVM)建立了牛肉肌肉顏色分級(jí)模型,其模型的預(yù)測準(zhǔn)確率分別為86.8%和94.7%。在豬肉顏色分級(jí)研究方面,賈淵等[5]將豬肉的R、G、B顏色分量以及亮度和飽和度構(gòu)建了一個(gè)新的顏色維度,并建立了SVM顏色分級(jí)模型,模型的分級(jí)正確率為96.5%。
本研究提出一種基于機(jī)器視覺技術(shù)的鵝肥肝色澤自動(dòng)分級(jí)模型,用以彌補(bǔ)傳統(tǒng)人工色澤評(píng)級(jí)的不足,通過機(jī)器視覺技術(shù)提取反映鵝肥肝色澤等級(jí)的色澤特征參數(shù),分別建立多元線性回歸分級(jí)模型和典型判別函數(shù)分級(jí)模型,實(shí)現(xiàn)鵝肥肝色澤等級(jí)的自動(dòng)判定。
鵝肥肝樣本取自于青島農(nóng)業(yè)大學(xué)優(yōu)質(zhì)水禽研究所育種基地,根據(jù)文獻(xiàn)[17]方法對(duì)75只青農(nóng)灰鵝進(jìn)行統(tǒng)一填飼、殺鵝取肝,得到75個(gè)新鮮鵝肥肝樣本,將所有鵝肥肝樣本在育種基地加工現(xiàn)場用真空薄膜袋封裝打包,并使用醫(yī)療冷藏箱將樣本從加工現(xiàn)場運(yùn)至實(shí)驗(yàn)室。封裝打包前,參照國家行業(yè)標(biāo)準(zhǔn)(NY 67—1988)對(duì)鵝肥肝樣本的色澤進(jìn)行人工評(píng)級(jí),將肝表面光澤良好、色度均勻且為淡黃、米黃或淺粉色的樣本劃分為特級(jí),用數(shù)值1(級(jí))標(biāo)記;將呈現(xiàn)淡黃、米黃或淺粉色的樣本劃分為一級(jí),用數(shù)值2(級(jí))標(biāo)記;將呈現(xiàn)淡黃、米黃、黃色或淺粉色的樣本劃分為二級(jí),用數(shù)值3(級(jí))標(biāo)記;將呈現(xiàn)淡黃、米黃、黃色、淺粉或淺紅色的樣本劃分為三級(jí),用數(shù)值4(級(jí))標(biāo)記。
鵝肥肝樣本圖像的采集采用機(jī)器視覺系統(tǒng),主要由工業(yè)相機(jī)、光源、計(jì)算機(jī)組成,如圖1所示。
圖1 鵝肥肝樣本圖像采集系統(tǒng)
將不同色澤等級(jí)的鵝肥肝樣本置于工業(yè)相機(jī)下方,依次采集鵝肥肝樣本圖像數(shù)據(jù),根據(jù)文獻(xiàn)[3]方法應(yīng)用MATLAB R2014a軟件對(duì)圖像進(jìn)行背景分割,不同色澤等級(jí)的典型鵝肥肝樣本圖像如圖2所示。
圖2 不同色澤等級(jí)的典型鵝肥肝樣本
對(duì)于經(jīng)圖像分割處理后的鵝肥肝樣本圖像,根據(jù)文獻(xiàn)[2]的顏色特征提取方法提取鵝肥肝的色澤特征參數(shù),修改如下。將HIS顏色模型中H、S、I顏色分量的平均值和標(biāo)準(zhǔn)偏差改為Lab顏色模型中的L、a、b顏色分量的平均值和標(biāo)準(zhǔn)偏差。因此,對(duì)于圖像的鵝肥肝目標(biāo)區(qū)域,通過提取相應(yīng)的R、G、B、L、a、b 顏 色 分 量 的 平 均 值(μR、μG、μB、μL、μa、μb)和標(biāo)準(zhǔn)偏差(σR、σG、σB、σL、σa、σb)共 12 個(gè)色澤特征參數(shù)來定量描述鵝肥肝樣本的色澤特征。應(yīng)用MATLAB 2014b軟件完成色澤特征參數(shù)的提取工作。
針對(duì)12個(gè)鵝肥肝色澤特征參數(shù)與色澤等級(jí)間的關(guān)系,本研究采用主成分分析法對(duì)這12個(gè)色澤特征參數(shù)進(jìn)行重新篩選,按主成分貢方差獻(xiàn)率選取對(duì)色澤具有綜合解釋能力的色澤主成分,并用色澤主成分進(jìn)行多元線性回歸建模和典型判別函數(shù)建模,分別得到兩種鵝肥肝色澤自動(dòng)分級(jí)模型。應(yīng)用SPSS 19.0軟件完成數(shù)據(jù)的統(tǒng)計(jì)、分析和建模工作。
經(jīng)感官評(píng)定,鵝肥肝色澤等級(jí)為1級(jí)、2級(jí)、3級(jí)、4級(jí)的樣本數(shù)分別為14、15、30、16。對(duì)75幅鵝肥肝圖像進(jìn)行圖像處理,提取12個(gè)色澤特征μR、μG、μB、μL、μa、μb、σR、σG、σB、σL、σa和 σb, 并 分 別用X1~X12表示,計(jì)算出不同色澤等級(jí)下12個(gè)色澤特征的均值和標(biāo)準(zhǔn)差,如表1所示。
由表1可知,對(duì)于不同色澤等級(jí)的鵝肥肝,其色澤特征差異較顯著。隨著鵝肥肝色澤等級(jí)的降低(從1級(jí)降到4級(jí)),特征X2、X3、X4、X9的均值隨等級(jí)逐步降低,特征X1、X7、X8、X10的均值隨等級(jí)呈下降趨勢(shì),其余色澤特征無明顯的變化規(guī)律。
對(duì)75個(gè)鵝肥肝圖像的12個(gè)色澤特征進(jìn)行主成分分析,得到12個(gè)主成分PC1~PC12,主成分方差貢獻(xiàn)率如表2所示,主成分系數(shù)矩陣如表3所示,表3中的Z1~Z12是輸入變量X1~X12標(biāo)準(zhǔn)化后的數(shù)據(jù)。標(biāo)準(zhǔn)化計(jì)算公式如式(1):
表2 主成分方差貢獻(xiàn)率
表3 主成分系數(shù)矩陣
式中:Xi為提取的第i個(gè)鵝肥肝色澤特征,Zi為Xi標(biāo)準(zhǔn)化后的數(shù)據(jù)為所有鵝肥肝樣本第i個(gè)色澤特征的均值,Si為所有鵝肥肝樣本第i個(gè)色澤特征的標(biāo)準(zhǔn)差與Si的具體取值詳見表1的總計(jì)部分。
由表2可知,前3個(gè)主成分(PC1、PC2、PC3)的特征值均大于1,且累計(jì)方差貢獻(xiàn)率高達(dá)86.24%,基本能夠涵蓋樣本的色澤信息,因此可以選取前3個(gè)主成分來代表原有12個(gè)鵝肥肝色澤特征,反映鵝肥肝色澤等級(jí)。75個(gè)鵝肝樣本色澤特征前3個(gè)主成分的數(shù)據(jù)點(diǎn)分布如圖3所示。由圖3可知,不同色澤等級(jí)對(duì)應(yīng)的主成分?jǐn)?shù)據(jù)點(diǎn)區(qū)域無明顯重疊現(xiàn)象,能夠大致分布在4個(gè)區(qū)域,但3級(jí)樣本標(biāo)準(zhǔn)化數(shù)據(jù)點(diǎn)之間分布較為分散,在實(shí)際應(yīng)用中可能會(huì)其他等級(jí)樣本發(fā)生混淆,其他3個(gè)等級(jí)的樣本標(biāo)準(zhǔn)化數(shù)據(jù)點(diǎn)分布較為集中,區(qū)分效果良好。
圖3 不同色澤等級(jí)鵝肥肝樣本的主成分分布
在保證各等級(jí)樣本內(nèi)部抽取比例為2∶1的前提下,隨機(jī)從75個(gè)鵝肥肝樣本中抽取50個(gè)樣本作為訓(xùn)練集,抽取25個(gè)樣本作為測試集。對(duì)訓(xùn)練集50個(gè)樣本的前3個(gè)主成分進(jìn)行多元線性回歸分析,得到回歸方程:
式(2)即為鵝肥肝色澤多元線性回歸分級(jí)模型,其中,Y為該模型預(yù)測的鵝肥肝色澤等級(jí),PC1、PC2、PC3分別為主成分分析提取的前3個(gè)主成分。
根據(jù)式(2)所建立的主成分回歸方程預(yù)測訓(xùn)練集的色澤等級(jí),模型的預(yù)測結(jié)果如圖4所示,其中訓(xùn)練集的相關(guān)系數(shù)R2=0.912,訓(xùn)練標(biāo)準(zhǔn)差為0.307。
圖4 回歸分級(jí)模型訓(xùn)練集預(yù)測結(jié)果
測試集的模型預(yù)測結(jié)果如圖5所示,其測試集的相關(guān)系數(shù)R2=0.935,測試標(biāo)準(zhǔn)差為0.271,與訓(xùn)練集的預(yù)測結(jié)果接近,說明所建立的色澤回歸分級(jí)模型具有一定的穩(wěn)定性。
圖5 回歸分級(jí)模型測試集預(yù)測結(jié)果
利用所建立的鵝肥肝色澤MLR分級(jí)模型對(duì)訓(xùn)練集和測試集的色澤等級(jí)進(jìn)行計(jì)算,將計(jì)算結(jié)果四舍五入保留整數(shù),且小于0.5的結(jié)果判定為1,大于4.5的結(jié)果判定為4,即可得到該模型的實(shí)際色澤判定等級(jí)。模型對(duì)訓(xùn)練集和測試集的分級(jí)結(jié)果分別如表4、表5所示。
表4 訓(xùn)練集中鵝肥肝色澤等級(jí)分級(jí)結(jié)果
表5 測試集中鵝肥肝色澤等級(jí)判定結(jié)果
由表4可知,模型在訓(xùn)練集中,將2個(gè)2級(jí)樣本誤判為3級(jí),將1個(gè)3級(jí)樣本誤判為4級(jí),將2個(gè)4級(jí)樣本誤判為3級(jí),模型在訓(xùn)練集中的分級(jí)正確率為90%。由表5可知,模型在測試集中,將1個(gè)2級(jí)樣本誤判為3級(jí),模型在測試集中的分級(jí)正確率為96%。綜上所述,通過鵝肥肝色澤MLR分級(jí)模型判定75個(gè)樣本色澤等級(jí),共有6個(gè)樣本發(fā)生了誤判,模型的總體分級(jí)正確率為92%。結(jié)果表明,模型的識(shí)別率和穩(wěn)定性都達(dá)到了較好的水平。而發(fā)生誤判的樣本全部發(fā)生在相鄰色澤等級(jí)之間,這是由于相鄰色澤等級(jí)的樣本之間提取的特征相似所導(dǎo)致的,所以使得模型的判定結(jié)果存在了一定的誤差。
對(duì)訓(xùn)練集50個(gè)樣本的前3個(gè)主成分進(jìn)行典型判別分析,得到3個(gè)典型判別函數(shù),其特征值及方差貢獻(xiàn)率如表6所示,其中前2個(gè)典型判別函數(shù)的累積方差貢獻(xiàn)率為97.18%,能夠描述鵝肥肝色澤特征前3個(gè)主成分的主要信息。經(jīng)計(jì)算可知,前2個(gè)典型判別函數(shù)與前3個(gè)主成分的轉(zhuǎn)換關(guān)系如式(3):
表6 典型判別函數(shù)方差貢獻(xiàn)率
式(3)即為鵝肥肝色澤典型判別函數(shù)分級(jí)模型,其中,F(xiàn)1、F2分別為前2個(gè)典型判別函數(shù)值,PC1、PC2、PC3分別為主成分分析提取的前3個(gè)主成分。
根據(jù)鵝肥肝典型判別函數(shù)分級(jí)模型,繪制訓(xùn)練集50個(gè)樣本的F1、F2數(shù)據(jù)點(diǎn)分布如圖6所示。由圖6可知,不同色澤等級(jí)對(duì)應(yīng)的F1、F2數(shù)據(jù)點(diǎn)均圍繞組質(zhì)心分布,其中1級(jí)組質(zhì)心為(-11.29,0.38),2級(jí)組質(zhì)心為(-1.86,-1.16),3級(jí)組質(zhì)心為(3.78,3.16),4級(jí)組質(zhì)心為(4.04,-5.00),4個(gè)不同等級(jí)的組質(zhì)心能夠較好分開,且不同等級(jí)間數(shù)據(jù)點(diǎn)沒有明顯重疊顯現(xiàn),說明模型分級(jí)效果較好。
圖6 訓(xùn)練集中不同色澤等級(jí)鵝肥肝樣本的F1、F2分布
為驗(yàn)證模型效果,計(jì)算分別訓(xùn)練集50個(gè)樣本的(F1,F2)數(shù)據(jù)點(diǎn)與各級(jí)別組中心的歐式距離,依據(jù)距離值最小原則判定樣本色澤等級(jí)。訓(xùn)練集樣本的回判結(jié)果如表7所示。由表7可知,4個(gè)等級(jí)的樣本判定正確率均為100.00%,總判別正確率為100%??紤]到模型是根據(jù)訓(xùn)練集樣本特征的前3個(gè)主成分信息得到的,故可能夸大模型判定效果,為了驗(yàn)證模型的有效性,以未參加建模的測試集25個(gè)樣本對(duì)模型進(jìn)一步檢驗(yàn),繪制訓(xùn)練集F1、F2數(shù)據(jù)點(diǎn)分布如圖7所示。由圖7可知,測試集的F1、F2分布與訓(xùn)練集的F1、F2分布(圖6)大致相同。測試集的模型判定結(jié)果如表8所示。由表8可知,模型對(duì)測試集中4個(gè)等級(jí)樣本的判定正確率同樣為100%,說明利用訓(xùn)練集構(gòu)建的模型分級(jí)效果良好。
表7 訓(xùn)練集中鵝肥肝色澤等級(jí)分級(jí)結(jié)果
表8 測試集中鵝肥肝色澤等級(jí)判定結(jié)果
圖7 測試集中不同色澤等級(jí)鵝肥肝樣本的F1、F2分布
本研究利用機(jī)器視覺技術(shù)和統(tǒng)計(jì)模式識(shí)別方法對(duì)不同色澤等級(jí)的鵝肥肝樣本進(jìn)行了色澤等級(jí)自動(dòng)判定,得到結(jié)論如下:①鵝肥肝線性回歸分級(jí)模型的識(shí)別率和穩(wěn)定性均達(dá)到了較高水平,模型的總體分級(jí)正確率為92%,模型中訓(xùn)練集與測試集的相關(guān)系數(shù)接近、標(biāo)準(zhǔn)差相近;②鵝肥肝典型判別函數(shù)分級(jí)模型的識(shí)別率高于線性回歸分級(jí)模型,其模型的總體分級(jí)正確率為100%,模型中訓(xùn)練集與測試集的典型判別函數(shù)數(shù)據(jù)點(diǎn)分布規(guī)律大致相同。因此,本研究可用于鵝肥肝色澤的自動(dòng)分級(jí),而且有望在此研究基礎(chǔ)上開發(fā)鵝肥肝色澤在線分級(jí)系統(tǒng),從而取代人工并且為鵝肥肝的生產(chǎn)加工提供技術(shù)支持。但本研究中訓(xùn)練集和測試集的樣本均較少,使得模型預(yù)測結(jié)果不能較全面的包含各個(gè)色澤等級(jí)樣本,今后應(yīng)該擴(kuò)大樣本數(shù)量并分多批次做重復(fù)試驗(yàn),以期得到更加準(zhǔn)確和穩(wěn)定的鵝肥肝色澤分級(jí)模型。