朱榮光,段宏偉,王龍,姚雪東,許程劍
1(石河子大學(xué) 機械電氣工程學(xué)院,新疆 石河子,832003) 2(石河子大學(xué) 食品學(xué)院,新疆 石河子,832003)
?
不同分集方法對牛肉嫩度高光譜檢測模型的比較
朱榮光1*,段宏偉1,王龍1,姚雪東1,許程劍2
1(石河子大學(xué) 機械電氣工程學(xué)院,新疆 石河子,832003) 2(石河子大學(xué) 食品學(xué)院,新疆 石河子,832003)
摘要選用牛肉嫩度作為研究對象,開展了4種不同樣品集劃分方法的選取對其高光譜模型的影響研究。首先選取了70個具有代表性的牛肉樣品并提取其肌肉感興趣區(qū)域(ROIs)的光譜,比較分析了濃度梯度法(C-G)、隨機法(R-S)、Kennard-Stone(K-S)和光譜-理化值共生矩陣法(SPXY)獲取的校正集建立的牛肉嫩度PCR和PLSR模型效果。結(jié)果表明:在PCR和PLSR中,SPXY均為最適的樣品分集方法,并且4種樣品集劃分方法下的PLSR模型效果均較優(yōu)。最優(yōu)模型SPXY-PLSR校正集的相關(guān)系數(shù)(Rcal)和均方根誤差(RMSEC)分別為0.94和0.48,預(yù)測集的相關(guān)系數(shù)(Rp)和均方根誤差(RMSEP)分別為0.93和0.63。研究表明SPXY方法結(jié)合高光譜PLSR模型能夠?qū)崿F(xiàn)牛肉嫩度的快速無損檢測。
關(guān)鍵詞高光譜圖像(HSI);牛肉嫩度;分集方法;SPXY
牛肉及其制品是我國主要的肉類消費品[1],嫩度常被列為肉品品質(zhì)優(yōu)劣的重要檢測指標(biāo)[2],直接影響著肉的商品價值以及消費者的滿意度,因此有必要基于嫩度對牛肉品質(zhì)進行分級評價。在進行牛肉嫩度檢測時,傳統(tǒng)感官評定結(jié)果誤差較大,理化檢測又對肉品有損壞,操作過程繁瑣。高光譜圖像技術(shù)作為一種有效的檢測方法,已在牛肉質(zhì)量檢測中有相關(guān)的研究[3-9],為快速無損準(zhǔn)確檢測牛肉嫩度提供了可能。
在利用高光譜圖像技術(shù)進行無損檢測時,模型效果驗證方法一般有內(nèi)部驗證、外部驗證和獨立驗證,而分集方法的選擇對模型驗證結(jié)果有一定的影響。國內(nèi)報道[10-13]相關(guān)的分集方法主要有:濃度梯度法(C-G)、隨機法(R-S)、kennard-stone(K-S)、光譜-理化值共生矩陣法(SPXY)。其中C-G將樣本按照化學(xué)測量值x由小至大排序,從中按序選取一定數(shù)量的樣本進行建模,R-S選取樣本時完全是隨意無規(guī)律的或者只遵循簡單的規(guī)律[14],K-S只選取光譜值y差異大的樣本作為模型校正集。而SPXY[15]是基于K-S法發(fā)展而來的,在計算樣本間距離時將光譜信息x和化學(xué)測量值y同時考慮在內(nèi),并且樣本在x和y空間具有相同的權(quán)重。當(dāng)樣品集劃分時,其化學(xué)值信息或光譜信息所占據(jù)的權(quán)重不同,高光譜模型效果也不盡相同,因此可以通過比較分析不同牛肉嫩度的高光譜檢測模型結(jié)果以選取最為合理的樣品分集方法。
為快速準(zhǔn)確檢測牛肉嫩度,首先選取了70個具有代表性的牛肉樣本并提取樣品肌肉部分感興趣區(qū)域(ROIs)的光譜。采用C-G、R-S、K-S和SPXY分別獲取對應(yīng)的樣品校正集和預(yù)測集并對其進行了光譜預(yù)處理,對比分析了4種分集方法下牛肉嫩度的PCR和PLSR模型效果。根據(jù)模型效果確定最合理的分集方法和最優(yōu)的建模方法。
1材料與方法
1.1牛肉試驗樣本制備
試驗樣本選擇牛肉品種為新疆褐牛,購置于石河子西部牧業(yè)零售店。根據(jù)實驗要求,取樣過程中嚴(yán)格遵照中華人民共和國《肉與肉制品的取樣標(biāo)準(zhǔn)GB/T 9695—2008》的規(guī)定進行。取8只牛后腿部距離股骨上端止點5 cm位置的肌肉塊,用無菌刀切割成基本尺寸為6 cm×4 cm×3cm的小塊,保證所切取的樣品厚度大體一致。取樣后采用保鮮袋密封包裝,冷藏于4 ℃恒溫箱中,保存1~15 d。整個過程中保證操作規(guī)范、取樣工具清潔。
1.2牛肉高光譜圖像采集系統(tǒng)
高光譜圖像采集系統(tǒng)如圖1所示。主要包括:光譜儀(ImSpector V10E-QE, Finland),150 W光纖鹵素?zé)?SCHOTT DCR Ⅲ),線陣CCD攝像機,脈沖輸送裝置(Zolix, SC300-1A, Beijing),暗箱,圖像采集卡和計算機等。整套系統(tǒng)置于自制的暗箱之中,以消除外界干擾對于圖像采集的影響。
圖1 高光譜圖像采集系統(tǒng)Fig.1 Hyperspectral imaging acquisition system
為準(zhǔn)確獲取樣品高清圖像,在進行牛肉的高光譜漫反射檢測時,需要對高光譜儀器進行參數(shù)設(shè)置,曝光時間設(shè)為16 ms,物距為33.5 cm,圖像采集速度為1.35 mm/s,樣本表面光照強度為2 910 lx。為去除高光譜圖像系統(tǒng)工作過程中暗電流等噪聲,圖像采集前需進行黑白校正[16],公式為R=(I-B)/(W-B),R為校正后圖像,I為原始圖像,W和B分別為全白、黑校正圖像。
1.3牛肉嫩度的剪切力測定
牛肉樣品嫩度剪切力的測定步驟嚴(yán)格遵循我國農(nóng)業(yè)部行業(yè)標(biāo)準(zhǔn)《NY/T1180—2006肉嫩度的測定剪切力測定法》進行。測量前,使用水浴將肉中心溫度控制在70~72 ℃,保證剪切試驗條件的統(tǒng)一。用C-LM3B型數(shù)顯式肌肉嫩度儀配備的取樣器進行取樣,觀察測定結(jié)果并得到最大剪切力值,每個樣品記錄5組數(shù)據(jù),取5組數(shù)據(jù)的平均值作為該樣品的嫩度值。
1.4數(shù)據(jù)處理
高光譜圖像數(shù)據(jù)處理用 ENVI 4.7和TQ 8.01軟件。對70個具有代表性的牛肉樣本進行肌肉部分感興趣區(qū)域(ROIs)光譜的提取,分別采用C-G、R-S、K-S和SPXY獲取對應(yīng)的校正集和預(yù)測集,比較了4種不同分集方法的牛肉嫩度PLSR和PCR模型效果。確定最合理的分集方法及對應(yīng)的模型。模型效果評價標(biāo)準(zhǔn)[17]包括建模效果和預(yù)測效果,若RMSEC越小,表明模型的建模效果越好,RMSEP越小,表明模型的預(yù)測效果越好。Rcal和Rp越大,預(yù)測值與實際測量值的相關(guān)性越好,且RMSEC和RMSEP差值越小,表明模型穩(wěn)健性較好。
2結(jié)果與討論
2.1牛肉嫩度結(jié)果統(tǒng)計分析
嫩度根據(jù)剪切力值可分為“老”、“嫩”,傳統(tǒng)評價方法[18]中剪切力值≤6 kg的樣本為嫩牛肉,剪切力值>6 kg的樣本為老牛肉。試驗采集的“嫩”牛肉樣品數(shù)量為49個,“老”牛肉樣品數(shù)量為21個,其剪切力統(tǒng)計結(jié)果如表1所示。包括校正集樣品數(shù)、預(yù)測集樣品數(shù)、樣品最大值、最小值、平均值和標(biāo)準(zhǔn)偏差,牛肉嫩度以均值為中心,大致呈高中低正態(tài)分布。
表1 牛肉樣品剪切力統(tǒng)計結(jié)果
2.2牛肉樣品的光譜提取
首先采用波段運算減法和掩膜去除圖像背景及陰影部分,其次采用波段運算加法、二值化和掩膜去除亮點、脂肪和結(jié)締組織,從而提取高光譜圖像中純肌肉部分作為感興趣區(qū)域(ROIs),并對該區(qū)域進行全波段400~1 000 nm光譜數(shù)據(jù)的提取。由于所采集到的光譜數(shù)據(jù)存在尖峰等噪聲,因此選取480~860 nm光譜作為高光譜圖像所采集到的牛肉樣品代表性原始光譜。由圖2可知,在596、760 nm附近有2處明顯的吸收峰。牛肉在儲藏過程中,其肉質(zhì)的老、嫩與肉品的含水量以及蛋白質(zhì)的分解等密切相關(guān),且760 nm附近為水的吸收峰,596 nm附近為氧合血紅蛋白的吸收峰[19],表明所提取的光譜信息與牛肉嫩度具有相關(guān)性。
圖2 牛肉樣品的代表性原始光譜Fig.2 Representative raw spectra of beef samples
2.3不同預(yù)處理方法的選擇
由于所采集到的光譜數(shù)據(jù)存在較多的噪聲,為了提高后續(xù)建模精度,需選用合適的預(yù)處理方法對原始光譜數(shù)據(jù)進行預(yù)處理。常用的光譜預(yù)處理方法有:多元散射校正(MSC)、變量標(biāo)準(zhǔn)化(SNV)、1階導(dǎo)數(shù)(1D)、2階導(dǎo)數(shù)(2D)、Savitzky-Golay(S-G)平滑和中心化處理(mean-center)等。表2為SPXY獲取的樣品集光譜經(jīng)不同預(yù)處理后建立的PLSR模型結(jié)果,通過比較Rcal、Rp、RMSEC 和 RMSEP,發(fā)現(xiàn)采用2階導(dǎo)數(shù)進行光譜預(yù)處理時,其模型效果明顯提高,但當(dāng)將2階導(dǎo)數(shù)與MSC相結(jié)合時的模型效果又有所下降,因此選取的最優(yōu)預(yù)處理方法為2D、S-G平滑(5點)和 mean-center相結(jié)合的方法。
表2 最優(yōu)預(yù)處理方法的選取
2.4不同分集方法下牛肉嫩度模型建立與評價
選用的樣品分集方法分別為濃度梯度法(C-G)、隨機法(R-S)、kennard-stone(K-S)和光譜-理化值共生矩陣法(SPXY),樣本劃分后建立的PCR和PLSR模型結(jié)果如表3所示。
表3 4種分集方法的PCR和PLSR模型結(jié)果
當(dāng)采用C-G、R-S、K-S和SPXY 4種分集方法,其分別獲取的牛肉嫩度樣品校正集建立的PCR模型,在選取的PCs分別為10、12、13和14時,對應(yīng)預(yù)測集的RMSEP均遠大于與該4種分集方法相對應(yīng)的PLSR模型結(jié)果,由此得出,在4種分集方法中,PLSR的模型效果均優(yōu)于PCR模型。
當(dāng)建模方法為PCR時,若樣本劃分方法為R-S,其最優(yōu)模型的RMSEP為0.90,大于C-G的模型結(jié)果。此時C-G的最優(yōu)模型選取的PCs為10,對應(yīng)的RMSEP為0.88,大于K-S的模型結(jié)果,其成因可能是C-G模型的PCs較少導(dǎo)致的模型欠擬合。該情況下K-S的模型最優(yōu)PCs為13,RMSEP為0.84,亦遠大于SPXY的建模結(jié)果。可見,PCR模型中,樣品分集方法的優(yōu)次順序為SPXY>K-S>C-G>R-S。
當(dāng)建模方法為PLSR時,R-S方法獲取的樣品集建立的最佳模型在選取的LVs為4時,其RMSEP為0.89,遠大于C-G的建模結(jié)果,其原因可能是R-S方法自身的隨機性導(dǎo)致的模型效果較差。當(dāng)前C-G獲取的樣品集所建立PLSR最優(yōu)模型的RMSEP為0.75,大于K-S方法下的模型結(jié)果,二者模型效果相近。此時K-S的模型選取了5個LVs,對應(yīng)的RMSEP為0.73,遠大于SPXY的模型結(jié)果。可知,PLSR模型中,SPXY分集方法最為合適,其順序依次為SPXY>K-S>C-G>R-S。
因此在PCR和PLSR2種建模方法中,SPXY均為最適樣品分集方法,并且與SPXY對應(yīng)的PLSR模型效果最優(yōu)。原因可能是SPXY將光譜信息和化學(xué)測量值信息考慮在內(nèi)時,同時選取了差異大的樣本作為模型校正集,確保了所選校正集樣本能夠均勻覆蓋整個樣本集試驗區(qū)域,提高了模型預(yù)測結(jié)果。最優(yōu)模型校正集的Rcal和RMSEC分別為0.94和0.48,預(yù)測集的Rp和RMSEP分別為0.93和0.63,如圖3(a)、圖3(b)所示。
圖3 SPXY對應(yīng)的PLSR模型效果Fig.3 PLSR model effects corresponding to SPXY
3結(jié)論
(1)對于PCR和PLSR 2種建模方法,最合理的樣品分集方法均為SPXY,其優(yōu)次順序均為SPXY>K-S>C-G>R-S。分析其原因可能在于樣品集選取時,光譜信息和化學(xué)測量值信息均需考慮在內(nèi),并且光譜信息所占據(jù)的權(quán)重稍高于化學(xué)測量值。
(2)對于C-G、R-S、K-S和SPXY 4種分集方法,其PLSR模型效果均較優(yōu),并且與SPXY相對應(yīng)的PLSR模型效果最優(yōu),其校正集的相關(guān)系數(shù)(Rcal)和均方根誤差分別為0.94和0.48,預(yù)測集的相關(guān)系數(shù)(Rp)和均方根誤差分別為0.93和0.63。
參考文獻
[1]葉強,賈彩荷. 湖嶺牛肉干加工技術(shù)研究[J]. 肉類研究,2009,23(9): 34-36.
[2]周光宏, 李春保, 徐幸蓮. 肉類食用品質(zhì)評價方法研究進展[J]. 中國科技論文在線, 2007, 2(2): 75-82.
[3]宋育霖,彭彥昆,郭輝,等. 光學(xué)擴散特征的生鮮肉細菌總數(shù)的無損檢測方法[J]. 光譜學(xué)與光譜分析, 2014, 34(3): 741-745.
[4]吳建虎,彭彥昆,陳菁菁,等. 基于高光譜散射特征的牛肉品質(zhì)參數(shù)的預(yù)測研究[J]. 光譜學(xué)與光譜分析,2010, 30(7): 1 815-1 819.
[5]朱榮光,姚雪東,高廣娣,等. 不同儲存時間和取樣部位牛肉顏色的高光譜圖像檢測[J]. 農(nóng)業(yè)機械學(xué)報,2013, 44(7): 165-169.
[6]趙杰文,翟劍妹,劉木華,等. 牛肉嫩度的近紅外光譜法檢測技術(shù)研究[J]. 光譜學(xué)與光譜分析, 2006, 26(4): 640-642.
[7]PENG Y, ZHANG J, WANG W, et al. Potential prediction of the microbial spoilage of beef using spatially resolved hyperspectral scattering profiles[J]. Journal of food engineering, 2011, 102(2): 163-169.
[8]WU J,PENG Y, LI Y, et al. Prediction of beef quality attributes using VIS/NIR hyperspectral scattering imaging technique[J]. Journal of Food Engineering, 2012, 109(2): 267-273.
[9]ElMASRY G, SUN D W, ALLEN P. Non-destructive determination of water-holding capacity in fresh beef by using NIR hyperspectral imaging[J]. Food Research International, 2011, 44(9): 2 624-2 633.
[10]劉偉,趙眾,袁洪福,等. 光譜多元分析校正集和驗證集樣本分布優(yōu)選方法研究[J]. 光譜學(xué)與光譜分析, 2014, 34(4): 947-951.
[11]展曉日,朱向榮,史新元,等. SPXY樣本劃分法及蒙特卡羅交叉驗證結(jié)合近紅外光譜用于橘葉中橙皮苷的含量測定[J]. 光譜學(xué)與光譜分析,2009, 29(4): 964-968.
[12]詹雪艷,趙娜,林兆洲,等. 校正集選擇方法對于積雪草總苷中積雪草苷NIR定量模型的影響[J]. 光譜學(xué)與光譜分析, 2014, 34(12): 3 267-3 272.
[13]朱向榮, 單楊, 李高陽, 等. 近紅外光譜法快速測定液態(tài)奶中蛋白質(zhì)和脂肪含量[J]. 食品科學(xué), 2011, 32(12): 191-195.
[14]李運鋒,袁景淇,薛耀鋒. 發(fā)酵過程中神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本的選取[J]. 化工自動化及儀表, 2004, 31(6): 21-24.[15]GALVAO R K H, ARAUJO M C U, JOSE G E, et al. A method for calibration and validation subset partitioning[J]. Talanta, 2005, 67(4): 736-740.
[16]WANG W, LI C,TOLLNER E W, et al. Journal of Food Engineering, 2012, 109(1): 38-48.
[17]KAMRUZZAMANA M, ELMASRY G, SUN D W, et al. Prediction of some quality attributes of lamb meat using near-infrared hyperspectral imaging and multivariate analysis[J]. Anal Chim Acta, 2012, 54(714): 57-67.
[18]PARK B, CHEN Y R,HRUSCHKA W R, et al. Near-infrared reflectance analysis for predicting beef longissimus tenderness[J]. Journal of Animal Science-Menasha Then Albany Then Champaign Illinois, 1998, 76: 2 115-2 120.
[19]浦瑞良,宮鵬. 高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2000.
Comparative research on hyperspectral detection model of beef tenderness with different sample set partitioning methods
ZHU Rong-guang1*, DUAN Hong-wei1,WANG Long1, YAO Xue-dong1, XU Cheng-jian2
1(College of Mechanical and Electrical Engineering,Shihezi University, Shihezi 832003, China) 2(2.Food College,Shihezi University, Shihezi 832003, China)
ABSTRACTSelection of sample set partitioning methods has an influence on the prediction results of hyperspectral quantitative analysis model. In this paper, beef tenderness was chosen as the research object, and study on the effects of 4 different sample set partitioning methods on hyperspectral model was carried out. Initially, 70 representative beef samples were adopted and spectra of muscle regions of interest (ROIs) were extracted. Subsequently, PCR and PLSR model effects of beef tenderness were separately compared and analyzed, whose models were established by the calibration set separately obtained from concentration gradient method (C-G), Random Sampling (R-S), Kennard stone (K-S) and sample set partitioning based on joint X-Y distance (SPXY). The results indicated SPXY was the best sample set partitioning method in PCR and PLSR models, the PLSR model effects under 4 sample set partitioning methods were all better than that of PCR. And SPXY-PLSR model effect was optimal, which correlation coefficient(Rcal) and root mean square error(RMSEC) of calibration set were 0.94 and 0.48 respectively, correlation coefficient(Rp) and root mean square error(RMSEP) of prediction set were 0.93 and 0.63 respectively. The research shows that the SPXY method combined with hyperspectral PLSR model can realize the rapid and nondestructive detection of beef tenderness.
Key wordshyperspectral; beef tenderness; sample set partitioning methods; SPXY
收稿日期:2015-08-14,改回日期:2015-11-05
基金項目:國家自然科學(xué)基金資助(No.31460418);高等學(xué)校博士學(xué)科點專項科研基金(No.20136518120004)資助
DOI:10.13995/j.cnki.11-1802/ts.201604034
第一作者:博士,副教授(本文通訊作者,E-mail: rgzh_jd@163.com)。