陳琳,董春旺,高明珠,葉陽.中國農(nóng)業(yè)科學院茶葉研究所,浙江省茶葉加工工程重點實驗室,國家茶產(chǎn)業(yè)工程技術研究中心,農(nóng)業(yè)部茶樹生物學與資源利用重點實驗室,浙江 杭州 30008;2.中國農(nóng)業(yè)科學院研究生院,北京 0008
?
基于近紅外光譜的紅茶干燥中含水率無損檢測方法
陳琳1,2,董春旺1*,高明珠1,2,葉陽1
1.中國農(nóng)業(yè)科學院茶葉研究所,浙江省茶葉加工工程重點實驗室,國家茶產(chǎn)業(yè)工程技術研究中心,農(nóng)業(yè)部茶樹生物學與資源利用重點實驗室,浙江 杭州 310008;2.中國農(nóng)業(yè)科學院研究生院,北京 100081
摘要:為實現(xiàn)工夫紅茶干燥中含水率的快速檢測,提出了基于近紅外光譜紅茶干燥中含水率無損檢測方法。隨機抽取6次干燥處理中的226個樣本,進行波長1 000~17 99 nm近紅外光譜掃描后按照國標法測定含水率。對原始光譜數(shù)據(jù)進行標準正態(tài)變量變換(SNVT)預處理,利用全局偏最小二乘法(PLS)、聯(lián)合區(qū)間偏最小二乘法(siPLS),分別構建水分近紅外預測模型并驗證。結果表明:用兩種方法檢測含水率,其準確度都可靠,但利用siPLS法將全光譜劃分為13個區(qū)間,聯(lián)合4個區(qū)間用6個主成分數(shù)構建的水分預測模型效果更優(yōu),其預測集的相關系數(shù)R和預測均方根誤差RMSEP值分別為0.9593和0.0395,說明模型預測精度高,可以實現(xiàn)紅茶干燥中含水率的快速無損檢測。
關鍵詞:紅茶;含水率;近紅外光譜;模型
干燥是工夫紅茶初加工的最后一道工序,含水率是衡量工夫紅茶干燥效果和品質(zhì)的重要指標。干燥過程中若能夠在線檢測工夫紅茶的含水率,則能有針對性的調(diào)控干燥進程,保證茶葉品質(zhì)。目前考察工夫紅茶含水率的主要手段是烘干法,測量結果雖然準確,但測量過程費時費力,不利于大樣本的快速檢測且無法起到在線監(jiān)測效果。
近紅外光譜(Near infrared,NIR)檢測技術具有簡便、快速、無損、無污染、重復性好、便于實現(xiàn)在線控制等優(yōu)勢[1-3],且隨著化學計量學方法的逐步發(fā)展,近紅外檢測技術在農(nóng)產(chǎn)品和食品檢測領域的應用也呈快速發(fā)展趨勢[4-7]。近紅外技術在茶葉內(nèi)含成分的快速檢測中已得到應用。劉輝軍等[8]采用NLPLS建立茶多酚含量的近紅外預測模型,模型預測值與實測值相關系數(shù)為0.967,模型精度高;Chen等[9-10]利用不同光譜預處理方法,結合PLS、LS-VSM、BP-ANN等多元校正方法,建立了茶葉中咖啡因、茶多酚、主要兒茶素等物質(zhì)含量的預測模型,模型相關性高,可以實現(xiàn)快速檢測;近紅外技術在水分檢測中也有不少成功的研究,但在紅茶過程中的應用鮮有報道。毛罕平等[11]利用近紅外光譜技術對葡萄水分脅迫狀況進行定量分析,分段逐步回歸法和主成分回歸法建立葉片干基含水率定量分析模型,預測值與實測值相關系數(shù)為0.94,RMSEP為0.15,可以實現(xiàn)有效預測;湯修映等[12]用近紅外光譜技術進行牛肉含水率檢測,采用多元散射校正、變量標準化、直接正交信號校正等方法對光譜數(shù)據(jù)進行預處理,采用MLR、PCR、PLSR等方法建立回歸模型,MSC預處理結合PLSR建模相關系數(shù)可達0.92,驗證標準差為0.069;劉潔等[13]利用近紅外光譜技術對板栗含水率進行快速無損檢測,采用SPXY對樣本集劃分,采用一階微分、多元散射校正、變量標準化進行預處理,PLS建立模型,結果表明一階微分結合偏最小二乘法建模性能最佳,栗仁檢測模型預測集預測值與實測值相關系數(shù)為0.8473,驗證均方根誤差為2.35%,可以實現(xiàn)板栗含水率的快速無損檢測。
本文以226個紅茶干燥過程樣作為研究對象,采用SNVT結合PLS、siPLS對光譜數(shù)據(jù)進行預處理,變量篩選,建立含水率定量分析模型。
1.1 儀器與設備
采用SupNIR-1520光譜分析儀(中國聚光科技有限公司)對茶葉樣本進行漫反射光譜掃描。該光譜分析儀的主要技術參數(shù)如下,探測器:高靈敏的512陣元光電二極管陣列;波長范圍:1 000~1 799 nm;光譜采樣間隔:1.5 nm;光譜分辨率:3.5 nm;波長精度:±1 nm。采用光譜分析儀配套的RS2(美國ASD公司)軟件包進行實時采集、分析輻射和輻照測量。試驗中還用到SartoriusB S224S精密電子天平(德國Sartorius公司),精確度為0.0001 g;DK340S恒溫電烘箱(日木Yamato公司),靈敏度為±1℃。
1.2 樣品來源及光譜獲取
實驗在浙江更香有機茶業(yè)有限公司實施,在6次干燥處理中隨機抽取226個樣本作為實驗對象。樣本含水率范圍為5%~60%,涵蓋了茶葉的主要含水率范圍(3%~70%)。按照含水率百分含量平均分布原則,將226個樣本按照2∶1的比例進行校正集(151個)和驗證集(75個)的劃分,保證校正集的樣品組分百分含量信息包含驗證集樣品的信息。樣本含水率統(tǒng)計信息如表1所示。
稱取約20 g完整葉片茶樣裝入樣品杯中,用壓樣器充分壓實后進行光譜采集,每個樣本采集3次,取3次光譜平均譜作為該樣品的近紅外原始光譜。
1.3 茶葉含水率的標準檢測方法
樣本在光譜測量后,立即按GB 8304-1987測量含水率,重復3次,取平均值作為對照。
表1 試驗樣本的具體情況Table 1 General information of tea samples
1.4 測量模型的評價指標
模型的性能評估是建立預測模型的重要步驟,目前通用的模型評價指標有:交互驗證均方根誤差(Root mean square error of cross-validation,RMSECV)、預測均方根誤差(Root mean square error of prediction,RMSEP)、偏差(Bias)、相關系數(shù)(r)、預測相對標準誤差(Residual prediction deviation,RPD)。RMSECV主要用于評價建模方法的可行性及所得模型的預測能力,RMSEP主要用于評價所建模型對外部樣本的預測能力,r用于考察樣本預測值與實測值之間的相關程度。一個好的測量模型應該有較低的RMSECV、RMSEP和Bias值,同時具有較高的r值和RPD 值[14-15]。本研究主要采用相關系數(shù)r、交互驗證均方根誤差RMSECV和預測均方根誤差RMSEP進行模型評估。
2.1 干燥樣本漫反射原始光譜
圖1是茶樣干燥加工過程中典型的近紅外漫反射光譜響應曲線。從圖1中可以看出,曲線在波長1 200 nm附近有反射峰,波長范圍在1 300~1 450 nm時反射率急劇增大,這是綠色植物葉片的紅邊效應,在波長1 550 nm后的近紅外波段反射率值相對比較平穩(wěn),由于葉片內(nèi)部液態(tài)水分的強烈吸收作用,而在波長1 100 nm和1 300 nm附近出現(xiàn)明顯的低谷。光譜曲線首端和末端均未有明顯的高頻噪聲,因此可以選擇波長1 000~1 799 nm的全波段范圍作為研究波段。
圖1 近紅外原始光譜曲線Fig.1 Original near infrared spectra
圖2 SNVT預處理后近紅外光譜曲線Fig.2 Near infrared spectra after SNVT pre-processing
2.2 光譜預處理
在光譜分析中,原始光譜含有與樣品組分無關的信息,受環(huán)境溫度、檢測器及樣品背景干擾等因素影響會夾入許多高頻隨機噪聲、基線漂移和光散射噪聲,需采用一定的預處理方法進行消除[16]。本研究采用標準正態(tài)變量變換(SNVT)對光譜進行有效信息提取,SNVT處理后的光譜曲線如圖2所示。由圖可知,SNVT預處理減少了光譜基線漂移的影響,可分辨重疊峰,提高分辨度和靈敏度。相比原始光譜,SNVT預處理可以提取光譜有效信息,減少誤差影響,提高建模精度。
2.3 回歸模型建立
常用的統(tǒng)計模型主要有多元線性回歸、主成分回歸、偏最小二乘回歸、人工神經(jīng)網(wǎng)絡,最小二乘支持向量機等方法。本文采用全局偏最小二乘法(PLS)和聯(lián)合區(qū)間偏最小二乘法(siPLS)建立近紅外水分預測模型。
2.3.1 全局偏最小二乘回歸模型建立
基于matlab軟件,將近紅外光譜全波段作為特征譜區(qū)與茶樣水分含量建立回歸模型,用plsrmse函數(shù)畫出用不同主成分數(shù)所建模型的交互驗證均方根誤差RMSECV值,通過plsmodel函數(shù)建立樣本預測模型,分別對訓練集和預測集中的含水率進行預測,得到相關關系圖如圖3所示。
結果表明,當主成分數(shù)為5時建立預測模型效果最好;訓練集的預測值與實測值相關系數(shù)r為0.9858,RMSECV值為0.0226;預測集的預測值與實測值相關系數(shù)r為0.9566,RMSEP值為0.0407。
2.3.2 聯(lián)合區(qū)間偏最小二乘法
用近紅外全波段數(shù)據(jù)進行分析時,由于光譜數(shù)據(jù)較多,易引進無用的光譜信息,從而影響水分預測模型的精度[17]。基于matlab軟件,利用siPLS先進行特征光譜區(qū)間的選擇。將近紅外光譜全波段劃分為10、11、12、…、20個區(qū)間,分別嘗試聯(lián)合3~4個子區(qū)間,依據(jù)RMSECV值最小原則選擇最優(yōu)聯(lián)合區(qū)間,結果如表2所示。
圖3 水分PLS模型的訓練集(a)和預測集(b)回歸模型圖Fig.3 Calibration(a)and prediction(b)regression curves of PLS models
siPLS校正模型的最優(yōu)聯(lián)合區(qū)間結果為,整個光譜區(qū)域(800個變量)被劃分為13個區(qū)間,4個子區(qū)間[1、6、10、13]聯(lián)合,主成分數(shù)為6時,RMSECV最小,所對應的波長范圍為1 000~1 062 nm、1 311~1 372 nm、1 557~1 617 nm、1 739~1 799 nm,參與建立模型的光譜變量數(shù)由800個降至246個,所選區(qū)間在光譜中的位置如圖4所示。利用篩選出的特征波段建立茶葉含水率的預測模型,訓練集和預測集的預測值和實測值之間相關關系如圖5所示。
訓練集中,相關系數(shù)(r)和交互驗證均方根誤差(RMSECV)分別為0.989和0.0199;預測集中,相關系數(shù)(r)和預測均方根誤差(RMSEP)分別為0.9593和0.0395。
2.4 兩種模型結果比較
從表3可以看出,PLS和siPLS所建模型其準確度都可靠,但siPLS模型性能更好。因為PLS利用近紅外光譜全波段進行建模,全光譜含有大量與水分含量無關的冗余信息和噪音信息,不可避免地影響模型的精度和穩(wěn)定性,siPLS優(yōu)選光譜區(qū)間進行建模,減少了無關信息影響,模型簡化,精度提高[18-19]。
表2 不同區(qū)間數(shù)的聯(lián)合區(qū)間偏最小二乘分析模型結果Table 2 Results of siPLS calibration model with different spectral regions
圖4 聯(lián)合區(qū)間偏最小二乘模型選擇的最佳聯(lián)合區(qū)間[1、6、10、13]Fig.4 Optimal spectral region selected by siPLS with intervals number1,6,10 and 13
圖5 水分siPLS模型訓練集(a)預測集(b)回歸模型圖Fig.5 Calibration(a)and prediction(b)regression curves tea moisture of siPLS models
表3 兩種預測模型的性能比較Table 3 Results and comparison of two models
通過對工夫紅茶干燥工序中226個茶葉樣本的水分和近紅外光譜進行分析,表明基于近紅外光譜技術可以實現(xiàn)紅茶干燥中含水率的快速無損檢測。對近紅外光譜進行標準正態(tài)變量變換(SNVT)預處理,可以減少噪聲干擾,提高所建模型精度。通過比較全局偏最小二乘回歸模型和聯(lián)合區(qū)間偏最小二乘回歸模型,發(fā)現(xiàn)siPLS可以提高模型精度,其水分預測模型的預測值與實測值相關系數(shù)r高達0.9593,RMSEP為0.0395。水分子中O-H鍵在近紅外光譜1 100 nm、1 400 nm、1 600 nm處有較強的吸收峰,siPLS篩選建模區(qū)間與其吸收峰呈現(xiàn)一定的相關性,為siPLS建模的良好效果提供了理論支撐。由于茶葉品種繁多,加工時間及鮮葉等級也存在著差異,導致光譜模型適用范圍存在局限,因此要實現(xiàn)在線、實時測量,還需要建立更穩(wěn)定的光譜測量模型[20],該模型需要大量覆蓋面廣的樣本,后續(xù)的研究可以針對不同種類、不同季節(jié)、不同等級的茶葉光譜特性進行深入分析,以建立更有廣泛代表意義的光譜測量模型。
參考文獻
[1]戴瑩,馮曉元,韓平,等.近紅外光譜技術在果蔬農(nóng)藥殘留檢測中的應用研究進展[J].食品安全質(zhì)量檢測學報,2014 5(3):659-663.
[2]林濤,于海燕,應義斌.可見/近紅外光譜技術在液態(tài)食品檢測中的應用研究進展[J].光譜學與光譜分析,2008,28(2):285-290.
[3]陳壽松,鄭功宇,金心怡,等.茶葉含水率近紅外在線快速測定及其應用研究[J].茶葉科學,2014,34(4):337-343.
[4]段民孝,刑錦豐,郭景倫,等.近紅外光譜分析技術及其在農(nóng)業(yè)中的應用[J].北京農(nóng)業(yè)科學,2002,20(1):11-14.
[5]Fox G P,Osborne B,Bowman J,et al.Measurement of genetic and environmental variation in barley(Hordeumvulgare)grain hardness[J].Journal of Cereal Science,2007,46(1):82-92.
[6]傅霞萍,應義斌,劉燕德,等.水果堅實度的近紅外光譜檢測分析試驗研究[J].光譜學與光譜分析,2006,26(6):1038-1041.
[7]孫通,徐惠榮,應義斌.近紅外光譜分析技術在農(nóng)產(chǎn)、食品品質(zhì)在線無損檢測中的應用研究進展[J].光譜學與光譜分析,2009,29(1):122-126.
[8]劉輝軍,呂進,張維剛,等.茶葉中茶多酚含量的近紅外光譜檢測模型研究[J].紅外技術,2007,29(7):429-432.
[9]Chen Q S,Zhao J W,Fang C H.Feasibility study on identifieation of green tea black and Oolong teas using near-inftared spectroscopy based on support veetor maehine(SVM)[J].Spectroehimiea Acta Part A,2007,66:568-574.
[10]Chen Q S,Zhao J W,Zhang H D,et al.Feasibility study on qualitative and quantitative analysis in tea by near inftared spectroscopy with multivariate calibration[J].Analytica Chimica Acta,2006,572(2):77-84.
[11]毛罕平,張曉東,李雪,等.基于光譜反射特征葡萄葉片含水率模型的建立[J].江蘇大學學報:自然科學版,2008,29(5):369-372.
[12]湯修映,牛力釗,徐楊,等.基于可見/近紅外光譜技術的牛肉含水率無損檢測[J].農(nóng)業(yè)工程學報,2013,29(11):248-252.
[13]劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測方法[J].農(nóng)業(yè)工程學報,2010,26(20):338-341.
[14]Li Xiaoli,He Yong.Chlorophyll assessment and sensitive wavelength exploration for tea(Camellia sinensis)based on reflectance spectral characteristics[J].Hortscience,2008,43(5):1-6.
[15]李曉麗,程術希,何勇.基于漫反射光譜的初制綠茶含水率無損檢測方法[J].農(nóng)業(yè)工程學報,2010,26(5):195-201.
[16]牛智有,林新.茶葉定性和定量近紅外光譜分析研究[J].光譜學與光譜分析,2009,29(9):2417-2420.
[17]江燕,楊眉,張學博,等.中藥飲片近紅外光譜水分定量模型的研究[J].藥物分析雜志,2013,33(9):1572-1577.
[18]吳瑞梅,趙杰文,陳全勝,等.近紅外光譜技術結合特征變量篩選快速檢測綠茶滋味品質(zhì)[J].光譜學與光譜分析,2011,31(7):1782-1785.
[19]張德濤,鄒小波,石吉勇,等.近紅外光譜結合不同偏最小二乘法快速檢測鎮(zhèn)江香醋的渾濁度[J].中國釀造,2012,31(1):169-171.
[20]周健,成浩,王麗鴛.近紅外技術在茶葉上的研究進展[J].茶葉科學,2008,28(4):294-300.
Nondestructive Measurement of Moisture of Black Tea in Drying Process Based on Near Infrared Spectroscopy
CHEN Lin1,2,DONG Chunwang1*,GAO Mingzhu1,2,YE Yang1
1.Tea Research Institute,Chinese Academy of Agricultural Sciences,Key Laboratory of Tea Processing Engineering of Zhejiang Province,National Engineering Technology Research Center of Tea Industry,Key Laboratory of Tea Biology and Resource Utilization of Ministry of Agriculture,Hzngzhou 310008,China; 2.Graduate School of Chinese Academy of Agricultural Sciences,Beijing 100081,China
Abstract:Moisture is an important index of tea drying effect and quality.To understand rapid detection of moisture in black tea,a nondestructive testing method was proposed based on near infrared spectroscopy(NIR).The diffuse reflectance spectra of 226 tea samples were scanned in the range of 1 000-1 799 nm.These samples were from 6 drying processes.Moisture contents of samples were immediately measured after spectral scanning.The original spectrum data were proposed by the Standard Normal Variate Transformation(SNVT).Two regression algorithms including Partial Least Square(PLS)and Synergy Interval Partial Least Square(siPLS)were used to develop models for determination of moisture contents respectively.The result showed that both models had high accuracy,but the performance of model with siPLS was better.It contained 13 spectral intervals combined with 4 subinterval and 6 principal component factors.The root mean square for prediction(RMSEP)and the correlation coefficient(Rp)reached 0.0395 and 0.9593,respectively.It showed that it is feasible to measure moisture content of black tea during drying process.
Keywords:black tea,moisture content,near infrared spectroscopy,model
作者簡介:陳琳,男,碩士研究生,主要從事茶葉加工方面的研究。*通訊作者:dongchunwang@tricaas.com
基金項目:浙江省自然科學基金(LY16C160002)、浙江省“三農(nóng)六方”項目(2014005)。
收稿日期:2016-01-12
修訂日期:2016-01-18
中圖分類號:TS272;O434
文獻標識碼:A
文章編號:1000-369X(2016)02-184-07