孫營偉,周 萍(中國地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083)
面粉濕面筋近紅外定量分析中的光譜預(yù)處理方法研究
孫營偉,周萍*
(中國地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083)
采用10種不同的預(yù)處理方法對面粉濕面筋含量的近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,并比較了10種預(yù)處理方法對偏最小二乘法(PLS)建立定量模型效果的影響。結(jié)果表明,采用近紅外光譜(NIRS)分析技術(shù)對面粉中的濕面筋含量進(jìn)行定量分析時,一階導(dǎo)數(shù)+減去一條直線的預(yù)處理方法對面粉濕面筋含量的預(yù)測效果最好,內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)R為0.901 8,內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差(RMSECV)為0.708;預(yù)測相關(guān)系數(shù)R為0.920 9,預(yù)測標(biāo)準(zhǔn)差(RMSEP)為0.083,提高了預(yù)測模型的精度和準(zhǔn)確性。
近紅外光譜;預(yù)處理;濕面筋;偏最小二乘法
面粉是人們?nèi)粘I钪兄匾氖称吩现?,生活水平的提高使人們對面粉的品質(zhì)問題尤為重視,面粉中的濕面筋含量對面粉的品質(zhì)有重要影響。濕面筋是面粉經(jīng)過加水揉制成面團(tuán),在水中反復(fù)揉洗后剩余的有彈性和黏彈性的不溶于水的膠狀物質(zhì),用百分比表示(%)[1]。國家標(biāo)準(zhǔn)中規(guī)定,強(qiáng)筋面粉中的濕面筋含量≥32.0%,弱筋面筋中的濕面筋含量≥24.0%,北方中筋面筋中濕面筋含量≥28.0%,南方中筋面筋中濕面筋含量≥24.0%[2]。傳統(tǒng)的濕面筋含量測定方法主要有手工洗滌法、儀器設(shè)備洗滌法和化學(xué)測定法。這些檢測方法受人為因素、面團(tuán)放置時間、加水量等因素的影響較大,而且檢測時間長,對技術(shù)要求高[3-4]。因此,采用安全性高、檢驗(yàn)速度快的近紅外光譜(near infrared spectroscopy,NIR)檢測方法對面粉中濕面筋含量進(jìn)行測定十分必要。
近紅外光譜光電磁波的波長范圍是介于可見區(qū)與中紅外區(qū)之間的區(qū)域,其波長范圍為780~2 526 nm,波數(shù)范圍為從12 500 cm-1到4 000 cm-1的區(qū)域,是人們最早發(fā)現(xiàn)的非可見光區(qū)域[5]。近紅外區(qū)光譜數(shù)據(jù)不僅信息量豐富,而且數(shù)據(jù)容易獲取,隨著近紅外光譜技術(shù)的日益完善,近紅外光譜檢測技術(shù)在食品及農(nóng)產(chǎn)品作物加工檢驗(yàn)、石油化工行業(yè)、生態(tài)及社會環(huán)境污染檢測、生物醫(yī)學(xué)等各個學(xué)科和領(lǐng)域得到了廣泛的應(yīng)用[6-7]。王欣[8]對光譜預(yù)處理中的常用方法進(jìn)行了綜合論述,并對傅里葉變換(Fourier transform,F(xiàn)T)、小波變換(wavelet transform,WT)進(jìn)行了重點(diǎn)介紹;吳靜珠等[9]以小麥為研究對象,比較了多種常見的光譜預(yù)處理方法對模型精度的影響;索少增等[10]初步探討了多種預(yù)處理方法對近紅外光譜技術(shù)檢測微量農(nóng)藥溶液含量的影響,并指出近紅外光譜技術(shù)結(jié)合預(yù)處理方法和偏最小二乘建模方法能夠用于初步檢測微量農(nóng)藥溶液含量。通過對樣品的光譜數(shù)據(jù)進(jìn)行一定的預(yù)處理,能夠有效地消除噪聲信息和無關(guān)變量,從而提高模型的準(zhǔn)確性和精度。
本研究采用10種不同的預(yù)處理方法對面粉濕面筋的近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,主要結(jié)合近紅外光譜技術(shù),采用化學(xué)計量學(xué)方法進(jìn)行光譜預(yù)處理,并建立偏最小二乘法(partial leastsquares,PLS)模型對面粉濕面筋含量進(jìn)行定量分析,初步探討了數(shù)據(jù)預(yù)處理對PLS建模效果的影響。以期提高模型的預(yù)測能力,為近紅外光譜面粉品質(zhì)檢測奠定基礎(chǔ)。
1.1料與試劑
試驗(yàn)樣本從北京海淀、東城、西城、豐臺、房山、密云六大地區(qū)的多個不同超市購買的不同生產(chǎn)日期、不同種類的面粉,共計237個。
氯化鈉(分析純):國藥集團(tuán)化學(xué)試劑有限公司。
1.2器與設(shè)備
MATRIXTM-F近紅外光譜分析儀(配有漫反射積分球附件):德國Bruke公司;GLUTOMATIC2200洗面筋儀器:瑞典波通公司;JJ200型天平:常熟雙杰測試儀器廠。
1.3法
1.3.1本化學(xué)值的測定
采用洗面筋儀器對面粉洗滌,根據(jù)雙試驗(yàn)結(jié)果允許誤差≤1.0%的原則,秤取10 g面粉樣品置于洗滌皿中,并放入4.6~5.2m L質(zhì)量濃度為20 g/L的氯化鈉緩沖溶液,將洗滌皿放入洗面筋儀指定位置后啟動儀器,20 s攪拌和成面后,儀器自動進(jìn)行洗滌,洗滌5m in后取出面筋,用擠壓板去除面團(tuán)中的水分,最后取出面筋后準(zhǔn)確測量面粉中的濕面筋含量,并將測量的濕面筋含量值作為建立PLS模型的真值。面粉中濕面筋含量的計算公式如下:
式中:W為濕面筋質(zhì)量,g;M為每100 g面粉中含水量,g;86為換算為14%基準(zhǔn)水分試樣的系數(shù);10為試樣面粉質(zhì)量,g。
1.3.2本的近紅外光譜采集
面粉為不透明的粉末狀固體,透射方式采集的近紅外光譜不能達(dá)到較好的測量效果,本試驗(yàn)采用漫反射的方式采集光譜數(shù)據(jù),近紅外光譜分析儀配有漫反射積分球附件,試驗(yàn)采用積分球的漫反射測驗(yàn)方式。光譜參數(shù)設(shè)置如下:檢測溫度為20~25℃,光譜范圍10 000~4 000 cm-1,分辨率8 cm-1,掃描次數(shù)64次,測量3次后取平均值。將面粉樣本放置在漫反射樣本杯中,進(jìn)行近紅外光譜采集。
1.3.3紅外光譜數(shù)據(jù)的預(yù)處理
選取常用的10種不同的預(yù)處理方法(消除常數(shù)偏移量、減去一條直線、矢量歸一化、最大-最小歸一化、多元散射校正、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、一階導(dǎo)數(shù)+減去一條直線、一階導(dǎo)數(shù)+矢量歸一化、一階導(dǎo)數(shù)+多元散射校正)對237個面粉樣本原始的光譜數(shù)據(jù)進(jìn)行預(yù)處理。采用偏最小二乘法建模,以模型相關(guān)系數(shù)R、內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差(root-meansquares error of cross-validation,RMSECV)、預(yù)測標(biāo)準(zhǔn)差(root-mean-squareerrorofprediction,RMSEP)為評價指標(biāo),建立經(jīng)過預(yù)處理后的面粉光譜數(shù)據(jù)和面粉濕面筋含量之間的PLS定量模型,并將預(yù)處理后的模型與無預(yù)處理的模型進(jìn)行比較[11-13]。
2.1粉樣本的近紅外光譜分析
以波數(shù)為橫坐標(biāo),吸光度值為縱坐標(biāo),獲得237個面粉樣本的近紅外光譜圖,結(jié)果如圖1所示。
圖1 面粉樣本的近紅外光譜圖Fig.1 Near-infra red spectra of flour sam p les
由圖1可知,面粉的近紅外光譜圖中包含大量的化學(xué)官能團(tuán)信息,除C-H外,還含有蛋白質(zhì)、淀粉、纖維素以及水分中的N-H、O-H和C=H的合頻吸收信息。不同的官能團(tuán)的特征譜帶有重疊現(xiàn)象,每個明顯的吸收譜帶中均含有不同類型化合物的官能團(tuán)信息。8336.64 cm-1附近的吸收譜帶中含有甲基、亞甲基C-H伸縮振動的二次倍頻峰;6 812.02 cm-1附近含有N-H鍵伸縮振動一次倍頻;5 168.72 cm-1附近含有O-H、HOH變形振動、蛋白質(zhì)仲酰胺CONH中的C=O二級倍頻吸收等;4 766.31 cm-1及4 314.57 cm-1附近含有N-H、C-H等多種不同的合頻吸收信息。因此,能夠采用近紅外光譜分析法對面粉品質(zhì)進(jìn)行檢測。
2.2紅外光譜數(shù)據(jù)的預(yù)處理
表1 面粉濕面筋PLS模型優(yōu)化參數(shù)及預(yù)測結(jié)果Table 1 Optimum parameters and prediction results of PLSmodel for wet gluten in flour
在優(yōu)化模型時,對同一樣品集的同一組分,內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)R越大、內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差RMSECV越小,則PLS算法所提取的光譜信息與分析組分的相關(guān)性越好,所建模型的預(yù)測能力和穩(wěn)健性越高,但是由于過擬合現(xiàn)象的存在,也會出現(xiàn)內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)較好,模型的預(yù)測精度降低的情況。由表1可知,光譜預(yù)處理方法不同,所建模型預(yù)測效果存在差異,10種預(yù)測處理方法相關(guān)系數(shù)R最大為0.9301,最小為0.8597;內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差RMSECV最大值為0.775,最小值為0.473;預(yù)測標(biāo)準(zhǔn)差RMSEP最大值為0.977,最小值為0.083。采用預(yù)處理后的校正模型與無光譜預(yù)處理的校正模型相比,校正模型的相關(guān)系數(shù)R均有所提高,預(yù)處理后的濕面筋校正模型的相關(guān)系數(shù)R都在0.85以上,內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差RMSECV均在0.78以下,說明針對本試驗(yàn)的237個面粉樣本的近紅外光譜數(shù)據(jù),采取一定的預(yù)處理方式能夠提高模型的預(yù)測精度。其中,綜合考慮各模型的內(nèi)部交叉驗(yàn)證結(jié)果和模型預(yù)測結(jié)果,一階導(dǎo)數(shù)+減去一條直線的預(yù)處理方法的內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)R為0.901 8,內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差RMSECV為0.708,37個檢測樣本的預(yù)測相關(guān)系數(shù)0.920 9,預(yù)測標(biāo)準(zhǔn)差RMSEP僅為0.083,在優(yōu)化面粉濕面筋定量模型、提高預(yù)測精度方面效果最佳。
圖2 不同預(yù)處理校正模型及模型預(yù)測結(jié)果Fig.2 Correction m odeland m odel predictions results of different pretreatments
由圖2可知,10種不同的預(yù)處理方法對面粉樣本的光譜數(shù)據(jù)進(jìn)行預(yù)處理后建立的偏小二乘模型精度不同,預(yù)測結(jié)果也不相同。而多元散射校正預(yù)處理方法的內(nèi)部交叉驗(yàn)證結(jié)果較好,但是從預(yù)測集結(jié)果來看,出現(xiàn)了過擬合現(xiàn)象。矢量歸一化由于主成分?jǐn)?shù)較大,包含的光譜信息中含有較多無用信息,而使模型預(yù)測精度降低。一階導(dǎo)數(shù)+減去一條直線、最大-最小歸一化、一階導(dǎo)數(shù)+多元散射校正、減去一條直線、一階導(dǎo)數(shù)+矢量歸一化、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)及消除常熟偏移量對雜質(zhì)無用信息進(jìn)行了有效的處理,提高了模型的預(yù)測精度。其中,一階導(dǎo)數(shù)+減去一條直線預(yù)處理后的模型的精度和預(yù)測結(jié)果優(yōu)于其他9種預(yù)處理結(jié)果。
圖3 無光譜預(yù)處理校正模型及模型預(yù)測結(jié)果Fig.3 Correction mode land modelpredictions results of no spectralpretreatments
由圖3可知,對光譜數(shù)據(jù)不進(jìn)行任何預(yù)處理時,由于原始光譜信息中含有大量的噪聲信息和無關(guān)變量,建立的偏最小二乘模型的性能和精確度低于預(yù)處理過后的光譜數(shù)據(jù)所建立的模型。
通過表1、圖2、圖3可以發(fā)現(xiàn),與原始光譜數(shù)據(jù)相比,經(jīng)過預(yù)處理的光譜數(shù)據(jù)在一定程度上去除了部分雜質(zhì)信息和無用信號,建立的模型的內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)均在0.85以上,說明采用校正能力強(qiáng)、適應(yīng)性好的預(yù)處理方法對近紅外光譜面粉品質(zhì)檢測的進(jìn)一步發(fā)展提供了較好的數(shù)據(jù)分析平臺。
本研究對面粉的近紅外光譜數(shù)據(jù)進(jìn)行10種不同的預(yù)處理方法,并建立預(yù)處理后的光譜數(shù)據(jù)與濕面筋含量之間的PLS定量分析模型,通過校正模型的內(nèi)部交叉驗(yàn)證評價指標(biāo)和預(yù)測結(jié)果比較了10預(yù)處理方法對PLS建模效果的影響。結(jié)果表明,一階導(dǎo)數(shù)+減去一條直線的預(yù)處理方法對PLS模型的優(yōu)化效果最好,內(nèi)部交叉驗(yàn)證相關(guān)系數(shù)R為0.901 8,內(nèi)部交叉驗(yàn)證標(biāo)準(zhǔn)差RMSECV為0.708,37個檢測樣本的預(yù)測相關(guān)系數(shù)0.9209,預(yù)測標(biāo)準(zhǔn)差RMSEP僅為0.083。通過預(yù)處理和無預(yù)處理的校正模型和預(yù)測結(jié)果比較,可以發(fā)現(xiàn)采用預(yù)處理后的光譜數(shù)據(jù)在一定程度上降低了主成分?jǐn)?shù),去除部分無用的光譜信息,降低了光譜信息的線性相關(guān)性,從而提高了模型的預(yù)測精度和準(zhǔn)確性[14-18]??梢妼υ嫉慕t外光譜數(shù)據(jù)進(jìn)行一定的預(yù)處理在面粉濕面筋定量分析方面有很好地應(yīng)用。
[1]白劍俠,趙欣.制粉廠的生產(chǎn)檢驗(yàn)[J].技術(shù)糧食工程,2010,52(3):53-54.
[2]王曉曦,陳穎,徐榮敏,等.小麥加工工藝與小麥粉品質(zhì)[J].糧食與飼料工業(yè),2006(10):9-12.
[3]胡玉君,劉翠玲,竇森磊,等.基于近紅外光譜的小麥粉濕面筋含量檢測[J].四川大學(xué)學(xué)報:自然科學(xué)版,2015,52(4):800-804.
[4]WESLEY I,LARROQUE O,OSBORNE B G,et al.Measurement of gliadin and glutenin contentof flour by NIR spectroscopy[J].J Cereal Sci,2001,34(2):125-133.
[5]褚小立,許育鵬,田高友.近紅外光譜解析實(shí)用指南[M].北京:化學(xué)工業(yè)出版社,2009.
[6]胡玉君,劉翠玲,孫曉榮,等.基于近紅外光譜的芝麻油酸價含量的預(yù)測[J].中國釀造,2014,33(8):131-135.
[7]徐一茹,劉翠玲,孫曉榮,等.基于近紅外和中紅外光譜技術(shù)的小麥粉品質(zhì)檢測及摻雜鑒別方法[J].食品科學(xué),2014,35(12):128-132.
[8]王欣.近紅外分析中光譜預(yù)處理方法的研究與應(yīng)用進(jìn)展[J].科技資訊,2013(15):2.
[9]吳靜珠,李慧,王克棟,等.光譜預(yù)處理在農(nóng)產(chǎn)品近紅外模型優(yōu)化中的應(yīng)用研究[J].農(nóng)機(jī)化研究,2011(3):178-181.
[10]索少增,劉翠玲,吳靜珠,等.微量農(nóng)藥溶液近紅外光譜PLS模型的不同預(yù)處理方法對比研究[J].食品工業(yè)科技,2012,33(11):330-332,337.
[11]WANG D,MA Z H,HAN P,et al.Research on detection of lime in wheat flour by NIRmicro-imaging[J].Sens Lett,2012,10(1/2):252-257.
[12]宦克為.小麥內(nèi)在品質(zhì)近紅外光譜無損檢測技術(shù)研究[D].長春:長春理工大學(xué)博士論文,2014.
[13]高居榮,韓秀蘭,孫彩玲,等.DA7200近紅外儀在小麥品質(zhì)分析中的應(yīng)用研究[J].實(shí)驗(yàn)室科學(xué),2009(1):173-176.
[14]王偉明,董大明,鄭文剛,等.梨果糖濃度近紅外漫反射光譜檢測的預(yù)處理方法研究[J].光譜學(xué)與光譜分析,2013,33(2):359-362.
[15]尼珍,胡昌勤,馮芳.近紅外光譜分析中光譜預(yù)處理方法的作用及其發(fā)展[J].藥物分析雜志,2008,28(5):824-829.
[16]吳靜珠,李慧,王克棟,等.光譜預(yù)處理在農(nóng)產(chǎn)品近紅外模型優(yōu)化中的應(yīng)用研究[J].農(nóng)機(jī)化研究,2011(3):178-181.
[17]夏俊芳,李培武,李小昱,等.不同預(yù)處理對近紅外光譜檢測臍橙VC含量的影響[J].農(nóng)業(yè)機(jī)械學(xué)報,2007,38(6):107-111.
[18]高榮強(qiáng),范世福,嚴(yán)衍祿,等.近紅外光譜的數(shù)據(jù)預(yù)處理研究[J].光譜學(xué)與光譜分析,2004,24(12):1563-1565.
Research on spectralpretreatmentmethods forquantitativeanalysisofwetgluten in flourby near infrared spectroscopy
SUN Yingwei,ZHOU Ping*
(SchoolofEarth Science and Resources,China University ofGeoscience,Beijing 100083,China)
Near infrared spectrum dataof thewetgluten contentin flourwaspreprocessed by 10 kindsof differentpretreatmentmethods.Theeffectof 10 pretreatmentmethodson quantitativemodelbased on partial leastsquares(PLS)was com pared.The results showed thatwhen thewetgluten content in flour was analyzed quantificationally by near infrared spectroscopy analysis technology,the predictive effect of first derivative+m inus a straight line pretreatmenton thewetgluten content in flourwas the optimal.The R and RMSECV valuewere 0.901 8 and 0.708,respectively.The R and RMSEP valuewas0.920 9 and 0.083,respectively.Thepretreatmentmethod improved theprecision and accuracy of predictionmodel.
near infrared spectroscopy;pretreatment;wetgluten;partial leastsquares
TS211.7
0254-5071(2016)01-0137-04
10.11882/j.issn.0254-5071.2016.01.030
2015-11-11
國家自然科學(xué)基金資助項(xiàng)目(49902019);中國科學(xué)院知識創(chuàng)新工程(KZCX2-209-05)
孫營偉(1990-),男,碩士研究生,研究方向?yàn)槎喙庾V技術(shù)在資源勘探及食品檢測的應(yīng)用。
周萍(1964-),女,副教授,博士,研究方向?yàn)楦吖庾V遙感技術(shù)。