張海紅,張淑娟,介鄧飛,趙華民
(山西農業(yè)大學工程技術學院,山西太谷 030801)
基于PCR和PLS的沙棘汁品種近紅外光譜研究
張海紅,張淑娟,介鄧飛,趙華民
(山西農業(yè)大學工程技術學院,山西太谷 030801)
建立可見-近紅外漫反射光譜與沙棘汁品種之間的數(shù)學模型,以評價可見-近紅外漫反射光譜技術快速檢測沙棘汁品種。采用美國ASD公司的FieldSpec3光譜儀對三種不同品種的沙棘汁進行光譜分析,各獲取30個樣本的光譜數(shù)據(jù),對原始光譜進行一階微分和二階微分預處理,并利用偏最小二乘法(PLS)數(shù)學校正方法對三種不同預處理的光譜數(shù)據(jù)建模。結果表明,采用二階微分預處理數(shù)據(jù),應用PLS方法建模較好,其校正模型相關系數(shù)為0.9992,均方根誤差為0. 0317;采用主成分回歸(PCR)和偏最小二乘法(PLS),對沙棘汁的二階微分數(shù)據(jù)進行分析比較,結果也表明,基于二階微分數(shù)據(jù),應用PLS方法建模較為理想,其預測集的相關系數(shù)為0.9988,所測預測樣本的均方根誤差為0.0392。近紅外光譜可作為一種快速、有效的無損檢測方法來識別沙棘汁的品種。
可見-近紅外漫反射光譜;快速檢測;沙棘汁品種;PCR;PLS
沙棘,又稱醋柳,酸刺,是生長在我國華北和東北地區(qū)的一種野生落葉灌木,果實為橢圓形橙黃色,它能調節(jié)血脂、血壓、改善心肌缺血,抗疲勞,增強記憶力。沙棘汁作為一種綠色飲料,其口感、糖分含量、酸度和維生素含量等內部品質都得到了人們廣泛的重視。從目前市場看,沙棘汁的品種繁多,不同品種間的顯著差異直接影響其口感及品質。因此,研究一種簡單、快速、無損的沙棘汁品種鑒別技術是非常必要的。
近紅外光譜技術是一種快速測定物質化學組分含量的現(xiàn)代光譜技術,具有速度快、無污染、適于在線分析等優(yōu)點,已引起越來越多國內外學者的重視[1~10]。有學者研究用近紅外光譜技術區(qū)別酸奶品種[2]、醬油品牌[3]、可樂品牌[4]等,本文旨在利用近紅外漫反射分析技術,基于主成分分析(PCR)和偏最小二乘法(PLS)對沙棘汁品種進行研究,初步建立沙棘汁品種的預測模型。
本試驗設備由微機、光譜儀、鹵光燈、校正白板等組成。光譜儀使用美國ASD(Analytical Spectral Device)公司的FieldSpec 3光譜儀,光譜采樣間隔為1 nm,采樣范圍為350~2500 nm,掃描次數(shù)30次,分辨率 3.5 nm,探頭視場角為 25°,采用漫反射方式進行樣品光譜采樣;光源采用與光譜儀配套的14.5 V鹵素燈。光譜數(shù)據(jù)以ASCII碼形式導出進行預處理,分析軟件為 ASD ViewSpec Pro V5.0,Unscramble V9.7。
本試驗材料分別為同一批次的夏普賽爾、維仕杰和匯源三種沙棘汁。各采集40個樣本,合計120個樣本,隨機分為建模集90個樣本和預測集30個樣本。試驗時,將沙棘汁裝入高1.4 cm,直徑6.5 cm的培養(yǎng)皿內,液面高度10 mm。將光譜儀置于沙棘汁樣本的上方,距沙棘汁表面50 mm,光源距盛樣容器中心350 mm,成45°角照射。
為了去除來自高頻隨機噪音、基線漂移、樣本不均勻、光散射等影響[10],采用Move average平滑法進行光譜預處理,選用平滑點數(shù)為9,此時能很好濾除各種因素產生的高頻噪音,再進行MSC(Multiplicative Scatter Correction)處理[3],三種不同品種沙棘汁的典型的可見-近紅外光譜漫反射曲線見圖1。
圖1 三種不同品種沙棘汁可見-近紅外漫反射光譜曲線Fig.1 Visible-Near infrared diffuse reflectance spectroscopy of three different varieties of persimmon
圖1中的橫坐標為波長,范圍是 350~2500 nm,縱坐標為光譜反射率。從圖1中可以看出,不同品種沙棘汁的光譜圖不同,具有一定的特征性和指紋性。
為了優(yōu)化建模,在對光譜數(shù)據(jù)進行前面的預處理的基礎上,本試驗采用一階微分(平滑點數(shù):9)和二階微分(平滑點數(shù):9)與原始光譜數(shù)據(jù)進行比較,應用主成分回歸(PCR)和偏最小二乘法(PLS)分別對沙棘汁品種進行建模。建模樣本的均方根誤差(RMSEC)和預測樣本的均方根誤差(RMSEP)用于評價與對比所建模型的精確性。
為了比較不同光譜處理方法對模型建立的影響,針對原始光譜、一階微分光譜和二階微分光譜,應用PLS校正方法對品種分別建模。表1顯示了三種光譜處理方法應用PLS校正方法建模的結果接近。比較而言,二階微分光譜的PLS效果最好,其校正模型相關系數(shù)較高,均方根誤差較低。圖2表明了PLS校正建模算法對沙棘汁二階微分光譜的校正結果,其校正模型相關系數(shù)為0.9992,校正均方根誤差為0.0317.
表1 不同光譜處理方法應用PLS校正方法建模結果Table 1 Results of PLS model with different spectrum
圖2 二階微分光譜PLS樣本集實測值與預測值的散點Fig.2 Second derivative spectra of the original sample set PLS predicted value of the measured value and the scatter
為了比較不同校正方法對沙棘汁品牌模型建立的影響,應用PCR和PLS兩種校正方法對沙棘汁品種分別建模。
從表2可以看出,采用原始光譜處理時,兩種不同校正方法對沙棘汁品種建模的結果。從分析結果看,兩種方法的校正結果接近。
表2 不同光譜建模方法的結果Table 2 Results for calibration models of PCR and PLS regression methods for the firmness of Persimmon
為了檢驗校正模型的可靠性和適應性,對二階微分光譜比較PCR和PLS兩種校正方法,在相同條件下應用于預測樣本集,結果見表3。由預測結果可知,PLS方法要優(yōu)于PCR方法。如圖3所示,應用所建PLS校正模型對預測集樣本進行的預測,其相關系數(shù)較高為0.9988,預測樣本均方根誤差為0.0392。
表3 同光譜建模方法的結果Table 3 Results for prediction models of PCR and PLS regression methods for the firmness of Persimmon
圖3 二階微分光譜PLS預測集實測值與預測值的散點Fig.3 Second derivative spectra of the original PLS prediction set and the predicted value of measured value of the scatter
研究結果表明,近紅外漫反射光譜可以作為一種快速檢測沙棘汁品種的方法。通過比較分析不同預處理方法的校正建模結果可知,二階微分光譜的PLS效果最好,其校正模型的相關系數(shù)較高,均方根誤差較低;通過比較主成分回歸PCR和偏最小二乘PLS兩種不同校正方法對沙棘汁原始光譜建模結果,可以看出兩種方法的校正結果接近,PLS建模結果稍好;由預測樣本集的預測結果可知,PLS方法要優(yōu)于PCR方法,其相關系數(shù)較高為0.9988,預測樣本均方根誤差為0.0392。
所建模型的準確性受多種因素的影響,需要深入了解各種影響因素以及制訂詳細的預防措施和解決方法,本實驗中選擇同一批次的樣本來建立模型,采用同一規(guī)格的比色皿盛放樣本等措施來盡量排除外界因素對實驗結果的影響。
[1]劉燕德,羅吉,歐陽愛國.可見光光譜檢測贛南臍橙糖度的研究[J].光譜學與光譜分析,2007,27(3):569-572.
[2]何勇,馮水娟,李曉麗,等.應用近紅外光譜快速鑒別酸奶品種的研究[J].光譜學與光譜分析,2006,26(11):2021-2023.
[3]童曉星,鮑一丹,何勇.應用近紅外光譜技術快速檢測醬油品牌的研究[J].光譜學與光譜分析,2008,28(3):597-601.
[4]裘正軍,陸江鋒,毛靜淵,等.基于可見-近紅外光譜的可樂品牌鑒別方法研究[J].光譜學與光譜分析,2007,27(8):1543-1546.
[5]李桂峰,趙國建,王向東,等.蘋果質地品質近紅外無損檢測和指紋分析[J].農業(yè)工程學報,2008,24(6):169-173.
[6]王莉,劉飛兒,何勇.應用可見-近紅外光譜技術進行白醋品牌和pH值的快速檢測[J].光譜學與光譜分析,2008,28(4):813-816.
[7]曾一凡,劉春生,孫旭東,等.可見-近紅外光譜技術無損檢測果實堅實度的研究[J].農業(yè)工程學報,2008,24(5):250-252.
[8]祝詩平,王剛,尹雄,等.DOSC在花椒揮發(fā)油含量近紅外光譜分析中的應用[J].農業(yè)機械學報,2008,39(4):104-107.
[9]張淑娟,王鳳花,張海紅,等.鮮棗品種和可溶性固形物的近紅外光譜無損檢測[J].農業(yè)機械學報,2009,40(4):151-154.
[10]田海清,應義斌,徐惠榮,等.西瓜可溶性固形物含量近紅外透射檢測技術[J].農業(yè)機械學報,2007,38(5):111-113.
Research on Varieties of Sea Buckthorn Juice by Near-Infrared Diffuse Reflectance Spectroscopy Based on the PCR and PLS
ZHANG Hai-hong,ZHANGShu-juan,JIE Deng-fei,ZHAO Hua-min
(College of Engineering and Technology,Shanxi Agricultural University,TaiguShanxi 030801,China)
The objectives of this study are to establish mathematical relationship between visible and near-infrared(Vis-NIR)diffuse reflectance spectroscopy and sea buckthorn juice varieties,and to evaluate the applicability of Vis-NIR spectroscopy technique for fast measurement of the sea buckthorn juice varieties.A Fieldspec3 spectroradio meter was used for collecting 30 samples spectra data of the three kinds of sea buckthorn juices,Then the first and second derivatives were calculated using Vis-NIR diffuse reflectance spectroscopy,and principal component regression(PCR)and partial least square(PLS)regression were used to establish mathematical models to analyze the spectral data with three pretreatments The best prediction results were obtained,which was based on second derivative with PLS model,and its correlation coefficients of calibration set was 0.9992,and root mean standard error of correction(RM SEC)was 0.0317.Based on the second derivative with PLS model,and its correlation coefficient of prediction set is 0.9988,and root mean standard error of correction(RMSEC)is 0.0392.Vis-NIR spectroscopy is a fast and available method for non-destructive detection of Sea buckthorn Juice Varieties.
Near-infrared diffuse reflectance spectroscopy;Fast measurement;Seabuckthorn juice varieties;PCR;PLS
O433.4
A
1671-8151(2010)01-0046-03
2009-11-20
2009-12-28
張海紅(1983-),女(漢),山西汾陽人,碩士,主要從事數(shù)字農業(yè)技術與裝備的研究。
張淑娟,教授,博士生導師。Tel:0354- 6288091;E-mail:zsujuan@263.net
山西省科技攻關項目(2007031109-2)
(編輯:武英耀)