張 林 黨 楠 楊 琳 李亞文 袁訓鋒
(商洛學院電子信息與電氣工程學院,陜西 商洛 726000)
基于近紅外光譜技術預測玉米伏馬菌素
張 林 黨 楠 楊 琳 李亞文 袁訓鋒
(商洛學院電子信息與電氣工程學院,陜西 商洛 726000)
為了更好地利用近紅外光譜分析技術對玉米伏馬菌素含量進行預測,減小因玉米產(chǎn)地間的差異對玉米近紅外光譜預測模型的影響,以不同產(chǎn)地的玉米作為研究對象,利用x-y共生距的方法將試驗樣本劃分為校正集與驗證集,采用經(jīng)典的偏最小二乘法分別建立不同產(chǎn)地和混合產(chǎn)地的玉米伏馬菌素預測模型,并采用驗證集樣本分別對模型的預測精度進行驗證。為了減小建模及預測過程的運算量,采用連續(xù)投影算法(SPA)和競爭性自適應加權算法(CARS)對不同產(chǎn)地玉米的近紅外光譜的特征波長進行篩選,篩選出22個特征波長變量作為輸入,大大降低了建模及預測過程的運算量,同時預測準確度也有所改善,其預測相關系數(shù)達到0.954,為快速、無損地實現(xiàn)對玉米伏馬菌素的檢測提供了可靠的理論依據(jù)。
玉米;伏馬菌素;近紅外光譜;預測
伏馬菌素(Fumonisins,F(xiàn)Bs)是被國際衛(wèi)生組織列為幾種嚴重致癌真菌毒素之一[1],是在合適的溫度與濕度條件下由串珠鐮刀菌代謝產(chǎn)生的二級代謝產(chǎn)物,其主要存在于玉米等谷物中。20世紀80年代Gelder blom等[2]在玉米制品中發(fā)現(xiàn)并成功分離出了B1型伏馬菌素,緊接著Laurent等[3]對伏馬菌素進行了深入的研究,發(fā)現(xiàn)伏馬菌素其實包含有兩種結構極其相近的有毒有害物質,分別將其命名為伏馬菌素B1和伏馬菌素FB2,隨著研究的深入,如今研究者[3]已經(jīng)發(fā)現(xiàn)多種類型的伏馬菌素,其主要可以分為A、B、C和P 4種類型。在玉米中最常見的是FB1型伏馬菌素,在目前所發(fā)現(xiàn)的所有種類的伏馬菌素當中,B1型伏馬菌素對人體的危害最大,毒性最強。
早在1993年國際癌癥研究院就把伏馬菌素列為強致癌物質目錄,將伏馬菌素認定為可以危害動物和人體健康的物質之一[4]。目前,國際衛(wèi)生組織認為伏馬菌素是幾種具有重大研究意義的真菌毒素之一[4]。傳統(tǒng)的伏馬菌素測定方法主要是通過分析化學的方法進行測定與研究[5],包括色譜測定法和濕化學分析兩種方法,這兩種方法能夠準確測定伏馬菌素的含量,但測量過程繁瑣,無法實現(xiàn)實時、無損的測定[6]。
本研究擬在分析玉米近紅外光譜特征的基礎上,采用近紅外光譜分析技術間接對玉米中伏馬菌素含量進行定量預測研究,同時采用偏最小二乘法(Partial least squares regression,PLS)建立玉米伏馬菌素含量預測模型,并對模型的精度與穩(wěn)定性進行驗證。
1.1 試驗材料
試驗中的玉米樣本選自陜西、山西、河南和黑龍江,從中挑選360個玉米樣本進行試驗,其中80個樣本產(chǎn)自陜西,90個產(chǎn)自山西,100個產(chǎn)自河南,90個產(chǎn)自黑龍江。將玉米樣本破碎、篩選并依次編號,標記光譜采集區(qū)域。試驗進行前先將玉米樣本取出在20 ℃的室溫下放置12 h,使玉米樣本與室內(nèi)溫度保持一致,盡量減少試驗中溫度對光譜采集的影響;
近紅外光譜儀:Antaris II型,美國Nicolet公司。
1.2 伏馬菌素測定與光譜采集
試驗過程中采用Antaris傅里葉變換近紅外光譜儀對玉米的近紅外光譜進行采集,選擇對波長800~2 400 nm范圍的光譜進行采集,掃描次數(shù)32次,分辨率3.0 cm-1。玉米樣本的光譜采集完成后采用數(shù)字阿貝折光儀對玉米中的伏馬菌素含量進行測定。
1.3 樣本的劃分
試驗中采用x-y共生距的劃分方法,同時兼顧樣本的x變量(近紅外光譜數(shù)據(jù))和y變量(玉米伏馬菌素含量)的歐氏距離。為了保證試驗樣本在x-y的空間的權重相同,將xy的距離進行標準化:
(1)
式中:
n——試驗樣本總數(shù);
dx/y(p,q)——試驗中任意的兩個樣本之間的歐氏距離[7];
在試驗過程中分別對4個產(chǎn)地的玉米樣本進行分組,分別將其分為校正集和預測集。
1.4 特征波長的選取
由于近紅外光譜中不但包含有需要的效信息,且包含著大量的冗余信息[8],在試驗的過程中采用連續(xù)投影算法(Successiveprojectionsalgorithm,SPA)和競爭自適應加權算法(CompetitiveAdaptiveReweightedSampling,CARS)的方法選取玉米伏馬菌素有效近紅外光譜的特征波長。
1.5 玉米伏馬菌素近紅外光譜檢測模型的建立
偏最小二乘法(PLS)因其具有良好的抗干擾性能和穩(wěn)定性,已在近紅外光譜分析領域得到了廣泛的應用[9],也是經(jīng)典的近紅外光譜建模方法之一。試驗過程中首先采用偏最小二乘法分別建立單一產(chǎn)地的玉米伏馬菌素近紅外光譜檢測模型,然后再建立2個產(chǎn)地混合、3個產(chǎn)地混合和4個產(chǎn)地混合的玉米伏馬菌素近紅外光譜預測模型。最后,采用驗證集玉米樣本分別對模型的預測精度和穩(wěn)定性進行驗證。
2.1 玉米樣品的近紅外光譜分析以及樣本的劃分
為了減少光譜噪聲的影響及運算量,試驗過程中選取4 000~12 000cm-1共計3 200個波長點進行研究。圖1為玉米樣本的原始漫反射近紅外光譜,僅從光譜圖很難區(qū)分不同產(chǎn)地玉米樣本光譜間的差異,對其進行主成分分析可以發(fā)現(xiàn)前5個主成分(PrincipalComponent,PC)包含了光譜數(shù)據(jù)的99%以上的信息。采用非參數(shù)檢驗(KruskalWallis)[10]的方法對玉米樣本的前5個主成分間的差異進行檢驗,所有主成分對應的P<0.05,表明不同產(chǎn)地的玉米近紅外光譜間存在著比較明顯的差異。
圖1 玉米原始光譜圖Figure 1 Corn raw spectra
在將試驗所用玉米樣本進行分組之前,首先采用馬氏距離、杠桿值和學生氏殘差檢驗法對試驗中樣本進行檢驗,剔除其中的異常樣本,然后將樣本分為校正集和預測集兩組。不同產(chǎn)地玉米伏馬菌素含量測定值分布和分組情況見表1。
2.2 單一產(chǎn)地的玉米伏馬菌素近紅外預測結果
采用偏最小二乘法和校正集樣本分別建立不同產(chǎn)地玉米的伏馬菌素含量預測模型,然后分別采用事先準備好的驗證集樣本對模型的預測精度進行驗證,結果見表2。采用單一產(chǎn)地玉米樣本建立的玉米伏馬菌素近紅外預測模型在對相應的玉米進行預測時模型具有較好的預測精度(達到0.9以上),但該模型用于其他產(chǎn)地的玉米伏馬菌素含量進行預測時,預測精度大幅度下降。
2.3 混合產(chǎn)地的玉米伏馬菌素近紅外光譜模型預測結果
為了克服單一產(chǎn)地建立的玉米伏馬菌素近紅外光譜模型在對其他產(chǎn)地玉米伏馬菌素含量預測時預測結果明顯變壞的問題,試驗中將4個產(chǎn)地的校正集玉米樣本進行混合,建立混合產(chǎn)地的玉米伏馬菌素近紅外光譜預測模型,并采用4個產(chǎn)地的玉米對模型的預測精度進行檢驗,結果見表3。通過對建模結果的分析,可以發(fā)現(xiàn)隨著選取建立模型的玉米產(chǎn)地種類混合數(shù)量的增加,模型的預測精度在不斷提高,將4個產(chǎn)地的玉米混合后作為校正集建立的玉米伏馬菌素預測模型的精度最佳。通過以上的研究可知,當校正集樣本中包含的玉米種類增加,玉米樣本的近紅外光譜信息也增加,這樣建立的預測模型具有更好的適應性,能夠減少因玉米產(chǎn)地的差異而導致對玉米伏馬菌素預測的影響。
2.4 混合產(chǎn)地模型的優(yōu)化
為了進一步減小玉米伏馬菌素預測過程運算的復雜性同時提高預測的精度,在4 000~12 000cm-1光譜范圍內(nèi),采用競爭自適應加權算法(CARS)對4個產(chǎn)地的玉米混合后的校正集樣本的伏馬菌素進行有效特征光譜的篩選。由于通過競爭自適應加權算法得到的最優(yōu)采樣次數(shù)會有細微的差異,因此將進行60次試驗,選取其得到的交叉驗證均方根誤差(RMSECV)最小的一次,本次競爭自適應加權算法對玉米伏馬菌素特征波長的選取過程見圖2。當采樣次數(shù)為45次時系統(tǒng)的交叉驗證均方根誤差最小,此時對應的光譜特征變量個數(shù)為109。將選定的109個特征波長作為輸入變量,建立玉米伏馬菌素近紅外光譜預測模型,其結果見表4。與全波段建模相比不但減少了預測過程的運算量,且模型的預測精度也有所提升。
表1 玉米樣本伏馬菌素含量測試結果統(tǒng)計數(shù)據(jù)Table 1 Content of fumonisin corn sample test results of statistical data
表2 單一產(chǎn)地的玉米伏馬菌素近紅外光譜建模及檢測結果?Table 2 Single origin of fumonisin corn near infrared spectrum modeling and testing results
?A為陜西,B為山西,C為河南,D為黑龍江;RP為預測集相關系數(shù);RMSEP為預測均方差。
表3 混合產(chǎn)地的玉米伏馬菌素近紅外光譜模型預測結果?Table 3 Hybrid origin of fumonisin corn near infrared spectrum model predicted results
? A為陜西,B為山西,C為河南,D為黑龍江;RP為預測集相關系數(shù);RMSEP為預測均方差。
采用競爭自適應加權算法剔除了玉米近紅外光譜中的大量無效信息,但剩余的109個特征波長的光譜中仍然包含著一些具有共線性的冗余信息,接下來采用連續(xù)投影算法(SPA)在109個有效光譜點中進一步優(yōu)選,剔除冗余項,得到22個玉米近紅外光譜特征波長變量,并用這22個特征波長建立玉米的伏馬菌素含量預測模型。與全波段建模相比采用SPA簡化后的模型更加簡單,其對4個產(chǎn)地玉米的預測集樣本伏馬菌素檢測相關系數(shù)Rp=0.954,預測均方根誤差RMSEP=0.417。應用該模型對4個不同產(chǎn)地的玉米伏馬菌素預測結果見圖3。通過去除光譜中的冗余信息,不但減少了建模與預測過程中的運算量,同時進一步提高了模型的預測精度。
圖2 競爭自適應加權算法對玉米近紅外光譜特征變量的篩選Figure 2 Competition adaptive weighting algorithm for corn screening of near infrared spectral characteristics of the variable
表4 玉米伏馬菌素模型優(yōu)化結果Table 4 Fumonisin corn model optimization results
? A為陜西,B為山西,C為河南,D為黑龍江;RP為預測集相關系數(shù);RMSEP為預測均方差。
圖3 采用CARS+SPA優(yōu)化模型的預測集樣本預測結果 與真實值散點圖
Figure3UsedCARS+SPAoptimizationmodelsetsamplepredictionresultsandtherealvalueofascatterdiagram
本試驗以4個產(chǎn)地的玉米作為研究對象,采用近紅外光譜分析技術對玉米伏馬菌素檢測方法進行了研究。研究發(fā)現(xiàn)采用混合產(chǎn)地的玉米樣本建立的模型相比采用單一產(chǎn)地玉米樣本建立的模型具有更好的適應性。為了減少建模及預測過程的運算量,試驗中采用CARS+SPA從光譜的3 200個自變量中篩選出有效的22個特征光譜作為系統(tǒng)的輸入變量,大大減少了系統(tǒng)的運算量和模型的復雜程度,同時預測結果也有所改善。試驗結果表明在對含有不同產(chǎn)地的玉米建立預測模型時,玉米的近紅外光譜中含有大量的線性變量,有效剔除這些共線性變量能夠提高玉米伏馬菌素含量的預測精度,減小由于玉米產(chǎn)地差異對玉米伏馬菌素近紅外光譜檢測的影響。本研究方法能夠較好地克服由于不同產(chǎn)地、不同品種導致近紅外光譜對玉米伏馬菌素含量預測精度低、系統(tǒng)穩(wěn)定性差的問題,采用本試驗方法建立的模型具有更高的適應性。
[1]CAMPSDachoupakanSirisomboon,REDDYPutthang,PETTRSirisomboon.Applicationofnearinfraredspectroscopytodetectaflatoxigenicfungalcontaminationinrice[J].FoodControl, 2013, 33(4): 207-214.
[2]SMITAT,MISHRAL.ArapidFT-NIRmethodforestimationofaflatoxinB1inredchilipowder[J].FoodControl, 2009, 20(11): 840-846.
[3]XIAChu.Researchprogressinthetechnologyforrapiddetectionofmycotoxinsingrainanditsproducts[J].ScienceandTechnologyofCereals,OilsandFoods, 2013, 21(3): 76-81.
[4]JAMESK.Deoxynivalenol:mechanismsofaction,humanexposure,andtoxicologicalrelevance[J].ArchToxicol, 2010, 84: 663-679.
[5] 袁景, 郭小玉, 楊天溪, 等. 基于光譜技術的食品中常見真菌霉素的快速檢測研究進展[J]. 上海師范大學學報: 自然科學版, 2015, 44(5): 571-579.
[6] 劉秀英, 申健, 常慶瑞, 等. 基于可見/近紅外光譜的牡丹葉片花青素含量預測[J]. 農(nóng)業(yè)機械學報, 2015, 46(9): 319-327.
[7]SIMSDA,GAMONJA.Relationshipsbetweenleafpigmeritcontentandspectralreflectanceacrossawiderangeofspecies,leafstructuresanddevelopmentstages[J].RemoteSensingofEnvrionment, 2002, 81(2/3): 337-354.
[8] 鄒小波, 陳正偉, 石吉勇, 等. 基于近紅外高光譜圖像的黃瓜葉片色素含量快速檢測[J]. 農(nóng)業(yè)機械學報, 2012, 43(5): 152-156.
[9] 劉秀英, 王力, 宋榮杰, 等. 黃綿土風干過程中土壤含水率的光譜預測[J]. 農(nóng)業(yè)機械學報, 2015, 46(4): 266-272.
[10] 李栓民, 郭銀巧, 王克如, 等. 小麥籽粒蛋白質光譜特征變量篩選方法研究[J]. 中國農(nóng)業(yè)科學, 2015, 48(12): 2 317-2 326.
Forecasting method of Fumonisin in corn using near infrared spectra technique
ZHANG LinDANGNanYANGLinLIYa-wenYUANXun-feng
(SchoolofElectronicInformationandElectricalEngineering,ShangLuoUniversity,Shangluo,Shaanxi726000,China)
In order to forecast the content of fumonisin in corn using the infrared spectrum analysis technology, and reduce the differences caused by their yield region, the influence of experiment using 4 different origin of domestic corn were investigated. The method of usingx-yco-occurrencedistancecouldbedividedintocalibrationsampleandvalidationsets,usingtheclassicalanddifferentregionsbasedonthepartialleastsquares,andthenthepredictionmodeloffumonisinmaizehybridorigin,andUSESthevalidationsetsamplestovalidatethepredictionprecision,respectively.Inordertoreducethecomputationalcomplexityofmodelingandforecastingprocess,experimentsusingcontinuousprojectionalgorithm(SPA)andcompetitiveadaptiveweightingalgorithm(CARS)thecharacteristicsoftheinfraredspectraofdifferentorigincornwavelengthfilter,and22characteristicswerefilteredout.Thenthese22wavelengthswereinputasvariables,andthisgreatlyreducedthecomputationalcomplexityofmodelingandforecastingprocess,aswellasimprovedthepredictionaccuracy,withthecorrelationcoefficientat0.954.
Corn; Fumonisins; NIR; Predict
商洛學院科學研究項目(編號:16SKY-FWDF005);商洛市科學技術研究發(fā)展計劃項目(編號:SK2016-52)
張林(1986—),男,商洛學院講師,碩士。 E-mail:759013520@qq.com
2016—10—10
10.13652/j.issn.1003-5788.2017.02.012