張 樂 吳靜珠 李江波 劉翠玲 孫曉榮 余 樂
(北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京重點實驗室1,北京 100048) (北京農(nóng)業(yè)智能裝備技術(shù)研究中心2,北京 100097)
玉米是目前我國種植面積最廣、產(chǎn)量第一的農(nóng)作物。隨著玉米機(jī)械化單粒精量播種技術(shù)的引入,我國玉米種植模式發(fā)生了深刻的改變[1]。單粒精量播種技術(shù)較傳統(tǒng)播種模式更有利于機(jī)械化操作,省工、省種、高產(chǎn),但是對每顆種子都提出了更高的檢測需求。根據(jù)GB 4404.1—2008[2],水分是我國農(nóng)作物種子質(zhì)量四大必檢項目之一。因此單粒玉米種子水分的快速、高通量、無損檢測對于單粒精量播種具有重要的現(xiàn)實意義。
GB/T 3543.6—1995《農(nóng)作物種子檢驗規(guī)程 水分測定》中顯示,種子水分測量方法有低恒溫烘干法、高溫烘干法、高水分預(yù)先烘干法[3],這些方法測試精度高但普遍存在試樣破壞性、耗時長、無法單顆測定等問題。近紅外光譜(Near Infrared Spectrometry,NIR)技術(shù)以其快速、無損、綠色分析特點在種子質(zhì)量檢測領(lǐng)域迅速發(fā)展[4,5]。我國在2010年發(fā)布了玉米水分含量近紅外法測定的國家標(biāo)準(zhǔn)用于玉米水分測定[6]。沈廣輝等[7]將近紅外光譜技術(shù)與偏最小二乘法結(jié)合建立了玉米籽粒中水分、粗蛋白、粗灰分和總能的定量分析模型,其中水分檢測模型的預(yù)測集相關(guān)系數(shù)和均方根誤差分別為0.76,2.41。肖青青[8]將近紅外技術(shù)與等間隔組合偏最小二乘法結(jié)合建立了玉米粉的水分、粗脂肪的高性噪比近紅外波長模型,其中水分檢測模型的預(yù)測集的相關(guān)系數(shù)和均方根誤差分別為0.943和0.278。國標(biāo)制定和文獻(xiàn)表明近紅外光譜技術(shù)在玉米水分檢測領(lǐng)域具有實際應(yīng)用可行性,但已有研究的檢測對象大都為經(jīng)過粉碎的玉米或是多粒玉米,難以滿足玉米精量播種技術(shù)對單粒種子水分的檢測需求。
本研究重點探索將近紅外光譜與化學(xué)計量學(xué)方法相結(jié)合,建立性能優(yōu)秀的單粒玉米種子水分快速、無損檢測定量檢測模型,以期為玉米精量播種技術(shù)的推廣和發(fā)展探索可行的檢測手段。
55組玉米樣本品種包括中地77、沈玉29、中地168、強(qiáng)碩68、奔誠15和春育8。從每組樣本中分別選取2個玉米籽粒,共計110份玉米樣本。首先采用單籽粒采樣附件掃描近紅外光譜后, 再使用HB43-S鹵素水分測定儀測定每組樣本水分。
表1為110份玉米樣本的含水量統(tǒng)計信息。按照3∶1的比例隨機(jī)劃分訓(xùn)練集和測試集,其中訓(xùn)練集樣本82份,測試集樣本28份。
表1 樣本集統(tǒng)計信息
采用VERTEX 70傅里葉變換紅外光譜儀[9]及單籽粒采樣附件采集單粒玉米種子光譜,如圖1所示。為減少裝樣引起的干擾,放置樣本時統(tǒng)一將樣本胚面朝下,樣本朝向一致。儀器參數(shù)設(shè)定:波數(shù)范圍為4 000 ~ 12 500 cm-1,分辨率為8 cm-1,掃描次數(shù)為64次。樣本近紅外光譜如圖2所示。不同顆粒的玉米種子表面平整度不一且種子形態(tài)、種皮性質(zhì)均存在明顯差異,導(dǎo)致光譜采集過程中光反射、散射影響程度不同,從圖2中也可以看出,樣本集近紅外光譜在整個譜區(qū)范圍內(nèi)離散度較大。但是所有樣品的光譜趨勢基本一致,玉米近紅外光譜在波數(shù)為8 400、7 000、5 000 cm-1處有3個明顯的特征峰。 其中8 400、7 000 cm-1處的特征峰為 O—H 鍵二級振動,5 000 cm-1處的特征峰為 O—H 鍵一級振動,均與玉米中水分含量有關(guān)。
圖1 單粒玉米種子測樣
圖2 樣本集近紅外原始光譜
為了降低由種子形態(tài)等引起的光譜噪聲干擾,選擇采用合適的光譜預(yù)處理方法提升光譜質(zhì)量。本實驗采用OPUS 7.2軟件,分析比較了一階導(dǎo)、二階導(dǎo)、歸一化、消除常數(shù)偏移量、以及多元散射校正結(jié)合光譜波段自動譜區(qū)搜索組合所建立的模型性能,如下表2所示。
表2 基于不同光譜預(yù)處理組合的PLS模型性能比較
由表2可以看出,求導(dǎo)并不適用于單粒玉米種子光譜數(shù)據(jù)預(yù)處理,單粒種子光譜本身含有的噪聲較大,求導(dǎo)更加劇了噪聲的引入,因此大大降低了模型的準(zhǔn)確性;多元散射校正可以有效消除近紅外漫反射光譜中由于樣品的鏡面反射及不均勻造成的噪聲[10],消除光譜的基線漂移現(xiàn)象及光譜的不重復(fù)性,因此基于多元散射校正相對其他預(yù)處理方法而言,建立的單粒種子水分模型性能較好,其訓(xùn)練集的相關(guān)系數(shù)為0.81,留一交互驗證均方根誤差(Root Mean Square Error of Cross Validation,RMSECV)為0.75;測試集的相關(guān)系數(shù)為0.93,預(yù)測均方根誤差(Root Mean Square Error of Prediction,RMSEP)為0.86。實驗結(jié)果表明基于PLS的單粒種子水分模型性能一般。
本實驗基于PLS的多元線性校正建模方法建模效果不是十分理想,分析其原因可能是由于單粒玉米種子光譜采集時引入的非線性干擾導(dǎo)致的,因此本實驗探索采用在小樣本、非線性建模領(lǐng)域極具代表性的建模方法[11]——支持向量機(jī)(support vector machine, SVM)建立單粒種子水分近紅外模型。
在Matlab2016中使用Libsvm3.1軟件包,將原始光譜數(shù)據(jù)經(jīng)過多元散射校正預(yù)處理后再進(jìn)行訓(xùn)練和測試。支持向量機(jī)中常見的核函數(shù)有線性、多項式、RBF和Sigmoid核函數(shù)4種形式。為選擇合適的核函數(shù), 分別采用4種核函數(shù)建立SVM模型。運行結(jié)果如表3所示。通常情況下,相較于其他核函數(shù),RBF核函數(shù)更適用于特征維數(shù)少、樣本數(shù)量正常、沒有先驗知識的情況,RBF核函數(shù)的參數(shù)決定了它對于數(shù)據(jù)中的噪聲有著較好的抗干擾能力[12]。從表3可以得出基于RBF核函數(shù)建立的模型訓(xùn)練集和測試集的準(zhǔn)確性更高。實驗采用網(wǎng)格搜索法確認(rèn)了RBF的核參數(shù),懲罰因子 C為1.174 1,核函數(shù)參數(shù)g為0.062 5。最終建立模型的訓(xùn)練集相關(guān)系數(shù)達(dá)到0.99,預(yù)測均方根誤差為0.05;測試集相關(guān)系數(shù)達(dá)到0.96,預(yù)測均方根誤差為0.71。相較于PLS模型而言,基于SVM的種子水分非線性檢測模型性能更優(yōu)。
表3 基于四種核函數(shù)的SVM模型性能比較
本研究采用多種光譜預(yù)處理方法消除單粒種子采集光譜時由于顆粒形態(tài)等引起的噪聲干擾,比較建立了基于PLS線性模型和SVM非線性模型的單粒玉米種子水分近紅外檢測模型。實驗結(jié)果表明,光譜預(yù)處理結(jié)合SVM非線性模型可以有效降低單粒玉米種子近紅外光譜采集時引入的非線性干擾,有助于提升單粒玉米種子水分近紅外快速無損檢測實際應(yīng)用可行性,有望為玉米精量播種技術(shù)的推廣和發(fā)展提供可行的檢測手段。