吳靜珠, 李曉琪, 劉翠玲, 余 樂, 孫曉榮, 孫麗娟
1. 北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點實驗室, 北京 100048 2. 中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所, 北京 100081
種子活力是表征種子品質(zhì)的重要指標[1]。 高活力種子具備顯著的生長優(yōu)勢和高產(chǎn)潛力, 是現(xiàn)代化農(nóng)業(yè)高效高產(chǎn)的首要條件。 在歐美等國, 種子活力已成為檢驗種子質(zhì)量的常規(guī)檢測項[2]。 我國現(xiàn)行的農(nóng)作物種子質(zhì)量標準(GB4404.1—2008)尚未將種子活力納入標準, 更無相關(guān)的活力檢測國標。 加速老化測定和電導(dǎo)率測定[3-4]是國際種子檢驗協(xié)會與北美官方種子分析家協(xié)會推薦的兩種最具代表性和最為常用的種子活力測定方法, 上述檢測方法均存在耗時性、 試樣破壞性等弊端, 無法滿足種子商業(yè)流通、 育種、 單粒播種等領(lǐng)域提出的快速、 無損、 單粒檢測的新需求, 因此探索和研究適應(yīng)現(xiàn)代種子產(chǎn)業(yè)高速發(fā)展的種子活力測定新方法和新技術(shù)已成為種子質(zhì)量檢測領(lǐng)域的熱點和趨勢。
近年來, 作為重要交叉前沿領(lǐng)域的太赫茲(Terahertz, THz)技術(shù)以其特有的波譜分辨能力、 透視性和低能性等技術(shù)優(yōu)勢在農(nóng)業(yè)領(lǐng)域嶄露頭角[5-6], 極有潛力成為紅外光譜技術(shù)和X射線技術(shù)的有力補充。 尤其是THz時域光譜(Terahertz-time domain spectroscopy, THz-TDS)與成像技術(shù)結(jié)合可獲取信息極為豐富的三維時空數(shù)據(jù)集, 不但能用于物體的形態(tài)辨別, 而且還能夠?qū)崿F(xiàn)對物體的物理、 化學(xué)性質(zhì)分析和物體組成成分的鑒別。 Liu等[7]從水稻種子的THz時域光譜圖像中提取THz光譜信息, 分別采用最小二乘支持向量機, 主成分分析-后向反饋神經(jīng)網(wǎng)絡(luò), 隨機森林等方法建立轉(zhuǎn)基因水稻種子判別模型, 其中最優(yōu)模型的識別準確率可達96.67%。 有研究利用THz-TDS結(jié)合圖像處理、 化學(xué)計量學(xué)和信息融合技術(shù)對儲存小麥的芽變、 霉變、 異物進行無損探測, 研究表明該技術(shù)是一種潛在的儲糧品質(zhì)無損精準檢測手段。 綜上研究可以發(fā)現(xiàn)THz-TDS光譜成像技術(shù)以其無損探測、 信息豐富以及安全性等技術(shù)優(yōu)勢在種子質(zhì)量檢測領(lǐng)域成為新興研究熱點, 但是目前研究尚在起步階段, 尤其是THz技術(shù)在種子活力方面的應(yīng)用研究尚有待探索。
玉米是糧食、 飼料和工業(yè)原料兼用農(nóng)作物, 現(xiàn)已成為我國第一大農(nóng)作物, 在《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020年)》中被列為重點領(lǐng)域和優(yōu)先主題。 因此以玉米種子為研究對象, 重點探索采用THz-TDS反射成像技術(shù)結(jié)合化學(xué)計量學(xué)方法無損檢測種子活力水平的可行性, 以期為進一步采用太赫茲時域光譜技術(shù)快速無損檢測種子活力水平提供理論基礎(chǔ)和技術(shù)支撐。
實驗選取中地77品種的玉米種子為樣本。 采用種子老化箱, 在溫度為40 ℃、 100%相對濕度條件下將種子樣本分批老化0, 1, 2, 3和4 d。 按照國家標準(GB/T3543.4—1995)采用ZLC-250智能種子發(fā)芽箱進行發(fā)芽試驗, 每組樣本進行4次重復(fù)實驗, 取其平均值作為該樣本的最終發(fā)芽率。 不同老化程度種子發(fā)芽率如表1所示。 從表1可以得出隨著老化天數(shù)增加, 發(fā)芽率不斷下降, 表明種子活力隨之不斷下降, 因此不同的老化天數(shù)對應(yīng)了不同的活力等級。
表1 不同老化程度種子的發(fā)芽率
采用英國Teraview公司的TeraPulse 4000太赫茲時域光譜儀以及反射成像附件, 采集上述老化天數(shù)為0, 1, 2, 3和4 d的玉米種子樣本的光譜反射成像數(shù)據(jù)。 光譜儀參數(shù)設(shè)定: 成像區(qū)域為40 mm×40 mm, 橫/縱向步長為200 nm。 圖1所示為玉米種子反射成像采集實驗。
1.3.1 廣義二維相關(guān)光譜技術(shù)
廣義二維相關(guān)光譜技術(shù)[8]主要用于探究在外界微擾(時間、 溫度、 濃度)作用下, 樣本光譜信號強度的動態(tài)變化。 通過觀察動態(tài)光譜的吸收峰的位置、 強度的變化以及方向的一致性和互異性來分析樣品的相關(guān)理化信息。 本實驗以老化時間即老化天數(shù)為擾動量, 采用廣義二維相關(guān)光譜技術(shù)初步解析與種子活力相關(guān)的THz敏感譜區(qū)。
圖1 玉米種子THz光譜反射成像實驗
1.3.2 支持向量機
支持向量機算法[9-10]與多層感知網(wǎng)絡(luò)器類似, 基于統(tǒng)計學(xué)理論, 有很好的泛化能力, 被廣泛應(yīng)用于模式識別和回歸分析。 該算法適合于小樣本, 維度高且非線性的樣本分類問題。 本實驗采用臺灣大學(xué)林智仁教授等開發(fā)的LIBSVM工具包, 在MATLAB2014a環(huán)境下運行, 探索建立判別種子活力等級的分析模型。
玉米種子胚乳和種胚所含成分存在顯著差異, 為探究種子不同組織在老化過程中與活力的相關(guān)性, 實驗首先通過太赫茲光譜圖像預(yù)處理無損提取玉米種子不同組織太赫茲吸光度譜。
為準確提取光譜信息, 實驗首先針對任一像素點光譜采用雙高斯濾波消噪法去除系統(tǒng)和環(huán)境噪聲; 然后采用峰峰值差分重構(gòu)對樣本圖像進行重構(gòu)增強, 以獲取表征不同組織區(qū)域的清晰輪廓(其中胚乳15.5~17 ps, 胚19~23 ps); 最后采用最大值法及迭代法分別進行圖像灰度化和閾值分割提取胚乳和種胚的位置信息。 具體處理流程如圖2和圖3所示。
圖2 胚乳重構(gòu)、 灰度化及閾值分割處理
從圖2和圖3中可以看出經(jīng)過預(yù)處理后圖像輪廓信息更為明顯。 根據(jù)上述預(yù)處理得到的胚乳和種胚的目標區(qū)域可以提取出各像素點THz光譜, 計算其平均值得到胚乳和種胚的平均光譜。 圖4所示即為經(jīng)過上述提取步驟得到老化1 d后的種子樣本的種胚和胚乳平均光譜, 從圖中可以看出吸光度譜在<10 cm-1以及>65 cm-1處存在較為明顯的差異。
圖3 種胚重構(gòu)、 灰度化及閾值分割處理
圖4 老化1 d胚乳和種胚THz平均光譜
種子活力水平與其老化程度密切相關(guān), 老化時間越長, 發(fā)芽率越低, 種子活力也隨之明顯下降。 實驗以老化天數(shù)為擾動量, 采用廣義二維相關(guān)法探索種胚和胚乳中與種子活力相關(guān)的特征太赫茲波段。
采用2Dshige軟件(Shigeaki Morita, Kwansei-Gakuin University, 2004—2005)針對2.1中提取的不同老化天數(shù)(0, 1, 2, 3, 4 d)的胚乳和種胚吸光度譜(0~77 cm-1)進行二維相關(guān)分析。 圖5所示為5個老化天數(shù)下種子胚乳吸光度譜的二維同步相關(guān)譜及二維異步相關(guān)譜(紅色代表正相關(guān), 藍色代表負相關(guān), 顏色深淺代表相關(guān)程度大小)
圖5 胚乳廣義二維相關(guān)光譜圖
圖5(a)中同步譜對角線上的自相關(guān)峰(V1,V2)出現(xiàn)在(75和75 cm-1)和(36和36 cm-1)(綠色圓圈標注), 自動峰的強度為正值, 說明兩個波段在外界微擾(即老化天數(shù))的作用下引起的變化程度較大, 因此該波段屬于種子活力THz敏感譜段; (75和75 cm-1)處較(36和36 cm-1)處顏色更深, 表明75 cm-1處較36 cm-1處與種子活力的相關(guān)性更強。 非對角線處的交叉峰出現(xiàn)在(36和75 cm-1)和(75和36 cm-1)(橘色圓圈標注), 且為正值, 表明樣本光譜在36與75 cm-1處存在強烈協(xié)同作用且變化方向一致。
圖5(b)異步譜中位于(36和75 cm-1)的交叉峰(紫色圓圈標注)處為負值, 而同步譜中(36和75 cm-1)處為正值, 表明36 cm-1信號強度變化小于75 cm-1; 異步譜中(75和36 cm-1)的交叉峰與同步譜中該位置處均為正值, 再次表明外界微擾作用下在75 cm-1處信號強度變化大于36 cm-1處。
類似地, 通過5個批次老化天數(shù)下的種胚廣義二維相關(guān)光譜分析同樣可得75 cm-1, 36 cm-1處為與種子活力相關(guān)的THz敏感譜區(qū)。
綜上以老化天數(shù)為擾動量解析種子THz吸收譜可得, 無論是胚乳還是種胚, 與種子活力明顯相關(guān)的太赫茲波段主要集中在75和36 cm-1附近, 這兩個波長處吸光度存在強烈協(xié)同變化且變化方向一致, 75 cm-1處信號強度變化大于36 cm-1處。 36 cm-1附近是典型的THz水峰特征吸收, 實驗結(jié)果表明種子活力受水分影響明顯, 但是水分源于種子內(nèi)部水分還是環(huán)境水分的干擾還有待研究; 75 cm-1處THz光譜信息對應(yīng)的作用機理還有待進一步解析。
種子老化天數(shù)和種子活力密切相關(guān)。 根據(jù)發(fā)芽率數(shù)據(jù), 老化天數(shù)0, 1, 2, 3和4 d對應(yīng)了種子五個活力等級, 因此本實驗探索采用支持向量機建立判別種子活力等級的五分類模型。 由于玉米種子胚乳和種胚成分及相應(yīng)THz譜差異顯著, 為精細化研究種子不同組織與種子活力的相關(guān)性, 分別基于種胚和胚乳THz譜建立種子活力分析模型。
實驗以5個老化批次的種子樣本THz反射圖像中種胚和胚乳區(qū)域的像素點為原始樣本集(胚乳樣本數(shù)6 004; 種胚樣本數(shù)798), 按照5∶1的比例隨機劃分訓(xùn)練集和測試集, 輸入樣本均歸一化處理。 支持向量機選用RBF為核函數(shù), 采用網(wǎng)格搜索法對懲罰參數(shù)c和核參數(shù)g進行參數(shù)尋優(yōu), 采用5折交叉驗證進行SVM網(wǎng)絡(luò)訓(xùn)練。 根據(jù)表2中的實驗結(jié)果可以得出, 基于胚乳的判別模型識別準確率僅為59.34%, 基于種胚的模型識別準確也僅有72.18%, 兩者活力判別模型都無法精細劃分五個類別的活力等級。 分析其原因, 可能是活力等級劃分過細導(dǎo)致。
表2 不同老化程度識別模型參數(shù)及結(jié)果
因此實驗嘗試減少活力等級分類數(shù)再進行建模分析。 根據(jù)農(nóng)作物種子質(zhì)量標準(GB4401.1—2008), 實驗以玉米種子發(fā)芽率85%為閾值建立種子高低活力的二分類模型。 按照上述類似步驟訓(xùn)練種子活力判別模型, 結(jié)果如表3所示, 不管是基于種胚還是胚乳建立的判別種子高低活力的二分類模型識別率均有了顯著提升。 就本實驗的結(jié)果而言, 基于種胚光譜信息建立的模型識別準確率高于胚乳模型。
表3 種子活力水平判別模型參數(shù)及測試結(jié)果
采用THz-TDS反射成像技術(shù)結(jié)合廣義二維相關(guān)光譜分析方法初步解析得到與玉米種子活力相關(guān)的敏感太赫茲波段主要集中在36和75 cm-1區(qū)域, 但是36和75 cm-1處THz光譜信息對應(yīng)的作用機理還有待解析。 實驗分別基于胚乳和種胚的THz吸光度譜建立了五分類和二分類活力判別模型, 其中五分類模型由于活力等級劃分過細導(dǎo)致預(yù)測效果較差, 二分類模型中胚乳模型識別率可達88.61%, 種胚模型識別率可達91.73%, 模型性能得到顯著改善。 實驗結(jié)果表明THz-TDS反射成像技術(shù)以其豐富的指紋譜、 低能安全和圖譜合一的特性, 結(jié)合機器學(xué)習方法在單粒種子活力快速、 無損、 粗篩領(lǐng)域有著光明的應(yīng)用前景。