張 伏, 崔夏華, 丁 軻, 張亞坤, 王永縣, 潘孝青
1. 河南科技大學農業(yè)裝備工程學院, 河南 洛陽 471003
2. 江蘇大學現(xiàn)代農業(yè)裝備與技術教育部重點實驗室, 江蘇 鎮(zhèn)江 212013
3. 機械裝備先進制造河南省協(xié)同創(chuàng)新中心, 河南 洛陽 471003
4. 河南科技大學動物科技學院, 河南 洛陽 471023
5. 江蘇省農業(yè)科學院畜牧研究所, 江蘇 南京 210014
雞蛋是營養(yǎng)豐富、 優(yōu)質的動物蛋白質來源, 受到豬瘟的影響, 雞蛋作為動物性蛋白的需求大幅增加, 蛋雞養(yǎng)殖行業(yè)也在逐步發(fā)展與壯大以滿足人們的需求。 如何在幼雛階段甚至胚胎發(fā)育階段能夠簡單、 準確與方便地判斷出雌雄, 對蛋雞養(yǎng)殖行業(yè)的發(fā)展具有重要意義[1]。 目前, 常用的幼雛雌雄判別方法多采用通過相關儀器肉眼識別或性狀體現(xiàn)進行, 機械法判別雛雞形狀已經成熟。 上述研究方法為雛雞和雞胚胎雌雄判別提供了理論基礎與方法依據(jù)。 但在孵化過程中, 種蛋無損、 快速鑒定性別的方法依然有待發(fā)展。
20世紀80年代后期迅速發(fā)展起來的近紅外光譜分析技術以其分析速度快、 操作簡單、 檢測準確率高等優(yōu)點已被廣泛應用于水果、 農作物[2]、 藥物[3-4]、 茶葉[5]等檢測。 受采集環(huán)境和樣本的影響, 采集到的光譜數(shù)據(jù)包含了各種各樣的外界噪聲, 包括基線漂移、 樣本不均勻和光散射等。 因此, 對所獲數(shù)據(jù)進行適當預處理以消除噪聲污染對后期模型分析尤為重要。 潘慶磊等[6]搭建高光譜圖像采集系統(tǒng)研究孵化0~12 d的種蛋胚胎圓頭、 中間、 尖頭3個部位的感興趣區(qū)域, 對原始數(shù)據(jù)搭建模型進行分析比較; 祝志慧等[7]以紫外-可見光波段為有效波段研究雞胚雌雄鑒別, 其采用多元散射校正對數(shù)據(jù)進行預處理后, 篩選特征波段建立模型; 劉燕德等[8]采用近紅外漫反射研究雞蛋品質, 采用多元散射校正、 最大-最小歸一化、 一階和二階導數(shù)、 基線校正、 一階導數(shù)+基線校正, 消除常數(shù)偏移量等預處理方法, 發(fā)現(xiàn)一階導數(shù)+基線校正的預處理方法較好。
本文在深入研究近紅外光譜預處理的基礎上, 以種雞蛋為研究對象, 為找到適合種雞蛋性別鑒定的預處理方法, 比較了多種預處理方法對偏最小二乘判別和線性判別模型的影響。
實驗樣本為96個殼色相近、 表面無裂紋的新鮮種雞蛋, 對蛋殼表面清理, 采用新潔爾滅溶液消毒后將樣本標號, 且分別將雞蛋的鈍端、 銳端和赤道[見圖1(a,b)]位置標記為1, 2和3, 如圖1所示。 采集胚胎發(fā)育過程中的種蛋表面漫反射光譜, 樣本采集后集中放置在溫度為37.8 ℃、 濕度為60%的孵化機中, 且孵化機的溫度和濕度根據(jù)變溫孵化法調節(jié)。 待孵化完成后, 對雛雞翻肛鑒定性別[見圖2(a,b)], 對無法準確鑒定結果的雛雞進行解剖檢測, 通過雄性睪丸和雌性卵巢的形態(tài)變化進行區(qū)分, 如圖2(a)公雞性腺, (b)母雞性腺。
圖1 種雞蛋測量位置圖
圖2 雛雞性腺圖
實驗用可見/近紅外光譜檢測系統(tǒng)如圖3所示, 系統(tǒng)主要包括一臺光源(150 W鹵素燈)、 波長范圍為345~1 041 nm的USB 4000光纖光譜儀(Ocean Optics)、 裝有與光譜儀配套采集軟件Spectrasuite的計算機和一根Y型光纖。 采用便攜式光源, 其入射光強度可調, 計算機與光譜儀間通過USB數(shù)據(jù)線連接。 所使用的孵化機型號為WQ-192(德州市通達孵化設備制造廠, 山東德州)。
圖3 可見/近紅外光譜檢測系統(tǒng)
使用檢測系統(tǒng)采集345~1 041 nm波長范圍的種蛋樣品表殼所標記的3個不同位置的漫反射光譜。 采集數(shù)據(jù)過程在黑暗環(huán)境下進行, 采集時將光纖探頭在不損壞樣本的前提下緊貼樣本表面以避免除入射光外其他光源的影響。 采集數(shù)據(jù)前先將設備預熱30 min, 采集軟件Spectrasuite的積分時間設置為4 ms, 采集樣本數(shù)據(jù)前, 將探頭緊貼校準白板, 調節(jié)光源使最大反射率為最大量程的80%, 采集參考光譜, 而后采集暗光譜。 為消除暗電流的影響, 需進行光譜校正, 樣本反射率的計算公式為
(1)
式(1)中,R為所測樣本反射率;I為樣本的反射光譜強度;IC為參考光譜的反射光譜強度;IA為暗光譜的反射光譜強度; (I,IC,IA均無單位)。
從放入孵化機時開始, 每隔24 h采集一次光譜數(shù)據(jù), 采集時待光譜曲線穩(wěn)定后保存所測數(shù)據(jù)。 經光譜校正后, 對數(shù)據(jù)進行預處理, 減弱數(shù)據(jù)中無關信息變量對光譜的影響, 提高模型的穩(wěn)健性和預測能力[9]。 對胚胎發(fā)育216, 240, 264, 288和312 h的數(shù)據(jù)進行分析, 主要是因為發(fā)育216 h后, 胚胎各種器官已包入體腔。
對96個種蛋進行觀察統(tǒng)計發(fā)現(xiàn), 共有46個為雄性蛋, 50個母雞蛋。 分析時按照2∶1的比例劃分訓練集和測試集, 本實驗將雄性種蛋的類別變量設為1, 雌性種蛋的類別變量設為-1。
表1 樣本劃分結果
雄性種蛋和雌性種蛋的平均原始光譜曲線如圖4所示。 由于光譜兩端的噪聲大, 信噪比低且信息少, 故選取440.27~874.6 nm中間區(qū)域內的光譜曲線進行分析。
圖4 樣本平均原始光譜圖
采用偏最小二乘法判別PLS-DA和線性判別分析LDA模型, 使用訓練集建模, 預測集進行預測, 得出預測集判別準確率, 求取相應的準確率變化, 216, 240, 264, 288和312 h預測集準確率數(shù)據(jù)見表2—表6。
表2 216 h不同位置、 不同預處理方法的預測集判別準確率變化
表3 240 h不同位置、 不同預處理方法的預測集判別準確率變化
表4 264 h不同位置、 不同預處理方法的預測集判別準確率變化
表5 288 h不同位置、 不同預處理方法的預測集判別準確率變化
表6 312 h不同位置、 不同預處理方法的預測集判別準確率變化
216~312 h內的準確率變化情況如圖5所示, 圖中黃色柱形表示PLS-DA模型的準確率變化, 紅色柱形表示LDA模型的準確率變化, 短斜線分別表示無法預測胚胎發(fā)育216,264和312 h所采數(shù)據(jù)經Spectroscopic預處理后所建模型的判別準確率。 由圖5知, 胚胎發(fā)育288 h時, 預處理可提高35個模型的準確率, 降低1個模型的準確率; 264 h的處理效果在分析時間內最差, 降低19個模型的判別準確率; 312 h的處理效果次之, 預處理降低12個模型的判別準確率。
Normalize是對數(shù)據(jù)進行歸一化處理, 將其限制在一定范圍內, 由圖5可見其對模型判別準確率影響不確定。 SNV和MSC均是消除漫反射數(shù)據(jù)采集過程中光譜差異的方法, 本研究中分析比較不同時間的SNV和MSC預處理, 發(fā)現(xiàn)除胚胎發(fā)育264 h時位置2處的PLS-DA模型外, 兩者對模型判別的準確率的影響相同, 由于存在實驗誤差, 可認為SNV和MSC預處理對不同時間、 不同位置的模型有相同作用。 導數(shù)法雖可有效消除基線和其他背景的干擾, 但其引入噪聲, 降低信噪比。 本研究中采用二階導數(shù)法對數(shù)據(jù)進行探索, 發(fā)現(xiàn)其可能對模型無作用效果, 判別準確率與原始數(shù)據(jù)相比沒有明顯差異。 比較胚胎發(fā)育288 h時的預處理影響, 發(fā)現(xiàn)Detrend和Spectroscopic兩種預處理方法可顯著提高判別效果, 其中Detrend是一種去趨勢的方法, 可消除獲取數(shù)據(jù)時產生偏移的影響, 而Spectroscopic是將反射率單位轉換為吸光度的一種方法, 對比兩種預處理方法在不同位置的處理效果可知, 其對位置2即鈍端處的效果更優(yōu)。 但經Spectroscopic預處理后可能無法獲取模型的預測集預測準確率, 所以Detrend是一種較優(yōu)的預處理方法。 由表5見, 此時PLS-DA模型的變化判別準確率為34.37%, LDA模型的變化判別準確率為43.75%, 故利用LDA模型對種蛋性別鑒定易獲得較佳的判別效果。
圖5 216~312 h內的準確率變化
綜上, 對胚胎發(fā)育288 h的數(shù)據(jù)進行預處理可提高模型的判別準確率, 其中采集位置2即種蛋鈍端處數(shù)據(jù)后, 進行Detrend去趨勢預處理, 利用LDA模型分析種蛋性別效果較好。
(1)研究了基于可見/近紅外光譜的受精蛋的性別判別位置和判別時間, 通過對光譜數(shù)據(jù)的截取, 最終確定440.27~874.6 nm波段的光譜為有效光譜, 通過對該段光譜的研究分析可以對種雞蛋進行有效研究。
(2)研究了不同時間、 不同預處理兩種模型的預測集準確率變化, 發(fā)現(xiàn)胚胎發(fā)育288 h時, 預處理可有效提高35個模型的準確率; 264 h的處理降低了19個模型的判別準確率; 312 h的預處理降低了12個模型的判別準確率。 288 h時的預處理效果較好, 264 h時的預處理效果分析時間內最差。
(3)研究了不同預處理方式間的差別及其對所建模型的預測效果影響。 發(fā)現(xiàn)Normalize對模型判別準確率影響不確定; SNV和MSC預處理對不同時間、 不同位置的模型有相同作用效果; 二階導數(shù)法可能對模型無作用效果, 判別準確率與原始數(shù)據(jù)相比沒有發(fā)生變化; Detrend和Spectroscopic兩種預處理方法可顯著提高判別效果, 且對位置2即鈍端處的效果更優(yōu), 但經Spectroscopic預處理后可能無法獲取模型的預測集準確率, 所以Detrend是一種較優(yōu)的預處理方法。
(4)比較了種蛋孵化288 h時, 位置2即鈍端處的模型預測效果。 此時, PLS-DA模型的變化判別準確率為34.37%, LDA模型的變化判別準確率為43.75%, LDA模型比PLS-DA模型的變化判別準確率高9.38%, 故利用LDA模型對種蛋性別鑒定易獲得較佳的判別效果。
由于近紅外光譜分析技術具有快速、 對樣本無損等特點, 該研究對近紅外光譜技術在孵化中期的性別鑒定時的數(shù)據(jù)采集位置和數(shù)據(jù)預處理方法進行了比較, 提供了一種新的思路。