国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BP神經(jīng)網(wǎng)絡的粳稻種子拉曼光譜鑒別方法研究

2023-12-18 05:25:48祝子涵田芳明高嘉欣
中國糧油學報 2023年10期
關鍵詞:粳稻波段預處理

祝子涵, 譚 峰, 田芳明,2, 高嘉欣, 白 楠

(黑龍江八一農(nóng)墾大學信息與電氣工程學院1,大慶 163319)

(農(nóng)業(yè)部農(nóng)產(chǎn)加工品質量監(jiān)督檢驗測試中心2,大慶 163316)

水稻是人類最重要的糧食作物之一。因不同稻區(qū)的天氣溫度、天氣濕度、降雨量、土壤成分、日照程度等自然生態(tài)環(huán)境因素有著明顯差異,為使水稻種植地區(qū)的水稻產(chǎn)量最大化,將合適的水稻品種種植到對應的水稻種植區(qū)域顯得尤為重要[1]。但因種子市場不規(guī)范操作,由種子品種選購錯選問題產(chǎn)生的種子發(fā)芽率低、產(chǎn)量低等一系列糾紛時常發(fā)生。因此,針對不同水稻種植區(qū)域的水稻種子品種快速鑒定識別對現(xiàn)在的農(nóng)業(yè)生產(chǎn)具有重要實際意義。

目前國內(nèi)外水稻種子鑒別的方法主要包括形態(tài)學方法、田間種植法、化學鑒定法、電泳法、分子標記法、電子鼻法和理化檢測法等[2,3],形態(tài)學方法效率低速度慢且較為主觀。田間種植鑒定法鑒別精度不高、周期長且受環(huán)境影響過大,耗費大量人力物力?;瘜W鑒定法雖然鑒別精度高,但耗時過多,對樣品有損傷,需要專門的操作人員。電泳法中蛋白質電泳法較為常見,圖譜對水稻品種的鑒別因基因的表達有時受發(fā)育階段的環(huán)境因素的影響,某些品種因基因組相近無法找到特異性蛋白而影響判別正確率。分子標記法中常用SSR分子標記法,其方法雖然測量水稻品種較為可靠,但操作難度較高且對操作人員水平要求較高,無法大規(guī)模作業(yè)。電子鼻法主要通過辨別氣味來實現(xiàn)品種鑒別,受環(huán)境因素影響過大,識別率不高,存在明顯的弊端。而理化檢測法中的光譜測定法依靠其無損、快速、便捷、客觀、準確、高效、操作簡單、不受環(huán)境影響等優(yōu)勢,迅速在品種鑒別方面得到廣泛發(fā)展。因此,探究基于快速檢測的種子品種鑒別方法對于深化該領域的研究具有重要的理論意義。

拉曼光譜分析技術是以光學質譜方法為基礎,在待測樣品的屬性值和拉曼光譜數(shù)據(jù)之間建立分類或回歸模型。由于拉曼光譜技術具有速度快、測量方便、成本低、無破壞等優(yōu)點,已經(jīng)被廣泛應用于農(nóng)業(yè)[4]、食品[5]、石化[6]、醫(yī)藥[7]等各個方面。

目前,基于拉曼光譜技術的水稻品種鑒別主要是以國內(nèi)水稻的粗分類、少品種、小范圍進行分類鑒別。沙敏等[8]對粳稻、秈稻和糯稻進行粗分類區(qū)分,雖然取得良好鑒別效果,但分類過于簡單,需對具體水稻品種間的鑒別進行進一步研究。孫娟等[9]采用拉曼光譜技術結合化學計量法雖然能更精準實現(xiàn)對水稻品種間的鑒別,但是鑒別水稻品種較少僅為4種,需對多品種水稻種子鑒別進一步探究。朱培培等[10]采用拉曼光譜技術可以快速、準確、便捷、高效的針對粳稻種子多品種鑒別,但是鑒別地域僅為寒地水稻,地域較為狹小單一,需對地域分布更為廣泛的粳稻種子鑒別進行進一步研究。因此,實驗提出基于拉曼光譜技術針對多地區(qū)多品種粳稻種子的鑒別方法研究具有重要意義。

1 材料與方法

1.1 實驗材料

粳稻的主要產(chǎn)地為長江以北地區(qū),為使研究具有一定的地域代表性,按照東北(黑龍江)、華北(天津)、華中(河南)、華東(山東、江蘇)地區(qū)來選擇粳稻種子進行研究[11,12]。實驗選用黑龍江、天津、山東、河南、江蘇5個產(chǎn)地的20個不同品種粳稻種子作為樣品,其中包含黑龍江6個品種,天津、山東各3個品種,河南、江蘇各4個品種。樣本信息如表1所示。

表1 水稻樣本信息表

1.2 儀器與軟件

光譜采集采取操作Advantage 532拉曼光譜儀,光譜測量波長范圍為200~3 400 cm-1,激發(fā)波長為532 nm,激發(fā)功率為100 mW,積分時間為1~6 s,分辨率為1.4 cm-1,結合ProScope HR軟件獲取樣品光譜信息。實驗使用LJJM-2011精米機對水稻種子進行脫殼處理,脫殼率≥99%,工作電壓為220 V,工作頻率為50 Hz,電機功率為750 W,1次工作時間為50~80 s可調,1次實驗用量為50~170 g。數(shù)據(jù)分析軟件采用MatlabR2018a實現(xiàn)。

1.3 光譜的獲取

對脫殼后的樣本進行挑選,剔除有破損、堊白度高、干癟畸形等問題的種子,將挑選后的粳稻種子樣品按1~20編號存放在的密封袋中并標記對應地區(qū)和品種。為保證實驗結果不受到外界因素的影響,測量前將全部粳稻種子樣本與光譜儀放在同一室內(nèi)環(huán)境下靜置24 h, 確保樣本的環(huán)境條件與儀器環(huán)境條件相同。每個品種的粳稻種子均隨機選取15個作為該品種的實驗樣本集,20個不同品種共計300個種子樣本集。在產(chǎn)地和品種分類鑒別中,選擇每個品種樣本集的4/5用作訓練集,剩余1/5的樣本集作為測試集,即訓練集樣本數(shù)為240個,測試集樣本數(shù)為60個。

1.4 光譜的預處理

拉曼光譜檢測由于樣本因素、環(huán)境因素、儀器因素等因素影響,產(chǎn)生的無關信息和背景噪聲對分析結果會產(chǎn)生很大影響。因此,為了得到準確的光譜信息,需要對數(shù)據(jù)進行預處理以減少影響。實驗采得所有粳稻種子樣品光譜信息范圍為200~3 400 cm-1,但是光譜曲線在3 200~3 400 cm-1范圍內(nèi)沒有特征峰值,且在200~400 cm-1范圍內(nèi)僅有1個特征峰值在269 cm-1,所有大米種子均有這一特征,可知這一特征光譜為C骨架振動歸屬為淀粉[13]。為提高模型運行速度減少運行時間,將這兩個波段截除掉,只保留400~3 200 cm-1的光譜信息作為初始光譜信息。對比SG平滑、一階導數(shù)(1-Der)、二階導數(shù)(2-Der)、迭代自適應加權懲罰最小二乘法(AIRPLS)、多元散射校正(MSC)和標準正態(tài)變量變換(SNV)6種數(shù)據(jù)預處理方法對分類結果的影響。原始光譜數(shù)據(jù)及其6種預處理方法后的光譜數(shù)據(jù)如圖1所示。選取對模型識別準確率提升最大的方法作為最終預處理方法。

圖1 粳稻種子樣本原始光譜數(shù)據(jù)與預處理后光譜數(shù)據(jù)

1.5 光譜的特征波段提取

由于預處理后的光譜數(shù)據(jù)量仍較大,為了減少建模數(shù)據(jù)量,提升模型運行速度,實驗采用篩選強度較低的競爭性自適應重加權采樣算法(CARS)和篩選強度較高的連續(xù)投影算法(SPA)對粳稻種子光譜數(shù)據(jù)進行特征波段篩選,以提高模型效率[14]。CARS和SPA 2種特征波段提取算法都是采取計算均方根誤差(RMSE),并選擇與均方根誤差最小值相對應的波段變量子集,將所提取出來的波段變量子集作為拉曼光譜信息的特征波段。

1.5.1 CARS提取特征波段

實驗使用CARS方法對預處理優(yōu)化后的拉曼光譜數(shù)據(jù)進行特征篩選,篩選過程如圖2所示。在實驗過程中,將蒙特卡洛采樣次數(shù)設置為50。從圖2中的波段數(shù)曲線可以看出,運行次數(shù)增加的過程中,光譜特征波段數(shù)量迅速減少,隨后曲線逐漸變得平緩,速度由快到慢表示選取過程由海選變?yōu)榫x。運行次數(shù)增加的過程中,交互驗證均方根誤差RMSECV的值呈現(xiàn)先低速下降隨后相對迅速上升的趨勢,表明選取過程由無用信息被逐漸剔除到有用信息也被剔除。圖2中回歸系數(shù)路徑曲線是波段提取過程中每次采樣中每個波段變量的回歸系數(shù)路徑。當采樣次數(shù)為18時RMSECV獲得最小值,此時對應的特征波段數(shù)量用于檢測粳稻種子模型分類的效果最好,相應的最佳特征波段數(shù)為248。因此,選取該248個特征波段對應的強度值作為后續(xù)建模數(shù)據(jù)。

圖2 變量變化、五折交互驗證及變量回歸系數(shù)變化路徑與運行次數(shù)關系曲線

1.5.2 SPA提取特征波段

采用SPA方法對預處理優(yōu)化過后的拉曼光譜數(shù)據(jù)進行特征波段提取,基于最小均方根誤差RMSEP值確定特征波段的最佳數(shù)目。由圖3可見,最佳特征波段數(shù)對應均方根誤差(RMSE)為0.703 88,特征波數(shù)為14。選取該14個特征波段對應的強度值作為后續(xù)建模數(shù)據(jù)。

圖3 SPA提取特征波段

1.6 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡

誤差反向傳播(Back Propagation, BP) 神經(jīng)網(wǎng)絡是當今使用最普遍的人工神經(jīng)網(wǎng)絡結構之一,是一種按照信號前向傳播、誤差逆向傳播方式訓練的多層前反饋神經(jīng)網(wǎng)絡,BP神經(jīng)網(wǎng)絡具有優(yōu)秀的解決擬合回歸問題能力和解決復雜度高的分類問題能力。傳統(tǒng)BP神經(jīng)網(wǎng)絡包括3層結構,即輸入層、隱藏層和輸出層。原始光譜數(shù)據(jù)裁剪后有2 801個節(jié)點,水稻產(chǎn)地共有5個類別,隱含層設置為單層,根據(jù)經(jīng)驗公式[15]神經(jīng)元個數(shù)初始設置為4。因此BP神經(jīng)網(wǎng)絡有2 801個節(jié)點在輸入層, 設置4個節(jié)點在隱含層,輸出層有5個節(jié)點。使用默認的S型函數(shù)在隱含層作為傳遞函數(shù),輸出層使用默認的線性函數(shù),網(wǎng)絡指定參數(shù)中學習率為0.001,目標誤差為0.001,最大迭代次數(shù)設為1 000。最終得到一個初始結構為3層拓撲結構的BP神經(jīng)網(wǎng)絡模型。

BP神經(jīng)網(wǎng)絡雖然能夠有效地適用于分類、擬合等任務,但在尋求最優(yōu)解的時候,很有可能陷入局部最優(yōu)、預測誤差較大的情況[16];而遺傳算法則是一種通過對自然進化過程的模擬來尋求最優(yōu)解的方法。所以構建遺傳算法(Genetic Algorithm, GA)優(yōu)化的BP神經(jīng)網(wǎng)絡模型,對BP神經(jīng)網(wǎng)絡的初始權值、閾值進行優(yōu)化,使被優(yōu)化后的BP神經(jīng)網(wǎng)絡可以更好地實現(xiàn)對函數(shù)的輸出。

采用GA算法優(yōu)化BP模型,遺傳算法優(yōu)化后的個體適應度變化曲線如圖4所示,其終止迭代次數(shù)為100。平均適應度與最佳適應度隨著進化代數(shù)不斷提升,說明GA算法能夠對BP模型原算法進行優(yōu)化。結果表明,當進化次數(shù)達到70時,個體達到最佳適應度。

圖4 個體適應度變化曲線

2 結果與分析

2.1 不同產(chǎn)地粳稻種子快速分類鑒別

水稻的質量和風味不僅受到父本母本遺傳給自身的基因影響,還受到地理條件包括土壤質量、水源質量等和氣候環(huán)境包括降雨量、日照時間、日照強度等的影響,因此不同產(chǎn)地的水稻品質相差明顯。由于其相似的外觀,肉眼很難將其分辨,所以利用拉曼光譜技術,針對黑龍江、天津、山東、河南、江蘇5個地區(qū)20種不同品種粳稻種子,進行光譜采集,對采集的粳稻種子光譜數(shù)據(jù)進行預處理、特征波段提取操作,建立BP神經(jīng)網(wǎng)絡模型后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型提升模型運行效率,達到快速區(qū)分不同產(chǎn)地粳稻種子目的。

2.1.1 預處理結果

預處理結果如表2所示。未進行預處理的光譜在BP神經(jīng)網(wǎng)絡模型中的識別準確率為85%,經(jīng)過SG、1-Der、2-Der、Airpls、MSC和SNV預處理之后的光譜在BP分類模型中的識別準確率分別為90.00%、86.67%、80.00%、83.33%、83.33%和85.00%,其中SG平滑識別準確率最高,達到90.00%。因此在后續(xù)實驗研究中,選擇SG平滑的預處理方法進行深入建模分析。

表2 不同預處理方法建模鑒別結果

2.1.2 特征波段提取結果

在SG平滑處理原始光譜基礎上,特征波段提取如表3所示。雖然2種方法均減少建模數(shù)據(jù)量,減少模型運行時間,但SPA方法對模型識別準確率較使用之前有所下降,CARS方法相比于使用之前對模型的運行速度和識別準確率均有提升,模型運行時間為40s,識別準確率為91.67%。因此在后續(xù)實驗研究中,選擇CARS的特征波段提取方法進行深入建模分析。

表3 不同特征波段提取方法建模鑒別結果

2.1.3 遺傳算法優(yōu)化結果

根據(jù)經(jīng)驗公式[17]優(yōu)化隱含層神經(jīng)元個數(shù),不同隱含層神經(jīng)元個數(shù)建模鑒別結果如表4所示。確定選取26為最佳隱含層神經(jīng)元個數(shù)后,將BP神經(jīng)網(wǎng)絡模型的權值閾值用遺傳算法優(yōu)化,GA-BP模型對不同產(chǎn)地粳稻種子識別準確率由98.33%提升至100.00%,運行時間由74 s提升至26 s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對不同產(chǎn)地粳稻種子能實現(xiàn)快速分類鑒別效果。

表4 不同隱含層神經(jīng)元個數(shù)建模鑒別結果

2.2 相同產(chǎn)地不同品種粳稻種子快速分類鑒別

為進一步研究同為粳稻、相同產(chǎn)地,但不同品種的大米之間的分類效果,分別以黑龍江6個品種之間、天津3個品種之間、山東3個品種之間、河南4個品種之間、江蘇4個品種之間為研究對象,進行光譜采集、數(shù)據(jù)預處理、數(shù)據(jù)特征波段提取、建立BP神經(jīng)網(wǎng)絡分析模型并用遺傳算法優(yōu)化,達到快速區(qū)分相同產(chǎn)地不同品種粳稻種子目的。

2.2.1 黑龍江地區(qū)

以黑龍江地區(qū)的龍稻3、龍稻4、龍稻6、龍粳29、龍粳39、龍粳1624共6個品種粳稻種子采用2.1.1優(yōu)選SG平滑預處理方法、2.1.2優(yōu)選CARS特征波段提取方法、選取最佳隱含層神經(jīng)元個數(shù)后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型的權值閾值,建立網(wǎng)絡拓撲結構為136-19-6的最佳GA-BP神經(jīng)網(wǎng)絡模型。最終模型識別準確率為94.44%,運行時間為4s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對黑龍江地區(qū)不同品種粳稻種子能實現(xiàn)快速分類鑒別效果。

2.2.2 天津地區(qū)

以天津地區(qū)的金粳18、金粳818、津稻372共3個品種粳稻種子采用2.1.1優(yōu)選SG平滑預處理方法、2.1.2優(yōu)選CARS特征波段提取方法、選取最佳隱含層神經(jīng)元個數(shù)后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型的權值閾值,建立網(wǎng)絡拓撲結構為100-15-3的最佳GA-BP神經(jīng)網(wǎng)絡模型。最終模型識別準確率為100%,運行時間為1 s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對天津地區(qū)不同品種粳稻種子能實現(xiàn)快速分類鑒別效果。

2.2.3 山東地區(qū)

以山東地區(qū)的圣香66、圣稻16、臨稻13號共3個品種粳稻種子采用2.1.1優(yōu)選SG平滑預處理方法、2.1.2優(yōu)選CARS特征波段提取方法、選取最佳隱含層神經(jīng)元個數(shù)后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型的權值閾值,建立網(wǎng)絡拓撲結構為86-10-3的最佳GA-BP神經(jīng)網(wǎng)絡模型。最終模型識別準確率為100%,運行時間為1 s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對山東地區(qū)不同品種粳稻種子能實現(xiàn)快速分類鑒別效果。

2.2.4 河南地區(qū)

以河南地區(qū)的鄭旱2號、鄭旱6號、鄭旱10號、洛稻998號共4個品種粳稻種子采用2.1.1優(yōu)選SG平滑預處理方法、2.1.2優(yōu)選CARS特征波段提取方法、選取最佳隱含層神經(jīng)元個數(shù)后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型的權值閾值,建立網(wǎng)絡拓撲結構為86-14-4的最佳GA-BP神經(jīng)網(wǎng)絡模型。最終模型識別準確率為91.67%,運行時間為3 s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對河南地區(qū)不同品種粳稻種子能實現(xiàn)快速分類鑒別效果。

2.2.5 江蘇地區(qū)

以江蘇地區(qū)的南粳46、南粳58、南粳5055、南粳9108共4個品種粳稻種子采用2.1.1優(yōu)選SG平滑預處理方法、2.1.2優(yōu)選CARS特征波段提取方法、選取最佳隱含層神經(jīng)元個數(shù)后,用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡模型的權值閾值,建立網(wǎng)絡拓撲結構為86-12-4的最佳GA-BP神經(jīng)網(wǎng)絡模型。最終模型識別準確率為91.67%,運行時間為1 s。說明建立的BP神經(jīng)網(wǎng)絡分析模型的預測精準度高、運行速度快,對江蘇地區(qū)不同品種粳稻種子能實現(xiàn)快速分類鑒別效果。

3 結論

選用黑龍江、天津、山東、河南、江蘇5個不同地區(qū)20個不同品種的粳稻種子進行分類鑒別方法研究。在對比實驗6種預處理方法對模型建模及判別影響中,SG平滑預處理方法在判別模型中識別準確率高于其他5種預處理方法。在探究光譜特征波段提取方法對模型建模及判別影響中,針對預測效果和運行速度綜合考慮,CARS特征提取方法提取的光譜特征優(yōu)于SPA特征提取方法。GA算法也加快了BP神經(jīng)網(wǎng)絡模型的運行速度,提高了模型識別準確率。

在SG平滑預處理、CARS特征波段提取拉曼光譜數(shù)據(jù)和GA算法優(yōu)化BP神經(jīng)網(wǎng)絡模型后建立最佳GA-BP神經(jīng)網(wǎng)絡模型。其中,不同產(chǎn)地(黑龍江、天津、山東、河南、江蘇)粳稻種子模型識別準確率達到100%,運行時間為26 s;相同產(chǎn)地不同品種粳稻種子模型識別準確率均在90%以上,平均識別準確率為95.56%,平均運行時間為2 s。說明拉曼光譜技術結合BP神經(jīng)網(wǎng)絡判別分析模型能夠有效快速準確鑒別粳稻種子的產(chǎn)地和品種。

猜你喜歡
粳稻波段預處理
春日暖陽
我國雙季早粳稻實現(xiàn)“零的突破”
解讀粳稻品種南方種植播期
基于預處理MUSIC算法的分布式陣列DOA估計
制導與引信(2017年3期)2017-11-02 05:16:56
豫南粳稻機械化適應品種篩選及利用研究
M87的多波段輻射過程及其能譜擬合
播期播量對晚粳稻寧84農(nóng)藝性狀及產(chǎn)量的影響
淺談PLC在預處理生產(chǎn)線自動化改造中的應用
絡合萃取法預處理H酸廢水
日常維護對L 波段雷達的重要性
西藏科技(2015年4期)2015-09-26 12:12:58
视频| 山阴县| 七台河市| 陆川县| 新泰市| 靖江市| 道真| 赣榆县| 浠水县| 酒泉市| 永嘉县| 竹山县| 高要市| 宣汉县| 曲水县| 阆中市| 通山县| 九江县| 乌兰察布市| 忻城县| 敦煌市| 荥经县| 新泰市| 金华市| 杭锦后旗| 榆树市| 贡嘎县| 胶南市| 辉南县| 卢氏县| 隆尧县| 申扎县| 棋牌| 利津县| 嘉峪关市| 南阳市| 万宁市| 两当县| 会理县| 襄樊市| 永泰县|