国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GA-LSTM的釀酒葡萄霜霉病預(yù)測(cè)方法研究*

2023-11-11 04:02施愛平錢震威李英豪馮亮
關(guān)鍵詞:霜霉病釀酒適應(yīng)度

施愛平,錢震威,李英豪,馮亮

(江蘇大學(xué)農(nóng)業(yè)工程學(xué)院,江蘇鎮(zhèn)江,212013)

0 引言

我國(guó)賀蘭山東麓地區(qū)是公認(rèn)的世界上最適合種植釀酒葡萄的黃金生態(tài)區(qū)之一,該地區(qū)葡萄酒產(chǎn)業(yè)近年在政策的支持下高速發(fā)展。但一些問題也隨之浮出水面,隨著各種酒莊、葡萄園的興建、擴(kuò)張、大規(guī)模的引種,部分葡萄園中釀酒葡萄種植年限增加,病蟲害問題也在近年來愈發(fā)嚴(yán)重,其中又以霜霉病發(fā)生最頻繁、造成損失最為嚴(yán)重。不及時(shí)進(jìn)行病蟲害防治會(huì)導(dǎo)致大量減產(chǎn),過量防治又會(huì)影響果實(shí)品質(zhì)和產(chǎn)量,造成過量的化學(xué)殘留,甚至影響葡萄園地塊的可持續(xù)發(fā)展,對(duì)土地造成損傷,破壞環(huán)境。

農(nóng)業(yè)專家系統(tǒng)最早誕生于20世紀(jì)70年代,世界公認(rèn)最早的農(nóng)業(yè)專家系統(tǒng)PLANT/ds[1]由美國(guó)伊利諾伊大學(xué)在1978年研究出來,用于大豆病蟲害的診斷,接著,被用于監(jiān)測(cè)谷物夜盜蛾、棉花管理、蘋果園管理、雜草識(shí)別的專家系統(tǒng)分別被開發(fā)出來[2]。隨著20世紀(jì)八九十年代計(jì)算機(jī)技術(shù)高速發(fā)展,農(nóng)業(yè)專家系統(tǒng)也得到了發(fā)展,不再局限于診斷等,開始向監(jiān)測(cè)、預(yù)測(cè)、預(yù)警等多種功能發(fā)展,在美國(guó)、日本等農(nóng)業(yè)信息化技術(shù)更發(fā)達(dá)的國(guó)家,人工智能等技術(shù)被應(yīng)用于農(nóng)業(yè)專家系統(tǒng)中,進(jìn)行病蟲害預(yù)警等工作[3]。20世紀(jì)90年代后,我國(guó)的農(nóng)業(yè)專家系統(tǒng)也開始快速發(fā)展。荀守華等[4]建立大袋蛾的灰色預(yù)測(cè)模型,對(duì)短期內(nèi)災(zāi)情預(yù)測(cè)有較好的性能。崔振洋等[5]建立馬爾科夫鏈預(yù)測(cè)模型對(duì)水稻稻瘟病進(jìn)行預(yù)測(cè),預(yù)測(cè)精度良好;孫朝云[6]將BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)三種病蟲害預(yù)測(cè)模型進(jìn)行比較,發(fā)現(xiàn)Elman神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)精度和收斂速度相比其他兩者都有不錯(cuò)的表現(xiàn);范紹強(qiáng)等[7]采用回歸分析法對(duì)小麥條銹病發(fā)生進(jìn)行預(yù)測(cè),經(jīng)檢驗(yàn)預(yù)測(cè)精度較高。張善文等[8]提出基于改進(jìn)深度置信網(wǎng)絡(luò)的大棚冬棗病蟲害預(yù)測(cè)模型,平均預(yù)測(cè)準(zhǔn)確率高達(dá)84.05%;Herms[9]提出基于日積溫和植物物候?qū)W的害蟲發(fā)育情況預(yù)測(cè),對(duì)病蟲害的短期預(yù)測(cè)有較好的結(jié)果;Grünig等[10]研究一種基于大數(shù)據(jù)和深度神經(jīng)網(wǎng)絡(luò)的病蟲害預(yù)測(cè)方法,認(rèn)為提高數(shù)據(jù)驅(qū)動(dòng)方法中數(shù)據(jù)的可靠性至關(guān)重要,對(duì)病蟲害模型有更好的支撐;李文學(xué)等[11]建立基于GIS的釀酒葡萄霜霉病季節(jié)流行時(shí)間動(dòng)態(tài)模型,對(duì)發(fā)生范圍、程度等進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果直觀。

長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是針對(duì)RNN存在的梯度消失及爆炸問題由Hochreiter等[12]提出的模型,由Gers等[13]進(jìn)行改進(jìn),增加遺忘門后,LSTM模型由于其處理時(shí)間序列數(shù)據(jù)問題的優(yōu)越性,開始廣泛應(yīng)用于各種實(shí)際問題,如降水量、空氣質(zhì)量預(yù)測(cè)等[14-15],均得到不錯(cuò)的預(yù)測(cè)結(jié)果。Wei等[16]為了提高交通流預(yù)測(cè)的準(zhǔn)確性,建立基于Bi-LSTM和注意力機(jī)制預(yù)測(cè)模型,證明注意力機(jī)制的加入加強(qiáng)了模型的預(yù)測(cè)性能;李莉等[17]建立基于LSTM的溫室番茄蒸騰量預(yù)測(cè)模型,結(jié)合多種溫室小氣候數(shù)據(jù)進(jìn)行研究,結(jié)果表明LSTM模型相比于NARX神經(jīng)網(wǎng)絡(luò)、RNN方法等,決定系數(shù)有所提高,誤差有所降低,預(yù)測(cè)性能較好;曹守啟等[18]提出基于K-means聚類和改進(jìn)粒子群優(yōu)化的LSTM預(yù)測(cè)模型,用于水產(chǎn)養(yǎng)殖的溶解氧預(yù)測(cè),該模型一定程度改善了極端天氣下預(yù)測(cè)魯棒性差的問題;閔超等[19]運(yùn)用匈牙利算法結(jié)合LSTM對(duì)儲(chǔ)糧害蟲軌跡跟蹤及行為研究,為建立高效的儲(chǔ)糧害蟲防治方案提供一種策略參考;謝濟(jì)銘等[20]提出基于貝葉斯超參數(shù)優(yōu)化的BHO-Bi-LSTM(BHO-Bi-Directional Long Short Term Memory)車速預(yù)測(cè)集成模型,并與經(jīng)典多元線性回歸車速預(yù)測(cè)模型、Bi-LSTM車速預(yù)測(cè)模型進(jìn)行對(duì)比,證明新模型有效改善合流區(qū)高峰時(shí)段車速特性復(fù)雜而導(dǎo)致不易預(yù)測(cè)的缺陷。由于病蟲害預(yù)測(cè)問題本質(zhì)上也是一種時(shí)間序列問題,本文對(duì)釀酒葡萄霜霉病預(yù)測(cè)LSTM模型進(jìn)行研究,并針對(duì)模型超參數(shù)確定過程中手動(dòng)調(diào)節(jié)存在的精度不足、收主觀因素及經(jīng)驗(yàn)影響、易陷入局部最優(yōu)解的問題,采用遺傳算法對(duì)超參數(shù)調(diào)節(jié)進(jìn)行優(yōu)化,最終建立GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型用于霜霉病防治的決策支持。

1 數(shù)據(jù)來源及相關(guān)模型及算法基本理論

1.1 數(shù)據(jù)來源

本研究釀酒葡萄園氣象及墑情數(shù)據(jù)采集自立蘭酒莊葡萄園中氣象傳感器以及土壤溫濕度傳感器、冠層溫濕度傳感器,小型氣象站每10 min進(jìn)行以上數(shù)據(jù)的采集,由于釀酒葡萄霜霉病發(fā)病期多為七月上旬—九月下旬,隨著每年當(dāng)月的氣象情況不同略有波動(dòng),本研究采用了2016—2021年每年6月1日—10月31日葡萄園間氣象墑情數(shù)據(jù),共918 d,共計(jì)132 192條氣象數(shù)據(jù)。釀酒葡萄霜霉病發(fā)生情況數(shù)據(jù)采集自立蘭酒莊葡萄園中病蟲害試驗(yàn)田,該試驗(yàn)田不進(jìn)行施藥操作,以獲取自然情況下葡萄園中霜霉病發(fā)生信息,由病蟲害研究人員收集并上傳霜霉病發(fā)生和嚴(yán)重性數(shù)據(jù),在數(shù)據(jù)庫(kù)中進(jìn)行保存。

1.2 LSTM神經(jīng)網(wǎng)絡(luò)

長(zhǎng)短期記憶(Long Short-Term Memory)神經(jīng)網(wǎng)絡(luò)是RNN的一個(gè)特殊變種,其被設(shè)計(jì)出來主要是為了解決RNN存在的梯度消失和梯度爆炸問題。LSTM通過給神經(jīng)元加上門結(jié)構(gòu)使其學(xué)習(xí)一些長(zhǎng)依賴信息,擁有保存較長(zhǎng)時(shí)間間隔數(shù)據(jù)的能力。LSTM中的重復(fù)神經(jīng)網(wǎng)絡(luò)模塊相比RNN中簡(jiǎn)單模塊而言要復(fù)雜許多,通過門控機(jī)制,在連續(xù)的時(shí)間步中,神經(jīng)元一定程度上保留上一時(shí)刻的細(xì)胞狀態(tài),相當(dāng)于對(duì)歷史信息有了“記憶”。LSTM隱藏層單元傳輸狀態(tài)如圖1所示。

圖1 LSTM隱藏層單元傳輸狀態(tài)

圖1中ct用于保存長(zhǎng)依賴信息,ht用于保存短期信息。由圖1可知,t時(shí)刻,LSTM中某個(gè)隱藏層單元輸入項(xiàng)有三個(gè),分別為當(dāng)前時(shí)刻外部輸入xt、上一時(shí)刻隱藏層單元的單元狀態(tài)ct-1和上一時(shí)刻的隱藏狀態(tài)ht-1,輸出為當(dāng)前時(shí)刻的ct和ht。

LSTM隱藏層單元的具體結(jié)構(gòu)如圖2所示,遺忘門負(fù)責(zé)遺忘階段的信息處理,以一定的概率和比例對(duì)上一時(shí)刻單元狀態(tài)ct-1進(jìn)行選擇性遺忘,以此控制歷史單元狀態(tài)信息流入當(dāng)前計(jì)算時(shí)刻的量。遺忘門計(jì)算公式如式(1)所示。

圖2 LSTM隱藏層單元結(jié)構(gòu)

ft=σ(Wf·[ht-1,xt]+bf)

(1)

式中:σ——sigmoid函數(shù);

Wf——遺忘門權(quán)重矩陣;

ht-1——上一時(shí)輸出值;

xt——當(dāng)前時(shí)刻外部輸入;

ct-1——上一時(shí)刻單元狀態(tài);

bf——遺忘門偏置。

輸入門負(fù)責(zé)決定讓多少新的外部輸入信息加入單元狀態(tài)中,輸入門計(jì)算公式如式(2)~式(4)所示。

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

(4)

式中:Wi——輸入門權(quán)重矩陣;

bi——輸入門偏置;

it——外部信息更新單元狀態(tài)程度系數(shù);

Wc——外部輸入保留權(quán)重;

bc——候選值偏置;

ot=σ(Wo·[ht-1,xt]+bo)

(5)

ht=ot·tanh(ct)

(6)

y=σ(Wy·ht+by)

(7)

式中:Wo——輸出門權(quán)重矩陣;

bo——輸門偏置;

Wy——隱藏狀態(tài)權(quán)重;

ht——當(dāng)前時(shí)刻輸出值;

ot——輸出門;

by——輸出值偏置。

1.3 遺傳算法

遺傳算法(Genetic Algorithm,GA)是由Holland于1975年提出,是優(yōu)化算法的一種,遺傳算法主要通過對(duì)達(dá)爾文生物進(jìn)化論中“優(yōu)勝劣汰”的自然選擇機(jī)制以及遺傳學(xué)進(jìn)行模擬學(xué)習(xí),來模仿生物進(jìn)化機(jī)制,從而實(shí)現(xiàn)對(duì)對(duì)象的優(yōu)化。

遺傳算法中由一個(gè)種群整體構(gòu)成了待解決問題可能解的解集,解集中的解與群體中的個(gè)體一一對(duì)應(yīng),種群中的個(gè)體由基因編碼方式得到。遺傳算法的目的是得到群體中的最優(yōu)個(gè)體,為此提出了個(gè)體的適應(yīng)度函數(shù),該函數(shù)是根據(jù)問題解決目標(biāo)進(jìn)行確定,用于評(píng)判個(gè)體的優(yōu)劣、解決問題能力強(qiáng)弱,適應(yīng)度越強(qiáng),則GA有更高的概率選中該個(gè)體,在迭代的過程中生存并繁衍誕生子代,該個(gè)體染色體特征也以更大的比例在其子代中得到繼承,這就是GA中的選擇操作。除了選擇操作,GA在迭代過程中還有兩個(gè)不可或缺的操作:交叉和變異,分別進(jìn)行染色體的基因重組和染色體中基因突變的操作。基于選擇、交叉、變異三種操作,對(duì)適應(yīng)度高的個(gè)體進(jìn)行下一代種族群體的構(gòu)建,并不斷迭代循環(huán),生成更優(yōu)的子代,直到達(dá)到預(yù)設(shè)的迭代次數(shù)或個(gè)體達(dá)到期望的適應(yīng)度,得出遺傳算法的最優(yōu)個(gè)體,也就是問題的最優(yōu)解。

2 GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型構(gòu)建

2.1 數(shù)據(jù)預(yù)處理

2.1.1 異常數(shù)據(jù)及缺失值處理

在較大規(guī)模的數(shù)據(jù)集中由于傳感器原因、人為因素和信息采集系統(tǒng)維護(hù)等情況,一些數(shù)據(jù)異常值或數(shù)據(jù)缺失等情況往往難以避免,這些數(shù)據(jù)異常對(duì)模型訓(xùn)練有不利的影響,因此需要對(duì)異常數(shù)據(jù)進(jìn)行處理。

本文采用的原始數(shù)據(jù)集由于傳感器維護(hù)原因有一個(gè)月的數(shù)據(jù)缺失,數(shù)據(jù)填充方式為:從中國(guó)氣象網(wǎng)站獲取一個(gè)月的每日溫度、相對(duì)濕度、風(fēng)速等,其他項(xiàng)數(shù)據(jù)如土壤溫濕度、冠層溫濕度等則是在隔年數(shù)據(jù)中選擇當(dāng)日氣象數(shù)據(jù)較為接近的日期的數(shù)據(jù)作為填充。在繪制的氣象數(shù)據(jù)折線圖中,有一些異常值明顯偏離了其余樣本,雖然樣本量較大,但數(shù)據(jù)中異常值數(shù)量并不多,只是極個(gè)別,因此在python中用matplotlib庫(kù)進(jìn)行數(shù)據(jù)可視化后,手動(dòng)在折線圖中標(biāo)記出異常樣本,然后進(jìn)行異常值的處理,采用的處理方法是平滑化,公式如式(8)所示。

(8)

式中:xb——平滑化處理后數(shù)值;

xb-1——異常值左側(cè)點(diǎn)數(shù)值;

xb+1——異常值右側(cè)點(diǎn)數(shù)值。

即將異常值替換為異常值點(diǎn)附近兩個(gè)值的平均數(shù)。

2.1.2 數(shù)據(jù)整合

在立蘭酒莊內(nèi)采集的原始?xì)庀髷?shù)據(jù)間隔為10 min,若采用原始的間隔10 min的數(shù)據(jù)作為模型輸入進(jìn)行訓(xùn)練,則存在數(shù)據(jù)量計(jì)算量過大、氣象數(shù)據(jù)時(shí)序性不強(qiáng)導(dǎo)致預(yù)測(cè)效果不佳等問題,因此將原始數(shù)據(jù)整合為每日氣象數(shù)據(jù),具體方法為將每天144條數(shù)據(jù)各項(xiàng)中土壤溫濕度、空氣溫濕度、冠層溫濕度、風(fēng)速、光照度累加后平均,將每日降水量累加,得到新的數(shù)據(jù)集如式(9)~式(10)所示。

(9)

xm=∑xi

(10)

式中:xi——每10 min一條的原始數(shù)據(jù)。

xn——原始數(shù)據(jù)進(jìn)行累加后平均的操作后新的每日數(shù)據(jù);

xm——每日144條降水量數(shù)據(jù)累加后得到的新的日降水量。

新數(shù)據(jù)集部分?jǐn)?shù)據(jù)示例如表1所示。

表1 新數(shù)據(jù)集部分?jǐn)?shù)據(jù)示例

2.1.3 數(shù)據(jù)歸一化

數(shù)據(jù)歸一化是將數(shù)據(jù)集中各項(xiàng)數(shù)據(jù)分別映射到0~1之間,將有量綱數(shù)據(jù)轉(zhuǎn)化為無量綱數(shù)據(jù),可以提高模型的精度、提高迭代速度、消除不同量綱數(shù)據(jù)帶來的不良影響,如:每日光照度數(shù)值和空氣溫濕度數(shù)值相差巨大,但它們對(duì)于病蟲害發(fā)生的影響水平可能是相近的,若不進(jìn)行歸一化處理,以原始數(shù)據(jù)輸入進(jìn)行訓(xùn)練,則模型訓(xùn)練過程中會(huì)大大放大光照度的影響水平而忽略溫濕度等因素,因此,對(duì)新數(shù)據(jù)集中各項(xiàng)進(jìn)行歸一化處理,歸一化公式如式(11)所示。

(11)

式中:xmin——數(shù)據(jù)集中該項(xiàng)最小值;

xmax——數(shù)據(jù)集中該項(xiàng)最大值。

2.1.4 數(shù)據(jù)集劃分

數(shù)據(jù)集按照時(shí)間而非比例進(jìn)行劃分,將2016年6月1日—2018年10月31日數(shù)據(jù)共459組作為訓(xùn)練集,將2019年6月1日—2020年10月31日數(shù)據(jù)共306組劃分為驗(yàn)證集,將2021年6月1日—10月31日數(shù)據(jù)共153組劃分為測(cè)試集。

2.2 LSTM基礎(chǔ)模型構(gòu)建

本文選擇選擇基于Python編程語言的Keras開源神經(jīng)網(wǎng)絡(luò)框架作為主體進(jìn)行LSTM釀酒葡萄霜霉病預(yù)測(cè)基礎(chǔ)模型的搭建,選擇sequential模型對(duì)LSTM模型進(jìn)行構(gòu)建。通過設(shè)置模型的初始參數(shù),包括隱藏層層數(shù)、神經(jīng)元(記憶單元)個(gè)數(shù)、激活函數(shù)、優(yōu)化算法、學(xué)習(xí)率、批次大小(batch_size)等,完成模型的初步構(gòu)建。

本文中LSTM釀酒葡萄霜霉病預(yù)測(cè)模型的輸入有10個(gè)特征變量,分別為:空氣溫度、空氣濕度、風(fēng)速、土壤溫度、土壤濕度、冠層溫度、冠層濕度、光照度、降水量和霜霉病發(fā)生情況,因此本文輸入序列的維度為10,則每次輸入模型的數(shù)據(jù)集結(jié)構(gòu)為[batch_size,20,10],其中batch_size指模型每一次訓(xùn)練數(shù)據(jù)集傳入的批次大小,也可以說是模型更新一次權(quán)重所用的樣本數(shù),20指的是時(shí)間窗寬度,10指的是數(shù)據(jù)的維度,batch_size需在模型初始化時(shí)指定,也可以作為超參數(shù)在后續(xù)模型的訓(xùn)練中調(diào)整以得到更優(yōu)的模型。本文LSTM模型的輸出結(jié)構(gòu)為[batch_size,5,1],表示模型輸出維度為1,預(yù)測(cè)接下來5日內(nèi)的病蟲害發(fā)生情況,將batch_size初始化為32。

LSTM模型的結(jié)構(gòu)初始化方面,由于隨隱藏層數(shù)量增加會(huì)導(dǎo)致計(jì)算量急劇增長(zhǎng)、計(jì)算效率變低、收斂速度變慢等問題,將隱藏層數(shù)量初始化為1,隱藏層神經(jīng)元數(shù)量初始化為150,訓(xùn)練集使用次數(shù)(epoch)選擇200次,選擇激活函數(shù)選擇為sigmoid函數(shù),優(yōu)化算法選擇Adam,學(xué)習(xí)率初始化為0.001,為了防止過擬合情況發(fā)生,加入了dropout,dropout比率初始化為0.3,損失函數(shù)選擇均方誤差(MSE),其公式如式(12)所示。

(12)

式中:yi——預(yù)測(cè)值;

損失函數(shù)就是模型在訓(xùn)練、驗(yàn)證過程中的評(píng)價(jià)指標(biāo),用于衡量模型訓(xùn)練過程中每一個(gè)epoch模型輸出的預(yù)測(cè)值和數(shù)據(jù)集真實(shí)值之間的差距大小,判斷模型預(yù)測(cè)性能是否優(yōu)秀。

至此LSTM基礎(chǔ)模型構(gòu)建完畢。

2.3 基于GA優(yōu)化LSTM釀酒葡萄霜霉病預(yù)測(cè)模型構(gòu)建

2.3.1 遺傳算法超參數(shù)搜索空間建立

LSTM釀酒葡萄霜霉病預(yù)測(cè)模型中需要手動(dòng)調(diào)整的超參數(shù)種類很多,首先確定使用遺傳算法進(jìn)行自動(dòng)搜索的超參數(shù)種類為:時(shí)間窗寬度、隱藏層節(jié)點(diǎn)數(shù)、epoch、Batch_size、Dropout比率、激活函數(shù)、優(yōu)化函數(shù),后確定各個(gè)超參數(shù)的取值范圍,由此形成超參數(shù)搜索空間,本文經(jīng)研究確定的超參數(shù)搜索空間如表2所示。

表2 超參數(shù)搜索空間

2.3.2 二進(jìn)制編碼、解碼

染色體個(gè)體編碼是遺傳算法的關(guān)鍵步驟,二進(jìn)制編碼方法具有便于編碼、解碼、交叉、變異等優(yōu)勢(shì),本文選擇二進(jìn)制方法進(jìn)行編碼,根據(jù)表2的超參數(shù)取值空間長(zhǎng)度,確定各變量二進(jìn)制編碼時(shí)的二進(jìn)制長(zhǎng)度,各變量二進(jìn)制編碼長(zhǎng)度如表3所示。

表3 變量二進(jìn)制編碼長(zhǎng)度

在定義大于等于超參數(shù)取值空間的變量二進(jìn)制長(zhǎng)度后,按照編號(hào)順序由x1~x7分別生成二進(jìn)制編碼長(zhǎng)度的隨機(jī)二進(jìn)制字符串并連接起來得到染色體個(gè)體,重復(fù)進(jìn)行以上操作得到多個(gè)個(gè)體構(gòu)成初始種群。

解碼是與編碼對(duì)應(yīng)的操作,是將GA中個(gè)體與模型進(jìn)行聯(lián)系的環(huán)節(jié),將二進(jìn)制編碼重新解碼為超參數(shù)組合才能夠進(jìn)行模型的訓(xùn)練計(jì)算并得到GA所需的適應(yīng)度函數(shù)繼續(xù)進(jìn)行迭代,具體方法為將子代染色體按照變量的編碼長(zhǎng)度重新劃分為各變量的二進(jìn)制取值,進(jìn)而得到二進(jìn)制值對(duì)應(yīng)的超參數(shù)取值,將解碼得到的超參數(shù)組合代入模型進(jìn)行訓(xùn)練。

2.3.3 遺傳操作

進(jìn)行遺傳首先需確定對(duì)個(gè)體進(jìn)行評(píng)價(jià)的適應(yīng)度函數(shù),該函數(shù)能夠?qū)δP偷念A(yù)測(cè)精度進(jìn)行評(píng)估,本文構(gòu)建的適應(yīng)度函數(shù)如式(13)所示。

(13)

式中:A——群體中的某個(gè)個(gè)體;

R——超參數(shù)搜索空間。

1) 選擇操作。選擇操作是以高適應(yīng)度為指標(biāo),從當(dāng)前種群中選出合適的個(gè)體,給它們較大的機(jī)會(huì)作為父代繁殖子代,本文使用輪盤賭策略進(jìn)行選擇操作,即將當(dāng)代群體個(gè)體適應(yīng)度進(jìn)行計(jì)算,并將適應(yīng)度按比例放大或縮小,使得所有個(gè)體適應(yīng)度值的和為1,將每個(gè)個(gè)體按照適應(yīng)度的比例分布至輪盤上,通過生成一個(gè)[0,1)間的隨機(jī)數(shù),選擇輪盤上該區(qū)域?qū)?yīng)的個(gè)體,個(gè)體被選中的概率與適應(yīng)度大小成正比,進(jìn)行m次選擇操作得到m個(gè)個(gè)體進(jìn)行后續(xù)的遺傳操作。

2) 交叉操作。預(yù)設(shè)一個(gè)交叉概率,本文設(shè)置交叉概率為0.7,對(duì)選擇操作得到的m個(gè)個(gè)體進(jìn)行兩兩不重復(fù)配對(duì),配對(duì)的同時(shí)生成一個(gè)[0,1]區(qū)間內(nèi)的隨機(jī)數(shù),若生成隨機(jī)數(shù)小于交叉概率,進(jìn)行后續(xù)步驟,若大于交叉概率則兩個(gè)個(gè)體維持原狀,在需進(jìn)行交叉操作的染色體上隨機(jī)確定交叉操作斷點(diǎn)位置,配對(duì)染色體于斷點(diǎn)處截?cái)嗖⒔粨Q斷點(diǎn)后的部分。

3) 變異操作。預(yù)設(shè)一個(gè)變異概率,本文設(shè)置變異概率為0.05,對(duì)選擇操作、和交叉操作得到的新的m個(gè)個(gè)體每個(gè)生成一個(gè)[0,1]區(qū)間內(nèi)的隨機(jī)數(shù),若生成隨機(jī)數(shù)小于變異概率,進(jìn)行后續(xù)步驟,若大于則個(gè)體維持原狀,被選中進(jìn)行變異操作的染色體在二進(jìn)制值上隨機(jī)選擇一個(gè)基本位進(jìn)行取反,即0變?yōu)?,1變?yōu)?,新的染色體作為子代中一個(gè)個(gè)體。

重復(fù)進(jìn)行以上遺傳操作,進(jìn)行迭代,直到達(dá)到終止條件:遺傳代數(shù)達(dá)到預(yù)設(shè)最大值;最優(yōu)個(gè)體數(shù)代未改變,滿足其一停止迭代。GA優(yōu)化LSTM釀酒葡萄霜霉病預(yù)測(cè)模型流程如圖3所示。

圖3 GA優(yōu)化LSTM釀酒葡萄霜霉病預(yù)測(cè)模型流程圖

3 預(yù)測(cè)結(jié)果與分析

試驗(yàn)的硬件環(huán)境為內(nèi)存16 GB、CPU Intel(R) Core(TM) i5-7300HQ CPU @ 2.50 GHz,GPU GeForce GTX 1050 Ti。

3.1 參數(shù)確定及預(yù)測(cè)結(jié)果

使用處理完的數(shù)據(jù)集對(duì)GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型進(jìn)行訓(xùn)練擬合并基于適應(yīng)度函數(shù)完成超參數(shù)搜索過程,迭代結(jié)束后對(duì)GA得到的最優(yōu)個(gè)體進(jìn)行解碼操作,得到GA-LSTM模型的最優(yōu)超參數(shù)組合如表4所示。

表4 GA得到模型最優(yōu)超參數(shù)組合

將得到的超參數(shù)組合代入模型,得到最終的GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型,其在測(cè)試集上的預(yù)測(cè)結(jié)果如圖4所示。

圖4 GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型測(cè)試集預(yù)測(cè)結(jié)果

GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型預(yù)測(cè)所得均方根誤差RMSE、均方誤差MSE、平均絕對(duì)誤差MAE指標(biāo)結(jié)果如表5所示。

表5 預(yù)測(cè)模型評(píng)價(jià)指標(biāo)

由圖4可以看出,GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型預(yù)測(cè)結(jié)果的曲線圖與病蟲害發(fā)生的真實(shí)曲線貼近。計(jì)算所得的評(píng)價(jià)指標(biāo)RMSE、MAE和MSE也顯示GA-LSTM模型在測(cè)試集上的預(yù)測(cè)性能優(yōu)秀,誤差較小。

3.2 模型對(duì)比驗(yàn)證研究

本文在GA-LSTM模型外還構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)釀酒葡萄霜霉病預(yù)測(cè)模型和手動(dòng)調(diào)參LSTM模型,兩種神經(jīng)網(wǎng)絡(luò)參數(shù)分別如表6、表7所示。

表6 BP神經(jīng)網(wǎng)絡(luò)釀酒葡萄霜霉病預(yù)測(cè)模型參數(shù)

表7 手動(dòng)調(diào)參LSTM釀酒葡萄霜霉病預(yù)測(cè)模型超參數(shù)確定

三種模型在測(cè)試集上的預(yù)測(cè)結(jié)果如圖5所示。

由圖5可以看出,GA-LSTM釀酒葡萄霜霉病預(yù)測(cè)模型預(yù)測(cè)結(jié)果相比LSTM模型和BP模型更加貼近真實(shí)值曲線,表示GA-LSTM模型有比LSTM和BP模型更好的預(yù)測(cè)性能。三種模型預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)如表8所示。

表8 三種模型預(yù)測(cè)結(jié)果指標(biāo)

由表8可知,預(yù)測(cè)性能GA-LSTM模型優(yōu)于LSTM模型優(yōu)于BP模型,LSTM模型在時(shí)間序列問題上擁有比BP神經(jīng)網(wǎng)絡(luò)更好的性能,LSTM的三種門結(jié)構(gòu)對(duì)時(shí)序數(shù)據(jù)的處理有正面作用,GA的加入對(duì)于LSTM模型的參數(shù)選擇也有正面作用,優(yōu)化了超參數(shù)調(diào)節(jié)環(huán)節(jié)。

4 結(jié)論

1) 本文以準(zhǔn)確預(yù)測(cè)寧夏賀蘭山東麓地區(qū)一葡萄園內(nèi)釀酒葡萄霜霉病的發(fā)生情況為目的,進(jìn)行了釀酒葡萄霜霉病預(yù)測(cè)模型的研究。采用寧夏立蘭酒莊葡萄園內(nèi)小型氣象站采集的氣象墑情等數(shù)據(jù)和人工采集的釀酒葡萄霜霉病發(fā)生情況作為數(shù)據(jù)來源,分別構(gòu)建了基于手動(dòng)調(diào)參LSTM、BP神經(jīng)網(wǎng)絡(luò)、GA-LSTM的釀酒葡萄霜霉病預(yù)測(cè)模型,并對(duì)三種模型在測(cè)試集上進(jìn)行了預(yù)測(cè)并對(duì)比。

2) 在表現(xiàn)模型預(yù)測(cè)性能的指標(biāo)中,GA-LSTM模型的RMSE值為0.410 3,LSTM模型的RMSE值為0.462 6,BP神經(jīng)網(wǎng)絡(luò)模型的RMSE值為0.484 6;GA-LSTM模型的MAE值為0.245 0,LSTM模型的MAE值為0.301 6,BP神經(jīng)網(wǎng)絡(luò)模型的MAE值為0.321 7,由評(píng)價(jià)指標(biāo)結(jié)果可得釀酒葡萄霜霉病預(yù)測(cè)方面GA-LSTM模型優(yōu)于LSTM模型優(yōu)于BP模型,可以證明LSTM在時(shí)間序列數(shù)據(jù)的預(yù)測(cè)性能優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,使用遺傳算法對(duì)于LSTM模型的超參數(shù)選擇環(huán)節(jié)進(jìn)行優(yōu)化會(huì)在超參數(shù)組合方面優(yōu)于手動(dòng)調(diào)參的LSTM模型,自動(dòng)搜索得到的超參數(shù)組合少了主觀選擇的局限性。

3) 后續(xù)研究可以在模型的輸入數(shù)據(jù)環(huán)節(jié)加入關(guān)聯(lián)分析,剔除對(duì)病蟲害發(fā)生影響較小或沒有影響的因素,可以較大程度上減輕計(jì)算機(jī)計(jì)算壓力,減少計(jì)算量,優(yōu)化模型。同時(shí)本研究得到的GA-LSTM模型不具備通用性,擴(kuò)展性較差,難以應(yīng)用于白粉病、灰霉病等病蟲害的預(yù)測(cè),后續(xù)可以通過一些方法增強(qiáng)模型的泛化性能。

猜你喜歡
霜霉病釀酒適應(yīng)度
不用藥 兩招搞定黃瓜霜霉病
改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
上半年釀酒產(chǎn)業(yè)產(chǎn)、銷、利均增長(zhǎng)
為什么酵母菌既能做面包也能釀酒?
多種殺菌劑對(duì)蠶豆霜霉病田間防治效果比較
黃瓜霜霉病發(fā)病癥狀及其防治技術(shù)
釀酒忘米
基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
調(diào)虧灌溉在釀酒葡萄上的應(yīng)用
黃瓜霜霉病的發(fā)生與防治