石慶蘭 束金陽(yáng) 李道亮 黃凱欣 查海涅
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.農(nóng)業(yè)農(nóng)村部智慧養(yǎng)殖重點(diǎn)實(shí)驗(yàn)室, 北京 100083;3.國(guó)家數(shù)字漁業(yè)創(chuàng)新中心, 北京 100083; 4.北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心, 北京 100083;5.安慶師范大學(xué)計(jì)算機(jī)與信息學(xué)院, 安慶 246052)
近年來(lái),由于稻蝦共作模式在保障糧食產(chǎn)量的前提下還能給農(nóng)民增加經(jīng)濟(jì)收入[1],因而有著良好的推廣前景。
相較于水稻單作和自然水環(huán)境的養(yǎng)殖,稻蝦共作可以提高水體pH值、總?cè)芙夤腆w(TDS)、電導(dǎo)率和氧化還原電位等參數(shù),此外在抑制潛水蒸發(fā)、提高水體自凈能力等方面也產(chǎn)生了積極作用[2]。然而,在養(yǎng)殖過(guò)程中,由于蝦的日常活動(dòng)不斷攪混田間水體,水中的太陽(yáng)光穿透率低,抑制水生植物的光合作用,導(dǎo)致水體溶解氧含量降低,不利于水生物的生長(zhǎng)和腐敗物質(zhì)的分解消化[3-4]。水中的溶解氧含量是水質(zhì)監(jiān)測(cè)的一項(xiàng)重要指標(biāo),當(dāng)?shù)疚r互作養(yǎng)殖環(huán)境中的溶解氧含量不足時(shí),氨和硫化氫不能實(shí)現(xiàn)無(wú)毒轉(zhuǎn)化,極易危及小龍蝦的生長(zhǎng)發(fā)育[5-6]。因此精確預(yù)測(cè)溶解氧含量是實(shí)現(xiàn)智慧稻蝦養(yǎng)殖的關(guān)鍵。
關(guān)于溶解氧濃度的預(yù)測(cè)國(guó)內(nèi)外學(xué)者采用了多種方法。LIU等[7]在池塘養(yǎng)殖環(huán)境下通過(guò)閾值處理、小波濾波等方法對(duì)溶解氧數(shù)據(jù)集進(jìn)行處理,大大提高溶解氧預(yù)測(cè)模型的準(zhǔn)確性。孫龍清等[8]和陳英義等[9]通過(guò)改進(jìn)的天牛須搜索算法和改進(jìn)粒子群優(yōu)化算法對(duì)參數(shù)選擇和特征提取進(jìn)行優(yōu)化,進(jìn)而降低模型預(yù)測(cè)誤差。在工廠化循環(huán)水養(yǎng)殖環(huán)境下,頻繁的人為調(diào)控使得溶解氧的變化更為復(fù)雜[10-11],REN等[12]采用變分模態(tài)分解(VMD)算法降低原始數(shù)據(jù)中的噪聲,有效提高神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)的質(zhì)量,后通過(guò)深度置信網(wǎng)絡(luò)(DBN)實(shí)現(xiàn)溶解氧的預(yù)測(cè)。TA等[13]通過(guò)逆向理解卷積神經(jīng)網(wǎng)絡(luò)建立溶解氧預(yù)測(cè)模型,在收斂速度、預(yù)測(cè)準(zhǔn)確性及穩(wěn)定性上,模型均滿足實(shí)際生產(chǎn)需求。在魚菜共生系統(tǒng)中,溶解氧的變化受到更多動(dòng)植物生存環(huán)境因素的影響[14],精準(zhǔn)預(yù)測(cè)的難度大大增加。這種養(yǎng)殖模式下,REN等[15]通過(guò)遺傳算法優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)溶解氧預(yù)測(cè)模型,提高了模型效率和預(yù)測(cè)準(zhǔn)確性。
在諸多預(yù)測(cè)算法當(dāng)中,以循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[16]為代表的深度學(xué)習(xí)適應(yīng)性好、學(xué)習(xí)能力強(qiáng)、適合時(shí)間序列的參數(shù)預(yù)測(cè),其預(yù)測(cè)精度取決于訓(xùn)練樣本數(shù)量。長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[17-18]和門控循環(huán)單元(GRU)[19]是在RNN的基礎(chǔ)上引入門控機(jī)制,增強(qiáng)了處理長(zhǎng)序列信息和記憶能力,防止梯度消失或爆炸,使模型訓(xùn)練效果更佳。目前稻蝦養(yǎng)殖中影響溶解氧含量變化的因素較多,不僅受養(yǎng)殖水體環(huán)境參數(shù)影響,還受作物生長(zhǎng)及其氣象環(huán)境等參數(shù)影響[20]。針對(duì)稻蝦養(yǎng)殖復(fù)雜環(huán)境下采用傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)存在計(jì)算效率低下、特征提取能力不足、缺乏對(duì)環(huán)境變化的適應(yīng)能力和過(guò)擬合風(fēng)險(xiǎn)高等問(wèn)題[21],本文采用BiLSTM[22]與GRU神經(jīng)網(wǎng)絡(luò)融合的方法對(duì)溶解氧含量進(jìn)行預(yù)測(cè),以期為溶解氧的調(diào)控提供依據(jù)和決策。
試驗(yàn)在安徽省全椒縣銀花家庭農(nóng)場(chǎng)稻蝦養(yǎng)殖基地(31.74°N,116.52°E)完成,養(yǎng)殖總面積為700 hm2,其中一個(gè)稻蝦養(yǎng)殖單元面積約為50 hm2,長(zhǎng)185 m,寬180 m,蝦渠寬度為6 m,投放幼蝦規(guī)格為 160~200尾/kg,投放量為450~600 kg/hm2。水質(zhì)監(jiān)測(cè)設(shè)備包括溶解氧水溫一體化傳感器、pH值傳感器、濁度傳感器、氨氮傳感器,稻蝦養(yǎng)殖田中部署情況如 圖1所示,采集到數(shù)據(jù)如表1所示。
表1 農(nóng)場(chǎng)中采集到的水質(zhì)數(shù)據(jù)Tab.1 Water quality data collected in farm
圖1 稻蝦田傳感器部署圖Fig.1 Sensor deployment diagram for rice and shrimp fields
由于傳感器探頭表面容易附著水中的浮游物使得測(cè)量誤差增大,因此需對(duì)傳感器進(jìn)行清洗校準(zhǔn) 2次,偏差為0.67~1.82 mg/L,對(duì)數(shù)據(jù)集進(jìn)行校準(zhǔn),計(jì)算公式為
式中XMax——校準(zhǔn)數(shù)據(jù)集最大值
XMin——校準(zhǔn)數(shù)據(jù)集最小值
X——某時(shí)刻溶解氧含量
Xrevised——同一時(shí)刻校準(zhǔn)后溶解氧含量
C——校準(zhǔn)偏差
校準(zhǔn)后溶解氧含量如圖2所示。
圖2 溶解氧含量數(shù)據(jù)校準(zhǔn)結(jié)果Fig.2 Correction results of dissolved oxygen content data
采用兩層循環(huán)神經(jīng)網(wǎng)絡(luò)模型,如圖3所示,第1層使用BiLSTM神經(jīng)網(wǎng)絡(luò),將2次得到的LSTM結(jié)果進(jìn)行拼接作為最終輸出。借助LSTM細(xì)胞單元的結(jié)構(gòu)來(lái)保存較長(zhǎng)的依賴關(guān)系,通過(guò)前向、后向兩個(gè)傳播方向的LSTM傳輸序列數(shù)據(jù),調(diào)整前后的狀態(tài)對(duì)當(dāng)前細(xì)胞單元狀態(tài)的影響,不僅可以保存序列數(shù)據(jù)中前向輸入對(duì)后向輸入的影響,也可以保存后向輸入對(duì)前向輸入的影響,大大提高了模型預(yù)測(cè)精度。第2層使用GRU神經(jīng)網(wǎng)絡(luò)以降低神經(jīng)網(wǎng)絡(luò)的計(jì)算復(fù)雜度、參數(shù)量和計(jì)算時(shí)間,在第1層得到序列特征的基礎(chǔ)上,保證模型預(yù)測(cè)精度的同時(shí),大大減少了模型訓(xùn)練時(shí)間。
圖3 BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 BiLSTM-GRU fusion neural network structure
根據(jù)采集的水質(zhì)數(shù)據(jù),模型輸入層設(shè)置為前48個(gè)時(shí)間刻度的水質(zhì)參數(shù),輸出層為未來(lái)12個(gè)時(shí)間刻度的溶解氧含量,具體預(yù)測(cè)方法如圖4所示。
圖4 BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)流程圖Fig.4 Flow chart of BiLSTM-GRU fusion neural network
計(jì)算溶解氧含量校準(zhǔn)前后與溫度、pH值、濁度、氨氮含量等參數(shù)之間的皮爾遜相關(guān)系數(shù)[23],如表2所示。由表2可知,pH值與溶解氧含量的相關(guān)性最大,故將溶解氧含量和pH值作為模型輸入,按照比例7∶3分為訓(xùn)練集和測(cè)試集后,將訓(xùn)練集輸入模型中對(duì)模型進(jìn)行訓(xùn)練。
表2 溶解氧含量與各參數(shù)之間的皮爾遜相關(guān)系數(shù)Tab.2 Pearson correlation coefficient between dissolved oxygen content and various parameters
采用均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)和決定系數(shù)R2[24-25]進(jìn)行評(píng)價(jià)。分別在不同隱藏層節(jié)點(diǎn)數(shù)、每次迭代不同的輸入樣本數(shù)量以及不同的訓(xùn)練輪次下進(jìn)行運(yùn)算,同時(shí)計(jì)算每種參數(shù)下的評(píng)價(jià)指標(biāo)。如表3所示,對(duì)比結(jié)果表明隱藏層節(jié)點(diǎn)數(shù)為48時(shí)表現(xiàn)最佳。將隱藏層節(jié)點(diǎn)數(shù)設(shè)置為48時(shí)不同輸入樣本數(shù)量對(duì)比如表4所示,結(jié)果表明當(dāng)每次迭代輸入的樣本數(shù)量為24時(shí)表現(xiàn)最佳。再將隱藏層節(jié)點(diǎn)數(shù)設(shè)置為48,每次迭代輸入的樣本數(shù)量設(shè)置為24,如表5所示,當(dāng)模型訓(xùn)練輪次為500時(shí)表現(xiàn)最佳。
表3 不同隱藏層節(jié)點(diǎn)數(shù)結(jié)果對(duì)比Tab.3 Comparison of number of nodes in hidden layer
表4 不同輸入樣本數(shù)量結(jié)果對(duì)比Tab.4 Comparison in different iteration sample numbers
表5 不同訓(xùn)練輪次結(jié)果對(duì)比Tab.5 Comparison of number of turns
3.3.1神經(jīng)網(wǎng)絡(luò)模型運(yùn)行結(jié)果
確定模型各個(gè)參數(shù)后,即隱藏層節(jié)點(diǎn)數(shù)為48,每次迭代輸入的樣本數(shù)量為24,訓(xùn)練輪次為500,建立BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖5所示。
圖5 BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)模型Fig.5 BiLSTM-GRU fusion neural network model
通過(guò)構(gòu)建完成的BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)模型以及4個(gè)對(duì)比模型(LSTM、GRU、BiLSTM、BiGRU)對(duì)測(cè)試集進(jìn)行訓(xùn)練,得到預(yù)測(cè)值與真實(shí)值差值如圖6所示。
圖6 各模型預(yù)測(cè)值與真實(shí)值差值變化曲線Fig.6 Difference between predicted results of each model and actual value
3.3.2不同采樣周期下的模型運(yùn)行結(jié)果
傳感器數(shù)據(jù)采樣周期小會(huì)增加傳感器的耗電量,增加數(shù)據(jù)采集器及接收平臺(tái)的存儲(chǔ)空間,降低模型的運(yùn)算速度。采樣周期增大又容易漏測(cè)溶解氧的變化,合理地設(shè)置采樣周期非常重要。
為確定傳感器最佳的采樣周期,模型構(gòu)建完成后,將不同采樣周期數(shù)據(jù)集(5、10、15、20、30、40 min)分別進(jìn)行模型訓(xùn)練,結(jié)果如圖7所示。
3.4.1多種模型性能對(duì)比
將5種模型的預(yù)測(cè)值與真實(shí)值進(jìn)行誤差對(duì)比分析,結(jié)果如表6所示。從表6可以看出,BiLSTM-GRU模型的表現(xiàn)最優(yōu),MAE和RMSE分別為0.275 9、0.616 0 mg/L,相較于LSTM模型提高25.14%和13.25%,相較于GRU模型提高13.02%和6.76%。在引入雙向神經(jīng)網(wǎng)絡(luò)對(duì)傳統(tǒng)的兩種循環(huán)神經(jīng)網(wǎng)絡(luò)優(yōu)化后,模型性能有所提升,但相較于融合神經(jīng)網(wǎng)絡(luò)模型在性能表現(xiàn)上稍顯不足,BiLSTM-GRU模型的MAE和RMSE相較于BiLSTM模型提高17.52%和9.90%,相較于BiGRU模型提高11.26%和8.08%。BiLSTM-GRU模型對(duì)數(shù)據(jù)的擬合效果(R2)達(dá)到0.954 7,對(duì)比另外4種模型依次提高2.22%、1.26%、1.70%和1.44%。因此,BiLSTM-GRU融合神經(jīng)網(wǎng)絡(luò)模型能夠更加充分挖掘到數(shù)據(jù)之間的隱藏信息,更為精準(zhǔn)地預(yù)測(cè)了稻蝦養(yǎng)殖環(huán)境溶解氧含量,為后續(xù)低溶解氧含量的預(yù)測(cè)預(yù)警提供了更加可靠的依據(jù)。
表6 模型誤差對(duì)比Tab.6 Comparison of model performance
3.4.2不同采樣周期對(duì)預(yù)測(cè)的影響
將不同采樣周期下的數(shù)據(jù)集模型訓(xùn)練結(jié)果分別進(jìn)行誤差計(jì)算,并統(tǒng)計(jì)模型運(yùn)行時(shí)間,得到模型運(yùn)行時(shí)間和平均運(yùn)行時(shí)間。根據(jù)一個(gè)傳感器在一次數(shù)據(jù)采集時(shí)的能耗(平均約為400 mA·s)計(jì)算4個(gè)傳感器在不同采樣周期下的傳感器總能耗。記錄不同采樣周期下的數(shù)據(jù)集和文件占用內(nèi)存量、24 h傳感器采集次數(shù)和總能耗、模型運(yùn)行時(shí)間和平均運(yùn)行時(shí)間以及在預(yù)測(cè)60 min時(shí)的MAE、RMSE、R2誤差結(jié)果,采樣周期為40 min時(shí),預(yù)測(cè)60 min時(shí)間點(diǎn)溶解氧濃度的誤差為預(yù)測(cè)40 min誤差和80 min誤差的平均值,得到不同采樣周期下的各項(xiàng)指標(biāo)如表7所示。
表7 不同采樣周期下各項(xiàng)指標(biāo)Tab.7 Various indicators in different sampling periods
從表7可以看出,傳感器的能耗以及數(shù)據(jù)集所占用內(nèi)存量均隨著采樣周期的增加而減小,當(dāng)達(dá)到一定程度時(shí),能耗雖仍在減小,但幅度較小。同時(shí)當(dāng)采樣周期為30 min時(shí),模型在預(yù)測(cè)60 min這個(gè)公共點(diǎn)的誤差最小,并且模型平均運(yùn)行時(shí)間最短。綜上所述,確定傳感器最佳采樣周期為30 min。
采集基地稻蝦田7—8月的水質(zhì)數(shù)據(jù)并作為輸入數(shù)據(jù)集對(duì)模型的預(yù)測(cè)效果進(jìn)行驗(yàn)證,得到預(yù)測(cè)結(jié)果以及預(yù)測(cè)誤差如圖8和表8所示。
表8 實(shí)際生產(chǎn)中的預(yù)測(cè)誤差Tab.8 Prediction error in actual production
圖8 實(shí)際生產(chǎn)中的預(yù)測(cè)結(jié)果Fig.8 Operation results in actual production
從圖8、表8中可以看出,模型在7—8月實(shí)際生產(chǎn)的溶解氧含量預(yù)測(cè)中,60 min的平均絕對(duì)值誤差為0.319 1 mg/L、均方根誤差為0.620 7 mg/L以及R2為0.924 1。綜合來(lái)看,模型在實(shí)際生產(chǎn)中得到驗(yàn)證,其預(yù)測(cè)效果表現(xiàn)良好。
(1)為保證預(yù)測(cè)的精準(zhǔn),對(duì)傳感器進(jìn)行了清洗校準(zhǔn),根據(jù)偏移量對(duì)傳感器進(jìn)行了標(biāo)定,并對(duì)歷史數(shù)據(jù)進(jìn)行了修正,以減小傳感器漂移出現(xiàn)的測(cè)量偏差。 對(duì)不同采樣周期下的模型性能與資源消耗綜合分析,確定傳感器最優(yōu)采樣周期為30 min。
(2)通過(guò)皮爾遜相關(guān)系數(shù)分析確定影響溶解氧含量變化最大的水質(zhì)參數(shù)pH值一同作為輸入數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練。采用循環(huán)神經(jīng)網(wǎng)絡(luò)模型(LSTM和GRU),在保證模型提取更多的特征因子以達(dá)到更加精準(zhǔn)的預(yù)測(cè)同時(shí),減少模型運(yùn)行時(shí)間,大大提高模型性能。
(3)通過(guò)與4種傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)比表明,在最優(yōu)傳感器采樣周期下,對(duì)于校準(zhǔn)后的數(shù)據(jù),融合神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果更好,其MAE、RMSE、R2分別為0.275 9 mg/L、0.616 0 mg/L和0.954 7,比傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡(luò)模型分別提高25.14%、13.25%和2.22%。