梁鑫婕,李衛(wèi)東,孟凡謙,張海嘯,李志偉,秦丹陽
(1.河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院,河南 鄭州 450001;2.中國海洋大學(xué)海洋技術(shù)學(xué)院,山東 青島 266000)
土壤水分的測量對于維持作物的正常生長以及提高作物的經(jīng)濟效益具有重大意義,以往傳統(tǒng)的對于土壤水分進(jìn)行預(yù)測的方法是根據(jù)經(jīng)驗公式進(jìn)行計算,其參數(shù)是固定的,不具備實時性的特點,無法滿足對土壤水分含量的動態(tài)預(yù)測,隨著科技快速發(fā)展和我國對農(nóng)業(yè)的結(jié)構(gòu)化調(diào)整,對土壤水分預(yù)測的動態(tài)實時性要求體現(xiàn)出來。因此,通過實現(xiàn)對土壤水分的動態(tài)預(yù)測進(jìn)一步實現(xiàn)對作物的科學(xué)供水,對實現(xiàn)精準(zhǔn)農(nóng)業(yè)具有重要意義[1-10]。
本研究使用爬蟲程序從中國天氣網(wǎng)獲取2018年10月1日—2019年7月10日的歷史氣象數(shù)據(jù),通過土壤墑情檢測儀獲取2018年10月1日—2019年7月10日期間的相關(guān)土壤數(shù)據(jù),將土壤數(shù)據(jù)及氣象數(shù)據(jù)合并作為本研究所使用的實驗數(shù)據(jù)。由于以往研究者對于相關(guān)實驗的研究表明,受氣象因素影響的主要為土壤的地表表面含水量,因此,課題組不再研究地表以下的土壤含水量,僅研究地表含水量,將兩部分?jǐn)?shù)據(jù)結(jié)合整理后總數(shù)據(jù)量為6 796條,部分?jǐn)?shù)據(jù)如表1所示。
對原始數(shù)據(jù)進(jìn)行預(yù)處理,為本研究中用到的神經(jīng)網(wǎng)絡(luò)預(yù)測模型構(gòu)建訓(xùn)練數(shù)據(jù)集,對于數(shù)據(jù)中存在的部分缺失值進(jìn)行補零替換,使用MinMaxScaler函數(shù)對補零后的數(shù)據(jù)進(jìn)行歸一化處理,特性范圍為0~1。從總數(shù)據(jù)中分離出300條作為本實驗的測試集,對于獲得的全體數(shù)據(jù)進(jìn)行歸一化處理,有效保留了數(shù)據(jù)的周期和范圍信息。數(shù)據(jù)預(yù)處理后的部分?jǐn)?shù)據(jù)如表2所示。
表2 預(yù)處理結(jié)果數(shù)據(jù)示例表
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),基本BP算法包含前向傳播和誤差的反向傳播這兩個過程。計算誤差按輸入到輸出的方向進(jìn)行前向傳播,調(diào)整權(quán)值和閾值則是反向傳播。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
將收集的處理后的訓(xùn)練數(shù)據(jù)動態(tài)地傳入BP神經(jīng)網(wǎng)絡(luò)模型中,不斷優(yōu)化權(quán)重文件參數(shù),根據(jù)上一時段的傳感器實測土壤含水量數(shù)據(jù)輸入預(yù)測程序,就可實現(xiàn)基于BP網(wǎng)絡(luò)模型的土壤含水量動態(tài)預(yù)測。
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network)的基本架構(gòu)包含輸入層、輸出層和隱含層。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)的一個變種,引入了環(huán)狀結(jié)構(gòu),在神經(jīng)元和自身之間建立連接,使得前一時序的信息可存儲并影響下一步網(wǎng)絡(luò)輸出。RNN挖掘數(shù)據(jù)中的時序信息以及語義信息的深度表達(dá)能力被充分利用,并在語音識別、語言模型、機器翻譯以及時序分析等方面實現(xiàn)了突破。本研究將此模型用于在時間上動態(tài)地預(yù)測土壤含水量。循環(huán)神經(jīng)網(wǎng)絡(luò)會記憶之前的信息,并利用之前的信息影響后面結(jié)點的輸出。RNN網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示。
圖2 RNN網(wǎng)絡(luò)結(jié)構(gòu)圖
本研究中土壤含水量預(yù)測模型使用均方根誤差(RMSE)、預(yù)測準(zhǔn)確率以及可決系數(shù)R2評估模型優(yōu)劣。均方根誤差公式如下:
式中,n表示測量次數(shù),di為一組測量值與真值的偏差。
傳統(tǒng)的土壤含水量預(yù)測模型是根據(jù)以往的測量數(shù)據(jù)進(jìn)行公式推導(dǎo),主要使用經(jīng)驗預(yù)測公式計算,參數(shù)固定。如圖3所示,是選取部分真實值和預(yù)測值進(jìn)行對比所得到的傳統(tǒng)土壤水分預(yù)測結(jié)果示例圖。由圖3可以看出傳統(tǒng)的對于土壤水分的預(yù)測方法與實際值存在一定的偏差。
圖3 傳統(tǒng)土壤水分預(yù)測結(jié)果示例圖
課題組使用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建不同小時尺度的土壤含水量預(yù)測模型,分別建立1 h和4 h預(yù)測模型用于檢驗不同模型之間的差異。對訓(xùn)練組數(shù)據(jù)進(jìn)行訓(xùn)練得到權(quán)重文件,預(yù)測未來1 h和4 h土壤含水量,部分預(yù)測數(shù)據(jù)與實際值如表3所示。
表3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測數(shù)據(jù)表
由上表可以看出隨時間尺度的增加,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測精度有所降低,圖4為模型擬合過程。圖4(a)為1 h模型的擬合過程,圖4(b)為4 h模型的擬合過程。
圖4 BP模型訓(xùn)練圖
本研究使用RNN建立不同的小時尺度土壤含水量預(yù)測模型,分別建立1 h、2 h、3 h、4 h預(yù)測模型,對不同模型的結(jié)果進(jìn)行詳細(xì)分析,部分測試結(jié)果數(shù)據(jù)如表4所示。
表4 RNN預(yù)測結(jié)果示例表
各模型訓(xùn)練過程圖如圖5所示,圖中(a)、(b)、(c)、(d)分別為1 h、2 h、3 h、4 h預(yù)測模型的訓(xùn)練過程。各模型預(yù)測評估結(jié)果如表5所示,由表5可以看出使用傳統(tǒng)公式法對土壤含水量進(jìn)行預(yù)測的準(zhǔn)確率僅為54.3%,均方根誤差為5.548,可決系數(shù)僅為0.023,表明數(shù)據(jù)離散程度較高。而且傳統(tǒng)土壤水分含量預(yù)測公式為逐日遞推公式,公式魯棒性差,預(yù)測出來的數(shù)據(jù)結(jié)果不具備可靠性。
圖5 RNN模型訓(xùn)練圖
表5 預(yù)測結(jié)果評估表
相較傳統(tǒng)預(yù)測公式方法,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型可根據(jù)學(xué)習(xí)過程中動態(tài)輸入的影響因子預(yù)測土壤的含水量,對后1 h土壤含水量情況進(jìn)行精確預(yù)測,結(jié)果離散程度大幅降低,模型帶來的優(yōu)化效果顯著,可決系數(shù)由原來的0.023提升至0.926。但是此模型在增加預(yù)測的時間間隔后數(shù)據(jù)準(zhǔn)確率有明顯下降,由原來的96.5%下降至95.9%,均方根誤差由原來的0.328升高至0.891,可決系數(shù)由0.926降至0.499,降低0.427。
相較于BP神經(jīng)網(wǎng)絡(luò)模型,RNN土壤含水量預(yù)測模型的離散程度更低,RMSE降低至0.306,真實數(shù)據(jù)與預(yù)測數(shù)據(jù)的誤差較小,可決系數(shù)升高至0.941,易得RNN模型對于土壤含水量的動態(tài)預(yù)測具有更好的效果。且RNN對于不同時間尺度的預(yù)測都保持較高的準(zhǔn)確率,均在96%以上。本研究可以得出隨著預(yù)測時間尺度的增加,BP神經(jīng)網(wǎng)絡(luò)和RNN模型預(yù)測數(shù)據(jù)的離散程度及相似程度均有所下降,RNN動態(tài)預(yù)測模型對比BP神經(jīng)網(wǎng)絡(luò)算法有更大的優(yōu)勢,RMSE上升幅度僅為0.235,R2降低0.067,RNN模型預(yù)測得到的數(shù)據(jù)具有更高的可信度。
在當(dāng)代中國科技日益創(chuàng)新和農(nóng)業(yè)快速發(fā)展、國家大力推進(jìn)供給側(cè)結(jié)構(gòu)改革的大形勢下,精準(zhǔn)農(nóng)業(yè)成為我國發(fā)展的目標(biāo),把科學(xué)技術(shù)應(yīng)用到農(nóng)業(yè)發(fā)展上來,正是國家政策的要求。農(nóng)業(yè)生產(chǎn)過程中對于水資源科學(xué)管理的要求日益增長,面對世界上淡水資源緊缺的問題,研究如何節(jié)約用水,把每一滴水用到該用的地方去對于保護水資源有重大意義。如今,隨著深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,課題組根據(jù)實際數(shù)據(jù)對提出的兩種土壤水分動態(tài)預(yù)測模型進(jìn)行研究,結(jié)果表明RNN動態(tài)預(yù)測模型具有較高的準(zhǔn)確率。