国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘農(nóng)田灌溉工程智能應(yīng)用研究

2022-09-14 05:52:10吾古麗江斯特瓦地
關(guān)鍵詞:需水量決策樹用水量

吾古麗江·斯特瓦地

(高昌區(qū)水管總站,新疆 吐魯番 838000)

農(nóng)田灌溉是在農(nóng)業(yè)生產(chǎn)的環(huán)節(jié),我國農(nóng)業(yè)用水量占全國總水量的 十分之七以上[1]。與傳統(tǒng)的灌溉技術(shù)相比,智能化農(nóng)田灌溉系統(tǒng)為機井配置了遠程智能監(jiān)控設(shè)備,通過智能化建設(shè)挖掘數(shù)據(jù),準確監(jiān)測并顯示地下水位變化、土壤墑情等各項信息,極大地改善了農(nóng)業(yè)生產(chǎn)基礎(chǔ)條件,提高水資源的合理利用率[2]。目前國內(nèi)外對精準智能化農(nóng)田灌溉工程進行了相關(guān)研究,主要分為無線傳感網(wǎng)絡(luò)技術(shù)、模糊控制技術(shù)、物聯(lián)網(wǎng)技術(shù)以及專家系統(tǒng)控制技術(shù)[3-4],此外還有部分學(xué)者采用無線傳感網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型以及智能灌溉專家決策系統(tǒng)等對智能灌溉進行了研究[5-11]。然而當前的研究,很少考慮數(shù)據(jù)來源的可靠性,因此做出來的灌溉優(yōu)化設(shè)計與實際具有一定偏差。本文提出了REP數(shù)據(jù)前處理方法,先對比分析了基于參考蒸散量的預(yù)處理(REP)和等水量分布(EWD)方法在建立灌溉數(shù)據(jù)庫中的優(yōu)異性,之后采用人工神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林、邏輯回歸、決策樹對灌溉需水量的智能預(yù)測進行了分析,研究成果可為相關(guān)工程提供參考。

1 數(shù)據(jù)收集

為了建立訓(xùn)練數(shù)據(jù)集,從灌區(qū)收集了三種不同類別的數(shù)據(jù)。第一種提供了灌區(qū)作物不同生長季節(jié)的總用水量信息,第二種是研究區(qū)域內(nèi)氣象站監(jiān)測的氣象數(shù)據(jù),第三種是兩種類型的空間數(shù)據(jù):(1)土地利用覆蓋圖像,提供有關(guān)作物種植的信息。(2)土壤類型圖像,提供與研究區(qū)域相關(guān)的不同土壤類型的信息。本文選擇對作物用水有重大影響的屬性,以及在整個種植季節(jié)都可用的數(shù)據(jù),例如,“種植期”與作物用水有著密切的關(guān)系。本文的訓(xùn)練集包含由各種天氣參數(shù)屬性組成的歷史數(shù)據(jù),如最高和最低溫度、風(fēng)速、濕度、降雨、太陽輻射,以及土壤類型、作物類型和作物用水,見表1。表1中的作物用水屬性稱為“類”屬性,其他所有屬性稱為“非類”屬性。數(shù)據(jù)集是一個二維表,其中列是屬性(分類和數(shù)值),行是記錄。每條記錄保存一天內(nèi)相應(yīng)屬性的每日平均值。土壤類型和作物類型等屬性歸類為類別屬性,而所有其他非類別屬性歸類為數(shù)字屬性。

表1 各屬性組成的訓(xùn)練集

2 基于REP數(shù)據(jù)預(yù)處理

第一種信息僅僅提供了灌區(qū)作物不同生長季節(jié)的總用水量信息,然而灌區(qū)并非每天供水,因此只能獲得任何特定日期的供水量信息,而無法估計特定一天作物的確切用水量。然而,為了獲得非類屬性和類屬性之間的精確關(guān)系,需要訓(xùn)練數(shù)據(jù)集記錄每日作物用水量。因此,本文提出了一種數(shù)據(jù)預(yù)處理方法,稱為基于參考蒸散量的預(yù)處理(REP),用于估算農(nóng)場的日常作物用水量。此外,我們還將提出的REP技術(shù)與基于等水量分布的預(yù)處理(EWD)進行了比較。在等水量分配技術(shù)(EWD)中,我們將輸送到灌區(qū)的水量除以兩次連續(xù)輸送之間的天數(shù),可以得到每天的平均用水量。然而,如果平均分配用水,那么無論天氣條件如何,每天的用水量都是一樣的。由于實際作物用水量與天氣條件有著密切的關(guān)系,因此需要在數(shù)據(jù)集中獲得更準確的用水量數(shù)據(jù),在精確數(shù)據(jù)集上應(yīng)用分類模型來探索非類別屬性和類別屬性(作物用水)之間的精確關(guān)系。

在估計每日用水量時,考慮了參考蒸散ETo因子,作物用水量可以通過作物系數(shù)Kc和參考蒸散量ETo的乘積來計算。對于特定的生長階段,每種作物都有一個恒定的作物系數(shù)值。計算特定一天的作物用水量如下:設(shè)n為灌區(qū)連續(xù)兩次供水之間的天數(shù),WT為n天開始時供水期間的供水量,nd中每一天的ETo值從氣象站獲得。在確定這些參數(shù)過后,計算第i天的系數(shù)xi,見式(1):

(1)

3 算法預(yù)測原理

3.1 人工神經(jīng)網(wǎng)絡(luò)(ANN)

人工神經(jīng)網(wǎng)絡(luò)是一種由生物啟發(fā)的,用來構(gòu)建可以學(xué)習(xí)并且獨立解釋數(shù)據(jù)中聯(lián)系的計算機程序的方法。每個神經(jīng)元以一組x變量(取值從1到n)的值作為輸入,計算預(yù)測的y-hat值。假設(shè)訓(xùn)練集中含有m個樣本,則向量x表示其中一個樣本的各個特征的取值。此外,每個單元有自己的參數(shù)集需要學(xué)習(xí),包括權(quán)重向量和偏差,分別用w和b表示。在每次迭代中,神經(jīng)元基于本輪的權(quán)重向量計算向量x的加權(quán)平均值,再加上偏差。最后,將計算結(jié)果代入一個非線性激活函數(shù)g。其計算過程如式(2)~式(3):

(2)

yk=g(sk)

(3)

式中:角標k為第k個神經(jīng)元;xj為輸入?yún)?shù)向量,表示未知量個數(shù);wj,k為各參數(shù)權(quán)重;bk為閾值;yk為輸出值;g(sk)為非線性激活函數(shù);sk為第一次進行權(quán)重分配后的輸入值。

3.2 支持向量機(SVM)

支持向量機是一種基于統(tǒng)計學(xué)的最先進的神經(jīng)網(wǎng)絡(luò)方法。支持向量機算法的基礎(chǔ)是最大間隔分類器,最大間隔分類器雖然很簡單,但不能應(yīng)用于大部分數(shù)據(jù),因為大部分屬是非線性數(shù)據(jù),無法用線性分類器進行分類,解決方案是對特征空間進行核函數(shù)映射,然后再運行最大間隔分類器。支持向量機的核函數(shù)映射是一種擴展特征空間的方法,核函數(shù)的核心思想是計算兩個數(shù)據(jù)點的相似度。

3.3 決策樹(DT)

決策樹是一中監(jiān)督機器學(xué)習(xí)算法,該算法根據(jù)數(shù)據(jù)的特征進行逐層劃分直到劃分完所有的特征,這一過程類似于樹葉生長過程。決策樹算法可用于解決分類和回歸問題,在實際數(shù)據(jù)分析中有著廣泛的應(yīng)用,比較經(jīng)典的決策樹算法有CART、ID3等等。

3.4 隨機森林(RF)

隨機森林由Leo Breiman(2001)提出的一種分類算法,他通過自助法(bootstrap)重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機抽取n個樣本生成新的訓(xùn)練樣本集合訓(xùn)練決策樹,然后按以上步驟生成m棵決策樹組成隨機森林,新數(shù)據(jù)的分類結(jié)果按分類樹投票多少形成的分數(shù)而定。

3.5 邏輯回歸(LR)

邏輯回歸模型的主要目標是基于訓(xùn)練數(shù)據(jù)集上提取的知識預(yù)測新給定數(shù)據(jù)的標簽。邏輯回歸可以分為兩種類型:簡單邏輯回歸和多元邏輯回歸。簡單邏輯回歸用于預(yù)測類別值,因為他是分類的,并且只有兩種可能的結(jié)果,然而,多元邏輯回歸可以用來預(yù)測由三個或更多可能結(jié)果組成的類值。

4 REP與EWD前處理方法對比分析

為了評估數(shù)據(jù)預(yù)處理技術(shù)的優(yōu)異,構(gòu)建了兩個訓(xùn)練數(shù)據(jù)集D1和D2。數(shù)據(jù)集D1使用等水量分布(EWD)方法,D2使用基于參考蒸散量的預(yù)處理(REP)方法。本文在訓(xùn)練數(shù)據(jù)集上應(yīng)用決策樹算法(C4.5)來提取非類屬性和類屬性之間的關(guān)系,然后將其應(yīng)用于測試數(shù)據(jù)集,以測試預(yù)測準確性。之后,在D1上使用帶有反饋的三層前饋結(jié)構(gòu)構(gòu)建人工神經(jīng)網(wǎng)絡(luò),將數(shù)據(jù)集分為三部分:70%、20%和10%用于訓(xùn)練、驗證和測試。網(wǎng)絡(luò)的訓(xùn)練使用兩種不同的網(wǎng)絡(luò)類型,第一種是使用8個節(jié)點,1個隱藏層,第二種是使用6個節(jié)點,1個隱藏層。兩種網(wǎng)絡(luò)都接受了30 000次、50 000次和70 000次學(xué)習(xí)迭代的訓(xùn)練。通過比較預(yù)測精度,對數(shù)據(jù)集D上的模型進行性能評估。計算時使用3折交叉驗證方法進行預(yù)測精度分析,這是一種通過將數(shù)據(jù)集劃分為三個相等部分(也稱為a倍)來測試精度的方法,其中數(shù)據(jù)集的兩部分用于訓(xùn)練,第三部分用于測試。該過程持續(xù)3次,以便數(shù)據(jù)集的每個部分都用于測試一次。D總共有6070條記錄,其中2023條記錄用于每次交叉驗證中的測試。

表2為基于EWD和REP方法模型的每折的預(yù)測精度。由表可知,對于EWD方法,隨機森林方法相比其他算法預(yù)測精度都好,平均準確率為51%,而對于REP方法,在所有其他技術(shù)中,RF的預(yù)測性能仍然最好,其次是決策樹和支持向量機。其中,RF的預(yù)測準確率為78%,而DT和SVM的預(yù)測準確率分別為74%和64%,ANN和LR回歸的準確性較低,但ANN在數(shù)據(jù)集D1上的性能優(yōu)于SVM。從上表還可看出,數(shù)值結(jié)果清楚地表明了基于灌溉工程和數(shù)據(jù)挖掘知識的數(shù)據(jù)預(yù)處理的有效性,REP方法處理數(shù)據(jù)的優(yōu)勢明顯大于EWD方法。

表2 基于EWD和REP方法模型的每折的預(yù)測精度

5 灌溉量預(yù)測分析

本文將6個模型均應(yīng)用于灌區(qū)的每個灌溉子區(qū)域,以獲得整個種植季節(jié)的需水量,其中5個機器學(xué)習(xí)模型,1個傳統(tǒng)的ETo預(yù)測方法。通過將每個灌溉子區(qū)域預(yù)測需水量相加,計算每個總的需水量。為節(jié)約篇幅,只將采用RF方法的預(yù)測需水量與實際需水量之間的值給出,如圖1所示。由圖可知,RF方法在一段預(yù)測區(qū)間內(nèi)均表現(xiàn)出良好的預(yù)測精度,實際總灌水量與預(yù)測總灌水量均保持在較小的誤差精度之內(nèi)。其中,RF預(yù)測的需水量與實際耗水量更接近,準確率高達98.5%,表明該模型預(yù)測的貼近度較高。其次是DT和ANN,其準確率分別為94.0%和93.0%,這兩個指標的預(yù)測度與RF方法相差不大。從結(jié)果分析來看,本文采用的機器學(xué)習(xí)方法可為灌區(qū)的需水量預(yù)測提供較好分析工具,大幅度提升灌區(qū)用水資源配置率。

圖1 RF方法的預(yù)測需水量與實際需水量

6 結(jié) 論

本文為提高灌溉用水量預(yù)測精度,提出了一種REP數(shù)據(jù)前處理方法,先對比分析了基于參考REP和EWD方法在建立灌溉數(shù)據(jù)庫中的優(yōu)異性,之后采用人工神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林、邏輯回歸、決策樹對灌溉需水量的智能預(yù)測進行了分析,結(jié)果表明經(jīng)過REP方法處理后的數(shù)據(jù),對后續(xù)用水量預(yù)測精度具有大幅度提升,優(yōu)勢明顯大于EWD方法。此外RF預(yù)測的需水量與實際耗水量更接近,準確率高達98.5%,其次是DT和ANN,其準確率分別為94.0%和93.0%。

猜你喜歡
需水量決策樹用水量
你的用水量是多少?
澳大利亞研發(fā)出新型農(nóng)業(yè)傳感器可預(yù)測農(nóng)作物用水量
南京城市中心區(qū)生態(tài)需水量探析
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
組合預(yù)測模型在區(qū)域需水量預(yù)測中的應(yīng)用
基于決策樹的出租車乘客出行目的識別
帕滿灌區(qū)供需水量平衡分析
大洋河生態(tài)需水量分析與評價
工業(yè)給排水用水量計算的重要性
大渡口区| 榆中县| 巧家县| 大关县| 卫辉市| 惠安县| 永济市| 谷城县| 肃南| 慈溪市| 光山县| 南丹县| 金昌市| 塘沽区| 磐安县| 郴州市| 罗城| 文化| 庐江县| 泰兴市| 保定市| 游戏| 盐亭县| 峡江县| 集安市| 汉沽区| 宣汉县| 诸暨市| 板桥市| 武穴市| 新乐市| 章丘市| 桃园县| 开鲁县| 石首市| 民乐县| 宿迁市| 金华市| 翁牛特旗| 通辽市| 玉树县|