摘要:為了確保農(nóng)業(yè)生產(chǎn)環(huán)境監(jiān)測的準(zhǔn)確性,檢測作物的生長狀況、科學(xué)指導(dǎo)作物生長、實(shí)時監(jiān)控傳感器節(jié)點(diǎn)、及時發(fā)現(xiàn)異常信息、改善整個農(nóng)業(yè)物聯(lián)網(wǎng)的正常運(yùn)行很有必要。基于此,本文基于物聯(lián)網(wǎng)節(jié)點(diǎn)檢測原理,分析農(nóng)業(yè)物聯(lián)網(wǎng)傳感節(jié)點(diǎn)數(shù)據(jù)檢測問題,并提出數(shù)據(jù)異常檢測方法,利用特征模糊聚類概率搜索方法檢測節(jié)點(diǎn)的異常,并建立相應(yīng)的數(shù)學(xué)模型,計(jì)算節(jié)點(diǎn)數(shù)據(jù)與異常數(shù)據(jù)的相關(guān)概率,利用度量準(zhǔn)則進(jìn)行比較,判斷該節(jié)點(diǎn)數(shù)據(jù)是否有異常,以供參考。
關(guān)鍵詞:農(nóng)業(yè)物聯(lián)網(wǎng);數(shù)據(jù)檢測;數(shù)據(jù)異常
一、農(nóng)業(yè)物聯(lián)網(wǎng)傳感節(jié)點(diǎn)數(shù)據(jù)檢測
(一) 農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)應(yīng)用
當(dāng)前,在農(nóng)業(yè)生產(chǎn)領(lǐng)域盡管利用信息化手段進(jìn)行機(jī)械化生產(chǎn),但實(shí)際操作層面上的智能化水平并不高。利用物聯(lián)網(wǎng)不僅可以提高農(nóng)業(yè)數(shù)據(jù)的處理能力,還可以提升應(yīng)用平臺的技術(shù)水平。例如,利用物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)溫室內(nèi)溫度的控制,一方面,通過數(shù)據(jù)技術(shù)增強(qiáng)感溫裝置的作用;另一方面,根據(jù)數(shù)據(jù)分析溫室內(nèi)的氣溫、空氣濕度和農(nóng)作物生產(chǎn)周期,給出最優(yōu)的方案,設(shè)定最優(yōu)的溫度范圍,實(shí)現(xiàn)溫度智能調(diào)整,更好地促進(jìn)農(nóng)作物生長。因此,在應(yīng)用物聯(lián)網(wǎng)的過程中,應(yīng)更多地關(guān)注數(shù)據(jù)技術(shù)的應(yīng)用,把數(shù)據(jù)技術(shù)與物聯(lián)網(wǎng)相結(jié)合,使其更好地發(fā)揮作用,充分利用其在農(nóng)業(yè)信息化建設(shè)中的作用。
(二)物聯(lián)網(wǎng)節(jié)點(diǎn)檢測原理
與互聯(lián)網(wǎng)相比,物聯(lián)網(wǎng)依賴于由傳感器構(gòu)成的傳感網(wǎng)絡(luò)。物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)據(jù)異常檢測又稱物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)據(jù)校驗(yàn),通過與普通節(jié)點(diǎn)的數(shù)據(jù)比對,從而達(dá)到對節(jié)點(diǎn)數(shù)據(jù)的異常檢測?;诖耍瑐鹘y(tǒng)的基于網(wǎng)絡(luò)節(jié)點(diǎn)的特征抽取,必須從網(wǎng)絡(luò)中抽取相同的特征進(jìn)行檢測,而在物聯(lián)網(wǎng)線路中,由于傳感器獲取的信息具有較大的隨機(jī)性和非線性,導(dǎo)致各傳感器收集的數(shù)據(jù)存在一些差異,難以形成統(tǒng)一特征,難以有效描述異常節(jié)點(diǎn),導(dǎo)致節(jié)點(diǎn)定位和判斷不準(zhǔn)確,從而造成物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中數(shù)據(jù)異常檢測精度降低的問題。
針對常規(guī)方法存在的這些缺點(diǎn),本文采用基于特征模糊聚類概率搜索的方法進(jìn)行節(jié)點(diǎn)數(shù)據(jù)的異常識別。該方法克服了傳統(tǒng)的基于節(jié)點(diǎn)單個樣本特性的缺點(diǎn),可以精準(zhǔn)檢測物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中的異常信息,為快速、完整地過濾掉異常信息提供了依據(jù)。
(三)特征模糊聚類概率檢測
農(nóng)業(yè)物聯(lián)網(wǎng)中的異常節(jié)點(diǎn)的檢測大多基于傳感器獲取的差異性信息,難以建立統(tǒng)一的傳輸模式。針對物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中的異常數(shù)據(jù),首先要解決如何通過特征模糊聚類的方法實(shí)現(xiàn)。通過對該矩陣的降維,在該矩陣中選擇待測節(jié)點(diǎn)的數(shù)據(jù),獲得與其相關(guān)的節(jié)點(diǎn),從而篩選出異常數(shù)據(jù)的特征,并進(jìn)行特征模糊聚類,提高異常數(shù)據(jù)的識別率。在對物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)進(jìn)行異常數(shù)據(jù)采集后,統(tǒng)計(jì)特征模糊聚類的概率,判斷該數(shù)據(jù)是否為非正常數(shù)據(jù)。利用常規(guī)方法對傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行異常檢測時,忽視節(jié)點(diǎn)與非正常數(shù)據(jù)的關(guān)聯(lián),導(dǎo)致檢測的準(zhǔn)確率不高,因此可以采用特征模糊聚類方法提高檢測的準(zhǔn)確性。
二、農(nóng)業(yè)物聯(lián)網(wǎng)傳感節(jié)點(diǎn)的數(shù)據(jù)檢測問題
(一)農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)檢測功能
在構(gòu)建農(nóng)業(yè)物聯(lián)網(wǎng)的基礎(chǔ)架構(gòu)后,針對特定的農(nóng)業(yè)生產(chǎn),必須設(shè)計(jì)相應(yīng)的系統(tǒng)功能。農(nóng)業(yè)物聯(lián)網(wǎng)不僅要實(shí)現(xiàn)其基礎(chǔ)功能,還要充分發(fā)揮在農(nóng)業(yè)領(lǐng)域的優(yōu)越性??傮w而言,該系統(tǒng)的設(shè)計(jì)具有如下特點(diǎn)。
第一,實(shí)時環(huán)境監(jiān)控?;A(chǔ)功能是利用各種傳感器實(shí)時監(jiān)控環(huán)境,包括溫度、濕度、二氧化碳濃度、光照、土壤肥力、水分等,并將這些信息以圖像、圖表等方式顯示在網(wǎng)絡(luò)上,然后由服務(wù)平臺進(jìn)行數(shù)據(jù)分析和處理。
第二,遠(yuǎn)程監(jiān)控,除了具備實(shí)時監(jiān)控的作用外,還能對農(nóng)戶進(jìn)行遠(yuǎn)程監(jiān)控。農(nóng)民只需通過手機(jī)或計(jì)算機(jī)登錄該系統(tǒng),通過移動網(wǎng)絡(luò)以及提前設(shè)置的系統(tǒng)參數(shù),智能化遙控大棚內(nèi)的設(shè)施,并隨時查看大棚的具體狀況。
第三,對農(nóng)業(yè)生產(chǎn)的預(yù)測和分析打破了以往農(nóng)民憑經(jīng)驗(yàn)進(jìn)行農(nóng)業(yè)生產(chǎn)的傳統(tǒng)模式。通過大數(shù)據(jù)技術(shù),可以分析作物的生長特性、生長周期、土壤肥力以及土壤干旱程度,從而確定作物的種植面積,并通過大數(shù)據(jù)進(jìn)行預(yù)測,判斷是否會影響作物的生長,從而進(jìn)行調(diào)整。同時,農(nóng)業(yè)物聯(lián)網(wǎng)還應(yīng)具有預(yù)警功能,可以提前設(shè)置作物的理想狀態(tài),當(dāng)超過一定的限度后,系統(tǒng)會發(fā)出預(yù)警信號,提醒農(nóng)民作出調(diào)整。
(二)農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)異常
通常情況下,傳感器節(jié)點(diǎn)會處于較惡劣的環(huán)境中,長時間暴露在陽光、雨水環(huán)境下,會對傳感器節(jié)點(diǎn)造成一定程度的破壞。由于傳感器節(jié)點(diǎn)的損壞,數(shù)據(jù)會出現(xiàn)異常,因此,需要實(shí)時監(jiān)控傳感器網(wǎng)絡(luò)并及時處理,確保整個網(wǎng)絡(luò)的正常運(yùn)轉(zhuǎn)。在農(nóng)業(yè)物聯(lián)網(wǎng)中,傳感器根據(jù)時間順序,連續(xù)采集作物生長和環(huán)境指數(shù),具有周期性、實(shí)時性和無限性的特點(diǎn)。受生產(chǎn)工藝、成本和網(wǎng)絡(luò)等因素的制約,在采集數(shù)據(jù)時,難免會出現(xiàn)異常,導(dǎo)致數(shù)據(jù)質(zhì)量大幅降低,難以保障物聯(lián)網(wǎng)設(shè)備的智能化控制和高效的數(shù)據(jù)分析。因此,有效、實(shí)時地發(fā)現(xiàn)異常信息,是農(nóng)業(yè)信息化管理和決策的關(guān)鍵。
(三)農(nóng)業(yè)物聯(lián)網(wǎng)信息采集平臺
為了實(shí)現(xiàn)農(nóng)業(yè)物聯(lián)網(wǎng)的應(yīng)用層和數(shù)據(jù)處理,要建立農(nóng)田物聯(lián)網(wǎng)信息采集平臺,主要負(fù)責(zé)農(nóng)田的小氣候數(shù)據(jù)采集和大氣總體氣象數(shù)據(jù)收集,而小氣象數(shù)據(jù)采集采用的是基于ZigBee技術(shù)和不同類型的傳感器構(gòu)建的無線傳感器網(wǎng)絡(luò),包括大氣溫度、濕度、二氧化碳、土壤含水量和光照強(qiáng)度等,通過GPRS模塊與PC互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)通訊,將采集到的數(shù)據(jù)上傳到服務(wù)器。利用中國氣象科學(xué)數(shù)據(jù)共享服務(wù)平臺的API接口進(jìn)行采集,利用API接口獲取Json數(shù)據(jù),利用JAVA語言分析獲取實(shí)時天氣數(shù)據(jù),從Tomcat中抽取農(nóng)業(yè)相關(guān)的氣溫、雨量、氣壓和濕度等信息,并上傳服務(wù)器,以便進(jìn)行歷史、實(shí)時的數(shù)據(jù)查詢以及后續(xù)的檢測研究。
(四)異常農(nóng)情數(shù)據(jù)在線監(jiān)測框架
農(nóng)業(yè)異常數(shù)據(jù)的在線監(jiān)測框架如圖1所示。在數(shù)據(jù)采樣間隔、離散程度、周期特性的基礎(chǔ)上,給出了滑窗尺度的計(jì)算方法,該算法首先對T段的數(shù)據(jù)進(jìn)行規(guī)范化,然后根據(jù)數(shù)據(jù)的離散程度、采樣間隔等因素,得出滑動窗口的大小。
(五)農(nóng)田系統(tǒng)數(shù)據(jù)故障類型
在農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)中,當(dāng)某個節(jié)點(diǎn)接收到信息時,會認(rèn)為這一節(jié)點(diǎn)的功能出現(xiàn)了問題。異常值是收集到的數(shù)據(jù)與原來的數(shù)據(jù)不一致,在檢測系統(tǒng)中,數(shù)據(jù)不會隨著時間的推移而發(fā)生變化。數(shù)據(jù)的同質(zhì)性是收集的數(shù)據(jù)很少發(fā)生變化,在這一測試系統(tǒng)中,是指數(shù)據(jù)保持在固定數(shù)值,例如,一天的氣溫在特定的溫度范圍內(nèi)會上下浮動1℃。
三、農(nóng)業(yè)物聯(lián)網(wǎng)傳感節(jié)點(diǎn)數(shù)據(jù)異常檢測方法
(一)特征模糊聚類概率的計(jì)算
在對物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)進(jìn)行異常數(shù)據(jù)采集后,通過分析節(jié)點(diǎn)和異常數(shù)據(jù)的特征模糊聚類概率,判斷該數(shù)據(jù)是否為非正常數(shù)據(jù)。利用常規(guī)方法對傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行異常檢測時,忽視了節(jié)點(diǎn)與非正常數(shù)據(jù)的關(guān)聯(lián),導(dǎo)致檢測的準(zhǔn)確率不高,從而采用基于特征模糊聚類的方法提高檢測的正確性。該方法根據(jù)節(jié)點(diǎn)的特征,可以劃分為異常數(shù)據(jù)和結(jié)點(diǎn)數(shù)據(jù)。在判斷物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)據(jù)為非正常數(shù)據(jù)時,必須計(jì)算特征模糊聚類概率。
在物聯(lián)網(wǎng)中,傳感器節(jié)點(diǎn)數(shù)據(jù)的異常識別是關(guān)鍵,它直接用于預(yù)測該特征的聚類概率,但預(yù)測精度不高,必須采用概率預(yù)測方法。利用傳統(tǒng)的檢測方法和特征模糊聚類概率法檢測物聯(lián)網(wǎng)中傳感器節(jié)點(diǎn)的異常,當(dāng)網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)量較多時,采用特征模糊聚類概率法進(jìn)行檢測的準(zhǔn)確率越高,與傳統(tǒng)檢測方法相比的優(yōu)勢就越大,而節(jié)點(diǎn)的異常檢測可以有效解決傳統(tǒng)檢測方法存在的高漏檢率問題。
(二)基于統(tǒng)計(jì)學(xué)方法的數(shù)據(jù)異常檢測方法
應(yīng)用統(tǒng)計(jì)學(xué)方法首先給出了隨機(jī)分布概率分布的數(shù)學(xué)模型,該模型分布可能為正態(tài)分布或泊松分布,在計(jì)算集合中,每個與模型數(shù)據(jù)相符的概率都會列出來,其中一些概率較小的出現(xiàn)異常。采用聚類技術(shù)對數(shù)據(jù)進(jìn)行分類,通過聚類操作,在出現(xiàn)異常數(shù)據(jù)時,會發(fā)現(xiàn)某一簇或多簇的樣本數(shù)據(jù)很少,且與其他簇之間存在較大差異,通常情況下,簇內(nèi)的數(shù)據(jù)為異常。在這種情況下,距離檢測技術(shù)必須先確定數(shù)據(jù)之間的距離,再計(jì)算數(shù)據(jù)之間的間隔,如果數(shù)據(jù)之間的間隔較近就是正常的數(shù)據(jù),而一旦距離超出某一范圍,就會被稱之為“離群點(diǎn)”,但距離異常的檢測時間更長。利用密度檢測異常數(shù)據(jù),是基于距離的方法,可以把各個點(diǎn)之間的間隔和數(shù)目綜合起來,從而獲得數(shù)據(jù)的密度?;诿芏鹊漠惓z測技術(shù)能有效識別區(qū)域異常,但由于是基于距離的異常檢測,所以計(jì)算量較大。
(三)基于時空相關(guān)性的數(shù)據(jù)異常檢測方法
前期工作中,統(tǒng)計(jì)和分析了大量的歷史數(shù)據(jù),得到兩個相鄰樣本之間的差值,即一個隨機(jī)變量的平均和變化,為時間相關(guān)性的檢測奠定了基礎(chǔ)。通過K-means算法對各個檢測節(jié)點(diǎn)進(jìn)行空間聚類,可以改善相同聚類中節(jié)點(diǎn)的空間相似性,為檢測提供依據(jù)。
在實(shí)時監(jiān)控中,采用基于時間相關(guān)性和空間相關(guān)性的方法。該方法首先對當(dāng)前的數(shù)據(jù)進(jìn)行時間相關(guān)性檢測,結(jié)果表明數(shù)據(jù)是正確的,將在下次采集到的數(shù)據(jù)中繼續(xù)進(jìn)行檢測;當(dāng)結(jié)果出現(xiàn)問題時,節(jié)點(diǎn)會向中心節(jié)點(diǎn)報(bào)告可疑信息,由中心節(jié)點(diǎn)進(jìn)行空間相關(guān)性檢測,如果檢測結(jié)果為正常,則判定為錯誤;如果結(jié)果異常說明傳感器的結(jié)點(diǎn)可能出現(xiàn)問題。時間相關(guān)性檢測是對數(shù)據(jù)進(jìn)行一級過濾,可以快速處理每條數(shù)據(jù);空間相關(guān)性檢測是一種二次過濾,能有效排除錯誤信息,提高算法的準(zhǔn)確性。該方法簡單、計(jì)算量小、由傳感器節(jié)點(diǎn)本身實(shí)現(xiàn)分布式故障檢測,無需與其他節(jié)點(diǎn)數(shù)據(jù)交換,可以降低網(wǎng)絡(luò)的通訊費(fèi)用;空間相關(guān)性檢測要求集群中各個結(jié)點(diǎn)的數(shù)據(jù)都集中在一個中心節(jié)點(diǎn)上進(jìn)行,相對于大量的常規(guī)數(shù)據(jù),利用時間相關(guān)性進(jìn)行檢測可以發(fā)現(xiàn),異常數(shù)據(jù)出現(xiàn)的可能性較低,不會產(chǎn)生過多的計(jì)算量。
四、結(jié)語
綜上所述,本文主要研究物聯(lián)網(wǎng)技術(shù)在現(xiàn)代農(nóng)業(yè)中的應(yīng)用,提出一種新的基于時空相關(guān)技術(shù)的網(wǎng)絡(luò)節(jié)點(diǎn)故障診斷方法,該方法可以確保在高精度的情況下,快速檢測故障傳感器節(jié)點(diǎn),其中,采用基于時間相關(guān)的方法,可以實(shí)現(xiàn)分布式運(yùn)算,而且無需節(jié)點(diǎn)之間的通訊。
參考文獻(xiàn):
[1]林山馳,劉林,李相國.基于多信息融合的設(shè)施農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)設(shè)計(jì)[J].現(xiàn)代信息科技,2022,06(19):136-141.
[2]王波.基于物聯(lián)網(wǎng)的無線傳感網(wǎng)絡(luò)數(shù)據(jù)采集方法[J].內(nèi)蒙古民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,34(01):9-14.
[3]王文,饒?jiān)罱B穩(wěn),等.基于預(yù)測模型的異常農(nóng)情數(shù)據(jù)在線檢測方法的研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,46(04):495-500.
[4]諶頏,戴華珍,龔文靜,等.智慧農(nóng)業(yè)物聯(lián)網(wǎng)控制系統(tǒng)設(shè)計(jì)與研究[J].信息記錄材料,2022,23(04):195-197.
[5]彭旭,饒?jiān)瑔萄?基于寬度卷積神經(jīng)網(wǎng)絡(luò)的異常農(nóng)情數(shù)據(jù)檢測方法[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2022,43(02):113-121.
[6]黃華.物聯(lián)網(wǎng)中傳感節(jié)點(diǎn)數(shù)據(jù)異常檢測方法研究[J].計(jì)算機(jī)仿真,2012,29(05):159-162.
[7]金鵬,夏曉峰,喬焰,等.基于深度信念網(wǎng)絡(luò)的高維傳感器數(shù)據(jù)異常檢測算法[J].傳感技術(shù)學(xué)報(bào),2019,32(06):892-901.
[8]段青玲,肖曉琰,劉怡然,等.基于SW-SVR的畜禽養(yǎng)殖物聯(lián)網(wǎng)異常數(shù)據(jù)實(shí)時檢測方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(08):159-165.
[9]李汀.基于區(qū)塊鏈的工業(yè)物聯(lián)網(wǎng)節(jié)點(diǎn)行為數(shù)據(jù)分析與追蹤模型研究[D].重慶:重慶郵電大學(xué),2020.
作者簡介:王飛鴻(1999),男,浙江省溫州市人,碩士研究生,主要研究方向?yàn)橹腔坜r(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)異常檢測、智慧城市物聯(lián)網(wǎng)異常檢測,郵箱:2281777777@qq.com。