牟文芊
摘要: 機器學(xué)習(xí)是人工智能的核心內(nèi)容之一,其應(yīng)用已經(jīng)滲透到了人類社會的各個領(lǐng)域。本文闡述了機器學(xué)習(xí)的基本概念和基本原理,介紹了幾種常用的機器學(xué)習(xí)方法的基本概念和基本原理。在此基礎(chǔ)上,以農(nóng)業(yè)為背景,介紹了機器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中的應(yīng)用。
【關(guān)鍵詞】現(xiàn)代農(nóng)業(yè) 機器學(xué)習(xí) 人工智能
1 引言
農(nóng)業(yè)農(nóng)村發(fā)展關(guān)系到我國實現(xiàn)小康社會的戰(zhàn)略目標(biāo)能否如期實現(xiàn),而現(xiàn)代農(nóng)業(yè)則是推動農(nóng)業(yè)農(nóng)村發(fā)展的關(guān)鍵要素。機器學(xué)習(xí)是人工智能研究的核心之一,將機器學(xué)習(xí)應(yīng)用于現(xiàn)代農(nóng)業(yè)生產(chǎn)中,能夠有效地推動現(xiàn)代農(nóng)業(yè)的發(fā)展,推進(jìn)實現(xiàn)農(nóng)業(yè)生產(chǎn)自動化和智能化,提高農(nóng)業(yè)生產(chǎn)的效率。
2 機器學(xué)習(xí)
機器學(xué)習(xí)是讓計算機模擬人的學(xué)習(xí)活動,獲取新知識、不斷改善性能和實現(xiàn)自身完善的智能方法。機器學(xué)習(xí)方法分為有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
2.1 有監(jiān)督學(xué)習(xí)
有監(jiān)督學(xué)習(xí)首先利用有標(biāo)號的樣本進(jìn)行訓(xùn)練,構(gòu)建相應(yīng)的學(xué)習(xí)模型。再利用該模型對未知樣本數(shù)據(jù)進(jìn)行分類和預(yù)測。這個學(xué)習(xí)過程與人類認(rèn)識事物的過程非常相似。
2.2 無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)是通過對無標(biāo)簽樣本進(jìn)行的學(xué)習(xí),即事先并不需要知道樣本的類別,而是通過某種方法,按照相似度的大小進(jìn)行分類。這種學(xué)習(xí)方法直接對數(shù)據(jù)進(jìn)行建模,并不需要任何訓(xùn)練樣本。
2.3 半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)是有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的結(jié)合,是利用有類標(biāo)號的數(shù)據(jù)和無類標(biāo)號的數(shù)據(jù)進(jìn)行學(xué)習(xí)的過程。其特點是利用少量有標(biāo)號樣本和大量無標(biāo)號樣本進(jìn)行機器學(xué)習(xí)?,F(xiàn)實世界尤其是現(xiàn)代農(nóng)業(yè)中通常存在大量的未標(biāo)注樣本,但有標(biāo)記樣本則比較少,面對大量的無標(biāo)號樣本的標(biāo)注,費時、費力和成本較高。因此半監(jiān)督學(xué)習(xí)的研究對于實際應(yīng)用是非常有意義的。
下面介紹幾種常用的機器學(xué)習(xí)算法。
2.1 決策樹
決策樹( Decision Tree,DT)是一種常見的歸納學(xué)習(xí),能夠從一組無規(guī)則的事例中推理出決策樹的表示形式,常用來構(gòu)建或設(shè)計分類器和預(yù)測模型,對未知數(shù)據(jù)進(jìn)行分類或預(yù)測等。
決策樹算法包括兩個步驟:
(1)利用訓(xùn)練樣本數(shù)據(jù)來創(chuàng)建決策樹模型;
(2)利用創(chuàng)建的決策樹模型對新數(shù)據(jù)進(jìn)行分類。創(chuàng)建決策樹的流程如圖1所示,其中S表示訓(xùn)練樣本集,A表示分類樣本集合,N表示葉節(jié)點。
2.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)( Artificial NeuralNetwork,ANN)是一種模仿自然界神經(jīng)網(wǎng)絡(luò)的功能和結(jié)構(gòu),通過調(diào)整內(nèi)部大量人工神經(jīng)元之間相互連接的權(quán)重,對信息進(jìn)行處理的數(shù)學(xué)模型。人工神經(jīng)元結(jié)構(gòu)由輸入向量、激活函數(shù)及輸出向量三部分組成。輸入向量X= {xo0,x1.. xn}與對應(yīng)的權(quán)值向量w= {w0,W1…Wn}分別相乘,再取和作為輸入值(
),w和x倒過來在激活函數(shù)的作用下輸出對應(yīng)的f(∑xi.wi+b),其中b為激活函數(shù)的閩值,人工神經(jīng)元的結(jié)構(gòu)如圖2所示。目前ANN已經(jīng)廣泛應(yīng)用于信息處理、預(yù)測分析等領(lǐng)域。
2.3 支持向量機
支持向量機是一種建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上的一種機器學(xué)習(xí)算法。這種算法在解決有限樣本、非線性、高維的模式分類等問題中表現(xiàn)出許多獨特的優(yōu)勢。在深度學(xué)習(xí)的熱潮來臨之前,支持向量機一直在機器學(xué)習(xí)領(lǐng)域占有重要的地位。
支持向量機通過非線性映射,把樣本空間映射到更高維的特征空間中,使非線性可分問題轉(zhuǎn)化為在特征空間中的線性可分。在一般情況下,升維使計算變得更加困難,但是支持向量機應(yīng)用核函數(shù)展開定理解決了這個難題。如圖3所示,支持向量機使用一個超平面把訓(xùn)練集中兩類樣本分開,即兩類點分別在超平面的兩側(cè)。作為一種有效的機器學(xué)習(xí)工具,支持向量機廣泛地應(yīng)用于各個領(lǐng)域。
2.4 聚類
聚類是將數(shù)據(jù)集中的所有樣本根據(jù)相似度的大小進(jìn)行劃分,形成兩個或多個類的過程。聚類沒有訓(xùn)練過程,即聚類不需要樣本有標(biāo)號,而分類需要有標(biāo)號的樣本進(jìn)行訓(xùn)練。常用的聚類算法是基于層次和基于劃分的聚類?;趯哟蔚木垲愔饕校浩胶獾鳒p聚類法、基于密度的聚類方法和使用代表點的聚類方法等;基于劃分的聚類方法主要有:K均值聚類算法、K中心點算法和隨機搜索聚類算法等。聚類算法常用于數(shù)據(jù)挖掘和模式識別中。其中K均值聚類算法最為常用,它采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個樣本的距離越近,其相似度就越大。圖4為K均值聚類算法流程。
2.5 深度學(xué)習(xí)
深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,它是在人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展起來的,最早由加拿大多倫多大學(xué)辛頓教授于2006年提出。深度學(xué)習(xí)中的“深度”,是相對于支持向量機和多層感知機等“淺層學(xué)習(xí)”方法而言的。深度學(xué)習(xí)與“淺層學(xué)習(xí)”相比,非線性操作的層級數(shù)更多。它通過對原始輸入進(jìn)行逐層特征變換,能夠自動地學(xué)習(xí)得到輸入數(shù)據(jù)特征的表示,因此在分類問題上取得了更好的效果。常用的深度學(xué)習(xí)方法有CNN和自動編碼器等。目前深度學(xué)習(xí)已經(jīng)在圖像識別和語音識別中的應(yīng)用取得了突破性的進(jìn)展。2012年,Hinton團(tuán)隊在ImageNet圖片分類大賽中,使用深度學(xué)習(xí)技術(shù)取得了冠軍。
3 機器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中的應(yīng)用
機器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)中正在發(fā)揮著積極的重要作用,本文主要從5個方面闡述如下。
3.1 作物育種
作物育種是一種通過改良作物的遺傳特性,來培育高產(chǎn)優(yōu)質(zhì)品種的技術(shù)。農(nóng)業(yè)育種專家通過尋找優(yōu)良性狀來提高農(nóng)作物產(chǎn)量,更高效地利用水分、養(yǎng)分,適應(yīng)氣候變化和抵御病蟲害,實現(xiàn)農(nóng)業(yè)作物的高產(chǎn)和穩(wěn)產(chǎn)等。植株遺傳優(yōu)良性狀的關(guān)鍵在于必須找到其對應(yīng)的基因序列。機器學(xué)習(xí)技術(shù)能夠分析以往的農(nóng)田數(shù)據(jù),包括農(nóng)作物在不同氣候條件下的表現(xiàn)和某種特定表型的遺傳性等,挖掘出其中的關(guān)聯(lián)規(guī)則,然后搭建概率模型,預(yù)測哪些基因最有可能參與植物的某種優(yōu)良性狀的表達(dá),幫助育種專家進(jìn)行合理的育種實驗。機器學(xué)習(xí)技術(shù)應(yīng)用于作物育種,不僅提高了育種的效率,而且能夠幫助育種專家對更多的變量進(jìn)行評估,提高了育種的準(zhǔn)確率。
3.2 農(nóng)作物病害識別
病害是導(dǎo)致農(nóng)作物減產(chǎn)的重要因素之一,傳統(tǒng)的農(nóng)作物病害識別方法基本上是依靠相關(guān)專家的專業(yè)知識和工作經(jīng)驗進(jìn)行識別,費時費力,效率較低,并且容易產(chǎn)生人為誤差,嚴(yán)重影響農(nóng)作物病害防治工作的高效性。深度學(xué)習(xí)通過訓(xùn)練大量農(nóng)作物病害圖像,能夠從中自動學(xué)習(xí)每種病害特征的表示,并建立相應(yīng)的預(yù)測模型。農(nóng)戶將遙感衛(wèi)星和無人機等拍下的農(nóng)田影像資料以及智能手機拍攝的照片上傳到云平臺后,模型能夠自動確定其所屬的病害類別,不僅提高了檢測的效率,而且實現(xiàn)了更精準(zhǔn)的病害診斷,減少了因失誤造成的資源浪費。
3.3 農(nóng)作物蟲害預(yù)測
蟲害是危害農(nóng)產(chǎn)物產(chǎn)量和品質(zhì)的重要因素,我國農(nóng)作物蟲害種類多、影響范圍廣,防治不及時易爆發(fā),對作物生產(chǎn)造成了嚴(yán)重影響。對蟲害發(fā)生程度進(jìn)行準(zhǔn)確的預(yù)測,在我國的農(nóng)作物安全生產(chǎn)中具有重要的地位。只有準(zhǔn)確預(yù)測農(nóng)作物蟲害的發(fā)生才能為各類農(nóng)業(yè)政策的制定提供有效參考,及時地采取預(yù)防措施,做到早防早治,降低造成的經(jīng)濟(jì)損失。通過對蟲害發(fā)生程度與空氣氣溫、土壤濕度、天氣狀況和農(nóng)藥施用量等多個外部環(huán)境因子建立回歸模型,掌握其發(fā)生規(guī)律,能夠有效對未來蟲害發(fā)生程度進(jìn)行預(yù)報。目前,馬爾科夫鏈、支持向量回歸、神經(jīng)網(wǎng)絡(luò)和深度回歸等己被廣泛地應(yīng)用于蟲害發(fā)生的預(yù)測中。
3.3 灌溉用水分析
在確保農(nóng)作物生長所需用水量的前提下,減少因水量不足或過多所導(dǎo)致農(nóng)作物旱澇情況的發(fā)生,保證農(nóng)作物高產(chǎn)穩(wěn)產(chǎn),是現(xiàn)代農(nóng)業(yè)灌溉中急需解決的問題之一。利用機器學(xué)習(xí)技術(shù)對農(nóng)作物用水需求量、蒸發(fā)蒸騰量和水文氣象指數(shù)等數(shù)據(jù)進(jìn)行挖掘分析,構(gòu)建智能灌溉控制系統(tǒng),為農(nóng)作物提供最有效的灌溉策略。智能灌溉系統(tǒng)可利用物聯(lián)網(wǎng)技術(shù)在監(jiān)測控制區(qū)域部署無線網(wǎng)絡(luò)、傳感器節(jié)點和灌溉設(shè)備,通過感知土壤水分,對土壤質(zhì)量實時監(jiān)測,來設(shè)置科學(xué)合理的灌溉水量,針對不同環(huán)境靈活選擇不同的灌溉模式,在保證農(nóng)作物生長的同時,也節(jié)約了灌溉用水。
3.4 農(nóng)業(yè)專家系統(tǒng)
農(nóng)業(yè)專家系統(tǒng)是應(yīng)用機器學(xué)習(xí)等人工智能技術(shù),用計算機模擬農(nóng)業(yè)專家的智能,通過各種算法進(jìn)行推理和判斷,為農(nóng)業(yè)中面臨的各種問題提供決策幫助。它是傳播各類農(nóng)業(yè)知識和農(nóng)業(yè)科技的一種途徑。農(nóng)業(yè)專家系統(tǒng)的研制已經(jīng)成為我國農(nóng)業(yè)信息技術(shù)研究的熱點。
3.5 農(nóng)產(chǎn)品電商
農(nóng)產(chǎn)品電商是現(xiàn)代農(nóng)業(yè)新型商業(yè)運作方式,集買賣、線上交易、電子支付及各類綜合服務(wù)為一體,解決了農(nóng)產(chǎn)品市場流通渠道窄、供應(yīng)鏈信息不對稱等問題,給農(nóng)產(chǎn)品零售業(yè)帶來了新的商機。
農(nóng)產(chǎn)品的電商平臺積累了海量的文本數(shù)據(jù)和圖像數(shù)據(jù),如商品描述、用戶評論和用戶咨詢等各種商品的圖像等等。這些數(shù)據(jù)不僅反映了產(chǎn)品特性,也蘊含了用戶的需求以及使用反饋。通過機器學(xué)習(xí)和深度學(xué)習(xí)算法,可以精細(xì)化定位產(chǎn)品與服務(wù)的不足。例如:可以利用機器學(xué)習(xí)中的推薦算法,能夠從農(nóng)產(chǎn)品電商平臺大數(shù)據(jù)中提取用戶和產(chǎn)品等各類數(shù)據(jù),分析各類用戶的消費興趣、消費行為和習(xí)慣,挖掘用戶潛在消費意向和可能的潛在用戶,提高農(nóng)產(chǎn)品交易成功率,營造良好的消費生態(tài)環(huán)境。
4 結(jié)束語
農(nóng)業(yè)農(nóng)村是國之根本,其現(xiàn)代化的發(fā)展水平是我國綜合實力的體現(xiàn)。在新時代下,機器學(xué)習(xí)、人工智能和芯片技術(shù)等新一代信息技術(shù)為現(xiàn)代農(nóng)業(yè)發(fā)展注入新的生機活力。未來機器學(xué)習(xí)新技術(shù)將快速滲透、融入農(nóng)業(yè)產(chǎn)業(yè)中,現(xiàn)代化農(nóng)業(yè)的發(fā)展將迎來新的機遇。
參考文獻(xiàn)
[1]毛林,王坤,成維莉,人工智能技術(shù)在現(xiàn)代農(nóng)業(yè)生產(chǎn)中的應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2018 (05):14 -18.
[2]陳凱,朱鈺,機器學(xué)習(xí)及其相關(guān)算法綜述[J].統(tǒng)計與信息論壇,2007 (05):105-112.
[3]季桂樹,陳沛玲,宋航.決策樹分類算法研究綜述[J].科技廣場,2007 (01):9-12.
[4]付文博,孫濤,梁藉,閆寶偉,范福新,深度學(xué)習(xí)原理及應(yīng)用綜述[J].計算機科學(xué),2018, 45 (Sl): 11-15+4 0.
[5]許少尉,陳思宇.基于深度學(xué)習(xí)的圖像分類方法[J].電子技術(shù)應(yīng)用,2018, 44 (06):116-119.
[6]王秀美,牟少敏,時愛菊,浩慶波.局部支持向量回歸在小麥蚜蟲預(yù)測中的研究與應(yīng)用[J],山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版), 2016, 47 (01): 52-56.
[7]李磊.隨機森林及數(shù)據(jù)可視化在棉蚜等級預(yù)測中的應(yīng)用研究[D].山東農(nóng)業(yè)大學(xué),2017.
[8]韓毅,基于物聯(lián)網(wǎng)的設(shè)施農(nóng)業(yè)溫室大棚智能控制系統(tǒng)研究[D].太原理工大學(xué),2016.
[9]降惠,李杰,農(nóng)業(yè)專家系統(tǒng)應(yīng)用現(xiàn)狀與前景展望[J].山西農(nóng)業(yè)科舉.2012. 40 (01):76-78.