錢曄 孫吉紅 李曉曙 徐敏 劉庭 姜微微
摘要:為確保白芨種植戶(企業(yè))獲得最大的經(jīng)濟(jì)效益,科研人員取得精確的數(shù)據(jù)進(jìn)行科學(xué)研究。首先,收集白芨種植過程中,澆水量、施肥量、噴灑農(nóng)藥量以及對應(yīng)的單位面積產(chǎn)量等數(shù)據(jù),構(gòu)建基于廣義回歸神經(jīng)網(wǎng)絡(luò)(general regression neural network,簡稱GRNN)算法的智能預(yù)測模型對特定種植條件下白芨的產(chǎn)量進(jìn)行預(yù)測,得到不同種植環(huán)境下白芨的不同產(chǎn)量數(shù)據(jù);然后,將這些數(shù)據(jù)輸入信息系統(tǒng)中,為用戶提供數(shù)據(jù),以便于在最適合的條件下種植白芨。試驗結(jié)果表明,GRNN在小樣本構(gòu)建智能預(yù)測模型時能夠取得較好的預(yù)測效果。因此,在白芨種植過程中,當(dāng)測試數(shù)據(jù)、輸入數(shù)據(jù)不斷增大的同時,采用該模型能夠為種植戶(企業(yè))提高更精準(zhǔn)的種植信息,最大化地提高產(chǎn)量,增加經(jīng)濟(jì)效益;為科研人員提供準(zhǔn)確的數(shù)據(jù)確保研究成果的真實性。
關(guān)鍵詞:白芨;智能;預(yù)測;GRNN算法;產(chǎn)量
中圖分類號: S126 ?文獻(xiàn)標(biāo)志碼: A ?文章編號:1002-1302(2021)09-0190-05
大數(shù)據(jù)時代的到來,使各種農(nóng)業(yè)數(shù)據(jù)爆炸式增長[1],加速了農(nóng)業(yè)信息技術(shù)、云計算、智能算法的發(fā)展,為建立各類農(nóng)業(yè)大數(shù)據(jù)中心提供了基礎(chǔ)數(shù)據(jù)。同時,全國各省市農(nóng)業(yè)大數(shù)據(jù)中心陸續(xù)推動了數(shù)據(jù)分析方法的發(fā)展,將已經(jīng)處于邊沿地帶的各種算法重新拉回了信息技術(shù)的核心位置,并處于不斷完善和改進(jìn)中。針對農(nóng)業(yè)種植行業(yè),近年來,國內(nèi)外學(xué)者采用回歸預(yù)測法、神經(jīng)網(wǎng)絡(luò)法和灰色預(yù)測法等[2-4]進(jìn)行了深入研究,其中時間序列模型對于非線性的預(yù)測并不理想[5-8],智能算法成為了主流預(yù)測方法。本研究采用傳統(tǒng)農(nóng)業(yè)技術(shù)與信息技術(shù)(神經(jīng)網(wǎng)絡(luò)算法、云計算等)相結(jié)合的方式,開展農(nóng)業(yè)信息技術(shù)活動,將神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),把統(tǒng)計的農(nóng)業(yè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),構(gòu)建智能預(yù)測模型,以確保種植的農(nóng)產(chǎn)品質(zhì)量高、價格高、收益高。
白芨(Bletilla striata)為蘭科白芨屬植物,具有良好的藥用價值[9],在我國大部分省區(qū)均有分布,在云南省主要分布在昆明、文山、紅河、曲靖、寧洱、德宏和西雙版納等地,生長在海拔為500~2 600 m的疏林下陰濕處。白芨塊根白色,具有收斂止血、消腫生肌等功效[10]。近年來,由于白芨價格上漲,人們對野生白芨的過度濫采濫挖,加之白芨種子自然萌發(fā)率極低,導(dǎo)致野生白芨資源逐年稀少[11-14]。當(dāng)前與白芨相關(guān)的論文及報道較少,僅限于白芨的多糖分析研究等[15-17]。云南省作為白芨的主要產(chǎn)區(qū)之一,每年種植企業(yè)、種植戶數(shù)量迅速增長,白芨逐漸占據(jù)云南省主要的中藥材市場。因此,通過構(gòu)建云南省白芨種植過程信息采集系統(tǒng),將采集的數(shù)據(jù)輸入基于廣義回歸神經(jīng)網(wǎng)絡(luò)(general regression neural network,簡稱GRNN)算法構(gòu)建的智能模型,預(yù)測白芨在單位面積內(nèi)的產(chǎn)量,并通過信息平臺進(jìn)行展示。
1 材料與方法
1.1 試驗數(shù)據(jù)來源及處理
1.1.1 構(gòu)建管理信息系統(tǒng) 采用軟件工程方法學(xué),在.net平臺下,采用C#語言構(gòu)建白芨管理信息系統(tǒng),系統(tǒng)功能主要有前臺功能和后臺功能,前臺功能包括用戶登錄、數(shù)據(jù)上傳、論壇等。后臺功能包括數(shù)據(jù)刪除、添加,用戶權(quán)限的修改。用戶權(quán)限包括管理員、一般用戶、會員用戶。管理員權(quán)限最高,能夠瀏覽前臺所有信息,能夠在后臺修改、刪除前臺的所用數(shù)據(jù)以及更改、刪除用戶權(quán)限及信息;一般用戶權(quán)限最低,只能夠瀏覽信息系統(tǒng)中的部分大眾信息;會員用戶主要是訂購信息,能夠從管理信息系統(tǒng)中獲取對白芨種植、生產(chǎn)過程中具有價值的數(shù)據(jù),能夠在論壇中暢所欲言,能夠隨時與管理員保持交流、獲取相關(guān)信息。
1.1.2 收集數(shù)據(jù) 構(gòu)建基于智能算法的白芨產(chǎn)量智能預(yù)測系統(tǒng),實現(xiàn)用戶注冊、登錄、權(quán)限管理、種植戶(企業(yè))填報相關(guān)種植信息、管理員增加或刪除用戶、上傳信息、用戶論壇等功能。其中,最主要的功能為收集數(shù)據(jù),具體如下。
種植戶(企業(yè))在注冊成為會員后,首先將進(jìn)入種植信息上傳頁面(圖1),將種植白芨的信息上傳,為收集預(yù)測信息做準(zhǔn)備。種植戶(企業(yè))加入系統(tǒng)之后,將種植的所有信息填寫在信息表中,由管理員提取相關(guān)信息,用于收集構(gòu)建智能預(yù)測模型的數(shù)據(jù)。
1.2 試驗方法
目前,對白芨的研究停滯于對白芨多糖含量的
研究,將白芨與信息技術(shù)結(jié)合構(gòu)建智能預(yù)測模型,尚為首例,具有多學(xué)科結(jié)合的應(yīng)用創(chuàng)新性。構(gòu)建白芨產(chǎn)量管理信息系統(tǒng)和基于GRNN算法的產(chǎn)量預(yù)測模型的技術(shù)路線見圖2。
1.2.1 選擇算法 智能算法構(gòu)建預(yù)測模型,通常采用的智能算法包括人工神經(jīng)網(wǎng)絡(luò)算法、灰色算法、聚類分析等算法,每種算法都各有優(yōu)缺點。例如,近年來最為流行的人工神經(jīng)網(wǎng)絡(luò)算法中,BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法構(gòu)建智能模型時,訓(xùn)練樣本的時間較長,影響預(yù)測的準(zhǔn)確率;GRNN算法適用于訓(xùn)練樣本較少的智能模型;徑向基函數(shù)(radial basis function,簡稱RBF)神經(jīng)網(wǎng)絡(luò)算法適用于訓(xùn)練樣本較大的智能模型。但是,隨著信息技術(shù)、人工智能的發(fā)展,對智能模型的預(yù)測準(zhǔn)確度越來越高。魏明樺等將BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),構(gòu)建農(nóng)產(chǎn)品價格預(yù)測模型,取得較好的預(yù)測效果,具有推廣實踐的作用[18-19]。郭鵬飛將RBF 神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),構(gòu)建水質(zhì)預(yù)測模型[20]。王李等將遺傳算法與BP 神經(jīng)網(wǎng)絡(luò)相結(jié)合運用于水質(zhì)預(yù)測中[21]。以上研究表明,近年來多位研究者已經(jīng)將神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn)并運用于各種模型的構(gòu)建中。但是,在中草藥領(lǐng)域構(gòu)建智能預(yù)測模型尚處于應(yīng)用創(chuàng)新領(lǐng)域。結(jié)合白芨管理信息系統(tǒng)的特點以及信息系統(tǒng)建立初期信息量較小等情況,本研究將采用聚類分析結(jié)合GRNN算法構(gòu)建基于改進(jìn)的GRNN算法的智能模型。
1.2.2 數(shù)據(jù)處理 首先,須要對數(shù)據(jù)集中空缺數(shù)據(jù)、異常數(shù)據(jù)進(jìn)行處理后才能作為樣本數(shù)據(jù)。出現(xiàn)數(shù)據(jù)空缺時,根據(jù)數(shù)據(jù)集中前后數(shù)據(jù)的關(guān)系進(jìn)行填充;發(fā)現(xiàn)異常數(shù)據(jù)時,直接將異常數(shù)據(jù)刪除或者按空缺數(shù)據(jù)的情況進(jìn)行處理。
1.2.3 GRNN預(yù)測模型構(gòu)建 GRNN算法適用于小樣本的訓(xùn)練集數(shù)據(jù)的模型構(gòu)建,如果在數(shù)據(jù)訓(xùn)練之前,采用聚類算法先將同類數(shù)據(jù)進(jìn)行規(guī)整,將提高GRNN算法構(gòu)建智能模型的準(zhǔn)確率。具體步驟如下:
(1)在Matlab平臺下,采用聚類算法中pdist函數(shù),用于計算輸入變量之間的距離;采用linkage函數(shù)定義變量之間的連接,cophenetic函數(shù)用于評價聚類信息;最后使用cluster函數(shù)創(chuàng)建聚類。
(2)使用歸一化算法獲取的數(shù)據(jù)集進(jìn)行歸一化處理,所有數(shù)據(jù)控制在(-1,1)之間。
(3)由于GRNN模型中,第1層輸入層神經(jīng)元個數(shù)與學(xué)習(xí)樣本中輸入向量維數(shù)相等,因此上一步中的數(shù)據(jù)集作為輸入樣本(Xn)將直接進(jìn)入模式層中。
(4)學(xué)習(xí)樣本的數(shù)量與模式層中神經(jīng)元的數(shù)量(n)一致,各個神經(jīng)元(Pn)對應(yīng)不同的樣本。
(5)根據(jù)求和公式計算學(xué)習(xí)樣本與模式層中神經(jīng)元之間的距離。
(6)求和層進(jìn)行求和后將進(jìn)入輸出層,輸出層中各神經(jīng)元(SD)將求和層的輸出數(shù)據(jù)(SNT)相除,得到模型的預(yù)測結(jié)果(YK)。
GRNN結(jié)構(gòu)見圖3,用GRNN算法構(gòu)建智能預(yù)測模型時將按照圖3進(jìn)行。
2 結(jié)果與分析
2.1 確定白芨產(chǎn)量智能預(yù)測模型的輸入及輸入模式
由于該研究構(gòu)建的信息系統(tǒng)尚未在線運行,以下內(nèi)容以相同技術(shù)環(huán)境下的模擬數(shù)據(jù)進(jìn)行試驗。在溫度可以恒定的溫室大棚中,將種植戶(企業(yè))提供的澆水、施肥、噴灑農(nóng)藥量等信息,進(jìn)行歸一化處理后,作為輸入層的數(shù)據(jù)向量,確定GRNN算法的輸入層神經(jīng)元個數(shù)為5,由于白芨產(chǎn)量作為輸出目標(biāo),確定輸出層的神經(jīng)元個數(shù)為1。
2.2 基于GRNN算法的智能預(yù)測模型的實現(xiàn)
2.2.1 試驗數(shù)據(jù) 由于該研究中,白芨管理信息系統(tǒng)僅作為科學(xué)研究使用,尚未推出市場。本研究采用模擬數(shù)據(jù)進(jìn)行試驗,白芨產(chǎn)量預(yù)測系統(tǒng)中影響產(chǎn)量的因子的部分模擬數(shù)據(jù)見表1、表2。
2.2.2 智能模型訓(xùn)練 此次試驗采用了模擬數(shù)據(jù),按照GRNN算法構(gòu)建智能模型的要求,在Matlab平臺下,編寫訓(xùn)練程序,建立基于智能算法的白芨產(chǎn)量預(yù)測模型。
2.2.3 GRNN算法構(gòu)建白芨產(chǎn)量智能預(yù)測模型的實現(xiàn) 由于GRNN算法實用于樣本較小的智能預(yù)測模型構(gòu)建。采用GRNN算法構(gòu)建白芨產(chǎn)量智能預(yù)測模型的預(yù)測結(jié)果見表3,與試驗數(shù)據(jù)相比較,預(yù)測準(zhǔn)確率達(dá)到80%以上,具有較好的預(yù)測準(zhǔn)確率。
2.3 預(yù)測結(jié)果分析
從網(wǎng)絡(luò)預(yù)測誤差進(jìn)行分析,網(wǎng)絡(luò)預(yù)測誤差見圖4,試驗中將光滑因子設(shè)置為0.01,目的為了提高預(yù)測的準(zhǔn)確率,由于試驗數(shù)據(jù)為模擬數(shù)據(jù),預(yù)測結(jié)果的準(zhǔn)確率控制在90%以內(nèi),視為較精確的預(yù)測率。
由表3、圖4可知,該模型具有較為精確的預(yù)測率,表明基于GRNN算法構(gòu)建白芨產(chǎn)量預(yù)測模型是合理可行的,顯示出模型的選擇算法的可行性,與傳統(tǒng)的預(yù)測方法相比較具有更好的實用性和推廣性。該模型不僅適用于白芨產(chǎn)量的預(yù)測,在適度改變參數(shù)的狀況下也適用于白芨質(zhì)量智能預(yù)測模型的構(gòu)建,為云南中藥材行業(yè)的健康發(fā)展提供了新路徑。
3 結(jié)論與討論
白芨作為重要的中藥材之一,在日常的生產(chǎn)、生活中具有重要的藥用價值,將白芨產(chǎn)業(yè)與智能算法、軟件工程等多學(xué)科相結(jié)合,可實現(xiàn)白芨產(chǎn)業(yè)的信息化發(fā)展,具有應(yīng)用創(chuàng)新性。
本研究將聚類分析與GRNN算法相結(jié)合構(gòu)建基于智能算法的白芨產(chǎn)量預(yù)測系統(tǒng),充分將智能算法、軟件工程等信息技術(shù)與白芨產(chǎn)業(yè)的發(fā)展現(xiàn)狀相結(jié)合,構(gòu)建白芨產(chǎn)業(yè)的大數(shù)據(jù)中心雛形。規(guī)避了傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)算法的缺點,提高了預(yù)測的準(zhǔn)確率。本研究將智能預(yù)測模型與管理信息系統(tǒng)相結(jié)合,實現(xiàn)種植戶、種植企業(yè)提供數(shù)據(jù),管理員收集數(shù)據(jù)、利用智能模型分析數(shù)據(jù)、提供信息,其他用戶支付數(shù)據(jù)信息費用等類生態(tài)循環(huán)圈。
如圖5所示,在構(gòu)建白芨管理信息系統(tǒng)的同時,如果將智能模型嵌入管理信息系統(tǒng)中,使得原本只能“聽”代碼指揮的系統(tǒng)具有模擬人工的智慧。一是采用聚類分析結(jié)合GRNN算法構(gòu)建基于改進(jìn)的GRNN算法的智能預(yù)測模型。二是構(gòu)建白芨管理信息系統(tǒng),在信息系統(tǒng)中設(shè)置預(yù)測模型的接口,用于上傳預(yù)測結(jié)果,并根據(jù)不同的權(quán)限進(jìn)行展示,將實現(xiàn)智能預(yù)測系統(tǒng)在農(nóng)業(yè)領(lǐng)域中的創(chuàng)新型應(yīng)用。
參考文獻(xiàn):
[1]王 劍,吳定峰. 大數(shù)據(jù)視角下農(nóng)業(yè)科研信息資源共建共享模式探索[J]. 中國農(nóng)學(xué)通報,2017,33(11):147-152.
[2]Hygh J S,Decarolis J F,Hill D B,et al. Multivariate regression as an energy assessment tool in early building design[J]. Building and Environment,2012,57(17):165-175.
[3]Ferreira P M,Ruano A E,Silva S,et al. Neural networks based predictive control for thermal comfort and energy savings in public buildings[J]. Energy and Buildings,2012,55:238-251.
[4]Leephakpreeda T. Grey prediction on indoor comfort tempera-ture for HVAC systems[J]. Expert Systems with Applications,2008,34(4):2284-2289.
[5]Kristiansen T. A time series spot price forecast model for the Nord Pool market[J]. International Journal of Electrical Power & Energy Systems,2014,61:20-26.
[6]Rojas I,Valenzuela O,Rojas F,et al. Soft-computing techniques and ARMA model for time series prediction[J]. Neurocomputing,2008,71(4):519-537.
[7]Buncic D,Moretto C. Forecasting Copper prices with dynamic averaging and selection models[J]. The North American Journal of Economics and Finance,2015,33:1-38.
[8]段青玲,張 磊,魏芳芳,等. 基于時間序列GA-SVR的水產(chǎn)品價格預(yù)測模型及驗證[J]. 農(nóng)業(yè)工程學(xué)報,2017,33(1):308-314.
[9]王寶森,白紅麗,張 虹,等. 云南蒙自野生白芨中礦質(zhì)元素含量分析[J]. 北方園藝,2011(2):181-182.
[10]張永為,蔣福升,王 寅,等. 白及產(chǎn)業(yè)現(xiàn)狀及可持續(xù)發(fā)展的探討[J]. 中華中醫(yī)藥學(xué)刊,2012,30(10):17-19.
[11]李 嶸,王喆之. 白及的研究概述及其資源利用對策[J]. 中草藥,2006,37(11):1751-1755.
[12]張亦誠. 白芨的生物特性及栽培技術(shù)[J]. 農(nóng)業(yè)科技與信息,2007(11):45.
[13]劉逢芹,夏麗婭. 中藥白芨的現(xiàn)代研究概況[J]. 山東醫(yī)藥工業(yè),2000(7):32-33.
[14]于占國,劉賢旺. 白芨研究進(jìn)展[J]. 江西林業(yè)科技,2002(5):42-44.
[15]張 穎,周岐新,賴 舒. 白芨多糖對骨髓造血功能的影響[J]. 中藥藥理與臨床,2009,25(4):35-37.
[16]芮海云,吳國榮,陳景耀,等. 白芨中性多糖抗氧化作用的實驗研究[J]. 南京師大學(xué)報(自然科學(xué)版),2003,26(4):94-98.
[17]芮海云,吳國榮,陳景耀,等. 白芨中性雜多糖的分離純化與結(jié)構(gòu)分析[J]. 安徽農(nóng)業(yè)大學(xué)學(xué)報,2004,31(1):30-33.
[18]魏明樺,鄭金貴. 基于改進(jìn)BP神經(jīng)算法的農(nóng)產(chǎn)品價格預(yù)測模型的構(gòu)建與實現(xiàn)[J]. 唐山師范學(xué)院學(xué)報,2014,36(2):66-68.
[19]張永超,趙錄懷,王 昊,等. 基于環(huán)境氣體信息的BP神經(jīng)網(wǎng)絡(luò)蘋果貯藏品質(zhì)預(yù)測[J]. 江蘇農(nóng)業(yè)學(xué)報,2020,36(1):194-198.
[20]郭鵬飛. 基于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)算法的水質(zhì)預(yù)測模型研究[D]. 南昌:華東交通大學(xué),2013.
[21]王 李,劉志斌,常 歡. 自適應(yīng)遺傳BP神經(jīng)網(wǎng)絡(luò)在水質(zhì)預(yù)測中應(yīng)用[J]. 微計算機信息,2011,27(4):230-231.