徐永春,張森文
(1 華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣東廣州 510642;2 廣東理工職業(yè)學(xué)院計(jì)算機(jī)系,廣東廣州 510091;3 暨南大學(xué)應(yīng)用力學(xué)研究所,廣東廣州 510632)
甘蔗產(chǎn)量的預(yù)測(cè)是制糖工業(yè)的一項(xiàng)重要技術(shù)管理工作,對(duì)優(yōu)化提高甘蔗生產(chǎn)作業(yè)及統(tǒng)籌管理具有指導(dǎo)作用.在甘蔗產(chǎn)量預(yù)測(cè)中,農(nóng)作物產(chǎn)量、氣象等是重要影響因子,應(yīng)用傳統(tǒng)數(shù)理統(tǒng)計(jì)方法對(duì)農(nóng)作物產(chǎn)量、氣象等的預(yù)測(cè)預(yù)報(bào)的研究已較為成熟,但該法對(duì)受外界多因素關(guān)聯(lián)作用的農(nóng)作物產(chǎn)量預(yù)測(cè)存在預(yù)測(cè)難度大、精度差、準(zhǔn)確度低等問題,在實(shí)際應(yīng)用中難以符合需求.近年來,神經(jīng)網(wǎng)絡(luò)在人工智能領(lǐng)域的應(yīng)用研究十分活躍,但仍存在訓(xùn)練時(shí)間長(zhǎng)、收斂于局部極小值等不足,使得傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法在網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練中所獲得的網(wǎng)絡(luò)權(quán)、閥值在訓(xùn)練效率和精度上都有所下降[1-2],而與之對(duì)比的人工智能算法——遺傳算法則具有簡(jiǎn)單通用、魯棒性強(qiáng)和并行運(yùn)算等優(yōu)點(diǎn),二者的結(jié)合將強(qiáng)化BP學(xué)習(xí)訓(xùn)練、優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)閥值,促進(jìn)BP神經(jīng)網(wǎng)絡(luò)的快速收斂,提高BP網(wǎng)絡(luò)神經(jīng)預(yù)測(cè)的效率與精度.但傳統(tǒng)遺傳算法存在一些具有超高適應(yīng)度的個(gè)體,它們?cè)谶x擇算子時(shí),會(huì)以很大的概率參加繁殖,引起群體平均適應(yīng)度飽和、個(gè)體間競(jìng)爭(zhēng)力減弱,導(dǎo)致運(yùn)算收斂速度下降,甚至是未成熟收斂,出現(xiàn)“早熟”現(xiàn)象[3-4].為有效發(fā)揮遺傳算法的特色優(yōu)勢(shì),在應(yīng)用中需對(duì)算子選擇方法、判別做適度改進(jìn).
甘蔗生產(chǎn)是市場(chǎng)調(diào)節(jié)、種植規(guī)模、氣候調(diào)節(jié)多因素作用關(guān)聯(lián)的大系統(tǒng).在甘蔗產(chǎn)量預(yù)測(cè)中,簡(jiǎn)化農(nóng)作物產(chǎn)量、氣象等輸入因子對(duì)于構(gòu)建規(guī)模適度的BP網(wǎng)絡(luò)模型,提高BP網(wǎng)絡(luò)的訓(xùn)練效率和精度有直接的作用.本文通過多元逐步回歸簡(jiǎn)化輸入?yún)⒘?,有效結(jié)合遺傳算法與神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建改進(jìn)的遺傳神經(jīng)網(wǎng)絡(luò)甘蔗產(chǎn)量預(yù)測(cè)模型,并以實(shí)例驗(yàn)證.
神經(jīng)網(wǎng)絡(luò)的優(yōu)化設(shè)計(jì)問題屬于高維連續(xù)的尋優(yōu)問題.根據(jù)BP網(wǎng)絡(luò)輸入節(jié)點(diǎn)設(shè)計(jì)的需要,本文采用搜索精度高、搜索空間大的實(shí)數(shù)編碼方案,可以較好地解決因空間不足而導(dǎo)致算法收斂緩慢問題.
在遺傳算子的改進(jìn)方案中,遺傳參數(shù)中的交叉概率pc和變異概率pm是決定遺傳算法(GA)性能的關(guān)鍵,無(wú)論過大還是過小,都會(huì)直接影響算法的收斂性和收斂速度,但很難找到一個(gè)適應(yīng)每個(gè)問題的最佳值,對(duì)于不同的優(yōu)化問題需要反復(fù)試驗(yàn)來確定pc和 pm.Scinivas 等[5]和 Fogarty[6]提出了種群隨迭代次數(shù)增加而收斂調(diào)整pc和pm的概率值,控制pc和pm最小范圍,但算法的自適應(yīng)能力較差.本文在文獻(xiàn)[7]基礎(chǔ)上,改進(jìn)自適應(yīng)交叉和變異算子,設(shè)計(jì)自適應(yīng)的交叉和變異公式(1)和(2),在預(yù)測(cè)仿真前實(shí)例驗(yàn)證,證明變異概率隨指數(shù)下降有很好的性能,其自適應(yīng)的交叉和變異公式為:
式中,t為遺傳迭代次數(shù);t_max為最大遺傳代數(shù);λ、k為常數(shù),根據(jù)種群分布大小取值,一般為[5,10];pc1、pm1分別為固定交叉概率和變異概率.通過式(1)和式(2)可控制 pc取值在[0.5,1]之間,而 pm取值在[0,0.5]之間.通過自適應(yīng)交叉和變異處理的遺傳算法,出現(xiàn)適應(yīng)值高于群體平均值的個(gè)體有更大的概率進(jìn)入下一代,而適應(yīng)值低于群體平均值的個(gè)體則將被淘汰,從而可大大加快遺傳算法收斂.
利用改進(jìn)遺傳算法與BP網(wǎng)絡(luò)形成混合訓(xùn)練算法,使每個(gè)個(gè)體包含若干條染色體,每條染色體對(duì)應(yīng)1個(gè)權(quán)值或閥值,染色體采用實(shí)數(shù)編碼,通過上述改進(jìn)策略,則改進(jìn)的遺傳BP網(wǎng)絡(luò)模型設(shè)計(jì)框架主要是以權(quán)閥值訓(xùn)練為主.首先由改進(jìn)GA進(jìn)行全局搜索,將搜索范圍縮小后,交與BP網(wǎng)絡(luò)執(zhí)行局部尋優(yōu),發(fā)揮其局部尋優(yōu)的高精確性,具體步驟如下:
1)初始化網(wǎng)絡(luò),初始化群體;
2)計(jì)算神經(jīng)網(wǎng)絡(luò)誤差函數(shù)個(gè)體適應(yīng)度,若達(dá)到預(yù)定精度要求則轉(zhuǎn)5);
3)遺傳操作(選擇、交叉、變異),產(chǎn)生新一代個(gè)體;
4)改進(jìn)自適應(yīng)交叉和變異算子更新;
5)解碼,獲得優(yōu)化的BP網(wǎng)絡(luò)權(quán)閥值;
6)再以優(yōu)化的權(quán)、閥值進(jìn)行BP模型的數(shù)據(jù)仿真預(yù)測(cè).
在甘蔗產(chǎn)量預(yù)測(cè)模型研究中,外界因子如氣象、品種資源分布率、化肥、人工技術(shù)等均對(duì)甘蔗產(chǎn)量預(yù)測(cè)有顯著的關(guān)聯(lián)作用.因此本文構(gòu)建的改進(jìn)遺傳算法BP模型選取對(duì)產(chǎn)量有顯著影響的氣象、優(yōu)化品種種植分布率作為輸入外界因子.因氣象、品種資源等外界因子在預(yù)測(cè)過程中,不能夠獨(dú)立提供預(yù)測(cè)模型參數(shù),故氣象、品種資源需要進(jìn)行自我學(xué)習(xí)、訓(xùn)練完成下一步的預(yù)測(cè)工作[8-9].
在模型仿真訓(xùn)練中,本文采用1995—2004年10年間的氣象、品種資源分布率等作為外界因子.
氣象因子主要包括溫度、濕度、降雨量和日照,而在每年甘蔗生產(chǎn)中,只有若干季度是甘蔗最主要的外界生產(chǎn)影響條件,每年12個(gè)月中有48個(gè)外界氣象因子、若干品種資源分布數(shù)據(jù)及年甘蔗產(chǎn)量,通過組合改進(jìn)遺傳算法BP模型輸入因子達(dá)到58個(gè),使預(yù)報(bào)因子數(shù)目過大,導(dǎo)致計(jì)算復(fù)雜,降低了模型的預(yù)報(bào)精度,因此根據(jù)BP模型訓(xùn)練需要,通過多元逐步回歸簡(jiǎn)化而得到甘蔗生產(chǎn)最終輸入的關(guān)鍵輸入向量,其數(shù)學(xué)方程如下:
在式(3)的輸入向量中,x1~x12分別為1—12月的氣溫輸入向量因子,x13~x24分別為1—12月的日照輸入向量因子,x25~x36分別為1—12月的降雨輸入向量因子,x37~x48分別為1—12月的濕度輸入向量因子,x49~x57分別為品種資源輸入向量因子.最后通過多元逐步回歸方程簡(jiǎn)化可得其最終決策外界因子為:x3,x4,x11,x19,x27,x30,x34,x46,x48及 x53等 10 個(gè)輸入因子.
由于采用自學(xué)習(xí)樣本,因此本文的模型數(shù)據(jù)設(shè)計(jì)即為以1994—2003年訓(xùn)練樣本由甘蔗均產(chǎn)及外界因子等9×11個(gè)變量所構(gòu)成,同理,2004—2006年3組樣本(3×11)作為教師樣本.
為驗(yàn)證預(yù)測(cè)仿真的精度及效率,本文同時(shí)采用灰色線性外推法、SBP、SGA-BP、SBP、RINAGA-BP 等多種算法對(duì)甘蔗產(chǎn)量進(jìn)行預(yù)測(cè).各BP模型參數(shù)的設(shè)置均為:動(dòng)量系數(shù)(lr)=0.95,迭代次數(shù)(MAXGEN)=10000,誤差精度(e)=0.00001;不同模型所獲得預(yù)測(cè)及誤差如表1、2.
表1 不同模型預(yù)測(cè)的甘蔗產(chǎn)量Tab.1 Result by different model kg·hm -2
表2 不同模型的預(yù)測(cè)訓(xùn)練時(shí)間及誤差和Tab.2 Training time and erroneous sum with different model of forecast
由表2可知,灰色線性外推法誤差和最大,時(shí)間最短,但決策可用性極低;BP模型可顯著降低預(yù)測(cè)誤差.不同BP模型訓(xùn)練誤差、訓(xùn)練時(shí)間差異較大,SGA-BP訓(xùn)練時(shí)間消耗最小,改進(jìn)遺傳算法的BP預(yù)測(cè)其次,但其誤差累計(jì)和最小,其模擬預(yù)測(cè)的精度最高,綜合而言,效果最優(yōu).
通過編碼、遺傳算子的改進(jìn),提高傳統(tǒng)遺傳算法的全局搜索和收斂效率,并以改進(jìn)遺傳算法對(duì)BP網(wǎng)絡(luò)權(quán)閥值進(jìn)行全局優(yōu)化,提高了BP神經(jīng)網(wǎng)絡(luò)運(yùn)行速度,從而有效克服了傳統(tǒng)BP網(wǎng)絡(luò)方法的缺點(diǎn);針對(duì)甘蔗復(fù)雜的輸入因子進(jìn)行多元逐步簡(jiǎn)化,優(yōu)化和提高了改進(jìn)遺傳BP在甘蔗生產(chǎn)預(yù)測(cè)仿真的學(xué)習(xí)效率.該預(yù)測(cè)模型與多種預(yù)測(cè)方法對(duì)比,驗(yàn)證了在多因素作用關(guān)聯(lián)下的甘蔗產(chǎn)量預(yù)測(cè)效率和精度.結(jié)果顯示,改進(jìn)遺傳算法在BP方法上的優(yōu)越性和合理性,這對(duì)于甘蔗產(chǎn)量的多因素關(guān)聯(lián)作用的預(yù)測(cè)預(yù)報(bào)應(yīng)用具有重要參考價(jià)值.
[1]沈清.神經(jīng)網(wǎng)絡(luò)應(yīng)用技術(shù)[M].長(zhǎng)沙:國(guó)防科技大學(xué)出版社,1993:45-85.
[2]徐永春,張森文.遺傳K均值方法在品種資源分類中的應(yīng)用[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2009,30(2):97-100.
[3]陳國(guó)良,王熙法,莊鎮(zhèn)泉,等.遺傳算法及其應(yīng)用[M].北京:人民郵電出版社,1996:80-81.
[4]謝凱.排擠小生境遺傳算法的研究與應(yīng)用[D].合肥:安徽理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,2005:43-53.
[5]SCINVIVAS M,PATNAIK L M.Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEE Trans SMC,1994,24(4):656-666.
[6]FOGARTY T C.Varying the probability of mutation in genetic algorithms[C]∥Anon.Proceedings of the 3rd International Conference on Genetic Algorithms.Boston:Boc.,1989:104-109.
[7]徐永春.基于智能算法的甘蔗生產(chǎn)決策模型研究與應(yīng)用[D].廣州:華南農(nóng)業(yè)大學(xué)工程學(xué)院,2008.
[8]高大啟.有教師的線性基本函數(shù)前向三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)研究[J].計(jì)算機(jī)學(xué)報(bào),1998,21(1):80-86.
[9]陳磊,張士喬,呂謀,等.自適應(yīng)遺傳算法優(yōu)化管網(wǎng)狀態(tài)估計(jì)神經(jīng)網(wǎng)絡(luò)模型[J].水利水電技術(shù),2004,35(10):61-63.