崔雪梅
(湖北工程學(xué)院生命科學(xué)技術(shù)學(xué)院,湖北孝感 432000)
(收稿日期:20120910 編輯:周紅梅)
基于灰色GA-LM-BP模型的CODMn預(yù)測(cè)
崔雪梅
(湖北工程學(xué)院生命科學(xué)技術(shù)學(xué)院,湖北孝感 432000)
針對(duì)灰色GM(1,1)模型擬合誤差較大和LM-BP神經(jīng)網(wǎng)絡(luò)泛化能力不強(qiáng)的問(wèn)題,提出了灰色GA-LM-BP模型,該模型采用灰色GM(1,1)模型預(yù)測(cè)數(shù)據(jù)并得到其殘差,利用LM-BP神經(jīng)網(wǎng)絡(luò)對(duì)殘差進(jìn)行擬合、測(cè)試、預(yù)測(cè)后,對(duì)灰色GM(1,1)模型的數(shù)據(jù)預(yù)測(cè)值進(jìn)行修正從而得到較合理的預(yù)測(cè)值,并運(yùn)用遺傳算法對(duì)LM-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化。運(yùn)用該模型對(duì)倫河孝感段的CODMn進(jìn)行了預(yù)測(cè),預(yù)測(cè)誤差不超過(guò)2.33%,表明模型的預(yù)測(cè)數(shù)據(jù)是合理的,可用于CODMn的預(yù)測(cè)和水質(zhì)預(yù)警預(yù)報(bào)。
灰色理論;GA-LM-BP模型;化學(xué)需氧量;水質(zhì)預(yù)測(cè)
化學(xué)需氧量(CODMn)是反映水中有機(jī)污染程度的指標(biāo),也是唯一能比較全面反映水中有機(jī)污染程度的指標(biāo),根據(jù)CODMn可以比較準(zhǔn)確地計(jì)算廢水有機(jī)污染物的排放總量[1-2]。用于預(yù)測(cè)CODMn的方法主要有逐步回歸法、神經(jīng)網(wǎng)絡(luò)法、灰色預(yù)測(cè)法等[3-5]。利用微分方程描述灰色系統(tǒng)動(dòng)態(tài)情況的模型,能反映地表水中CODMn濃度隨時(shí)間變化的規(guī)律,但胡惠彬等[3]采用灰色GM(1,1)模型進(jìn)行數(shù)據(jù)預(yù)測(cè)時(shí),擬合誤差比較大。LM-BP神經(jīng)網(wǎng)絡(luò)存在擬合能力強(qiáng)、泛化能力差的特點(diǎn),采用多次擬合測(cè)試能夠在一定程度上提高其泛化能力,但該方法需要反復(fù)試驗(yàn),有時(shí)試驗(yàn)上萬(wàn)次還不一定能夠取得很好的效果[6]。采用遺傳算法對(duì)LM-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化,能夠提高其泛化能力[7]。
本文首先采用灰色GM(1,1)模型預(yù)測(cè)CODMn并得到其殘差,再用LM-BP神經(jīng)網(wǎng)絡(luò)對(duì)該殘差進(jìn)行擬合,同時(shí)用遺傳算法對(duì)LM-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化。利用灰色LM-BP模型對(duì)殘差進(jìn)行擬合、測(cè)試、預(yù)測(cè)后,對(duì)灰色GM(1,1)模型的數(shù)據(jù)預(yù)測(cè)值進(jìn)行修正,最后得到較合理的CODMn預(yù)測(cè)值。
1.1 灰色GM(1,1)模型
單序列一階線性灰色GM(1,1)模型以微分?jǐn)M合為核心,根據(jù)原始數(shù)據(jù)序列的特征,找出各數(shù)據(jù)之間的變化規(guī)律,它是灰色系統(tǒng)理論的基本預(yù)測(cè)模型,其動(dòng)態(tài)預(yù)測(cè)建模過(guò)程[8-10]如下:
步驟1數(shù)據(jù)預(yù)處理。設(shè)系統(tǒng)原始數(shù)據(jù)為X0= {x0,1,x0,2,…,x0,k},進(jìn)行一階累加,生成的序列為
式中:k為原始序列數(shù)據(jù)的個(gè)數(shù)。
式中:a為發(fā)展系數(shù);b為灰色作用量;z1,p為x1,p的緊鄰均值生成序列。
GM(1,1)模型的白化微分方程[11]為
1.2 遺傳算法
遺傳算法是借鑒達(dá)爾文進(jìn)化思想和遺傳學(xué)理論演化出的一種隨機(jī)搜索算法[12],其基本思想是:隨機(jī)產(chǎn)生若干個(gè)所求解問(wèn)題的數(shù)字編碼,形成初始群體;通過(guò)適應(yīng)度函數(shù)對(duì)每個(gè)個(gè)體進(jìn)行評(píng)價(jià),淘汰適應(yīng)度低的個(gè)體,選擇適應(yīng)度高的個(gè)體參加遺傳操作,生成下一代新的種群,再對(duì)這個(gè)新種群進(jìn)行下一輪進(jìn)化。
1.3 LM-BP神經(jīng)網(wǎng)絡(luò)
標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)的基本思想是:將輸出誤差以一定的方式通過(guò)隱含層向輸入層逐層反向傳播,并傳給各層的所有節(jié)點(diǎn),最后根據(jù)各層節(jié)點(diǎn)的誤差來(lái)修正各節(jié)點(diǎn)的權(quán)值。該方法速度慢,容易陷入局部極小值,針對(duì)該問(wèn)題,人們提出了很多改進(jìn)算法,其中LM(levenberg marquardt)算法是精度很高且速度最快的一種[6]。LM算法又稱阻尼最小二乘法,它解決了標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)的局部極小值問(wèn)題。
LM算法對(duì)標(biāo)準(zhǔn)3層BP神經(jīng)網(wǎng)絡(luò)改進(jìn)的主要步驟如下[13]:
步驟1初始權(quán)閾值初始化:隨機(jī)產(chǎn)生初始權(quán)值和閾值,確定所有樣本的誤差平方和以及要達(dá)到的收斂準(zhǔn)則ε,在編程中ε一般取1個(gè)很小的數(shù)。
中國(guó)家用電器研究院評(píng)測(cè)中心主任工程師梁晶以“用戶體驗(yàn)及用戶體驗(yàn)評(píng)測(cè)”為主題,從用戶角度分享了冰箱技術(shù)升級(jí)的側(cè)重點(diǎn)。她表示,從產(chǎn)品策劃的角度來(lái)說(shuō),用戶體驗(yàn)分為“有用”、“可用”、“易用”三個(gè)等級(jí),三者都滿足就能成為消費(fèi)者青睞的好產(chǎn)品。未來(lái)冰箱企業(yè)創(chuàng)新,符合并挖掘用戶需求是關(guān)鍵。
步驟2計(jì)算輸出誤差:對(duì)于r個(gè)輸入層節(jié)點(diǎn)、n個(gè)隱含層節(jié)點(diǎn)、m個(gè)輸出層節(jié)點(diǎn)的3層網(wǎng)絡(luò)來(lái)說(shuō),隱含層第i節(jié)點(diǎn)輸出ai為
式中:w1ij、b1i分別為第1層(輸入層)節(jié)點(diǎn)的權(quán)重和閾值;xj為隱含層的節(jié)點(diǎn)輸入;f1為變換函數(shù)。
隱含層的節(jié)點(diǎn)輸出為輸出層的節(jié)點(diǎn)輸入,輸出層第j節(jié)點(diǎn)輸出yj為
式中:w2ij、b2i分別為第2層即隱含層節(jié)點(diǎn)的權(quán)重和閾值;f2為變換函數(shù)。
輸出層節(jié)點(diǎn)輸出誤差E為
式中:ysj為期望輸出。
步驟3計(jì)算雅可比矩陣:
式中:Su為第u層節(jié)點(diǎn)數(shù);Q為訓(xùn)練樣本數(shù)。
步驟4求BP網(wǎng)絡(luò)權(quán)值的調(diào)整量Δwv:
式中:wv、wv+1分別為v、v+1時(shí)刻的權(quán)值;I為單位矩陣;μv為L(zhǎng)M算法內(nèi)部使用的一個(gè)大于零的調(diào)整因子,用于控制LM算法的迭代。通過(guò)自適應(yīng)調(diào)整該值,LM算法可以完成梯度下降法與高斯牛頓法的較好結(jié)合。
1.4 灰色GA-LM-BP模型
灰色GA-LM-BP模型數(shù)據(jù)預(yù)測(cè)修正流程如圖1所示。該模型的總體思想是:首先建立灰色GM(1,1)模型并預(yù)測(cè)數(shù)據(jù),得到其殘差。由于灰色GM(1,1)模型擬合精度不高,采用LM-BP神經(jīng)網(wǎng)絡(luò)對(duì)該殘差進(jìn)行擬合、測(cè)試、預(yù)測(cè),同時(shí)采用遺傳算法對(duì)LM-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)閾值進(jìn)行優(yōu)化。最后,將LM-BP神經(jīng)網(wǎng)絡(luò)得到的殘差預(yù)測(cè)結(jié)果對(duì)GM(1,1)模型的數(shù)據(jù)預(yù)測(cè)值進(jìn)行修正,得到合理的數(shù)據(jù)預(yù)測(cè)值。該模型包含灰色GM(1,1)預(yù)測(cè)和LM-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè),其中LM-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)過(guò)程相對(duì)比較復(fù)雜,里面包含GA對(duì)LP-BP神經(jīng)網(wǎng)絡(luò)初始權(quán)閾值的優(yōu)化。
遺傳算法對(duì)LM-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化的核心思想如下:①建立BP神經(jīng)網(wǎng)絡(luò),設(shè)置好網(wǎng)絡(luò)訓(xùn)練參數(shù),隨機(jī)初始化遺傳算法GA種群;②將遺傳算法種群的每組個(gè)體作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,采用LM算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;③將訓(xùn)練好的LM-BP神經(jīng)網(wǎng)絡(luò)對(duì)殘差進(jìn)行測(cè)試、預(yù)測(cè),計(jì)算其均方誤差,將均方誤差作為遺傳算法的評(píng)價(jià)函數(shù),計(jì)算每個(gè)個(gè)體的適應(yīng)度;④根據(jù)適應(yīng)度對(duì)個(gè)體進(jìn)行遺傳(選擇、交叉、變異)操作;⑤滿足遺傳代數(shù)g大于設(shè)定值的條件就結(jié)束,否則轉(zhuǎn)第②步,進(jìn)入下一代遺傳。
在編程的過(guò)程中,可以求出所有代所有個(gè)體中適應(yīng)度最小的值,并且記下此時(shí)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,這樣就能保證網(wǎng)絡(luò)經(jīng)過(guò)多次訓(xùn)練多代遺傳后,最終得到最優(yōu)的網(wǎng)絡(luò)參數(shù)。經(jīng)過(guò)遺傳算法對(duì)初始權(quán)值和閾值的優(yōu)化后,神經(jīng)網(wǎng)絡(luò)的泛化能力將大幅增強(qiáng)。遺傳算法適應(yīng)度跟種群的個(gè)體之間是一種間接的關(guān)系,中間經(jīng)過(guò)了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測(cè)試,這是該模型實(shí)現(xiàn)的一個(gè)難點(diǎn)。
圖1 灰色GA-LM-BP模型數(shù)據(jù)預(yù)測(cè)修正流程
采用灰色GA-LM-BP模型對(duì)倫河孝感段的CODMn進(jìn)行擬合、測(cè)試、預(yù)測(cè)。數(shù)據(jù)取樣每2個(gè)月1次,采用2008年8月至2011年12月共21個(gè)月的CODMn監(jiān)測(cè)數(shù)據(jù)。建立灰色GM(1,1)模型,得到CODMn的模擬值、殘差及殘差相對(duì)誤差,如表1所示。
表1 灰色GM(1,1)模型對(duì)CODMn的擬合結(jié)果
由表1可見(jiàn),灰色GM(1,1)模型的擬合精度不高,且殘差的相對(duì)誤差沒(méi)有規(guī)律性,需采用灰色GALM-BP模型對(duì)數(shù)據(jù)進(jìn)行修正。建立LM-BP神經(jīng)網(wǎng)絡(luò),將最后3個(gè)數(shù)據(jù)作為測(cè)試數(shù)據(jù),前17個(gè)數(shù)據(jù)作為擬合數(shù)據(jù),BP網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為8,輸出層節(jié)點(diǎn)數(shù)為1,經(jīng)反復(fù)試驗(yàn)確定隱含層節(jié)點(diǎn)數(shù)為6比較合適。設(shè)置遺傳算法個(gè)體(31個(gè)數(shù)據(jù))變量的二進(jìn)制位數(shù)為20,代溝為0.9,遺傳代數(shù)為10。將遺傳算法的種群個(gè)體作為L(zhǎng)M-BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,經(jīng)過(guò)LM-BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后,對(duì)測(cè)試樣本進(jìn)行對(duì)比,求出其均方誤差,將均方誤差作為遺傳算法的評(píng)價(jià)函數(shù),進(jìn)一步求出種群個(gè)體的適應(yīng)度。經(jīng)過(guò)10代遺傳后,得到各代種群適應(yīng)度的最優(yōu)解和均值變化如圖2所示。
圖2 各代種群的最優(yōu)解和均值的變化
利用灰色GA-LM-BP模型對(duì)灰色GM(1,1)預(yù)測(cè)得到的殘差相對(duì)誤差進(jìn)行擬合,其擬合相對(duì)誤差分別為:1.70×10-6、-2.87×10-7、6.68×10-8、-6.50× 10-6、-5.88×10-6、-2.90×10-6、-7.44×10-6、4.16× 10-5、1.96×10-6,可以看出灰色GA-LM-BP模型對(duì)訓(xùn)練樣本基本上能百分之百擬合。對(duì)表1中最后3個(gè)殘差數(shù)據(jù)的相對(duì)誤差進(jìn)行預(yù)測(cè),預(yù)測(cè)的相對(duì)誤差分別為-1.3831%、-0.32296%、-2.3206%,從預(yù)測(cè)結(jié)果可以看出,其誤差均不超過(guò)2.33%,說(shuō)明可以用該灰色GA-LM-BP模型對(duì)殘差的相對(duì)誤差進(jìn)行預(yù)測(cè)。
最后,利用灰色GM(1,1)模型預(yù)測(cè)2012年2—10月的5個(gè)CODMn質(zhì)量濃度數(shù)據(jù),采用灰色GALM-BP模型對(duì)殘差的相對(duì)誤差進(jìn)行預(yù)測(cè),然后修正預(yù)測(cè)的CODMn質(zhì)量濃度數(shù)據(jù),最后得到較合理的CODMn質(zhì)量濃度值,如表2所示。
表2 CODMn質(zhì)量濃度灰色預(yù)測(cè)、修正結(jié)果
灰色GA-LM-BP模型是一種有效的水質(zhì)預(yù)測(cè)方法,其吸收了灰色預(yù)測(cè)方法、遺傳算法和LM-BP神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),但同時(shí)也增加了編程的復(fù)雜性和計(jì)算工作量,主要體現(xiàn)在遺傳算法的優(yōu)化過(guò)程中。運(yùn)用灰色GA-LM-BP模型對(duì)倫河孝感段21個(gè)月的CODMn實(shí)測(cè)數(shù)據(jù)進(jìn)行擬合、預(yù)測(cè),應(yīng)用結(jié)果表明,采用該模型對(duì)本地區(qū)的CODMn值進(jìn)行預(yù)測(cè)是合理可行的,一方面該方法利用灰色GM(1,1)模型能很好地反映本地區(qū)河流CODMn值隨時(shí)間的變化規(guī)律,另一方面可以采用LM-BP神經(jīng)網(wǎng)絡(luò)的殘差預(yù)測(cè)結(jié)果對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行修正,得到合理的預(yù)測(cè)數(shù)據(jù)。
[1]朱玉磊.化學(xué)需氧量幾種測(cè)定方法研究[J].科技資訊, 2008,28(10):83-85.(ZHU Yulei.The research of determination of chemical oxygen demand(COD)[J]. Science&Technology Information,2008,28(10):83.(in Chinese))
[2]遠(yuǎn)振海,魯治冰.基于神經(jīng)網(wǎng)絡(luò)的COD值預(yù)測(cè)研究[J].黑龍江水專學(xué)報(bào),2008,35(1):84-86.(YUAN Zhenhai,LU Zhibing.COD data forecast based on NN[J]. Journal of Heilongjiang Hydraulic Engineering College, 2008,35(1):84-86.(in Chinese))
[3]胡惠彬.灰色系統(tǒng)的GM(1,1)模型在地表水COD濃度預(yù)測(cè)中的應(yīng)用[J].中國(guó)環(huán)境監(jiān),1993,9(4):45-46. (HU Huibin.Application of grey system GM(1,1) models in forecasting cod concentration of surface water [J].Environmental Monitoring in China,1993,9(4):45-46.(in Chinese))
[4]劉玉存,于國(guó)強(qiáng),王少華,等.基于神經(jīng)網(wǎng)絡(luò)的傳爆藥廢水COD去除率預(yù)測(cè)研究[J].含能材料,2009,17(3): 361-364.(LIU Yucun,YU Guoqiang,WANG Shaohua,et al.Elman model in prediction of COD removal rate of booster explosive wastewater[J].Chinese Journal of EnergeticMaterials,2009,17(3):361-364.(in Chinese))
[5]趙英,崔福義,郭亮,等.基于BP神經(jīng)網(wǎng)絡(luò)的天津于橋水庫(kù)CODMn預(yù)測(cè)研究[J].南京理工大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(3):376-380.(ZHAO Ying,CUI Fuyi, GUO Liang,et al.CODMnforecast based on BP neural network at Yuqiao Reservoir in Tianjin[J].Journal of Nanjing University of Science and Technology:Nature Science,2008,32(3):376-380.(in Chinese))
[6]阮仕平,黨志良,胡曉寒,等.基于LM-BP算法的綜合水質(zhì)評(píng)價(jià)研究[J].水資源研究,2004,25(1):12-14. (YUAN Shiping,DANG Zhiliang,HU Xiaohan,et al. Study on comprehensive water quality assessment based on LM-BP algorithm[J].JournalofWaterResources Research,2004,25(1):12-14.(in Chinese))
[7]GUOhairu,LIZhimin.Amethodofimproving generalization ability for neural network based on genetic algorithm[C]//2010 IEEE International Conference on Intelligent ComputingandIntelligentSystems(ICIS 2010).Beijing:IEEE PRESS,2010:742-745.
[8]劉思峰,謝乃明.灰色系統(tǒng)理論及其應(yīng)用[M].第4版.北京:科學(xué)出版社,2008.
[9]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中科技大學(xué)出版社,2004.
[10]周媛,朱大奇.水下機(jī)器人傳感器故障診斷的灰色預(yù)測(cè)模型[J].中國(guó)造船,2011,52(1):137-144.(ZHOU Yuan,ZHU Daqi.A sensor fault diagnosis method for underwater vehicles based on GM(1,1)[J].Shipbuilding of China,2011,52(1):137-144.(in Chinese))
[11]閻威武,常俊林,邵惠鶴.基于滾動(dòng)時(shí)間窗的最小二乘支持向量機(jī)回歸估計(jì)方法及仿真[J].上海交通大學(xué)學(xué)報(bào),2004,38(4):524-527.(YAN Weiwu,CHANG Junlin,SHAO Huihe.Least square SVM regression method based on sliding time window and its simulation[J]. Journal of Shanghai Jiaotong University,2004,38(4): 524-527.(in Chinese))
[12]原思聰,江祥奎.基于GA-BP神經(jīng)網(wǎng)絡(luò)的雙目攝像機(jī)標(biāo)定[J].西安建筑科技大學(xué)學(xué)報(bào):自然科學(xué)版,2011, 43(4):604-608.(YUAN Sicong,JIANG Xiangkui. Binocular camera calibration based on GA-BP neural network[J].Journal of Xi'an University of Architecture& Technology:Natural Science Edition,2011,43(4):604-608.(in Chinese))
[13]繆新穎,褚金奎,杜小文.LM-BP神經(jīng)網(wǎng)絡(luò)在大壩變形預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(1): 220-222.(MIAO Xinying,CHU Jinkui,DU Xiaowen. Application of LM-BP neural network in predicting dam deformation[J].Computer Engineering and Applications, 2011,47(1):220-222.(in Chinese))
Prediction of CODMnvalue based on the grey GA-LM-BP model
//CUI Xuemei(College of Life Science and Technology,Hubei Engineering University,Xiaogan432000,China)
Due to the large fitting-errors of grey GM(1,1)model and the weak generalization ability of LM-BP neural network,a model of grey GA-LM-BP network was proposed in this paper.The grey GM(1,1)model was used to predict data and obtain residual errors.After the residual errors were fitted,tested and forecasted with LM-BP neural network, more reasonable predicted values can be obtained by correcting the predicted values of the GM(1,1)model.In the meantime,the initialized weights and threshold of LM-BP neural network were optimized with the genetic algorithm(GA). The grey GA-LM-BP model was then used to predict the CODMnvalues at the Xiaogan segment of Lunhe River.Since the prediction errors were found to be less than 2.33%,the accuracy of the model is considered to be reasonable.The model can be used to predict the CODMnvalues and the water quality early warning.
grey theory;GA-LM-BP model;CODMn;water quality prediction
(收稿日期:20120910 編輯:周紅梅)
10.3880/j.issn.10067647.2013.05.009
TP181;X703.1
A
10067647(2013)05003804
湖北省教育科學(xué)“十一五”規(guī)劃課題(2009B106);湖北工程學(xué)院項(xiàng)目(Z2011019)
崔雪梅(1979—),女,云南宣威人,講師,碩士,主要從事生態(tài)環(huán)境及智能預(yù)測(cè)研究。xgughr@126.com