李建偉 魏偉 陳沛然 袁志華
摘要:以歸一化處理后的1986-2010年河南省農(nóng)田有效灌溉面積的統(tǒng)計(jì)數(shù)據(jù)作為樣本數(shù)據(jù),分別采用BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)回歸兩種方法建立了農(nóng)田有效灌溉面積的預(yù)測(cè)模型。預(yù)測(cè)結(jié)果表明,支持向量機(jī)的預(yù)測(cè)方法具有更高的預(yù)測(cè)精度和更強(qiáng)的泛化能力,預(yù)測(cè)誤差僅為BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差的11.8%,更適合進(jìn)行農(nóng)田有效灌溉面積的預(yù)測(cè)。最后采用兩種模型分別對(duì)河南省“十二五”期間的農(nóng)田有效灌溉面積進(jìn)行了預(yù)測(cè),指出了其變化趨勢(shì)。
關(guān)鍵詞:農(nóng)田有效灌溉面積;BP神經(jīng)網(wǎng)絡(luò);支持向量機(jī);預(yù)測(cè)
中圖分類(lèi)號(hào):S279.2;TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)09-2157-04
農(nóng)田有效灌溉面積指有固定水源、灌溉工程設(shè)施配套、土地平整、在一般年景下能夠進(jìn)行正常灌溉的耕地面積,包括機(jī)灌面積、電灌面積、自流灌溉面積和噴灌面積[1]。它是反映農(nóng)田水利建設(shè)和水利化的重要指標(biāo),也是我國(guó)各地區(qū)制定水利發(fā)展規(guī)劃的重要指標(biāo)之一。對(duì)農(nóng)田有效灌溉面積進(jìn)行預(yù)測(cè)可以為了解未來(lái)農(nóng)村水利基礎(chǔ)設(shè)施的建設(shè)狀況提供有價(jià)值的參考信息,同時(shí)也可為相關(guān)部門(mén)合理制定行業(yè)發(fā)展規(guī)劃提供理論支持。
1 預(yù)測(cè)方案的確定與預(yù)測(cè)方法的選擇
1.1 預(yù)測(cè)方案的確定
農(nóng)田有效灌溉面積的變化受多方面因素的影響,比如政策、中央財(cái)政資金投入、地方財(cái)政資金投入、農(nóng)民收入狀況等。這些因素并不是孤立地對(duì)農(nóng)田有效灌溉面積產(chǎn)生影響,而是耦合在一起以非線性的方式影響農(nóng)田有效灌溉面積的變化。
農(nóng)田有效灌溉面積的預(yù)測(cè)有兩大類(lèi)方案:一種為結(jié)構(gòu)式的預(yù)測(cè)方法,就是通過(guò)一定的方式建立起各主要影響因素與農(nóng)田有效灌溉面積之間的關(guān)系,然后根據(jù)未來(lái)各影響因素的變化去預(yù)測(cè)相對(duì)應(yīng)的農(nóng)田有效灌溉面積;另一種為數(shù)據(jù)序列預(yù)測(cè)法,就是將各年度的農(nóng)田有效灌溉面積數(shù)值作為連續(xù)的時(shí)間序列看待,可以認(rèn)為農(nóng)田有效灌溉面積的變化規(guī)律已經(jīng)蘊(yùn)含在數(shù)據(jù)序列之中,再采用合適的方法對(duì)該序列在未來(lái)的取值進(jìn)行預(yù)測(cè)。
在第一種方案中,首先需要確定具體影響農(nóng)田有效灌溉面積變化的因素種類(lèi)及其影響規(guī)律,另外還需要對(duì)各因素的未來(lái)變化進(jìn)行預(yù)測(cè)。準(zhǔn)確地確定影響農(nóng)田有效灌溉面積變化的各種因素本身就很有難度,各因素對(duì)有效灌溉面積影響規(guī)律的辨識(shí)也同樣是一個(gè)比較復(fù)雜的問(wèn)題,而預(yù)測(cè)各因素未來(lái)的變化更是一個(gè)幾乎和預(yù)測(cè)農(nóng)田有效灌溉面積難度相當(dāng)?shù)膯?wèn)題。在第二種方案中,首先需要建立起能夠充分反映農(nóng)田有效灌溉面積變化規(guī)律的預(yù)測(cè)模型,然后通過(guò)求取該預(yù)測(cè)模型在未來(lái)的輸出值即可實(shí)現(xiàn)預(yù)測(cè)。兩種方案相比,顯然第二種方案更容易實(shí)現(xiàn)。因此,在以下研究中采用數(shù)據(jù)序列預(yù)測(cè)方案。
1.2 預(yù)測(cè)方法的選擇
在數(shù)據(jù)序列的預(yù)測(cè)中,目前廣泛采用的方法有移動(dòng)平均法、指數(shù)平滑法、線性回歸法、灰色預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)方法等。這些方法中神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)方法從本質(zhì)上來(lái)說(shuō)更為適合應(yīng)用于非線性預(yù)測(cè)問(wèn)題。而農(nóng)田有效灌溉面積所構(gòu)成的數(shù)據(jù)序列是一個(gè)典型的非線性序列。顯然在該研究中采用神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)方法較為合適。為了充分研究這兩種方法的適用性,以下對(duì)這兩種方法進(jìn)行對(duì)比分析。
2 兩種預(yù)測(cè)方法的理論基礎(chǔ)及特性分析
2.1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的理論基礎(chǔ)及特性分析
在各類(lèi)神經(jīng)網(wǎng)絡(luò)中,BP神經(jīng)網(wǎng)絡(luò)堪稱(chēng)最經(jīng)典、使用最為廣泛的一種神經(jīng)網(wǎng)絡(luò)[2,3]。
BP神經(jīng)網(wǎng)絡(luò)是誤差反向傳播(Back error propagation,簡(jiǎn)稱(chēng)BP)神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)稱(chēng)。BP神經(jīng)網(wǎng)絡(luò)通常由1個(gè)輸入層、若干隱含層和1個(gè)輸出層組成,在每層中可以包括若干個(gè)神經(jīng)元。各相鄰層神經(jīng)元之間多為全連接方式,而同層神經(jīng)元之間則無(wú)連接[4]。各神經(jīng)元間的連接傳遞相應(yīng)的權(quán)值,隱含層及輸出層各神經(jīng)元都有自己的閾值。BP神經(jīng)網(wǎng)絡(luò)作為一種前饋網(wǎng)絡(luò),具有前饋網(wǎng)絡(luò)的共性。研究表明,三層前饋網(wǎng)絡(luò)就能夠以任意精度逼近任意連續(xù)函數(shù)及其各階導(dǎo)數(shù)[5]。對(duì)序列進(jìn)行建模,從本質(zhì)上來(lái)說(shuō)就是獲得序列的變化泛函,BP神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近功能正好可以實(shí)現(xiàn)此過(guò)程。
但BP神經(jīng)網(wǎng)絡(luò)也存在若干缺陷,其中比較突出的是網(wǎng)絡(luò)結(jié)構(gòu)的不易確定、易限于局部收斂和收斂速度慢。其中網(wǎng)絡(luò)結(jié)構(gòu)的不易確定是指在確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的過(guò)程中沒(méi)有準(zhǔn)確的依據(jù)可以遵循。而局部收斂則對(duì)BP神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近功能影響較大。
2.2 支持向量機(jī)預(yù)測(cè)的理論基礎(chǔ)及特性分析
3 預(yù)測(cè)模型的建立
3.1 樣本數(shù)據(jù)的準(zhǔn)備
從河南統(tǒng)計(jì)年鑒中收集了1986-2010年河南省農(nóng)田有效灌溉面積的統(tǒng)計(jì)數(shù)據(jù)[10]。為了降低預(yù)測(cè)模型的復(fù)雜程度,采用峰值法對(duì)這些數(shù)據(jù)進(jìn)行了歸一化處理。將歸一化后的1986-2009年數(shù)據(jù)作為訓(xùn)練樣本,2010年數(shù)據(jù)作為檢驗(yàn)樣本。
確定預(yù)測(cè)模型每次的輸入樣本中包含6個(gè)數(shù)據(jù),即用連續(xù)6年的數(shù)據(jù)預(yù)測(cè)第七年的數(shù)據(jù)。據(jù)此可建立訓(xùn)練時(shí)的輸入樣本矩陣(6×18)和輸出樣本向量(1×18)。
3.2 預(yù)測(cè)模型基本參數(shù)的確定與訓(xùn)練
1)BP神經(jīng)網(wǎng)絡(luò)基本參數(shù)的確定與訓(xùn)練。確定BP神經(jīng)網(wǎng)絡(luò)的隱含層數(shù)為1,輸入層神經(jīng)元數(shù)為6,輸出層神經(jīng)元數(shù)為1,隱含層神經(jīng)元數(shù)為11。隱含層和輸出層的激勵(lì)函數(shù)分別采用正切型Sigmoid函數(shù)和對(duì)數(shù)型Sigmoid函數(shù)。為了提高收斂速度,訓(xùn)練時(shí)采用了Levenberg-Marquardt數(shù)值優(yōu)化算法。
2)支持向量機(jī)基本參數(shù)的確定與訓(xùn)練。采用Epsilon型支持向量機(jī)回歸算法,經(jīng)過(guò)多次試驗(yàn),確定拉格朗日乘子上界為5,不敏感函數(shù)取值為0.000 01,核函數(shù)采用高斯型,高斯核函數(shù)的寬度取0.15。
4 預(yù)測(cè)與分析
4.1 兩種模型預(yù)測(cè)能力對(duì)比
利用訓(xùn)練完畢的兩種預(yù)測(cè)模型仿真預(yù)測(cè)1992-2009年的河南省農(nóng)田有效灌溉面積并進(jìn)行反歸一化處理。反歸一化后的各預(yù)測(cè)值、預(yù)測(cè)誤差的絕對(duì)值和預(yù)測(cè)相對(duì)誤差的絕對(duì)值見(jiàn)表1。從表1可以看出,支持向量機(jī)的各預(yù)測(cè)值與實(shí)際值更為接近,其預(yù)測(cè)誤差的絕對(duì)平均值、預(yù)測(cè)相對(duì)誤差的絕對(duì)平均值都遠(yuǎn)小于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的對(duì)應(yīng)參數(shù)。圖1中的各預(yù)測(cè)數(shù)據(jù)也全部經(jīng)過(guò)了歸一化處理,從圖1中1992-2009部分也可以看出,支持向量機(jī)的預(yù)測(cè)值基本和實(shí)際值重合在一起,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值在一些地方則與實(shí)際值相差較大,說(shuō)明基于支持向量機(jī)的預(yù)測(cè)模型泛化能力更強(qiáng)。
利用這兩種預(yù)測(cè)模型分別預(yù)測(cè)作為檢驗(yàn)樣本的2010年河南省農(nóng)田有效灌溉面積,反歸一化后的預(yù)測(cè)結(jié)果如表2和圖1所示。從表2和圖1可以看出,基于支持向量機(jī)的預(yù)測(cè)模型在檢驗(yàn)樣本處的實(shí)際預(yù)測(cè)精度也遠(yuǎn)高于BP神經(jīng)網(wǎng)絡(luò),其預(yù)測(cè)誤差僅為BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差的11.8%。
4.2 河南省“十二五”期間農(nóng)田有效灌溉面積的預(yù)測(cè)與分析
實(shí)際上,預(yù)測(cè)結(jié)果是在現(xiàn)有條件的基礎(chǔ)上從數(shù)據(jù)序列的角度進(jìn)行的預(yù)測(cè),如果在“十二五”期間,政府大幅增加水利行業(yè)的資金投入,最終的發(fā)展情況將會(huì)比該預(yù)測(cè)結(jié)果更好。
5 小結(jié)
在對(duì)農(nóng)田有效灌溉面積進(jìn)行預(yù)測(cè)時(shí),數(shù)據(jù)序列預(yù)測(cè)法比結(jié)構(gòu)式預(yù)測(cè)法更為簡(jiǎn)單易行。在各種數(shù)據(jù)序列預(yù)測(cè)方法中,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法和基于支持向量機(jī)的預(yù)測(cè)方法更為適合農(nóng)田有效灌溉面積的非線性變化規(guī)律。
研究針對(duì)BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)兩種預(yù)測(cè)方法進(jìn)行了對(duì)比分析。理論研究表明,基于支持向量機(jī)的預(yù)測(cè)方法可以克服BP神經(jīng)網(wǎng)絡(luò)的諸多缺陷,具有優(yōu)越性。
以河南省1986-2010年的農(nóng)田有效灌溉面積統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),詳細(xì)闡述了利用兩種預(yù)測(cè)方法建立預(yù)測(cè)模型的過(guò)程,并進(jìn)行了應(yīng)用驗(yàn)證。驗(yàn)證結(jié)果表明,基于支持向量機(jī)的預(yù)測(cè)方法具有更好的泛化能力,預(yù)測(cè)精度更高。最后獲得了河南省“十二五”期間農(nóng)田有效灌溉面積的預(yù)測(cè)數(shù)據(jù)并指出了其發(fā)展趨勢(shì)。
參考文獻(xiàn):
[1] 鄭家亨.統(tǒng)計(jì)大辭典[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,1995.
[2] 卞鳳蘭,黃曉明,劉 睿.城鎮(zhèn)化進(jìn)程中公路網(wǎng)用地的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,40(5):1073-1076.
[3] 尹健康,陳昌華,邢小軍,等. 基于BP神經(jīng)網(wǎng)絡(luò)的煙田土壤水分預(yù)測(cè)[J]. 電子科技大學(xué)學(xué)報(bào),2010,39(6):891-895.
[4] 陳 明. 神經(jīng)網(wǎng)絡(luò)模型[M]. 大連:大連理工大學(xué)出版社,1995.
[5] 柳小桐. BP神經(jīng)網(wǎng)絡(luò)輸入層數(shù)據(jù)歸一化研究[J].機(jī)械工程與自動(dòng)化,2010(3):122-123,126.
[6] 張 華,曾 杰.基于支持向量機(jī)的風(fēng)速預(yù)測(cè)模型研究[J]. 太陽(yáng)能學(xué)報(bào),2010,31(7):928-932.
[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.
[9] HSU C W, LIN C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Networks,2002,13(3):415-425.
[10] 河南省統(tǒng)計(jì)局,國(guó)家統(tǒng)計(jì)局河南調(diào)查總隊(duì). 河南省統(tǒng)計(jì)年鑒—2011[M].北京:中國(guó)統(tǒng)計(jì)出版社,2011.