趙黎明,趙巖
(天津大學(xué)管理經(jīng)濟(jì)學(xué)部,天津 300072)
山東省人均用水量預(yù)測(cè)模型研究
——基于多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)模型
趙黎明,趙巖
(天津大學(xué)管理經(jīng)濟(jì)學(xué)部,天津 300072)
針對(duì)水資源供需矛盾日益嚴(yán)重的問題,采用多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型分別對(duì)人均用水量進(jìn)行預(yù)測(cè),并對(duì)兩者預(yù)測(cè)結(jié)果進(jìn)行比較,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型能更好地反映人均用水量及其因變量之間的復(fù)雜關(guān)系。結(jié)果表明:BP模型可有效解決人均用水量的預(yù)測(cè)問題,為政府部門進(jìn)行相關(guān)預(yù)測(cè)和決策提供參考。
人均用水量;SPSS多元線性回歸;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)
水資源是當(dāng)前經(jīng)濟(jì)社會(huì)發(fā)展的重要戰(zhàn)略性資源,是制約區(qū)域經(jīng)濟(jì)可持續(xù)發(fā)展的重要因素。近年來,山東省國(guó)民經(jīng)濟(jì)快速發(fā)展,人民生活水平顯著提高,對(duì)水資源的需求量越來越大,在山東省水資源總量有限的情況下,對(duì)用水量進(jìn)行預(yù)測(cè)分析對(duì)制定未來水資源規(guī)劃具有重要的現(xiàn)實(shí)意義。本文分別采用SPSS回歸分析和BP神經(jīng)網(wǎng)絡(luò)對(duì)山東省人均用水量進(jìn)行預(yù)測(cè)分析,以期找到一種精確、實(shí)用的用水量預(yù)測(cè)模型。
1.1 變量的選擇
將影響人均用水量的因素分為兩大類:經(jīng)濟(jì)水平和生活條件。前者用人均工農(nóng)業(yè)產(chǎn)值、人均可支配收入來度量,后者用人均工業(yè)廢水排放量、人均建筑面積和人均造林面積來度量。本文將采用生活條件這一因素對(duì)人均用水量進(jìn)行預(yù)測(cè)。
以人均用水量Y(人/m3)作為被解釋變量,以人均工業(yè)廢水排放X1(人/t)、人均建筑面積X2(人/m2)、人均造林面積X3(人/m2)為解釋變量建立多元回歸模型。
1.2 數(shù)據(jù)的收集
建立包括人均用水量Y、人均工業(yè)廢水排放X1、人均建筑面積X2、人均造林面積X3的數(shù)據(jù)庫。根據(jù)《山東省統(tǒng)計(jì)年鑒(2012)》和《山東省水資源公報(bào)》搜集、整理模型的數(shù)據(jù)庫,如表1所示。
2.1 模型建立
運(yùn)用SPSS18進(jìn)行線性回歸分析,相關(guān)數(shù)據(jù)如表2所示[1-3]。
通過表2可得,人均用水量的預(yù)測(cè)公式為
表1 山東省人均用水量預(yù)測(cè)原始數(shù)據(jù)(2000—2009年)
表2 線性回歸系數(shù)
2.2 模型診斷
1)共線性檢驗(yàn)
由表2可知:本模型的容忍度均大于0.01, VIF(方差膨脹系數(shù))均小于10,此外特征值為3.899、0.087、0.02、0.004,只有一項(xiàng)略小于0.01,條件指標(biāo)(CI)為1.000、6.684、13.947、30.215,只有一項(xiàng)略高于30。以上指標(biāo)表明:本模型存在輕微的多重共線性問題。
2)擬合優(yōu)度檢驗(yàn)
根據(jù)回歸分析,回歸模型的樣本決定系數(shù)R2=0.803,說明模型的3個(gè)自變量可以解釋“人均用水量”因變量80.3%的變異量。根據(jù)R2檢驗(yàn)規(guī)則,R2的值越接近1,代表方程的擬合優(yōu)度越好,此處R2=0.803,表明人均用水量與人均工業(yè)廢水排放量、人均建筑面積、人均造林面積的線性關(guān)系顯著,回歸模型能很好地反映實(shí)際數(shù)據(jù)的變化,方程的擬合優(yōu)度較好。D-W=1.303,表明各殘差項(xiàng)之間具有一定的正相關(guān)關(guān)系。
3)顯著性檢驗(yàn)
本例的F=10.849,顯著性檢驗(yàn)P值為0.003。本例取95%的置信區(qū)間(α=0.05),P= 0.003<α=0.05,表示回歸模型整體解釋變異量達(dá)到顯著水平,由接近99.997%的概率可以斷定,自變量對(duì)因變量產(chǎn)生顯著的線性影響。
根據(jù)模型預(yù)測(cè)結(jié)果繪制人均用水量多元回歸預(yù)測(cè)值與實(shí)際值比較圖,如圖1所示。根據(jù)相關(guān)數(shù)據(jù)預(yù)測(cè)2015、2020年的人均用水量為222.5 (人/m3)、225.7(人/m3)。
圖1 人均用水量多元回歸預(yù)測(cè)值與實(shí)際值的比較
3.1 網(wǎng)絡(luò)訓(xùn)練過程
1)歸一化處理數(shù)據(jù)。使用SPSS18的轉(zhuǎn)換功能,選擇隨機(jī)數(shù)字生成器,設(shè)置起點(diǎn)固定值為9 191 972,運(yùn)用計(jì)算變量功能建立分區(qū)變量partition,數(shù)字表達(dá)式為2*rv.bernoulli(0.7)-1,將分區(qū)值設(shè)置為概率為0.7的Bernoulli變量。
2)將人均用水量Y選為因變量,人均工業(yè)廢水排放X1(人/t)、人均建筑面積X2(人/m2)、人均造林面積X3(人/m2)為因子,使用分區(qū)變來那個(gè)partition來分區(qū)變量。
3)隱藏層數(shù)為一個(gè),單位自動(dòng)計(jì)算,激活函數(shù)Sigmoid,輸出選擇恒等函數(shù),尺度因變量重標(biāo)度選擇標(biāo)準(zhǔn)化,修正值為0.02,培訓(xùn)類型為批處理,初始Lambda值、Sigma值為默認(rèn)的0.000 000 5,0.000 05,間隔點(diǎn)中心數(shù)為0,間隔偏移量為±0.5。
根據(jù)模型預(yù)測(cè)結(jié)果繪制人均用水量BP預(yù)測(cè)值與實(shí)際值比較圖[4-12],如圖2所示;學(xué)習(xí)結(jié)果及殘差數(shù)據(jù)見表3。根據(jù)相關(guān)數(shù)據(jù)預(yù)測(cè)2015、2020年的人均用水量為224.5(人/m3)、227.3(人/m3)。
圖2 人均用水量BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)際值的比較
圖3 BP神經(jīng)網(wǎng)絡(luò)對(duì)因變量的觀察預(yù)測(cè)圖
3.2 結(jié)果檢驗(yàn)
從BP神經(jīng)網(wǎng)絡(luò)關(guān)于因變量人均用水量的觀察預(yù)測(cè)圖可以看出:人均用水量Y的預(yù)測(cè)值基本位于從原點(diǎn)出發(fā)的45°線之上,模型的預(yù)測(cè)結(jié)果接近理想狀況。此外,從表3可知:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的最大殘差為-0.92,最低預(yù)測(cè)精度為99.61%,表明模型具有較高的精確性。
表3 多元回歸與BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果比較
由圖1、2及表3可知:BP神經(jīng)網(wǎng)絡(luò)對(duì)于人均用水量Y的預(yù)測(cè)較多元線性回歸的預(yù)測(cè)更為敏感和精確,預(yù)測(cè)值的誤差和精度都高于多元線性回歸模型。本文分析這種現(xiàn)象的原因是兩種模型本身的特點(diǎn)和此例因變量與自變量之間的關(guān)系共同決定的。
人均用水量Y與3個(gè)自變量之間并非典型的線性相關(guān)關(guān)系,同時(shí)自變量之間具有一定的相關(guān)關(guān)系,線性回歸方程無法準(zhǔn)確描述這種非線性相關(guān)關(guān)系和自變量的相關(guān)關(guān)系。BP神經(jīng)網(wǎng)絡(luò)模型屬于隱含式的數(shù)學(xué)方法,在分析過程中不需要建立數(shù)學(xué)模型,只需要通過對(duì)原始數(shù)據(jù)訓(xùn)練得到穩(wěn)定的學(xué)習(xí)網(wǎng)絡(luò),從而對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),這種方法更加簡(jiǎn)便。因此,人均用水量Y與自變量的非完全的線性相關(guān)關(guān)系以及自變量之間的相關(guān)關(guān)系不會(huì)對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)產(chǎn)生影響,神經(jīng)網(wǎng)絡(luò)模型得以更好地模擬非線性方程。
人均用水量與相關(guān)自變量之間具有復(fù)雜的關(guān)系,BP神經(jīng)網(wǎng)絡(luò)的非線性映射功能可以很好地克服線性回歸分析針對(duì)復(fù)雜關(guān)系變量時(shí)的不足。同時(shí),BP神經(jīng)網(wǎng)絡(luò)操作方便,不需要人為地確定權(quán)重,降低了主觀因素對(duì)預(yù)測(cè)造成的影響,預(yù)測(cè)結(jié)果更加精確。在人均用水量相關(guān)影響因素更加具體和精確以及神經(jīng)網(wǎng)絡(luò)自身不斷完善的前提下,神經(jīng)網(wǎng)絡(luò)在人均用水量預(yù)測(cè)以及其他相關(guān)預(yù)測(cè)領(lǐng)域?qū)⒌玫礁鼜V泛的應(yīng)用。
[1]Daily G C,Ehrlich P R.Socioeconomic equity,sustain-ability,and earth carrying capacity[J].Ecological Application,1996,6(4):991-1001.
[2]宇傳華.SPSS統(tǒng)計(jì)分析[M].北京:電子工業(yè)出版社,2007.
[3]張紅坡,張海鋒.SPSS統(tǒng)計(jì)分析實(shí)用寶典[M].北京:清華大學(xué)出版社,2012.
[4]劉丹丹,馮利華,王寧,等.基于BP神經(jīng)網(wǎng)絡(luò)的義烏水資源需求量預(yù)測(cè)[J].水資源與水利工程學(xué)報(bào),2010,21(4):114-117.
[5]王輝,孫世群,熊鴻斌.城市工業(yè)廢水排放量灰色預(yù)測(cè)的研究[J].安徽化工,2005,(5):51-53.
[6]夏維力,呂曉強(qiáng).基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)技術(shù)創(chuàng)新能力評(píng)價(jià)及應(yīng)用研究[J].研究與發(fā)展管理,2005,17 (1):50-54.
[7]李永華,劉德,金龍.基于BP神經(jīng)網(wǎng)絡(luò)的汛期降水量預(yù)測(cè)模型研究[J].氣象科學(xué),2002,22(4):461-467.
[8]鄧代強(qiáng),朱永建,李健,等.基于BP神經(jīng)網(wǎng)絡(luò)的充填料漿流變參數(shù)預(yù)測(cè)分析[J].武漢理工大學(xué)學(xué)報(bào),2012 (7):82-87.
[9]李連,孫聰,蘇濤.基于蟻群改進(jìn)BP算法的組合預(yù)測(cè)模型[J].四川兵工學(xué)報(bào),2012(9):68-70.
[10]尹然,丁曉明,李小亮,等.基于SA-BP神經(jīng)網(wǎng)絡(luò)的軟件缺陷預(yù)測(cè)模型的研究[J].西南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2013(8):147-152.
(責(zé)任編輯 劉舸)
[11]郭杰,歐名豪,劉瓊,等.基于BP神經(jīng)網(wǎng)絡(luò)的南通市建設(shè)用地需求預(yù)測(cè)[J].資源科學(xué),2009,31(8):1355-1361.
[12]劉樹鋒,陳俊合.基于神經(jīng)網(wǎng)絡(luò)理論的水資源承載力研究[J].資源科學(xué),2007,29(1):99-105.
(責(zé)任編輯 劉舸)
Multivariate Linear Regression and BP Neural Network Model for Per Capita Water Consumption Forecasting Model Research in Shandong Province
ZHAO Li-ming,ZHAO Yan
(Economic Management Department,Tianjin University,Tianjin 300072,China)
Water resource is becoming one of the most important factors of economic and social development.In view of the problem of serious imbalance between supply and demand of water resources,
this paper used multivariate linear regression model and BP neural network model to forecast the per capita water consumption respectively,and made comparisons about the forecasting result.We found that the BP neural network model can better response the complicated relationship between the per capita water consumption and the dependent variable.BP model can effectively solve the problem of per capita water consumption prediction,and provide a reference for relevant prediction and decisionmaking for the government department.
per capita water consumption;SPSS multivariate linear regression;BP neural network; forecasting
TU991.5
A
1674-8425(2014)03-0131-04
10.3969/j.issn.1674-8425(z).2014.03.024
2013-11-22
趙黎明(1951—),男,河北人,教授,博士生導(dǎo)師,主要從事區(qū)域經(jīng)濟(jì)可持續(xù)發(fā)展(含旅游管理)、企業(yè)管理、市場(chǎng)研究等方面研究;通訊作者趙巖,碩士研究生,主要從事區(qū)域經(jīng)濟(jì)可持續(xù)發(fā)展專業(yè)研究。
趙黎明,趙巖.山東省人均用水量預(yù)測(cè)模型研究——基于多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)模型[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2014(3):131-134.
format:ZHAO Li-ming,ZHAO Yan.Multivariate Linear Regression and BP Neural Network Model for Per Capita Water Consumption Forecasting Model Research in Shandong Province[J].Journal of Chongqing University of Technology:Natural Science,2014(3):131-134.