馬于航,索梅芹
(1.河北工程大學(xué)水利水電學(xué)院,河北邯鄲 056021;2.河北工程大學(xué)河北省智慧水利重點(diǎn)實(shí)驗(yàn)室,河北邯鄲 056038)
城市需水預(yù)測(cè)是城市水資源管理和規(guī)劃的重要環(huán)節(jié),也是供水系統(tǒng)優(yōu)化運(yùn)行的基本內(nèi)容[1]。城市需水量是一個(gè)受人口、地域、經(jīng)濟(jì)發(fā)展等諸多因素影響的變量,具有較強(qiáng)的非線性和不確定性。現(xiàn)有的需水預(yù)測(cè)方法包括傳統(tǒng)預(yù)測(cè)(回歸分析、指數(shù)平滑、趨勢(shì)外推法等)[2-5]和新型預(yù)測(cè)(BP 神經(jīng)網(wǎng)絡(luò)、灰色預(yù)測(cè)、混沌理論、組合模型等)[6-12]。馬興冠等[13]研究表明指數(shù)預(yù)測(cè)、定額預(yù)測(cè)法、趨勢(shì)法等方法只能反映一種平穩(wěn)的幾何增長(zhǎng)過(guò)程,預(yù)測(cè)精度偏低,聶紅梅[14]等比較了主成分回歸、逐步回歸、灰色模型和BP神經(jīng)網(wǎng)絡(luò)四種城市需水預(yù)測(cè)模型,其中BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性擬合能力,利用BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行需水預(yù)測(cè)具有較高的預(yù)測(cè)精度;但在實(shí)際使用過(guò)程中,BP 神經(jīng)網(wǎng)絡(luò)具有收斂速度慢、易陷入局部最優(yōu)的缺點(diǎn)。為加強(qiáng)BP 神經(jīng)網(wǎng)絡(luò)全局搜索的能力、提高網(wǎng)絡(luò)性能與預(yù)測(cè)精度,引入遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),構(gòu)建GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,具有一定的計(jì)算效果。在實(shí)際用水過(guò)程中,由于不確定因素的影響,需水量具有波動(dòng)性和不確定性的特點(diǎn),單一使用GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型得到的點(diǎn)預(yù)測(cè)結(jié)果、難以解決需水量的波動(dòng)性和不確定性,而利用區(qū)間預(yù)測(cè)可以更好地反映城市需水量的實(shí)際情況。因此,在GA-BP 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,引入正態(tài)區(qū)間估計(jì)的方法,進(jìn)行城市需水量區(qū)間預(yù)測(cè),可得到更穩(wěn)定、更準(zhǔn)確、更接近實(shí)際的預(yù)測(cè)效果。
本文以邯鄲市為例,構(gòu)建基于GA-BP神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的組合預(yù)測(cè)模型,該模型使用主成分分析法、灰色關(guān)聯(lián)分析法對(duì)需水影響因子進(jìn)行兩次篩選,篩選后的需水影響因子作為輸入GA-BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,在使用GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)基礎(chǔ)上,引入正態(tài)區(qū)間估計(jì),以實(shí)現(xiàn)提升預(yù)測(cè)精度、更好地反映城市需水量實(shí)際情況的目的。
基于GA-BP 神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的組合預(yù)測(cè)模型主要分為以下幾部分:主成分分析、灰色關(guān)聯(lián)分析、GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)、正態(tài)檢驗(yàn)、正態(tài)區(qū)間估計(jì)。設(shè)計(jì)的組合模型技術(shù)路線如圖1所示。
圖1 組合模型設(shè)計(jì)Fig.1 Combined model design
1.1.1 主成分分析法
主成分分析法是一種常用的數(shù)據(jù)分析方法,其基本思想是將多指標(biāo)的數(shù)據(jù)通過(guò)數(shù)據(jù)的線性變化(基變換)轉(zhuǎn)換為幾個(gè)線性無(wú)關(guān)的綜合指標(biāo),舍棄部分信息量,從而達(dá)到數(shù)據(jù)降維和解決數(shù)據(jù)間多重共線性的目的。基本原理:
設(shè)Xmn=(X1,X2,…,Xm)為m個(gè)標(biāo)準(zhǔn)化指標(biāo)組成的數(shù)據(jù)矩陣,每個(gè)指標(biāo)有n個(gè)樣本;
對(duì)矩陣X進(jìn)行線性變化(基變換)得Ykn=PkmXmn,YT=(y1,y2,…,yk)(k<m)為降維后的數(shù)據(jù)矩陣,由k個(gè)指標(biāo)組成,每個(gè)指標(biāo)有n個(gè)樣本,這是降維的基本形式;
主成分分析法要求降維后數(shù)據(jù)矩陣的協(xié)方差矩陣為對(duì)角矩陣,即降維后各指標(biāo)間線性無(wú)關(guān)且每次提取的主成分信息量最大:
不難看出,進(jìn)行線性變換時(shí)連續(xù)提取主成分的過(guò)程,其實(shí)就是矩陣X的協(xié)方差矩陣的對(duì)角化過(guò)程。通過(guò)矩陣對(duì)角化的方式對(duì)矩陣X的協(xié)方差矩陣進(jìn)行運(yùn)算,所計(jì)算得到的最大的特征值即為第一主成分的方差,也代表了信息量的多少,而相應(yīng)的特征向量即是通過(guò)矩陣X線性變換所得到第一主成分的特征系數(shù),它也可視為相應(yīng)指標(biāo)在主成分中所占有的最大權(quán)重。
1.1.2 灰色關(guān)聯(lián)分析法
灰色關(guān)聯(lián)分析法是一種關(guān)于多指標(biāo)數(shù)據(jù)的分析方法,能夠定量分析不同指標(biāo)數(shù)據(jù)對(duì)某個(gè)指標(biāo)的影響程度?;居?jì)算過(guò)程包括:
設(shè)指標(biāo)X0(k)=[X0(1),X0(2),…,X0(m)];
影響因素指標(biāo)Xi(k)=[Xi(1),Xi(2),…,Xi(n)],i=1,2,…,n;
消除量綱影響進(jìn)行初值化處理:
計(jì)算指標(biāo)與影響因素?cái)?shù)據(jù)Xi(k)差的絕對(duì)值:
計(jì)算關(guān)聯(lián)系數(shù):
計(jì)算各影響因素與指標(biāo)的關(guān)聯(lián)度,并根據(jù)得到的關(guān)聯(lián)度由大到小排序。關(guān)聯(lián)度越大,代表兩者之間的相關(guān)性就越強(qiáng):
1.2.1 BP神經(jīng)網(wǎng)絡(luò)
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一個(gè)由誤差反向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),大量研究證實(shí)了BP 神經(jīng)網(wǎng)絡(luò)在時(shí)間序列預(yù)測(cè)中的優(yōu)越性,其基本結(jié)構(gòu)由輸入層、隱藏層和輸出層三部分組成。其核心思想是模擬腦神經(jīng)信號(hào)的傳播方式,使用樣本值進(jìn)行多次訓(xùn)練,采用梯度下降的方法,進(jìn)行誤差反向傳播,調(diào)整權(quán)值、閾值,確定影響因素與輸出值之間的映射關(guān)系。其基本原理如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.2 Basic structure of BP neural network
神經(jīng)元節(jié)點(diǎn)間正向傳播,設(shè)輸入層神經(jīng)元Xi,隱含層神經(jīng)元Hj,信號(hào)激活函數(shù)f(x),權(quán)重ωij,閾值bj:
誤差反向傳播調(diào)整權(quán)重,實(shí)際值Yn,模擬值yn,E(ω,b)為變量ω,b的誤差函數(shù):
1.2.2 GA-BP神經(jīng)網(wǎng)絡(luò)
GA-BP(Genetic Algorithm-Back Propagation)神經(jīng)網(wǎng)絡(luò)是使用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)。隨機(jī)生成多組BP神經(jīng)網(wǎng)絡(luò)的權(quán)值、閾值(群體),個(gè)體是其中的一組權(quán)值、閾值,每個(gè)個(gè)體的染色體為權(quán)值或閾值,每條染色體的基因?yàn)闄?quán)值或閾值的二進(jìn)制編碼,使用誤差均方差或平均相對(duì)誤差作為適應(yīng)度函數(shù),較小的誤差個(gè)體更容易被選擇(輪盤賭選擇),從而進(jìn)行染色體交叉以及基因變異,最終選出最優(yōu)個(gè)體,即優(yōu)異的影響因子與輸出值間的映射關(guān)系。
1.3.1K-s正態(tài)檢驗(yàn)
K-s正態(tài)檢驗(yàn)是一種用于測(cè)試單個(gè)樣本是否符合特定分布的方法。基本原理是將樣本數(shù)據(jù)的累積頻率分布與正態(tài)分布進(jìn)行比較。如果兩者之間的差異很小,則假定該數(shù)據(jù)樣本符合正態(tài)分布標(biāo)準(zhǔn)。在SPSS 軟件上對(duì)樣本進(jìn)行K-s檢驗(yàn),計(jì)算P值,若P>0.5,則接受零假設(shè),認(rèn)為樣本符合正態(tài)分布。
1.3.2 正態(tài)區(qū)間估計(jì)
若總體X服從正態(tài)分布N(μ,σ2),σ2未知,對(duì)μ做區(qū)間估計(jì)。假設(shè)X1,X2,…,Xn是總體X的一個(gè)樣本,樣本均值為-X,樣本方差為S2,則:
在置信度為1-α下,μ的置信區(qū)間為:
需水量的變化是社會(huì)、經(jīng)濟(jì)、科技、文化等因素綜合作用的結(jié)果。本文結(jié)合邯鄲市的用水結(jié)構(gòu),選取《邯鄲市水資源公報(bào)》和《邯鄲市統(tǒng)計(jì)年鑒》中2004-2019年的數(shù)據(jù),初步選取了25 個(gè)影響邯鄲市需水的因素:農(nóng)業(yè)用水量(X1,億m3)、工業(yè)用水量(X2,億m3)、生活用水量(X3,億m3)、地區(qū)生產(chǎn)總值(X4,億元)、第一產(chǎn)業(yè)生產(chǎn)總值(X5,億元)、第二產(chǎn)業(yè)生產(chǎn)總值(X6,億元)、第三產(chǎn)業(yè)生產(chǎn)總值(X7,億元)、農(nóng)林牧漁業(yè)總產(chǎn)值(X8,萬(wàn)元)、糧食總播種面積(X9,hm2)、糧食總產(chǎn)量(X10,t)、有效灌溉面積(X11,hm2)、溫度(X12,℃)、降水量(X13,mm)、日照時(shí)長(zhǎng)(X14,h)、工業(yè)總產(chǎn)值(X15,萬(wàn)元)、重輕工業(yè)比值(X16)、發(fā)電量(X17,億kWh)、洗煤(X18,萬(wàn)t)、鋼材(X19,萬(wàn)t)、常住人口(X20,萬(wàn))、城鎮(zhèn)化率(X21)、年平均居民可支配收入(X22,元)、年平均居民消費(fèi)性支出(X23,元)、年平均每人地區(qū)生產(chǎn)總值(X24,元)、公園綠地面積(X25,hm2)。
總需水量影響因子指標(biāo)篩選。因?yàn)橹鞒煞址治龇ǚ治鲂杷绊懸蜃拥闹饕康氖呛Y除存在重復(fù)信息的數(shù)據(jù)指標(biāo),灰色關(guān)聯(lián)分析法主要目的為篩選出與目的指標(biāo)發(fā)展趨勢(shì)相近的數(shù)據(jù)指標(biāo),所以為保證入選指標(biāo)具有代表性、全面性且對(duì)預(yù)測(cè)結(jié)果有促進(jìn)作用,使用主成分分析法和灰色關(guān)聯(lián)法對(duì)指標(biāo)進(jìn)行兩次篩選。具體步驟和方法如下:
(1)使用主成分分析法對(duì)25個(gè)影響因子指標(biāo)進(jìn)行分析。分析結(jié)果如表1所示。
表1 相關(guān)系數(shù)矩陣特征值及方差貢獻(xiàn)率Tab.1 Eigenvalues and variance contribution of correlation coefficient matrix
從表1得,4個(gè)主成分累計(jì)方差貢獻(xiàn)率已達(dá)91.245%,說(shuō)明4個(gè)主成分基本包含了全部指標(biāo)蘊(yùn)含的信息,因此提取4 個(gè)主成分,4 個(gè)主成分包含方差貢獻(xiàn)率分別為69.61%、9.35%、7.32%、4.96%,據(jù)此對(duì)4個(gè)主成分中指標(biāo)提取個(gè)數(shù)依次為14、2、2、1。
(2)將主成分中指標(biāo)的特征向量由大到小排列,根據(jù)提取個(gè)數(shù)依次提取指標(biāo)。結(jié)果如表2所示。
表2 主成分中指標(biāo)的提取Tab.2 Extraction of indicators in principal components
提取主成分時(shí),對(duì)應(yīng)的特征向量是從數(shù)據(jù)矩陣線性變換獲得的主成分系數(shù),也可以視為主成分中指標(biāo)的權(quán)重。因此,將主成分中所含指標(biāo)的特征向量由大到小進(jìn)行排列,按照貢獻(xiàn)率的大小依次提取前14、2、2、1個(gè)指標(biāo)。提取指標(biāo)為X1、X4、X5、X6、X7、X8、X12、X14、X15、X16、X17、X19、X20、X21、X22、X24、X25,總 計(jì)17 個(gè)指標(biāo)。
(3)計(jì)算所有需水因子指標(biāo)與總需水量的灰色關(guān)聯(lián)系數(shù),使用灰色關(guān)聯(lián)系數(shù)對(duì)主成分分析提取的指標(biāo)第二次篩選。計(jì)算結(jié)果如表3所示。
表3 灰色關(guān)聯(lián)系數(shù)計(jì)算結(jié)果Tab.3 Calculation results of gray correlation coefficients
結(jié)合主成分分析法提取的指標(biāo),依據(jù)灰色關(guān)聯(lián)系數(shù)最終篩選出10 個(gè)總需水影響因子指標(biāo):第一產(chǎn)業(yè)生產(chǎn)總值、第二產(chǎn)業(yè)生產(chǎn)總值、有效灌溉面積、溫度、日照時(shí)長(zhǎng)、工業(yè)總產(chǎn)值、發(fā)電量、常住人口、城鎮(zhèn)化率、地區(qū)生產(chǎn)總值(X5、X6、X11、X12、X14、X15、X17、X20、X21、X24)。
農(nóng)業(yè)用水影響因子:第一產(chǎn)業(yè)生產(chǎn)總值、農(nóng)林牧漁業(yè)總產(chǎn)值、糧食總播種面積、糧食總產(chǎn)量、有效灌溉面積、溫度、降水量、日照時(shí)長(zhǎng)8 個(gè)影響因子;工業(yè)用水影響因子:第二產(chǎn)業(yè)生產(chǎn)總值、發(fā)電量、工業(yè)總產(chǎn)值、洗煤、重輕工業(yè)比值、鋼材6 個(gè)影響因子;生活用水影響因子:地區(qū)生產(chǎn)總值、常住人口、城鎮(zhèn)化率、居民可支配收入、居民消費(fèi)性支出、人均地區(qū)生產(chǎn)總值6個(gè)影響因子;總需水量影響因子:第一產(chǎn)業(yè)生產(chǎn)總值、溫度、日照時(shí)長(zhǎng)、有效灌溉面積、第二產(chǎn)業(yè)生產(chǎn)總值、發(fā)電量、工業(yè)總產(chǎn)值、常住人口、人均地區(qū)生產(chǎn)總值、城鎮(zhèn)化率10個(gè)影響因子。
根據(jù)上述選定的用水影響因素,在matlab上編寫B(tài)P神經(jīng)網(wǎng)絡(luò)、GA-BP 神經(jīng)網(wǎng)絡(luò)代碼,使用2004-2016年的需水量和需水影響因素?cái)?shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,利用BP 神經(jīng)網(wǎng)絡(luò)、GA-BP 神經(jīng)網(wǎng)絡(luò)分別進(jìn)行模擬,使用相對(duì)誤差指數(shù)作為檢驗(yàn)指標(biāo),對(duì)2017-2019年的數(shù)據(jù)樣本進(jìn)行檢驗(yàn)分析。模擬預(yù)測(cè)結(jié)果如圖3所示,模擬預(yù)測(cè)結(jié)果統(tǒng)計(jì)如表4所示。
表4 BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模擬預(yù)測(cè)結(jié)果統(tǒng)計(jì) %Tab.4 Statistics of simulation prediction results of BP neural network and GA-BP neural network
圖3 BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模擬預(yù)測(cè)結(jié)果Fig.3 BP neural network and GA-BP neural network simulation prediction results
為檢驗(yàn)GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度,使用訓(xùn)練樣本平均相對(duì)誤差、檢驗(yàn)樣本最大相對(duì)誤差兩個(gè)指標(biāo)從歷史用水?dāng)?shù)據(jù)擬合、未來(lái)用水預(yù)測(cè)兩個(gè)方面與BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比,其中,在對(duì)邯鄲市農(nóng)業(yè)用水、工業(yè)用水、生活用水、總用水進(jìn)行模擬預(yù)測(cè)時(shí),BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本平均相對(duì)誤差為1.22%、2.00%、1.69%、1.24%,檢驗(yàn)樣本最大相對(duì)誤差為2.37%、4.76%、4.12%、4.69%;GA-BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本平均相對(duì)誤差為1.79%、0.78%、1.62%、0.85%,檢驗(yàn)樣本最大相對(duì)誤差為1.85%、2.38%、1.87%、2.84%??梢姡珺P神經(jīng)網(wǎng)絡(luò)與GA-BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本平均相對(duì)誤差基本都小于2%,訓(xùn)練樣本平均相對(duì)誤差較小,檢驗(yàn)樣本最大相對(duì)誤差都在5%以下,整體上均可滿足需水預(yù)測(cè)要求;對(duì)比BP 神經(jīng)網(wǎng)絡(luò)和GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果,GA-BP 神經(jīng)網(wǎng)絡(luò)的歷史用水?dāng)?shù)據(jù)擬合更好、預(yù)測(cè)精度更高。
單一使用GA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行需水預(yù)測(cè),預(yù)測(cè)結(jié)果并不能很好的反映未來(lái)需水量實(shí)際狀況,其主要原因?yàn)椋阂环矫媸褂肎A-BP 神經(jīng)網(wǎng)絡(luò)得到的預(yù)測(cè)結(jié)果為點(diǎn)預(yù)測(cè)結(jié)果,不能反映未來(lái)需水量的波動(dòng)性和不確定性特點(diǎn),另一方面,在實(shí)際進(jìn)行GABP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)操作時(shí),即使在相同參數(shù)條件下,也會(huì)出現(xiàn)由于初始權(quán)重、隨機(jī)閾值、過(guò)擬合等隨機(jī)因素造成預(yù)測(cè)結(jié)果不唯一的現(xiàn)象。因此,構(gòu)建基于GA-BP神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的組合需水預(yù)測(cè)模型,在使用GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的基礎(chǔ)上,引入正態(tài)區(qū)間估計(jì),使用GA-BP神經(jīng)網(wǎng)絡(luò)的點(diǎn)預(yù)測(cè)結(jié)果作為正態(tài)區(qū)間估計(jì)樣本,進(jìn)行區(qū)間預(yù)測(cè),具體步驟如下。
(1)將邯鄲市2004-2016年總需水量與影響因子數(shù)據(jù)作為訓(xùn)練樣本,2017、2018年數(shù)據(jù)作為檢驗(yàn)樣本,使用GA-BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行多次擬合,并選擇訓(xùn)練結(jié)果,挑選出訓(xùn)練樣本平均相對(duì)誤差小于2%以及檢驗(yàn)樣本最大相對(duì)誤差小于2%的GA-BP神經(jīng)網(wǎng)絡(luò),然后使用挑選出的GA-BP 神經(jīng)網(wǎng)絡(luò)對(duì)2019年總需水量進(jìn)行預(yù)測(cè),取80 個(gè)GA-BP 神經(jīng)網(wǎng)絡(luò)點(diǎn)預(yù)測(cè)結(jié)果。預(yù)測(cè)結(jié)果頻率分布如圖4所示,預(yù)測(cè)結(jié)果統(tǒng)計(jì)如表5所示。
表5 GA-BP神經(jīng)網(wǎng)絡(luò)2019年總需水量點(diǎn)預(yù)測(cè)結(jié)果描述統(tǒng)計(jì)Tab.5 GA-BP neural network 2019 total water demand point forecast results descriptive statistics
圖4 GA-BP神經(jīng)網(wǎng)絡(luò)2019年總需水量點(diǎn)預(yù)測(cè)結(jié)果頻率分布Fig.4 Frequency distribution of GA-BP neural network 2019 total water demand point forecast results
(2)在SPSS 軟件上對(duì)80 個(gè)GA-BP 神經(jīng)網(wǎng)絡(luò)2019年總需水量點(diǎn)預(yù)測(cè)結(jié)果樣本進(jìn)行K-s檢驗(yàn),經(jīng)計(jì)算P=0.2,P>0.05,接受零假設(shè),即80 個(gè)2019年總需水量點(diǎn)預(yù)測(cè)結(jié)果樣本服從正態(tài)分布。根據(jù)正態(tài)分布均值區(qū)間估計(jì)得:在置信度95%的情況下,基于GA-BP 神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的邯鄲市2019年總需水量區(qū)間預(yù)測(cè)結(jié)果為19.083 4~19.279 2 億m3。邯鄲市2019年總需水量為19.278 4 億m3。結(jié)果分析如表6所示。
表6 基于GA-BP神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的2019年總需水量區(qū)間預(yù)測(cè)結(jié)果Tab.6 Total water demand interval forecast results for 2019 based on GA-BP neural network with normal interval estimation
從表5 可以看出,在平均相對(duì)誤差小于2%、檢驗(yàn)樣本最大相對(duì)誤差小于2%的條件下,使用單一GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)2019年總需水量預(yù)測(cè),點(diǎn)預(yù)測(cè)結(jié)果預(yù)測(cè)相對(duì)誤差在-6.2%~5.13%之間。從表6 可以看出,在GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)基礎(chǔ)上引入正態(tài)區(qū)間估計(jì)的組合模型對(duì)2019年總需水量預(yù)測(cè),預(yù)測(cè)相對(duì)誤差在-1.01%~0.004%之間,基于正態(tài)區(qū)間估計(jì)與GA-BP神經(jīng)網(wǎng)絡(luò)的組合需水預(yù)測(cè)模型更穩(wěn)定、預(yù)測(cè)精度更高。
本文結(jié)合邯鄲市用水結(jié)構(gòu),采用主成分分析法、灰色關(guān)聯(lián)分析法對(duì)邯鄲市需水因素?cái)?shù)據(jù)進(jìn)行兩次篩選,在使用GA-BP神經(jīng)網(wǎng)絡(luò)得到邯鄲市需水量點(diǎn)預(yù)測(cè)結(jié)果的基礎(chǔ)上,引入正態(tài)區(qū)間估計(jì),對(duì)邯鄲市總需水量進(jìn)行區(qū)間預(yù)測(cè)。主要結(jié)論如下。
(1)BP 神經(jīng)網(wǎng)絡(luò)與GA-BP 神經(jīng)網(wǎng)絡(luò)兩種預(yù)測(cè)方法均可滿足基本需水預(yù)測(cè)要求,且GA-BP神經(jīng)網(wǎng)絡(luò)的歷史用水?dāng)?shù)據(jù)擬合更好、預(yù)測(cè)精度更高;其中,在對(duì)邯鄲市農(nóng)業(yè)用水、工業(yè)用水、生活用水、總用水進(jìn)行模擬預(yù)測(cè)時(shí),GA-BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本平均相對(duì)誤差為1.79%、0.78%、1.62%、0.85%,檢驗(yàn)樣本最大相對(duì)誤差為1.85%、2.38%、1.87%、2.84%。
(2)單一使用GA-BP 神經(jīng)網(wǎng)絡(luò)對(duì)未來(lái)需水量進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)結(jié)果不穩(wěn)定,會(huì)出現(xiàn)誤差較大的現(xiàn)象,其中,在訓(xùn)練樣本平均相對(duì)誤差小于2%、檢驗(yàn)樣本最大相對(duì)誤差小于2%的條件下,使用單一GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)2019年總需水量預(yù)測(cè),預(yù)測(cè)相對(duì)誤差在-6.2%~5.13%之間。
(3)與單一使用GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相比,基于GABP神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的組合需水預(yù)測(cè)模型更穩(wěn)定、預(yù)測(cè)精度更高、更能反映未來(lái)需水量實(shí)際狀況。在置信度95%的情況下,基于GA-BP 神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的邯鄲市2019年區(qū)間預(yù)測(cè)相對(duì)誤差在-1.01%~0.004%之間。
城市需水預(yù)測(cè)從時(shí)間尺度上可分為短期預(yù)測(cè)(一年以內(nèi))、中期預(yù)測(cè)(一至十年)、長(zhǎng)期預(yù)測(cè)(十年以上)。本文構(gòu)建了基于GA-BP 神經(jīng)網(wǎng)絡(luò)與正態(tài)區(qū)間估計(jì)的組合預(yù)測(cè)模型,限于數(shù)據(jù)資料,以邯鄲市為例僅驗(yàn)證了中期預(yù)測(cè)的可靠性,對(duì)于預(yù)測(cè)時(shí)間尺度在十年以上的長(zhǎng)期預(yù)測(cè)來(lái)說(shuō),訓(xùn)練樣本數(shù)據(jù)代表性較差,不能反映如未來(lái)節(jié)水政策、未來(lái)城市建設(shè)等不可量化信息,在預(yù)測(cè)精度上會(huì)有折扣;對(duì)于中、短期預(yù)測(cè)來(lái)說(shuō),節(jié)水政策、城市建設(shè)等不可量化指標(biāo)信息在歷史用水?dāng)?shù)據(jù)趨勢(shì)中有所體現(xiàn)。因此從理論上講,該模型在中、短期預(yù)測(cè)上有不錯(cuò)的精度,但在實(shí)際應(yīng)用過(guò)程中需要進(jìn)一步驗(yàn)證。 □