(新疆塔里木河流域希尼爾水庫管理局,新疆 庫爾勒 841000)
城市需水量預(yù)測(cè)是進(jìn)行區(qū)域水資源調(diào)配的重要基礎(chǔ),其受人口、固定資產(chǎn)投資、經(jīng)濟(jì)增長(zhǎng)等多種因素的影響,且具有非線性、大時(shí)滯和不穩(wěn)定等特點(diǎn)。因此對(duì)城市需水量預(yù)測(cè)方法進(jìn)行研究,及時(shí)準(zhǔn)確掌握未來城市需水量的變化規(guī)律,對(duì)于提高城市供水保證率、降低城市缺水風(fēng)險(xiǎn)、維護(hù)水安全具有重要意義。
目前,國(guó)內(nèi)外學(xué)者針對(duì)城市需水量預(yù)測(cè)方法已經(jīng)進(jìn)行了大量的研究,取得了一定的成果。如:采用灰色關(guān)聯(lián)模型、主成分回歸模型、多元線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型等[1-5],但這些方法在處理數(shù)據(jù)上缺少魯棒性,導(dǎo)致模型普遍缺乏長(zhǎng)效性和擴(kuò)展能力,不能完全反映數(shù)據(jù)的本質(zhì)特征。
鑒于此,本文在前人研究的基礎(chǔ)上,以新疆阿克蘇市歷年城市需水量及相關(guān)數(shù)據(jù)為例,耦合主成分分析(Principal Component Analysis, PCA)和長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long Short-term Memory,LSTM)的各自優(yōu)點(diǎn),構(gòu)建了基于PCA-LSTM模型的城市需水量預(yù)測(cè)方法,并取得了一些有價(jià)值的研究成果。
PCA方法的主要計(jì)算步驟如下:?原始數(shù)據(jù)標(biāo)準(zhǔn)化處理;?計(jì)算標(biāo)準(zhǔn)化矩陣的相關(guān)系數(shù);?根據(jù)相關(guān)系數(shù)矩陣計(jì)算特征值和特征向量;?計(jì)算特征值及貢獻(xiàn)率;?計(jì)算主成分載荷矩陣及得分。具體計(jì)算過程參見文獻(xiàn)[4]。
LSTM模型具體算法過程參見文獻(xiàn)[6]。
本文耦合PCA模型與LSTM模型的各自優(yōu)點(diǎn),構(gòu)建了PCA-LSTM模型。其計(jì)算步驟如下:?對(duì)歷年城市需水量和相關(guān)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理; ?利用PCA降低模型輸入?yún)?shù)維度,篩選出需水量的關(guān)鍵因子; ?構(gòu)建PCA-LSTM預(yù)測(cè)模型,并對(duì)樣本參數(shù)不斷進(jìn)行優(yōu)化; ?評(píng)價(jià)模型性能。
選用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squard Error,RMSE)和平均絕對(duì)百分誤差(Mean Absolute Percent Error,MAPE)3項(xiàng)指標(biāo)作為模型優(yōu)劣評(píng)價(jià)指標(biāo)。
以新疆阿克蘇市2000—2016年城市需水量數(shù)據(jù)為研究對(duì)象,采用已經(jīng)預(yù)處理過的試驗(yàn)數(shù)據(jù),主要包括全市歷年GDP、第一產(chǎn)業(yè)增加值、固定資產(chǎn)投資、城鎮(zhèn)消費(fèi)品零售額、總?cè)丝?、城?zhèn)居民人均可支配收入、城市綠化面積和城市需水量數(shù)據(jù)。以2000—2012年數(shù)據(jù)為訓(xùn)練集,2013—2016年數(shù)據(jù)為驗(yàn)證集。
為了進(jìn)一步提高模型計(jì)算結(jié)果的可信度,將所構(gòu)建模型(PCA-LSTM模型)與LSTM模型、粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)與最小二乘支持向量機(jī)模型計(jì)算結(jié)果進(jìn)行對(duì)比研究。
2.2.1 仿真分析
利用SPSS軟件計(jì)算影響城市需水量的主次因素,主成分計(jì)算結(jié)果見表1。由表1可以看出,前3個(gè)因子的特征值均大于1,且累計(jì)貢獻(xiàn)率達(dá)到83.47%,因此選擇前3個(gè)因子代替原變量。通過正交旋轉(zhuǎn)法得到各因素對(duì)3個(gè)主成分的載荷,見表2。對(duì)第1因子貢獻(xiàn)最大的為全市GDP、第一產(chǎn)業(yè)增加值;對(duì)第2因子貢獻(xiàn)較大的是固定資產(chǎn)投資;城市總?cè)丝趯?duì)第3因子貢獻(xiàn)較大。
表1 特征值及主成分貢獻(xiàn)率
表2 主成分矩陣
因此,本研究選用的主要影響因子有全市GDP、第一產(chǎn)業(yè)增加值、固定資產(chǎn)投資與城市總?cè)丝?,并以此?gòu)建未來城市需水量預(yù)測(cè)模型的輸入樣本,輸出參數(shù)為1年后的城市需水量。模型具體參數(shù)詳見表3。
表3 PCA-LSTM算法參數(shù)
由表4可以看出,構(gòu)建模型的評(píng)價(jià)指標(biāo)MAE、MAPE和RMSE分別達(dá)到了12.75萬m3、0.06%和15.11萬m3,證明該模型預(yù)測(cè)精度較為理想。
表4 PCA-LSTM預(yù)測(cè)模型精度分析
2.2.2 模型對(duì)比
LSTM模型、PCA-BP模型、PCA-LSSVM等模型計(jì)算結(jié)果詳見表5。
表5 不同模型預(yù)測(cè)結(jié)果精度分析
由表5可知,PCA-LSTM模型的MAE、MAPE和RMSE分別為12.75萬m3、0.06%和15.11萬m3,較LSTM模型分別提高了7.43萬m3、0.04%和9.67萬m3的精度,而且評(píng)價(jià)指標(biāo)優(yōu)于PCA-PSO-BP與PCA-LSSVM模型。這表明PCA-LSTM模型可為干旱區(qū)城市水資源調(diào)度調(diào)控提供決策依據(jù)。
a.利用PCA方法篩選影響城市需水量的主要因子,實(shí)現(xiàn)了模型有效降維,提升了LSTM模型的預(yù)測(cè)精度和穩(wěn)定性。
b.構(gòu)建的PCA-LSTM模型與BP神經(jīng)網(wǎng)絡(luò)等其他模型相比,模型評(píng)價(jià)指標(biāo)MAE、MAPE和RMSE的誤差分別為12.75萬m3、0.06%和15.11萬m3,均優(yōu)于傳統(tǒng)模型,為干旱區(qū)城市水資源調(diào)度調(diào)控開辟了新方法。