黃繼文 ,陳華偉 ,郭旭維
(1.山東省水利科學(xué)研究院,山東 濟(jì)南 250014;2.山東省水利廳,山東 濟(jì)南 250014)
統(tǒng)計(jì)分析技術(shù)中的數(shù)據(jù)挖掘模型有相關(guān)分析、回歸分析、差異分析、聚類(lèi)分析、時(shí)間序列分析等方法。本文主要采用K-均值聚類(lèi)模型和差分自回歸移動(dòng)平均時(shí)間序列模型(ARIMA)進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)分析、預(yù)測(cè)。
K-均值算法流程如下:
1)給定大小為n的數(shù)據(jù)集,令I(lǐng)=1,選取k個(gè)初始聚類(lèi)中心 Zj(I),j=1,2,…,k;
2)計(jì)算每個(gè)數(shù)據(jù)對(duì)象與聚類(lèi)中心的距離D(xi,Zj(I)),i=1,2,…,n,j=1,2,…,k,如果滿(mǎn)足
則 xi∈Wj;
3)令I(lǐng)=I+1,計(jì)算k個(gè)新的聚類(lèi)中心和誤差平方和準(zhǔn)則Jc的值:
4)判斷:若 Zj(I+1)≠Zj(I), j=1,2,…,k,則I=I+1,返回 2);否則算法結(jié)束。
ARIMA模型的通用表達(dá)式為:
式中:φ1,φ2, …,φP為自回歸系數(shù);p 為回歸階次;θ1,θ2,…,θq為移動(dòng)平均系數(shù);q 為移動(dòng)平均階次;{εi}為白噪聲序列。若以d表示差分階次,則常略記為 ARIMA(p,d,q)。
根據(jù)《山東省統(tǒng)計(jì)年鑒》(2011年)和《山東省水資源公報(bào) (2010年)》,計(jì)算出全省及17市2010年萬(wàn)元工業(yè)增加值取水量。根據(jù)萬(wàn)元工業(yè)增加值取水量將17市分成6類(lèi)。經(jīng)聚類(lèi)統(tǒng)計(jì)量計(jì)算結(jié)果檢驗(yàn),聚類(lèi)變量在6個(gè)分類(lèi)檔次中均值顯著差異,聚類(lèi)結(jié)果有效。據(jù)此聚類(lèi)結(jié)果,結(jié)合2015年全省萬(wàn)元工業(yè)增加值下降率為25%的目標(biāo),分6個(gè)檔次初步設(shè)定各設(shè)區(qū)的市萬(wàn)元工業(yè)增加值取水量下降率,詳見(jiàn)表1。
1)定額法預(yù)測(cè)。根據(jù)《山東省國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十二個(gè)五年規(guī)劃綱要(2011—2015年)》以及全省各地級(jí)市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展 “十二五”規(guī)劃提出的經(jīng)濟(jì)社會(huì)發(fā)展指標(biāo),綜合確定各地級(jí)市工業(yè)增長(zhǎng)率,預(yù)測(cè)2015年工業(yè)增加值。根據(jù)初步設(shè)定的萬(wàn)元工業(yè)增加值取水量下降率,推求2015年萬(wàn)元工業(yè)增加值取水量,進(jìn)行全省及各地級(jí)市2015年工業(yè)需水量預(yù)測(cè)。經(jīng)預(yù)測(cè),到2015年,全省工業(yè)增加值達(dá)到29 625億元,2011—2015年年均增長(zhǎng)率9.5%。按照2015年全省萬(wàn)元工業(yè)增加值取水量下降到10.67萬(wàn)m3的目標(biāo),到2015年,全省工業(yè)需水量將達(dá)到316 099萬(wàn)m3。
表1 山東省2010年萬(wàn)元工業(yè)增加值取水量聚類(lèi)結(jié)果
2)ARIMA模型預(yù)測(cè)。采用預(yù)測(cè)精度較高的ARIMA模型對(duì)非平穩(wěn)序列進(jìn)行差分處理,預(yù)測(cè)2015年工業(yè)需水量,進(jìn)而預(yù)測(cè)2015年全省17個(gè)設(shè)區(qū)的市工業(yè)用水效率,詳見(jiàn)表2。
表2 ARIMA模型預(yù)測(cè)2015年全省工業(yè)需水量及用水效率
從表2可知,到2015年,全省工業(yè)需水量將達(dá)到年32.39億m3。結(jié)合全省工業(yè)增加值預(yù)測(cè)結(jié)果,可以推求出2015年萬(wàn)元工業(yè)增加值取水量為10.93 m3,略大于10.67 m3。因此,隨著全省不斷推進(jìn)節(jié)水型社會(huì)建設(shè)工作,到2015年,全省基本能實(shí)現(xiàn)2015年萬(wàn)元工業(yè)增加值取水量較2010年下降25%的目標(biāo)。
根據(jù)聚類(lèi)結(jié)果及2015年需水預(yù)測(cè)結(jié)果,同時(shí)參考各市2010—2012年萬(wàn)元工業(yè)增加值取水量下降率情況,調(diào)整全省17個(gè)設(shè)區(qū)市萬(wàn)元工業(yè)增加值下降幅度初步方案,見(jiàn)表3。經(jīng)校核計(jì)算,將全省萬(wàn)元工業(yè)增加值下降率為25%的指標(biāo)在全省范圍內(nèi)進(jìn)行分解后,17個(gè)設(shè)區(qū)的市工業(yè)需水量與全省工業(yè)需水量基本協(xié)調(diào)一致。
表3 調(diào)整后全省及17市萬(wàn)元工業(yè)增加值取水量分解成果表
實(shí)踐證明,選用統(tǒng)計(jì)學(xué)模型算法,從大量的水資源及其相關(guān)數(shù)據(jù)中提取有用的信息,能夠?yàn)榻鉀Q水資源管理領(lǐng)域的突出問(wèn)題提供新的分析方法和科學(xué)的決策支持。