西安理工大學(xué) 理學(xué)院 應(yīng)用數(shù)學(xué)系,西安 710054
西安理工大學(xué) 理學(xué)院 應(yīng)用數(shù)學(xué)系,西安 710054
西安市是關(guān)中地區(qū)政治、經(jīng)濟(jì)、文化發(fā)展的核心,雖然有著八水繞長(zhǎng)安之美譽(yù),但是隨著社會(huì)的高速發(fā)展,水資源緊缺已成為制約西安市可持續(xù)發(fā)展的瓶頸。由于用水量是一個(gè)復(fù)雜的、相互關(guān)聯(lián)的體系,受到政策,人口,氣象等因素影響呈非線性的波動(dòng)狀態(tài),如何有效地預(yù)測(cè)出未來用水量,將會(huì)對(duì)市政決策者在水資源規(guī)劃和管理方面提供科學(xué)依據(jù)。
目前,對(duì)于用水量預(yù)測(cè)已經(jīng)取得了一定的研究成果,主要包括:時(shí)間序列預(yù)測(cè)法[1],馬爾科夫預(yù)測(cè)法[2],主成分分析法[3],灰色系統(tǒng)理論預(yù)測(cè)法[4],但是隨著計(jì)算機(jī)技術(shù)的發(fā)展,小波分析,支持向量機(jī),神經(jīng)網(wǎng)絡(luò),粒子群優(yōu)化算法,計(jì)算機(jī)仿真算法等一批智能算法的出現(xiàn),為復(fù)雜的預(yù)測(cè)問題提供了更加有利的科學(xué)工具,許多學(xué)者將傳統(tǒng)預(yù)測(cè)法與智能算法相結(jié)合,如基于最小二乘支持向量機(jī)的供水量預(yù)測(cè)模型[5],粒子群算法和神經(jīng)網(wǎng)絡(luò)結(jié)合的預(yù)測(cè)法[6],基于時(shí)間序列和神經(jīng)網(wǎng)絡(luò)理論的SIMULINK仿真模型[7]等均取得了較好的效果,它們?cè)谝欢ǔ潭壬咸岣吡祟A(yù)測(cè)的精度。
本文在深入分析各種方法優(yōu)缺點(diǎn)的基礎(chǔ)上,發(fā)現(xiàn)在選擇影響供水量的主要因素時(shí),大部分學(xué)者采用主成分分析法或者支持向量機(jī)算法,而鮮見采用粗糙集屬性約簡(jiǎn)算法,于是嘗試著用粗糙集中知識(shí)的依賴度理論對(duì)多屬性進(jìn)行約簡(jiǎn),在約簡(jiǎn)基礎(chǔ)上建立灰色GM(1,N)預(yù)測(cè)模型,對(duì)西安市年供水量進(jìn)行預(yù)測(cè)。
2.1 粗糙集知識(shí)的依賴度理論
粗糙集理論[8]具有很強(qiáng)的定性分析能力,能夠有效地表達(dá)不確定的或不精確的知識(shí),善于從數(shù)據(jù)中獲得知識(shí),并能利用不確定、不完整的經(jīng)驗(yàn)知識(shí)進(jìn)行推理等,因此在知識(shí)獲取、機(jī)器學(xué)習(xí)、規(guī)則生成、決策分析、智能控制等領(lǐng)域獲得廣泛運(yùn)用。粗糙集理論中對(duì)象的隸屬函數(shù)值卻依賴于知識(shí)庫,它可以從所需處理的數(shù)據(jù)中直接得到,無需外界的任何信息,所以用它來反映知識(shí)的模糊性是比較客觀的。
定義1(集合的下近似和上近似)給定知識(shí)庫K= (U,S),其中,U為論域,S表示論域U上的等價(jià)關(guān)系族,則?X?U和論域U上的一個(gè)等價(jià)關(guān)系R∈IND(K),(IND(K)表示知識(shí)庫K=(U,S)中所有等價(jià)關(guān)系),定義子集 X關(guān)于知識(shí)R的下近似和上近似分別為:
集合 posR(X)=稱為 X的R正域。
定義2(知識(shí)的依賴度)給定一個(gè)決策表DT=(U,C∪D,V,f),C為條件屬性,D為決策屬性,V是信息函數(shù) f的值域。
表示決策屬性依賴于條件屬性的程度。其中|?|為集合的基數(shù)。
2.2 灰色GM(1,N)模型
定義3(灰色關(guān)聯(lián)度)設(shè)系統(tǒng)行為序列
γ(x0(k), xi(k))=
定義4(GM(1,N)模型)[9]設(shè)
2.3 預(yù)測(cè)步驟
有以上理論支持,可以得到融合粗糙集和灰色理論預(yù)測(cè)方法的預(yù)測(cè)步驟如下:
(1)采集相關(guān)原始數(shù)據(jù)。
(2)對(duì)于原始數(shù)據(jù)無量綱化處理。
(3)運(yùn)用等距離離散化算法處理(2)所得數(shù)據(jù)。
(4)根據(jù)粗糙集的知識(shí)依賴度理論計(jì)算出依賴度較大的條件屬性。
(5)建立GM(1,N)預(yù)測(cè)模型。
本文以西安市2001-2009年全年供水總量(用D表示)為系統(tǒng)特征因素,初步選取對(duì)全年供水量有影響的八個(gè)因素:西安市生產(chǎn)總值(用a表示)、居民家庭用水量(用b表示)、社會(huì)固定資產(chǎn)投資(用c表示)、人口(用d表示)、生產(chǎn)用水(用e表示)、日綜合生產(chǎn)能力(用f表示)、人均日生活用水量(用j表示)、年降水量(用k表示)作為研究對(duì)象(數(shù)據(jù)來源于2002-2010年《陜西省統(tǒng)計(jì)年鑒》,見表1)。其中2001-2007年數(shù)據(jù)用于建模,2008-2009年數(shù)據(jù)用于模型檢驗(yàn),然后對(duì)2010年和2011年的全年供水總量進(jìn)行預(yù)測(cè)。
表1 全年供水量與相關(guān)因子原始數(shù)據(jù)1)
3.1 無量綱化處理
3.2 決策表的離散化處理
將無量綱化處理過的數(shù)據(jù)離散化,這里采用等距離離散化算法[10],該算法基本思想:將連續(xù)屬性取值區(qū)間分成N個(gè)小區(qū)間(N是決策者取定的),某屬性的取值范圍[a,b],則N個(gè)區(qū)間取值為:
本算例中,對(duì)2001-2009年的數(shù)據(jù)進(jìn)行離散化,可得離散化后的決策表2。
表2 離散化后的樣本信息決策表
3.3 基于粗糙集知識(shí)依賴度理論的供水量預(yù)測(cè)因子篩選
在表2中,將每一年的行數(shù)據(jù)看成一個(gè)集合,則論域U={e1,e2,…,e9},將每一個(gè)指標(biāo)看成一個(gè)屬性,則屬性集合 C={a,b,c,d,e,f,j,k,D},其中 D 為決策屬性,可以得到條件屬性對(duì)決策屬性的分類如下:
決策屬性關(guān)于各個(gè)條件屬性的正域分別為:
再根據(jù)定義2,可以計(jì)算出決策屬性對(duì)每個(gè)條件屬性的依賴度如下:
故排序結(jié)果為b=e=f?a=c?j=k?d。
3.4 基于灰色關(guān)聯(lián)度理論的供水量預(yù)測(cè)因子篩選
根據(jù)公式(3)計(jì)算得到各個(gè)條件屬性的灰關(guān)聯(lián)度。見表3。故排序結(jié)果為 f?d?b?e?j?k?a?c。
3.5 建立GM(1,N)模型
表3 各條件屬性的灰關(guān)聯(lián)度
表4 兩種方法選取的因子建模結(jié)果比較
知識(shí)依賴度越高說明該條件屬性對(duì)決策屬性影響越大,灰色關(guān)聯(lián)度越高的相關(guān)因素序列對(duì)系統(tǒng)特征行為序列影響也越大。這里對(duì)粗糙集知識(shí)依賴度所選取的因子b,e,f和灰色關(guān)聯(lián)度所選取的因子f,d,b分別建立GM(1,4)模型,并進(jìn)行比較,所得結(jié)果見表4。
由表4對(duì)比結(jié)果可知,選取b,e,f建立的GM(1,4)模型的擬合精度比f,b,d建立的模型擬合精度高,所以選取b,e,f建立的 GM(1,4)模型作為預(yù)測(cè)模型,并用 2008年和2009年數(shù)據(jù)進(jìn)行模型檢驗(yàn),并與離散GM(1,1)模型的預(yù)測(cè)值進(jìn)行比較,所得結(jié)果見表5。
通過表5對(duì)比結(jié)果,選取b,e,f建立的GM(1,4)模型其相對(duì)誤差最小。由于相關(guān)因素越多,對(duì)其預(yù)測(cè)誤差將會(huì)代入GM(1,4)模型,從而增加了預(yù)測(cè)誤差,所以用此模型做短期預(yù)測(cè)比較合適。根據(jù)實(shí)際情況采取線性回歸法,三次指數(shù)平滑法,最小二乘法,GM(1,1)等方法預(yù)測(cè)出居民家庭用水量(b)、生產(chǎn)用水量(e)、日綜合生產(chǎn)能力(f)。這里采用GM(1,1)模型分別預(yù)測(cè)出2010年和2011年的相關(guān)因素序列值如表6所示。
表5 模型檢驗(yàn)
表6 相關(guān)因素預(yù)測(cè)值104m3
選擇由b,e,f建立的GM(1,4)模型作為預(yù)測(cè)模型,其參數(shù)列如下:
其中式(4)是GM(1,4)模型的時(shí)間響應(yīng)式,式(5)是累減還原式。
由式(4)和(5)可得2010年和2011年西安市年供水量分別為:33 659×104m3和37 271×104m3。
本文用粗糙集知識(shí)依賴度理論找出了對(duì)供水量有較大影響的三個(gè)因素:居民家庭用水量、生產(chǎn)用水量、日綜合生產(chǎn)能力建立GM(1,4)模型。通過實(shí)例驗(yàn)證可以看出本文所提方法建立的模型確實(shí)是可行的。對(duì)未來兩年所作的預(yù)測(cè)值也符合西安市十二五規(guī)劃要求。但是也有一些需要改進(jìn)的地方,用GM(1,N)模型進(jìn)行預(yù)測(cè),需要對(duì)相關(guān)因素進(jìn)行評(píng)估和預(yù)測(cè),會(huì)將相關(guān)因素預(yù)測(cè)誤差代入GM(1,N)模型,對(duì)預(yù)測(cè)結(jié)果產(chǎn)生不良影響。GM(1,N)模型用于短期預(yù)測(cè)效果好于長(zhǎng)期預(yù)測(cè)。
[1]張可義.非平穩(wěn)時(shí)間序列建模與預(yù)報(bào)在供水管網(wǎng)水量預(yù)測(cè)中的應(yīng)用研究[D].北京:北京科學(xué)研究總院北京機(jī)械工業(yè)自動(dòng)化研究所,2007.
[2]李小冰,蔡煥杰,張?chǎng)危?禿尾河流域降水量權(quán)馬爾科夫鏈模型預(yù)測(cè)研究[J].干旱地區(qū)農(nóng)業(yè)研究,2009,27(6):252-256.
[3]劉思峰,黨耀國,方志耕,等.灰色系統(tǒng)理論及其應(yīng)用[M].5版.北京:科學(xué)出版社,2010.
[4]Chen X H.Uncertainty research in rough set data analyzing[D]. Beijing:Tsinghua University,2000:69-70.
[5]呂王勇,趙凌,陳東.基于主成分分析的四川省用水量預(yù)測(cè)[J].水資源與水工程學(xué)報(bào),2009,20(6):84-87.
[6]趙宇哲,武春友.灰色震蕩序列GM(1,1)模型及在城市用水中的應(yīng)用[J].運(yùn)籌與管理,2010,19(5):156-166.
[7]Xie Ying,Zheng Hua.Water supply forecasting based on developed LS-SVM[C]//3rd IEEE Conference,Singapore,2008:2228-2233.
[8]王亮,張宏偉,岳琳,等.PSO-BP模型在城市用水量短期預(yù)測(cè)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2007,27(9):165-170.
[9]雷鳴,張宏偉,閆靜靜.城市用水量預(yù)測(cè)的SIMULINK仿真技術(shù)研究[J].中國給水排水,2010,26(15):54-57.
[10]苗奪謙,李道國.粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008.
融合粗糙集和灰色GM(1,N)的西安市供水量預(yù)測(cè)
孫 強(qiáng),王秋萍
SUN Qiang,WANG Qiuping
Department of Applied Mathematics,School of Sciences,Xi’an University of Technology,Xi’an 710054,China
For multivariate prediction problems,this paper constructs fusion prediction model of rough set and grey system theory. The model adopts theory of knowledge dependency to reduce multiple attributes,GM(1,N)model is established based on knowledge reduction.Annual water supply quantity of Xi’an is fitted and forecasted by using the established model,and fitted values is compared with values of DGM(1,1)model.The experimental results indicate that this method has advantage over selecting the factors of influence by traditional grey incidence grade.Thereby,a kind of method suitable for water supply forecasts is provided.
rough set;knowledge dependency;grey correlation;GM(1,N)model
對(duì)于多變量預(yù)測(cè)問題,構(gòu)造了粗糙集和灰色理論的融合預(yù)測(cè)模型。該模型運(yùn)用粗糙集的知識(shí)依賴度理論對(duì)多屬性進(jìn)行約簡(jiǎn),在約簡(jiǎn)基礎(chǔ)上建立GM(1,N)模型。用所建模型對(duì)西安市年供水量進(jìn)行了擬合和預(yù)測(cè),并與離散灰色GM(1,1)模型作比較。實(shí)驗(yàn)結(jié)果表明該模型的預(yù)測(cè)精度高于傳統(tǒng)的用灰關(guān)聯(lián)度選擇影響因子建模,從而為供水量預(yù)測(cè)問題提供了一種新方法。
粗糙集;知識(shí)的依賴度;灰色關(guān)聯(lián)度;GM(1,N)模型
A
O29;C931
10.3778/j.issn.1002-8331.1110-0169
SUN Qiang,WANG Qiuping.Water supply quantity forecast of Xi’an via combination rough sets with GM(1,N)model. Computer Engineering and Applications,2013,49(11):237-240.
“十一五”國家科技支撐計(jì)劃項(xiàng)目子課題(No.2008BAE63B03)。
孫強(qiáng)(1983—),男,碩士生,研究方向:灰色預(yù)測(cè)及其粗糙集應(yīng)用研究;王秋萍(1964—),女,博士,副教授,主要研究領(lǐng)域:預(yù)測(cè)與決策分析理論、方法及應(yīng)用,系統(tǒng)工程。E-mail:sunqiang1022@163.com
2011-10-11
2011-12-02
1002-8331(2013)11-0237-04
CNKI出版日期:2012-03-08 http://www.cnki.net/kcms/detail/11.2127.TP.20120308.1520.035.html