秦 成
(中國煤炭科工集團重慶研究院,重慶 400039)
水資源危機是指水資源系統(tǒng)不能保證生態(tài)、經(jīng)濟和社會可持續(xù)利用及其發(fā)展,并且供求矛盾異常尖銳時的狀態(tài)[1]。水資源危機涉及的誘因較多,存在明顯不確定性,但爆發(fā)前的水資源系統(tǒng)狀態(tài)的變化卻是一個按客觀規(guī)律演變的連續(xù)變化過程,水危機的發(fā)生只是該系統(tǒng)連續(xù)變化過程中符合客觀科學(xué)規(guī)律的一個突變[2]。
從水資源危機發(fā)生前各種危機前兆的出現(xiàn),到問題積聚到某一程度引發(fā)水資源危機這一過程存在一定的時間間隔,因此可以在這個時間段內(nèi)通過預(yù)警來提前預(yù)報危機并采取相應(yīng)措施控制或減緩危機的產(chǎn)生。所以預(yù)警的研究對解決水資源危機問題有著至關(guān)重要的作用,并成為當前研究的熱點。陳紹金[3]建立了基于系統(tǒng)動力學(xué)的湘江流域水安全系統(tǒng)預(yù)警模型;文俊等[4]提出了基于熵組合權(quán)重的區(qū)域水資源可持續(xù)利用預(yù)警新模型;李仰斌等[5]進行了山西省水資源安全評價與預(yù)警研究。但是,當前的研究還存在3個關(guān)鍵問題:①目前常用的預(yù)警方法將會面對預(yù)警警界即閾值難確定的問題,很多文獻是根據(jù)實際經(jīng)驗確定閾值,缺乏理論依據(jù);②面對預(yù)警指標眾多、指標間非線性關(guān)系復(fù)雜的難題,如何篩選合適的預(yù)警指標以及如何預(yù)測指標在未來時段的量值;③傳統(tǒng)的預(yù)警方法需要建立精準的數(shù)學(xué)模型方可實現(xiàn)對未來狀態(tài)的預(yù)測,然而面對像水資源系統(tǒng)這樣不確定或非線性時,此類方法就難以實現(xiàn)。為此,筆者將粗糙集(rough set)理論引入到水資源危機預(yù)警研究中,利用決策表的屬性約簡來篩選預(yù)警指標并獲得預(yù)警判別規(guī)則,在此基礎(chǔ)之上通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測預(yù)警指標未來的值,然后帶入預(yù)警判別規(guī)則即可快速而簡便地完成水資源危機預(yù)警。
劉梅[2]和申海亮[6]分別驗證了水資源系統(tǒng)具有突跳性、多徑性、發(fā)散性和可恢復(fù)性,符合突變理論的基本應(yīng)用條件,因此可以把尖點突變(cusp catastrophe)模型應(yīng)用到水資源系統(tǒng)危機識別中[2,6]。
尖點突變模型勢函數(shù)是
式中:x為狀態(tài)變量,a和b為控制變量,故相空間是三維的。
勢函數(shù)的所有臨界點集合成突變流形M,其表達式為V'(x)=4x3+2ax+b,通過聯(lián)立V'=0和V″=0可得到反映狀態(tài)變量與各控制變量間關(guān)系的分歧集Δ,Δ是突變流形M在控制空間a~b平面上的投影:
在平衡曲面M中發(fā)生質(zhì)變有2種基本形式:①漸變。當a>0時,b的變化只引起狀態(tài)變量x的光滑變化,x連續(xù)的從上葉量變過渡到下葉或由下葉量變過渡到上葉,b稱為正則因子;②突變。當a<0時,M上出現(xiàn)褶皺,x的變化不再連續(xù),a、b達到分歧集方程關(guān)系時,x從上葉突跳到下葉或由下葉突跳到上葉,a稱為剖分因子。在尖點突變中,a是決定突變的力量,b是某種質(zhì)態(tài)的保守力量[7]。
因此,在應(yīng)用突變模型前首先要確定控制變量。一般來說,水資源危機識別因子錯綜復(fù)雜又相互關(guān)聯(lián),如果分析每個因子,不僅增加工作量,而且分析是孤立的,如果盲目減少因子又會損失很多信息。所以尋求一個合理的方法成為解決問題的關(guān)鍵。筆者采用主成分分析法,在保證數(shù)據(jù)信息丟失最少的前提下,把反映人類活動對水資源系統(tǒng)不利影響的識別因子 I1,I2,…,In-k進行主成分提取,得到少數(shù)幾個主成分,對這幾個主成分加權(quán)求和得到綜合主成分,將其作為尖點突變模型的剖分因子a。同樣把反映水資源系統(tǒng)自身狀態(tài)的識別因子In-k+1,…,In進行主成分分析,求得綜合主成分將其作為尖點突變模型的正則因子b。狀態(tài)變量x是指水資源系統(tǒng)的狀態(tài)。將各年a、b的值帶入式(2),若Δ<0,說明水資源系統(tǒng)將會發(fā)生突變。分歧集值Δ與控制變量a和b直接相關(guān),而a和b又是從整個水資源系統(tǒng)出發(fā)通過主成分分析得到的,因此分歧集值Δ代表著水資源系統(tǒng)內(nèi)部各個子系統(tǒng)綜合作用的結(jié)果。這就是說,水資源系統(tǒng)中某個或某幾個子系統(tǒng)出現(xiàn)了問題,可能并不會影響整個系統(tǒng)正常運行,當各子系統(tǒng)之間相互碰撞,不利因素突顯出來,便會導(dǎo)致系統(tǒng)狀態(tài)發(fā)生突跳,即爆發(fā)水資源危機[2]。
設(shè)S={U,A,V,f}為一知識表達系統(tǒng),U為對象的非空有限集合,稱為論域;A=C∪D是屬性集合,子集C和子集D分別稱為條件屬性和決策屬性;V是對象屬性的值域;f是信息函數(shù),指定每個對象屬性的屬性值。具有條件屬性和決策屬性的知識表達系統(tǒng)稱為決策表。本次研究中將水資源危機識別的結(jié)果作為決策屬性,識別因子作為條件屬性。決策表以1個二維表格的形式表示。表中的每1列描述了1個屬性(識別因子),每1行描述了所研究論域中的1個樣本。
粗糙集理論易于處理離散數(shù)據(jù),然而在實際的水資源系統(tǒng)中大多數(shù)指標數(shù)據(jù)都是連續(xù)的。因此要實現(xiàn)連續(xù)數(shù)據(jù)的粗糙集約簡處理,得到水資源危機識別規(guī)則知識,其前提就是要將連續(xù)數(shù)據(jù)進行離散化。目前對連續(xù)數(shù)據(jù)進行離散化的方法有多種:等距離劃分、等頻率劃等,但是使用這些方法需用戶對數(shù)據(jù)特征有較清楚的認識[8],所以本文采用具有動態(tài)聚類特性和一定的自適應(yīng)性的K-均值聚類算法對連續(xù)數(shù)據(jù)進行離散化。
在選取的各種水資源危機識別因子中,并非所有的因子都很重要,其中某些屬性是冗余的。屬性約簡就是在保持屬性分類能力不變的條件下,刪除其中不相關(guān)或不重要的屬性。對?a∈C,若posC(D)=pos(C-{a})(D)(posC(D)稱為 D 的 C正域)則認為a是冗余的,稱C'=C-{a}為C的一個約簡。通過屬性約簡后保留的指標即為預(yù)警指標。
令Xi和Yj分別代表U/C與U/D中的各個等價類,des(Xi)表示對等價類Xi的描述,即等價類Xi對于各條件屬性值的特定取值;des(Yj)表示對等價類Yj的描述,即等價類Yj對于各決策屬性值的特定取值。決策規(guī)則定義如下:
根據(jù)約簡后的決策信息系統(tǒng),可以得到具有一定決策概率的不精確決策規(guī)則。其中大量的決策規(guī)則是冗余的,這就需要衡量這些規(guī)則的價值。從系統(tǒng)客觀層面評價一條規(guī)則,主要依據(jù)可信度、覆蓋率和支持數(shù)來衡量,在數(shù)據(jù)挖掘時,一般希望得到可信度和覆蓋率都高的有效規(guī)則,但實際上這兩個指標是成負關(guān)系的。所以需要權(quán)衡一規(guī)則的可信度和覆蓋率來評價其價值。雖然運用數(shù)學(xué)方法可以對一規(guī)則進行評價,但還應(yīng)結(jié)合水資源科學(xué)的相關(guān)知識、考慮水資源危機自身的特點。
由于預(yù)警指標歷史樣本數(shù)目N往往較小,故一般只能對各指標進行短中期預(yù)測。在確定BP網(wǎng)絡(luò)拓撲結(jié)構(gòu)時,網(wǎng)絡(luò)輸入層和輸出層的神經(jīng)元節(jié)點數(shù)均取預(yù)警指標數(shù)目,隱層的神經(jīng)元節(jié)點數(shù)往往需要根據(jù)設(shè)計者的經(jīng)驗和多次試驗來確定。用BP神經(jīng)網(wǎng)絡(luò)模型進行滾動預(yù)測的基本思想就是[9]:設(shè)xi為一系統(tǒng)因子數(shù)據(jù)系列,i=1,2,…,N,在進行神經(jīng)網(wǎng)絡(luò)預(yù)測時用 xi-n,xi-n+1,…,xi-1的信息數(shù)據(jù)來預(yù)測 i時刻的值,即將 xi-n,xi-n+1,…,xi-1作為數(shù)據(jù)信息輸入,而xi的值作為預(yù)測的期望值,以此構(gòu)造如下學(xué)習(xí)樣本:輸入(x1,x2,…,xn)輸出 xn+1;輸入(x2,x3,…,xn+1)輸出 xn+2…;輸入(xN-n,xN-n+1,…,xN-1)輸出xN。通過對學(xué)習(xí)樣本的訓(xùn)練,直到誤差達到允許的范圍,就可以用它滾動預(yù)測預(yù)警指標值。
將預(yù)測得到的預(yù)警指標數(shù)據(jù)樣本根據(jù)決策規(guī)則對水資源危機狀況進行判別,可能出現(xiàn)以下某種情況:①一個數(shù)據(jù)樣本與一個規(guī)則相匹配;②一個數(shù)據(jù)樣本與一個以上規(guī)則相匹配,結(jié)果一致;③一個數(shù)據(jù)樣本與一個以上規(guī)則相匹配,但結(jié)果不一致;④一個數(shù)據(jù)樣本不與任何一個規(guī)則相匹配。對于情況①和②,規(guī)則的判定結(jié)果是一致的;對于情況③和④可采用少數(shù)推理方法[10]來消除不一致沖突問題。應(yīng)用這種推理方法,對于任意待識樣本都可以根據(jù)從決策表中所得到的規(guī)則進行判別,得到合適的結(jié)論。
本文以A市為例,在文獻[11]的基礎(chǔ)上,針對水資源危機的特點篩選如下識別因子:I1為GDP年增長率,%;I2為人口自然增長率,%;I3為萬元GDP產(chǎn)值耗水量,m3/萬元;I4為萬元產(chǎn)值工業(yè)耗水量,m3/萬元;I5為農(nóng)田灌溉用水定額,m3/hm2;I6為水資源開發(fā)利用程度,%;I7為地表水綜合污染指數(shù);I8為地下水位下降速率,m/a;I9為人均占有水資源量,m3/人;I10為地表水資源模數(shù),萬m3/(km2·a);I11為地下水可開采資源模數(shù),萬m3/(km2·a)。為了進行系列年水資源危機識別,所有的識別因子都包含了1998—2007年10 a的數(shù)據(jù),如表1所示。
采用 spss17 統(tǒng)計分析軟件分別對 I1、I2、I3、I4、I5、I6、I7、I8和 I9、I10、I1111 個評價因子進行主成分抽取,先將指標在方向統(tǒng)一為越大越好的值,再將各個指標值進行標準化處理,取得標準化值Z。對Z1,Z2,Z3,Z4,Z5,Z6,Z7,Z88 個表現(xiàn)人類活動對水資源系統(tǒng)影響的標準化變量進行分析,得到3個主成分F1、F2、F3,方差計算表明,累計方差貢獻率達到93.1%,認為能夠很好地代表原始數(shù)據(jù),由F1、F2、F3加權(quán)求和得綜合主成分a(其代表人類活動對水資源系統(tǒng)影響,是決定突變的力量),將它作為尖點突變模型的剖分因子。對Z9、Z10、Z113個表現(xiàn)自然水資源狀態(tài)的標準化變量進行分析,抽取累計方差貢獻率達93.7%的兩個主成分 W1、W2,由 W1、W2計算綜合主成分b(其代表水資源自然狀態(tài),是保守力量),將它作為尖點突變模型的正則因子。各年的剖分因子、正則因子計算結(jié)果如表2所示。
表2 系列年a、b值
將a、b值帶入式(2)進行計算,可知Δ<0的是1998年和1999年,水資源系統(tǒng)處于不穩(wěn)定狀態(tài),將會發(fā)生突跳,即水資源系統(tǒng)處于危機狀態(tài)。其他年份Δ>0,水資源系統(tǒng)處于穩(wěn)定狀態(tài),發(fā)生漸變。在決策表中決策屬性取值按Δ<0取0,Δ>0取1。決策屬性取值按Δ<0取0,Δ>0取1,即,0代表危機狀態(tài),1代表非危機狀態(tài),見表3所示。
表1 水資源危機識別因子原始數(shù)據(jù)
表3 各指標離散后數(shù)據(jù)類別及決策屬性
采用K-均值聚類的方法將表1中的樣本數(shù)據(jù)離散化,將各屬性下的列數(shù)據(jù)離散為兩類數(shù)據(jù),分別用數(shù)字“1”和“2”來表示所分的類別。離散后的數(shù)據(jù)如表3所示,對應(yīng)各個聚類中心I1(9.06,14.08),I2(0.75,0.54),I3(614,372),I4(145.5,82.25),I5(3438.75,2692.50),I6(89.92,171.19),I7(0.86,0.75),I8(0.23,0.28),I9(300.93,177.19),I10(7.33,18.58),I11(33.06,24.46)。
得到表3的離散數(shù)據(jù)后,對上述11個水資源危機識別因子進行屬性約簡,最終得到只含有3個識別因子的15條約簡,在此約簡基礎(chǔ)之上產(chǎn)生了83條相應(yīng)的決策規(guī)則,通過從用戶主觀和系統(tǒng)客觀兩層面來衡量這些規(guī)則的價值,篩選出其中的約簡(萬元產(chǎn)值工業(yè)耗水量I4、農(nóng)田灌溉用水定額I5、人均占有水資源量I9)作為水資源危機的預(yù)警指標,并通過對應(yīng)的決策規(guī)則(表4)來進行預(yù)警。即通過{I4,I5,I9}這3個因子對應(yīng)的數(shù)據(jù)就可以判斷水資源系統(tǒng)是否處于危機狀態(tài),通過計算實際數(shù)據(jù)與聚類中心的距離,判斷樣本數(shù)據(jù)所屬類別后就可以按表4的規(guī)則知識來對水資源系統(tǒng)危機進行識別,快速而方便。
用BP神經(jīng)網(wǎng)絡(luò)模型滾動預(yù)測預(yù)警指標2008—2012年的值,BP神經(jīng)網(wǎng)絡(luò)的輸入層、隱層、和輸出層的神經(jīng)元節(jié)點數(shù)分別為3、8、3,訓(xùn)練網(wǎng)絡(luò)達到收斂后進行滾動預(yù)測,結(jié)果如表5所示。計算各預(yù)測值與 I4,I5,I9聚類中心的距離可知,2008—2012年滿足規(guī)則3:
因此未來幾年內(nèi)水資源系統(tǒng)不會發(fā)生突變,即不會產(chǎn)生危機。
表4 水資源危機預(yù)警規(guī)則
針對水資源系統(tǒng)具有突跳性、多徑性、發(fā)散性和可恢復(fù)性的特點,用尖點突變模型進行水資源危機識別,其中尖點突變模型中的正則因子和剖分因子分別通過對相應(yīng)水資源危機識別因子進行主成分分析得到,將識別因子和識別結(jié)果分別作為決策表的條件屬性和決策屬性;針對粗糙集易于處理離散數(shù)據(jù)的特點,采用具有動態(tài)聚類特性和一定的自適應(yīng)性的K-均值聚類算法對連續(xù)的識別因子數(shù)據(jù)進行離散化,對離散化的決策表進行屬性約簡確定出水資源危機預(yù)警指標和決策規(guī)則;針對預(yù)警指標間非線性關(guān)系復(fù)雜的特點,用BP神經(jīng)網(wǎng)絡(luò)模型滾動預(yù)測預(yù)警指標,按照決策規(guī)則就可進行水資源危機預(yù)警判別。通過上述方法的耦合,建立了水資源危機預(yù)警的CC-RS-BP模型。
表5 用BP神經(jīng)網(wǎng)絡(luò)預(yù)測各預(yù)警指標值
CC-RS-BP模型對A市進行水資源危機預(yù)警結(jié)果表明:分歧集Δ<0的是1998和1999年,水資源系統(tǒng)處于不穩(wěn)定狀態(tài),將會發(fā)生突跳,即水資源系統(tǒng)處于危機狀態(tài),其他年份Δ>0,水資源系統(tǒng)處于穩(wěn)定狀態(tài),發(fā)生漸變;I4、I5、I9可以作為該地區(qū)的水資源危機預(yù)警指標,從系統(tǒng)客觀和用戶主觀兩層面在產(chǎn)生的83條規(guī)則知識中篩選出5條規(guī)則作為水資源危機預(yù)警的判別規(guī)則;BP神經(jīng)網(wǎng)絡(luò)滾動預(yù)測2008—2012年的指標滿足其中規(guī)則3:
即未來幾年內(nèi)水資源系統(tǒng)不會發(fā)生突變,這與A市2008—2010年的實際情況相吻合。
CC-RS-BP模型將尖點突變模型應(yīng)用于內(nèi)部作用尚未知的水資源系統(tǒng),充分發(fā)揮了尖點突變理論直接處理不連續(xù)性而不聯(lián)系任何特殊的內(nèi)在機制的優(yōu)點,該模型的預(yù)警是以規(guī)則的形式來判斷的有別于傳統(tǒng)的預(yù)警方法,易被人理解和利用,模型采用BP神經(jīng)網(wǎng)絡(luò)滾動預(yù)測預(yù)警指標值可以充分利用相鄰時期各指標的變化趨勢信息,為非線性、自學(xué)習(xí)、自適應(yīng)、大規(guī)模并行分布多指標預(yù)測問題提供新途徑。
[1]周玉璽,馬傳棟.制度、技術(shù)、政策與水資源危機[J].中國生態(tài)農(nóng)業(yè)學(xué)報,2006,14(2):1-4.
[2]劉梅.區(qū)域水資源危機的識別與對策研究[D].保定:河北農(nóng)業(yè)大學(xué),2009.
[3]陳紹金.水安全系統(tǒng)評價、預(yù)警與調(diào)控研究[M].北京:中國水利水電出版社,2006.
[4]文俊,李靖,金菊良.基于熵組合權(quán)重的區(qū)域水資源可持續(xù)利用預(yù)警模型[J].水電能源科學(xué),2006,24(3):6-10.
[5]李仰斌,暢明琦.水資源安全評價與預(yù)警研究[J].中國農(nóng)村水利水電,2009(1):1-4.
[6]申海亮.天津市水資源安全預(yù)警系統(tǒng)研究[D].天津:天津大學(xué),2007.
[7]艾德春.我國煤炭供需平衡的預(yù)測預(yù)警研究[D].徐州:中國礦業(yè)大學(xué),2008.
[8]徐襲,祝力,范學(xué)鑫.基于粗糙集與K-均值聚類的故障知識挖掘[J].微計算機信息,2007(15):141-142.
[9]呂光輝.中國西部干旱區(qū)生態(tài)安全評價、預(yù)警與調(diào)控研究:以新疆地區(qū)為例[D].烏魯木齊:新疆大學(xué),2005.
[10]劉菁菁,田銀華.基于主成分-粗糙集理論的企業(yè)信貸風(fēng)險預(yù)警研究[J].哈爾濱商業(yè)大學(xué)學(xué)報:社會科學(xué)版,2009(2):57-61.
[11]李升.地下水環(huán)境健康預(yù)警研究:以黃河下游懸河段(河南)為例[D].長春:吉林大學(xué),2008.