呂福財(cái),付 強(qiáng),朱建華,周 兵
(1.東北農(nóng)業(yè)大學(xué),哈爾濱150030;2.穆棱市水利勘測(cè)設(shè)計(jì)隊(duì),黑龍江穆棱157500)
洪水災(zāi)害損失評(píng)價(jià)就是根據(jù)已有災(zāi)情指標(biāo)值建立災(zāi)情評(píng)價(jià)模型,對(duì)因洪水災(zāi)害造成的破壞程度進(jìn)行評(píng)價(jià)。黑龍江省是我國主要的糧食產(chǎn)地,全省境內(nèi)江河湖泊眾多,有黑龍江、烏蘇里江、松花江、嫩江和綏芬河五大水系,現(xiàn)有湖泊、水庫6 000余個(gè),水面達(dá)80多萬公頃。及時(shí)有效地對(duì)黑龍江省進(jìn)行洪水災(zāi)害損失評(píng)價(jià)工作,對(duì)洪水災(zāi)害管理工作和災(zāi)害的救濟(jì)具有重要的指導(dǎo)意義。
洪水災(zāi)情涉及自然環(huán)境與社會(huì)經(jīng)濟(jì)等許多因素,目前國內(nèi)外尚無統(tǒng)一的洪水災(zāi)情評(píng)估指標(biāo)體系和對(duì)各指標(biāo)的災(zāi)情等級(jí)標(biāo)準(zhǔn),洪水災(zāi)害損失災(zāi)情評(píng)價(jià)至今仍是洪災(zāi)研究的難點(diǎn)和熱點(diǎn)之一。我國在洪水災(zāi)害損失評(píng)價(jià)方面相繼提出了災(zāi)度判別法、模糊綜合評(píng)判、物元分析、神經(jīng)網(wǎng)絡(luò)等災(zāi)情等級(jí)模型[1-4],但上述方法需要災(zāi)情評(píng)價(jià)的標(biāo)準(zhǔn)。黑龍江省正是沒用洪水災(zāi)害損失的評(píng)價(jià)標(biāo)準(zhǔn)或標(biāo)準(zhǔn)已經(jīng)不適用,因而一直無法對(duì)其進(jìn)行洪災(zāi)損失的評(píng)價(jià)分析。本文將改進(jìn)的GA方法—基于實(shí)數(shù)編碼的加速遺傳算法(Real coding based Accelerating Genetic Algorithm,簡稱 RAGA)與投影尋蹤分類模型(Projection Pursuit Classification Model,簡稱PPC模型)有機(jī)結(jié)合[5],通過RAGA優(yōu)化PPC模型中的投影方向參數(shù),完成高維數(shù)據(jù)向低維空間的轉(zhuǎn)換,即將每個(gè)樣本的多個(gè)評(píng)價(jià)指標(biāo)綜合成一個(gè)綜合指標(biāo),然后按投影值進(jìn)行排序與識(shí)別,從而實(shí)現(xiàn)對(duì)黑龍江省洪水災(zāi)害損失評(píng)價(jià)。為沒有評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)的評(píng)價(jià)研究提供一條新的方法與思路。
投影尋蹤分類模型(Projection Pursuit Classification Model,簡稱PPC)的建模過程包括如下幾步:
步驟1:樣本評(píng)價(jià)指標(biāo)集的歸一化處理。設(shè)各指標(biāo)值的樣本集為{x*(i,j)|i=1,2,…,n,j=1,2,…,p},其中x*(i,j)為第i個(gè)樣本第j個(gè)指標(biāo)值,n、p分別為樣本的個(gè)數(shù)(樣本容量)和指標(biāo)的數(shù)目。為消除各指標(biāo)值的量綱和統(tǒng)一各指標(biāo)值的變化范圍,可采用下式進(jìn)行極值歸一化處理例如對(duì)于越小越優(yōu)的指標(biāo):
其中,xmax(j)、xmin(j)分別為第j個(gè)指標(biāo)值的最大值和最小值,x(i,j)為指標(biāo)特征值歸一化的序列。
步驟2:構(gòu)造投影指標(biāo)函數(shù)Q(a)。PP方法就是把p維數(shù)據(jù){x(i,j)|j=1,2,…,p}綜合成以a={a(1),a(2),a(3),…,a(p)}為投影方向的一維投影值z(mì)(i):
然后根據(jù){z(i)|i=1,2,…,n}的一維散布圖進(jìn)行分類。式(3)中a為單位長度向量。綜合投影指標(biāo)值時(shí),要求投影值z(mì)(i)的散布特征應(yīng)為:局部投影點(diǎn)盡可能密集,最好凝聚成若干個(gè)點(diǎn)團(tuán);而在整體上投影點(diǎn)團(tuán)之間盡可能散開。因此。投影指標(biāo)函數(shù)可以表達(dá)成:
其中,Sz為投影值z(mì)(i)的標(biāo)準(zhǔn)差,Dz為投影值z(mì)(i)的局部密度,即:
其中,E(z)為序列{z(i)|i=1,2,…,n}的平均值;R為局部密度的窗口半徑,它的選取既要使包含在窗口內(nèi)的投影點(diǎn)的平均個(gè)數(shù)不太少,避免滑動(dòng)平均偏差太大,又不能使它隨著n的增大而增加太高,R可以根據(jù)試驗(yàn)來確定;r(i,j)表示樣本之間的距離,r(i,j)=|z(i)-z(j)|;u(t)為一單位階躍函數(shù),當(dāng)t≥0時(shí),其值為1,當(dāng)t<0時(shí)其函數(shù)值為0。
步驟3:優(yōu)化投影指標(biāo)函數(shù)。當(dāng)各指標(biāo)值的樣本集給定時(shí),投影指標(biāo)函數(shù)Q(a)只隨著投影方向a的變化而變化。不同的投影方向反映不同的數(shù)據(jù)結(jié)構(gòu)特征,最佳投影方向就是最大可能暴露高維數(shù)據(jù)某類特征結(jié)構(gòu)的投影方向,因此可以通過求解投影指標(biāo)函數(shù)最大化問題來估計(jì)最佳投影方向,即:
這是一個(gè)以{a(j)|j=1,2,…,p}為優(yōu)化變量的復(fù)雜非線性優(yōu)化問題,用傳統(tǒng)的優(yōu)化方法處理較難。因此,本文應(yīng)用模擬生物優(yōu)勝劣汰與群體內(nèi)部染色體信息交換機(jī)制的基于實(shí)數(shù)編碼的加速遺傳算法(Real coded Accelerating Genetic Algorithm,簡稱RAGA)來解決其高維全局尋優(yōu)問題(RAGA的結(jié)構(gòu)在下節(jié)介紹)。
步驟4:分類(優(yōu)序排列)。把由步驟3求得的最佳投影方向a*代入式(3)后可得各樣本點(diǎn)的投影值Z*(i)。將z*i與z*(j)進(jìn)行比較,二者越接近,表示樣本i與j越傾向于分為同一類。若按z*(i)值從大到小排序,則可以將樣本從優(yōu)到劣進(jìn)行排序。
遺傳算法由美國密執(zhí)安大學(xué)的Holland教授提出的,是模擬生物在自然環(huán)境中的遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化概率搜索算法。主要包括選擇(selection)、交叉(crossover)和變異(mutation)等操作。例如求解如下最優(yōu)化問題:Maxf(x),st,a(j)≤x(j)≤b(j)。
共有8個(gè)步驟:①在各個(gè)決策變量的取值變化區(qū)間隨機(jī)生成N組均勻分布的隨機(jī)變量;②計(jì)算目標(biāo)函數(shù)值,從大到小排列;③計(jì)算基于序的評(píng)價(jià)函數(shù)(用eval(V)表示);④進(jìn)行選擇操作,產(chǎn)生新的種群;⑤對(duì)步驟④產(chǎn)生的新種群進(jìn)行交叉操作;⑥對(duì)步驟⑤產(chǎn)生的新種群進(jìn)行變異操作;⑦進(jìn)化迭代;⑧上述⑦個(gè)步驟構(gòu)成標(biāo)準(zhǔn)遺傳算法(SGA)。由于SGA不能保證全局收斂性,在實(shí)際應(yīng)用中常出現(xiàn)在遠(yuǎn)離全局最優(yōu)點(diǎn)的地方SGA即停滯尋優(yōu)工作。為此,可以采用第1次、第2次進(jìn)化迭代所產(chǎn)生的優(yōu)秀個(gè)體的變量變化區(qū)間作為變量新的初始變化區(qū)間,算法進(jìn)入步驟①,重新運(yùn)行SGA,形成加速運(yùn)行,則優(yōu)秀個(gè)體區(qū)間將逐漸縮小,與最優(yōu)點(diǎn)的距離越來越近。直到最優(yōu)個(gè)體的優(yōu)化準(zhǔn)則函數(shù)值小于某一設(shè)定值或算法運(yùn)行達(dá)到預(yù)定加速次數(shù),結(jié)束整個(gè)算法運(yùn)行。此時(shí),將當(dāng)前群體中最佳個(gè)體指定為RAGA的結(jié)果。上述8個(gè)步驟構(gòu)成基于實(shí)碼的加速遺傳算法(RAGA)。
災(zāi)情資料取自《黑龍江省防汛資料匯編》。
表1中為黑龍江省1992-2001年的洪水災(zāi)害損失的10個(gè)評(píng)價(jià)樣本,每個(gè)樣本有7個(gè)評(píng)價(jià)指標(biāo),即屬于7維數(shù)據(jù)。對(duì)表1中黑龍江省洪水災(zāi)害損失的10個(gè)評(píng)價(jià)樣本建立綜合效益分類評(píng)價(jià)的PPC模型。RAGA過程中選定父代初始種群規(guī)模為N=400,交叉概率PC=0.80,變異概率pm=0.8c,優(yōu)秀個(gè)體數(shù)目選定為20個(gè),a=0.05,加速次數(shù)為20,得出密度窗寬R=7.9170,最大投影值943.0534,最佳投影方向a*= (0.3993,0.4040,0.3988,0.0352,0.4071,0.4199,0.4185),將a*帶入式(3)中即得黑龍江省洪水災(zāi)害損失的投影值(見圖1)為:z*(i)=(0.1473,0.1394,0.7833,0.0937,0.2309,0.2855,2.4494,0.1366,0.0434,0.0323)。
表1 黑龍江省洪水災(zāi)害災(zāi)情評(píng)價(jià)指標(biāo)原始數(shù)據(jù)
從圖1可以看出,黑龍江省1992-2001年10 a間有兩年的洪災(zāi)損失非常嚴(yán)重,分別為1998和1994兩年的投影值分別為2.4494和0.7833比其他年份均高可以肯定這兩年的損失嚴(yán)重。1994年的評(píng)價(jià)結(jié)果與潘華盛[11]利用模糊綜合評(píng)價(jià)法的結(jié)論相符;1998年松花江、嫩江發(fā)生了超百年一遇的特大洪水,黑龍江省洪水損失達(dá)到歷史洪水災(zāi)害損失最大。由此,說明了再不需要評(píng)價(jià)標(biāo)準(zhǔn)的情況下,RAGA的PPC模型的評(píng)價(jià)結(jié)果可靠。
另外,最佳投影方向各分量的大小實(shí)際上反映了各評(píng)價(jià)指標(biāo)對(duì)洪水災(zāi)害損失的影響程度(見圖2),最佳投影方向a*表明,各評(píng)價(jià)指標(biāo)對(duì)洪水災(zāi)害損失評(píng)價(jià)的影響程度大小依次為直接經(jīng)濟(jì)損失、水利設(shè)施經(jīng)濟(jì)損失、房屋倒塌數(shù)、洪澇的成災(zāi)面積、洪澇的受災(zāi)面積、受災(zāi)人口、死亡人口。由此可以看出洪水災(zāi)害損失實(shí)質(zhì)主要是經(jīng)濟(jì)的損失,為防洪減災(zāi)的有關(guān)部門提供了及時(shí)有效地減災(zāi)救災(zāi)依據(jù)。
圖1 1992~2001年黑龍江省洪水災(zāi)害損失的投影值z(mì)*(i)
圖2 黑龍江省洪水災(zāi)害損失綜合評(píng)價(jià)指標(biāo)的投影方向a*
黑龍江省在洪水災(zāi)害無評(píng)價(jià)標(biāo)準(zhǔn)或評(píng)價(jià)標(biāo)準(zhǔn)不適用的情況下,嘗試了不用評(píng)價(jià)標(biāo)準(zhǔn)的RAGA的PPC模型進(jìn)行了1992-2001年10 a的洪水災(zāi)害損失評(píng)價(jià)工作。實(shí)例的計(jì)算結(jié)果說明,該方法避免了主觀賦權(quán)的人為干擾,取得了較好效果,為沒有評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)的評(píng)價(jià)研究提供一條新的方法與思路;并且分析了各指標(biāo)的影響程度,為防洪減災(zāi)提供了依據(jù)。
[1] 金菊良,魏一鳴,楊曉華.基于遺傳算法的洪水災(zāi)情評(píng)估神經(jīng)網(wǎng)絡(luò)模型探討[J].災(zāi)害學(xué),1998,13(2):6-11.
[2] 于慶東.災(zāi)度等級(jí)判別方法的局限性及其改進(jìn)[J].自然災(zāi)害學(xué)報(bào),1993,2(2):8-10.
[3] 趙黎明,王康,邱佩華.災(zāi)害綜合評(píng)估研究[J].系統(tǒng)工程理論與實(shí)踐,1997,17(3):63-69.
[4] 李祚泳,鄧新民.自然災(zāi)害的物元分析災(zāi)情評(píng)估模型初探[J].自然災(zāi)害學(xué)報(bào),1994,3(2):28-33.
[5] 付強(qiáng),趙小勇.投影尋蹤模型原理及其應(yīng)用[M].北京:科學(xué)出版社,2006.
[6] 付強(qiáng),王志良,梁川.基于RAGA的PPC模型在土壤質(zhì)量變化評(píng)價(jià)中的應(yīng)用研究[J].水土保持學(xué)報(bào),2002,16(5):109-110.
[7] 項(xiàng)靜恬,史久恩.非線性系統(tǒng)中數(shù)據(jù)處理的統(tǒng)計(jì)方法[M].北京:科學(xué)出版社,2000.
[8] 張欣莉.投影尋蹤及其在水文水資源中的應(yīng)用[M].成都:四川大學(xué),2000.
[9] 周明,孫樹棟.遺傳算法原理及其應(yīng)用[M].北京:國防工業(yè)出版社,2000.
[10] 付強(qiáng).數(shù)據(jù)處理方法及其農(nóng)業(yè)應(yīng)用[M].北京:科學(xué)出版社,2006.
[11] 潘華盛,張桂華,董淑華.黑龍江省洪水災(zāi)害等級(jí)評(píng)估模型—模糊綜合評(píng)價(jià)法[J].黑龍江氣象,2000,2(1):1-4.