王玉麗 包為民
(河海大學(xué) 水文水資源學(xué)院, 南京 210098)
降雨三步抗差修正效果的研究
王玉麗 包為民
(河海大學(xué) 水文水資源學(xué)院, 南京 210098)
在分析流域降雨分布規(guī)律的基礎(chǔ)上,利用三步抗差方法修正遙測(cè)降雨觀測(cè)資料中的異常誤差.采用陸水流域的11場(chǎng)洪水降雨資料,加上人工生成的不同量級(jí)的誤差系列,計(jì)算比較各步抗差修正的有效性.計(jì)算結(jié)果表明:在不同量級(jí)的異常誤差下抗差修正方法是有效的,第一、二、三步相結(jié)合的效果最好,一二步結(jié)合的效果次之,且隨著誤差量級(jí)的增大抗差有效性增強(qiáng).
三步抗差; 遙測(cè)降雨; 陸水流域; 效果
降雨作為洪水預(yù)報(bào)系統(tǒng)的重要輸入項(xiàng),其精度直接影響洪水預(yù)報(bào)的精度,雨量資料的誤差是洪水預(yù)報(bào)模型誤差的重要來(lái)源[1].遙測(cè)系統(tǒng)能夠?qū)崟r(shí)準(zhǔn)確快速地將降雨量存入數(shù)據(jù)庫(kù),一定程度上提高了降雨資料的時(shí)效性,但也存在著誤差.水文遙測(cè)系統(tǒng)的誤差有兩類,一是隨機(jī)觀測(cè)誤差,二是有偏誤差,把含有偏觀測(cè)誤差的降雨觀測(cè)值視為異常值[2].將抗差估計(jì)方法引入到遙測(cè)降雨觀測(cè)中,利用抗差抵御異常值污染的特性對(duì)降雨資料進(jìn)行修正,確保降雨資料在進(jìn)入洪水預(yù)報(bào)系統(tǒng)之前正確無(wú)誤.
具體函數(shù)形式為:
每個(gè)時(shí)段都建立式(2)的降雨函數(shù),其中Ji、Wi表示第n站對(duì)應(yīng)的經(jīng)緯度,Ri表示該時(shí)段的第i站降雨量.因此上式中的7個(gè)參數(shù)是時(shí)變的,即每個(gè)時(shí)段都會(huì)率定出一組參數(shù).
式(2)表示成矩陣形式:
其中
其中n為雨量站的個(gè)數(shù).
采用最小二乘法求得的參數(shù)X可表示為:
若降雨觀測(cè)資料中含有異常值,會(huì)導(dǎo)致率定出的參數(shù)是不精確的,因此引入抗差估計(jì)方法與最小二乘法相結(jié)合,即抗差最小二乘法求得的參數(shù)估值為[6-9]:
式中,P為權(quán)陣,其初始值為單位陣I.
式中,σ為加權(quán)殘差均方差;ε為殘差;k1、k2為常數(shù),由未加入異常誤差情況下的理想模型試算后取k1=2.7,k2=3.5.
三步抗差修正的第一步是針對(duì)時(shí)段降雨量,第二步對(duì)時(shí)段降雨量絕對(duì)離差,第三步是對(duì)時(shí)段降雨量的模擬絕對(duì)誤差.一個(gè)流域的時(shí)段降雨量、時(shí)段降雨量絕對(duì)離差和時(shí)段降雨量模擬絕對(duì)誤差都分布在一定范圍內(nèi)并且有一定的分布特征.根據(jù)這些分布特征可以提出以下特征函數(shù)[10-14]:
其中的Xi在第1步、第2步和第3步中分別代表時(shí)段降雨量、時(shí)段降雨量絕對(duì)離差和時(shí)段降雨量模擬誤差.k1、k2是常數(shù),決定著正常區(qū)、降權(quán)區(qū)和淘汰區(qū)的大?。?/p>
計(jì)算步驟:1)分析所有雨量站降雨資料的統(tǒng)計(jì)特征,進(jìn)行排頻確定各步的k1、k2值;2)對(duì)所有時(shí)段降雨量資料,采用相應(yīng)的抗差特征函數(shù)進(jìn)行誤差修正;3)對(duì)步驟2)修正后的降雨資料計(jì)算時(shí)段降雨量絕對(duì)離差,利用相應(yīng)的抗差特征函數(shù)進(jìn)行修正;4)對(duì)步驟3)修正后的降雨資料通過(guò)式(1)計(jì)算時(shí)段降雨模擬絕對(duì)誤差,再利用相應(yīng)的抗差特征函數(shù)修正.
式中,μi為不服從正態(tài)分布的低頻率誤差;R為隨機(jī)數(shù);emax為影響生成誤差大小的常數(shù);T為異常值產(chǎn)生的間隔,控制異常誤差產(chǎn)生的間隔頻率.
陸水流域位于湖北省東南部,是長(zhǎng)江中游南岸的一級(jí)支流,發(fā)源于湘鄂贛3省交界的幕阜山北麓通城縣境內(nèi)的黃龍山,流經(jīng)通城、崇陽(yáng)、赤壁、嘉魚(yú)4縣(市).整個(gè)流域位于北緯29°05′~29°50′,東經(jīng)113°40′~114°10′.流域面積3 950 km2.干流全長(zhǎng)183 km[15].采用陸水水庫(kù)11場(chǎng)洪水降雨資料加上式(8)生成不同量級(jí)的人工誤差,所構(gòu)成的一系列具有異常誤差的降雨觀測(cè)資料來(lái)進(jìn)行抗差效果的研究,考慮了當(dāng)1個(gè)站、2個(gè)站和4個(gè)站有異常值情況下的各步修正效果,其中誤差添加的雨量站和時(shí)段都是隨機(jī)的.
先對(duì)所有雨量站的降雨資料進(jìn)行排頻計(jì)算,其分布如圖1所示.可以看出陸水流域的時(shí)段降雨量主要分布在[0,30]mm區(qū)間上,其中[0,10]mm為高頻區(qū),頻率為98.16%,[10.1,30]mm發(fā)生頻率為1.84%.時(shí)段降雨量絕對(duì)離差和時(shí)段降雨量模擬絕對(duì)誤差的排頻與降雨量的相似.確定各步的臨界值k1和k2值見(jiàn)表1.
圖1 陸水水庫(kù)降雨頻率分布
臨界值時(shí)段降雨量/mm時(shí)段降雨量絕對(duì)離差/mm時(shí)段降雨量絕對(duì)模擬誤差/mmk11187k2292012
因?yàn)槿娇共钚拚谝粋€(gè)站、兩個(gè)站和四個(gè)站發(fā)生異常誤差情況的變化規(guī)律相似,現(xiàn)以一個(gè)站出現(xiàn)異常情況為例進(jìn)行說(shuō)明.
不同量級(jí)異常誤差情況下的三步抗差效果見(jiàn)表2,三步抗差的修正效果(以一個(gè)站有異常誤差為例)如圖2所示.由表2可以看出在不同量級(jí)的誤差情況下,三步抗差的效果不同.結(jié)合表2和圖3,可以發(fā)現(xiàn)對(duì)于小誤差,第二步的效果比第一、三步的效果好,第三步的效果也比大誤差時(shí)好.對(duì)于大誤差,第一步的效果較好,第二、三步的修正效果則變?nèi)酰@是因?yàn)楫惓U`差越大,異常值就會(huì)越容易被識(shí)別出來(lái)并得到修正,當(dāng)?shù)谝徊娇共钚Ч芎脮r(shí),余留給第二、三步的誤差則會(huì)變小,就會(huì)放大修正效果,導(dǎo)致后兩步有效系數(shù)很?。粗?,當(dāng)?shù)谝徊降男拚Ч缓脮r(shí),余留和后兩步的誤差變大,相應(yīng)的修正效果也會(huì)越明顯.可以看出三步在修正過(guò)程中相互彌補(bǔ).隨著誤差量級(jí)的增大,總的修正效果越好.結(jié)果中出現(xiàn)負(fù)值可能是抗差過(guò)度所引起的.
圖2 三步抗差的修正效果(以一個(gè)站有異常誤差為例)
emaxr11r12r13r1tr21r22r23r2tr41r42r43r4t100.3180.4750.0860.3550.1800.0500.0670.0670.1050.052-0.0010.151200.4060.4100.0300.6600.3120.412-.0970.5560.1700.3750.0110.487300.4530.1970.0620.5880.4480.2580.1100.6360.4160.367-0.0530.610400.6310.151-0.0620.6680.6230.2120.1070.7350.5480.3410.0550.718500.7360.119-0.2920.6990.7000.586-.2100.8500.6170.398-0.0620.755600.7750.109-0.0890.7810.7480.131-.1250.7540.6570.459-0.1170.792700.8160.080-0.0970.8150.7770.1390.1520.8370.6720.5110.0010.840800.8420.0450.0330.8540.7950.2060.0200.8400.6880.548-0.0540.851900.8580.0320.0490.8690.8040.2870.0100.8620.6940.577-0.4210.8161000.8700.018-0.1260.8560.8190.3420.0290.8840.7070.602-0.1270.8692000.9100.308-0.0120.9370.8460.649-.0290.9440.7260.683-0.0330.910均值0.6920.177-0.0380.7350.6410.2970.0030.7240.5450.447-0.0730.709
當(dāng)一個(gè)站發(fā)生異常誤差時(shí)第一、二、三步以及總的修正平均效果為0.692、0.177、-0.038、0.736;當(dāng)兩個(gè)站發(fā)生異常誤差時(shí)則為0.641、0.297、0.003、0.724;當(dāng)四個(gè)站有異常誤差時(shí)的效果分別為0.545、0.447、-0.073、0.709.可看出隨著發(fā)生異常值站數(shù)的增多,第一步抗差效果會(huì)稍變差,第二修正效果越好,第三步的修正效果不穩(wěn)定,這是因?yàn)殡S著發(fā)生異常值站數(shù)的增多,抗差探測(cè)異常值的效率降低,進(jìn)而導(dǎo)致修正有效性略低.
各步抗差修正效果見(jiàn)表3.計(jì)算三步抗差中各步的抗差效果,結(jié)合表2、3可以看出,當(dāng)一個(gè)、兩個(gè)、四個(gè)站有異常值時(shí),第一步修正效果為0.692,0.641,0.545,第二步修正效果為0.673,0.656,0.578,第三步的效果為0.177,0.178,-0.025,一二步結(jié)合的效果為0.729,0.715,0.692,一三步結(jié)合的效果為0.575,0.611,0.512,一二三步的效果為0.735,0.724,0.709.第一步的修正效果明顯比第二、三步好,而第二步的效果又比第三步的好.單獨(dú)的第二、三步和一、三步結(jié)合在小誤差情況下修正效果很差,甚至出現(xiàn)負(fù)值.而一、二步結(jié)合修正時(shí)在小誤差情況下效果好.一、二、三步結(jié)合的效果比一、二步結(jié)合和一、三步結(jié)合的效果好,其中一二步結(jié)合比一三步結(jié)合的效果好.
表3 各步抗差修正效果
1)不同量級(jí)的異常誤差情況下,遙測(cè)降雨的三步抗差效果不同.誤差量級(jí)越大,抗差效果越好.
2)隨著發(fā)生異常誤差站數(shù)的增加,由于異常值被探測(cè)效率的降低,導(dǎo)致修正效果降低.
3)第一、二、三步結(jié)合的抗差效果比第一步和一二步結(jié)合的修正效果好,其中一、二步結(jié)合的效果比第一步的好.在三步抗差的過(guò)程過(guò)各步相互彌補(bǔ),得到較高的修正有效性.
4)臨界值k1、k2是通過(guò)試算的方法確定的,具有一定的主觀性.因此對(duì)于確定k1、k2值得方法有待進(jìn)一步的研究.
[1] 包為民,瞿思敏,等.遙測(cè)系統(tǒng)降雨觀測(cè)誤差估計(jì)方法研究[J].水利學(xué)報(bào),2003,34(4):30-34.
[2] 趙 超.流域?qū)崟r(shí)洪水抗差預(yù)報(bào)系統(tǒng)研究[D].南京:河海大學(xué),2006.
[3] 瞿思敏.抗差理論在洪水預(yù)報(bào)中的應(yīng)用研究[D].南京:河海大學(xué),2004.
[4] 瞿思敏,包為民,石 朋,等.降雨觀測(cè)粗差修正方法研究[J].武漢大學(xué)學(xué)報(bào),2005,38(6):32-34.
[5] 周江文,黃幼才,楊元喜,等.抗差最小二乘法[J].武漢:華中理工大學(xué)出版社,1997.
[6] 包為民,嵇海祥,等.抗差理論及在水文學(xué)中的應(yīng)用[J].水科學(xué)進(jìn)展,2003(4).
[7] A.Bárdossy, Singh S K. Robust Estimation of Hydrological Model Parameters[J]. Hydrology and Earth System Sciences,2008(12): 1273-1283.
[8] 包為民,林 躍,黃賢慶,等.水庫(kù)入庫(kù)河段洪水匯流參數(shù)抗差估計(jì)研究[J].武漢大學(xué)學(xué)報(bào):工學(xué)報(bào),2004,37(6):1127-1129.
[9] 包為民,瞿思敏,等.水文系統(tǒng)抗差權(quán)函數(shù)分析與檢驗(yàn)[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2003(8):1127-1129.
[10] Zhao C,Hong H S,Zhu M L. A Three-stepwise Robust Statistical Method for Outlying Rainfall Observation[J].Journal of the Graduate School of the Chinese Academy of Sciences,2010,27(1):17-26.
[11] 歐吉坤.一種三步抗差方案的設(shè)計(jì)[J].測(cè)繪學(xué)報(bào),1996,25(3):173-179.
[12] Li Qian,Bao Weimin,Qian jinglin. An Error Updating System for Real-time Flood Forecasting based on Robust Procedure[J].KSCE Journal of Civil Engineering, 2015,19(3):796-803.
[13] Rousseeuw P J,Leroy A M. Robust Regression and Outlier Detection[M]. John Wiley&Sons,NewYork,1987.
[14] Tsuyoshi Hashimoto,Daniel P Loucks,Jery R.Stedinger,Robustness of Water Resources Systems,Water Resources Res,2003,18(1):21-26.
[15] 程孟孟,杜成壽,鄭桂平.陸水流域水文特性分析[J].人民長(zhǎng)江,2013,44(18):56-58.
StudyofThree-stepwiseRobustCorrectEffectofRainfall
Wang Yuli Bao Weiming
(College of Hydrology & Water Resources, Hohai Univ., Nanjing 210098, China)
Based on the analysis of rainfall distribution in the basin,the three-stepwise robust method is used to correct the outliers in the telemetric rainfall observation data. Eleven floods rainfall data of Lushui basin are used; and the error series of different magnitudes are calculated and compared. The results show that: the robust correction method is effective; the combination of the first, second and third steps has the best effect; the combination of first and second steps followed. Furthermore, the effect is better with the increase of the error magnitude.
three stepwise robust; telemetry rainfall; Lushui basin; effect
10.13393/j.cnki.issn.1672-948X.2017.05.007
2016-11-30
國(guó)家自然科學(xué)基金面上基金(51279057/51479062);水利部公益性行業(yè)科研專項(xiàng)項(xiàng)目(201501059).
王玉麗(1992-),女,碩士生,主要從事水文水資源和水文預(yù)報(bào)方面的研究.E-mail:yuliwang8943@163.com
P332
A
1672-948X(2017)05-0034-04
[責(zé)任編輯王迎春]