蔡 樂(lè),趙學(xué)麗,王亞娟
(北京市水文總站,100089,北京)
降水的形成機(jī)制和預(yù)報(bào)屬于氣象工作的研究?jī)?nèi)容,水文工作研究降水量時(shí)空分布特征和降水資料的整理及應(yīng)用。降水量合理性檢驗(yàn)是判斷降水量數(shù)據(jù)異常的有效方法,也是發(fā)布實(shí)時(shí)水情信息和降水量資料整編的重要前提。傳統(tǒng)的降水量合理性檢驗(yàn)完全由人工完成,由于數(shù)據(jù)量很大,檢驗(yàn)方法規(guī)則不統(tǒng)一,插補(bǔ)方式因人而異,從而導(dǎo)致效率低,數(shù)據(jù)的可靠性和準(zhǔn)確性受到影響。因此,結(jié)合計(jì)算機(jī)的使用,尋求一種高效的降水量數(shù)據(jù)處理平臺(tái),對(duì)水情發(fā)報(bào)和資料整編都具有重要意義。
2007年引進(jìn)的水文水環(huán)境基礎(chǔ)信息管理系統(tǒng)(Water Management Information System Kisters,簡(jiǎn)稱 WISKI)成功應(yīng)用于北京水文、地下水、水環(huán)境業(yè)務(wù)系統(tǒng)。WISKI由德國(guó)Kisters公司研發(fā),經(jīng)過(guò)20多年的開(kāi)發(fā)與應(yīng)用,已成為一個(gè)比較完善的軟件產(chǎn)品。該產(chǎn)品具有強(qiáng)大的業(yè)務(wù)擴(kuò)展功能,可根據(jù)具體工作需要進(jìn)行二次開(kāi)發(fā),進(jìn)而配置出符合實(shí)際要求的各類統(tǒng)計(jì)、分析和糾錯(cuò)功能。WISKI平臺(tái)的成功搭建為雨量合理性檢驗(yàn)和插補(bǔ)工作提供了充分條件,同時(shí)也為尋求一種全新的水文數(shù)據(jù)整理模式提供了探索空間。
WISKI系統(tǒng)在時(shí)序數(shù)據(jù)的基本運(yùn)算和數(shù)據(jù)生成方面有獨(dú)特之處,具有較強(qiáng)的整體功能和完整性。WISKI本身沒(méi)有提供降水量合理性檢測(cè)的解決方案,但它提供了時(shí)序計(jì)算平臺(tái)和一系列通用的時(shí)序計(jì)算方法,可根據(jù)需求進(jìn)行系統(tǒng)的二次開(kāi)發(fā),使得降水量合理性檢驗(yàn)的適應(yīng)性和靈活性更強(qiáng)。
根據(jù)合理性檢驗(yàn)的需求,以獨(dú)立的雨量站降水量時(shí)序?yàn)榛締挝?,選取相關(guān)性最好的雨量站作為關(guān)聯(lián)站,進(jìn)行每場(chǎng)次降水量數(shù)據(jù)的橫向比較,通過(guò)數(shù)據(jù)值之間的定量關(guān)系判別異常數(shù)據(jù)類型,從而完成降水量合理性檢驗(yàn),完整實(shí)施流程見(jiàn)圖1。
圖1 WISKI進(jìn)行降水量合理性分析流程圖
表1 40a長(zhǎng)時(shí)間序列雨量站之間相關(guān)系數(shù)所占總體百分比分布表
目前,北京市水文總站在全市范圍內(nèi)建設(shè)了121個(gè)遙測(cè)雨量站,雨量傳感器的分辨率為0.5mm,并且在雨水情系統(tǒng)建設(shè)中首次使用了CDMA—1X網(wǎng)絡(luò)作為主信道、GSM為備用信道的傳輸方案,針對(duì)目前的硬件設(shè)施情況和近年的使用經(jīng)驗(yàn),遙測(cè)降水量數(shù)據(jù)的錯(cuò)誤主要有以下幾種類型:
①遷站引起數(shù)據(jù)缺失。由于山區(qū)房屋改造,遙測(cè)雨量站被迫遷站而引起數(shù)據(jù)缺失。
②儀器堵塞引起數(shù)據(jù)異常。遙測(cè)儀器出現(xiàn)堵塞,會(huì)造成一次降水后遙測(cè)數(shù)據(jù)連續(xù)多日維持在一個(gè)較小值范圍內(nèi),或者無(wú)遙測(cè)數(shù)據(jù)。
③設(shè)備故障引起數(shù)據(jù)異常。由于設(shè)備故障,在較長(zhǎng)時(shí)間內(nèi)沒(méi)有遙測(cè)數(shù)據(jù)。
④人為注水調(diào)試引起數(shù)據(jù)異常。人為注水調(diào)試的數(shù)據(jù)一般會(huì)人工剔除,但也不免遺漏未剔除的人工注水?dāng)?shù)據(jù)。
⑤RTU硬件原因?qū)е聰?shù)據(jù)異常。由RTU的硬件原因?qū)е碌漠惓?,主要表現(xiàn)為“跳數(shù)”,即數(shù)據(jù)出現(xiàn)較大的波動(dòng)。
降水量合理性檢驗(yàn)的核心工作就是對(duì)有以上問(wèn)題而導(dǎo)致的異常數(shù)據(jù)值進(jìn)行排查。
(1)相關(guān)系數(shù)的計(jì)算
傳統(tǒng)人工進(jìn)行雨量合理性檢驗(yàn)是將同流域或者鄰近雨量站之間的數(shù)據(jù)進(jìn)行對(duì)比,這種比較多數(shù)情況下是可行的,但是缺乏有力的科學(xué)根據(jù)和足夠的量化數(shù)據(jù)作支撐。雨量站之間距離的大?。ǖ匦螚l件)是降水是否同步的必要條件,而非充分條件,即關(guān)聯(lián)性強(qiáng)的雨量站距離一定很近,但距離很近的雨量站關(guān)聯(lián)性不一定強(qiáng)。我們需要引入一個(gè)具體的量化指標(biāo)來(lái)判斷雨量站之間關(guān)聯(lián)性的強(qiáng)弱,因此,相關(guān)系數(shù)的計(jì)算是必不可少的。
選取長(zhǎng)時(shí)間序列(1979—2009年)的日雨量值進(jìn)行兩站之間相關(guān)系數(shù)計(jì)算,同時(shí)間的降水量值分別為序列 x1,x2,x3…xn-1,xn和 y1,y2,y3…yn-1,yn,n的數(shù)值不取決于兩個(gè)時(shí)間序列中的任何一個(gè)時(shí)序數(shù),某時(shí)間序列的降水量值不為0,與其對(duì)應(yīng)另一組時(shí)序便參與相關(guān)系數(shù)計(jì)算,無(wú)雨量取0值。采用EXCEL求相關(guān)系數(shù)方便快捷,CORREL函數(shù)自動(dòng)將同為空白的信息濾掉,滿足分析的要求。雨量站之間的相關(guān)系數(shù)分布情況見(jiàn)表1。通過(guò)計(jì)算可以得出,平原區(qū)雨量站之間的相關(guān)系數(shù)普遍較大,山區(qū)雨量站之間相關(guān)性不及平原區(qū)明顯。通常相關(guān)系數(shù)大于0.8時(shí),兩組變量有很強(qiáng)的線性相關(guān)性,為了考慮山區(qū)雨量站相關(guān)性略低的影響,選取相關(guān)系數(shù)大于0.75的雨量站為候選關(guān)聯(lián)雨量站。
(2)雙累計(jì)分析
通過(guò)長(zhǎng)時(shí)間序列求得的相關(guān)系數(shù)可有效反映日降水量數(shù)據(jù)相關(guān)性,關(guān)聯(lián)雨量站的選取還需要在相關(guān)性較強(qiáng)的雨量站之間選擇數(shù)據(jù)一致性好的。WISKI自帶的雙累計(jì)分析為數(shù)據(jù)一致性檢查提供了有效方式。選取5分鐘時(shí)段的雨量值進(jìn)行雙累計(jì)曲線分析,通過(guò)分析雙累計(jì)曲線可知,相關(guān)系數(shù)高的雨量站之間雙累積曲線形態(tài)一般較好,但也存在極個(gè)別特殊情況。浦洼站與十渡站40年降水量資料相關(guān)系數(shù)為0.92,但是雙累計(jì)曲線形態(tài)不如與黃塔站的好,浦洼站與黃塔站40年降水量資料相關(guān)系數(shù)為0.88。
通過(guò)相關(guān)系數(shù)的計(jì)算和雙累積曲線分析,每個(gè)雨量站選取相關(guān)系數(shù)高、雙累積曲線形態(tài)較好的3個(gè)雨量站為其關(guān)聯(lián)站,在WISKI中建立日雨量檢查時(shí)序,配置該時(shí)序的源信息,時(shí)間序列配置為待檢驗(yàn)雨量站及其關(guān)聯(lián)站的日降水量值。
降水量合理性檢驗(yàn)規(guī)則的制定是一個(gè)突破傳統(tǒng),由定性分析向定量分析轉(zhuǎn)變的一個(gè)步驟??蓞⒖棘F(xiàn)成的降水量合理性檢查原則極少,降水量合理性檢驗(yàn)規(guī)則的制定參考以往的工作經(jīng)驗(yàn)進(jìn)行。針對(duì)降水量數(shù)據(jù)可能出現(xiàn)的錯(cuò)誤情況,共制定了如下幾種異常值類型,并且統(tǒng)一編碼,用異常代碼的形式展示。將該雨量站的錯(cuò)誤類型總體分為降水量大于0與等于0兩大類,再細(xì)化分具體的異常類型(見(jiàn)表2)。
表2 雨量站遙測(cè)數(shù)據(jù)異常代碼統(tǒng)計(jì)表
表3 5月降水量合理性檢查成果表(部分)(異常值成立:true,不成立:false)
WISKI將所有的測(cè)量值和計(jì)算值都以時(shí)序數(shù)據(jù)方式保存,每個(gè)時(shí)序數(shù)據(jù)對(duì)應(yīng)于一個(gè)站點(diǎn)的指定參數(shù),可以配置多種數(shù)據(jù)輸出模式,根據(jù)參數(shù)與時(shí)段生成相關(guān)的報(bào)表,并且可以設(shè)置在指定的時(shí)間自動(dòng)生成報(bào)表,為成果自動(dòng)輸出提供了一個(gè)合理的解決方案。由于降水量合理性檢查沒(méi)有具體的定量指標(biāo)來(lái)判別異常值一定成立,所以最終輸出的成果還需要進(jìn)行人工校核,但如果在檢驗(yàn)規(guī)則較為完善的前提下,人工校核的工作量就會(huì)很小。首先經(jīng)WISKI平臺(tái)自動(dòng)將疑似異常值的數(shù)據(jù)從海量的降水量數(shù)據(jù)庫(kù)中挑出,再根據(jù)人工的經(jīng)驗(yàn)對(duì)WISKI挑選的異常值進(jìn)行排查,可有效減少數(shù)據(jù)的遺漏,進(jìn)而達(dá)到提高效率、減少錯(cuò)誤的目的。
表3是運(yùn)用WISKI生成的5月降水量合理性檢查成果表的部分信息,經(jīng)人工校核,WISKI自動(dòng)生成的成果表1/2以上的異常值均成立,并且無(wú)一異常值被遺漏。
①二次開(kāi)發(fā)WISKI使其應(yīng)用于雨量合理性檢驗(yàn)是可行的。這種全新的數(shù)據(jù)處理方式將以往大量繁雜的人工工作通過(guò)計(jì)算機(jī)平臺(tái)實(shí)現(xiàn),減輕了工作強(qiáng)度,提高了時(shí)效性,同時(shí)也提高了水文資料處理的先進(jìn)性、科學(xué)性,具有積極的意義。
②由于WISKI平臺(tái)二次開(kāi)發(fā)具有很強(qiáng)的靈活性,雨量合理性檢驗(yàn)規(guī)則可根據(jù)實(shí)際需求具體制定,并可以根據(jù)工作經(jīng)驗(yàn)不斷完善,使其更接近于真實(shí)的降水情況。當(dāng)然,使用計(jì)算機(jī)平臺(tái)進(jìn)行水文資料的處理代替了大量人工工作量,但其中人的作用還是不可或缺的,還需要經(jīng)驗(yàn)豐富的水文工作人員對(duì)從海量數(shù)據(jù)中提取的異常值進(jìn)行排查。這樣人工經(jīng)驗(yàn)和計(jì)算機(jī)運(yùn)用得到了有機(jī)結(jié)合,提高了水文數(shù)據(jù)處理的可靠性。
③WISKI應(yīng)用于雨量合理性檢驗(yàn)僅是二次開(kāi)發(fā)WISKI平臺(tái)的探索之一。根據(jù)水文工作的實(shí)際需求對(duì)WISKI進(jìn)行有目的的二次開(kāi)發(fā),可實(shí)現(xiàn)很多水文數(shù)據(jù)的分析計(jì)算功能。除WISKI之外的一些平臺(tái)也可經(jīng)過(guò)開(kāi)發(fā)代替部分人工勞作,可應(yīng)用到水文數(shù)據(jù)的處理工作中,促進(jìn)水文行業(yè)信息化技術(shù)的發(fā)展。
[1]降水量測(cè)驗(yàn)規(guī)范(SL 21—2006)[M].北京:中國(guó)水利水電出版社,2006.
[2]水文資料整編規(guī)范(SL 247—1999)[M].北京:中國(guó)水利水電出版社,2000.
[3]趙學(xué)麗,池宸星,吳海山.WISKI在北京水文數(shù)據(jù)管理中的應(yīng)用[J].北京水務(wù),2008(6).
[4]吳金塔.水文遙測(cè)數(shù)據(jù)智能糾錯(cuò)及插補(bǔ)技術(shù)在洪水預(yù)報(bào)中的應(yīng)用研究[J].水利水電科技,2005(11).