陳 媛, 董丹丹, 申 飆, 蔡宏珂
(1.國能大渡河大數(shù)據(jù)服務(wù)有限公司,四川 成都 610041;2.成都信息工程大學(xué),四川 成都 610225;3.重慶美天科技有限公司,重慶 401120)
地面雨量站網(wǎng)可以提供精確的點(diǎn)降雨信息,但由于其空間分布不均,在雨量站網(wǎng)稀疏地區(qū),如果僅用雨量網(wǎng)觀測降雨估計(jì)流域面降雨量將會產(chǎn)生很大的不確定性。數(shù)值模式輸出的降雨產(chǎn)品可以彌補(bǔ)觀測系統(tǒng)部署不均造成的問題,但模式降雨產(chǎn)品本身亦存在嚴(yán)重的系統(tǒng)偏差[1-2]?;趩我粊碓吹慕涤曩Y料各有利弊,如何有效結(jié)合不同來源降雨資料的優(yōu)勢,發(fā)展多源降雨融合技術(shù),成為近年來國際上在高質(zhì)量降雨產(chǎn)品研發(fā)中的主流趨勢[3-5]。
數(shù)據(jù)融合是將來源和分辨率各異的、直接和間接的觀測數(shù)據(jù)與模型模擬結(jié)果集成,生成在時(shí)間、空間和物理特性三個維度上具有一致性的各種數(shù)據(jù)集,通過數(shù)據(jù)融合技術(shù)對地面觀測降雨和格點(diǎn)降雨產(chǎn)品進(jìn)行綜合分析以獲取最優(yōu)面降雨估計(jì),融合后的降雨具有多種降雨資料的優(yōu)勢,能夠精確反映降雨的空間分布狀態(tài)[6-8]。數(shù)據(jù)融合方法有兩種[9-10]:(1)全局校正融合方法的基本假設(shè)是格點(diǎn)降雨在空間域上具有連續(xù)分布的偏差,利用真實(shí)觀測的站點(diǎn)數(shù)據(jù)對每個格點(diǎn)降雨進(jìn)行修正,此方法融合了地面觀測降雨的局部高精度和格點(diǎn)降雨資料覆蓋范圍廣且空間分布合理的優(yōu)點(diǎn)。(2)局部校正融合方法的核心是基于加權(quán)平均、回歸分析等數(shù)學(xué)思想,主要利用單個格點(diǎn)所包含的雨量站點(diǎn)降雨信息對格點(diǎn)降雨信息進(jìn)行局部修正,此融合方法考慮了降雨的空間自相關(guān)性,在雨量站網(wǎng)密度較大地區(qū)融合效果較好,但在雨量站網(wǎng)密度較低地區(qū),雨量站點(diǎn)距離較大,其空間自相關(guān)性被高估,融合結(jié)果會產(chǎn)生很大的不確定性。
四 川 大 渡 河 流 域 位 于 99°42'E~103°48'E,28°15'N~33°33'N,青藏高原東南邊緣向四川盆地西部的過渡地帶,流域內(nèi)地貌形態(tài)差異明顯,地理特征復(fù)雜,氣候差異明顯[11-12],與降雨密切相關(guān)的滑坡、泥石流等地質(zhì)災(zāi)害頻繁發(fā)生[13-14],流域的流量、江河的抗洪能力以及水庫的蓄洪規(guī)模都與流域的平均降雨量密切相關(guān)[15-16]。目前,大渡河流域氣象觀測站點(diǎn)分布不均且密度較低,存在某些區(qū)域缺乏雨量觀測數(shù)據(jù)的問題。因此,有必要對大渡河流域降雨數(shù)據(jù)進(jìn)行融合方法研究及其誤差分析,從而改善流域內(nèi)降雨數(shù)據(jù)精度不夠的問題,為防災(zāi)減災(zāi)提供參考。
采用資料:(1)1979-2018年大渡河流域自建測站和氣象系統(tǒng)觀測站網(wǎng)的氣象觀測資料,時(shí)間分辨率為逐日。(2)1979-2018年ERA5再分析數(shù)據(jù),時(shí)間分辨率為逐小時(shí),空間分辨率0.25°。(3)1979-2018年NCEP2再分析數(shù)據(jù),時(shí)間分辨率為逐小時(shí),空間分辨率2.5°。(4)1997-2018年 TRMM 數(shù)據(jù)。(5)1979-2018年由氣象觀測資料、ERA5再分析數(shù)據(jù)融合且再由氣象觀測資料、TRMM數(shù)據(jù)訂正得到的逐日降雨融合數(shù)據(jù)(Grid數(shù)據(jù))。(6)2008-2018年全流域、1~4區(qū)逐日Grid數(shù)據(jù)面雨量與觀測資料面雨量數(shù)據(jù)。
根據(jù)大渡河流域地理特征,將其分為4個區(qū)域,從西北到東南依次為一區(qū)、二區(qū)、三區(qū)和四區(qū),如圖1所示,為3條黑線所分隔,一區(qū)位于大渡河流域的上游,二區(qū)主要位于中游,三區(qū)和四區(qū)位于流域下游,其中四區(qū)主要位于大渡河的南側(cè)。
圖1 1979-2018年觀測站點(diǎn)、Grid、ERA5、NCEP2日均降雨量空間分布
首先進(jìn)行降雨數(shù)據(jù)融合得到一套新的完整逐日降雨數(shù)據(jù) Grid數(shù)據(jù);再結(jié)合氣象站點(diǎn)資料、ERA5和NCEP2格點(diǎn)資料,從日均降雨量空間分布、4個分區(qū)日均面雨量、日降雨量均方根誤差、日降雨量標(biāo)準(zhǔn)差及全流域、1~4區(qū)的面雨量時(shí)間序列這5個方面來評估融合資料,與站點(diǎn)資料、ERA5和NCEP2格點(diǎn)資料進(jìn)行誤差對比分析,探討Grid數(shù)據(jù)的適用性。
1.2.1 數(shù)據(jù)融合方法
目前國際上使用較多的格點(diǎn)數(shù)據(jù)主要為ERA5和NCEP2再分析數(shù)據(jù)集,因此,首先將大渡河流域觀測站點(diǎn)數(shù)據(jù)與ERA5降雨數(shù)據(jù)進(jìn)行融合得到格點(diǎn)數(shù)據(jù);然后,由于大渡河流域站點(diǎn)密度較低,局部校正融合方法不適用,因此采用最優(yōu)插值數(shù)據(jù)融合方法進(jìn)行全局校正[9-10],利用氣象觀測數(shù)據(jù)和TRMM衛(wèi)星反演降雨數(shù)據(jù)進(jìn)行校正,形成逐日降雨資料,數(shù)據(jù)的空間分辨率為0.1°×0.1°,即經(jīng)融合訂正后形成的逐日降雨融合數(shù)據(jù)(Grid數(shù)據(jù))。使用的插值方法包括3次樣條插值和反距離權(quán)重插值方法。
1.2.2 面雨量計(jì)算方法
在某個特定地點(diǎn)所測得的降落到地面的降雨量稱作點(diǎn)雨量,氣象部門觀測和預(yù)報(bào)的一般是作為站點(diǎn)位置函數(shù)的點(diǎn)雨量,而水文部門需要的則是流域范圍內(nèi)的面雨量。流域面雨量可以通過點(diǎn)雨量來計(jì)算,表示為
式中,P是作為連續(xù)函數(shù)的點(diǎn)雨量,C是某一特定流域,AC為流域面積。
由于降雨觀測站的離散性,不可能獲得完全連續(xù)的點(diǎn)雨量場P。實(shí)際計(jì)算是通過將式(1)離散化來完成的,即先將流域C劃分為N個包含一個雨量觀測的小區(qū)域,用第i個小區(qū)域上的點(diǎn)雨量Pi代表小區(qū)域的平均降雨量,流域的面雨量近似為
式中:N為樣本量
1.2.3 誤差評估方法
采用標(biāo)準(zhǔn)差和均方根誤差來進(jìn)行誤差評估。標(biāo)準(zhǔn)差在降雨數(shù)據(jù)的評估中是最常使用的指標(biāo),可作為表征變量變化程度的統(tǒng)計(jì)量。標(biāo)準(zhǔn)差定義是各樣本距平的算數(shù)平方根,它反映樣本的平均變化程度,能夠反應(yīng)降雨變化程度的統(tǒng)計(jì)量。公式如下:
均方根誤差(RMSE)是用來衡量觀測值同真值之間的偏差。公式如下:
式中,x和y為兩組變量,N為樣本量。
1.2.4 相關(guān)系數(shù)
采用皮爾遜相關(guān)系數(shù)來描述兩個變量的線性相關(guān),用r來表示相關(guān)系數(shù),公式如下:
從圖1看,觀測站點(diǎn)數(shù)據(jù)顯示大渡河流域日均降雨在南部區(qū)域即3區(qū)和4區(qū)相對偏多,日均最大值可以達(dá)到7.1 mm以上,而在中北部區(qū)域即1區(qū)和2區(qū)相對偏少,日均降雨量最小值在2.9 mm以下,整體上大渡河流域降雨呈現(xiàn)出自北向南逐漸增加的趨勢。ERA5降雨資料顯示,大渡河流域總體上表現(xiàn)出“北低南高”的降雨趨勢,但由于該套資料的分辨率僅為0.25°,因此在每個區(qū)域內(nèi)并不能完全展示實(shí)際降雨的分布狀況,尤其在1區(qū)、2區(qū)和4區(qū)內(nèi)的降雨量明顯偏小,在3區(qū)內(nèi)降雨量比觀測站點(diǎn)值又偏高;NCEP2數(shù)據(jù)同樣由于空間分辨率(2.5°)過低,不能完全展現(xiàn)大渡河流域的降雨實(shí)況,甚至不能完全覆蓋流域范圍。
Grid數(shù)據(jù),分辨率達(dá)到了0.1°,基本能完整地展示出大渡河流域的降雨分布,總體上的降雨分布與觀測站點(diǎn)基本一致,同樣呈現(xiàn)出北部多、南部少的分布狀況,在每個區(qū)域內(nèi)的降雨分布和觀測站點(diǎn)展示出的降雨量基本吻合。
為進(jìn)一步評估Grid、ERA5和NCEP2這3套降雨資料與觀測站點(diǎn)數(shù)據(jù)具體差異情況,將Grid、ERA5和NCEP2日均降雨量數(shù)據(jù)分別插值到觀測站點(diǎn)上,并與觀測站點(diǎn)數(shù)據(jù)進(jìn)行對比(圖2)。
圖2 1979-2018觀測站點(diǎn)及Grid、ERA5、NCEP2插值到站點(diǎn)日均降雨量空間分布
從各個分區(qū)來看,ERA5數(shù)據(jù)插值到站點(diǎn)后的降雨量在3區(qū)和4區(qū)明顯比觀測站點(diǎn)數(shù)據(jù)偏小,而NCEP2數(shù)據(jù)插值到站點(diǎn)后的降雨量在3區(qū)和4區(qū)明顯比觀測站點(diǎn)偏大;Grid數(shù)據(jù)與觀測站點(diǎn)相比在3區(qū)和4區(qū)相較于ERA5和NCEP2數(shù)據(jù)明顯更好。在1區(qū)內(nèi),Grid和ERA5插值后的降雨量與觀測站點(diǎn)數(shù)據(jù)比較接近,但ERA5數(shù)據(jù)在2區(qū)整體上偏高。此外,NCEP2插值后的數(shù)據(jù)在1區(qū)和2區(qū)均明顯比觀測站點(diǎn)數(shù)據(jù)偏高,多數(shù)站點(diǎn)日均降雨都在5.18 mm以上。
綜上,對于Grid數(shù)據(jù)而言,其插值到站點(diǎn)后的數(shù)據(jù)優(yōu)于ERA5和NCEP2數(shù)據(jù),降雨量量級與觀測站點(diǎn)數(shù)據(jù)差距小,且整個區(qū)域內(nèi)的降雨量變化趨勢與觀測站點(diǎn)數(shù)據(jù)基本一致,在每個分區(qū)內(nèi)的最大降雨量和最小降雨量與觀測站點(diǎn)值相對接近。
為進(jìn)一步定量化觀測站點(diǎn)數(shù)據(jù)與 Grid、ERA5、NCEP2資料在各分區(qū)的接近程度,從不同區(qū)域的日均面雨量直方圖來看(圖3),在4個區(qū)域內(nèi)Grid數(shù)據(jù)的日均面雨量均比觀測站點(diǎn)偏高,這可能是由于站點(diǎn)分布較為稀疏,導(dǎo)致Grid數(shù)據(jù)中包含相對多的ERA5數(shù)據(jù)信息。同時(shí),ERA5數(shù)據(jù)則在1~3區(qū)內(nèi)日均面雨量同樣比觀測站點(diǎn)偏高,但是在4區(qū)表現(xiàn)相反,明顯比觀測站點(diǎn)低;NCEP2數(shù)據(jù)在各個區(qū)域都比觀測站點(diǎn)偏高。
圖3 1979-2018年觀測站點(diǎn)、Grid、ERA5、NCEP2 1~4區(qū)日均面雨量
1區(qū)內(nèi),Grid、ERA5、NCEP2面雨量呈逐漸增大,其中Grid數(shù)據(jù)與觀測站點(diǎn)數(shù)據(jù)最接近,NCEP2數(shù)據(jù)與觀測站點(diǎn)的差距最大。2區(qū)內(nèi)與觀測站點(diǎn)差距最大的為ERA5,但由于融合數(shù)據(jù)Grid加入了站點(diǎn)信息,Grid數(shù)據(jù)比ERA5更接近觀測站點(diǎn)數(shù)據(jù)。3區(qū)內(nèi),ERA5數(shù)據(jù)得出的日均面雨量數(shù)值最低,且與觀測站點(diǎn)最為接近,但從圖2日均降雨量空間分布來看,ERA5雨量在3區(qū)為“西少東多”,而實(shí)際站點(diǎn)為“西多東少”,因此Grid站點(diǎn)在3區(qū)與觀測站點(diǎn)更為接近。4區(qū)內(nèi),Grid數(shù)據(jù)與觀測站點(diǎn)數(shù)據(jù)更接近。
綜上,Grid數(shù)據(jù)的日均面雨量和觀測站點(diǎn)數(shù)據(jù)最接近。
以觀測站點(diǎn)降雨數(shù)據(jù)為基準(zhǔn),評估Grid、ERA5和NCEP2各數(shù)據(jù)對大渡河流域日降雨量的均方根誤差(RMSE)情況(圖4)??傮w上看,Grid數(shù)據(jù)與站點(diǎn)數(shù)據(jù)的RMSE誤差最小。從各個分區(qū)來看,在1區(qū)和2區(qū)內(nèi),Grid數(shù)據(jù)絕大部分RMSE值很小,誤差值在2.6以下;ERA5和NCEP2數(shù)據(jù)誤差約在8.9~12.5,部分站點(diǎn)誤差更高。在3區(qū)和4區(qū)內(nèi),Grid數(shù)據(jù)依然表現(xiàn)最好,很多站點(diǎn)的誤差值都在2.6以下,ERA5和NCEP2數(shù)據(jù)的表現(xiàn)遠(yuǎn)弱于Grid數(shù)據(jù),其絕大部分站點(diǎn)數(shù)據(jù)的誤差值都在8.9~12.5,甚至部分站點(diǎn)誤差值超過22以上。因此,從3套數(shù)據(jù)的RMSE誤差來看,Grid數(shù)據(jù)的要明顯小于ERA5和NCEP2數(shù)據(jù)。
圖4 1979-2018年Grid、ERA5、NCEP2日降雨量插值到站點(diǎn)RMSE空間分布
若從1~4區(qū)的RMSE區(qū)域平均來看(圖5),Grid的優(yōu)勢更加明顯。1區(qū)、2區(qū)和4區(qū)的Grid數(shù)據(jù)誤差遠(yuǎn)低于其余兩套數(shù)據(jù)。在3區(qū)內(nèi),Grid數(shù)據(jù)的誤差雖有所增加,但相對于ERA5和NCEP2數(shù)據(jù)誤差而言依然較小。因此在大渡河流域Grid降雨資料的準(zhǔn)確性更高。
圖5 1979-2018年Grid、ERA5、NCEP2 1~4區(qū)RMSE區(qū)域平均值
標(biāo)準(zhǔn)差能夠反映變量的平均變化程度。一個較大的標(biāo)準(zhǔn)差代表變量變化幅度較大;一個較小的標(biāo)準(zhǔn)差代表變化幅度較小。從圖6可以看出,觀測站點(diǎn)數(shù)據(jù)位于北部區(qū)域的1區(qū)和2區(qū)絕大部分站點(diǎn)標(biāo)準(zhǔn)差在4.5以下,而位于南部區(qū)域的3區(qū)和4區(qū)標(biāo)準(zhǔn)差相對較高,部分站點(diǎn)標(biāo)準(zhǔn)差在10以上。這說明3~4區(qū)降雨的變化程度比1~2區(qū)的變化程度大。
圖6 1979-2018年觀測站點(diǎn)、Grid、ERA5、NCEP2日降雨量標(biāo)準(zhǔn)差空間分布
將Grid、ERA5和NCEP2降雨數(shù)據(jù)的標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)對比,可以看到,Grid數(shù)據(jù)的標(biāo)準(zhǔn)差空間分布特征明顯與觀測站點(diǎn)數(shù)據(jù)更接近,1區(qū)和2區(qū)內(nèi),Grid數(shù)據(jù)在標(biāo)準(zhǔn)差也基本在4.5以下,3區(qū)和4區(qū)內(nèi),標(biāo)準(zhǔn)差也較為接近,這說明各分區(qū)標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)在不同分區(qū)內(nèi)的標(biāo)準(zhǔn)差分布狀況基本一致。ERA5數(shù)據(jù)在3區(qū)和4區(qū)內(nèi)的標(biāo)準(zhǔn)差明顯低于Grid數(shù)據(jù),大部分在7.5以下,但部分區(qū)域標(biāo)準(zhǔn)差又較大。對于NCEP2數(shù)據(jù)而言,由于分辨率較低,并不能完全展示不同分區(qū)內(nèi)的降雨標(biāo)準(zhǔn)差,其中更多的降雨細(xì)節(jié)被忽略。因此,從各套數(shù)據(jù)的標(biāo)準(zhǔn)差來看,Grid數(shù)據(jù)與觀測站點(diǎn)數(shù)據(jù)最接近。
若將Grid、ERA5和NCEP2數(shù)據(jù)的標(biāo)準(zhǔn)差插值到各站點(diǎn)上(圖7),同樣可以看出,Grid數(shù)據(jù)在各站點(diǎn)上的標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)的標(biāo)準(zhǔn)差基本一致,即“北部低、南部高”,北部的降雨量變化較小,南部的降雨量變化較大。從ERA5和NCEP2數(shù)據(jù)在各站點(diǎn)上的標(biāo)準(zhǔn)差來看,兩者在整個大渡河流域的標(biāo)準(zhǔn)差均比較低,與觀測站點(diǎn)數(shù)據(jù)的標(biāo)準(zhǔn)差存在較大差距,EAR5和NCEP2數(shù)據(jù)對大渡河流域的降雨表現(xiàn)不如高分辨率的Grid數(shù)據(jù)。進(jìn)一步說明了Grid數(shù)據(jù)與觀測站點(diǎn)數(shù)據(jù)最接近,Grid數(shù)據(jù)平均變化程度優(yōu)于ERA5和NCEP2數(shù)據(jù)。
圖7 1979-2018年觀測站點(diǎn)及Grid、ERA5、NCEP2插值到站點(diǎn)日降雨量標(biāo)準(zhǔn)差空間分布
從不同區(qū)域內(nèi)、不同降雨數(shù)據(jù)的標(biāo)準(zhǔn)差區(qū)域平均直方圖來看(圖8),1區(qū)內(nèi),Grid數(shù)據(jù)的標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)十分接近;2區(qū)內(nèi)Grid數(shù)據(jù)也最為接近觀測站點(diǎn)數(shù)據(jù);3區(qū)和4區(qū)內(nèi),ERA5的標(biāo)準(zhǔn)差明顯低于觀測站點(diǎn),Grid的標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)更接近。
圖8 1979-2018 年觀測站點(diǎn)、Grid、ERA5、NCEP2 1~4區(qū)日標(biāo)準(zhǔn)差區(qū)域平均值
綜上,從標(biāo)準(zhǔn)差分析來看,Grid數(shù)據(jù)總體上、各分區(qū)內(nèi)與觀測站點(diǎn)數(shù)據(jù)最接近,Grid數(shù)據(jù)平均變化程度優(yōu)于ERA5和NCEP2數(shù)據(jù)。
為進(jìn)一步對比Grid數(shù)據(jù)和觀測數(shù)據(jù),計(jì)算了大渡河整個流域和1~4區(qū)的面雨量在2008-2018年的逐日時(shí)間序列(圖略)。用皮爾遜相關(guān)系數(shù)來表征Grid數(shù)據(jù)與觀測資料的相關(guān)性,Grid數(shù)據(jù)的多個時(shí)間序列與觀測資料相比,大多數(shù)相關(guān)系數(shù)都在0.9以上。從全流域來看,Grid數(shù)據(jù)除2008年和觀測的相關(guān)系數(shù)<0.9外,其余年份都>0.9,部分年份>0.95,甚至等于0.99。此外,在降雨較少的1-3月及11月和12月,Grid數(shù)據(jù)也能較好地展示大渡河全流域和各分區(qū)的降雨變化,Grid數(shù)據(jù)和觀測的降雨在降雨較少期也基本吻合。因此,從全流域和1~4分區(qū)的面雨量時(shí)間序列來看,Grid數(shù)據(jù)和觀測值也比較接近。
大渡河流域的復(fù)雜地形,導(dǎo)致在該區(qū)域內(nèi)的氣象觀測站點(diǎn)分布不均,致使其在流域內(nèi)的降雨無法完全通過常規(guī)意義的觀測站點(diǎn)觀測得到,因此需要精度更高的數(shù)據(jù)集來展示大渡河流域的降雨?duì)顩r。對大渡河流域觀測站點(diǎn)、Grid、ERA5和NCEP2數(shù)據(jù)在日尺度上,分別對比評估4套數(shù)據(jù)在大渡河流域的適用性。其主要結(jié)論如下:
(1)Grid數(shù)據(jù)的分辨率達(dá)到0.1°,基本能完整地展示出大渡河流域的日均降雨分布,總體上的降雨分布和觀測站點(diǎn)基本一致,在每個區(qū)域內(nèi)的降雨分布和觀測站點(diǎn)展示出的降雨量基本吻合。
(2)Grid數(shù)據(jù)插值站點(diǎn)的數(shù)據(jù)優(yōu)于ERA5和NCEP2數(shù)據(jù),降雨量量級與觀測站點(diǎn)數(shù)據(jù)差距小,且整個區(qū)域內(nèi)的降雨量變化趨勢與觀測站點(diǎn)數(shù)據(jù)基本一致。
(3)從標(biāo)準(zhǔn)差來看,Grid數(shù)據(jù)在各站點(diǎn)上的標(biāo)準(zhǔn)差與觀測站點(diǎn)數(shù)據(jù)的標(biāo)準(zhǔn)差基本一致,北部的日降雨量標(biāo)準(zhǔn)差小變化較小,南部的日降雨量標(biāo)準(zhǔn)差大變化大。從標(biāo)準(zhǔn)差分布的整體來看,EAR5和NCEP2數(shù)據(jù)對大渡河流域的降雨表現(xiàn)不如高分辨率的Grid數(shù)據(jù)。
(4)從均方根誤差來看,Grid數(shù)據(jù)的誤差要明顯小于ERA5和NCEP2數(shù)據(jù)集。
(5)從標(biāo)準(zhǔn)差和均方根誤差兩方面綜合來看,Grid數(shù)據(jù)在日均降雨量空間分布、日均面雨量、日降雨量RMSE和日降雨量標(biāo)準(zhǔn)差上和觀測值比較接近;從全流域和1~4分區(qū)的面雨量時(shí)間序列來看,Grid數(shù)據(jù)和觀測值也比較接近??傊?Grid數(shù)據(jù)能較好地反映大渡河流域的實(shí)際降雨情況。