孟令遠(yuǎn)
(煙臺(tái)市水文中心,山東 煙臺(tái) 264000)
煙臺(tái)位于中國東部山東省南部,地理坐標(biāo)介于36°24'~38°23'N、119°18'~121°57'E,行政面積為13 756 km2,其中陸地、海域分別占56.36%、43.64%。屬于暖溫帶半濕潤季風(fēng)氣候,氣候溫和濕潤,年平均氣溫為12.8 ℃,降水量為700 mm,年日照時(shí)數(shù)2 500-2 600 h,無霜期為200-240 d,積溫4 000 ℃~4 200 ℃。受副熱帶季風(fēng)與海陸位置影響,該地降水量分配不均衡,7-9 月降水約占70%以上,具有強(qiáng)度大、集中性特點(diǎn),易受臺(tái)風(fēng)天氣影響。該區(qū)屬魯南山地向黃海過渡帶,海拔介于0~1 548 m,地勢自北向東南傾斜,受地貌影響,區(qū)域河流短促而流速急,流域面積達(dá)1 714 km2,年均徑流量為1.32億m3。
此研究使用的主要數(shù)據(jù)來源是研究區(qū)2019年GPM衛(wèi)星降雨數(shù)據(jù)和地面雨量站資料,數(shù)據(jù)源自GPM 官網(wǎng)氣象站點(diǎn)降雨量數(shù)據(jù)來源于中國氣象局(China Meteorological Administration,CMA)的氣象科學(xué)數(shù)據(jù)中心(http://data.cma.cn/),共收集到研究區(qū)19個(gè)站點(diǎn)資料。
高斯過程回歸(GPR)是一種基于貝葉斯理論的空間插方法,其基本思想是將空間數(shù)據(jù)看作多元高斯分布,通過分析樣本數(shù)據(jù)的各自位置之間的空間相似性,建立出空間位置與對應(yīng)變量之間的協(xié)方差函數(shù),從而根據(jù)觀測數(shù)據(jù)和協(xié)方差函數(shù),計(jì)算未知位置上預(yù)測值和方差。對于變量集合X={x1,x2…xn},設(shè)其滿足高斯(GP)分布,則有:
模型y=f(x)+δ2,δ2=N(0,),y為因變量,δ2為協(xié)方差,對于測試點(diǎn)x*,對應(yīng)的y*的后驗(yàn)分布:
式中:υ*、∑*、In分別為均值、總方差、n維矩陣。經(jīng)研究表明,平方指數(shù)核函數(shù)能夠較好促進(jìn)GPR模型收斂,其形式如下:
利用氣象站點(diǎn)點(diǎn)位提取預(yù)測得到的降水柵格面對應(yīng)位置處降水量y',以地面觀測值為真值y,計(jì)算二者之間相對誤差,進(jìn)而評價(jià)區(qū)域降水量空間預(yù)測精度,計(jì)算公式如下:
式中:y、y'分別是GPR預(yù)測降水量、地面降水量值,i=1,2…n為樣本數(shù)量。R2、MAE和RMSE分別為決定系數(shù)、平均絕對誤差、均方根誤差。
研究區(qū)GPM衛(wèi)星降水資料見圖1,圖中10 km×10 km空間分辨率的GPM 像素值初步描述了區(qū)域降水量分布特征,其最大、最小值分別為802 mm、1 054 mm,空間平均值為894 mm,覆蓋區(qū)域總像素?cái)?shù)為137 個(gè)。但其柵格面呈現(xiàn)明顯機(jī)械性特征,鄰域之間降水量存在不平滑漸變。據(jù)煙臺(tái)19 個(gè)氣象站點(diǎn)2019年降水量統(tǒng)計(jì)特征,其統(tǒng)計(jì)最大值出現(xiàn)在棲霞區(qū)南部,達(dá)1 012 mm,最小值為萊州市西部的795 mm,全部站點(diǎn)平均值為867 mm,離差系數(shù)達(dá)19.49%。并且這些樣點(diǎn)數(shù)據(jù)通過了0.05水平整體分布檢驗(yàn)。
圖1 研究區(qū)GPM降水量特征圖
為評估所選的環(huán)境變量對區(qū)域降水量空間分布預(yù)測的有效性,利用Pearson 相關(guān)性系數(shù)分析了環(huán)境變量與地面觀測降水量之間線性關(guān)系。依圖2可見,除坡向、坡度外,降水量與其他環(huán)境因子之間呈現(xiàn)顯著線性關(guān)系,其中與經(jīng)度、緯度和經(jīng)緯度乘積的相關(guān)性系數(shù)依次達(dá)到-0.49、-0.28、-0.49,表明區(qū)域降水量呈現(xiàn)一定程度自西向東遞增、自南向北減少、自西南向西北遞減的特征,這反映了該地降水分布受海陸位置影響。與DEM呈負(fù)的顯著性關(guān)系,相關(guān)系數(shù)為-0.41,說明海拔高程控制著降水量在局域尺度上分布。而GPM降水量值與地面觀測降水量之間呈極顯著相關(guān)性(P<0.05),相關(guān)系數(shù)為0.51,表明GPM 衛(wèi)星降水量產(chǎn)品在該地具有良好替代性,因此可作為新的有效環(huán)境變量預(yù)測區(qū)域降水量分布。
圖2 環(huán)境變量與地面觀測降水量之間相關(guān)性圖
GPR模型有兩個(gè)超參數(shù):scale,控制高斯核函數(shù)相關(guān)性,決定了樣本之間相似度;degree決定了高斯核函數(shù)在每個(gè)樣本點(diǎn)的方差,即噪聲水平。這些超參數(shù)的組合配置直接影響了模型擬合及預(yù)測能力。為避免過擬合或欠擬合,采用grid方法自動(dòng)化尋優(yōu)(圖3),可見當(dāng)scale 和degree 參數(shù)均取0.1 時(shí),模型RMSE最小,此時(shí)具有良好擬合能力。
圖3 GPR模型超參數(shù)優(yōu)化過程圖
在上述基礎(chǔ)預(yù)測了煙臺(tái)市降水量柵格面,并利用站點(diǎn)降水量進(jìn)行獨(dú)立驗(yàn)證。可見,降水量預(yù)測值與實(shí)際值之間具有良好相關(guān)性,二者隨機(jī)分布于1:1 直線兩側(cè),總體離散度低。具體來看,模型R2達(dá)0.71,MAE和RMSE僅為32.81 mm、39.99 mm,表明GPR算法利用協(xié)變量較好擬合了區(qū)域降水量空間分布規(guī)律,該預(yù)測模型精度擬合能力好,預(yù)測精度可靠。
煙臺(tái)市2019 年降水量空間分布格局,與圖1 中GPM 衛(wèi)星降水量值基本一致。可見,空降尺度上降水量分布范圍介于728~963 mm之間,空間平均值為823 mm,標(biāo)準(zhǔn)差為267 mm,離差系數(shù)僅有32.44%,表明局域降水量分布存在明顯異質(zhì)性。具體來看,東南海岸線地區(qū)降水量偏少反而在海岸線內(nèi)側(cè)產(chǎn)生降水中心。這是由于海洋對降水蒸發(fā)作用,使得海濱風(fēng)向上空空氣中蒸汽含量大,容易形成云團(tuán)而產(chǎn)生降水,但易缺少地表粗糙度對運(yùn)移遲滯影響,進(jìn)而使降水中心偏離海岸。而在內(nèi)陸的煙臺(tái)西部地區(qū)降水量,主要是距海洋水汽較遠(yuǎn)、受西伯利亞高壓控制,加之局部山地阻擋影響,導(dǎo)致空氣濕度較小,降水量相對較少。需指出的是,該分布圖并未出現(xiàn)傳統(tǒng)降水量插值過程中出現(xiàn)機(jī)械性條帶、“牛眼”特征等,在刻畫降水量分布漸變特征方面具有良好平滑性,因而更符合區(qū)域?qū)嶋H。
此研究對煙臺(tái)市2019 年降水量數(shù)據(jù)進(jìn)行空間預(yù)測研究,分析了預(yù)測精度,主要結(jié)論如下:①煙臺(tái)市2019年GPM年降水?dāng)?shù)據(jù)與地面站點(diǎn)觀測數(shù)據(jù)具有良好一致性,整體相關(guān)系數(shù)達(dá)0.51,盡管其空間分辨率粗糙,但初步揭示了區(qū)域降水量分布實(shí)際特征。②基于GPR算法建立的非線性模型可較好擬合降水量與地形、海陸位置因子之間關(guān)系,進(jìn)而幫助預(yù)測區(qū)域其他位置上降水量分布,預(yù)測結(jié)果展示了平滑分布特征,總體可信度較高。③GPR模型的精度R2達(dá)0.71,反映了該算法較好應(yīng)用能力。但文中仍存在不足,首先,文中僅有19 個(gè)站點(diǎn)資料,這在建模時(shí)可能由于樣本數(shù)據(jù)不足導(dǎo)致模型訓(xùn)練不充分而產(chǎn)生不確定性;其次,研究區(qū)下墊面環(huán)境和風(fēng)向強(qiáng)度復(fù)雜,在構(gòu)建降水量預(yù)測模型時(shí)未納入這些因子,進(jìn)而降低了預(yù)測精度。后續(xù)考慮引入其他對區(qū)域降水敏感的環(huán)境協(xié)變量,進(jìn)而建立更復(fù)雜、系統(tǒng)性的預(yù)測模型。