王 佳,李 瓊,魏加華,3*
(1.青海大學(xué)水利電力學(xué)院,青海 西寧 810016;2.三江源生態(tài)與高原農(nóng)牧業(yè)國(guó)家重點(diǎn)實(shí)驗(yàn)室,青海大學(xué), 青海 西寧 810016;3.清華大學(xué)水沙科學(xué)與水利水電工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100084)
大氣可降水量(Precipitable Water Vapor,PWV)表示地面至大氣頂界垂直空氣柱中全部水汽凝結(jié)后在氣柱底面上形成的液態(tài)水深度[1]。PWV作為水汽含量的衡量標(biāo)準(zhǔn),對(duì)監(jiān)測(cè)及預(yù)報(bào)全球或局地氣候變化及中小尺度惡劣天氣至關(guān)重要[2-5]。無(wú)線電探空儀、GNSS(Global Navigation Satellite System,GNSS)和遙感探測(cè)是大氣可降水量觀測(cè)的主要手段。無(wú)線電探空儀精度高,但時(shí)間分辨率較低,多用于精度的驗(yàn)證;GNSS具有高精度、低費(fèi)用、時(shí)間分辨率高的優(yōu)勢(shì)[6-9],但空間分辨率受地面觀測(cè)站點(diǎn)密度的影響較大。遙感衛(wèi)星探測(cè)數(shù)據(jù)覆蓋廣,空間分辨率較高。MODIS水汽產(chǎn)品空間分辨率可達(dá)到1 km[10-11],但其受天氣條件與搭載的傳感器性能等影響精度有限[12],需要進(jìn)一步的精度校正。
結(jié)合地基探測(cè)數(shù)據(jù)對(duì)遙感水汽產(chǎn)品進(jìn)行校正,以獲得更高時(shí)空分辨率、更高精度的數(shù)據(jù)是目前大氣可降水量數(shù)據(jù)獲取的一種有效方式。曹艷豐等[13]、方圣輝等[14]研究了不同區(qū)域GNSS PWV數(shù)據(jù)與MODIS PWV數(shù)據(jù)間的線性關(guān)系,并建立了回歸模型,對(duì)MODIS PWV數(shù)據(jù)進(jìn)行校正并獲得了高精度的可降水量數(shù)據(jù)。但由于影響可降水量的因素較多,簡(jiǎn)單的線性回歸模型在地形復(fù)雜區(qū)域適用性會(huì)降低。神經(jīng)網(wǎng)絡(luò)模型具有很強(qiáng)的容錯(cuò)性以及自學(xué)習(xí)、自組織與自適應(yīng)能力,可以模擬復(fù)雜的非線性映射,使得環(huán)境噪聲(氣溶膠、云等)的影響降到最低。
獲得高精度且連續(xù)的可降水量數(shù)據(jù),對(duì)研究區(qū)域氣候的變化,評(píng)估降水潛力具有非常重要的作用。本文采用線性回歸與BP(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)方法,建立利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)的模型,并利用探空數(shù)據(jù)檢驗(yàn)?zāi)P偷男UЧ?/p>
青海省位于中國(guó)西北地區(qū)中南部,青藏高原東北部,處于氣候變化的敏感區(qū)。氣候類型復(fù)雜多樣,具有明顯的高原氣候特征,寒冷干燥,太陽(yáng)輻射強(qiáng),氣溫日較差較大[15]。青海省復(fù)雜的下墊面對(duì)地氣間能量和水分交換過(guò)程有重要影響,從而影響水汽的時(shí)空分布變化。
研究采用的數(shù)據(jù)包括無(wú)線電探空數(shù)據(jù)、地基GNSS反演的PWV數(shù)據(jù)和MODIS PWV數(shù)據(jù)(2016年)。無(wú)線電探空站在青海省內(nèi)有玉樹、西寧、格爾木和都蘭4個(gè)站點(diǎn),每日觀測(cè)兩次,數(shù)據(jù)來(lái)源于懷俄明大學(xué)(http://weather.uwyo.edu/wyoming/),用SOUNDING表示。地基GNSS站在青海省內(nèi)有15個(gè)連續(xù)運(yùn)行的站點(diǎn),時(shí)間分辨率為1 h,數(shù)據(jù)來(lái)源于中國(guó)地震局GNSS數(shù)據(jù)產(chǎn)品服務(wù)平臺(tái)(http://www.cgps.ac.cn)。無(wú)線電探空站和GNSS站點(diǎn)具體信息如表1所示。
表1 地面站點(diǎn)信息Tab.1 Information of ground station
MODIS數(shù)據(jù)來(lái)自EOS系列衛(wèi)星中TERRA衛(wèi)星上搭載的中分辨率光譜成像儀反演得到的MOD05產(chǎn)品,數(shù)據(jù)下載地址為https://modis.gsfc.nasa.gov/。研究使用的近紅外水汽產(chǎn)品空間分辨率為1 km×1 km,每天只有1幅觀測(cè)圖像,本研究選取GNSS與MODIS時(shí)間相匹配的數(shù)據(jù)。
1.2.1 線性回歸分析法 線性回歸是利用數(shù)理統(tǒng)計(jì)中回歸分析的方法,來(lái)確定兩種或兩種以上變量間相互依賴的定量關(guān)系,被廣泛應(yīng)用于氣象水文領(lǐng)域[16]。對(duì)MODIS PWV進(jìn)行校正時(shí),以月為尺度進(jìn)行模型構(gòu)建,式(1)為本研究采用的線性回歸模型表達(dá)式:
PWVGNSS=PWVMODIS×a+b
(1)
式中:PWVGNSS、PWVMODIS分別為GNSS PWV的值與MODIS PWV的值,a為模型系數(shù),b為常數(shù)。
1.2.2 BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)又被稱為誤差反向傳播神經(jīng)網(wǎng)絡(luò),是一種多層的前向神經(jīng)網(wǎng)絡(luò)[17-18],具有自適應(yīng)學(xué)習(xí)性,可以模擬輸入—輸出間的非線性關(guān)系,減少缺測(cè)值對(duì)模型的影響。本文以GNSS站點(diǎn)經(jīng)緯度為中心,篩選3×3窗口范圍內(nèi)的MODIS PWV與相應(yīng)的GNSS PWV進(jìn)行匹配,建立數(shù)據(jù)集,并將其以7∶3的比例隨機(jī)抽取分為訓(xùn)練集與測(cè)試集。如圖3所示,以對(duì)應(yīng)的MODIS PWVn及其經(jīng)緯度(lonn,latn)為輸入,經(jīng)輸入層i,根據(jù)權(quán)值W(i,j)和隱藏層閾值a,計(jì)算得到隱藏層j的輸出Zq。再經(jīng)由權(quán)值V(j,k)和輸出層閾值b計(jì)算得到神經(jīng)網(wǎng)絡(luò)預(yù)期輸出,與期望輸出GNSS PWV及其經(jīng)緯度(lon′,lat′)比較并計(jì)算網(wǎng)絡(luò)預(yù)測(cè)誤差,根據(jù)計(jì)算得來(lái)的誤差更新權(quán)值和閾值,直到誤差減小到預(yù)期范圍,結(jié)束迭代,網(wǎng)絡(luò)訓(xùn)練結(jié)束。另外,為了減少數(shù)據(jù)之間量級(jí)的差異對(duì)網(wǎng)絡(luò)精度的影響,在訓(xùn)練前先將數(shù)據(jù)進(jìn)行歸一化。
Wang等[19]利用GNSS PWV對(duì)MODIS PWV數(shù)據(jù)的精度做過(guò)驗(yàn)證,表明GNSS PWV與MODIS PWV間存在良好的相關(guān)性且GNSS PWV精度更高,但GNSS PWV的空間分辨率不足;而MODIS PWV空間連續(xù)且覆蓋范圍大,但精度略差。本文利用玉樹(QHYS)、格爾木(QHGE)、西寧(XNIN)和都蘭(QHDL)4個(gè)無(wú)線電探空站點(diǎn)數(shù)據(jù)計(jì)算GNSS PWV與MODIS PWV數(shù)據(jù)的均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRE)和相關(guān)系數(shù)(r)對(duì)青海省內(nèi)的GNSS PWV與MODIS PWV做簡(jiǎn)單的精度評(píng)估。
根據(jù)表2中計(jì)算得到各個(gè)站點(diǎn)的誤差可以發(fā)現(xiàn),GNSS PWV數(shù)據(jù)平均偏差為1~2 mm,相關(guān)系數(shù)除都蘭站外均為0.9~1,顯示GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)之間較強(qiáng)的相關(guān)性。而MODIS PWV數(shù)據(jù)相較GNSS PWV數(shù)據(jù)整體偏差較大,平均偏差為1~6 mm,存在校正的必要性。
表2 GNSS PWV與MODIS PWV原始數(shù)據(jù)精度評(píng)估表Tab.2 Accuracy evaluation of original data of GNSS PWV and MODIS PWV
如圖2所示,4個(gè)站點(diǎn)的GNSS PWV與探空數(shù)據(jù)相關(guān)性高,存在良好的線性關(guān)系,玉樹,格爾木,西寧3個(gè)站點(diǎn)GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)在30 mm以下均保持著很強(qiáng)的相關(guān)性,但都蘭站GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)僅在10 mm以下的相關(guān)性比較強(qiáng),這與都蘭站的觀測(cè)受到氣候影響有關(guān)。而相對(duì)于GNSS PWV而言,圖3中MODIS PWV數(shù)據(jù)與探空數(shù)據(jù)的相關(guān)性整體偏弱,說(shuō)明MODIS PWV數(shù)據(jù)較GNSS PWV數(shù)據(jù)偏差大,精度低。
為了檢驗(yàn)GNSS PWV與MODIS PWV的相關(guān)性,從15個(gè)GNSS站點(diǎn)中隨機(jī)選取幾個(gè)站點(diǎn)研究各站點(diǎn)之間PWV的趨勢(shì)變化及相關(guān)性(圖4)。
在圖4a中,選取站點(diǎn)為德令哈、格爾木和西寧,可以看出,這些站點(diǎn)的MODIS PWV與GNSS PWV變化趨勢(shì)基本相同,都呈現(xiàn)中間(夏季)高,兩邊(冬季)低的特征。由圖4b至圖4d可知,德令哈、西寧和沱沱河單個(gè)站點(diǎn)的GNSS PWV與各自對(duì)應(yīng)區(qū)域的MODIS PWV均有良好的相關(guān)性。由此得出,MODIS PWV數(shù)據(jù)與GNSS PWV數(shù)據(jù)之間整體都有比較好的相關(guān)性,為利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)提供了基礎(chǔ)。
GNSS數(shù)據(jù)存在缺失情況,剔除缺測(cè)值后,將15個(gè)地基GNSS站2016年的數(shù)據(jù)與MODIS PWV數(shù)據(jù)按月匹配,根據(jù)式(1)中的方法,計(jì)算系數(shù),得到基于最小二乘法的各月的回歸模型(表3)。
表3 逐月回歸模型Tab.3 Monthly regression model
本文在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模時(shí),根據(jù)MODIS PWV與GNSS PWV數(shù)據(jù)的特性,利用站點(diǎn)的GNSS PWV校正部分區(qū)域內(nèi)的MODIS PWV。神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建主要有以下幾個(gè)步驟:
(1)數(shù)據(jù)的導(dǎo)入與劃分。根據(jù)融合數(shù)據(jù)的特性,以GNSS PWV數(shù)據(jù)的經(jīng)緯度為中心的,將需要校正的數(shù)據(jù)(MODIS PWV)與目標(biāo)數(shù)據(jù)(GNSS PWV)根據(jù)經(jīng)緯度匹配,建立數(shù)據(jù)集,并按照訓(xùn)練數(shù)據(jù)70%,測(cè)試數(shù)據(jù)30%的比例進(jìn)行劃分。
(2)確定隱藏層個(gè)數(shù)。輸入層神經(jīng)元設(shè)定為9,輸出層神經(jīng)元為1。隱藏層神經(jīng)元個(gè)數(shù)根據(jù)經(jīng)驗(yàn)公式確定取值范圍為[3,13],經(jīng)過(guò)測(cè)試并考慮到模型的復(fù)雜度且避免過(guò)擬合的需求,最終確定隱藏層神經(jīng)元個(gè)數(shù)為10。
(3)網(wǎng)絡(luò)初始化。給各連接權(quán)值分別賦值(-1,1)之間的隨機(jī)數(shù),設(shè)定激活函數(shù)為sigmod函數(shù),損失函數(shù)應(yīng)用RMSE函數(shù)。最后經(jīng)過(guò)調(diào)整學(xué)習(xí)率μ為1.5,控制誤差ε在0.05范圍內(nèi)。
利用玉樹、西寧、格爾木、都蘭4個(gè)探空站數(shù)據(jù)對(duì)兩組模型校正后的MODIS PWV數(shù)據(jù)進(jìn)行評(píng)價(jià),分析其校正效果。由圖5可以看出利用兩種模型得到的校正后數(shù)據(jù)的均方根誤差與平均絕對(duì)誤差皆逐漸減小。
由表4可以看出,線性回歸結(jié)果中玉樹、西寧、格爾木3個(gè)站點(diǎn)較都蘭效果更好,均方根誤差平均降低了1.24 mm,平均絕對(duì)誤差平均降低了1.1 mm,平均相對(duì)誤差平均降低了13%。整體校正效果較好,但在都蘭地區(qū)校正效果不太明顯,均方根誤差降低了0.6 mm,平均絕對(duì)誤差降低了0.47 mm,平均相對(duì)誤差降低了僅4%??紤]到青海地區(qū)地理面積大,但站點(diǎn)稀疏、站點(diǎn)間海拔相差較大,對(duì)線性回歸模型存在影響。所以在不同站點(diǎn)上對(duì)MODIS PWV數(shù)據(jù)的校正結(jié)果存在一定差異性。從計(jì)算結(jié)果來(lái)看,線性回歸校正模型在青海地區(qū)對(duì)數(shù)據(jù)的精度提升有一定的效果,但是,BP神經(jīng)網(wǎng)絡(luò)模型校正后的MODIS PWV數(shù)據(jù)精度評(píng)價(jià)效果更好,與未校正前的數(shù)據(jù)相比,均方根誤差平均降低了2.46 mm,平均絕對(duì)誤差平均降低了0.947 mm,平均相對(duì)誤差平均降低了19.25%??傊哂凶赃m應(yīng)性的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)MODIS PWV數(shù)據(jù)的校正效果更好。
表4 MODIS數(shù)據(jù)校正前后精度評(píng)價(jià)表Tab.4 Accuracy evaluation of MODIS data before and after correction
大氣可降水量反映了區(qū)域水汽條件和降水潛力。青海省地域廣闊,地形復(fù)雜,大氣可降水量差異顯著,獲得高精度且空間連續(xù)的大氣可降水量對(duì)區(qū)域生態(tài)、農(nóng)業(yè)生產(chǎn)、水資源管理等具有重要意義。方圣輝等[14]僅根據(jù)4個(gè)地面站點(diǎn)對(duì)全國(guó)范圍的大氣可降水量建立了線性回歸分析模型,僅僅提高了精度并不能反映連續(xù)的空間變化。而曹艷豐等[13]、王茜雯等[20]利用地面站點(diǎn)數(shù)據(jù)分別對(duì)美國(guó)及香港地區(qū)GNSS站點(diǎn)密集區(qū)域的MODIS PWV建立了線性回歸校正模型,表明線性回歸校正模型在地面站點(diǎn)密集的區(qū)域有良好的校正效果,但針對(duì)青海省這種地貌復(fù)雜,站點(diǎn)稀疏的區(qū)域,線性回歸模型的效果尚未確定。因此本文通過(guò)對(duì)青海省GNSS的資料進(jìn)行處理分析,利用不同觀測(cè)手段之間可降水量數(shù)據(jù)的相關(guān)性,分別應(yīng)用線性回歸方法與BP神經(jīng)網(wǎng)絡(luò)方法結(jié)合GNSS PWV數(shù)據(jù)對(duì)MODIS PWV數(shù)據(jù)進(jìn)行校正研究,依據(jù)校正后的數(shù)據(jù),分析兩種模型在站點(diǎn)稀疏區(qū)域的校正效果,得到以下結(jié)論:
(1)利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)是行之有效的,線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型得到的結(jié)果精度均在毫米級(jí)以內(nèi),可以應(yīng)用到后續(xù)的研究中;
(2)BP神經(jīng)網(wǎng)絡(luò)模型效果好于線性回歸模型,應(yīng)用四個(gè)無(wú)線探空站點(diǎn)數(shù)據(jù)對(duì)結(jié)果進(jìn)行檢驗(yàn),平均相對(duì)誤差整體上由3.24 mm減少到2.35 mm,精度提升了27%,說(shuō)明神經(jīng)網(wǎng)絡(luò)方法能更好地?cái)M合GNSS PWV數(shù)據(jù)與MODIS PWV數(shù)據(jù)之間的關(guān)系,對(duì)MODIS PWV的校正效果更好。
本文僅對(duì)MODIS PWV的精度提升進(jìn)行了研究,獲得了高精度空間連續(xù)的可降水量數(shù)據(jù)集,但水汽變化快速?gòu)?fù)雜。因此,在下一步的研究中將著重提高M(jìn)ODIS PWV的時(shí)間連續(xù)性,在時(shí)間尺度上分析其變化規(guī)律,為臨近預(yù)報(bào)和人工降雨等提供有力支撐。