楊 飛,郭際明,陳 明,章 迪
1. 中國礦業(yè)大學(xué)(北京)地球科學(xué)與測繪工程學(xué)院,北京 100083; 2. 武漢大學(xué)測繪學(xué)院,湖北 武漢 430079; 3. 國家基礎(chǔ)地理信息中心, 北京 100830
隨著GPS氣象學(xué)概念的提出[1],學(xué)者們一直致力于開發(fā)和改進(jìn)基于GNSS反演大氣可降水量的方法,這使得GNSS成為一種高效、可靠的水汽遙感技術(shù),它具有全天時(shí)、全天候、連續(xù)運(yùn)行、低成本、高分辨率及高精度等優(yōu)點(diǎn)[2-5]。在獲取大氣可降水量PWV時(shí),需要將天頂濕延遲乘以轉(zhuǎn)換因子,它是加權(quán)平均溫度Tm的一個(gè)函數(shù)[6]。因此,準(zhǔn)確計(jì)算Tm是GNSS獲取高精度大氣可降水量的關(guān)鍵。Tm是測站上空的溫度和濕度廓線沿著天頂方向的數(shù)值積分,可以通過無線電探空、大氣再分析資料精確計(jì)算。然而,全球探空測站分布稀疏,空間分辨率難以滿足GNSS氣象學(xué)需求;大氣再分析資料的時(shí)間分辨率較低且通常每月更新一次;難以滿足實(shí)時(shí)/近實(shí)時(shí)Tm計(jì)算的要求[7-8]。
文獻(xiàn)[1]收集了位于27°N~65°N之間的13個(gè)美國探空測站數(shù)據(jù)并對8718個(gè)探空剖面進(jìn)行分析,發(fā)現(xiàn)Tm與地表溫度Ts存在很好的線性關(guān)系,建立了Bevis公式,成為當(dāng)前使用最為廣泛的Tm線性回歸模型。雖然Ts的地理和季節(jié)變化可以反映出Tm的地理和季節(jié)變化,但基于北美探空數(shù)據(jù)建立的Bevis公式往往存在區(qū)域性的精度差異。因此,學(xué)者們進(jìn)行了大量研究來建立Tm和Ts的區(qū)域線性回歸模型[9-14]。此外,只須測站位置和時(shí)間信息的經(jīng)驗(yàn)?zāi)P椭饾u成為Tm計(jì)算的主要方法。文獻(xiàn)[15]利用2005—2009年全球135個(gè)探空測站數(shù)據(jù),基于全球氣壓和溫度(GPT)模型構(gòu)建了GWMT模型,并通過優(yōu)化建模方法和改善建模源數(shù)據(jù)提出了一系列改善模型,如GTm-Ⅱ、GTm-Ⅲ、GWMT-Ⅳ、GTM-X及GWMT-D[16-20]。文獻(xiàn)[21]考慮了緯度和海拔變化,利用滑動窗口算法建立了GGTm模型。文獻(xiàn)[22]提出了考慮線性趨勢、年變化、半年變化及空間變化的GTrop模型。此外,經(jīng)驗(yàn)對流層模型GPT3和UNB3m同樣可以提供Tm估值[23-24]。由于開源、易操作、網(wǎng)格分辨率及精度高且可以提供其他對流層參數(shù),GPT3模型成為當(dāng)前使用最為廣泛的Tm經(jīng)驗(yàn)?zāi)P汀?/p>
研究表明Tm經(jīng)驗(yàn)?zāi)P途韧陀赥m回歸模型[25-27]。為了提高經(jīng)驗(yàn)?zāi)P凸烙?jì)Tm的精度,本文提出一種Tm經(jīng)驗(yàn)?zāi)P偷木椒?,它引入地面氣溫?cái)?shù)據(jù)并通過最小二乘方法快速獲取精化系數(shù),達(dá)到對Tm的誤差補(bǔ)償作用。相較基于機(jī)器學(xué)習(xí)等精化方法,本文方法計(jì)算公式簡便,可以快速推廣至任意Tm經(jīng)驗(yàn)?zāi)P?,達(dá)到模型精化的目的,對改善GNSS水汽反演精度有重要的現(xiàn)實(shí)意義。
加權(quán)平均溫度Tm是由測站上空的水汽壓和氣溫在天頂方向的數(shù)值積分計(jì)算得到的,文獻(xiàn)[28—29]給出了Tm的定義及精確計(jì)算Tm的方法
(1)
式中,T是大氣溫度,單位為K;e是水汽壓,單位為hPa;z為測站上空的垂直高度,單位為m。在常規(guī)的探空數(shù)據(jù)資料中,上述氣象參數(shù)及高程信息均不是連續(xù)值,往往以高度分層的形式存儲。因此,式(1)的離散化形式常用于Tm的精確計(jì)算
(2)
式中,下標(biāo)i代表第i層的氣象參數(shù)信息。
Bevis模型是基于美國13個(gè)無線電探空站2 a的觀測資料,共8712條探空廓線建立起來的Tm與Ts線性回歸模型
Tm=70.2+0.72·Ts
(3)
基于10 a的ECMWF再分析資料的37個(gè)氣壓層月平均數(shù)據(jù),文獻(xiàn)[23]提出了GPT3模型。作為GPT系列模型的最新版本,GPT3模型可以提供全球范圍內(nèi)1°×1°格網(wǎng)點(diǎn)上加權(quán)平均溫度的平均值、年周期和半年周期變化。依據(jù)測站位置和時(shí)間信息,可以利用式(4)快速獲取其Tm估值
(4)
式中,A0表示模型格網(wǎng)點(diǎn)Tm的平均值;A1和B1表示模型格網(wǎng)點(diǎn)Tm的年振幅;A2和B2表示其半年振幅。
由于GPT3模型的建模源是月平均數(shù)據(jù),其模型只包含年和半年周期項(xiàng),缺乏表示Tm隨高程變化的Tm遞減率參數(shù),其精度往往受到限制。通過對實(shí)測Tm與GPT3估計(jì)Tm的差異和實(shí)測Ts與GPT3估計(jì)Ts的差異進(jìn)行分析,其線性相關(guān)系數(shù)達(dá)到了0.62,如圖1所示(使用第2節(jié)試驗(yàn)中的數(shù)據(jù))。因此,本文提出一種GPT3模型估計(jì)Tm的精化方法,它將地面氣溫?cái)?shù)據(jù)引入并利用最小二乘獲取精化系數(shù)。具體地,該精化模型如式(5)所示
Tm=TmGPT3+M·(Ts-TsGPT3)
(5)
式中,Tm和Ts分別為加權(quán)平均溫度真值和地表溫度真值;TmGPT3和TsGPT3分別表示由GPT3模型估計(jì)得到的加權(quán)平均溫度和地表溫度;M表示實(shí)測地表溫度和模型估計(jì)地表溫度差異的權(quán)值,即精化模型的精化系數(shù),可以通過最小二乘擬合得到。
圖1 Tm差異與Ts差異示意圖(實(shí)測值與GPT3估值)Fig.1 The diagram of Tm differences and Ts differences (measured values and GPT3 estimates)
本文選擇2011—2015年我國與鄰近區(qū)域的探空站點(diǎn)資料,以及對應(yīng)的地面氣象資料進(jìn)行GPT3模型區(qū)域精化。探空數(shù)據(jù)分辨率為12 h,即每天固定在UTC 0:00和UTC 12:00。探空剖面包括了不同高度的氣壓、溫度等氣象信息。為了計(jì)算準(zhǔn)確的Tm,需對探空剖面信息進(jìn)行嚴(yán)格的質(zhì)量控制,只有滿足以下條件的剖面數(shù)據(jù)才可以用式(2)計(jì)算Tm[26]:①探空數(shù)據(jù)中最后一個(gè)有效記錄的高度不低于10 km;②探空數(shù)據(jù)中有效的觀測值數(shù)量不少于20個(gè);③兩個(gè)連續(xù)高度層之間的高差應(yīng)不超過1 km;④任何兩個(gè)連續(xù)高度層的氣壓差值不大于200 hPa。
經(jīng)過質(zhì)量控制,本文選取我國及鄰近區(qū)域180個(gè)探空測站,其范圍為0°N~65°N,60°E~145°E,如圖2所示。圖2(a)表示用于模型精化的130個(gè)探空測站的分布情況。通過GPT3模型,利用雙線性內(nèi)插算法并考慮測站與模型格網(wǎng)點(diǎn)高程差異,可以獲取這些測站的Tm和Ts估值[23]。聯(lián)合探空測站數(shù)據(jù)獲取的精確加權(quán)平均溫度和地表溫度,便可利用式(5)擬合得到本文中模型精化系數(shù)M=0.47,構(gòu)建基于GPT3的精化模型。圖2(b)表示用于模型精度檢驗(yàn)的50個(gè)探空測站分布。
圖2 研究區(qū)域及測站分布Fig.2 The map of the research area and the distribution of the sites
為了驗(yàn)證所提精化模型的優(yōu)勢,本文還利用上述130個(gè)探空測站的地面氣溫和加權(quán)平均溫度信息,基于Beivs模型的思路,構(gòu)建了上述研究區(qū)域的Tm-Ts線性模型。區(qū)域線性模型表達(dá)為Tm=53.45+0.78·Ts。因此,本文比較了4種模型在我國及鄰近區(qū)域估計(jì)Tm的精度。它們分別為Bevis模型、區(qū)域線性模型、GPT3模型和基于GPT3的精化模型。本文選取3個(gè)統(tǒng)計(jì)量,即均方根誤差(RMSE)、平均絕對誤差(MAE)及相關(guān)系數(shù)(R)作為標(biāo)準(zhǔn)來比較和評價(jià)4種模型估計(jì)Tm的精度。
利用上述4種模型,分別計(jì)算50個(gè)驗(yàn)證測站2011—2015年不同時(shí)刻的Tm,共141 110個(gè)數(shù)據(jù)。將探空剖面信息計(jì)算的相應(yīng)時(shí)刻Tm作為參考值,繪制了散點(diǎn)圖,如圖3所示。圖中虛線表示1∶1的直線,直線表示模型Tm估值與Tm真值的線性擬合直線??梢园l(fā)現(xiàn),基于GPT3的精化模型表現(xiàn)優(yōu)于其他3種模型,其點(diǎn)分布在擬合線附近的密度高于其他模型,且其斜率達(dá)到了0.93。相較于Bevis模型,區(qū)域線性模型的點(diǎn)位分布密度沒有明顯差別,但其擬合斜率得到有效改善,說明構(gòu)建局部區(qū)域Tm-Ts線性模型可以提高Tm估計(jì)精度。注意到GPT3模型估計(jì)的Tm有明顯的界限(圖中方框位置),即無論真實(shí)Tm值變得多小或多大,GPT3估計(jì)的Tm值總為243 K或290 K左右。而基于GPT3的精化模型較好地解決了這一問題,使其可以準(zhǔn)確估計(jì)任何范圍的Tm值。
圖3 4種模型Tm估計(jì)值與Tm真值的散點(diǎn)圖Fig.3 The scatter plots of the estimated Tm against the true Tm with four models
此外,利用4種模型估計(jì)Tm的殘差計(jì)算了它們各自的MAE和RMSE,不同模型估計(jì)Tm與Tm真值的相關(guān)系數(shù)R也被統(tǒng)計(jì),并列于表1。GPT3模型表現(xiàn)最差,其MAE、RMSE和R分別為3.43 K、4.46 K和0.94?;贕PT3的精化模型不僅有效改善了GPT3模型的精度,也優(yōu)于基于Tm-Ts線性關(guān)系的區(qū)域模型的精度。相較于其他3種模型,基于GPT3的精化模型對MAE和RMSE的改善量分別達(dá)到了0.53、0.68、0.38 K和0.68、0.94、0.55 K。
表1 4種模型估計(jì)Tm殘差的統(tǒng)計(jì)
為了分析4種模型在不同區(qū)域估計(jì)Tm的表現(xiàn),計(jì)算并統(tǒng)計(jì)了每種模型在每1個(gè)驗(yàn)證測站估計(jì)Tm與Tm真值的殘差。圖4展示了4種模型估計(jì)Tm在各個(gè)測站RMSE的空間分布??梢钥吹剑?種模型估計(jì)Tm的精度都會受到緯度的影響,即隨著緯度的增大精度變差。Bevis模型、GPT3模型和區(qū)域線性模型在中高緯度地區(qū)估計(jì)Tm的精度都較差,甚至出現(xiàn)大量RMSE>6 K的測站。受限于GPT3模型本身在中高緯度較差的表現(xiàn)及Tm在中高緯度區(qū)域的變化和波動較大,基于GPT3的精化模型估計(jì)Tm的精度也存在緯度上的差異。但是,依然可以看到基于GPT3的精化模型顯著改善了其在中高緯度區(qū)域估計(jì)Tm的精度,其對Tm精度的改善率與其他區(qū)域是一致的。另外,基于GPT3的精化模型在其他緯度區(qū)域測站的表現(xiàn)同樣優(yōu)于其他3種模型。
圖4 4種模型估計(jì)Tm的RMSE在不同測站空間分布Fig.4 The spatial distribution of RMSE at each site for the four models
表2統(tǒng)計(jì)了4種模型在不同測站估計(jì)Tm的MAE和RMSE,包括最大值、最小值和平均值??梢钥吹剑琈AE和RMSE的最大數(shù)值都出現(xiàn)在Bevis模型,說明Bevis模型難以服務(wù)于全球或大區(qū)域的Tm估計(jì),在某些測站會出現(xiàn)較大誤差。注意到GPT3模型RMSE和MAE的最大值和最小值都小于Bevis模型和區(qū)域線性模型的相應(yīng)統(tǒng)計(jì)量。這表明該測站的Tm變化與建立的整個(gè)區(qū)域Tm-Ts線性關(guān)系不符,需要更加具體、范圍更小的區(qū)域線性模型。而基于GPT3的精化模型的所有統(tǒng)計(jì)量都是4種模型中最小的,其中MAE和RMSE的平均值分別為2.71 K和3.44 K,改善量分別達(dá)到了17.1%、20.1%、13.1%和16.7%、20.7%、13.4%。
表2 4種模型在不同測站的精度統(tǒng)計(jì)
為了分析4種模型估計(jì)不同時(shí)刻Tm的精度情況,本文計(jì)算并統(tǒng)計(jì)了2011—2015年不同模型在每天的RMSE,其時(shí)間序列如圖5所示??梢钥吹?,4種模型的RMSE表現(xiàn)出明顯的周期性,在冬季總體較大,夏季較小。這是由于Tm本身季節(jié)幅度的差異造成,冬季Tm幅度大,往往會使得Tm建模結(jié)果變差,導(dǎo)致較大的RMSE?;贕PT3的精化模型得到的RMSE時(shí)間序列明顯優(yōu)于其他3種模型,幾乎每天都可獲得最小的RMSE。進(jìn)一步,表3詳細(xì)給出了不同模型在4個(gè)季節(jié)估計(jì)Tm的RMSE??梢钥吹?,基于GPT3的精化模型在不同季節(jié)的RMSE分別為3.83、3.01、3.69、4.06 K,相較于GPT3模型,不同季節(jié)的改善量分別達(dá)到1.07、0.87、0.85、0.85 K。
表3 4種模型在不同季節(jié)估計(jì)Tm的RMSE
圖5 4種模型在不同時(shí)刻的RMSE序列Fig.5 The RMSE of the four models at different days
為了更好地理解精化模型對于GPT3模型精度改善的原因,圖6繪制了GPT3模型和基于GPT3的精化模型在不同測站估計(jì)Tm的時(shí)間序列,且將Tm真值的時(shí)間序列作為參考。圖6選取了6個(gè)不同區(qū)域的測站,這些測站經(jīng)質(zhì)量控制后Tm觀測值的數(shù)量較多。可以看到,在每1個(gè)測站,GPT3模型估計(jì)的Tm都是一條平滑的周期曲線,只能表現(xiàn)出Tm的季節(jié)性變化。而基于GPT3的精化模型在這些測站可以模擬出更復(fù)雜的Tm變化,表現(xiàn)出Tm在短時(shí)間內(nèi)的波動和突變,與探空得到的Tm真值具有更好的一致性。
本文提出一種Tm經(jīng)驗(yàn)?zāi)P途椒?,引入地面氣溫?cái)?shù)據(jù)并通過最小二乘方法快速獲取精化系數(shù),達(dá)到對Tm的誤差補(bǔ)償作用。其計(jì)算公式簡便,可以快速推廣至任意Tm經(jīng)驗(yàn)?zāi)P汀?/p>
基于我國及周邊地區(qū)180個(gè)探空測站,本文開展了區(qū)域GPT3模型精化試驗(yàn)和分析。驗(yàn)證結(jié)果表明,所提出的基于GPT3的精化模型估計(jì)Tm的MAE、RMSE和R分別為2.75 K、3.52 K、0.97,有效改善了GPT3模型的精度,改善量分別為19.9%、21.1%、3.2%;且比基于Tm-Ts關(guān)系的Bevis模型和區(qū)域線性模型精度要高。此外,空間分布分析表明,基于GPT3的精化模型可以改善傳統(tǒng)Tm模型受到緯度的影響,顯著提高高緯度區(qū)域Tm估計(jì)精度;時(shí)間序列分析表明基于GPT3的精化模型在不同年積日都可以獲得最好的Tm估計(jì),且可以有效解決GPT3模型只能表現(xiàn)Tm季節(jié)性變化的缺陷。因此,本文提出的Tm經(jīng)驗(yàn)?zāi)P途椒梢詰?yīng)用到GPT3模型估計(jì)Tm的快速精化中,也可以進(jìn)一步推廣至其他Tm經(jīng)驗(yàn)?zāi)P偷木ぷ髦小?/p>
圖6 模型估計(jì)的Tm和探空Tm在不同測站的時(shí)間序列Fig.6 The Tm time series estimated from the two models and radiosonde observations at different sites