呂潤清,李響
(1.江蘇省氣象臺,江蘇南京 210008;2.國家海洋環(huán)境預(yù)報中心,北京 100081)
人類社會的生產(chǎn)生活與各種天氣/氣候情況密不可分,因此天氣/氣候?qū)W分析是保障社會發(fā)展的重要因素,也面臨巨大的挑戰(zhàn)。高質(zhì)量的氣象數(shù)據(jù)是分析當(dāng)前及過去天氣現(xiàn)象和氣候特征的重要基礎(chǔ)?,F(xiàn)有的氣象觀測資料受地域、時間和觀測儀器的限制,僅覆蓋了部分海洋和極地等地區(qū)[1],其時間和空間的不連續(xù)性無法滿足需求[2]。
20世紀80年代后期,隨著計算機技術(shù)的發(fā)展,基于求解動力方程的天氣數(shù)值預(yù)報模式得到充分應(yīng)用[3]。研究人員利用數(shù)據(jù)同化技術(shù)將各種來源的地面、高空觀測資料與數(shù)值模式的結(jié)果相結(jié)合,得到格點化、連續(xù)長時間序列、高時空分辨率的歷史資料數(shù)據(jù)集,處理后的數(shù)據(jù)集稱為再分析數(shù)據(jù)[4]。再分析數(shù)據(jù)集綜合了傳統(tǒng)觀測數(shù)據(jù)和數(shù)值模式數(shù)據(jù)的優(yōu)點,彌補了單一觀測資料時空分布不均的缺點,增加了數(shù)值結(jié)果的準確性,改進了對大氣物理過程的描述,能夠充分反映氣象要素的多種時空尺度變化特征[5-6],在各種天氣/氣候/海洋研究領(lǐng)域都發(fā)揮著重要作用,如短時間內(nèi)的強對流突發(fā)事件[7]、短期天氣預(yù)報、區(qū)域氣候特征模擬[8]、全球長時間氣候變率、變化的監(jiān)測和研究[9]以及為海洋特征模擬提供驅(qū)動[10]等。
美國、歐洲和日本等國家主要的業(yè)務(wù)/科研部門均開展了全球大氣再分析資料的研究,各類再分析數(shù)據(jù)集的時間跨度和分辨率逐步提高,覆蓋時間尺度從十幾年到一百多年[11]。例如:美國國家環(huán)境預(yù)報中心(National Centers for Environmental Prediction,NCEP)、美國國家大氣研究中心(National Center for Atmospheric Research,NCAR)和美國能 源 部(Department Of Energy,DOE)聯(lián)合發(fā)布的NCEP/NCAR(NCEP1)、NCEP/DOE(NCEP2)、NCEP/CFSR(Climate Forecast System Reanalysis,氣候預(yù)報系統(tǒng)再分析)等數(shù)據(jù)集[12-14];美國國家航空航天局(National Aeronautics and Space Administration,NASA)提供的回顧性分析應(yīng)用數(shù)據(jù)集(Modern-Era Retrospective analysis for Research and Applications,MERRA)[15];歐 洲 中 期 天 氣 預(yù) 報 中 心(European Centre for Medium-range Weather Forecasts,ECMWF)推出的系列再分析數(shù)據(jù):第一個全球大氣研究計劃(Global Atmospheric Research Program,GARP)全球?qū)嶒灒‵irst GARPGlobal Experiment,F(xiàn)GGE)、15 a歐洲再分析數(shù)據(jù)(European Re-Analyses 15 years,ERA-15)、40 a歐洲再分析數(shù)據(jù)(European Re-Analyses 40 years,Era-40)和過渡期歐洲再分析數(shù)據(jù)(European Re-Analyses-Interim,ERA-Interim)[16,17];日本氣象廳(Japan Meteorological Agency,JMA)發(fā)布的25 a日本再分析數(shù)據(jù)(Japanese Re-Analysis 25 years,JRA-25)和55 a日本再分析數(shù)據(jù)(Japanese Re-Analysis 55 years,JRA-55)[18-19]等。2014年,中國國家氣象局(China Meteorological Administration,CMA)國家氣象信息中心也開始研發(fā)中國全球再分析資料集(CMA’s global atmospheric Re-Analysis,CRA)[20]。
由于選用不同數(shù)值模式、觀測資料以及同化和均一化過程帶來的差異[21],不同再分析數(shù)據(jù)集的可信度存在差異[22-23]。2016年,ECMWF發(fā)布了使用新一代四維變分同化技術(shù)制作的第五代ECMWF再分析資料集(The fifth generation ECMWF Re-Analyses,ERA5),該數(shù)據(jù)集采用實時更新的方式提供1950年至今的高分辨率全球大氣再分析數(shù)據(jù)[24-25]。ERA-Interim與ERA5的適用性比較研究已在中國多個省份開展,孟憲貴等[26]對比了山東省及周邊的觀測數(shù)據(jù),結(jié)果表明ERA5在地面和對流層低層的相對濕度和風(fēng)場上的表現(xiàn)明顯優(yōu)于ERAInterim;朱景等[27]利用浙江省71個氣象自動觀測臺站的溫度資料,證明ERA5對地表溫度的模擬較ERA-Interim有明顯改善。此外,同一數(shù)據(jù)集在不同區(qū)域的適用性也有較大差別,葉夢姝[21]比較了全國降水資料與3套再分析資料,結(jié)果顯示平原地區(qū)的再分析資料結(jié)果較山區(qū)更加可信,復(fù)雜地形區(qū)域?qū)邓目請蠛吐﹫笄闆r都顯著多于平原地區(qū)。
江蘇位于116°~122°E,30°~36°N之間,受東亞季風(fēng)控制,兼具南北方氣候特征,以淮河和蘇北灌溉總渠一線為界,北部屬于溫帶季風(fēng)氣候,南部屬于亞熱帶季風(fēng)氣候。地理環(huán)境上,江蘇為沿海省份,海岸線綿長,大陸地區(qū)整體地勢平坦,地跨長江和淮河,域內(nèi)湖泊眾多。受季風(fēng)和地理環(huán)境影響,江蘇天氣情況復(fù)雜多變,氣象災(zāi)害相對頻發(fā),預(yù)報具有很大的挑戰(zhàn)性[28]。鑒于再分析數(shù)據(jù)集對天氣/氣候預(yù)測的重要性及其數(shù)據(jù)本身的不確定性,研判再分析數(shù)據(jù)在江蘇區(qū)域的適用性及對相關(guān)的后續(xù)研究提供的理論依據(jù),具有非常重要的意義。本文利用江蘇省73個國家級自動氣象觀測站和3個高空探測站,對ERA-Interim和ERA5的地面和高空氣象要素在江蘇區(qū)域內(nèi)的適用性進行分析對比,利用機器學(xué)習(xí)方法對再分析數(shù)據(jù)的誤差進行分類,探究其主要的誤差分布和偏離特征,最終給出這兩種再分析數(shù)據(jù)在江蘇區(qū)域的適用性情況,為使用該區(qū)域ERA5和ERA-Interim再分析數(shù)據(jù)集進行相關(guān)天氣/氣候研究及預(yù)報的氣象科研人員提供借鑒和參考。
觀測數(shù)據(jù)為江蘇省73個國家級自動氣象觀測站及3個高空探測站(南京、徐州和射陽)的觀測數(shù)據(jù),具體站點分布如圖1所示。文中所用地面觀測要素包括:海平面氣壓(單位:hPa)、10 m風(fēng)向(單位:°)、10 m風(fēng)速(單位:m/s)、2 m氣溫(單位:℃)、2 m相對濕度(單位:%)和每1 h內(nèi)降水累積量(單位:mm);高空觀測要素包括:標(biāo)準氣壓層(1 000 hPa、925 hPa、850 hPa、700 hPa、500 hPa、400 hPa、300 hPa、250 hPa、200 hPa、150 hPa和100 hPa)的位勢高度(單位:位勢米)、風(fēng)向(單位:°)、風(fēng)速(單位:m/s)、氣溫(單位:℃)和相對濕度(單位:%)。
圖1 江蘇區(qū)域觀測數(shù)據(jù)站點分布(紅點所示為地面自動觀測站,紅五角星所示為探空站點)
由于江蘇省在2016年進行了氣象觀測改革,對觀測數(shù)據(jù)實施質(zhì)量控制,剔除異常值,所以2016年后的數(shù)據(jù)質(zhì)量結(jié)果更為可信。為了保證不同月份間對比的數(shù)據(jù)量保持一致,需要選取整年的觀測數(shù)據(jù)。因此,選取觀測數(shù)據(jù)時段為2016—2018年,其中地面要素為逐10 min質(zhì)控后觀測數(shù)據(jù),高空要素為一日2次(世界時00時和12時,下同)的觀測數(shù)據(jù),總數(shù)據(jù)量達11 449 758個,具有一定的代表性。
再分析數(shù)據(jù)為ERA-Interim和ERA5再分析數(shù)據(jù)集。ERA-Interim是ECMWF第3代再分析數(shù)據(jù)集,使用ECMWF集成預(yù)報系統(tǒng)(Integrated Forecast System,IFS)31r2循環(huán)(Cycle 31r2,Cy31r2)中的四維變分(Four-Dimensional Variational,4D-Var)數(shù)據(jù)同化技術(shù)[29]。該數(shù)據(jù)提供0.125°~2.5°多種空間分辨率,垂向上從地面起分為60層,分辨率最高可達0.1 hPa,時間范圍為1979—2019年,提供每日4次同化數(shù)據(jù)(世界時00時、06時、12時和18時)[30]。ERA5數(shù)據(jù)是ECMWF最新再分析數(shù)據(jù)集。作為ERA-Interim的替代品,ERA5的時間和空間分辨率都得到提高,水平分辨率由0.75°提高至0.281 25°,垂直分層由60層增至137層,垂向分辨率由0.1 hPa提高至0.01 hPa(約為80 km),數(shù)據(jù)的時間范圍延展到從1979年開始到最近5 d內(nèi)的實時數(shù)據(jù)(2020年已發(fā)布將時間范圍提前至1950年的初步版本),時間分辨率由每6 h提高至每1 h[24,25]。此外,相比于ERA-Interim數(shù)據(jù),ERA5數(shù)據(jù)對觀測資料的使用方法和物理過程描述都有顯著的改進,數(shù)據(jù)同化技術(shù)使用的是ECMWF新一代IFS 41r2循環(huán)(Cycle 41r2,Cy41r2)的4D-Var技術(shù)[31]。本文選取了2016—2018年同時間段的ERA5和ERA-Interim再分析數(shù)據(jù)。
本文首先通過Pearson相關(guān)系數(shù)(Correlation Coefficient,CC)衡量再分析數(shù)據(jù)和觀測數(shù)據(jù)之間的一致性,并利用標(biāo)準差(Standard Deviation,δ)和均方根誤差(Root Mean Square Error,RMSE)量化偏離程度,具體計算公式如下:
式中,A表示觀測數(shù)據(jù);E為再分析數(shù)據(jù);N為樣本數(shù);-表示平均值。這3個統(tǒng)計量將通過泰勒圖綜合表示。標(biāo)準化的泰勒圖基于余弦定理,綜合展示CC、δ和RMSE的關(guān)系。以原點為圓心,方位角表示相關(guān)系數(shù),距原點的距離為再分析數(shù)據(jù)和觀測數(shù)據(jù)的δ比率;以觀測數(shù)據(jù)點(Obs,沿水平方向距離原點一個單位)為圓心的圓表示標(biāo)準化RMSE。因此距離觀測數(shù)據(jù)點越近,說明再分析數(shù)據(jù)模擬效果越好[32]。泰勒圖中標(biāo)準差比率為:
標(biāo)準化均方根誤差為:
同時,文中利用相對偏差(Relative bias)衡量誤差偏離正負和分析誤差來源,計算公式為:
為了充分利用有限的數(shù)據(jù),減少統(tǒng)計量計算誤差,本文利用自助采樣法(拔靴法,Bootstrap)[33]計算上述統(tǒng)計量95%置信度的范圍。在常規(guī)計算方法下,對于一組再分析數(shù)據(jù)和觀測數(shù)據(jù),統(tǒng)計量式(1)—(6)只能計算出對應(yīng)的一個值,難以估計這個值的質(zhì)量或者置信度。Bootstrap方法作為一種增廣樣本統(tǒng)計方法,以原始數(shù)據(jù)為基礎(chǔ),通過重復(fù)抽樣(抽樣次數(shù)由用戶指定),可以得到一組數(shù)據(jù)某統(tǒng)計量的分布特征(通過重復(fù)抽樣得到某個統(tǒng)計量的多個值)[34],適用于本文統(tǒng)計量難以用常規(guī)方法進行假設(shè)檢驗的問題。在本文實際計算某統(tǒng)計量過程中,對于一組再分析數(shù)據(jù)和觀測數(shù)據(jù),規(guī)定通過Bootstrap方法得到某統(tǒng)計量1 000個樣本,再以1 000個樣本為基礎(chǔ),取具有95%置信度的范圍進行檢驗,下文討論的有關(guān)統(tǒng)計量都在95%置信區(qū)間內(nèi)。
此外,本文利用無監(jiān)督學(xué)習(xí)K均值(K-means,K為指定分類數(shù)目)聚類分析方法對各氣象要素的誤差進行分類。K-means算法是一種基于空間歐式距離(空間中兩個樣本對象之間的真實距離)進行相似度劃分的聚類算法,歐式距離越小的兩個樣本對象之間的相似程度越高[35]。因其算法簡捷高效,且可以指定分類數(shù)目,歸類結(jié)果解釋性強,此方法已被用于挖掘大量氣象數(shù)據(jù)中深層次的關(guān)系。韓微等[36]基于全國50 a的逐日氣溫觀測資料,利用聚類分析方法將全國劃分為若干區(qū)域,劃分結(jié)果與按氣候和地形劃分結(jié)果相近。本文嘗試利用再分析數(shù)據(jù)誤差將觀測站點劃分為若干區(qū)域,各區(qū)域之內(nèi)的誤差最小化,同時區(qū)域之間的誤差最大化,分類區(qū)域能具有一定地域特征。分類結(jié)果有助于描述系統(tǒng)誤差的空間分布,在使用再分析數(shù)據(jù)的過程中,注意系統(tǒng)誤差對天氣分析的影響,能夠提高再分析數(shù)據(jù)利用率。
3.1.1 地面要素的適用性
圖2給出了2016—2018年ERA5和ERAInterim數(shù)據(jù)中各地面氣象要素的泰勒圖。兩套再分析數(shù)據(jù)對江蘇區(qū)域的各地面觀測要素均具有較好的表征能力,除小時降水量這一要素外,ERA5的其他地面要素數(shù)據(jù)比ERA-Interim數(shù)據(jù)的適用性顯著提升,尤其是2 m氣溫及2 m相對濕度。
圖2 地面要素泰勒圖(紅色和藍色散點表示1—12月ERA5和ERA-Interim再分析數(shù)據(jù)的相關(guān)系數(shù)、標(biāo)準差和均方根誤差的分布,散點旁數(shù)字表征月份,散點越靠近Obs表示再分析數(shù)據(jù)和觀測數(shù)據(jù)間各項誤差越?。?/p>
相比ERA-Interim數(shù)據(jù),ERA5中海平面氣壓與觀測數(shù)據(jù)的相關(guān)系數(shù)均高于0.95(ERA-Interim在0.9附近),且均方根誤差小于0.25 hPa(ERA-Interim在0.25~0.5 hPa之間)。ERA5的2 m氣溫及2 m相對濕度相比于ERA-Interim表現(xiàn)出系統(tǒng)性改進,與觀測數(shù)據(jù)的相關(guān)系數(shù)分別集中在0.95和0.9附近,兩個要素的相關(guān)系數(shù)相較于ERA-Interim與觀測數(shù)據(jù)的相關(guān)系數(shù)0.5和0.4均提升了超過0.4,標(biāo)準化均方根誤差均減少了60%。ERA5數(shù)據(jù)的10 m風(fēng)速風(fēng)向相較于ERA-Interim數(shù)據(jù)也有所改進,與觀測的一致性提高(相關(guān)系數(shù)提高約0.3),均值也更接近于觀測。但是,上述地面要素在ERA5和ERA-Interim兩套數(shù)據(jù)中的標(biāo)準差比率沒有顯著差異,標(biāo)準差比率均集中在1附近,ERA5和ERA-Interim均較準確地表征海平面氣壓、2 m氣溫和2 m相對濕度的振幅,ERA-Interim高估了10 m風(fēng)速約15%,10 m風(fēng)向的振幅也有約15%的偏離。兩套數(shù)據(jù)的小時降水量相較于觀測均有較大誤差,相關(guān)系數(shù)分布較為離散,體現(xiàn)了該要素時間上適用性的差異,在實際研究/預(yù)報中需謹慎使用該要素。ERA5數(shù)據(jù)的地面要素適用性相較于ERA-Interim數(shù)據(jù)顯著提升(除小時降水量),可能主要得益于制作該數(shù)據(jù)的模式、同化系統(tǒng)和觀測數(shù)據(jù)的改進。
需要注意的是,在統(tǒng)計學(xué)上,本文計算得到的相關(guān)系數(shù)只需高于0.104(根據(jù)數(shù)據(jù)量查表可得),即可認為在顯著性水平0.001上顯著相關(guān)[37]。方差F檢驗[37]表明,在顯著性水平0.05上,兩套再分析數(shù)據(jù)的海平面氣壓與觀測數(shù)據(jù)相比離散程度沒有顯著差異,其他各要素離散程度都有顯著差異。
3.1.2 相關(guān)系數(shù)和相對偏差的時空分布特征
兩套再分析數(shù)據(jù)與觀測數(shù)據(jù)的一致性及誤差的時空分布特征,對于再分析數(shù)據(jù)的合理使用非常重要。本文選擇針對不同站點逐月的相關(guān)系數(shù)和相對偏差進行時空分布特征的分析。圖3給出了兩套再分析數(shù)據(jù)與站點觀測數(shù)據(jù)之間相關(guān)系數(shù)的逐月變化。對于各地面氣象要素,ERA5數(shù)據(jù)與觀測數(shù)據(jù)的一致性要優(yōu)于ERA-Interim數(shù)據(jù),尤其是2 m氣溫及2 m相對濕度。ERA5再分析數(shù)據(jù)的各地面氣象要素的相關(guān)系數(shù)季節(jié)差異顯著,相關(guān)系數(shù)的低值區(qū)主要存在于夏季(6—8月)。小時降水量的相關(guān)系數(shù)差異較大,最好月份和最差月份相差達0.6,其他要素季節(jié)相差在0.2之內(nèi)。此外,2 m相對濕度在1月和12月的相關(guān)系數(shù)與年均值相比偏低0.05,10 m風(fēng)向在整個下半年(6—12月)相關(guān)系數(shù)明顯偏低,比上半年偏低0.2。相較ERA5,ERA-Interim再分析數(shù)據(jù)與觀測的相關(guān)系數(shù)的季節(jié)差異沒有明顯分布規(guī)律。海平面氣壓與觀測數(shù)據(jù)的相關(guān)系數(shù)在9月比年均相關(guān)系數(shù)略偏高0.01。10 m風(fēng)向、10 m風(fēng)速、2 m氣溫和2 m相對濕度與觀測數(shù)據(jù)的相關(guān)系數(shù)季節(jié)差異在0.2之內(nèi),10 m風(fēng)向在3月、10月、11月和12月的一致性較差,10 m風(fēng)速在1—6月一致性偏低,2 m氣溫和2 m相對濕度在1—6月的相關(guān)系數(shù)較其他月偏高0.15,小時降水量的主要誤差季節(jié)分布和ERA5相似。
圖3 地面要素站點相關(guān)系數(shù)逐月分布(各物理量單位見2.1部分)
圖4給出了兩套再分析數(shù)據(jù)與站點觀測數(shù)據(jù)之間相對偏差的逐月變化。兩套數(shù)據(jù)的相對偏差量級相近,且存在季節(jié)差異特征,不同要素的偏差的季節(jié)特征不同。但均值t檢驗[37]顯示,在0.05顯著性水平上,ERA5再分析數(shù)據(jù)的海平面氣壓在冬季與觀測相比沒有顯著差異,2 m氣溫部分站點在冬季與觀測沒有顯著差異,其他氣象要素均值與觀測相比有顯著差異;ERA-Interim的10 m風(fēng)速和小時降水量與觀測均值有顯著差異,其他氣象要素與觀測相比只在部分站點有顯著差異。兩套數(shù)據(jù)相對偏差的95%置信區(qū)間也顯示,ERA5各氣象要素的置信區(qū)間不包含0值,而ERA-Interim各氣象要素相對偏差的置信區(qū)間在一半以上的站點跨0值分布。因此,ERA5再分析數(shù)據(jù)的相對偏差時空分布特征是可信的,在后續(xù)研究中有使用意義,而ERA-Interim相對偏差的時空分布特征在統(tǒng)計學(xué)上并不完全可信,需要注意。ERA5再分析數(shù)據(jù)與觀測數(shù)據(jù)的相對偏差大致可以分為3個量級:海平面氣壓相對偏差在0.1%之內(nèi),低估了觀測海平面氣壓值,且6—10月偏離程度略大;10 m風(fēng)向、2 m氣溫和2 m相對濕度的相對偏差絕對值在10%之內(nèi),分別在1—7月、10—12月和1—7月表現(xiàn)為正偏差,其余月份相對偏差為負值;ERA5顯著高估了10 m風(fēng)速和小時降水量,10 m風(fēng)速和小時降水量分別在1—7月和10—12月相對偏差較低。ERA-Interim再分析數(shù)據(jù)的相對偏差的季節(jié)分布特征與ERA5再分析數(shù)據(jù)類似,不同氣象要素的偏離程度也相近,但2 m氣溫在1—4月為正偏差,2 m相對濕度在1—7月為負偏差。
圖4 地面要素站點相對偏差逐月分布(單位:%)
導(dǎo)致這兩套再分析數(shù)據(jù)適用性的季節(jié)差異的主要原因可能是江蘇地區(qū)為顯著的季風(fēng)區(qū)域。受季風(fēng)影響,冬季在強勁的西北氣流控制下天氣形勢穩(wěn)定,而夏季受東南氣流影響,天氣多變,強對流天氣過程頻發(fā),且易受到臺風(fēng)等極端天氣影響,多出現(xiàn)短時強降水[7,28],導(dǎo)致再分析數(shù)據(jù)在夏季的適用性偏低。以季節(jié)差異明顯的小時降水量為例,ERA5和觀測的小時降水量降水分布直方圖(圖略)表明,ERA5數(shù)據(jù)的降水頻次和一般降水量(小時降水量<20 mm)均高于觀測,對一般降水存在空報現(xiàn)象,導(dǎo)致小時降水量被高估;同時,ERA5數(shù)據(jù)明顯低估了短時強降水(小時降水量>20 mm)發(fā)生的概率,常漏報短時強降水,而短時強降水常出現(xiàn)在對流性天氣多發(fā)的夏季,導(dǎo)致夏季的數(shù)據(jù)適用性較差。
圖3和圖4表明,兩套再分析數(shù)據(jù)的適用性存在季節(jié)差異,同時也存在空間差異,不同觀測站點間差異在夏半年(4—9月)尤為明顯。為了更加直觀地考察兩套數(shù)據(jù)適用性的空間差異,采用無監(jiān)督學(xué)習(xí)K-means聚類分析方法[36]對73個觀測站4—9月的誤差進行分類,分類依據(jù)為各個站點地面要素的相關(guān)系數(shù)和相對偏差。
圖5給出了ERA5再分析數(shù)據(jù)中各地面要素適用性的空間差異。圖中可以看出,ERA5再分析數(shù)據(jù)適用性的空間分布具有顯著的地域特征,總體以長江為界將江蘇省分為南北兩個區(qū)域,兩個區(qū)域間站點的相關(guān)系數(shù)差別不大,但是相對偏差有明顯區(qū)別。其主要表現(xiàn)為10 m風(fēng)向在南部地區(qū)(紅點)為負偏差而在北部地區(qū)(藍點)為正偏差,2 m相對濕度在南部地區(qū)為正偏差而在北部地區(qū)為負偏差。具體分類結(jié)果顯示,南部區(qū)域海平面氣壓的相關(guān)系數(shù)相對較高,海平面氣壓、10 m風(fēng)向和2 m氣溫的相對偏差為負,分別集中在-0.025 5%、-5.26%和-3.34%左右,10 m風(fēng)速、2 m相對濕度和小時降水量的相對偏差為正,分別集中在59.14%、2.49%和56.63%附近。而在北部區(qū)域,2 m氣溫和2 m相對濕度的相關(guān)系數(shù)較高,海平面氣壓、2 m氣溫和2 m相對濕度的相對偏差為負,分別為-0.036%、-0.058 2%和-3.30%左右,10 m風(fēng)向、10 m風(fēng)速和小時降水量的相對偏差為正,分別集中在為2.22%、22.15%和90.83%附近。同樣,對ERA-Interim再分析數(shù)據(jù)進行了聚類分析,結(jié)果顯示為沒有顯著的空間分布特征(圖略)。
圖5 ERA5地面要素適用性誤差分類
圖6給出了兩套再分析數(shù)據(jù)與江蘇境內(nèi)3個高空探測站2016—2018年氣象探空數(shù)據(jù)的相關(guān)系數(shù)和相對偏差的對比。兩套數(shù)據(jù)中的高空氣象要素與觀測較為一致,其中位勢高度與氣溫比較準確,各層的風(fēng)速、風(fēng)向與觀測相對一致,但是各層的相對濕度隨高度的變化體現(xiàn)了較大的差異性。兩套數(shù)據(jù)的適用性表現(xiàn)出相同的空間差異,其中,氣溫和風(fēng)向的適用性在對流層低層和高層表現(xiàn)出明顯空間差異,相對濕度在對流層中高層的適用性有明顯空間差異。
圖6 高空要素相關(guān)系數(shù)和相對偏差對比圖
ERA5數(shù)據(jù)各層位勢高度與探空數(shù)據(jù)的相關(guān)系數(shù)都在0.95以上,相關(guān)系數(shù)從1 000 hPa開始隨高度逐漸減小,在850~925 hPa之間達到局部極小值,然后逐漸回升,從150 hPa高度再度開始急劇減小,相關(guān)系數(shù)在對流層高層降至最??;相對偏差在1 000~700 hPa之間為負值,其隨高度增加緩慢減小,在對流層中高層趨近于0。ERA5數(shù)據(jù)的風(fēng)向和風(fēng)速與探空數(shù)據(jù)的相關(guān)系數(shù)在0.7之上,基本隨高度的增加而增大;相對偏差在1 000~700 hPa之間隨高度增加而逐漸趨近于0,在對流層中高層基本保持不變。ERA5的氣溫和相對濕度與探空數(shù)據(jù)的相關(guān)系數(shù)隨高度增加而減小,其中相對濕度的相關(guān)系數(shù)變化顯著,從0.9減小到0.2;氣溫的相對偏差在對流層中低層700 hPa達到極小值-17%,中高層接近于0,相對濕度則在對流層中高層有明顯偏差,最大相對偏差可達100%。不同站點高空氣象要素的適用性隨高度變化的趨勢基本一致,相比于站點58238,站點58150和站點58027的風(fēng)向、風(fēng)速、氣溫和位勢高度在對流層低層和高層的適用性較差,相對濕度在對流層中高層與觀測數(shù)據(jù)有更大差異。高空要素相比于地面要素沒有明顯季節(jié)變化特征(圖略)。
兩套再分析數(shù)據(jù)高空氣象要素的相關(guān)系數(shù)和相對偏差隨高度變化的趨勢基本一致。相較于ERA-Interim數(shù)據(jù),ERA5數(shù)據(jù)與探空數(shù)據(jù)的相關(guān)系數(shù)在風(fēng)場和氣溫上的表現(xiàn)有所提升。風(fēng)向在不同高度上均有改善,相關(guān)系數(shù)平均提高了0.3左右;風(fēng)速的相關(guān)系數(shù)在對流層低層提高了約0.4;氣溫的相關(guān)系數(shù)在對流層高層提升約0.1;ERA5的位勢高度和相對濕度與ERA-Interim相比沒有明顯優(yōu)勢。兩套數(shù)據(jù)在不同氣壓層的相對偏差沒有顯著差異。
本文利用江蘇73個國家級自動氣象觀測站和3個高空探測站的觀測數(shù)據(jù)對ERA-Interim和ERA5再分析數(shù)據(jù)的地面及高空氣象要素在江蘇省的適用性進行對比研究,主要結(jié)論如下:
(1)ERA5再分析數(shù)據(jù)的各地面要素的適用性均優(yōu)于ERA-Interim再分析數(shù)據(jù),其中2 m氣溫及2 m相對濕度體現(xiàn)了系統(tǒng)性的改進,相關(guān)系數(shù)提升超過0.4,但兩套再分析數(shù)據(jù)的小時降水量均存在較大的誤差。ERA5再分析數(shù)據(jù)與觀測數(shù)據(jù)之間的一致性及誤差均存在一定的時空分布特征??傮w而言,ERA5中海平面氣壓的適用性在全年都有很好的表現(xiàn),數(shù)據(jù)質(zhì)量可靠,其他氣象要素在夏季的適用性低于其他季節(jié),空間上表征為在夏半年存在顯著南北差異,10 m風(fēng)向在江蘇南部為負偏差而在北部為正偏差,2 m相對濕度在南部為正偏差而在北部為負偏差。與之相對的,ERA-Interim數(shù)據(jù)沒有顯著的時空分布特征。
(2)兩套再分析數(shù)據(jù)的高空氣象要素與觀測數(shù)據(jù)均較為一致,其中位勢高度與氣溫比較準確,各層的風(fēng)速、風(fēng)向與觀測數(shù)據(jù)相對一致,但是各層的相對濕度隨高度的變化體現(xiàn)出較大的差異性,各個要素不同站點間適用性差異在對流層低層和高層比較明顯??傮w而言,ERA5再分析數(shù)據(jù)在各氣壓層與觀測的一致性優(yōu)于ERA-Interim再分析數(shù)據(jù)。
本文雖然取得了一定的研究成果,但是還存在一些不足。本文的分析工作,尤其是季節(jié)分析和聚類分析,是基于3 a(2016—2018年)的觀測數(shù)據(jù),其結(jié)果代表性有一定局限,我們將在以后的研究中進行更長時間序列的驗證分析。同時,本文采用聚類分析方法對誤差的空間分布特征進行了分析,但是對這種誤差空間分布特征的成因未明確,在后續(xù)的研究中也將開展更多的機制分析工作,給出誤差時空分布特征的成因。