左泉,鮑艷松,董焱,許丹,吳瑩
(1.南京信息工程大學 氣象災害預報預警與評估協(xié)同創(chuàng)新中心,南京 210044;2.中國氣象局氣溶膠與云降水重點開放實驗室,南京 210044;3.南京信息工程大學 大氣物理學院,南京 210044)
幾十年來,對高空風的探測幾乎都采用氣球作為空氣流動的示蹤物。這種方式不能連續(xù)進行觀測,時空分辨率低且費用較高[1]。風廓線雷達則是當前常規(guī)探空體制的重要補充[2],每次觀測時間只需幾分鐘,探測分辨率最小可到幾十米,具有連續(xù)無人值守和全天候自動觀測的優(yōu)點[3],可以連續(xù)獲得測站上空的水平風速、垂直風速、大氣折射率結(jié)構(gòu)常數(shù)等信息[4-6],是可以應用于業(yè)務(wù)的地基遙感設(shè)備[7]。
作為一種遙感探測設(shè)備,各種干擾信號都有可能使數(shù)據(jù)發(fā)生錯誤,其數(shù)據(jù)的質(zhì)量問題也就更加突出[8],尤其是在有降水情況下,水平風向、風速的測量誤差相對較大[9-10]。風廓線雷達靈敏度高、波束較寬、副瓣較高,更易受到干擾信號的影響;而模式應用對風廓線雷達的數(shù)據(jù)質(zhì)量也有很高的要求[11]。目前,我國在風廓線雷達硬件技術(shù)方面已比較成熟[12],而在信號與數(shù)據(jù)處理及質(zhì)量控制方面還有待提高[13]。為了獲取一致性更高的探測資料并投入應用,研究切實可行的風廓線雷達數(shù)據(jù)質(zhì)量控制方法是非常有價值且必要的[14]。
目前國內(nèi)外針對風廓線雷達數(shù)據(jù)的質(zhì)量控制開展過很多工作,也取得了一定的成果。美國NPN網(wǎng)和CAP網(wǎng)主要采用的是中值濾波算法、Weber-Wuertz 算法(WW算法)[15]和NIMA算法[16-17]。近十幾年來,我國也有不少科學工作者和氣象部門開始針對風廓線雷達數(shù)據(jù)的質(zhì)量控制和資料應用展開研究。周芯玉等[18]利用中位數(shù)方法對廣東陽江的風廓線雷達資料進行了質(zhì)量控制和對比分析。文獻[19-20]使用一致性平均方法、垂直一致性檢測和中值檢測等動態(tài)算法對山東省的風鄭線雷達數(shù)據(jù)進行了有效的實時質(zhì)量控制。在風廓線雷達資料的同化應用方面,文獻[21-23]利用風廓線雷達觀測資料,把U和V聯(lián)合起來進行EOF分解,利用分解出的主要模態(tài)重構(gòu)該時間序列內(nèi)的風場,使數(shù)據(jù)能更好地滿足資料同化模式中的正態(tài)分布和無偏估計。其后,Zhang等[24]利用blacklisting對異常值進行檢驗,并用迭代重加權(quán)最小協(xié)方差行列式(IRMCD)法進行質(zhì)量控制工作,推斷IRMCD法在風廓線雷達數(shù)據(jù)質(zhì)量控制中顯得更有效且全面。另外,余貞壽等[25]在2018年通過對風廓線雷達資料進行氣候極值檢驗、一致性檢查、垂直稀疏化等質(zhì)量控制,探討了其在一次暴雨過程中對降水預報的影響。
由于風廓線雷達的觀測受到多方面因素的影響,目前國內(nèi)還未形成較成熟的針對不同地域風廓線雷達數(shù)據(jù)的質(zhì)量控制方案。本研究主要針對北京地區(qū)7個站點的風廓線雷達數(shù)據(jù)展開研究,初步評價了數(shù)據(jù)的精度情況,并利用2種不同的質(zhì)量控制流程處理數(shù)據(jù),多方面比較不同的質(zhì)量控制方法產(chǎn)生的效果及影響。
本文使用的觀測資料來自北京7個站點(南郊、海淀、霞云嶺、延慶、懷柔、平谷、密云)的風廓線雷達,時間分辨率均為6 min,空間分辨率為120 m。7臺風廓線雷達的站點地理位置信息如表1所示。另外,用于評價風廓線雷達數(shù)據(jù)精度和數(shù)據(jù)的質(zhì)量控制效果的風場數(shù)據(jù)來自美國氣象環(huán)境預報中心(National Centers for Environmental Prediction,NCEP)和美國國家大氣研究中心(National Center for Atmospheric Research,NCAR)聯(lián)合制作得到的分辨率為0.5°×0.5°的FNL再分析資料。
表1 北京風廓線雷達站點地理位置信息
由于FNL再分析資料的風場為徑向、緯向風分量(以下簡稱U、V分量),故將風廓線雷達的水平風速根據(jù)風向分解成U、V2個分量。另外,由于2種數(shù)據(jù)資料的高度分層也不一致,所以在對比前先將風廓線雷達的風場數(shù)據(jù)插值到FNL再分析資料的高度層上,然后再進行對比分析,主要的對比技術(shù)流程如圖1所示。
圖1 風廓線雷達資料與FNL再分析資料對比流程
選取了2018年6月當中7個站點均無地面降水的時段,并對風廓線雷達數(shù)據(jù)與再分析資料進行對比分析。從2018年6月各站點U、V分量散點圖與相關(guān)系數(shù)及其一維線性擬合情況(圖2、圖3)來看,7個站點的散點分布與擬合情況大致相同,均有較強的相關(guān)性。其中,延慶站的U分量擬合情況最好,相關(guān)性也最強,而對于V分量來說,平谷站的相關(guān)系數(shù)最大,有較強的相關(guān)性。
注:紅線為標準擬合線y=x,黑線為風廓線雷達資料與再分析資料的實際擬合線;R為相關(guān)系數(shù)。圖2 2018年6月(無降水時段)各站點U分量散點對比
注:紅線為標準擬合線y=x,黑線為風廓線雷達資料與再分析資料的實際擬合線;R為相關(guān)系數(shù)。圖3 2018年6月(無降水時段)各站點V分量散點對比
另外,將FNL資料作為對比值,計算了各站點U、V分量各自的平均偏差和均方根誤差,繪制出其隨高度變化的垂直廓線,如圖4所示。可以得出,密云站的總體誤差較大,而南郊站的垂直廓線波動較小。在1 600 m以下,密云站的平均偏差絕對值是最大的,而平谷站相對較小且偏向穩(wěn)定。到了高層,延慶、海淀、密云和霞云嶺站的平均偏差絕對值開始不斷增大,而南郊站的偏差絕對值則保持在1 m/s以內(nèi),且逐漸減小并趨于穩(wěn)定。各站點的U分量從1 000 m開始向上,密云站的均方根誤差始終是最大的,隨著高度的上升,南郊站的均方根誤差越來越小并逐漸趨于穩(wěn)定。對于V分量來說,南郊和平谷站的平均偏差較小,絕對值基本維持在0~0.5 m/s,各站點均方根誤差隨高度變化差別不大,但密云站的誤差相對來說還是比較大的,均方根誤差最高已經(jīng)超出了6 m/s。
圖4 2018年6月各站點U分量、V分量平均偏差與均方根誤差垂直廓線
要對風廓線雷達觀測資料進行質(zhì)量控制,必須要考慮先對其進行質(zhì)量檢查。所以,針對原始的觀測資料,本文首先進行了簡單的氣候極值檢驗[26],用于剔除超過氣象值最大限度的錯誤風場數(shù)據(jù)(表2)。
表2 風速氣候極大值參考表
隨后,又對極值檢驗后的風場數(shù)據(jù)進行了垂直一致性檢驗[27]。如果某高度層的垂直變化值同時大于其下2層的垂直變化值的3倍,則將該高度層上的水平風速看作異常風速值并予以剔除。由此,共計剔除了3.2%的水平風速異常值。
1)EOF分析重構(gòu)法。固定某一時次,選取該時次前1 h至后1 h的2 h內(nèi)的數(shù)據(jù)構(gòu)成時間序列,將U和V聯(lián)合起來組成X矩陣[21]。計算X的協(xié)方差矩陣S=XXT,并求其特征值Λ與特征向量E(Λ為對角陣,對角元素即不同模態(tài)的特征值)。將特征值從大到小排列得λ1≥λ2≥…≥λ2L,計算前m個特征向量的累計解釋方差如式(1)所示。
(1)
式中:L為數(shù)據(jù)的高度層。然后求時間系數(shù)矩陣T=ETX,利用EOF分解出的模態(tài)重構(gòu)2 h內(nèi)的時間序列,即X=ET,從而獲得選取的分析時刻的風場垂直分布(針對累計解釋方差設(shè)置了針對性截斷閾值,設(shè)前m個特征向量滿足G≥90%,且前m-1個特征向量不滿足G≥90%,則重構(gòu)時將只采用前m個模態(tài)的特征向量),此時得到相應的第i高度層上第j時刻的徑向風和緯向風分別如式(2)、式(3)所示。
(2)
(3)
式中:ei,k為特征向量E中的元素值;tk,j為時間系數(shù)矩陣T中的元素值。
2)高斯濾波法。高斯濾波是一種線性平滑濾波,本文也利用了二維高斯算子對研究數(shù)據(jù)的序列進行重加權(quán),即利用高斯核的一維卷積算子對U、V風場的高頻噪聲進行過濾[28]。高斯分布如式(4)所示。
(4)
其中,σ越大,平滑效果越好。經(jīng)過多次試驗結(jié)果的比較,最終在本研究中取δ為1.5。
針對2018年6月中的每一個地面無降水時段,本文對南郊站的風廓線雷達數(shù)據(jù)分別進行了上述2種方法的質(zhì)量控制工作,并與FNL再分析資料進行對比,以比較2種質(zhì)量控制方法的效果和作用。
1)時空尺度對比分析。圖5為2018年6月6日6時(世界時,下同)U、V分量質(zhì)量控制前后廓線對比圖??梢钥闯?,質(zhì)量控制后的風廓線雷達數(shù)據(jù)顯得更加平滑,數(shù)據(jù)一致性也更好,但2種質(zhì)量控制方法的效果存在著較明顯的區(qū)別。風廓線雷達初始風場在垂直方向上存在較大的波動,這一特征在U分量中尤為顯著。在高度的變化上,經(jīng)過EOF重構(gòu)后的風場比高斯濾波場更加均勻,尤其是對于U分量(圖5(a)),它濾去了很多在垂直方向上的大幅度風速變化,使得風隨高度的變化變得平緩。而高斯濾波后的風場則與初始場較為接近,保留了很多初始風場的變化特征。
圖5 2018年6月6日6時風廓線雷達U、V分量質(zhì)量控制前后對比
為了進一步探討2類質(zhì)量控制方法在空間尺度上的定性影響特征,本文選取了另一時刻的風場垂直廓線進行了對比,圖6為6月20日18時各風場的垂直廓線對比圖。可以看出,在隨高度變化的空間尺度上,高斯濾波場依然是更多地保留了風廓線雷達初始風場的變化特征,而EOF場則相對顯得更加平滑和均勻,有效地過濾了相鄰高度上風速的較大變化。因此,在很多強對流天氣發(fā)生的情況下,高斯濾波法能夠更多地保留風場在垂直方向上的較大切變。
在隨時間演變方面,分析6月6日4時6分至7時54分風廓線雷達觀測風場與質(zhì)量控制后得到的風場在1 590 m高度上的時間序列后發(fā)現(xiàn),質(zhì)控后的風場相比原始風場要更加平緩(圖7)??梢院苊黠@地看出,無論是U分量還是V分量,高斯濾波后的風場都相對變得更加平滑,并且在濾去了某些小尺度高頻脈動的同時,也相應地在一定程度上保留了初始風場在時間尺度上的變化特征,比EOF重構(gòu)場更加接近于初始風場,從而能夠有效地防止了部分情況下風場隨時間演變的有效變化被當作異常值剔除的錯誤發(fā)生。
圖6 2018年6月20日18時風廓線雷達U、V分量質(zhì)量控制前后對比
圖7 2018年6月6日4時6分至7時54分觀測風場與質(zhì)量控制風場在1 590 m高度上隨時間的演變
隨后,為了進一步驗證上述2種質(zhì)量控制方法的效果,本文給出了6月6日4時6分至7時54分風廓線雷達初始風場與質(zhì)量控制后得到的2個風場的U、V分量隨高度和時間的變化情況(圖8)。與初始場進行對比分析可以發(fā)現(xiàn),2種方法都可以濾去大部分的高頻脈動,但高斯濾波法在去掉這些小尺度高頻脈動的同時,也較好地保留了原風場的基本特征,很好地改善了這個時間段內(nèi)風場的均一性。從圖中還可以看出,高斯濾波法所得到的風場在時間尺度上更為均一,而EOF重構(gòu)的風場在空間尺度上更為平均,這也與上述得出的結(jié)論相符合。因此可以認為,2種質(zhì)量控制方法在時間和空間尺度上有著不同的效果。
圖8 2018年6月6日4時6分至7時54分觀測風場與質(zhì)量控制風場(EOF場、Gauss場)的U、V分量隨高度和時間的變化
2)誤差分析。由于在探空數(shù)據(jù)的觀測過程中,存在時間分辨率過高、探空氣球在水平方向上的漂移等實際因素,故本研究將FNL再分析資料的風場數(shù)據(jù)作為第三方觀測數(shù)據(jù),用于評價質(zhì)量控制的效果。由于風廓線雷達的垂直分辨率較高,數(shù)據(jù)分布密集、高度層與FNL再分析資料差別較大,故針對風廓線雷達初始風場和質(zhì)量控制后得到的風場進行了垂直稀疏化處理,即只取與FNL資料模式高度層相近的風場數(shù)據(jù),以達到使其與再分析資料高度層數(shù)相同且垂直分辨率基本一致的目的。
對風場數(shù)據(jù)進行垂直稀疏化處理后,將其分別與FNL再分析場進行對比,計算并繪制出初始風場、2種質(zhì)量控制場各自與再分析場差值的頻數(shù)分布圖(圖9)。可以看出,各風場數(shù)據(jù)與FNL資料U分量的差值基本都集中在0 m/s附近,其中大多數(shù)差值分布在-2~2 m/s的范圍內(nèi);而在差值為-0.4~1.2 m/s的區(qū)間內(nèi),2種質(zhì)控場出現(xiàn)的頻數(shù)比初始風場有所增多,尤其在0附近,Gauss場的頻數(shù)相對于其他場,有較明顯的提升,這在V分量的差值頻數(shù)圖中表現(xiàn)得更為顯著。2種質(zhì)控場在0~2 m/s的區(qū)間內(nèi)頻數(shù)增多,其中Gauss場在0.2~2 m/s的區(qū)間內(nèi),頻數(shù)相比于EOF場和初始場都明顯提高很多。但可能由于高斯濾波算法的原因,Gauss場的頻數(shù)在差值極值區(qū)有略微的增加。
圖9 2018年6月南郊站風廓線雷達初始場及質(zhì)量控制場與FNL再分析資料風場差值的頻數(shù)分布
由此,本文計算了各個風場數(shù)據(jù)與FNL再分析資料差值的平均值與標準差(表3、表4)??梢园l(fā)現(xiàn),2種質(zhì)量控制方法得到的數(shù)據(jù)與再分析資料差值的平均值和標準差均比風廓線雷達初始風場要小,說明EOF重構(gòu)法和高斯濾波法對改善數(shù)據(jù)偏差均有一定的作用。相對于EOF重構(gòu)場,Gauss場與再分析場差值的平均值與標準差都更小一些,說明高斯濾波后得到的風場數(shù)據(jù)整體上更接近于FNL再分析場。
表3 風廓線初始場、質(zhì)控場與FNL場U分量差值的平均值與標準差
表4 風廓線初始場、質(zhì)控場與FNL場V分量差值的平均值與標準差
本文選用2018年6月地面無降水時段北京南郊、海淀、霞云嶺、延慶、懷柔、平谷、密云這7個站點的風廓線雷達的觀測資料,將其與FNL再分析資料進行對比,得到初步的數(shù)據(jù)精度評估結(jié)果:7個站點上的U、V分量散點分布與擬合情況大致相同,均與再分析資料有較強的相關(guān)性,其中,延慶站的U分量擬合情況最好,相關(guān)性也最強,而對于V分量來說,平谷站的相關(guān)系數(shù)最大,有較強的相關(guān)性;從平均偏差和均方根誤差二者結(jié)合來看,南郊站的誤差相對較小,且數(shù)據(jù)的波動也比其他6個站點穩(wěn)定。
隨后本文對南郊站點的風廓線雷達數(shù)據(jù)進行了更加深入的研究。同樣地,還是選取6月地面無降水時段南郊站所有時次的風廓線雷達資料,分別利用EOF分析重構(gòu)法和高斯濾波法對其進行了質(zhì)量控制,再將質(zhì)量控制前后的數(shù)據(jù)與FNL再分析資料的風場數(shù)據(jù)進行對比,探尋這2種方法在時空尺度和誤差分析上所產(chǎn)生的不同影響,得到主要結(jié)論如下。
1)在空間尺度上,EOF分析重構(gòu)法的數(shù)據(jù)平滑效果更好,能夠有效地過濾相鄰高度上風速的較大變化,高斯濾波法得到的風場則是更多地保留了風廓線雷達初始風場的變化特征,在很多強對流天氣發(fā)生的情況下,高斯濾波法能夠更多地保留風場在垂直方向上產(chǎn)生的較大切變。
2)在時間尺度上,高斯濾波法的效果要明顯優(yōu)于EOF分析重構(gòu)法。高斯濾波后的數(shù)據(jù)不僅隨時間變得更加平滑,而且在濾去了小尺度高頻脈動的同時,也相應地在某種程度上保留了初始風場在時間尺度上的變化特征,比EOF重構(gòu)場更加接近于初始風場。
3)從風廓線雷達數(shù)據(jù)質(zhì)量控制前后與FNL再分析資料的誤差對比分析可以得出,2種質(zhì)量控制方法在改善數(shù)據(jù)誤差方面均能呈現(xiàn)出一定的效果,其中高斯濾波法相比于EOF重構(gòu)法更能減小數(shù)據(jù)的觀測誤差。
需要指出的是,本文對質(zhì)量控制方法在數(shù)據(jù)誤差方面的影響展開了討論,但沒有更深入地研究質(zhì)量控制前后風廓線雷達數(shù)據(jù)的實際技術(shù)應用,這在后期的工作中尚需進一步研究。