江 益,王立俊*,鄭虹暉
(1.海南省氣象信息中心,???570203;2.海南省南海氣象防災(zāi)減災(zāi)重點實驗室,海口 570203)
能見度是反映大氣透明度的一項指標,是環(huán)境空氣質(zhì)量好壞的一項判斷依據(jù)。近年來人們對霧霾天氣的日益關(guān)注,而能見度是判斷此類天氣現(xiàn)象的重要依據(jù),因此能見度數(shù)據(jù)的質(zhì)量控制十分重要?,F(xiàn)階段國內(nèi)外學(xué)者對實時氣象資料的質(zhì)量控制方法有了許多的研究[1-6],現(xiàn)在業(yè)務(wù)運行的氣象資料質(zhì)量控制系統(tǒng)[7-9]就是其成果之一,但其中只對小時能見度進行界限值檢查等基本方法的質(zhì)量控制,存在許多疑誤信息被漏檢,為數(shù)據(jù)質(zhì)量審核員帶來許多不便。能見度有誤的情況主要有能見度跳變(與前后時次能見度相差過大)、最小平均能見度跳變(與能見度差異過大)、能見度與實際天氣現(xiàn)象不匹配等,而這些能見度疑誤情況均不能被現(xiàn)有的質(zhì)量控制平臺檢測出來。國內(nèi)有一些學(xué)者對自動能見度與人工能見度的對比及自動能見度的質(zhì)量控制方法做出了一些分析和探討[10-15],但尚未提出具體可用的質(zhì)量控制方法。此外海南省除了海南島陸地外,還包含200 多萬平方公里南海海域,對于南海海島能見度的質(zhì)量控制方法仍未有研究,因此本文重新設(shè)計了能見度質(zhì)量控制方法,方法中包括界限值檢查、時變檢查和內(nèi)部一致性檢查,研究一套針對海南島與南海海島實時能見度的質(zhì)量控制方法,以提高資料審核的效率。
選用資料為2017 年9 月—2018 年8 月海南省21 個國家站的逐小時10min 平均能見度(以下簡稱能見度)、最小平均能見度、相對濕度、風(fēng)速等數(shù)據(jù),數(shù)據(jù)來源于氣象資料業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫。
界限值檢查方法是檢查要素值是否在其測量允許值范圍之內(nèi)。根據(jù)最新氣象觀測業(yè)務(wù)規(guī)定,小時能見度相關(guān)數(shù)據(jù)均應(yīng)在0~30000m 的范圍內(nèi),即若各類能見度數(shù)據(jù)超過30000m 即為錯誤數(shù)據(jù)。
除了降水、霧、霾、煙霧等特殊現(xiàn)象會導(dǎo)致能見度變化劇烈,正常情況下能見度的變化有一定的過程,因此將能見度與其時間前、后的測值相比較,來判斷其數(shù)據(jù)是否發(fā)生異常。主要對能見度和最小能見度進行時變檢查,將被檢時次的能見度Vi分別與其前后時次的能見度Vi-1與Vi+1相比較,將被檢時次的最小能見度Vmini與上個時次的能見度Vi-1相對比,看其差值是否超過閾值范圍。
根據(jù)對海南省歷史小時能見度與最小能見度進行分析得出閾值Δ 的取值,以最小能見度10000m為臨界值,最小能見度高于臨界值時,根據(jù)對小時能見度與最小能見度、最小能見度與上時次能見度、小時能見度與下時次能見度、小時能見度與上時次能見度的差值絕對值的統(tǒng)計,Δ 在15000m 以內(nèi)次數(shù)的概率均在98%以上,將Δ 定為15000m;最小能見度低于臨界值時,由于最小能見度值較小,根據(jù)過往審核經(jīng)驗出現(xiàn)疑誤的可能性較高,將閾值調(diào)低以避免漏檢,對各類差值絕對值進行統(tǒng)計,Δ 在5000m 以內(nèi)次數(shù)的概率均在80%以上,將Δ 的值定在5000m:
根據(jù)某些氣象觀測要素之間的關(guān)聯(lián)性,可通過檢查與相關(guān)要素數(shù)據(jù)是否保持這種內(nèi)部關(guān)系來檢查其是否發(fā)生異常,即為內(nèi)部一致性檢查。對于能見度的內(nèi)部一致性檢查主要可以從兩個方面來進行,其一檢查同類要素之間的一致性關(guān)系,最小平均能見度必須小于或等于能見度:Vmin≤V,或最小能見度與能見度之間的差值是否在閾值范圍內(nèi);其二檢查能見度與相關(guān)氣象要素之間的一致性關(guān)系,與能見度變化直接相關(guān)的要素有降水量、天氣現(xiàn)象(輕霧、霧、霾)、相對濕度、風(fēng)速等。當(dāng)有降水發(fā)生或其他天氣現(xiàn)象影響時,小時能見度或最小能見度會降低。由于天氣現(xiàn)象實現(xiàn)自動觀測后,天氣現(xiàn)象主要由能見度與相對濕度等相關(guān)要素來進行判斷,因此不能用天氣現(xiàn)象來判斷能見度是否異常。由此著重討論能見度與相對濕度、風(fēng)速的相關(guān)性。
對2017 年9 月—2018 年8 月海南島逐小時能見度與相對濕度、風(fēng)速的相關(guān)性分季節(jié)進行分析。從圖1、表1 中可以看出,海南省共21 個國家站各季能見度與相對濕度均呈負相關(guān),且均通過顯著性檢驗,其中海南島春夏兩季能見度與相對濕度的負相關(guān)較為顯著;秋季、冬季兩者的相關(guān)性略低于春夏季。從表1 中可以看出,西沙、珊瑚兩個海島站能見度與相對濕度的相關(guān)性夏季最高,其次為冬季,春秋兩季相對偏低。
表1 2017 年9 月—2018 年8 月西沙、珊瑚站四季逐小時能見度與相對濕度的相關(guān)系數(shù)(均通過95%信度檢驗)
圖1 2017 年9 月—2018 年8 月海南島春夏秋冬季逐小時能見度與相對濕度相關(guān)系數(shù)分布圖(均通過95%信度檢驗)
從圖2 中可以看出,海南島上19 個國家站各季能見度與風(fēng)速基本上呈正相關(guān),相關(guān)性總體上較相對濕度偏低,其中三亞站各季能見度與風(fēng)速的相關(guān)系數(shù)均小于0.1,因此可以判斷三亞站能見度與風(fēng)速不相關(guān)。其余臺站春季、冬季能見度與風(fēng)速的相關(guān)性較好,夏季、秋季大部分站點的相關(guān)系數(shù)低于0.3,說明海南島夏秋兩季能見度與風(fēng)速基本不相關(guān)。從表2中可以看出,南海上西沙、珊瑚站能見度與風(fēng)速的相關(guān)性較好,均呈顯著的負相關(guān)。
圖2 2017 年9 月—2018 年8 月海南島春夏秋冬季逐小時能見度與風(fēng)速相關(guān)系數(shù)分布圖(紅色數(shù)字為未通過95%信度檢驗)
表2 2017 年9 月—2018 年8 月西沙、珊瑚站四季逐小時能見度與風(fēng)速的相關(guān)系數(shù)(均通過95%信度檢驗)
采用線性回歸的方法來判斷能見度與其他要素的內(nèi)部一致性關(guān)系,根據(jù)上文得出的能見度與相對濕度、風(fēng)速的相關(guān)性情況,對2017 年9 月—2018 年8 月不同季節(jié)、不同地域小時能見度變化值與相對濕度變化值、風(fēng)速變化值進行線性擬合,得出擬合方程:
式 中ΔVi、ΔPi、ΔWi分別為待測時次小時能見度變化預(yù)測值、相對濕度實際變化值、風(fēng)速實際變化值。
通過將預(yù)測絕對誤差,即小時能見度實際值與預(yù)測能見度值差值的絕對值,與預(yù)測誤差標準差相對比,來判斷能見度與相關(guān)要素的一致性關(guān)系,如公式(3)所示,式中std 表示標準差,m 為標準差的倍數(shù),公式(4)、(5)為能見度平均絕對誤差ΔV 與標準差std 的計算公式,n 為樣本總數(shù)。m 的值根據(jù)實際需要選取,當(dāng)預(yù)測絕對誤差不滿足公式(3)時,則該時次的小時能見度為疑誤值。
對海南島除三亞站外春季、冬季的小時能見度、相對濕度、風(fēng)速的變化值進行二元線性擬合,得出公式(2)中x1、x2、x3取值分別為-457.2、154.3、-30.6。
對小時能見度實際變化值與預(yù)測誤差進行分析,得出兩者的相關(guān)系數(shù)為0.84,且通過95%的信度檢驗,說明小時能見度實際變化越大,預(yù)測誤差也越大。能見度出現(xiàn)的異常情況一般為能見度驟降,因此以被檢上一時次的小時能見度Vi-1為基準,Vi-1越大,所允許的變化值也越大,當(dāng)Vi-1在15000m 以內(nèi)時,m 的值定為2,當(dāng)Vi-1大于15000m 時,m 的值定為3。
對海南島除三亞站外的夏季、秋季的小時能見度、相對濕度的變化值進行一元線性擬合,得出公式(2) 中x1、x2、x3取值分別為-411.1、0、-74.2,m 的取值與春冬季相同。
對三亞站的小時能見度、相對濕度的變化值進行一元線性擬合,公式(2)中x1、x2、x3取值分別為-860.9、0、0,判斷疑誤的方法與上述相同。
對西沙、珊瑚站的小時能見度、相對濕度、風(fēng)速的變化值進行二元線性擬合,公式(2)中x1、x2、x3取值分別為-582.3、-361.8、0,判斷疑誤的方法與上述相同。
總的來說,海南省21 個國家站能見度與相對濕度全年均呈負相關(guān)關(guān)系,除了個別站點外,這種負相關(guān)關(guān)系均較為顯著;對于能見度與風(fēng)速的相關(guān)性,西沙、珊瑚站全年均呈較為顯著的負相關(guān)關(guān)系,三亞站全年不相關(guān),其他臺站春季、冬季呈正相關(guān)關(guān)系,而夏季、秋季相關(guān)性較弱。
對于時次i 的小時能見度與最小能見度的質(zhì)量控制分兩步進行,如圖3 所示,f 為小時能見度與最小能見度共同的質(zhì)量控制碼,f 為0 表示正確,f 為1表示疑誤,Δ 為變化閾值。第一步進行界限值檢查、最小能見度事變檢查與同類要素間的內(nèi)部一致性檢查,第二步針對第一步判斷為正常的能見度數(shù)據(jù)進行再次質(zhì)量控制,主要為小時能見度事變檢查及能見度與其被檢時次相關(guān)要素的一致性檢查,閾值Δ如公式(1)所示。在質(zhì)量控制流程中對降水造成的能見度變化進行了篩選。
圖3 小時能見度質(zhì)量控制流程圖
圖4 為澄邁、三亞、西沙站逐小時預(yù)測能見度值與實際小時能見度對比圖。從圖中可以看出,總體上預(yù)測能見度的變化與實際能見度變化基本吻合,在個別時次能見度變化劇烈時預(yù)測能見度的值和實際能見度值差值稍大,但均在誤差允許范圍內(nèi)。當(dāng)實際能見度維持在最高值長時間不變時,預(yù)測能見度會有上下波動變化,與實際不符,但誤差在允許范圍內(nèi)。因此,內(nèi)部一致性檢查方法能較好地對小時能見度進行篩查。
圖4 內(nèi)部一致性檢查結(jié)果個例實際能見度與預(yù)測能見度對比圖
以5 月6 日白沙站為例(圖5),對質(zhì)量控制方法效果進行分析。質(zhì)量控制后出現(xiàn)2 條疑誤信息,20時最小能見度未通過第一步質(zhì)量控制,21 時小時能見度未通過第二步質(zhì)量控制。這兩個時次均無降水發(fā)生,20 時最小能見度、21 時小時能見度均未通過時變檢查,且21 時能見度預(yù)測誤差的絕對值超過了3 倍標準差,未通過內(nèi)部一致性檢查。對這兩個時次的分鐘能見度進行查看,發(fā)現(xiàn)這兩個數(shù)據(jù)均是由于分鐘能見度跳變造成,確認為錯誤數(shù)據(jù)。
圖5 2019 年5 月6 日白沙站能見度圖
使用該質(zhì)量控制方法對海南省2019 年5 月的能見度數(shù)據(jù)進行質(zhì)量控制,最終從14847 個樣本中挑取出231 條疑誤數(shù)據(jù),與人工審核結(jié)果相對比,錯誤數(shù)據(jù)挑出率達到99%,同時也將輕霧、霧等造成的能見度變化挑選了出來,而MDOS 的錯誤數(shù)據(jù)挑出率為0%。
對海南島與南海海島能見度進行研究分析,得出了由界限值檢查、時變檢查、內(nèi)部一致性檢查組成的實時能見度質(zhì)量控制方法,其中內(nèi)部一致性檢查采用了線性回歸的方法,根據(jù)能見度與相對濕度、風(fēng)速之間的相關(guān)性,通過大量樣本進行多元線性擬合得出擬合公式及其誤差標準差來檢查判斷。界限值檢查可查出明顯異常值;時變檢查可查出明顯變化數(shù)據(jù);內(nèi)部一致性檢查可查出不符合數(shù)據(jù)關(guān)系的數(shù)據(jù);組合成質(zhì)量控制流程可較好地將錯誤能見度和特殊天氣造成的能見度變化情況挑選出來,錯誤數(shù)據(jù)挑出率達99%,對資料審核員審核能見度數(shù)據(jù)起到了很好的輔助作用,大大提高了審核效率。
本文僅研究了針對小時能見度的質(zhì)量控制方法,并未結(jié)合分鐘能見度進行質(zhì)量控制,且尚不能將特殊天氣造成的能見度變化與錯誤數(shù)據(jù)區(qū)分開,將在下一步進行深入研究。