劉伯駿 張亞萍* 黎中菊 韓 瀟 蘆 華 張 勇
1)(重慶市氣象臺,重慶 401147) 2)(重慶市氣象科學(xué)研究所,重慶 401147)
近年隨著計(jì)算機(jī)科學(xué)的發(fā)展和大數(shù)據(jù)處理能力的提升,應(yīng)用深度學(xué)習(xí)等人工智能技術(shù)進(jìn)行強(qiáng)對流風(fēng)暴識別和預(yù)報(bào),成為越來越多研究者的選擇[1-3]。深度學(xué)習(xí)一般分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),當(dāng)帶標(biāo)識的樣本較少時(shí),也會采用半監(jiān)督學(xué)習(xí)。無論監(jiān)督學(xué)習(xí)還是半監(jiān)督學(xué)習(xí),標(biāo)識工作是建立深度學(xué)習(xí)數(shù)據(jù)集的關(guān)鍵基礎(chǔ),這在觀測數(shù)據(jù)匱乏的災(zāi)害性天氣智能預(yù)報(bào)中尤為重要。標(biāo)識正確、質(zhì)量可靠的數(shù)據(jù)集,對深度學(xué)習(xí)算法準(zhǔn)確率有決定性影響。由于強(qiáng)對流事件發(fā)生概率低、過程時(shí)間短、空間尺度小,導(dǎo)致觀測難度大,觀測數(shù)據(jù)往往不完備,制約了深度學(xué)習(xí)在相關(guān)領(lǐng)域的應(yīng)用。其中,冰雹的地面實(shí)況觀測最少,觀測時(shí)間不明也很常見。將冰雹實(shí)況信息與天氣雷達(dá)監(jiān)測和跟蹤的風(fēng)暴體進(jìn)行匹配,可以充分利用地面實(shí)況,提高冰雹觀測數(shù)據(jù)完備性。
本文將無地面實(shí)況情況下,根據(jù)天氣雷達(dá)觀測到的風(fēng)暴體特征進(jìn)行降雹風(fēng)暴體(下文簡稱雹暴)判識稱為雹暴識別,而將標(biāo)明導(dǎo)致地面出現(xiàn)冰雹實(shí)況的風(fēng)暴體稱為雹暴標(biāo)識,即將天氣雷達(dá)觀測到的強(qiáng)對流風(fēng)暴體與地面實(shí)況相匹配,算法核心在于根據(jù)地面冰雹事件發(fā)生的時(shí)空信息,找出導(dǎo)致該事件的風(fēng)暴體(雹暴)。為彌補(bǔ)地面觀測不足,Gange等[2]將雹暴識別結(jié)果(WSR-88D中冰雹探測算法[4])用于建立冰雹實(shí)況數(shù)據(jù)集,并指出氣候統(tǒng)計(jì)證實(shí)冰雹識別結(jié)果與冰雹地面報(bào)告的空間分布基本一致[5]。張秉祥等[6]根據(jù)地面站的冰雹觀測,利用其相對準(zhǔn)確的時(shí)間,搜索冰雹發(fā)生時(shí)刻及前兩個體掃的風(fēng)暴體,通過綜合指數(shù)標(biāo)識雹暴。王瑾等[7]在雹暴標(biāo)識上,采用以下規(guī)則:①風(fēng)暴單體識別和跟蹤(the storm cell identification and tracking,簡稱SCIT[8-9])算法識別的風(fēng)暴體要在人工影響天氣炮點(diǎn)5 km范圍內(nèi);②風(fēng)暴體在連續(xù)兩個體掃時(shí)間內(nèi)達(dá)到一定強(qiáng)度;③對于有準(zhǔn)確時(shí)間記錄的冰雹事件,識別出風(fēng)暴體的時(shí)間必須在地面記錄時(shí)刻前15 min到記錄時(shí)刻后5 min范圍內(nèi);④對于無準(zhǔn)確時(shí)間的降雹記錄,考慮距離炮點(diǎn)最近的風(fēng)暴體為雹暴;⑤風(fēng)暴體必須在雷達(dá)靜錐區(qū)外且在觀測范圍內(nèi)。若滿足上述條件的風(fēng)暴體不唯一,以距離為判斷依據(jù)。然而炮點(diǎn)觀測有限,對于如何利用更普遍的、時(shí)空信息更模糊的地面災(zāi)情報(bào)告進(jìn)行雹暴標(biāo)識,仍沒有完整的解決方案。
在以上雹暴識別和標(biāo)識方法的基礎(chǔ)上,本文利用重慶地區(qū)災(zāi)情信息中有準(zhǔn)確觀測時(shí)間的冰雹過程實(shí)況數(shù)據(jù),選取空間上有利于描述地面觀測與風(fēng)暴體匹配程度的判別因子,采用模糊邏輯算法,提出一種融合地面冰雹實(shí)況信息和雷達(dá)觀測的客觀標(biāo)識方法,以解決時(shí)間信息模糊時(shí)的雹暴標(biāo)識問題。
利用中國氣象局災(zāi)害性天氣短時(shí)臨近預(yù)報(bào)預(yù)警業(yè)務(wù)系統(tǒng)SWAN(Severe Weather Automatic Nowcast System)進(jìn)行雷達(dá)回波三維拼圖及SCIT產(chǎn)品計(jì)算。由于重慶及其周邊雷達(dá)站陸續(xù)建成,不同年份拼圖所使用的原始雷達(dá)數(shù)量不同:2008—2009年僅使用重慶雷達(dá)數(shù)據(jù),2010—2011年使用重慶、萬州2部雷達(dá)數(shù)據(jù)拼圖,2012年使用重慶、萬州、黔江3部雷達(dá)拼圖,2013—2014年使用重慶、萬州、黔江、永川4部雷達(dá)拼圖,2015—2019年使用重慶、萬州、黔江、永川、南充、宜賓、成都、達(dá)州、遵義、恩施、宜昌、懷化共12部雷達(dá)拼圖。SCIT算法使用雷達(dá)拼圖數(shù)據(jù)的水平分辨率為1 km×1 km,時(shí)間分辨率為6 min。
災(zāi)情報(bào)告是一種描述氣象災(zāi)害詳細(xì)情況的信息。災(zāi)情信息通常由氣象信息員觀測收集,或通過民政部、應(yīng)急管理部等相關(guān)單位共享得到,經(jīng)各基層氣象部門匯總后形成災(zāi)情報(bào)告,上報(bào)到中國氣象局氣象災(zāi)害管理系統(tǒng),供相關(guān)用戶下載使用。氣象信息員行政村(社區(qū))覆蓋率一直穩(wěn)定在較高水平,這一數(shù)據(jù)被認(rèn)為有較好一致性和較高空間密度[10]。但應(yīng)注意到災(zāi)情報(bào)告通常為事后收集,對冰雹等災(zāi)害性天氣的時(shí)空描述往往比較模糊,僅有少量過程能提供相對精確的降雹時(shí)間點(diǎn)。
本文將冰雹事件分為兩類:有相對準(zhǔn)確時(shí)間信息的過程(簡稱時(shí)間確定過程)和無相對準(zhǔn)確時(shí)間信息的過程(簡稱時(shí)間不確定過程)。重慶地區(qū)災(zāi)情報(bào)告顯示:2008—2019年共發(fā)生冰雹事件64次,27個區(qū)縣受冰雹災(zāi)害影響。其中時(shí)間確定過程19次,時(shí)間不確定過程45次,但受到觀測數(shù)據(jù)限制(如雷達(dá)數(shù)據(jù)缺失或雹暴處于雷達(dá)觀測盲區(qū)),可用于標(biāo)識算法研究的時(shí)間確定過程和時(shí)間不確定過程分別僅有13次和22次(時(shí)間確定過程見表1,其中時(shí)間為北京時(shí),下同)。為此,基于時(shí)間確定過程中2008—2018年的8次過程(簡稱參照集)構(gòu)建標(biāo)識算法,將2019年5次過程(簡稱驗(yàn)證集)用以檢驗(yàn)。
表1 2008—2019年重慶地區(qū)有相對準(zhǔn)確時(shí)間和雷達(dá)觀測數(shù)據(jù)的冰雹過程Table 1 Hail cases with exactly time and radar observation in Chongqing during 2008-2019
本文基于2008—2019年重慶地區(qū)冰雹災(zāi)情報(bào)告,確定冰雹發(fā)生的大致時(shí)空信息。根據(jù)對應(yīng)時(shí)段的SCIT產(chǎn)品確定備選風(fēng)暴體,并基于三維拼圖數(shù)據(jù)計(jì)算風(fēng)暴體雷達(dá)觀測特性信息。利用模糊邏輯算法,綜合時(shí)空信息和風(fēng)暴體雷達(dá)觀測特性進(jìn)行雹暴標(biāo)識(圖1)。
圖1 雹暴客觀標(biāo)識方法流程Fig.1 Diagram of the object-labeling algorithm for hailstorm
由于強(qiáng)對流天氣的發(fā)生發(fā)展需要滿足多個物理?xiàng)l件,且不同類型強(qiáng)對流天氣的物理量統(tǒng)計(jì)結(jié)果表明,很難找到一個完全明確的、單一物理量閾值表征某類天氣發(fā)生發(fā)展的物理?xiàng)l件[11-12],因此需要能夠綜合應(yīng)用代表不同物理?xiàng)l件的多個物理量的方法,模糊邏輯方法正是其中之一[13]。1965年美國數(shù)學(xué)家Zadeh[14]首先提出模糊集合的概念,標(biāo)志著模糊數(shù)學(xué)的誕生。模糊邏輯善于表達(dá)界線不清晰的知識與經(jīng)驗(yàn),借助隸屬函數(shù)的概念,處理模糊關(guān)系,在氣象領(lǐng)域應(yīng)用廣泛[6,15-21]。本文根據(jù)災(zāi)情報(bào)告給出的時(shí)空信息,將距離也引入隸屬函數(shù),結(jié)合以往研究雹暴識別的常用指標(biāo),采用模糊邏輯算法,形成雹暴客觀標(biāo)識方法。
結(jié)合前人研究成果[22-24]與重慶本地經(jīng)驗(yàn)總結(jié)[25],選取風(fēng)暴體最大反射率因子(CRM,單位:dBZ)、風(fēng)暴體最大回波頂高(ETM,單位:km)、最大垂直積分液態(tài)水含量(VILM,單位:kg·m-2)及45 dBZ所在最大高度(H,單位:km)作為雷達(dá)觀測指標(biāo),選用風(fēng)暴體質(zhì)心與冰雹災(zāi)害初始猜測位置(簡稱初猜位置,精確到秒)間的距離(DIST,單位:km)作為地面觀測指標(biāo)。
2.1.1 風(fēng)暴體質(zhì)心與初猜位置間的距離(DIST)
初猜位置由災(zāi)情報(bào)告中冰雹災(zāi)害的空間位置信息確定,進(jìn)而根據(jù)SCIT算法識別的風(fēng)暴質(zhì)心位置計(jì)算DIST。Witt等[4]認(rèn)為,當(dāng)最近的風(fēng)暴體與地面災(zāi)情報(bào)告位置相距50 km或更遠(yuǎn)時(shí)不合理,因此DIST的上限被設(shè)置為50 km;作為冰雹母體的雷暴是γ中尺度系統(tǒng),根據(jù)Orlanski[26]尺度劃分理論,其水平特征空間尺度為20 km。若假設(shè)風(fēng)暴體近似為圓形,則其半徑為10 km。因此,當(dāng)DIST不大于10 km時(shí),可認(rèn)為在距離上已達(dá)最優(yōu)情況(圖2)。
2.1.2 風(fēng)暴最大反射率因子(CRM)
多普勒天氣雷達(dá)是監(jiān)測對流系統(tǒng)的基本手段,強(qiáng)對流天氣系統(tǒng)常伴有強(qiáng)烈的上升運(yùn)動和顯著的水汽相態(tài)變化[27],CRM較大是表征強(qiáng)對流的重要指標(biāo)。本文設(shè)置CRM上限時(shí)參考張秉祥等[6]在利用模糊邏輯進(jìn)行雹暴判識時(shí)的閾值60 dBZ;考慮到重慶地形復(fù)雜、遮擋嚴(yán)重,將CRM隸屬函數(shù)下限設(shè)置為30 dBZ(圖2)。
2.1.3 風(fēng)暴最大回波頂高(ETM)
ETM指風(fēng)暴體投影范圍內(nèi),18 dBZ所能達(dá)到的最大高度。相比于雷暴和短時(shí)大風(fēng)等強(qiáng)對流天氣,冰雹對應(yīng)的風(fēng)暴體回波頂更高[28]。張秉祥等[6]將回波頂上下限分別設(shè)置為8 km和6 km。本研究中,為了將更多風(fēng)暴體納入備選范圍,將ETM下限降至5 km。結(jié)合重慶本地強(qiáng)對流統(tǒng)計(jì)結(jié)果,強(qiáng)對流天氣的ETM主要在10 km以上,以此確定ETM上限為10 km(圖2)。
2.1.4 風(fēng)暴45 dBZ所在最大高度(H)
H指風(fēng)暴體中45 dBZ回波所到達(dá)的最大高度。Smith等[29]指出,云內(nèi)最初冰雹凝結(jié)體直徑中位數(shù)約為0.4~0.5 cm。根據(jù)Marshall-Palmer雨滴譜指數(shù)分布關(guān)系式推導(dǎo)出,冰雹凝結(jié)體初期等效雷達(dá)反射率因子約為45 dBZ。判斷冰雹簡單有效的方法是比較強(qiáng)回波高度相對于0℃和-20℃等溫線高度的位置[6],當(dāng)45 dBZ超過0℃高度時(shí),可能出現(xiàn)冰雹;當(dāng)45 dBZ回波所在高度超過-20℃層時(shí),出現(xiàn)冰雹概率極大。根據(jù)2014—2018年重慶沙坪壩站探空數(shù)據(jù)統(tǒng)計(jì),3—9月重慶0℃層和-20℃層平均高度如表2所示。據(jù)此,將H的下限和上限分別設(shè)置為3 km和8 km(圖2)。
表2 2014—2018年3—9月重慶沙坪壩站平均0℃和-20℃層高度Table 2 Average heights of 0℃ and -20℃ at Shapingba sounding station from Mar to Sep during 2014-2018
圖2 降雹風(fēng)暴體客觀標(biāo)識方法中各指標(biāo)的隸屬函數(shù)Fig.2 Membership functions of each index of object-labeling algorithm for hailstorm
2.1.5 風(fēng)暴最大垂直積分液態(tài)水含量(VILM)
VILM定義為風(fēng)暴體投影范圍內(nèi)最大垂直積分液態(tài)水含量,值越大,對流性越強(qiáng)。該指標(biāo)對于冰雹過程有較好指示意義。張秉祥等[6]將VILM的下限和上限分別設(shè)置為35 kg·m-2和55 kg·m-2??紤]重慶地區(qū)雷達(dá)波束有時(shí)受地形遮擋影響,本文對上述指標(biāo)略作下調(diào),分別為25 kg·m-2和50 kg·m-2(圖2)。
本文對DIST,CRM,ETM,H,VILM的權(quán)重分別設(shè)置為0.4,0.2,0.2,0.1和0.1。其中,對CRM,ETM,H,VILM,本文參考已有研究成果設(shè)置權(quán)重。而DIST作為標(biāo)識算法中獨(dú)有的指標(biāo),將測試不同距離權(quán)重對標(biāo)識算法結(jié)果的影響。為此,設(shè)定以下敏感性試驗(yàn):當(dāng)距離權(quán)重取值自0.1逐步遞增至0.9時(shí),其余物理量按比例分配剩余權(quán)重,保持各權(quán)重之和為1。將以上描述可表示為
wDIST=i/10,i=1,2,3,…,9;
(1)
(2)
(3)
式(1)~式(3)中,wDIST,wCRM,wETM,wH,wVILM分別表示DIST,CRM,ETM,H,VILM的權(quán)重。
當(dāng)距離選取不同權(quán)重時(shí),算法在參照集中標(biāo)識結(jié)果變化如圖3所示。圖中橫坐標(biāo)為距離權(quán)重,縱坐標(biāo)為不同過程中,算法標(biāo)識時(shí)間與地面災(zāi)情報(bào)告中記錄的冰雹發(fā)生時(shí)間之差,其正(負(fù))值代表算法標(biāo)識時(shí)間較晚(早)。當(dāng)wDIST較小,算法挑選發(fā)展更旺盛、距離稍遠(yuǎn)的對流風(fēng)暴體;反之,當(dāng)wDIST過大,則標(biāo)識更多參考距離的影響。由圖3可見,對于部分過程(如2008年4月10日、2011年7月23日、2014年4月17日、2015年7月25日的冰雹過程),客觀標(biāo)識算法結(jié)果與距離權(quán)重?zé)o關(guān),這是因?yàn)楸⒈┳顝?qiáng)時(shí)刻與地面觀測到的降雹時(shí)刻相對應(yīng)。但對于其余過程,降雹時(shí)刻與雹暴最強(qiáng)時(shí)刻不同,此時(shí)引入距離信息可以改善標(biāo)識效果(如2008年6月5日、2010年5月6日、2018年3月17日的冰雹過程)??傮w上,隨著DIST權(quán)重增加至0.4,時(shí)間差的方差(圖略)收斂至最小,平均值接近于0。因此,后續(xù)計(jì)算中,取DIST權(quán)重為0.4。
圖3 距離權(quán)重選取對標(biāo)識結(jié)果的影響Fig.3 The influence of distance weight on labeling results
由于雷達(dá)拼圖時(shí)間以6 min為間隔,標(biāo)識結(jié)果很難與地面災(zāi)情報(bào)告時(shí)間一一對應(yīng)。若標(biāo)識結(jié)果與觀測時(shí)間之差處于[-18 min,12 min]的時(shí)間窗內(nèi),則認(rèn)為標(biāo)識正確??傮w而言,客觀算法可以準(zhǔn)確給出冰雹發(fā)生時(shí)間及對應(yīng)的風(fēng)暴體,針對8次過程,有7次能夠正確標(biāo)識,其中有5次標(biāo)識時(shí)間與災(zāi)情報(bào)告描述的時(shí)間相差在1個體掃(6 min)內(nèi)(表3)。對于2008年6月5日豐都小冰雹過程,因SWAN中的SCIT算法未識別出風(fēng)暴體,所以造成客觀算法未能標(biāo)識成功。表3同時(shí)給出客觀算法對不同過程所標(biāo)識出的風(fēng)暴體的匹配程度,即模糊邏輯中的綜合隸屬度。匹配程度由各判別因子乘各自對應(yīng)權(quán)重并求和得到。表3表明:參照集中風(fēng)暴體匹配程度普遍較大(大于0.78),平均匹配程度為0.924,標(biāo)準(zhǔn)差為0.096。匹配程度與冰雹尺寸的相關(guān)性較差,如對大冰雹而言,既有匹配程度達(dá)到1.000的2014年沙坪壩冰雹,也有匹配程度為0.805 的2018年彭水冰雹。分析發(fā)現(xiàn),絕大部分過程中導(dǎo)致匹配程度下降的原因是垂直積分液態(tài)水含量較小,而垂直積分液態(tài)水含量主要與冰雹發(fā)生地點(diǎn)與雷達(dá)站的距離有關(guān)。
表3 雹暴標(biāo)識客觀算法在參照集的標(biāo)識效果Table 3 Results of objective labeling algorithm for hailstorm based on reference set
圖4展示冰雹標(biāo)識算法給出的標(biāo)識時(shí)刻垂直積分液態(tài)水含量、組合反射率因子以及SCIT算法給出的風(fēng)暴路徑信息。為了更好地測試算法特性,從以下幾個方面進(jìn)行試驗(yàn):①針對上述過程,輸入數(shù)據(jù)時(shí)間長度隨機(jī)分布,使每個過程計(jì)算時(shí)間長度為4.5~8 h。結(jié)果顯示,輸入數(shù)據(jù)時(shí)長對標(biāo)識結(jié)果沒有顯著影響。②上述過程共有大冰雹過程3次,小冰雹過程3次,冰雹大小不明過程2次。若SWAN中SCIT算法可以識別出風(fēng)暴體,則冰雹尺寸對標(biāo)識結(jié)果無顯著影響。③冰雹災(zāi)害所發(fā)生的月份不同、時(shí)間不同(午后或夜間),未對算法的準(zhǔn)確性產(chǎn)生影響。④算法對風(fēng)暴體生命史長度不敏感。無論對2010年5月6日的長生命史風(fēng)暴體,還是2015年7月25日豐都太平壩鄉(xiāng)的局地生消雹暴,標(biāo)識算法均能給出較好標(biāo)識結(jié)果。
圖4 各冰雹過程中算法標(biāo)識時(shí)刻的垂直積分液態(tài)水含量(填色)、組合反射率因子(實(shí)線,單位:dBZ)及SCIT識別的風(fēng)暴體路徑(三角,紅色為標(biāo)識時(shí)刻)Fig.4 Vertical integrated liquid water(the shaded),composite reflectivity(the line,unit:dBZ) and storm path from SCIT at labeling time for each hail case(triangles,the red one means labeling time)
續(xù)圖4
雖然客觀標(biāo)識算法整體標(biāo)識效果較好,但在2008年6月5日南川冰雹過程中標(biāo)識效果并不理想:地面災(zāi)情報(bào)告中提及的時(shí)間為15:20,而標(biāo)識結(jié)果為15:06,時(shí)間偏差為14 min;對于豐都冰雹,災(zāi)情報(bào)告中記錄時(shí)間約為15:30,而標(biāo)識算法未能給出結(jié)果。
圖5給出此次過程降雹臨近時(shí)刻SWAN拼圖組合反射率因子及SCIT識別風(fēng)暴結(jié)果,且標(biāo)明地面觀測指出的降雹位置和時(shí)間,15:24時(shí)刻數(shù)據(jù)缺失。由圖5可見,對于豐都冰雹,SCIT算法在臨近時(shí)刻均未識別出風(fēng)暴體,算法標(biāo)識失敗。對于南川冰雹,SCIT算法在15:18,15:30也未能識別出風(fēng)暴體,因此標(biāo)識算法僅能從15:06,15:12,15:42中挑選。風(fēng)暴強(qiáng)度15:42最強(qiáng),15:06次之,15:12最弱。結(jié)合距離因素,客觀算法最終將冰雹發(fā)生時(shí)間定為15:06。以上分析表明:客觀標(biāo)識算法對風(fēng)暴體識別結(jié)果較為敏感。
圖5 2008年6月5日南川、豐都冰雹過程組合反射率因子演變及風(fēng)暴路徑信息Fig.5 Composite reflectivity evolution with storm path information in the hail case at Nanchuan and Fengdu on 5 Jun 2008
由標(biāo)識方法構(gòu)建過程及權(quán)重分配可知,在標(biāo)識過程中,初猜位置對標(biāo)識結(jié)果影響較大。以2008年4月10日南川冰雹為例分析初猜位置偏差的影響,并利用有SCIT識別結(jié)果的參照集過程,分析初猜擾動對標(biāo)識結(jié)果的影響。
對2008年4月10日南川冰雹過程,客觀算法標(biāo)識時(shí)刻為21:42,而災(zāi)情報(bào)告指出南川德隆鎮(zhèn)21:30 開始降雹,時(shí)間偏差為12 min。圖6為21:30—21:42組合反射率因子演變及SCIT識別單體情況。由于臨近降雹時(shí)刻,僅有1個單體在德隆鎮(zhèn)上空,因此可確定該單體造成降雹。追溯歷史位置,該風(fēng)暴體以約40 km·h-1的速度向東移動,并于21:30—21:36分進(jìn)入德隆鎮(zhèn)邊界范圍,與災(zāi)情報(bào)告時(shí)間基本對應(yīng)。標(biāo)識偏差相對較大與初猜位置定位有關(guān)。初猜位置由災(zāi)情報(bào)告中鄉(xiāng)鎮(zhèn)名稱定位而得,因此定位位置常為鄉(xiāng)鎮(zhèn)政府所在地或人口密集區(qū)。對于面積較大(或行政邊界中,任一方向距離較遠(yuǎn))的鄉(xiāng)鎮(zhèn),這種定位方式會導(dǎo)致誤差,對標(biāo)識結(jié)果產(chǎn)生不利影響。由此可以推斷,若降雹風(fēng)暴體尺度較大或呈帶狀,可能導(dǎo)致風(fēng)暴識別算法對風(fēng)暴定位與降雹位置產(chǎn)生一定偏移,影響標(biāo)識結(jié)果。
圖6 2008年4月10日南川冰雹組合反射率因子演變及風(fēng)暴路徑信息Fig.6 Composite reflectivity evolution with storm path information in the hail case at Nanchuan on 10 Apr 2008
為了定量探討初猜位置對標(biāo)識結(jié)果影響,通過改變參照集(除去無SCIT產(chǎn)品的2008年6月5日豐都冰雹)的初猜位置進(jìn)行擾動試驗(yàn):以原始初猜位置為圓心,10 km為半徑,每隔30°方位構(gòu)建新的初猜位置,并基于新位置進(jìn)行冰雹標(biāo)識。標(biāo)識結(jié)果平均時(shí)間偏差和均方根誤差(圖7)顯示,初猜位置的10 km偏差會對標(biāo)識結(jié)果產(chǎn)生平均值為[-8 min,12 min]的影響,這在多數(shù)情況下不影響標(biāo)識準(zhǔn)確率。絕大部分過程中,時(shí)間偏差的均方根誤差小于14 min,與平均偏差量級相當(dāng)。但對于部分過程(如2008年6月5日南川冰雹),初猜位置的偏移會引起較大標(biāo)識結(jié)果離散度,這可能與當(dāng)天回波較為分散、備選風(fēng)暴體較多有關(guān)。
圖7 初猜位置擾動對標(biāo)識結(jié)果的影響Fig.7 Influence of initial guess position disturbance on labeling results
為了檢驗(yàn)客觀標(biāo)識方法的適用性,本文分別對驗(yàn)證集和時(shí)間不確定過程進(jìn)行標(biāo)識。對于驗(yàn)證集,在標(biāo)識過程中去除準(zhǔn)確時(shí)間信息,使算法在標(biāo)識過程中將時(shí)間搜索范圍擴(kuò)大到冰雹發(fā)生前后的幾個小時(shí),從而模擬災(zāi)情報(bào)告沒有準(zhǔn)確時(shí)間信息描述的情形。如果算法標(biāo)識時(shí)間處于地面觀測時(shí)段或其鄰近時(shí)間窗范圍內(nèi),則認(rèn)為算法標(biāo)識正確。對于時(shí)間不確定過程,文中將標(biāo)識算法給出的時(shí)間與經(jīng)驗(yàn)豐富的短臨預(yù)報(bào)員給出的標(biāo)識結(jié)果進(jìn)行比較,以判斷客觀方法是否與預(yù)報(bào)員標(biāo)識結(jié)果接近。
對于已建立的客觀標(biāo)識方法,采用驗(yàn)證集進(jìn)行測試,結(jié)果顯示:對于驗(yàn)證集5個過程,客觀算法標(biāo)識正確率為100%,匹配程度分布在0.887至1.000之間(表4),這與標(biāo)識算法基于參照集的分布基本相當(dāng)。對各過程中匹配程度丟分項(xiàng)分析表明:除2019年4月24日巫溪冰雹過程因風(fēng)暴體質(zhì)心距離初猜位置較遠(yuǎn)導(dǎo)致匹配程度低之外,其余過程均因風(fēng)暴體垂直積分液態(tài)水含量較低而導(dǎo)致匹配程度降低。以上結(jié)果初步證實(shí)客觀標(biāo)識算法具有較好的泛化能力,可以在時(shí)間信息模糊的情況下進(jìn)行正確標(biāo)識,為冰雹數(shù)據(jù)集的擴(kuò)展增加可能性。
表4 雹暴標(biāo)識客觀算法在驗(yàn)證集的標(biāo)識效果Table 4 Performance of objective labeling algorithm for hailstorm based on validation set
時(shí)間不確定過程中,災(zāi)情報(bào)告無法提供精確的時(shí)空信息,但可以將標(biāo)識算法得到的時(shí)間與經(jīng)驗(yàn)豐富的短臨預(yù)報(bào)員給出的標(biāo)識結(jié)果進(jìn)行比較,判斷二者是否一致。針對22次時(shí)間不確定過程,預(yù)報(bào)員給出的標(biāo)識結(jié)果與客觀算法基本一致:18個過程標(biāo)識正確;2個過程回波偏弱,因預(yù)報(bào)員未給出標(biāo)識結(jié)果無法比較;2個過程時(shí)間相差較遠(yuǎn),分別為30 min和36 min,經(jīng)查驗(yàn),由于災(zāi)情報(bào)告給出的空間范圍較大,主客觀標(biāo)識過程中對初猜位置的認(rèn)定有出入,導(dǎo)致標(biāo)識時(shí)間相差較遠(yuǎn)。此外,比較主客觀標(biāo)識結(jié)果顯示:預(yù)報(bào)員更傾向于將標(biāo)識時(shí)間提前1~2個體掃,標(biāo)識出的風(fēng)暴體較災(zāi)情報(bào)告描述地點(diǎn)稍遠(yuǎn)、強(qiáng)度稍弱,在此情況下,主客觀往往標(biāo)識的是同一個風(fēng)暴體,因此對數(shù)據(jù)集構(gòu)建影響不大。
以2018年4月30日江津中山鎮(zhèn)冰雹過程為例,考察標(biāo)識算法在時(shí)間不確定過程中的標(biāo)識效果。針對此次過程,災(zāi)情報(bào)告給出如下描述:“在低層低渦和冷空氣的共同作用下,4月30日20:00—5月1日14:00我區(qū)各地出現(xiàn)明顯雷陣雨天氣,部分地區(qū)伴有雷電、短時(shí)強(qiáng)降水、陣性大風(fēng)、冰雹等強(qiáng)對流天氣。具體雨量……受局部大風(fēng)和冰雹影響,我區(qū)中山鎮(zhèn)遭受風(fēng)雹災(zāi)害?!睋?jù)此,測算初猜位置為28.79°N,106.28°E,并確定搜索時(shí)間段為4月30日20:00—5月1日14:00。將以上信息輸入到標(biāo)識算法,得到標(biāo)識結(jié)果:4月30日20:12中山鎮(zhèn)西部風(fēng)暴體導(dǎo)致降雹。圖8a給出4月30日20:12 SWAN組合反射率因子、初猜位置信息。風(fēng)暴體最強(qiáng)回波超過65 dBZ,且距初猜位置較近。對風(fēng)暴體沿圖8a中AB兩點(diǎn)進(jìn)行剖面(圖8b),可見最強(qiáng)回波中心約處于5 km高度,超過當(dāng)日0℃層所在高度(30日20:00鄰近探空站測得0℃層高度為4.38 km),且45 dBZ延伸至12 km左右(-20℃層高度為7.63 km)。風(fēng)暴體東北側(cè)低層有弱回波區(qū),對應(yīng)低層較強(qiáng)的上升氣流。以上分析可知,識別算法給出降雹時(shí)間的雷達(dá)回波符合傳統(tǒng)降雹風(fēng)暴體特征,該風(fēng)暴體降雹可能性很大,且風(fēng)暴體距離災(zāi)情報(bào)告中致災(zāi)位置較近,標(biāo)識結(jié)果合理。此次過程,人工標(biāo)識降雹時(shí)間為20:06,比客觀方法提前6 min。此時(shí)刻風(fēng)暴體已從西面接近中山鎮(zhèn),但距離稍遠(yuǎn),強(qiáng)度基本相當(dāng)。
圖8 2018年4月30日20:12雷達(dá)組合反射率因子(a)及其沿圖8a中AB所作剖面(b)Fig.8 Composite reflectivity at 2012 BT 30 Apr 2018(a) and profile along AB in Fig.8a(b)
本文選取2008—2019年重慶地區(qū)冰雹天氣過程,并將災(zāi)情報(bào)告與雷達(dá)觀測的強(qiáng)對流風(fēng)暴體進(jìn)行合理匹配,發(fā)展基于地面實(shí)況觀測的雹暴標(biāo)識算法。對于參照集,8次冰雹過程,算法正確標(biāo)識7次,其中有5次標(biāo)識時(shí)間與災(zāi)情報(bào)告描述的時(shí)間相差1個體掃。通過驗(yàn)證集和時(shí)間不確定過程的檢驗(yàn),證實(shí)標(biāo)識方法可在時(shí)間信息模糊的情況下進(jìn)行標(biāo)識。具體分析表明:
1) 冰雹大小對標(biāo)識結(jié)果沒有顯著影響。冰雹災(zāi)害發(fā)生的月份和時(shí)間(午后或夜間),未對標(biāo)識算法的準(zhǔn)確性產(chǎn)生影響。冰雹生命史長短對標(biāo)識結(jié)果無顯著影響,無論2010年5月6日的長生命史雹暴,還是2015年7月25日豐都太平壩鄉(xiāng)的局地生消雹暴,算法均能給出較好標(biāo)識效果。
2) 標(biāo)識結(jié)果對SCIT風(fēng)暴體識別算法較為敏感,對風(fēng)暴識別算法能否識別出風(fēng)暴體對標(biāo)識結(jié)果有直接影響,其給出的風(fēng)暴體質(zhì)心位置(或風(fēng)暴體大小等特性)對標(biāo)識結(jié)果有間接影響。另外,初猜位置也會影響標(biāo)識結(jié)果。
3) 驗(yàn)證集檢驗(yàn)和時(shí)間不確定過程主客觀標(biāo)識結(jié)果表明,標(biāo)識算法可在無準(zhǔn)確時(shí)間信息情況下對雹暴進(jìn)行合理標(biāo)識。
以上研究所選用降雹過程有限,且均為重慶地區(qū)冰雹過程,后續(xù)研究中將豐富降雹過程,進(jìn)一步驗(yàn)證標(biāo)識算法的泛化能力。此外,在冰雹數(shù)據(jù)集中負(fù)樣本(即該風(fēng)暴體確定沒有降雹)的標(biāo)識方法有待研究。