黃毅 候玉芳 趙澤棲
收稿日期:2023-08-01
基金項目:邢臺市重點研發(fā)計劃自籌項目(2021ZC038)
DOI:10.19850/j.cnki.2096-4706.2024.06.031
摘? 要:選取2020年5月3日邢臺出現(xiàn)四個超級單體的強對流過程,以6分鐘的間隔對三維閃電數(shù)據(jù)進行劃分,使用DBSCAN聚類算法刪除離散點,使用K-means聚類算法對三維閃電數(shù)據(jù)進行聚類分析。選取輪廓系數(shù)最大的K值,并與雷達回波拼圖數(shù)據(jù)進行對比,識別四個超級單體并計算聚類中心和聚類最大半徑,使用趨勢外推法對四個超級單體的運動軌跡進行預測。分析表明:DBSCAN聚類算法可以有效刪除離散點,操作性強;四個超級單體的K-means算法聚類中心和30 dBZ以上的強回波區(qū)域一致性較好,可以獲取聚類中心運動軌跡和聚類最大半徑;使用臨近三個時次數(shù)據(jù)進行趨勢外推,MSE最小,該方法對雷電預警信號發(fā)布有參考價值。
關鍵詞:DBSCAN;K-means;三維閃電;強回波區(qū);趨勢外推法
中圖分類號:TP391? ? 文獻標識碼:A? 文章編號:2096-4706(2024)06-0145-04
Application of Clustering Algorithm in Lightning Early Warning for Four Supercell Strong Convective Processes
HUANG Yi, HOU Yufang, ZHAO Zexi
(Xingtai Meteorological Bureau, Xingtai? 054099, China)
Abstract: It selects four supercell strong convective processes that occurred in Xingtai on May 3, 2020, the three-dimensional lightning data is divided at 6 minutes intervals. The DBSCAN clustering algorithm is used to remove discrete points, and the K-means clustering algorithm is used to perform clustering analysis on the three-dimensional lightning data. It selects the K value with the highest contour coefficient and compare it with the radar echo mosaic data to identify four supercells and calculate the clustering center and clustering maximum radius. Trend projection is used to predict the motion trajectories of the four supercells. Analysis shows that the DBSCAN clustering algorithm can effectively delete discrete points and has strong operability. The K-means algorithm for four supercells has good consistency in clustering centers and strong echo areas above 30 dBZ, and can obtain the movement trajectory of clustering centers and the maximum radius of clustering. Using data from nearly three time periods for trend projection, with the minimum MSE, this method has reference value for the release of lightning early warning signals.
Keywords: DBSCAN; K-means; three-dimensional lightning; strong echo area; trend projection
0? 引? 言
雷電預警在雷電災害防范中發(fā)揮著重要作用。2022年,河北省突發(fā)事件預警信息發(fā)布平臺發(fā)布預警信息38 117條,其中雷電預警信號發(fā)布量占27.95%,排名第二。目前,河北省已部署11臺雷電觀測設備,完成了覆蓋全省的閃電定位儀監(jiān)測網(wǎng)建設。為避免強對流天氣中出現(xiàn)雷雨大風、冰雹、短時強降水等災害,升級全閃電定位探測站,新建甚高頻閃電測繪陣列。
于涵等[1]利用基于BLNet的全閃三維定位和多普勒天氣雷達資料,分析了2015至2017年北京暖季7次強颮線過程的閃電活動與雷達回波強度之間的關系,分析結(jié)果表明,閃電主要發(fā)生在前部線狀對流云區(qū)內(nèi),且集中分布在30 dBZ以上的強回波區(qū)域,小部分閃電分布在后部的層狀云區(qū)域內(nèi)。候榮濤等[2]使用IDBSCAN改進聚類算法進行閃電聚類分析。王力艷等[3]對一次颮線過程中閃電活動與雷達回波特征進行分析,地閃主要發(fā)生在大于30 dBZ的雷達回波內(nèi),在40 dBZ以上的強回波中心最為密集,且地閃密集區(qū)并不是發(fā)生在雷達回波最強盛的時期,而是緊隨其后。阮悅等[4]對冰雹云三維閃電及雙偏振雷達回波特征進行分析,分析結(jié)果表明,閃電頻數(shù)、正地閃或正地閃占比率與回波強度、最強回波高度、強回波伸展高度呈正相關。
閃電定位數(shù)據(jù)分為三維閃電定位數(shù)據(jù)(VLF/LF)和二維閃電定位數(shù)據(jù)(ADTD),卜俊偉等[5]對四川省云地閃和三維閃電檢測系統(tǒng)進行了對比,結(jié)果表明三維閃電檢測系統(tǒng)所檢測的數(shù)據(jù)量明顯高于云地閃系統(tǒng),三維閃電系統(tǒng)的檢測數(shù)據(jù)量是云地閃觀測系統(tǒng)的2倍多。余蓉等[6]對湖北省兩套閃電定位網(wǎng)的地閃進行對比,三維閃電定位網(wǎng)的探測靈敏度和探測效率明顯高于二維閃電定位網(wǎng),前者探測到的閃擊總數(shù)約為后者的2.3倍,且能夠探測到更多偏弱的正閃擊,閃電強度也更為集中。成勤等[7]通過一次特大暴雨過程對三維閃電系統(tǒng)和二維閃電系統(tǒng)的閃電特征進行對比分析,三維閃電系統(tǒng)的地閃密度大于二維閃電系統(tǒng)。馬強[8]對VLF/LF型閃電定位儀的三維閃電數(shù)據(jù)和ADTD型閃電定位數(shù)據(jù)進行了對比,VLF/LF型閃電定位儀在低電流地閃觀測精度、云閃觀測精度等方面均優(yōu)于ADTD型閃電定位儀。
考慮到雷暴中心和30 dBZ以上強回波區(qū)域?qū)P系的復雜性,本文利用三維閃電數(shù)據(jù)進行聚類分析和趨勢外推,結(jié)合雷達回波拼圖數(shù)據(jù)對雷暴中心運動軌跡進行研究。
1? 雷電預警信號檢驗
雷電預警信號檢驗為不分級檢驗,即檢驗雷電預警信號的準確性和時效性。準確性為通過雷電預警信號的正確、空報、漏報次數(shù)計算TS評分、空報率、漏報率、命中率。時效性為通過預警信號的發(fā)布時間和預警信號對應的災害性天氣出現(xiàn)時間計算預警信號提前時間(分鐘),評定統(tǒng)計準確預警的時間提前量(T1)、預警的時間提前量(T2)、有效預警的時間提前量(T3)。在實際工作中,發(fā)布雷電預警信號可以參考雷達回波、10分鐘閃電分布數(shù)據(jù)和10分鐘閃電密度數(shù)據(jù),基本上是出現(xiàn)了雷電或者即將出現(xiàn)雷電時才發(fā)預警,所以時間提前量(T2)很小甚至沒有。
2? 天氣實況及強對流過程分析
2020年5月3日18時至22時,邢臺市大部分地區(qū)出現(xiàn)雷陣雨天氣,降水區(qū)平均降水量達到7.5毫米,寧晉、清河、巨鹿、南宮、隆堯局地出現(xiàn)大雨;寧晉、巨鹿、南宮、新河、平鄉(xiāng)、威縣、廣宗、清河、臨西出現(xiàn)冰雹;清河、臨西、邢臺皇寺出現(xiàn)8級瞬時大風。
此次天氣狀況受低槽切變線的影響,地面有冷鋒配合,3日08時,500 hPa我省北部受短波槽影響,溫度場落后于高度場,天氣系統(tǒng)向東南方向移動,并逐漸發(fā)展加強,南部有一短波槽快速劃過;700 hPa和850 hPa邢臺市受反氣旋式環(huán)流控制,天氣晴好,利于輻射增溫;850 hPa吉林西部有一低渦,低渦的冷式切變從吉林、內(nèi)蒙古、河北省西北部延伸到山西、陜西北部,河南省有一暖中心,邢臺市受暖氣團控制,回溫明顯,地面有一個熱低壓區(qū),當日邢臺市東部地面氣溫達到33~35 ℃,為強對流的發(fā)生提供能量條件,隨著系統(tǒng)東移南壓,觸發(fā)強對流天氣。
在強對流期間有四個超級單體生成,自東向西記為A、B、C、D。單體A在西北氣流的引導下向東南傳播,在對流天氣發(fā)生前(3日白天8到19時),邢臺市中部自北向南從寧晉、新河到南和、平鄉(xiāng)一直有地面輻合線穩(wěn)定維持。輻合線東側(cè)為偏東風,西側(cè)為偏北風。19:30時單體A中心位于辛集北部,隨著引導氣流流向邢臺市寧晉,20時單體A在向東南移動的過程中,在其西南側(cè),單體出流與前期穩(wěn)定維持的地面輻合線相遇,在輻合線上觸發(fā)新的單體。多個被觸發(fā)的新單體與單體A呈東北-西南向線狀排列。
通過對邯鄲雷達風廓線產(chǎn)品的分析得出,新單體觸發(fā)階段(20:00—21:30)在0.3~0.9 km高度維持著東北風到偏南風,在0.9~1.2 km高度維持著偏東風到東南風。由此可見,在此期間有新單體在老單體西南側(cè)不斷出現(xiàn),但底層入流方向以偏東風為主,老單體的入流沒有被新單體切斷,使老單體維持較長時間。從0.3~3 km的垂直風隨時間變化來看,此階段0.3 km高度維持東北風4~6 m/s,3 km高度維持西南風且風速隨時間逐漸增大,風速為10~24 m/s,說明0.3~3 km的垂直風切變不斷增大,且維持較強的低層垂直風切變環(huán)境,垂直風切變矢量順時針旋轉(zhuǎn),利于對流單體的組織和增強,最終在我市東部形成線狀排列的4個超級單體。
在雷電預警信號發(fā)布中,臨城與南和出現(xiàn)閃電定位數(shù)據(jù),但未給出雷電預警,為漏報;其他縣局發(fā)布預警時間晚于閃電定位數(shù)據(jù)出現(xiàn)時間,時間提前量(T2)為0。
3? 超級單體運動軌跡分析
21:18時,在邢臺東部出現(xiàn)4個超級單體,并持續(xù)5個體掃。19:48時單體A反射率因子在寧晉東北部超過65 dBZ,有回波懸垂,且55 dBZ以上的強回波伸展至-20℃等溫線高度以上,存在弱回波區(qū),回波前緣探測到中尺度氣旋,即已達到超級單體風暴強度。19:56時寧晉四芝蘭區(qū)域出現(xiàn)八級大風,20:00時左右寧晉東北部鄉(xiāng)鎮(zhèn)觀測到冰雹,反射率因子隨高度向入流一側(cè)傾斜,持續(xù)時間(19:30—20:48)較長,表明單體發(fā)展旺盛,20:30時開始對新河造成影響,單體A移動過程中,其出流與輻合線的移動較為一致。20:00時單體B由單體A出流在寧晉縣中部觸發(fā),先沿東北向移動再沿東南向移動,20:51時新河國家站降雹,南宮大范圍降雹,持續(xù)時間大約10分鐘。20:12時單體C由單體A出流在隆堯縣北部觸發(fā),先沿東北向移動再沿東南向移動,20:54時巨鹿、廣宗、威縣、清河、臨西先后降雹。20:42時單體D受地面輻合線影響,在任縣中部生成并不斷發(fā)展,先沿東北向移動再沿東南向移動,21:12時平鄉(xiāng)、廣宗、威縣、臨西先后降雹。
4? DBSCAN聚類算法刪除離散點
周明薇等[9]在利用閃電定位和雷達資料對邵陽地區(qū)雷電預報預警的研究中指出:一個雷達體掃時間內(nèi)出現(xiàn)3次以上的地閃視為一個雷暴單體,其余則為非雷暴單體。在實際的數(shù)據(jù)處理中,采取這種方法刪除離散點存在問題,因其沒有給出刪除3次及3次以下地閃數(shù)據(jù)的半徑范圍。DBSCAN是基于密度的聚類方法,具有2個參數(shù),分別為鄰域半徑(Eps)和最少點數(shù)目(min_samples),合理設置這兩個參數(shù)可以有效刪除離散點。
如圖1所示,從左到右分別為20200503111200(世界時)三維閃電定位數(shù)據(jù)散點及聚類中心圖和經(jīng)過DBSCAN聚類算法刪除離散點后的聚類中心圖。聚類中心以X點顯示,在左圖中東北方向出現(xiàn)2個離散點,如果直接使用K-means聚類算法進行聚類,輪廓系數(shù)最大值對應的聚類中心(X點)位于東北方向兩個離散點的中間位置,在使用DBSCAN算法刪除離散點后,K-means聚類算法獲得兩個聚類中心,兩個聚類中心的位置關系和雷達回波拼圖中大于30 dBZ的強回波區(qū)域一致。
(a)刪除離散點前K-means聚類中心圖
(b)刪除離散點后K-means聚類中心圖
圖1? 20200503111200(世界時)DBSCAN算法刪除離散點比較圖
5? K-means聚類算法提取超級單體運動軌跡
K-means聚類算法是一種迭代求解的聚類算法,具有1個表示簇個數(shù)的參數(shù)(n_clusters),模型效果評估可以通過使用樣本離最近聚類中心的總和(inertias)、輪廓系數(shù)、蘭德指數(shù)、同質(zhì)化得分。K-means聚類算法適用于凸數(shù)據(jù)集,在此過程中,雷達回波呈現(xiàn)帶狀,即孤立的塊狀。
因為對流系統(tǒng)的生消演變規(guī)律非常復雜,使用K-means聚類算法可獲取多個聚類中心位置,結(jié)合雷達回波拼圖數(shù)據(jù),識別出四個超級單體所對應的聚類中心,獲得四個超級單體所對應聚類中心的運動軌跡和聚類最大半徑,提取出5月3日21時12分至21時54分A、B、C、D四個超級單體對應的聚類中心和聚類最大半徑,A、C超級單體對應的聚類中心為1312—1354(世界時)8組數(shù)據(jù),D超級單體對應的聚類中心為1318—1354(世界時)7組數(shù)據(jù),B超級單體對應的聚類中心為1324—1354(世界時)6組數(shù)據(jù)。
如圖2所示,從左到右分別為1324-1330(世界時)刪除離散點后的三維閃電數(shù)據(jù)K-means聚類中心圖,聚類中心(X點)數(shù)量均為8個,對應的輪廓系數(shù)最大。在邢臺地區(qū),可以明顯看出與ABCD四個超級單體對應的聚類中心,與雷達回波拼圖中大于30 dBZ的強回波區(qū)域一致,且通過與雷達回波拼圖數(shù)據(jù)的比較可以確定聚類中心的位置,計算聚類中心的經(jīng)緯度和聚類最大半徑。
(a)1324(世界時)K-means聚類中心圖
(b)1330(世界時)聚類K-means中心圖
圖2? 1324—1330(世界時)三維閃電數(shù)據(jù)K-means聚類中心圖
如圖3所示,自東向西依次為A、B、C、D四個超級單體對應的聚類中心軌跡,聚類中心以X點表示,四個超級單體主要影響的是邢臺東部,A超級單體聚類中心軌跡中的前四個軌跡點呈現(xiàn)東南方向線性特征,第五個軌跡點呈現(xiàn)東北方向線性特征;B超級單體在1342—1348—1354(世界時)處呈現(xiàn)明顯的分裂特征,選取運動方向前側(cè)的聚類中心,B超級單體聚類中心軌跡中的前三個軌跡點呈現(xiàn)東南方向線性特征,第四、第五個軌跡點呈現(xiàn)東北方向和西北方向線性特征;C超級單體在1318—1324—1330(世界時)處呈現(xiàn)明顯的分裂特征,同樣選取運動方向前側(cè)的聚類中心,C超級單體聚類中心軌跡點呈現(xiàn)東南方向線性特征;D超級單體對應的聚類中心軌跡呈現(xiàn)東南方向線性特征。
圖3? A、B、C、D四個超級單體對應三維閃電數(shù)據(jù)聚類中心軌跡圖
6? 采用趨勢外推法進行預測
A、B、C、D四個超級單體對應的聚類中心軌跡呈現(xiàn)明顯的線性關系,使用趨勢外推法預測下一個時次的聚類中心位置和聚類最大半徑。禹振軍等[10]利用趨勢外推法對漁業(yè)養(yǎng)殖機械化水平進行趨勢分析和預測。因ABCD四個超級單體的軌跡樣本量較小,故采用趨勢外推法對聚類中心經(jīng)度、緯度和最大半徑三個數(shù)據(jù)進行預測,以臨近三個時次數(shù)據(jù)預測最后一個軌跡數(shù)據(jù)為例,采用sklearn的mean_squared_error方法計算MSE,計算結(jié)果如表1所示。
表1? 預測結(jié)果MSE計算表
超級單體聚類軌跡 經(jīng)度預測MSE 緯度預測MSE 聚類最大半徑MSE
A 0.004 90 0.025 15 0.001 56
B 0.004 51 0.000 63 0.006 01
C 0.002 29 0.000 64 0.009 39
D 5.83E-09 0.000 23 0.001 39
從表1中可以看出,D超級單體對應的聚類軌跡約為直線,因此使用趨勢外推法,三項MSE均為最小,A、B和C超級單體對應的聚類軌跡在最后四個軌跡點中均存在聚類軌跡的方向變化,因此經(jīng)度預測MSE和緯度預測MSE較大,僅A超級單體聚類軌跡的緯度預測MSE超過0.01;ABCD超級單體聚類的最大半徑序列呈現(xiàn)波動,因此最大半徑MSE相差較大。
7? 結(jié)? 論
本文綜合利用三維閃電定位數(shù)據(jù)和雷達回波拼圖數(shù)據(jù),對2020年5月3日邢臺出現(xiàn)的四個超級單體的強對流過程進行分析,使用DBSCAN聚類算法,通過設定鄰域半徑和最少點數(shù)目兩個參數(shù)來刪除離散點,該方法的操作性較強;使用K-means聚類算法計算雷暴中心運動軌跡,與雷達回波拼圖中30 dBZ以上的強回波區(qū)域較為一致;雷暴中心運動軌跡呈現(xiàn)明顯的線性特征,采用趨勢外推法對運動軌跡進行預測,僅A超級單體聚類軌跡的緯度預測MSE超過0.01;與10分鐘閃電分布和10分鐘閃電密度資料相比,減少了數(shù)據(jù)的間隔,更有利于發(fā)現(xiàn)雷暴中心運動軌跡的變化,后續(xù)將對更多雷暴事例,特別是弓形回波事例進行更為深入細致的研究。
參考文獻:
[1] 于函,張鴻波,劉冬霞,等.颮線系統(tǒng)中的閃電活動與雷達回波特征的相關性研究[J].大氣科學,2022,46(4):835-844.
[2] 侯榮濤,朱斌,馮民學,等.基于DBSCAN聚類算法的閃電臨近預報模型 [J].計算機應用,2012,32(3):847-851.
[3] 王力艷,車向輝.一次颮線過程的閃電活動與雷達回波特征 [J].黑龍江氣象,2016,33(2):13-15+21.
[4] 阮悅,黃慧琳,魏鳴,等.福建冰雹云三維閃電及雙偏振雷達回波特征分析 [J].氣象,2022,48(4):442-451.
[5] 卜俊偉,張琨.四川省云地閃和三維閃電監(jiān)測系統(tǒng)對比分析 [J].農(nóng)業(yè)災害研究,2022,12(1):81-83.
[6] 余蓉,杜牧云,晏紫淙,等.湖北省兩套閃電定位網(wǎng)地閃數(shù)據(jù)的對比分析 [J].暴雨災害,2021,40(6):646-654.
[7] 成勤,張科杰,劉俊,等.一次特大暴雨過程三維和二維系統(tǒng)閃電特征對比分析 [J].熱帶氣象學報,2021,37(3):396-408.
[8] 馬強.ADTD型與VLF/LF型閃電定位數(shù)據(jù)的對比分析 [J].氣象水文海洋儀器,2022,39(4):18-20.
[9] 周明薇,王道平,羅龍友,等.基于閃電定位和雷達資料的邵陽地區(qū)雷電預報預警研究 [J].氣象與環(huán)境學報,2021,37(3):117-124.
[10] 禹振軍,盛順,胡浩,等.基于趨勢外推法的北京市漁業(yè)機械化水平研究 [J].中國農(nóng)機化學報,2023,44(6):217-223+238.
作者簡介:黃毅(1983—),男,漢族,江西贛州人,工程師,本科,研究方向:大數(shù)據(jù)和機器學習。