梁 明,劉 軍,洪玉清,林慶西,姜喜姣,田 平
(1.廣東省地震局,廣州 510070;2.中國地震局地震監(jiān)測與減災(zāi)技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣州 510070)
大震發(fā)生后,通常在震中一定范圍內(nèi)會伴隨著密集的余震序列??焖贉?zhǔn)確地產(chǎn)出余震序列目錄可為震后趨勢判定、地震應(yīng)急及救援等工作提供重要參考。同時(shí),余震序列目錄還可以為震源機(jī)制快速測定、地震破裂過程反演、余震精定位以及發(fā)震構(gòu)造研究等[1-5]提供基礎(chǔ)資料。因此,大震過后的余震序列產(chǎn)出至關(guān)重要,如何快速準(zhǔn)確地產(chǎn)出余震目錄是地震監(jiān)測工作的重要內(nèi)容之一。
目前,大震后的余震序列目錄以及日常地震目錄的產(chǎn)出主要還是依靠地震編目人員人工完成。就廣東臺網(wǎng)來說,每年需人工分析地震平均達(dá)4 千多個(gè),震相數(shù)十萬余條。近年來,隨著臺網(wǎng)密度的不斷加大,尤其是國家地震烈度速報(bào)與預(yù)警工程廣東子項(xiàng)目以及粵港澳大灣區(qū)與粵西地區(qū)地震監(jiān)測能力提升工程項(xiàng)目建設(shè)完成之后,廣東省測震臺數(shù)量將從原來的112 個(gè)增加至178 個(gè)[6-7],可編目的地震數(shù)量和記錄的臺站數(shù)將會越來越多,依靠現(xiàn)有的人工處理模式完成地震編目工作將面臨重大挑戰(zhàn),迫切需要一套能夠替代人工分析的地震數(shù)據(jù)自動處理系統(tǒng)。為了解決上述問題,廣東省地震局地震監(jiān)測技術(shù)及軟件研發(fā)創(chuàng)新團(tuán)隊(duì)基于深度學(xué)習(xí)研發(fā)了兩套地震自動編目處理系統(tǒng),均使用的是基于本地波形數(shù)據(jù)重新訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型。目前兩套系統(tǒng)已經(jīng)在廣東臺網(wǎng)部署安裝,處于試運(yùn)行階段。
據(jù)中國地震臺網(wǎng)中心正式測定,北京時(shí)間2023年2月11日10時(shí)41分42秒,廣東河源市源城區(qū)發(fā)生了M4.3 地震,震中位于北緯23.76°,東經(jīng)114.64°,震源深度11 km。截至2023 年2 月18 日24 時(shí),廣東地震臺網(wǎng)編目余震239 條,其中ML0.0~0.9 有206 條,ML1.0~1.9 有28 條,ML2.0~2.9 有4 條,ML3.0~3.9 有1 條,最大余震為2 月11 日14時(shí)的ML3.4 地震。此次地震短期內(nèi)余震較密集,以微小地震為主,并且有很多疊加地震,波形重疊交錯(cuò),分析難度較大,對自動編目系統(tǒng)是一次嚴(yán)峻的考驗(yàn)。因此,本文利用兩套地震自動編目系統(tǒng)檢測的河源地震序列結(jié)果,通過與人工編目結(jié)果對比,從震相拾取精度、定位參數(shù)精度等維度分析討論自動編目系統(tǒng)的實(shí)際運(yùn)行效果,為進(jìn)一步完善系統(tǒng)提供參考依據(jù),從而加快推進(jìn)地震自動編目系統(tǒng)的業(yè)務(wù)化運(yùn)行。
廣東省地震局地震監(jiān)測技術(shù)及軟件研發(fā)創(chuàng)新團(tuán)隊(duì)于2021 年創(chuàng)建,其中一個(gè)研究方向就是基于機(jī)器學(xué)習(xí)的事件自動檢測、定位等相關(guān)算法及軟件的研發(fā)。在廣東省地震局的支持以及團(tuán)隊(duì)成員的努力下,研發(fā)了兩套地震自動編目處理系統(tǒng)(以下簡稱系統(tǒng)1 和系統(tǒng)2)。其中,系統(tǒng)1 是在前期工作的基礎(chǔ)上[8],選取PhaseNet 模型[9],使用2008 年至2021年廣東省地震數(shù)據(jù)對其進(jìn)行重訓(xùn)練,利用重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行震相到時(shí)拾取,然后采用GaMMA算法[10]進(jìn)行震相關(guān)聯(lián)及定位。因GaMMA算法定位時(shí)不產(chǎn)出震級,因此在本研究中并未就兩套地震自動編目系統(tǒng)在震級方面的表現(xiàn)進(jìn)行評估。系統(tǒng)2 是基于Mask R-CNN 模型[11],使用2007 年至2020 年廣東省地震數(shù)據(jù)對其進(jìn)行重新訓(xùn)練,然后利用重新訓(xùn)練后的模型進(jìn)行震相到時(shí)拾取,采用自研算法進(jìn)行震相關(guān)聯(lián),最后調(diào)用MSDP 軟件中的Hyposat定位程序進(jìn)行定位。
本文是選取2023年2月10日0時(shí)至2023年2月18 日24 時(shí)廣東臺網(wǎng)記錄到的連續(xù)地震波形數(shù)據(jù)進(jìn)行處理分析,在該時(shí)段內(nèi),兩套地震自動編目處理系統(tǒng)與廣東臺網(wǎng)人工編目系統(tǒng)使用的臺站分布完全一致。廣東河源M4.3地震震中周邊50 km范圍內(nèi)包含14 個(gè)測震臺站,距離震中最近的是LVY 臺,震中距約為2 km,100 km范圍內(nèi)包含18個(gè)測震臺站,150 km范圍內(nèi)包含27個(gè)測震臺站(圖1)。因?yàn)榇舜蔚卣鹩嗾鹣鄬?,因此本文研究區(qū)域范圍是23.68°~23.84°N,114.56°~114.72°E。在上述研究時(shí)段及研究區(qū)域內(nèi),廣東地震臺網(wǎng)人工編目地震共241 條(以下簡稱人工目錄),系統(tǒng)1 共產(chǎn)出地震目錄643 條(以下簡稱自動目錄1),系統(tǒng)2 共產(chǎn)出地震目錄136條(以下簡稱自動目錄2)。
圖1 地震臺站分布圖(五角星為主震震中,三角形為地震臺站)Fig.1 Distribution map of seismic stations(the pentagram is the epicenter of main shock and the triangle is the seismic station)
本文將以人工目錄為準(zhǔn),如果自動目錄與其發(fā)震時(shí)刻偏差在3 s 以內(nèi),震中位置偏差在15 km 以內(nèi),則認(rèn)為匹配成功,視為同一地震事件;如果有多條事件符合匹配條件,則以發(fā)震時(shí)刻差值最小為依據(jù)優(yōu)先選擇匹配事件;如果自動目錄中的事件無法在人工目錄中找到,則認(rèn)為是系統(tǒng)多檢測的事件;如果人工目錄中的事件無法在自動目錄中找到,則認(rèn)為是系統(tǒng)漏檢測的事件。
圖2給出的是自動目錄與人工目錄震中分布情況。從圖中可以看出,系統(tǒng)1產(chǎn)出的自動編目地震數(shù)量明顯多于人工編目地震數(shù)量。基于觀測報(bào)告統(tǒng)計(jì),在研究時(shí)段以及研究范圍內(nèi),人工編目共產(chǎn)出地震目錄241 條,系統(tǒng)1 共產(chǎn)出地震目錄643條,比人工目錄多出402條,自動目錄數(shù)量是人工目錄的2.67 倍。自動目錄1 中有213 個(gè)地震與人工目錄匹配成功,其中ML3.0 及以上地震事件匹配率為100%,ML2.0~2.9 地震事件匹配率為100%,ML1.0~1.9 地震事件匹配率為92.9%,ML0.0~0.9地震事件匹配率為87.4%。系統(tǒng)多檢測出430 個(gè)地震事件,漏檢測28個(gè)地震事件。相較于系統(tǒng)1,系統(tǒng)2 產(chǎn)出的自動編目地震數(shù)量要少很多,系統(tǒng)2 共產(chǎn)出地震目錄136 條,比人工目錄少105 條。自動目錄2 中有127 個(gè)地震與人工目錄匹配成功,其中ML3.0 及以上地震事件匹配率為100%,ML2.0~2.9地震事件匹配率為100%,ML1.0~1.9 地震事件匹配率為76.9%,ML0.0~0.9 地震事件匹配率為48.8%。系統(tǒng)多檢測出9 個(gè)地震事件,漏檢測114個(gè)地震事件。
圖2 自動目錄與人工目錄震中分布圖Fig.2 The epicenter distribution of the automatic catalog and manual catalog
為了更明顯的看出兩套系統(tǒng)產(chǎn)出自動目錄隨時(shí)間的變化情況,我們給出了自動目錄與人工目錄余震累積數(shù)量變化圖(圖3)。由圖3 可見,對于系統(tǒng)1,在主震發(fā)生后的前1 個(gè)小時(shí),其產(chǎn)出的自動目錄中的余震數(shù)量比人工目錄中的余震數(shù)量略少;在這之后,自動目錄中余震數(shù)量明顯多于人工目錄中的余震數(shù)量。而對于系統(tǒng)2,在研究時(shí)段內(nèi),其產(chǎn)出的自動目錄中的余震數(shù)量一直少于人工目錄中的余震數(shù)量,尤其是在12 日之前;而12日之后,其余震數(shù)量與人工目錄中的余震數(shù)量相差不大。
圖3 自動目錄與人工目錄余震累積數(shù)量變化圖Fig.3 The cumulative number diagram of aftershocks in automatic catalog and manual catalog
圖4 給出了自動目錄與人工目錄Pg、Sg 震相到時(shí)拾取差異統(tǒng)計(jì)情況,其中震相到時(shí)偏差為自動目錄減去人工目錄。統(tǒng)計(jì)表明,系統(tǒng)1自動拾取的震相中有2340 個(gè)Pg 震相和2539 個(gè)Sg 震相與人工拾取震相匹配,震相檢出率分別為89.9%和84.7%。Pg震相平均到時(shí)差異為0.020 s,Pg震相拾取偏差小于±0.1 s 占98.4%,小于±0.2 s 占99.0%,小于±0.5 s占99.7%。Sg震相平均到時(shí)差異為0.024 s,Sg震相拾取偏差小于±0.1 s占97.1%,小于±0.2 s占99.1%,小于±0.5 s 占99.6%。系統(tǒng)2 自動拾取的震相中有1258 個(gè)Pg 震相和1306 個(gè)Sg 震相與人工拾取震相匹配,震相檢出率分別為48.3%和43.5%。Pg 震相平均到時(shí)差異為0.052 s,Pg 震相拾取偏差小于±0.1 s 占89.7%,小于±0.2 s 占91.6%,小于±0.5 s占98.4%。Sg震相平均到時(shí)差異為0.077 s,Sg震相拾取偏差小于±0.1 s 占86.9%,小于±0.2 s 占92.8%,小于±0.5 s占97.4%。
圖4 自動目錄與人工目錄Pg、Sg震相到時(shí)偏差統(tǒng)計(jì)圖Fig.4 The statistical diagram of arrival time deviation of Pg-phase and Sg-phase between automatic catalog and manual catalog
圖5分別給出了自動目錄與人工目錄匹配成功地震事件在發(fā)震時(shí)刻、震中位置以及震源深度方面的偏差統(tǒng)計(jì)情況,其中偏差值為自動目錄減去人工目錄。對于系統(tǒng)1,發(fā)震時(shí)刻偏差基本在±1.0 s 以內(nèi),共有206 個(gè)地震,占比96.7%(圖5(a));震中位置偏差整體在3 km 以內(nèi),極個(gè)別在3~8 km之間,偏差小于3 km 的地震有208 個(gè),占比97.7%(圖5(b));震源深度偏差整體在±4 km以內(nèi),共有208 個(gè)地震,占比97.7%(圖5(c))。對于系統(tǒng)2,發(fā)震時(shí)刻偏差基本在±0.5 s以內(nèi),共有125個(gè)地震,占比98.4%(圖5(d));震中位置偏差整體都在2 km 以內(nèi),偏差小于1 km 的地震有122 個(gè),占比96.1%(圖5(e));震源深度偏差整體在±1 km以內(nèi),共有124個(gè)地震,占比97.6%(圖5(f))。
圖5 自動目錄與人工目錄多參數(shù)對比圖Fig.5 Multi-parameter comparison between automatic catalog and manual catalog
從圖2、圖3 中我們已經(jīng)看到,系統(tǒng)1 產(chǎn)出的自動目錄數(shù)量遠(yuǎn)遠(yuǎn)多于人工目錄數(shù)量,而系統(tǒng)2產(chǎn)出的自動目錄數(shù)量要少于人工目錄數(shù)量。為了分析兩套系統(tǒng)多檢測地震事件的可信度以及漏檢測地震事件的原因,我們對其逐一進(jìn)行了人工確認(rèn)。
經(jīng)過確認(rèn),我們發(fā)現(xiàn)系統(tǒng)1 多檢測出的430 個(gè)事件和系統(tǒng)2 多檢測出的9 個(gè)事件均含有地震信號,無誤觸發(fā)事件。此次河源M4.3 地震震中附近臺站較多,并且均勻分布在震中周圍(圖1),對于震級較小,甚至震級為負(fù)的地震都有多個(gè)臺站記錄到較清晰的事件波形(圖6a)。兩套系統(tǒng)多檢測出的地震事件震級均為負(fù),一般情況下,臺網(wǎng)編目人員不會將負(fù)震級的地震編入目錄,因此沒有與人工目錄匹配上。
圖6 多檢測和漏檢測事件波形圖Fig.6 Waveform of multiple detection and missed detection events
對于系統(tǒng)1 漏檢測的28 個(gè)地震事件,經(jīng)過查看人工目錄和自動目錄的詳細(xì)數(shù)據(jù),發(fā)現(xiàn)漏檢測的地震主要分成兩種情況。一種是漏檢測地震事件前后有多個(gè)事件,且發(fā)震時(shí)間間隔很短,近臺未疊加在一起。這種情況會出現(xiàn)同一檢測窗口包含多個(gè)地震,而PhaseNet方法在處理這種情況時(shí)存在一定的缺陷,即對于同一檢測窗口內(nèi)包含多個(gè)地震,且振幅相近或相差較大時(shí),較小的地震概率值會顯著偏低,從而被遺漏[8]。本次河源地震短期內(nèi)余震較密集(圖3,圖6b),出現(xiàn)這種情況較多,這也是該系統(tǒng)漏檢測地震的主要原因之一。而另外一種是事件波形疊加在一起,從而造成疊加地震中信噪比較小的地震信號被遺漏(圖6c)。
因系統(tǒng)2 漏檢測的地震事件較多,所以我們從人工和自動目錄詳細(xì)數(shù)據(jù)、震相檢測策略等多方面進(jìn)行了分析,發(fā)現(xiàn)造成系統(tǒng)2漏檢測地震的主要原因是震相檢測策略問題。該系統(tǒng)設(shè)置檢測窗口長度為60 s,并且沒有設(shè)置滑動窗口,當(dāng)該地震被分割在兩個(gè)檢測窗口時(shí),該地震會被遺漏。因?yàn)镸ask R-CNN 模型是拾取事件波形輪廓,然后再將起始像素信息轉(zhuǎn)換成初至震相信息。當(dāng)同一檢測窗口中包含多個(gè)地震且振幅相差較大時(shí),做歸一化處理后,小的地震事件波形輪廓就拾取不到,從而造成地震事件被遺漏。又因該系統(tǒng)設(shè)置了較長檢測窗口,大大增加了其發(fā)生的概率。Mask RCNN 模型在拾取出事件波形輪廓的同時(shí)會給出一個(gè)分類分?jǐn)?shù),該系統(tǒng)對于分?jǐn)?shù)較低的輪廓信息直接去掉不用,這樣大概率會造成波形疊加在一起的地震事件被遺漏。
針對自動目錄與人工目錄匹配成功的地震事件,我們做了進(jìn)一步的分析。兩套系統(tǒng)自動拾取的Pg、Sg 震相到時(shí)偏差均呈正態(tài)分布,且主要分布在±0.5s以內(nèi)(圖4),震相拾取精度較高。兩套系統(tǒng)自動拾取的Sg 震相都要比Pg 震相多,這也符合本次河源地震特點(diǎn),即余震較密集,很多地震事件波形疊加在一起,Pg 震相拾取難度大大增加(圖6)。Pg 震相的平均到時(shí)差要小于Sg 震相的平均到時(shí)差,說明Pg 震相拾取精度要高于Sg 震相。這一點(diǎn)從圖4(b)中也可以明顯看到,系統(tǒng)2 中,Pg 震相到時(shí)偏差正負(fù)數(shù)量均勻分布,收斂性更好,而Sg 震相到時(shí)偏差整體在零軸左側(cè),存在早于人工識別Sg波震相到時(shí)的情況。這可能是由于Mask RCNN 模型是拾取事件波形輪廓,為了兼顧計(jì)算速度等因素設(shè)置1 個(gè)像素點(diǎn)代表0.1 秒,而Sg 震相屬于續(xù)至震相,不像Pg 震相那樣邊界相對清晰,在像素信息轉(zhuǎn)換成震相信息時(shí)造成了上述情況發(fā)生。兩套系統(tǒng)產(chǎn)出的自動目錄與人工目錄在發(fā)震時(shí)刻、震中位置以及震源深度方面偏差均較小(圖5)。系統(tǒng)1中有個(gè)別地震事件偏差較大,經(jīng)過分析發(fā)現(xiàn)主要原因是在拾取和關(guān)聯(lián)震相時(shí)混淆了相鄰地震的Pg、Sg震相。
為了更好的評估兩套地震自動編目處理系統(tǒng)在廣東臺網(wǎng)的試用情況,促進(jìn)系統(tǒng)的改進(jìn)和完善,本文利用2023 年2 月11 日廣東河源M4.3 地震主震前1 天以及后7 天廣東臺網(wǎng)記錄的連續(xù)波形數(shù)據(jù),結(jié)合人工編目結(jié)果,從震中分布、震相拾取精度、定位精度等維度分析討論了兩套地震自動編目系統(tǒng)的優(yōu)缺點(diǎn),得出如下結(jié)論:
(1)在研究時(shí)段和研究范圍內(nèi),系統(tǒng)1 檢測出643 條地震,是人工目錄的2.67 倍,事件匹配率較高;系統(tǒng)2 檢測出136 條地震,約為人工目錄的二分之一,ML1.0 以下地震事件匹配率較低。2 套系統(tǒng)自動檢測結(jié)果均為真實(shí)事件,無誤觸發(fā),事件真實(shí)率為100%。
(2)兩套系統(tǒng)產(chǎn)出的自動目錄在發(fā)震時(shí)刻、震中位置以及震源深度方面均與人工目錄偏差較小;自動拾取的Pg、Sg 震相到時(shí)精度較高,Pg 震相拾取精度要高于Sg 震相,系統(tǒng)2 存在早于人工識別Sg波震相到時(shí)的情況。
(3)兩套系統(tǒng)產(chǎn)出的地震目錄可靠度較高,都具備地震自動編目的能力;兩套系統(tǒng)相比,系統(tǒng)1處理大震后較密集余震的能力較強(qiáng),可以產(chǎn)出完備性較好的地震目錄,而系統(tǒng)2處理余震能力還有待加強(qiáng)。
(4)兩套系統(tǒng)在處理同一檢測窗口包含多個(gè)地震的能力還需進(jìn)一步加強(qiáng),尤其是系統(tǒng)2。
因系統(tǒng)1 暫未產(chǎn)出震級,本文未對兩套系統(tǒng)在震級方面的表現(xiàn)進(jìn)行評估;同時(shí)在筆者撰寫論文期間,研發(fā)團(tuán)隊(duì)就系統(tǒng)2中的問題進(jìn)行了修復(fù),待后續(xù)系統(tǒng)不斷改進(jìn)完善后,再做細(xì)致分析。
致謝:本文部分圖件使用GMT 軟件繪制,得到了審稿專家對于改善論文質(zhì)量的寶貴建議和意見,在此一并表示感謝。