王錦紅 蔣海昆
摘要:機(jī)器學(xué)習(xí)突出的隱式特征提取和復(fù)雜任務(wù)處理能力正推動(dòng)著地震預(yù)測(cè)科學(xué)的發(fā)展,為系統(tǒng)了解機(jī)器學(xué)習(xí)技術(shù)在地震預(yù)測(cè)領(lǐng)域的發(fā)展現(xiàn)狀,從指定時(shí)空窗的地震震級(jí)預(yù)測(cè)、發(fā)震位置和發(fā)震時(shí)間估計(jì)三方面,綜述了國內(nèi)外機(jī)器學(xué)習(xí)在地震預(yù)測(cè)領(lǐng)域中的應(yīng)用,其中在震級(jí)預(yù)測(cè)問題上AI應(yīng)用最為廣泛;總結(jié)了機(jī)器學(xué)習(xí)地震預(yù)測(cè)的主要特征參數(shù)、模型和評(píng)價(jià)相關(guān)問題,從多種評(píng)價(jià)機(jī)制中探索地震活動(dòng)性參數(shù)對(duì)地震預(yù)測(cè)結(jié)果的影響,并對(duì)地震預(yù)測(cè)領(lǐng)域存在的問題進(jìn)行初步討論和展望。在可預(yù)見的未來,AI技術(shù)的引入和應(yīng)用領(lǐng)域的拓展,有可能引領(lǐng)地震預(yù)測(cè)領(lǐng)域的持續(xù)發(fā)展。
關(guān)鍵詞:地震預(yù)測(cè);機(jī)器學(xué)習(xí);特征提?。荒P驮u(píng)價(jià)
中圖分類號(hào):P315.7?? 文獻(xiàn)標(biāo)識(shí)碼:A?? 文章編號(hào):1000-0666(2023)02-0173-15
doi:10.20015/j.cnki.ISSN1000-0666.2023.0022
0 引言
地震預(yù)測(cè)是世界性的科學(xué)難題。在慶祝Science創(chuàng)刊125周年之際,該刊雜志社公布了125個(gè)最具挑戰(zhàn)性的科學(xué)問題(Kennedy,Norman,2005),其中第55個(gè)問題明確提出:是否存在有助于預(yù)報(bào)地震的前兆?地震預(yù)測(cè)困難之處在于一方面涉及地震前兆的地球物理觀測(cè)基本屬于遠(yuǎn)離震源地方的地表觀測(cè),所觀測(cè)到的物理量除包含可能的地震孕育信息外,更多的是與環(huán)境、路徑、干擾等有關(guān)的信息;另一方面是研究人員對(duì)地震孕震機(jī)理尚無清晰的認(rèn)識(shí),即地震預(yù)測(cè)的理論問題遠(yuǎn)未解決。因此,目前的地震預(yù)測(cè)基本停留在基于觀測(cè)資料的現(xiàn)象類比和統(tǒng)計(jì)分析層面。
近幾十年來,人工智能(Artificial Intelligence,簡(jiǎn)稱AI)技術(shù)在計(jì)算機(jī)視覺和圖像識(shí)別、時(shí)間序列分析和異常檢測(cè)、生物醫(yī)學(xué)等許多行業(yè)應(yīng)用的成功經(jīng)驗(yàn)表明,在理論問題尚未解決之前,AI技術(shù)對(duì)識(shí)別未知特性、發(fā)現(xiàn)系統(tǒng)隱含規(guī)律、解決實(shí)際問題等方面作用巨大,顯著推動(dòng)了相關(guān)行業(yè)的發(fā)展。AI是用于模擬和擴(kuò)展人類智能的理論、方法和技術(shù),開發(fā)相應(yīng)應(yīng)用系統(tǒng)的一門技術(shù)科學(xué),而機(jī)器學(xué)習(xí)是AI的最重要組成部分,是一門研究如何實(shí)現(xiàn)AI的技術(shù)性學(xué)科,涉及統(tǒng)計(jì)理論、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等領(lǐng)域。即機(jī)器學(xué)習(xí)是從歷史數(shù)據(jù)中學(xué)習(xí)特征和規(guī)律,然后將其應(yīng)用到未知事物探索中的一門科學(xué)(中國電子技術(shù)標(biāo)準(zhǔn)化研究院,2018)。2006年“深度神經(jīng)網(wǎng)絡(luò)”概念被提出(Hinton,Salakhutdinov,2006),該方法具有能夠在超大數(shù)據(jù)集中發(fā)現(xiàn)隱藏模式的性能,使其成為一種機(jī)器學(xué)習(xí)技術(shù)的新方法。
由于地震孕育的地球物理過程存在非線性和復(fù)雜性等問題,任何可記錄的物理參數(shù)與未來地震的時(shí)間、震級(jí)或空間位置之間缺乏確定的數(shù)學(xué)或經(jīng)驗(yàn)關(guān)系(Panakkat,Adeli,2007)。但隨著AI技術(shù)的發(fā)展,基于已有地震觀測(cè)數(shù)據(jù)的AI技術(shù)在地震預(yù)測(cè)領(lǐng)域得到越來越廣泛的應(yīng)用。學(xué)習(xí)大量觀測(cè)數(shù)據(jù)可以發(fā)現(xiàn)其隱含的特征或規(guī)律,一方面有利于深化對(duì)地震機(jī)理的認(rèn)識(shí),更重要的是可以利用這些數(shù)據(jù)建立/訓(xùn)練模型,對(duì)未來數(shù)據(jù)進(jìn)行擬合進(jìn)而開展地震預(yù)測(cè),這可以在機(jī)理和內(nèi)在規(guī)律尚不清楚的情況下改善地震預(yù)測(cè)的準(zhǔn)確性。
本文介紹了機(jī)器學(xué)習(xí)預(yù)測(cè)地震的一般流程,并從數(shù)據(jù)特征、模型算法和評(píng)價(jià)指標(biāo)等方面,簡(jiǎn)要綜述機(jī)器學(xué)習(xí)在地震預(yù)測(cè)領(lǐng)域的最新研究進(jìn)展。
1 機(jī)器學(xué)習(xí)地震預(yù)測(cè)簡(jiǎn)介
1.1 機(jī)器學(xué)習(xí)
根據(jù)學(xué)習(xí)模式,機(jī)器學(xué)習(xí)主要分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)(圖1)。有監(jiān)督學(xué)習(xí)是指利用已標(biāo)記的有限訓(xùn)練數(shù)據(jù)集,通過某種學(xué)習(xí)方法建立模型,實(shí)現(xiàn)對(duì)新輸入數(shù)據(jù)的標(biāo)記,要求訓(xùn)練樣本的分類標(biāo)簽已知,分類標(biāo)簽精確度越高,樣本越具有代表性,學(xué)習(xí)模型的準(zhǔn)確度越高。最典型的監(jiān)督學(xué)習(xí)算法包括回歸(標(biāo)簽為連續(xù)變量)和分類(標(biāo)簽為分類變量)。無監(jiān)督學(xué)習(xí)是利用無標(biāo)記的有限數(shù)據(jù)描述隱藏在未標(biāo)記數(shù)據(jù)??? 中的結(jié)構(gòu)/規(guī)律,其典型算法包括降維、聚類等。強(qiáng)化學(xué)習(xí)是通過交互和反饋指導(dǎo)學(xué)習(xí)器進(jìn)行決策,不同于以上兩種學(xué)習(xí)方式,強(qiáng)化學(xué)習(xí)訓(xùn)練需要環(huán)境給予反饋,基于這種反饋不斷強(qiáng)化學(xué)習(xí)器性能以完成特定的目的,其在機(jī)器人控制、自動(dòng)駕駛、游戲等領(lǐng)域已有許多成功應(yīng)用。
常見的機(jī)器學(xué)習(xí)算法還包括半監(jiān)督學(xué)習(xí)、遷移學(xué)習(xí)等,其中半監(jiān)督學(xué)習(xí)介于無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)之間。經(jīng)常遇到的實(shí)際情況是,部分?jǐn)?shù)據(jù)有標(biāo)簽,部分?jǐn)?shù)據(jù)無標(biāo)簽,無標(biāo)簽的數(shù)據(jù)數(shù)量遠(yuǎn)遠(yuǎn)大于有標(biāo)簽的數(shù)據(jù)。未標(biāo)記的樣本雖未直接包含標(biāo)記信息,但若它們與完全標(biāo)記的樣本是從相同數(shù)據(jù)源獨(dú)立分布采樣得來,則它們所包含的關(guān)于數(shù)據(jù)分布的信息對(duì)建立學(xué)習(xí)模型將大有裨益,這也是半監(jiān)督學(xué)習(xí)日益受到重視的重要原因。遷移學(xué)習(xí)是指當(dāng)在某些領(lǐng)域無法取得足夠多的數(shù)據(jù)進(jìn)行模型訓(xùn)練時(shí),利用另一領(lǐng)域數(shù)據(jù)獲得的關(guān)系進(jìn)行學(xué)習(xí),可以把已訓(xùn)練好的模型參數(shù)遷移到新的模型上來指導(dǎo)新模型的訓(xùn)練,從而更有效地學(xué)習(xí)底層規(guī)則、減少數(shù)據(jù)量(中國電子技術(shù)標(biāo)準(zhǔn)化研究院,2018)。目前地震預(yù)測(cè)領(lǐng)域的機(jī)器學(xué)習(xí)基本上使用有監(jiān)督學(xué)習(xí)類算法。
1.2 機(jī)器學(xué)習(xí)地震預(yù)測(cè)的一般流程
機(jī)器學(xué)習(xí)地震預(yù)測(cè)主要基于地震觀測(cè)數(shù)據(jù)某些特征來進(jìn)行,如地震活動(dòng)性參數(shù)、地震前兆、地震波以及衛(wèi)星監(jiān)測(cè)數(shù)據(jù)等(Asencio-Cortés? et al,2016;Asim et al,2016;Niksarlioglu,Kulahci,2013;Wang et al,2022)。通過數(shù)據(jù)預(yù)處理,將其轉(zhuǎn)換為適合分類或回歸算法的形式,找到數(shù)據(jù)中隱藏的模式,以達(dá)到預(yù)測(cè)地震強(qiáng)度、發(fā)生時(shí)間和可能地點(diǎn)的目的。
目前的機(jī)器學(xué)習(xí)地震預(yù)測(cè)模型大多為降維預(yù)測(cè),即大多只對(duì)未來地震的發(fā)震時(shí)間、地點(diǎn)和震級(jí)三要素進(jìn)行單要素或其中兩個(gè)要素進(jìn)行預(yù)測(cè)。在實(shí)際應(yīng)用中,還需對(duì)發(fā)震時(shí)間或震級(jí)進(jìn)一步進(jìn)行離散化或進(jìn)行空間網(wǎng)格化,從而使預(yù)測(cè)過程簡(jiǎn)化為分類或回歸問題。對(duì)于二元分類(如預(yù)測(cè)震級(jí)是否高于或低于閾值)或回歸(如可能的震級(jí)估計(jì)),訓(xùn)練和預(yù)測(cè)的輸出結(jié)果通常表達(dá)為概率形式。一般的機(jī)器學(xué)習(xí)地震預(yù)測(cè)模式和流程如圖2所示,包括數(shù)據(jù)集建立、數(shù)據(jù)預(yù)處理、分類/回歸模型構(gòu)建、外推預(yù)測(cè)、結(jié)果或模型評(píng)估等5個(gè)環(huán)節(jié)。
2 主要特征參數(shù)
在目前已開展的研究中,以地震目錄為主的地震觀測(cè)數(shù)據(jù),由于其具有易獲取、較好的完備性、無干擾、較長(zhǎng)時(shí)期的數(shù)據(jù)積累等特性,成為機(jī)器學(xué)習(xí)地震預(yù)測(cè)最為常用的輸入特征數(shù)據(jù)。通過簡(jiǎn)單的預(yù)處理可將地震目錄轉(zhuǎn)換成適合模型輸入要求的形式,作為機(jī)器學(xué)習(xí)的輸入來訓(xùn)練模型和開展預(yù)測(cè),如直接將地震目錄參數(shù)進(jìn)行簡(jiǎn)單轉(zhuǎn)換,將地震發(fā)生時(shí)間轉(zhuǎn)換為序號(hào)(Zhang et al,2019)、將地震位置(經(jīng)、緯度和深度)轉(zhuǎn)換為預(yù)先劃分好的網(wǎng)格(Wang et al,2017;Kail et al,2021)等。
Panakkat和Adeli(2007)基于地震統(tǒng)計(jì)參數(shù)及地震學(xué)中的基本統(tǒng)計(jì)特征,依據(jù)G-R關(guān)系和特征地震兩個(gè)先驗(yàn)統(tǒng)計(jì)模型,將地震目錄轉(zhuǎn)換為8個(gè)地震活動(dòng)性參數(shù)作為特征參數(shù)構(gòu)建機(jī)器學(xué)習(xí)地震預(yù)測(cè)模型。8個(gè)預(yù)測(cè)特征參數(shù)中(表1中特征1~8),T為地震序列時(shí)間分布,Mmean為地震的平均活動(dòng)強(qiáng)度,dE1/2為地震應(yīng)變釋放的快慢,η和ΔM為G-R關(guān)系b值及數(shù)據(jù)總體對(duì)G-R關(guān)系的偏離,μ和c為特征地震的平均復(fù)發(fā)周期及其離散程度,b值被用來描述研究區(qū)域的地震震級(jí)-頻度特征與地震活動(dòng)水平,是地震預(yù)測(cè)的一個(gè)常用指標(biāo)參數(shù)。Reyes等(2013)基于ANN模型預(yù)測(cè)智利和伊比利亞半島的地震,使用了7個(gè)特征參數(shù)(表1特征9~15),其中5個(gè)為等地震個(gè)數(shù)計(jì)算的G-R關(guān)系b值及等地震序號(hào)間隔的b值增量,目的是間接考察b值隨時(shí)間的變化;考慮最近的地震活動(dòng)水平及預(yù)測(cè)區(qū)6級(jí)地震的背景危險(xiǎn)性,將研究區(qū)近1周以來的最大地震震級(jí)及發(fā)生6級(jí)地震的背景概率也作為特征使用。Martínez-lvarez等(2013)把上述所有特征合并用于機(jī)器學(xué)習(xí)建模。
之后,以這些指標(biāo)為基礎(chǔ)又演化出更多的特征參數(shù),如Asencio-Cortés等(2016)考察了19個(gè)地震活動(dòng)性相關(guān)參數(shù)在機(jī)器學(xué)習(xí)地震預(yù)測(cè)中的靈敏性,所使用的預(yù)測(cè)指標(biāo)主要取自Panakkat和Adeli(2007)、Reyes等(2013)確定的地震參數(shù),增加了不同震級(jí)間隔范圍內(nèi)地震計(jì)算所得的G-R關(guān)系a值、基于概率模型的復(fù)發(fā)時(shí)間Tr等參數(shù)及其組合(表1中特征16、17)。Asim等(2018a)利用機(jī)器學(xué)習(xí)對(duì)興都庫什、智利和南加州地區(qū)進(jìn)行地震預(yù)測(cè),把基于目錄的預(yù)測(cè)指標(biāo)全部匯集在一起,利用最小二乘和最大似然兩種方法計(jì)算特征,將地震相關(guān)的特征參數(shù)擴(kuò)充到60個(gè),包括G-R關(guān)系系數(shù)、地震發(fā)生率、前震頻次、地震應(yīng)變釋放等參數(shù),基于最大相關(guān)和最小冗余(mRMR)準(zhǔn)則來確定具體的入選特征。需要指出的是,有些特征的應(yīng)用不但于預(yù)測(cè)效率提升無益,甚至可能會(huì)降低預(yù)測(cè)效果。因此,一些學(xué)者將特征選擇技術(shù)應(yīng)用于地震預(yù)測(cè),發(fā)現(xiàn)G-R關(guān)系相關(guān)參數(shù)以及描述地震頻次變化、發(fā)生時(shí)間、地震應(yīng)變釋放速率等參數(shù),對(duì)機(jī)器學(xué)習(xí)地震預(yù)測(cè)具有較大的貢獻(xiàn)度(Martínez-lvarez et al,2013;Asim et al,2018a),地震率變化z、β(Asim et al,2016,2020,2018a,b),b值的標(biāo)準(zhǔn)偏差σb(Asim et al,2016,2018b,2020)等指標(biāo)也被用于機(jī)器學(xué)習(xí)地震預(yù)測(cè)模型訓(xùn)練,具體見表1的特征18~20。
除基于地震目錄構(gòu)建的各類特征外,在地震預(yù)測(cè)中還用到一些其它類型的數(shù)據(jù),如靜態(tài)庫侖應(yīng)力變化(DeVries et al,2018)、地脈動(dòng)(馬士振等,2020)、氡濃度(Külahc et al,2009;Niksarlioglu,Kulahci,2013)、地電信號(hào)(Suratgar et al,2008;Moustra et al,2011)、強(qiáng)度函數(shù)(Nicolis et al,2021)、模型表面變形特征(Corbi et al,2019)等。除以上使用的地震特征外,還有研究通過深度學(xué)習(xí)方法從數(shù)據(jù)集中提取特征,再與傳統(tǒng)地震特征相融合來開展地震預(yù)測(cè)(Li et al,2020)。
3 模型評(píng)價(jià)
AI領(lǐng)域存在較多的外推預(yù)測(cè)算法,與之對(duì)應(yīng)的評(píng)價(jià)機(jī)制對(duì)于模型的訓(xùn)練和優(yōu)化顯得尤為重要。地震預(yù)測(cè)模型評(píng)估指標(biāo)中,最簡(jiǎn)單的方法是通過混淆矩陣來進(jìn)行評(píng)測(cè),這也是機(jī)器學(xué)習(xí)中最常見的模型評(píng)估方法,主要用于地震預(yù)測(cè)中諸如地震事件是否發(fā)生的二分類問題,其中混淆矩陣的4個(gè)指標(biāo)(表2)描述了所有可能預(yù)測(cè)的結(jié)果。True Positive(簡(jiǎn)稱TP):預(yù)測(cè)有震且實(shí)際有震的數(shù)量,即有震報(bào)準(zhǔn)的數(shù)量。False Positive(簡(jiǎn)稱FP):預(yù)測(cè)有震但實(shí)際無震的數(shù)量,即虛報(bào)的數(shù)量。True Negative(簡(jiǎn)稱TN):預(yù)測(cè)無震且實(shí)際無震的數(shù)量,即無震報(bào)準(zhǔn)的數(shù)量。False Negative(簡(jiǎn)稱FN):預(yù)測(cè)無震但實(shí)際有震的數(shù)量,即漏報(bào)的數(shù)量。
混淆矩陣在機(jī)器學(xué)習(xí)地震預(yù)測(cè)評(píng)價(jià)領(lǐng)域得到較多的應(yīng)用,如Gulia和Wiemer(2019)用混淆矩陣評(píng)估了“紅綠燈”形式的分類器在地震發(fā)生過程中對(duì)地震序列屬于前震還是余震進(jìn)行實(shí)時(shí)識(shí)別的能力;Mignan和 Broccardo(2020)利用混淆矩陣分析了ANN模型與其它機(jī)器學(xué)習(xí)簡(jiǎn)易模型在預(yù)測(cè)增益上的不同。但總的來看,由于混淆矩陣統(tǒng)計(jì)的只是地震的次數(shù),單一的統(tǒng)計(jì)值很難全面衡量模型的優(yōu)劣,因此在混淆矩陣的基本統(tǒng)計(jì)結(jié)果上又延伸出許多檢驗(yàn)指標(biāo),見表3。與混沌矩陣有關(guān)的模型評(píng)估曲線可以更直觀地顯示預(yù)測(cè)效能評(píng)價(jià)結(jié)果,例如Precision-Recall(簡(jiǎn)稱P-R)曲線(Kail et al,2021)、Receiver Operating Characteristic(簡(jiǎn)稱ROC)曲線(Kanarachos et al,2017)、Area Under Curve(簡(jiǎn)稱AUC)曲線(DeVries et al,2018;Aslam et al,2021)等,這些曲線可直接用于二分類問題,但無法直接應(yīng)用于多分類問題。在一些地震預(yù)測(cè)回歸算法中,還使用了平均絕對(duì)誤差Mean Absolute Error(簡(jiǎn)稱MAE)(Alarifi et al,2012;Nicolis et al,2021)、均方誤差Mean Squared Error(簡(jiǎn)稱MSE)(Alarifi et al,2012;Nicolis et al,2021)、均方根誤差Root Mean Squared Error(簡(jiǎn)稱RMSE)(Hu et al,2012)、相對(duì)誤差Relative Error(簡(jiǎn)稱RE)(Asencio-Cortés et al,2018)等指標(biāo)來表征預(yù)測(cè)值和觀測(cè)值之間的差異。由于不同地震預(yù)測(cè)模型的要求不同,需根據(jù)具體的預(yù)測(cè)模型選擇合適的評(píng)價(jià)指標(biāo),才能得到有效的評(píng)估結(jié)果,進(jìn)而對(duì)模型進(jìn)行反饋和優(yōu)化。
4 主要算法及預(yù)測(cè)效果
機(jī)器學(xué)習(xí)思想在地震預(yù)測(cè)中的應(yīng)用最早起源于我國20世紀(jì)80年代,如石紹先和范楊(1990),石紹先和沈斌(1986)研究了多級(jí)判別、聚類分析等在地震預(yù)測(cè)中的應(yīng)用,后續(xù)這種思想延伸到了神經(jīng)網(wǎng)絡(luò)中。由于神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜的非線性問題時(shí)具有明顯的優(yōu)點(diǎn),不需要對(duì)象有精確的數(shù)學(xué)模型,可通過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的可變性,逐步適應(yīng)外部環(huán)境的各種因素作用(王煒等,2000a),許多學(xué)者將其應(yīng)用于地震綜合預(yù)測(cè)(蔡煜東等,1993;李榮峰,2000;王煒等,2000;王煒,吳耿峰,2000,2006a,b;陳一超等,2008;韓曉飛等,2012)。蔡煜東等(1993)運(yùn)用神經(jīng)網(wǎng)絡(luò)對(duì)我國西南地區(qū)17個(gè)震例進(jìn)行分析,建立了地震綜合預(yù)報(bào)專家系統(tǒng),對(duì)確定地區(qū)、確定時(shí)間范圍內(nèi)的地震強(qiáng)度進(jìn)行預(yù)測(cè);李榮峰(2000)建立人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)福建及其周邊地區(qū)的年度最大地震震級(jí),該模型的輸入值為4個(gè)地震參數(shù)(b值、ML≥2.5地震的頻次、每年地震釋放總能量∑E和空間集中度C值),兼顧地震三要素,預(yù)測(cè)準(zhǔn)確率可達(dá)90%;王煒等(2000b)進(jìn)一步探索Back Propagation(簡(jiǎn)稱BP)神經(jīng)網(wǎng)絡(luò)在地震中期預(yù)報(bào)中的應(yīng)用,結(jié)果表明中強(qiáng)地震前1~3 a,未來震中周圍一般都開始出現(xiàn)明顯的異常區(qū),BP神經(jīng)網(wǎng)絡(luò)顯示出一定的中期預(yù)報(bào)效果。但由于BP神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、易陷入局部最小點(diǎn)等不足,陳一超等(2008)提出利用具有全局搜索能力的遺傳算法,建立遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合的震級(jí)預(yù)測(cè)模型,震級(jí)預(yù)測(cè)誤差小于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò);韓曉飛等(2012)提出基于遺傳算法結(jié)合廣義回歸神經(jīng)網(wǎng)絡(luò)的地震預(yù)測(cè)算法,震級(jí)預(yù)測(cè)誤差也小于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法。
盡管國內(nèi)開展了許多探索性研究,但總的來看國外在人工智能地震技術(shù)研究方面遠(yuǎn)遠(yuǎn)走在前列。地震預(yù)測(cè)的重點(diǎn)是震級(jí)、時(shí)間、地點(diǎn)三要素,但目前大多數(shù)研究主要關(guān)注震級(jí)預(yù)測(cè)問題,即在固定區(qū)域、固定時(shí)間窗前提下,評(píng)估某級(jí)以上地震的發(fā)震可能性,即大多數(shù)研究實(shí)際上是將地震預(yù)測(cè)問題進(jìn)行降維處理,轉(zhuǎn)化為在固定區(qū)域、固定時(shí)間段內(nèi)“有”或“無”某級(jí)以上地震發(fā)生的分類問題。
4.1 指定時(shí)空窗的地震震級(jí)預(yù)測(cè)
4.1.1 神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡(jiǎn)稱ANN)較早被應(yīng)用于地震預(yù)測(cè)研究。Alves(2006)針對(duì)地震時(shí)間序列的混沌特性,借鑒“金融振蕩器(financialoscillators)”工具構(gòu)建地震相關(guān)數(shù)據(jù)集,利用ANN對(duì)1998年7月和2004年1月2次5級(jí)以上地震進(jìn)行預(yù)測(cè),雖然預(yù)測(cè)時(shí)空、窗口較大,但也在一定程度上證明了ANN模型的地震預(yù)測(cè)潛力。為進(jìn)一步探索ANN的地震預(yù)測(cè)效能,Reyes等(2013)采用ANN模型對(duì)指定區(qū)域未來5天內(nèi)地震趨勢(shì)進(jìn)行預(yù)測(cè),得到ANN預(yù)測(cè)效能受區(qū)域差異影響較大。而對(duì)于相同區(qū)域的預(yù)測(cè),許多研究顯示ANN似乎優(yōu)于決策樹、支持向量機(jī)、樸素貝葉斯、K-最近鄰、ANFIS等分類器(Reyes et al,2013;Morales-Esteban et al,2013;Pandit,Pandal,2021)。也有研究指出,由于地震目錄的結(jié)構(gòu)化和表格化性質(zhì)及有限的特征數(shù)量,比ANN更簡(jiǎn)單、更透明的機(jī)器學(xué)習(xí)模型似乎更為可?。∕ignan,Broccardo,2019)。
Panakkat和 Adeli(2007)采用前饋反向傳播神經(jīng)網(wǎng)絡(luò)Levenberg-Marquardt(簡(jiǎn)稱LMBP)、遞歸神經(jīng)網(wǎng)絡(luò)Recurrent Neural Network(簡(jiǎn)稱RNN)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)Radial Basis Function(簡(jiǎn)稱RBF)3種模型預(yù)測(cè)南加州和舊金山地區(qū)1991年1月至2005年9月后續(xù)單位時(shí)間(月)的地震強(qiáng)度,模型輸入即表1中8個(gè)地震相關(guān)特征參數(shù),并使用4種不同的統(tǒng)計(jì)指標(biāo)(檢測(cè)概率POD、虛警率FAR、頻率偏差FB和R分?jǐn)?shù))評(píng)估模型的預(yù)測(cè)精度,結(jié)果表明與LMBP和RBF網(wǎng)絡(luò)相比,RNN具有更高的預(yù)測(cè)精度,尤其在中強(qiáng)度地震(5.5≤M<6.5)預(yù)測(cè)時(shí),不同模型之間的差距最明顯;Adeli和Panakkat(2009)使用特征作為概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,簡(jiǎn)稱PNN)的輸入來預(yù)測(cè)相同地區(qū)的地震,結(jié)果顯示PNN對(duì)M≤6.0地震的預(yù)測(cè)結(jié)果比RNN更好。上述8個(gè)地震參數(shù)還被用于預(yù)測(cè)興都庫什和巴基斯坦北部的地震,在興都庫什地區(qū),線性規(guī)劃增強(qiáng)集成分類器(Linear Programming Boosting,簡(jiǎn)稱LPBoost)在預(yù)測(cè)靈敏度方面有比較好的結(jié)果,而神經(jīng)網(wǎng)絡(luò)則傾向于產(chǎn)生更低的誤報(bào)率(Asim et al,2016);在巴基斯坦北部地區(qū),前饋神經(jīng)網(wǎng)絡(luò)則表現(xiàn)更好,其準(zhǔn)確率可達(dá)75%(Asim et al,2017b)。從上述研究可見,即使用相同的地震活動(dòng)性特征和相同的機(jī)器學(xué)習(xí)算法,在不同地區(qū)也會(huì)產(chǎn)生不同的預(yù)測(cè)效果,可能是由每個(gè)區(qū)域構(gòu)造及地震活動(dòng)特點(diǎn)存在差異所致。盡管機(jī)器學(xué)習(xí)提供了特征或模型選取算法,但主要為針對(duì)特定數(shù)據(jù)的模型與數(shù)據(jù)之間吻合程度的一系列統(tǒng)計(jì)學(xué)指標(biāo),不同特點(diǎn)的地震活動(dòng)區(qū)域適用哪些特征和算法并沒有明確的認(rèn)識(shí),還是只能使用不停的嘗試、檢驗(yàn)、調(diào)參等方法來進(jìn)行選擇和優(yōu)化。
隨觀測(cè)數(shù)據(jù)的急劇增加,ANN模型不斷復(fù)雜化,深度神經(jīng)網(wǎng)絡(luò)Deep Neural Networks(簡(jiǎn)稱DNN)、RNN等學(xué)習(xí)模型也不斷推出。Li等(2020)提出一種可以有效融合顯性和隱性特征的深度學(xué)習(xí)模型A Deep Learning Model for Earthquake Prediction(簡(jiǎn)稱DLEP),在8個(gè)具有不同特征的典型地震帶上進(jìn)行測(cè)試,認(rèn)為DLEP在地震震級(jí)預(yù)測(cè)方面具有更好的泛化能力和更高的準(zhǔn)確性。RNN的優(yōu)勢(shì)在于對(duì)序列數(shù)據(jù)具有記憶,能夠更好地反映地震活動(dòng)的時(shí)間依賴特性,因而也被應(yīng)用于地震預(yù)測(cè)研究。長(zhǎng)短期記憶網(wǎng)絡(luò)Long Short Term Memory(簡(jiǎn)稱LSTM)作為一種特殊的RNN能夠更好地解決長(zhǎng)序列訓(xùn)練過程中的梯度消失和梯度爆炸問題,因而被廣泛應(yīng)用,如Wang等(2017)從地震活動(dòng)空間相關(guān)的角度出發(fā),利用LSTM學(xué)習(xí)不同位置地震之間的時(shí)空關(guān)系,即使在地震監(jiān)測(cè)能力低的地區(qū),仍然能夠使用該方法判斷是否有地震發(fā)生;Kail等(2021)同樣基于LSTM,研究預(yù)測(cè)震級(jí)高于給定閾值的地震是否會(huì)從選定時(shí)刻開始的10~50天在給定區(qū)域發(fā)生,并進(jìn)而解釋日本地區(qū)歷史地震之間的時(shí)間依賴特性。由于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)和RNN等震相自動(dòng)識(shí)別技術(shù)的出現(xiàn),基于深度學(xué)習(xí)的地震監(jiān)測(cè)技術(shù)快速發(fā)展(Perol et al,2018;Mousavi,Beroza,2020),使得地震監(jiān)測(cè)臺(tái)網(wǎng)可檢測(cè)出更多的地震事件,其空間分辨率和震級(jí)完備性也顯著提高,這不但可以改進(jìn)傳統(tǒng)的統(tǒng)計(jì)和基于物理的地震預(yù)測(cè)方法,對(duì)基于AI的預(yù)測(cè)方法、特征構(gòu)建以及模型訓(xùn)練也大有裨益(Mousavi,Gregory,2022)。
4.1.2 多種機(jī)器學(xué)習(xí)模型集成
同一種數(shù)據(jù)、多種機(jī)器學(xué)習(xí)模型的聯(lián)合使用和相互印證可能是當(dāng)前可以考慮的一種途徑,如Asim等(2018b)將地震特征與基于遺傳規(guī)劃Genetic Programming(簡(jiǎn)稱GP)和自適應(yīng)增強(qiáng)Adaptive Boosting(簡(jiǎn)稱AdaBoost)集成分類方法相結(jié)合,定義了一個(gè)地震預(yù)測(cè)系統(tǒng)(Enhanced Particle Swarm Optimization,簡(jiǎn)稱EPSO),用于預(yù)測(cè)未來15天M≥5.0地震發(fā)生的可能性,對(duì)興都庫什、智利和南加州地區(qū)進(jìn)行的地震預(yù)測(cè),預(yù)測(cè)精度P1分別為74%、80%和84%,與Asim等(2017b)預(yù)測(cè)結(jié)果相比,提高了約15%;在巴基斯坦北部也印證了EPSO系統(tǒng)的低誤報(bào)率(Aslam et al,2021)。Asim等(2018a)利用基于支持向量回歸器(Support Vactor Reression,簡(jiǎn)稱SVR)和混合神經(jīng)網(wǎng)絡(luò)(Hybrid neural network,簡(jiǎn)稱HNN)的混合系統(tǒng)再次對(duì)以上3個(gè)地區(qū)進(jìn)行地震預(yù)測(cè)檢驗(yàn),與靈敏度高達(dá)90%但精度P1較小的SVM-HNN預(yù)測(cè)模型相比較,該分類預(yù)測(cè)模型靈敏度相對(duì)低但精度P1較高,從實(shí)際應(yīng)用的角度更為可取(Asim et al,2018b)。Asencio-Cortés等(2018)利用1970—2017年南加州地區(qū)約140萬多條地震目錄數(shù)據(jù),采用16種地震特征參數(shù),探索了4種回歸算法(廣義線性模型、梯度推進(jìn)機(jī)、深度學(xué)習(xí)和隨機(jī)森林)與集成學(xué)習(xí)相結(jié)合用于時(shí)間窗為7天的中強(qiáng)地震震級(jí)預(yù)測(cè)嘗試,不同算法預(yù)測(cè)震級(jí)與實(shí)際震級(jí)的對(duì)比結(jié)果顯示非常離散。史翔宇(2021)采用相同的16個(gè)地震活動(dòng)性特征參數(shù),對(duì)上述4種模型對(duì)預(yù)測(cè)結(jié)果的單獨(dú)貢獻(xiàn)進(jìn)行分析,發(fā)現(xiàn)G-R類特征參數(shù)貢獻(xiàn)度較大,地震能量類特征參數(shù)次之,不同模型和特征參數(shù)在不同地震區(qū)(帶)的地震預(yù)測(cè)貢獻(xiàn)度有較大的差異。
4.1.3 聚類和地震活動(dòng)圖像識(shí)別
純粹的分類/聚類算法也被用于地震預(yù)測(cè)研究,如Florido等(2015)將原始數(shù)據(jù)轉(zhuǎn)換成包含地震活動(dòng)性參數(shù)b值的數(shù)據(jù)集,應(yīng)用聚類算法對(duì)轉(zhuǎn)換后的數(shù)據(jù)集進(jìn)行離散化,構(gòu)建地震活動(dòng)的參數(shù)“序列”,將指定區(qū)域M≥4.4地震作為標(biāo)簽,對(duì)M≥4.4地震前的所有“序列”進(jìn)行搜索,找出可能的地震前兆“序列”用于地震預(yù)測(cè),在指定的評(píng)價(jià)語境下,其結(jié)果的準(zhǔn)確率接近70%,肯定了所提出方法的有效性;Shodiq等(2015)提出一種空間分析和自動(dòng)聚類技術(shù)來判斷后續(xù)是否有大地震發(fā)生,使用山谷追蹤技術(shù)確定最佳分類數(shù)為6類,在質(zhì)心K均值優(yōu)于其它K均值的情況下進(jìn)行分層聚類,其結(jié)果顯示對(duì)印尼地區(qū)未來1~6年的地震預(yù)測(cè)具有較高的準(zhǔn)確性;Shodiq等(2017)進(jìn)一步將自動(dòng)聚類和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,預(yù)測(cè)印尼地區(qū)發(fā)生5.1級(jí)地震后5天內(nèi)發(fā)生5.5級(jí)或6級(jí)以上地震的可能性,結(jié)果表明該模型能較好地預(yù)測(cè)6級(jí)以上地震,P0、P1、SN、Sp四項(xiàng)指標(biāo)平均值達(dá)到75%,其中P0高達(dá)97%;Shodiq等(2018)使用同樣的方法對(duì)該區(qū)域的余震進(jìn)行預(yù)測(cè),發(fā)現(xiàn)對(duì)M≥6地震的余震具有較好的預(yù)測(cè)效果,特異度Sp為99.16%。
與計(jì)算機(jī)視覺類似的地震活動(dòng)圖像識(shí)別也被用于地震預(yù)測(cè),如Huang等(2018)提出一種基于圖深度學(xué)習(xí)的機(jī)器學(xué)習(xí)地震預(yù)測(cè)方法,將中國臺(tái)灣地震活動(dòng)圖轉(zhuǎn)換為圖像,共產(chǎn)生65 536個(gè)特征(對(duì)應(yīng)256×256像素圖像),利用CNN從標(biāo)有地震信息的地理圖像中提取隱含特征,用過去120天的地震事件預(yù)測(cè)未來30天的地震。如果未來30天的最大地震震級(jí)大于等于6級(jí),則將該圖像標(biāo)記為1,否則標(biāo)記為0。該CNN模型的R值評(píng)分約等于0.303,在不需要人工設(shè)計(jì)特征的情況下,該方法已展現(xiàn)出良好的應(yīng)用前景。
4.2 發(fā)震位置和發(fā)震時(shí)間預(yù)測(cè)
目前大多數(shù)機(jī)器學(xué)習(xí)地震預(yù)測(cè)研究均針對(duì)指定時(shí)空域的未來地震活動(dòng)水平估計(jì),對(duì)地點(diǎn)及時(shí)間預(yù)測(cè)的研究并不多,如Madahizadeh和Allame-??? hzadeh(2009)基于人工神經(jīng)網(wǎng)絡(luò)對(duì)余震空間分布模式進(jìn)行了研究,但研究對(duì)象僅為一個(gè)地震序列。DeVries等(2018)基于DNN對(duì)余震空間分布區(qū)域進(jìn)行預(yù)測(cè)研究,共使用了一個(gè)包含30 000多個(gè)主震-余震對(duì)的獨(dú)立測(cè)試數(shù)據(jù)集對(duì)余震進(jìn)行二元分類(余震存在或不存在),其模型特征主要基于主震破裂模型計(jì)算的應(yīng)力變化張量而設(shè)計(jì),并非常用的地震活動(dòng)性特征;DNN模型包含6個(gè)隱藏層,每個(gè)隱藏層由50個(gè)節(jié)點(diǎn)組成,總共產(chǎn)生13 451個(gè)自由參數(shù),DNN在測(cè)試數(shù)據(jù)集上遍歷所有的破裂滑移分布和網(wǎng)格單元得到的累積AUC值為0.849,大于經(jīng)典庫侖破裂應(yīng)力準(zhǔn)則AUC值(0.583),與ROC評(píng)價(jià)結(jié)果對(duì)比來看也是如此(圖3)。結(jié)果表明DNN在余震地點(diǎn)預(yù)測(cè)方面比傳統(tǒng)庫侖破裂應(yīng)力變化有更好的優(yōu)勢(shì),能夠更好地解釋余震的空間分布。他們進(jìn)一步分析認(rèn)為,對(duì)余震地點(diǎn)預(yù)測(cè)起主要作用的是偏應(yīng)力張量第二不變量,因而認(rèn)為DNN給出的預(yù)測(cè)結(jié)果在物理上可解釋。該項(xiàng)工作受到廣泛關(guān)注的同時(shí)也引起極大的爭(zhēng)議,如Mignan和Broccardo(2019)認(rèn)為,余震預(yù)測(cè)屬于一種降維預(yù)測(cè),本身就應(yīng)該比主震預(yù)測(cè)容易,僅用較簡(jiǎn)單的ANN就完全可以達(dá)到很好的效果,且無需應(yīng)力相關(guān)參數(shù)的計(jì)算,簡(jiǎn)化了余震預(yù)測(cè)過程,限制了模型偏差,深化了對(duì)余震機(jī)理的認(rèn)識(shí)和對(duì)預(yù)測(cè)模型的改善。
機(jī)器學(xué)習(xí)對(duì)地震發(fā)生時(shí)間的預(yù)測(cè),目前仍停留在環(huán)境條件單一的實(shí)驗(yàn)室觀測(cè)數(shù)據(jù)處理,而Rouet-Leduc等(2017,2018)基于剪切摩擦實(shí)驗(yàn)AE連續(xù)波形記錄和同時(shí)期的剪應(yīng)力記錄,訓(xùn)練隨機(jī)森林模型,訓(xùn)練樣本約占記錄數(shù)據(jù)的60%,預(yù)測(cè)并重現(xiàn)了另外約40%時(shí)間段的剪應(yīng)力變化(圖4)。這意味著可以通過連續(xù)波形記錄,預(yù)測(cè)斷層失穩(wěn)(比擬于大地震)的時(shí)間。
(a)為斷層泥雙剪實(shí)驗(yàn)裝置示意圖;(b)為實(shí)驗(yàn)過程的剪應(yīng)力記錄,選擇實(shí)驗(yàn)過程部分階段(b中紅色陰影區(qū)域)放大,顯示非周期的粘滑特征如(d)所示,與(d)時(shí)段相對(duì)應(yīng)的聲發(fā)射波形記錄如(c)所示;在(c)和(d)中,綠色陰影區(qū)域?qū)?yīng)60%的訓(xùn)練集,據(jù)此建立聲發(fā)射數(shù)據(jù)與剪應(yīng)力之間的相關(guān)性模型;(c)和(d)中藍(lán)色陰影區(qū)域?qū)?yīng)40%的測(cè)試集,使用聲發(fā)射數(shù)據(jù)(e),通過ML模型預(yù)測(cè)得到的剪應(yīng)力時(shí)間變化如(f)中藍(lán)線所示,與實(shí)際觀測(cè)的剪應(yīng)力時(shí)間變化(f中紅線)高度吻合Hulbert等(2019)基于實(shí)驗(yàn)室觀測(cè)數(shù)據(jù)開展了類似的重構(gòu)應(yīng)力變化過程的研究,并進(jìn)一步將機(jī)器學(xué)習(xí)用于常規(guī)地震與慢地震(包括震顫和瞬時(shí)加速和自驅(qū)動(dòng)傳播等其他慢滑模式)的識(shí)別,其研究肯定了預(yù)測(cè)各種粘滑和蠕變-滑動(dòng)失穩(wěn)模式的可行性,認(rèn)為災(zāi)難性地震失穩(wěn)前可能會(huì)有一組有組織的、潛在的可預(yù)測(cè)過程。但總的來看,迄今為止尚未見到類似方法在實(shí)際地震記錄中的應(yīng)用,其難點(diǎn)可能在于與實(shí)驗(yàn)室環(huán)境條件相比較,實(shí)際環(huán)境過于復(fù)雜。Wang 等(2021)利用遷移學(xué)習(xí)算法處理實(shí)驗(yàn)室剪切實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)來自一個(gè)雙軸剪切裝置,該裝置可記錄聲發(fā)射數(shù)據(jù)以及計(jì)算摩擦系數(shù)所需的法向應(yīng)力和剪切應(yīng)力。首先通過數(shù)值方法模擬實(shí)驗(yàn)室觀測(cè)數(shù)值,利用模擬的實(shí)驗(yàn)室數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型,然后將其應(yīng)用到實(shí)驗(yàn)室實(shí)際觀測(cè)數(shù)據(jù)中預(yù)測(cè)地震(斷層滑移),實(shí)現(xiàn)了從數(shù)值模擬到實(shí)驗(yàn)室剪切實(shí)驗(yàn)的遷移學(xué)習(xí),同時(shí)引入交叉訓(xùn)練的方法來模擬實(shí)際地震觀測(cè)數(shù)據(jù)不足的情況。結(jié)果表明實(shí)驗(yàn)中的失穩(wěn)時(shí)間預(yù)測(cè)要比強(qiáng)度預(yù)測(cè)更加準(zhǔn)確。通過遷移學(xué)習(xí),研究人員可以從一個(gè)模型推廣到另一個(gè)模型,從而克服數(shù)據(jù)的稀疏特性,但其所采用的數(shù)據(jù)驅(qū)動(dòng)的方法僅對(duì)慢滑事件有效,而對(duì)于大規(guī)模粘滑斷層卻作用有限。
近期有學(xué)者對(duì)機(jī)器學(xué)習(xí)在地震預(yù)測(cè)研究中的概況也進(jìn)行了總結(jié)(Mignan,Broccardo,2020),如Al Banna等(2020)利用“Earthquake”“Prediction”“Neural Network”“Machine Learning”等關(guān)鍵詞搜尋了292篇相關(guān)論文,經(jīng)過篩選最終選擇84篇進(jìn)行進(jìn)一步分析,結(jié)果顯示利用AI進(jìn)行地震預(yù)測(cè)的文章數(shù)量近些年呈逐漸上升的趨勢(shì)且涵蓋了幾乎所有的AI方法,其中ANN應(yīng)用最多(約占33%)。按不同作者各自的評(píng)價(jià)規(guī)則及數(shù)據(jù),23種AI算法的預(yù)測(cè)成功率均達(dá)到60%,其中神經(jīng)動(dòng)態(tài)分類-優(yōu)化模型、反向傳播自適應(yīng)模型和改進(jìn)的人工蜂群-多層感知系統(tǒng)以及隨機(jī)森林等的預(yù)測(cè)準(zhǔn)確率相對(duì)更高。DNN對(duì)復(fù)雜問題表現(xiàn)出更優(yōu)的解決問題能力,在地震預(yù)測(cè)研究中應(yīng)用也較為廣泛。
5 結(jié)論與討論
地震預(yù)測(cè)是地震危險(xiǎn)性評(píng)估、震災(zāi)預(yù)防和建筑結(jié)構(gòu)安全設(shè)計(jì)的關(guān)鍵。隨著觀測(cè)站網(wǎng)密度增加,地震和地震物理觀測(cè)技術(shù)的進(jìn)步,地震觀測(cè)數(shù)據(jù)急劇增加,使AI技術(shù)可以更好地發(fā)揮其在大數(shù)據(jù)處理、隱式特征提取等方面的優(yōu)勢(shì),以此識(shí)別各類地震觀測(cè)數(shù)據(jù)中的未知特征或規(guī)律,對(duì)地震的發(fā)生時(shí)間、可能震級(jí)等進(jìn)行預(yù)測(cè)。本文對(duì)國內(nèi)外機(jī)器學(xué)習(xí)在地震預(yù)測(cè)領(lǐng)域中的應(yīng)用進(jìn)行總結(jié)發(fā)現(xiàn),數(shù)據(jù)的稀缺性、數(shù)據(jù)收集的質(zhì)量以及同一模型在不同位置的性能可變性等問題都會(huì)顯著影響模型的性能。在這里,我們將討論地震預(yù)測(cè)研究中面臨的困難,并提出克服這些困難的一些方法。
(1)機(jī)器學(xué)習(xí)能夠發(fā)揮計(jì)算機(jī)處理大數(shù)據(jù)的優(yōu)勢(shì),可發(fā)現(xiàn)人工難以直觀觀察到的某些震前特征。機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用,開拓了針對(duì)非線性復(fù)雜系統(tǒng)的地震孕育發(fā)生過程的新的研究途徑,對(duì)提升地震預(yù)測(cè)能力起到重要的促進(jìn)作用,其中以ANN為基礎(chǔ)發(fā)展起來的神經(jīng)網(wǎng)絡(luò)是最常見的地震預(yù)測(cè)模型。
(2)目前已有的研究大多采用基于區(qū)域地震活動(dòng)特征的特征提取方法,由于每個(gè)地震帶都有其獨(dú)特的地震活動(dòng)特點(diǎn),建立精確的區(qū)域地震預(yù)測(cè)模型時(shí),需要考慮特征參數(shù)的區(qū)域性差異。這種“個(gè)性化”的方法在不同區(qū)域的實(shí)際應(yīng)用中其結(jié)果差異尤其明顯,在一個(gè)區(qū)域表現(xiàn)得較好,可能在另一個(gè)區(qū)域則表現(xiàn)不佳。由于機(jī)器學(xué)習(xí)地震預(yù)測(cè)模型主要基于數(shù)據(jù)驅(qū)動(dòng),而地震發(fā)生又是小概率事件。對(duì)于一個(gè)特定的區(qū)域,其模型訓(xùn)練和檢驗(yàn)樣本數(shù)據(jù)一般都匱乏,這不僅需要未來在更多地區(qū)、更長(zhǎng)時(shí)段、對(duì)更多震例的積累和研究,還應(yīng)創(chuàng)建基準(zhǔn)地震數(shù)據(jù)集,對(duì)地震模型進(jìn)行測(cè)試,以簡(jiǎn)化不同模型的比較過程(Al Banna et al,2020)。
(3)地震預(yù)測(cè)包括時(shí)間、地點(diǎn)及震級(jí)3個(gè)維度。由于地震孕育過程的極端復(fù)雜性及三要素預(yù)測(cè)的極端困難,目前大多數(shù)機(jī)器學(xué)習(xí)地震預(yù)測(cè)研究主要集中于指定時(shí)空域內(nèi)地震活動(dòng)的震級(jí)預(yù)測(cè)。隨計(jì)算機(jī)處理速度的提升、AI技術(shù)的發(fā)展和可用資料的進(jìn)一步積累,未來應(yīng)思考如何能夠同時(shí)提升地震時(shí)、空、強(qiáng)三要素的預(yù)測(cè)能力。
(4)地震與區(qū)域構(gòu)造環(huán)境、地震之間具有非常復(fù)雜的非線性相互作用。當(dāng)前的機(jī)器學(xué)習(xí)并不能清晰地解釋這種高度的非線性關(guān)系,因此仍需要進(jìn)一步研究各個(gè)地震參數(shù)的相互關(guān)系,找出它們的影響因素和物理成因,并結(jié)合現(xiàn)有對(duì)地震及地震前兆成因、特點(diǎn)、震例的認(rèn)識(shí),考慮物理約束的半監(jiān)督學(xué)習(xí)算法,采用物理模型約束下的數(shù)據(jù)驅(qū)動(dòng)方式,可能是機(jī)器學(xué)習(xí)等AI技術(shù)在地震預(yù)測(cè)領(lǐng)域能夠更好地發(fā)揮作用的重要途徑之一。當(dāng)前,基于機(jī)器學(xué)習(xí)對(duì)輸入特征重要性的進(jìn)一步認(rèn)識(shí),也可說明某些強(qiáng)相關(guān)特征與未來強(qiáng)震活動(dòng)之間可能存在物理關(guān)聯(lián),這也為深化地震前兆物理機(jī)理的認(rèn)識(shí)提供了一條可能的途徑。
(5)相對(duì)于真正的大數(shù)據(jù),用于地震預(yù)測(cè)的數(shù)據(jù)和學(xué)習(xí)樣本仍十分匱乏,加之同一模型、相同特征在不同區(qū)域的預(yù)測(cè)效能差異極大,因而機(jī)器學(xué)習(xí)地震預(yù)測(cè)研究仍有許多問題亟待解決,這些問題顯著影響著機(jī)器學(xué)習(xí)地震預(yù)測(cè)模型的預(yù)測(cè)效能。盡管基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法更直接地結(jié)合了結(jié)構(gòu)化地震目錄完整的時(shí)空結(jié)構(gòu),還利用了諸如DNN等算法的自動(dòng)特征提取能力,但這些研究大多仍處于實(shí)驗(yàn)階段,側(cè)重于比較不同深度學(xué)習(xí)或經(jīng)典機(jī)器學(xué)習(xí)預(yù)測(cè)因子的相對(duì)性能。深度學(xué)習(xí)地震預(yù)測(cè)模型是否為能夠?yàn)榈卣鹂深A(yù)測(cè)性提供新的見解,以及它們是否比傳統(tǒng)的“統(tǒng)計(jì)+經(jīng)驗(yàn)”的方法表現(xiàn)更好,仍有待進(jìn)一步的研究和對(duì)比(Mousavi,Gregory,2022)。
當(dāng)前機(jī)器學(xué)習(xí)地震預(yù)測(cè)算法主要基于地震目錄等地震觀測(cè)資料,基于形變、電磁、流體等地球物理觀測(cè)資料的機(jī)器學(xué)習(xí)地震預(yù)測(cè)算法或模型尚不多見。我國長(zhǎng)期的地震預(yù)測(cè)實(shí)踐表明,形變、電磁、流體等地球物理觀測(cè)資料對(duì)地震短期預(yù)測(cè)可能具有不可替代的作用。地球物理觀測(cè)資料是以秒或分鐘為單位的等間隔采樣數(shù)據(jù),因而時(shí)間連續(xù),大量成熟的機(jī)器學(xué)習(xí)時(shí)間序列預(yù)測(cè)算法可嘗試應(yīng)用于基于地球物理觀測(cè)資料的地震異常識(shí)別和地震預(yù)測(cè);地球物理觀測(cè)資料易受環(huán)境和人為因素影響,機(jī)器學(xué)習(xí)異常檢測(cè)類算法可用于地球物理觀測(cè)資料的異常識(shí)別以及異常機(jī)理或影響因素分析,這方面的探索近期已有成果。因而,基于地球物理觀測(cè)資料的機(jī)器學(xué)習(xí)地震預(yù)測(cè)研究是一個(gè)值得探索的領(lǐng)域。
參考文獻(xiàn):
蔡煜東,甘俊人,姚林聲.1993.人工神經(jīng)網(wǎng)絡(luò)在地震綜合預(yù)報(bào)中的應(yīng)用[J].地震學(xué)報(bào),15(2):257-260.
陳一超,曾三友,張好春,等.2008.基于遺傳神經(jīng)網(wǎng)絡(luò)的地震預(yù)測(cè)研究[J].計(jì)算機(jī)應(yīng)用與軟件,(4):135-137.
韓曉飛,潘存英,羅詞建.2012.基于遺傳算法的廣義回歸神經(jīng)網(wǎng)絡(luò)在地震預(yù)測(cè)中的應(yīng)用[J].華北地震科學(xué),30(1):48-53.
李榮峰.2000.福建及其周邊地區(qū)地震活動(dòng)人工神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建[J].臺(tái)灣海峽,(1):107-112.
馬士振,劉宏志,牟磊.2020.在地脈動(dòng)數(shù)據(jù)上應(yīng)用分類算法的地震預(yù)測(cè)實(shí)驗(yàn)[J].地震,40(1):159-171.
石紹先,范楊.1990.多級(jí)判別在地震綜合預(yù)報(bào)中的應(yīng)用[J].地震研究,13(4):8-14.
石紹先,沈斌.1986.聚類分析在地震綜合預(yù)報(bào)中的應(yīng)用[J].地震研究,9(1):57-64.
史翔宇.2021.基于機(jī)器學(xué)習(xí)回歸算法的地震預(yù)測(cè)研究及其在中國地震科學(xué)實(shí)驗(yàn)場(chǎng)的應(yīng)用[D].北京:中國地震局地震預(yù)測(cè)研究所.
王煒,林命週,馬欽忠等.2006a.支持向量機(jī)及其在地震預(yù)報(bào)中的應(yīng)用前景[J].地震工程學(xué)報(bào).28(1):78-84.
王煒,劉悅,李國正等.2006b.我國大陸強(qiáng)震預(yù)測(cè)的支持向量機(jī)方法[J].地震學(xué)報(bào),28(1):29-36.
王煒,宋先月,王琤琤.2000.人工神經(jīng)網(wǎng)絡(luò)在地震中期預(yù)報(bào)中的應(yīng)用[J].地震,22(1):10-16.
王煒,吳耿鋒.2000.神經(jīng)網(wǎng)絡(luò)在地震學(xué)方法綜合預(yù)報(bào)中的應(yīng)用[J].地震學(xué)報(bào),22(2):189-193.
中國電子技術(shù)標(biāo)準(zhǔn)化研究院.2018.人工智能標(biāo)準(zhǔn)化白皮書(2018版)[EB/OL].(2018-01-24)[2022-09-20].http://www.cesi.cn/201801/3545.html.
Adeli H,Panakkat A.2009.A probabilistic neural network for earthquake magnitude prediction[J].Neural networks,22(7):1018-1024.
Al Banna M H,Taher K A,Kaiser M S,et al.2020.Application of artificial intelligence in predicting earthquakes:state-of-the-art and future challenges[J].IEEE Access,8:192880-192923.
Alarifi A S N,Alarifi N S N,Al-Humidan S.2012.Earthquakes magnitude predication using artificial neural network in northern Red Sea area[J].Journal of King Saud University-Science,24(4):301-313.
Alves E I.2006.Earthquake forecasting using neural networks:results and future work[J].Nonlinear Dynamics,44(1):341-349.
Asencio-Cortés G,Martínez-lvarez F,Morales-Esteban A,et al. 2016.A sensitivity study of seismicity indicators in supervised learning to improve earthquake prediction[J].Knowledge-Based Systems,101:15-30.
Asencio-Cortés G,Morales-Esteban A,Shang X,et al. 2018. Earthquake prediction in California using regression algorithms and cloud-based big data infrastructure[J].Computers & Geosciences,115:198-210.
Asim K M,AwaisM,Martínez-lvarez F,et al.2017a.Seismic activity prediction using computational intelligence techniques in northern Pakistan[J].Acta Geophysica,65(5):919-30.
Asim K M,Idris A,Iqbal T,et al.2018a.Earthquake prediction model using support vector regressor and hybrid neural networks[J].PloS one,13(7):e0199004.
Asim K M,Idris A,Iqbal T,et al.2018b.Seismic indicators based earthquake predictor system using Genetic Programming and AdaBoost classification[J].Soil Dynamics and Earthquake Engineeing,111:1-7.
Asim K M,Idris A,Martínez-lvarez F,et al.2016.Short term earthquake prediction in Hindukush region using tree based ensemble learning[C]//International conference on frontiers of information technology(FIT).IEEE,365-370.
Asim K M,Martínez-lvarez F,BasitA,et al.2017b.Earthquake magnitude prediction in Hindukush region using machine learning techniques[J].Natural Hazards,85(1):471-486.
Asim K M,Moustafa S SR,Niaz I A,et al.2020.Seismicity analysis and machine learning models for short-term low magnitude seismic activity predictions in Cyprus[J].Soil Dynamics and Earthquake Engineering,130:105932.
Aslam B,Zafar A,Khalil U,et al.2021.Seismic activity prediction of the northern part of Pakistan from novel machine learning technique[J].Journal of Seismology,25(2):639-652.
Corbi F,Sandri L,Bedford J,et al.2019.Machine learning can predict the timing and size of analog earthquakes[J].Geophysical Research Letters,46(3):1303-1311.
DeVries P M R,Viegas F,Wattenberg M,et al.2018.Deep learning of aftershock patterns following large earthquakes[J].Nature,560(7720):632-634.
Florido E,Martínez-lvarez F,Morales-Esteban A,et al.2015.Detecting precursory patterns to enhance earthquake prediction in Chile[J].Computers & Geosciences,76:112-120.
Gulia L,Wiemer S.2019.Real-time discrimination of earthquake foreshocks and aftershocks[J].Nature,74(7777):193-199.
Hinton G E,Salakhutdinov R R.2006.Reducing the dimensionality of data with neural networks[J].Science,313(5786):504-507.
Hu W S,Nie H L,Wang H.2012.Applied research of BP neural network in earthquake prediction[J].Applied Mechanics and Materials,204:2449-2454.
Huang J,Wang X,Zhao Y,et al.2018.Large earthquake magnitude prediction in Taiwan based on deep learning neural network[J].Neural Network World,28(2):149-160.
Hulbert C,Rouet-Leduc B,Johnson P A,et al.2019.Similarity of fast and slow earthquakes illuminated by machine learning[J].Nature Geoscience,12(1):69-74.
Kail R,Burnaev E,Zaytsev A.2021.Recurrent convolutional neural networks help to predict location of earthquakes[J].IEEE Geoscience and Remote Sensing Letters,19:1-5.
Kanarachos S,Christopoulos S-R.G,Chroneos A,et al.2017.Detecting anomalies in time series data via a deep learning algorithm combining wavelets,neural networks and Hilbert transform[J].Expert Systems with Applications,85:292-304.
Kennedy D,Norman C.2005.What dont we know?[J].Science,309(5731):75.
Külahc F,ncez M,Doru M,et al.2009.Artificial neural network model for earthquake prediction with radon monitoring[J].Applied Radiation and Isotopes,67(1):212-219.
Li R,LuX,Li S,et al.2020.DLEP:A deep learning model for earthquake prediction[C]//International Joint Conference on Neural Networks(IJCNN).IEEE,1-8.
Madahizadeh R,Allamehzadeh M.2009.Prediction of aftershocks distribution using artificial neural networks and its application on the May 12,2008 Sichuan earthquake[J].Journal of Seismology and Earthquake Engineering,11(3):112-120.
Martínez-lvarez F,Reyes J,Morales-Esteban A,et al. 2013. Determining the best set of seismicity indicators to predict earthquakes.Two case studies:Chile and the Iberian Peninsula[J].Knowledge-Based Systems,50:198-210.
Mignan A,Broccardo M.2019.One neuron versus deep learning in aftershock prediction[J].Nature,574(7776):E1-E3.
Mignan A,Broccardo M.2020.Neural network applications in earthquake prediction(1994-2019):Meta-analytic and statistical insights on their limitations[J].Seismological Research Letters,91(4):2330-2342.
Morales-Esteban A,Martínez-lvarez F,Reyes J.2013.Earthquake prediction in seismogenic areas of the Iberian Peninsula based on computational intelligence[J].Tectonophysics,593:121-34.
Mousavi S M,Beroza G C.2020.A machine-learning approach for earthquake magnitude estimation[J].Geophysical Research Letters,47(1):e2019GL085976.
Mousavi S M,Gregory C B.2022.Deep-learning seismology[J].Science,377(6607):eabm4470.
Moustra M,Avraamides M,Christodoulou C.2011.Artificial neural networks for earthquake prediction using time series magnitude data or seismic electric signals[J].Expert systems with applications,38(12):15032-15039.
Nicolis O,Plaza F,Salas R.2021.Prediction of intensity and location of seismic events using deep learning[J].Spatial Statistics,42:100442.
Niksarlioglu S,Kulahci F.2013.An artificial neural network model for earthquake prediction and relations between environmental parameters and earthquakes[J].International Journal of Geological and Environmental Engineering,7(2):87-90.
Panakkat A,Adeli H.2007.Neural network models for earthquake magnitude prediction using multiple seismicity indicators[J].International journal of neural systems,17(1):13-33.
Pandit A,Panda S.2021.Prediction of earthquake magnitude using soft computing techniques:ANN and ANFIS[J].Arabian Journal of Geosciences,14(13):1-10.
Perol T,Gharbi M,Denolle M.2018.Convolutional neural network for earthquake detection and location[J].Science Advances,4(2):e1700578.
Reyes J,Morales-Esteban A,Martínez-lvarez F.2013.Neural networks to predict earthquakes in Chile[J].Applied Soft Computing,13(2):1314-1328.
Rouet-Leduc B,Hulbert C,Bolton D C,et al.2018.Estimating fault friction from seismic signals in the laboratory[J].Geophysical Research Letters,45(3):1321-1329.
Rouet-Leduc B,Hulbert C,Lubbers N,et al.2017.Machine learning predicts laboratory earthquakes[J].Geophysical Research Letters,44(18):9276-9282.
Rouet-Leduc B,Hulbert C,McBrearty I W,et al.2020.Probing slow earthquakes with deep learning[J].Geophysical Research Letters,47(4):e2019GL085870.
Shodiq M N,Barakbah A R,Harsono T.2015.Spatial analysis of earthquake distribution with automatic clustering for prediction of earthquake seismicity in Indonesia[C]//The Fourth Indonesian-Japanese Conference on Knowledge Creation and Intelligent Computing(KCIC),24-26.
Shodiq M N,Kusuma D H,Rifqi M G,et al.2017.Spatial analisys of magnitude distribution for earthquake prediction using neural network based on automatic clustering in Indonesia[C]//International Electronics Symposium on Knowledge Creation and Intelligent Computing(IESKCIC).IEEE,246-251.
Shodiq M N,Kusuma D H,Rifqi M G,et al.2018.Neural network for earthquake prediction based on automatic clustering in indonesia[J].JOIV:International Journal on Informatics Visualization,2(1):37-43.
Suratgar A A,Setoudeh F,Salemi A H,et al.2008.Magnitude of earthquake prediction using neural network[C]//Fourth International Conference on Natural Computation.IEEE,2:448-452.
Wang K,Johnson C W,Bennett K C,et al.2021.Predicting fault slip via transfer learning[J].Nature communications,12(1):1-11.
Wang Q,Guo Y,Yu L,et al.2017.Earthquake prediction based on spatio-temporal data mining:an LSTM network approach[J].IEEE Transactions on Emerging Topics in Computing,8(1):148-158.
Wang Y,Li X,Wang Z,et al.2022.Deep learning for magnitude prediction in earthquake early warning[J].Gondwana Research,doi:org/10.1016/j.gr.2022.06.009.
Zhang L,Si L,Yang H,et al.2019.Precursory Pattern Based Feature Extraction Techniques for Earthquake Prediction[J].IEEE Access,7:30991-31001.
Zhang S,Shi Z,Wang G,et al.2022.Application of the extreme gradient boosting method to quantitatively analyze the mechanism of radon anomalous change in Banglazhang hot spring before the Lijiang MW7.0 earthquake[J].Journal of Hydrology,612:28249.
Research Progress in Field of Earthquake Predictionby Machine Learning Based on Seismic Data
WANG Jinhong1,JIANG Haikun2
(1.Institute of Earthquake Forecasting,China Earthquake Administration,Beijing 100036,China)
(2.China Earthquake Networks Center,Beijing 100045,China)
Abstract
Machine learnings prominent implicit feature extraction and complex task processing capabilities are driving the science of earthquake prediction.In order to systematically understand the development status of machine learning technology in the field of earthquake prediction,this paper focuses on the application of machine learning in the field of earthquake prediction at home and abroad in recent years from the three aspects of earthquake magnitude prediction,earthquake location and earthquake occurrence time estimation in a specified time-space window,among which AI is the most widely used in earthquake magnitude prediction.In addition,this paper summarizes the main characteristic parameters,models and evaluation related issues of machine learning earthquake prediction,and explores the influence of seismicity parameters on earthquake prediction results from various evaluation mechanisms.Finally,a preliminary discussion and outlook on the problems existing in the field of earthquake prediction will be conducted.In the foreseeable future,the introduction of AI technology and the expansion of application fields are likely to lead the continuous development of the field of earthquake prediction.
Keywords:earthquake prediction;machine learning;feature extraction;model evaluation
收稿日期:2022-08-22.
基金項(xiàng)目:地震動(dòng)力學(xué)國家重點(diǎn)實(shí)驗(yàn)室開放基金(LED2022B05).
第一作者簡(jiǎn)介:王錦紅(1999-),碩士研究生在讀,主要從事人工智能強(qiáng)余震預(yù)測(cè)研究.E-mail:17866618823@163.com.
通訊作者簡(jiǎn)介:蔣海昆(1964-),研究員,主要從事余震統(tǒng)計(jì)、余震機(jī)理及余震預(yù)測(cè)研究.E-mail:jianghaikun@seis.ac.cn.
王錦紅,蔣海昆.2023.基于地震觀測(cè)數(shù)據(jù)的機(jī)器學(xué)習(xí)地震預(yù)測(cè)研究綜述[J].地震研究,46(2):173-187,doi:10.20015/j.cnki.ISSN1000-0666.2023.0022.