田宵 汪明軍 張偉
1)東華理工大學(xué),地球物理與測(cè)控技術(shù)學(xué)院,南昌 330013 2)南方科技大學(xué),地球與空間科學(xué)系,廣東深圳 518055
水力壓裂是頁(yè)巖氣、煤層氣等非常規(guī)油氣資源開(kāi)采過(guò)程中的關(guān)鍵環(huán)節(jié),而微地震監(jiān)測(cè)技術(shù)是監(jiān)測(cè)壓裂過(guò)程以及評(píng)估壓裂效果的重要手段。水力壓裂過(guò)程中巖石破裂產(chǎn)生的地震波信號(hào)可以被放置在井中或地表的檢波器接收,這些信號(hào)能夠用來(lái)反演震源位置、震源機(jī)制解、震級(jí)等參數(shù),從而監(jiān)測(cè)裂縫的發(fā)育過(guò)程以及評(píng)估壓裂效果(Eisner et al,2010;Maxwell,2010;宋維琪等,2013;李晗等,2018;Wang et al,2018)。地面監(jiān)測(cè)和井中監(jiān)測(cè)是兩種常用的監(jiān)測(cè)方式。與井中監(jiān)測(cè)相比,地面監(jiān)測(cè)的檢波器記錄由于地震波衰減嚴(yán)重通常顯示出較低的信噪比。地面監(jiān)測(cè)不僅具有較高的覆蓋次數(shù)和較寬的方位角,更易于反演震源機(jī)制解,而且具有簡(jiǎn)單、經(jīng)濟(jì)以及適應(yīng)性強(qiáng)等優(yōu)勢(shì),因此得到了越來(lái)越廣泛的應(yīng)用(Duncan et al,2010)。
微地震監(jiān)測(cè)的主要內(nèi)容是反演震源位置和震源機(jī)制解。震源位置能夠提供裂縫的位置和分布信息,而震源機(jī)制解可用于描述裂縫破裂類型、了解工區(qū)地應(yīng)力狀態(tài)(尹陳等,2013;Zeng et al,2014;Zheng et al,2016)。大量的壓裂監(jiān)測(cè)結(jié)果表明微地震事件主要是由剪切為主的裂縫破裂產(chǎn)生的,因此地面觀測(cè)記錄會(huì)出現(xiàn)P波極性變化(Eisner et al,2010;Staněk et al,2014)。P波極性信息的確定對(duì)地面微地震的震源定位和震源機(jī)制反演具有重要意義。
常用的求解震源機(jī)制的方法包括P波極性法(許忠淮等,1983)、縱橫波振幅比法(Kisslinger,1980)和波形反演方法(Li et al,2011;譚玉陽(yáng)等,2019)。P波極性物理圖像明確,是穩(wěn)定的地震波信息。鑒于地面監(jiān)測(cè)范圍廣、微地震事件震級(jí)較小,利用不同方位的檢波器記錄的P波極性能夠反演出較為穩(wěn)定的震源機(jī)制解,且求解過(guò)程具有簡(jiǎn)單、快速等優(yōu)點(diǎn)。因此,P波極性法被廣泛用于地面監(jiān)測(cè)的震源機(jī)制反演(Staněk et al,2014;楊心超等,2015)。
地面監(jiān)測(cè)數(shù)據(jù)信噪比低、數(shù)據(jù)量大,通常采用不需要拾取走時(shí)的繞射疊加定位法(Kao et al,2004;Li et al,2020)。受震源機(jī)制的影響,直接使用原始波形進(jìn)行疊加會(huì)因?yàn)闃O性不同而導(dǎo)致震源位置的疊加能量降低,影響定位精度。為克服該問(wèn)題,前人使用不同的波形特征進(jìn)行疊加定位(Trojanowski et al,2017),例如使用波形振幅的平方、長(zhǎng)短時(shí)窗能量比、波形的包絡(luò)信息等;或者聯(lián)合反演震源位置和震源機(jī)制解,利用震源機(jī)制校正微地震記錄的極性(Liang et al,2016;李宏等,2018)。Trojanowski等(2017)對(duì)比了幾種常用的解決極性問(wèn)題的方法,結(jié)果表明經(jīng)過(guò)極性校正后的定位精度明顯高于使用原始波形以及振幅平方等波形特征的結(jié)果。因此,確定P波極性可以提高微地震繞射疊加定位的精度。
微地震監(jiān)測(cè)的數(shù)據(jù)處理方法通常借鑒天然地震領(lǐng)域。早期的天然地震極性拾取由經(jīng)驗(yàn)豐富的地震工作者完成,隨著全球?qū)掝l帶地震儀的迅速發(fā)展,地震數(shù)據(jù)量越來(lái)越龐大,這些工作逐漸被一些自動(dòng)算法所替代。例如,Chen等(2016)根據(jù)拾取的P波到時(shí),通過(guò)相位振幅和噪聲水平的比值來(lái)確定極性;Pugh等(2016)利用貝葉斯算法進(jìn)行P波初動(dòng)方向的定量概率估計(jì),以得到極性是正值還是負(fù)值的概率;Kim等(2017)選取信噪比較好的參考波形,通過(guò)計(jì)算目標(biāo)波形和參考波形的互相關(guān)系數(shù)來(lái)獲取相對(duì)極性。極性自動(dòng)拾取算法具有穩(wěn)定性和可重復(fù)性,但是大多需要預(yù)先拾取P波到時(shí),計(jì)算速度較慢。
近年來(lái),隨著計(jì)算機(jī)領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域取得了巨大的成功(Hinton et al,2012)。機(jī)器學(xué)習(xí)算法也被廣泛地應(yīng)用于地震學(xué)和地震勘探領(lǐng)域,包括地震信號(hào)的檢測(cè)與拾取(Zhu et al,2019;于子葉等,2018;趙明等,2019;Wang et al,2019;Zheng et al,2020)、震源定位(Zhang et al,2020),信號(hào)去噪(王鈺清等,2019)等。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種著名的深度學(xué)習(xí)方法,主要應(yīng)用于圖像分類、目標(biāo)檢測(cè)和圖像分割等問(wèn)題上(Krizhevsky et al,2012)。Ross等(2018)利用CNN進(jìn)行天然地震極性分類,通過(guò)大量已標(biāo)定極性的數(shù)據(jù)集進(jìn)行模型訓(xùn)練,預(yù)測(cè)精度能夠與人工拾取相匹敵。隨后,Hara等(2019)將CNN應(yīng)用到日本西部地區(qū)的地震數(shù)據(jù)極性分類中,并采用不同區(qū)域的地震數(shù)據(jù)驗(yàn)證了訓(xùn)練的模型具有較強(qiáng)的適用性。除此之外,Mousavi等(2019)采用聚類方法確定天然地震信號(hào)的極性類型,該方法不需要預(yù)先對(duì)數(shù)據(jù)進(jìn)行標(biāo)定。深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)中挖掘出P波極性特征,不需要預(yù)先拾取P波到時(shí)。預(yù)測(cè)新的數(shù)據(jù)時(shí),只需要將微震事件分割成相互獨(dú)立的窗口,然后輸入到訓(xùn)練好的模型中即可迅速預(yù)測(cè)出極性類型,節(jié)省了大量的計(jì)算時(shí)間。
針對(duì)地面微地震監(jiān)測(cè)的檢波器布置多采用規(guī)則觀測(cè)系統(tǒng),Tian等(2020)提出了多道記錄的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(Multi-trace based CNN,簡(jiǎn)稱MT-CNN),以確定地面微地震事件的P波極性。該方法不同于Ross等(2018)提出的單道記錄的CNN(Single-trace based CNN,簡(jiǎn)稱ST-CNN),其使用多條相鄰檢波器記錄作為訓(xùn)練樣本,并輸出多道記錄的極性。MT-CNN在學(xué)習(xí)P波極性特征的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)了相鄰檢波器的極性分布規(guī)律。Tian等(2020)將MT-CNN訓(xùn)練為易于實(shí)現(xiàn)的回歸模型,輸出一組范圍在[-1,1]之間的連續(xù)變量,然后通過(guò)設(shè)置閾值進(jìn)行極性分類,當(dāng)預(yù)測(cè)值大于0.3時(shí)為正極性、小于-0.3 時(shí)為負(fù)極性,其余為不確定。相較基于分類模型的ST-CNN,人工選取閾值會(huì)導(dǎo)致MT-CNN正(負(fù))極性和不確定性之間的預(yù)測(cè)誤差較大。此外,回歸模型使用均方誤差作為損失函數(shù),而分類模型使用的是交叉熵?fù)p失函數(shù),導(dǎo)致回歸模型的收斂速度比分類模型慢(Golik et al,2013)。
微地震的3種極性標(biāo)簽相互獨(dú)立,屬于無(wú)序性問(wèn)題,構(gòu)建CNN的極性分類模型會(huì)比回歸模型更易于網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練和收斂。因此,本文在Tian等(2020)的基礎(chǔ)上,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的地面微地震P波極性分類網(wǎng)絡(luò)模型,與MT-CNN類似,其輸入仍為多道記錄,但是輸出為中間道的極性。通過(guò)分析訓(xùn)練模型的準(zhǔn)確度、損失曲線以及在實(shí)際數(shù)據(jù)中的應(yīng)用,進(jìn)一步論證訓(xùn)練模型的適用性。
本文使用的訓(xùn)練數(shù)據(jù)為一套網(wǎng)格型的地面監(jiān)測(cè)數(shù)據(jù)。地面監(jiān)測(cè)的檢波器分布如圖1 所示,758個(gè)垂直單分量檢波器布置成由10條線所組成的網(wǎng)格,檢波器的間距約為25m,圖中的數(shù)字代表檢波器的排列順序。圖2(a)為時(shí)間長(zhǎng)度為1s的原始波形,時(shí)間采樣率為1ms,原始數(shù)據(jù)的信噪比較低,難以肉眼識(shí)別出微震事件。通過(guò)對(duì)原始數(shù)據(jù)去除均值、帶通濾波(10~70Hz),可觀測(cè)到較為清晰的微地震事件(圖2(b))。山西和順地勢(shì)復(fù)雜,檢波器高程在1290~1450m之間,通過(guò)高程校正,微震事件的記錄變得更加連續(xù)(圖2(c)),且可以觀察到極性逆轉(zhuǎn)的現(xiàn)象。
圖 1 地面微地震監(jiān)測(cè)的檢波器分布
圖 2 微震數(shù)據(jù)預(yù)處理(a)觀測(cè)到的微震事件原始波形; (b)去除均值、帶通濾波(10~70Hz)后的波形; (c)高程校正后的波形; 紅色箭頭表示正極性,黑色箭頭表示負(fù)極性
通過(guò)對(duì)微地震原始數(shù)據(jù)預(yù)處理,最后挑選出具有不同震源機(jī)制解和信噪比的5個(gè)微震事件來(lái)構(gòu)建數(shù)據(jù)集。為了提高訓(xùn)練模型的泛化能力和魯棒性,對(duì)訓(xùn)練樣本進(jìn)行了數(shù)據(jù)增強(qiáng)(Tian et al,2020)。微震數(shù)據(jù)可以看作二維圖像數(shù)據(jù),參照?qǐng)D像識(shí)別,可使用反轉(zhuǎn)、平移的方式進(jìn)行數(shù)據(jù)增強(qiáng)。反轉(zhuǎn)是指將已有的訓(xùn)練樣本值乘以-1,相應(yīng)的極性類型也反轉(zhuǎn);平移是指沿著時(shí)間軸滑動(dòng)樣本,使P波極性信息出現(xiàn)在時(shí)窗的任意位置。經(jīng)過(guò)數(shù)據(jù)增強(qiáng),數(shù)據(jù)集擴(kuò)充為17227個(gè)樣本,其中正極性、負(fù)極性和不確定的比例分別為29%、39%和32%。最后將整個(gè)數(shù)據(jù)集和對(duì)應(yīng)的標(biāo)簽隨機(jī)分為2組:三分之二的數(shù)據(jù)用于模型訓(xùn)練,稱為訓(xùn)練數(shù)據(jù)集;剩余三分之一的數(shù)據(jù)用于模型測(cè)試,稱為測(cè)試數(shù)據(jù)集。
CNN是一個(gè)多層前饋神經(jīng)網(wǎng)絡(luò),卷積層作為CNN的關(guān)鍵部分,通常與其他層一起使用。CNN每個(gè)卷積層由一組濾波器組成,這些濾波器對(duì)前一層的輸出結(jié)果進(jìn)行卷積計(jì)算,以此來(lái)提取數(shù)據(jù)集的P波極性特征并用于極性預(yù)測(cè)。通過(guò)優(yōu)化學(xué)習(xí)過(guò)程和網(wǎng)絡(luò)結(jié)構(gòu),微調(diào)整個(gè)網(wǎng)絡(luò)的權(quán)重和偏差,可以最大限度地提取這些特征。本文基于Keras平臺(tái)分別設(shè)計(jì)了基于單道記錄的CNN模型和基于多道記錄的CNN模型,用于進(jìn)行地面微地震P波極性分類。
P波初至極性識(shí)別可以當(dāng)作一個(gè)簡(jiǎn)單的圖像分類問(wèn)題。根據(jù)人工極性的識(shí)別結(jié)果,可將每道微震數(shù)據(jù)分為三類:正極性、負(fù)極性和不能被人工識(shí)別的不確定極性?;趩蔚烙涗浀腃NN模型(簡(jiǎn)稱ST-CNN-classify)截取單道地震記錄的P波信息作為輸入層,輸入樣本的大小為1×M的向量,其中1代表道數(shù),M為時(shí)間域采樣點(diǎn)的個(gè)數(shù)。輸入樣本經(jīng)過(guò)若干個(gè)相互交替的卷積層、池化層提取極性特征后,再經(jīng)過(guò)一個(gè)或一個(gè)以上的全連接層,最后由 Softmax 分類器輸出3個(gè)值,分別對(duì)應(yīng)輸入樣本為不確定、正極性、負(fù)極性的概率,其中最大概率值所對(duì)應(yīng)的類別即為該網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,如圖3(a)所示,圖中輸出的最大概率值為0.92,對(duì)應(yīng)極性類別為2,即極性為負(fù)。
圖 3 基于單道記錄(a)與基于多道記錄(b)的極性分類網(wǎng)絡(luò)
分類問(wèn)題一般采用交叉熵?fù)p失函數(shù)來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù),交叉熵通常用于衡量輸入(真實(shí))概率分布p和預(yù)測(cè)概率分布q之間的差異
(1)
其中,N為訓(xùn)練數(shù)據(jù)集的大小。損失函數(shù)(Loss)可使用隨機(jī)梯度下降算法迭代求解,每次迭代后,卷積核和權(quán)重將會(huì)被更新。在訓(xùn)練過(guò)程中,損失值(loss)和準(zhǔn)確度(accuracy)為判斷ST-CNN-classify模型的性能指標(biāo)。
對(duì)于地面微震監(jiān)測(cè),檢波器陣列通常采用“星型”、“網(wǎng)格型”等規(guī)則觀測(cè)系統(tǒng)??紤]到P波的輻射花樣,相鄰檢波器記錄通常顯示出規(guī)則的極性分布。基于此,本文提出利用多條相鄰道的P波信息作為訓(xùn)練樣本。為了將多道極性識(shí)別仍當(dāng)作分類問(wèn)題處理,輸入樣本包含多道相鄰檢波器記錄(道數(shù)為奇數(shù)),但是只輸出中間道(目標(biāo)道)的極性類型(圖3(b))。對(duì)于第K道的檢波器記錄,選取前后各N1道數(shù)據(jù),時(shí)間域的采樣點(diǎn)數(shù)為M,則輸入樣本的大小為(2×N1+1)×M,輸出結(jié)果為第K道的極性。多道記錄和單道記錄的樣本標(biāo)定方法相同,不確定為0,正極性為1,負(fù)極性為2。
MT-CNN-classify和ST-CNN-classify均為分類模型,兩者的區(qū)別主要在于前者能夠?qū)⒛繕?biāo)道與相鄰道結(jié)合起來(lái)預(yù)測(cè)目標(biāo)道的極性類型。如果目標(biāo)道前面或后面不足N1道時(shí),則填充目標(biāo)道的波形記錄。與ST-CNN-classify相同,MT-CNN-classify也經(jīng)過(guò)若干卷積層、池化層和全連接層,最后由Softmax分類器輸出不同類別的概率值,數(shù)值最大的概率值對(duì)應(yīng)類別則為分類結(jié)果。
利用微地震實(shí)際數(shù)據(jù)分別訓(xùn)練2個(gè)CNN模型,其中MT-CNN-classify的訓(xùn)練樣本中相鄰檢波器個(gè)數(shù)為5。在輸入神經(jīng)網(wǎng)絡(luò)前,所有輸入數(shù)據(jù)均歸一化至[-1,1]之間。ST-CNN-classify 和 MT-CNN-classify 均使用4組卷積層,每組卷積層包含卷積最大池化和Dropout。其中,卷積操作通過(guò)ReLu激活函數(shù)實(shí)現(xiàn)從輸入數(shù)據(jù)中提取極性特征;在卷積層之后緊跟著最大池化層,其主要功能為降維、對(duì)特征進(jìn)行壓縮、簡(jiǎn)化網(wǎng)絡(luò)復(fù)雜度等;Dropout層是指按照一定概率將神經(jīng)元從網(wǎng)絡(luò)中丟棄,從而降低模型的過(guò)擬合風(fēng)險(xiǎn)。卷積神經(jīng)網(wǎng)絡(luò)的最后一層為全連接層,其用于連接所有的輸出,并用Softmax激活函數(shù)計(jì)算分類概率。2個(gè)CNN模型的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1、表2 所示。MT-CNN-classify和ST-CNN-classify結(jié)構(gòu)相似,但在 MT-CNN-classify 中,卷積操作使用二維卷積核同時(shí)學(xué)習(xí)P波極性特征和檢波器陣列的極性規(guī)律。2個(gè)CNN網(wǎng)絡(luò)均采用隨機(jī)梯度下降優(yōu)化方法進(jìn)行訓(xùn)練,學(xué)習(xí)率設(shè)定為0.01,模型設(shè)定的批量大小為8,迭代次數(shù)為200。
表1ST-CNN-classify參數(shù)
表 2MT-CNN-classify參數(shù)
圖 4 MT-CNN-classify(a)、(c)和ST-CNN-classify(b)、(d)的準(zhǔn)確度損失曲線訓(xùn)練準(zhǔn)確度和訓(xùn)練損失曲線分別以紅色和綠色繪制;測(cè)試準(zhǔn)確度和測(cè)試損失曲線分別以藍(lán)色和黑色繪制
圖 5 測(cè)試數(shù)據(jù)集的預(yù)測(cè)誤差直方圖(a)測(cè)試集預(yù)測(cè)誤差分布;(b)不同數(shù)量檢波器的模型預(yù)測(cè)誤差對(duì)比
圖 6 3個(gè)CNN模型的損失曲線對(duì)比
訓(xùn)練好的CNN模型可進(jìn)一步用于地面微震實(shí)際數(shù)據(jù)的P波極性分類。采用訓(xùn)練好的ST-CNN-classify模型和MT-CNN-classify模型分別預(yù)測(cè)未用于構(gòu)建訓(xùn)練數(shù)據(jù)集的34個(gè)微地震事件的P波極性,預(yù)測(cè)過(guò)程僅耗時(shí)幾秒。由于實(shí)際數(shù)據(jù)的極性是未知的,可通過(guò)反演震源機(jī)制解來(lái)評(píng)估預(yù)測(cè)結(jié)果。利用P波極性求解震源機(jī)制解需要震源位置,在進(jìn)行地面監(jiān)測(cè)時(shí),垂直單分量檢波器的P波記錄通常顯示出比S波更高的信噪比,因此可用P波信息定位微地震事件。根據(jù)已有的資料,用于繞射疊加定位的P波速度模型為4250m/s。X、Y、Z三個(gè)方向的定位范圍分別為0~1000m、0~1000m和700~1700m,步長(zhǎng)均為10m。求出震源位置后,通過(guò)對(duì)所有可能的走向、傾角和滑動(dòng)角進(jìn)行格點(diǎn)搜索,可以得到最佳的震源機(jī)制解。最小矛盾比為CNN預(yù)測(cè)極性和震源機(jī)制解計(jì)算的極性不一致的比例,可用來(lái)評(píng)估反演得到的震源機(jī)制解的準(zhǔn)確度。
圖 7對(duì)比了ST-CNN-classify模型和MT-CNN-classify模型預(yù)測(cè)的8個(gè)微地震事件的極性分布,極性預(yù)測(cè)結(jié)果直觀地顯示在檢波器陣列上,紅色、綠色和黃色圓圈分別為正極性、負(fù)極性和不確定,圓圈的大小與微震數(shù)據(jù)振幅的相對(duì)大小成正比,黑色實(shí)心圓代表了微震事件的震源位置,由繞射疊加方法利用極性矯正后的波形獲得。圖7 各分圖左上角的沙灘球(最佳斷層面解的下半球投影圖)是由預(yù)測(cè)的P波極性反演的震源機(jī)制解,黑色陰影區(qū)域代表壓縮象限,白色區(qū)域代表膨脹象限。通常,正極性應(yīng)該被投射到壓縮象限,而負(fù)極性應(yīng)該被投射到膨脹象限,然而ST-CNN-classify的膨脹(壓縮)象限中出現(xiàn)一些正(負(fù))極性。對(duì)比圖7(a)和圖7(b),可以直觀地看出MT-CNN-classify模型在正、負(fù)極性之間的預(yù)測(cè)誤差更小,得到的極性分布比ST-CNN-classify模型更為合理。圖7 中的Ψ為震源機(jī)制解的最小矛盾比,范圍在0和1之間,Ψ的數(shù)值越小,表明震源機(jī)制解越準(zhǔn)確。Ψ值進(jìn)一步證明了MT-CNN-classify模型具有更高的P波極性預(yù)測(cè)準(zhǔn)確度。
圖 7 8個(gè)微震事件的極性預(yù)測(cè)結(jié)果
統(tǒng)計(jì)34個(gè)微震事件的最小矛盾比的分布情況,如圖8 所示,圖8 中3種模型最小矛盾比的均值和方差見(jiàn)表3。結(jié)果表明,MT-CNN-classify模型的最小矛盾比大多分布在0~0.1區(qū)間,與ST-CNN-classify結(jié)果相比有較大改善。進(jìn)一步對(duì)比基于回歸模型的 MT-CNN-regression 的結(jié)果(Tian et al,2020),MT-CNN-classify中有13個(gè)事件的最小矛盾比在0~0.05區(qū)間,而MT-CNN-regression模型有11個(gè)事件在該區(qū)間。此外,相比ST-CNN-classify,多道數(shù)據(jù)的分類模型和回歸模型均有較低的最小矛盾比。
圖 8 不同CNN模型的最小矛盾比分布直方圖
表3不同CNN模型最小矛盾比的平均值和方差
為了便于與Tian等(2020)中MT-CNN-regression的結(jié)果對(duì)比,本文構(gòu)建數(shù)據(jù)集的方法與Tian等(2020)相同,但該處理方法存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。首先,將5個(gè)微震事件數(shù)據(jù)增強(qiáng)后的樣本分為訓(xùn)練集與測(cè)試集,導(dǎo)致測(cè)試集與訓(xùn)練集中可能存在同一源數(shù)據(jù)生成的樣本。此外,訓(xùn)練樣本與測(cè)試樣本均來(lái)自5個(gè)微震事件,而檢波器為間距極小的高密臺(tái)陣。因此,對(duì)同一事件,相鄰臺(tái)站的波形記錄相似度極高,即訓(xùn)練集與測(cè)試集中存在高度相似的樣本。
針對(duì)以上兩點(diǎn),對(duì)檢波器個(gè)數(shù)為9的MT-CNN-classify網(wǎng)絡(luò)進(jìn)行交叉驗(yàn)證,即將5個(gè)微震事件數(shù)據(jù)增強(qiáng)后的結(jié)果依次放入訓(xùn)練集和測(cè)試集,該處理方法可避免測(cè)試集與訓(xùn)練集中存在同一源數(shù)據(jù)生成的樣本。5組樣本集交叉驗(yàn)證的訓(xùn)練集和測(cè)試集的準(zhǔn)確度如表4 所示,結(jié)果表明,訓(xùn)練集的準(zhǔn)確度和圖4 相比相差不大,但測(cè)試集準(zhǔn)確度有所降低,由此可證明圖4 所采用的數(shù)據(jù)集存在數(shù)據(jù)泄露。此外,最后一組交叉驗(yàn)證的測(cè)試集準(zhǔn)確度為74.58%,相比前面4組較低,這是由于事件5的信噪比較低。雖然本文使用的數(shù)據(jù)集存在數(shù)據(jù)泄露,導(dǎo)致測(cè)試集的準(zhǔn)確度偏高,但是通過(guò)實(shí)際數(shù)據(jù)的應(yīng)用,MT-CNN-classify模型比ST-CNN-classify的預(yù)測(cè)精度高這一結(jié)論仍然成立。
表4MT-CNN-classify交叉驗(yàn)證
針對(duì)地面微地震監(jiān)測(cè)多為規(guī)則觀測(cè)系統(tǒng),本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的多道極性分類網(wǎng)絡(luò)模型,并以此來(lái)確定微震數(shù)據(jù)的P波極性。多道數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)模型不僅可以學(xué)習(xí)P波極性特征,還能夠?qū)W習(xí)相鄰檢波器的P波極性分布規(guī)律,進(jìn)一步提高目標(biāo)道的預(yù)測(cè)精度。本文著重對(duì)比了ST-CNN-classify、MT-CNN-classify和MT-CNN-regression三個(gè)網(wǎng)絡(luò)模型,實(shí)際數(shù)據(jù)的P波極性預(yù)測(cè)結(jié)果表明,相比單道數(shù)據(jù)的CNN模型,無(wú)論是基于回歸模型還是分類模型的多道數(shù)據(jù)的CNN均可獲得較高的極性預(yù)測(cè)精度。此外,MT-CNN-classify模型的損失曲線比MT-CNN-regression收斂快。本研究提出的基于多道的P波極性分類網(wǎng)絡(luò)還適用于其他具有規(guī)則臺(tái)站分布的地震數(shù)據(jù)集。
致謝:感謝南京物探研究院提供的水力壓裂監(jiān)測(cè)數(shù)據(jù)以及審稿人提出的寶貴意見(jiàn)。