David Cova 劉 洋*③ 丁成震 魏程霖 胡 飛 李韻竹
(①中國石油大學(xué)(北京)油氣資源與探測國家重點(diǎn)實(shí)驗(yàn)室,北京 102249;②中國石油大學(xué)(北京)CNPC 物探重點(diǎn)實(shí)驗(yàn)室,北京 102249;③中國石油大學(xué)(北京)克拉瑪依校區(qū)石油學(xué)院,新疆克拉瑪依 834000;④東方地球物理公司研究院,河北涿州 072751)
靜校正是地震資料處理的重要環(huán)節(jié)之一,而初至拾取是計(jì)算地表靜校正量的一個(gè)重要步驟,特別是在地表?xiàng)l件較為復(fù)雜的地區(qū),低速風(fēng)化層速度變化較為劇烈,準(zhǔn)確、自動(dòng)拾取初至成為解決此類地區(qū)靜校正問題的關(guān)鍵所在。然而,目前大多數(shù)的初至拾取方法只能實(shí)現(xiàn)部分自動(dòng)化,需要花費(fèi)大量時(shí)間進(jìn)行人工質(zhì)量控制。隨著高密度地震采集技術(shù)的應(yīng)用,地震數(shù)據(jù)量變得十分巨大,導(dǎo)致初至拾取過程中耗費(fèi)的人工成本急劇增加?;谏疃葘W(xué)習(xí)的初至自動(dòng)拾取方法成本低、效率高,可以滿足當(dāng)今地震高密度采集的數(shù)據(jù)量需求。傳統(tǒng)的初至自動(dòng)拾取方法,如基于能量的方法[1-2]或基于相關(guān)性的方法[3-4],普遍要求數(shù)據(jù)信噪比高、波形一致。在地形變化劇烈或強(qiáng)噪聲干擾的情況下,初至拾取精度會(huì)降低。
深度神經(jīng)網(wǎng)絡(luò)適合于解決模式匹配分類問題,它由神經(jīng)網(wǎng)絡(luò)演化而來,結(jié)構(gòu)更加復(fù)雜,性能可以隨訓(xùn)練數(shù)據(jù)的增加而提高[5]。
深度學(xué)習(xí)算法可以挖掘數(shù)據(jù)的特征。深度學(xué)習(xí)模型由多個(gè)層次組成,以學(xué)習(xí)具有多個(gè)抽象層次的數(shù)據(jù)表示。這是一種層次漸進(jìn)的特征學(xué)習(xí),先從較低層次的特征中學(xué)習(xí),從而定義更高層次的特征[6]。在此意義上,初至拾取問題可以定義為模式識(shí)別問題,目的是區(qū)分背景噪聲與地震有效數(shù)據(jù)。因此,深層神經(jīng)網(wǎng)絡(luò)可以從地震數(shù)據(jù)中學(xué)習(xí)特征而無需人工干預(yù),將地震數(shù)據(jù)分為噪聲和有效數(shù)據(jù)兩類。
近幾年來,出現(xiàn)了多種應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行初至拾取的方法,如神經(jīng)網(wǎng)絡(luò)[7-8]、支持向量機(jī)[9]、模糊聚類[10]、混合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[11-12]、全卷積網(wǎng)絡(luò)(Fully Convolutional Network,F(xiàn)CN)[13-14]、半監(jiān)督全卷積網(wǎng)絡(luò)(SS-FCN)[15]、U-Net變體[16-17]和伴有遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)[18-19]等。在這些方法中,F(xiàn)CN可以逐像素分類、處理不同大小的數(shù)據(jù),因此被廣泛使用。
FCN起源于CNN,CNN最早由LeCun等[20]提出,但當(dāng)時(shí)計(jì)算能力制約了其更為廣泛的應(yīng)用。近十年來,由于圖像分類技術(shù)的重大突破,卷積神經(jīng)網(wǎng)絡(luò)得到了廣泛的應(yīng)用,相繼開發(fā)了AlexNet[21]、VGG16[22]和GoogleNet[23]等架構(gòu)。CNN能夠逐步減少輸入數(shù)據(jù)占用的空間,并有效增加特征映射的數(shù)量,但是在預(yù)測分辨率方面存在不足。該問題的一種解決方法是使用語義分割進(jìn)行像素級(jí)分類,并從低清晰度表示中恢復(fù)高分辨率輸出。目前,語義分割方法一般使用FCN架構(gòu)。FCN通過下采樣和上采樣兩部分恢復(fù)高分辨率輸出,通常可以通過轉(zhuǎn)置卷積[24-25]或空洞卷積[26-27]實(shí)現(xiàn)。U-Net作為FCN的一種變體,具有多功能性、可處理不同大小的數(shù)據(jù)且分割性能明顯提高[28]等特點(diǎn)。然而,U-Net在實(shí)現(xiàn)初至拾取時(shí)有一定的局限性,尤其是在數(shù)據(jù)的信噪比較低時(shí),拾取結(jié)果的精度會(huì)低于之前的驗(yàn)證精度。因此,網(wǎng)絡(luò)結(jié)構(gòu)需要進(jìn)一步優(yōu)化以減少誤差。此外,對圖像后續(xù)處理也能有效改善拾取結(jié)果[29]。由于近年來U-Net應(yīng)用效果較好,它的結(jié)構(gòu)得到了更為廣泛的拓展,例如UNet++[30]和Attention U-Net(aU-Net)[31]能較好地解決復(fù)雜分割問題。
針對以上問題,本文提出了四個(gè)關(guān)鍵技術(shù)點(diǎn):
(1)將U-Net網(wǎng)絡(luò)模型與簡單變體網(wǎng)絡(luò)模型aU-Net、復(fù)雜變體網(wǎng)絡(luò)模型UNet++的效果進(jìn)行比較,從不同角度分析分割問題;
(2)通過試驗(yàn)確定網(wǎng)絡(luò)超參數(shù),包括對損失函數(shù)、優(yōu)化器和激活函數(shù)等進(jìn)行試驗(yàn);
(3)制定振幅均衡處理流程,可以提高樣本信噪比,均衡訓(xùn)練樣本,提高訓(xùn)練穩(wěn)定性、樣本識(shí)別率和預(yù)測值魯棒性;
(4)在拾取初至之前,對分割的邊緣添加視速度約束以增加圖像分割細(xì)節(jié)。
最后,使用該方法對一套陸地地震數(shù)據(jù)集進(jìn)行初至自動(dòng)拾取,獲得了較好的結(jié)果。
U-Net模型由兩部分組成,第一部分為編碼器(下采樣),第二部分為解碼器(上采樣)。編碼器是一種傳統(tǒng)的CNN,它通過增加特征映射的數(shù)量、減少空間采樣信息提取高層次至低層次的特征。解碼器的作用是恢復(fù)數(shù)據(jù)在編碼過程中的特定位置,逐漸降低分辨率。同時(shí),用殘差連接(Residual Connections)將高分辨率的局部特征與低分辨率的全局特征相結(jié)合,增加更具語義意義的輸出。
在用于初至拾取的U-Net結(jié)構(gòu)中,其工作原理是:在輸入的空間位置中檢測信號(hào)具體的特征,這些特征與地震有效數(shù)據(jù)和背景噪聲的特征有關(guān);對檢測到的特征逐像素進(jìn)行二值分類,得到區(qū)分有效信號(hào)與噪聲的分割圖像,通過訓(xùn)練U-Net學(xué)習(xí)有效信號(hào)和噪聲特征并進(jìn)行分類;將有效信號(hào)與噪聲區(qū)域之間的分割邊緣定義為初至?xí)r間。在初至拾取中,由于初至在單炮記錄上一般是近似對稱出現(xiàn)的,所以邊界檢測問題比傳統(tǒng)的分割問題更簡單。
圖1所示為U-Net結(jié)構(gòu),每個(gè)編碼器層包括兩個(gè)無偏差的級(jí)聯(lián)卷積層以提高分類精度,每個(gè)卷積層的值為
(1)
盡管U-Net已經(jīng)取得了一定的效果,但在分割精度方面仍然存在一些限制。因此,需要使用額外的方法提高分割精度,本文比較了三種不同復(fù)雜度的U-Net結(jié)構(gòu),從不同角度分析該問題。
UNet++[30]與U-Net有三個(gè)不同之處:一是前者的殘差連接具有卷積層,可以用來解決編碼器特征與解碼器語義之間的語義差別;二是前者的殘差密集連接可以改進(jìn)梯度流(Gradient Flow);三是與單一損失層相比,前者的深度監(jiān)督(Deep Supervision)實(shí)現(xiàn)了模型剪枝(Model Pruning),可以更有效地提高性能。
U-Net殘差連接直接將高分辨率的特征映射從編碼器傳送到解碼器,通常這個(gè)過程會(huì)使特征映射產(chǎn)生一定的非相似性。雖然殘差連接有助于恢復(fù)網(wǎng)絡(luò)輸出的空間分辨率,但是結(jié)合來自編碼器與解碼器的語義上不相等的特征映射可能會(huì)降低分割性能。當(dāng)解碼器與編碼器網(wǎng)絡(luò)的特征映射在語義上相似時(shí),分隔精度會(huì)得到提高。為了實(shí)現(xiàn)這一點(diǎn),U-Net++引入了一個(gè)深度監(jiān)督的編碼器和解碼器,其中編碼器與解碼器通過一系列嵌套和密集的殘差連接結(jié)合在一起(圖2)。殘差連接減少了編碼器與解碼器特征映射之間的語義差別,并在高分辨率特征映射上捕捉到細(xì)節(jié)。疊加特征映射的計(jì)算公式為
(2)
式中:Xi,j是節(jié)點(diǎn)的輸出,i是沿編碼器的下采樣層,j是沿著殘差連接的密集塊的卷積層序號(hào);H(·)是緊跟激活函數(shù)的卷積運(yùn)算;u(·)是上采樣層;[]是連接層。
Wide U-Net(wU-Net)[30]的卷積核由U-Net的32×64×128×256×512變?yōu)?7×70×140×280×560,通過采用更多的超參數(shù)提高網(wǎng)絡(luò)性能。wU-Net和UNet++模型具有相似數(shù)量的超參數(shù)(表1),能夠客觀地度量網(wǎng)絡(luò)性能。
圖1 U-Net結(jié)構(gòu)
圖2 UNet++結(jié)構(gòu)
表1 U-Net變體的超參數(shù)
雖然U-Net具有表達(dá)能力強(qiáng)、推理速度快、濾波器共享等特點(diǎn),但是當(dāng)目標(biāo)的形狀和大小有很大變化時(shí),它需要依賴多級(jí)串聯(lián)的CNN。此外,傳統(tǒng)方法會(huì)導(dǎo)致計(jì)算資源和模型參數(shù)的過度冗余使用。為了解決這一問題,發(fā)展了Attention U-Net模型,即aU-Net[31]模型(圖3a),引入了注意門(Attention Gates,AGs)(圖3b)。
AGs可以在沒有額外監(jiān)督的情況下專注于目標(biāo)結(jié)構(gòu)進(jìn)行自動(dòng)學(xué)習(xí)。在訓(xùn)練過程中,這些門突出對分類任務(wù)有用的顯著特征。此外,它不會(huì)顯著增加計(jì)算量,也不像多模型框架那樣需要大量的模型參數(shù)(表1)。AGs通過抑制不相關(guān)區(qū)域的特征,提高了模型對稠密標(biāo)簽預(yù)測的敏感性和準(zhǔn)確性,同時(shí)保持了較高的預(yù)測精度。
AGs可以通過以下公式表達(dá),即
(3)
(4)
通過比較U-Net與基于U-Net的三種不同變體模型的性能,發(fā)現(xiàn)U-Net優(yōu)于復(fù)雜化的U-Net變體。下面對U-Net的每個(gè)超參數(shù)進(jìn)行詳盡測試以得到最優(yōu)化的結(jié)果。測試的參數(shù)包括學(xué)習(xí)率(Learning Rate)、激活功能(Activation Function)、損失函數(shù)(Loss Function)、優(yōu)化器(Optimizer)、舍棄比率(Dropout Rate)和權(quán)重初始化(Weight Initialization)等(表2)。
重點(diǎn)分析激活函數(shù)和損失函數(shù)。首先,傳統(tǒng)的U-Net激活函數(shù)是ReLU[32],它存在梯度消失問題。為了避免這種情況,研究人員嘗試了ELU[31],并取得了一些效果。本文中除了以上兩個(gè)函數(shù)之外,還比較了另外兩個(gè)激活函數(shù),一個(gè)是帶泄露修正線性單元(Leaky ReLU,LReLU)[33],這是對傳統(tǒng)ReLU的簡單改進(jìn),可避免梯度消失問題;另一個(gè)是SELU[34],這是一個(gè)更復(fù)雜的解決方案,可以與ELU相媲美。它們的表達(dá)式分別為
圖3 aU-Net 變體(a)aU-Net結(jié)構(gòu); (b)注意門R、S分別為ReLU、Sigmiod激活函數(shù)
表2 測試的超參數(shù)
(5)
和
(6)
式中:Rl,k是第k特征圖處LReLU的輸入;Rs,k是第k特征圖處SELU的輸入;Zk是第k維特征圖處的值;在默認(rèn)情況下λl為0.001、λs約為1.0507、as約為1.6733,λs和as為固定值,使輸入均值為0、標(biāo)準(zhǔn)差為1。
LReLU是經(jīng)典的ReLU的變體,它在計(jì)算導(dǎo)數(shù)時(shí)設(shè)置一個(gè)小的梯度,使梯度值不再停留在零上,因而避免了梯度消失問題;由于沒有指數(shù)運(yùn)算,因而計(jì)算速度比ELU快;缺點(diǎn)是不能避免梯度爆炸問題,因?yàn)閍s值是不可學(xué)習(xí)的,它是預(yù)先定義的,取微分時(shí)變成線性函數(shù),而ELU是非線性的。
另一方面,SELU允許網(wǎng)絡(luò)通過內(nèi)部規(guī)范化特性實(shí)現(xiàn)更快收斂,輸出自動(dòng)歸一化至零平均值和單位方差。此外,該網(wǎng)絡(luò)權(quán)重初始化需要正態(tài)(高斯)分布。它的另外一個(gè)優(yōu)點(diǎn)是不存在梯度消失問題,可通過映射兩個(gè)連續(xù)層之間的均值(μ)和方差(υ)計(jì)算as和λs,并找到同時(shí)滿足兩個(gè)層的不動(dòng)點(diǎn)(μ,υ)=(0,1)的解。
在常規(guī)的炮點(diǎn)道集中,樣本數(shù)量大于初至波樣本和噪聲樣本,因此目前初至拾取面臨的主要問題之一是樣本不平衡(Data Imbalance)。為了克服這一問題,本文測試了四種類型的損失函數(shù):第一種是基于概率分布的二元交叉熵?fù)p失函數(shù)(Binary Cross Entropy,BCE);第二種是基于區(qū)域的損失函數(shù),包括Dice、Tversky和Focal Tversky等;第三種是基于邊界的損失函數(shù),例如Huber;第四種是基于合并的損失函數(shù),例如將交叉熵與Dice合并為一個(gè)損失函數(shù)(二元交叉熵代價(jià)函數(shù)+Dice)。二元交叉熵代價(jià)函數(shù)+Dice[30]為
(7)
式中:Y是真實(shí)值;Z是預(yù)測結(jié)果;N是批大小(Batch Size)。
Dice系數(shù)(Dice Coefficient)[35]為預(yù)測值與實(shí)際值之間相似度的評(píng)價(jià)指標(biāo),局限性在于假陽性(False Positives,F(xiàn)P)與假陰性(False Negatives,F(xiàn)N)的權(quán)重相等,即精度高但召回率低。初至拾取是一個(gè)高度不平衡的問題,因此要求FN的權(quán)重高于FP以提高召回率。
Tversky指數(shù)[36]是平衡FP與FN的Dice系數(shù)的一個(gè)推廣,通過最小化,Tversky指數(shù)可變成損失函數(shù),即
(8)
式中:β是假陰性的權(quán)重;ε是防止被零除的數(shù)值穩(wěn)定因子。通過調(diào)整超參數(shù)α和β,可以控制假陽性與假陰性之間的權(quán)衡。較大的β值會(huì)提高模型的收斂性。當(dāng)α=β=0.5時(shí),Tversky函數(shù)簡化為Dice函數(shù)。
Focal Tversky函數(shù)[37]向前更進(jìn)一步,引入了一個(gè)與標(biāo)簽頻率成反比的權(quán)重,即
(9)
式中γ是焦點(diǎn)參數(shù)因子,可以控制容易分類的“數(shù)據(jù)”部分與難以分類的“噪聲”部分。該指數(shù)對分類良好的樣本的誤差進(jìn)行加權(quán),防止了大量分類錯(cuò)誤的樣本對梯度的影響,進(jìn)而緩解了類別不平衡。另外,當(dāng)γ=1時(shí),F(xiàn)ocal Tversky函數(shù)簡化為Tversky函數(shù)。
Huber函數(shù)[38]是由可調(diào)參數(shù)δ確定的平均絕對誤差(Mean Absolute Error,MAE)與均方誤差(Mean Squared Error,MSE)之間的平衡,即
Lh(Y,Z)=
(10)
該損失函數(shù)用于變化較大的數(shù)據(jù)或有很少異常值的數(shù)據(jù)。當(dāng)δ趨近0時(shí),Huber函數(shù)接近MAE;當(dāng)δ趨近∞時(shí),Huber函數(shù)接近MSE。對于較大的異常值,建議使用較小的δ值,因?yàn)镸SE會(huì)影響損失值。但是,當(dāng)異常值很少時(shí),建議使用較大的δ值,因?yàn)镸SE會(huì)比MAE作用更大。
球面擴(kuò)散引起信號(hào)能量的變化、噪聲等從而導(dǎo)致地震數(shù)據(jù)中信號(hào)能量的不均衡,進(jìn)而直接影響網(wǎng)絡(luò)訓(xùn)練的性能(圖4a)。本文使用基于四分位距法(Inter Quartile Range,IQR)[39]的最小—最大標(biāo)準(zhǔn)化法和百分位限幅以提高振幅,利用傳統(tǒng)的2σ-3σ限幅以處理異常值。應(yīng)用全局百分比歸一化方法,數(shù)據(jù)在該圖中位于標(biāo)準(zhǔn)差2σ范圍內(nèi)的百分比為95.45%,而位于3σ范圍內(nèi)的百分比為99.73%。
數(shù)據(jù)集的差異性可以通過范圍和標(biāo)準(zhǔn)差衡量,但是它們對異常值十分敏感?;谏舷滤姆治粩?shù)測量離散度,且在測量數(shù)據(jù)離散度時(shí)更能規(guī)避異常值的影響。通過IQR可以獲知第一個(gè)和第三個(gè)四分位數(shù)的間距,可顯示數(shù)據(jù)分布中間50%范圍的值。
圖4 不同方法對地震數(shù)據(jù)振幅處理效果對比(a)原始地震; (b)AGC; (c)RMS; (d)本文方法
雖然傳統(tǒng)的自動(dòng)增益控制(Automatic Gain Control,AGC)是一種較有效的方法,但它會(huì)加強(qiáng)初至之前的噪聲,這對網(wǎng)絡(luò)正確識(shí)別和分類樣本而言是一個(gè)問題(圖4b),AGC使網(wǎng)絡(luò)更加難以區(qū)分噪聲與有效數(shù)據(jù)。同時(shí),低頻噪聲可能會(huì)出現(xiàn)在初至波的前面,這可能導(dǎo)致分類錯(cuò)誤。初至波應(yīng)當(dāng)盡可能清晰,以便網(wǎng)絡(luò)能從數(shù)據(jù)像素中識(shí)別出噪聲。
均方根(RMS)振幅歸一化方法能夠在一定程度上解決這個(gè)問題,但也存在一些不足(圖4c):①在較遠(yuǎn)的地震道中,噪聲在整個(gè)地震道中都被增強(qiáng),且在面波周圍區(qū)域的特征歸一化后能量較低;②3000ms以下深層的地震數(shù)據(jù)能量并沒有完全增強(qiáng)。
因此,為了在樣本之間獲得適當(dāng)?shù)钠胶饽芰?,本文將RMS歸一化法與最小—最大標(biāo)準(zhǔn)化法和IQR限幅相結(jié)合以截?cái)鄻O值,并加上T平方補(bǔ)償解決球面發(fā)散問題(圖4d)。此方法的優(yōu)勢在于均衡了整炮數(shù)據(jù),從而網(wǎng)絡(luò)在訓(xùn)練過程中可以更容易地正確識(shí)別和分類樣本。
在神經(jīng)網(wǎng)絡(luò)中,Basheer等[40]建議在0.1~0.9內(nèi)進(jìn)行歸一化以避免飽和,這非常適合網(wǎng)絡(luò)內(nèi)部的激活函數(shù),并且不會(huì)導(dǎo)致學(xué)習(xí)率降低。此外,使用該范圍(0.1~0.9)進(jìn)行分類任務(wù)時(shí)會(huì)得出錯(cuò)誤的后驗(yàn)概率估值,采用最小—最大標(biāo)準(zhǔn)化將其分布范圍限制在0~1內(nèi),計(jì)算公式為
(11)
式中:x表示總樣本;xi為待標(biāo)準(zhǔn)化的樣本;min(x)為采樣點(diǎn)中的最小值;max(x)為采樣點(diǎn)中的最大值。該方法的主要優(yōu)點(diǎn)是對原始數(shù)據(jù)中的信息干擾小,尤其是在非高斯分布或標(biāo)準(zhǔn)差很小的時(shí)候。
均值和方差很容易受到異常值的影響??s尾處理(Winsorization)或限幅(Clipping)可以有效地解決這個(gè)問題并能增強(qiáng)統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確性。振幅范圍越大,顯示的細(xì)節(jié)越少。因此,振幅直方圖上的四分位數(shù)、峰度和偏度有助于分析數(shù)據(jù)分布,并可適當(dāng)?shù)丶舨脭?shù)據(jù),從而避免可能影響歸一化的尖脈沖。
通常,在顯示地震剖面時(shí),振幅限制是通過振幅范圍的2σ(95.45%)、3σ(99.73%)或99%的對稱以避免出現(xiàn)明顯的尖峰,如圖5所示。然而,數(shù)據(jù)通常是非對稱的,并且適合于計(jì)算用于限幅的各個(gè)四分位數(shù),這在選擇限幅邊界時(shí)可以提供直接控制。
四分位距是一個(gè)統(tǒng)計(jì)度量,其中“中值50”位于數(shù)據(jù)之中,如圖5所示,其計(jì)算公式為
IQR=Q3-Q1
(12)
式中:Q3是75%以上數(shù)據(jù)的四分位數(shù);Q1是25%以下數(shù)據(jù)的四分位數(shù)。限幅的原理是:給異常值分配較低的權(quán)重或修改權(quán)值使其接近集合中的其他值,最小化異常值的影響。在這種情況下,IQR修改Q1與Q3間隔之外的數(shù)據(jù)點(diǎn)值,不會(huì)修改Q1與Q3之間的數(shù)據(jù)點(diǎn)值。
圖5 IQR與σ的對比圖 σ為綠線,2σ為紫線,IQR為藍(lán)線,99% 四分位數(shù)為紅線,1.5×IQR為黑線
綜上所述,本文設(shè)計(jì)振幅均衡處理流程如圖6所示。
圖6 振幅均衡處理流程
結(jié)合地球物理參數(shù)的約束,能間接地提高分割圖像的精度,使網(wǎng)絡(luò)預(yù)測更穩(wěn)定。首先,為了降低不確定性,將高程靜校正應(yīng)用于炮檢道集。盡管這些靜校正量并不完全準(zhǔn)確,但它們減少了地震道之間的變化;然后,為了減少錯(cuò)誤分類像素的影響,在初至附近增加視速度約束。錯(cuò)誤分類像素與初至波上下的低信噪比相關(guān),可以定義兩個(gè)視速度約束解決這個(gè)問題,一個(gè)是初至之上的高速約束解決噪聲誤分類;另一個(gè)是初至之下的低速約束解決有效信號(hào)誤分類。這些錯(cuò)誤分類像素通常出現(xiàn)在遠(yuǎn)離分割邊緣的地方。網(wǎng)絡(luò)可以處理很寬的邊界,且在近地表速度劇烈變化的區(qū)域也能獲得很高的精度。
圖7為視速度約束的初至拾取流程圖,它可以提高分割精度和初至的檢測精度。這種地球物理參數(shù)約束可通過糾正像素分類錯(cuò)誤,解決分割異常問題以獲得更高的分辨率。根據(jù)區(qū)域內(nèi)不太可能出現(xiàn)的速度值調(diào)整上、下限。本文中,速度約束邊界值分別為1650m/s和2100m/s。利用如下公式進(jìn)行速度約束
(13)
圖7 視速度約束的初至拾取流程圖
本文采用Dice系數(shù)和Jaccard指數(shù)兩個(gè)經(jīng)典的相似度評(píng)價(jià)指標(biāo)評(píng)估預(yù)測結(jié)果。
Dice系數(shù)[35]表達(dá)式為
(14)
式中Np是樣本中的像素總數(shù)。
Jaccard指數(shù)[41]表達(dá)式為
(15)
本文所用數(shù)據(jù)為陸上二維地震資料,包含1000個(gè)炮集。道間距為25 m,最大炮檢距為6 km,每個(gè)炮集包含480道,采樣間隔為2 ms。振幅隨炮檢距的增加而衰減是初至拾取面臨的主要挑戰(zhàn),但數(shù)據(jù)調(diào)節(jié)后,圖4d中顯示的振幅更均衡。此外,初至拾取僅限于近、中炮檢距(3 km左右)的范圍內(nèi),遠(yuǎn)炮檢距將用于評(píng)估無訓(xùn)練樣本區(qū)域的預(yù)測效果。
振幅調(diào)整用于減少數(shù)據(jù)分類中出現(xiàn)的問題,并平衡相同類別數(shù)據(jù)間的能量。圖4顯示了原始資料、AGC處理后、RMS處理后和振幅調(diào)整后的記錄。由圖可見,與原始資料、AGC處理后、RMS處理后資料相比,經(jīng)振幅調(diào)整后的炮集能量更均衡。圖8顯示了振幅調(diào)整中每個(gè)步驟之后的能量直方圖,可見能量得到均衡,振幅異常得到明顯衰減(圖8f)。
將采樣尺寸設(shè)置為64×64像素,這相當(dāng)于128ms的時(shí)間窗長和1600m的炮檢距范圍,保留噪聲樣本以增強(qiáng)網(wǎng)絡(luò)泛化性,而不是像Lu等[42]那樣刪除它們。
訓(xùn)練標(biāo)簽是利用人工拾取的初至通過二進(jìn)制編碼(例如白色和黑色)填充像素而創(chuàng)建的。標(biāo)簽是手動(dòng)選取創(chuàng)建的,第一個(gè)分隔符上方的像素等于1,下方的像素等于0。然后,在樣品提取之后,根據(jù)如下公式將樣品與標(biāo)簽配對
(16)
圖8 振幅處理過程中的能量直方圖(a)原始地震; (b)T平方球面發(fā)散修正; (c)振幅限制至99%; (d)振幅限制至IQR; (e)逐道均方根歸一化; (f)最小—最大標(biāo)準(zhǔn)化
式中:S是樣本;下標(biāo)ij表示像素位置。全白(100%)像素填充的樣本被標(biāo)記為噪聲,被20%到80%白色像素充填的樣本被標(biāo)記為初至波;無白色像素(0%)的樣本被標(biāo)記為有效數(shù)據(jù)。從理論上講,初至波呈高斯分布。在這種情況下,高斯分布的極值容易導(dǎo)致錯(cuò)誤分類。因此,為了確保初至波能夠被識(shí)別,本文將像素?cái)?shù)分布限制在20%~80%以保持穩(wěn)定性。分布在0~20%和80%~100%數(shù)據(jù)被丟棄。如果像素比例太低(小于10%),則可能會(huì)將其錯(cuò)誤分類為有效數(shù)據(jù);如果比例過高(超過90%),則可能會(huì)誤判為噪聲。
在訓(xùn)練數(shù)據(jù)較少的情況下,可以通過數(shù)據(jù)增廣增加訓(xùn)練數(shù)據(jù)量[43]。本文通過水平翻轉(zhuǎn)炮集以增加所提取樣本的數(shù)量,這類似于采集中從兩個(gè)方向放炮。這種方式既保留了觀測系統(tǒng)信息,又將樣本數(shù)增加了一倍。數(shù)據(jù)集被隨機(jī)地分為兩個(gè)部分,其中80%用于5倍交叉驗(yàn)證(CV),20%用于測試。在訓(xùn)練階段,5倍交叉驗(yàn)證數(shù)據(jù)集(80%)分成五個(gè)部分,其中四個(gè)部分用于訓(xùn)練,一個(gè)用于驗(yàn)證。然后,計(jì)算平均的訓(xùn)練和驗(yàn)證誤差。最后,在對模型進(jìn)行微調(diào)之后,使用測試數(shù)據(jù)集比較三個(gè)U-Net變體的結(jié)果。經(jīng)過100 次迭代后實(shí)現(xiàn)了收斂。在一個(gè)內(nèi)存(RAM)為4 GB的NVIDIA Quadro K4200中訓(xùn)練時(shí)間為26h。最終的訓(xùn)練準(zhǔn)確率為99.83%,驗(yàn)證準(zhǔn)確率為99.79%。
本文僅測試、評(píng)估不同U-Net超參數(shù)(學(xué)習(xí)率、激活函數(shù)、損失函數(shù)、優(yōu)化器、舍棄比率權(quán)重初始化等)大小以及不同U-Net超參數(shù)組合對初至拾取的影響。
學(xué)習(xí)率決定了神經(jīng)網(wǎng)絡(luò)在反向傳播過程中每次更新權(quán)值的步長,它影響了收斂的速度(圖9)。由圖可見,學(xué)習(xí)率越大,預(yù)測值異常越大(圖9a),這是因?yàn)榻鉀Q方案局限于局部最小值;設(shè)法減小左側(cè)的預(yù)測值異常(圖9b)時(shí),右側(cè)的預(yù)測值異常仍然明顯;學(xué)習(xí)率越小,預(yù)測精度越高(圖9c),可見左側(cè)和右側(cè)預(yù)測值異常均明顯減小。
激活函數(shù)增加了模型的非線性。將函數(shù)ReLU與三種函數(shù)(LReLU,ELU,SELU)進(jìn)行比較(圖10)以選擇合適的激活函數(shù)。與其他三個(gè)函數(shù)相比,ReLU具有更廣范圍的異常值(圖10a);LReLU的異常值較高 (圖10b);ELU縮小了異常值范圍(圖10c);SELU效果最佳,不僅減少了異常值,且提高了初至預(yù)測精度(圖10d)。
損失函數(shù)用于衡量學(xué)習(xí)過程中預(yù)測值與實(shí)際值之間的差異或偏差(圖11)。由圖可見,BCE、Dice和Tversky的函數(shù)組合對初至預(yù)測的結(jié)果相對較好,但有一些較大的異常值(圖11a)。損失函數(shù)的組合并非總能產(chǎn)生良好的效果,因?yàn)閰?shù)差異可能會(huì)導(dǎo)致意想不到的破壞作用。Dice和BCE函數(shù)組合使異常值減小,連續(xù)性降低(圖11b)。BCE盡管使初至預(yù)測異常值減小,但其連續(xù)性也受到影響 (圖11c)。Huber在以少量降低初至波連續(xù)性為代價(jià)的情況下,提供了減小異常值的最佳方案(圖11d)。
在超參數(shù)優(yōu)化器類型中,隨機(jī)梯度下降(SGD)以其脫離局部最小值的速度和能力而聞名[44]。Adadelta根據(jù)歷史梯度衡量學(xué)習(xí)率,學(xué)習(xí)率隨著訓(xùn)練過程自動(dòng)逐漸減小[45]。自適應(yīng)矩估計(jì)(Adam)使用隨機(jī)梯度下降估計(jì)歷史梯度的一階和二階矩[46]。Adamax是一種基于無窮范數(shù)的Adam變體,參數(shù)更新的計(jì)算要比Adam更簡單[46]。RMSprop通過調(diào)整更新參數(shù)時(shí)的步長以加快梯度下降。
圖9 不同學(xué)習(xí)率對初至拾取的影響(a)10-4; (b)10-5; (c)10-6紅線為預(yù)測結(jié)果,箭頭所指尖峰為預(yù)測值異常。 圖10~圖15、圖17~圖21同
五種優(yōu)化器對初至拾起的效果如圖12所示。SGD初至拾起的效果不好(圖12a),這可能與內(nèi)在跳躍相關(guān)。與其他方法迭代次數(shù)相同時(shí),SGD初至自動(dòng)拾取效果均不好。相對于SGD而言,RMS-prop初至拾起的效果改善明顯,只是預(yù)測值異常高(圖12b)。Adadelta對預(yù)測值異常減小一半(圖12c)。Adam幾乎消除了預(yù)測值異常,但初至波出現(xiàn)了輕微的不連續(xù)(圖12d)。Adamax不僅消除預(yù)測值異常,而且保證了初至拾取的連續(xù)性(圖12e)。
圖10 不同激活函數(shù)對初至拾取的影響(a)ReLU; (b)LReLU; (c)ELU; (d)SELU
圖11 不同損失函數(shù)對初至拾取的影響(a)BCE+Dice+Tversky; (b)BCE+Dice; (c)BCE; (d)Huber
圖12 不同優(yōu)化器對初至拾取的影響(a)SGD; (b)RMSprop; (c)Adadelta; (d)Adam; (e)Adamax
隨機(jī)舍棄一些神經(jīng)元,可以緩解網(wǎng)絡(luò)過擬合,提高網(wǎng)絡(luò)的通用性。圖13中展示了舍棄比率對初至拾取的影響。當(dāng)舍棄比率為0.05時(shí)(圖13d),效果最佳;舍棄比率為0.1和0.2時(shí)效果較好(圖13b和圖13c);當(dāng)舍棄比率為0時(shí),預(yù)測值異常大(圖13a),如果誤差過大,則需要較長的訓(xùn)練時(shí)間才能收斂到解而得到滿意的拾取效果。
在訓(xùn)練之前,初始化權(quán)重決定了網(wǎng)絡(luò)的初始狀態(tài),可以避免梯度消失或爆炸問題的出現(xiàn)。為此,LeCun等[47]利用高斯分布函數(shù)得到初始化權(quán)重,再乘以輸入數(shù)據(jù)的平方根。Glorot等[48]和He等[49]改進(jìn)了LeCun初始化方式。Glorot等[48]初始化更適用于具有Sigmoid的網(wǎng)絡(luò)層;He等[49]初始化更適用于具有ReLU的網(wǎng)絡(luò)層。由圖14可見,LeCun正態(tài)分布權(quán)重初始化對初至拾取的預(yù)測值異常在左右兩側(cè)均很大(圖14a);He正態(tài)分布權(quán)重初始化對初至拾取的預(yù)測值異常在左側(cè)幾乎完全消除,而右側(cè)的異常也減小(圖14b); Glorot正態(tài)分布權(quán)重初始化對初至拾取的預(yù)測值異常在左側(cè)已得到完全校正,而右側(cè)也減小(圖14c)。
圖13 不同舍棄比率對初至拾取的影響(a)0; (b)0.20; (c)0.10; (d)0.05
對比不同網(wǎng)絡(luò)架構(gòu)初至拾取的結(jié)果(圖15)。不建議體系結(jié)構(gòu)之間共享相同的超參數(shù),本文實(shí)驗(yàn)選定損失函數(shù)Focal Tversky的參數(shù)為γ=2、α=0.3、β=0.7、ε=1;Huber損失函數(shù)的參數(shù)為δ=0.9,目的是將每個(gè)網(wǎng)絡(luò)優(yōu)化到最佳狀態(tài),每個(gè)架構(gòu)的最佳超參數(shù)如表3所示。此外,為了提高實(shí)驗(yàn)結(jié)果精度,aU-Net模型包含了一種深度監(jiān)督和金字塔式訓(xùn)練的變體。
圖14 不同權(quán)重初始化對初至拾取的影響(a)LeCun正態(tài); (b)He正態(tài); (c)Glorot正態(tài)
UNet++模型通過一系列嵌套和殘差密集連接,形成最復(fù)雜的網(wǎng)絡(luò)架構(gòu),拾取的初至連續(xù)性好,但沒能降低預(yù)測值異常(圖15a); aU-Net架構(gòu)初至預(yù)測值異常有所減小,但初至不連續(xù)(圖15b),這很可能是由于結(jié)構(gòu)簡單及參數(shù)的減少導(dǎo)致偏差的增大;伴有深度監(jiān)督的aU-Net架構(gòu),網(wǎng)絡(luò)架構(gòu)復(fù)雜性增加,可以降低預(yù)測值異常(圖15c); wU-Net架構(gòu)初至拾起中,盡管預(yù)測值異常減小,但拾取的連續(xù)性受到了很大的影響(圖15d); U-Net架構(gòu)拾起初至消除了預(yù)測值異常且保存了連續(xù)性,效果好(圖15e)。
表3 每個(gè)架構(gòu)的最佳超參數(shù)
綜上所述,在某些情況下,在復(fù)雜模型與簡單模型之間尋找平衡,不實(shí)施新架構(gòu)而集中更多精力優(yōu)化超參數(shù)時(shí),也有可能獲得令人滿意的結(jié)果。
與傳統(tǒng)的BCE相比,U-Net的優(yōu)勢在于損失函數(shù)Huber更關(guān)注邊界。與傳統(tǒng)的ReLU和Adamax優(yōu)化器相比,損失函數(shù)SELU可對網(wǎng)絡(luò)進(jìn)行歸一化并提高準(zhǔn)確性,這是對傳統(tǒng)的Adam優(yōu)化器的改進(jìn)。
圖15 不同網(wǎng)絡(luò)架構(gòu)初至拾取的結(jié)果對比(a)UNet++; (b)aU-Net; (c)aU-Net+DP; (d)wU-Net; (e)U-Net
計(jì)算速度約束前、后分割圖像的準(zhǔn)確度、查全率、Dice系數(shù)和Jaccard指數(shù)(表4,值越大意味著性能越好),結(jié)果表明,本文方法提高了初至波預(yù)測的精度。
表4 速度約束前、后的得分比較
應(yīng)用接受者操作特性 (Receiver Operating Characteristic,ROC)[50]曲線評(píng)估最終預(yù)測結(jié)果。圖16顯示了速度約束前、后每道分割結(jié)果的ROC曲線。由圖可見,平均真正例率(True Positive Rate,TPR)或查全率從0.9854提高到0.9866;而假正例率(False Positive Rate,F(xiàn)PR)仍保持在0.0014。TPR是噪聲樣本的正確分類,而FPR是數(shù)據(jù)樣本的正確分類。速度約束后的結(jié)果更接近理想情況,即FPR=0、TPR=1。這說明速度約束可以改善分類效果。具體來說,在低信噪比的區(qū)域(例如遠(yuǎn)炮檢距區(qū)域)中,像素?zé)o法準(zhǔn)確區(qū)分有效數(shù)據(jù)與噪聲數(shù)據(jù),噪聲數(shù)據(jù)降低了所預(yù)測初至波時(shí)間的精度,而視速度約束可以修改這些像素,從而提高拾取精度。
圖16 速度約束前(紅點(diǎn))后(藍(lán)點(diǎn))每道分割結(jié)果
圖17顯示了本文方法所預(yù)測的初至波。結(jié)果表明,自動(dòng)拾取的初至在近炮檢距連續(xù)性好,中炮檢距也準(zhǔn)確,且在低能區(qū)(白色箭頭)的預(yù)測值異常點(diǎn)很少。圖17a中藍(lán)色箭頭指示了比原始初至拾取結(jié)果精度更高的網(wǎng)絡(luò)區(qū)域;圖17b顯示了拾取的初至與地面起伏存在良好的對應(yīng)關(guān)系(藍(lán)色箭頭所示);由圖17c可見,在先前標(biāo)記信息丟失的中炮距檢區(qū)域初至拾取效果較好,這表明在沒有初至波信息的情況下網(wǎng)絡(luò)能夠預(yù)測初至;圖17d表明,在能量較弱的區(qū)域預(yù)測精度會(huì)降低(白色箭頭所示),并且在末端地震道中拾取結(jié)果欠穩(wěn)定(紅色箭頭所指),并出現(xiàn)在所有采樣點(diǎn)中。這個(gè)普遍存在的問題可能是由于計(jì)算誤差引起的,而不是網(wǎng)絡(luò)預(yù)測中所固有的。
對比并定量分析預(yù)測結(jié)果與人工拾取的結(jié)果,如圖18所示。由圖可見,某一單炮負(fù)炮檢距情況下絕對平均誤差為2.5088ms (圖18b);另一單炮正負(fù)炮檢距情況下絕對平均誤差為4.0812ms(圖18d),大于4個(gè)樣點(diǎn)值。同時(shí),也可以看到在信噪比低的區(qū)域預(yù)測誤差增大。
圖19顯示的是參與訓(xùn)練的多炮人工拾取初至與本文方法預(yù)測結(jié)果的對比,平均誤差為8.8993 ms,小于5個(gè)樣點(diǎn)值。
之前所有的訓(xùn)練樣本都來自Xline方向,因此選取了一條與訓(xùn)練樣本垂直的測線試驗(yàn)。圖20顯示在正炮檢距和正負(fù)炮檢距本文方法自動(dòng)拾取初至的預(yù)測值與人工拾取的結(jié)果吻合都很好。正炮檢距下預(yù)測結(jié)果和人工拾取一致,絕對平均誤差為1.9855ms (圖20b);在正負(fù)炮檢距在沒有人工拾取的情況下,本文方法仍然能夠預(yù)測出初至結(jié)果,絕對平均誤差為6.8889ms (圖20d)。
應(yīng)用本文方法對另一個(gè)工區(qū)的數(shù)據(jù)進(jìn)行試驗(yàn),未重新訓(xùn)練,而是直接利用以前的訓(xùn)練結(jié)果。由于遠(yuǎn)地震道的初至信噪比很低,自動(dòng)拾取誤差大。單炮記錄1預(yù)測結(jié)果與人工拾取吻合度很高,絕對平均誤差為2.9785ms (圖21b);單炮記錄2絕對平均誤差為13.1448ms (圖21d)。盡管信噪比不高,但是訓(xùn)練網(wǎng)絡(luò)仍能取得令人滿意的預(yù)測結(jié)果。
圖17 不同炮檢距初至自動(dòng)拾取結(jié)果(a)和(c)為近炮檢距; (b)和(d)為近中炮檢距 藍(lán)線為手動(dòng)拾取,紅線為本文方法自動(dòng)拾取,圖18~圖21同
圖18 訓(xùn)練數(shù)據(jù)的人工拾取初至和本文方法預(yù)測結(jié)果差異(a)負(fù)炮檢距; (b)負(fù)炮檢距的誤差; (c)正負(fù)炮檢距; (d)正負(fù)炮檢距的誤差
圖19 參與訓(xùn)練的多炮人工拾取初至和本文方法預(yù)測結(jié)果差異
圖20 對未參與訓(xùn)練的數(shù)據(jù)進(jìn)行初至預(yù)測(a)正炮檢距; (b)正炮檢距的誤差; (c)正負(fù)炮檢距; (d)正負(fù)炮檢距的誤差
圖21 對未參與訓(xùn)練的另一工區(qū)的數(shù)據(jù)進(jìn)行初至預(yù)測(a)單炮記錄1; (b)單炮記錄1的拾取誤差; (c)單炮記錄2; (d)單炮記錄2的拾取誤差
本文研究了基于U-Net網(wǎng)絡(luò)和視速度約束的地震波初至自動(dòng)拾取方法,并進(jìn)行了參數(shù)試驗(yàn)和實(shí)際資料初至拾取試驗(yàn),取得的主要結(jié)論為:
(1)基于速度約束的方法提高了分割圖像中邊界識(shí)別精度,這些邊界指示了初至波的時(shí)間;
(2)最小—最大歸一化和四分位距限幅通過平衡樣本能量對網(wǎng)絡(luò)訓(xùn)練性能有積極影響,提高了分類精度;
(3)該方法在低信噪地震資料中進(jìn)行應(yīng)用,預(yù)測值異常較小。