邵蓉波, 肖立志*, 廖廣志, 史燕青, 周軍,, 李國軍, 侯學(xué)理
1 中國石油大學(xué)(北京)人工智能學(xué)院, 北京 102249 2 中國石油集團(tuán)測(cè)井有限公司, 西安 710077
隨著近年來數(shù)據(jù)科學(xué)和人工智能的發(fā)展,利用機(jī)器學(xué)習(xí)解決地球物理測(cè)井、地震勘探等方面的問題受到廣泛重視.相較于傳統(tǒng)方法,數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法跳出領(lǐng)域知識(shí),從全新的角度觀察數(shù)據(jù),探索更大的函數(shù)空間,在物理關(guān)系未知的情況下對(duì)數(shù)據(jù)和目標(biāo)進(jìn)行映射,提供了在高維空間中表征變量之間關(guān)系的方法,減少了研究人員對(duì)地質(zhì)地球物理及巖石物理學(xué)知識(shí)的需求(Bergen et al., 2019).地球物理和人工智能發(fā)展的另一個(gè)思路是將機(jī)理模型融入機(jī)器學(xué)習(xí)之中,既可以提升地球物理機(jī)器學(xué)習(xí)模型的可解釋性,又能夠更準(zhǔn)確地對(duì)巖石物理關(guān)系進(jìn)行映射(Reichstein et al., 2019; 肖立志, 2022).已有學(xué)者對(duì)神經(jīng)網(wǎng)絡(luò)在地球物理中的應(yīng)用展開研究,席道瑛和張濤(1994)使用反向傳播神經(jīng)網(wǎng)絡(luò)自動(dòng)識(shí)別巖性.近些年,Kohli等(2014)構(gòu)建了數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)模型,根據(jù)不同偏移距井的測(cè)井資料計(jì)算滲透率.張東曉等(2018)將LSTM與串級(jí)系統(tǒng)相結(jié)合,提出串級(jí)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(CLSTM),實(shí)驗(yàn)表明CLSTM更適用于生成序列式的測(cè)井?dāng)?shù)據(jù).Sultan(2019)采用自適應(yīng)差分進(jìn)化(SaDE)方法優(yōu)化人工神經(jīng)網(wǎng)絡(luò)(ANN)的參數(shù),有效地預(yù)測(cè)了總有機(jī)碳(TOC),與傳統(tǒng)的估算方法相比神經(jīng)網(wǎng)絡(luò)方法更加高效精準(zhǔn).廖廣志等(2020)的研究表明卷積神經(jīng)網(wǎng)絡(luò)可以用于預(yù)測(cè)儲(chǔ)層微觀孔隙結(jié)構(gòu),且優(yōu)于單層神經(jīng)網(wǎng)絡(luò)模型.Al-AbdulJabbar等(2020)利用人工神經(jīng)網(wǎng)絡(luò)(ANN)根據(jù)鉆井參數(shù)預(yù)測(cè)儲(chǔ)層孔隙度,并取得較好的預(yù)測(cè)效果.Gao等(2020)利用井旁道數(shù)據(jù)與測(cè)井含氣性解釋結(jié)果建立卷積神經(jīng)網(wǎng)絡(luò)模型,同時(shí)使用遷移學(xué)習(xí)方法緩解少標(biāo)簽導(dǎo)致的過擬合問題.Liu等(2020)提出了一種基于局部深度多核學(xué)習(xí)支持向量機(jī)(LDMKL-SVM)的巖相分類方法,同時(shí)考慮低維全局特征和高維局部特征,自動(dòng)學(xué)習(xí)核函數(shù)和SVM的參數(shù),結(jié)合地震彈性信息預(yù)測(cè)巖性.Gao等(2021) 提出了一種基于多層感知器(MLP)的低電阻率低對(duì)比度(LRLC)儲(chǔ)層識(shí)別方法,MLP方法解決了LRLC儲(chǔ)層與水層的電阻率相似而無法有效識(shí)別的問題.金永吉等(2021)將遺傳神經(jīng)網(wǎng)絡(luò)用于測(cè)井曲線重構(gòu),實(shí)驗(yàn)表明相較于傳統(tǒng)方法生成的曲線質(zhì)量更高.Zhang等(2021)提出了一種“常規(guī)測(cè)井資料-礦物成分預(yù)測(cè)-紋層組合類型識(shí)別”有監(jiān)督組合機(jī)器學(xué)習(xí)方法,用于在地質(zhì)數(shù)據(jù)有限的情況下預(yù)測(cè)具有高度垂直異質(zhì)性的層狀頁巖的空間分布,構(gòu)建測(cè)井?dāng)?shù)據(jù)與主要礦物成分的映射關(guān)系.白洋等(2021)使用分類委員會(huì)機(jī)器進(jìn)行致密砂巖流體識(shí)別,使流體識(shí)別模型預(yù)測(cè)精度和泛化能力大幅度提高.Dong等(2022)提出了一種基于雙深度Q網(wǎng)絡(luò)(DDQN)的深度強(qiáng)化學(xué)習(xí)(DRL)方法,在三個(gè)常規(guī)試井模型中進(jìn)行自動(dòng)曲線匹配,結(jié)果表明DDQN比監(jiān)督機(jī)器學(xué)習(xí)算法魯棒性更好.畢麗飛等(2021)提出了基于標(biāo)簽傳播的半監(jiān)督學(xué)習(xí)方法并應(yīng)用于巖性預(yù)測(cè),結(jié)果表明該模型可以提升小樣本類別的準(zhǔn)確率.目前多名學(xué)者對(duì)人工智能和神經(jīng)網(wǎng)絡(luò)在地球物理中的應(yīng)用持樂觀態(tài)度(Kohli and Arora, 2014; 王昊等, 2020).
在自然語言處理和機(jī)器視覺等領(lǐng)域常使用多任務(wù)學(xué)習(xí)的方法提升預(yù)測(cè)效果.多任務(wù)學(xué)習(xí)可以將多個(gè)相關(guān)的任務(wù)放在一起學(xué)習(xí),學(xué)習(xí)過程中通過一個(gè)在底層的共享表示(Shared representation)來互相分享、互相補(bǔ)充學(xué)習(xí)到的領(lǐng)域相關(guān)信息,提升泛化效果(Evgeniou, 2004).共享一般是基于參數(shù)(Parameter based)的共享:比如基于神經(jīng)網(wǎng)絡(luò)的多任務(wù)學(xué)習(xí)和高斯處理過程;或者是基于約束(Regularization based)的共享:比如均值和聯(lián)合特征(Joint feature)學(xué)習(xí)(Jebara, 2011).多任務(wù)學(xué)習(xí)也被視為一種歸約遷移(Inductive transfer)(Dietterich et al., 1997).歸約遷移(Inductive transfer)通過引入歸約偏置(Inductive bias)來改進(jìn)模型,使得模型更傾向于某些假設(shè).在多任務(wù)學(xué)習(xí)場(chǎng)景中,歸約偏置由輔助任務(wù)來提供,使模型更傾向于那些可以同時(shí)解釋多個(gè)任務(wù)的解,從而提升模型的泛化性能(Dietterich et al., 1997; Argyriou et al., 2008).
機(jī)器視覺領(lǐng)域,Sun等(2014)提出了一種聯(lián)合訓(xùn)練人臉確認(rèn)損失和人臉分類損失的多任務(wù)人臉識(shí)別網(wǎng)絡(luò)DeepID2,網(wǎng)絡(luò)中共有兩個(gè)損失函數(shù):人臉分類損失函數(shù)和驗(yàn)證損失函數(shù).Zhang等(2014)提出的TCDCN模型以檢測(cè)臉部特征點(diǎn)為主要任務(wù),輔以4個(gè)分任務(wù),相較于單任務(wù)模型,TCDCN模型的檢測(cè)更準(zhǔn)確.目標(biāo)檢測(cè)領(lǐng)域,Girshick(2015)提出的Fast R-CNN是一個(gè)快速物體檢測(cè)的多任務(wù)卷積網(wǎng)絡(luò).自然語言處理領(lǐng)域,Collobert等(2008)將語義角色標(biāo)注、語言模型、詞性標(biāo)簽、語塊、命名實(shí)體標(biāo)簽等任務(wù)統(tǒng)一到一個(gè)框架中,利用輔助任務(wù)中自動(dòng)學(xué)習(xí)得到的特征提升語義角色標(biāo)注的性能.
在地球物理應(yīng)用中,桑文鏡等(2020)提出多任務(wù)殘差網(wǎng)絡(luò),以疊前地震數(shù)據(jù)預(yù)測(cè)阻抗和含氣飽和度.孫永壯和黃鋆(2021)將多任務(wù)學(xué)習(xí)用于巖性預(yù)測(cè)和橫波速度預(yù)測(cè),以橫波速度預(yù)測(cè)為主任務(wù),使用巖性預(yù)測(cè)任務(wù)輔助橫波預(yù)測(cè)任務(wù),從而提升橫波速度預(yù)測(cè)效果.
現(xiàn)有地球物理測(cè)井機(jī)器學(xué)習(xí)的研究主要是基于單任務(wù)學(xué)習(xí),單任務(wù)學(xué)習(xí)的局限性在于面對(duì)復(fù)雜問題時(shí)需要將其分解為多個(gè)單一獨(dú)立的子問題,逐一解決再歸納合并,從而得到原始復(fù)雜問題的解(Caruana, 1998).然而地球物理測(cè)井中的許多復(fù)雜問題內(nèi)部相互關(guān)聯(lián),無法分解為單一獨(dú)立的子問題.此外,如果將儲(chǔ)層參數(shù)預(yù)測(cè)分解為單任務(wù)處理,會(huì)忽略儲(chǔ)層參數(shù)之間的關(guān)聯(lián)信息.因此相較于單任務(wù)機(jī)器學(xué)習(xí),多任務(wù)學(xué)習(xí)在儲(chǔ)層參數(shù)預(yù)測(cè)方面更具優(yōu)勢(shì).本文將多任務(wù)學(xué)習(xí)方法應(yīng)用于儲(chǔ)層參數(shù)預(yù)測(cè)任務(wù),在學(xué)習(xí)共享多個(gè)儲(chǔ)層參數(shù)之間的信息,使模型具有更好的泛化效果,提升儲(chǔ)層參數(shù)預(yù)測(cè)精度.
本文使用的多任務(wù)模型基于深度神經(jīng)網(wǎng)絡(luò)(DNN),DNN可以看作是多層多維度的線性回歸和各種線性或非線性激活函數(shù)的組合,通過梯度下降等方式根據(jù)損失函數(shù)的數(shù)值調(diào)節(jié)模型內(nèi)部的權(quán)重(Haykin, 1998; Goodfellow et al., 2016; Michael, 2015).在使用DNN模型進(jìn)行回歸預(yù)測(cè)時(shí),信息由輸入層到輸出層逐層運(yùn)算,單個(gè)神經(jīng)元的計(jì)算可以表示為:
(1)
其中,z為神經(jīng)網(wǎng)絡(luò)中某一個(gè)神經(jīng)元,xi為上一層第i個(gè)神經(jīng)元,wi為對(duì)應(yīng)的權(quán)重,b為偏置權(quán)重,m為上一層中神經(jīng)元個(gè)數(shù),W=[w1,w2,…,wm],X=[x1,x2,…,xm]T.W和b統(tǒng)稱為模型參數(shù),參數(shù)初始化時(shí)一般隨機(jī)賦值.
DNN模型的隱藏層后會(huì)連接激活函數(shù)δ(z),激活函數(shù)的非線性轉(zhuǎn)換使神經(jīng)網(wǎng)絡(luò)的擬合能力進(jìn)一步增強(qiáng),使模型的預(yù)測(cè)結(jié)果不斷逼近真實(shí)值(Goodfellow et al., 2016).本文使用的激活函數(shù)除線性函數(shù)(公式(2)),還有非線性的ReLU函數(shù)(公式(3))和SoftPlus函數(shù)(公式(4)):
δlinear(z)=z,
(2)
δReLU(z)=max(z,0),
(3)
δsoftplus(z)=lg(1+ez).
(4)
ReLU的非飽和性潰瘍有效地解決梯度消失的問題,其單側(cè)抑制提供了網(wǎng)絡(luò)的稀疏表達(dá)能力.SoftPlus可以看作是ReLu的平滑.根據(jù)神經(jīng)科學(xué)家的相關(guān)研究,softplus和ReLu與腦神經(jīng)元激活頻率函數(shù)有神似的地方.也就是說,相比于早期的激活函數(shù)(如softmax,tanh等),softplus和ReLu更加接近腦神經(jīng)元的激活模型(Ciuparu et al., 2020).
深度神經(jīng)網(wǎng)絡(luò)多任務(wù)隱層參數(shù)共享分為硬共享與軟共享(Ruder, 2017; Liu et al., 2016).參數(shù)的硬共享機(jī)制可以應(yīng)用到所有任務(wù)的所有隱層上,保留任務(wù)相關(guān)的輸出層,從而降低過擬合的風(fēng)險(xiǎn)(Caruana, 1993; Baxter, 1997).參數(shù)的軟共享機(jī)制中每個(gè)任務(wù)都有獨(dú)立的模型參數(shù),對(duì)模型參數(shù)的距離進(jìn)行正則化保障參數(shù)的相似(Duong et al., 2015).
研究表明,多任務(wù)學(xué)習(xí)從4個(gè)方面提升模型效果(Ruder, 2017):(1)噪聲:對(duì)主任務(wù)而言,相關(guān)任務(wù)中與主任務(wù)無關(guān)的信息視作噪聲,訓(xùn)練過程中噪聲可以提高模型泛化效果;(2)逃離局部最優(yōu)解:多任務(wù)學(xué)習(xí)中的不同任務(wù)的局部最優(yōu)解常處于不同位置,在梯度傳播時(shí)相互影響從而可以有效避免模型陷入局部最優(yōu)解;(3)權(quán)值更新:多任務(wù)學(xué)習(xí)中權(quán)值更新受多個(gè)任務(wù)的影響,相較于單任務(wù)學(xué)習(xí)提升了底層共享層的學(xué)習(xí)速率;(4)泛化:多任務(wù)學(xué)習(xí)有可能影響單個(gè)任務(wù)的擬合能力,但降低模型過擬合幾率,提升模型泛化能力.
總體而言,多任務(wù)學(xué)習(xí)中共享部分越多,噪聲與泛化的影響越明顯;參與學(xué)習(xí)的任務(wù)數(shù)量越多,逃離局部最優(yōu)解與權(quán)值更新的效果越明顯.
本文提出的基于多任務(wù)學(xué)習(xí)的測(cè)井儲(chǔ)層參數(shù)預(yù)測(cè)方法將對(duì)幾種描述油氣藏的重要參數(shù)進(jìn)行預(yù)測(cè).傳統(tǒng)測(cè)井解釋方法中用自然伽馬(GR)曲線或自然電位(SP)曲線計(jì)算地層泥質(zhì)含量;用泥質(zhì)校正后的聲波時(shí)差(AC)、補(bǔ)償中子(CNL)和密度(DEN)計(jì)算地層孔隙度(POR);用電阻率測(cè)井值(RT)、孔隙度(POR)及泥質(zhì)含量來計(jì)算含水飽和度(SW);用井徑(CAL)進(jìn)行井眼校正;然后循環(huán)迭代,逐次逼近儲(chǔ)層參數(shù)真實(shí)值(雍世和等, 2002).因此選取聲波時(shí)差(AC)、井徑(CAL)、中子(CNL)、密度(DEN)、自然伽馬(GR)、電阻率(RT)以及自然電位(SP)作為輸入數(shù)據(jù),以孔隙度(POR)、滲透率(PERM)與含水飽和度(SW)的預(yù)測(cè)作為任務(wù),使用多任務(wù)學(xué)習(xí)模型同時(shí)對(duì)三種儲(chǔ)層參數(shù)進(jìn)行預(yù)測(cè),不必反復(fù)迭代校正儲(chǔ)層參數(shù),相較于傳統(tǒng)測(cè)井解釋方法,多任務(wù)學(xué)習(xí)在簡(jiǎn)化儲(chǔ)層參數(shù)預(yù)測(cè)流程,并提升神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果與泛化能力.
下面將分析多任務(wù)模型損失函數(shù)的選取以及幾種不同類型的多任務(wù)模型,并給出其應(yīng)用于測(cè)井儲(chǔ)層參數(shù)預(yù)測(cè)的具體方法.
多任務(wù)模型中損失函數(shù)的選擇需要綜合考慮每個(gè)任務(wù)的特點(diǎn),并對(duì)每種任務(wù)分配合適的權(quán)重.若不同任務(wù)的量綱相同且數(shù)據(jù)分布區(qū)間大致重合或使用歸一化等數(shù)據(jù)預(yù)處理方式,可使用常見的均方誤差(Mean Square Error, MSE)、平均絕對(duì)誤差(Mean Absolute Error, MAE)等損失函數(shù),然后根據(jù)模型訓(xùn)練情況調(diào)整每種任務(wù)的權(quán)重.若任務(wù)間的差異較大或不方便進(jìn)行數(shù)據(jù)預(yù)處理,適合使用受數(shù)據(jù)分布影響較小的損失函數(shù),例如平均絕對(duì)值百分比誤差(Mean Absolute Percentage Error, MAPE).
地球物理測(cè)井中,儲(chǔ)層參數(shù)的數(shù)值分布區(qū)間不一致,根據(jù)本研究所采用的數(shù)據(jù)集統(tǒng)計(jì)得到:孔隙度大多分布于9.71±2.70%;滲透率大多分布于0.23±0.26(0.987×10-15m2);含水飽和度大多分布于66.61±16.75%.若使用MAE作為損失函數(shù),模型訓(xùn)練時(shí)損失函數(shù)將由含水飽和度MAE主導(dǎo),導(dǎo)致參數(shù)優(yōu)化時(shí)會(huì)忽略滲透率和孔隙度對(duì)模型的影響,使?jié)B透率和孔隙度擬合效果較差;若對(duì)其設(shè)置權(quán)重,對(duì)每個(gè)任務(wù)損失函數(shù)設(shè)置合適的權(quán)重有一定困難.因此選擇MAPE作為損失函數(shù),計(jì)算預(yù)測(cè)值與實(shí)際值誤差的百分比,將不同儲(chǔ)層參數(shù)的誤差以統(tǒng)一的尺度表示,既可以保證每個(gè)儲(chǔ)層參數(shù)在模型訓(xùn)練過程中都能得到較為充分的訓(xùn)練,又能避免損失函數(shù)權(quán)重設(shè)置不合理.
首先是泛化性能最強(qiáng)的同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型,其特點(diǎn)為除輸出層每個(gè)儲(chǔ)層參數(shù)獨(dú)立計(jì)算,其余各層均共享神經(jīng)元,如圖1所示,記作multi_same_α.在multi_same_α中,多任務(wù)相互之間有較強(qiáng)的影響,當(dāng)儲(chǔ)層參數(shù)之間相關(guān)性較高時(shí),權(quán)值更新作用顯著,可以取得較好的預(yù)測(cè)效果;當(dāng)儲(chǔ)層參數(shù)之間差異較大時(shí),噪聲會(huì)導(dǎo)致預(yù)測(cè)效果不理想;由于每個(gè)任務(wù)沒有私有隱藏層,模型對(duì)單個(gè)任務(wù)的擬合能力可能較差.
在神經(jīng)網(wǎng)絡(luò)模型中靠近輸入層的網(wǎng)絡(luò)提取的信息較為廣泛,靠近輸出層的網(wǎng)絡(luò)提取的信息與輸出值的關(guān)聯(lián)性更大.因此將multi_same_α進(jìn)一步改造,得到另一種泛化性能稍弱,但對(duì)單個(gè)任務(wù)擬合能力更強(qiáng)的同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型,其特點(diǎn)在于靠近輸入層的隱藏層為共享層,靠近輸出層的隱藏層為結(jié)構(gòu)相同的私有層,如圖2所示,記作multi_same_β.三個(gè)儲(chǔ)層參數(shù)共同影響共享層的訓(xùn)練,多任務(wù)模型中的權(quán)值更新方式輔助提升廣泛信息提取的效果;每個(gè)儲(chǔ)層參數(shù)的私有層僅受當(dāng)前儲(chǔ)層參數(shù)的影響,僅從共享網(wǎng)絡(luò)的輸出中提取與當(dāng)前儲(chǔ)層參數(shù)有關(guān)的信息,減少其他儲(chǔ)層參數(shù)對(duì)當(dāng)前儲(chǔ)層參數(shù)預(yù)測(cè)效果的影響.該模型的泛化性能和擬合能力取決于私有層結(jié)構(gòu),一般而言私有層越少泛化性能越好,私有層越多擬合能力越強(qiáng).
為獲得更好的儲(chǔ)層參數(shù)擬合效果,進(jìn)一步提出異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型,該模型的特點(diǎn)為靠近輸入層的隱藏層為共享層,每個(gè)儲(chǔ)層參數(shù)的私有層結(jié)構(gòu)各不相同,如圖3所示,記作multi_diff.該模型保留了multi_same_β模型使用權(quán)值更新方式輔助提升廣泛信息提取效果的優(yōu)點(diǎn),并且靈活性更好,每個(gè)儲(chǔ)層參數(shù)可以根據(jù)自身特點(diǎn)定制不同的私有層從而更好地從共享網(wǎng)絡(luò)輸出的信息中提取信息.例如聲波時(shí)差、補(bǔ)償中子和密度與孔隙度呈近似線性的關(guān)系,輸入輸出之間的映射較為簡(jiǎn)單,因此孔隙度私有層結(jié)構(gòu)較為簡(jiǎn)單;含水飽和度受地層電阻率、泥質(zhì)含量、孔隙度等因素的影響,輸入輸出之間呈非線性關(guān)系,因此含水飽和度私有層結(jié)構(gòu)相對(duì)復(fù)雜;滲透率與測(cè)井曲線之間的映射較難確定,因此滲透率私有層的結(jié)構(gòu)最復(fù)雜.multi_diff模型的泛化能力取決于共享層結(jié)構(gòu),共享層層數(shù)越多泛化性能越好,反之亦然.
圖1 同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型α(multi_same_α)Fig.1 Multitask reservoir parameters prediction model α with the same structure(multi_same_α)
圖2 同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型β(multi_same_β)Fig.2 Multitask reservoir parameters prediction model β with the same structure(multi_same_β)
實(shí)驗(yàn)數(shù)據(jù)來自于某油田的64口井的常規(guī)測(cè)井?dāng)?shù)據(jù),該區(qū)塊為致密砂巖儲(chǔ)層,低孔、低滲、低對(duì)比度.井眼環(huán)境校正和井間標(biāo)準(zhǔn)化等處理過程已由數(shù)據(jù)提供方完成,進(jìn)行數(shù)據(jù)清洗和異常值校正后數(shù)據(jù)集共包含5571條數(shù)據(jù),具體特征分布如表1所示.孔隙度、滲透率與含水飽和度為油田的常規(guī)測(cè)井處理結(jié)果,其交會(huì)分析圖如圖4所示,孔隙度與滲透率呈較強(qiáng)的正相關(guān)性,含水飽和度與孔隙度、滲透率之間均存在一定的負(fù)相關(guān)性.訓(xùn)練集和測(cè)試集按8∶2的比例隨機(jī)劃分,訓(xùn)練集中含有4456條數(shù)據(jù),測(cè)試集中含有1115條數(shù)據(jù).
實(shí)驗(yàn)中使用的模型及編號(hào)如表2所示.三種多任務(wù)模型的結(jié)構(gòu)與具體參數(shù)設(shè)置參見附錄表A1—A3,為驗(yàn)證多任務(wù)模型儲(chǔ)層預(yù)測(cè)提升效果,構(gòu)建單任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型進(jìn)行對(duì)照實(shí)驗(yàn).單任務(wù)模型的輸入數(shù)據(jù)與多任務(wù)模型相同,僅輸出一個(gè)儲(chǔ)層參數(shù)的預(yù)測(cè)結(jié)果.多任務(wù)模型中的參數(shù)涉及多個(gè)任務(wù)的計(jì)算,而在單任務(wù)模型所有參數(shù)只涉及一個(gè)儲(chǔ)層參數(shù)的計(jì)算,多任務(wù)模型訓(xùn)練速度相對(duì)緩慢.考慮多任務(wù)模型訓(xùn)練速度下降影響,實(shí)驗(yàn)中的單任務(wù)模型分別訓(xùn)練3000輪和10000輪,多任務(wù)模型統(tǒng)一訓(xùn)練10000輪.同架構(gòu)單任務(wù)模型命名方式為“儲(chǔ)層參數(shù)_same_訓(xùn)練輪數(shù)”,具體模型結(jié)構(gòu)與參數(shù)設(shè)置參見附錄表A4.異架構(gòu)單任務(wù)模型具體模型結(jié)構(gòu)與參數(shù)設(shè)置參見附錄表A5.本次實(shí)驗(yàn)的模型參數(shù)為隨機(jī)初始化,為保障實(shí)驗(yàn)結(jié)論的可靠性,所有模型進(jìn)行5次訓(xùn)練.模型訓(xùn)練使用Adam優(yōu)化器,該優(yōu)化方法是基于SGD改進(jìn)得到的,可以代替經(jīng)典的隨機(jī)梯度下降法來更有效地更新網(wǎng)絡(luò)權(quán)重,近些年已成為應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法之一.Adam優(yōu)化器的優(yōu)點(diǎn)有:計(jì)算效率高;內(nèi)存需求少;梯度的對(duì)角線重縮放不變;適合大數(shù)據(jù)或大模型的訓(xùn)練;適用于非固定目標(biāo);適用于非常嘈雜或稀疏梯度的問題;超參數(shù)調(diào)節(jié)方便(Kingma and Ba, 2014).
表1 實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析Table 1 Statistical analysis of experimental data
圖3 異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型(multi_diff)Fig.3 Multitask reservoir parameter prediction model with different structure(multi_diff)
圖4 孔滲飽交會(huì)分析圖 (a) 孔隙度-滲透率交匯圖; (b) 孔隙度-含水飽和度交匯圖; (c) 滲透率-含水飽和度交匯圖.Fig.4 Cross analysis Figure of porosity, permeability and water saturation (a)Porosity-permeability cross plot; (b) Porosity-water-saturation cross plot; (c) Permeability-water-saturation cross plot.
表2 實(shí)驗(yàn)?zāi)P徒y(tǒng)計(jì)與編號(hào)Table 2 Statistics and numbering of experimental models
模型評(píng)價(jià)指標(biāo)使用平均相對(duì)誤差(MAPE)和平均絕對(duì)誤差(MAE),誤差越小模型表現(xiàn)越好,取5次測(cè)試結(jié)果評(píng)價(jià)指標(biāo)的最大值、最小值與中位數(shù)綜合衡量?jī)?chǔ)層參數(shù)預(yù)測(cè)效果.由于多任務(wù)模型同時(shí)輸出三種儲(chǔ)層參數(shù),無法分割,在計(jì)算最大誤差值、最小誤差值和中位誤差值時(shí)使用三種儲(chǔ)層參數(shù)的誤差總和.從訓(xùn)練效果看含水飽和度的MAE與孔隙度和滲透率的MAE存在量級(jí)上的差別,因而使用MAPE作為模型主要評(píng)價(jià)指標(biāo),MAE用于輔助單個(gè)儲(chǔ)層參數(shù)預(yù)測(cè)效果的評(píng)價(jià).
2.3.1 同架構(gòu)模型測(cè)試結(jié)果
同架構(gòu)的單任務(wù)與多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型在測(cè)試集上的測(cè)試效果如表3所示.
根據(jù)各項(xiàng)評(píng)價(jià)指標(biāo),訓(xùn)練10000輪的單任務(wù)模型預(yù)測(cè)效果優(yōu)于訓(xùn)練3000輪的單任務(wù)模型;multi_same_α與multi_same_β模型的預(yù)測(cè)效果優(yōu)于訓(xùn)練10000輪的單任務(wù)模型;multi_same_β模型的預(yù)測(cè)效果略優(yōu)于multi_same_α模型.與對(duì)照實(shí)驗(yàn)中訓(xùn)練10000輪的同架構(gòu)單任務(wù)模型在測(cè)試集上的MAPE相比,multi_same_α模型的孔隙度預(yù)測(cè)效果提升超過30%,滲透率預(yù)測(cè)效果提升約22%,含水飽和度預(yù)測(cè)效果提升8%左右;multi_same_β模型的孔隙度預(yù)測(cè)效果提升超過30%,滲透率預(yù)測(cè)效果提升約24%,含水飽和度預(yù)測(cè)效果提升超過10%.
表3 同架構(gòu)的單任務(wù)與多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型測(cè)試結(jié)果Table 3 Test result of single-task and multitask reservoir parameters prediction models with same structure
2.3.2 異架構(gòu)模型測(cè)試結(jié)果
異架構(gòu)的單任務(wù)與多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型在測(cè)試集上的測(cè)試效果如表4所示.
在對(duì)照實(shí)驗(yàn)中,POR_diff_10000模型在測(cè)試集上的MAPE明顯低于POR_diff_3000模型,若繼續(xù)訓(xùn)練,該模型或許還有性能提升空間.其余兩種儲(chǔ)層參數(shù)預(yù)測(cè)模型訓(xùn)練3000輪和10000輪的MAPE差距較小,說明這兩種模型已到達(dá)性能極限,無法通過訓(xùn)練提升模型性能.對(duì)比訓(xùn)練10000輪的對(duì)照實(shí)驗(yàn)?zāi)P驮跍y(cè)試集上的預(yù)測(cè)效果,multi_diff模型孔隙度預(yù)測(cè)效果基本沒有提升,滲透率預(yù)測(cè)效果提升超過60%,含水飽和度預(yù)測(cè)效果提升超過10%.
從測(cè)試集上的表現(xiàn)來看,異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型的綜合預(yù)測(cè)效果優(yōu)于同架構(gòu)的多任務(wù)模型,就每個(gè)儲(chǔ)層參數(shù)而言:
(1)multi_diff模型、multi_same_α模型和multi_same_β模型中孔隙度的預(yù)測(cè)效果差別不大,MAPE在6%左右.
(2)multi_diff模型的滲透率在測(cè)試集上的MAPE在13%左右,multi_same_α和multi_same_β模型的滲透率在測(cè)試集上的MAPE在17%左右.
(3)multi_diff模型的含水飽和度在測(cè)試集上的MAPE在6%左右,multi_same_α和multi_same_β模型的含水飽和度在測(cè)試集上的MAPE在9%左右.
表4 異架構(gòu)的單任務(wù)與多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型測(cè)試結(jié)果Table 4 Test result of single-task and multitask reservoir parameters prediction models with different structure
圖5 不同網(wǎng)絡(luò)預(yù)測(cè)實(shí)際應(yīng)用效果對(duì)比圖Fig.5 Comparison of practical application performance of different network
實(shí)驗(yàn)中使用的各個(gè)儲(chǔ)層參數(shù)預(yù)測(cè)模型的預(yù)測(cè)效果圖如圖5所示.其中,POR、PERM、SW為儲(chǔ)層參數(shù)標(biāo)簽數(shù)據(jù);SAME_A_POR、SAME_A_PERM、SAME_A_SW為multi_same_α模型預(yù)測(cè)的孔隙度、滲透率和含水飽和度;SAME_B_POR、SAME_B_PERM、SAME_B_SW為multi_same_β模型預(yù)測(cè)的孔隙度、滲透率和含水飽和度;DIFF_POR、DIFF_PERM、DIFF_SW為multi_diff模型預(yù)測(cè)的孔隙度、滲透率和含水飽和度;POR_SAME、PERM_SAME、SW_SAME分別為POR_same_10000、PERM_same_10000和SW_same_10000模型的預(yù)測(cè)值;POR_DIFF、PERM_DIFF、SW_DIFF分別為POR_diff_10000、PERM_diff_10000和SW_diff_10000模型的預(yù)測(cè)值.從總體預(yù)測(cè)效果來看孔隙度預(yù)測(cè)值與標(biāo)簽值最接近;PERM_same_10000模型預(yù)測(cè)的滲透率與標(biāo)簽值的誤差較大,其余模型預(yù)測(cè)的滲透率和標(biāo)簽值相差不大;三種儲(chǔ)層參數(shù)中含水飽和度的預(yù)測(cè)值和標(biāo)簽值差距最大,但總體趨勢(shì)和標(biāo)簽值相吻合.
多任務(wù)測(cè)井儲(chǔ)層參數(shù)預(yù)測(cè)模型可以有效提升單任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型的預(yù)測(cè)效果,效果提升幅度與模型結(jié)構(gòu)有關(guān).多任務(wù)模型不僅節(jié)省計(jì)算資源,還簡(jiǎn)化了儲(chǔ)層參數(shù)獲取流程.
異架構(gòu)的多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型總體預(yù)測(cè)效果最好,具有可以針對(duì)每種儲(chǔ)層參數(shù)單獨(dú)設(shè)計(jì)私有層架構(gòu)的特點(diǎn),有良好的研究前景.
我們還進(jìn)行了遷移學(xué)習(xí)測(cè)井儲(chǔ)層參數(shù)預(yù)測(cè)的研究,以孔隙度預(yù)測(cè)模型作為基礎(chǔ)模型對(duì)滲透率預(yù)測(cè)模型和含水飽和度預(yù)測(cè)模型進(jìn)行參數(shù)遷移.兩項(xiàng)實(shí)驗(yàn)使用同一個(gè)數(shù)據(jù)集,對(duì)比兩項(xiàng)實(shí)驗(yàn)的結(jié)果可以發(fā)現(xiàn),異架構(gòu)多任務(wù)模型的滲透率和含水飽和度預(yù)測(cè)效果優(yōu)于遷移學(xué)習(xí)的滲透率和含水飽和度預(yù)測(cè)效果(邵蓉波 et al., 2022).多任務(wù)學(xué)習(xí)和基于相關(guān)性的遷移學(xué)習(xí)均是利用儲(chǔ)層參數(shù)之間的相關(guān)性影響模型參數(shù)的更迭,從而提升神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果.在遷移學(xué)習(xí)中這種影響是單向的,孔隙度可以影響滲透率預(yù)測(cè)模型的訓(xùn)練,而滲透率無法對(duì)孔隙度預(yù)測(cè)模型產(chǎn)生影響,使用遷移學(xué)習(xí)可以控制信息流動(dòng)的方向.在多任務(wù)模型中這種影響是相互的,孔隙度在影響滲透率預(yù)測(cè)的同時(shí)孔隙度的預(yù)測(cè)也受到滲透率的影響,無法對(duì)信息流動(dòng)方向進(jìn)行人為限制.因此兩種方式各有利弊,可根據(jù)實(shí)際情況選擇合適的模型.根據(jù)實(shí)驗(yàn)中發(fā)現(xiàn)的問題,下一步研究還將從以下幾個(gè)方面展開:
(1)探究不同類別激活函數(shù)之間的適配性對(duì)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型效果的影響.
(2)嘗試不同模型架構(gòu),探究在多任務(wù)模型中模型架構(gòu)對(duì)提升儲(chǔ)層參數(shù)預(yù)測(cè)效果的影響.
(3)考慮使用參數(shù)軟共享方式進(jìn)行多任務(wù)學(xué)習(xí).
(4)測(cè)井?dāng)?shù)據(jù)有較強(qiáng)的序列性,可以考慮將基于異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型推廣至循環(huán)神經(jīng)網(wǎng)絡(luò)模型中,例如LSTM和GRU.
(5)借鑒圖像處理方式處理測(cè)井?dāng)?shù)據(jù),并將基于異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型推廣到卷積神經(jīng)網(wǎng)絡(luò)模型中.
致謝外審專家對(duì)本文提出了建設(shè)性的修改意見,課題組郭云龍幫助本文繪圖,在此一并致謝!
附錄
附表A1 同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型α構(gòu)造與參數(shù)Appendix Table A1 Parameters of multitask reservoir parameters prediction model α with the same structure
附表A2 同架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型β構(gòu)造與參數(shù)Appendix Table A2 Parameters of multitask reservoir parameters prediction model β with the same structure
附表A3 異架構(gòu)多任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型結(jié)構(gòu)與參數(shù)Appendix Table A3 Parameters of multitask reservoir parameters prediction model with different structure
附表A4 同架構(gòu)單任務(wù)儲(chǔ)層參數(shù)預(yù)測(cè)模型構(gòu)造與參數(shù)Appendix Table A4 Parameters of single-task reservoir parameters prediction model with same structure
附表A5 異架構(gòu)單任務(wù)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)與參數(shù)Appendix Table A5 Parameters of single-task reservoir parameters prediction models with different structure