臧子婧,吳海波,張平松,董守華
(1.安徽理工大學(xué) 地球與環(huán)境學(xué)院,安徽 淮南 232001;2.中國礦業(yè)大學(xué) 資源與地球科學(xué)學(xué)院,江蘇徐州 221116)
我國煤層氣資源豐富,開發(fā)利用價值大,煤層含氣量是煤層氣資源開發(fā)的重要資料,準(zhǔn)確地預(yù)測煤層含氣量,不僅能大大降低煤層氣資源開發(fā)的風(fēng)險性,還能節(jié)約開采成本,提高煤層氣開采效率[1-3]。充分挖掘地震資料所蘊(yùn)含的信息,利用地震多屬性優(yōu)選融合技術(shù)提高煤層含氣量的預(yù)測精度是目前煤層氣儲層預(yù)測研究的熱點(diǎn)之一[4-6]?,F(xiàn)有的研究多基于BP(Back Propagation,簡稱BP)神經(jīng)網(wǎng)絡(luò)預(yù)測模型,該模型非線性問題處理能力強(qiáng),在數(shù)據(jù)擬合和函數(shù)逼近方面都具有明顯的優(yōu)勢,計算精度更是高于傳統(tǒng)的線性預(yù)測算法[7-8],但BP神經(jīng)網(wǎng)絡(luò)對初始值敏感,當(dāng)網(wǎng)絡(luò)層次較多時,容易導(dǎo)致計算量大、收斂慢、局部極小等問題[9-10]。
近年來,國內(nèi)外學(xué)者們將神經(jīng)網(wǎng)絡(luò)算法作為研究對象,在煤層氣儲層預(yù)測建模和優(yōu)化算法方面不斷進(jìn)行嘗試,如施式亮等[11]提出了一種基于神經(jīng)網(wǎng)絡(luò)和遺傳算法(Genetic Algorithm,簡稱GA)的煤與瓦斯突出區(qū)域預(yù)測模型;劉景艷等[12]提出了一種基于粒子群算法(Particle Swarm Optimization,簡稱PSO)優(yōu)化神經(jīng)網(wǎng)絡(luò)的煤層瓦斯含量預(yù)測模型;楊楨等[13]提出了一種基于蟻群算法(Ant Colony Optimization,簡稱ACO)優(yōu)化神經(jīng)網(wǎng)絡(luò)的瓦斯預(yù)測模型。上述預(yù)測模型均取得了較好的效果,但在訓(xùn)練過程中仍存在不足,如GA算法易早熟收斂、局部搜索能力較差;PSO算法在迭代后期易陷入局部最優(yōu)解,且搜索精度不高;ACO算法尋優(yōu)較盲目,收斂慢,容易發(fā)生停滯現(xiàn)象[14]。
相比較傳統(tǒng)的優(yōu)化算法,人工蜂群算法(Artificial Bee Colony,簡稱ABC)的控制參數(shù)更少,全局搜索能力更強(qiáng),尤其適用于復(fù)雜問題的優(yōu)化[15-16]。因此,筆者提出一種人工蜂群尋優(yōu)算法改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型——ABC-BP預(yù)測模型,通過設(shè)計合理的蜂群和適應(yīng)度函數(shù),對神經(jīng)網(wǎng)絡(luò)的輸入層與隱含層的連接權(quán)值和隱含層的閾值進(jìn)行優(yōu)化,從而增強(qiáng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的魯棒性,提高預(yù)測精度和效率。
研究區(qū)塊位于沁水盆地南緣,區(qū)內(nèi)無大中型斷層發(fā)育,中部發(fā)育一個向斜和一個背斜;預(yù)測的目標(biāo)儲層為3號煤層,位于下二疊統(tǒng)山西組下部,煤層厚5.04~7.16 m,平均6.11 m;煤質(zhì)為低–中灰、高機(jī)械強(qiáng)度無煙煤;煤層原始的含氣量高達(dá)16.6 m3/t以上。
研究區(qū)的勘探孔(井)布置如圖1a所示,縱測線號(Inline)19~343,橫測線號(Crossline)100~1 300,CDP網(wǎng)格尺寸為5 m×5 m;采用8線10炮制束狀觀測系統(tǒng),單邊激發(fā)、線距40 m、點(diǎn)距10 m、炮線距50 m、滿覆蓋次數(shù)32,炮檢位置關(guān)系如圖1b所示。本次所用三維地震數(shù)據(jù)體為經(jīng)過常規(guī)處理和疊前偏移后的數(shù)據(jù)體,處理后的典型地震剖面如圖2所示。
研究區(qū)內(nèi)共有10個鉆孔提供了煤層含氣量解吸實驗數(shù)據(jù),但其中6口位于研究區(qū)邊緣(圖1a),地震記錄覆蓋次數(shù)為24,考慮到工區(qū)內(nèi)煤層含氣量數(shù)據(jù)較少,且覆蓋次數(shù)相差不大,因此,邊緣處的6口井?dāng)?shù)據(jù)仍作為本次的研究數(shù)據(jù)。本次預(yù)測將Q1201、Q1202、Q1204、Q1206、Q1208、Q1501、Q1502以及Q1503這8口井的數(shù)據(jù)作為訓(xùn)練樣本,取中心處Q1203和邊緣處的Q1205作為待預(yù)測對象,驗證分析預(yù)測模型的準(zhǔn)確性。
圖1 研究區(qū)勘探情況Fig.1 Exploration in the study area
圖2 處理的典型地震剖面Fig.2 Typical seismic profile after process
煤層含氣量一般受地質(zhì)構(gòu)造、煤的變質(zhì)程度、煤巖組分和煤層埋藏深度的影響,研究區(qū)煤層氣賦存條件較好,但受褶曲構(gòu)造的影響,造成了煤層氣賦存非常不平衡。本文依據(jù)勘探區(qū)疊后三維地震數(shù)據(jù)體,沿3號煤層分別提取了9種不同類型的地震屬性,分別是最大曲率、傾角屬性、薄層屬性、甜點(diǎn)屬性、聲阻抗、瞬時頻率、瞬時加速度、瞬時振幅以及瞬時Q值,各屬性均能在一定程度上反映含氣性特征,其中,前3種地震屬性能反映不同的沉積、構(gòu)造特征,后5種地震屬性主要用于識別巖性或儲層特性,甜點(diǎn)屬性多用于指示含氣異常。各屬性的提取涉及到大量數(shù)學(xué)公式,這里不再一一贅述。
本文采用R型聚類分析對9種地震屬性進(jìn)行了分類優(yōu)選,目的是為了確保所選地震屬性對煤層含氣量變化最為敏感且相互獨(dú)立,具體步驟如下。
①將9種地震屬性數(shù)據(jù)進(jìn)行歸一化,按照式(1)計算兩兩之間的相關(guān)系數(shù),組成系數(shù)矩陣;將系數(shù)矩陣進(jìn)行數(shù)據(jù)變換,把相關(guān)系數(shù)轉(zhuǎn)化為距離,按最長距離法進(jìn)行聚類,聚類分析結(jié)果如圖3所示。由圖3分析可知,9種屬性可大致分為相互獨(dú)立的A、B、C、D這4種類型。
其中,xi、xj為歸一化后各個屬性。
②提取井位處的9種地震屬性值及相應(yīng)的煤層含氣量,在歸一化處理的基礎(chǔ)上,按照式(2)計算出各屬性和煤層含氣量的相關(guān)系數(shù)(表1)。
③分別在上述四類屬性中優(yōu)選出對地質(zhì)目標(biāo)反應(yīng)最敏感的1種組成本次預(yù)測用的地震屬性集(表1)。優(yōu)選的地震屬性分別是傾角屬性、薄層屬性、最大曲率以及瞬時Q值,各優(yōu)選地震屬性切片如圖4所示。
式中:xi為井位置處歸一化后各個屬性;y1為歸一化后的煤層含氣量數(shù)據(jù);cov為協(xié)方差函數(shù)。
其中,傾角屬性的分布可直觀地展示目的層構(gòu)造特征;薄層屬性用于指示煤層厚度特性;曲率屬性常用來識別斷層、褶皺;瞬時Q值與地震波衰減吸收系數(shù)成反比,各屬性均能在一定程度上反映煤層氣藏的變化。
圖3 地震屬性聚類分析Fig.3 Clustering analysis of seismic attributes
BP網(wǎng)絡(luò)又稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層和輸出層構(gòu)成,每一層都由若干個神經(jīng)元組成。其結(jié)構(gòu)如圖5所示。BP神經(jīng)網(wǎng)絡(luò)除了具有非常強(qiáng)大的非線性映射能力、自主學(xué)習(xí)和自適應(yīng)能力,還具有不俗的泛化能力和容錯能力[17]。
BP神經(jīng)網(wǎng)絡(luò)按有監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練,當(dāng)學(xué)習(xí)樣本輸入網(wǎng)絡(luò)后,其神經(jīng)元的激活值將從輸入層經(jīng)各隱含層傳到輸出層,并輸出網(wǎng)絡(luò)響應(yīng)結(jié)果。然后,遵循期望輸出與實際輸出誤差最小的原則,將誤差信號沿原來的連接通路返回并逐層修正連接權(quán)值和閾值,直到誤差信號滿足精度要求為止。
表1 井位置的各屬性與煤層含氣量相關(guān)系數(shù)Table 1 Correlation coefficient between each property of well location and gas content of coal seam
圖4 通過聚類分析優(yōu)選出的4種研究區(qū)3號煤層地震屬性切片F(xiàn)ig.4 Four kinds of seismic attribute slices of No.3 coal seam in the study area were selected by cluster analysis
圖5 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 BP neural network structure
由于BP算法本質(zhì)為梯度下降法,因此,當(dāng)目標(biāo)函數(shù)非常復(fù)雜,或樣本數(shù)量不足時,該方法容易陷入局部極值,導(dǎo)致計算量大、收斂慢等問題[18]。
人工蜂群算法是一種通過模擬蜂群采蜜行為而解決優(yōu)化問題的群智能算法。它是由雇傭蜂、跟隨蜂、偵察蜂以及蜜源組成,蜜蜂根據(jù)各自的分工進(jìn)行不同的活動,通過蜂群間不斷地交流、轉(zhuǎn)換與協(xié)作,從而找到問題的最優(yōu)解[19-21]。
本文利用ABC智能尋優(yōu)算法對BP神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元的權(quán)值和閾值進(jìn)行了優(yōu)化,具體優(yōu)化步驟如下。
①設(shè)置BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)、參數(shù),如InDim、OutDim、HiddenNum等,輸入學(xué)習(xí)樣本以及待預(yù)測數(shù)據(jù),進(jìn)行歸一化處理。
②設(shè)置ABC參數(shù),各蜂群總數(shù)SN=100,SN也表示蜜源個數(shù),蜜源被采集次數(shù)即最大迭代次數(shù)Maxicircles=150及控制參數(shù)Limit=50,確定問題搜索范圍,并且在搜索范圍內(nèi)隨機(jī)產(chǎn)生初始解xi(i=1,2,…,SN),每個解xi是一個D維的向量。
③按照式(3)計算并評估每個初始解的適應(yīng)度,設(shè)定循環(huán)條件并開始循環(huán)。
式中:RMSEi為第i個解的BP網(wǎng)絡(luò)均方誤差。
④雇傭蜂對解xi按照式(4)進(jìn)行鄰域搜索產(chǎn)生新解(蜜源)vi,并計算其適應(yīng)度值。
式中:φij為[–1,1]之間的隨機(jī)數(shù);k∈{1,2,…,SN},j∈{1,2,…,D},且k≠i。
⑤按照式(5)進(jìn)行貪婪選擇,如果vi的適應(yīng)度值優(yōu)于xi,則用vi替換xi,將vi作為當(dāng)前最好的解,否則保留xi不變,失敗次數(shù)加一。
⑥根據(jù)式(6)計算蜜源的概率pi,跟隨蜂依照概率pi選擇解或食物源,按照式(4)搜索產(chǎn)生新解(蜜源)vi,并計算其適應(yīng)度,并重復(fù)步驟⑤。
⑦判斷是否有要放棄的解,若有,則偵查蜂按式(7)隨機(jī)產(chǎn)生新解替換,記錄到目前為止的最優(yōu)解。
⑧判斷是否滿足循環(huán)終止條件,若滿足,循環(huán)結(jié)束,輸出最優(yōu)解,否則返回步驟④繼續(xù)搜索。
⑨迭代停止后,輸出當(dāng)前全局最優(yōu)解,提取BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值,代入到BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練學(xué)習(xí),完成預(yù)測后,將輸出數(shù)據(jù)反歸一化即為最終預(yù)測結(jié)果。
在ABC-BP預(yù)測模型中,SN參數(shù)對算法性能的影響具有不確定性,多次試驗后取值為100;Maxicircles參數(shù)取值越大,優(yōu)化效果越好,但不宜超過200;Limit參數(shù)只要不設(shè)置過小,對算法性能影響很小。
此次,隱含層中的神經(jīng)元均采用Log-sigmoid型傳遞函數(shù),輸出層的神經(jīng)元則采用ReLU型傳遞函數(shù)。學(xué)習(xí)樣本為第2章節(jié)中優(yōu)選出的4種地震屬性及第1章節(jié)中8口井?dāng)?shù)據(jù):輸入為井位置處的優(yōu)選地震屬性值,輸出為與之對應(yīng)的煤層含氣量值,整個預(yù)測流程如圖6所示。
圖6 預(yù)測流程Fig.6 Prediction workflow
本次研究按照圖6所示的預(yù)測流程,基于學(xué)習(xí)樣本訓(xùn)練好的ABC-BP模型,以整個工區(qū)目標(biāo)儲層的優(yōu)選地震屬性為輸入,進(jìn)行研究區(qū)的煤層含氣量預(yù)測,并與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行了對比,如圖7所示。兩模型預(yù)測值與實測值誤差分析對比見表2。其中,井Q1203與Q1205為驗證井,未參與模型訓(xùn)練。
圖7 目標(biāo)煤儲層含氣量預(yù)測結(jié)果Fig.7 Gas content prediction results of target coal reservoir
表2 井位置煤層含氣量預(yù)測值與實測值誤差分析Table 2 Error analysis of predicted and measured gas content of coal seam in well location
各井煤層含氣量實測數(shù)據(jù)表明:由于井Q1501、Q1502、Q1503以及Q1204的煤層含氣量實測值均大于15 m3/t且位置相對集中,其附近井Q1203、Q1206、Q1208的煤層含氣量實測值則處于10~15 m3/t,初步判斷煤層含氣量高值區(qū)應(yīng)集中于Q1501、Q1502、Q1503、Q1204附近,研究區(qū)其余煤層氣井附近,煤層含氣量則有下降的趨勢;位于橫測線400~600區(qū)域的井Q1202、Q1205的煤層含氣量實測值為5~8 m3/t,而位于橫測線244的井Q1201的煤層含氣量實測值卻高達(dá)18.9 m3/t,初步判斷井Q1202、Q1205附近存在低含氣區(qū),僅在井Q1201處有局部增高現(xiàn)象。
由圖7a可知:煤層含氣量高值區(qū)大致分布在黑色虛線區(qū)域(H區(qū))內(nèi),少數(shù)煤層含氣量高值區(qū)在工區(qū)內(nèi)零散分布;煤層含氣量低值區(qū)分布在橫測線號600左右;其余位置煤層含氣量中等,較周圍高值區(qū)或低值區(qū)有漸變趨勢。這一預(yù)測結(jié)果與各井含氣量的變化趨勢基本吻合,這表明ABC-BP模型的煤層含氣量預(yù)測結(jié)果具有一定可靠性。
由圖7b可知:煤層含氣量高值區(qū)主要分布在橫測線號800附近位置,部分分布于橫測線號大于300的區(qū)域;煤層含氣量低值區(qū)分布在橫測線號為600和1 000的附近;其余位置煤層含氣量中等,較周圍高值區(qū)或低值區(qū)有漸變趨勢。根據(jù)上述煤層含氣量實測值分析,可明顯發(fā)現(xiàn)BP模型預(yù)測結(jié)果對煤層氣高值區(qū)識別不明顯,且無論是高值區(qū)還是低值區(qū)均較分散,難以識別,預(yù)測效果欠佳。
根據(jù)表2的仿真結(jié)果可知:對比同一井處的煤層含氣量實測值和預(yù)測值,BP模型和ABC-BP模型均有較好的吻合,ABC-BP模型訓(xùn)練樣本的平均誤差率為0.23%,BP模型訓(xùn)練樣本的平均誤差率為0.61%,ABC-BP模型的誤差明顯低于BP模型;對于驗證井Q1203和Q1205,ABC-BP模型的預(yù)測結(jié)果誤差不超過1 m3/t,誤差率分別是6.97%和14.47%,而BP模型的誤差率則為8.23%和41.78%,預(yù)測精度較差。相較于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),改進(jìn)后的ABC-BP預(yù)測模型預(yù)測精度更高,誤差范圍更穩(wěn)定,預(yù)測效果更加理想。
a.本文利用人工蜂群算法(ABC)有效優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值,構(gòu)建了ABC-BP模型,解決了BP神經(jīng)網(wǎng)絡(luò)計算量大,收斂慢,容易陷入局部極小等問題。相比較傳統(tǒng)的改進(jìn)方法,ABC算法的快速全局尋優(yōu)能力更強(qiáng),進(jìn)一步提高了BP神經(jīng)網(wǎng)絡(luò)的預(yù)測性能。
b.本次研究以井位置的優(yōu)選地震屬性和含氣量數(shù)據(jù)為樣本訓(xùn)練了ABC-BP模型,通過整個工區(qū)優(yōu)選地震屬性的輸入,實現(xiàn)了目標(biāo)煤儲層含氣量的定量預(yù)測,其中,訓(xùn)練井處的平均誤差率為0.23%,驗證井處的誤差率低于15%。因此,基于優(yōu)選地震屬性和ABC-BP的預(yù)測模型可有效用于煤層含氣量的預(yù)測。
c.本次煤儲層含氣量預(yù)測結(jié)果精度受優(yōu)選地震屬性質(zhì)量、樣本位置以及樣本數(shù)量的影響,這些因素的影響還需要進(jìn)一步的研究。