朱林奇,張 沖,魏 旸,郭 聰,周雪晴,陳雨龍
油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)江大學(xué)地球物理與石油資源學(xué)院,武漢430100
基于改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)模型的頁(yè)巖儲(chǔ)層總有機(jī)碳含量評(píng)價(jià)方法
朱林奇,張 沖*,魏 旸,郭 聰,周雪晴,陳雨龍
油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)江大學(xué)地球物理與石油資源學(xué)院,武漢430100
由于采用常規(guī)測(cè)井曲線評(píng)價(jià)頁(yè)巖儲(chǔ)層總有機(jī)碳含量的精度不高,泛化能力不強(qiáng),需要大量樣本。針對(duì)這些問(wèn)題,改進(jìn)了神經(jīng)網(wǎng)絡(luò)算法,以增加模型的預(yù)測(cè)能力。利用模糊系統(tǒng)優(yōu)化細(xì)胞神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以增強(qiáng)其邏輯推理能力,提高其對(duì)模糊數(shù)據(jù)的敏感性;選擇能有效避免“虛擬碰撞”的雨林算法,并針對(duì)其存在的缺陷進(jìn)行改進(jìn);利用改進(jìn)雨林優(yōu)化算法對(duì)網(wǎng)絡(luò)的初始權(quán)值閾值進(jìn)行優(yōu)化,避免網(wǎng)絡(luò)陷入局部極小。分析測(cè)井特征曲線的物理意義,選擇密度測(cè)井曲線與自然伽馬能譜測(cè)井曲線作為網(wǎng)絡(luò)的輸入,以總有機(jī)碳含量作為輸出,通過(guò)70塊巖心樣本網(wǎng)絡(luò)學(xué)習(xí)與26塊巖心樣本預(yù)測(cè),證明了新網(wǎng)絡(luò)模型的優(yōu)越性。結(jié)果表明,新模型回判將相對(duì)誤差從23.189%減小到17.185%,預(yù)測(cè)相對(duì)誤差由52.421%減小到15.158%,具有更強(qiáng)的學(xué)習(xí)能力與泛化能力,更適用于頁(yè)巖儲(chǔ)層總有機(jī)質(zhì)含量的測(cè)井評(píng)價(jià)。
頁(yè)巖;總有機(jī)碳含量;模糊神經(jīng)網(wǎng)絡(luò);改進(jìn)的雨林算法;泛化能力
頁(yè)巖氣藏是典型的“自生自儲(chǔ)”油氣藏。氣體在頁(yè)巖中主要以游離態(tài)氣及吸附態(tài)氣的形式存在,其中游離氣存在于天然裂縫及微孔隙中,吸附氣吸附于干酪根和粘土表面。由于頁(yè)巖氣特殊的成藏方式,一些反映地層中碳含量高低的參數(shù)能大致表征地層中含氣量。國(guó)內(nèi)研究表明,總有機(jī)碳含量與吸附氣、游離氣含量均有較好的正相關(guān)關(guān)系(董大忠等,2012;姜福杰等,2012)。這是因?yàn)椋S著總有機(jī)碳含量的增高,干酪根含量增高,地層吸附氣體的也增強(qiáng),導(dǎo)致吸附氣量增大。同時(shí),頁(yè)巖的生排烴行為在一定程度上形成的多微孔以及微裂縫,改善頁(yè)巖儲(chǔ)層的儲(chǔ)集性能,而儲(chǔ)集性能的改善有利于游離氣含量的增長(zhǎng)??傊?,總有機(jī)碳含量的多少?zèng)Q定了頁(yè)巖氣產(chǎn)量的高低,頁(yè)巖氣要想達(dá)到商業(yè)開(kāi)采的標(biāo)準(zhǔn),必須達(dá)到總有機(jī)碳含量的最低標(biāo)準(zhǔn)。所以,總有機(jī)碳含量計(jì)算意義重大,其意義類似于常規(guī)油氣藏中的含烴飽和度,是非常重要的儲(chǔ)層參數(shù)。
總有機(jī)碳含量(TOC)與頁(yè)巖產(chǎn)氣率有著良好的線性正相關(guān)關(guān)系,在評(píng)價(jià)頁(yè)巖氣產(chǎn)氣率上有著自己獨(dú)特的優(yōu)勢(shì)(Ross and Bustin,2007;李延鈞等,2011)。國(guó)內(nèi)外研究顯示,利用元素俘獲能譜測(cè)井(ECS)、核磁共振測(cè)井(CMR)等技術(shù)輔助評(píng)價(jià)總有機(jī)碳量的精度較為可靠(Jacobi et al., 2002;Pemper etal.,2010;張曉玲等,2013;趙晨陽(yáng)等,2002)。但由于測(cè)量?jī)r(jià)格昂貴,在所有井中均進(jìn)行上述新技術(shù)的測(cè)量是不現(xiàn)實(shí)的,精度較高的測(cè)井新技術(shù)模型應(yīng)用性不強(qiáng)。
現(xiàn)階段常規(guī)測(cè)井曲線評(píng)價(jià)總有機(jī)碳含量的方法主要有3類:
第1類為ΔlogR法及其改進(jìn)方法,即利用電阻率與孔隙度曲線疊加預(yù)測(cè)總有機(jī)碳含量(郝建飛等,2012;劉承民,2012;張作清等,2013;鐘光海等2015)。存在的問(wèn)題一是需要首先確定出成熟度的參數(shù)LOM,制約了該方法的使用,故現(xiàn)在多用其改進(jìn)算法;二是logR模型的確定受到人為因素的干擾,因?yàn)閘ogR的得到需要先確定細(xì)粒的非烴源巖作為基線,基線選擇的合適與否決定了logR的預(yù)測(cè)精度,在刻度確定的情況下,實(shí)際情況中有些井難以找到合適的基線,只能選擇較為合適的深度段作為基線,精度難以保證。
第2類方法為利用單一特征曲線或者多特征曲線進(jìn)行擬合計(jì)算,如利用自然伽馬曲線與TOC建立統(tǒng)計(jì)關(guān)系,利用干酪根密度較小的概念所提出的補(bǔ)償密度曲線與TOC單因素?cái)M合的方法,利用補(bǔ)償密度曲線、補(bǔ)償中子曲線、聲波時(shí)差曲線、深電阻率曲線進(jìn)行多元擬合建模等(Rossand Bustin, 2008;馬林,2013;李軍等,2014,謝慶明等,2014)。這一類算法的優(yōu)勢(shì)是建模方法簡(jiǎn)單,在精度要求不高的情況下實(shí)現(xiàn)較為方便。存在的問(wèn)題有兩個(gè):首先,在建模時(shí)由于缺少理論支撐,無(wú)法確定測(cè)井曲線與總有機(jī)碳含量的具體方程而僅能判斷具有正相關(guān)性或者負(fù)相關(guān)性,這樣的公式精度難以得到保證。其次,在總有機(jī)碳含量較小時(shí),由于測(cè)井曲線所測(cè)得的信息為地層中各類巖石礦物及流體的綜合,總有機(jī)碳含量的信息必然會(huì)被干擾信息所壓制,導(dǎo)致其與測(cè)井曲線的相關(guān)性減弱。
第3類是基于上述問(wèn)題,近幾年提出了神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)總有機(jī)碳含量的方法,即利用神經(jīng)網(wǎng)絡(luò)強(qiáng)逼近函數(shù)的能力提升總有機(jī)碳含量計(jì)算的精度(熊鐳等,2014;柳筠,2015;孟召平等,2105)。該方法進(jìn)一步提升了總有機(jī)碳含量計(jì)算的精度,使用較為廣泛。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)存在著其固有缺點(diǎn):第一,需要大量樣本以便統(tǒng)計(jì)其規(guī)律,使其具有良好的泛化能力,而因取心昂貴造價(jià)高,且實(shí)驗(yàn)價(jià)格不菲,在實(shí)際情況下并不能進(jìn)行大量的巖心實(shí)驗(yàn);第二,神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值初始化時(shí)存在著隨機(jī)性,使得結(jié)果容易陷入局部極小,這就使神經(jīng)網(wǎng)絡(luò)方法在運(yùn)用中的可靠性大打折扣。
基于上述分析,筆者嘗試對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),以解決其存在的問(wèn)題,增加神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)可靠性,提升總有機(jī)碳含量的測(cè)井評(píng)價(jià)精度。
常規(guī)測(cè)井系列具有成本低的特點(diǎn),較非常規(guī)測(cè)井系列應(yīng)用更廣泛,故本文僅討論常規(guī)測(cè)井曲線與總有機(jī)碳含量的關(guān)系。利用焦石壩地區(qū)龍馬溪組某頁(yè)巖氣井96塊巖心進(jìn)行相關(guān)性分析,發(fā)現(xiàn)總有機(jī)碳含量與密度測(cè)井曲線、自然伽馬能譜測(cè)井曲線(主要為鈾、鉀含量以及去鈾伽馬值)存在著一定的相關(guān)性(圖1)。
密度測(cè)井方法測(cè)量地層的體積密度,在總有機(jī)碳含量較高時(shí),地層中的干酪根含量較多,而干酪根的密度范圍一般為1.1~1.4 g/cm3,故在富含干酪根的地層,密度測(cè)井值會(huì)存在明顯的回落。所以,總有機(jī)碳含量應(yīng)與密度測(cè)井值關(guān)系密切(圖1a)。除了密度測(cè)井外,總有機(jī)碳含量還與去鈾伽馬值(KTH)、鈾元素(K)、鉀元素(U)具有良好的相關(guān)性(圖1b、c、d),這是因?yàn)楦衫腋泻蟹派湓剽櫍匀毁ゑR能譜測(cè)井中測(cè)量的鈾元素曲線值越高,說(shuō)明干酪根含量越多,對(duì)應(yīng)的總有機(jī)碳含量值應(yīng)越高。
式(1)為自然伽馬能譜測(cè)井反推地層鈾、釷、鉀含量的方程。其中,A1、A2、A3、B1、B2、B3、C1、C2、C3為對(duì)應(yīng)系數(shù),在儀器出廠時(shí)就已經(jīng)刻度完畢,是一個(gè)定值。分析該方程組可知,在系數(shù)W1、W2、W3變化不大的情況下,若鈾含量較高,相應(yīng)的釷、鉀的含量應(yīng)較低。所以,去鈾伽馬、鉀測(cè)井曲線也應(yīng)與總有機(jī)碳含量關(guān)系密切,且與鈾元素與總有機(jī)碳含量的相關(guān)性相反。
圖1 常規(guī)測(cè)井曲線響應(yīng)與總有機(jī)碳含量相關(guān)關(guān)系Fig.1 Correlation between conventional log curvesand totalorganic carbon content
圖1顯示,雖然上述特征曲線響應(yīng)與TOC含量之間存在著正相關(guān)或者負(fù)相關(guān)關(guān)系,但是這種關(guān)系僅能定性的對(duì)TOC進(jìn)行分析,對(duì)于定量計(jì)算來(lái)說(shuō)精度過(guò)低,尤其當(dāng)TOC含量低時(shí),呈現(xiàn)明顯的離散。這是因?yàn)槌R?guī)測(cè)井曲線測(cè)量的是地層的綜合響應(yīng),在TOC含量不高時(shí),其所表達(dá)的信息必定會(huì)被其他信息所壓制而難以顯現(xiàn),有必要利用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征數(shù)據(jù)信息挖掘。
3.1 模糊神經(jīng)網(wǎng)絡(luò)
由于模糊系統(tǒng)與神經(jīng)網(wǎng)絡(luò)既有著功能上的共性又存在著相輔相成的理論特點(diǎn),兩者越來(lái)越多的被有機(jī)的結(jié)合在一起使用。模糊神經(jīng)網(wǎng)絡(luò)繼承了神經(jīng)網(wǎng)絡(luò)的強(qiáng)樣本學(xué)習(xí)能力,又由于結(jié)合了模糊系統(tǒng),存在著一定的邏輯推理能力,其方法較舊有的BP神經(jīng)網(wǎng)絡(luò)啟發(fā)性、魯棒性、透明性均更強(qiáng),不僅能處理明確的數(shù)據(jù),對(duì)模糊的數(shù)據(jù)同樣敏感(劉立峰等,2014;徐智浩等,2014)。
模糊神經(jīng)網(wǎng)絡(luò)通常由4層組成,分別為輸入層、模糊化層、模糊規(guī)則層以及去模糊化層,在網(wǎng)絡(luò)學(xué)習(xí)時(shí)以誤差平方和最小為學(xué)習(xí)目標(biāo),利用梯度法與誤差反向傳播法進(jìn)行權(quán)值的更新。在多層神經(jīng)網(wǎng)絡(luò)下,層數(shù)越多,其誤差反向傳播速度越慢(嚴(yán)鴻和管燕平,2009)。這樣的后果一是使得網(wǎng)絡(luò)的學(xué)習(xí)速度變得異常緩慢,二是容易陷入局部極小值。所以,需要利用優(yōu)化算法優(yōu)化權(quán)值及閾值,以加快收斂速度,防止局部極小值的產(chǎn)生。
3.2 改進(jìn)雨林算法
為了克服模糊神經(jīng)網(wǎng)絡(luò)存在的上述問(wèn)題,通常在進(jìn)行網(wǎng)絡(luò)訓(xùn)練之前先進(jìn)行優(yōu)化算法的尋優(yōu),以確定較為合適的權(quán)值與閾值,輸入到模糊神經(jīng)網(wǎng)絡(luò)中進(jìn)行迭代。筆者選用較新的雨林優(yōu)化算法,并對(duì)其進(jìn)行改進(jìn),以加強(qiáng)其全局尋優(yōu)能力。
3.2.1 雨林算法(RFA)及其改進(jìn)思路
雨林算法在2013年被提出(高維尚等,2013;高維尚和邵誠(chéng),2014)??紤]到自然界各種動(dòng)物群體均存在著“碰撞的現(xiàn)象”,而樹(shù)叢的生長(zhǎng)并不存在碰撞,而是有機(jī)的向外延伸,吸收陽(yáng)光,具有模擬動(dòng)物群體算法所不具備的優(yōu)勢(shì)。在算法方面,該算法采用全局分區(qū)樣與局部分級(jí)采樣相結(jié)合、均勻采樣與非均勻采樣相結(jié)合的思路,以適應(yīng)未知目標(biāo)函數(shù)的復(fù)雜分布,有效避免虛擬碰撞,使算法更易尋找到全局最優(yōu)解(圖1)。
雨林算法雖較其他啟發(fā)式算法有著明顯的優(yōu)點(diǎn),但也存在著一些不合理性。比如,其存在著在迭代后期收斂過(guò)快的問(wèn)題,就有可能未能搜尋到全局最優(yōu)解而可能收斂到局部最優(yōu)解的凸集。所以,筆者嘗試對(duì)于雨林算法進(jìn)行改進(jìn),以在最大程度上解決這個(gè)問(wèn)題。考慮到雨林算法的收斂速度主要決定于學(xué)習(xí)因子α,通過(guò)改進(jìn)學(xué)習(xí)因子α使其在后期學(xué)習(xí)中收斂變慢,以較慢的速度、較多的迭代次數(shù)去更好的找到全局最優(yōu)解。
算法行為規(guī)劃所對(duì)應(yīng)的動(dòng)態(tài)方程組為:
其中,i、j、k、s分別為集合數(shù)、迭代次數(shù)、決策空間和播種節(jié)點(diǎn)的示意次數(shù),n、r、nn為代理的數(shù)量、代理的范圍和保留播種節(jié)點(diǎn)量,α為學(xué)習(xí)因子。筆者將其改進(jìn)為一與迭代次數(shù)j與最大迭代次數(shù)Tmax有關(guān)的函數(shù),以達(dá)到前期快速確定可行域,后期緩慢在可行域中尋找全局最優(yōu)解的目的。
3.2.2 改進(jìn)雨林算法實(shí)現(xiàn)步驟
(1)初始樹(shù)木播種。在優(yōu)化算法中,需要對(duì)初始尋優(yōu)點(diǎn)進(jìn)行初始化采樣。其采樣的合理性決定了算法是否能尋找到全局最優(yōu)點(diǎn)。在雨林算法中,采樣以一種近似均勻的方式進(jìn)行,來(lái)確保有一個(gè)以上的采樣點(diǎn)進(jìn)入關(guān)鍵域內(nèi),方式類似于樹(shù)木播種。這種采樣方式會(huì)使得可行域中留下的最大空白最小。在算法的可行域中以陣列的方式播種,并使得該種子形成根節(jié)點(diǎn)進(jìn)行生長(zhǎng)。
(2)萌發(fā)。依據(jù)信息熵算法計(jì)算播種后的信息熵。雨林算法中信息熵計(jì)算方法為:
式中,t代表迭代的數(shù)目;H為采樣的信息熵。
依據(jù)信息熵、節(jié)點(diǎn)適應(yīng)度計(jì)算采樣價(jià)值樹(shù)信息價(jià)值與采樣價(jià)值變化率,以確定下一次迭代中每個(gè)播種節(jié)點(diǎn)周圍新生采樣點(diǎn)數(shù)量值以及伸展的范圍,信息增益越大,伸展的范圍越大,采樣點(diǎn)數(shù)量越多。
(3)生長(zhǎng)。依據(jù)萌發(fā)過(guò)程得到的伸展范圍以及采樣點(diǎn)數(shù),不斷更新進(jìn)行繼續(xù)采樣,并在更新的同時(shí)計(jì)算信息增益,以確定伸展范圍及新生采樣點(diǎn)數(shù)量。
(4)競(jìng)爭(zhēng)。進(jìn)行節(jié)點(diǎn)的更新,僅保留若干個(gè)較為優(yōu)勢(shì)的節(jié)點(diǎn)作為下次播種的節(jié)點(diǎn),以增加優(yōu)勢(shì)節(jié)點(diǎn)的生長(zhǎng)能力,使較優(yōu)節(jié)點(diǎn)獲得良好的生長(zhǎng)的空間。
(5)計(jì)壽。若樹(shù)木在最近的幾次生長(zhǎng)中適應(yīng)度增加,則認(rèn)為為較優(yōu)樹(shù),算法將該雨林節(jié)點(diǎn)保存,并跳過(guò)播種階段,直接進(jìn)行萌發(fā)。
(6)繁衍。利用優(yōu)化結(jié)果與實(shí)際結(jié)果的差異以及迭代次數(shù)去衡量程序是否滿足了結(jié)束的條件。若未滿足條件,則繼續(xù)第一步的播種階段,在播種時(shí)播種更多的樹(shù),以便于尋找到全局最優(yōu)解。
最終,通過(guò)雨林算法的優(yōu)化,可得到較為可靠的神經(jīng)網(wǎng)絡(luò)初始權(quán)值與閾值。對(duì)應(yīng)的改進(jìn)雨林算法模糊神經(jīng)網(wǎng)絡(luò)流程見(jiàn)圖2。
3.2.3 方法驗(yàn)證
利用前人方法建立模型,以便于進(jìn)行方法與精度的對(duì)比。利用BP神經(jīng)網(wǎng)絡(luò)模型,以前文所確定的4種特征曲線為輸入,以總有機(jī)碳含量作為輸出,建立4×10××10×10×1的神經(jīng)網(wǎng)絡(luò)模型,其中建立1個(gè)隱層是因?yàn)?隱層結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)即具有逼近一切函數(shù)的能力(范佳妮等,2005)。取96塊巖心中的70塊進(jìn)行建模,26塊進(jìn)行模型檢測(cè)。最后得到的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)結(jié)果以及預(yù)測(cè)結(jié)果(圖3)。
分析圖3可以發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)TOC的精度較常規(guī)擬合方法精度更高,在精度要求不高的情況下可以達(dá)到預(yù)測(cè)TOC含量的目的。但是,對(duì)比學(xué)習(xí)樣本點(diǎn)回歸精度與未參與建模樣本預(yù)測(cè)結(jié)果,模型預(yù)測(cè)結(jié)果要差于回歸結(jié)果,這說(shuō)明神經(jīng)網(wǎng)絡(luò)本身固有的泛化能力較弱,對(duì)于未知樣本點(diǎn)的預(yù)測(cè)穩(wěn)定性不高,不確定性強(qiáng)。值得一提的是,由于初始權(quán)值與閾值的隨機(jī)性,神經(jīng)網(wǎng)絡(luò)極易陷入局部極小,筆者在建立模型時(shí)反復(fù)運(yùn)行了27次,以確定最優(yōu)神經(jīng)網(wǎng)絡(luò)模型。這種帶有強(qiáng)人為干擾的模型并不利于TOC含量預(yù)測(cè),因?yàn)椴⒉涣私饨⒌哪P褪欠駷樽顑?yōu)模型。
圖2 改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)流程Fig.2 The processof im proving the fuzzy neuralnetw ork w ith the im proved rain forestalgorithm
圖3 BP神經(jīng)網(wǎng)絡(luò)建模精度與預(yù)測(cè)精度Fig.3 Modeling precision and prediction accuracy of BPneuralnetw ork
利用筆者所提出的改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行TOC含量預(yù)測(cè)。建模樣本與預(yù)測(cè)樣本與上述BP神經(jīng)網(wǎng)絡(luò)模型建立樣本相同,以便于比較兩模型在建模精度與泛化能力上的優(yōu)劣。預(yù)測(cè)時(shí)進(jìn)行了雨林算法與改進(jìn)雨林算法的權(quán)值閾值優(yōu)化比較,結(jié)果見(jiàn)圖4。從優(yōu)化結(jié)果中可以看出,改進(jìn)的雨林算法(IRFA)雖然在迭代速度上不如原有雨林算法(RFA),但是在尋優(yōu)能力上強(qiáng)于雨林算法,考慮到改進(jìn)的雨林算法優(yōu)化神經(jīng)網(wǎng)絡(luò)也僅僅運(yùn)行了426.32 s,認(rèn)為筆者提出的改進(jìn)的雨林算法應(yīng)更適應(yīng)于函數(shù)的尋優(yōu),其尋優(yōu)效果更明顯。
圖5為改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)建模精度與預(yù)測(cè)精度圖。對(duì)比圖3可以看出,筆者提出的方法在建模精度與預(yù)測(cè)精度上明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò),尤其是預(yù)測(cè)精度有較大改善,體現(xiàn)了良好的泛化能力。計(jì)算兩種模型平均相對(duì)誤差,運(yùn)用筆者提出的模型將回歸70個(gè)樣本的相對(duì)誤差從23.189%降低到17.185%,預(yù)測(cè)相對(duì)誤差由52.421%降低到15.158%,建模效果大為改善。這僅僅是運(yùn)行了1次的結(jié)果,并未通過(guò)反復(fù)運(yùn)行以確定最優(yōu)模型。并且,由該相對(duì)誤差數(shù)據(jù)可以看出,回歸精度反而大于預(yù)測(cè)精度,說(shuō)明該模型未存在傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)極易存在的過(guò)擬合現(xiàn)象,利用筆者提出的方法預(yù)測(cè)TOC含量時(shí),在樣品點(diǎn)達(dá)到70個(gè)的情況下即可得到較為合理的模型。
圖4 改進(jìn)雨林算法與雨林算法尋優(yōu)對(duì)比Fig.4 Comparison of the improved rain forestalgorithm and rain forestalgorithm in optim ization
圖5 改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)建模精度與預(yù)測(cè)精度Fig.5 Modeling precision and prediction accuracy of fuzzy neuralnetwork optim ized by the improved rain forestalgorithm
利用改進(jìn)模型進(jìn)行某井段總有機(jī)碳含量進(jìn)行評(píng)價(jià),結(jié)果見(jiàn)圖6。其中,第6道為上述BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型所評(píng)價(jià)出來(lái)的總有機(jī)碳含量曲線,第7道為筆者提出的改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)模型評(píng)價(jià)得到的總有機(jī)碳含量曲線。
對(duì)比顯示,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)曲線總體波動(dòng)較大,并且在2354~2359m深度段,預(yù)測(cè)結(jié)果在精度和趨勢(shì)上均嚴(yán)重不符合實(shí)際情況。這是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)過(guò)于敏感,U測(cè)井曲線在建模樣本點(diǎn)中并不存類似該深度段的較大值。對(duì)于這種問(wèn)題,BP神經(jīng)網(wǎng)絡(luò)只有增加樣本點(diǎn)的數(shù)量以增加精度,若利用該模型將會(huì)得到不準(zhǔn)確的評(píng)價(jià)認(rèn)識(shí)。
筆者模型預(yù)測(cè)曲線波動(dòng)較小,且預(yù)測(cè)精度與趨勢(shì)均較符合實(shí)際情況,說(shuō)明模型具有一定的邏輯思維,尤其在2354~2359m深度段,在建模時(shí)未出現(xiàn)類似高鈾值樣本的情況下,其也能得到較好的結(jié)果,體現(xiàn)了良好的泛化能力,優(yōu)于原始BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果,對(duì)總有機(jī)碳含量的評(píng)價(jià)有所幫助。
(1)依據(jù)巖心與常規(guī)測(cè)井曲線數(shù)據(jù),確定了常規(guī)測(cè)井曲線與總有機(jī)碳含量的相關(guān)性及其物理意義,并認(rèn)為在總有機(jī)碳含量較低的情況下,常規(guī)測(cè)井中所反映的總有機(jī)碳含量信息被地層中其他信息所干擾覆蓋,使得相關(guān)性變差,故需要借助神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘能力進(jìn)行總有機(jī)碳含量的求取。
(2)考慮到神經(jīng)網(wǎng)絡(luò)固有的問(wèn)題,借助模糊系統(tǒng)的邏輯推理的能力,應(yīng)用模糊系統(tǒng)優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提高其對(duì)模糊數(shù)據(jù)的敏感程度;嘗試使用避免“虛擬碰撞”的雨林算法并嘗試將其改進(jìn),以優(yōu)化神經(jīng)網(wǎng)絡(luò)的初始權(quán)值閾值,避免其陷入局部極小。
(3)利用70個(gè)樣本點(diǎn)對(duì)未改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)與改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)分別建模,并利用26個(gè)樣本點(diǎn)進(jìn)行預(yù)測(cè)。結(jié)果顯示,筆者提出的改進(jìn)雨林模糊神經(jīng)網(wǎng)絡(luò)模型精度較傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)精度更高,并發(fā)現(xiàn)建模樣本在70個(gè)以上時(shí)就可得到未過(guò)擬合模型。實(shí)例分析結(jié)果顯示,筆者提出的模型更合理,適用于頁(yè)巖儲(chǔ)層總有機(jī)質(zhì)含量的測(cè)井評(píng)價(jià)。
圖6 S井某井段總有機(jī)碳含量預(yù)測(cè)對(duì)比Fig.6 Comparison of the predicted TOC in a section of Swell
(References):
董大忠,鄒才能,楊樺,等.2012.中國(guó)頁(yè)巖氣勘探開(kāi)發(fā)進(jìn)展與發(fā)展前景[J].石油學(xué)報(bào),33(S1):107-114.
范佳妮,王振雷,錢(qián)鋒.2005.BP人工神經(jīng)網(wǎng)絡(luò)隱層結(jié)構(gòu)設(shè)計(jì)的研究進(jìn)展[J].控制工程,12(S0):105-109.
高維尚,邵誠(chéng).2014.復(fù)雜非凸約束優(yōu)化難題與迭代動(dòng)態(tài)多樣進(jìn)化算法[J].自動(dòng)化學(xué)報(bào),40(11):2469-2479.
高維尚,邵誠(chéng),高琴.2013.群體智能優(yōu)化中的虛擬碰撞:雨林算法[J].物理學(xué)報(bào),62(19):28-43.
郝建飛,周燦燦,李霞,等.2012.頁(yè)巖氣地球物理測(cè)井評(píng)價(jià)綜述[J].地球物理學(xué)進(jìn)展,27(4):1624-1632.
姜福杰,龐雄奇,歐陽(yáng)學(xué)成,等.2012.世界頁(yè)巖氣研究概況及中國(guó)頁(yè)巖氣資源潛力分析[J].地學(xué)前緣,19(2):198-211.
李軍,路箐,李爭(zhēng),等.2014.頁(yè)巖氣儲(chǔ)層“四孔隙”模型建立及測(cè)井定量表征方法[J].石油與天然氣地質(zhì),35(2):266-271.
李延鈞,劉歡,劉家霞,等.2011.頁(yè)巖氣地質(zhì)選區(qū)及資源潛力評(píng)價(jià)標(biāo)準(zhǔn)[J].西南石油大學(xué)學(xué)報(bào)(自然科學(xué)版),33(2):28-34.
劉承民.2012.頁(yè)巖氣測(cè)井評(píng)價(jià)方法及應(yīng)用[J].中國(guó)煤炭地質(zhì),24(8): 77-79.
柳筠.2015.涪陵地區(qū)頁(yè)巖氣測(cè)井評(píng)價(jià)參數(shù)研究[J].江漢石油科技,25 (3):34-41.
劉立峰,孫贊東,韓劍發(fā),等.2014.量子粒子群神經(jīng)網(wǎng)絡(luò)碳酸鹽巖流體識(shí)別方法研究[J].地球物理學(xué)報(bào),57(3):991-1000.
孟召平,郭彥省,劉尉.2015.頁(yè)巖氣儲(chǔ)層有機(jī)碳含量與測(cè)井參數(shù)的關(guān)系及預(yù)測(cè)模型[J].煤炭學(xué)報(bào),40(2):247-253.
馬林.2013.頁(yè)巖儲(chǔ)層關(guān)鍵參數(shù)測(cè)井評(píng)價(jià)方法研究[J].油氣藏評(píng)價(jià)與開(kāi)發(fā),3(6):66-71.
謝慶明,程禮軍,劉俊峰,等.2014.渝東南黔江地區(qū)龍馬溪組頁(yè)巖氣儲(chǔ)層測(cè)井解釋評(píng)價(jià)研究[J].地球物理學(xué)進(jìn)展,29(3):1312-1318.
熊鐳,張超謨,張沖,等.2014.A地區(qū)頁(yè)巖氣儲(chǔ)層總有機(jī)碳含量測(cè)井評(píng)價(jià)方法研究[J].巖性油氣藏,26(3):74-83.
徐智浩,李勝,張瑞雷,等.2014.基于LuGre摩擦模型的機(jī)械臂模糊神經(jīng)網(wǎng)絡(luò)控制[J].控制與決策,29(6):1097-1102.
嚴(yán)鴻,管燕平.2009.BP神經(jīng)網(wǎng)絡(luò)隱層單元數(shù)的確定方法及實(shí)例[J].控制工程,16(S1):100-102.
張曉玲,肖立志,謝然紅,等.2013.頁(yè)巖氣藏評(píng)價(jià)中的巖石物理方法[J].地球物理學(xué)進(jìn)展,28(4):1962-1974.
張作清,鄭煬,孫建孟.2013.頁(yè)巖氣評(píng)價(jià)“六性關(guān)系”研究[J].油氣井測(cè)試,22(1):66-74.
趙晨陽(yáng),杜禹,蔡振東,等.2015.國(guó)外頁(yè)巖氣儲(chǔ)層測(cè)井評(píng)價(jià)技術(shù)綜述[J].遼寧化工,44(4):473-478.
鐘光海,謝冰,周肖.2015.頁(yè)巖氣測(cè)井評(píng)價(jià)方法研究—以四川盆地蜀南地區(qū)為例[J].巖性油氣藏,27(4):96-102.
Jacobi D,Breig J,LeCompte B,et al.2002.Effective geochemical and geomechanical characterization of shale gas reservoirs from the Wellboreenvironment:Caney and theWoodford Shale[A].SPE124231.
Pemper R,Han X G,Mendez F,et al.2010.The direct measurement of carbon in wells containing oil and natural gas using a pulsed neutron mineralogy Ttool[A].SPE133128.
Ross D JK and Bustin R M.2007.Shale gas potential of the Lower Jurassic Gordondale Member,northeastem British Colunbia,Canada[J].AAPG Bulletin,55(1):51-75.
Ross D JK and Bustin R M.2008.Characterizing the shale gas resource potential of Devonian-Mississippian strata in the Western Canada sedimentary basin:Application ofan integrated formation evaluation[J]. AAPGBulletin,92(1):87-125.
TheM ethod for TOC Content Evaluation in Shale Reservoirs Based on Im p roved Rain Forest Fuzzy NeuralNetwork M odel
ZHU Linqi,ZHANG Chong*,WEIYang,GUO Cong,ZHOU Xueqing,CHEN Yulong
Key Laboratory of Exploration Technologies for Oiland Gas Resources,Ministry of Education,Geophysics and Oil Resource Institute,Yangtze University,Wuhan 430100,China
Theaccuracy ofevaluating totalorganic carbon in shale reservoirs is limited by using conventional logging curvesbecauseof their insufficient generalization ability and requirement of a large number of samples.In view of these problems,neural network algorithm was improved to improve the prediction ability of themodel.The cellular neural network structure was optim ized by using a fuzzy system to enhance its logical reasoning ability and to improve its sensitivity to fuzzy data.The rain forest algorithm,which can effectively avoid the virtual collision,was selected,and its defect of slow convergence in the late learning was overcome.The initial weight value and threshold value of the network were optimized by the improved rain forest optimization algorithm to prevent thenetwork from resulting in localminimum,which can improve theaccuracy and generalization ability of themodel.Based on the analysis of the physicalmeaning of the characteristic curve,the density log curves and the natural gamma ray spectrum logging curves were chosen as the input to the network and the total organic carbon contentwas used as the output.Through the networklearning of 70 core samples and the prediction of 26 core samples,the role of the improved rain forest algorithm and fuzzy logic is proved.The superiority of thenew networkmodel isdemonstrated.The resultshows that the relative regressionalerror of thenewmodel is reduced from 23.189%to 17.185%,and the relative prediction error is reduced from 52.421%to 15.158%,whichmeans that the prediction is in accordance with the real situation of formation.From the above,we learn that the newmodel has better learning ability and generalization ability.Thenewmodel ismore suitable for loggingevaluation of totalorganicmatter content in shale reservoirs.
shalegas;TOC;fuzzy neuralnetwork;improved rainforestalgorithm;generalization
ZHANGChong,Associate Professor;E-mail:yzlogging@163.com
P631.82
A文獻(xiàn)標(biāo)識(shí)碼:1006-7493(2016)04-0716-08
10.16108/j.issn1006-7493.2016079
2016-05-31;
2016-06-04
國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(41404084);湖北省自然科學(xué)基金(2013CFB396)聯(lián)合資助
朱林奇,男,1993年生,碩士,地球探測(cè)與信息技術(shù)專業(yè);E-mail:445364694@qq.com
*通訊作者:張沖,副教授;E-mail:yzlogging@163.com