魏明強(qiáng),周金鑫,段永剛,董全
(1.西南石油大學(xué)石油與天然氣工程學(xué)院,成都 610500; 2.中國石油西南油氣田分公司勘探事業(yè)部,成都 610000)
頁巖氣是游離和吸附在頁巖孔隙中,需要人工改造后才能得到工業(yè)氣流的天然氣[1]。總有機(jī)碳含量(total organic carbon,TOC)是評(píng)價(jià)頁巖氣藏生烴能力的重要參數(shù),其值越高越有利于頁巖氣的富集,一般認(rèn)為TOC含量大于2%時(shí),頁巖氣藏才具有商業(yè)開采的價(jià)值[2-3]。相對(duì)于復(fù)雜、昂貴的鉆井取心和實(shí)驗(yàn)室?guī)r心分析而言,將測井技術(shù)應(yīng)用在頁巖氣儲(chǔ)層評(píng)價(jià)上具有更快速、更高效的優(yōu)勢(shì)[4]。20世紀(jì)80年代,人們發(fā)現(xiàn)測井曲線和總有機(jī)碳含量之間的相關(guān)關(guān)系,測井?dāng)?shù)據(jù)就被廣泛運(yùn)用到總有機(jī)碳含量的計(jì)算中??傆袡C(jī)碳含量主要測定方法有巖心實(shí)驗(yàn)室測定方法、ΔlgR法、自然伽馬能譜法、巖性掃描測井法、多元線性回歸擬合法等[5-7]。Passey等[8]用聲波曲線和電阻率曲線計(jì)算得到總有機(jī)碳含量,即ΔlgR法;Schmoker[9]用密度測井、自然伽馬測井資料回歸分析計(jì)算得到總有機(jī)碳含量;Lewis等[10]提出了用元素俘獲能譜測井等參數(shù)計(jì)算干酪根和總有機(jī)碳含量。
頁巖氣藏與常規(guī)油氣藏存在很大差異,這使得頁巖氣的測井評(píng)價(jià)方法與常規(guī)測井評(píng)價(jià)方法不同[11],而且TOC含量與多個(gè)參數(shù)之間有著較為復(fù)雜的非線性關(guān)系,常規(guī)測井解釋方法存在著精度不高、泛化能力不強(qiáng)等缺點(diǎn),不能滿足頁巖氣勘探開發(fā)的需求。
隨著人工智能的發(fā)展,大量學(xué)者將一些機(jī)器學(xué)習(xí)的方法運(yùn)用到頁巖氣藏總有機(jī)碳含量的預(yù)測中。Khoshnoodkia等[12]用神經(jīng)網(wǎng)絡(luò)方法有效預(yù)測了TOC含量;Tan等[13]將支持向量回歸技術(shù)運(yùn)用在總有機(jī)碳含量的預(yù)測上,體現(xiàn)了支持向量回歸技術(shù)在總有機(jī)碳含量預(yù)測上的適用性;陳娟等[14]采用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)方法預(yù)測頁巖氣水平井壓后產(chǎn)能,得到TOC含量等地質(zhì)參數(shù)是影響累產(chǎn)氣量的主控因素。畢臣臣[15]建立深度前饋神經(jīng)網(wǎng)絡(luò)模型,利用共軛梯度法對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,預(yù)測得到TOC含量。王惠君等[16]以上古生界泥質(zhì)烴源巖為研究對(duì)象,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的TOC預(yù)測模型,通過對(duì)比試驗(yàn)驗(yàn)證了該方法的有效性。楊占偉等[17]利用主成分分析法對(duì)測井資料進(jìn)行預(yù)處理,建立BP神經(jīng)網(wǎng)絡(luò)和梯度提升決策樹TOC預(yù)測模型,提高區(qū)塊TOC曲線的預(yù)測精度。調(diào)研發(fā)現(xiàn)目前基于機(jī)器學(xué)習(xí)的預(yù)測模型對(duì)模型影響因素的探究還不夠深入。
川南海相頁巖氣藏成功商業(yè)化開發(fā)為中國頁巖氣開采提供寶貴經(jīng)驗(yàn),基于大數(shù)據(jù)分析的機(jī)器學(xué)習(xí)能夠快速、有效地處理大量數(shù)據(jù)信息,將其引用到頁巖氣藏的評(píng)價(jià)處理中,有明顯的優(yōu)勢(shì)?,F(xiàn)對(duì)威遠(yuǎn)-長寧區(qū)塊多口測井?dāng)?shù)據(jù)進(jìn)行分析、整理,針對(duì)巖心樣本少,取芯層段較為集中,以往基于測井?dāng)?shù)據(jù)和巖心數(shù)據(jù)建立的機(jī)器學(xué)習(xí)儲(chǔ)層參數(shù)預(yù)測模型僅能對(duì)特定層段進(jìn)行預(yù)測和面對(duì)較長井段時(shí),預(yù)測精度不夠高等缺點(diǎn),以得到的測井?dāng)?shù)據(jù)作為輸入值,測井解釋結(jié)果作為輸出值,建立多個(gè)不同參數(shù)的總有機(jī)碳含量預(yù)測模型,對(duì)預(yù)測模型的特征組合、網(wǎng)絡(luò)結(jié)構(gòu)、優(yōu)化器、訓(xùn)練批次等參數(shù)的設(shè)置進(jìn)行探討,以確定最優(yōu)的預(yù)測模型,與實(shí)驗(yàn)室得到的巖心數(shù)據(jù)和其他特殊測井方法得到的結(jié)果進(jìn)行預(yù)測效果對(duì)比,驗(yàn)證模型的可行性。
總有機(jī)碳含量與測井?dāng)?shù)據(jù)之間有較為明顯的規(guī)律,根據(jù)X13井巖心得到的分析數(shù)據(jù),建立了研究區(qū)塊的總有機(jī)碳含量的測井敏感性分析。氣層中烴源巖越成熟,有機(jī)質(zhì)越多,總有機(jī)碳含越量高,聲波時(shí)差出現(xiàn)“周波跳躍”現(xiàn)象,補(bǔ)償聲波增大,因?yàn)橛袡C(jī)質(zhì)密度低,補(bǔ)償密度值隨之減小,有機(jī)質(zhì)還會(huì)吸附鈾這一放射元素,自然伽馬值也會(huì)越高[18],同時(shí)鈾富集在還原環(huán)境而釷富集在氧化環(huán)境,因此總有機(jī)碳含量越高,呈現(xiàn)出高鈾、低釷的特征[19]。補(bǔ)償中子值會(huì)因含氫指數(shù)顯高值,但束縛水和有機(jī)質(zhì)都含氫,造成補(bǔ)償中子特征不太明顯[20]。圖1得到,總有機(jī)碳含量與補(bǔ)償聲波、自然伽馬、鈾曲線呈現(xiàn)正相關(guān),與無鈾伽馬、補(bǔ)償密度、補(bǔ)償中子和釷曲線呈現(xiàn)負(fù)相關(guān),基本符合頁巖氣常規(guī)測井曲線特征。
圖1 總有機(jī)碳含量與各種測井?dāng)?shù)據(jù)交會(huì)圖
在實(shí)際測井過程中,由于人為因素或者儀器故障等因素,數(shù)據(jù)集中可能出現(xiàn)大段缺失、重復(fù)、偏離正常趨勢(shì)及不符合生產(chǎn)實(shí)際的異常點(diǎn),在構(gòu)建模型前,需對(duì)測井?dāng)?shù)據(jù)進(jìn)行處理以符合生產(chǎn)實(shí)際。數(shù)據(jù)預(yù)處理主要包含異常點(diǎn)檢測、缺失值處理和歸一化三部分。本文研究分別選取有自然伽馬能譜測井資料的5口井和不包含自然伽馬能譜測井資料的17口井資料,對(duì)測井?dāng)?shù)據(jù)預(yù)處理后,開展巖心實(shí)驗(yàn)分析得到TOC,使用皮爾遜(Pearson)相關(guān)性系數(shù)算法對(duì)其相關(guān)性進(jìn)行檢驗(yàn),得到測井?dāng)?shù)據(jù)相關(guān)性(表1和表2)。
表1 含能譜測井?dāng)?shù)據(jù)相關(guān)性
表2 不含能譜測井?dāng)?shù)據(jù)相關(guān)性
從表1可以得到在自然伽馬能譜測井資料中,總有機(jī)碳含量與補(bǔ)償聲波、自然伽馬和鈾的相關(guān)性較好,與鉀和無鈾伽馬的相關(guān)性很差,甚至還低于補(bǔ)償中子的相關(guān)性,與前文單因素分析的結(jié)果相矛盾。出現(xiàn)這種現(xiàn)象是因?yàn)榭傆袡C(jī)碳含量值是實(shí)驗(yàn)室?guī)r心分析得到,不同解釋方法直接影響了總有機(jī)碳含量與測井資料的相關(guān)性。另外實(shí)驗(yàn)室獲得巖心數(shù)據(jù)時(shí),選用的儲(chǔ)層約80 m,巖心只有75塊,相對(duì)于由五口測井資料所得到5 000 m儲(chǔ)層段、50 000個(gè)數(shù)據(jù)點(diǎn),出現(xiàn)相關(guān)性不一致的現(xiàn)象并非不符常理。
對(duì)比表1和表2,基于常規(guī)測井項(xiàng)目解釋和自然伽馬能譜測井解釋得到的總有機(jī)碳含量與各種測井資料的相關(guān)性不一致。常規(guī)測井項(xiàng)目解釋的總有機(jī)碳含量與密度出現(xiàn)極強(qiáng)相關(guān),自然伽馬能譜測井解釋得到的總有機(jī)碳含量與鈾出現(xiàn)極強(qiáng)相關(guān),總有機(jī)碳含量的計(jì)算就可以有多種不同方法,在這里基于常規(guī)測井項(xiàng)目總有機(jī)碳含量的計(jì)算可以采用密度法,含有自然伽馬能譜測井項(xiàng)目總有機(jī)碳含量的計(jì)算可以用鈾曲線來回歸。
BP算法利用前向傳播輸出的最后結(jié)果來計(jì)算誤差的偏導(dǎo)數(shù),再用這個(gè)偏導(dǎo)數(shù)與前面的隱藏層進(jìn)行加權(quán)求和,如此一層一層地向后傳下去,直到輸入層,最后利用每個(gè)節(jié)點(diǎn)求出的偏導(dǎo)數(shù)來更新權(quán)重,通過不斷調(diào)節(jié)網(wǎng)絡(luò)權(quán)重值,使網(wǎng)絡(luò)的最終輸出與期望輸出盡可能接近,以達(dá)到訓(xùn)練的目的。
假定有m個(gè)訓(xùn)練樣本{(x1,y1),(x2,y2),…,(xm,ym)},其中d(i)為對(duì)應(yīng)輸入x(i)的期望,定義誤差函數(shù)E為
(1)
式(1)中:E(i)為單個(gè)樣本的訓(xùn)練誤差。
(2)
式(2)中:dk(i)為期望輸出值;yk(i)為實(shí)際輸出值。
將式(2)代入式(1),可以得到新的誤差函數(shù)E為
(3)
BP算法每次迭代按以下方式對(duì)權(quán)重和偏置進(jìn)行更新,即
(4)
(5)
通過Python中的tensorflow深度學(xué)習(xí)庫編程建立基于BP算法的神經(jīng)網(wǎng)絡(luò)模型,模型建立和訓(xùn)練的步驟如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)模型建立框圖
對(duì)所有網(wǎng)絡(luò)模型采用隨機(jī)初始化,選取含能譜伽馬測井和不含能譜伽馬測井的數(shù)據(jù),基于表1和表2測井?dāng)?shù)據(jù)相關(guān)性表,隨機(jī)組合與總有機(jī)碳含量有極強(qiáng)相關(guān)性的特征和其他特征,建立了不同特征組合、不同結(jié)構(gòu)和不同訓(xùn)練參數(shù)的神經(jīng)網(wǎng)絡(luò)模型如表3所示,使用平均絕對(duì)誤差(mean absolute error,MAE)作為訓(xùn)練過程中的評(píng)估指標(biāo)(metrics),模型訓(xùn)練時(shí)每進(jìn)行一輪迭代輸出一次loss和MAE作為模型精度是否符合要求的參考,并對(duì)比每個(gè)模型之間的差異并對(duì)各影響因素進(jìn)行了分析研究,最后確定了最優(yōu)的預(yù)測模型。
表3 不同條件下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果對(duì)比
2.2.1 特征組合
相同神經(jīng)網(wǎng)絡(luò)模型下的測試集決定系數(shù)R2隨特征數(shù)量的增多而增大。這一規(guī)律并非是絕對(duì)的,因?yàn)橐陨夏P投冀⒃诳傆袡C(jī)碳含量與各特征值存在相關(guān)性的情況下,相關(guān)性只是特征選取的參考之一,即便加入相關(guān)性偏低的特征,也有可能提高模型訓(xùn)練的準(zhǔn)確率。對(duì)比表3中的模型1和5,在不考慮與總有機(jī)碳含量相關(guān)性極低的鉀和無鈾伽馬之后,測試集R2降低,說明在模型5中鉀和無鈾伽馬對(duì)訓(xùn)練模型的準(zhǔn)確度是有貢獻(xiàn)的。
同時(shí)因?yàn)橛?xùn)練數(shù)據(jù)的維度不高,在多層神經(jīng)網(wǎng)絡(luò)中模型能將訓(xùn)練數(shù)據(jù)的關(guān)系表達(dá)得很好,造成了一些弱相關(guān)的特征也會(huì)提升模型的準(zhǔn)確率。對(duì)于幾十、幾百個(gè)特征的高維數(shù)據(jù),在數(shù)據(jù)處理時(shí)需要對(duì)數(shù)據(jù)進(jìn)行降維處理,因?yàn)檫^高的維度會(huì)對(duì)模型結(jié)果造成不良影響。對(duì)比表3中模型11、12、13,MAE隨特征增加而降低,測試集R2隨特征增多而升高,但在用未參與訓(xùn)練的井作為模型驗(yàn)證井評(píng)價(jià)模型的泛化能力時(shí),模型11、12、13驗(yàn)證井R2分別是0.936、0.941、0.923,對(duì)比得到模型12的泛化能力最強(qiáng),模型13訓(xùn)練時(shí),將訓(xùn)練集中的噪音和不具代表性的特征擬合了,存在過擬合。
特征之間存在多重共線性可能影響模型的泛化能力。在回歸問題中,特征之間的多重共線性會(huì)使得相關(guān)性不會(huì)隨著模型的調(diào)整或數(shù)據(jù)的改變而規(guī)律的變化。因?yàn)榫€性回歸模型與神經(jīng)網(wǎng)絡(luò)模型有相似的地方,這就可能使得特征間的共線性會(huì)使得模型的泛化性變差。因此,為提高模型的預(yù)測精度,模型在訓(xùn)練時(shí)選取的參數(shù)應(yīng)該優(yōu)選與目標(biāo)值相關(guān)性較好的特征,而且特征間的相關(guān)性應(yīng)該盡量低才好。
2.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)比表3中的模型3、4、5,相同特征組合下,隨神經(jīng)網(wǎng)絡(luò)層數(shù)的加深,MAE降低,R2升高,說明增加網(wǎng)絡(luò)層數(shù)可以提高訓(xùn)練準(zhǔn)確度。對(duì)比表3中的模型2和模型3,減少其中一層隱層上的神經(jīng)元個(gè)數(shù),模型MAE升高,R2降低,可以得出:適當(dāng)增大隱層中的神經(jīng)元個(gè)數(shù)也可以提高訓(xùn)練模型的精度。不論是增加神經(jīng)網(wǎng)絡(luò)層數(shù)還是增加某一層神經(jīng)元的個(gè)數(shù)都增加了模型整體的復(fù)雜度,在不出現(xiàn)過擬合的前提上,合適的模型復(fù)雜度可以提升模型的精度。本文對(duì)每個(gè)神經(jīng)網(wǎng)絡(luò)模型采用兩種方法防止過擬合。
(1)交叉驗(yàn)證。數(shù)據(jù)導(dǎo)入模型前,將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集,表3中模型7訓(xùn)練過程如圖3(a)和圖3(b)所示。模型將每輪對(duì)32 256個(gè)樣本訓(xùn)練后的模型在8 064個(gè)點(diǎn)上進(jìn)行驗(yàn)證,得到驗(yàn)證集的損失Val loss和平均誤差 Val MAE。當(dāng)訓(xùn)練損失下降,驗(yàn)證集損失也下降時(shí),說明模型還未達(dá)到最優(yōu),仍在訓(xùn)練過程中;當(dāng)訓(xùn)練損失下降,驗(yàn)證集損失趨于不變時(shí),說明模型開始過擬合。圖3(a)可以看出模型在大約第60輪左右,驗(yàn)證集損失Val loss不再下降而是趨于附近波動(dòng),說明模型7在第60輪左右處泛化能力最強(qiáng),之后已出現(xiàn)過擬合。
Train Loss為訓(xùn)練集損失;Val loss為驗(yàn)證集損失
(2)早停法。在模型7訓(xùn)練時(shí),用早停法監(jiān)控驗(yàn)證集損失值Val loss,設(shè)定EarlyStopping的忍受值(Patience)為30,即容忍檢測到的驗(yàn)證集損失在30輪內(nèi)都沒有改進(jìn)(變小)時(shí)提前終止訓(xùn)練。圖3(b)就是使用EarlyStopping后的模型訓(xùn)練圖,可以看出模型7在第60輪左右達(dá)到最佳,繼續(xù)訓(xùn)練30輪后沒有改進(jìn),停止了訓(xùn)練。訓(xùn)練停止后得到的模型是第90輪左右的模型,與最佳狀態(tài)模型可能有略微差異,所以對(duì)Patience值的選取也應(yīng)該適中。Patience過大,導(dǎo)致訓(xùn)練停止時(shí)模型過擬合程度加大,過小又可能會(huì)因?yàn)榍捌谟?xùn)練中較大、較多的波動(dòng)在還未達(dá)到最佳效果時(shí)提前停止。
2.2.3 優(yōu)化器
神經(jīng)網(wǎng)絡(luò)訓(xùn)練就是使損失函數(shù)值盡可能小的過程,實(shí)現(xiàn)這一目的就需要優(yōu)化器。不同優(yōu)化器的原理不同,最優(yōu)化的過程也不同,最終對(duì)模型訓(xùn)練結(jié)果也會(huì)產(chǎn)生差異。根據(jù)表3的模型7、8、9、10可以得到,Adadelta對(duì)所建模型的結(jié)果影響最佳,SGD(stochastic gradient descent)最差。
如圖3所示,模型7、9訓(xùn)練損失下降,驗(yàn)證集損失在迭代60輪左右后,驗(yàn)證集損失基本趨于不變,模型8、10訓(xùn)練損失下降,驗(yàn)證集損失也一直在下降,可以得到Adadelta和Adam使模型收斂更快,大約迭代60輪即可得出最佳模型;SGD訓(xùn)練時(shí)誤差波動(dòng)較大,導(dǎo)致收斂也最慢;Adagrad訓(xùn)練時(shí)誤差波動(dòng)最小,但收斂速度一般。
2.2.4 訓(xùn)練批次(batch_size)
由表4可以得到,模型8-2的batch_size減小后其訓(xùn)練時(shí)長明顯變長,且單次輪回時(shí)間約5 s,而模型1的單次迭代時(shí)間約2 s。模型8-2的MAE相對(duì)于模型1而言升高了0.01,但無法判斷是否因?yàn)閎atch_size的不同而造成的,因?yàn)槟P投际请S機(jī)初始化,起始條件不同,完全一致的神經(jīng)網(wǎng)絡(luò)也會(huì)有細(xì)小差異。合理的batch_size能夠提高內(nèi)存的利用率,并且在訓(xùn)練中每次更新的并非全部數(shù)據(jù),只是用一個(gè)批量的數(shù)據(jù),這會(huì)給訓(xùn)練帶來人為誤差,但這些誤差被證明能使算法走出“鞍點(diǎn)”(局部最小值),不使用batch_size的機(jī)器學(xué)習(xí)易陷入“鞍點(diǎn)”。隨著計(jì)算機(jī)計(jì)算能力的提升,batch_size推薦設(shè)置在32以內(nèi),在處理測井?dāng)?shù)據(jù)這一類特征少、數(shù)據(jù)量夠龐大的數(shù)據(jù)集時(shí),不用像圖像識(shí)別等深度學(xué)習(xí)領(lǐng)域那樣去犧牲部分準(zhǔn)確率來換取較短的訓(xùn)練時(shí)間。
支持向量機(jī)(support vector machine,SVM)是對(duì)數(shù)據(jù)進(jìn)行二分類的監(jiān)督學(xué)習(xí),通過尋找超平面以間隔最大化的學(xué)習(xí)策略對(duì)樣本進(jìn)行分割,最終轉(zhuǎn)化為求解凸二次規(guī)劃問題。本文研究主要使用支持向量回歸機(jī)對(duì)數(shù)據(jù)進(jìn)行回歸分析?;谙嚓P(guān)性檢測,通過Python編程建立支持向量機(jī)模型,支持向量機(jī)模型建立和訓(xùn)練的步驟如圖4所示。
圖4 支持向量機(jī)模型建立框圖
支持向量機(jī)模型采用含自然伽馬能譜測井的數(shù)據(jù)進(jìn)行訓(xùn)練,對(duì)不同特征組合和不同核函數(shù)選擇對(duì)模型的影響進(jìn)行分析。訓(xùn)練結(jié)果如表5所示。
表5 不同輸入變量的支持向量機(jī)訓(xùn)練結(jié)果對(duì)比
3.2.1 特征組合
根據(jù)建立的15個(gè)模型得到與BP神經(jīng)網(wǎng)絡(luò)相似的結(jié)論:總有機(jī)碳含量與各特征都有相關(guān)性時(shí),相同神經(jīng)網(wǎng)絡(luò)模型下的測試集R2隨特征數(shù)量的增多而增大。同樣的為提高模型的預(yù)測精度,模型在訓(xùn)練時(shí)選取的參數(shù)應(yīng)該優(yōu)選與目標(biāo)值相關(guān)性較好的特征,而且特征間的相關(guān)性應(yīng)該盡量低才好。
3.2.2 核函數(shù)
對(duì)5種特征組合建立了支持向量機(jī)模型,并使用不同的核函數(shù)對(duì)每種組合進(jìn)行訓(xùn)練。從訓(xùn)練結(jié)果可以看出多項(xiàng)式核函數(shù)對(duì)模型的訓(xùn)練效果最差,幾乎不擬合,徑向基核函數(shù)的效果在相同特征組合上均好于線性核函數(shù)??赡艿脑蚴嵌囗?xiàng)式核函數(shù)的參數(shù)使用的是默認(rèn)參數(shù),不適合當(dāng)前數(shù)據(jù)集的訓(xùn)練。在實(shí)際使用中,對(duì)于特征較多,訓(xùn)練集不大的情況使用線性核效果較好,較多的在特征較少,訓(xùn)練集數(shù)量十分可觀的情況下使用非線性核,使大量的訓(xùn)練集能在訓(xùn)練中提供更多的變化幅度,這也是上述支持向量機(jī)模型使用rbf核函數(shù)能取得較好效果的原因;當(dāng)特征較少,而訓(xùn)練集非常龐大的情況,可以選用線性核來降低運(yùn)算時(shí)間,因?yàn)榉蔷€性核所需的計(jì)算量相當(dāng)大,在能保證模型精度差異不大時(shí),使用線性核更優(yōu)。
W區(qū)塊位于四川盆地,區(qū)塊內(nèi)主要有五峰組-龍馬溪組、筇竹寺組處于有利相帶,富含有機(jī)質(zhì)頁巖。為進(jìn)一步驗(yàn)證模型的實(shí)用性,選擇區(qū)塊中未參與訓(xùn)練的H24井作為含能譜測井資料模型的案例井,使用表3中模型6對(duì)其總有機(jī)碳含量進(jìn)行預(yù)測;選擇區(qū)塊中未參與訓(xùn)練的X23、X24井作為不含能譜測井資料的案例井,使用表3中泛化能力最強(qiáng)的模型12對(duì)總有機(jī)碳含量進(jìn)行預(yù)測,并將預(yù)測結(jié)果與實(shí)驗(yàn)室得到的巖心數(shù)據(jù)進(jìn)行對(duì)比,得到預(yù)測結(jié)果如表6所示,和測井得到的真實(shí)值TOC_TRUE、模型預(yù)測得到的預(yù)測值TOC_PRE、巖心實(shí)驗(yàn)室測定值TOC_OB隨儲(chǔ)層深度DEPTH變化圖,如圖5和圖6所示。
TOC_TRUE為測井總有機(jī)碳含量值; TOC_PRE為模型預(yù)測總有機(jī)碳含量值;TOC_OB為實(shí)驗(yàn)測定總有機(jī)碳含量值;DEPTH為儲(chǔ)層深度
TOC_TRUE為測井總有機(jī)碳含量值; TOC_PRE為模型預(yù)測總有機(jī)碳含量值;TOC_OB為實(shí)驗(yàn)測定總有機(jī)碳含量值;DEPTH為儲(chǔ)層深度
表6 預(yù)測結(jié)果
根據(jù)結(jié)果可以得到模型6預(yù)測結(jié)果能反映實(shí)驗(yàn)室測井解釋的大致趨勢(shì),但誤差相對(duì)較大;模型12能夠有很好的預(yù)測效果,對(duì)比兩個(gè)模型,分析其誤差可能原因如下。
(1)相對(duì)于17口井的數(shù)據(jù)而言,含能譜測井的5口井?dāng)?shù)據(jù)較少,而且主要使用的是評(píng)價(jià)井?dāng)?shù)據(jù),使用能譜測井的儲(chǔ)層段較短。這使得模型6比模型12的預(yù)測效果要差。
(2)數(shù)據(jù)過于集中,5口井的總有機(jī)碳含量的值主要集中在1.3左右,低值在訓(xùn)練中對(duì)模型權(quán)重有較大的影響,導(dǎo)致模型6對(duì)高值的預(yù)測誤差較大。
(3)對(duì)于模型12,由于模型使用的是水平井的測井?dāng)?shù)據(jù),總體數(shù)據(jù)分布比較均勻,但低值較少,這使得其總體預(yù)測結(jié)果比原始的測井解釋稍大,其誤差主要集中在低值和0點(diǎn)出,在主力產(chǎn)層龍馬溪組下部的預(yù)測結(jié)果與原始的測井解釋結(jié)果幾乎一致。
以川南海相頁巖氣為研究對(duì)象,開展了總有機(jī)碳含量的BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)預(yù)測模型的研究,得到以下結(jié)論。
(1)根據(jù)實(shí)驗(yàn)室?guī)r心獲得的數(shù)據(jù)建立了研究區(qū)塊總有機(jī)碳含量的測井響應(yīng)特征,得到該區(qū)塊富氣頁巖層段的測井響應(yīng)具有高自然伽馬、高補(bǔ)償聲波、高鈾、低無鈾伽馬、低密度、低釷的特征。
(2)通過實(shí)例證明,基于不含自然伽馬能譜測井資料的BP神經(jīng)網(wǎng)絡(luò)模型12能夠相當(dāng)好地反映出地層的實(shí)際情況,MAE為0.13,R2為0.989,相對(duì)誤差為4.26%。
(3)采用RBF核函數(shù)的支持向量機(jī)模型預(yù)測效果明顯好于采用線性核函數(shù)和多項(xiàng)式核函數(shù)的模型,使用多項(xiàng)式核函數(shù)的支持向量機(jī)模型預(yù)測效果最差。與多層神經(jīng)網(wǎng)絡(luò)模型相比,支持向量機(jī)模型訓(xùn)練時(shí)間極短,但預(yù)測精度不高。
(4)多層神經(jīng)網(wǎng)絡(luò)可以對(duì)測井?dāng)?shù)據(jù)進(jìn)行較深入的訓(xùn)練,但只采用實(shí)驗(yàn)室?guī)r心獲得的數(shù)據(jù)進(jìn)行訓(xùn)練并不能很好地反映出整個(gè)產(chǎn)層物性的變化趨勢(shì),基于處理后的測井資料所訓(xùn)練出的模型能夠很好地預(yù)測整個(gè)產(chǎn)層總有機(jī)碳含量的變化趨勢(shì)。如果測井資料的數(shù)量足夠大,其訓(xùn)練出的模型的預(yù)測結(jié)果和真實(shí)值幾乎一致。