劉燁, 郭超, 馬微, 程國(guó)建
(1.西安石油大學(xué)計(jì)算機(jī)學(xué)院, 陜西 西安 710065; 2.陜西延長(zhǎng)石油(集團(tuán))有限責(zé)任公司研究院, 陜西 西安 710075; 3.西安理工大學(xué)圖書館, 陜西 西安 710048)
傳統(tǒng)測(cè)井曲線砂體解釋工作依賴主觀經(jīng)驗(yàn)基礎(chǔ)由人工手動(dòng)完成,使得砂體解釋包含大量重復(fù)性工作,極大增加其具體實(shí)現(xiàn)的繁瑣性,解釋結(jié)果也受主觀因素影響而帶來額外誤差。
司馬立強(qiáng)等[1]利用BP神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)取心井儲(chǔ)層流動(dòng)單元進(jìn)行學(xué)習(xí)訓(xùn)練,提高了測(cè)井解釋精度。王紹忠等[2]應(yīng)用BP神經(jīng)網(wǎng)絡(luò)儲(chǔ)層預(yù)測(cè)圖進(jìn)行該區(qū)塊砂體追蹤和解釋,取得了良好的效果。石玉江等[3]基于自組織神經(jīng)網(wǎng)絡(luò)技術(shù)建立了孔隙結(jié)構(gòu)測(cè)井自動(dòng)判別和分類滲透率計(jì)算模型,有效提高滲透率計(jì)算精度。張紹紅[4]提出了一種由多測(cè)井和多地震屬性參數(shù)組成的概率神經(jīng)網(wǎng)絡(luò)方法進(jìn)行非均質(zhì)性較強(qiáng)的油氣儲(chǔ)層預(yù)測(cè)。徐剛等[5]應(yīng)用人工神經(jīng)網(wǎng)絡(luò)方法,通過統(tǒng)計(jì)分析確定各種類型典型樣本圈閉不同地質(zhì)因素的權(quán)重,并對(duì)50個(gè)圈閉進(jìn)行了地質(zhì)評(píng)價(jià)。孫志華等[6]利用神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)地震相進(jìn)行了自動(dòng)識(shí)別。
本文利用人工神經(jīng)網(wǎng)絡(luò)技術(shù),針對(duì)砂體自動(dòng)識(shí)別方法開展研究,提出一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)值方法,將測(cè)井曲線砂體的各物性特征參數(shù)作為輸入,輸出為相對(duì)應(yīng)的砂體解釋類別,以此進(jìn)行測(cè)井曲線砂體的自動(dòng)解釋工作。
鄂爾多斯盆地氣田測(cè)井曲線砂體的解釋類別主要有氣層、含氣層、氣水同層、含氣水層、水層和干層等。實(shí)際應(yīng)用中,通常較為關(guān)注氣層、含氣層和干層這3類地層。氣層砂體的孔隙度滲透率等物性參數(shù)較好,是氣藏開發(fā)的主力層位,定為Ⅰ類;含氣層是物性介于干層與氣層之間的砂體,定為Ⅱ類;干層指的是不滲透的砂層,本身無生氣能力,在氣藏中干層的作用與泥巖接近,不具有工業(yè)開發(fā)價(jià)值,定為Ⅲ類。
鄂爾多斯盆地氣田開發(fā)的測(cè)井?dāng)?shù)據(jù)中,與各砂體類別的主要因素有孔隙度、滲透率、含氣飽和度、砂厚、泥質(zhì)含量與深度等,測(cè)井解釋能夠在對(duì)代表該類影響因素的測(cè)井?dāng)?shù)據(jù)綜合分析基礎(chǔ)上,對(duì)砂體進(jìn)行細(xì)致解釋工作。本文收集到鄂爾多斯盆地某氣田140余口開發(fā)井或探井的測(cè)井曲線數(shù)據(jù),其中每口井的砂體數(shù)量約為10組,通過數(shù)據(jù)清洗與篩選,最終用于神經(jīng)網(wǎng)絡(luò)方法研究砂體解釋的數(shù)據(jù)樣本為1 310組,每組砂體數(shù)據(jù)中包含已確定的砂體類型,以及相對(duì)應(yīng)的6個(gè)影響因素。
實(shí)驗(yàn)使用1 310組砂體的孔隙度分布情況見圖1。圖1中,砂體樣本編號(hào)第1~163組是Ⅰ類砂體,第164~435組是Ⅱ類砂體,第436~1 310組是Ⅲ類砂體,圖2至圖6中出現(xiàn)的樣本編號(hào)與之相同。從圖1可以看出,Ⅰ類砂體的孔隙度多分布在8%~14%;Ⅱ類的多分布在6%~13%;Ⅲ類的分布范圍多在3%~9%。1 310組砂體樣本的孔隙度分布表明,3類砂體的滲透率具有較大差別,其中Ⅰ類與Ⅲ類的差別較為明顯,并且第Ⅲ類砂體的孔隙度分布范圍更為廣泛。
圖1 孔隙度分布
1 310組砂體的滲透率分布情況如圖2所示。從圖2可見,Ⅰ類砂體的滲透率多分布在0.3~2 mD*非法定計(jì)量單位,1 mD=9.87×10-4 μm2,下同;Ⅱ類砂體的多分布在0.1~0.6 mD;Ⅲ類的多分布在0.01~0.2 mD。1 310組砂體樣本的滲透率分布表明,Ⅰ類砂體的滲透率值最大,Ⅱ類砂體與Ⅲ類砂體的滲透率值均較小,特別是第Ⅲ類砂體滲透率值與Ⅰ類砂體的差別在一個(gè)數(shù)量級(jí)上。
圖2 有效滲透率分布
1 310組砂體的含氣飽和度分布情況見圖3。從圖3可見,Ⅰ類砂體的含氣飽和度多分布在50%~80%;Ⅱ類砂體的多分布在30%~60%;Ⅲ類的多分布在5%~55%。1 310組砂體樣本的含氣飽和度分布表明,3類砂體的含氣飽和度分別有不同程度的差別,Ⅰ類砂體的含氣飽和度最高,而Ⅲ類砂體的含氣飽和度分布范圍最廣。
圖3 含氣飽和度分布
1 310組砂體的厚度分布情況見圖4。從圖4可見,Ⅰ類砂體的泥質(zhì)含量多分布在3%~15%;Ⅱ類砂體的多分布在5%~22%;Ⅲ類的多分布在12%~35%。1 310組砂體樣本的泥質(zhì)含量分布表明,3類砂體的泥質(zhì)含量具有明顯的分異性,Ⅰ類砂體的泥質(zhì)含量最低,而第Ⅲ類砂體的泥質(zhì)含量最高,并且其分布范圍最廣。
圖4 泥質(zhì)含量分布
砂厚指各單砂體的厚度,計(jì)算公式為
砂厚=砂底深度-砂頂深度
(1)
1 310組砂體的厚度分布情況見圖5。
圖5 砂厚分布
從圖5可見,Ⅰ類與Ⅱ類砂體的砂厚多分布在2~5 m;Ⅲ類多分布在1~9 m。1 310組砂體樣本的砂厚分布表明,3類砂體的砂厚差別比較小,樣本值在整體上多分布于2~6 m。
深度指各砂體所處的深度,計(jì)算公式為
深度=(砂頂深度+砂底深度)/2
(2)
1 310組砂體的深度分布情況見圖6。可以看出3類砂體的深度分布差別并不明顯,多分布于2.8 m~3.1 km。
圖6 深度分布
通過對(duì)上述影響砂體類別的6個(gè)影響因素分析得知,單純依據(jù)其中某一個(gè)參數(shù)無法較好地進(jìn)行砂體解釋工作,而多種影響因素之間的關(guān)系又無法利用數(shù)學(xué)方法進(jìn)行描述。因此,本文采用人工神經(jīng)網(wǎng)絡(luò)技術(shù),將6個(gè)影響因素綜合起來建立砂體類型相應(yīng)的特征空間,實(shí)現(xiàn)基于測(cè)井曲線的自動(dòng)砂體解釋方法。
通過已解釋的測(cè)井曲線砂體統(tǒng)計(jì)數(shù)據(jù)建立用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的特定數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,目的是使訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)能夠以未解釋測(cè)井?dāng)?shù)據(jù)作為輸入進(jìn)行自動(dòng)砂體解釋分類。神經(jīng)網(wǎng)絡(luò)的輸出則是輸入?yún)?shù)所對(duì)應(yīng)的3類砂巖解釋類型結(jié)果的概率,最終通過概率對(duì)比能夠?qū)⑤斎霕颖具M(jìn)行自動(dòng)分類,實(shí)現(xiàn)測(cè)井曲線的自動(dòng)解釋工作[7]。
實(shí)驗(yàn)通過Matlab軟件及神經(jīng)網(wǎng)絡(luò)模式識(shí)別工具箱執(zhí)行,主要步驟為數(shù)據(jù)采集、特征選擇、特征歸一化、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、數(shù)據(jù)測(cè)試、推廣應(yīng)用。
各砂體的特征數(shù)據(jù)具有一定數(shù)量級(jí)差別,為了防止單一數(shù)據(jù)異常值影響其他變量,并為獲得能夠進(jìn)行廣泛對(duì)比的取值范圍,對(duì)所有統(tǒng)計(jì)數(shù)據(jù)進(jìn)行歸一化處理。數(shù)據(jù)歸一化將所有數(shù)據(jù)都轉(zhuǎn)化為[0,1]之間的數(shù),取消了各維數(shù)據(jù)間的數(shù)量級(jí)差別,避免因?yàn)檩斎胼敵鰯?shù)據(jù)的數(shù)量級(jí)差別較大而造成網(wǎng)絡(luò)預(yù)測(cè)誤差。數(shù)據(jù)歸一化采用最大最小方法,函數(shù)形式為
xk=(xk-xmin)/(xmax-xmin)
(3)
式中,xmin為數(shù)據(jù)序列中的最小數(shù);xmax為數(shù)據(jù)序列中的最大數(shù)。實(shí)驗(yàn)采用Matlab中的mapminmax函數(shù)進(jìn)行歸一化處理。
神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)高維的輸入/輸出映射,通常用于分類與回歸等問題求解中。分類問題是通過一組特征將對(duì)象分配至一個(gè)預(yù)定義的類別,它是使用非線性函數(shù)進(jìn)行特征空間到分類空間的映射,而神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)若干維空間的任意函數(shù)映射。為設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)獲得較好的映射效果,需要分別選擇神經(jīng)網(wǎng)絡(luò)模型、神經(jīng)元的激勵(lì)函數(shù)、誤差函數(shù)和訓(xùn)練算法。
應(yīng)用神經(jīng)網(wǎng)絡(luò)模式識(shí)別工具箱進(jìn)行砂體分類研究。該神經(jīng)網(wǎng)絡(luò)是一個(gè)3層前饋網(wǎng)絡(luò),神經(jīng)元分為輸入層、輸出層和隱層,其拓?fù)浣Y(jié)構(gòu)見圖7。根據(jù)選擇的6個(gè)特征參數(shù),輸入層有6個(gè)神經(jīng)元;輸出層有3個(gè)神經(jīng)元對(duì)應(yīng)每個(gè)砂體類別;隱層有7個(gè)神經(jīng)元,其數(shù)量通過多次實(shí)驗(yàn)后確定。
圖7 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
隱層神經(jīng)元和輸出神經(jīng)元均使用Sigmoid函數(shù),神經(jīng)網(wǎng)絡(luò)的每個(gè)輸出值的范圍在[0,1]。對(duì)于每個(gè)砂體樣本,取3個(gè)輸出中最大值所對(duì)應(yīng)的類別作為分類結(jié)果。神經(jīng)網(wǎng)絡(luò)使用交叉熵誤差函數(shù)和擬牛頓最小化誤差函數(shù)。
在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,必須對(duì)訓(xùn)練樣本使用監(jiān)督訓(xùn)練,神經(jīng)網(wǎng)絡(luò)訓(xùn)練采用誤差反向傳播方法:給定輸入神經(jīng)元初始模式,神經(jīng)網(wǎng)絡(luò)給出輸出值,如果其不等于期望的輸出,則計(jì)算兩者的差值(均方差),進(jìn)行權(quán)值修改以降低誤差。在每次訓(xùn)練中重復(fù)上述操作,直至誤差最小[8]。
將1 310組砂體樣本隨機(jī)分成訓(xùn)練集、驗(yàn)證集和測(cè)試集3個(gè)部分,分別占70%(916組)、15%(197組)和15%(197組)。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中初始權(quán)重矩陣由小隨機(jī)數(shù)值組成。當(dāng)網(wǎng)絡(luò)驗(yàn)證集的均方差開始增加時(shí),即神經(jīng)網(wǎng)絡(luò)的泛化效果停止提高時(shí),網(wǎng)絡(luò)訓(xùn)練會(huì)自動(dòng)停止。神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的訓(xùn)練和驗(yàn)證誤差曲線見圖8。在第56次訓(xùn)練結(jié)束時(shí),網(wǎng)絡(luò)擬合獲得最佳效果,此時(shí)驗(yàn)證集的均方差為0.046。
圖8 訓(xùn)練誤差
測(cè)井曲線砂體訓(xùn)練集與驗(yàn)證集的樣本數(shù)量分別為916組與197組,神經(jīng)網(wǎng)絡(luò)對(duì)這2組砂體的分類正確率分別是86.4%和91.4%,表示916組砂體樣本訓(xùn)練集中有791組得到正確分類,197組驗(yàn)證集中有180組得到正確分類。上述結(jié)果表明神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)井曲線砂體分類的擬合效果良好,同時(shí)選用未參與神經(jīng)網(wǎng)絡(luò)訓(xùn)練的測(cè)試集對(duì)其性能進(jìn)行測(cè)試。
測(cè)試集由197組砂體樣本組成,3類砂體的樣本數(shù)量分別為28(Ⅰ類)、36(Ⅱ類)和133(Ⅲ類),用于測(cè)試神經(jīng)網(wǎng)絡(luò)的最終分類性能。這里應(yīng)用混合矩陣(Confusion Matrix)表示神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)井曲線砂體類別的識(shí)別效果。混合矩陣將所有正確和錯(cuò)誤的分類信息都?xì)w到一個(gè)表里,其中列表示真實(shí)的分類,行表示神經(jīng)網(wǎng)絡(luò)分類[8]。
神經(jīng)網(wǎng)絡(luò)對(duì)3類測(cè)井曲線砂體的整體分類效果較好。其中,第Ⅰ類砂體的識(shí)別正確率達(dá)85.7%,有4組砂體被錯(cuò)誤分類為第Ⅱ類;第Ⅱ類砂體的識(shí)別效果較差一些,分類正確率為77.8%,其中有7組砂體被錯(cuò)誤識(shí)別為第Ⅲ類,1組砂體被錯(cuò)誤識(shí)別為第Ⅰ類;而第Ⅲ類砂體的識(shí)別效果最佳,僅有3組砂體被錯(cuò)誤識(shí)別為第Ⅱ類。測(cè)試集中共計(jì)正確分類182組砂體(92.4%),錯(cuò)誤分類15組(7.6%)。在錯(cuò)誤分類中,神經(jīng)網(wǎng)絡(luò)選擇的分類與正確類別臨近,并且沒有發(fā)生干層砂體被識(shí)別為氣層砂體。僅考慮氣層砂體(即氣層砂體和含氣層砂體)和干層砂體這2個(gè)類別,則識(shí)別的正確率分別是89.1%和97.7%。誤差產(chǎn)生的一個(gè)原因可能是采集到的樣本中各類別砂體數(shù)據(jù)量不均一所導(dǎo)致,這使得神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中受到限制。
為探討上述神經(jīng)網(wǎng)絡(luò)砂體識(shí)別模型的推廣應(yīng)用能力,使用第2組測(cè)井曲線砂體樣本數(shù)據(jù)集進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的測(cè)試研究。第2組測(cè)試集選擇的是鄂爾多斯盆地中另一區(qū)塊東南部的61口開發(fā)井或探井的測(cè)井?dāng)?shù)據(jù),共計(jì)得到649組測(cè)井曲線砂體數(shù)據(jù):78組氣層砂體(測(cè)試集的12.0%),125組含氣層砂體(19.3%)和446組干層砂體(68.7%)。通過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)第2組測(cè)試集進(jìn)行自動(dòng)識(shí)別,測(cè)井曲線砂體的識(shí)別正確率達(dá)到89.8%,這表明649組砂體樣本中有583組得到正確分類。
第2組測(cè)試集的混合矩陣中,第Ⅰ類和第Ⅱ類砂體的分類效果均一般,部分Ⅰ類與Ⅱ類砂體分別被錯(cuò)誤識(shí)別為Ⅱ類與Ⅲ類;而第Ⅲ類砂體的分類效果最佳,正確率達(dá)96.2%,僅有少量砂體被神經(jīng)網(wǎng)絡(luò)識(shí)別為第Ⅱ類等。如果考慮氣層砂體(氣層砂體和含氣層砂體)和干層砂體這2個(gè)類別,則分類的正確率分別是88.7%和96.2%,總正確率達(dá)到93.8%。神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)井曲線砂體解釋的推廣應(yīng)用效果較好,特別是對(duì)干層砂體的有效分類,而氣層砂體與含氣層砂體的識(shí)別精度相對(duì)低一些,可能是由于區(qū)塊地質(zhì)因素和測(cè)試樣本中類別數(shù)量不均一所致。
(1) 提出基于測(cè)井曲線中砂體統(tǒng)計(jì)參數(shù)的數(shù)值方法用于自動(dòng)解釋砂體類別。使用砂體的統(tǒng)計(jì)參數(shù)作為神經(jīng)網(wǎng)絡(luò)輸入,輸出是對(duì)應(yīng)砂體的解釋結(jié)果。
(2) 分別選擇2組不同的砂體數(shù)據(jù)測(cè)試神經(jīng)網(wǎng)絡(luò)的自動(dòng)解釋及其推廣應(yīng)用效果。結(jié)果表明基于神經(jīng)網(wǎng)絡(luò)的自動(dòng)解釋測(cè)井曲線砂體的正確率分別是92.4%和89.8%,這一精度滿足測(cè)井分析砂體解釋的初步要求,可以協(xié)助砂體識(shí)別工作。
(3) 產(chǎn)生識(shí)別誤差的一個(gè)原因可能是采集到的樣本中各類別砂體數(shù)據(jù)量不均一所導(dǎo)致,這使得神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中無法更好地完成網(wǎng)絡(luò)訓(xùn)練。
參考文獻(xiàn):
[1] 司馬立強(qiáng), 肖華, 袁龍, 等. 基于BP神經(jīng)網(wǎng)絡(luò)技術(shù)的儲(chǔ)層流動(dòng)單元研究 [J]. 測(cè)井技術(shù), 2012, 36(4): 421-425.
[2] 王紹忠, 周紅科. 埕島油田東斜坡層序約束下的儲(chǔ)層預(yù)測(cè)技術(shù) [J]. 石油地球物理勘探, 2012, 47(1): 142-149.
[3] 石玉江, 時(shí)卓, 張海濤, 等. 蘇里格氣田致密氣層測(cè)井精細(xì)建模方法 [J]. 西南石油大學(xué)學(xué)報(bào): 自然科學(xué)版, 2012, 34(5): 71-77.
[4] 張紹紅. 概率神經(jīng)網(wǎng)絡(luò)技術(shù)在非均質(zhì)地層巖性反演中的應(yīng)用 [J]. 石油學(xué)報(bào), 2008, 29(4): 549-552.
[5] 徐剛, 張建寧, 譚明友. BP人工神經(jīng)網(wǎng)絡(luò)在濟(jì)陽(yáng)拗陷圈閉地質(zhì)評(píng)價(jià)中的應(yīng)用 [J]. 石油地球物理勘探, 2004, 39(5): 565-569.
[6] 孫志華, 鄭俊茂, 甘嫦華, 等. 地震解釋技術(shù)在N50井區(qū)的應(yīng)用 [J]. 石油地球物理勘探, 2003, 38(6): 687-689.
[7] Marmo R, Amodio S, Tagliaferri R. et al. Textural Identification of Carbonate Rocks by Image Processing and Neural Network: Methodology Proposal and Examples [J]. Computers & Geosciences, 2005, 31(5): 649-659.
[8] 史峰, 王小川, 郁磊, 等. MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析 [M]. 北京: 北京航空航天大學(xué)出版社, 2010: 1-10, 282-283.