趙倩,楊斌,李星,王少龍,魏杰
(成都理工大學能源學院,四川成都610059)
YD油田英東一號構(gòu)造位于青海省柴達木盆地西部茫崖坳陷區(qū)英雄嶺沖斷隆起帶南緣油砂山—大烏斯構(gòu)造帶。該油田存在油氣并存,受異常流體性質(zhì)、儲層物性、地層水礦化度等因素影響,下油砂山組常規(guī)測井油氣識別存在較大困難,射孔解釋與生產(chǎn)矛盾,流體識別存在較大困難。
該地區(qū)流體識別研究主要有常規(guī)的圖版法識別結(jié)合核磁共振測井、模塊式地層動態(tài)測試儀(MDT)測壓進行識別[1]。最新研究方法提出利用電阻率和聲波時差之間的相關(guān)系數(shù)與兩者重疊時的包絡(luò)面積可識別出流體類型(不適合氣層)[2]。前者因運用特殊測井技術(shù),識別準確度有所提高,但由于該地區(qū)井數(shù)量較多,運用特殊測井儀器進行測量的井數(shù)量有限,難以普及;后者使用比較新穎的方法,但沒有對重要的氣層進行識別。當有多個圖版法識別流體,識別結(jié)果出現(xiàn)差異時,以及當數(shù)據(jù)點落在圖版分界線時,得到的判別結(jié)果存在主觀性。
為了解決這些難題,考慮采用數(shù)據(jù)挖掘算法。數(shù)據(jù)挖掘算法包括神經(jīng)網(wǎng)絡(luò),支持向量機,貝葉斯判別,決策樹等,其中神經(jīng)網(wǎng)絡(luò)[3-5]在流體識別中的應(yīng)用已經(jīng)比較廣泛和成熟,但神經(jīng)網(wǎng)絡(luò)屬于“黑盒”模型,樣本數(shù)據(jù)的擬合過程方式無從知曉[6]。而決策樹是一種“白盒”模型,可以清楚了解分類器是如何工作以及各種參數(shù)的相對重要性,在測井解釋方面有很好的指導(dǎo)作用[7]。
圖版法在流體識別中非常實用與常見,不同流體的測井響應(yīng)特征可以在圖版上顯示出來。但建立圖版需要選擇的曲線以及曲線組合的形式需根據(jù)不同流體類型變換。通過多口井多次試油結(jié)論得出,該地區(qū)有純氣層、純油層、含油水層、油水同層、油氣同層、水層、干層等7種流體,各流體測井響應(yīng)特征見表1。
表1 流體測井響應(yīng)特征
根據(jù)不同類型流體的測井響應(yīng)特征可以發(fā)現(xiàn),反映流體性質(zhì)的關(guān)鍵參數(shù)主要包括:孔隙度、含水飽和度、聲波、密度、中子、電阻率和錄井氣測參數(shù)等。
以這7類參數(shù)為依據(jù),綜合利用測井、錄井資料,采用了幅度值法、比值法、差值法、曲線校正法等建立不同參數(shù)類型的交會圖版。經(jīng)過多次試驗優(yōu)選出了8個有效的測井及錄井氣測參數(shù):DEN、RHT09、RHT09/RLLd、|φD-φN|、C2/C3、ΔAC、φ、Sw,建立了4個圖版。其中,RHT09為陣列感應(yīng)測井的最深探測電阻率值,RLLd為深側(cè)向電阻率,φD與φN分別為計算的密度孔隙度和校正后中子孔隙度,C2與C3分別為錄井氣測乙烷含量和丙烷含量,ΔAC為聲波時差幅度差。
圖1 ΔAC—RHT09/RLLd交會圖
(2)圖版2:|φD-φN|—RHT09/RLLd交會圖。由于地層水礦化度異常高且油氣層因受到鉆井液浸泡,陣列感應(yīng)測井電阻率呈現(xiàn)高侵入的特征,且電阻率絕對值較低,為解決這一難題,引入了密度孔隙度與校正中子孔隙度差值的絕對值,再與電阻率的比值進行交會,能夠較好地區(qū)分出氣層。密度孔隙度計算公式為[9]
φD=(ρb-ρma)/(ρf-ρma)
(1)
式中,φD為密度孔隙度,%;ρb為曲線密度值;ρma為巖石骨架密度,取值2.666 g/cm3;ρf為流體密度,取值1.0 g/cm3。
補償中子孔隙度進行了泥質(zhì)校正[10]
φN′=(φNma-φN)/(φNma-φf)-
Vsh(φNma-φNsh)/(φNma-φf)
(2)
式中,φN′為校正后的中子孔隙度,%;φNma為砂巖骨架中子孔隙度,取值-3.5;φN為校正前的中子孔隙度;φf為流體中子孔隙度,取值100;Vsh為泥質(zhì)含量;φNsh為泥巖中子孔隙度,取值27%。
圖2 |φD-φN|—RHT09/RLLd交會圖
從圖2可見,油層:|φD-φN|<3.5%;氣層、油氣同層:|φD-φN|≥3.5%。該圖版同時可以較好地區(qū)分出油氣同層。
(3)圖版3:DEN—C2/C3交會圖。氣測總烴與其他氣測值是油氣判斷較直觀的參數(shù),該圖版選用密度與氣測比值C2/C3[10]進行交會(見圖3)。在氣測總烴含量較高(>45%)時,能夠較好地區(qū)分油層與氣層。其中,氣層為:C2/C3≥2;油層為:C2/C3<2。
圖3 DEN—C2/C3交會圖
(4)圖版4:φ—RHT09交會圖。該圖版綜合考慮了孔隙度、陣列感應(yīng)測井電阻率和含水飽和度這3個參數(shù)(見圖4),通過不同的含水飽和度區(qū)間,可定性判別油氣層類和水層類。其中,水層、含油水層、油水同層Sw≥50%,氣層、油層、油氣同層Sw<50%。
圖4 φ—RHT09交會圖
圖版法識別流體存在多解性和不確定性。整個識別過程繁瑣,特別是對整個區(qū)塊的所有井進行識別時,工作量十分龐大。為了解決以上問題,運用數(shù)據(jù)挖掘中的決策樹法。構(gòu)造決策樹的目的是找出屬性(測井輸入曲線)和類別(流體類別)間的關(guān)系,用它來預(yù)測未知的類別。這種具有預(yù)測功能的系統(tǒng)稱為決策樹分類器[7]。
決策樹是一種常用的數(shù)據(jù)挖掘方法,是類似流程圖的樹型結(jié)構(gòu)[11-12]。
決策樹算法主要包括2個過程:構(gòu)造過程和分類過程。構(gòu)造決策樹分為建樹和剪枝2個階段,前者歸納出決策樹,后者防止過度擬合。目前決策樹算法有ID3(Quinlan 1986)、CART(Breman 1984)、FACT(Loh 1988)、C4.5(Quinlan 1993)等算法,本文采用CART算法。
CART(Classification And Regression Tree)算法是一種二分分類回歸樹。若目標變量是離散的,則是分類樹,否則是回歸樹。CART算法是在給定輸入隨機變量X條件下輸出隨機變量Y的條件概率分布的學習方法。構(gòu)造過程和ID3、C4.5的構(gòu)造上大致相同,只是在屬性選擇過程中不是使用信息增益或信息增益率,而是使用基尼指數(shù)(Gini index)最小化準則進行特征選擇。采用二分遞歸分割的方法,不斷將當前的樣本集分為2個子集,使得每個非葉子節(jié)點都有2個分支,最后產(chǎn)生1棵二叉決策樹[12-13]。
設(shè)1個樣本集合S,有A屬性參數(shù),有K類,若屬于第i類的樣本子集為Ci,則其基尼指數(shù)為
(3)
若集合S根據(jù)特征A是否取某一可能值a被分割為S1和S2兩部分,即
S1={(x,y)∈S|A(x)=a}
(4)
S2=S-S1
(5)
則以特征A作為判別條件時,基尼指數(shù)定義
(6)
Gini(S)、Gini(S,A)分別表示集合S的不確定性以及通過A=a分割后集合的不確定性。基尼指數(shù)值越大,樣本集合的不確定性也就越大CART算法可判斷屬性變量的重要性,自動忽略對目標變量沒有貢獻的屬性,對于樣本集中不合適的孤立點、缺失值可自動處理[13]??墒褂米詣拥某杀緩?fù)雜性剪枝來得到歸納性更強的樹。CART算法得到的為二叉樹模型,相比ID3與C4.5得到的多叉樹更簡潔。
通過以上各流體的測井響應(yīng)特征及流體識別建立的圖版,對測井數(shù)據(jù)進行處理,選擇CNL、DEN、感應(yīng)電阻率(RHT09)、φ、Sw、RHT09/RLLd、|φD-φN|、C2/C3、ΔAC,這9個參數(shù)作為決策樹輸入?yún)?shù),
以
試油結(jié)論作為輸出結(jié)果。CART算法采用(Gini index)作為劃分度量,選擇基尼指數(shù)最大的屬性作為劃分節(jié)點。對輸入的9個參數(shù)計算,進行權(quán)重判斷,參數(shù)權(quán)重見圖5。圖5柱狀圖表示從9個參數(shù)中挖掘出對流體敏感的DEN、RHT09、Sw、RHT09/RLLd、|φD-φN|、C2/C3、φ等7個參數(shù),CNL、ΔAC這2個參數(shù)幾乎不敏感,所以不參與建樹。選出的7個參數(shù)中C2/C3與Sw的參數(shù)權(quán)重最大,敏感性最高;φ、RHT09和RHT09/RLLd次之。為了能將7種類型的流體均能識別出,同時使識別結(jié)果更為準確,考慮加入敏感度不是特別高的|φD-φN|和DEN,|φD-φN|能有效區(qū)分油類與氣類;DEN是有效區(qū)分出干層的重要參數(shù)。
圖5 流體識別數(shù)據(jù)挖掘權(quán)重圖
通過決策樹識別生成的規(guī)則具有高準確率,88個流體樣本,生成的決策樹模型可正確識別83個,模型正確率達94.32%。運用生成的決策樹模型識別預(yù)留出的12個檢驗?zāi)P偷臉颖?其正確個數(shù)為11個,正確率達91.7%,表明模型可用(見表2)。圖6是流體識別的決策樹識別模型樹狀圖,模型從根節(jié)點即含水飽和度開始對數(shù)據(jù)樣本進行測試,至上而下共4個層次。樹的每個分枝代表一類流體的識別規(guī)則,葉節(jié)點表示構(gòu)成該識別規(guī)則的屬性參數(shù)以及每個參數(shù)的數(shù)值區(qū)間。通過對模型的分析可以清楚地看出流體類型識別的參數(shù)組合和關(guān)聯(lián)規(guī)則,例如油層根結(jié)點往下需要同時滿足4個條件Sw<0.516 3、C2/C3<2.159 6、DEN<2.509 5、|φD-φN|<8.353 22%。該方法易理解分類準確,不僅在流體識別方面提供了新的有效方法,也為地球物理其他方面的研究提供思路和指導(dǎo)。
表2 流體識別決策樹模型檢驗表
圖6 流體識別的決策樹模型圖
圖7 XD112井流體識別結(jié)果圖
以XD112井為實例(見圖7),對XD112井Ⅶ-4、Ⅶ-5、Ⅶ-8這3個未參與模型建立的實際試油小層運用決策樹圖版法進行流體識別。Ⅶ-4層測井曲線特征:自然伽馬為83.153 API,電阻率為5.123 Ω·m、聲波時差為256.259 μs/m,中子為21.526%,密度為2.373 g/cm3,總烴高達84%,Sw為0.449,φ為15.475%。Ⅶ-5層測井曲線特征:自然伽馬為85.435 API,電阻率為5.054 Ω·m,聲波時差為273.925 μs/m,中子為21.526%,密度為2.373 g/cm3,總烴高達33.75%,Sw為0.389,φ為20.032%。對這2個小層運用決策樹模型識別得出均為氣層,且2個小層的中子曲線和密度曲線有充填支持了氣層結(jié)論。經(jīng)實際射孔驗證,Ⅶ-4、Ⅶ-5小層日產(chǎn)氣5 143 m3,屬于氣層,模型識別正確。
Ⅶ-8層測井曲線特征:自然伽馬為72.858 API,電阻率為5.123 Ω·m,聲波時差為277.528 μs/m,中子為18.966%,密度為2.327 g/cm3,總烴4.23%,C2/C3為17.155,φ為10.503%,Sw為0.724。對這個小層運用決策樹模型識別結(jié)果為干層,與射孔結(jié)果相符。
(1)圖版DEN—RHT09對于干層、油氣層大類和水層大類識別較高;對于氣層類,可用|φD-φN|—RHT09/RLLd交會圖版進行識別,當錄井氣測全烴Tgas>45%時,使用DEN—C2/C3圖版能夠較好地區(qū)分油層和氣層;對于油層類,ΔAC—RHT09/RLLd交會圖進行識別;對于水層類使用RHT09-φ圖版。圖版法在定性劃分流體性質(zhì)時具有很好的作用,但是當流體類型落在2類流體分界線附近時則帶有一定的人為主觀性;面對大量數(shù)據(jù)時圖版法識別效率太低。
(2)YD油田油氣并存,流體性質(zhì)、儲層物性、地層水礦化度異常高等因素導(dǎo)致流體測井響應(yīng)特征復(fù)雜,不同流體類型識別困難。決策樹法很好地解決了圖版法存在的缺陷,通過決策樹數(shù)據(jù)挖掘的分析,根據(jù)各屬性參數(shù)之間的關(guān)系,選出DEN、RHT09、Sw、RHT09/RLLd、|φD-φN|、C2/C3、φ等7個對流體識別最敏感的參數(shù),使得識別更有效快捷。
(3)運用決策樹進行流體識別只是數(shù)據(jù)挖掘方法與地球物理學相結(jié)合方法的其中一種,但這一方法的實現(xiàn)為地球物理其他方面的研究提供了一種新的思路和方法。