陳玉雪,常安定,強(qiáng)玲娟
(長(zhǎng)安大學(xué)理學(xué)院,西安 710064)
?
基于數(shù)據(jù)挖掘的M地區(qū)低滲透儲(chǔ)層評(píng)價(jià)
陳玉雪,常安定,強(qiáng)玲娟
(長(zhǎng)安大學(xué)理學(xué)院,西安 710064)
文章以M地區(qū)為研究對(duì)象,針對(duì)該區(qū)實(shí)際地質(zhì)情況,基于孔隙度、滲透率等測(cè)井資料,運(yùn)用多元統(tǒng)計(jì)中的R型因子分析、判別分析及數(shù)據(jù)挖掘中的聚類分析,對(duì)儲(chǔ)層進(jìn)行合理的分類,得出儲(chǔ)層空間的展布規(guī)律,并建立定量的評(píng)價(jià)標(biāo)準(zhǔn)。結(jié)合實(shí)際產(chǎn)能資料驗(yàn)證,認(rèn)為該方法在儲(chǔ)層評(píng)價(jià)中是可行的。
R型因子分析;Fisher判別;凝聚層次聚類;儲(chǔ)層評(píng)價(jià);鄂爾多斯
儲(chǔ)層研究的目的是對(duì)儲(chǔ)層做出符合地質(zhì)實(shí)況的分類與評(píng)價(jià)[1-3],故首要任務(wù)就是對(duì)儲(chǔ)層做出合理的分類評(píng)價(jià),它的結(jié)果能夠直接指導(dǎo)油氣的勘探與開發(fā)。因此,儲(chǔ)層評(píng)價(jià)工作一直是國(guó)內(nèi)外研究者關(guān)注的焦點(diǎn)。儲(chǔ)層分類的關(guān)鍵是合理選擇評(píng)價(jià)參數(shù)及方法,目前研究方向主要集中在運(yùn)用各種數(shù)學(xué)方法、地質(zhì)學(xué)與實(shí)驗(yàn)方法等對(duì)滲透率和孔隙度等儲(chǔ)層物性參數(shù)進(jìn)行評(píng)價(jià),其中包括:地質(zhì)經(jīng)驗(yàn)法、模糊數(shù)學(xué)法,權(quán)重分析法以及各種地震方法等等[1]。根據(jù)各個(gè)地區(qū)不同的地質(zhì)特征,每種評(píng)價(jià)方法均有各自不同的優(yōu)缺點(diǎn)。
本次工作在對(duì)M地區(qū)的研究中發(fā)現(xiàn),M地區(qū)的儲(chǔ)層非均質(zhì)性較強(qiáng),溶蝕孔洞發(fā)育較多,現(xiàn)有方法對(duì)該區(qū)評(píng)價(jià)時(shí)其結(jié)果不太理想。由此,本研究以M地區(qū)的地質(zhì)資料為例,引入多元統(tǒng)計(jì)分析中的R型因子分析優(yōu)化評(píng)價(jià)參數(shù),然后使用數(shù)據(jù)挖掘中的凝聚層次聚類算法對(duì)儲(chǔ)層分類,并建立評(píng)價(jià)標(biāo)準(zhǔn),從而得到更精準(zhǔn)的評(píng)價(jià)結(jié)果。相比較而言,比傳統(tǒng)定性分類更加合理、全面[4-5]。
因子分析和判別分析都是多元統(tǒng)計(jì)中的典型方法[6]。因子分析的目的是降維和簡(jiǎn)化數(shù)據(jù),它通過(guò)研究多個(gè)變量間的內(nèi)部依賴關(guān)系,用少數(shù)幾個(gè)能反映原來(lái)眾多變量主要信息的‘因子’來(lái)表示其基本的數(shù)據(jù)結(jié)構(gòu)。原始變量是可觀測(cè)的顯在變量,而因子是不可觀測(cè)的潛在變量[7]。因子分析在此用來(lái)確定變量權(quán)重。
判別分析是利用已經(jīng)得到的變量數(shù)據(jù),找到一種判別函數(shù),使得此函數(shù)具有某種最有性質(zhì),能夠把屬于不同類別的樣本點(diǎn)盡量區(qū)別開來(lái)[6]。判別分析在此用來(lái)建立評(píng)價(jià)標(biāo)準(zhǔn)并驗(yàn)證評(píng)價(jià)結(jié)果。
數(shù)據(jù)挖掘的目的是從大量、隨機(jī)的數(shù)據(jù)中通過(guò)算法探尋隱藏的潛在信息的過(guò)程,主要包括分類、聚類、關(guān)聯(lián)分析與異常檢測(cè)[8]。其中,聚類分析是數(shù)據(jù)挖掘中的一個(gè)重要方法,它是一種在沒(méi)有任何先驗(yàn)信息條件下,將現(xiàn)有的無(wú)標(biāo)記數(shù)據(jù)進(jìn)行歸類的數(shù)據(jù)分析過(guò)程。其目標(biāo)是,組內(nèi)的對(duì)象相互之間是相似的,而不同組中的對(duì)象是不相關(guān)的。組內(nèi)的相似性越大,組間差距越大,聚類效果就越好[9]。
1.1 R型因子分析
設(shè)有n個(gè)樣本,每個(gè)樣本有m項(xiàng)參數(shù),則原始數(shù)據(jù)集可用矩陣表示為:
(1)將樣本標(biāo)準(zhǔn)化,去除原始量綱及異常點(diǎn)。
(2)判斷原始變量是否適合于因子分析(求變量間的相關(guān)系數(shù)矩陣,若矩陣中大部分相關(guān)系數(shù)均大于0.3,且通過(guò)球形檢驗(yàn)即可)。
(4)因子旋轉(zhuǎn)。
(5)計(jì)算公共因子變量得分[9-10]。
1.2 凝聚層次聚類算法
層次聚類常常使用稱作樹狀圖的類似于樹的圖顯示。凝聚層次聚類算法的基本思想是:將數(shù)據(jù)對(duì)象看成一棵樹狀圖,運(yùn)用遞歸的方法發(fā)現(xiàn)潛在的簇,在自下而上的凝聚模型中,從個(gè)體點(diǎn)作為本身的簇開始,相繼合并兩個(gè)最接近的簇,直到只剩下一個(gè)簇[8]。
算法描述如下:
第一步:根據(jù)需要,計(jì)算鄰近度矩陣。
第二步:repeat。
第三步:合并最接近的兩個(gè)簇。
第四步:更新鄰近性矩陣,以反映新的簇與原來(lái)的簇之間的鄰近性。
第五步:until僅剩下一個(gè)簇。
1.3 Fisher判別
從m個(gè)總體中抽取具有n個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),然后借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù):
U(X)=u1X1+u2X2+…+unXn=u′X
(1)
其中,系數(shù)u=(u1,u2, …un)確定的原則是使得總體之間區(qū)別最大,每個(gè)個(gè)體內(nèi)部離差最小。有了線性判別函數(shù)后,對(duì)于一個(gè)新的樣品,將它的n個(gè)指標(biāo)值代入(1)式中求出U(X)值,然后根據(jù)判別一定的規(guī)則,即可判別出新的樣品屬于哪個(gè)總體[6,11]。
2.1 地質(zhì)背景
鄂爾多斯盆地是一個(gè)位于中國(guó)西部,在華北地臺(tái)上發(fā)育起來(lái)的多旋回中、新生代沉積盆地。盆地具有構(gòu)造穩(wěn)定,整體抬升、持續(xù)下降、地層平緩的特征[12]。在晚三疊世延長(zhǎng)期,發(fā)育了大型的鄂爾多斯湖盆,成藏了大量的油氣資源[9],其中“長(zhǎng)4+5—長(zhǎng)2”是湖盆的萎縮期,面積逐漸變小[12]。
M地區(qū)位于鄂爾多斯盆地伊陜斜坡中部,地層為一個(gè)單斜,傾角不足1°。M地區(qū)長(zhǎng)2期以三角洲平原分流河道沉積為主,尤其是長(zhǎng)21期,三角洲發(fā)育進(jìn)入鼎盛時(shí)期,廣泛發(fā)育的河道砂體為油氣聚集提供了必須的儲(chǔ)集空間,由于巖性的橫向變化和儲(chǔ)集砂體沉積之后的差異壓實(shí)作用形成構(gòu)造—巖性圈閉。
三疊紀(jì)末期,鄂爾多斯盆地受印支運(yùn)動(dòng)的影響整體抬升。地表遭受長(zhǎng)時(shí)期的風(fēng)化剝蝕,形成起伏不平、溝谷縱橫的古地貌景觀。研究區(qū)位于前侏羅紀(jì)甘陜古河谷南側(cè)的子午嶺斜坡帶。延長(zhǎng)組長(zhǎng)2保存完整,長(zhǎng)1也不同程度的有所保存,保存厚度可達(dá)30~50 m,有利于油氣成藏。
2.2 參數(shù)優(yōu)選和因子分析
在4口取心井產(chǎn)段選,取樣本32個(gè),優(yōu)選了孔隙度、滲透率,非汞飽和度、中值壓力、結(jié)構(gòu)系數(shù)和進(jìn)汞迂曲度作為分析指標(biāo),并對(duì)數(shù)據(jù)進(jìn)行因子分析,分析結(jié)果見表1。
從表1可知,本例中有兩個(gè)因子對(duì)應(yīng)的特征值大于1,因此應(yīng)提取相應(yīng)的兩個(gè)公因子,且從中可以看出,前兩個(gè)因子已經(jīng)可以解釋79.093%的方差。
從表2可以看出,第一個(gè)公因子在指標(biāo)x1、x2、x6上有較大載荷,說(shuō)明這三個(gè)指標(biāo)有較強(qiáng)的相關(guān)性,可以歸為一類;其他指標(biāo)歸為另一類。
根據(jù)表2可得到旋轉(zhuǎn)后的因子得分表達(dá)式為:
F1=0.696x1+0.658x2+0.834x3+0.923x4+0.59x5+0.762x6
F2=0.102x1+0.217x2+0.378x3+0.29x4+0.946x5+0.035x6
式中:x1為孔隙度(%);x2為滲透率(×10-3μm);x3為非汞飽和度(%);x4為中值壓力(MPa);x5為結(jié)構(gòu)系數(shù);x6為進(jìn)汞迂曲度。
表1 各公因子方差貢獻(xiàn)表
注:提取方法為主體元件分析。
表2 旋轉(zhuǎn)后因子載荷陣
圖1 M地區(qū)儲(chǔ)層分類系譜圖(橫坐標(biāo)為樣本,縱坐標(biāo)為距離系數(shù))Fig.1 Family tree of reservoir classification in area M
2.3 凝聚層次聚類
根據(jù)2個(gè)公共因子的得分對(duì)該區(qū)儲(chǔ)層進(jìn)行聚類分析,可得到分類系譜圖1。由圖1可知:當(dāng)距離系數(shù)為1.5時(shí),所有樣品明顯的分為4類(A、B、C、D)。
結(jié)合系譜圖,對(duì)劃分的四類儲(chǔ)層進(jìn)行分析,其結(jié)果如表3所述。
為驗(yàn)證分類的合理性,與現(xiàn)場(chǎng)儲(chǔ)層分類結(jié)果對(duì)比發(fā)現(xiàn),A類為好儲(chǔ)層,B類為較好儲(chǔ)層,C類為較差儲(chǔ)層,D類為非儲(chǔ)層。
2.4 儲(chǔ)層類型判別
確定了儲(chǔ)層劃分的4個(gè)類型以后,將標(biāo)準(zhǔn)樣品按照以上四類儲(chǔ)層類型分組,建立判別需要的輸入文件,利用Fisher判別分析法建立每一類儲(chǔ)層的判別函數(shù)模型,判別函數(shù)分別為:
F1=-64.98-1.680x1+0.656x2+0.877x3+0.097x4+0.017x5+0.579x6
表3 儲(chǔ)層分類參數(shù)統(tǒng)計(jì)
表4 正2井區(qū)相對(duì)滲透率分析數(shù)據(jù)表
圖2 5032井相對(duì)滲透率曲線Fig.2 Permeability saturation curve of well 5032
F2=-28.767-0.867x1+1.155x2+0.357x3+0.038x4+0.054x5+0.698x6
式中:x1為孔隙度(%);x2為滲透率(×10-3μm);x3為非汞飽和度(%);x4為中值壓力(MPa); x5為結(jié)構(gòu)系數(shù);x6為進(jìn)汞迂曲度。
從中可以得到,孔隙度和第一個(gè)判別函數(shù)關(guān)系較密切,滲透率和第二個(gè)判別函數(shù)關(guān)系較密切。實(shí)際上這兩個(gè)函數(shù)式計(jì)算的是各觀測(cè)值在每個(gè)維度上的坐標(biāo),這樣可以通過(guò)這兩個(gè)式子求出各個(gè)樣品觀測(cè)值的具體空間位置。
通過(guò)驗(yàn)證,隨機(jī)選擇的樣本點(diǎn)與上述聚類分析結(jié)果吻合率達(dá)到94%以上,說(shuō)明所建立的Fisher判別函數(shù)與其評(píng)價(jià)指標(biāo)的分類標(biāo)準(zhǔn)符合了精度上的要求。通過(guò)spss判別分析,可計(jì)算其他井樣品所屬儲(chǔ)層類型。
2.5 應(yīng)用效果分析
通過(guò)對(duì)正2井區(qū)5032井巖心樣品模擬地層條件進(jìn)行的儲(chǔ)層潤(rùn)濕性試驗(yàn),結(jié)果為親水儲(chǔ)層。水潤(rùn)濕指數(shù)為0.646,油潤(rùn)濕指數(shù)為0。相對(duì)滲透率分析見圖2、表4所述,等滲點(diǎn)含水飽和度58.4%,束縛水飽和度為35.3%。水驅(qū)油試驗(yàn),無(wú)水驅(qū)油效率為25%,最終驅(qū)油效率為43%。滲流分析成果表明,正2井區(qū)長(zhǎng)2油藏的儲(chǔ)層性質(zhì)對(duì)油田開發(fā)較為有利。
綜上所述,該儲(chǔ)層分類評(píng)價(jià)標(biāo)準(zhǔn)的結(jié)論與實(shí)際生產(chǎn)情況吻合,這一新的評(píng)價(jià)標(biāo)準(zhǔn)達(dá)到了較高的精度,適用于該區(qū)的儲(chǔ)層評(píng)價(jià)分析。
采用因子分析優(yōu)化評(píng)價(jià)參數(shù),解決了參數(shù)多、數(shù)據(jù)不規(guī)整的問(wèn)題;通過(guò)凝聚層次聚類分析,將該區(qū)儲(chǔ)層分為四類,每類儲(chǔ)層各參數(shù)值均是規(guī)律遞變;最后,通過(guò)Fisher判別函數(shù)建立了儲(chǔ)層分類的綜合判別函數(shù)表達(dá)式,以及定量的分類標(biāo)準(zhǔn)。
[1] 陳歡慶, 丁超, 杜宜靜, 等. 儲(chǔ)層評(píng)價(jià)研究進(jìn)展[J]. 地質(zhì)科技情報(bào), 2015, 34(5): 66-74.
[2] 楊俊杰. 鄂爾多斯盆地構(gòu)造演化與油氣分布規(guī)律[M]. 北京: 石油工業(yè)出版社, 2002.
[3] 于興河. 油氣儲(chǔ)層地質(zhì)學(xué)基礎(chǔ)[M]. 北京: 地質(zhì)出版社, 2009: 362-382.
[4] 黃淵, 廖明光, 李斌, 等. 數(shù)據(jù)挖掘技術(shù)在碳酸鹽巖儲(chǔ)層評(píng)價(jià)中的應(yīng)用[J]. 特種油氣藏, 2014(5): 37-42.
[5] 譚鋒奇, 李洪奇, 孟照旭, 等. 數(shù)據(jù)挖掘方法在石油勘探開發(fā)中的應(yīng)用研究[J]. 石油地球物理勘探, 2010, 45(1): 85-91.
[6] 張潤(rùn)楚. 多元統(tǒng)計(jì)分析[M]. 北京: 科學(xué)出版社, 2010.
[7] 張林泉. 基于因子分析的應(yīng)用研究[J]. 哈爾濱師范大學(xué)學(xué)報(bào)(自然科學(xué)報(bào)), 2009, 25(5): 60-63.
[8] 范明, 范宏建, 等. 數(shù)據(jù)挖掘?qū)д揫M]. 北京: 人民郵電出版社, 2014.
[9] 李文厚, 龐軍剛, 曹紅霞, 等. 鄂爾多斯盆地晚三疊世延長(zhǎng)期沉積體系及巖相古地理演化[J]. 西北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009(3): 501-506.
[10] 呂紅華, 任明達(dá), 柳金誠(chéng), 等. Q型主因子分析與聚類分析在柴達(dá)木盆地花土溝油田新近系砂巖儲(chǔ)層評(píng)價(jià)中的應(yīng)用[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版), 2006, 42(6): 740-745.
[11] 付殿敬, 徐敬領(lǐng), 王貴文. 基于Q型聚類分析和貝葉斯判別算法研究?jī)?chǔ)層分類評(píng)價(jià)[J]. 科技導(dǎo)報(bào), 2011, 29(3): 29-33.
[12] 劉池洋, 趙紅格, 桂小軍. 鄂爾多斯盆地演化-改造的時(shí)空坐標(biāo)及成藏(礦)響應(yīng)[J]. 地質(zhì)學(xué)報(bào), 2006, 80(5): 617-633.
The data mining-based evaluation of low permeability reservoir in area M
CHEN Yuxue, CHANG Anding, QIANG Lingjuan
(ChanganUniversityFacultyofScience,Xi’an710064,China)
According to practical geological situation, logging data, such as porosity, permeability of area M multivariate statistical R factor analysis, discriminant analysis and cluster analysis for data mining are used to make reasonable classification of reservoirs, then is summarized the spatial distribution pattern of reservoirs and set up evaluation criterion. The actual production data show that the method is feasible.
type R factor analysis; Fisher discrimination; condensation hierarchical clustering; reservoir evaluation; Erduosi
2016-04-28;
2016-07-21; 責(zé)任編輯: 王傳泰
陜西省科技計(jì)劃項(xiàng)目(編號(hào):2015JM1022)資助。
陳玉雪(1970—),女,在讀研究生,主要從事統(tǒng)計(jì)最優(yōu)化方向研究工作。通信地址:陜西省西安市南二環(huán)中段,長(zhǎng)安大學(xué)理學(xué)院;郵政編碼:710064;E-mail:332575096@qq.com
10.6053/j.issn.1001-1412.2016.04.009
P618.13,TE348
A