鐘亞軍 張宏濤 胡高賢 董 巖
(1. 石油大學(北京) 北京)(2. 陜西省煤層氣開發(fā)利用有限公司 陜西 西安)(3. 石油集團測井有限公司油氣評價中心 陜西 西安)
巖性識別是儲層測井評價的首要任務。常規(guī)油田生產(chǎn)往往采用交會圖法識別礦物成分,最常用的就是中子—密度交會圖法識別巖性。交會圖法一般適用于巖石骨架成分不超過2 ~3 種,復雜巖性碳酸鹽巖儲層,其巖石骨架的主要礦物成分是方解石和白云石,通常還含有一些粘土礦物、有機質(zhì)、石膏、鹽巖、黃鐵礦、硅質(zhì)等,它們雖然含量不多,但對儲層的影響及對測井信息的貢獻特別大,因此依靠該方法無法細致的劃分儲層巖性。Matlab 具有其他編程語言例如FORTRAN、C 語言無法比擬的強大圖形功能,本文主要引用Matlab工具箱中的聚類分析函數(shù)實現(xiàn)巖性劃分識別,即利用Matlab 聚類函數(shù)進行測井相析,通過測井相與巖相之間轉(zhuǎn)化,得到單井系統(tǒng)聚類巖性。對研究區(qū)幾口取心井進行計算分析,然后對比取心巖性。對比結(jié)果有較高的識別符合率,可以在該地區(qū)推廣使用。
聚類分析(cluster analysis)是一組將研究對象分為相對同質(zhì)的群組(clusters)的統(tǒng)計分析技術(shù),根據(jù)“物以類聚”的道理,對樣品或指標進行分類的一種多元統(tǒng)計分析方法,它們討論的對象是大量的樣品,要求能合理地按各自的特性來進行合理的分類,沒有任何模式可供參考或依循,即在沒有先驗知識的情況下進行的。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析的目標就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類[1]。
本文主要運用系統(tǒng)聚類方法,簡單地說,是指聚類過程按照一定層次進行。它是目前使用最多的一種聚類方法,其基本思想是:首先,將要分類的n 個變量各自看作一類,然后分別計算兩個個體之間的對應程度或關(guān)系密切程度[2]??梢杂脙煞N方式來測量:1)采用描述個體對(變量對)之間的接近程度的指標,例如距離,距離越小的個體(變量)越具有相似性。2)采用表示相似程度的指標,例如相關(guān)系數(shù),相關(guān)系數(shù)越大的個體(變量)越具有相似性[3]。在計算出個體之間的距離之后,將關(guān)系最密切的兩個個體歸為—類,其余不變,即得到n-1 個類,如此重復進行下去,每次歸類都減少1 類,直至最后n 個變量都歸為1 類,如圖1 所示。系統(tǒng)聚類能夠得到多個分類解,可以根據(jù)實際情況進行分類。系統(tǒng)聚類的顯著優(yōu)點就是可以在巖心資料較少情況下,根據(jù)測井曲線系統(tǒng)聚類,結(jié)合地區(qū)經(jīng)驗,進行巖性分類,不同于判別分析需要大量巖心資料樣本。
圖1 聚類分析原理圖
Matlab 統(tǒng)計工具箱聚類分析函數(shù)實現(xiàn)測井相分析主要有以下步驟:
1)找到數(shù)據(jù)集合中變量兩兩之間的相似性和非相似性,用pdist 函數(shù)計算變量之間的距離;
2)用linkage 函數(shù)定義變量之間的連接。將對象進行分組,生成二進的具有層次結(jié)構(gòu)的聚類樹;用linkage 函數(shù)將很接近的兩兩對象聯(lián)系一起;對象被兩兩合并成為二進類,同時新生成的類合并更大的類,直到聚類樹生成;
3)用cophenetic 函數(shù)評價聚類信息,利用pdist 函數(shù)生成的Y 和linkage 函數(shù)生成的Z 計算cophenet 相關(guān)系數(shù);
4)利用cluster 函數(shù),根據(jù)linkage 函數(shù)的輸出Z 創(chuàng)建分類。
當分類變量的測量尺度不一致時,需要事先做標準化處理。
數(shù)據(jù)標準化處理包括選擇數(shù)量,類型和特征的標度,它依靠特征選擇和特征抽取,特征選擇選擇重要的特征,特征抽取把輸入的特征轉(zhuǎn)化為一個新的顯著特征,它們經(jīng)常被用來獲取一個合適的特征集來為避免“維數(shù)災”進行聚類,數(shù)據(jù)預處理還包括將孤立點移出數(shù)據(jù),孤立點是不依附于一般數(shù)據(jù)行為或模型的數(shù)據(jù),因此孤立點經(jīng)常會導致有偏差的聚類結(jié)果,因此為了得到正確的聚類,我們必須將它們剔除。
在利用測井資料作聚類分析時,我們選取六條與巖性相關(guān)度較高的曲線作變量,他們分別是GR、AC、DEN、CNL、PE、RLLD。測井數(shù)據(jù)之間的量綱是不一致的,灰?guī)r的電阻率可達103數(shù)量級,而中子、密度一般只有個位數(shù)量級,為了防止出現(xiàn)中子、密度曲線被“吃掉”的情況,因此,在作聚類分析之前先將測井曲線進行歸一化處理。
具體代碼如下:
根據(jù)聚類樹圖的分布特征,結(jié)合地質(zhì)取心資料,將本區(qū)巖性主要分為4 大類:灰?guī)r,白云巖,泥質(zhì)白云巖,膏質(zhì)白云巖。所以將測井相分為4 大類(圖2)。圖中可以看出4 類測井相在交會圖上較好區(qū)分。
圖2 Matlab 程序生成聚類樹譜
利用聚類分析程序,對鄂爾多斯地區(qū)well001 井奧陶系測井數(shù)據(jù)進行處理,得到該井奧陶系馬家溝組聚類分析巖性,然后與取心巖性相對比,取得較好的符合率,尤其是膏質(zhì)白云巖層段符合率很高,說明該方法在識別復雜巖性上是有效的(圖3,圖4)。
圖3 matlab 聚類分析結(jié)果在巖性交會圖上的分布
圖4 鄂爾多斯地區(qū)well001 井奧陶系取心巖性與聚類分析巖性對比圖
鄂爾多斯盆地奧陶系馬家溝組地層屬于海相沉積地層,巖性以灰?guī)r、白云巖為主,白云巖段儲層較多發(fā)育,取心資料較多。該井在馬家溝組共有3 處取心,1#取心13.35 m,2#取心17.22 m,3#取心30.64 m,將取心巖性觀察與測井聚類分析識別巖性對比,符合率達96.3%。
在1#取心段,可以看出聚類分析識別的巖性中,很有效的泥質(zhì)白云巖段、灰?guī)r段從白云巖段中分辨出來;在2#取心段中,深度為2 313.24 m ~2 315.45 m 的白云質(zhì)灰?guī)r識別模糊外,其他層段全部符合取心觀察巖性;在3#取心段聚類分析識別巖性準確的識別除了含膏質(zhì)在內(nèi)的白云巖層段。
1)利用Maltab 函數(shù)編寫程序可以節(jié)省大量時間,提升工作效率,而且,利用它強大的圖像功能可以實現(xiàn)測井解釋的可視化,提高數(shù)據(jù)分析處理效果。
2)可以利用Matlab 統(tǒng)計分析工具箱實現(xiàn)了測井相聚類分析,完成了單井巖性識別,通過對比取巖心井巖性驗證,證實該方法是巖性識別方便有效的手段。
[1]孫宇峰. 基于Matlab 的模糊聚類分析及應用[J]. 韶關(guān)學院學報(自然科學),2006,27(9)
[2]尋知鋒,余繼峰. 聚類和判別分析在測井巖性識別中的應用[J]. Journal of Shandong University of Science and Technology(Natural Science),2008,27(5)
[3]張振城,孫建孟,馬建海,等. 利用測井資料自動識別藻灰?guī)r[J]. 吉林大學學報(地球科學版),2005,35(3)
[4]杜 藏,駱 源. 科學計算語言matlab 簡明教程[M]. 天津:南開大學出版社,1998
[5]陳桂明. Matlab 數(shù)據(jù)統(tǒng)計(6. x)[M]. 北京:科學出版社,2002
[6]劉 飛,陳岳龍,蔣麗婷.MATLAB 在碎屑沉積巖礦物含量計算中的應用[J].沉積學報,2006,24(2)
[7]朱劍兵. Matlab 軟件在測井資料處理中的應用[J]. 油氣地球物理,2006,4(1)