姜龍燕 楊 斌 王 巍 劉 璐
(1.中國(guó)石化華北油氣分公司,河南 鄭州 450000;2.成都理工大學(xué)能源學(xué)院,四川 成都 610059)
奧陶系馬家溝組是鄂爾多斯盆地重要的油氣勘探層位。富縣地區(qū)馬家溝組的主要巖性為石灰?guī)r、白云巖以及二者的混合,另外在部分層位含有硬石膏與泥巖、坍塌角礫巖。勘探實(shí)踐證明,白云巖儲(chǔ)層往往對(duì)應(yīng)于更為優(yōu)質(zhì)的儲(chǔ)層品質(zhì),儲(chǔ)層巖性識(shí)別準(zhǔn)確與否直接關(guān)乎后續(xù)儲(chǔ)層評(píng)價(jià)的精度與可信度以及壓裂施工的設(shè)計(jì)。目前測(cè)井解釋多使用交會(huì)圖法,并借助專業(yè)的測(cè)井解釋軟件如Forward 進(jìn)行剖面處理[1],此外還有神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)分析方法[2-3]、成像測(cè)井與地層元素測(cè)井等特殊測(cè)井方法,但是多數(shù)地質(zhì)研究人員并不擅長(zhǎng)操作專業(yè)測(cè)井軟件,特殊測(cè)井成本高昂,數(shù)據(jù)分析方法對(duì)樣本依賴性高。鑒于此,以期提供給地質(zhì)研究人員更加簡(jiǎn)便易行的巖性識(shí)別方法,使其能夠在只有測(cè)井曲線沒有測(cè)井解釋的巖性剖面情況下,依然能夠快速判斷碳酸鹽巖的大概成分,在沒有測(cè)井解釋軟件的情況下依然能精確識(shí)別巖性。
筆者針對(duì)富縣地區(qū)下古生界馬家溝組地層開展巖性識(shí)別,為了方便地質(zhì)人員快速識(shí)別巖性,本次研究利用各種礦物骨架值的不同創(chuàng)建包絡(luò)法(表1)。在巖性識(shí)別方面,所有的研究基本上都是基于不同的測(cè)井系列對(duì)不同的礦物敏感性不同[4-8]而開展,包絡(luò)法亦如此。研究中選取對(duì)巖性敏感的光電吸收截面指數(shù)(PE)曲線、補(bǔ)償密度(DEN)曲線與補(bǔ)償中子(CNL)曲線進(jìn)行兩兩交會(huì),結(jié)合自然伽馬(GR)曲線,即可快速判斷出基本巖性。
表1 碳酸鹽巖中主要礦物的測(cè)井響應(yīng)數(shù)值表
PE-DEN包絡(luò)法是將PE曲線與DEN曲線置于同一曲線道中,調(diào)整二者的左右刻度值,使二者在石灰?guī)r段重合(圖1)。彼時(shí),在白云巖段,此二曲線亦會(huì)重合,但其與石灰?guī)r段重合的位置并不相同:石灰?guī)r段曲線重合在密度值為2.7 g/cm3處,當(dāng)巖石方解石與白云石成分同時(shí)存在混雜時(shí),曲線的重合位置會(huì)有所變化,白云石含量越高,重合的位置越偏向曲線道的右側(cè),即密度值更高一側(cè),當(dāng)巖性為白云巖時(shí),重合在密度值為2.8 g/cm3處。當(dāng)含有硬石膏時(shí),巖石密度值與PE值都會(huì)增大,進(jìn)而形成一個(gè)包絡(luò)面積,面積越大,代表硬石膏含量越高。需要注意的是,由于巖石中含有不同程度的泥巖,所以曲線的重合刻度在不同地區(qū)會(huì)稍有差別。
圖1 包絡(luò)法識(shí)別富縣地區(qū)碳酸鹽巖巖性示意圖
DEN-CNL包絡(luò)法源于補(bǔ)償密度、補(bǔ)償中子交會(huì)圖版,操作方法同PE-DEN包絡(luò)法,即將二者置于同一數(shù)據(jù)道內(nèi),調(diào)整DEN刻度左右值分別為2 g/cm3與3 g/cm3,CNL曲線左右刻度值分別為45%與-15%,此時(shí),二者在石灰?guī)r段基本重合,在其他巖性段與擴(kuò)徑段,二者處于分開狀態(tài)形成包絡(luò)面積。包絡(luò)法粗略便捷,但是對(duì)經(jīng)驗(yàn)要求較高,更適合于研究人員在現(xiàn)場(chǎng)快速判別巖性種類。
為了更精確地對(duì)巖性進(jìn)行劃分,筆者利用MRGC[9-10]-KNN 巖性識(shí)別模型進(jìn)行巖性識(shí)別的研究。研究中以取心段詳細(xì)描述為基準(zhǔn),參考巖屑錄井巖性,在前述包絡(luò)法巖性識(shí)別研究的基礎(chǔ)上對(duì)研究區(qū)巖性進(jìn)行細(xì)化歸類,具體研究思路如圖2所示。
圖2 巖性識(shí)別技術(shù)流程圖
根據(jù)前述研究,選擇出能較好地反映研究區(qū)馬家溝組巖性變化的GR、補(bǔ)償聲波(AC)、CNL、DEN、深側(cè)向電阻率(LLD)和PE六條測(cè)井曲線進(jìn)行聚類分析,并采用歐式距離[11]進(jìn)行歸一化處理,將輸入數(shù)據(jù)均壓縮至0~1。
在調(diào)節(jié)MRGC 聚類范圍在200~300 類后,開始建立聚類模型,最終通過模型聚類出286類具有一定相關(guān)性的巖性。之后將無監(jiān)督學(xué)習(xí)的結(jié)果導(dǎo)入到單井圖中,使其為錄井剖面、巖心、工區(qū)典型測(cè)井響應(yīng)特征等提供參考,并加以人工干預(yù),為小類定名,之后再將相同巖性的小類合并。期間會(huì)有一些因?yàn)閿?shù)據(jù)繁雜而導(dǎo)致的誤差,此時(shí)可采用三維交會(huì)圖進(jìn)行修正,最終將富縣地區(qū)馬家溝組馬五段286個(gè)聚類合并為8類巖性(圖3)。
圖3 馬五段聚類結(jié)果定名合并矩陣圖
最小臨近算法(KNN)是通過測(cè)量不同特征值之間的距離進(jìn)行分類。其思路是如果一個(gè)樣本在特征空間中的K個(gè)最相似,即特征空間中最鄰近樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別[12-18]。在KNN 中,通過計(jì)算對(duì)象間距離來作為各個(gè)對(duì)象之間的距離、相識(shí)度或非相似性指標(biāo),避免了對(duì)象之間的匹配問題。
以Python3.6 為開發(fā)環(huán)境,將經(jīng)過處理之后、各巖性占比較為均勻的馬五段超過2 000個(gè)樣本點(diǎn)按照9∶1 的比例劃分為訓(xùn)練樣本子集、檢驗(yàn)樣本子集兩部分。在確立了輸入曲線的歸一化參數(shù)和歸一化處理后,在訓(xùn)練樣本子集中首先通過交叉驗(yàn)證優(yōu)化Kneighbors 數(shù)和距離準(zhǔn)則這兩項(xiàng)重要的參數(shù),然后開始建立模型。
為了排除數(shù)據(jù)量級(jí)對(duì)建模產(chǎn)生的影響,需要對(duì)建模數(shù)據(jù)進(jìn)行歸一化操作,并且今后參與預(yù)測(cè)的數(shù)據(jù)都需要按照相同的歸一化參數(shù)進(jìn)行歸一化。對(duì)于具有近似線性特征的測(cè)井曲線,如GR等測(cè)井曲線采用線性歸一。對(duì)于具有非線性對(duì)數(shù)特征的測(cè)井曲線,如LLD則采用對(duì)數(shù)歸一化公式[19]。通過對(duì)數(shù)據(jù)樣本的分析,排除異常點(diǎn),得到研究區(qū)馬五段測(cè)井曲線極值Xmin、Xmax(表2)。值得一提的是,在此提出歸一化參數(shù)是因?yàn)橹挥袩o論是模型建模過程還是模型的使用過程,在數(shù)據(jù)歸一化過程中必須采用此參數(shù)。
表2 馬五段巖性識(shí)別模型的輸入測(cè)井曲線歸一化數(shù)據(jù)表
KNN 建模中有K-neighbors 數(shù)和距離準(zhǔn)則兩個(gè)參數(shù)需要確定,通過對(duì)訓(xùn)練數(shù)據(jù)的交叉驗(yàn)證調(diào)試獲得。將訓(xùn)練樣本隨機(jī)劃分為10 份,選取其中一份作為檢驗(yàn)樣本,其余作為訓(xùn)練樣本,計(jì)算出預(yù)測(cè)符合率(score),并重復(fù)10 次,直到每一份都可以作為檢驗(yàn)樣本,求得所有10 次預(yù)測(cè)符合率的平均值,最終確定使用曼哈頓距離,K值取7(圖4)。
圖4 馬五段KNN交叉驗(yàn)證符合率隨K取值變化曲線圖
模型建立完成后,將預(yù)留的未參與KNN 建模過程的1/10 檢驗(yàn)樣本集輸入KNN 模型中,得到預(yù)測(cè)類輸出,將預(yù)測(cè)類輸出與檢驗(yàn)樣本的期望巖性類標(biāo)簽進(jìn)行符合與否的對(duì)比,在2 224個(gè)檢驗(yàn)樣本中,預(yù)測(cè)錯(cuò)誤171個(gè),預(yù)測(cè)符合率高達(dá)92.31%。利用上述建立好的KNN 模型對(duì)富縣地區(qū)多口井進(jìn)行巖性識(shí)別,富X 井巖性識(shí)別結(jié)果如圖5 所示,從圖5 中可見,KNN 巖性識(shí)別結(jié)果比錄井巖性、SOM 巖性等識(shí)別結(jié)果要更加精細(xì)、合理,更加符合地質(zhì)特征。
圖5 運(yùn)用KNN模型對(duì)富X井巖性識(shí)別結(jié)果圖
1)包絡(luò)法簡(jiǎn)單直觀、可操作性強(qiáng),能夠快速進(jìn)行巖性類別的判斷。其關(guān)鍵在于兩相包絡(luò)曲線左右刻度值的調(diào)整,對(duì)于操作者的經(jīng)驗(yàn)要求較高。
2)MRGC-KNN法結(jié)果更精確,但是由于取心數(shù)量所限,在實(shí)際操作過程中難免有誤判的情況發(fā)生,此時(shí)可以參考包絡(luò)結(jié)果、錄井結(jié)論進(jìn)行調(diào)整。
3)因坍塌角礫巖的測(cè)井響應(yīng)基本與云質(zhì)泥巖、泥質(zhì)云巖無異,所以目前無論是包絡(luò)法還是MRGC-KNN 法都還無法有效地識(shí)別坍塌角礫巖。對(duì)于此種巖性的確定主要是運(yùn)用電成像資料,同時(shí)參考大的地質(zhì)背景,即先確定大范圍的巖溶坍塌主要發(fā)生在哪一個(gè)小層,進(jìn)而確定大致的角礫巖發(fā)育段。