姬慶慶 朱登明 石 敏 王兆其 周 軍*
(*中國科學(xué)院大學(xué) 北京 100049)(**中國科學(xué)院計(jì)算技術(shù)研究所前瞻研究實(shí)驗(yàn)室 北京 100190)(***華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院 北京 102206)(****中國石油集團(tuán)測(cè)井有限公司 西安 710065)
測(cè)井技術(shù)在勘探過程中收集關(guān)于地質(zhì)儲(chǔ)集層的“四性”信息,即“巖性、物性、電性、含油性”,測(cè)井解釋則需要通過“四性”之間的關(guān)系建立測(cè)井解釋模型,確定油層有效厚度。測(cè)井解釋通過研究儲(chǔ)集層電性與巖性、物性、含油性的對(duì)應(yīng)關(guān)系,力求消除巖石礦物背景對(duì)于油層信息的影響,從而達(dá)到客觀評(píng)價(jià)砂巖儲(chǔ)集性能和流體性質(zhì),并準(zhǔn)確劃分儲(chǔ)層的目的[1]。
現(xiàn)階段國內(nèi)眾多單位多以常規(guī)曲線為基礎(chǔ),結(jié)合區(qū)塊地質(zhì)特點(diǎn),采用傳統(tǒng)方法利用人工對(duì)油氣層進(jìn)行識(shí)別、解釋和評(píng)價(jià),還沒有較為成熟的自動(dòng)分層解釋軟件[2]。由于人工解釋的方法需要大量人力,同時(shí)分層結(jié)果易受解釋人員主觀因素的影響,因此難以滿足不斷提高的測(cè)井解釋要求。
隨著油氣勘探規(guī)模的不斷擴(kuò)大,測(cè)井解釋將面對(duì)更多更復(fù)雜的研究對(duì)象,測(cè)井分層解釋方法的發(fā)展與測(cè)井技術(shù)的發(fā)展息息相關(guān)。利用計(jì)算機(jī)技術(shù)對(duì)測(cè)井曲線進(jìn)行自動(dòng)分層[3],可以在一定程度上避免專家依賴、減少人力消耗,是未來技術(shù)發(fā)展趨勢(shì)?,F(xiàn)階段用于巖性自動(dòng)識(shí)別的方法主要有概率統(tǒng)計(jì)法、聚類分析法、支持向量機(jī)法(support vector machine,SVM)[4-5]。概率統(tǒng)計(jì)法往往以概率統(tǒng)計(jì)為基礎(chǔ),通過先驗(yàn)和條件概率估計(jì)后驗(yàn)概率對(duì)測(cè)井進(jìn)行識(shí)別解釋。概率統(tǒng)計(jì)方法適用于物性特征條件較好的數(shù)字測(cè)井資料,針對(duì)巖心資料較少但測(cè)井資料較多的情況能夠取得一定的效果[6],但這一方法存在著先驗(yàn)概率獲得困難、人為影響因素大等缺點(diǎn)。
本文在充分了解測(cè)井曲線數(shù)據(jù)特點(diǎn)的基礎(chǔ)上,提出了一種基于有監(jiān)督學(xué)習(xí)的多粒度聚類算法的測(cè)井曲線自動(dòng)分層識(shí)別方法。利用該方法可以對(duì)測(cè)井曲線進(jìn)行“儲(chǔ)層”和“非儲(chǔ)層”自動(dòng)識(shí)別,還能夠在“儲(chǔ)層”內(nèi)對(duì)測(cè)井曲線進(jìn)行油水層自動(dòng)識(shí)別。本文方法優(yōu)勢(shì)如下。現(xiàn)有測(cè)井曲線分層識(shí)別方法往往需要先對(duì)數(shù)據(jù)進(jìn)行歸一化操作[7-9],而本文方法為了更好地發(fā)掘曲線特征,無需對(duì)曲線數(shù)據(jù)進(jìn)行歸一化操作,降低了程序運(yùn)算的時(shí)間復(fù)雜度;現(xiàn)有方法往往只利用曲線本身特征開展分層識(shí)別,本文方法在充分分析測(cè)井曲線和油藏之間關(guān)系的基礎(chǔ)上,引入關(guān)鍵屬性導(dǎo)數(shù)、屬性比值,通過這些內(nèi)部特征發(fā)掘,有效提升了分層識(shí)別準(zhǔn)確率;現(xiàn)有分層識(shí)別方法較少進(jìn)行多粒度分層識(shí)別,而本方法能夠先劃分“儲(chǔ)層”和“非儲(chǔ)層”,然后在“儲(chǔ)層”內(nèi)進(jìn)行細(xì)化識(shí)別。
聚類算法能夠快速準(zhǔn)確地解決各種分類問題,近年來受到了學(xué)者們的廣泛關(guān)注。江超等人[10]利用K-means聚類方法對(duì)激光雷達(dá)采集的障礙物信息進(jìn)行聚類,并結(jié)合其他方法實(shí)現(xiàn)機(jī)器人的實(shí)時(shí)避障功能。劉暢等人[11]將聚類算法應(yīng)用于監(jiān)控視頻運(yùn)動(dòng)目標(biāo)檢測(cè)與感興趣區(qū)域分割問題的研究。這些研究往往將聚類算法作為某一步驟進(jìn)行使用,缺少針對(duì)具體數(shù)據(jù)進(jìn)行深入分析并對(duì)聚類算法進(jìn)行改進(jìn)的探索。為解決測(cè)井曲線自動(dòng)識(shí)別問題,本文深入分析測(cè)井?dāng)?shù)據(jù)特點(diǎn),并結(jié)合問題本身對(duì)聚類算法進(jìn)行改進(jìn),從而能夠在測(cè)井曲線分層識(shí)別問題中獲得更好的表現(xiàn)。
豐富和準(zhǔn)確的測(cè)井曲線是進(jìn)行準(zhǔn)確自動(dòng)分層的基礎(chǔ),隨著近些年測(cè)井技術(shù)的不斷發(fā)展,隨鉆測(cè)井技術(shù)方法和儀器在不斷創(chuàng)新和完善。與此同時(shí),在測(cè)井過程中,還逐步引入密度、電成像等技術(shù),勘探開發(fā)和技術(shù)人員能夠收集到更加全面的隨鉆測(cè)井資料并形成測(cè)井曲線。隨鉆測(cè)井技術(shù)所形成的測(cè)井曲線既能夠?yàn)榭碧焦ぷ魈峁?dǎo)向,還能夠根據(jù)地質(zhì)屬性評(píng)價(jià)油氣資源情況,已經(jīng)成為石油勘探公司關(guān)注和研究的熱點(diǎn)技術(shù)[12-14]。上述測(cè)井技術(shù)的發(fā)展使得獲取的測(cè)井曲線數(shù)據(jù)更加真實(shí),更有利于開展自動(dòng)分層識(shí)別工作。
圖1展示的是青海某區(qū)塊的測(cè)井?dāng)?shù)據(jù)及解釋結(jié)論,圖中對(duì)測(cè)井技術(shù)在勘探過程中收集的關(guān)于地質(zhì)儲(chǔ)集層的“巖性、物性、電性、含油性”進(jìn)行了展示。其中,左側(cè)3道為測(cè)井過程中能夠體現(xiàn)“巖性、物性、電性”的原始測(cè)井曲線,右側(cè)第1道為“含油性”信息。在人工測(cè)井曲線標(biāo)定過程中,往往通過觀察測(cè)井曲線特點(diǎn)并結(jié)合標(biāo)定人員經(jīng)驗(yàn)對(duì)測(cè)井曲線進(jìn)行分層標(biāo)定,而自動(dòng)測(cè)井解釋正是需要利用計(jì)算機(jī)技術(shù)在它們之間建立聯(lián)系。
圖1 測(cè)井曲線數(shù)據(jù)示意圖
主成分分析算法是通過求解目標(biāo)協(xié)方差矩陣的前N個(gè)最大特征值對(duì)應(yīng)的特征向量來組成特征映射矩陣從而實(shí)現(xiàn)樣本的主成分空間映射[15-16]。伴隨著測(cè)井設(shè)備的發(fā)展,測(cè)井設(shè)備能夠采集到越來越豐富的測(cè)井?dāng)?shù)據(jù)。測(cè)井?dāng)?shù)據(jù)涉及到多個(gè)物理屬性,但并非所有的屬性都與地質(zhì)分層具有相關(guān)性,因此需要對(duì)復(fù)雜多樣的測(cè)井?dāng)?shù)據(jù)與地層分布的相關(guān)性進(jìn)行判斷。利用主成分分析法能夠?qū)y(cè)井?dāng)?shù)據(jù)與地質(zhì)分層的相關(guān)性做出很好的判斷,經(jīng)過主成分分析法的分析,再引入專家系統(tǒng)輔以修正,能夠選擇出具有重要影響的測(cè)井屬性。同時(shí)主成分分析也能夠起到對(duì)高維測(cè)井?dāng)?shù)據(jù)降維、有效減少運(yùn)算復(fù)雜度的作用。本文方法在數(shù)據(jù)關(guān)鍵信息缺失最少的原則下,探尋原始測(cè)井?dāng)?shù)據(jù)中對(duì)于測(cè)井分層結(jié)果具有重要影響的測(cè)井屬性,將這些重要指標(biāo)稱為主成分。
針對(duì)測(cè)井?dāng)?shù)據(jù)而言,某測(cè)井樣本包含m個(gè)測(cè)井屬性,即m個(gè)維度,每個(gè)測(cè)井屬性沿深度方向有n個(gè)采樣點(diǎn),這樣便構(gòu)成了m×n階矩陣,如此大的數(shù)據(jù)規(guī)模計(jì)算機(jī)處理起來存在一定的困難。因此需要在這些繁雜的數(shù)據(jù)信息中分析出能夠表征地質(zhì)含油特性的有用信息,也就是需要在m維數(shù)據(jù)中尋找關(guān)鍵屬性數(shù)據(jù)。為了有效解決這一問題,需要對(duì)測(cè)井?dāng)?shù)據(jù)進(jìn)行降維操作,把原來較多測(cè)井曲線反映出的信息進(jìn)行簡(jiǎn)化,然后使用少數(shù)幾個(gè)相互獨(dú)立互不相關(guān)的綜合指標(biāo)代替,同時(shí)還需要有限的幾個(gè)指標(biāo)能夠盡量充分反映原來多指標(biāo)信息。
設(shè)Σ為根據(jù)測(cè)井屬性建立的特征矩陣,通過運(yùn)算Σ可得的特征值為λ1≥λ2≥…≥λm≥0,e1=(ei1,ei2,…,eim)T為對(duì)應(yīng)特征值λi的正交單位特征向量,則第i個(gè)主成分的貢獻(xiàn)率為
(1)
累計(jì)貢獻(xiàn)率為
(2)
測(cè)井區(qū)塊所涉及的測(cè)井?dāng)?shù)據(jù)包含60個(gè)不同的測(cè)井屬性維度,本文按照累計(jì)貢獻(xiàn)率>85%、特征值大于1的原則選取主成分,選擇前7個(gè)主成分進(jìn)行分析。在主成分分析法中,主成分載荷矩陣指的是各項(xiàng)原始指標(biāo)與主成分之間的關(guān)系,某一原始指標(biāo)與主成分聯(lián)系越緊密,則經(jīng)過荷載矩陣計(jì)算出的聯(lián)系系數(shù)的絕對(duì)值越大。因此主成分荷載矩陣可以反映出測(cè)井曲線分層的主要影響因素。
本文首先對(duì)原始測(cè)井曲線進(jìn)行主成分分析,然后再通過主成分荷載矩陣分析各原始測(cè)井曲線與主成分之間的聯(lián)系,進(jìn)而選取用于測(cè)井曲線自動(dòng)分層的測(cè)井曲線。經(jīng)過上述選擇,最終確定用于測(cè)井曲線自動(dòng)分層的測(cè)井曲線為聲波(AC)、自然電位(SP)、中子(CNL)、密度(DEN)、自然伽馬(GR)、深側(cè)向電阻率(LLD)和淺側(cè)向電阻率(LLS)等7條測(cè)井曲線。
受測(cè)井設(shè)備及地質(zhì)構(gòu)造的限制,測(cè)井初始段和結(jié)束段往往會(huì)出現(xiàn)數(shù)值異常的測(cè)量值,例如99 999、-99 999、0等。這些異常值會(huì)對(duì)測(cè)井曲線自動(dòng)分層識(shí)別帶來負(fù)向影響,因此在分層之前就需要對(duì)這些異常數(shù)據(jù)做剔除處理。
在測(cè)井過程中,由于使用多種測(cè)井設(shè)備,因此存在如下3種采樣深度間隔:0.075 m、0.1 m和0.125 m。在同一深度下能夠更好地對(duì)每個(gè)采樣點(diǎn)的多種屬性特征進(jìn)行提取,本文利用克里金插值算法,對(duì)不同采樣間隔的曲線統(tǒng)一采樣間隔達(dá)到深度校正的目的,從而保障在相同深度下,不同測(cè)井屬性都存在相應(yīng)的屬性值,方便對(duì)層位特征信息提取分析。經(jīng)過深度校正與統(tǒng)一,本文采樣點(diǎn)深度間隔為0.1 m。
對(duì)于儲(chǔ)層劃分及測(cè)井解釋這一問題而言,根據(jù)人工解釋的經(jīng)驗(yàn),往往在重要曲線出現(xiàn)大幅波動(dòng)的深度段,會(huì)有層位點(diǎn)出現(xiàn)。根據(jù)前述證據(jù)權(quán)重法分析可知,自然電位曲線在儲(chǔ)層及非儲(chǔ)層劃分中能夠起到重要的作用,因此本文引入自然電位曲線的一階導(dǎo)數(shù)、二階導(dǎo)數(shù)參與測(cè)井曲線“儲(chǔ)層”與“非儲(chǔ)層”劃分。
構(gòu)建由自然電位曲線一階導(dǎo)數(shù)、二階導(dǎo)數(shù)構(gòu)成的向量:
(3)
由于曲線異常數(shù)據(jù)點(diǎn)已經(jīng)在前期處理過程中剔除,因此有效避免了曲線不可導(dǎo)的情況。
在一些地質(zhì)條件下,對(duì)于水層受泥漿侵入影響不同的情況,測(cè)井曲線深側(cè)向電阻率(HLLD)比淺側(cè)向電阻率(HLLS)的值升高更多,即二者比值(HLLD/ HLLS)應(yīng)大于油層的二者比值。故可以根據(jù)淡水泥漿侵入對(duì)深側(cè)向電阻率和淺側(cè)向電阻率影響的不同,利用二者比值深入發(fā)掘測(cè)井曲線特征從而提升儲(chǔ)層劃分及油水層解釋準(zhǔn)確率[17]。
針對(duì)測(cè)井曲線自動(dòng)分層識(shí)別問題,本文采用圖2所示技術(shù)路線開展研究。
在測(cè)井曲線自動(dòng)分層識(shí)別前,先對(duì)測(cè)井?dāng)?shù)據(jù)進(jìn)行數(shù)據(jù)處理,這一步驟包括剔除無效數(shù)據(jù)、測(cè)井?dāng)?shù)據(jù)深度對(duì)齊、重點(diǎn)屬性一階求導(dǎo)、二階求導(dǎo)等步驟。由于數(shù)據(jù)采集過程存在多種因素干擾,從而使得某些數(shù)據(jù)出現(xiàn)異常波動(dòng),因此還需對(duì)數(shù)據(jù)作濾波操作,去除測(cè)井?dāng)?shù)據(jù)中的異常值。
圖2 測(cè)井曲線自動(dòng)分層識(shí)別技術(shù)路線
K-均值聚類算法是聚類分析中常用的方法,其核心思想是在n個(gè)樣本的數(shù)據(jù)庫中,給定分類數(shù)K,然后選取K個(gè)初始聚類中心,計(jì)算樣本點(diǎn)到各個(gè)聚類中心的歐氏距離,并將樣本點(diǎn)劃分到距離它最近的聚類中心所屬的一類中去。當(dāng)各個(gè)樣本點(diǎn)所屬類別都劃分完畢后,利用計(jì)算平均值的方式得到每一類樣本點(diǎn)新的聚類中心,通過不斷迭代,直至兩次迭代得到的聚類中心相同,此時(shí)獲得最終的聚類中心并完成分類。
對(duì)于測(cè)井曲線自動(dòng)分層問題,將測(cè)井曲線根據(jù)不同曲線特征劃分為不同儲(chǔ)層,其本質(zhì)上是一種聚類問題。本文結(jié)合測(cè)井?dāng)?shù)據(jù)具體特點(diǎn),采用K-均值聚類算法對(duì)測(cè)井?dāng)?shù)據(jù)進(jìn)行分類。在測(cè)井曲線自動(dòng)分層問題中,其基本思路是給定儲(chǔ)層分類和各個(gè)測(cè)井屬性代表值(即聚類中心),計(jì)算測(cè)井?dāng)?shù)據(jù)到聚類中心的歐式距離,然后將其歸類于距離最小的聚類中心對(duì)應(yīng)的儲(chǔ)層類別。
傳統(tǒng)的無監(jiān)督聚類算法只需要給出樣本數(shù)據(jù)即可通過不斷尋找聚類中心完成聚類,但對(duì)于測(cè)井?dāng)?shù)據(jù)而言,由于各測(cè)井屬性之間相似性極高,利用無監(jiān)督的聚類算法很難準(zhǔn)確找到合適的聚類中心,同時(shí)也會(huì)帶來運(yùn)算時(shí)間代價(jià)的提升[18-20]。針對(duì)上述問題,本文將有監(jiān)督的機(jī)器學(xué)習(xí)思想與K-聚類分析法相結(jié)合,構(gòu)建K-最近鄰(K-nearest neighbor, KNN)網(wǎng)絡(luò)。因?yàn)楸疚乃婕暗臏y(cè)井?dāng)?shù)據(jù)中存在人為標(biāo)定好的準(zhǔn)確分層信息,這些人為標(biāo)定好的分層信息可以作為聚類學(xué)習(xí)過程中訓(xùn)練數(shù)據(jù)的數(shù)據(jù)標(biāo)簽。在有標(biāo)簽標(biāo)定的訓(xùn)練數(shù)據(jù)引導(dǎo)網(wǎng)絡(luò)尋找最佳聚類中心的基礎(chǔ)上,能夠更好地引導(dǎo)K-均值聚類問題分別尋找到不同標(biāo)簽類別對(duì)應(yīng)的聚類中心,從而完成對(duì)各不同標(biāo)簽類別的識(shí)別任務(wù),該方法流程圖如圖3所示。
圖3 KNN方法流程圖
在本方法中,首先輸入經(jīng)過預(yù)處理的帶有人工標(biāo)定標(biāo)簽的K類測(cè)井?dāng)?shù)據(jù),然后利用聚類算法計(jì)算各個(gè)數(shù)據(jù)樣本點(diǎn)到各個(gè)標(biāo)簽類別對(duì)應(yīng)的聚類中心的距離。通過不斷迭代找出各個(gè)標(biāo)簽類別對(duì)應(yīng)的最佳聚類中心,從而完成有監(jiān)督的聚類算法的訓(xùn)練過程。接下來對(duì)待分類樣本點(diǎn)進(jìn)行分類標(biāo)定,首先輸入待分類樣本點(diǎn)對(duì)應(yīng)的測(cè)井?dāng)?shù)據(jù),然后利用聚類算法計(jì)算各待分類樣本點(diǎn)到各個(gè)類別聚類中心的距離,最終將待分類樣本點(diǎn)劃歸至歐氏距離最小的聚類中心對(duì)應(yīng)的類別。待所有待分類樣本點(diǎn)全部識(shí)別標(biāo)定結(jié)束后,輸出聚類結(jié)果。
本文在進(jìn)行測(cè)井曲線分層識(shí)別過程中,采用2.1節(jié)提出的KNN算法,并將多粒度識(shí)別的思想與之結(jié)合。
首先構(gòu)造向量:
(4)
中值濾波是一種非線性的濾波技術(shù),相比于線性濾波器,它在一定程度上能夠去除數(shù)據(jù)的局部異常[21-22]。對(duì)數(shù)字信號(hào)序列Xj(-∞ 對(duì)于本文測(cè)井曲線“儲(chǔ)層”及“非儲(chǔ)層”識(shí)別而言,其識(shí)別結(jié)果為“0”、“1”兩種數(shù)值結(jié)果,其中“0”代表“非儲(chǔ)層”,“1”代表“儲(chǔ)層”。結(jié)合中值濾波具有在濾除數(shù)據(jù)噪聲的同時(shí)能夠較好地保護(hù)連續(xù)數(shù)據(jù)數(shù)值的特點(diǎn),本文選用中值濾波對(duì)測(cè)井曲線“儲(chǔ)層”及“非儲(chǔ)層”識(shí)別結(jié)果進(jìn)行濾波處理,從而達(dá)到對(duì)個(gè)別預(yù)測(cè)誤差點(diǎn)進(jìn)行修正的目的。 由于“油水層”在地質(zhì)構(gòu)造、地層物性等方面有著眾多相似點(diǎn),因此需要引入更多測(cè)井曲線挖掘其特征從而對(duì)“油水層”進(jìn)行識(shí)別。 為了實(shí)現(xiàn)“油水層”識(shí)別,構(gòu)造向量: (5) 這種做法能夠排除具有大量數(shù)據(jù)點(diǎn)位的“非儲(chǔ)層”數(shù)據(jù)的干擾,同時(shí)最大限度地放大“儲(chǔ)層”內(nèi)油水層之間的數(shù)據(jù)特征,能夠使多粒度聚類算法取得更好的“油水層”識(shí)別結(jié)果。多粒度聚類算法完成“油水層”識(shí)別后,再次使用濾波算法對(duì)少量誤差點(diǎn)進(jìn)行濾波操作,糾正識(shí)別過程中部分零星點(diǎn)位的誤差,然后輸出最終的“油水層”識(shí)別結(jié)果。 本文選用青海地區(qū)某區(qū)塊內(nèi)10口垂直井測(cè)井?dāng)?shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),井位分布如圖4所示,其中9口井的“儲(chǔ)層”、“非儲(chǔ)層”及“油水層”劃分?jǐn)?shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)另外一口井即Y189井的“儲(chǔ)層”和“非儲(chǔ)層”兩類層位分布進(jìn)行識(shí)別,然后在“儲(chǔ)層”數(shù)據(jù)段內(nèi)對(duì)“油水層”進(jìn)行識(shí)別。 圖4 實(shí)驗(yàn)用井井位圖 實(shí)驗(yàn)前,選取Y220、Y219、Y205、Y194、Y192、Y181、Y148、Y146、Y45等9口測(cè)井的聲波、自然電位、自然伽馬3條原始測(cè)井曲線及自然電位曲線的一階導(dǎo)數(shù)、二階導(dǎo)數(shù)進(jìn)行實(shí)驗(yàn),不同井的曲線深度范圍不完全相同,但大都集中在500~1 300 m范圍內(nèi),采樣間隔為0.1 m。預(yù)測(cè)井Y189井的預(yù)測(cè)范圍為500~1 100 m,總長600 m,共需預(yù)測(cè)6 000個(gè)采樣點(diǎn)。 KNN聚類分析法針對(duì)Y189井“儲(chǔ)層”和“非儲(chǔ)層”識(shí)別結(jié)果圖如圖5所示,本文以670.3~744.8 m、1 041.5~1 095.2 m深度段的預(yù)測(cè)結(jié)果為例進(jìn)行說明。圖5中,左側(cè)3道為本文方法所使用的測(cè)井曲線隨深度變化在不同地層產(chǎn)生不同的響應(yīng)值;右側(cè)第1道為濾波前的“儲(chǔ)層”、“非儲(chǔ)層”預(yù)測(cè)結(jié)果,右側(cè)第2道為濾波后的“儲(chǔ)層”、“非儲(chǔ)層”預(yù)測(cè)結(jié)果,圖中有顏色填充的深度段屬于“儲(chǔ)層”,未進(jìn)行填充的深度段屬于“非儲(chǔ)層”。右側(cè)第3道為人工標(biāo)注的識(shí)別結(jié)果,有符號(hào)標(biāo)注的深度段為“儲(chǔ)層”,未進(jìn)行標(biāo)注的深度段為“非儲(chǔ)層”。 如表1所示,表格中展示了人工標(biāo)定的分層結(jié)果、本文方法自動(dòng)識(shí)別的分層結(jié)果及二者之間的誤差值,由該表數(shù)據(jù)可以看出,在大部分層位本文方法能夠很好地識(shí)別“儲(chǔ)層”與“非儲(chǔ)層”。 在剔除“非儲(chǔ)層”數(shù)據(jù)段后,本方法繼續(xù)進(jìn)行油水層劃分。該實(shí)驗(yàn)區(qū)域儲(chǔ)層內(nèi)共有干層、差油層、水層、含油水層、油層、油水同層等6類層位。實(shí)驗(yàn)過程中,將Y220、Y219、Y205、Y194、Y192、Y181、Y148、Y146、Y45等9口測(cè)井的聲波、自然電位、中子、密度、自然伽馬、深側(cè)向電阻率和淺側(cè)向電阻率等7條原始測(cè)井曲線及深側(cè)向電阻率/淺側(cè)向電阻率作為訓(xùn)練數(shù)據(jù)輸入。表2是多粒度油水層識(shí)別結(jié)果。 Y189井包含干層、水層、油水同層和油層等4類層位。對(duì)于Y189井的油水層識(shí)別,從表2中可以看出,盡管本文多粒度聚類識(shí)別方法針對(duì)“油層”、“干層”這兩類層位識(shí)別時(shí)存在一定程度的誤差,但在29個(gè)層位當(dāng)中,本文設(shè)計(jì)的多粒度聚類識(shí)別方法能夠準(zhǔn)確識(shí)別24個(gè)層位,識(shí)別準(zhǔn)確率已經(jīng)達(dá)到82.8%。說明利用多粒度聚類識(shí)別方法將“非儲(chǔ)層”數(shù)據(jù)去除,然后在“儲(chǔ)層”內(nèi)繼續(xù)進(jìn)行識(shí)別的方法能夠獲得更加準(zhǔn)確的識(shí)別效果。 圖5 測(cè)井曲線“儲(chǔ)層”、“非儲(chǔ)層”識(shí)別結(jié)果 表1 Y189井“儲(chǔ)層”自動(dòng)識(shí)別結(jié)果 在分類問題領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)算法常被用于解決圖像分類問題,支持向量機(jī)(SVM)算法往往被用于解決文本分類問題。為體現(xiàn)本文所選方法在解決測(cè)井曲線自動(dòng)分層問題上的優(yōu)勢(shì),將本文方法與常見的SVM算法、經(jīng)典CNN算法在同一真實(shí)測(cè)井曲線數(shù)據(jù)集中開展對(duì)比實(shí)驗(yàn)。其中SVM算法與傳統(tǒng)CNN算法采用青海某區(qū)塊100口井?dāng)?shù)據(jù)進(jìn)行訓(xùn)練,然后對(duì)Y189井進(jìn)行儲(chǔ)層劃分及油水層識(shí)別,實(shí)驗(yàn)結(jié)果如表3所示。此處僅選取670.3~712.2 m、1 041.5~1 094.6 m深度段進(jìn)行展示。 表2 Y189井多粒度油水層識(shí)別結(jié)果 通過對(duì)比可以發(fā)現(xiàn),本文方法相較于SVM算法在“儲(chǔ)層”邊界劃分上精確度更高;二者在水層的識(shí)別上表現(xiàn)相當(dāng),但在其他層位的識(shí)別中,本文方法取得了更加準(zhǔn)確的識(shí)別結(jié)果。同時(shí)本文方法相較于經(jīng)典CNN算法在上界劃分中表現(xiàn)相近,但在下界劃分中取得了較好的結(jié)果;在油水層識(shí)別中,經(jīng)典CNN算法對(duì)于油層及干層的識(shí)別不夠敏感,誤差較大,識(shí)別效果劣于本文方法。上述對(duì)比實(shí)驗(yàn)說明本文方法在實(shí)驗(yàn)測(cè)井?dāng)?shù)據(jù)上能夠比SVM算法及經(jīng)典CNN算法取得更好的實(shí)驗(yàn)結(jié)果。 表3 Y189井不同算法對(duì)比實(shí)驗(yàn)結(jié)果 為了更好地衡量本文方法在測(cè)井曲線“油水層”劃分問題中的時(shí)間消耗,將本文方法與CNN算法及SVM算法進(jìn)行比較。其中本文方法選取9口井為訓(xùn)練集,CNN算法及SVM算法選取100口井作為訓(xùn)練集,在訓(xùn)練結(jié)束后均選擇同一口井在3種方法中對(duì)訓(xùn)練結(jié)果進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果如表4所示。 表4 不同算法時(shí)間消耗對(duì)比實(shí)驗(yàn)結(jié)果 通過上述實(shí)驗(yàn)可以發(fā)現(xiàn),SVM算法所需訓(xùn)練及測(cè)試時(shí)間最長,其次是CNN算法,所需時(shí)間最少的為本文方法。盡管本文在訓(xùn)練階段采用9口測(cè)井?dāng)?shù)據(jù)進(jìn)行訓(xùn)練,但在測(cè)井曲線劃分精度優(yōu)于其他兩種算法的同時(shí),時(shí)間消耗上也優(yōu)于其他兩種算法,說明本文方法具有較強(qiáng)的先進(jìn)性和實(shí)用性。 本文提出了一種基于聚類算法的測(cè)井曲線自動(dòng)分層識(shí)別方法。在對(duì)測(cè)井?dāng)?shù)據(jù)進(jìn)行剔除異常值、統(tǒng)一采樣間隔、求取重要屬性一階導(dǎo)數(shù)和二階導(dǎo)數(shù)等預(yù)處理的基礎(chǔ)上,通過多粒度聚類的方法將測(cè)井曲線先自動(dòng)劃分為“儲(chǔ)層”、“非儲(chǔ)層”,然后在“儲(chǔ)層”內(nèi)對(duì)測(cè)井曲線開展進(jìn)一步的識(shí)別。該方法相對(duì)于傳統(tǒng)方法具有以下優(yōu)勢(shì)。第一,本方法無需對(duì)測(cè)井曲線進(jìn)行歸一化操作,能夠降低算法運(yùn)行時(shí)間復(fù)雜度;第二,本方法引入重要屬性導(dǎo)數(shù)、基于測(cè)井屬性的比值數(shù)據(jù)等,能夠更加充分地挖掘測(cè)井曲線特征,取得更好的分層識(shí)別結(jié)果;第三,該方法在有監(jiān)督的聚類算法基礎(chǔ)上能夠?qū)y(cè)井曲線實(shí)現(xiàn)多粒度識(shí)別,在提高測(cè)井曲線油水層識(shí)別準(zhǔn)確率的基礎(chǔ)上,還能夠滿足實(shí)際生產(chǎn)中的不同需求。 本文所提出的方法已在真實(shí)測(cè)井?dāng)?shù)據(jù)上開展實(shí)驗(yàn)并取得了較好的自動(dòng)分層識(shí)別結(jié)果,但目前對(duì)于油水混合類層位的識(shí)別準(zhǔn)確度還不夠高。未來將針對(duì)這些問題進(jìn)行改善,從而使本文方法能夠更加精準(zhǔn)地識(shí)別油水混合類層位,同時(shí)在石油測(cè)井解釋領(lǐng)域取得更加廣闊的應(yīng)用。2.3 儲(chǔ)層內(nèi)油水層識(shí)別
3 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析
3.1 “儲(chǔ)層”與“非儲(chǔ)層”識(shí)別
3.2 多粒度油水層識(shí)別
3.3 對(duì)比實(shí)驗(yàn)
4 結(jié) 論