徐守余,路 研,王 亞
1.中國石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580 2.海洋國家實驗室海洋礦產(chǎn)資源評價與探測技術(shù)功能實驗室,山東 青島 266071
濁積扇低滲透油藏與常規(guī)油藏的地質(zhì)特征存在明顯差異。該儲層孔隙結(jié)構(gòu)復(fù)雜、細(xì)小,再加上后期成巖作用的改造,導(dǎo)致儲層物性較差,平面、縱向非均質(zhì)性較為強(qiáng)烈[1-3]。這些因素綜合作用導(dǎo)致低滲透油藏差異性較為明顯,區(qū)塊部分井出現(xiàn)注水開發(fā)效果差、含水上升快等問題,影響了研究區(qū)的油氣勘探與開發(fā)。查明低滲透儲層層間水驅(qū)效果的差異性、流體滲流特征及分布規(guī)律,對油藏開發(fā)中后期剩余油分布預(yù)測意義重大[4-6]。
流動單元的概念最早是由Hearn(1984)提出的,是指垂向及橫向上連續(xù)的、影響流體流動的、巖石物理性質(zhì)相似的儲集巖體,且隨著開發(fā)階段的深入,呈動態(tài)性變化[7-10]。低滲透儲層強(qiáng)烈的非均質(zhì)性、復(fù)雜的滲流特征對流動單元劃分的精度提出了更高的要求。近年來,支持向量機(jī)算法越來越多地被運(yùn)用到復(fù)雜巖性識別、測井曲線分層及儲層預(yù)測等方面[11-13]。然而,在流動單元領(lǐng)域還無人涉及。因此,利用支持向量機(jī)算法開展流動單元研究,為流動單元分類評價提供了新的研究方向。
本文以大蘆湖油田樊29塊湖底濁積扇儲層為例,結(jié)合低滲透儲層的特征,在因子分析法優(yōu)選參數(shù)的基礎(chǔ)上,應(yīng)用支持向量機(jī)算法開展流動單元研究,建立研究區(qū)流動單元分布模式,以期為油藏開發(fā)中后期剩余油分布預(yù)測、提高采收率提供理論支撐。
大蘆湖油田位于濟(jì)陽坳陷東營凹陷博興洼陷,是一被斷層切割的簡單穹窿背斜構(gòu)造。研究區(qū)樊29塊位于大蘆湖油田中部鼻狀構(gòu)造的高部位,其主力含油層系為沙三中亞段四砂層組,含油面積為2.9 km2,地質(zhì)儲量為583×104t。四砂層組主要發(fā)育5個小層,其中41小層在研究區(qū)不發(fā)育,只發(fā)育42、43、44、45四個小層;每個小層又可細(xì)分為4個單砂層,故全區(qū)可以細(xì)分為16個單砂層。該油藏儲集層為湖底濁積扇沉積,主要發(fā)育中扇、外扇亞相,內(nèi)扇亞相不發(fā)育;巖性類型主要包括含礫砂巖、細(xì)砂巖、粉砂巖、泥質(zhì)粉砂巖及泥巖。油藏埋深2 800~3 100 m,平均孔隙度15.9%,平均滲透率11.6×10-3μm2,為中深層低滲透油藏。油藏非均質(zhì)性強(qiáng)、層間矛盾突出,經(jīng)過幾十年的開發(fā),目前已進(jìn)入高含水期,含水率達(dá)81.3%,采出程度為19.78%,處于低速開發(fā)階段。
研究區(qū)為典型的湖底濁積扇沉積體系,形成于沙三段沉積中期。該時期物源供應(yīng)充足,高青扇三角洲沉積體系范圍擴(kuò)大,一度向博興斷層下降盤推進(jìn),東北部受地形的影響,在樊家古鼻狀構(gòu)造部位推進(jìn)不前,沉積體快速堆積,滑塌濁積扇沉積體系因而形成[14]。大蘆湖油田樊29塊濁積扇沉積體系主要發(fā)育濁積水道、水道間及朵葉體等微相類型,受沉積環(huán)境、成巖作用、構(gòu)造作用等多重因素的影響,儲層成因機(jī)制復(fù)雜。沉積體系內(nèi)各水道砂體橫向、縱向遷移變化快,展布規(guī)律及連通程度復(fù)雜。此外,成巖作用的改造導(dǎo)致儲層非均質(zhì)強(qiáng)烈,儲層物性、滲流能力較差。
由于濁積扇儲層特征及成因機(jī)制的復(fù)雜性,僅僅依靠單一參數(shù)難以反映儲層流動單元的全部特征。因此,在流動單元評價參數(shù)選取過程中應(yīng)充分考慮影響儲層流動單元分布的諸多因素,如儲層巖石物理特征、微觀孔隙結(jié)構(gòu)特征、儲層沉積特征及儲層非均質(zhì)特征等[15-16]。
本文在充分考慮影響流動單元分布的諸多因素基礎(chǔ)上,共選取了13個儲層特征參數(shù),包括:孔隙度(φ)、滲透率(K)、泥質(zhì)體積分?jǐn)?shù)(Vsh)、含油飽和度(So)、沉積微相、砂巖厚度(H)、孔喉半徑(R35)、流動帶指標(biāo)(Ifz)、油藏品質(zhì)指數(shù)(Irq)、滲透率突進(jìn)系數(shù)(TK)、滲透率級差(JK)、隔夾層厚度(hd)、隔夾層密度(ρd)。其中:φ、K反映儲層儲集物性特征;So反映儲層流體特征;沉積微相、H反映儲層沉積特征;Vsh反映儲層巖性特征;hd、ρd、TK、JK反映儲層非均質(zhì)特征;Irq反映儲層質(zhì)量特征;R35、Ifz反映儲層的微觀孔隙結(jié)構(gòu)特征,是體現(xiàn)流體滲流能力的特征參數(shù)。
2.2.1 因子分析法原理
因子分析的概念最早是由Thurstone于1931年首次系統(tǒng)提出的,是研究變量間相關(guān)性、變量內(nèi)部成因聯(lián)系及探索產(chǎn)生上述關(guān)系內(nèi)因的一種多元統(tǒng)計學(xué)方法[1]。在流動單元研究中,儲層評價參數(shù)眾多且參數(shù)間關(guān)系復(fù)雜。因子分析法通過降維的思想,可以提取幾個少數(shù)的主因子來涵蓋大量的原始儲層信息;新因子的提取既無損于原始參數(shù)的信息,又能簡化眾多參數(shù)間的復(fù)雜關(guān)系,便于對原始參數(shù)進(jìn)行分類和解釋[17]。因子分析的步驟包括:建立因子分析模型,計算因子載荷;進(jìn)行因子旋轉(zhuǎn)得到旋轉(zhuǎn)后的因子載荷,計算因子得分。其中,初始因子載荷矩陣往往不唯一,因子地質(zhì)涵義不明確,故需要進(jìn)行最大方差旋轉(zhuǎn)得到地質(zhì)意義明確的主因子。
建立因子分析模型。假設(shè)X=(X1,X2,…,Xm)是m×1階的隨機(jī)向量,代表每個單砂層的儲層參數(shù);F=(F1,F1,…,Fp)是p×1階的標(biāo)準(zhǔn)化正交主因子向量(p Xi=ai1F1+ai2F2+…+aipFp+εi; i=1, 2, 3, … ,m。 (1) 式中:ai1,ai2, … ,aip是各變量(儲層參數(shù))在各主因子上的載荷,反映了變量(儲層參數(shù))與主因子之間關(guān)系的密切程度;εi為特殊因子。矩陣形式為 X=AF+ε。 (2) 為了得到地質(zhì)意義明確的主因子,需利用最大方差法對初始載荷進(jìn)行旋轉(zhuǎn)得到旋轉(zhuǎn)后的因子載荷。計算各主因子得分就需要將主因子F表示為原始變量的線性組合。主因子Fj由原始變量Xi表示的線性組合為 Fj=c1jX1+c2jX2+…+cmjXm; j=1, 2, 3, … ,m。 (3) 式中,cmj為變量系數(shù)。 通過因子分析可以探索儲層參數(shù)間的內(nèi)在聯(lián)系,將冗雜的儲層參數(shù)轉(zhuǎn)化為少數(shù)幾個反映儲層性質(zhì)的主因子。當(dāng)每個主因子被賦予客觀合理的地質(zhì)解釋后,就可以利用含有地質(zhì)含義的主因子作為流動單元評價的儲層參數(shù),進(jìn)而完成優(yōu)選流動單元評價參數(shù)的目的。 2.2.2 因子分析法應(yīng)用 本文通過標(biāo)志層對比、旋回對比、等高程對比等方法建立了包括小層、單砂層在內(nèi)的多級地層格架,并通過測井解釋參數(shù)模型的建立,進(jìn)行了研究區(qū)儲層測井二次解釋。在此基礎(chǔ)上選取了10口關(guān)鍵井的13個流動單元評價參數(shù),以單砂層內(nèi)各參數(shù)均值構(gòu)成122個樣本,利用SPSS軟件,采用因子分析法對樣本數(shù)據(jù)的13個流動單元評價參數(shù)進(jìn)行了因子分析,分析結(jié)果如下。 樣本數(shù)據(jù)的KMO(Kaiser-Meyer-Olkin)檢驗統(tǒng)計量和Bartlett球形檢驗統(tǒng)計量是檢驗樣本數(shù)據(jù)是否適合做因子分析的兩個重要指標(biāo)[18]。對122個樣本數(shù)據(jù)的KMO和Bartlett球形檢驗結(jié)果如表1所示。其中,KMO值為0.623,Bartlett球形檢驗顯著水平為0.000,非常顯著,因此研究區(qū)儲層參數(shù)適合做因子分析。通過方差分析可知,從13個參數(shù)中提取5個主因子時可以涵蓋84.134%的原始儲層信息(表2),符合因子分析的精度要求。通過因子載荷旋轉(zhuǎn)得到各主因子的載荷系數(shù)矩陣(表3)。 表1 KMO和Bartlett球形檢驗 由因子載荷系數(shù)矩陣可以得出每個因子的地質(zhì)意義。對于因子F1,載荷較大的是孔喉半徑、流動帶指標(biāo)、油藏品質(zhì)指數(shù),因此F1反映儲層流動特征,命名為流動因子;對于因子F2,正載荷較大的是沉積微相、砂巖厚度,負(fù)載荷較大的是泥質(zhì)體積分?jǐn)?shù),主要反映儲層沉積特征,命名為沉積因子;對于因子F3,載荷較大的是隔夾層厚度、隔夾層密度,主要反映隔夾層特征,命名為隔夾層因子;對于因子F4,載荷較大的是滲透率級差、滲透率突進(jìn)系數(shù),反映儲層非均質(zhì)特征,命名為非均質(zhì)因子;而對于因子F5,載荷較大的是孔隙度、滲透率、含油飽和度,反映儲層儲集特征,命名為儲集因子。因此,可以用提取的5個主因子:流動因子(F1)、沉積因子(F2)、隔夾層因子(F3)、非均質(zhì)因子(F4)、儲集因子(F5),作為流動單元評價的地質(zhì)參數(shù)。 支持向量機(jī)(SVM)最早由Vapnik[19]提出,是一種基于統(tǒng)計學(xué)理論的新型機(jī)器學(xué)習(xí)方法。其基本實現(xiàn)途徑是通過核函數(shù)的引入,將非線性問題(輸入空間)映射到新的高維特征空間,在高維特征空間中構(gòu)造最優(yōu)決策曲面并進(jìn)行樣本分類。支持向量機(jī)在解決研究目標(biāo)與多個不確定特征相關(guān)的非線性問題時,具有精度高、速度快、通用性強(qiáng)和理論完善等優(yōu)點(diǎn)[20]。由于低滲透儲層流動單元受多種地質(zhì)因素的影響,且流動性能好壞與各因素間變化規(guī)律不盡相同,因此本文采用非線性處理能力較強(qiáng)的支持向量機(jī)算法進(jìn)行流動單元分類識別。支持向量機(jī)算法結(jié)構(gòu)示意圖和流動單元劃分流程如圖1、2所示。算法實現(xiàn)流程如下:首先,選取已知樣本組成學(xué)習(xí)樣本對模型進(jìn)行訓(xùn)練,從而建立流動單元定量識別模型;其次,通過測試樣本對建立的預(yù)測模型進(jìn)行檢驗;最終,利用驗證合格的預(yù)測模型實現(xiàn)對未知樣本的流動單元預(yù)測。 模型構(gòu)建主要包括核函數(shù)和懲罰因子C的確定。SVM中最常見的核函數(shù)主要有高斯徑向基核函數(shù)、多層感知器核函數(shù)和多項式核函數(shù)3種[21]。高斯徑向基核函數(shù)擁有較寬的收斂域,對于各種各樣的樣本情況都有較高的適用性,且只有一個核參數(shù)g,靈活性高,是目前運(yùn)用最廣泛且效果最優(yōu)的分類核函數(shù)。本文在實際的SVM模型建立中,通過對不同核函數(shù)模型預(yù)測精度的對比可知,選用高斯徑向基核函數(shù)時模型預(yù)測精度遠(yuǎn)遠(yuǎn)高于其他兩類核函數(shù)(表4)。因此,選用高斯徑向基核函數(shù)來建立支持向量機(jī)預(yù)測模型。高斯徑向基核函數(shù)公式為 表2 方差分析結(jié)果 表3 旋轉(zhuǎn)后因子載荷矩陣 圖1 支持向量機(jī)結(jié)構(gòu)圖Fig.1 Structure of SVM 圖2 支持向量機(jī)劃分流動單元流程圖Fig.2 Flow chart of flow unit division base on SVM Table4Comparisonofpredictionaccuracyofdifferentkernelfunctions 核函數(shù)類型預(yù)測準(zhǔn)確率/%高斯徑向基核函數(shù)90.38多項式核函數(shù)85.25多層感知器核函數(shù)69.66 (4) 式中:xi(i=1, 2, 3, … ,n)代表樣本的輸入特征;x是多個行向量xi組成的矩陣;g為高斯核寬度,控制著徑向基核函數(shù)對非線性樣本的映射效果。當(dāng)g取值很小時,所有樣本都成為支持向量,容易出現(xiàn)過擬合現(xiàn)象;當(dāng)g取值較大時,該核函數(shù)映射的空間相當(dāng)于一個低維的子空間,所有樣本被分為一類,對新樣本分類能力幾乎為零。因此,只有當(dāng)g取合適值時樣本才能取得最優(yōu)分類效果。 核函數(shù)建立后還需優(yōu)選出最優(yōu)的高斯徑向基核參數(shù)g和懲罰因子C,從而使SVM模型取得最準(zhǔn)確的分類結(jié)果。國際上常用的模型參數(shù)優(yōu)化方法主要有留一法、網(wǎng)格搜索、粒子群優(yōu)化算法及交叉驗證法[21]。其中交叉驗證法具有應(yīng)用廣泛、精確率高的特點(diǎn),所以本文選用交叉驗證與網(wǎng)格搜索相結(jié)合的方法進(jìn)行參數(shù)尋優(yōu)。首先,憑經(jīng)驗選定一個g和C的網(wǎng)格搜索范圍;其次,采用交叉驗證法,以學(xué)習(xí)樣本作為訓(xùn)練集訓(xùn)練支持向量機(jī)并進(jìn)行檢驗,得到每組參數(shù)對應(yīng)的交叉驗證精度;最終,選出交叉驗證精度最高的一組參數(shù)值,即為最優(yōu)參數(shù)。C表示對錯誤分類懲罰的程度,控制著最優(yōu)分類面的位置。當(dāng)多組參數(shù)得到交叉驗證精度均最高時,為避免因C過高而導(dǎo)致過學(xué)習(xí)狀態(tài)(即學(xué)習(xí)樣本分類準(zhǔn)確度很高,而預(yù)測樣本分類準(zhǔn)確度卻很低),一般選取最小的C。 通過反復(fù)搜索和驗證,最終確定最優(yōu)參數(shù)(g,C)=(0.002, 16 777 216),此時模型的交叉驗證精度為88.57%(圖3)。 圖3 SVM模型參數(shù)尋優(yōu)Fig.3 Optimization of SVM model parameters 基于因子分析法進(jìn)行參數(shù)優(yōu)選的基礎(chǔ)上,選取5個主因子(流動因子、沉積因子、隔夾層因子、非均質(zhì)因子、儲集因子)作為支持向量機(jī)模型的輸入特征參數(shù)。采用孔喉半徑法將研究區(qū)10口關(guān)鍵井的122個樣本數(shù)據(jù)分為4類流動單元(圖4),從而獲得構(gòu)建模型所需的已知樣本數(shù)據(jù)集(表5),并以F29井為例(該井單砂層發(fā)育不完整,421、441、443、444單砂層不發(fā)育)展示單井流動單元劃分結(jié)果(圖5)。按照第3節(jié)中的算法流程建立研究區(qū)流動單元預(yù)測模型,進(jìn)而應(yīng)用建立的預(yù)測模型對研究區(qū)未取心井進(jìn)行流動單元識別與劃分[22]。 為避免各參數(shù)間量綱的差異導(dǎo)致運(yùn)算困難,影響學(xué)習(xí)效果,所有樣本數(shù)據(jù)在進(jìn)入支持向量機(jī)之前都要進(jìn)行歸一化處理,將樣本的特征值映射到[0,1]。本文采用MATLAB中的mapminmax函數(shù)完成樣本數(shù)據(jù)的歸一化處理。 研究區(qū)取心井?dāng)?shù)量有限,樣本數(shù)據(jù)較少,而支持向量機(jī)在小樣本數(shù)據(jù)分類中具有顯著的優(yōu)勢,因此采用該算法進(jìn)行流動單元分類預(yù)測是可靠的。選取4.1節(jié)中提取的10口關(guān)鍵井的122個樣本數(shù)據(jù)組成樣本集進(jìn)行SVM訓(xùn)練,樣本數(shù)據(jù)示例如表5所示。樣本數(shù)據(jù)分配時,為避免訓(xùn)練樣本過少而導(dǎo)致模型精度不佳或測試樣本不足導(dǎo)致的預(yù)測局限性,一般選取樣本數(shù)據(jù)的1/2~2/3作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練。因此,選取70個樣本數(shù)據(jù)作為學(xué)習(xí)樣本組成訓(xùn)練集進(jìn)行訓(xùn)練(Ⅰ類流動單元10個、Ⅱ類流動單元15個、Ⅲ類流動單元36個、Ⅳ類流動單元9個),并建立SVM模型;選取52個測試樣本(Ⅰ類流動單元6個、Ⅱ類流動單元10個、Ⅲ類流動單元30個、Ⅳ類流動單元6個)對流動單元預(yù)測模型進(jìn)行檢驗(表6)。 圖4 孔喉半徑法劃分流動單元Fig.4 Flow unit divided by pore throat method 根據(jù)模型預(yù)測結(jié)果可知,測試樣本的整體正判率為90.38%,且4類流動單元的預(yù)測正判率均在85%以上,具有較高的預(yù)測精度(表6)。錯判的5個樣本均出現(xiàn)在由一類流動單元向另一類流動單元過渡的地方,但9.62%的錯判率已經(jīng)滿足地質(zhì)上的要求。支持向量機(jī)算法為流動單元研究提供了一種新的手段,具有較顯著的分類效果,應(yīng)用該算法開展流動單元研究具有廣闊的前景。 本文應(yīng)用建立的支持向量機(jī)預(yù)測模型對工區(qū)未取心井進(jìn)行流動單元識別與分類,并在單井流動單元預(yù)測的基礎(chǔ)上,對濁積扇儲層內(nèi)部進(jìn)行流動單元井間分布預(yù)測[23-24]。以441單砂層為例,將預(yù)測結(jié)果與定性分析結(jié)果進(jìn)行對比,結(jié)果如圖6所示。結(jié)果表明:支持向量機(jī)預(yù)測結(jié)果與定性分析結(jié)果符合度較高,該算法在流動單元劃分中具有顯著的分類效果。 VSP. 自然電位;GR. 自然伽馬;AC. 聲波時差;Rt. 地層電阻率。① 毫達(dá)西(mD)為非法定計量單位,1 mD=0.987×10-3 μm2,下同。圖5 F29井流動單元劃分Fig.5 Flow unit division of F29 well 研究區(qū)為典型的湖底濁積扇沉積,沉積微相對流動單元展布具有明顯的控制作用,但后期成巖作用的改造也可能導(dǎo)致同一沉積微相發(fā)育不同的流動單元類型、同一流動單元分布于不同的沉積微相[25]。本文以441單砂層為例研究了流動單元的平面展布規(guī)律(圖7)。研究表明:Ⅲ類流動單元分布最為廣泛,占全區(qū)的65%左右,是研究區(qū)最主要的流動單元類型,Ⅰ、Ⅱ、Ⅳ類流動單元分布較少,儲層流動性能較差與低滲儲層分布特征吻合;另外,平面上流動單元與沉積微相展布規(guī)律吻合。Ⅰ類、Ⅱ類流動單元分布局限,僅在濁積水道主流線方向及朵葉體微相發(fā)育;Ⅲ類流動單元分布廣泛,呈大面積連片分布,在濁積水道、水道側(cè)緣及中扇側(cè)緣均有分布;Ⅳ類流動單元主要分布在濁積扇外緣的扇緣亞相。 表6 SVM模型預(yù)測精度分析 a.定性分析結(jié)果;b.預(yù)測結(jié)果。圖6 441單砂層流動單元識別結(jié)果對比圖Fig.6 Correlation of flow unit in 441 single sand layer 圖7 441單砂層沉積微相平面展布Fig.7 Distribution of sedimentary microfacies in 441 single sand layer 1)利用因子分析法從13個流動單元評價參數(shù)中提取了流動因子、沉積因子、隔夾層因子、非均質(zhì)因子、儲集因子等5個綜合因子,這5個主因子較為完整地涵蓋了原始儲層信息。 2)基于支持向量機(jī)的流動單元預(yù)測模型能夠較為系統(tǒng)地反映多種地質(zhì)因素與流動性能之間的復(fù)雜映射規(guī)律,能夠更為精確地劃分流動單元,正判率高達(dá)90.38%。該方法操作簡單、運(yùn)算速度快、準(zhǔn)確率高,為流動單元研究提供了一種新的思路,應(yīng)用該算法開展流動單元研究具有廣闊的前景。 3)流動單元與沉積微相平面展布規(guī)律吻合。Ⅰ類、Ⅱ類流動單元分布局限,僅在濁積水道主流線方向及朵葉體微相發(fā)育;Ⅲ類流動單元分布廣泛,呈大面積連片分布,在濁積水道、水道側(cè)緣及中扇側(cè)緣均有分布;Ⅳ類流動單元主要分布在濁積扇外緣的扇緣亞相。3 支持向量機(jī)算法原理及模型構(gòu)建
3.1 支持向量機(jī)算法原理
3.2 模型構(gòu)建
3.3 模型參數(shù)尋優(yōu)
4 實例分析
4.1 樣本數(shù)據(jù)提取及預(yù)處理
4.2 流動單元分類預(yù)測
4.3 流動單元平面展布特征
5 結(jié)論