楊愛東, 單立群, 劉彥昌, 秦培莉
(1.中國石油渤海鉆探工程公司測井分公司, 天津 300457; 2.中國石油大港油田分公司信息中心, 天津 300280; 3.中國石油大港油田分公司測試公司, 天津 300280; 4.中國石油大港油田分公司大港油田采油一廠, 天津 300280)
流動單元研究的主要目的和意義是明確剩余油的形成和分布,同時為油藏數(shù)值模擬提供可靠的分層依據(jù)。由于具體的地質條件和實際資料的限制及研究問題的出發(fā)點不同,對流動單元的認識及研究方法也不完全一致[1]。國內外眾多學者針對流動單元開展了大量的研究工作,尤其是在應用數(shù)理統(tǒng)計方法進行流動單元劃分上。Aminian等[2]提出了神經網絡方法識別流動單元類型和預測儲層物性參數(shù)。司馬立強等[3]利用BP神經網絡技術對黃玨油田方4阜一段儲層屬低孔隙度、低滲透率儲層流動單元進行預測。唐銜等[4]提出了基于模糊C均值聚類模型劃分流動單元的方法。Aguilar等[5]研究了基于流動層帶指數(shù)采用聚類分析方法進行儲層流動單元劃分和儲層滲透率預測。但是這些方法都沒有考慮測井曲線的非線性和參數(shù)敏感性對流動單元識別準確度的影響。本文考慮以上2個影響因素,提出了基于小波變換(WT)與最小二乘支持向量機(LSSVM)相結合的儲層流動單元劃分方法。
研究對象A區(qū)X斷塊位于潛山二級構造帶的東南部,是某油田復雜斷塊的重要組成部分,其構造特征為大型逆牽引背斜構造。該區(qū)主力油層為上第三系明化鎮(zhèn)組的NmⅡ、NmⅢ、NmⅣ和館陶組的NgⅠ,儲量占區(qū)塊儲量的96%,下第三系東營組和沙河街組僅有少數(shù)油組。其中明化鎮(zhèn)組以中彎曲度曲流河沉積為主,巖性組合以粉砂巖和細砂巖為主。受沉積環(huán)境的影響,該區(qū)物性較好,但滲透率變異系數(shù)大,縱向上非均質性強。油層埋藏深度1 120~2 160 m,以泥質膠結為主,膠結作用對孔隙度滲透率影響明顯,由于壓實作用差,生產中易出砂,平面上砂體多呈透鏡狀分布,分布范圍小而厚度差異大。巖心分析表明,NmⅢ段的孔隙度主要分布于20%~40%,平均取值31.18%;而滲透率分布于100~1 000 mD*非法定計量單位,1 mD=9.87×10-4 μm2,下同。
最小二乘支持向量機(LSSVM)算法是標準SVM的一個變形。LSSVM將SVM求解二次規(guī)劃問題轉換成求解線性方程組。使用二次不敏感損失函數(shù),大大降低了計算的復雜性[6-10]。LSSVM的函數(shù)估計問題可描述為求解如下問題。設樣本集表示為(x1,y1),(x2,y2),…,(xl,yl)∈Rn×R,LSSVM的回歸函數(shù)為
f(x)=ω·φ(x)+b
(1)
式中,φ(x)為從輸入空間到高維特征空間的非線性映射;ω為權值向量;b為偏置量。利用結構風險最小化原則,將回歸問題轉化為有約束的二次優(yōu)化問題,LSSVM回歸中對應的優(yōu)化問題
(2)
式中,xi為輸入量;yi為目標值;ω為權矢量;φ(xi)為核空間映射函數(shù);γ為可調參數(shù);ξi∈R為誤差變量。引入拉格朗日原函數(shù)
(3)
式中,αi(i=1,…,l)為拉格朗日乘子。根據(jù)極值存在的必要條件,將偏導置為0得到
(4)
設核函數(shù)K(xi,xj)=φ(xi)φ(xj),通過上述條件可以得到線性方程組問題
(5)
解方程組,求得系數(shù),可得到LSSVM回歸估計方程
(6)
核函數(shù)K(xi,xj)為滿足Mercer條件的任意對稱函數(shù),常用的核函數(shù)有:Sigmoid核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)(RBF)。這里采取徑向基核函數(shù),K(xi,xj)=exp[-(xi,xj)2/(2σ2)]。
小波變換(Wavelet Transform,WT)是由一基本小波或母小波ψ(t)通過伸縮因子a和平移因子b產生一個函數(shù)族{ψb,a(t)}[11-13]
(7)
定義信號x(t)的小波變換為
(8)
式中,ψ*(t)為ψ(t)的復共軛函數(shù)。因為時間序列是一組離散的有序觀測數(shù)據(jù),因此,一般采用離散小波變換(Discrete Wavelet Transform,DWT)對時間序列進行分解與重構。在實際中應用較多的離散二進小波變換算法是Mallat算法,其分解過程見圖1。
圖1 小波變換
選取21口取心井的巖心資料,利用Kozeney-Carman方程計算儲層油藏品質指數(shù)IRQ和流動層帶指數(shù)IFZ,利用孔隙度、滲透率等物性參數(shù)確定該研究區(qū)儲層流動單元的劃分標準,孔隙度和滲透率的關系為
(9)
式中,K為滲透率,mD;φ為有效孔隙度;HC為孔隙結構常數(shù),1/μm2。
將式(9)兩邊分別除以φ并開方有
(10)
分別定義下列參數(shù),油藏品質指數(shù)IRQ
(11)
標準化孔隙度指標φz
(12)
流動層帶指數(shù)IFZ
(13)
IFZ參數(shù)把巖石結構和礦物地質特征孔喉特征等結合,能較準確地描述油藏的非均質特征。對式(13)兩邊取對數(shù)整理得
lgIRQ=lgφz+lgIFZ
(14)
為提高劃分的準確性,根據(jù)21口井的相關資料,進行IFZ與物性的相關性分析,對一些異常IFZ值進行了刪除,如較差物性對應相對較高的IFZ值的樣品點。利用式(11)至式(13)分別計算巖心分析樣品的IRQ和IFZ,計算IFZ的核密度,繪制IFZ的頻率直方圖(見圖2)。
圖2 IFZ頻率直方圖
通過式(14)計算儲層質量指數(shù)與標準化孔隙度雙對數(shù)關系,在IRQ和φz的雙對數(shù)關系圖(見圖3)上,具有近似IFZ值的樣品將落在1條斜率為1的直線上,具有不同IFZ值的樣品將落在斜率相同的1組平行直線上,而同一直線上的樣品具有相似的孔喉特征,從而構成一個流動單元,且不同的流動單元的IFZ值不同。
圖3 IRQ和φz的雙對數(shù)關系圖
利用IFZ劃分流動單元類型圖,從圖2和圖3可以看出,該研究區(qū)流動單元分為3類,各流動單元的IFZ值范圍:Ⅰ類流動單元(大于0.6 μm);Ⅱ流動單元(0.4~0.6 μm);Ⅲ類流動單元(小于0.4 μm)。
利用取心井劃分出的流動單元區(qū)間,統(tǒng)計每類流動單元的孔隙度、滲透率及流動層帶指數(shù)IFZ,得出每個類型流動單元的綜合分類標準(見表1)。從表1可見,反映儲集層滲流能力的滲透率和流動層帶指數(shù)IFZ差別很大。根據(jù)滲透能力的差異,認為Ⅰ類流動單元的滲流能力和儲層質量好;Ⅱ類流動單元的滲流能力和儲層質量較好;Ⅲ類流動單元的滲流能力和儲層質量較差。
利用LSSVM建立儲層流動單元劃分模型時,由于在訓練樣本中不同性質的測井曲線與儲層流動單元之間存在一定的非線性關系,同時各測井曲線本身也存在較強的非線性特性,必然對模型的識別精度造成一定的影響。為了降低因測井曲線與儲層流動單元類型之間存在非線性關系而造成的識別誤差,提出將WT引入LSSVM建模過程當中。將WT與LSSVM相結合建立儲層流動單元劃分模型其過程可歸結為,①依據(jù)小波變換原理,利用Matlab軟件對訓練樣本集中的測井曲線進行分解,使各測井曲線分別分解為不同頻率的高頻和低頻成分;②將各訓練樣本集分解后得到含有各測井曲線高頻和低頻成分的訓練樣本集,利用決策樹C5.0對訓練樣本進行參數(shù)敏感性分析得到學習所用的訓練樣本集;③利用LSSVM訓練訓練樣本建立流動單元預測識別模型;④應用預測流動單元識別模型識別非取心井段流動單元類型。
以R05為例,依據(jù)小波變換原理,利用Matlab軟件對訓練樣本集R05進行分解。采用db3小波基對訓練樣本集進行5級分解,對分解后得到的低頻逼近信號和各高頻細節(jié)信號分別進行單支重構,分解與單支重構后的圖像見圖4。
圖4 R05的小波分解
利用LSSVM建模時首先應對測井數(shù)據(jù)進行參數(shù)敏感性分析,對測井數(shù)據(jù)進行參數(shù)敏感性分析可以避免不敏感參數(shù)導致核函數(shù)內積計算的困難,提高模型的預測精度。本文基于決策樹C5.0算法優(yōu)選出流動單元識別的敏感參數(shù)。采用決策樹C5.0算法中的信息增益率作為屬性選擇度量,通過實際模型給出測井屬性的巖性敏感程度排序。圖5中柱狀圖就是7條測井曲線經過小波變換分解出的70個屬性對流動單元類型所占的敏感性權重,可以發(fā)現(xiàn)對流動單元類型反映最敏感的屬性依次為a2,GR(GR的近似系數(shù)2)、a1,R25(R25的近似系數(shù)1)、d1,CNL(CNL的細節(jié)系數(shù)1)、a3,GR(GR的近似系數(shù)3)和a1,R05(R05的近似系數(shù)1),其余屬性對流動單元類型的敏感性為0。
圖5 C5.0算法敏感參數(shù)分析
利用LSSVM建模時需尋找合適的分類函數(shù)對未知樣本進行分類,分類函數(shù)的確定包括核函數(shù)的選擇和懲罰因子的確定。常用的核函數(shù)有高斯徑向基核函數(shù)、多項式核函數(shù)和線性核函數(shù),在分類問題概率分布未知的情況下,由高斯徑向基核函數(shù)訓練而成的模型比基于其他核函數(shù)的模型具有更好的總體性能。因此,利用LSSVM建立流動單元識別模型時選用高斯徑向基核函數(shù),通過網格搜索法和5折交叉驗證法可確定超參數(shù)σ及C的值。
首先,直接利用LSSVM對各訓練樣本集進行訓練,利用學習訓練后的模型對測試樣本進行檢驗,從而考察模型的預測準確性。其次,在小波分解后形成不同頻率的訓練樣本集上,組合不同測井曲線從高頻段到低頻段的屬性,進行敏感參數(shù)分析,利用LSSVM對敏感頻段參數(shù)樣本集進行學習訓練后的模型作為最終預測識別模型并對測試樣本進行檢驗,如果達到預測識別精度,則獲得儲層流動單元類別劃分模型。否則調整參數(shù),重新進行訓練和檢驗。利用LSSVM和WT-LSSVM這2種模型分別對635個訓練樣本進行識別,然后利用學習訓練后的2種模型對50個測試樣本進行預測。利用LSSVM建模時,經網格搜索法和交叉驗證法確定超參數(shù)σ2=0.4,C=100,為了便于比較對混合模型也選用相同的超參數(shù)。最終2種模型對測試樣本的預測結果見圖6,圖6中黑色和藍色曲線幾乎重合,表明WT-LSSVM預測值與實際值有比較高的吻合度。
圖6 WT-LSSVM和LSSVM預測結果
對非取心段或整個井段流動單元預測的實現(xiàn)方法:對目的層段按測井曲線數(shù)據(jù)點進行預測,即搜集該層段對應的特征測井曲線(CNL、GR、SP、AC、NG、R05、R25),對7條測井曲線進行小波變換,提取分解后的a2,GR、a1,R25、d1,CNL、a3,GR和a1,R05特征作為已訓練好網絡的輸入,輸出為每個測井數(shù)據(jù)點對應的流動單元類型值。此時,由于網絡比較靈敏或者局部測井曲線異常會致使某個儲層內在某類流動單元的背景下夾雜一些比較離散的其他類型的流動單元,需要人為地對數(shù)據(jù)進行局部的修改,以保證后面參數(shù)計算時模型選擇的正確性。
通過對測試樣本的預測分析,可以看出WT與LSSVM相結合的混合預測識別模型具有較高的預測精度,因此,更適合于流動單元類型識別建模。以某取心井數(shù)據(jù)為例,將20組測試樣本歸一化后分別輸入到WT-LSSVM儲層流動單元類型識別模型當中,可以得到基于WT-LSSVM模型的儲層流動單元類型識別結果。為了進一步說明WT-LSSVM模型對儲層流動單元類型識別的準確性,本文再利用巖心分析和LSSVM對20組測試樣本所在的儲層流動單元類型進行識別。3種方法的最終識別結果見表2。
由表2可見,基于WT-LSSVM的識別模型對儲層流動單元類型的識別準確度較高,基于LSSVM的識別模型次之。因此,基于WT-LSSVM的儲層流動單元類型識別模型有效可行。
(1) 通過取心井的測井、物性分析資料,利用流動帶指數(shù)劃分方法建立了研究區(qū)塊儲層流動單元類型的劃分標準,研究區(qū)目的層劃分為Ⅰ類、Ⅱ類、Ⅲ類流動單元。
(2) 將WT引入LSSVM建模過程中,從而降低了因測井曲線與儲層流動單元類型之間存在非線性關系而造成的識別誤差,利用決策樹算法優(yōu)選出流動單元識別的敏感參數(shù),在此基礎上,利用LSSVM訓練訓練樣本建立流動單元預測識別模型。
(3) 實際應用表明,基于WT與LSSVM的流動單元類型識別模型具有較高的識別精度,對于提高測井資料的綜合利用率以及構建高效準確的流動單元類型識別模型具有重要的參考價值。
參考文獻:
[1] 陳歡慶, 胡永樂, 閆林, 等. 儲層流動單元研究進展 [J]. 地球學報, 2010(6): 875-884.
[2] AMINIAN K, AMERI S, OYEROKUN A, et al Prediction of Flow Units and Permeability Using Artificial Neural Networks [J]. Society of Petroleum Engineers, 2003(1).
[3] 司馬立強, 肖華, 袁龍, 等. 基于BP神經網絡技術的儲層流動單元研究 [J]. 測井技術, 2012, 36(4): 421-425.
[4] 唐銜, 侯加根, 鄧強, 等. 基于模糊C均值聚類的流動單元劃分方法——以克拉瑪依油田五3中區(qū)克下組為例 [J]. 油氣地質與采收率, 2009, 16(4): 34-37.
[5] AGUILAR C, HUGO G, RINCN G. Hydraulic Unit Determination and Permeability Prediction Based on Flow Zone Indicator Using Cluster Analysis [J]. Society of Petroleum Engineers, 2014, May 21.
[6] 楊斌, 匡立春, 孫中春, 等. 一種用于測井油氣層綜合識別的支持向量機方法 [J]. 測井技術, 2005, 29(6): 511-514.
[7] LIU X, LU W C, JIN S L, et al. Support Vector Regression Applied to Materials Optimization of Sialon Ceramics [J]. Chemometrics and Intelligent Laboratory Systems, 2006, 82(12): 8-14.
[8] MOHAMMAD ALI AHMADI, Alireza BAHADORI. A LSSVM Approach for Determining Well Placement and Conning Phenomena in Horizontal Wells [J]. Fuel, 2015, 153(8): 276-283.
[9] MOHAMMAD ALI AHMADI. Toward Reliable Model for Prediction Drilling Fluid Density at Wellbore Conditions: A LSSVM model [J]. Neuro Computing, 2016 June 7.
[10] MILAD ARABLOO, HOSSEIN ZIAEE, MOONYONG LEE, et al. Prediction of the Properties of Brines Using Least Squares Support Vector Machine (LS-SVM) Computational Strategy [J]. Journal of the Taiwan Institute of Chemical Engineers, 2015, 50(5): 123-130.
[11] 余繼峰, 李增學. 測井數(shù)據(jù)小波變換及其地質意義 [J]. 中國礦業(yè)大學學報, 2003, 32(3): 336-338.
[12] 閻輝, 李鯤鵬, 張學工, 等. 測井曲線的小波變換特性在自動分層中的應用 [J]. 地球物理學報, 2000, 43(4): 568-573.
[13] AWOTUNDE A A, HORNE R N. Reservoir Description with Integrated Multiwell Data Using Two-dimensional Wavelets [J]. Math Geosci, 2013, 45(2): 225-252.