王桂芳,王碩亮,許學(xué)健,雷燕,康波
(1.中國(guó)石油 吐哈油田分公司 勘探開(kāi)發(fā)研究院,新疆 哈密 839009;2.中國(guó)地質(zhì)大學(xué) 能源學(xué)院,北京 100083)
KS 油田位于哈薩克斯坦南圖爾蓋盆地Aryskum坳陷Ashisai 凸起,構(gòu)造頂部發(fā)育小斷層,油藏內(nèi)部斷裂不發(fā)育[1-4]。主要目的層為白堊系和上侏羅統(tǒng),發(fā)現(xiàn)MⅠ、MⅡ、JⅠ、JⅡ、JⅢ和JⅣ共6套含油層系。儲(chǔ)集層物性較好,為中—高孔、中—高滲儲(chǔ)集層,其中白堊系儲(chǔ)集層平均孔隙度為28.7%,平均滲透率為2 288 mD;侏羅系儲(chǔ)集層平均孔隙度為23.8%,平均滲透率為625 mD。油藏原油性質(zhì)較好,具有低密度和低黏度的特點(diǎn)。該油田已進(jìn)入開(kāi)發(fā)后期,含水率高達(dá)98.2%[5-8],采出程度達(dá)90.9%,多數(shù)采油井處于高含水率、低產(chǎn)油量的狀態(tài)。KS 油田儲(chǔ)集層砂巖強(qiáng)親水,在均質(zhì)砂巖中水驅(qū)效率很高,注入高效驅(qū)油劑后采收率提高幅度有限;在非均質(zhì)砂巖中,注入水易沿高滲層竄流,波及體積小[9]。因此,亟需開(kāi)展注水井調(diào)剖,但該油田調(diào)剖堵水經(jīng)驗(yàn)欠缺,調(diào)剖堵水選井決策時(shí)的具體界限難以界定。
調(diào)剖堵水常用的選井選層方法有PI 決策[10-13]和RE 決策,對(duì)于中—高滲儲(chǔ)集層,PI決策中的壓力指數(shù)決策方法雖然不能保證調(diào)剖效果,但能夠指導(dǎo)調(diào)剖措施的實(shí)施,因?yàn)閴毫χ笖?shù)能反映中—高滲儲(chǔ)集層的滲透率,高滲通道可使?jié)B透率增大,儲(chǔ)集層非均質(zhì)性增強(qiáng)[14-17],但是僅通過(guò)注水井井口壓降測(cè)試數(shù)據(jù)來(lái)判斷注水井是否應(yīng)該調(diào)剖,沒(méi)有考慮采油井的生產(chǎn)狀況,不能充分體現(xiàn)油藏的整體開(kāi)發(fā)規(guī)律。RE 決策的指標(biāo)選取較PI 決策更加全面,但是各指標(biāo)的界限和權(quán)重難以確定,不同類(lèi)型油藏的不同開(kāi)發(fā)階段對(duì)調(diào)剖選井決策的指標(biāo)界限和權(quán)重影響較大,人為干擾因素過(guò)多。
本文提出調(diào)剖選井模糊聚類(lèi)方法,根據(jù)KS 油田地質(zhì)特征和生產(chǎn)特征,構(gòu)建基于多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid 核函數(shù)[18]的新型核函數(shù),提高調(diào)剖選井的樣本集識(shí)別率和檢測(cè)集識(shí)別率。將該方法應(yīng)用于KS 油田,篩選出3 口注水井調(diào)剖,都取得較好的降水增油效果。
首先,更新劃分矩陣U=[μij]:
更新聚類(lèi)中心:
根據(jù)所選擇的指標(biāo)體系與最終結(jié)果的邏輯關(guān)系,確定聚類(lèi)類(lèi)別的物理意義和對(duì)應(yīng)措施。
從計(jì)算過(guò)程可以看出,模糊聚類(lèi)分析是一個(gè)爬坡過(guò)程,以類(lèi)間距離最大和類(lèi)內(nèi)距離最小為準(zhǔn)則,不斷進(jìn)行迭代計(jì)算,直至得到最優(yōu)解。因此,此計(jì)算過(guò)程對(duì)距離的表達(dá)式要求很高,不同的指標(biāo)集合、不同的數(shù)據(jù)形式,所對(duì)應(yīng)的最優(yōu)距離表達(dá)式不同,目前常用5種距離表達(dá)式(表1)。
表1 模糊聚類(lèi)類(lèi)間最優(yōu)距離計(jì)算方法Table 1.Calculation methods of the optimal distance between fuzzy clusters
在聚類(lèi)分析過(guò)程中,利用不同的距離表達(dá)式,識(shí)別出來(lái)的各類(lèi)模式結(jié)果也不相同,這主要取決于目標(biāo)數(shù)據(jù)體的分布形式。例如,歐氏距離(歐幾里德距離)可以識(shí)別出圓形的數(shù)據(jù)形式,如果研究目標(biāo)是圓形的分布模式,利用歐氏距離可較準(zhǔn)確識(shí)別;若研究目標(biāo)是矩形或三角形的分布模式,則誤差較大。
以KS 油田的實(shí)際數(shù)據(jù)為基礎(chǔ),分別利用歐氏距離和曼哈坦距離公式進(jìn)行模糊聚類(lèi)計(jì)算。利用歐氏距離識(shí)別出的3 個(gè)類(lèi)中心坐標(biāo)分別為(1.065,0.006),(2.998,0.041),(4.940,0.018);利用曼哈坦距離識(shí)別出的3個(gè)類(lèi)中心坐標(biāo)分別為(1.056,0.017),(3.102,-0.029),(4.911,0.001)。采用不同表達(dá)式計(jì)算的距離具有差異,因此明確數(shù)據(jù)的分布規(guī)律十分必要。在調(diào)剖選井決策中,如果沒(méi)有明確研究目標(biāo)的數(shù)據(jù)分布模式,在距離表達(dá)式的選取上,必然存在一定的盲目性。直接用某一種距離計(jì)算方法對(duì)油水井進(jìn)行分類(lèi),容易產(chǎn)生較大的誤差。
考慮到核函數(shù)具有將空間非線(xiàn)性樣本映射到高維空間呈線(xiàn)性分布的特征,將核函數(shù)引入模糊聚類(lèi)計(jì)算,以解決油田動(dòng)態(tài)數(shù)據(jù)分布特征不穩(wěn)定的問(wèn)題。常用的核函數(shù)有多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)(表2)。
表2 常用核函數(shù)的表達(dá)式和特征Table 2.Expressions and characteristics of commonly used kernel functions
由于以上核函數(shù)均存在一定不足,本文將以上3種核函數(shù)進(jìn)行多元線(xiàn)性組合,構(gòu)建了一種新型核函數(shù)。新型核函數(shù)中存在n1、n2和n3共3個(gè)待定系數(shù),代表3種核函數(shù)對(duì)新型核函數(shù)的影響程度,可通過(guò)模糊聚類(lèi)學(xué)習(xí)樣本進(jìn)行機(jī)器學(xué)習(xí)和訓(xùn)練時(shí)確定具體數(shù)值。構(gòu)建的新型核函數(shù)為:
由于KS 油田調(diào)剖樣品數(shù)量較少,選用與KS 油田相鄰的KN 油田的調(diào)剖堵水?dāng)?shù)據(jù),作為學(xué)習(xí)和檢測(cè)的樣本。KN 油田累計(jì)實(shí)施調(diào)剖堵水達(dá)100 余井次,將調(diào)剖后增油量超過(guò)300 t 的單井作為急需調(diào)剖的學(xué)習(xí)樣本;將調(diào)剖后見(jiàn)效但增油量小于300 t 的單井作為密切觀(guān)察的學(xué)習(xí)樣本;將無(wú)需調(diào)剖的單井作為正常生產(chǎn)的學(xué)習(xí)樣本,分別采用多項(xiàng)式核函數(shù)、徑向基核函數(shù)、Sigmoid 核函數(shù)和本文構(gòu)建的新型核函數(shù)進(jìn)行學(xué)習(xí)和驗(yàn)證。由計(jì)算結(jié)果可知,新型核函數(shù)的樣本集識(shí)別率和檢測(cè)集識(shí)別率比其他幾種核函數(shù)更高(表3),說(shuō)明新型核函數(shù)對(duì)于調(diào)剖堵水選井決策指標(biāo)體系的數(shù)據(jù)具有較好的學(xué)習(xí)和預(yù)測(cè)能力。因此,選用新型核函數(shù)對(duì)KS油田的基礎(chǔ)數(shù)據(jù)進(jìn)行空間轉(zhuǎn)換。
表3 各類(lèi)核函數(shù)樣本識(shí)別結(jié)果Table 3.Recognition results of various kernel function samples
根據(jù)KS 油田的生產(chǎn)特點(diǎn),確定了注水井調(diào)剖模糊聚類(lèi)方法的指標(biāo)體系選取原則:①數(shù)據(jù)多,模糊聚類(lèi)方法對(duì)具有一定規(guī)模和分布規(guī)律的數(shù)據(jù)有較好的識(shí)別效果;②時(shí)間長(zhǎng),能夠反映長(zhǎng)期高強(qiáng)度注水開(kāi)發(fā)后儲(chǔ)集層孔隙結(jié)構(gòu)的變化;③成本低,要求決策過(guò)程費(fèi)用低、周期短、不影響生產(chǎn);④時(shí)效性好,要求指標(biāo)體系能夠較準(zhǔn)確反映目前實(shí)際生產(chǎn)狀況和變化趨勢(shì);⑤獨(dú)立性強(qiáng),指標(biāo)體系之間不能存在共軛性。根據(jù)以上原則,最終確定了4 個(gè)靜態(tài)指標(biāo)(有效厚度、滲透率、滲透率突進(jìn)系數(shù)、滲透率變異系數(shù))、4個(gè)注水井指標(biāo)(日注水量、注水油壓、視吸水指數(shù)、單位厚度累計(jì)注水量)、4 個(gè)采油井指標(biāo)(日產(chǎn)液量變化率、含水率、視產(chǎn)液指數(shù)變化率、單位厚度累計(jì)產(chǎn)液量)和2 個(gè)井間指標(biāo)(油水井關(guān)聯(lián)性、關(guān)聯(lián)性變化率)。該指標(biāo)體系的數(shù)值越大,越需要調(diào)剖,因此,類(lèi)中心數(shù)值最大的一類(lèi)對(duì)應(yīng)的選井決策結(jié)果是急需調(diào)剖[19-20],類(lèi)中心數(shù)值最小的一類(lèi)對(duì)應(yīng)的選井決策結(jié)果是正常生產(chǎn)。
本文提出的基于新型核函數(shù)的調(diào)剖選井模糊聚類(lèi)方法主要包括4 個(gè)步驟,分別是數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)特征降維、聚類(lèi)計(jì)算和歸類(lèi)分析。
(1)數(shù)據(jù)標(biāo)準(zhǔn)化 為了使影響資料質(zhì)量的各種系統(tǒng)誤差降到最低,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。假設(shè)由原始數(shù)據(jù)構(gòu)成的矩陣經(jīng)標(biāo)準(zhǔn)化后形成矩陣Sj為第j個(gè)變量的標(biāo)準(zhǔn)差。相關(guān)公式如下:
(2)數(shù)據(jù)特征降維 由于單井描述特征較多,數(shù)據(jù)可讀性差,特征多重共線(xiàn)性嚴(yán)重,算法的搜索難度大,計(jì)算成本高,需要將數(shù)據(jù)進(jìn)行特征降維,將高維模型投影到低維模型上。假設(shè)Rn為某個(gè)數(shù)據(jù)集,可得一組有序的正交基向量,對(duì)任意X∈Rn,降維之后的向量可表示為:
(3)聚類(lèi)計(jì)算 基于新型核函數(shù)的模糊聚類(lèi)算法,可以根據(jù)實(shí)際情況,產(chǎn)生最合適的類(lèi)的數(shù)目,半徑和最小密度閾值均為全局參數(shù)。
(4)歸類(lèi)分析 基于新型核函數(shù)的模糊聚類(lèi)算法可以根據(jù)實(shí)際情況產(chǎn)生最佳分類(lèi)數(shù),可以通過(guò)調(diào)試最小密度閾值得到規(guī)定分類(lèi)數(shù)。
對(duì)KS 油田22 口注水井進(jìn)行模糊聚類(lèi)計(jì)算,結(jié)果表明,急需調(diào)剖的井有3 口,密切觀(guān)察和正常生產(chǎn)的井分別為13口和6口(表4)。
表4 KS油田注水井調(diào)剖選井結(jié)果Table 4.Results of water injection well selection for profile control in KS oilfield
對(duì)這3 口注水井實(shí)施調(diào)剖,均取得了較好的降水增油效果(表5)。從采油井2717 井的生產(chǎn)曲線(xiàn)可以看出,注水井2716井調(diào)剖后,對(duì)應(yīng)采油井2717井含水率明顯下降,產(chǎn)油量顯著上升,表明注水井調(diào)剖選井工作較為成功(圖1)。
表5 KS油田典型注水井調(diào)剖效果統(tǒng)計(jì)Table 5.Statistics of profile control effects for typical water injection wells in KS oilfield
(1)針對(duì)KS油田的地質(zhì)和生產(chǎn)特點(diǎn),對(duì)傳統(tǒng)的調(diào)剖注水井選井決策方法進(jìn)行了改進(jìn),采用多元線(xiàn)性組合的方式構(gòu)建了一種新型核函數(shù),建立了新型的模糊聚類(lèi)算法,選擇需要調(diào)剖的井,能夠達(dá)到較高的擬合精度和預(yù)測(cè)精度。
(2)新型注水井調(diào)剖選井決策方法應(yīng)用于KS油田,從22口注水井中優(yōu)選出3口進(jìn)行調(diào)剖,取得了較好的增油降水效果。
符 號(hào) 注 釋
A——協(xié)方差矩陣;
b——聚類(lèi)中心迭代次數(shù);
c,v——Sigmoid核函數(shù)參數(shù);
d——距離,m;
g——加權(quán)指數(shù);
h——樣本數(shù)最大值;
i,j——元素序號(hào);
k——樣品指標(biāo)數(shù);
K(xi,xj)——核函數(shù);
m,n——i,j的最大值;
n1、n2、n3——待定系數(shù);
p——樣品指標(biāo)數(shù)最大值;
q——階數(shù);
Rn——數(shù)據(jù)集;
Sj——第j個(gè)變量的標(biāo)準(zhǔn)差;
U——矩陣;
vi——行聚類(lèi)中心;
vk——列聚類(lèi)中心;
Vb——第b個(gè)聚類(lèi)中心;
Vb+1——第b+1個(gè)聚類(lèi)中心;
x′——標(biāo)準(zhǔn)化矩陣;
xi——第i行數(shù)據(jù);
xik——第i行第k列數(shù)據(jù);
xij——第i行第j列數(shù)據(jù);
——標(biāo)準(zhǔn)化矩陣第i行第j列數(shù)據(jù);
xj——第j列數(shù)據(jù);
xjk——第j行第k列數(shù)據(jù);
X——降維后向量;
yn——降維前第n個(gè)向量;
ε——模糊聚類(lèi)精度要求;
μij——模糊聚類(lèi)劃分矩陣;
σ——函數(shù)寬度參數(shù);
φi——第i個(gè)正交基向量;
φn——第n個(gè)正交基向量。