潘勇博 張 紅 馮 定 馮 云
(長江大學(xué)機械工程學(xué)院;湖北省油氣鉆完井工具工程技術(shù)研究中心)
石油鉆探行業(yè)中,隨著技術(shù)的不斷進步,旋轉(zhuǎn)導(dǎo)向鉆具已成為相關(guān)工作者的最佳選擇之一[1-2]。造斜率作為導(dǎo)向鉆具的一個重要參數(shù),常被用于衡量導(dǎo)向鉆具的造斜能力。實際鉆探過程中,造斜率影響因素眾多,如地層硬度、鉆頭、導(dǎo)向工具結(jié)構(gòu)[3]、溫度及壓力等。迄今為止,在無數(shù)學(xué)者的不懈努力下,已經(jīng)涌現(xiàn)出許多造斜率預(yù)測法。比較有代表性的有H.KARLSSON等[4-5]于1985年提出的三點定圓法、M.BIRADES等[6-7]于1989年提出的平衡曲率法、蘇義腦[8]于1992年提出的極限曲率法。此外,還有修正的三點定圓法[9-10]、鉆頭與地層相互作用理論[11]和回歸分析法[12]等也能較好地預(yù)測造斜率。幾何預(yù)測法雖然計算簡單,但是僅考慮了鉆具組合的幾何結(jié)構(gòu),忽略了地層因素和工具材料的影響,預(yù)測精度已遠遠不能滿足當今的生產(chǎn)需求。與幾何預(yù)測法相比,力學(xué)預(yù)測法的預(yù)測精度有了大幅度提升,但計算復(fù)雜度要遠遠高于其他預(yù)測法。而回歸分析法中的Kriging代理模型預(yù)測法能夠通過已有的鉆井數(shù)據(jù)構(gòu)建一個響應(yīng)面模型,用該模型對目標點進行插值計算[13-14],獲取目標點處的預(yù)測造斜率,以此來指導(dǎo)鉆井作業(yè)。前期研究發(fā)現(xiàn)[15-16],Kriging代理模型能夠高效地處理“多變量單響應(yīng)”問題,且預(yù)測精度要優(yōu)于一階多項式模型、二階多項式模型以及RBF模型,對于鉆探行業(yè)中多因素影響下的造斜率預(yù)測具有較好的預(yù)測結(jié)果。
本文在前期對于Kriging代理模型研究的基礎(chǔ)上,將統(tǒng)計學(xué)中相關(guān)性這一概念加以運用,以便提高Kriging代理模型的預(yù)測精度?;谒拇ㄊ∧尘毋@井參數(shù),計算造斜率與各個影響因素之間的相關(guān)系數(shù),剔除相關(guān)系數(shù)處于(-0.2,0.2)區(qū)間內(nèi)的“無關(guān)因素”后,用剩余的影響因素(敏感因子)再次進行數(shù)據(jù)擬合并進行造斜率預(yù)測,并與未經(jīng)數(shù)據(jù)處理的Kriging代理模型預(yù)測結(jié)果對比,結(jié)果顯示:剔除“無關(guān)因素”后的預(yù)測模型不僅能夠大幅度降低計算量,更能夠在原有預(yù)測模型的基礎(chǔ)上提高預(yù)測精度,在一定程度上降低鉆探過程中鉆頭偏離目標地層的風(fēng)險。
Kriging代理模型又被稱為Kriging響應(yīng)面模型,它的產(chǎn)生依賴于Kriging插值法。Kriging插值法是基于地理學(xué)第一定律所衍生出來的插值方法,核心思想是空間內(nèi)任何一點處的響應(yīng)值與其附近若干個已知點的響應(yīng)值有關(guān),并且該點與已知點的相關(guān)程度與距離有關(guān)[17-18]。此插值法可表示為:
(1)
式中:y(xi)表示第i個已知位置處每100 m的實際造斜率,(°);λi表示第i個已知位置的造斜率對待估位置造斜率的影響程度,通常為距離的某種函數(shù);y(x0)表示待估位置處每100 m造斜率的預(yù)測值,(°)。
為了得到待估點的預(yù)測造斜率y(x0),必須求出系數(shù)λ。為此,引入統(tǒng)計學(xué)中“將未知函數(shù)看作是高斯靜態(tài)隨機過程的一個具體實現(xiàn)”的假設(shè),此假設(shè)可表示為:
Y(x0)=m+p(x0)
(2)
式中:m為一個常數(shù),它表示空間某個區(qū)域內(nèi)造斜率的數(shù)學(xué)期望,反映了待估造斜率的整體趨勢;p(x0)可以理解為待估位置處造斜率偏離其數(shù)學(xué)期望的程度,反映了待估造斜率的局部波動。實際問題中,p(x0)的數(shù)學(xué)期望為0,方差為σ2;Y(x0)表示目標位置每100 m造斜率預(yù)測值,(°)。
由地理學(xué)第一定律可知,一定范圍內(nèi),空間內(nèi)不同位置處的響應(yīng)值(本文釋義為造斜率影響因素的不同取值組合所對應(yīng)的造斜率)具有一定的相關(guān)性,根據(jù)統(tǒng)計學(xué)中協(xié)方差相關(guān)理論不難得出:
(3)
即
Cov[p(x0),p(x1)]=σ2R(x0,x1)
(4)
式(4)中,變量R表示影響因素的不同取值組合所對應(yīng)的造斜率的相關(guān)程度,常用高斯指數(shù)模型來擬合。
為使造斜率預(yù)測模型具有更高的預(yù)測精度,Kriging插值法要求預(yù)測結(jié)果的均方誤差SMSE最小,即求出合適的權(quán)重系數(shù),使得下式取到最小值:
SMSE[y(x0)]=E{[y(x0)-Y(x0)]2}
(5)
(6)
經(jīng)過運算,最優(yōu)權(quán)重系數(shù)λi可由矩陣形式的線性方程組求出:
(7)
為方便表述,將式中:
記為矩陣R,R為對稱矩陣。
將(1 1 … 1)T記為矩陣M;將(R(x1,x0),R(x2,x0) …R(xn,x0))T記為矩陣r;將(λ1λ2…λn)T記為矩陣λ;于是上式變?yōu)椋?/p>
(8)
即有:
(9)
將式(9)代入Kriging插值法的定義式,即可得到:
(10)
式中:y=(y1,y2,…,yn)T。
進一步簡化后可寫為:
rTR-1{y-[(MTR-1M)TMTR-1y]M}
(11)
在最終表達式中,除了矩陣r以外的所有參數(shù)僅與訓(xùn)練樣本有關(guān),在實際使用過程中可在首次計算完成之后將訓(xùn)練好的造斜率預(yù)測模型存儲下來。預(yù)測不同待估點造斜率時僅需計算并代入矩陣r即可得到造斜率預(yù)測值。
前期研究的Kriging代理模型在預(yù)測造斜率前僅對獲取到的造斜率影響因素與實際造斜率進行擬合,并未對數(shù)據(jù)進行任何處理。在前期研究中雖已驗證Kriging代理模型的預(yù)測精度要優(yōu)于一階多項式模型、二階多項式模型以及RBF模型,但在鉆探行業(yè)不斷發(fā)展的今天,井眼軌跡的控制面臨著更大的挑戰(zhàn),基于Kriging代理模型的造斜率預(yù)測精度仍有待提高。
在實際問題中,多因素問題比比皆是,如農(nóng)作物產(chǎn)量、電子產(chǎn)品使用壽命、鉆井時實際造斜率等。而各個因素對于響應(yīng)值的影響效果各不相同,甚至有些因素對于響應(yīng)值幾乎沒有影響。在信號處理中由于噪聲信號的存在使得人們很難獲取期望的輸出,在造斜率預(yù)測方面也存在相似問題,即鉆井作業(yè)時,影響實際造斜率的因素眾多,如鉆頭側(cè)向力、鉆頭偏轉(zhuǎn)角以及鄰井造斜率等。在獲取的初始數(shù)據(jù)中,有些影響因素對造斜率的影響效果較為顯著;而有些因素對于造斜率的影響甚微,倘若將這些“噪聲因素”也作為回歸擬合的自變量之一進行數(shù)值計算,不僅不能得到精準的擬合方程,甚至?xí)箻颖军c變得更加離散。因此,考慮剔除相關(guān)系數(shù)過低的因素,用剩下的敏感因子進行數(shù)據(jù)擬合并進行插值計算,以獲取精度更高的造斜率預(yù)測模型。
構(gòu)建造斜率預(yù)測模型時,有些因素的取值普遍較小,而有些因素的取值普遍較大。輸入的各個影響因素的數(shù)量級可能會影響造斜率預(yù)測精度,為了降低由各因素的數(shù)量級帶來的誤差,本文采用MinMaxScaler法對造斜率影響因素的實鉆數(shù)據(jù)進行歸一化處理,使所有數(shù)據(jù)均分布于區(qū)間[0,1]。MinMaxScaler歸一化的計算式為:
(12)
式中:x′為經(jīng)過歸一化處理后的變量;x為變量初始值;xmax、xmin分別為初始變量中的最大值和最小值。
造斜率影響因素眾多,通過已知鉆井數(shù)據(jù)求出各個因素與實際造斜率間的相關(guān)系數(shù),分析實際造斜率對各個影響因素的敏感程度。變量間的相關(guān)系數(shù)有多種定義方式,如Pearson相關(guān)系數(shù)、Spearman相關(guān)系數(shù)等。本文采用Pearson相關(guān)系數(shù),其計算式為:
(13)
式中:rX,Y為某個影響因素X與造斜率Y之間的相關(guān)系數(shù),取值范圍為[-1,1],其絕對值越接近1,表示2個變量X、Y之間的線性相關(guān)程度越高;Cov(X,Y)為變量X、Y間的協(xié)方差;E(X)、E(Y)、D(X)、D(Y)分別為變量X、變量Y的均值和方差。
利用Pearson相關(guān)系數(shù)評估各個影響因素與造斜率之間的相關(guān)性,依據(jù)相關(guān)程度表[19]剔除相關(guān)系數(shù)處于(-0.2,0.2)間的無關(guān)變量,將其余的變量作為敏感因子,分別按下式進行加權(quán)處理。
(14)
式中:r(x,i)y為第i個影響因素與實際造斜率之間的相關(guān)系數(shù);n為參與構(gòu)建預(yù)測模型的敏感因子個數(shù);xi0為第i個未經(jīng)加權(quán)處理的敏感因子;xi為第i個加權(quán)處理后的敏感因子。
不同相關(guān)系數(shù)對應(yīng)的相關(guān)程度如表1所示。
表1 不同相關(guān)系數(shù)對應(yīng)的相關(guān)程度Table 1 Correlativity corresponded by different correlation coefficients
一個預(yù)測精度不足的模型對于實際生產(chǎn)需求毫無意義,因此,如何選取一個合適的標準來評判預(yù)測精度顯得尤為重要。本文由于樣本點較少,使用單個指標來評判Kriging模型的預(yù)測精度時,會因為個別特殊樣本點的存在使得預(yù)測結(jié)果缺少可信度。為了克服這個缺點,本文繼續(xù)采用文獻[16]中的3個預(yù)測指標(均方根誤差(ERMS)、最大絕對誤差(EMA)和平均絕對誤差(EAA))綜合評判預(yù)測模型的精度,計算式為:
(15)
用這3個誤差的均值作為最終衡量依據(jù),誤差越小則預(yù)測模型的精度越高。
為了驗證相關(guān)性分析后的Kriging代理模型能否提高造斜率預(yù)測精度,采用文獻[20]中四川省某井段鉆井參數(shù)進行預(yù)測模型構(gòu)建。鉆井參數(shù)如表2所示。
表2 四川省某井段鉆井參數(shù)Table 2 Drilling parameters of a hole interval in the Sichuan Basin
部分鉆井參數(shù)示意圖如圖1所示。
圖1 部分鉆井參數(shù)示意圖Fig.1 Schematic diagram of some drilling parameters
圖1中,X、Z分別指向井眼軸線的切線方向和井眼高邊方向;X、Y、Z共同構(gòu)成笛卡爾坐標系,以此確定Y的指向;向量ef、er和ea分別指向鉆頭合力方向、實際鉆進方向和鉆具軸線方向;F為鉆頭側(cè)向力;αa為鉆頭偏轉(zhuǎn)角、αf為鉆頭合力角、αr為鉆進趨勢角。
為了降低由樣本數(shù)據(jù)分布區(qū)間差異造成的造斜率預(yù)測精度不足,采用MinMaxScaler法對樣本數(shù)據(jù)進行歸一化處理。由于對初始參數(shù)中鉆頭側(cè)向力、鉆頭偏轉(zhuǎn)角、鉆頭合力角、鄰井造斜率以及初始井斜進行了歸一化變換,其物理意義已不再是對應(yīng)的鉆井參數(shù),但在某種意義上能夠反映對應(yīng)的鉆頭側(cè)向力等鉆井參數(shù)。故將變換后的鉆頭側(cè)向力、鉆頭偏轉(zhuǎn)角、鉆頭合力角、鄰井造斜率以及初始井斜分別記為X1、X2、X3、X4、X5。歸一化后的鉆井數(shù)據(jù)如表3所示。
該數(shù)據(jù)集僅有26個樣本,為了同時實現(xiàn)模型構(gòu)建及造斜率預(yù)測,由程序隨機抽取其中22組數(shù)據(jù)構(gòu)建造斜率預(yù)測模型,用剩余的4個樣本檢驗?zāi)P偷木取S捎诓煌挠?xùn)練樣本得到的預(yù)測模型精度不同,重復(fù)試驗300次,選取預(yù)測精度最高的預(yù)測模型作為最終輸出結(jié)果。下文涉及到的計算數(shù)據(jù)為最優(yōu)預(yù)測模型對應(yīng)的計算結(jié)果。
首先運用統(tǒng)計學(xué)相關(guān)理論分析該數(shù)據(jù)中各個影響因素與造斜率之間的相關(guān)性,得出對應(yīng)的相關(guān)系數(shù),相關(guān)性分析結(jié)果如表4所示。
表4 各影響因素與造斜率之間的相關(guān)性分析結(jié)果Table 4 Correlation analysis results between influential factors and build-up rate
表4中,相關(guān)系數(shù)表示各個影響因素與造斜率之間的相關(guān)性大小,其絕對值越接近1,表示相關(guān)程度越高[21-22]。
為了直觀地比較相關(guān)性分析結(jié)果,將表4中各個數(shù)據(jù)轉(zhuǎn)化為柱狀圖,如圖2所示。從圖2可以直觀地看出,鉆頭偏轉(zhuǎn)角與造斜率之間的相關(guān)程度最低且相關(guān)系數(shù)僅為0.04,故可以將其看作“無關(guān)變量”處理。將該因素剔除后用剩余的4個敏感因子再進行模型構(gòu)建。此處結(jié)論與文獻[19]中基于神經(jīng)網(wǎng)絡(luò)預(yù)測法的分析結(jié)果一致。
圖2 各影響因素與造斜率之間的相關(guān)系數(shù)柱狀圖Fig.2 Correlation coefficients between influential factors and build-up rate
剔除了無關(guān)變量之后,將剩余的4個敏感因子X1、X3、X4及X5根據(jù)下式進行加權(quán)變換:
(16)
式中:X1、X3、X4及X5分別表示經(jīng)過加權(quán)變換后的4個敏感因子;X10、X30、X40及X50分別為對應(yīng)于X1、X3、X4及X5加權(quán)變換前的敏感因子。
對數(shù)據(jù)進行加權(quán)變換后即可代入數(shù)學(xué)軟件構(gòu)建預(yù)測模型。用于構(gòu)建預(yù)測模型的最終數(shù)據(jù)見表5。
表5 用于構(gòu)建預(yù)測模型的最終數(shù)據(jù)Table 5 Final data for building prediction model
為了做對照,本文先采用初始數(shù)據(jù)(5個影響因素)中22個樣本構(gòu)建Kriging代理模型,并將剩余4個樣本代入預(yù)測模型進行造斜率預(yù)測;隨后,用表5中經(jīng)過多種處理后的數(shù)據(jù)(剔除無關(guān)因素
并進行數(shù)據(jù)處理后的數(shù)據(jù)集)重復(fù)上述操作,并與未經(jīng)數(shù)據(jù)處理的預(yù)測模型進行預(yù)測值對比。由于撰寫需要,下文中的所有計算結(jié)果僅保留兩位小數(shù)。造斜率預(yù)測結(jié)果如圖3所示。
圖3 優(yōu)化前、后的Kriging法造斜率預(yù)測值Fig.3 Predicted values of build-up rate using Kriging method before and after optimization
從圖3可以看出,在4個用以測試的樣本點處,相較于使用初始數(shù)據(jù)進行模型構(gòu)建,經(jīng)過相關(guān)性分析后的Kriging代理模型能使造斜率預(yù)測值更接近實際值。其中,在各個用于測試的“待估點”處,造斜率預(yù)測偏差(預(yù)測值與真實值之差的絕對值)如圖4所示。
圖4 優(yōu)化前、后的Kriging法造斜率預(yù)測偏差Fig.4 Prediction deviations of build-up rate using Kriging method before and after optimization
從圖4可以看出,剔除“無關(guān)因素”之后構(gòu)建的Kriging代理模型的預(yù)測誤差要低于用原始數(shù)據(jù)構(gòu)建的Kriging代理模型。但實際造斜率越趨近于造斜極限,造斜率預(yù)測值偏離實際值的程度越大。究其原因,主要是訓(xùn)練樣本點過少,隨著越來越多高影響因素的加入,該模型的預(yù)測精度將會進一步提升。
由于待估點過少,僅采用待估點的預(yù)測偏差判斷模型優(yōu)劣可能會使試驗不具備說服性??紤]到文獻[16]中使用了ERMS、EMA和EAA等3個指標來判斷模型的預(yù)測精度,本文繼續(xù)采用這3個指標,以此來增加試驗結(jié)果的可信度。試驗結(jié)果如圖5所示。
降低誤差等效于提升精度。為了更加直觀地看出此方法對預(yù)測模型預(yù)測精度的提升效果,將預(yù)測精度提升率(誤差的降低值與改進前的誤差值的比值)以百分比的形式表示,結(jié)果如圖6所示。
由圖5和圖6可以看出:剔除“無關(guān)因素”前均方根誤差、最大絕對誤差、平均絕對誤差及3種誤差平均值分別為2.51、4.28、2.07及2.95;剔除“無關(guān)因素”后均方根誤差、最大絕對誤差、平均絕對誤差及3種誤差平均值分別為2.17、3.79、1.71和2.56;相較于用初始數(shù)據(jù)構(gòu)建的Kriging代理模型,改進后模型的3種誤差RMSE、MAE及AAE分別降低了13.26%、11.53%和17.37%,3種誤差的平均值降低了13.39%。由此可知,剔除“無關(guān)”因素之后再構(gòu)建Kriging代理模型,預(yù)測誤差能降低13.39%,即預(yù)測精度能得到有效提升。
任何工程研究起源于工程問題也要應(yīng)用于工程問題。實際鉆探過程中可以通過檢測鉆頭所在位置,從而得知井眼軌跡是否偏離了目標地層,然而這樣做的弊端也不容忽視,即當檢測到井眼軌跡偏離目標地層后,此時已釀成工程事故,工作人員能做的也僅僅是補救。
本文所探討的造斜率預(yù)測方法能夠在鉆井作業(yè)時實時預(yù)測下一時刻的造斜率,通過提前設(shè)置目標地層所在位置和傳感器返回的鉆具當前位姿,綜合計算鉆具鉆入目標地層所需的造斜率。在鉆頭側(cè)向力、鉆頭偏轉(zhuǎn)角、鉆頭合力角、鄰井造斜率以及初始井斜5個因素中,根據(jù)本文相關(guān)性分析結(jié)果,鉆頭偏轉(zhuǎn)角對實際造斜率影響相對較小,可不予考慮;對于一口確定的井來說,鄰井造斜率及初始井斜皆為常量,可根據(jù)現(xiàn)場數(shù)據(jù)給出;鉆頭側(cè)向力和鉆頭合力角可根據(jù)底部鉆具組合的力學(xué)特性[23-25]求出。本文主要研究造斜率預(yù)測模型精度的提升,對于力學(xué)參數(shù)的計算不展開討論。
高精度Kriging代理模型實際使用流程如圖7所示。鉆井作業(yè)時,在造斜率預(yù)測系統(tǒng)中可提前輸入鄰井造斜率及初始井斜,并實時計算鉆頭側(cè)向力、鉆頭合力角以及目標地層所需的造斜率(命名為計算造斜率)。用本文造斜率預(yù)測模型實時預(yù)測下一時刻的造斜率(命名為預(yù)測造斜率),并與計算造斜率比較。以指向式導(dǎo)向工具為例,若預(yù)測造斜率小于計算造斜率,則需調(diào)節(jié)偏心環(huán)使其能夠提供更大的偏置力以增加工具的實際造斜率;若預(yù)測造斜率大于工具計算造斜率,則反之。預(yù)測模型的精度越高,工具準確鉆入目標地層的概率也就越大,在一定程度上能夠降低井眼軌跡偏離目標地層的風(fēng)險。
圖7 高精度Kriging代理模型實際使用流程圖Fig.7 Flow chart for actual use of high accuracy Kriging surrogate model
(1)Kriging代理模型最終表達式中,除了矩陣r以外的所有元素僅與訓(xùn)練樣本有關(guān),在實際運用過程中可在首次計算完成之后將訓(xùn)練好的模型存儲下來,后續(xù)預(yù)測時僅需代入與待估點相關(guān)的矩陣r即可快速得出相應(yīng)的造斜率預(yù)測值,大大提高效率。
(2)雖然用于預(yù)測的輸入變量越多,預(yù)測精度越高,但這并不代表所有因素都應(yīng)被用于構(gòu)建預(yù)測模型,有些因素會使樣本點變得更加離散化,降低預(yù)測精度。因此,應(yīng)該恰當?shù)剡x擇合適的輸入因素,以獲得精度更高的預(yù)測模型。
(3)運用相關(guān)性分析求得訓(xùn)練樣本的造斜率與各個影響因素之間的相關(guān)系數(shù),剔除相關(guān)性較低的數(shù)據(jù)能有效降低預(yù)測誤差。在本文所選數(shù)據(jù)中,3種誤差(ERMS、EMA和EAA)分別降低了13.26%、11.53%和17.37%,3種預(yù)測誤差平均降低了13.39%。
(4)建立的預(yù)測模型可適用于多領(lǐng)域中的多變量響應(yīng)問題,隨著訓(xùn)練樣本中具有較高相關(guān)性的參數(shù)增多,模型預(yù)測精度會進一步提高,井眼軌跡偏離目標地層的風(fēng)險也會進一步降低。
(5)下一步研究將考慮不同因素間交互效應(yīng)的影響,進一步提高預(yù)測精度。