馮向東,張玉琴,韓紅偉,張建亮
(成都理工大學(xué) 工程技術(shù)學(xué)院,四川 樂山 614007)
地球物理曲線的分層研究對(duì)勘探和開發(fā)油氣資源是一種重要手段,是在認(rèn)識(shí)油氣層的地質(zhì)面貌和剖析油氣藏量的內(nèi)在規(guī)律等方面的一種較為有力的武器。測井的第一步就是需要利用各種各樣的儀器與設(shè)備,來對(duì)各種巖層中所含的物理參數(shù)進(jìn)行測量,例如放射性、導(dǎo)電性、以及聲學(xué)特性等,第二步則需要對(duì)測井曲線進(jìn)行研究與分析,從而可以較好地得到巖性信息與地質(zhì)信息[1]?,F(xiàn)階段較為常用的測井方法有放射測井、成像測井、電測井和聲波測井等等,其所得到的各種參數(shù)結(jié)果,從某一側(cè)面都能夠反映相應(yīng)的地質(zhì)特性。當(dāng)然,假如想對(duì)地質(zhì)的構(gòu)造及變化進(jìn)行全面的研究,那么就必須綜合多種測井參數(shù)。
測井曲線的層序劃分在油井勘測開發(fā)中必不可少,在對(duì)地層進(jìn)行劃分、對(duì)地層的巖性進(jìn)行判別、對(duì)儲(chǔ)層進(jìn)行預(yù)測等方面都具有非常重要的意義。長期以來,在進(jìn)行地質(zhì)分層時(shí),不僅僅考慮曲線的形態(tài),還需要根據(jù)曲線反映的各種信息通過分層人員豐富的知識(shí)來獲得最優(yōu)解,可是這不僅需要具備豐富的知識(shí)積累和熟練程度,而且費(fèi)時(shí)費(fèi)力,主觀性還很強(qiáng),并且由于沒有一個(gè)統(tǒng)一的分層準(zhǔn)則,每個(gè)人都使用自己的分層方式,導(dǎo)致結(jié)果的差異性過大,出錯(cuò)率也較高。而與人工分層相比,自動(dòng)分層不僅可以規(guī)避人為分層的隨意性,還可以較大程度地提高工作效率并且避免一定的失誤率[2]。
現(xiàn)階段,通過測井曲線來進(jìn)行地質(zhì)面貌的分析時(shí),主要方法還是按照層來進(jìn)行分析的,因此第一步就必須完成曲線的分層分析。由于每個(gè)物理層的地質(zhì)特征應(yīng)該是相似或者相同的,因此首先可以通過相似的曲線來把剖面劃分成若干個(gè)小層。這樣做的目的,不僅可以有效降低非地層因素的干擾,同時(shí)也可以突出地層與地層中所擁有的流體物質(zhì)的變化,進(jìn)而大大地提高了解釋的精度。在過去較長的一段時(shí)間里,基本上都是測井人員人工先對(duì)曲線的形態(tài)變化進(jìn)行觀察,再依據(jù)自身所積累的經(jīng)驗(yàn)來找出曲線中每一段所含有的半幅點(diǎn)位置,用來劃分地層。顯然由于測井人員自身所積累的經(jīng)驗(yàn)的高低,以及熟練程度的差異,其所得到的分層結(jié)果必然會(huì)有特別大的誤差,最終導(dǎo)致了準(zhǔn)確率的降低。
隨著計(jì)算機(jī)技術(shù)逐步應(yīng)用到測井的解釋中,自動(dòng)分層技術(shù)[3-5]也獲得了較快的發(fā)展,不僅減少了以往那些人工解釋中含有的人為因素所造成的分層誤差,同時(shí)大大提高了工作效率。現(xiàn)有的利用曲線來自動(dòng)劃分地層的方法,按照數(shù)學(xué)分類的準(zhǔn)則主要是數(shù)理統(tǒng)計(jì)方法和非數(shù)理統(tǒng)計(jì)方法,以及人工智能算法[2]。而這些數(shù)學(xué)方法也都各有優(yōu)缺點(diǎn)。
數(shù)理統(tǒng)計(jì)方法主要有方差分析法、聚類分析法[6-11]等,但如果在細(xì)致分層時(shí)使用這種方法,其計(jì)算量將會(huì)非常大,普通的家用計(jì)算機(jī)根本無法承受這樣的計(jì)算量。非數(shù)理統(tǒng)計(jì)方法是以小波變換方法[12-13]和活度函數(shù)法為主。人工智能算法主要還是使用BP神經(jīng)網(wǎng)絡(luò)[14-17],可是如果使用神經(jīng)網(wǎng)絡(luò)并且想要保證分類結(jié)果的正確性,就需要有大量的樣本才能實(shí)現(xiàn),同時(shí)還有可能會(huì)陷入局部最優(yōu)解,因此其分類結(jié)果有較大的可能性會(huì)存在誤差。
另外,大量的支持向量機(jī)改進(jìn)算法[18-20]被用于分類,同時(shí)支持向量機(jī)在測井解釋中的應(yīng)用[21-22]也被陸續(xù)提出,但所需的分類問題中應(yīng)該是大量的多分類問題,而支持向量機(jī)本身其實(shí)是二類的分類算法,所以如果利用支持向量機(jī)來處理多分類問題,這將是一個(gè)需要值得深入進(jìn)行研究的課題。
針對(duì)聚類分析和BP神經(jīng)網(wǎng)絡(luò)算法存在的問題,通常采用的做法是主成分分析降維或者是選取有代表性的幾條曲線來實(shí)現(xiàn)。但是無論哪一種做法,都會(huì)使得有用信息缺失,造成分層錯(cuò)誤。該文將結(jié)合自組織神經(jīng)網(wǎng)絡(luò),來對(duì)油氣層的識(shí)別進(jìn)行數(shù)據(jù)的分析。
在收集的某地區(qū)測井?dāng)?shù)據(jù)中,首先在采用放射測井時(shí),可能會(huì)遭受到來自核外電子、核衰變、伽馬量子等方面的隨機(jī)作用,許多與地質(zhì)特性根本沒有關(guān)系的起伏變化會(huì)出現(xiàn)在測得的曲線上;同時(shí),由于聲波會(huì)經(jīng)過多次的折射與反射、測井探頭會(huì)遭到隨機(jī)碰撞等原因,曲線上必將出現(xiàn)大量帶有毛刺的干擾。顯然如果在進(jìn)行測井解釋時(shí),直接使用這些帶有干擾的曲線來進(jìn)行,其分類的結(jié)果必然會(huì)含有很大的誤差。以自然伽瑪數(shù)據(jù)為例,見圖1。所檢測的7 482個(gè)數(shù)據(jù)中,有375個(gè)異常數(shù)據(jù)點(diǎn)。
圖1 原始數(shù)據(jù)
因此對(duì)于這些與地質(zhì)無關(guān)信息的干擾,必須設(shè)法濾除;同時(shí)曲線上能反映地質(zhì)特性的有用成分,也必須最大限度地保留。通常出現(xiàn)這樣的情況,不少工作人員會(huì)采取去除異常點(diǎn)或者前后兩點(diǎn)取平均值的方法來解決。但這樣無形中給自動(dòng)分層加入了人為因素。
由于同一層物質(zhì)的連續(xù)性,因此同一指標(biāo)應(yīng)該是連續(xù)變化的,采用三次樣條插值的方法進(jìn)行測井曲線平滑處理,修正以后的數(shù)據(jù)曲線見圖2。同時(shí)也為后續(xù)地層劃分和測井分析提供了正確、有力的數(shù)據(jù)支持。
圖2 修正以后的數(shù)據(jù)
自組織神經(jīng)網(wǎng)絡(luò)算法是一種在沒有監(jiān)督學(xué)習(xí)的狀態(tài)下神經(jīng)網(wǎng)絡(luò)映射的過程,它是通過神經(jīng)元之間的相互競爭與學(xué)習(xí)來完成的。在整個(gè)學(xué)習(xí)的過程中只需存在有一些學(xué)習(xí)的樣本,而不用去提供理想的目標(biāo)與輸出。通過輸入樣本的特征,該網(wǎng)絡(luò)會(huì)自組織地進(jìn)行映射,同時(shí)對(duì)訓(xùn)練的樣本進(jìn)行自動(dòng)分類[23-25]。自組織神經(jīng)網(wǎng)絡(luò)主要是由輸入層與競爭層所構(gòu)成。在模式識(shí)別問題中,該網(wǎng)絡(luò)的輸入向量是能反映油氣模式的訓(xùn)練樣本,在訓(xùn)練網(wǎng)絡(luò)的過程中,權(quán)值向量與輸入向量中,誰最接近神經(jīng)元,就會(huì)在競爭中最終獲勝。當(dāng)然該神經(jīng)網(wǎng)絡(luò)也會(huì)根據(jù)自身的學(xué)習(xí)規(guī)則,及時(shí)對(duì)這個(gè)獲勝的神經(jīng)元進(jìn)行權(quán)值的調(diào)整,獲勝神經(jīng)元的權(quán)值向量在修改后,也能夠更加接近當(dāng)前的輸入向量。最終可以將任意維的輸入向量,變換到一維或二維離散的網(wǎng)絡(luò)上,同時(shí)保持一定的拓?fù)溆行蛐浴?/p>
(1)
其次就是需要確定最佳匹配單元的領(lǐng)域,該領(lǐng)域是隨迭代次數(shù)n的變化而變化的,故稱此為領(lǐng)域函數(shù)Λi(n)。當(dāng)然,這里還需要一個(gè)在Λi(n)內(nèi)的單元例能夠修改權(quán)值的公式。為此將加入一個(gè)遺忘項(xiàng)—g(yj)wj,其中g(shù)(yj)是單元j的輸出的非負(fù)的標(biāo)量函數(shù),而且滿足:
yj=0,g(yj)=0,?j
(2)
這樣,用微分方程來表示權(quán)值的學(xué)習(xí):
(3)
網(wǎng)絡(luò)的學(xué)習(xí)目的,就是在最佳的匹配單元周圍形成一定的“氣鼓”,在這里選?。?/p>
(4)
由式(2),有:
(5)
帶入式(3),有:
(6)
為了進(jìn)一步簡化,取α=η,η為學(xué)習(xí)步長,則式(6)變?yōu)椋?/p>
(7)
對(duì)離散的情況:
wj(n+1)=
(8)
SOM算法的步驟大致可以歸納如下,主要由競爭過程、協(xié)作過程和自適應(yīng)調(diào)整過程組成:
Step1:初始化權(quán)值向量,選用較小的隨機(jī)數(shù)對(duì)各個(gè)權(quán)值向量賦初值wj(0),而各個(gè)節(jié)點(diǎn)的權(quán)值必須取為不同的值。
Step2:在樣本集合中任意選取一個(gè)樣本x作為輸入向量。
Step3:在時(shí)刻n,選取最佳的匹配單元i,即:
Step4:確定領(lǐng)域函數(shù)Λi(n)。
Step5:修正權(quán)值
wj(n+1)=
Step6:n←n+1,返回Step2,直到形成有意義的映射圖。
在分析數(shù)據(jù)過程中,需要結(jié)合工程應(yīng)用中的實(shí)際需要來對(duì)指標(biāo)進(jìn)行篩選。在某地區(qū)的3號(hào)井中,選取了自然伽馬(GR)、聲波時(shí)差(AC)、密度(DEN)、深側(cè)向(RLLD)、微球形狀聚焦(RMSF)等19個(gè)指標(biāo),共計(jì)7 478×19個(gè)數(shù)據(jù)。以水層、油層、油水同層和干層等四種層位進(jìn)行研究。
按照前面提到的算法步驟,采用自己編寫的MATLAB程序:
clc,clear,
A=load('shujuLG022.txt');
X=A';
[n,p]=size(X);
m=4;%要求輸出4個(gè)神經(jīng)元
K=5 000;% 最大訓(xùn)練次數(shù)
a=0.5;%初始比例系數(shù)
a1=min(A);a2=max(A); A1=repmat(a1',1,m);A2=repmat(a2',1,m);
W=unifrnd(A1,A2);%隨機(jī)產(chǎn)生權(quán)值
for k=1:K
r=floor(5*(K-k)/K);%修改鄰域半徑
b=a*(K-k)/K;%修改比例系數(shù)
for t=1:p
for j=1:m
Y(j)=norm(X(:,t)-W(:,j));
end
i=find(Y==min(Y));
i=i(1);%尋找獲勝單元
for j=1:m
if abs(j-i)<=r
W(:,j)=W(:,j)+b*(X(:,t)-W(:,j));%修改權(quán)值
end,
end,
end,
end
W
for i=1:p
c=X(:,i);
CC=repmat(c,1,m);
AA=CC-W;
SSS=sqrt(sum(AA.^2));
k=find(SSS==min(SSS));
T(i)=k;
end
T
經(jīng)過計(jì)算,7 478個(gè)數(shù)據(jù)的分層結(jié)果中,在四種層位分別所占比重見圖3。油水同層所占比重最小,只占到3%,水層次之,有16%,而油層最多,占到了41%。并從中選出10個(gè)原始數(shù)據(jù)的分類結(jié)果,放在表1里。
圖3 各層在原始數(shù)據(jù)中所占的比重
表1 部分?jǐn)?shù)據(jù)的分類結(jié)果
為了驗(yàn)證以上分類結(jié)果的正確性,就需要對(duì)各層的物性及含油性進(jìn)行評(píng)價(jià),同時(shí)掌握各層中不同曲線所能展示出來的不同特征。
油層的特征包括微電極的曲線幅度中等,帶有明顯的正幅度差,如果滲透性變差則幅度差將會(huì)變??;自然電位曲線會(huì)顯示出正異?;蜇?fù)異常,伴隨泥質(zhì)含量的增加其異常幅度隨之變?。婚L、短電極將視電阻率曲線呈現(xiàn)有高阻的特征;感應(yīng)曲線顯示出明顯的低電導(dǎo);而聲波的時(shí)差值處于中等,曲線平緩也將呈現(xiàn)平臺(tái)狀。
油水層的特征有微電極曲線幅度處于中等,正幅度差明顯,但若與油層相比較,其幅度會(huì)相對(duì)降低;自然電位曲線同樣顯示有正負(fù)異常,但異常幅度值將會(huì)比油層要大;短電極視電阻率曲線的幅度較高,但是長電極視電阻率曲線幅度將會(huì)較低,高電導(dǎo)值會(huì)顯示在感應(yīng)曲線中;聲波的時(shí)差數(shù)值同樣處于中等,且呈現(xiàn)平臺(tái)狀,而井徑通常會(huì)小于鉆頭的直徑。
干層的特征為極淺電阻率曲線幅度處于中等,帶有明顯的正幅度差;若與油水層比,其幅度又會(huì)再次降低;自然電位曲線和油水層一樣,展現(xiàn)出正異?;蜇?fù)異常,但其異常幅度值會(huì)比油水層大;在聲波的時(shí)差曲線中,伴有明顯的數(shù)值增大、周波跳躍的現(xiàn)象,而中子伽瑪?shù)那€幅度比油層更高。
水層呈現(xiàn)有極淺電阻率,曲線幅度中等,正幅度差明顯,其幅度比油層要低;自然電位曲線依然會(huì)顯示有正負(fù)異常,而異常的幅度值比油層要大。
以人工分層準(zhǔn)則的結(jié)果作為標(biāo)準(zhǔn),自組織神經(jīng)網(wǎng)絡(luò)算法所的結(jié)果,準(zhǔn)確率達(dá)到82.17%。說明自組織神經(jīng)網(wǎng)絡(luò)算法基本上滿足分層的要求,能夠較為成功地識(shí)別該組數(shù)據(jù),并且利用計(jì)算機(jī)所花時(shí)間大大少于人工分層所用時(shí)間。
該文主要是通過采用自組織神經(jīng)網(wǎng)絡(luò)來對(duì)油氣數(shù)據(jù)的分層應(yīng)用進(jìn)行聚類研究。通過自己編寫的MATLAB程序算法對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化設(shè)計(jì)和處理,并將測井的數(shù)據(jù)和最終的數(shù)據(jù)處理結(jié)果,都放在了同樣的一個(gè)系統(tǒng)之中,使其能夠自動(dòng)完成測井?dāng)?shù)據(jù)和得到油氣分層識(shí)別之間的一個(gè)高度映射關(guān)系,充分反映出輸入的測井曲線信號(hào)特征和油氣層之間的內(nèi)在聯(lián)系,為油氣層網(wǎng)絡(luò)的自動(dòng)識(shí)別創(chuàng)造了條件。而在數(shù)據(jù)輸入初期,通過插值的方式,消除該測井?dāng)?shù)據(jù)隨機(jī)干擾帶來的噪聲,同時(shí)也保留了數(shù)據(jù)的完整性和代表性;最后,與該地區(qū)的地質(zhì)資料進(jìn)行對(duì)比,結(jié)合人工分層的結(jié)果加以驗(yàn)證,以保證利用自組織神經(jīng)網(wǎng)絡(luò)識(shí)別的結(jié)果能夠更加客觀和可靠。
研究結(jié)果表明,采用自組織神經(jīng)網(wǎng)絡(luò)進(jìn)行油氣層識(shí)別是可行的,該方法的可操作性強(qiáng),原理簡單易于實(shí)現(xiàn),參數(shù)與網(wǎng)絡(luò)結(jié)構(gòu)容易調(diào)整,識(shí)別率比較高,是研究測井曲線的一種有效的手段。該方法不僅能夠?qū)鴥?nèi)現(xiàn)有的油氣田進(jìn)行油氣層的識(shí)別,還可以對(duì)原有的舊井進(jìn)行再次復(fù)查,以便能夠發(fā)現(xiàn)是否存在新的油氣層位,提高油氣產(chǎn)量。
當(dāng)然,該方法僅僅是在數(shù)據(jù)分析基礎(chǔ)上建立的,沒有能夠結(jié)合地質(zhì)學(xué)中相關(guān)的知識(shí)。從最后與人工分層的結(jié)果驗(yàn)證來看,如果在此算法的基礎(chǔ)之上,能夠再依據(jù)地質(zhì)學(xué)中的專業(yè)知識(shí),那么將是對(duì)測井曲線進(jìn)行了更加科學(xué)的分析,也必將得到更加合理的分層結(jié)果。