沈 華,宋 煒,唐傳章,張銳鋒,王澤丹,黃新亞,王會(huì)來(lái),劉 慧
(1.中國(guó)石油天然氣股份有限公司華北油田分公司勘探事業(yè)部,河北任丘062550;2.中國(guó)石油大學(xué)(北京)地球物理學(xué)院,北京102249;3.中國(guó)石油天然氣股份有限公司華北油田分公司勘探開(kāi)發(fā)研究院,河北任丘062550)
隨著油田精細(xì)勘探的不斷推進(jìn),深層巖性油氣藏和復(fù)雜潛山油氣藏成為油氣勘探的重要地質(zhì)目標(biāo),提高地震資料分辨率、改善目的層成像精度已深入到地震勘探的全過(guò)程。決定地震分辨率的關(guān)鍵是有效頻帶寬度,而制約有效頻帶寬度的兩個(gè)主要因素是反射信號(hào)的能量和頻寬,因此,如何在地震采集和處理過(guò)程中保持有效信號(hào)的能量和頻寬,是研究的焦點(diǎn)問(wèn)題之一。
地震波在地下介質(zhì)中傳播時(shí),波的能量吸收因素主要來(lái)自介質(zhì)粘彈性引起的吸收作用[1]。在松散的地層或裂隙發(fā)育的地層中,地震波的吸收響應(yīng)比地震波速響應(yīng)更為敏感[2-4]。華北油田冀中探區(qū)地表平緩,但表層結(jié)構(gòu)松散且復(fù)雜多變、速度低,對(duì)地震波的吸收、衰減嚴(yán)重,導(dǎo)致地震資料分辨率低,尤其在表層結(jié)構(gòu)復(fù)雜地區(qū)地震資料品質(zhì)較差,難以滿足復(fù)雜構(gòu)造、深潛山和地層巖性勘探的需求[5-8]。巖石物理學(xué)研究結(jié)果表明,地下介質(zhì)對(duì)地震波的吸收作用與介質(zhì)固結(jié)程度、孔隙度和孔隙充填物關(guān)系密切[9-10]。因此,固結(jié)巖層的吸收規(guī)律不能簡(jiǎn)單地應(yīng)用于表層未固結(jié)低、降速帶。在常規(guī)地震資料處理中,地震波的吸收衰減補(bǔ)償只針對(duì)淺、中、深層,而表層低、降速帶介質(zhì)對(duì)地震子波的吸收衰減基本未進(jìn)行補(bǔ)償。為了更好地消除復(fù)雜近地表因素對(duì)采集、處理帶來(lái)的影響,需要對(duì)近地表結(jié)構(gòu)有清晰的認(rèn)識(shí),并獲取準(zhǔn)確的近地表結(jié)構(gòu)屬性參數(shù)模型,如低、降速帶厚度、速度、品質(zhì)因子(Q)等。多年來(lái),諸多學(xué)者在復(fù)雜近地表結(jié)構(gòu)特征參數(shù)調(diào)查[2-4]、激發(fā)條件及觀測(cè)方式[5-8]、復(fù)雜近地表的吸收衰減因子求取與有效補(bǔ)償[11-21]、復(fù)雜近地表速度建模及靜校正[22-24]等方面開(kāi)展了大量的研究,并取得豐碩的研究成果。華北油田冀中探區(qū)表層結(jié)構(gòu)的復(fù)雜性、介質(zhì)不均勻性以及未固結(jié)低、降速帶嚴(yán)重的吸收衰減,使得表層地震波的衰減補(bǔ)償變得十分復(fù)雜。
本文針對(duì)華北油田實(shí)際生產(chǎn)面臨的兩個(gè)問(wèn)題開(kāi)展研究。一個(gè)是在高吸收衰減區(qū)地震資料分辨率和信噪比低,往往處理后,再要求施工方補(bǔ)炮,延誤了數(shù)據(jù)采集的進(jìn)度。另一個(gè)是基于環(huán)保的需要和對(duì)資料精度的要求,2018年底華北油田引進(jìn)自適應(yīng)非線性掃描激發(fā)采集技術(shù),在冀中探區(qū)同口三維工區(qū)開(kāi)展可控震源采集,由于自適應(yīng)非線性掃描激發(fā)需要在每個(gè)激發(fā)點(diǎn)先按常規(guī)線性掃描激發(fā),然后根據(jù)接收的單炮數(shù)據(jù)設(shè)計(jì)自適應(yīng)激發(fā)參數(shù),導(dǎo)致野外施工進(jìn)度緩慢,成本增加,當(dāng)時(shí)提出了施工前將近地表分類,再根據(jù)近地表類別分別進(jìn)行常規(guī)線性掃描采集,確定不同類別地表?xiàng)l件下的自適應(yīng)激發(fā)因子,具體施工時(shí),按分類結(jié)果實(shí)施,但是由于時(shí)間倉(cāng)促,未能提出較好的分類算法,主要采用平均衰減因子作為分類依據(jù),由于分類太粗,在生產(chǎn)中并不能滿足需求。
本文在前人研究的基礎(chǔ)上,利用冀中探區(qū)近萬(wàn)平方公里范圍內(nèi)的微測(cè)井解釋成果,在構(gòu)建和分析近地表結(jié)構(gòu)特征屬性參數(shù)的基礎(chǔ)上,基于機(jī)器學(xué)習(xí)的平衡迭代規(guī)約和層次聚類分析(balanced Iterative reducing and clustering using hierarchies,BIRCH)方法[25-28],對(duì)華北油田冀中探區(qū)進(jìn)行了多屬性參數(shù)分類劃分,將不同類別勘探區(qū)域的表層吸收衰減參數(shù)用于采集參數(shù)設(shè)計(jì)優(yōu)化和地震資料處理,為深化華北油田冀中探區(qū)復(fù)雜地質(zhì)目標(biāo)的地震勘探提供有效的技術(shù)支撐。
華北油田冀中探區(qū)雖然地表平緩,但表層結(jié)構(gòu)復(fù)雜多變,特別是人類活動(dòng)對(duì)表層結(jié)構(gòu)的改造,加劇了表層結(jié)構(gòu)的縱橫向變化。從高程數(shù)據(jù)可以看出,冀中探區(qū)地勢(shì)總體平坦,南、北部較高,中間區(qū)域較低,海拔在-1.7~36.8m,平均海拔14.24m(圖1)。探區(qū)表層結(jié)構(gòu)變化復(fù)雜,低、降速帶厚度從幾米到四五十米,橫向變化劇烈。地震勘探過(guò)程中,由于表層結(jié)構(gòu)松散、速度比較低,因而對(duì)地震波的吸收、衰減非常嚴(yán)重,一些表層結(jié)構(gòu)復(fù)雜的地區(qū)地震資料品質(zhì)較差,甚至得不到有效的深層反射信息。受表層和深層條件雙重影響,研究區(qū)內(nèi)已有的一次和二次三維采集的地震資料信噪比低、頻帶窄,深層地震波吸收衰減嚴(yán)重,處理、解釋結(jié)果達(dá)不到實(shí)際生產(chǎn)的要求。
圖1 華北油田冀中探區(qū)地表高程分布情況
通過(guò)微測(cè)井?dāng)?shù)據(jù)分析將華北油田冀中探區(qū)近地表分為低速層、降速層,冀中探區(qū)低、降速層的厚度(h)不同,速度橫向上也有顯著差別(圖2)。
球面擴(kuò)散是導(dǎo)致反射信號(hào)能量降低的主要因素,吸收是使反射信號(hào)頻帶寬度變窄的主要因素,其中表層吸收尤為嚴(yán)重,是降低分辨率的主要因素之一。描述介質(zhì)吸收性質(zhì)的有關(guān)參數(shù)包括吸收系數(shù)α和品質(zhì)因子Q。均勻吸收介質(zhì)中傳播的平面波振幅方程為:
A(r,t)=A0e-αrω(t)
(1)
圖2 低、降速層厚度及速度屬性
在吸收介質(zhì)中,振幅隨傳播距離的增大而呈指數(shù)減小。其中,r為地震波的傳播距離,A0是初始振幅,A是地震波傳播r后的振幅譜,ω(t)是波動(dòng)函數(shù),α為吸收系數(shù)。品質(zhì)因子是用來(lái)度量介質(zhì)對(duì)地震波能量吸收衰減的參量,地震勘探中常用能量損耗因子來(lái)表達(dá):
(2)
其中,在諧波激勵(lì)情況下,ΔE表示每震動(dòng)一個(gè)周期的能量損耗量,E表示系統(tǒng)中處于最大應(yīng)力和應(yīng)變狀態(tài)下的瞬時(shí)彈性勢(shì)能,品質(zhì)因子Q代表了儲(chǔ)能與耗散能量之比,1/Q表示能量損耗因子,其值越大說(shuō)明地層對(duì)地震波的吸收衰減作用越劇烈。由對(duì)數(shù)函數(shù)關(guān)系表可知,品質(zhì)因子是一個(gè)正數(shù),Q值越小,能量損耗越大。圖3是冀中探區(qū)低、降速帶品質(zhì)因子屬性圖,可見(jiàn)探區(qū)內(nèi)品質(zhì)因子變化較大。地震波在近地表傳播衰減過(guò)程可以表示為:
(3)
式中:Hi為第i層的厚度;Vi為第i層的速度;Qi為第i層的Q值;W0(f)為初始地震波的頻譜;WN(f)為地震波在近地表傳播N層后的頻譜;f為頻率。
基于公式(3),根據(jù)地表速度、Q值和厚度可以模擬地震信號(hào)不同頻率成分經(jīng)過(guò)地表傳播后的相對(duì)衰減量。頻率越大,衰減量越大。圖4給出了不同主頻的子波能量相對(duì)衰減量。由圖4可見(jiàn),不同頻率成分有不同的衰減量,特別是高頻成分,在穿透低、降速帶時(shí),衰減更嚴(yán)重?;诠?3),對(duì)比分析了主頻為30Hz的雷克子波經(jīng)過(guò)地表傳播后峰值頻率和頻寬的變化(圖5)。由圖5a和圖5b可見(jiàn),衰減越嚴(yán)重的地區(qū),峰值頻率和頻寬減小得越多。為了進(jìn)一步評(píng)價(jià)子波穿過(guò)近地表后能量的變化,通過(guò)對(duì)比分析衰減前、后子波峰值振幅比屬性(圖5c)和子波總能量比屬性(圖5d)來(lái)研究地表橫向衰減特征的變化。由圖5c 和圖5d可以看出,在高衰減區(qū)域,無(wú)論是子波峰值振幅比還是子波總能量比其變化都很明顯,因此低、降速帶不僅對(duì)地震資料的分辨率有影響,對(duì)信噪比也同樣有影響。
為了研究近地表本身屬性的影響,需要將與地震信號(hào)有關(guān)的物理參數(shù)消除。定義:
(4)
式中:QNA為N層近地表介質(zhì)的平均衰減效應(yīng)因子,其與近地表地層條件有關(guān),與頻率和地震信號(hào)的特征無(wú)關(guān)。利用華北油田冀中探區(qū)的微測(cè)井資料計(jì)算得到的QNA見(jiàn)圖6a;以QNA為基準(zhǔn),以子波衰減前、后最大振幅比和能量比為參考,將冀中探區(qū)表層條件分為3類(圖6b)和9類(圖6c)。3類表層條件的具體劃分閾值細(xì)節(jié)如下。
圖3 冀中探區(qū)低、降速帶品質(zhì)因子(Q)
圖4 不同主頻的子波能量相對(duì)衰減量
圖5 30Hz雷克子波穿透低降速帶后屬性變化情況
1) 第1類:QNA<0.01,該表層表現(xiàn)為輕度衰減。
2) 第2類:0.01 3) 第3類:QNA>0.023,該表層表現(xiàn)為嚴(yán)重衰減。 9類表層條件的具體劃分閾值細(xì)節(jié)這里不贅述。 基于上述分類結(jié)果,分別就不同地表類型對(duì)地震信號(hào)的分辨率、振幅衰減、頻譜特征和信噪比的影響開(kāi)展討論。圖7a給出了目的層時(shí)間厚度Δt=16ms,對(duì)于不同地表類型,以主頻30Hz雷克子波穿透近地表,再由目的層頂、底反射回地面,觀測(cè)到的反射波對(duì)地層的分辨能力。圖7a中藍(lán)色線是第1類近地表?xiàng)l件,屬于低衰減區(qū),薄層可以分辨;紅色線是第2類近地表?xiàng)l件,屬于中等衰減區(qū),薄層不可分辨;綠色線是第3類近地表?xiàng)l件,屬于高衰減區(qū),薄層不可分辨。圖7b給出了目的層時(shí)間厚度Δt=25ms,對(duì)于不同地表類型,以主頻30Hz雷克子波穿透近地表,再由目的層頂、底反射回地面,觀測(cè)到的反射波對(duì)地層的分辨能力。圖7b中藍(lán)色線是第1類近地表?xiàng)l件,屬于低衰減區(qū),薄層可以分辨;紅色線是第2類近地表?xiàng)l件,屬于中等衰減區(qū),薄層可分辨;綠色線是第3類近地表?xiàng)l件,屬于高衰減區(qū),薄層不可分辨。由圖7可見(jiàn),在地震資料的采集處理過(guò)程中需要考慮地表的影響。圖8展示的是主頻30Hz雷克子波穿過(guò)不同類型的地表后子波波形和頻譜變化規(guī)律。由圖8 可見(jiàn),第3類區(qū)域子波振幅衰減嚴(yán)重(圖8a中綠色子波);第1、2、3類區(qū)域子波頻譜主頻向低頻方向移動(dòng),頻帶變窄(圖8b)。 圖6 利用華北油田冀中探區(qū)的微測(cè)井資料計(jì)算得到的平均衰減效應(yīng)因子(a)以及基于衰減因子門檻值的3類(b)和9類(c)分類結(jié)果 圖7 不同地表類型對(duì)不同目的層厚度的分辨率影響(雷克子波主頻30Hz) 圖8 主頻30Hz雷克子波穿過(guò)不同類型的地表后子波波形(a)及頻譜(b)變化規(guī)律 地震信號(hào)的信噪比和地表?xiàng)l件密切相關(guān)。在相同噪聲水平下,由于地表?xiàng)l件不同,有效信號(hào)的衰減量不同,因此反射地震數(shù)據(jù)信噪比也不同。如圖9所示,含噪聲主頻30Hz雷克子波穿過(guò)第1類輕度或無(wú)衰減區(qū)域后信噪比最高(信噪比為3.20),第2類次之(信噪比為0.90),第3類由于信號(hào)衰減嚴(yán)重,信噪比較低(信噪比為0.06),有效信號(hào)幾乎淹沒(méi)在噪聲中。盡管上述分類方式具有一定的指導(dǎo)意義,但是這種分類方式要根據(jù)具體的地質(zhì)情況確定分類門檻,而且門檻的設(shè)定對(duì)分類結(jié)果影響較大,將復(fù)雜地表結(jié)構(gòu)簡(jiǎn)單地分成3類,在生產(chǎn)實(shí)踐中難以起到指導(dǎo)作用,因此需要新的分類劃分方法。 圖9 不同地表?xiàng)l件對(duì)反射地震數(shù)據(jù)信噪比的影響 BIRCH算法是由ZHANG等[28]提出的對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行聚類分析的一種非常有效的基于距離的層次聚類算法。該算法首先采用自底向上的層次聚類算法,然后再通過(guò)迭代重定位來(lái)改進(jìn)聚類結(jié)果。BIRCH算法利用聚類特征樹(shù)(clustering feature tree,CF Tree)來(lái)實(shí)現(xiàn)快速聚類。特征樹(shù)的節(jié)點(diǎn)由多個(gè)聚類特征(clustering feature,CF)組成。CF是一個(gè)由(N,LS,SS)來(lái)表示的三元組,其中,N代表CF中擁有的樣本點(diǎn)的數(shù)量;LS代表CF中樣本點(diǎn)各特征維度的和;SS代表CF中樣本點(diǎn)各特征維度的平方和。例如,在CF Tree某個(gè)節(jié)點(diǎn)的某個(gè)CF中,有5個(gè)樣本(1,3),(3,5),(2,4),(4,6),(5,7),則其三元組參數(shù)N=5,LS=(1+3+2+4+5,3+5+4+6+7)=(15,25),SS=(12+32+22+42+52+32+52+42+62+72)=190。CF滿足線性運(yùn)算,如CF1+CF2=(N1+N2,LS1+LS2,SS1+SS2)。在CF Tree上,對(duì)于每個(gè)父節(jié)點(diǎn)中的CF節(jié)點(diǎn),它的(N,LS,SS)三元組的值等于這個(gè)CF節(jié)點(diǎn)所指向的所有子節(jié)點(diǎn)的三元組之和。CF Tree的重要參數(shù)有:①每個(gè)內(nèi)部節(jié)點(diǎn)的最大CF數(shù)B;②每個(gè)葉子節(jié)點(diǎn)的最大CF數(shù)L;③葉子節(jié)點(diǎn)每個(gè)CF的最大樣本半徑閾值T,即在CF中所有樣本點(diǎn)一定要在半徑小于T的超球體內(nèi)。 在聚類開(kāi)始時(shí),CF Tree是空的,首先從訓(xùn)練集讀入第1個(gè)樣本點(diǎn),將它放入新的CF三元組A,該三元組的參數(shù)N=1,將新的CF作為根節(jié)點(diǎn),此時(shí)的CF Tree如圖10a所示。繼續(xù)讀入第2個(gè)樣本點(diǎn),如果該樣本點(diǎn)和第1個(gè)樣本點(diǎn)A在半徑為T的超球體范圍內(nèi),則屬于同一個(gè)CF,將該點(diǎn)也加入CFA,此時(shí)A的三元組參數(shù)N=2,CF Tree如圖10b所示。繼續(xù)讀入第3個(gè)樣本點(diǎn),如果不能融入前面的節(jié)點(diǎn)形成的半徑為T的超球體內(nèi),則需要新的CF三元組B來(lái)容納這個(gè)新值。此時(shí)根節(jié)點(diǎn)就由兩個(gè)CF三元組A和B組成,CF Tree如圖10c所示。讀入第4個(gè)樣本點(diǎn)時(shí),如果它和B在半徑小于T的超球體內(nèi),則更新后的CF Tree如圖10d所示。 當(dāng)葉子節(jié)點(diǎn)的最大CF數(shù)L=3時(shí),隨著樣本點(diǎn)的不斷讀入,CF Tree的節(jié)點(diǎn)需要分裂,假設(shè)分裂前的CF Tree如圖11a所示,葉子節(jié)點(diǎn)LN1有3個(gè)CF,LN2和LN3各有兩個(gè)CF。當(dāng)新的樣本點(diǎn)讀入時(shí),可發(fā)現(xiàn)它離LN1節(jié)點(diǎn)最近,因此需要判斷它是否在sc1,sc2,sc3這3個(gè)CF對(duì)應(yīng)的超球體之內(nèi),如果不在,則要建立一個(gè)新的CF,即sc8來(lái)容納它。如果設(shè)定葉子節(jié)點(diǎn)的最大CF數(shù)L=3,即LN1的CF個(gè)數(shù)已經(jīng)達(dá)到最大值,不能再創(chuàng)建新的CF,就需要將LN1葉子節(jié)點(diǎn)分裂為二,并從LN1所有CF元組中,找到兩個(gè)最遠(yuǎn)的CF作為這兩個(gè)新葉子節(jié)點(diǎn)的種子CF,然后將LN1節(jié)點(diǎn)里所有CF(sc1,sc2,sc3),以及新樣本點(diǎn)的新元組sc8劃分到兩個(gè)新的葉子節(jié)點(diǎn)上。LN1節(jié)點(diǎn)分裂后的CF Tree如圖11b所示,如果設(shè)定內(nèi)部節(jié)點(diǎn)的最大CF數(shù)B=3,則此時(shí)葉子節(jié)點(diǎn)一分為二會(huì)導(dǎo)致根節(jié)點(diǎn)的最大CF數(shù)超出范圍,因此根節(jié)點(diǎn)也要分裂,分裂的方法和葉子節(jié)點(diǎn)分裂一樣,分裂后的CF Tree如圖11c 所示。當(dāng)所有的訓(xùn)練集樣本建立了CF Tree,一個(gè)基本的BIRCH算法就完成了,對(duì)應(yīng)的輸出就是若干個(gè)CF節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)里的樣本點(diǎn)就是一個(gè)聚類的簇。因此BIRCH算法的主要過(guò)程就是建立CF Tree的過(guò)程。 BIRCH算法的主要優(yōu)點(diǎn)有:①節(jié)約內(nèi)存,所有的樣本都保存在磁盤上,CF Tree只保存了CF節(jié)點(diǎn)所對(duì)應(yīng)的指針,聚類特征樹(shù)概括了聚類的有用信息,并且占用空間較元數(shù)據(jù)集合小得多,可以存放在內(nèi)存中,從而可以提高算法在大型數(shù)據(jù)集合上的聚類速度及可伸縮性;②只需要掃描訓(xùn)練集一次就可以建立CF Tree,且CF Tree的增、刪、改都很快速,因此聚類速度快;③可以識(shí)別噪聲點(diǎn),還可以對(duì)數(shù)據(jù)集進(jìn)行初步分類的預(yù)處理。BIRCH算法的主要缺點(diǎn)有:①由于CF Tree對(duì)每個(gè)節(jié)點(diǎn)的CF個(gè)數(shù)有限制,導(dǎo)致聚類結(jié)果可能和真實(shí)的類別分布不同;②對(duì)高維特征數(shù)據(jù)聚類效果不好,比如樣本數(shù)據(jù)維度超過(guò)20,此時(shí)可以選擇Mini Batch K-Means。 圖12a為隨機(jī)生成的樣本數(shù)據(jù),共1000個(gè)樣本,每個(gè)樣本2個(gè)特征,共4個(gè)簇;圖12b是不指定聚類類別數(shù)得到的聚類結(jié)果,共分為8個(gè)類簇;圖12c是指定類別數(shù)為4時(shí)得到的聚類結(jié)果。由圖12b和圖12c 可見(jiàn),如果對(duì)數(shù)據(jù)的類別屬性有所了解,指定類別數(shù)可獲得更好的聚類結(jié)果。圖13顯示的是由兩組1500個(gè)點(diǎn)構(gòu)成的隨機(jī)樣本,一組是兩個(gè)圈形數(shù)據(jù),另一組是兩個(gè)月牙形數(shù)據(jù),分別采用K-means和BIRCH算法進(jìn)行聚類得到的結(jié)果。對(duì)比聚類結(jié)果可以看出,傳統(tǒng)K-means聚類方法主要依據(jù)樣本點(diǎn)的距離關(guān)系進(jìn)行聚類,因此聚類結(jié)果和真實(shí)數(shù)據(jù)分布不一致,如圖13a和圖13c將圈形和兩個(gè)月牙形的樣本簇按距離遠(yuǎn)近進(jìn)行聚類,得出了錯(cuò)誤的聚類結(jié)果。而本文所述的BIRCH算法則是一種基于距離的層次聚類算法,根據(jù)其樹(shù)形結(jié)構(gòu)的特征層次聚類思想,得到如圖13b和圖13d的正確聚類結(jié)果。而本文所涉及的問(wèn)題,即近地表類別的變化類似于圖13所示的樣本點(diǎn)分布,需要基于多屬性的層次關(guān)系,尋找到正確的聚類結(jié)果,因此最終選用了BIRCH算法。當(dāng)然,在機(jī)器學(xué)習(xí)領(lǐng)域,還有很多聚類算法,比如DBSCAN、凝聚層次聚類、譜聚類等都可以取得和BIRCH方法類似的效果,因?yàn)楸疚牡闹攸c(diǎn)不是分析算法的差異,因此不作詳細(xì)對(duì)比分析。 圖10 聚類特征樹(shù)生成示意 圖11 CF Tree節(jié)點(diǎn)分裂示意 圖12 隨機(jī)樣本不同參數(shù)BIRCH聚類結(jié)果 圖13 兩組隨機(jī)樣本分別采用K-means和BIRCH聚類方法得到的結(jié)果 本文以華北油田冀中探區(qū)近10000km2范圍內(nèi)的微測(cè)井處理解釋成果資料為基礎(chǔ),用于多屬性聚類分析的向量由以下屬性構(gòu)成:近地表高程,低、降速帶速度、厚度、Q值,不同主頻率(10Hz,20Hz,30Hz,40Hz)的雷克子波能量相對(duì)衰減量,主頻30Hz雷克子波峰值振幅比屬性、總能量比、峰值頻率屬性、頻帶寬度屬性,平均衰減因子屬性。 BIRCH多維向量層次聚類假設(shè)特征數(shù)據(jù)為正態(tài)分布(即滿足零均值且單位方差呈高斯分布),需要對(duì)輸入多屬性向量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,使其滿足正態(tài)分布。算法實(shí)現(xiàn)中,以Scikit-Learn的開(kāi)源數(shù)學(xué)庫(kù)為基礎(chǔ),選擇其中的Preprocessing.StandardScalar函數(shù)實(shí)現(xiàn)輸入數(shù)據(jù)標(biāo)準(zhǔn)化[25]。按上述方法,完成了研究區(qū)近10000km2的無(wú)監(jiān)督BIRCH聚類分析研究。 圖14給出了基于BIRCH多維向量層次聚類方法得到的近地表結(jié)構(gòu)分類結(jié)果。圖14中將冀中探區(qū)分為9類,與圖6b的分類結(jié)果相比,將近地表結(jié)構(gòu)的差異劃分得更加細(xì)致,圖14中劃分的1、2、3類相當(dāng)于圖6b中的第3類,對(duì)應(yīng)吸收衰減比較嚴(yán)重的區(qū)域;4、5、6類相當(dāng)于圖6b中的第2類,對(duì)應(yīng)吸收衰減中等區(qū)域;而7、8、9類相當(dāng)于圖6b中的第1類,對(duì)應(yīng)吸收衰減相對(duì)較弱的區(qū)域。對(duì)比圖14和圖6c可見(jiàn),盡管圖6c也通過(guò)門檻值將平均衰減因子屬性劃分成了9類,但是分類細(xì)節(jié)還是不如多屬性參數(shù)BIRCH聚類分析方法。由此可見(jiàn),兩種分類方法有一定相關(guān)性,但是BIRCH聚類分析方法無(wú)需人為設(shè)定任何門檻值,更易于實(shí)現(xiàn),且分類更精細(xì)。例如圖14中左下角紅色區(qū)域和右上角橙色區(qū)域,按圖6采用的分類方法都?xì)w為第3類,實(shí)際上從圖2的低、降速帶厚度、速度和圖3中的Q值分布來(lái)看,這兩個(gè)區(qū)域還是有明顯差異的。 沿圖14中測(cè)線AA′和BB′進(jìn)行吸收衰減試驗(yàn)來(lái)驗(yàn)證近地表結(jié)構(gòu)對(duì)子波能量、分辨率和信噪比的影響。圖14中的a1,b1分別表示主頻為30Hz的雷克子波穿透測(cè)線AA′和BB′所在位置的低、降速帶層,經(jīng)吸收衰減后波形特征的變化,可以明顯看到,不同類別地層對(duì)子波波形的改變。圖14中的a2,b2分別表示主頻為30Hz的雷克子波穿透測(cè)線AA′和BB′所在位置的低、降速帶層,然后透過(guò)一個(gè)厚度為Δt=20ms的地層反射回來(lái)后的子波,可見(jiàn)低衰減區(qū)域分辨率明顯高于高衰減區(qū)域。圖14中的a3,b3分別表示主頻為30Hz疊加隨機(jī)噪聲的雷克子波在相同信噪比情況下穿透測(cè)線AA′和BB′所在位置的低、降速帶層,經(jīng)吸收衰減后的子波??梢悦黠@看到,低、降速帶對(duì)地震資料信噪比的影響。 圖14 基于BIRCH多維向量層次聚類方法得到的近地表結(jié)構(gòu)分類結(jié)果 在實(shí)際應(yīng)用中,通常要考慮不同類別的近地表結(jié)構(gòu)下激發(fā)條件對(duì)地震資料品質(zhì)的影響。冀中探區(qū)的三維地震資料采集以井炮為主,圖15給出了圖14中C點(diǎn)所在位置采用BIRCH聚類方法得到的1類區(qū)域不同激發(fā)深度的單炮記錄,由圖15可見(jiàn),激發(fā)深度對(duì)單炮質(zhì)量的影響明顯。圖16給出了圖14中D點(diǎn)所在位置采用BIRCH聚類方法得到的1類區(qū)域不同藥量激發(fā)的單炮記錄。由圖16可見(jiàn),同樣在高速頂以下15m激發(fā),采用的炸藥量不同,單炮記錄品質(zhì)明顯不同。小藥量激發(fā)的單炮記錄高頻低能,大藥量激發(fā)的單炮記錄低頻高能,隨著藥量的增加,單炮記錄質(zhì)量提高。由圖16h可見(jiàn),繼續(xù)增大藥量,單炮記錄的質(zhì)量提高有限,但生產(chǎn)成本卻明顯提高,因此在采用BIRCH聚類方法得到的1類區(qū)域,激發(fā)藥量達(dá)到8~9kg即可滿足生產(chǎn)要求。 圖15 基于BIRCH多維向量層次聚類方法得到的1類區(qū)域不同激發(fā)深度的單炮記錄(激發(fā)藥量為8kg) 圖16 基于BIRCH多維向量層次聚類方法得到的1類區(qū)域相同激發(fā)深度(15m)下不同藥量的單炮記錄 另外,在觀測(cè)系統(tǒng)設(shè)計(jì)時(shí),可采用如圖14所示的分類結(jié)果進(jìn)行分區(qū)設(shè)計(jì),如BIRCH聚類分析的1類區(qū)域,屬于強(qiáng)吸收衰減區(qū)域,可采用加密炮增加覆蓋次數(shù)提高信噪比。 本文方法采用多種屬性參數(shù)構(gòu)成的向量作為輸入進(jìn)行空間聚類分析,可有效克服基于平均衰減因子的單屬性劃分近地表特征的缺點(diǎn),提高分類劃分的精度。當(dāng)然,輸入?yún)?shù)的多少也值得關(guān)注。圖17a是采用12個(gè)屬性參數(shù)(去掉低、降速層的速度和厚度屬性)進(jìn)行BIRCH聚類分析得到的近地表結(jié)構(gòu)平面分布圖。從圖17a可見(jiàn),分類結(jié)果大體趨勢(shì)上和圖14一致,但是缺少細(xì)節(jié)信息。圖17b是采用8個(gè)屬性參數(shù)(去掉了低、降速層的Q值屬性)進(jìn)行BIRCH聚類分析得到的近地表結(jié)構(gòu)平面分布圖。從圖17b可見(jiàn),分類結(jié)果大體趨勢(shì)和圖14一致,但更加平滑??梢?jiàn),如果用來(lái)聚類的屬性相關(guān)度不是太大,保留多屬性聚類分析,可以更加精細(xì)地描述表層特征的變化。 圖17 基于BIRCH多維向量層次聚類方法得到的近地表結(jié)構(gòu)平面分布 近地表參數(shù)的變化,對(duì)地震資料的信噪比、分辨率有直接影響,因此無(wú)論是資料采集還是處理,確定目標(biāo)區(qū)近地表結(jié)構(gòu)類別,并合理利用,是提高采集資料品質(zhì)和處理質(zhì)量的關(guān)鍵環(huán)節(jié)。本文引入無(wú)監(jiān)督機(jī)器學(xué)習(xí)的BIRCH多屬性向量層次聚類方法劃分近地表結(jié)構(gòu)類型,可以有效克服基于平均衰減因子屬性分類劃分的缺點(diǎn),提高近地表結(jié)構(gòu)分類劃分精度和可靠性,理論模型和實(shí)際資料分析結(jié)果證明了本文方法的有效性,并得出以下結(jié)論: 1) 平均衰減因子屬性可以作為近地表結(jié)構(gòu)劃分的參考性屬性,但是由于門檻值很難把握,因此在實(shí)際應(yīng)用中并不是好的分類依據(jù); 2) 基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的BIRCH多屬性向量層次聚類分析方法,可以很好地利用近地表多屬性參數(shù)向量實(shí)現(xiàn)近地表結(jié)構(gòu)的分類劃分,為觀測(cè)系統(tǒng)設(shè)計(jì)和地震資料激發(fā)、接收和處理提供幫助; 3) 通過(guò)對(duì)華北油田冀中探區(qū)近地表結(jié)構(gòu)的分類劃分及其對(duì)地震資料信噪比和分辨率的影響因素分析,認(rèn)為基于近地表多屬性參數(shù)聚類分析結(jié)果優(yōu)化地震資料采集和處理參數(shù)是可行的,為地震資料采集和處理參數(shù)優(yōu)化提供了新依據(jù)。2 平衡迭代規(guī)約和層次聚類方法原理
2.1 BIRCH算法核心思想
2.2 聚類特征樹(shù)的生成
3 應(yīng)用效果分析
4 結(jié)論