譚茂金,白 洋,吳 靜,張海濤,李高仁,肖承文, 韓 闖, 魏修平
(1.中國(guó)地質(zhì)大學(xué)(北京)地球物理與信息技術(shù)學(xué)院,北京100083;2.中國(guó)石油長(zhǎng)慶油田勘探開(kāi)發(fā)研究院,陜西西安,710021;3.中國(guó)石油塔里木油田勘探開(kāi)發(fā)研究院,新疆庫(kù)爾勒841000;4.中國(guó)石油化工股份有限公司石油勘探開(kāi)發(fā)研究院,北京100083)
頁(yè)巖油氣和致密砂巖氣等非常規(guī)油氣資源是未來(lái)重要的接替資源,對(duì)這類非常規(guī)油氣藏進(jìn)行儲(chǔ)層評(píng)價(jià)是地球物理測(cè)井解釋面臨的重要任務(wù)之一。地球物理測(cè)井作為深入地層的“眼睛”,具有方法多、分辨率高和信息量大等優(yōu)點(diǎn),能夠?yàn)橛蜌獠卦u(píng)價(jià)提供連續(xù)、準(zhǔn)確的電、聲、核或核磁等原位物理參數(shù)。如何從這些測(cè)量數(shù)據(jù)中提取與復(fù)雜油氣藏相關(guān)的信息是測(cè)井解釋的主要內(nèi)容。測(cè)井解釋的內(nèi)容主要包括巖性識(shí)別、流體判別等定性分析,以及孔隙度、滲透率、飽和度、脆性指數(shù)等參數(shù)預(yù)測(cè),前者屬于分類問(wèn)題,后者屬于回歸問(wèn)題。測(cè)井解釋的方法主要包括兩大類:一類是基于數(shù)理統(tǒng)計(jì)的方法,通過(guò)構(gòu)建交會(huì)圖等建立流體識(shí)別、巖性劃分的圖版,利用巖心分析資料構(gòu)建經(jīng)驗(yàn)公式;另一類是體積模型與理論公式方法,例如孔隙度公式和飽和度公式等,通過(guò)響應(yīng)方程和最優(yōu)化方法可以實(shí)現(xiàn)儲(chǔ)層定量評(píng)價(jià)[1-4]。但是,針對(duì)非常規(guī)油氣藏,例如頁(yè)巖油氣藏,由于巖性礦物成分復(fù)雜、油氣賦存方式多樣、非均質(zhì)性強(qiáng)、物性差等特征,構(gòu)建的交會(huì)圖、簡(jiǎn)化的體積模型均不適用。而且,測(cè)井?dāng)?shù)據(jù)與測(cè)試、巖心實(shí)驗(yàn)數(shù)據(jù)間常為非線性關(guān)系,建立的線性經(jīng)驗(yàn)公式精度較差,推廣能力不佳。目前,井壁成像測(cè)井、核磁共振測(cè)井和陣列聲波測(cè)井等現(xiàn)代成像測(cè)井技術(shù)能夠從不同的角度有效解決測(cè)井解釋和儲(chǔ)層評(píng)價(jià)中的一些難題,但是這些測(cè)井技術(shù)相對(duì)昂貴,應(yīng)用范圍較小,沒(méi)有在非常規(guī)油氣藏勘探開(kāi)發(fā)中大規(guī)模應(yīng)用[5-6]。
近年來(lái),具有強(qiáng)非線性擬合能力的機(jī)器學(xué)習(xí)方法發(fā)展迅速,特別是當(dāng)前流行的深度學(xué)習(xí),在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等領(lǐng)域取得了長(zhǎng)足的發(fā)展。在地球物理測(cè)井智能解釋中,神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、支持向量機(jī)等智能算法在巖性、流體識(shí)別等分類問(wèn)題[7-8],以及孔隙度、滲透率、TOC含量等儲(chǔ)層參數(shù)預(yù)測(cè)問(wèn)題中的廣泛應(yīng)用[9-10],大大提高了評(píng)價(jià)精度,為測(cè)井解釋和地層評(píng)價(jià)提供了有效“利器”。但是,測(cè)井?dāng)?shù)據(jù)具有多源異構(gòu)、小樣本特征,淺層網(wǎng)絡(luò)擬合能力不足而深層網(wǎng)絡(luò)又易過(guò)擬合,大量繁復(fù)訓(xùn)練得到的模型難以推廣,泛化能力較差。因此,需要開(kāi)辟適合測(cè)井學(xué)科背景、密切聯(lián)系油氣開(kāi)發(fā)應(yīng)用場(chǎng)景的新思路和新方法。
針對(duì)當(dāng)前單一智能算法在地球物理測(cè)井解釋應(yīng)用中面臨的困境,集成學(xué)習(xí)將是一種更合適、更靈活的解決方案[11-12]。本文介紹了集成學(xué)習(xí)的框架和策略研究進(jìn)展,概述了集成學(xué)習(xí)算法的原理、分類,尤其是以異質(zhì)集成為特征的委員會(huì)機(jī)器在致密砂巖流體識(shí)別、儲(chǔ)層參數(shù)計(jì)算和有機(jī)頁(yè)巖生烴潛力評(píng)價(jià)等方面的應(yīng)用效果。
集成學(xué)習(xí)算法模仿了人類在做出重大決定時(shí)尋求多方意見(jiàn)輔助決策的現(xiàn)象。該智能算法針對(duì)同一研究問(wèn)題,同時(shí)訓(xùn)練多個(gè)學(xué)習(xí)器,并采用特定的組合策略集成這些學(xué)習(xí)器的預(yù)測(cè)結(jié)果,以得到較全面、可靠的判斷。集成學(xué)習(xí)算法在油氣藏解釋和評(píng)價(jià)中應(yīng)用廣泛,可通過(guò)該方法組合多個(gè)智能算法解決流體識(shí)別等分類問(wèn)題和儲(chǔ)層參數(shù)預(yù)測(cè)等回歸問(wèn)題。根據(jù)使用的集成學(xué)習(xí)器種類,可將集成學(xué)習(xí)算法分為同質(zhì)集成和異質(zhì)集成兩類,前者采用相同類型的智能算法構(gòu)建同質(zhì)集成模型,后者采用不同類型的智能算法,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、最近鄰算法和決策樹(shù)等構(gòu)建異質(zhì)集成模型,也稱做委員會(huì)機(jī)器(committee machine,CM)。
對(duì)于同質(zhì)集成模型,吳靜[13]基于決策樹(shù)使用Bagging算法構(gòu)建了同質(zhì)集成模型,通過(guò)有放回的自助采樣從原始數(shù)據(jù)集中得到k個(gè)采樣集,將采樣得到的訓(xùn)練集分別用于決策樹(shù)基分類器的訓(xùn)練,然后將各基分類器的輸出結(jié)果組合得到最終的同質(zhì)集成輸出結(jié)果。在解決分類問(wèn)題時(shí),按照少數(shù)服從多數(shù)的投票策略獲得最終預(yù)測(cè)結(jié)果;對(duì)于回歸任務(wù),采用簡(jiǎn)單平均獲得最終預(yù)測(cè)結(jié)果。該方法在構(gòu)建模型的過(guò)程中引入隨機(jī)性,減少了基分類器的方差,有效解決了過(guò)擬合問(wèn)題,其算法原理如圖1所示。
圖1 基于Bagging算法的同質(zhì)集成模型
對(duì)于異質(zhì)集成模型,委員會(huì)機(jī)器中不同類型的智能算法通常被稱為專家,聯(lián)合這些專家并制定相應(yīng)的決策機(jī)制能夠有效改善預(yù)測(cè)結(jié)果,增強(qiáng)訓(xùn)練模型的推廣能力[14-15]。而且,基于柯西不等式能夠直接證明委員會(huì)機(jī)器的最終輸出總是優(yōu)于專家的平均水平[16]。但是,與同質(zhì)集成模型類似,委員會(huì)機(jī)器提升機(jī)制的前提是專家訓(xùn)練模型的誤差必須低于隨機(jī)猜測(cè),才能保證足夠數(shù)量的專家實(shí)現(xiàn)較好的集成效果[17]。圖2為一種通用的委員會(huì)機(jī)器結(jié)構(gòu)。
圖2 一種通用的委員會(huì)機(jī)器結(jié)構(gòu)
一般而言,集成學(xué)習(xí)算法中各學(xué)習(xí)器的獨(dú)立性和差異性是提高集成能力的關(guān)鍵。因此,在同等條件下,異質(zhì)集成往往優(yōu)于同質(zhì)集成。針對(duì)鄂爾多斯盆地大牛地氣田的流體識(shí)別問(wèn)題,分別采用決策樹(shù)使用Bagging算法構(gòu)建了同質(zhì)集成分類模型,采用多數(shù)投票法綜合各決策樹(shù)的分類結(jié)果,最終的分類準(zhǔn)確率為99.23%;采用反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、支持向量機(jī)(SVM)和K鄰近(KNN)組成異質(zhì)集成回歸模型,最終的分類準(zhǔn)確率達(dá)到99.60%,說(shuō)明異質(zhì)集成學(xué)習(xí)器的分類效果更好。類似地,在儲(chǔ)層參數(shù)回歸問(wèn)題中,采用決策樹(shù)使用Bagging算法構(gòu)建同質(zhì)集回歸模型,采用反向傳播神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和高斯過(guò)程回歸(GPR)組成異質(zhì)集成回歸模型,前者預(yù)測(cè)結(jié)果均方誤差為1.45,后者預(yù)測(cè)結(jié)果均方誤差為1.36??梢钥闯?異質(zhì)集成算法在測(cè)井智能解釋中構(gòu)建的分類模型和回歸模型均展現(xiàn)出較好的性能,且預(yù)測(cè)精度高于同質(zhì)集成。
我們將上述異質(zhì)集成模型稱為委員會(huì)機(jī)器。但是,隨著測(cè)井解釋問(wèn)題逐漸由常規(guī)走向非常規(guī),由各向同性走向各向異性,委員會(huì)機(jī)器中的專家常常出現(xiàn)性能不足的問(wèn)題,進(jìn)一步發(fā)展和應(yīng)用受限。因此,針對(duì)復(fù)雜測(cè)井解釋問(wèn)題,在傳統(tǒng)委員會(huì)機(jī)器模型中引入門網(wǎng)絡(luò),將復(fù)雜學(xué)習(xí)任務(wù)劃分為更簡(jiǎn)單的子任務(wù),能夠達(dá)到降低專家訓(xùn)練難度,提高專家訓(xùn)練模型性能的目的。此外,考慮到當(dāng)前地球物理測(cè)井智能算法應(yīng)用中存在的數(shù)據(jù)驅(qū)動(dòng)與模型驅(qū)動(dòng)割裂的問(wèn)題,我們將物理模型約束引入委員會(huì)機(jī)器,能夠更好地結(jié)合數(shù)據(jù)挖掘和物理模型兩者的優(yōu)勢(shì),取長(zhǎng)補(bǔ)短,改善最終預(yù)測(cè)結(jié)果。
近年來(lái),針對(duì)不同測(cè)井解釋問(wèn)題,分別構(gòu)建了面向流體識(shí)別等分類問(wèn)題的分類委員會(huì)機(jī)器和面向孔隙度、滲透率、飽和度等巖石物理參數(shù)預(yù)測(cè)等回歸問(wèn)題的回歸委員會(huì)機(jī)器。委員會(huì)機(jī)器測(cè)井智能解釋方法已發(fā)展三代,分別為靜態(tài)委員會(huì)機(jī)器、動(dòng)態(tài)委員會(huì)機(jī)器及物理模型與數(shù)據(jù)共同驅(qū)動(dòng)的委員會(huì)機(jī)器。
在利用智能算法進(jìn)行模型訓(xùn)練和實(shí)際預(yù)測(cè)的過(guò)程中,針對(duì)同一預(yù)測(cè)目標(biāo),不同智能算法總會(huì)產(chǎn)生不同的訓(xùn)練和預(yù)測(cè)結(jié)果,而這些結(jié)果有好有壞。這反映出面對(duì)同一預(yù)測(cè)目標(biāo),有些智能算法表現(xiàn)為弱學(xué)習(xí)機(jī);有些表現(xiàn)為強(qiáng)學(xué)習(xí)機(jī)。這個(gè)過(guò)程實(shí)質(zhì)上取決于智能算法與預(yù)測(cè)目標(biāo)間的適應(yīng)關(guān)系,當(dāng)預(yù)測(cè)任務(wù)改變時(shí),適應(yīng)關(guān)系也隨之改變。適應(yīng)關(guān)系的不可預(yù)知性導(dǎo)致適用各種場(chǎng)景的強(qiáng)學(xué)習(xí)機(jī)難以尋找。因此,人們提出了一種通過(guò)訓(xùn)練方式讓智能系統(tǒng)自動(dòng)判別學(xué)習(xí)機(jī)強(qiáng)、弱,并將其結(jié)合起來(lái)的方法。這種方法通過(guò)一定的組合策略,對(duì)多個(gè)專家輸出進(jìn)行組合,能夠最大程度地考慮到不同專家與預(yù)測(cè)任務(wù)間的適應(yīng)關(guān)系,最終得到的結(jié)果優(yōu)于絕大部分專家。這一過(guò)程類似于人類委員會(huì)的決策過(guò)程,因此稱之為委員會(huì)機(jī)器[18]。委員會(huì)機(jī)器一般由輸入層、專家層、組合器、輸出層構(gòu)成[19]。針對(duì)地球物理測(cè)井解釋中的分類問(wèn)題,優(yōu)選適合分類問(wèn)題的專家,以投票法作為組合器構(gòu)建分類委員會(huì)機(jī)器;針對(duì)回歸問(wèn)題,優(yōu)選適合回歸問(wèn)題的專家,以加權(quán)平均法作為組合器構(gòu)建回歸委員會(huì)機(jī)器。其中,投票法采用絕對(duì)投票策略,即選擇頻數(shù)最高的輸出結(jié)果作為最終輸出YCCM[20]。
YCCM=Pmax(yi)
(1)
式中:yi為對(duì)應(yīng)第i組輸入數(shù)據(jù)的不同專家輸出的預(yù)測(cè)結(jié)果;Pmax(·)為基于最大頻數(shù)的投票函數(shù)。
對(duì)于回歸委員會(huì)機(jī)器組合策略,假設(shè)共有n個(gè)專家,組合器分配給第j個(gè)專家的加權(quán)系數(shù)wj由遺傳算法(GA)和粒子群算法(PSO)等最優(yōu)化算法計(jì)算得到。然后,將加權(quán)系數(shù)分別分配給每個(gè)專家的輸出并求和,得到最終輸出YRCM。
(2)
式中:yj為第j個(gè)專家的預(yù)測(cè)結(jié)果。在這一過(guò)程中,若某一專家性能表現(xiàn)不佳,系統(tǒng)能夠自動(dòng)以調(diào)整權(quán)重的方式來(lái)保證最終結(jié)果的誤差最小。
在以公式(1)和公式(2)作為組合策略的委員會(huì)機(jī)器中,集成模型性能的提升機(jī)制源于這一組合策略下的多專家聯(lián)合決策。實(shí)際上,該過(guò)程中的單個(gè)專家訓(xùn)練性能并未得到提升,會(huì)導(dǎo)致集成效果受學(xué)習(xí)器影響很大,需要提前花費(fèi)大量資源準(zhǔn)備最優(yōu)化的學(xué)習(xí)器組合。而且,當(dāng)專家數(shù)量達(dá)到一定程度后,提升效果將會(huì)趨于穩(wěn)定,輸出結(jié)果將不會(huì)得到進(jìn)一步改善。因此,可以認(rèn)為這種無(wú)法提高專家自身性能的委員會(huì)機(jī)器是靜態(tài)的(圖2)。
在靜態(tài)委員會(huì)機(jī)器的輸入層和組合器之間加入門網(wǎng)絡(luò),能夠?qū)⑽瘑T會(huì)機(jī)器的多專家聯(lián)合提升機(jī)制改變?yōu)椤胺侄沃钡奶嵘龣C(jī)制[21]。模糊C均值聚類算法(FCM聚類)是一種典型的門網(wǎng)絡(luò),該網(wǎng)絡(luò)首先對(duì)輸入數(shù)據(jù)進(jìn)行聚類分析,通過(guò)學(xué)習(xí)到的數(shù)據(jù)模式以類內(nèi)差異足夠小而類間差異足夠大為原則劃分子數(shù)據(jù)集[22]。
式中:U指示輸入數(shù)據(jù)屬于某個(gè)聚類簇的隸屬度矩陣;V為聚類質(zhì)心;X為輸入的測(cè)井?dāng)?shù)據(jù);M表示數(shù)據(jù)組數(shù);C為聚類簇?cái)?shù)量;q為模糊系數(shù)。通過(guò)不斷對(duì)V和U進(jìn)行最優(yōu)化,可以得到最佳的聚類結(jié)果,并得到對(duì)應(yīng)的子數(shù)據(jù)集。
專家層接收這些簡(jiǎn)化的子數(shù)據(jù)集進(jìn)行訓(xùn)練,得到多個(gè)子模型?;诮o定的模型性能評(píng)價(jià)指標(biāo),建立專家與子數(shù)據(jù)集間的最優(yōu)化匹配關(guān)系,即遍歷哪些專家與哪些子數(shù)據(jù)集的適應(yīng)關(guān)系最好。然后,通過(guò)組合器將這些子模型組合起來(lái),作為最終預(yù)測(cè)模型。最后,將數(shù)據(jù)輸入到這些最優(yōu)化的子模型組合中,集成系統(tǒng)會(huì)自動(dòng)根據(jù)輸入數(shù)據(jù)的隸屬度分配子模型進(jìn)行預(yù)測(cè)和組合,得到最終輸出YDCM。
(4)
由于此過(guò)程通過(guò)門網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)進(jìn)行自適應(yīng)的無(wú)監(jiān)督學(xué)習(xí),并自動(dòng)建立子數(shù)據(jù)與專家間的適應(yīng)性關(guān)系、最優(yōu)化子模型組合,因此可以將這種提升方法稱為動(dòng)態(tài)委員會(huì)機(jī)器(DCM)[23]。動(dòng)態(tài)委員會(huì)機(jī)器通過(guò)引入門網(wǎng)絡(luò),簡(jiǎn)化了子數(shù)據(jù)結(jié)構(gòu),降低了專家訓(xùn)練難度,再結(jié)合多專家訓(xùn)練策略,保證了最終集成模型具有較高的提升上限,集成效果受專家性能的限制較小(圖3)。相應(yīng)地,針對(duì)分類問(wèn)題和回歸問(wèn)題,動(dòng)態(tài)委員會(huì)機(jī)器(DCM)又細(xì)分為動(dòng)態(tài)分類委員會(huì)機(jī)器(DCCM)和動(dòng)態(tài)回歸委員會(huì)機(jī)器(DRCM)。
圖3 引入門網(wǎng)絡(luò)的動(dòng)態(tài)委員會(huì)機(jī)器結(jié)構(gòu)與工作原理示意
數(shù)據(jù)驅(qū)動(dòng)是目前機(jī)器學(xué)習(xí)算法的核心。在有監(jiān)督學(xué)習(xí)過(guò)程中,機(jī)器學(xué)習(xí)一般通過(guò)自動(dòng)調(diào)整內(nèi)在結(jié)構(gòu)滿足特征數(shù)據(jù)與標(biāo)簽數(shù)據(jù)間的映射關(guān)系,建立有一定推廣能力的訓(xùn)練模型。然而,在地球物理測(cè)井智能解釋過(guò)程中,單純采用沒(méi)有地質(zhì)約束的數(shù)據(jù)驅(qū)動(dòng)策略容易導(dǎo)致訓(xùn)練模型預(yù)測(cè)結(jié)果與客觀認(rèn)識(shí)大相徑庭。此時(shí),即使訓(xùn)練模型的評(píng)價(jià)指標(biāo)相當(dāng)好,但其對(duì)未知樣本空間的預(yù)測(cè)結(jié)果仍不會(huì)令人信服。因此,將物理模型約束引入到機(jī)器學(xué)習(xí)中將是未來(lái)測(cè)井智能解釋的趨勢(shì)之一。物理模型約束可以作用在專家結(jié)構(gòu)中,也可以作用在輸入與輸出端??紤]到委員會(huì)機(jī)器采用的專家類型不同,后者更易于實(shí)現(xiàn)。所以,在數(shù)據(jù)集構(gòu)建過(guò)程中,將巖石物理模型的計(jì)算結(jié)果與其它測(cè)井?dāng)?shù)據(jù)作為特征數(shù)據(jù),巖心巖石物理實(shí)驗(yàn)數(shù)據(jù)作為標(biāo)簽數(shù)據(jù)一起輸入到委員會(huì)機(jī)器中進(jìn)行訓(xùn)練,構(gòu)建物理模型和數(shù)據(jù)共同驅(qū)動(dòng)的委員會(huì)機(jī)器模型(圖4)。然后,將其它測(cè)井?dāng)?shù)據(jù)和巖石物理模型計(jì)算結(jié)果輸入到上述復(fù)合模型中,得到最終輸出YMCM。
圖4 引入物理模型約束的委員會(huì)機(jī)器結(jié)構(gòu)與工作原理示意
(5)
式中:Ej(·)為專家函數(shù),其輸出即為專家預(yù)測(cè)結(jié)果;M為巖石物理模型的計(jì)算結(jié)果,如基于體積模型計(jì)算得到的孔隙度、Timur方程計(jì)算得到的滲透率和Archie公式計(jì)算得到的含水飽和度等。
此方法基于委員會(huì)機(jī)器的特殊結(jié)構(gòu)而提出,不僅將物理模型約束項(xiàng)直接引入輸入數(shù)據(jù)中,還可以提前設(shè)定權(quán)重來(lái)調(diào)整約束項(xiàng)比重,能夠更加靈活地改善預(yù)測(cè)結(jié)果[24]。
在委員會(huì)機(jī)器實(shí)際應(yīng)用中,測(cè)井流體識(shí)別問(wèn)題可將生產(chǎn)和測(cè)試結(jié)果作為標(biāo)簽數(shù)據(jù),采用概率神經(jīng)網(wǎng)絡(luò)、貝葉斯分類、決策樹(shù)等適合分類問(wèn)題的智能算法作為專家;測(cè)井儲(chǔ)層參數(shù)計(jì)算問(wèn)題則可以將孔隙度、滲透率、密閉取心飽和度等巖心巖石物理實(shí)驗(yàn)結(jié)果作為標(biāo)簽數(shù)據(jù),采用廣義回歸神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)等適合回歸問(wèn)題的智能算法作為專家?;谝陨戏诸悊?wèn)題和回歸問(wèn)題,結(jié)合3種委員會(huì)機(jī)器學(xué)習(xí)框架,分別構(gòu)建適用于致密砂巖儲(chǔ)層流體識(shí)別的靜態(tài)分類委員會(huì)機(jī)器(SCCM)、適用于有機(jī)頁(yè)巖TOC含量預(yù)測(cè)和致密砂巖含氣性預(yù)測(cè)的動(dòng)態(tài)回歸委員會(huì)機(jī)器(DRCM)以及適用于致密砂巖孔隙度、滲透率、飽和度3個(gè)重要儲(chǔ)層參數(shù)預(yù)測(cè)的引入模型驅(qū)動(dòng)的委員會(huì)機(jī)器(MCM)。
以鄂爾多斯盆地致密砂巖儲(chǔ)層流體識(shí)別為例,采用BP神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)和決策樹(shù)作為專家,采用投票法作為組合器構(gòu)建了分類委員會(huì)機(jī)器。訓(xùn)練數(shù)據(jù)包含796組,以自然伽馬、AT10~90、聲波、密度和中子作為特征數(shù)據(jù),以氣層、氣水同層、水層和干層作為標(biāo)簽數(shù)據(jù)。其中,標(biāo)簽數(shù)據(jù)采用了獨(dú)熱編碼進(jìn)行形式轉(zhuǎn)換,即以[1 0 0 0]作為氣層標(biāo)簽,以[0 1 0 0]作為氣水同層標(biāo)簽,以[0 0 1 0]作為水層標(biāo)簽,以[0 0 0 1]作為干層標(biāo)簽。將數(shù)據(jù)集輸入到委員會(huì)機(jī)器中進(jìn)行模型訓(xùn)練,專家超參數(shù)采用網(wǎng)格搜索法進(jìn)行優(yōu)化,并以準(zhǔn)確率作為模型性能評(píng)價(jià)指標(biāo)。然后,將訓(xùn)練數(shù)據(jù)輸入到委員會(huì)機(jī)器中進(jìn)行訓(xùn)練,訓(xùn)練結(jié)果顯示BP神經(jīng)網(wǎng)絡(luò)準(zhǔn)確率為83.75%,概率神經(jīng)網(wǎng)絡(luò)準(zhǔn)確率為89.25%,決策樹(shù)準(zhǔn)確率為86.75%,委員會(huì)機(jī)器組合輸出準(zhǔn)確率為91.25%。最后,利用訓(xùn)練模型進(jìn)行地下儲(chǔ)層流體識(shí)別,井A的識(shí)別結(jié)果如圖5所示,在2679~2681m深度處的測(cè)試結(jié)論顯示該層為水層,原解釋結(jié)論為氣水同層,而委員會(huì)機(jī)器流體識(shí)別結(jié)果正確預(yù)測(cè)為水層。此外,采用該方法在環(huán)江地區(qū)7口井進(jìn)行了驗(yàn)證,預(yù)測(cè)得到296個(gè)小層,與測(cè)試結(jié)果的符合率為90.91%。
圖5 A井致密砂巖儲(chǔ)層委員會(huì)機(jī)器測(cè)井流體識(shí)別
結(jié)合上述委員會(huì)機(jī)器和動(dòng)態(tài)委員會(huì)機(jī)器構(gòu)建方法,以中國(guó)黔南坳陷九門沖組頁(yè)巖為例分別建立了靜態(tài)回歸委員會(huì)機(jī)器(SRCM)、動(dòng)態(tài)回歸委員會(huì)機(jī)器(DRCM)來(lái)預(yù)測(cè)TOC。訓(xùn)練集由聲波時(shí)差(AC)、中子(CNL)、密度(DEN)、鉀(K)和深側(cè)向電阻率(LLD)共5個(gè)測(cè)井系列構(gòu)成,包含237組數(shù)據(jù)。由于該數(shù)據(jù)集為小樣本數(shù)據(jù),為了能夠有效評(píng)價(jià)訓(xùn)練模型的性能,采用留一交叉驗(yàn)證法進(jìn)行模型測(cè)試。然后,通過(guò)以上方法分別對(duì)比了3個(gè)專家、SRCM和DRCM模型性能。留一交叉驗(yàn)證結(jié)果顯示,Elman神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)和廣義回歸神經(jīng)網(wǎng)絡(luò)的平均相對(duì)誤差分別為13.92%,11.91%和12.78%。SRCM的平均相對(duì)誤差為11.32%,而DRCM的平均相對(duì)誤差為8.71%。利用上述構(gòu)建的靜態(tài)、動(dòng)態(tài)TOC含量預(yù)測(cè)模型在中國(guó)黔南坳陷九門沖組頁(yè)巖B井中進(jìn)行TOC含量預(yù)測(cè),結(jié)果如圖6所示。第1、3、4道分別為常規(guī)測(cè)井系列,第2道為深度道,第5~7 道分別為基于鈾(U)測(cè)井?dāng)M合的TOC含量、SRCM和DRCM的TOC含量預(yù)測(cè)結(jié)果。實(shí)際預(yù)測(cè)的TOC含量與巖心TOC對(duì)比結(jié)果顯示,基于U測(cè)井?dāng)M合的TOC含量的平均相對(duì)誤差為18.34%,SRCM預(yù)測(cè)結(jié)果的平均相對(duì)誤差為10.34%,DRCM預(yù)測(cè)結(jié)果的平均相對(duì)誤差為7.16%。誤差對(duì)比結(jié)果顯示,針對(duì)頁(yè)巖儲(chǔ)層,動(dòng)態(tài)委員會(huì)機(jī)器能夠較好地建立起測(cè)井?dāng)?shù)據(jù)與TOC含量間的非線性映射關(guān)系,為無(wú)巖心井段提供可靠、連續(xù)的TOC含量信息。
圖6 B井動(dòng)態(tài)委員會(huì)機(jī)器TOC含量測(cè)井解釋(1ft≈30.48cm)
另外,采用決策樹(shù)、概率神經(jīng)網(wǎng)絡(luò)、貝葉斯分類、BP神經(jīng)網(wǎng)絡(luò)、最近鄰算法5個(gè)專家構(gòu)建的動(dòng)態(tài)委員會(huì)機(jī)器,以ΔRT、RT90、密度、聲波時(shí)差和中子作為輸入,訓(xùn)練得到了塔里木盆地庫(kù)車坳陷大北、克深、博孜地區(qū)的智能流體識(shí)別模型,模型訓(xùn)練、驗(yàn)證準(zhǔn)確率分別為96.29%和91.39%。采用該模型,以井C為例進(jìn)行了流體識(shí)別,如圖7所示。第6道為靜態(tài)委員會(huì)機(jī)器(SCCM)流體識(shí)別結(jié)果,第7道為動(dòng)態(tài)分類委員會(huì)機(jī)器(DCCM)流體識(shí)別結(jié)果,第8道為對(duì)應(yīng)的動(dòng)態(tài)分類委員會(huì)機(jī)器解釋結(jié)論,第9道為測(cè)井解釋結(jié)論,第11道為測(cè)試結(jié)果。其中,動(dòng)態(tài)委員會(huì)機(jī)器流體識(shí)別結(jié)果與測(cè)試結(jié)果對(duì)應(yīng)性更好,且更符合油水分布規(guī)律。將該方法應(yīng)用該地區(qū)5口井的流體類型識(shí)別,識(shí)別結(jié)果中的11個(gè)小層有測(cè)試結(jié)果,識(shí)別結(jié)果符合率達(dá)到100%。
圖7 C井動(dòng)態(tài)委員會(huì)機(jī)器含氣性預(yù)測(cè)結(jié)果(1mD≈0.987×10-3μm2;1l=1×10-3m3)
針對(duì)鄂爾多斯盆地長(zhǎng)8組地層,結(jié)合由BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)和小波神經(jīng)網(wǎng)絡(luò)構(gòu)建的靜態(tài)委員會(huì)機(jī)器,分別引入物理模型約束構(gòu)建了孔隙度、滲透率和飽和度預(yù)測(cè)模型。由于是將約束項(xiàng)作用在輸入端,因此將基于體積模型計(jì)算的孔隙度、Timur模型計(jì)算的滲透率和阿爾奇公式計(jì)算的飽和度,再加上自然伽馬、深探測(cè)感應(yīng)測(cè)井、淺探測(cè)感應(yīng)測(cè)井、聲波時(shí)差、密度和中子等測(cè)井?dāng)?shù)據(jù)分別作為特征數(shù)據(jù)加入到孔隙度、滲透率和飽和度模型訓(xùn)練中。與巖心數(shù)據(jù)對(duì)比顯示,訓(xùn)練得到的孔隙度、滲透率和飽和度模型的平均相對(duì)誤差分別為7.43%,14.65%和6.33%,均高于單個(gè)專家及傳統(tǒng)委員會(huì)機(jī)器方法(傳統(tǒng)委員會(huì)機(jī)器孔隙度、滲透率和飽和度模型平均相對(duì)誤差分別為10.23%,17.98%和9.25%)。利用上述模型預(yù)測(cè)實(shí)際致密砂巖儲(chǔ)層參數(shù),圖8為D井智能預(yù)測(cè)結(jié)果,第3道、第5道和第6道分別列出了滲透率、含水飽和度、孔隙度的預(yù)測(cè)結(jié)果,以及巖心實(shí)驗(yàn)測(cè)量結(jié)果,其中,深褐色曲線為模型計(jì)算的儲(chǔ)層參數(shù)結(jié)果。對(duì)比結(jié)果說(shuō)明,模型驅(qū)動(dòng)的委員會(huì)機(jī)器比單純委員會(huì)機(jī)器預(yù)測(cè)結(jié)果有進(jìn)一步改善。
圖8 D井物理模型與委員會(huì)機(jī)器聯(lián)合驅(qū)動(dòng)的孔隙度、滲透率、飽和度預(yù)測(cè)結(jié)果
此外,為了進(jìn)一步推廣委員會(huì)機(jī)器測(cè)井解釋方法,簡(jiǎn)化智能模型構(gòu)建流程,結(jié)合上述委員會(huì)機(jī)器學(xué)習(xí)框架,開(kāi)發(fā)了委員會(huì)機(jī)器測(cè)井解釋軟件,能夠?qū)崿F(xiàn)輸入數(shù)據(jù)預(yù)處理、專家超參數(shù)自動(dòng)優(yōu)化、組合權(quán)重最優(yōu)化及分配、實(shí)際數(shù)據(jù)預(yù)測(cè)與輸出、預(yù)測(cè)結(jié)果可視化等功能,對(duì)提高測(cè)井解釋效率和精度具有積極作用。
本研究基于測(cè)井?dāng)?shù)據(jù)的多源和小樣本等特征提出了適用于頁(yè)巖、致密砂巖等非常規(guī)油氣儲(chǔ)層的委員會(huì)機(jī)器智能測(cè)井解釋方法,并針對(duì)實(shí)際問(wèn)題進(jìn)一步提出動(dòng)態(tài)委員會(huì)機(jī)器和物理模型約束的委員會(huì)機(jī)器,在儲(chǔ)層流體識(shí)別和儲(chǔ)層參數(shù)預(yù)測(cè)等問(wèn)題中展現(xiàn)出了較好的應(yīng)用效果。
1) 委員會(huì)機(jī)器集成多個(gè)異質(zhì)專家,提高了解空間的搜索范圍,減小了最終解落入局部極小的風(fēng)險(xiǎn)。再結(jié)合投票、加權(quán)求和等組合方式,實(shí)現(xiàn)了小樣本特征下的測(cè)井智能解釋。預(yù)測(cè)結(jié)果表明,委員會(huì)機(jī)器預(yù)測(cè)誤差低于單個(gè)專家,預(yù)測(cè)結(jié)果優(yōu)于同質(zhì)集成方法。
2) 動(dòng)態(tài)委員會(huì)機(jī)器引入門網(wǎng)絡(luò),針對(duì)不同儲(chǔ)層模式構(gòu)建多個(gè)子模型,采用組合器實(shí)現(xiàn)子模型組合自動(dòng)優(yōu)化。與傳統(tǒng)委員會(huì)機(jī)器相比,動(dòng)態(tài)委員會(huì)機(jī)器的工作機(jī)制更科學(xué)、合理,預(yù)測(cè)精度更高。
3) 在傳統(tǒng)委員會(huì)機(jī)器基礎(chǔ)上,引入地球物理模型進(jìn)行約束訓(xùn)練,減小了最優(yōu)解的搜索范圍,對(duì)提高訓(xùn)練模型泛化能力具有較好的作用,實(shí)際預(yù)測(cè)結(jié)果也更符合真實(shí)地層變化規(guī)律。