楊 勇
(中國石化勝利油田分公司,山東 東營 257001)
勝利油田作為中國東部陸上老油田的典型代表之一,目前整體進(jìn)入高勘探程度、特高含水開發(fā)階段,探明未動用儲量以低滲透、稠油等低品位儲量為主,動用難度大,開發(fā)成本較高,剩余油與油藏流場更加復(fù)雜,傳統(tǒng)的開發(fā)技術(shù)在兼顧大幅度提高采收率與降本增效方面面臨嚴(yán)峻挑戰(zhàn)。2014 年以來,國際油價斷崖式下跌,對石油企業(yè)低成本效益開發(fā)的要求日益提高,為實現(xiàn)低油價新常態(tài)下的可持續(xù)發(fā)展,石油企業(yè)迫切需要大力實施技術(shù)創(chuàng)新,重塑業(yè)務(wù)流程,實現(xiàn)勘探開發(fā)業(yè)務(wù)整體轉(zhuǎn)型升級,將更多的油氣資源經(jīng)濟(jì)有效地開采出來。實踐表明,大數(shù)據(jù)及人工智能技術(shù)是解決石油勘探開發(fā)一系列難題的有效途徑,為勘探開發(fā)領(lǐng)域帶來了顛覆性變革[1]。近年來,各大石油公司與IT 公司在智能應(yīng)用領(lǐng)域開展合作,形成了殼牌+微軟、??松梨?微軟、荷蘭皇家殼牌+微軟、雪佛龍+微軟、斯倫貝謝+微軟、哈里伯頓+微軟、道達(dá)爾+谷歌、貝克休斯+英偉達(dá)、中國石油+華為、中國石化+阿里巴巴、中國海油+阿里巴巴等聯(lián)合戰(zhàn)略攻關(guān)團(tuán)隊,在油氣勘探開發(fā)大數(shù)據(jù)平臺建設(shè)、數(shù)據(jù)共享生態(tài)環(huán)境打造、數(shù)據(jù)處理及解釋質(zhì)量提升等方面作了諸多有益探索[2],顯現(xiàn)了油氣行業(yè)中大數(shù)據(jù)及人工智能技術(shù)巨大的發(fā)展?jié)摿Α?/p>
勝利油田經(jīng)歷了60 年的勘探開發(fā),積累了地震、地質(zhì)、開發(fā)動態(tài)、實驗分析、采油工程等多源、多尺度的海量數(shù)據(jù)資源,同時,隨著信息化建設(shè)水平的提高,在源頭數(shù)據(jù)實時采集、存儲,以及高效計算處理的軟硬件設(shè)備方面具備了強大的基礎(chǔ)支撐能力。目前,勝利油田數(shù)據(jù)中心共存儲86 個油氣田、4 152個區(qū)塊/單元、8 965口探井、67 241口開發(fā)井的數(shù)據(jù),數(shù)據(jù)總量共7.6 億條、5 TB,每天新增數(shù)據(jù)30萬余條,為151個應(yīng)用提供數(shù)據(jù)服務(wù),也為開展勘探開發(fā)大數(shù)據(jù)及人工智能技術(shù)研究提供了有利條件。近年來,在勝利油田圍繞勘探開發(fā)大數(shù)據(jù)及人工智能技術(shù)的落地應(yīng)用,按照“全面調(diào)研、重點攻關(guān)、定點突破”的思路,開展了多個應(yīng)用場景的攻關(guān)探索,在地質(zhì)智能表征、油藏智能預(yù)測與調(diào)控等場景應(yīng)用研發(fā)方面取得了一系列進(jìn)展。筆者系統(tǒng)總結(jié)勝利油田勘探開發(fā)大數(shù)據(jù)及人工智能技術(shù)研究進(jìn)展,分析該技術(shù)領(lǐng)域面臨的挑戰(zhàn),提出下一步的發(fā)展方向,以期為大數(shù)據(jù)及人工智能技術(shù)與油田勘探開發(fā)業(yè)務(wù)的深度融合、助力油田高效勘探與效益開發(fā)提供借鑒與參考。
目前,油氣勘探目標(biāo)日趨精細(xì),物探采集數(shù)據(jù)量越來越大,對地球物理資料處理、解釋的效率及精度提出了更高的要求。人工解釋無法快速認(rèn)識數(shù)據(jù)包含的特征信息,也無法獲得高質(zhì)量、高分辨率的精細(xì)解釋結(jié)果,地震解釋走向自動化和智能化已成為必然趨勢。作為一種端到端的數(shù)據(jù)分析手段,大數(shù)據(jù)及人工智能技術(shù)可更有效挖掘深層次的數(shù)據(jù)特征,對提高預(yù)測精度及工作效率、降低勘探成本都有極大的幫助。2019 年,與大數(shù)據(jù)及人工智能技術(shù)相關(guān)的研究論文在國際勘探地球物理學(xué)家學(xué)會(Society of Exploration Geophysicists,SEG)年會收錄論文的占比達(dá)到14%[3],2020年提高至近18%,表明大數(shù)據(jù)及人工智能技術(shù)是關(guān)注度最高、增長速度最快的研究方向,已成為目前油氣勘探領(lǐng)域最有力的技術(shù)創(chuàng)新“助推器”。
勝利油田的研究人員一直在積極探索大數(shù)據(jù)及人工智能技術(shù)在油氣勘探領(lǐng)域中的應(yīng)用研究,針對探區(qū)內(nèi)斷裂系統(tǒng)復(fù)雜、儲層類型復(fù)雜等地質(zhì)特點,改進(jìn)創(chuàng)新了斷層檢測、層位提取、巖性識別、測井解釋等多個油氣智能建模關(guān)鍵工作節(jié)點的技術(shù),取得了一些階段性應(yīng)用成果和經(jīng)驗認(rèn)識。
斷層、巖性變化、噪聲干擾都會導(dǎo)致地震反射同相軸的不連續(xù)性,常規(guī)的相干[4]、方差[5]、曲率[6]和斷層似然性[7]等地震屬性分析方法無法對斷層進(jìn)行有效識別。雖然可利用平滑濾波[8]、螞蟻追蹤[9-10]等方法對其進(jìn)行后續(xù)處理以增加斷點連續(xù)性和檢測準(zhǔn)確率,但流程復(fù)雜、關(guān)鍵參數(shù)選取困難,導(dǎo)致解釋主觀性強、可靠性低、效率低等問題。利用深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可建立斷層與地震數(shù)據(jù)之間端到端的映射關(guān)系,在提升斷層解釋效率及檢測精度方面取得了一定的進(jìn)展[11],但在如何有針對性地建立斷層樣本數(shù)據(jù)、如何充分利用已有解釋成果方面的研究相對較少,限制了斷層自動檢測網(wǎng)絡(luò)模型解釋精度的進(jìn)一步提升。為此,首先開展實際斷層樣本數(shù)據(jù)的典型特征解剖,詳細(xì)梳理斷層實際解釋成果,根據(jù)花狀、階梯狀、“Y”字形等不同斷層組合樣式,分別建立實際斷層樣本庫;其次,有針對性地建立勝利探區(qū)斷層正演樣本數(shù)據(jù),統(tǒng)計分析斷層傾角、斷面方位角、斷距、斷層切割關(guān)系、地層傾角、地層曲率、地層速度、地震子波、信噪比等構(gòu)造要素及地球物理參數(shù),構(gòu)建了適用于勝利探區(qū)的三維斷層模型及地震正演數(shù)據(jù)1 000 余組,進(jìn)一步豐富斷層樣本數(shù)據(jù);最后,改進(jìn)聯(lián)合實際解釋和正演模擬樣本數(shù)據(jù)的斷層自動檢測網(wǎng)絡(luò)模型,進(jìn)一步提升復(fù)雜構(gòu)造背景下的斷層自動檢測精度。在勝利東部探區(qū)的東辛、牛莊等地區(qū)開展了應(yīng)用測試,結(jié)果表明,相比本征相干等常規(guī)方法(圖1),基于深度學(xué)習(xí)的自動檢測結(jié)果斷點清晰連續(xù),和專家解釋的斷層結(jié)果吻合度高,且計算效率可提升10 倍以上,證實了三維斷層自動檢測技術(shù)的研究潛力及應(yīng)用前景。
圖1 斷層檢測結(jié)果對比Fig.1 Comparison of fault detection results
層位解釋是地質(zhì)建模的關(guān)鍵步驟。常規(guī)層位提取技術(shù)需依賴人工干預(yù),存在工作量巨大、解釋結(jié)果不精細(xì)等問題。目前自動或半自動構(gòu)造提取方法通?;谙辔蛔粉櫍?2-13]、傾角引導(dǎo)[14-15]和波形分類[16]來逐一提取地震數(shù)據(jù)中的層位信息。此類方法主要基于局部數(shù)據(jù)分析,在噪聲較大或者地質(zhì)構(gòu)造復(fù)雜時面臨較大困難。為此,部分研究人員引入相對地質(zhì)年代體[17-18]進(jìn)行層位提取,將識別目標(biāo)由單一層位轉(zhuǎn)換為所有層位信息。借鑒該思路,為提升網(wǎng)絡(luò)泛化能力,實現(xiàn)了融合已知構(gòu)造約束的層位自動提取多任務(wù)網(wǎng)絡(luò)模型(圖2)。首先,結(jié)合探區(qū)構(gòu)造特征,利用地質(zhì)模型正演和地球物理正演生成模式豐富的相對地質(zhì)年代體樣本庫;其次,建立可同時輸出斷層與相對地質(zhì)年代體的構(gòu)造自動解釋網(wǎng)絡(luò)模型;再次,改進(jìn)損失函數(shù),融入匹配已知層位約束方程,增強深度學(xué)習(xí)網(wǎng)絡(luò)模型泛化能力;最后,不斷測試調(diào)優(yōu),獲得最終層位自動提取網(wǎng)絡(luò)模型。利用該網(wǎng)絡(luò)模型可快速預(yù)測出地震數(shù)據(jù)對應(yīng)的相對地質(zhì)年代體,并利用井震標(biāo)定,提取得到高精度的層位自動解釋結(jié)果。
圖2 融合已知構(gòu)造約束的層位自動提取多任務(wù)網(wǎng)絡(luò)模型Fig.2 Multi-task network model for automatic horizon extraction integrating known structural restraints
砂體識別描述是貫穿油氣田勘探開發(fā)全過程的一項重要工作。地震反演作為砂體預(yù)測的常規(guī)技術(shù)得到廣泛應(yīng)用[19-20],但不論是疊后反演還是疊前反演,受限于地震的縱向分辨率,井間預(yù)測結(jié)果分辨率較低、可靠性較弱,準(zhǔn)確率有待進(jìn)一步提高。機(jī)器學(xué)習(xí)方法從井點出發(fā),充分挖掘地震屬性與測井巖性敏感曲線之間的數(shù)據(jù)關(guān)系[21-23],最大限度地發(fā)揮地震屬性的利用效率,預(yù)測結(jié)果的縱向分辨率高于確定性反演,井間可靠性優(yōu)于地質(zhì)統(tǒng)計學(xué)反演。但是井點數(shù)據(jù)較少,需要有針對性地進(jìn)行屬性特征優(yōu)選及機(jī)器學(xué)習(xí)超參數(shù)優(yōu)化,不斷提升砂體預(yù)測精度。為此,提出了基于機(jī)器學(xué)習(xí)方法和地震屬性特征雙優(yōu)選的砂體巖性識別方法。從地質(zhì)認(rèn)識出發(fā),明確砂巖發(fā)育段的地震反射特征,提取大量跟砂體特征相關(guān)的屬性數(shù)據(jù),分析屬性之間的線性相關(guān)性,剔除相關(guān)性較強的屬性,并通過機(jī)器學(xué)習(xí)方法展開輸入屬性對砂體巖性的重要程度分析(圖3),判斷每一種輸入屬性對于目標(biāo)的重要程度,數(shù)值越大,重要程度越高,將重要程度較低的屬性剔除;然后,針對研究區(qū)具體情況,將優(yōu)選出的屬性集及巖性敏感測井曲線作為樣本,嘗試多種不同機(jī)器學(xué)習(xí)方法,從眾多機(jī)器學(xué)習(xí)方法中進(jìn)行優(yōu)選;最后,使用K 折交叉驗證法進(jìn)行超參數(shù)優(yōu)化,找到模型泛化性能最優(yōu)的超參數(shù),獲得偏差和方差都低的評估結(jié)果。該方法在勝利油田實際工區(qū)應(yīng)用取得較好效果。
圖3 輸入屬性對砂體巖性的重要程度分析結(jié)果Fig.3 Analysis results of input attribute importance for sand body lithology
測井巖性自動識別 常規(guī)測井曲線巖性識別方法主要包括交會圖[24]、統(tǒng)計學(xué)方法[25-26]等。但隨著巖性識別目標(biāo)越來越復(fù)雜,識別結(jié)果越來越精細(xì)、多解性越來越強,亟需尋找可以進(jìn)一步挖掘巖性測井響應(yīng)特征的技術(shù)手段,以提升測井巖性識別精度及效率。為此,將知識圖譜、深度學(xué)習(xí)技術(shù)相結(jié)合,建立了測井巖性的自動識別技術(shù)流程(圖4)。首先,建立測井領(lǐng)域知識圖譜,提取鄰井同層知識特征。根據(jù)巖性識別業(yè)務(wù)需求,基于石油技術(shù)詞典、測井領(lǐng)域文獻(xiàn)、測井專業(yè)書籍、地質(zhì)勘探書籍、地質(zhì)開發(fā)書籍等測井領(lǐng)域資料構(gòu)建測井知識體系分類、測井本體模型,進(jìn)行命名實體識別、關(guān)系抽取、知識融合,建立測井知識圖譜,并通過知識表征技術(shù),實現(xiàn)了鄰井同層的知識特征提??;其次,通過卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶神經(jīng)網(wǎng)絡(luò),實現(xiàn)了測井曲線的數(shù)據(jù)特征提取;最后,經(jīng)由注意力機(jī)制將兩類特征相融合,建立了深度神經(jīng)網(wǎng)絡(luò)與知識圖譜聯(lián)合的測井巖性識別模型,實現(xiàn)了測井資料的巖性自動識別。根據(jù)上述研究思路,在勝利油田孤東七區(qū)西開展測試應(yīng)用,對該區(qū)塊40 口井進(jìn)行測試驗證,整體準(zhǔn)確率為96.3%。
圖4 聯(lián)合知識驅(qū)動與數(shù)據(jù)驅(qū)動的測井巖性自動識別技術(shù)流程Fig.4 Technical roadmap of automatic logging lithology identification driven by knowledge and data
測井小層自動劃分 老油田開發(fā)井?dāng)?shù)多、縱向?qū)酉蛋l(fā)育,地層對比人工解釋工作量大、多解性強。為反映測井曲線在深度方向的結(jié)構(gòu)特征,摒棄了常規(guī)機(jī)器學(xué)習(xí)方法中“點對點”的技術(shù)思路,重新設(shè)計了一種基于數(shù)據(jù)驅(qū)動和循環(huán)滑動時窗的小層劃分方法。通過優(yōu)選將對地質(zhì)分層敏感的測井曲線作為特征參數(shù),采取“窗口對點”的循環(huán)滑動時窗方法進(jìn)行樣本采集。同時,通過大量測試,優(yōu)選了隨機(jī)森林作為核心方法,并通過超參數(shù)調(diào)優(yōu),得到最終的小層自動劃分網(wǎng)絡(luò)模型。實際應(yīng)用測試中,“點對點”的方法預(yù)測精度為75%,改進(jìn)后的“窗口對點”劃分精度達(dá)到89%。
測井橫波速度曲線生成 疊前AVO 分析及反演需要高精度的橫波速度資料[27-28],但受成本較高的影響,實測橫波測井資料較少。通??刹捎媒?jīng)驗公式法[29]和巖石物理建模法[30]進(jìn)行橫波速度的估算。其中,經(jīng)驗公式法簡單易用,但估算精度不高,且受區(qū)域限制;而巖石物理建模法雖然估算精度較高,但是流程復(fù)雜、參數(shù)繁多,操作難度大。為此,利用深度全連接網(wǎng)絡(luò),建立其他測井曲線與橫波速度曲線之間的重構(gòu)模型。收集濟(jì)陽坳陷10 口井的實測橫波速度測井?dāng)?shù)據(jù)及常規(guī)測井曲線序列(GR,SP,AC,CNL等)開展應(yīng)用測試,隨機(jī)抽取8口井作為訓(xùn)練數(shù)據(jù),2 口井作為驗證。測試結(jié)果表明,與經(jīng)驗公式法、巖石物理建模法、多元回歸方法等常規(guī)方法相比,深度學(xué)習(xí)方法可獲得更高精度的橫波速度預(yù)測結(jié)果。
目前大數(shù)據(jù)及人工智能技術(shù)與油氣開發(fā)業(yè)務(wù)正處于深度融合發(fā)展階段,其強大的數(shù)據(jù)分析及學(xué)習(xí)能力讓傳統(tǒng)開發(fā)工作流程的轉(zhuǎn)型升級具有了新的突破點,尤其是對于油藏類型多樣、開發(fā)歷史較長的油田,已積累豐富的數(shù)據(jù)資源,利用大數(shù)據(jù)及人工智能技術(shù)可實現(xiàn)開發(fā)經(jīng)驗的快速總結(jié)與應(yīng)用。中外專家對其在油氣田開發(fā)領(lǐng)域中的應(yīng)用開展了大量的探索和研究[31-32],主要包括智能鉆完井、油藏描述及高效建模方法、流體高壓物性預(yù)測、油藏智能代理模型等方向。筆者團(tuán)隊重點對開發(fā)實驗數(shù)據(jù)挖掘與應(yīng)用、開發(fā)動態(tài)數(shù)據(jù)高效分析(注采響應(yīng)分析、生產(chǎn)指標(biāo)預(yù)測)、方案智能決策和優(yōu)化等方面開展深入研究,并取得了階段性進(jìn)展。
在油藏開發(fā)動態(tài)分析中,注采井間響應(yīng)關(guān)系的識別及連通關(guān)系的定量預(yù)測,是一項用時較長且難以定量化的工作,其結(jié)果直接決定了局部剩余油判斷的準(zhǔn)確性。雖然油藏工程方法已經(jīng)建立多種物理解析模型[33],例如電容電阻模型、飛行時間模型,但考慮因素較少造成適應(yīng)性較弱,礦場推廣應(yīng)用難度較大。
勝利油田以陸相沉積油藏為主,含油小層多且儲層物性變化快,加之生產(chǎn)時間較長、經(jīng)過較多輪次的層系組合調(diào)整,注采井間響應(yīng)關(guān)系分析更加困難,需要綜合考慮儲層平面物性變化、縱向連通程度、井網(wǎng)井距、生產(chǎn)歷史、工作制度等因素。依靠人工對井組注入量、動液面、采液量隨時間增減關(guān)系對比的定性識別方法依然是最主要的工作模式。
近年來隨著機(jī)器學(xué)習(xí)方法的進(jìn)步,勝利油田積極探索基于神經(jīng)網(wǎng)絡(luò)的注采井組動態(tài)響應(yīng)模型建立方法,通過對注采井組歷史生產(chǎn)數(shù)據(jù)的學(xué)習(xí),定量分析神經(jīng)網(wǎng)絡(luò)模型輸出節(jié)點對輸入節(jié)點的敏感性,以表征注采井間的連通程度。常規(guī)神經(jīng)網(wǎng)絡(luò)僅能夠?qū)⒂退畷r間序列動態(tài)數(shù)據(jù)作為輸入樣本,輸入數(shù)據(jù)之間平行非關(guān)聯(lián)(圖5),難以考慮注水井與多口采油井之間的空間位置關(guān)系,圖神經(jīng)網(wǎng)絡(luò)(GNN)將整個圖結(jié)構(gòu)關(guān)系作為輸入、輸出(圖6),該技術(shù)在社交網(wǎng)絡(luò)、知識圖、推薦系統(tǒng)等各個領(lǐng)域得到越來越廣泛的應(yīng)用[34-35]。
圖5 常規(guī)神經(jīng)網(wǎng)絡(luò)模型Fig.5 Conventional neural network model
圖6 圖神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.6 Structure of graph neural network model
引入GNN 方法將井點作為圖的頂點,連通關(guān)系表述為邊(圖7),該方法在根據(jù)圖節(jié)點之間的依賴關(guān)系進(jìn)行建模方面具有強大功能,使得與圖分析相關(guān)的研究具有獨特優(yōu)勢。應(yīng)用圖注意力機(jī)制與滲流物理過程信息相結(jié)合的方法[36],建立了適用于井網(wǎng)注采平衡訓(xùn)練的圖神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了預(yù)測區(qū)塊不同開發(fā)時間下的注采井動態(tài)量化預(yù)測,2021 年平均預(yù)測精度已達(dá)82%。
圖7 注采井間響應(yīng)關(guān)系結(jié)構(gòu)Fig.7 Structure of inter-well injection-production response relationship
對單井初期產(chǎn)油量、遞減率、累積產(chǎn)油量等開發(fā)指標(biāo)的預(yù)測,是油氣田開發(fā)方案制訂和優(yōu)化的重要環(huán)節(jié)[37-38]。傳統(tǒng)方法通過數(shù)值模擬和油藏工程方法來預(yù)測,但存在數(shù)值模擬方法成本高、周期較長,油藏工程模型準(zhǔn)確度低等問題。利用模式識別挖掘?qū)崟r生產(chǎn)數(shù)據(jù)中反映的生產(chǎn)信息,建立油藏或單井代理模型替代數(shù)值模擬計算或傳統(tǒng)的產(chǎn)能分析方法,可實現(xiàn)剩余油分布和生產(chǎn)指標(biāo)的快速準(zhǔn)確預(yù)測。
例如,基于深度學(xué)習(xí)方法構(gòu)建多層卷積神經(jīng)網(wǎng)絡(luò),實現(xiàn)剩余油分布的快速準(zhǔn)確預(yù)測[39-40];基于長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)構(gòu)建產(chǎn)能預(yù)測時序模型,利用歷史生產(chǎn)數(shù)據(jù)來預(yù)測油井未來的產(chǎn)油量;基于人工神經(jīng)網(wǎng)絡(luò)構(gòu)建井底壓力預(yù)測模型,輸入生產(chǎn)井中監(jiān)測的井底溫度、井筒直徑、溶解氣油比、油氣密度、油氣黏度和油氣水產(chǎn)量等數(shù)據(jù),進(jìn)行訓(xùn)練后可準(zhǔn)確計算直井多相滲流狀態(tài)下的井底流壓。
對目前常見機(jī)器學(xué)習(xí)方法、深度學(xué)習(xí)方法開展開發(fā)指標(biāo)應(yīng)用測試,結(jié)果表明各類方法在訓(xùn)練集上普遍具有較高精度的擬合能力(平均誤差為9%~15%),然而測試集的預(yù)測精度普遍較低,特別是隨著預(yù)測時間越長偏離程度越大。面對這樣的結(jié)果,應(yīng)重點思考以下問題:第一,訓(xùn)練一個適合各類油藏各種階段各種指標(biāo)的通用預(yù)測模型,還是應(yīng)該一個油藏或一類油藏訓(xùn)練一個模型;第二,單井之間、井組之間、油藏之間的差異如何全面準(zhǔn)確反映在樣本上,依據(jù)油藏工程思路構(gòu)建樣本的特征是否充足,油井開關(guān)制度、關(guān)井周期、周圍井的干擾等更多傳統(tǒng)方法難以量化的因素如何進(jìn)入樣本;第三,基于數(shù)值模擬的正演樣本和實際動態(tài)數(shù)據(jù)應(yīng)該如何融合應(yīng)用。
對勝利油田典型單元開發(fā)數(shù)據(jù)的時序特征進(jìn)行聚類分析,提出數(shù)據(jù)集應(yīng)該首先根據(jù)滲透率、儲層厚度、原油黏度三參數(shù)進(jìn)行分類;其次將開發(fā)動態(tài)數(shù)據(jù)根據(jù)措施時間進(jìn)行分段,分別對無措施、有措施進(jìn)行建模分析預(yù)測,避免了多種因素同時考慮,機(jī)器學(xué)習(xí)模型復(fù)雜程度高、訓(xùn)練速度慢的缺陷。編寫動靜態(tài)數(shù)據(jù)融合模塊,實現(xiàn)了鉆井、地質(zhì)、開發(fā)動態(tài)、措施等多源數(shù)據(jù)的自動匯總,形成了單井產(chǎn)量預(yù)測所需的數(shù)據(jù)整合方法流程。
實現(xiàn)了樣本數(shù)據(jù)的輔助清洗、轉(zhuǎn)換,形成了樣本預(yù)處理基本流程。針對無措施、有措施2 種不同預(yù)測場景,設(shè)計了有、無措施數(shù)據(jù)的自動分割方法,構(gòu)建了單井產(chǎn)量預(yù)測所需的樣本庫。通過對數(shù)據(jù)指標(biāo)的反復(fù)循環(huán)分析(單變量、多變量、數(shù)據(jù)轉(zhuǎn)換等),抽取出有用特征。初步形成了無人為預(yù)先假設(shè)條件的單井指標(biāo)預(yù)測的特征提取流程和方法。目前采用BP 神經(jīng)網(wǎng)絡(luò)(BPNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(如LSTM)方法構(gòu)建疊加模型(圖8),靜態(tài)特征向量輸入到BP 模型中,動態(tài)序列輸入到LSTM 模型中,然后用全連接層拼裝在一起形成疊加模型,這種網(wǎng)絡(luò)結(jié)構(gòu)可以提取動態(tài)時間序列數(shù)據(jù)前后變化的自相關(guān)特征,綜合靜態(tài)特征、時序數(shù)據(jù)動態(tài)趨勢特征進(jìn)行指標(biāo)預(yù)測,提高擬合、預(yù)測精度。
圖8 BPNN+LSTM網(wǎng)絡(luò)模型Fig.8 BPNN+LSTM network model
開發(fā)方案決策包括層系組合、井位優(yōu)選、注采量調(diào)整,該類工作依賴于數(shù)值模擬計算的常規(guī)歷史擬合和生產(chǎn)優(yōu)化方法,求解難度大、計算耗時長、難以快速收斂。近年來,基于代理模型輔助歷史擬合和生產(chǎn)優(yōu)化的方法受到了廣泛的關(guān)注和研究,使用代理模型替換數(shù)值模擬的復(fù)雜計算可大幅提高計算效率從而加速優(yōu)化,滿足油田現(xiàn)場的實時生產(chǎn)優(yōu)化需求[41-44]。
該類方法首先利用人工智能技術(shù)建立油藏生產(chǎn)指標(biāo)預(yù)測模型,再結(jié)合優(yōu)化目標(biāo)和優(yōu)化方法實現(xiàn)快速歷史擬合和生產(chǎn)優(yōu)化。通過神經(jīng)網(wǎng)絡(luò)和主成分分析相結(jié)合的歷史擬合方法,可根據(jù)數(shù)值模擬生成的數(shù)據(jù)訓(xùn)練得到能直接預(yù)測歷史擬合函數(shù)值的神經(jīng)網(wǎng)絡(luò)模型(圖9),結(jié)合優(yōu)化方法實現(xiàn)油藏模型參數(shù)的自動尋優(yōu);基于人工神經(jīng)網(wǎng)絡(luò)和遺傳算法的生產(chǎn)優(yōu)化方法,可以在歷史生產(chǎn)數(shù)據(jù)訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,利用遺傳算法實現(xiàn)油藏注采參數(shù)的優(yōu)化;基于代理模型的水平井完井策略優(yōu)化方法,可建立以地質(zhì)數(shù)據(jù)和水平井完井?dāng)?shù)據(jù)為輸入的代理模型,通過優(yōu)化方法對完井策略進(jìn)行優(yōu)化,實現(xiàn)水平井以最大產(chǎn)能生產(chǎn)。2021 年,筆者團(tuán)隊已初步實現(xiàn)了井位、措施等優(yōu)化系統(tǒng)的搭建,對非均質(zhì)油藏開展了優(yōu)化測試及應(yīng)用研究。
圖9 基于代理模型的油藏調(diào)控優(yōu)化模型Fig.9 Optimized reservoir control model based on agent model
開發(fā)實驗數(shù)據(jù)的挖掘是大數(shù)據(jù)及人工智能技術(shù)比較容易實現(xiàn)的應(yīng)用領(lǐng)域,因為實驗類數(shù)據(jù)保存相對規(guī)范,最接近商業(yè)大數(shù)據(jù)格式,預(yù)測效果是否準(zhǔn)確主要取決于數(shù)據(jù)的數(shù)量和質(zhì)量,其研究起步較早。GULER 等用機(jī)器學(xué)習(xí)的方法,將巖石的參數(shù)輸入ANN 網(wǎng)絡(luò)中,得到不同巖石含水飽和度下的水油相對滲透率[45];AL-FATTAH 等利用ANN 模型進(jìn)行了碳酸鹽巖儲層相對滲透率的預(yù)測,并得到了較好的曲線擬合結(jié)果[46]。在非常規(guī)領(lǐng)域通過機(jī)器學(xué)習(xí)可實現(xiàn)巖心實驗數(shù)據(jù)到測井跨尺度建模預(yù)測,以及缺失曲線、壞井眼等影響因素下的曲線智能重構(gòu)[47-49]。
筆者團(tuán)隊目前正在開展相對滲透率曲線、流體高壓物性的預(yù)測研究。利用大數(shù)據(jù)技術(shù)可建立常規(guī)巖心數(shù)據(jù)、測井?dāng)?shù)據(jù)與相對滲透率曲線的預(yù)測模型,并通過地層流體的組分預(yù)測流體密度、黏度等特征參數(shù),為精細(xì)反映三維地質(zhì)體內(nèi)油水滲流差異提供支撐。研究表明,相對滲透率曲線的形態(tài)預(yù)測不僅需要考慮孔隙度、滲透率、流體黏度等參數(shù),還需要考慮井位的空間坐標(biāo)及深度等地質(zhì)信息,測試集的預(yù)測精度才能獲得較大幅度的提高。通常一口取心井上可獲取多個層段的相對滲透率曲線,所以相對滲透率數(shù)據(jù)的基本特征是“平面集中、縱向分散”,將相同地質(zhì)層位的巖心作為一類特殊樣本,增加該類樣本的權(quán)重可大幅度提高測試應(yīng)用的預(yù)測精度。目前正在積極探索基于測井曲線的預(yù)測方法,直接將巖心對應(yīng)的測井?dāng)?shù)據(jù)作為基本輸入信息,進(jìn)一步提高模型的預(yù)測精度。地層流體高壓物性預(yù)測方面,整理清洗井口脫氣原油的組分?jǐn)?shù)據(jù)和地層原油的飽和壓力、原油密度等高壓物性實驗數(shù)據(jù),形成地面井流物-地層流體高壓物性參數(shù)的機(jī)器學(xué)習(xí)樣本集,創(chuàng)建包含回歸決策樹、支持向量機(jī)、XGBoost、神經(jīng)網(wǎng)絡(luò)等多模型機(jī)器學(xué)習(xí)預(yù)測方法,實現(xiàn)了高壓物性參數(shù)的智能預(yù)測。
為進(jìn)一步挖掘勘探開發(fā)數(shù)據(jù)潛力,提升油氣勘探大數(shù)據(jù)及人工智能技術(shù)應(yīng)用水平,將重點從以下3個方面開展持續(xù)攻關(guān)。
加強油氣勘探開發(fā)領(lǐng)域的大數(shù)據(jù)及人工智能核心算法攻關(guān) 實現(xiàn)高質(zhì)量勘探開發(fā)智能化應(yīng)用的前提在于核心算法的創(chuàng)新與突破。研發(fā)適合勘探開發(fā)的復(fù)雜多模態(tài)多任務(wù)網(wǎng)絡(luò)是解決該問題的有效途徑??碧介_發(fā)是石油工業(yè)上游的核心業(yè)務(wù),具有高技術(shù)、高密度特點,其業(yè)務(wù)鏈長、涉及環(huán)節(jié)多、上下聯(lián)系緊密。創(chuàng)建的智能方法框架(模型)應(yīng)可以融合勘探開發(fā)相關(guān)的多專業(yè)數(shù)據(jù)及多領(lǐng)域知識,通過多模態(tài)、多任務(wù)的模式表征行業(yè)中復(fù)雜的數(shù)據(jù)關(guān)系,從而滿足行業(yè)不同場景的應(yīng)用需求,獲得高精度、高遷移能力的智能預(yù)測模型。
加快油氣勘探開發(fā)智能應(yīng)用樣本數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)庫建立 大量的應(yīng)用經(jīng)驗表明,大數(shù)據(jù)及人工智能技術(shù)突破的基礎(chǔ)在于高質(zhì)量、大規(guī)模的數(shù)據(jù)資源。首先,需要圍繞勘探開發(fā)核心目標(biāo),分析勘探開發(fā)、地質(zhì)工程等不同應(yīng)用場景的研究需求,結(jié)合油藏實際特征,建立勘探開發(fā)智能應(yīng)用所需的樣本數(shù)據(jù)標(biāo)準(zhǔn)。其次,根據(jù)樣本數(shù)據(jù)標(biāo)準(zhǔn),依托油田信息化、數(shù)字化建設(shè)基礎(chǔ),嚴(yán)格把控重力、磁力、電法、地震、測井、巖心、錄井、開發(fā)動態(tài)等勘探開發(fā)觀測數(shù)據(jù)及其成果解釋數(shù)據(jù)的質(zhì)量,實現(xiàn)分區(qū)塊、分油藏類型的實際樣本數(shù)據(jù)庫構(gòu)建。同時,深入開展地質(zhì)模型、地球物理及油藏物理機(jī)理研究,逐步實現(xiàn)從靜態(tài)地質(zhì)模型到動態(tài)演化的地質(zhì)模型模擬、從簡化方程到完備方程的地球物理數(shù)據(jù)模擬、從簡單數(shù)據(jù)趨勢預(yù)測到數(shù)值模擬與機(jī)器學(xué)習(xí)結(jié)合、從單一概率到混合分布的噪聲模擬,獲得大量的、符合實際情況的勘探開發(fā)物理模擬數(shù)據(jù),進(jìn)一步豐富勘探開發(fā)樣本庫。
促進(jìn)油氣勘探開發(fā)大數(shù)據(jù)及人工智能技術(shù)應(yīng)用平臺建設(shè) 油氣勘探開發(fā)專業(yè)性強,對數(shù)據(jù)管理、計算、成圖等有著特殊的要求?,F(xiàn)有工作的開展往往需要依托不同的專業(yè)軟件系統(tǒng),存在數(shù)據(jù)不統(tǒng)一、流程一體化改造難等問題。而大數(shù)據(jù)及人工智能技術(shù)采用端到端的學(xué)習(xí)模式,可對各類數(shù)據(jù)信息進(jìn)行有效融合,并將其統(tǒng)一至同一個研究目標(biāo),便于勘探開發(fā)業(yè)務(wù)流程的一體化重塑。為此,需對標(biāo)中外一流大數(shù)據(jù)及人工智能應(yīng)用平臺,充分借鑒成熟發(fā)展經(jīng)驗,不斷夯實擴(kuò)充分布式存儲、高性能計算、可視化環(huán)境等軟硬件基礎(chǔ),優(yōu)化集成各類數(shù)據(jù)接口、專業(yè)數(shù)據(jù)處理、機(jī)器學(xué)習(xí)等算法模塊,開發(fā)創(chuàng)新勘探開發(fā)智能一體化工作流程搭建、智能預(yù)測模型發(fā)布、智能應(yīng)用綜合評價等核心應(yīng)用,打造適用于油氣勘探開發(fā)的大數(shù)據(jù)及人工智能技術(shù)應(yīng)用平臺,為油田數(shù)字化轉(zhuǎn)型提供技術(shù)支撐。
大數(shù)據(jù)及人工智能技術(shù)已在各行各業(yè)展示了巨大的應(yīng)用潛力,也在油氣勘探開發(fā)領(lǐng)域步入了融合發(fā)展階段。近年來,在勝利油田多個勘探開發(fā)智能應(yīng)用場景進(jìn)行了有益的探索研究,并在斷層自動檢測、層位自動提取、砂體自動預(yù)測、測井自動解釋、開發(fā)實驗數(shù)據(jù)挖掘與應(yīng)用、開發(fā)動態(tài)數(shù)據(jù)高效分析(注采井間響應(yīng)分析、生產(chǎn)指標(biāo)預(yù)測)、方案智能決策和優(yōu)化等方面取得了進(jìn)展。研究成果表明,大數(shù)據(jù)及人工智能技術(shù)可為紛繁復(fù)雜的勘探開發(fā)數(shù)據(jù)及應(yīng)用需求提供新的高質(zhì)量及高效分析手段,發(fā)展?jié)摿薮蟆?/p>
實現(xiàn)勘探開發(fā)數(shù)據(jù)智能應(yīng)用的進(jìn)一步突破,還面臨著勘探開發(fā)專業(yè)與大數(shù)據(jù)及人工智能技術(shù)融合不足、勘探開發(fā)數(shù)據(jù)庫不完備、平臺建設(shè)滯后等問題。面臨上述挑戰(zhàn),有必要開展技術(shù)深化研究、基礎(chǔ)數(shù)據(jù)規(guī)范化管理、算法模塊及平臺持續(xù)開發(fā)等方面的工作。
挑戰(zhàn)與機(jī)遇共存,圍繞油氣勘探開發(fā)的精細(xì)化需求,不斷加強勘探開發(fā)大數(shù)據(jù)及人工智能技術(shù)攻關(guān),將會有助于催生出一系列高效、實用化的油田數(shù)據(jù)智能分析新技術(shù),打造出一批學(xué)科交叉、研究能力過硬的創(chuàng)新團(tuán)隊,為油田的數(shù)字化、智能化轉(zhuǎn)型及高質(zhì)量發(fā)展提供新的動能。