国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)在水力壓裂作業(yè)中的應(yīng)用綜述

2022-01-18 00:15何玉榮宋志超張燕明肖元相
關(guān)鍵詞:水力決策樹機(jī)器

何玉榮,宋志超,張燕明,肖元相

(1.哈爾濱工業(yè)大學(xué)能源科學(xué)與工程學(xué)院,黑龍江哈爾濱 150001;2.中國石油天然氣股份有限公司長慶油田分公司油氣工藝研究院,陜西西安 710018)

數(shù)據(jù)驅(qū)動(dòng)技術(shù)為科學(xué)研究及工程應(yīng)用提供了一系列新的研究手段,可用于在大量數(shù)據(jù)中檢測數(shù)據(jù)背后的隱藏關(guān)系、計(jì)算不確定性以及吸收多種數(shù)據(jù)類型進(jìn)而提取有用信息[1]。傳統(tǒng)理論建模方法多依賴于試錯(cuò),而且計(jì)算過程耗時(shí)冗余,利用機(jī)器學(xué)習(xí)算法發(fā)現(xiàn)數(shù)據(jù)的物理本構(gòu)關(guān)系,可以簡化理論模型,加速模型計(jì)算,成為傳統(tǒng)模型的有利補(bǔ)充[2]。自水力壓裂技術(shù)試點(diǎn)[3]成功以來,測井?dāng)?shù)據(jù)數(shù)量與質(zhì)量不斷提高,為機(jī)器學(xué)習(xí)在水力壓裂作業(yè)中的實(shí)施提供了有利基礎(chǔ)。值得注意的是,機(jī)器學(xué)習(xí)算法在水力壓裂作業(yè)中已經(jīng)成為不可或缺[4]的實(shí)用工具。由于傳感器收集的數(shù)據(jù)如速度、壓力具有非線性和高維度特性,如何將這些原始數(shù)據(jù)轉(zhuǎn)換為可用信息作為輸出,納入現(xiàn)場監(jiān)控和生產(chǎn)管理至關(guān)重要。筆者綜述水力壓裂作業(yè)過程中常見的機(jī)器學(xué)習(xí)算法,重點(diǎn)論述這些經(jīng)典機(jī)器學(xué)習(xí)算法在水力壓裂作業(yè)中的實(shí)際應(yīng)用,包括對壓裂作業(yè)中參數(shù)預(yù)測與評估、產(chǎn)能預(yù)測與優(yōu)化、實(shí)時(shí)預(yù)測與監(jiān)控等。最后對機(jī)器學(xué)習(xí)算法在水力壓裂應(yīng)用過程中面臨的挑戰(zhàn)以及未來可能的研究方向進(jìn)行展望。

1 經(jīng)典機(jī)器學(xué)習(xí)算法

機(jī)器學(xué)習(xí)是數(shù)據(jù)驅(qū)動(dòng)建模的統(tǒng)稱,也是人工智能算法的子集[5]。機(jī)器學(xué)習(xí)通過學(xué)習(xí)過程,從訓(xùn)練集中獲取經(jīng)驗(yàn),并比對測試集進(jìn)行驗(yàn)證。機(jī)器學(xué)習(xí)算法在特定的任務(wù)當(dāng)中,模型的性能是通過性能指標(biāo)來衡量的。雖然機(jī)器學(xué)習(xí)算法眾多,但是沒有算法可以完美地解決所有問題,尤其是對于預(yù)測模型來說,受到數(shù)據(jù)集的規(guī)模和結(jié)構(gòu)影響較大。主要綜述預(yù)測模型中的經(jīng)典算法以及各算法的特點(diǎn)及其適用性。

1.1 線性回歸

線性回歸也被稱為簡單線性回歸,將兩個(gè)變量之間的關(guān)系用一條直線表示[6]。通過調(diào)整一元函數(shù)的斜率和截距找到最優(yōu)直線,從而最小化回歸誤差。該模型[7]可表示為

y=b0+b1x.

(1)

式中,x為輸入?yún)?shù);y為輸出參數(shù);b0和b1分別為一元函數(shù)的截距和斜率。

多元線性回歸模型被用于檢查多個(gè)變量之間的線性相關(guān)性,是普通最小二乘法的延伸[8],在此基礎(chǔ)上進(jìn)行預(yù)測分析,該模型可表示為

y=β0+β1x1+β2x2+…+βzxz+ε.

(2)

式中,y為預(yù)測參數(shù);xi為輸入?yún)?shù);β0為常數(shù);βi為回歸系數(shù);ε為殘差項(xiàng)。

多元線性回歸模型中認(rèn)為輸入變量與輸出變量之間存在線性關(guān)系,獨(dú)立變量之間不是高度彼此相關(guān)[9]。線性回歸算法的優(yōu)點(diǎn)是計(jì)算簡單,其缺點(diǎn)是不能擬合非線性數(shù)據(jù)。

1.2 樹型算法

樹型算法與線性模型不同,樹型模型對非線性關(guān)系也可以有很好的映射,這些算法賦予預(yù)測模型穩(wěn)定性與準(zhǔn)確性。常見的樹型模型有決策樹[10](回歸樹、分類樹),隨機(jī)森林[11]、梯度提升樹[12]等。

決策樹(decision tree,DT)是有監(jiān)督學(xué)習(xí)中常見的分類(回歸)算法,決策樹的生成通常分為兩個(gè)步驟[13]:①節(jié)點(diǎn)分裂,若分裂該節(jié)點(diǎn)可獲得最大信息增益,則該節(jié)點(diǎn)分裂為兩個(gè)或多個(gè)節(jié)點(diǎn);②閾值確定,選擇合適的閾值可以使誤差達(dá)到最小。在實(shí)際應(yīng)用過程中,決策樹算法對具有時(shí)間序列的數(shù)據(jù),需要過多的預(yù)處理,在分類作業(yè)過程中,決策樹算法錯(cuò)誤會(huì)增加的很快。

決策樹算法[14]易于理解、可視化分析、從模型中提取規(guī)則、運(yùn)行速度較快,可以在短時(shí)間內(nèi)對大規(guī)模數(shù)據(jù)集做出效果良好的預(yù)測。但是該算法不容易發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)屬性,易出現(xiàn)過擬合現(xiàn)象;另外當(dāng)數(shù)據(jù)集中出現(xiàn)一新的數(shù)據(jù)時(shí),需重新計(jì)算。隨機(jī)森林就是以這些問題為切入點(diǎn)被提出的。

隨機(jī)森林是一種基于決策樹模型的分類與回歸模型,當(dāng)對某一具體問題進(jìn)行預(yù)測時(shí),需統(tǒng)計(jì)隨機(jī)森林中每一顆決策樹的預(yù)測結(jié)果。隨機(jī)森林的隨機(jī)體現(xiàn)在兩個(gè)方面,一為隨機(jī)抽樣,二為隨機(jī)特征,被視為多個(gè)獨(dú)立的決策樹模型[11],其數(shù)學(xué)模型可表示為

(3)

式中,hi為決策樹模型;N為決策樹模型的個(gè)數(shù)。

隨機(jī)森林模型通過平均決策樹模型,降低了模型過擬合的風(fēng)險(xiǎn)[15],即使數(shù)據(jù)集中出現(xiàn)一個(gè)新點(diǎn),隨機(jī)森林整體算法也不會(huì)受很大影響。但是相比于決策樹而言,隨機(jī)森林引入決策樹個(gè)數(shù)、最大深度、候選特征數(shù)范圍等超參數(shù),使模型變得更為復(fù)雜,同時(shí)增加了計(jì)算成本。具體算法[16]如圖1所示。

圖1 隨機(jī)森林算法與原理Fig.1 Random forest algorithm and principle

1.3 神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)是受生物神經(jīng)系統(tǒng)啟發(fā)而產(chǎn)生的統(tǒng)計(jì)學(xué)模型,對人腦神經(jīng)系統(tǒng)進(jìn)行抽象構(gòu)造人工神經(jīng)元,神經(jīng)元之間的連接由一定拓?fù)浣Y(jié)構(gòu)構(gòu)建,神經(jīng)網(wǎng)絡(luò)在挖掘非線性數(shù)據(jù)關(guān)系方面非常有效,被認(rèn)為是石油工程師的新工具[17]。水力壓裂技術(shù)過程中常見的神經(jīng)網(wǎng)絡(luò),包含前饋神經(jīng)網(wǎng)絡(luò)(feedforward neural network,FNN)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function network,RBF network)以及卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,ConvNet或CNN),結(jié)構(gòu)示意如圖2[18-19]所示。

圖2 前饋神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)算法與原理Fig.2 Feedforward neural network and convolutional neural network algorithm and principle

前饋神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層、輸出層3部分組成。整體算法分為正向傳播和反向傳播兩個(gè)過程,對于正向傳播而言,任意神經(jīng)元的數(shù)學(xué)模型[20]可表示為

(4)

式中,xj為凈輸入;yi為神經(jīng)元的凈輸出;w為權(quán)重矩陣;b為偏置向量;f為激活函數(shù);k為上一層隱藏層神經(jīng)元數(shù)量。

考慮非線性對模型的影響,解決線性模型的缺陷[21],若沒有激活函數(shù),即f(x)=x相對于神經(jīng)網(wǎng)絡(luò)沒有隱藏層的情況,神經(jīng)網(wǎng)絡(luò)退化成最初始的感知機(jī)。常見的激活函數(shù)有Sigmoid型函數(shù)、Tanh函數(shù)、ReLU函數(shù)系列、Swish函數(shù)等,激活函數(shù)的選擇直接決定了輸入與輸出之間的非線性映射。2017年谷歌公司[22]提出一種形式簡單的激活函數(shù)即Swish函數(shù),表明對于絕大多數(shù)情況,Swish激活函數(shù)優(yōu)于ReLU函數(shù)。

對于反向傳播而言,通過最小化非凸損失函數(shù)(對于回歸問題一般是均方差,對于分類問題一般為交叉熵),找到神經(jīng)網(wǎng)絡(luò)權(quán)重的最大似然估計(jì),利用梯度下降法更新權(quán)重矩陣[18]。其數(shù)學(xué)模型的一般表達(dá)式為

(5)

式中,L(x,y)為損失函數(shù);α為步長或稱為學(xué)習(xí)速率。利用鏈?zhǔn)角髮?dǎo)法則即可求出各層各參數(shù)的偏導(dǎo)數(shù)。

前饋神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)能力,適用于高維度、高自由度、非線性問題,但是容易出現(xiàn)訓(xùn)練集損失函數(shù)不斷下降,測試集卻趨于不變,即出現(xiàn)過擬合現(xiàn)象。Srivastava等[23]提出Dropout技術(shù),發(fā)現(xiàn)可以有效避免過擬合現(xiàn)象。

RBF神經(jīng)網(wǎng)絡(luò)[24]是僅有一層隱藏層的神經(jīng)網(wǎng)絡(luò),且激活函數(shù)為徑向基函數(shù),相比于普通神經(jīng)網(wǎng)絡(luò)而言,RBF神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的逼近能力,結(jié)構(gòu)簡單,可以逼近任意非線性函數(shù)且輸入節(jié)點(diǎn)與隱藏層之間的連接權(quán)重為1。對于RBF神經(jīng)網(wǎng)絡(luò)而言,僅有一層隱藏層,隱藏層的神經(jīng)元個(gè)數(shù)為N,N的選取根據(jù)具體問題而設(shè)定,RBF隱藏層第j個(gè)節(jié)點(diǎn)的數(shù)學(xué)模型[24]的輸出表示為

(6)

輸出層的數(shù)學(xué)模型[24]可表示為

(7)

式中,ωj為權(quán)重;F(xj)為輸出。

RBF神經(jīng)網(wǎng)絡(luò)保留了上述神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),例如,非線性映射能力強(qiáng)、并行能力強(qiáng);此外由于RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單算法速度得到了極大提高,且具有很強(qiáng)的聚類分析能力。

卷積神經(jīng)網(wǎng)絡(luò)[25]是一種典型的深層神經(jīng)網(wǎng)絡(luò),在計(jì)算機(jī)視覺領(lǐng)域占據(jù)主導(dǎo)地位。僅采用全連接神經(jīng)網(wǎng)絡(luò)處理圖像信息時(shí),具有參數(shù)過多和局部不變性特征兩個(gè)問題。而卷積神經(jīng)網(wǎng)絡(luò)具有局部連接、權(quán)重共享以及匯聚等特點(diǎn),使得卷積神經(jīng)網(wǎng)絡(luò)在圖像處理等領(lǐng)域的準(zhǔn)確率遠(yuǎn)遠(yuǎn)超過其他神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖2(b)所示。卷積神經(jīng)網(wǎng)絡(luò)一般包括卷積層、池化層、全連接層3部分[19],卷積層是一種局部特征提取器,特征圖數(shù)量由卷積核數(shù)量直接決定;池化層是一種特征壓縮器,將卷積層提取到的特征壓縮,減小圖像的失真率,通過池化層使得圖像具有一定的局部不變性;全連接層是一種分類器,對特征進(jìn)行分類輸出,針對分類問題最后一層一般是Softmax輸出層。

神經(jīng)網(wǎng)絡(luò)[26]可以處理大規(guī)模數(shù)據(jù),準(zhǔn)確率高,易于并行,能充分逼近任意復(fù)雜的非線性關(guān)系;對于小噪點(diǎn)數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)也具有較強(qiáng)的魯棒性和容錯(cuò)性。但是神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長,需要大量參數(shù)且訓(xùn)練過程為黑盒過程,使得輸出結(jié)果難以解釋。

2 機(jī)器學(xué)習(xí)在水力壓裂作業(yè)中的應(yīng)用

水力壓裂作為一種增產(chǎn)技術(shù),自20世紀(jì)以來,迅速在全球范圍內(nèi)得到廣泛應(yīng)用[3]。該技術(shù)通常將數(shù)十兆帕的壓裂液泵入井筒中,在地層中形成裂縫,同時(shí)裂縫在支撐劑的作用下保持打開狀態(tài),促使致密油氣輸送到地面。此外水力壓裂可結(jié)合水平鉆井技術(shù),使其成為最具成本收益的增產(chǎn)技術(shù)。然而在實(shí)際多級壓裂作業(yè)中,有多達(dá)三分之一的射孔簇沒有產(chǎn)出[27]。這是因?yàn)閴毫言O(shè)計(jì)尚有缺陷以及地質(zhì)學(xué)等因素導(dǎo)致各射孔簇產(chǎn)量不均勻。在水力壓裂作業(yè)前根據(jù)井的歷史數(shù)據(jù)和儲層信息對產(chǎn)能進(jìn)行預(yù)測,對壓裂進(jìn)行優(yōu)化設(shè)計(jì),有助于提高產(chǎn)能。在水力壓裂作業(yè)中,實(shí)時(shí)對相關(guān)參數(shù)諸如裂縫密度、滲透率、聲波曲線、壓力曲線等進(jìn)行預(yù)測,可以實(shí)時(shí)改變壓裂設(shè)計(jì)方案。

2.1 水力壓裂作業(yè)中參數(shù)預(yù)測與評估

在水力壓裂過程中諸如:滲透率、裂縫密度等參數(shù)難以直接測量,不易評估[28]。近數(shù)十年來,試驗(yàn)和數(shù)值模擬方法積累了大量相關(guān)數(shù)據(jù),為機(jī)器學(xué)習(xí)算法在參數(shù)評估與預(yù)測方面的實(shí)施提供了基礎(chǔ)。本部分主要綜述機(jī)器學(xué)習(xí)與物理建模的混合應(yīng)用、機(jī)器學(xué)習(xí)對水力壓裂作業(yè)中未知的關(guān)鍵參數(shù)的預(yù)測與評估。

水力壓裂作業(yè)過程中,對裂縫進(jìn)行全面建模、表征裂縫幾何形狀是實(shí)現(xiàn)油氣管理預(yù)測的必要條件[29]。模擬油氣在多孔介質(zhì)中三維輸運(yùn)建模是石油壓裂過程中常見的方法,建模方法種類較多,例如:由Ertekin等[29]提出的有限差分流體動(dòng)力學(xué)模擬,Hunsweck等[30]提出有限元方法模擬水力裂縫的擴(kuò)展,Crouch等[31]提出邊界元方法改進(jìn)擬三維模型。為了精準(zhǔn)計(jì)算,通常采用底層模擬或細(xì)網(wǎng)格技術(shù),相比之下耗費(fèi)時(shí)間。

機(jī)器學(xué)習(xí)建?;驒C(jī)器學(xué)習(xí)與傳統(tǒng)方法混合建模在石油壓裂領(lǐng)域得到了廣泛應(yīng)用。Kalyuzhnyuk等[32]利用神經(jīng)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)數(shù)值模擬建模,成功應(yīng)用于穩(wěn)態(tài)水力裂縫形狀的評估。Artun[33]分別采用神經(jīng)網(wǎng)絡(luò)與簡單物理建?!娙?電阻模型構(gòu)建具有合理精度和計(jì)算效率的地質(zhì)模型,量化注水油藏注采井之間的井間儲層連通性。相比之下神經(jīng)網(wǎng)絡(luò)模型更具有靈活性,訓(xùn)練時(shí)間不足1 min,具有很高的計(jì)算效率。Urban-Rascon等[34]利用微地震數(shù)據(jù)結(jié)合自組織映射與多屬性分析,對霍恩河頁巖的裂縫網(wǎng)絡(luò)的復(fù)雜性進(jìn)行表征;并利用人工神經(jīng)網(wǎng)絡(luò)輔助選擇與現(xiàn)場裂縫和模擬相關(guān)的重要數(shù)據(jù)。Llorca等[35]利用神經(jīng)網(wǎng)絡(luò)對虛擬瞬態(tài)壓力進(jìn)行模擬,利用現(xiàn)場瞬變壓力進(jìn)行訓(xùn)練,對未進(jìn)行試井的其他井的瞬變壓力進(jìn)行預(yù)測,并評估了測試井的生產(chǎn)歷史、井的數(shù)量以及井的位置。該模型不僅降低了試井的成本,并在幾秒之內(nèi)生成可靠的虛擬瞬態(tài)壓力數(shù)據(jù);而且通過對虛擬瞬態(tài)壓力進(jìn)行分析,同時(shí)可以預(yù)測干擾效應(yīng)與儲層滲透率。

至今,在水力壓裂作業(yè)中應(yīng)用了各種機(jī)器學(xué)習(xí)算法,每種建模方法各具特色。除取代傳統(tǒng)數(shù)值模擬或與數(shù)值模擬混合使用探究參數(shù)信息外,還可以根據(jù)以往的測井?dāng)?shù)據(jù)結(jié)合當(dāng)?shù)貎泳唧w情況,直接獲取裂縫或儲層等相關(guān)信息,并對壓裂效果進(jìn)行評估。Jafari等[36]使用伊朗西南部油田結(jié)合模糊神經(jīng)網(wǎng)絡(luò)方法,將聲波、體積密度、孔隙率、電阻率作為輸入?yún)?shù),推斷裂縫密度,構(gòu)造離散和連續(xù)兩種模型,均可對裂縫密度進(jìn)行良好的推斷。Li等[37]利用遺傳算法結(jié)合支持向量機(jī)對裂縫密度做出了精準(zhǔn)預(yù)測。Mohamed等[38]利用線性回歸和多層感知機(jī)算法預(yù)測裂縫閉合壓力、裂縫閉合時(shí)間、滲透率等參數(shù),同時(shí)將輸出結(jié)果與實(shí)際測量結(jié)果相比較,均獲得了良好結(jié)果。Kumar等[39]利用德克薩斯州米德蘭盆地的水力壓裂試驗(yàn)場的示蹤、完井及增產(chǎn)數(shù)據(jù),對水力壓裂作用中的天然裂縫以及新產(chǎn)生的裂縫組成的裂縫網(wǎng)絡(luò)進(jìn)行了詳細(xì)評估,為非常規(guī)儲層的油氣采收提供參考。將現(xiàn)有數(shù)據(jù)與機(jī)器學(xué)習(xí)方式相結(jié)合,提供裂縫網(wǎng)絡(luò)以及流動(dòng)信息并將其可視化表示,可為油氣生產(chǎn)優(yōu)化提供較優(yōu)決策。

雖然上述研究中機(jī)器學(xué)習(xí)算法可以獲得良好結(jié)果,但是由于數(shù)據(jù)規(guī)模與數(shù)據(jù)結(jié)構(gòu)不同,導(dǎo)致沒有一種算法可以適用于所有情況。具體何種算法最適用于所面臨的問題,往往需要多次嘗試。Nouri-Taleghani等[40]對比了RBF神經(jīng)網(wǎng)絡(luò)、多層感知機(jī)算法并采用遺傳算法優(yōu)化各算法的權(quán)重,利用全套測井?dāng)?shù)據(jù)進(jìn)行訓(xùn)練,提升模型泛化能力,開發(fā)確定裂縫密度的數(shù)學(xué)模型,取代傳統(tǒng)巖心數(shù)據(jù)和圖像測井方法。相比之下RBF神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的預(yù)測能力。Shi[41]針對南襄盆地泌陽凹陷安棚油田以及鄂爾多斯盆地塔巴廟地區(qū)致密油田分別采用支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、多元回歸分析算法對裂縫進(jìn)行預(yù)測。結(jié)果證明支持向量機(jī)在有限數(shù)據(jù)下精度較高,在工程應(yīng)用中可以作為輔助工具。Wang等[42]對比了4種有監(jiān)督學(xué)習(xí)算法:隨機(jī)森林、提升樹、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)算法,對每口井泵送的支撐劑、真實(shí)垂直深度等近20個(gè)重要參數(shù)進(jìn)行了預(yù)測,發(fā)現(xiàn)基于隨機(jī)森林算法的預(yù)測模型對Montney致密油井水力裂縫處理更有效,可為工程應(yīng)用提供很高的實(shí)用價(jià)值。

機(jī)器學(xué)習(xí)除直接預(yù)測裂縫或儲層參數(shù)信息外,在實(shí)際壓力過程中由于壓裂作業(yè)的成本受限,在鉆井過程中沒有對相關(guān)測井曲線進(jìn)行測定;或由于老井年久,導(dǎo)致相關(guān)參數(shù)缺失,一些研究中嘗試?yán)脵C(jī)器學(xué)習(xí)算法,從可用參數(shù)中估算實(shí)際參數(shù)。Onalo等[43]利用多層感知機(jī)神經(jīng)網(wǎng)絡(luò)結(jié)合實(shí)際伽馬射線與地層密度估算了地層中聲波縱波與橫波的渡越時(shí)間。Bukar等[44]分別利用多元性回歸模型、支持向量機(jī)、決策樹(回歸樹)等有監(jiān)督學(xué)習(xí)算法對聲波測井曲線進(jìn)行預(yù)測。對于缺少聲波測井?dāng)?shù)據(jù)的老油氣田,這種方法尤為重要。Shan等[45]將卷積神經(jīng)網(wǎng)絡(luò)與雙向長短期記憶神經(jīng)網(wǎng)絡(luò)相結(jié)合,在中國港東油田進(jìn)行了性能測評,在實(shí)際工程應(yīng)用中可應(yīng)用該方法補(bǔ)充聲波測井、伽馬射線測井以及自發(fā)電位測井的數(shù)據(jù)。樊毅龍等[46]通過蘇東氣井篩選收集了800口井關(guān)于施工條件和生產(chǎn)方面的數(shù)據(jù)集,通過多元線性回歸算法,分析各個(gè)參數(shù)及其標(biāo)準(zhǔn)誤差并以此為標(biāo)準(zhǔn)。發(fā)現(xiàn)多重填補(bǔ)法效果對于補(bǔ)充數(shù)據(jù)缺失值來說,效果最佳。Wang等[47]采用K-fold交叉驗(yàn)證方式輔助提高了神經(jīng)網(wǎng)絡(luò)的魯棒性,同時(shí)對神經(jīng)網(wǎng)絡(luò)中隱藏層數(shù)量,每一層神經(jīng)元個(gè)數(shù),激活函數(shù)等超參數(shù)進(jìn)行了優(yōu)化。研究結(jié)果表明在水力壓裂的每個(gè)階段,平均支撐劑的含量是影響產(chǎn)能的主要因素之一;而且在實(shí)際壓裂過程中,如將該神經(jīng)網(wǎng)絡(luò)模型集成到水力壓裂相關(guān)程序中,該數(shù)據(jù)驅(qū)動(dòng)模型可以實(shí)時(shí)進(jìn)行更新。

2.2 水力壓裂作業(yè)中產(chǎn)能預(yù)測與優(yōu)化

不論是對水力壓裂模擬還是對儲層模擬,由于壓裂過程中流體輸運(yùn)性質(zhì)具有極高的不確定度,同時(shí)考慮到儲層的復(fù)雜性、底層的裂縫性質(zhì)等因素,通過數(shù)值模擬方式對產(chǎn)能進(jìn)行預(yù)測,往往不準(zhǔn)確[48]。另外一些研究中提出利用冪律指數(shù)遞減法[49]、Arps下降曲線[50]等方法預(yù)測產(chǎn)量,但是由于流體在人工裂縫和天然裂縫之間有流動(dòng)差異,通過這些方法預(yù)測往往會(huì)低估油氣產(chǎn)量。相比之下,科研人員利用機(jī)器學(xué)習(xí)算法可以對裂縫進(jìn)行良好的預(yù)測。李菊花等[16]利用涪陵頁巖氣田一期數(shù)據(jù)集,結(jié)合隨機(jī)森林算法對氣井產(chǎn)量進(jìn)行預(yù)測。研究表明密度測井值、脆性指數(shù)等參數(shù)是影響多級壓裂井產(chǎn)量的主要因素。馬先林等[51]用蘇里格氣田東區(qū)712口壓裂直井?dāng)?shù)據(jù),對比隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、多元回歸等算法對產(chǎn)能進(jìn)行了預(yù)測,結(jié)果表明隨機(jī)森林算法預(yù)測性能最佳。Cao等[52]考慮非常規(guī)儲層的未知因素,采用人工神經(jīng)網(wǎng)絡(luò)算法針對實(shí)際油井產(chǎn)量進(jìn)行建模。該模型可以預(yù)測現(xiàn)有井的產(chǎn)量,同時(shí)也可以對未開采的油井進(jìn)行預(yù)測,表明利用神經(jīng)網(wǎng)絡(luò)建立的模型可以取代傳統(tǒng)經(jīng)驗(yàn)公式以及數(shù)值建模的產(chǎn)能預(yù)測。

相比較于隨機(jī)森林與神經(jīng)網(wǎng)絡(luò)算法,對于有時(shí)間序列的數(shù)據(jù)集,基于長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)的深層神經(jīng)網(wǎng)絡(luò)具有更高的準(zhǔn)確性,同樣也被應(yīng)用到水力壓裂產(chǎn)能預(yù)測過程中。Esmaili等[53]基于數(shù)據(jù)驅(qū)動(dòng)技術(shù)建立機(jī)器學(xué)習(xí)預(yù)測模型,對賓夕法尼亞州西南部Marcellus頁巖油氣生產(chǎn)過程進(jìn)行了建模,相比于傳統(tǒng)數(shù)值模擬方法,該模型精度更高,且識別周期更短,可以與完整的油井歷史數(shù)據(jù)相匹配,也可以獲取單個(gè)井的生產(chǎn)行為。Song等[54]將LSTM的超參數(shù)用粒子群算法進(jìn)行了優(yōu)化配置,該模型可以準(zhǔn)確捕捉在多種因素共同作用下,油氣產(chǎn)能的復(fù)雜變化規(guī)律;并與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)合遞減曲線分析方法的結(jié)果相比較,發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)針對時(shí)間序列的數(shù)據(jù)預(yù)測性能遠(yuǎn)高于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。Liu等[55]提出了一種基于LSTM結(jié)合集成經(jīng)驗(yàn)?zāi)J降膶W(xué)習(xí)模式,并采用遺傳算法確定LSTM的超參數(shù),結(jié)果表明該方法可以很好預(yù)測井的產(chǎn)量。

在對水力壓裂產(chǎn)能預(yù)測的同時(shí),許多學(xué)者考慮到經(jīng)濟(jì)效益,將壓裂過程與各致密油氣的價(jià)格相結(jié)合,估算致密油氣的凈現(xiàn)值。Morozov等[56]利用俄羅斯西伯利亞西部20口不同井,近5 000組相關(guān)典型數(shù)據(jù),選擇包含壓裂設(shè)計(jì)參數(shù)在內(nèi)的92個(gè)特征為輸入變量,生產(chǎn)數(shù)據(jù)包含產(chǎn)量在內(nèi)的16個(gè)特征為輸出;結(jié)合過濾手段消除數(shù)據(jù)庫中的噪點(diǎn)并補(bǔ)充缺失值,通過選擇最佳裂縫參數(shù)達(dá)到優(yōu)化設(shè)計(jì)提高油氣產(chǎn)能的目的。Nguyen-Le等[57]提出一種動(dòng)態(tài)經(jīng)濟(jì)指標(biāo)的框架,基于多元線性回歸算法將儲層參數(shù)與壓裂參數(shù)以及各種致密油氣價(jià)格相結(jié)合,考慮初始油氣飽和度和吸附天然氣含量,用于估算致密油氣的凈現(xiàn)值。

水力壓裂作業(yè)的成本很高,所以對壓裂參數(shù)進(jìn)行優(yōu)化是經(jīng)濟(jì)、高效、實(shí)用的方法[58]。在過去的一些研究中,大多數(shù)研究均是通過局部敏感性分析確定最佳參數(shù),然而這些方法不能篩出不重要參數(shù),因此機(jī)器學(xué)習(xí)算法的引入,可極大程度地幫助科研人員解決這一問題。Alwarda[59]利用水力壓裂水錘衰減數(shù)據(jù)結(jié)合主成分分析以及偏最小二乘回歸算法估計(jì)瞬時(shí)關(guān)閥壓力與摩擦損失,這個(gè)摩擦損失包含井筒與射孔之間、近井筒彎曲處等局部摩擦損失,該研究可以輔助射孔的優(yōu)化設(shè)計(jì)以及完井的設(shè)計(jì)決策,強(qiáng)調(diào)機(jī)器學(xué)習(xí)算法的實(shí)用價(jià)值。Yu等[60]結(jié)合機(jī)器學(xué)習(xí)算法提出一種高效的框架,考慮井底壓力、裂縫半長、儲層壓力、滲透率等8個(gè)參數(shù);同時(shí)考慮不同致密油氣價(jià)格,優(yōu)化非常規(guī)致密油氣水力壓裂作業(yè)的生產(chǎn)方案與工藝設(shè)計(jì),可以輔助工程師根據(jù)實(shí)際裂縫狀態(tài)重新對后續(xù)裂縫位置進(jìn)行設(shè)計(jì)。Han等[48]利用150口井的典型數(shù)據(jù)包含8 560個(gè)數(shù)據(jù)點(diǎn),選擇完井系數(shù)、水力壓裂系數(shù)、儲層性質(zhì)等參數(shù)作為特征輸入,結(jié)合神經(jīng)網(wǎng)絡(luò)模型并使用遞減曲線分析方法,對未來生產(chǎn)率進(jìn)行預(yù)測。同時(shí)為了保證神經(jīng)網(wǎng)絡(luò)算法具有高質(zhì)量的輸入輸出數(shù)據(jù),此研究中通過無監(jiān)督學(xué)習(xí)聚類算法識別數(shù)據(jù)之間的相關(guān)性。Surguchev等[61]利用人工神經(jīng)網(wǎng)絡(luò)方法進(jìn)行預(yù)模擬并通過篩選工具評估在不同油藏條件下的適用性,在儲藏?cái)?shù)據(jù)有限時(shí)可用該方法進(jìn)行協(xié)助決策。Jin等[62]基于低頻分布聲波傳感數(shù)據(jù)結(jié)合神經(jīng)網(wǎng)絡(luò)算法對裂縫進(jìn)行識別,突出裂縫特征,通過訓(xùn)練、驗(yàn)證、測試證明該方法與人工手動(dòng)識別效果吻合良好,結(jié)果表明更密集的裂縫網(wǎng)絡(luò)需要較小的簇間距設(shè)計(jì)。

對于優(yōu)化問題,除根據(jù)各種數(shù)據(jù)集規(guī)模與特征確定最優(yōu)算法外,同時(shí)可以結(jié)合群體優(yōu)化算法(如遺傳算法、粒子群算法等)對施工參數(shù)進(jìn)行優(yōu)化配置。陳新浩[63]利用某氣田近300口井施工數(shù)據(jù),結(jié)合神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機(jī)等機(jī)器學(xué)習(xí)算法對水力壓裂過程進(jìn)行優(yōu)化,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)結(jié)合優(yōu)化算法最適合優(yōu)化配置施工參數(shù)。Sabah等[64]利用馬倫油田2 820組數(shù)據(jù),開發(fā)了一種將遺傳算法、粒子群算法、布谷鳥算法與多層感知機(jī)相耦合的方法,采用Savitzky-Golay(SG)過濾器對數(shù)據(jù)集中不相關(guān)冗余數(shù)據(jù),對鉆井前的井漏進(jìn)行了預(yù)測,結(jié)果表明混合智能算法的預(yù)測性能相比于單一機(jī)器學(xué)習(xí)算法更加強(qiáng)大。

機(jī)器學(xué)習(xí)算法在水力壓裂產(chǎn)能預(yù)測與優(yōu)化過程中,需要通過交叉驗(yàn)證、網(wǎng)格搜索、隨機(jī)搜索等方式或者采用群體優(yōu)化算法對機(jī)器學(xué)習(xí)算法中的超參數(shù)進(jìn)行確定,以提高模型的魯棒性與適用性[65]。同時(shí)為保證數(shù)據(jù)質(zhì)量,可以考慮在機(jī)器學(xué)習(xí)模型訓(xùn)練前對數(shù)據(jù)進(jìn)行過濾,或采用無監(jiān)督學(xué)習(xí)算法對噪點(diǎn)過濾[66]。

3 結(jié)論與展望

簡要回顧了機(jī)器學(xué)習(xí)經(jīng)典預(yù)測算法,例如線性回歸、樹形算法、神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)以及各算法在水力壓裂作業(yè)中的應(yīng)用。機(jī)器學(xué)習(xí)已經(jīng)成為推測流體流動(dòng)特性、儲層特性、相關(guān)參數(shù)信息的有效工具。機(jī)器學(xué)習(xí)算法在水力壓裂作業(yè)中的應(yīng)用仍有不足:①在數(shù)據(jù)大量缺失或數(shù)值模擬建模未穩(wěn)定的情況下,應(yīng)用機(jī)器學(xué)習(xí)算法會(huì)引來很大偏差;②在數(shù)據(jù)特征不明確或有噪點(diǎn)時(shí)同樣會(huì)給機(jī)器學(xué)習(xí)帶來極高的不確定度;③對于大多數(shù)機(jī)器學(xué)習(xí)算法而言,輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的關(guān)聯(lián)是不透明的,導(dǎo)致從數(shù)據(jù)中獲取的關(guān)聯(lián)可能存在問題。針對機(jī)器學(xué)習(xí)在水力壓裂過程中的應(yīng)用提出如下展望:機(jī)器學(xué)習(xí)算法之間以及機(jī)器學(xué)習(xí)算法與優(yōu)化算法混合使用,以提高模型的預(yù)測能力;發(fā)展數(shù)據(jù)集的公共平臺,方便科研人員用于尋求數(shù)據(jù);將物理建模與機(jī)器學(xué)習(xí)算法混合使用,針對實(shí)際問題提供優(yōu)化方案。

猜你喜歡
水力決策樹機(jī)器
蒲石河抽水蓄能電站1號機(jī)轉(zhuǎn)輪改造水力穩(wěn)定性研究與實(shí)踐
機(jī)器狗
機(jī)器狗
供熱一級管網(wǎng)水力計(jì)算及分析
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
未來機(jī)器城
決策樹學(xué)習(xí)的剪枝方法
決策樹多元分類模型預(yù)測森林植被覆蓋
基于水力壓裂鉆孔的注水量及壓裂半徑的應(yīng)用研究
砂礦開采沖礦溝自流水力運(yùn)輸探析