国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工智能的鉆速預(yù)測模型數(shù)據(jù)有效性下限分析

2021-03-25 03:44:02曹彥偉朱海燕
鉆探工程 2021年3期
關(guān)鍵詞:鉆速建模神經(jīng)網(wǎng)絡(luò)

李 謙,曹彥偉,朱海燕

(1.成都理工大學(xué)環(huán)境與土木工程學(xué)院,四川 成都610059;2.成都理工大學(xué)能源學(xué)院,四川 成都610059)

0 引言

鉆探鉆井作業(yè)是固體礦產(chǎn)與油氣資源勘探過程中至關(guān)重要的環(huán)節(jié)。鉆速作為評(píng)估鉆探鉆井作業(yè)最有效的指標(biāo)之一,鉆速預(yù)測對(duì)于優(yōu)化鉆探工藝、降低作業(yè)成本、實(shí)現(xiàn)科學(xué)鉆探具有重要意義,它是鉆探鉆井作業(yè)的一項(xiàng)重要內(nèi)容。國內(nèi)外眾多學(xué)者對(duì)鉆速的評(píng)估與預(yù)測進(jìn)行了大量的研發(fā)。但由于地層與工藝的復(fù)雜性,影響鉆速的因素繁多,同時(shí)相關(guān)領(lǐng)域理論體系的不完備性,這些因素之間至今未建立較為令人信服的通用分析模型。各國學(xué)者基于不同的現(xiàn)場參數(shù)與鉆速的關(guān)系,先后建立了多種不同的鉆速預(yù)測模型。

截止目前,常規(guī)的鉆速預(yù)測方案有理論推導(dǎo)型與數(shù)據(jù)挖掘型兩種形式。理論推導(dǎo)型預(yù)測方程主要基于鉆頭結(jié)構(gòu)、受力平衡、機(jī)械比能等理論進(jìn)行推演,如孟英峰等[1]、Chen 等[2]均提出基于機(jī)械比能理論可實(shí)現(xiàn)鉆速的預(yù)測與優(yōu)化;鄒德永等[3]提出基于鉆頭力學(xué)平衡的迭代可實(shí)現(xiàn)定向鉆井中PDC 鉆頭的鉆速預(yù)測;劉軍波等[4]認(rèn)為將鉆頭轉(zhuǎn)速的影響帶入傳統(tǒng)的三維鉆速方程將提高鉆速預(yù)測的精度。?這類研究中也有結(jié)合數(shù)值仿真模擬進(jìn)行的分析,如Saksala 等[5]提出將基于粘塑性和損傷力學(xué)的本構(gòu)模型引入有限元模擬,結(jié)合接觸力學(xué)模型建立了較為準(zhǔn)確的鉆速-鉆頭-巖石相互作用預(yù)測模型。

理論推導(dǎo)型模型固然可以獲得顯著的解析解,但建模過程中為簡化邊界條件而引入的大量假設(shè)條件,無疑為模型的應(yīng)用帶來較大的限制。因此,利用現(xiàn)場監(jiān)測數(shù)據(jù),從中進(jìn)行挖掘和分析的鉆速預(yù)測技術(shù)近年來備受矚目。同時(shí)得益于近年來機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,越來越多的鉆速預(yù)測方式引入人工智能的相關(guān)概念(如表1 所示),均獲得了較高的預(yù)測精度。隨著人工智能技術(shù)的深度介入,鉆速預(yù)測的效率開始引起關(guān)注。Bataee 等[6]將神經(jīng)網(wǎng)絡(luò)的預(yù)測精度與常規(guī)模型的預(yù)測精度進(jìn)行了對(duì)比,發(fā)現(xiàn)同參數(shù)條件下神經(jīng)網(wǎng)絡(luò)的預(yù)測精度可達(dá)98.5%,均高于其余方案;Hegde 等[7-8]評(píng)估了試驗(yàn)驅(qū)動(dòng)型模型與使用人工智能的數(shù)據(jù)驅(qū)動(dòng)型模型的建模精度,發(fā)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的模型相較于其他模型可降低預(yù)測誤差達(dá)12%。

表1 近年基于數(shù)據(jù)挖掘與人工智能的鉆速預(yù)測方案匯總(部分)Table 1 ROP prediction algorithm based on data mining and artificial intelligence in recent years (partial)

在人工智能與大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展的當(dāng)前,對(duì)數(shù)據(jù)的渴望前所未有。而在鉆探鉆井行業(yè)中,現(xiàn)場作業(yè)的多影響因素及條件復(fù)雜性無疑對(duì)精確模型的需求更高,同時(shí)帶來對(duì)更多數(shù)據(jù)的采集與分析需求。但值得注意的是,隨著對(duì)數(shù)據(jù)采集類型與數(shù)據(jù)量的激增,對(duì)施工作業(yè)中的數(shù)據(jù)采集作業(yè)會(huì)引起施工成本與難度的增加,過多的數(shù)據(jù)采集操作也會(huì)潛在影響常規(guī)鉆探鉆井施工。當(dāng)數(shù)據(jù)采集量超過實(shí)際需求量時(shí),原本用以降低成本提高效率的數(shù)據(jù)采集分析反而將拖累鉆探鉆井施工,達(dá)到事倍功半的效果。因此,鉆探鉆井?dāng)?shù)據(jù)建模中的數(shù)據(jù)采集規(guī)模與精度的下限判定是避免這種情況產(chǎn)生的必要條件。故本文基于中國南海某片區(qū)10 口井的相關(guān)數(shù)據(jù),對(duì)通過使用神經(jīng)網(wǎng)絡(luò)建立鉆速預(yù)測方程需求的數(shù)據(jù)規(guī)模下限問題進(jìn)行了分析與探討。

1 數(shù)據(jù)來源與相關(guān)性分析

1.1 數(shù)據(jù)來源與規(guī)模

本文使用的數(shù)據(jù)源于中國南海某片區(qū),經(jīng)過數(shù)據(jù)采集、整合、清洗、缺失值補(bǔ)充與錯(cuò)誤值刪除后,獲得源自10 口井,涵蓋包括井眼位置、施工工藝、鉆井液性能、地質(zhì)條件、鉆頭鉆具共5 大類44 種不同類型的21917 條數(shù)據(jù)生成初始數(shù)據(jù)集。如表2 所示為初始數(shù)據(jù)集所包含的所有數(shù)據(jù)類型。

表2 初始數(shù)據(jù)集包含的數(shù)據(jù)變量及縮寫Table 2 Data variables and abbreviations in the initial data set

續(xù)表

1.2 基本數(shù)據(jù)集的相關(guān)性分析

在數(shù)據(jù)建模分析前,對(duì)輸入輸出數(shù)據(jù)進(jìn)行相關(guān)性分析是判定建模數(shù)據(jù)是否有用的必備步驟。本次研究使用Person 相關(guān)系數(shù)計(jì)算法,令ρa(bǔ)b為變量a,b的Person 相關(guān)系數(shù),主要計(jì)算方法如式(1)所示,其計(jì)算結(jié)果區(qū)間為[-1,1],主要的判定標(biāo)準(zhǔn)如所表3所示。

式 中:cov(a,b)——變 量a,b的 協(xié) 方 差 矩 陣;σa,σb——變量a,b各自的標(biāo)準(zhǔn)差;ai,bi——變量a,b數(shù)據(jù)集中第i個(gè)變量值——變量a,b平均值;n——變量a,b的數(shù)據(jù)集大小。

分別計(jì)算如表2 所示前43 個(gè)輸入?yún)?shù)與輸出參數(shù)鉆速之間的相關(guān)性統(tǒng)計(jì)如圖1 中柱狀圖所示,可知在當(dāng)前初始數(shù)據(jù)集中,低相關(guān)參數(shù)包含16 種,其中8 種相關(guān)性系數(shù)<0.1;中相關(guān)系數(shù)包含15 種,其中9 種相關(guān)性系數(shù)位于[0.5,0.6]區(qū)間;高相關(guān)系數(shù)包含12 種,相關(guān)性系數(shù)全部位于[0.6,0.7]區(qū)間。對(duì)3 種相關(guān)性級(jí)別的參數(shù)進(jìn)行類別統(tǒng)計(jì)如圖1 中餅圖所示,可見高相關(guān)性參數(shù)中施工工藝與鉆井液性能占據(jù)75%的比例,中相關(guān)性參數(shù)中鉆井液性能占據(jù)67%的比例。參考圖1 柱狀圖的高相關(guān)區(qū)參數(shù)詳細(xì)清單,可發(fā)現(xiàn)高相關(guān)性參數(shù)中的施工工藝類參數(shù)具體包括扭矩(T)、泵量(Q)、出入口鉆井液密度(MI、MO)、大鉤載荷(WOH)和井徑(d)。嚴(yán)格來說,其中泵量、出入口鉆井液密度也可視為鉆井液性能參數(shù)。綜上所述,該初始數(shù)據(jù)集中鉆井液性能是影響鉆速的主要參數(shù)類型。

表3 相關(guān)性判定標(biāo)準(zhǔn)Table 3 Correlation criteria

圖1 初始數(shù)據(jù)集相關(guān)性計(jì)算結(jié)果Fig.1 Correlation calculation results of the initial data set

2 數(shù)據(jù)有效性下限分析

2.1 數(shù)據(jù)分組、訓(xùn)練與精度評(píng)價(jià)

本文擬采用BP 神經(jīng)網(wǎng)絡(luò)結(jié)合10 折交叉驗(yàn)證的數(shù)據(jù)分組方式完成不同維度與取樣精度的模擬分析。因本次研究數(shù)據(jù)總量較大(21917 條),綜合考慮建模精度,選用10 折交叉驗(yàn)證法進(jìn)行數(shù)據(jù)分組。將該初始數(shù)據(jù)集劃分為相斥的10 個(gè)互斥子集如式(2)所示。為避免數(shù)據(jù)劃分過程中引入額外的偏差而對(duì)最終結(jié)果產(chǎn)生影響,數(shù)據(jù)分組以“分層采樣”的形式進(jìn)行劃分,保證分組完成后訓(xùn)練集與測試集的數(shù)據(jù)分布與原數(shù)據(jù)集相同。故每個(gè)子集Di均需要從初始數(shù)據(jù)集(令其為ini_data_all)中分層采樣得到。在本次訓(xùn)練建模中,將以井號(hào)和地層深度2 個(gè)參數(shù)為主(2 個(gè)參數(shù)的結(jié)合可視為整個(gè)區(qū)塊的地層分布與位置)進(jìn)行分層采樣。完成分層采樣后,如圖2 所示,每次用其中的9 個(gè)子集的并集作為訓(xùn)練集,余下的作為測試集。最終形成10 組訓(xùn)練/測試集,從而可進(jìn)行10 次訓(xùn)練和測試,最終返回10 個(gè)測試結(jié)果均值作為建模精度的評(píng)估。

圖2 10 折交叉驗(yàn)證基本原理Fig.2 Basic principle of 10-fold cross-validation

鉆速預(yù)測屬于典型的多輸入單輸出的非線性擬合,因此建模方式選用為在該方面擬合精度非常高的BP 神經(jīng)網(wǎng)絡(luò),建立網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。該網(wǎng)絡(luò)包含3 層結(jié)構(gòu),輸入層、隱藏層和輸出層。每層均包含若干神經(jīng)元,其中只有相鄰層的所有神經(jīng)元兩兩連接,同層與不相鄰層的神經(jīng)元均完全不相連。輸入與輸出層的神經(jīng)元數(shù)量分別與輸入、輸出變量相同,分別負(fù)責(zé)網(wǎng)絡(luò)的數(shù)據(jù)輸入與計(jì)算結(jié)果的輸出。隱藏層的神經(jīng)元數(shù)量則會(huì)影響分析速率與精度,如果隱藏層結(jié)點(diǎn)數(shù)過少,網(wǎng)絡(luò)不能具有必要的學(xué)習(xí)能力和信息處理能力。反之,若過多,會(huì)大大增加網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性。參考相關(guān)研究基礎(chǔ),本次研究中選用隱藏層神經(jīng)元數(shù)量p=10。

圖3 本次研究使用的BP 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.3 Basic structure of the BP neural network used in this study

本次研究中BP 神經(jīng)網(wǎng)絡(luò)建模精度選擇以預(yù)測輸出yi-output與真實(shí)值yi-true之間的絕對(duì)誤差RMSE與擬合精度R2為精度度量,其各自計(jì)算方法如式(3)所示,當(dāng)計(jì)算結(jié)果|RMSE|=0,R2=1 時(shí),BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出與真實(shí)值完全匹配,達(dá)到最高精度。

式中:yi-output——第i個(gè)元素BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出;yi-true——第i個(gè)元素真實(shí)值;m——元素?cái)?shù)量。

2.2 建模數(shù)據(jù)維度下限分析

建模數(shù)據(jù)維度是指建立鉆速預(yù)測模型的參數(shù)類型數(shù)量,而建模數(shù)據(jù)維度的下限則可被定義為達(dá)到足夠建模預(yù)測精度需求的最少參數(shù)數(shù)量。對(duì)滿足精度的建模參數(shù)數(shù)量下限的研究,可最大程度地降低現(xiàn)場對(duì)參數(shù)檢測需求或后期分析數(shù)據(jù)需求,避免由于對(duì)建模數(shù)據(jù)量的盲目增長需求而帶來的生產(chǎn)與分析成本的急劇上升。結(jié)合圖1 所示的相關(guān)性分析結(jié)果,本次研究分別針對(duì)高、中、低相關(guān)區(qū)的建模參數(shù)組合進(jìn)行。具體分析方案設(shè)計(jì)為依次從高、中、低相關(guān)性參數(shù)組中相關(guān)性最低的參數(shù)開始,逐漸增加引入BP 神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù)的數(shù)量,分別計(jì)算并統(tǒng)計(jì)引入不同輸入?yún)?shù)數(shù)量后的網(wǎng)絡(luò)建模預(yù)測精度,從而獲取鉆速預(yù)測精度隨引入?yún)?shù)數(shù)量不同的改變趨勢(shì)。

基于高、中、低3 種不同相關(guān)性的參數(shù)進(jìn)行建模數(shù)據(jù)維度變化的鉆速預(yù)測建模精度分析,分析結(jié)果如圖4 所示,其變化趨勢(shì)完全類似。隨著引入?yún)?shù)數(shù)量的提升,BP 神經(jīng)網(wǎng)絡(luò)預(yù)測鉆速與真實(shí)鉆速的絕對(duì)誤差RMSE值逐漸下降,同時(shí)預(yù)測精度R2也逐漸上升??捎^察到的是高、中、低3 種相關(guān)性參數(shù)在引入3 個(gè)及以上的參數(shù)數(shù)量后,無論其預(yù)測誤差還是預(yù)測精度均得到躍升,當(dāng)相關(guān)性越低時(shí),其躍升的幅度越高。引入?yún)?shù)數(shù)量3 可視為預(yù)測建模精度的躍升閾值。

除躍升閾值以外,還可觀察到不同相關(guān)性的參數(shù)的建模精度隨引入數(shù)量的提升范圍存在上限,低相關(guān)性參數(shù)在引入15 個(gè)參數(shù)后建模精度達(dá)到上限約為92%,中相關(guān)性參數(shù)在引入13 個(gè)參數(shù)后建模精度達(dá)到上限約92 %,高相關(guān)性參數(shù)在引入11 個(gè)參數(shù)后達(dá)到上限約94%。精度上限的存在說明初始數(shù)據(jù)集中參數(shù)包含的信息量存在上限,這也與相關(guān)性計(jì)算結(jié)果中最高相關(guān)性未超過0.7 相符。

圖4 鉆速預(yù)測模型建模數(shù)據(jù)維度下限試驗(yàn)結(jié)果Fig.4 Test results of the lower limit of the data dimension for the ROP prediction model

橫向?qū)Ρ? 種相關(guān)性參數(shù)組(如圖4 所示),在引入相同數(shù)量的參數(shù)時(shí),參數(shù)的相關(guān)性越高,最終鉆速預(yù)測的誤差越低,預(yù)測精度也越高。但值得注意的是,這種區(qū)別并不如相關(guān)性指數(shù)的區(qū)分度那么明顯。在僅引入單參數(shù)時(shí),低相關(guān)性參數(shù)鉆速預(yù)測最大誤差達(dá)到13.31 m/h,同時(shí)其精度僅有19.28%。對(duì)比之下,單參數(shù)引入時(shí)中相關(guān)性參數(shù)預(yù)測的最大誤差為11.78 m/h,預(yù)測精度49.92%,高相關(guān)性參數(shù)預(yù)測的最大誤差為10 m/h,預(yù)測精度為67.58%??梢娫谝胼^少參數(shù)時(shí),即使相關(guān)性很高的參數(shù)預(yù)測誤差也很大,預(yù)測精度也較低。同理,將同相關(guān)性所有參數(shù)引入后,低相關(guān)性參數(shù)能夠取得的最低預(yù)測誤差為5.42 m/h,預(yù)測精度為91.70%;中相關(guān)性參數(shù)能夠取得的最低預(yù)測誤差為5.41 m/h,預(yù)測精度為91.72%;高相關(guān)性參數(shù)能夠取得的最低誤差為4.59 m/h,預(yù)測精度為94.12%。三者之間差距并不大,這說明當(dāng)引入?yún)?shù)數(shù)量達(dá)到一定程度后,即使是相關(guān)性較低的參數(shù),通過增加引入?yún)?shù)的數(shù)量,BP 神經(jīng)網(wǎng)絡(luò)也能取得較高的預(yù)測精度與較低的預(yù)測誤差。

參數(shù)間相關(guān)性的不同對(duì)鉆速預(yù)測精度的影響則表現(xiàn)為到達(dá)指定精度需要的參數(shù)數(shù)量下限不同。如圖5 所示,以工業(yè)常用的最低精度標(biāo)準(zhǔn)85%為限,基于本數(shù)據(jù)集,低相關(guān)性參數(shù)需要引入9 個(gè),中相關(guān)性參數(shù)需要引入6 個(gè),而高相關(guān)性參數(shù)僅需要引入4 個(gè)。若將精度指標(biāo)下限提升至90%,則低相關(guān)性、中相關(guān)性與高相關(guān)性參數(shù)則需分別引入12個(gè)、10 個(gè)與9 個(gè)。由此可見,隨精度指標(biāo)下限的提高,不同相關(guān)性參數(shù)的引入數(shù)量(維度下限)也在上升,且不同相關(guān)性參數(shù)引入數(shù)量差距在逐漸減少。這是由于原始數(shù)據(jù)建模精度存在上限所致,這表征原始數(shù)據(jù)集中包含的真正影響鉆速的信息存在上限。該觀點(diǎn)在如圖4 所示的建模數(shù)據(jù)維度下限試驗(yàn)中也得到驗(yàn)證,當(dāng)引入?yún)?shù)數(shù)量超過10 以后,高、中、低3 種相關(guān)性參數(shù)的預(yù)測精度均達(dá)到上限,不再隨數(shù)據(jù)維度的上升而改變。

圖5 不同相關(guān)性參數(shù)達(dá)到需求預(yù)測精度的維度下限Fig.5 Lower limit of the dimension of different correlation parameters for the required accuracy

2.3 建模數(shù)據(jù)精度下限分析

由維度下限分析可知,當(dāng)引入數(shù)據(jù)維度足夠多時(shí),即使是低相關(guān)參數(shù)也可取得較高的預(yù)測精度。在此基礎(chǔ)上,本研究進(jìn)一步分析在數(shù)據(jù)維度保持不變時(shí),維持建模精度所需的數(shù)據(jù)取樣間隔精度下限。對(duì)取樣精度下限的研究,可減少數(shù)據(jù)分析時(shí)對(duì)數(shù)據(jù)量的需求,提高分析效率,避免對(duì)分析數(shù)據(jù)量的疑惑而引起對(duì)分析結(jié)論的懷疑。同時(shí),也可降低實(shí)際鉆探鉆井采樣時(shí)對(duì)錄井、監(jiān)測數(shù)據(jù)的要求。尤其是使用成本較高的隨鉆測量/測井(MWD/LWD)技術(shù)時(shí),對(duì)采樣精度的降低可提高設(shè)備的使用壽命,進(jìn)一步降低使用成本。本次分析以圖5 所示85%和90%兩組精度下的參數(shù)組合為藍(lán)本,逐漸增加取樣間隔,從基本數(shù)據(jù)集默認(rèn)的1 m 一個(gè)樣本開始,逐步擴(kuò)大到100 m 一個(gè)樣本。通過對(duì)不同精度樣本進(jìn)行建模誤差和精度分析,觀察是否能夠找到建模精度下限。

高、中、低3 種相關(guān)性精度下限分析結(jié)果如圖6所示。整體來看,無論是相關(guān)性的區(qū)別(高、中、低)還是初始精度的區(qū)別(85%、90%),在取樣間隔逐漸增大時(shí)呈現(xiàn)相同的變化趨勢(shì),即隨著取樣間隔的增大,鉆速預(yù)測模型的誤差同步增大,建模精度也逐漸下降。同時(shí)值得注意的是,如表4 所示,在不同相關(guān)性與初始精度的數(shù)據(jù)結(jié)果統(tǒng)計(jì)中發(fā)現(xiàn),當(dāng)取樣精度超過10 m 時(shí),所有不同相關(guān)性和初始精度條件下的建模預(yù)測誤差增長幅度與建模下降率明顯上升。說明取樣精度10 m 左右可視為建模取樣精度的下限值。當(dāng)取樣精度超過10 m 時(shí),會(huì)引起精度的急劇下降,對(duì)建模及后續(xù)使用帶來極大的分析誤差。

結(jié)合表4 與圖6 相關(guān)數(shù)據(jù),可發(fā)現(xiàn)在改變?nèi)娱g隔時(shí),建模參數(shù)的相關(guān)性相較初始精度更加敏感。低相關(guān)參數(shù)在取樣精度間隔逐漸增大時(shí)會(huì)更明顯的反映出建模誤差增大與建模精度減小的情況,其變化幅度明顯大于中相關(guān)與高相關(guān)參數(shù)。當(dāng)數(shù)據(jù)取樣間隔由1 m 增長到100 m 時(shí),85%初始精度的低相關(guān)性參數(shù)建模誤差由6.94 m/h 增長到15.83 m/h,增長率為128%,同時(shí)建模精度由85.9%下降到52.2%,下降幅度33.7%;而90%初始精度的低相關(guān)性參數(shù)建模誤差由5.80 m/h 增長到12.47m/h,增長率為115 %,同時(shí)建模精度由90.4%下降至58.7%,下降幅度31.5%。相對(duì)而言,中相關(guān)性與高相關(guān)性參數(shù)的變化幅度稍小。85%初始精度的中相關(guān)性參數(shù)建模誤差增長率為88%,精度下降22.2%;90%初始精度的中相關(guān)性參數(shù)建模誤差增長率95%,精度下降29.9%。85%初始精度的高相關(guān)性參數(shù)建模誤差增長率為52.8%,精度下降14.1%;90%初始精度的高相關(guān)性參數(shù)建模誤差增長率86.8%,精度下降19.9%。由此說明,當(dāng)建模數(shù)據(jù)相關(guān)性增大時(shí),相應(yīng)的由于建模取樣數(shù)據(jù)間隔增大而導(dǎo)致的建模誤差會(huì)減小,這說明基于高相關(guān)性參數(shù)建立的模型更加穩(wěn)定與健壯,受數(shù)據(jù)取樣精度的影響更小。

2.4 效果驗(yàn)證

結(jié)合數(shù)據(jù)建模維度與精度下限分析結(jié)果,分別以10 m 的取樣精度,以85%的初始精度建立基于低相關(guān)性參數(shù)(引入9 參數(shù))、中相關(guān)性參數(shù)(引入6參數(shù))、高相關(guān)性參數(shù)(引入4 參數(shù))BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,將預(yù)測鉆速與實(shí)測鉆速對(duì)比如圖7 所示。由圖7 可知,無論初始數(shù)據(jù)的相關(guān)性如何,在數(shù)據(jù)維度與精度均達(dá)到下限值時(shí),BP 神經(jīng)網(wǎng)絡(luò)都能取得較高的預(yù)測精度。其中各模型主要的缺陷與隱患在于數(shù)據(jù)模型的穩(wěn)定性,低相關(guān)性模型的穩(wěn)定性將低于中、高相關(guān)性預(yù)測模型,建模參數(shù)發(fā)生變化時(shí)可能會(huì)引起較大的預(yù)測誤差波動(dòng)。

3 結(jié)論

基于中國南海某片區(qū)10 口井相關(guān)參數(shù)的初始數(shù)據(jù)集(包含井眼位置、施工工藝、鉆井液性能、地質(zhì)條件、鉆頭鉆具5 大類44 種不同參數(shù)共21917 條數(shù)據(jù)),本文根據(jù)Person 相關(guān)系數(shù)的定義,計(jì)算了43種不同輸入?yún)?shù)與實(shí)際鉆速之間的相關(guān)性,并將所有輸入?yún)?shù)劃分為低相關(guān)性參數(shù)(含16 種參數(shù))、中相關(guān)性參數(shù)(含15 種參數(shù))和高相關(guān)性參數(shù)(含12種參數(shù))。通過使用BP 神經(jīng)網(wǎng)絡(luò),結(jié)合10 折交叉驗(yàn)證法,分別就低、中、高相關(guān)性參數(shù)建立了不同的鉆速預(yù)測方程,并計(jì)算了各自的預(yù)測誤差與預(yù)測精度,獲得如下結(jié)論:

圖6 鉆速預(yù)測取樣精度下限分析結(jié)果Fig.6 Analysis results of the lower limit of sampling accuracy for ROP prediction

表4 精度下限建模試驗(yàn)分析結(jié)果Table 4 Analysis results of modeling test for the lower accuracy limit

圖7 基于最低維度與取樣精度下限的建模預(yù)測效果Fig.7 Prediction results of the model based on the lowest data dimension and sampling accuracy

(1)就建模數(shù)據(jù)維度上看,BP 神經(jīng)網(wǎng)絡(luò)建模預(yù)測的精確度將隨引入?yún)?shù)數(shù)量的上升而上升。參數(shù)的相關(guān)性決定了引入?yún)?shù)數(shù)量的下限。以工業(yè)常用的85%精度為下限,低相關(guān)性參數(shù)需要引入9個(gè),中、高相關(guān)性參數(shù)則分別需要引入6 個(gè)與4 個(gè),當(dāng)精度下限提升到90%,相應(yīng)的需要引入的低、中、高相關(guān)性參數(shù)分別提升為12 個(gè)、10 個(gè)與9 個(gè)。

(2)在引入足夠的參數(shù)后,無論引入?yún)?shù)的相關(guān)性高低,都可取得大于90 %的預(yù)測精度。但不同參數(shù)能夠達(dá)到的預(yù)測精度存在上限,本數(shù)據(jù)集中低、中、高相關(guān)性參數(shù)建模精度的上限分別為92%、92%與94%左右。該上限值與引入?yún)?shù)包含的有效信息相關(guān),預(yù)測精度達(dá)到上限后繼續(xù)引入?yún)?shù)并不會(huì)提高預(yù)測精度。

(3)在確定初始預(yù)測精度較高(≥85%)的前提下,建模參數(shù)取樣的精度間隔增大,會(huì)引起建模參數(shù)數(shù)量的降低和其中包含信息的丟失,從而會(huì)引起預(yù)測精度的下降。通過分別對(duì)高、中、低相關(guān)性參數(shù)組進(jìn)行建模驗(yàn)證可知,當(dāng)數(shù)據(jù)取樣間隔超過10 m后會(huì)引起建模精度的急劇下降,故本文數(shù)據(jù)集的鉆速預(yù)測模型的建模取樣精度下限為10 m。

(4)針對(duì)不同相關(guān)性與初始精度的預(yù)測建模對(duì)比后發(fā)現(xiàn),參數(shù)相關(guān)性的降低會(huì)增大由于取樣間隔增大而導(dǎo)致的建模誤差,即使用低相關(guān)性參數(shù)建立模型需要的取樣精度下限應(yīng)略高于高相關(guān)性參數(shù)建立模型時(shí)的取樣要求,以防建模過程中產(chǎn)生的波動(dòng)。

(5)驗(yàn)證結(jié)果表明,在引入足夠的參數(shù)數(shù)量與取樣間隔精度后,低相關(guān)性、中相關(guān)性、高相關(guān)性參數(shù)均可建立足夠準(zhǔn)確的BP 神經(jīng)網(wǎng)絡(luò)鉆速預(yù)測方程。

猜你喜歡
鉆速建模神經(jīng)網(wǎng)絡(luò)
聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運(yùn)動(dòng)”為例
螺桿鉆具提速技術(shù)研究
石油研究(2020年1期)2020-05-22 12:51:40
AWOBA-NW井施工分析
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
基于PSS/E的風(fēng)電場建模與動(dòng)態(tài)分析
電子制作(2018年17期)2018-09-28 01:56:44
不對(duì)稱半橋變換器的建模與仿真
淺析提高中深井鉆速的方法
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
保靖县| 都江堰市| 濉溪县| 石狮市| 喀什市| 濮阳市| 镇坪县| 承德市| 金湖县| 伊川县| 广汉市| 石阡县| 海丰县| 蒙山县| 阳江市| 上犹县| 淮南市| 保德县| 邢台县| 喀喇| 黎平县| 剑阁县| 松溪县| 阿城市| 石城县| 商南县| 辽阳市| 天峨县| 嘉荫县| 连州市| 乌鲁木齐市| 景东| 崇义县| 荆门市| 勃利县| 建阳市| 乳山市| 项城市| 遂川县| 义乌市| 科技|