国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹(shù)的鉆井工況智能識(shí)別方法

2022-03-26 06:29劉勝娃曹湘華
新型工業(yè)化 2022年1期
關(guān)鍵詞:貝葉斯決策樹(shù)鉆井

劉勝娃,曹湘華

(中國(guó)石油川慶鉆探工程有限公司長(zhǎng)慶鉆井總公司,陜西 西安 710021)

0 引言

鉆井工程是一項(xiàng)大型復(fù)雜的系統(tǒng)工程,對(duì)于鉆井過(guò)程中各種工況的自動(dòng)識(shí)別能夠有效地提升鉆井工作效率并降低成本投入。隨著油田數(shù)字化建設(shè)與智能化的發(fā)展,國(guó)內(nèi)外學(xué)者采用各種機(jī)器學(xué)習(xí)算法對(duì)鉆井?dāng)?shù)據(jù)開(kāi)展研究。Susana Ferreiro等人[1]提出了一種基于貝葉斯算法的鉆孔過(guò)程毛刺檢測(cè)方法,用來(lái)減少鉆孔工作中毛刺對(duì)于工作效率的影響;Alla Andrianova等人[2]使用機(jī)器學(xué)習(xí)方法來(lái)處理油田大量現(xiàn)場(chǎng)數(shù)據(jù),以恢復(fù)油田測(cè)量質(zhì)量;Cesar Soares等人[3]建立了基于機(jī)器學(xué)習(xí)的鉆孔滲透率(ROP)的實(shí)時(shí)預(yù)測(cè)模型;M.Golitsyna等人[4]提出了一種基于機(jī)器學(xué)習(xí)的鉆井時(shí)異常自動(dòng)檢測(cè)方法,利用鉆探參數(shù)提高了對(duì)鉆井中異常工況的智能檢測(cè)效果;Mohammad Sabah等人[5]通過(guò)MLP-PSO算法和機(jī)器學(xué)習(xí)算法識(shí)別和排名預(yù)測(cè)了鉆孔滲透率上最具影響力的變量;郭長(zhǎng)杰等人[6]深入分析了國(guó)內(nèi)油氣行業(yè)機(jī)器學(xué)習(xí)應(yīng)用場(chǎng)景,并從大數(shù)據(jù)分析、建模推廣等角度提出了油氣公司應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的相關(guān)建議。

綜上所述,當(dāng)前對(duì)于工況智能識(shí)別方面的研究相對(duì)較少。王江萍等人[7]構(gòu)建神經(jīng)網(wǎng)絡(luò)模型和基于數(shù)值計(jì)算的知識(shí)處理系統(tǒng)對(duì)鉆井事故進(jìn)行了預(yù)測(cè)診斷,但在工況識(shí)別方面劃分不夠詳細(xì);孟昭等人[8]設(shè)計(jì)了一種PDC鉆頭井下工況評(píng)價(jià)方法,該發(fā)明能夠通過(guò)讀取鉆進(jìn)過(guò)程中的鉆壓、轉(zhuǎn)速以及機(jī)械鉆速等參數(shù)來(lái)判讀PDC鉆頭在井下的工況,但該發(fā)明存在一定的局限性;周向軍[9]等人提出了三牙輪鉆頭井下工況的判斷與識(shí)別方法,但該方法只針對(duì)三牙輪鉆頭;孫挺等人[10]提出了基于支持向量機(jī)的鉆井工況實(shí)時(shí)智能識(shí)別方法,解決了人工進(jìn)行鉆井分析不能及時(shí)準(zhǔn)確反映真實(shí)現(xiàn)場(chǎng)情況的問(wèn)題,但是該方法存在尋找最優(yōu)參數(shù)問(wèn)題。因此,本文提出了一種基于決策樹(shù)的鉆井工況智能識(shí)別方法,通過(guò)鉆井過(guò)程中大量多項(xiàng)參數(shù)監(jiān)測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練與測(cè)試,并采用貝葉斯算法與支持向量機(jī)進(jìn)行結(jié)果對(duì)比。該方法不僅解決了傳統(tǒng)閾值法識(shí)別工況的絕對(duì)性弊端和一些現(xiàn)有的工況識(shí)別方法的局限性,同時(shí)更進(jìn)一步提高了工況識(shí)別的準(zhǔn)確性與鉆井工作的效率。

1 決策樹(shù)算法

決策樹(shù)[11]是一種經(jīng)典的分類算法,其模型是根據(jù)數(shù)據(jù)的屬性以樹(shù)狀的結(jié)構(gòu)來(lái)建立的。其決策過(guò)程如下:首先,樣本數(shù)據(jù)中的每一個(gè)特征屬性都可以作為決策樹(shù)潛在的分裂節(jié)點(diǎn),遍歷所有特征屬性,計(jì)算每個(gè)特征的增益(作為決策樹(shù)繼續(xù)分裂的依據(jù))。其次,將增益最大的特征作屬性為葉子結(jié)點(diǎn)繼續(xù)劃分,不斷循環(huán)以上過(guò)程,直到所有節(jié)點(diǎn)完成劃分,最終獲得完整的決策樹(shù)。

假設(shè)樣本集合為U,U中第i類樣本的所占比例為Ui(i=1,2,…,n),則U的信息熵定義為式(1)。

其中若Ent(U)的值越小,則表示U的純度越高。

由于鉆井過(guò)程中各項(xiàng)屬性都屬于連續(xù)屬性,不能夠直接通過(guò)其屬性的可取值來(lái)進(jìn)行對(duì)樹(shù)結(jié)點(diǎn)的劃分,所以需要對(duì)各項(xiàng)屬性進(jìn)行離散化處理[12-14]。

樣本集合U中,假定其中連續(xù)屬性a,a在D上出現(xiàn)了n個(gè)不同的取值,依次從小到大進(jìn)行排序后,假定一個(gè)劃分點(diǎn)p,能夠?qū)劃分為U+p和Up。此時(shí),兩個(gè)相鄰的屬性取值an和an+1后,點(diǎn)p在區(qū)間[an,an+1]中取任意值所產(chǎn)生的劃分結(jié)果都相同。所以對(duì)于連續(xù)屬性a可考察包含x-1個(gè)元素的候選劃分點(diǎn)集合,如式(2):

繼而就可以對(duì)這些連續(xù)屬性選取最優(yōu)的劃分點(diǎn)來(lái)進(jìn)行樣本集合劃分,如式(3):

Gain(U,a,p)表示信息增益,Gain值越大,則表示使用屬性a對(duì)決策樹(shù)劃分后得到的結(jié)果越好,即可選擇Gain(U,a,p)為劃分點(diǎn)。

2 工況識(shí)別實(shí)驗(yàn)

2.1 數(shù)據(jù)采集與預(yù)處理

在工況識(shí)別的建模中,數(shù)據(jù)來(lái)源十分關(guān)鍵,數(shù)據(jù)質(zhì)量對(duì)于工況識(shí)別效果具有重要影響。本文中使用的數(shù)據(jù)集是采集自某油田連續(xù)15天鉆井現(xiàn)場(chǎng)的175436條真實(shí)數(shù)據(jù)。

數(shù)據(jù)集中包含有機(jī)械鉆速、吊鉗扭矩、轉(zhuǎn)盤(pán)轉(zhuǎn)速以及離開(kāi)井底時(shí)間等近百余種參數(shù)數(shù)據(jù),其中有部分參數(shù)數(shù)值在鉆井過(guò)程中采集結(jié)果始終為0,即該種類的數(shù)據(jù)對(duì)于模型構(gòu)建并無(wú)影響。所以通過(guò)對(duì)每個(gè)種類數(shù)據(jù)分別求和來(lái)進(jìn)行對(duì)無(wú)用數(shù)據(jù)的初步消除,篩選出求和結(jié)果不為0的參數(shù)數(shù)據(jù)進(jìn)行建模。

鉆井工作中將工況分為劃眼、起鉆、下鉆、鉆進(jìn)、接單根、坐卡、解卡、循環(huán)和離開(kāi)井底,為方便研究,實(shí)驗(yàn)中使用相應(yīng)的數(shù)字來(lái)對(duì)工況進(jìn)行代替,如表1所示。

表1 現(xiàn)場(chǎng)鉆井工況分類

2.2 決策樹(shù)工況識(shí)別模型

研究過(guò)程中將175436條數(shù)據(jù)集重新隨機(jī)順序排列,按照比例8:2進(jìn)行拆分,即其中140349條數(shù)據(jù)用于參與訓(xùn)練以找到最優(yōu)參數(shù),剩余35087條數(shù)據(jù)進(jìn)行模型測(cè)試。

通過(guò)對(duì)數(shù)據(jù)中每個(gè)屬性計(jì)算信息增益,保留最高信息增益的屬性并將其設(shè)置為根節(jié)點(diǎn),對(duì)每個(gè)節(jié)點(diǎn)設(shè)置新的葉子節(jié)點(diǎn),最后進(jìn)行剪枝處理。最終模型中選取大鉤負(fù)荷、立管壓力、轉(zhuǎn)盤(pán)扭矩、轉(zhuǎn)盤(pán)轉(zhuǎn)速、大鉤高度、鉆壓、大繩做功、大鉤速度8種參數(shù)作為輸入?yún)?shù)。模型輸出參數(shù)為鉆進(jìn)工況,及劃眼、起鉆、下鉆等9種工況;工況識(shí)別流程如圖1所示。

2.3 結(jié)果與分析

建立樸素貝葉斯算法與支持向量機(jī)工況識(shí)別模型。樸素貝葉斯算法基于貝葉斯定理和特征之間條件獨(dú)立假設(shè)的分類方法。對(duì)于給定的訓(xùn)練數(shù)據(jù)集,首先基于特征條件獨(dú)立假設(shè)學(xué)習(xí)輸入/輸出的聯(lián)合概率分布;然后基于此模型,對(duì)給定的輸入,利用貝葉斯定理求出后驗(yàn)概率最大的輸出。支持向量機(jī)是一種監(jiān)督式學(xué)習(xí)算法,基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則建立,其主要思想是尋找一個(gè)線性分離超平面,將非線性輸入映射到高維特征空間中,使類別之間的隔離邊緣最大化[10]。本文基于MATLAB環(huán)境,實(shí)現(xiàn)三個(gè)識(shí)別模型的主要仿真代碼如下:

accuracyArray(i,3) = accuracy;

通過(guò)三種模型間的對(duì)比,對(duì)決策樹(shù)模型進(jìn)行評(píng)估。采用隨機(jī)劃分方法對(duì)原始數(shù)據(jù)進(jìn)行分組,共進(jìn)行42次仿真實(shí)驗(yàn)。將數(shù)據(jù)代入三種模型后得到的識(shí)別結(jié)果對(duì)比,多次的驗(yàn)證后識(shí)別率結(jié)果總結(jié)如表2所示。

表2 三種模型42次仿真識(shí)別正確率統(tǒng)計(jì)

實(shí)驗(yàn)結(jié)果表明,在采用貝葉斯算法、支持向量機(jī)與決策樹(shù)算法三種模型工況識(shí)別正確率中,決策樹(shù)算法模型的工況識(shí)別正確率達(dá)到了97%,其識(shí)別率正確最高。

3 結(jié)語(yǔ)

鉆井工況的智能識(shí)別對(duì)于鉆井工作具有十分重要的意義。本文設(shè)計(jì)了一種基于決策樹(shù)算法對(duì)工況進(jìn)行智能識(shí)別的方法,該法以實(shí)際鉆井?dāng)?shù)據(jù)為建模依據(jù),同時(shí)建立樸素貝葉斯與支持向量機(jī)對(duì)比模型。仿真實(shí)驗(yàn)結(jié)果分析表明該方法具有抗干擾強(qiáng)、算法參數(shù)自適應(yīng)等優(yōu)點(diǎn),且對(duì)于工況智能識(shí)別的準(zhǔn)確率進(jìn)行了提高,獲得了較為理想的實(shí)驗(yàn)結(jié)果。該方法能夠?yàn)殂@井工作提供有力的幫助,具有較為廣泛的應(yīng)用前景。

猜你喜歡
貝葉斯決策樹(shù)鉆井
改進(jìn)貝葉斯統(tǒng)計(jì)挖掘名老中醫(yī)對(duì)肺痿的證候分型經(jīng)驗(yàn)
淺析鉆井用變頻調(diào)速三相異步電動(dòng)機(jī)技術(shù)
基于貝葉斯定理的證據(jù)推理研究
基于貝葉斯解釋回應(yīng)被告人講述的故事
簡(jiǎn)述一種基于C4.5的隨機(jī)決策樹(shù)集成分類算法設(shè)計(jì)
租賃房地產(chǎn)的多主體貝葉斯博弈研究
租賃房地產(chǎn)的多主體貝葉斯博弈研究
中國(guó)建成全球最大海上鉆井平臺(tái)
決策樹(shù)學(xué)習(xí)的剪枝方法
未來(lái)2年將有超過(guò)100座鉆井平臺(tái)報(bào)廢
阿克陶县| 富宁县| 高唐县| 平果县| 河源市| 大丰市| 大荔县| 德庆县| 乌兰县| 河北省| 兴城市| 湖北省| 永善县| 广安市| 大方县| 庆城县| 千阳县| 措勤县| 东兰县| 桂东县| 瑞安市| 克拉玛依市| 沁源县| 宝兴县| 丘北县| 茌平县| 台南县| 蕉岭县| 肃南| 万安县| 伊通| 霍邱县| 天峻县| 崇明县| 汉寿县| 甘肃省| 郎溪县| 桐柏县| 龙南县| 嘉禾县| 连城县|