国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機森林的鉆井工程預警研究

2017-10-12 01:21:22岳彩通范業(yè)活宋殿光呂澤鵬3鄭州大學電氣工程學院河南鄭州
石油天然氣學報 2017年4期
關鍵詞:鉆井工程決策樹鉆井

李 廣,王 杰,梁 靜,岳彩通,范業(yè)活,宋殿光,呂澤鵬3鄭州大學電氣工程學院,河南 鄭州

2中國電子科技集團公司第二十二研究所第七研究部,河南 新鄉(xiāng)

3中國石油化工股份有限公司華北油氣分公司,河南 鄭州

基于隨機森林的鉆井工程預警研究

李 廣1,2,王 杰1*,梁 靜1,岳彩通1,范業(yè)活2,宋殿光2,呂澤鵬31鄭州大學電氣工程學院,河南 鄭州

2中國電子科技集團公司第二十二研究所第七研究部,河南 新鄉(xiāng)

3中國石油化工股份有限公司華北油氣分公司,河南 鄭州

針對因錄井傳感器工作性能不穩(wěn)定、安裝位置受限等原因造成數(shù)據(jù)失真和丟失導致的鉆井工程異常預報準確率不高,因傳感器傳輸問題無法獲知鉆井狀態(tài)導致工程事故預報準確率不高,因新研制的巖屑流量監(jiān)測儀系統(tǒng)單一無法準確預警等問題,以錄井傳感器、井下傳感器和巖屑流量監(jiān)測儀為對象,結(jié)合其數(shù)據(jù)失真、數(shù)據(jù)不完整、數(shù)據(jù)傳輸困難、動態(tài)數(shù)據(jù)流、單一系統(tǒng)等特點,從歐氏距離、曼哈頓距離、GMBR距離、馬氏距離4個維度,以無異常、異常上升、異常下降為目標空間,采用隨機森林算法設計參數(shù)異常判斷。以各個參數(shù)的歐氏距離為維度,以各種鉆井事故復雜程度為目標空間,采用隨機森林算法設計鉆井工程事故復雜預警模型。利用該模型在現(xiàn)場真實數(shù)據(jù)集上進行仿真,結(jié)果表明工程參數(shù)異常和事故復雜預報準確率均明顯提升。

鉆井工程,數(shù)據(jù)流,隨機森林

AbstractIn consideration of the problems of instability in operation, limitation in installation position that caused low accuracy of drilling abnormal prewarning for data distortion and loss, low accuracy of drilling abnormal prewarning from unstable operation of sensors and newly developed cuttings flow monitoring instrument, the mud logging sensors, down hole sensors and cuttings flow monitoring instrument were used as object; the low warning precision of logging sensors, down hole sensors and cutting flow monitor was analyzed from the aspect of data distortion, data loss, data transmitting difficulty and single system. Abnormal condition discriminating parameters were designed with random forest algorithm in four dimensions, including Euclidean distance, Mahaton distance, GMBR distance and Marsh distance, and with conditions of no abnormality, abnormality increase and abnormality decrease were used as its discriminating target space. A drilling engineering accident warning model was built by using random forest algorithm with Euclidean distance of each parameter as its dimensions and various drilling accident conditions as its target space. Finally, emulation is made with actual field data, and the results show that the warning accuracy for both abnormal engineering parameters and accidents is improved significantly.

KeywordsDrilling Engineering, Data Flow, Random Forest

1. 引言

石油鉆井事故嚴重威脅著鉆井安全。錄井傳感器受測量原理或安裝位置等原因,某些參數(shù)存在失真現(xiàn)象,如總池體積傳感器受攪拌機影響,測量數(shù)據(jù)波動較大;把式出口流量傳感器受泥漿結(jié)餅粘結(jié)影響,存在傳感器失效,獲取不到真正出口流量值。錄井傳感器均在地面,而預測目標如井漏、溢流發(fā)生位置在井下,間接測量加上失真數(shù)據(jù)導致鉆井工程事故預報不準確。針對上述問題,中國電子科技集團公司第二十二研究所研發(fā)了井下測量系統(tǒng),能夠?qū)@頭鉆具內(nèi)外壓力、扭矩、溫度和密度等參數(shù)直接測量,獲取井下數(shù)據(jù),并研發(fā)了巖屑流量監(jiān)測儀,通過測量巖屑上返質(zhì)量,結(jié)合進尺情況判斷地層變化及可能發(fā)生的工程事故。隨著傳感器井下化系統(tǒng)和巖屑流量監(jiān)測儀技術越來越成熟,在鉆井工程事故復雜預警中的作用越來越大,如何綜合利用各個系統(tǒng)信息為安全鉆井保駕護航成為越來越緊迫的任務。

鉆井工程事故異常預報[1][2]的首要工作是檢測參數(shù)異常,組合各種參數(shù)異常類型及程度,對鉆井事故是否發(fā)生及嚴重程度進行報警。目前,主要的機器分類方法有神經(jīng)網(wǎng)絡[3]、SVM (支持向量機) [4]、隨機森林(RF, random forests) [5][6]。神經(jīng)網(wǎng)絡容易陷入局部最小點,SVM運算量過大,不利于在線運行。RF是由Leo Breinan在2001年提出的一種統(tǒng)計學習方法,在生物學、醫(yī)學、工程、互聯(lián)網(wǎng)應用等領域取得了很好的效果。為此,筆者初步探討了RF在鉆井工程預警中的應用,只針對RF在鉆井工程參數(shù)趨勢異常判斷和鉆井事故模型檢測2個方面的內(nèi)容進行研究。

2. 隨機森林算法

RF是一種由多個決策樹[7]進行分類的方法。RF是決策樹的一種,隨機決策樹是組成RF的最小決策單元。RF有2個特征:①有放回地隨機選擇樣本數(shù)據(jù);②無放回地隨機選擇訓練樣本特征來進行隨機決策樹的節(jié)點分裂。采用CART (classification and regression trees)的方式生成決策樹,通常不需要進行剪枝,最大程度生長[8]。通過Bootstrap Aggregating Method [9]采集樣本數(shù)據(jù)作為每棵樹的訓練集。結(jié)合Bootstrap Aggregating Method [9]和Random Subspace Method [10]兩種思想,構(gòu)建多個決策樹,組合分類預測結(jié)果。

2.1. 生成決策樹

在機器學習技術中,數(shù)據(jù)采樣一般采用Bagging和Boosting兩種方式[6]。Bagging是采用有放回的方式,即從樣本庫中采其總量的約2/3數(shù)據(jù)作為訓練樣本,采集后再放回到樣本庫中,重復K次采樣,得到K個訓練樣本庫。Boosting采用一次抽樣、迭代訓練的方式。

RF采用Bagging方式,從N個樣本庫中,隨機抽取n個數(shù)據(jù),抽取后再放回樣本庫中,再次抽取n個數(shù)據(jù),重復K次,得到K個訓練數(shù)據(jù)集,經(jīng)過訓練分類得到K個決策樹{h(X,θk),k= 1, 2, …,K},n <N。訓練數(shù)據(jù)中,n以外的數(shù)據(jù)稱為袋外數(shù)據(jù)OOB (out of bag) [11],OOB數(shù)據(jù)可以用來預測分類器的精度,綜合K次評估結(jié)果,得到錯誤率的OOB估計,用于評估集成分類器的正確率,但大多采用的是訓練數(shù)據(jù)以外的數(shù)據(jù)作為測試數(shù)據(jù),即測試數(shù)據(jù)和訓練數(shù)據(jù)無交叉,但兩者測試的精度是一樣的。由于Bagging的訓練樣本抽取方式,每次生成的決策樹訓練樣本都不一樣,可以一定程度地避免過擬合現(xiàn)象。RF的第2個特征是無放回的抽取分裂屬性,從M個屬性中隨機抽取m個作為單個分類器的屬性集,m <M。當原始數(shù)據(jù)集中M較少時,可以通過線性組合的方式確定新的屬性,提高分類器之間的差異。RF的2個隨機性特征,確保不會出現(xiàn)過擬合,同時也能提高精確度和抗噪聲能力。

設數(shù)據(jù)有M個輸入特征,則在生成隨機樹時,無放回地隨機固定選取M個特征中的m個,以不純度最小原則選取1個特征進行分支生成;再通過同樣的方式,生成下面的所有分支和葉子。RF相比于決策樹有2個特征:有放回地隨機抽取固定數(shù)量訓練數(shù)據(jù);無放回地隨機抽取固定數(shù)量m個屬性。2個隨機性特征保證了RF具有較好的抗噪聲干擾能力,避免了固定數(shù)據(jù)訓練導致的過擬合現(xiàn)象。

2.2. 投票決策

在分類階段,最終結(jié)果由所有決策樹的結(jié)果綜合而成。常用的方法是概率平均和投票法。由于該次研究的決策基于不同測量系統(tǒng)數(shù)據(jù),因此采用投票法進行決策。

式中:C是分類結(jié)果;P是類別;N是森林中決策樹的數(shù)目;I是森林中第i個決策樹的權重;是樹hi對類CP的分類結(jié)果;是樹hi的葉子節(jié)點數(shù)。

如果把數(shù)據(jù)看成一個表,行表示數(shù)據(jù),列表示屬性,則 RF算法具有隨機選擇行數(shù)據(jù)的特征。采用Bagging方式對樣本數(shù)據(jù)集采取有放回的抽取策略,構(gòu)建與測試數(shù)據(jù)集相對應的決策樹。無放回的隨機選擇列屬性,采用CART (classification and regression tree) 方式選擇一個最優(yōu)分裂屬性。由多個決策樹組成一片森林。根據(jù)每個決策樹的結(jié)果,通過投票方式確定最終分類結(jié)果(圖1)。

Figure 1. The pre-warning system of drilling engineering based on forest decision圖1. 鉆井工程預警RF決策系統(tǒng)

3. 基于RF的鉆井工程預警研究

基于RF的鉆井工程事故預警主要應用在2個方面:一個是數(shù)據(jù)異常判斷,另外一個是預警模型判斷。數(shù)據(jù)異常判斷采用不同特征量的距離作為屬性,目標空間為異常上升、異常下降和無異常。預警模型判斷采用不同參數(shù)的歐氏距離,目標空間為井漏、溢流和刺漏等。由于現(xiàn)場工況復雜,很多正常操作也會導致參數(shù)類似于故障異常的特征,再加上傳感器數(shù)據(jù)丟失和失常等原因,導致現(xiàn)場參數(shù)趨勢異常、事故誤報和漏報增多。RF可以結(jié)合幾個領域的決策優(yōu)勢,經(jīng)過綜合判斷輸出一個比單一系統(tǒng)效果好的結(jié)果。

地面和井下參數(shù)異常判斷均采用 RF方法進行。巖屑流量監(jiān)測儀數(shù)據(jù)并入錄井數(shù)據(jù)輔助決策。由于受傳輸帶寬影響,井下傳感器參數(shù)不能夠?qū)崟r傳輸?shù)降孛?,因此井下傳感器采?RF技術獨立運行,只傳送事故復雜預報結(jié)果到地面,再聯(lián)合錄井和巖屑流量監(jiān)測儀進行投票決策。壓縮感知 CS (compressed sensing) [12]具有前端直接采集壓縮后數(shù)據(jù)、后端計算量大的特點,完全滿足了鉆井井下數(shù)據(jù)傳輸特點和要求。隨著 CS技術的發(fā)展,井下傳感器數(shù)據(jù)實時傳輸?shù)降孛婧螅瑢⑻岣咩@井工程事故檢測準確率,降低誤報率和漏報率。

圖2是對某油田某井井漏數(shù)據(jù)的RF仿真試驗結(jié)果,數(shù)據(jù)是各個系統(tǒng)單獨采樣,標簽化是通過專家經(jīng)驗,對故障數(shù)據(jù)開始、結(jié)束時刻進行標志化工作。從結(jié)果可以看出,井下參數(shù)(井底外壓、井底內(nèi)壓)對事故的重要性更大,能夠更直接地反映井漏事故發(fā)生。

圖3為RF訓練與實測效果對比圖,可以看出,經(jīng)過專家標定的數(shù)據(jù)庫監(jiān)督學習,訓練AUC (area under curve)的值(AUC)最高能達到93%;實測AUC平均能達到92%,選擇最合適的決策樹顆數(shù),最佳AUC能達到92.6%。圖3與圖4對比可知,RF能夠獲得比傳統(tǒng)單一模型高的準確率,及比單一模型低的誤報率和漏報率。

Figure 2. RF diagram of leakage parameter importance analysis圖2. RF井漏參數(shù)重要性分析圖

Figure 3. The contrast diagram of RF training and test effect圖3. RF訓練與測試效果對比圖

Figure 4. The contrast diagram of traditional single model and RF圖4. 傳統(tǒng)單一模型與RF對比圖

4. 結(jié)語

該次研究的主要成果在于探索了鉆井工程事故預警在數(shù)據(jù)失真、數(shù)據(jù)丟失、信息片面和測量范圍局限性等問題。引入了RF算法,利用RF算法的隨機抽取數(shù)據(jù)、隨機抽取屬性,集成多個模型綜合決策的特點,解決由數(shù)據(jù)失真、數(shù)據(jù)丟失和系統(tǒng)單一造成的鉆井工程事故誤報率高、漏報率高等問題。通過現(xiàn)場真實數(shù)據(jù)仿真實驗得知,RF算法不但能夠提升事故復雜預報準確率,降低誤報率和漏報率,還能夠分析出事故復雜的關聯(lián)參數(shù),為海量鉆井數(shù)據(jù)知識挖掘提供技術支持和探討,為鉆井工程事故預警技術的提升進行有效探索。

References)

[1]王杰, 李廣, 朱曉東. 基于分層模糊推理的石油鉆井事故預警系統(tǒng)[J]. 微計算機信息, 2008, 7(25): 177-178.

[2]朱曉東, 王杰. 基于分層模糊系統(tǒng)的石油鉆井參數(shù)預測模型[J]. 石油學報, 2010, 31(5): 838-848.

[3]Zhai, M., Roshtkhari, M.J. and Mori, G. (2016) Deep Learning of Appearance Models for Online Object Tracking.

[4]Weston, J. (2014) Support Vector Machine.

[5]Wager, S. and Athey, S. (2015) Estimation and Inference of Heterogeneous Treatment Effects Using Random Forests.

[6]Zhang, F., Du, B. and Zhang, L. (2016) Scene Classification via a Gradient Boosting Random Convolutional Network Framework.IEEE Transactions on Geoscience and Remote Sensing, 54, 1793-1802.https://doi.org/10.1109/TGRS.2015.2488681

[7]Wang, S., Fan, C., Hsu, C., Sun, Q. and Yang, F. (2014) A vertical Hando ff Method via Self-Selection Decision Tree for Internet of Vehicles.IEEE Systems Journal, 99, 1-10.

[8]Petersen, M., Tolver, A., Husted, L.,et al.(2016) Repeated Measurements of Blood Lactate Concentration as a Prognostic Marker in Horses with Acute Colitis Evaluated with Classification and Regression Trees (CART) and Random Forest Analysis.The Veterinary Journal, 213, 18-23. https://doi.org/10.1016/j.tvjl.2016.03.012

[9]Hassan, A. and Bhuiyan, M. (2016) Computer-Aided Sleep Staging Using Complete Ensemble Empirical Mode Decomposition with Adaptive Noise and Bootstrap Aggregating.Biomed Signal Process Control, 24, 1-10.https://doi.org/10.1016/j.bspc.2015.09.002

[10]Hosseini, M., Hajisami, A. and Pompili, D. (2016) Real-Time Epileptic Seizure Detection from Eeg Signals via Random Subspace Ensemble Learning.IEEE International Conference on Autonomic Computing(ICAC), 17-22 July 2016,209-218. https://doi.org/10.1109/ICAC.2016.57

[11]Janitza, S. (2017) On the Overestimation of Random Forest’s Out-of-Bag Error.

[12]Bigot, J., Boyer, C. and Weiss, P. (2013) An Analysis of Block Sampling Strategies in Compressed Sensing.

Study on Drilling Engineering Prewarning Based on Random Forests

Guang Li1,2, Jie Wang1*, Jing Liang1, Caitong Yue1, Yehuo Fan2, Dianguang Song2,Zepeng Lv31Electric Engineering Institute of Zhengzhou University, Zhengzhou Henan
2The Seventh Section of 22ndResearch Institute of China Electronics Technology Group Corporation,Xinxiang Henan
3China Petroleum Chemical Co. Ltd., Zhengzhou Henan

李廣(1980-),男,博士研究生,現(xiàn)主要從事智能計算、機器學習、故障檢測等方面的學習與研究。

2017年4月24日;錄用日期:2017年7月22日;發(fā)布日期:2017年8月15日

Copyright ? 2017 by authors, Yangtze University and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

Received: Apr. 24th, 2017; accepted: Jul. 22th, 2017; published: Aug. 15th, 2017

文章引用: 李廣, 王杰, 梁靜, 岳彩通, 范業(yè)活, 宋殿光, 呂澤鵬. 基于隨機森林的鉆井工程預警研究[J]. 石油天然氣學報, 2017, 39(4): 193-198.

10.12677/jogt.2017.394055

?通信作者。

國家自然科學基金項目(61473266)。

猜你喜歡
鉆井工程決策樹鉆井
聰聰?shù)叵颅h(huán)游記之超深鉆井
自升式鉆井平臺Aker操作系統(tǒng)應用探討
海洋石油(2021年3期)2021-11-05 07:42:54
鉆井工程中井漏預防及堵漏技術分析
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
掃描“藍鯨”——觀察海上鉆井平臺
決策樹和隨機森林方法在管理決策中的應用
電子制作(2018年16期)2018-09-26 03:27:06
中國石油路上最深井KS 21 井鉆井工程通過審查
錄井工程(2017年3期)2018-01-22 08:40:09
新型智能錄井系統(tǒng)在優(yōu)化鉆井工程中的應用
錄井工程(2017年4期)2017-03-16 06:10:41
基于決策樹的出租車乘客出行目的識別
G0-7“工廠化”井組鉆井工藝技術
漳平市| 屏边| 聂拉木县| 开远市| 全南县| 安义县| 平定县| 松溪县| 拜泉县| 宣威市| 饶平县| 固始县| 如皋市| 西充县| 天祝| 东海县| 文安县| 休宁县| 诏安县| 日照市| 德钦县| 离岛区| 噶尔县| 仁布县| 社旗县| 池州市| 寻甸| 郑州市| 安溪县| 达孜县| 浦城县| 安龙县| 乐昌市| 阳高县| 常宁市| 石家庄市| 呈贡县| 昌黎县| 黑山县| 额济纳旗| 鱼台县|