国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)技術(shù)在油田套損井防治中的應(yīng)用研究

2018-10-19 05:37
數(shù)字通信世界 2018年9期
關(guān)鍵詞:概率密度巖性數(shù)據(jù)挖掘

阮 杰

(中國石油大港油田信息中心,天津 300280)

1 引言

本文基于大港油田公司多年來積累的大量井筒專業(yè)數(shù)據(jù)及生產(chǎn)數(shù)據(jù),在正常和套損井構(gòu)成的大量數(shù)據(jù)樣本中,利用大數(shù)據(jù)技術(shù)了解大港油田套損井分布、套損井發(fā)生規(guī)律、套損井主控因素,進(jìn)而預(yù)測套損井發(fā)生概率,為油田公司套損井的防治工作提供建議和指導(dǎo),以更好的實(shí)現(xiàn)對套損井的防治。

2 大數(shù)據(jù)技術(shù)基本概述

數(shù)據(jù)挖掘是大數(shù)據(jù)技術(shù)數(shù)據(jù)分析、處理的核心,是規(guī)律發(fā)現(xiàn)及預(yù)測的主要技術(shù),隨著科技的發(fā)展,數(shù)據(jù)挖掘不再僅僅依賴在線分析等傳統(tǒng)的分析方法。它結(jié)合了多種學(xué)科知識,并把這些復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,從而更專注于自己所要解決的問題。通過數(shù)據(jù)挖掘分析軟件,可以高度自動化地分析數(shù)據(jù),做出歸納性的推理,從海量數(shù)據(jù)中挖掘出潛在的、有價(jià)值的知識、模型或規(guī)則,并對未來情況進(jìn)行預(yù)測,以輔助決策者評估風(fēng)險(xiǎn)、做出正確的決策。

大數(shù)據(jù)挖掘技術(shù)相比于傳統(tǒng)的數(shù)據(jù)挖掘分析,具有數(shù)據(jù)量大、查詢分析復(fù)雜等特點(diǎn),大數(shù)據(jù)與云計(jì)算密不可分。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于掌握對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理的技術(shù)。

大數(shù)據(jù)的特色在于對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,它必須依托互聯(lián)網(wǎng)的云服務(wù)進(jìn)行分布式處理、分布式數(shù)據(jù)庫和云存儲等。如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵是提高對海量數(shù)據(jù)的“加工能力”。簡單地說,大數(shù)據(jù)技術(shù)就是從各種各樣類型的數(shù)據(jù)海洋中,快速獲得有價(jià)值信息的能力。

3 大數(shù)據(jù)技術(shù)實(shí)現(xiàn)套損井防治研究

為探討大數(shù)據(jù)技術(shù)在油田企業(yè)套損井防治中的研究和應(yīng)用,我們選擇了大港油田港西油田套損井開展了具體研究,主要思路和過程如圖1所示:

圖1 大數(shù)據(jù)技術(shù)實(shí)現(xiàn)套損井防治主要思路和過程

通過各個(gè)環(huán)節(jié)的遞進(jìn),明確多因素情況下,港西油田套損井發(fā)生的主要因素,實(shí)現(xiàn)對套損井發(fā)生情況的預(yù)測,明確主控有針對的開展相關(guān)防護(hù)工作,實(shí)現(xiàn)對套損井防治。

根據(jù)分析的主題,我們對港西油田各類單井的砂巖段小層數(shù)據(jù)、射孔數(shù)據(jù)、套管數(shù)據(jù)進(jìn)行了整理實(shí)現(xiàn)近千口井、五千余條數(shù)據(jù)的整理。

3.1 數(shù)據(jù)挖掘技術(shù)進(jìn)行規(guī)律發(fā)現(xiàn)

在上述數(shù)據(jù)的基礎(chǔ)上,我們開展了基于巖性、井筒名義壽命、鋼級、套損位置深度等單因素的分析及數(shù)據(jù)樣本的分析和擬合。根據(jù)相關(guān)數(shù)據(jù),我們擬合出了套損部位名義壽命在不同巖性中的概率密度曲線,橫軸為名義壽命,縱軸為名義壽命對應(yīng)的概率密度值。

圖2 套損井巖性、名義壽命分布擬合曲線

如圖2可看出,對于這四種巖性類別,名義壽命的峰值都在2500天左右,概率密度在1到2×1014范圍內(nèi)通過對套損位置深度的概率密度分析,擬合出的套損位置深度在不同巖性中的概率密度曲線,橫軸為套損位置深度,縱軸為套損位置深度對應(yīng)的概率密度值。

圖3 套損位置深度、套損位置巖性分布擬合曲線

在圖3這四種巖性類別中,沙泥界面的套損位置深度有明顯的峰值,在2000米左右,近似于正態(tài)分布,其峰值介于0.0015和0.0010之間,表明沙泥界面巖性中發(fā)生套損的深度多為2000米左右。

通過以上因素的共同考慮,對名義壽命、套損位置深度、套損位置巖性因素進(jìn)行散點(diǎn)圖的繪制,并擬合曲線,如圖4所示:

圖4 名義壽命、套損位置深度、套損位置巖性散點(diǎn)分布圖

根據(jù)散點(diǎn)圖可以看出數(shù)據(jù)主要分布在深度小于3000米名義壽命小于10000天的范圍,根據(jù)散點(diǎn)圖,使用stat_smooth()平滑函數(shù)擬合出曲線圖如下:由此可見,對于套損位置巖性為砂巖和其他類型的情況,樣本的套損發(fā)生位置深度隨名義壽命的增加而遞減;對于套損位置巖性為泥巖和泥沙界面的情況,在名義壽命隨深度增加程總體遞減,但在遞減過程中,均出現(xiàn)先增后減的情況。

圖5 根據(jù)散點(diǎn)圖擬合出的曲線

3.2 基于機(jī)器學(xué)習(xí)的套損井防治模型研究

在規(guī)律分析的基礎(chǔ)上,基于R語言我們開展了基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘模型的構(gòu)建。首先我們開展了相應(yīng)的數(shù)據(jù)清洗,數(shù)據(jù)清洗的主要目的是去除去缺失的觀測(沒有進(jìn)行插補(bǔ),因?yàn)閿?shù)據(jù)量夠用),把因變量進(jìn)行因子化,在清理完成之后,通過分層隨機(jī)抽樣對對樣本進(jìn)行了分類和分組。

圖6

考慮到量綱的影響,進(jìn)一步對數(shù)值型變量進(jìn)行標(biāo)準(zhǔn)正態(tài)scale標(biāo)準(zhǔn)化處理,以確保所有數(shù)據(jù)在統(tǒng)一的量綱下進(jìn)行分析和應(yīng)用。反復(fù)比較數(shù)據(jù)的抽樣及分類特征發(fā)現(xiàn),套損井主控因素的研究模型建立宜采用“隨機(jī)森林”的方法建模分析和特征提取,在基于隨機(jī)森林算法進(jìn)行特征提取的過程中,為增強(qiáng)結(jié)果的可靠性,引入十折交叉驗(yàn)證方式算法(ten-foldcross validation)。

通過模型的構(gòu)建,利用分層隨機(jī)抽樣的方式,分別隨機(jī)選取25%的樣本構(gòu)成測試集,75%的樣本構(gòu)成訓(xùn)練集。通過十次10折交叉驗(yàn)證,其精度都在98%以上,說明模型的預(yù)測精度較高。隨后,模型針對之前輸入的各種特征變量給出了影響港西油田套損井發(fā)生的4個(gè)重要特征,即為鋼級、砂層厚度、水泥返深、滲透率。

基于該算法構(gòu)建的模型,我們隨機(jī)抽了了大港油田港西油田21組數(shù)據(jù)進(jìn)行相關(guān)的驗(yàn)證,通過模型的運(yùn)算得到結(jié)果與實(shí)際情況基本吻合,進(jìn)而驗(yàn)證了模型的基本可用性,也為該模型的正式應(yīng)用奠定了基礎(chǔ)。通過該模型的研究,可以快速的針對特定區(qū)塊進(jìn)行套損井主控因素的發(fā)現(xiàn),為專業(yè)研究人員提供了基礎(chǔ)的套損井發(fā)生因素的說明,針對相應(yīng)的主控因素可以快速的開展有針對的措施應(yīng)對,以防止或延緩套損井情況的發(fā)生,以確保生產(chǎn)的平穩(wěn)、有序開展。

4 結(jié)束語

本文基于油田生產(chǎn)過程中套損井防治的場景,利用大數(shù)據(jù)技術(shù)進(jìn)行相關(guān)機(jī)理的研究,對大數(shù)據(jù)技術(shù)的具體應(yīng)用進(jìn)行詳細(xì)的了解和應(yīng)用,實(shí)現(xiàn)了大數(shù)據(jù)技術(shù)在油田套損井防治中的應(yīng)用,為后續(xù)的深入應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。

猜你喜歡
概率密度巖性數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
一種識別薄巖性氣藏的地震反射特征分析
連續(xù)型隨機(jī)變量函數(shù)的概率密度公式
基于GUI類氫離子中電子概率密度的可視化設(shè)計(jì)
相關(guān)矩陣和熵值算法在松遼盆地元素錄井巖性識別中的應(yīng)用
K 近鄰分類法在巖屑數(shù)字圖像巖性分析中的應(yīng)用
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
運(yùn)用測井資料識別巖性油氣藏
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
隨機(jī)變量線性組合的分布的一個(gè)算法
台东市| 大宁县| 江北区| 伊宁县| 涿州市| 宁远县| 迁安市| 洞口县| 安康市| 包头市| 兴宁市| 南投市| 香港| 五大连池市| 探索| 崇礼县| 枣强县| 康马县| 常宁市| 南陵县| 武邑县| 双柏县| 台前县| 大洼县| 乌苏市| 乐平市| 桓仁| 金华市| 清镇市| 天台县| 元谋县| 阿克| 京山县| 拉萨市| 镇宁| 乡宁县| 渝北区| 沾化县| 桃江县| 南丹县| 荥阳市|