韋博
(中海油信息科技有限公司天津分公司,天津300452)
互聯(lián)網(wǎng)背景下的石油行業(yè)大數(shù)據(jù)的信息化應用
韋博
(中海油信息科技有限公司天津分公司,天津300452)
隨著我國石油勘探開發(fā)的難度逐漸加大,在互聯(lián)網(wǎng)快速發(fā)展的背景下,石油行業(yè)如何高效的開發(fā)、管理和利用大數(shù)據(jù)技術是當前需要思考的課題。石油行業(yè)信息化的成熟度是提升出產(chǎn)量的關鍵要素,為此,要關注互聯(lián)網(wǎng)背景下的石油行業(yè)大數(shù)據(jù)技術的信息化應用,采用先進的大數(shù)據(jù)分析和計算技術,提升石油行業(yè)的勘探開發(fā)效率,充分利用數(shù)據(jù)挖掘技術實現(xiàn)對石油基礎數(shù)據(jù)的分析,更好地降低石油行業(yè)成本,提升勘探開發(fā)效能。
互聯(lián)網(wǎng);石油行業(yè);大數(shù)據(jù);信息化
隨著石油行業(yè)勘探、生產(chǎn)、運輸、安全管理的難度逐漸加大,需要建立以石油行業(yè)大數(shù)據(jù)為依托和支撐,利用先進的大數(shù)據(jù)技術和手段,來挖掘和利用石油行業(yè)數(shù)據(jù)資源,并將其貫穿于石油行業(yè)的上游、下游各個領域,更好地提升石油行業(yè)的勘探與生產(chǎn)管理的信息化應用水平。
石油行業(yè)大數(shù)據(jù)具有海量、異源、異構(gòu)的特點,可以將其應用于石油地震勘探之中,通過對大數(shù)據(jù)的采集、存儲、綜合處理和成像的信息化應用,可以較好地實現(xiàn)對數(shù)據(jù)的分析和利用。具體來說,大數(shù)據(jù)在石油行業(yè)地震勘探中的信息化應用包括以下三個方面:
一是地球物理數(shù)據(jù)采集。通過對石油行業(yè)大數(shù)據(jù)的采集,可以全面獲悉地球地質(zhì)結(jié)構(gòu)、地層的變化情況,并在物探裝備技術不斷發(fā)展和成熟的條件下,實現(xiàn)對地質(zhì)結(jié)構(gòu)、地層變化數(shù)據(jù)的高效采集,從而使石油大數(shù)據(jù)呈快速膨脹的趨勢。
二是數(shù)據(jù)處理。在采集海量的地球物理數(shù)據(jù)之后,還要對不同區(qū)塊的數(shù)據(jù)進行參數(shù)組合和流程組合,要充分利用大數(shù)據(jù)的模式識別分析方法、數(shù)據(jù)并行處理技術等,實現(xiàn)對數(shù)據(jù)的分析和處理。要選用相對輕便的網(wǎng)絡化地震采集儀器,推行可控震源有效采集技術,在量化的質(zhì)量監(jiān)控軟件之下,實現(xiàn)對數(shù)據(jù)的可靠性評價,更好地對海量數(shù)據(jù)進行處理、分析和解釋[1]。
由此可見,在石油行業(yè)地震勘探之中,可以充分利用大數(shù)據(jù)技術,提升油氣識別精度,增強石油勘探的準確性。
為了更好地實現(xiàn)對特定區(qū)塊的地質(zhì)研究,應當在全面了解和明晰該區(qū)塊的地貌特質(zhì)及地質(zhì)狀況的前提下,對其加以分析和研究。利用大數(shù)據(jù)技術的分析方法,實現(xiàn)對研究區(qū)的井位資料的采集和分析,以此作為分析和解釋鉆井、錄井、測井曲線、試油的手段,可以針對海量的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的石油數(shù)據(jù),建構(gòu)一體化的綜合性數(shù)據(jù)管理模型,運用數(shù)據(jù)挖掘技術實現(xiàn)對地質(zhì)儲層的研究。
隨著數(shù)字化油田建設的不斷深入推進,隱藏的數(shù)據(jù)資源被挖掘、開發(fā)和利用,可以通過大數(shù)據(jù)技術,實現(xiàn)對海量歷史數(shù)據(jù)的分析。盡可能地提高采收率和油氣產(chǎn)量,并通過對地震、鉆井、生產(chǎn)數(shù)據(jù)的綜合分析,提供更為智能的生產(chǎn)服務,成為改變油氣開發(fā)方法的決策支持和依據(jù)。例如:可以運用決策樹分析法、聚類分析法、神經(jīng)網(wǎng)絡算法等技術,對油氣數(shù)據(jù)進行關聯(lián)性的分析和預測,并用曲線、數(shù)據(jù)表等形式加以展示,為油田企業(yè)的生產(chǎn)提供準確的依據(jù)。
在石油企業(yè)的油氣管道設計、建設及運營管理過程中,會生成大量的數(shù)據(jù)。然而,這些數(shù)據(jù)的采集標準不夠統(tǒng)一、記錄形式多樣化、數(shù)據(jù)相對孤立難以整合,為此,要采用大數(shù)據(jù)技術,對油氣管道進行風險判定和預控,并針對油氣管道的缺陷,進行針對性、有計劃的修復[2]。例如:油氣管道的腐蝕調(diào)查和處理工作之中,就可以采用大數(shù)據(jù)技術,實現(xiàn)對油氣管道相關數(shù)據(jù)的篩查和分析,以更好地對油氣管道腐蝕的影響程度進行排序分析和等級劃分,以全面而準確地辨識油氣管道風險,減少開挖的數(shù)量,增強油氣管道安全管理水平。
隨著石油行業(yè)規(guī)模的不斷擴大,其必然也會滋生出各種危險因素。為此,要運用大數(shù)據(jù)技術,實現(xiàn)對油氣生產(chǎn)中的安全分析,預知可能出現(xiàn)的風險,提早做好防范工作。要運用大數(shù)據(jù)挖掘技術,挖掘油田企業(yè)中人的不安全行為、物的不安全狀態(tài)、管理漏洞等信息,發(fā)現(xiàn)和挖掘油田生產(chǎn)作業(yè)的事故規(guī)律及特點,以此作為提出安全措施的依據(jù)。例如:在海洋油氣建造管理的過程中,可以利用數(shù)學分析方法和技術,對設備反饋數(shù)據(jù)進行實時的監(jiān)測,全面獲悉設備系統(tǒng)的運行狀態(tài),并監(jiān)測設備零件的振幅、溫度、轉(zhuǎn)速、油壓等相關參數(shù),完成海洋油氣建造管理的先見修復任務。
石油行業(yè)要以“面向主題”為數(shù)據(jù)倉庫建設的原則,建構(gòu)石油基礎數(shù)據(jù)庫數(shù)據(jù)倉庫體系,其框架結(jié)構(gòu)包括如下幾個層次的內(nèi)容:
一是數(shù)據(jù)源。它主要來自于世界石油工業(yè)基礎數(shù)據(jù)庫、世界油氣資源查詢系統(tǒng)數(shù)據(jù)庫、《石油基礎數(shù)據(jù)要覽》。
二是數(shù)據(jù)存儲與管理。這是利用數(shù)據(jù)挖掘技術提取、轉(zhuǎn)換和加載數(shù)據(jù),將這些異源異構(gòu)的數(shù)據(jù)集成、轉(zhuǎn)換到數(shù)據(jù)倉庫之中,為OLAP分析和數(shù)據(jù)挖掘創(chuàng)造條件。
三是數(shù)據(jù)挖掘、數(shù)據(jù)倉庫的應用。在建立數(shù)據(jù)倉庫和多維數(shù)據(jù)集的前提下,建構(gòu)數(shù)據(jù)挖掘模型,實施OLAP操作和分析,以特定的主題為原則,實現(xiàn)對隱藏的數(shù)據(jù)信息的挖掘和分析[3]。
要對石油基礎數(shù)據(jù)倉庫多維數(shù)據(jù)進行切片、劃塊和旋轉(zhuǎn)操作,從多個角度、不同側(cè)面觀察和檢測多維數(shù)據(jù),它具有多維性、層次性的特點,可以有效地支持OLAP應用。在建構(gòu)石油基礎數(shù)據(jù)倉庫多維分析模型的過程中,要以能源基礎數(shù)據(jù)事實表的設計為前提和核心,要包括石油產(chǎn)量、儲量、石油現(xiàn)貨價格等,并設計典型維度表,記錄事實表中事實記錄的具體特性,以此作為用戶分析數(shù)據(jù)的窗口。
在石油大數(shù)據(jù)的信息化應用過程中,要以算法作為數(shù)據(jù)挖掘技術的核心,具體來說,可以采用如下數(shù)據(jù)挖掘算法,以實現(xiàn)對石油基礎數(shù)據(jù)的挖掘和分析:
一是決策樹算法。它是采用自頂向下的遞歸方式,通過對數(shù)據(jù)的清理、歸納,構(gòu)造決策樹,并依照規(guī)則集合進行數(shù)據(jù)提取。
二是聚類分析算法。它是一種數(shù)據(jù)預處理過程,是基于多變量數(shù)據(jù)的多個數(shù)據(jù)屬性的分類方法,可以基于劃分、層次、密度等進行不同分類。
三是關聯(lián)分析算法。這是對石油大數(shù)據(jù)之間的相互關聯(lián)性進行發(fā)現(xiàn)和挖掘,通過對數(shù)據(jù)庫的多次掃描,找尋所有的頻繁項集,并可以分為簡單關聯(lián)、時序關聯(lián)和因果關聯(lián),更好地揭示事件之間的關系。
在互聯(lián)網(wǎng)背景之下,可以利用大數(shù)據(jù)技術的超強數(shù)據(jù)存儲能力及虛擬化技術,對石油行業(yè)空間數(shù)據(jù)結(jié)構(gòu)加以全面的建構(gòu)和完善,在虛擬化技術的資源合理配置與優(yōu)化的前提下,實現(xiàn)多維度的數(shù)據(jù)監(jiān)控管理,較好地調(diào)度和管控地理信息數(shù)據(jù)。
基于我國數(shù)字化油田建設的滯后狀態(tài),要建構(gòu)并完善數(shù)字化油田的相關規(guī)范,具體包括項目管理類標準規(guī)范、基礎信息分類編碼標準規(guī)范、勘探開發(fā)應用系統(tǒng)標準規(guī)范、軟件開發(fā)與運行維護標準規(guī)范等,為石油行業(yè)的基礎數(shù)據(jù)交換、信息安全、系統(tǒng)運行維護服務提供數(shù)字化、信息化的服務和管理。
為了更好地實現(xiàn)對石油行業(yè)大規(guī)模數(shù)據(jù)的并行處理與計算,要提升并行計算程序的自動化處理能力,減少底層技術細節(jié),致力于問題計算和算法實現(xiàn)??梢圆捎米詣踊⑿刑幚碥浖?,如:Google MapReduce并行計算軟件、Spark并行計算系統(tǒng)軟件及Hadoop MapReduce并行計算軟件等[4],并且通過加速比實現(xiàn)對數(shù)據(jù)并行計算的性能評估,更好地提升石油行業(yè)大規(guī)模數(shù)據(jù)的并行處理與計算能力。
要運用大數(shù)據(jù)技術建立石油行業(yè)的應急救援信息庫,以云計算平臺為大型數(shù)據(jù)平臺,建構(gòu)包括石油行業(yè)各類應急突發(fā)事件的應急救援信息庫,豐富應急救援信息庫的內(nèi)容,實現(xiàn)對應急救援的人、財、物的資源分配與定量描述,其具體內(nèi)容主要包括以下幾點:1)案例知識庫。這主要是關于石油行業(yè)應急管理的成熟案例;2)預案庫。這是標準格式的石油行業(yè)應急突發(fā)事件的預案;3)應急救援隊伍信息庫。這是根據(jù)事故類型的不同靈活調(diào)用不同的應急救援隊伍,合理分配救援任務;4)石油行業(yè)應急專家信息庫。這是通過關聯(lián)分析法找尋適宜的專家,以獲得應急突發(fā)事件時的專家協(xié)助與指導;5)應急救援物資儲備信息庫。這是對石油行業(yè)應急突發(fā)事件時的物資調(diào)用,以減少突發(fā)應急事件的損失。
在石油行業(yè)的監(jiān)測與預警階段,可以利用大數(shù)據(jù)技術進行監(jiān)測信息化應用,可以啟動應急響應行動,對各種致災因子及表象加以實時、動態(tài)的監(jiān)測,可以通過關聯(lián)分析算法,進行基礎信息的匹配度識別,實現(xiàn)實時預處理,較好地達到監(jiān)測與預警的目的。
這是通過對危機信息及數(shù)據(jù)的科學整合、分析,合理認識和控制應急突發(fā)事件的各類危險要素,并進行風險評估,幫助工作人員進行準確的判斷和識別,減少危機的損害性影響。
綜上所述,面對互聯(lián)網(wǎng)的信息化不斷普及的趨勢,要結(jié)合海量、異源、異構(gòu)石油行業(yè)大數(shù)據(jù)的特點和規(guī)律,充分利用大數(shù)據(jù)技術,實現(xiàn)對數(shù)據(jù)的快速高效的挖掘、分析和處理。使之應用于石油行業(yè)的勘探、生產(chǎn)、運輸及管理領域,建設數(shù)字化油田、智能化油田,為石油企業(yè)的決策提供契合度最高的信息資源服務,更好地提升石油行業(yè)的大數(shù)據(jù)信息化應用水平,成為石油勘探、生產(chǎn)、運輸及管理的輔助工具之一。
[1]路寬一,張慶霖.關于架構(gòu)石油行業(yè)大數(shù)據(jù)的探討[J].信息系統(tǒng)工程,2016(1):121.
[2]崔海福,何貞銘,王寧.大數(shù)據(jù)在石油行業(yè)中的應用[J].石油化工自動化,2016(2):44.
[3]鄭曉蓮.石油企業(yè)開展互聯(lián)網(wǎng)+培訓的探討[J].石油教育,2016(2):53.
[4]李小寧.數(shù)據(jù)挖掘技術在石油工程的應用前景展望[J].信息化建設,2016(4):307.
TP393
A
1009-3044(2017)24-0025-02
2017-07-03