馬華鋒,馬 榮,高 鵬,衣博茹
(1.延長油田股份有限公司吳起采油廠,陜西延安 717600;2.大慶油田有限責(zé)任公司第四采油廠,黑龍江大慶 163000)
數(shù)據(jù)是石油公司最重要的資產(chǎn)之一。隨著石油企業(yè)的發(fā)展,油田在勘探開發(fā)過程中積累了大量的數(shù)據(jù),為石油企業(yè)的生產(chǎn)和科研提供了大量的數(shù)據(jù)支持。但是,它也給石油企業(yè)的發(fā)展帶來了很多問題,即數(shù)據(jù)資源分散,數(shù)據(jù)共享困難。為了更好地適應(yīng)石油企業(yè)的業(yè)務(wù)發(fā)展,迫切需要開展大規(guī)模的數(shù)據(jù)治理,使數(shù)據(jù)更加標準、統(tǒng)一。
隨著經(jīng)濟的快速發(fā)展,科學(xué)技術(shù)水平也不斷提高,經(jīng)過多年的數(shù)據(jù)開發(fā),石油企業(yè)積累了一定的數(shù)據(jù),但在數(shù)據(jù)管理的過程中還存在一些不足,亟待解決。數(shù)據(jù)治理是解決這些問題的數(shù)字轉(zhuǎn)換的方式,需要以多種方式來解決數(shù)據(jù)管理的問題,如組織職責(zé)、工作流程和系統(tǒng)規(guī)范,解決數(shù)據(jù)的不一致,最終建立標準化的數(shù)據(jù)應(yīng)用標準,提高組織內(nèi)數(shù)據(jù)質(zhì)量,實現(xiàn)數(shù)據(jù)共享,充分發(fā)揮數(shù)據(jù)資產(chǎn)的價值[1]。
石油企業(yè)數(shù)據(jù)治理的內(nèi)容主要包括5 個方面,以下就針對這5 個方面做詳細分析。
(1)建立數(shù)據(jù)模型:數(shù)據(jù)模型包括企業(yè)整個業(yè)務(wù)范圍,建立起具有穩(wěn)定、容易使用等特點的全域統(tǒng)一模型,這也為針對不同應(yīng)用展開分析打下了良好的基礎(chǔ),在保障機構(gòu)中也是具有靈活性和擴展性,打破了信息孤島帶來的限制,讓數(shù)據(jù)做到相互連接。
(2)數(shù)據(jù)質(zhì)量管控體系:建立起企業(yè)級的數(shù)據(jù)質(zhì)量管理,可以保證做到對數(shù)據(jù)質(zhì)量問題進行全程的追蹤、監(jiān)控,支撐了整個數(shù)據(jù)質(zhì)量管理流程,建立起企業(yè)中統(tǒng)一數(shù)據(jù)質(zhì)量檢查機制,為數(shù)據(jù)質(zhì)量考核起到輔助作用,保證整個數(shù)據(jù)更加真實有效。
(3)元數(shù)據(jù)管理:判斷企業(yè)中業(yè)務(wù)領(lǐng)域中的數(shù)據(jù)資產(chǎn),做到對企業(yè)數(shù)據(jù)資源做到統(tǒng)一盤查,通過科學(xué)有效的機制管理元數(shù)據(jù),向開發(fā)人員和終端用戶提供元數(shù)據(jù)服務(wù),保證滿足用戶在業(yè)務(wù)方面的需求,為企業(yè)業(yè)務(wù)系統(tǒng)、開發(fā)和維護數(shù)據(jù)平臺提供支撐。
(4)數(shù)據(jù)標準:該標準中涉及到多方面的內(nèi)容,分別是元數(shù)據(jù)、主數(shù)據(jù)、參照數(shù)據(jù)、數(shù)據(jù)指標標準等。通過建立起數(shù)據(jù)標準體系,可以保證數(shù)據(jù)更加標準,管控能力也能得到很大程度的提高,使得數(shù)據(jù)在應(yīng)用過程中更加具有一致性。建立標準的控制更新機制,使數(shù)據(jù)得到不斷的補充、完善,更好地支撐業(yè)務(wù)的開發(fā)。
(5)數(shù)據(jù)共享交換:在統(tǒng)一規(guī)則下,在元數(shù)據(jù)、統(tǒng)一工具下,實現(xiàn)數(shù)據(jù)的交換、整合、復(fù)制以及共享,讓不同客戶可以享受到在不同項目中的數(shù)據(jù)需求。不斷推進“互聯(lián)網(wǎng)+油田業(yè)務(wù)”,為了管理現(xiàn)場的數(shù)據(jù),探索出新的技術(shù)應(yīng)用,如區(qū)塊鏈技術(shù),保證數(shù)據(jù)更加的安全可靠,并有序地共享數(shù)據(jù)。
本次研究中以某石油企業(yè)為例。該企業(yè)在前兩年處理數(shù)據(jù)中還存在著很多不足之處,然而在信息技術(shù)的快速發(fā)展下,治理的理念也發(fā)生了變化,提出了可以使石油企業(yè)發(fā)展的有效對策,具體的解決方案是:第一,數(shù)據(jù)治理以前,要做到整體性分析工程的技術(shù)框架,其中涉及到了治理工具、應(yīng)用的技術(shù)、數(shù)據(jù)池;第二,要給予一定的技術(shù)支持,通過這種方式主要是因為數(shù)據(jù)治理過程中技術(shù)的作用是非常關(guān)鍵的。
該企業(yè)處理數(shù)據(jù)中采用的技術(shù)是Datist,此技術(shù)具有的優(yōu)點是讀寫所有數(shù)據(jù),在讀寫能力方面是非常強的。處理相關(guān)數(shù)據(jù)中,借助于Datist 技術(shù),處理的整個過程都能觀看到。同時企業(yè)對數(shù)據(jù)處理的方法也是非常多,處理也是非常的優(yōu)質(zhì)。例如,在提取數(shù)據(jù)核心內(nèi)容的過程中,首先要對數(shù)據(jù)進行過濾、排序和推送。在Datist 技術(shù)處理數(shù)據(jù)過程中,也可以和GIS 分析功能進行結(jié)合,保證數(shù)據(jù)可以及時、準確地呈現(xiàn)。一體化體系結(jié)構(gòu)中,核心部位就是數(shù)據(jù)池,整個實施中需要合理地使用虛擬數(shù)據(jù)庫進行處理。數(shù)據(jù)庫越來越多地存儲在云端,在云端中的內(nèi)容非常豐富。常見的數(shù)據(jù)庫是屬于一種關(guān)系性數(shù)據(jù)庫,包含的格式種類也是多種多樣,其中最常用的是Oracle、My SQL。數(shù)據(jù)池中有存儲著多種多樣格式的數(shù)據(jù),也可以存放一些和數(shù)據(jù)沒有任何關(guān)系的文件。在這種體系結(jié)構(gòu)中,不僅是包括了大量的數(shù)據(jù)池,而且這些數(shù)據(jù)池都是獨立的,相互之間不會產(chǎn)生影響,具有相對強勁的擴張性[3]。
案例選取的是某石油企業(yè)開/關(guān)日數(shù)據(jù)總賬,該總賬在井動態(tài)分析中起著非常重要的作用,工作中涉及的數(shù)據(jù)也非常廣泛。例如,開/關(guān)井日數(shù)據(jù)表、油井生產(chǎn)數(shù)據(jù)表等。這些表基本上集中在系統(tǒng)庫A 中,庫的數(shù)量很大,查詢相關(guān)數(shù)據(jù)和記錄需要花費大量的時間,從幾分鐘到幾十分鐘不等。查詢相關(guān)數(shù)據(jù)后,需要擴展各表數(shù)據(jù)的有效關(guān)聯(lián),使關(guān)井前的生產(chǎn)計算更加合理。在使用這種方式的過程中,會消耗大量的人力和時間,導(dǎo)致工作效率下降,工作的整體質(zhì)量也會下降。在本研究的過程中,希望能夠開展數(shù)據(jù)治理,更好地保證數(shù)據(jù)的有效性和真實性。
為了保證數(shù)據(jù)可以在最短的時間里計算出來,讓數(shù)據(jù)實現(xiàn)實用性,本次研究過程中就需要針對實施中存在的問題進行及時的解決。首先,提高查詢速度。如圖1 所示,借助于制定出完善的管理制度,通過大數(shù)據(jù)庫中的技術(shù),定期檢查報表中涉及到的數(shù)據(jù),在網(wǎng)絡(luò)的幫助下,將所有重要數(shù)據(jù)合理地同步到數(shù)據(jù)池中,通過這種方式可以有效提高查詢數(shù)據(jù)的速度,保證在幾分鐘的時間基礎(chǔ)上提高幾秒鐘。其次,加強對數(shù)據(jù)自動統(tǒng)計。根據(jù)標準化的技術(shù)體系,根據(jù)Datist 技術(shù),制作完整的數(shù)據(jù)流(圖2)。Datist 技術(shù)不僅可以大大提高數(shù)據(jù)驅(qū)動能力,而且整個過程可視化,在過去完成更復(fù)雜的項目,需要大量的開發(fā)人員和程序員掌握復(fù)雜的數(shù)據(jù)庫知識,但隨著信息技術(shù)的快速發(fā)展,使用Datist 數(shù)據(jù)專家軟件盡可能快地設(shè)計。最后,呈現(xiàn)準確報表。對數(shù)據(jù)組織完成以后,Datist 技術(shù)就能直接計算出較為準確的報表[4]。
圖1 數(shù)據(jù)模型系統(tǒng)總體框架
圖2 使用Datist 技術(shù)對石油企業(yè)數(shù)據(jù)進行處理的功能分解
經(jīng)過多次實踐和研究,該石油企業(yè)借助以往的數(shù)據(jù)管理項目建立了完善的數(shù)據(jù)池,使一定范圍內(nèi)的問題能夠及時得到解決,主要問題是數(shù)據(jù)共享和集成。針對這種情況,將操作下的數(shù)據(jù)錄入,進行準確的交換和存儲,數(shù)據(jù)錄入和查詢同步進行,可以有效地提高工作效率,保證數(shù)據(jù)更加準確有效,也更有利于適應(yīng)現(xiàn)代石油企業(yè)發(fā)展的需要。如果建立了完善的組織、管理、技術(shù)和治理體系,并開發(fā)出了獨特的解決方案,那么該解決方案的應(yīng)用就應(yīng)該以數(shù)據(jù)治理工具和數(shù)據(jù)池為中心。實現(xiàn)數(shù)據(jù)治理后,可以改變現(xiàn)狀,在很大程度上解決數(shù)據(jù)查詢的時間和速度。面對當(dāng)前的發(fā)展形勢,借助這種新的治理模式和理念,可以有效開展石油企業(yè)的建設(shè),實現(xiàn)大數(shù)據(jù)在企業(yè)中的合理應(yīng)用,促進石油企業(yè)的健康可持續(xù)發(fā)展。通過設(shè)計出符合石油企業(yè)發(fā)展的數(shù)據(jù)治理總體框架,并對其中核心內(nèi)容進行明確,分析數(shù)據(jù)治理過程中的現(xiàn)狀,借鑒國內(nèi)外企業(yè)中針對數(shù)據(jù)治理的解決方案,最終構(gòu)建出符合石油企業(yè)發(fā)展的數(shù)據(jù)治理體系方案,保證企業(yè)數(shù)據(jù)利用的效率,讓企業(yè)得到不斷的發(fā)展[5]。
通過將新技術(shù)引入石油企業(yè)信息化建設(shè)中,可以在很大程度上提高石油企業(yè)建設(shè)和發(fā)展的質(zhì)量,將數(shù)據(jù)和業(yè)務(wù)緊密聯(lián)系起來。然而這樣的背景對石油企業(yè)的數(shù)據(jù)質(zhì)量也提出了更高的要求,因此企業(yè)有必要借助數(shù)據(jù)管理技術(shù)對油田數(shù)據(jù)進行全生命周期管理,從而有效滿足石油企業(yè)在信息技術(shù)下的發(fā)展。數(shù)據(jù)管理工程及相關(guān)信息技術(shù)能夠在很大程度上促進石油企業(yè)的發(fā)展,使石油企業(yè)的經(jīng)濟效益和社會效益實現(xiàn)統(tǒng)一。