程崢
摘 要 數(shù)據(jù)挖掘是近年來迅速興起的一個研究領(lǐng)域,它的目標(biāo)是從歷史數(shù)據(jù)中發(fā)現(xiàn)、提取出有用的信息。面對信息高速發(fā)展產(chǎn)生的龐大數(shù)據(jù)量,應(yīng)用數(shù)據(jù)挖掘技術(shù)從中查找出數(shù)據(jù)間的內(nèi)在關(guān)系。急需通用和功能強(qiáng)大的工具,以便于從海量數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,并把這些數(shù)據(jù)轉(zhuǎn)化成有組織的知識。借助數(shù)據(jù)挖掘技術(shù),可以把大型數(shù)據(jù)集轉(zhuǎn)換成有需要的知識。
關(guān)鍵詞 油田企業(yè) 信息化 數(shù)據(jù)挖掘 內(nèi)在關(guān)系
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A
數(shù)據(jù)的爆炸式增長、廣泛應(yīng)用和巨大數(shù)量使得我們的時代成為真正的數(shù)據(jù)時代。急需通用和功能強(qiáng)大的工具,以便于從海量數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,并把這些數(shù)據(jù)轉(zhuǎn)化成有組織的知識。借助數(shù)據(jù)挖掘技術(shù),可以把大型數(shù)據(jù)集轉(zhuǎn)換成有需要的知識。筆者結(jié)合油田企業(yè)工作實際,就數(shù)據(jù)挖掘技術(shù)在油田企業(yè)信息化建設(shè)中的應(yīng)用前景,談一點粗淺認(rèn)識。
1數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是近年來迅速興起的一個研究領(lǐng)域,它的目標(biāo)是從歷史數(shù)據(jù)中發(fā)現(xiàn)、提取出有用的信息。隨著信息技術(shù)的高速發(fā)展,積累的數(shù)據(jù)量急速增長,如何從海量數(shù)據(jù)中提取出有用信息成為當(dāng)務(wù)之急,數(shù)據(jù)挖掘技術(shù)就是運用這些發(fā)展起來的數(shù)據(jù)處理技術(shù),通過高層次的分析,發(fā)現(xiàn)數(shù)據(jù)中的內(nèi)部聯(lián)系與規(guī)則,為現(xiàn)實提供參考。例如,油田企業(yè)各類生產(chǎn)報表,地質(zhì)資料研究,圖書館、基層單位圖書管理系統(tǒng),信訪信息處理以及勘探開發(fā)等,數(shù)據(jù)挖掘技術(shù)都有著廣泛的應(yīng)用前景。
數(shù)據(jù)挖掘(Data Mining)是從大量數(shù)據(jù)中挖掘有趣模式和知識的過程。數(shù)據(jù)源包括數(shù)據(jù)庫、數(shù)據(jù)倉庫、Web、其他信息存儲庫或動態(tài)流入系統(tǒng)的數(shù)據(jù)。其中的有趣模式和知識可以包括多個方面,主要指用戶需要的信息。數(shù)據(jù)挖掘可以看作信息技術(shù)自然進(jìn)化的結(jié)果:數(shù)據(jù)收集和數(shù)據(jù)庫創(chuàng)建、數(shù)據(jù)管理(包括數(shù)據(jù)存儲和檢索、數(shù)據(jù)庫事務(wù)處理)和高級數(shù)據(jù)分析(包括數(shù)據(jù)倉庫和數(shù)據(jù)挖掘)。
數(shù)據(jù)挖掘吸納了諸如統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)庫和數(shù)據(jù)倉庫、信息檢索、可視化、算法、高性能計算和許多應(yīng)用領(lǐng)域的大量技術(shù)。數(shù)據(jù)挖掘研究與開發(fā)的邊緣學(xué)科特性極大地促進(jìn)了數(shù)據(jù)挖掘的成功和廣泛應(yīng)用。
2數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書管理系統(tǒng)
如果可以把數(shù)據(jù)挖掘技術(shù)應(yīng)用到油田圖書館的圖書搜索系統(tǒng)中,將會進(jìn)一步完善搜索系統(tǒng),方便油田企業(yè)使用。
一是優(yōu)化查詢結(jié)果。近年來,油田企業(yè)注重干部職工學(xué)習(xí)培養(yǎng),油田圖書館及各單位圖書室的藏書不斷增多,這也為圖書選擇提供了一定難度。在搜索到的圖書中,應(yīng)該選擇哪一本比較好?哪一本更受大家的歡迎?面對這些問題,使用數(shù)據(jù)挖掘技術(shù),我們針對數(shù)據(jù)庫中以往的借用圖書記錄,可以將同類別的圖書進(jìn)行排序,干部職工在搜索后,可從中了解到比較受歡迎的書籍,對于提高干部職工的文化素養(yǎng)起到事半功倍的效果。
二是提供相關(guān)書籍信息。數(shù)據(jù)挖掘技術(shù)除了可以對查詢結(jié)果起到優(yōu)化作用,還可以做系統(tǒng)推薦。每個人都有喜愛的圖書種類,針對每名干部職工以往的借閱記錄,從中找出任何一名干部職工喜愛的圖書類別,然后推薦同類別的圖書給他。此方法在當(dāng)今很多的購物網(wǎng)站都被使用,如亞馬遜在登錄用戶名后,針對用戶的搜索,下方會給出瀏覽此書的人還喜歡的圖書名稱,這些都為用戶提供方便。
3數(shù)據(jù)挖掘技術(shù)應(yīng)用于油氣信息研判
高技術(shù)油氣設(shè)備在油氣勘探開發(fā)、生產(chǎn)經(jīng)營領(lǐng)域的應(yīng)用和發(fā)展以及相關(guān)技術(shù)的突破和發(fā)展,使得地質(zhì)情報工作趨于信息化、多維化和自動化。從數(shù)據(jù)挖掘在金融、零售等行業(yè)的應(yīng)用來看,我們可以利用數(shù)據(jù)挖掘技術(shù)中的基礎(chǔ)算法,如序列模式分析、關(guān)聯(lián)規(guī)則、聚類等,實現(xiàn)地質(zhì)信息獲取與情報準(zhǔn)確研判,將結(jié)果應(yīng)用于各類生產(chǎn)決策中。
比如,在油氣生產(chǎn)中,地下不穩(wěn)定的因素有很多,對地下不穩(wěn)定因素的事先評估尤為重要,可將地下不穩(wěn)定因素的原因、問題,生產(chǎn)優(yōu)勢與劣勢等進(jìn)行收集分析。在當(dāng)今科技飛速發(fā)展的新形勢下,我們可以通過對地下信息等方面的事先收集,運用地質(zhì)情報等相關(guān)理論與挖掘方法相結(jié)合,挖掘出適合各種生產(chǎn)方式、方法的處理方案、預(yù)案。而且通過運用地質(zhì)信息等相關(guān)理論,不斷地優(yōu)化信息資源庫、模型庫,這部分就要用到數(shù)據(jù)挖掘技術(shù)與機(jī)器學(xué)習(xí)相結(jié)合使用。
另外,在地質(zhì)信息處理、研判過程中也可以使用數(shù)據(jù)挖掘技術(shù),例如,空間數(shù)據(jù)挖掘技術(shù)能夠幫助我們從低級別、分散的數(shù)據(jù)中提取出高效的情報知識;模式識別技術(shù)、遙感圖像處理技術(shù)的使用都為情報提取提供了方法保證。
綜上所述,數(shù)據(jù)挖掘迎合了當(dāng)今社會對可伸縮的、有效的和靈活的數(shù)據(jù)分析的迫切需要,是信息技術(shù)的自然進(jìn)化,是多個學(xué)科和應(yīng)用領(lǐng)域的集合。從目前看,數(shù)據(jù)挖掘在諸如商務(wù)智能、生物信息學(xué)、Web搜索、金融和數(shù)字圖書館等領(lǐng)域都已應(yīng)用,因此提出將數(shù)據(jù)挖掘應(yīng)用于油田企業(yè)信息化建設(shè)方面的一些設(shè)想。將數(shù)據(jù)挖掘與油田信息化建設(shè)相結(jié)合,可以推進(jìn)當(dāng)前企業(yè)信息化建設(shè),可以很大程度地提高信息化的應(yīng)用能力,提高企業(yè)的凝聚力、生產(chǎn)力。其中不免要遇到一些挑戰(zhàn),例如數(shù)據(jù)庫隱私保證、用戶交互以及多數(shù)據(jù)類型的處理。但是,信息化作為一個總體的發(fā)展方向,數(shù)據(jù)挖掘技術(shù)的應(yīng)用將是一種新的、必要的、有效的信息處理手段,能夠提高知識發(fā)現(xiàn)的有效性、及時性以及正確性。
參考文獻(xiàn)
[1] 程羅德,孫濤,邢旭峰,等.高校信息門戶網(wǎng)站群建設(shè)管理應(yīng)用問題研究及對策[J].電腦知識與技術(shù),2013(26).
[2] 王振.辦公自動化研究綜述[J].辦公自動化,2010(22).
[3] 吳志超.建設(shè)工程項目全壽命周期系統(tǒng)化管理之研究[J].基建優(yōu)化,2004(01).
[4] 蘭林.局域網(wǎng)維護(hù)中網(wǎng)絡(luò)安全與硬件維護(hù)策略探討[J].計算機(jī)光盤軟件與應(yīng)用,2013(20).