文/黑龍江省大慶市天然氣分公司 宋晨
半個世紀以來,隨著計算機技術(shù)全面融入社會生活,信息爆炸已經(jīng)積累到了一個開始引發(fā)變革的程度。大數(shù)據(jù)——正在以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品和服務(wù),或深刻的洞見。人們不再以為數(shù)據(jù)是靜止和陳舊的。大數(shù)據(jù)的掌握程度一方面可以轉(zhuǎn)化為經(jīng)濟價值的來源,另一方面大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟、人文以及社會的其他方面。同樣大數(shù)據(jù)時代的到來,也將影響到檔案管理,如何在這種形勢下,更好的利用大數(shù)據(jù)和發(fā)揮其在檔案管理工作中的作用,也是我們現(xiàn)在面臨的挑戰(zhàn)。
大數(shù)據(jù)并非一個確切的概念。最初這個概念是指已經(jīng)超出了一般電腦所能處理的信息量,因此工程師們必須改進處理數(shù)據(jù)的工具。這導致了新的處理技術(shù)的誕生,這些技術(shù)使得人們處理的數(shù)據(jù)量大大增加。今天,大數(shù)據(jù)可以認為是人們在大規(guī)模的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模的數(shù)據(jù)基礎(chǔ)上是無法完成的。
大數(shù)據(jù)的核心就是預測。大數(shù)據(jù)不是要機器人像人一樣的思考,相反,它是把數(shù)學算法運用到海量的數(shù)據(jù)上來預測事情的可能性。2009年 H1N1甲型流感爆發(fā),而在爆發(fā)前幾周,互聯(lián)網(wǎng)巨頭谷歌公司已經(jīng)預測到了流感的爆發(fā),并且可以具體到特定的地區(qū)和州,這讓公共衛(wèi)生官員和計算機科學家們感到震驚。原來谷歌公司保存了多年以來所有的搜索記錄,他們設(shè)立了一個系統(tǒng)唯一關(guān)注的是特定搜索詞條的使用頻率與流感在時間和空間上的傳播之間的關(guān)系。經(jīng)過一系列處理計算,他們預測的準確度高達97%,而且非常及時,而疾控中心卻要在流感爆發(fā)后一兩周后才會有結(jié)果。由此可見,通過特定的系統(tǒng)對大量數(shù)據(jù)的分析,是可以完成曾經(jīng)用傳統(tǒng)思維無法預料到的事情。大數(shù)據(jù)引發(fā)的革命并不在于分析數(shù)據(jù)的機器,而在與數(shù)據(jù)本身和我們?nèi)绾问褂脭?shù)據(jù)。
在大數(shù)據(jù)時代,我們要利用的是所有數(shù)據(jù),而不再僅僅依靠一小部分數(shù)據(jù)。我們現(xiàn)在要對“樣本=總體”來進行深刻探索。
數(shù)據(jù)長期以來一直是有價值的,但通常只是被視為附屬于企業(yè)經(jīng)營核心業(yè)務(wù)的一部分,但在大數(shù)據(jù)時代,所有數(shù)據(jù)都是有價值的。數(shù)據(jù)的價值從它最基本的用途轉(zhuǎn)變?yōu)槲磥淼臐撛趦r值,它促使企業(yè)改變它們的商業(yè)模式,因此創(chuàng)新型企業(yè)能夠提取其潛在的價值并獲得潛在的巨大收益。
就油田檔案館來說,其最大的優(yōu)勢在于所擁有龐大的數(shù)據(jù)資源,這就相當于一個大的數(shù)據(jù)庫。目前,由于油田檔案數(shù)字化還沒有全面完成,許多檔案資源都散落在互不連接的數(shù)據(jù)庫中,形成很多碎片。如何將這些數(shù)據(jù)庫打通,實現(xiàn)信息資源共享,研究成果共享,同時利用檔案資源發(fā)掘?qū)ζ髽I(yè)生產(chǎn)有價值的信息,發(fā)掘檔案部門在生產(chǎn)中的潛力,將會對油田發(fā)展建設(shè)。
就油田檔案館而言,油田檔案館有別于其他地方檔案館,因為大部分記錄的是與企業(yè)生產(chǎn)有關(guān)的檔案。其中石油勘探開發(fā)類檔案是油田的核心檔案資源,同時也是在國家巨大投入下幾代石油人智慧的結(jié)晶,很多新的發(fā)現(xiàn)都是基于老資料的二次研究上取得的成果。就企業(yè)而言,如天然氣分公司來說,建設(shè)項目是我們企業(yè)的核心檔案。把核心檔案做為我們企業(yè)檔案管理今后工作中的重點,發(fā)揮核心檔案在企業(yè)的生產(chǎn)、科研、決策方面的重要作用,將會使檔案的重要性得到進一步的體現(xiàn)。檔案工作應(yīng)該由傳統(tǒng)的重藏輕用轉(zhuǎn)化為深度挖掘,通過對資源數(shù)據(jù)的分析來解決企業(yè)所需要解決的問題。
大數(shù)據(jù)時代的到來,檔案管理人員要用發(fā)展的眼光去重新認識檔案,用創(chuàng)新的思路去開展檔案工作,用變革的理念去適應(yīng)檔案未來的發(fā)展。檔案管理人員的理念應(yīng)該發(fā)生根本性的轉(zhuǎn)變:把傳統(tǒng)的以文書檔案為主轉(zhuǎn)變?yōu)橐云髽I(yè)核心業(yè)務(wù)為主。我們檔案人員也要去關(guān)心企業(yè)所需要解決的問題,企業(yè)所需要的資源,要把企業(yè)的生產(chǎn)當成是自己的工作,然后把有價值的資源信息進行整合、分析、挖掘,形成檔案的智慧分析庫,為企業(yè)提供更加方便快捷的服務(wù)甚至是發(fā)現(xiàn)問題。我們也可以主動調(diào)查業(yè)務(wù)部門的需求,建立各種數(shù)據(jù)模型,對海量數(shù)據(jù)進行聚類、分類、相關(guān)性分析,找到數(shù)據(jù)之間的關(guān)系,進而提高企業(yè)決策水平,幫助其生產(chǎn)經(jīng)營管理。檔案管理人員只有把這些“死”的數(shù)據(jù)變成“活”的信息,才能更好地體現(xiàn)檔案工作的價值。如果我們還不抓住這個契機,發(fā)揮自身的優(yōu)勢,那么檔案部門在生產(chǎn)企業(yè)中將會越來越無足輕重。
檔案資源管理是檔案工作的一種新機制,即把檔案作為一種資源,對各種檔案信息進行綜合管理,應(yīng)用信息技術(shù)開發(fā)檔案信息資源,開發(fā)檔案信息創(chuàng)造的技術(shù)和經(jīng)濟效益。提高檔案科學管理的工作效益。
隨著油田的生產(chǎn)開發(fā)不斷擴大,油田勘探開發(fā)類的檔案資料在不斷的增加。石油地質(zhì)檔案資料是石油企業(yè)在勘探開發(fā)過程中產(chǎn)生的一系列記錄、數(shù)據(jù)、分析結(jié)果以及科研成果等,是石油企業(yè)在地震、鉆井、測井、錄井、試油、油井開發(fā)等油氣田勘探開發(fā)過程中產(chǎn)生的數(shù)據(jù)。地質(zhì)檔案匯集了油氣勘探開發(fā)過程的成果,其中油井資料更是地質(zhì)檔案的重要部分。如何利用好已有的油井資料來解決生產(chǎn)中的難題,為穩(wěn)產(chǎn)4000萬噸提供更好的幫助,將是檔案資源管理中的重要內(nèi)容。如果我們還繼續(xù)傳統(tǒng)的借閱模式,那就會存在因借閱頻繁而引起檔案的損毀、丟失現(xiàn)象的增多,給井史資料造成無法彌補的損失,同時也是油田資源的損失。
油井信息管理的基礎(chǔ)是油井的資料共享,因此,檔案管理系統(tǒng)需要建立油井管理的基礎(chǔ)信息數(shù)據(jù)庫,然后對這些資料中的油田、區(qū)塊和井進行在分析、整理,這才是油井檔案信息管理的核心。采油廠檔案管理系統(tǒng)以油井資料管理為核心內(nèi)容,為科研部門、生產(chǎn)管理部門,在科研攻關(guān)和革新改造、指導生產(chǎn)方面提供檔案服務(wù),是將科技信息資源轉(zhuǎn)化為生產(chǎn)力,把“死資料”變成活信息的有力的佐證。
1.建立企業(yè)檔案系統(tǒng)全文檢索,通過用戶訪問記錄的Web使用挖掘,提出合理化建議大數(shù)據(jù)的核心就是預測,如何把大數(shù)據(jù)這一核心價值在油田檔案管理中體現(xiàn)出來,讓大數(shù)據(jù)服務(wù)于油田生產(chǎn)企業(yè),將會是我們檔案工作的又一突破點。
在基于對企業(yè)所有檔案進行數(shù)字化建立全文檢索系統(tǒng)后,通過對網(wǎng)頁關(guān)鍵字、下載記錄、檢索詞、用戶對網(wǎng)頁利用時間和頻度等方式進行整理分析,如果發(fā)現(xiàn)某一基建項目的訪問量激增,或者同一設(shè)備的訪問量增多,檔案人員就可以把相關(guān)資料找出來,反饋給生產(chǎn)運行部門。比如在整理中發(fā)現(xiàn)某一型號的儀器儀表的查找率增多,檔案人員就可以把這一型號在不同單位的儀器儀表找出來,向查找單位部門詢問造成這一現(xiàn)象的原因,進而可以上報企業(yè)的生產(chǎn)運行部,使他們可以分析和預測,同樣問題也將會出現(xiàn)在其他不同的單位。
2.為生產(chǎn)提供高效、快捷的服務(wù)。在建立大慶油田檔案系統(tǒng)的全文檢索系統(tǒng)后,各個采油廠的勘探開發(fā)類檔案都會集中,同樣油氣勘探開發(fā)的各項科研成果也將匯集于此。比如,當某一采油廠的勘探開發(fā)工作遇到難題和瓶頸的時候,就可以通過勘探開發(fā)檔案系統(tǒng)來借鑒其他采油廠的勘探開發(fā)經(jīng)驗和技術(shù)。這樣就可以在技術(shù)攻關(guān)上節(jié)約時間,節(jié)約成本,避免了同一問題的重復研究。
同時,隨著油氣勘探難度的不斷加深,許多工作需要在已有的資料上進行重復研究和利用。檔案在生產(chǎn)資源管理系統(tǒng)的建立可以提高檔案資料的利用率,提供高效、快捷的信息服務(wù)。
[1]維克托·邁爾—舍恩伯格.大數(shù)據(jù)時代[M].浙江人民出版社,2013.