和海金
【摘 要】本文綜合分析了大數(shù)據(jù)發(fā)展給檔案管理帶來的變革與機遇,以及對應的風險和沖擊,提出應當順應時代趨勢,積極轉(zhuǎn)變思維,促進大數(shù)據(jù)與檔案管理工作融合,同時給出了促進融合發(fā)展的相關(guān)意見。
【關(guān)鍵詞】大數(shù)據(jù);檔案管理;融合發(fā)展
大數(shù)據(jù)一詞最初來源于ApacheOrg開源組織的項目,那時,它主要描述的是大量的數(shù)據(jù)集合,而現(xiàn)在大數(shù)據(jù)的意義變得愈加抽象,它可以指向任何一種數(shù)據(jù)類型,無論這些數(shù)據(jù)是數(shù)字還是文字,是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的。在檔案管理這項時刻與數(shù)據(jù)和記錄打交道的領(lǐng)域,大數(shù)據(jù)時代的來臨,無疑會對傳統(tǒng)的檔案管理模式帶來巨大的沖擊,如何以新思維,新視角看待大數(shù)據(jù)對檔案管理這一領(lǐng)域的影響,是當前亟待解決的重要問題之一。
一、大數(shù)據(jù)發(fā)展給檔案管理帶來的變革與機遇
(一)檔案概念的泛化
大數(shù)據(jù)時代下,任何的信息可能產(chǎn)生價值,一條簡單的購物記錄,或者是一次去醫(yī)院看病的經(jīng)歷,甚至是旅游時一次不經(jīng)意地網(wǎng)絡(luò)照片分享。在大數(shù)據(jù)的背景下,這些信息都會被記錄下來,逐漸累積,組成一個人的“檔案”,這樣一來檔案的概念就跳出了原來人們印象中的各類表格和證明材料?!皺n案”的概念泛化了。
(二)數(shù)據(jù)挖掘與檔案管理
大數(shù)據(jù)挖掘,值得是通過數(shù)據(jù)的篩選、分析、整合,最終實現(xiàn)由數(shù)據(jù)向知識地轉(zhuǎn)變,充分發(fā)揮數(shù)據(jù)的效用。檔案館中大量的資料信息在大數(shù)據(jù)時代已經(jīng)變成了一筆重要的財富。有學者提出,未來檔案館的主要業(yè)務(wù)就是對大量數(shù)據(jù)的分析。檔案管理從原來單一的記錄和檢索,逐漸轉(zhuǎn)變?yōu)榱诵畔⑼诰蚝椭R獲取。
數(shù)據(jù)挖掘首先要對海量的數(shù)據(jù)進行整理與分析,之后對數(shù)據(jù)進行建模,找出數(shù)據(jù)之間的關(guān)聯(lián)性和規(guī)律性。此時檔案管理之中的信息就不僅僅來源于檔案本身,檔案的調(diào)取次數(shù),檔案的訪問記錄,檔案的檢索路徑等一系列信息都會成為數(shù)據(jù),與檔案本身一起組成新的“檔案”,檔案中的數(shù)據(jù)來源和數(shù)據(jù)內(nèi)容都會得到極大的豐富。
(三)大數(shù)據(jù)與檔案管理的融合
要想實現(xiàn)檔案管理與大數(shù)據(jù)的融合發(fā)展,就必須完成三個方面的轉(zhuǎn)變。首先是由傳統(tǒng)管理模式向信息化管理模式的轉(zhuǎn)變,傳統(tǒng)的檔案以紙張為主,檢索和流通困難,已經(jīng)不適合大數(shù)據(jù)模式下檔案管理的要求,為此需要建立與紙質(zhì)檔案對應的信息化的電子檔案,方便實現(xiàn)資源的共享。
其次是要由封閉向開放轉(zhuǎn)變,過去的檔案管理,主要著眼于檔案資料的完整性和保密性,力求使檔案不受到外界的破壞和非法利用,而大數(shù)據(jù)時代的檔案管理,更加側(cè)重于服務(wù)性,檔案的開放性要求提高。要求檔案部門及相關(guān)管理人員主動向用戶提供信息抓取準確的價值高價值知識服務(wù)。通過檔案的流通,使檔案得到了增值,發(fā)揮了其在靜滯狀態(tài)下無法發(fā)揮的作用。
第三是檔案的集中性和規(guī)范性,為了實現(xiàn)檔案的有效流通,同時方便對檔案進行系統(tǒng)的建模,需要將原來分散的檔案統(tǒng)一整合起來,通過資源的整合消除獨立的信息孤島,同時科學地劃分檔案類型。這樣做不僅使檔案工作精細化,科學化,而且在對檔案的分析建模中也有很大的作用。
二、大數(shù)據(jù)對檔案管理帶來的風險和沖擊
數(shù)據(jù)共享化程度提高以及數(shù)據(jù)本身體量的增大,導致檔案的數(shù)據(jù)安全性受到了極大的沖擊。
(一)檔案系統(tǒng)自身安全風險
電子化的檔案存儲在服務(wù)器,個人電腦以及各類存儲介質(zhì)中,同時由于信息的統(tǒng)一化,集中化程度提高。導致一旦關(guān)鍵硬件或軟件支持受到損害,往往會帶來比傳統(tǒng)檔案管理更大的危害和風險。人員誤操作,數(shù)據(jù)庫軟件故障,系統(tǒng)漏洞,這些都可能導致檔案數(shù)據(jù)的不可讀,不可寫甚至完全損壞。而且隨著檔案系統(tǒng)結(jié)構(gòu)功能愈加復雜,其各類軟硬件組成日益豐富,數(shù)據(jù)損壞和丟失的風險也隨之提高。
(二)外部惡意攻擊
由于大數(shù)據(jù)對流通性和開放性的要求,導致信息的接口和終端激增,相比起傳統(tǒng)的檔案數(shù)據(jù)管理,大數(shù)據(jù)環(huán)境下檔案管理的外部風險十分巨大。同時,檔案的系統(tǒng)化和精細化管理,使得別有用心之人檢索和獲取有價值檔案變得愈加容易。在這樣的環(huán)境下,檔案的流失和泄露輕則會侵犯個人的隱私,使其人身、自由、財產(chǎn)等權(quán)利受到侵害。重則有可能造成國家機密的泄露,嚴重危害國家安全。
三、如何安全有效促進檔案管理與大數(shù)據(jù)的融合
大數(shù)據(jù)是科學技術(shù)催生的新產(chǎn)物,在各國高速發(fā)展信息技術(shù),搶占信息領(lǐng)域高地的今天,為了方便文件的傳輸,備份、非結(jié)構(gòu)化數(shù)據(jù)的存儲以及檔案管理脫離舊模式實現(xiàn)從封閉管理向知識服務(wù)的轉(zhuǎn)變,這些都離不開與大數(shù)據(jù)的融合。檔案管理人員應當拋棄故步自封,墨守成規(guī)的想法,積極促進檔案管理與大數(shù)據(jù)的融合工作。但在融合的過程中還應當注意大數(shù)據(jù)給檔案管理帶來的安全風險,采取科學有效手段,實現(xiàn)大數(shù)據(jù)與檔案管理的融合。
(一)構(gòu)建合理的檔案資源體系
豐富的檔案資源是檔案管理部門的重要優(yōu)勢,是開展檔案服務(wù)的資本和信息源頭。單純依靠紙質(zhì)的館藏檔案資源,形式過于單一。大數(shù)據(jù)時代,數(shù)據(jù)的來源呈爆炸增長,針對面向服務(wù)的檔案發(fā)展要求,應當針對不同的需求,對數(shù)據(jù)來源進行遴選。同時為數(shù)據(jù)建立良好的索引結(jié)構(gòu),確保檔案資源可以高效精確地被提取和利用。
(二)積極發(fā)展高效數(shù)據(jù)采集及存儲技術(shù)
在建立好資源體系之后,下一個需要解決的問題就是進行高效的數(shù)據(jù)采集和存儲,數(shù)據(jù)的獲取決定著系統(tǒng)能否得到有價值的信息輸入,數(shù)據(jù)的存儲結(jié)構(gòu)則直接影響著數(shù)據(jù)的后續(xù)處理、計算、交換以及系統(tǒng)的運行速度。伴隨技術(shù)的發(fā)展,目前已經(jīng)出現(xiàn)了基于虛擬現(xiàn)實的檔案數(shù)據(jù)備份,基于云計算平臺的大數(shù)據(jù)智能存儲等存儲方式,技術(shù)人員應當著眼需求,積極在這方面進行探索。
(三)努力建設(shè)精細的數(shù)據(jù)管理模式
當數(shù)據(jù)獲取、存儲之后,由于各種數(shù)據(jù)來源渠道紛繁復雜,結(jié)構(gòu)各異,同時由于數(shù)據(jù)中非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)比例的增加,導致使用傳統(tǒng)的信息描述和索引方式已經(jīng)無法實現(xiàn)高效的數(shù)據(jù)挖掘。這也是制約檔案信息化建設(shè)的主要瓶頸之一,針對這一問題,我國已經(jīng)發(fā)展了基于語義本體的檔案數(shù)據(jù)結(jié)構(gòu)和基于靜態(tài)離線排序策略的智能檔案檢索方式。同時積極進行基于用戶的數(shù)據(jù)深度挖掘,使檔案管理服務(wù)更加智能。
(四)不斷加強檔案管理安全建設(shè)
檔案資源的安全問題是檔案管理的核心問題和頭等大事,在大數(shù)據(jù)發(fā)展愈加深入的今天,檔案安全形勢已經(jīng)出現(xiàn)變化,相比較傳統(tǒng)的檔案管理模式,其安全壓力大大增加,為此檔案建設(shè)的全程都需要將安全放在首位,從人員、設(shè)備、技術(shù)多個方面建設(shè)嚴密的檔案安全保護體系。
首先要推進檔案保存場館的安全建設(shè),改善檔案保管條件,積極做好環(huán)境監(jiān)控,嚴防火災,盜竊。定時對安全設(shè)備進行檢修維護排查安全隱患,檔案人員要牢固樹立安全意識,建立嚴格人員管控和執(zhí)勤制度,積極培養(yǎng)專業(yè)技術(shù)過硬的大數(shù)據(jù)人才,成立檔案管理應急小組。最后應當積極發(fā)展保密技術(shù),從硬件和軟件兩個角度出發(fā),不斷修復系統(tǒng)漏洞,為檔案保密提供良好的平臺環(huán)境。
【參考文獻】
[1]劉陽. 大數(shù)據(jù)時代檔案管理模式變化研究[D].湘潭大學,2015.
[2]張文元,張倩.大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘[J].檔案管理,2016(02):33-35.
[3]閻曉峰.大數(shù)據(jù)與檔案資源開發(fā)利用[J].中國檔案,2015(11):16-19.
[4]吳青霞.傳統(tǒng)檔案管理與“大數(shù)據(jù)-新媒體”融合途徑探索[J].山西檔案,2015(06):42-44.
[5]宋淑琴.大數(shù)據(jù)視野下檔案管理思維方式的轉(zhuǎn)變[J].檔案學研究, 2015 (03):36-39.