杜曉林
【摘要】大數(shù)據(jù)時(shí)代的到來(lái),給檔案的管理工作帶來(lái)了新的難度與挑戰(zhàn)。本文從大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)概念的轉(zhuǎn)變出發(fā),并從“點(diǎn)”“面”“空間”“時(shí)空”四個(gè)維度著眼,探究大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)的四維結(jié)構(gòu)理論。
【關(guān)鍵詞】大數(shù)據(jù);檔案數(shù)據(jù);四維結(jié)構(gòu)理論
每一次科技革命都會(huì)對(duì)檔案工作產(chǎn)生巨大的影響。工業(yè)時(shí)代的高效率讓檔案數(shù)量激增,迫使檔案管理更為系統(tǒng)化、科學(xué)化;信息時(shí)代計(jì)算機(jī)的普遍應(yīng)用使電子文件的概念成為檔案管理工作必須面對(duì)的問(wèn)題;而無(wú)論如何,2015年國(guó)務(wù)院下發(fā)的《國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》表明大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),在大數(shù)據(jù)浪潮席卷下的檔案概念有了全新的變化。
一、大數(shù)據(jù)時(shí)代的檔案數(shù)據(jù)
全球知名咨詢公司麥肯錫(Mc Kinsey)是最早提出“大數(shù)據(jù)時(shí)代”已經(jīng)到來(lái)的權(quán)威機(jī)構(gòu),該公司在2011年6月份的研究報(bào)告中明確指出大數(shù)據(jù)已經(jīng)開始滲透到各行各業(yè),逐漸成為各職能領(lǐng)域不可缺少的生產(chǎn)因素。不可否認(rèn)的是,大數(shù)據(jù)時(shí)代的到來(lái)也對(duì)檔案學(xué)理論研究及檔案工作產(chǎn)生了很大的影響。就目前來(lái)說(shuō),我們一般所說(shuō)的檔案,其通用的定義為:檔案是社會(huì)組織或個(gè)人在以往的實(shí)踐活動(dòng)中直接形成的具有清晰、確定的原始記錄作用的固化信息。傳統(tǒng)的檔案管理方式采用了去粗取精的方法,將有用的、有價(jià)值的部分提取出來(lái),而對(duì)于那些看似“無(wú)關(guān)緊要”的內(nèi)容被排除在外,這樣的方式在一定程度上節(jié)約了人力物力,提高了管理效率,但也造成了一部分檔案數(shù)據(jù)的損失。
在大數(shù)據(jù)時(shí)代,檔案具有來(lái)源的豐富性、數(shù)據(jù)的冗余性、載體的多樣性和內(nèi)容的混雜性等新的特征,數(shù)據(jù)與檔案間的概念區(qū)分越來(lái)越小,甚至可以寬泛地說(shuō):數(shù)據(jù)即檔案,可能單個(gè)數(shù)據(jù)沒(méi)有價(jià)值,但當(dāng)它成為集合數(shù)據(jù)的一分子時(shí),它的作用才能顯現(xiàn)出來(lái),在此基礎(chǔ)上提取出的大量有價(jià)值的異構(gòu)數(shù)據(jù),成為我們所需的資源。因此,在大數(shù)據(jù)時(shí)代的引領(lǐng)下,檔案工作者亟須轉(zhuǎn)變思維,樹立起“數(shù)據(jù)即檔案”的大檔案觀,保證各類檔案數(shù)據(jù)的完整性與豐富性。
二、大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)的四維結(jié)構(gòu)理解
(一)第一維——“點(diǎn)”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第一維是結(jié)構(gòu)中的“點(diǎn)”,其基本的構(gòu)成要素是檔案數(shù)據(jù)。這里面的數(shù)據(jù)并非元數(shù)據(jù),一般是指一個(gè)數(shù)字、一個(gè)名詞或是一張圖片等等。這是檔案數(shù)據(jù)的第一維,也是檔案數(shù)據(jù)的基礎(chǔ),以下各維的構(gòu)成都由檔案數(shù)據(jù)為基礎(chǔ)進(jìn)行的。將檔案數(shù)據(jù)作為基本單位進(jìn)行理解更具有靈活性,每個(gè)檔案數(shù)據(jù)都兼具兩種特點(diǎn):一是作為信息主體,另一個(gè)則是信息背景。檔案數(shù)據(jù)的不斷累積,這些數(shù)據(jù)根據(jù)來(lái)源組合可以成為檔案信息。
(二)第二維——“面”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第二維是檔案中的“面”,其基本構(gòu)成要素是檔案信息。這里的檔案信息是由檔案數(shù)據(jù)與檔案背景組成的,數(shù)據(jù)轉(zhuǎn)化為信息被接受者接收的必要條件就是對(duì)背景的解讀。同一來(lái)源的檔案數(shù)據(jù)中必然存在可以互為背景的檔案數(shù)據(jù),通過(guò)對(duì)于背景的解讀,檔案數(shù)據(jù)就能成為具有利用價(jià)值的檔案信息。
(三)第三維——“空間”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第三維是檔案中的“空間”,其基本構(gòu)成要素是檔案知識(shí)。檔案知識(shí)是人類在實(shí)踐中認(rèn)識(shí)客觀世界的成果。它包括事實(shí)、信息的描述或在教育和實(shí)踐中獲得的技能。它可以是關(guān)于理論的,也可以是關(guān)于實(shí)踐的。檔案知識(shí)是檔案信息在空間上的延展,統(tǒng)一來(lái)源具有一定相似性的檔案信息整合在一起。知識(shí)的傳輸過(guò)程是傳輸者將其知識(shí)轉(zhuǎn)換為數(shù)據(jù),數(shù)據(jù)通過(guò)一定的方式被利用者接受,然后對(duì)接收到的數(shù)據(jù)和背景重新整合成為信息,接受者根據(jù)自己的理解與推理能力重新加工成知識(shí)的過(guò)程。從這個(gè)傳輸過(guò)程中能看出接受者的能力在知識(shí)的接受過(guò)程中起決定性作用,經(jīng)過(guò)人的提煉推理信息才有可能成為知識(shí),所以檔案知識(shí)是檔案信息加上利用者的個(gè)人經(jīng)驗(yàn)組合而成的。
(四)第四維——“時(shí)空”。檔案數(shù)據(jù)四維結(jié)構(gòu)的第四維是檔案中的“時(shí)空”,其基本構(gòu)成要素是數(shù)據(jù)化的檔案館。檔案數(shù)據(jù)的第四維已經(jīng)是檔案數(shù)據(jù)在時(shí)間與空間上的匯集了,此時(shí)的檔案數(shù)據(jù)已經(jīng)在時(shí)間與空間上進(jìn)行延伸,是對(duì)于四方上下與古往今來(lái)分布的檔案信息進(jìn)行整合推理的過(guò)程。而檔案數(shù)據(jù)在經(jīng)過(guò)四維結(jié)構(gòu)中的第四維整合后,為直接面向公眾服務(wù)提供了支持工具,服務(wù)方式也更為多樣化,使檔案工作向精品化、個(gè)性化、智能化的服務(wù)方向發(fā)展。
三、檔案數(shù)據(jù)四維結(jié)構(gòu)理論對(duì)檔案工作的指導(dǎo)意義
在大數(shù)據(jù)時(shí)代,檔案管理工作被賦予了新的形式與內(nèi)容,檔案數(shù)據(jù)的量化進(jìn)程將大大加快,檔案數(shù)據(jù)四維結(jié)構(gòu)間的各個(gè)維度,即“點(diǎn)”“面”“空間”“時(shí)空”間的聯(lián)系將更加緊密與靈活,并且各個(gè)維度間的轉(zhuǎn)換速度得到有效提升,檔案信息流通程度變強(qiáng),檔案利用效率變高,對(duì)檔案存儲(chǔ)系統(tǒng)也提出了更高的要求。但與此同時(shí),檔案數(shù)據(jù)源的真實(shí)可靠性遭受質(zhì)疑,檔案數(shù)據(jù)的安全性、保密性受到嚴(yán)峻挑戰(zhàn),這也成為我們必須面對(duì)的問(wèn)題。不過(guò),毋庸置疑的是,大數(shù)據(jù)時(shí)代的發(fā)展必將引領(lǐng)檔案工作實(shí)現(xiàn)跨越式發(fā)展,更好地為需求者提供服務(wù)。
【參考文獻(xiàn)】
[1]馮惠玲,張輯哲.檔案學(xué)概論[M].北京:中國(guó)人民大學(xué)出版社,2006.