張偉
摘要:文章在分析大數(shù)據(jù)和大數(shù)據(jù)時(shí)代內(nèi)涵與特征的基礎(chǔ)上,探討了大數(shù)據(jù)時(shí)代下的檔案開發(fā)和利用新變化、新特征,在此基礎(chǔ)上,提出了大數(shù)據(jù)時(shí)代檔案的數(shù)據(jù)價(jià)值開發(fā)和利用建議。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)時(shí)代;檔案價(jià)值;檔案開發(fā);檔案的數(shù)據(jù)價(jià)值
引言
當(dāng)前,大數(shù)據(jù)影響范圍十分廣泛,影響程度十分深遠(yuǎn),遠(yuǎn)遠(yuǎn)超出了人們對(duì)此的想象,各行各業(yè)在信息化快速推進(jìn)中進(jìn)入到了大數(shù)據(jù)時(shí)代。檔案在大數(shù)據(jù)時(shí)代也呈現(xiàn)出與以往不同的明顯特點(diǎn),其價(jià)值體現(xiàn)方式和開發(fā)利用方式,都有很大轉(zhuǎn)變,通過何種手段不斷提升其開發(fā)利用效率,成為學(xué)術(shù)界和實(shí)踐中重點(diǎn)關(guān)注的問題。
一、大數(shù)據(jù)和大數(shù)據(jù)時(shí)代的內(nèi)涵與特征
(一)大數(shù)據(jù)的內(nèi)涵和特征
目前,國(guó)內(nèi)外學(xué)術(shù)界對(duì)大數(shù)據(jù)還沒有一個(gè)統(tǒng)一的內(nèi)涵界定。例如,維基百科認(rèn)為大數(shù)據(jù)所涉及的資料數(shù)量遠(yuǎn)遠(yuǎn)超過過去數(shù)據(jù)的總和,目前主流數(shù)據(jù)處理軟件在短時(shí)間內(nèi)很難獲取、管理、處理并整理,成為幫助組織經(jīng)營(yíng)決策更積極目標(biāo)的各類資訊;學(xué)者 John Rauser 對(duì)大數(shù)據(jù)的定義是:“任何超過一臺(tái)計(jì)算機(jī)所處理能力的各類數(shù)據(jù)。”著名咨詢公司麥 肯錫對(duì)其定義是:“很難在短時(shí)間內(nèi),通過傳統(tǒng)數(shù)據(jù)庫(kù)的軟件工具進(jìn)行抓取、管理和處理的各類數(shù)據(jù)的集合?!?根據(jù)各個(gè)學(xué)者對(duì)其內(nèi)涵的界定可以看出,由于其研究的角度不同,導(dǎo)致其研究?jī)?nèi)容的不同,對(duì)其內(nèi)涵的界定也各不相同。如果從數(shù)據(jù)本身和數(shù)據(jù)處理技術(shù)兩個(gè)角度來對(duì)大數(shù)據(jù)進(jìn)行理解的話,大數(shù)據(jù)就有廣義和狹義之分。狹義上的大數(shù)據(jù)主要指數(shù)據(jù)的形式和規(guī)模,大數(shù)據(jù)的結(jié)構(gòu)形式不僅包含了結(jié)構(gòu)化的數(shù)據(jù),更多是指非結(jié)構(gòu)化的數(shù)據(jù)和半結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)的結(jié)構(gòu)形式多種多樣;從大數(shù)據(jù)的規(guī)模來說,大數(shù)據(jù)等同于海量的數(shù)據(jù),其規(guī)模十分龐大。廣義上的大數(shù)據(jù),不僅包含結(jié)構(gòu)形式和規(guī)模,而且還包含了數(shù)據(jù)處理技術(shù)。大數(shù)據(jù)的處理技術(shù)是指可以從那些不斷增長(zhǎng)的信息和轉(zhuǎn)瞬即逝的大數(shù)據(jù)中獲取有價(jià)值的信息的能力。無論是從狹義角度還是從廣義角度來看大數(shù)據(jù),其核心仍然是大數(shù)據(jù),是那些超越傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、不借用網(wǎng)絡(luò),無法用主流軟件工具和技術(shù)進(jìn)行分析的復(fù)雜數(shù)據(jù)集合。 大數(shù)據(jù)具有以下幾個(gè)方面的基本特征:一是數(shù)據(jù)的規(guī)模十分龐大;二是數(shù)據(jù)的多樣性,包含了各類文本數(shù)據(jù)、音頻數(shù)據(jù)、圖片數(shù)據(jù)和視頻數(shù)據(jù)等結(jié)構(gòu)化、半結(jié) 構(gòu)化及非結(jié)構(gòu)化的數(shù)據(jù)資料;三是數(shù)據(jù)在處理時(shí)效方面的高速性。
(二)大數(shù)據(jù)時(shí)代的內(nèi)涵和特征
大數(shù)據(jù)時(shí)代是建立在物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等現(xiàn)代網(wǎng)絡(luò)渠道中的廣泛、大量的數(shù)據(jù) 資源收集和整理基礎(chǔ)上的數(shù)據(jù)存儲(chǔ)、價(jià)值提升、智能處理和信息展示的信息時(shí)代。在大數(shù)據(jù)時(shí)代,人們可以從大量的數(shù)據(jù)中獲取可以轉(zhuǎn)換為推動(dòng)人們生活方式變化 的有價(jià)值的各類知識(shí)。 大數(shù)據(jù)時(shí)代,具有以下幾個(gè)方面的特征:
第一,社會(huì)性。大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)領(lǐng)域主要是以數(shù)據(jù)流通來取代產(chǎn)品流通,從而把生產(chǎn)演變成為服務(wù),把人工勞動(dòng)演變成為信息勞動(dòng)。
第二,廣泛性。大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)技術(shù)快速發(fā)展并普及,計(jì)算機(jī)技術(shù)深入到社會(huì)各個(gè)領(lǐng)域,融入人們生活之中。人們?cè)诟鱾€(gè)領(lǐng)域產(chǎn)生和采集到的數(shù)據(jù)數(shù)量十分巨大,甚至達(dá)到了前所未有的龐大。
第三,公開性。大數(shù)據(jù)時(shí)代越來越多的數(shù)據(jù)都被開放,都可以通過網(wǎng)絡(luò)獲取,這種公開性取決于網(wǎng)絡(luò)開放平臺(tái)是否受到法律支持或社會(huì)公認(rèn)。
第四,動(dòng)態(tài)性。借助于互聯(lián)網(wǎng)而進(jìn)入到了大數(shù)據(jù)時(shí)代,充分體現(xiàn)了基于互聯(lián) 網(wǎng)的及時(shí)動(dòng)態(tài)數(shù)據(jù),不僅數(shù)據(jù)在收集的時(shí)候具有動(dòng)態(tài)性,而且數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理技術(shù)也在不斷地動(dòng)態(tài)發(fā)展,數(shù)據(jù)處理工具具有很強(qiáng)的動(dòng)態(tài)性。
二、大數(shù)據(jù)時(shí)代的檔案管理變化和檔案價(jià)值
(一)大數(shù)據(jù)時(shí)代的檔案價(jià)值變化
傳統(tǒng)檔案管理中, 對(duì)于檔案價(jià)值的判斷和分析都是停留在信息層面,無論是參考價(jià)值還是憑證價(jià)值,也都是通過滿足人們檔案查詢需求和檔案利用需求而實(shí)現(xiàn)自身價(jià)值的,這些都可以統(tǒng)一理解為檔案的信息價(jià)值。但是,在大數(shù)據(jù)時(shí) 代,對(duì)于檔案價(jià)值的分析,不僅是停留在信息價(jià)值的層面,而且還有數(shù)據(jù)價(jià)值的層面,即檔案的數(shù)據(jù)價(jià)值。檔案的數(shù)據(jù)價(jià)值是指在大數(shù)據(jù)時(shí)代中,檔案作為重要的數(shù)據(jù)資源,其價(jià)值是通過數(shù)據(jù)處理技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)應(yīng)用而體現(xiàn)的。 與檔案的信息價(jià)值相比,檔案的數(shù)據(jù)價(jià)值具有時(shí)效性、宏觀性、關(guān)聯(lián)性和隱深性的特點(diǎn)。
(二)檔案數(shù)據(jù)的創(chuàng)新
大數(shù)據(jù)豐富了檔案價(jià)值觀,而且還可以使學(xué)術(shù)界從新的維度去研究檔案價(jià)值,有利于新的檔案價(jià)值觀的形成,可以對(duì)大數(shù)據(jù)時(shí)代的檔案價(jià)值內(nèi)在規(guī)律進(jìn)行更加準(zhǔn)確的認(rèn)識(shí)和把握,對(duì)大數(shù)據(jù)時(shí)代檔案價(jià)值的內(nèi)涵進(jìn)行全面深刻理解,從而把檔案價(jià)值研究引向一個(gè)新的高度。檔案數(shù)據(jù)價(jià)值拓展了檔案的外延從而使那些原 有的沒有保存價(jià)值的文檔材料,重新進(jìn)行了歸檔,使其變得更有價(jià)值。
(三)檔案數(shù)據(jù)的價(jià)值
檔案管理工作的創(chuàng)新。首先,隨著數(shù)據(jù)技術(shù)的發(fā)展和成熟,電子檔案成為檔案的主要保存形式,電子文件歸檔和管理成為檔案工作的主要內(nèi)容;其次,隨著檔案載體的數(shù)據(jù)化,采用云存儲(chǔ)技術(shù),對(duì)檔案價(jià)值進(jìn)行挖掘,采集檔案數(shù)據(jù)價(jià)值已經(jīng)刻不容緩;再次,大數(shù)據(jù)時(shí)代的檔案管理,如果采取逐份鑒定的方式,已經(jīng)很難適應(yīng)形式發(fā)展要求,以一個(gè)事件、活動(dòng)、項(xiàng)目,甚至是某個(gè)機(jī)構(gòu)全部 數(shù)據(jù)為基礎(chǔ)的宏觀檔案鑒定方法將在大數(shù)據(jù)時(shí)代顯現(xiàn)其優(yōu)勢(shì)。
三、大數(shù)據(jù)時(shí)代下的檔案數(shù)據(jù)價(jià)值開發(fā)和利用
(一)創(chuàng)新檔案數(shù)據(jù)價(jià)值開發(fā)和利用理念
要適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展要求,在數(shù)據(jù)檔案價(jià)值開發(fā)利用中,不斷創(chuàng)新理念,牢固樹立大開放、大檔案和大服務(wù)理念。數(shù)據(jù)價(jià)值開發(fā)的大檔案理念,通過對(duì)檔案資源的有效整合,特別是要更加注重對(duì)檔案數(shù)據(jù)和信息的獲取、分析和挖掘,通過各種挖掘工具的使用,使檔案數(shù)據(jù)更加真實(shí)、全面和客觀,使檔案中所反映的信息更加真實(shí)、全面和客觀,更好地為社會(huì)提供檔案數(shù)據(jù)信息服務(wù)。
(二)牢固樹立檔案數(shù)據(jù)價(jià)值的大服務(wù)理念
在檔案數(shù)據(jù)價(jià)值開發(fā)過程中,以用戶需求為導(dǎo)向,提供適銷對(duì)路的檔案數(shù)據(jù)信息服務(wù)產(chǎn)品,為社會(huì)各界提供參考,使檔案數(shù)據(jù)價(jià)值開發(fā)和利用的范圍更為廣泛,層次不斷提升。
結(jié)束語(yǔ)
總之,在大數(shù)據(jù)時(shí)代,檔案管理的價(jià)值和開發(fā)利用價(jià)值越發(fā)顯得重要。要充分與大數(shù)據(jù)結(jié)合,使檔案管理發(fā)揮出最大價(jià)值,實(shí)現(xiàn)檔案管理更科學(xué)、更廣泛的發(fā)展。
參考文獻(xiàn):
[1]李麗芳.大數(shù)據(jù)時(shí)代檔案信息利用及效果探析[J].城建檔案,2016(11):111-114
[2]李小晨.大數(shù)據(jù)時(shí)代背景下的檔案管理探討[J].云南檔案,2013(6):48-50
[3]詹秀琴.淺談網(wǎng)絡(luò)檔案信息資源的收集保存策略[J].黑龍江科技信息,2016(17):14-18
[4]焦明江.論我國(guó)檔案信息立法的完善[J].蘭臺(tái)世界,2015(2):21-24
[5]李宏實(shí).關(guān)于對(duì)檔案信息交流的分析[J].黑龍江史志,2015(8):6-9