姜玉輝
摘 要:當(dāng)前計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)不斷發(fā)展,給其他各行各業(yè)都帶來了很大的便利,而大數(shù)據(jù)這個(gè)理念也在很多領(lǐng)域得到了推廣應(yīng)用。檔案管理工作主要是針對重大事件進(jìn)行記錄,所以其對于人類的重要性是不言而喻的,而隨著時(shí)代的發(fā)展,越來越多的新技術(shù)的應(yīng)用,給檔案管理工作帶來了很大的機(jī)遇,同時(shí)檔案管理工作也在面臨著一些困難。當(dāng)前就我國的情況來看,數(shù)據(jù)安全問題一直沒有解決,并且人才短缺,所以數(shù)字化檔案依然遲遲沒有實(shí)現(xiàn)。本文主要針對大數(shù)據(jù)時(shí)代下的檔案管理工作進(jìn)行了探討。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;檔案數(shù)字資源;整合;難點(diǎn);對策
在當(dāng)前很多人對于數(shù)據(jù)非常重視,認(rèn)為其是對于管理工作來說,最具有決定意義的一個(gè)元素了?,F(xiàn)在已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,而人類的生活工作以及娛樂都離不開一系列的數(shù)字化資源。檔案記錄了人類社會(huì)發(fā)展的全過程,可以說是一系列非常重要的材料,現(xiàn)在已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,在這個(gè)時(shí)代下,檔案管理工作被提出了更高的要求,所以檔案管理工作的效率有待于提高,這就需要應(yīng)該對數(shù)據(jù)處理方式進(jìn)行一定程度的改良和優(yōu)化,保證檔案管理工作的科學(xué)性。
一、在大數(shù)據(jù)背景之下檔案管理工作的特點(diǎn)
大數(shù)據(jù)就其本身的構(gòu)成來說,成分是非常復(fù)雜的,并且隨著表現(xiàn)形式的不同,其體現(xiàn)出的狀態(tài)也分為很多個(gè)類型。但是大數(shù)據(jù)這一理念的誕生,其目的是讓人類社會(huì)可以發(fā)展方向更加明晰,思路更為簡單。大數(shù)據(jù)通過其預(yù)測的方式來達(dá)成上述的效果,人類往往可以根據(jù)大數(shù)據(jù)的統(tǒng)計(jì)結(jié)果來確定出一個(gè)發(fā)展方向,并且給人們提供一個(gè)新的視角。所以大數(shù)據(jù)這一理念在以后很長一段時(shí)間內(nèi)都會(huì)處于上升時(shí)期,并且給人類的生活帶來很大的改變,其中對于檔案管理工作也會(huì)造成以下幾點(diǎn)影響。
(一)數(shù)據(jù)總量增加
進(jìn)入大數(shù)據(jù)時(shí)代以后,我國的檔案建設(shè)工作可以分成兩個(gè)部分,一部分是增量檔案,另一部分是存量檔案,并且這兩部分檔案工作都要事先數(shù)字化。當(dāng)前我國的檔案館藏已經(jīng)非常豐富了,根據(jù)相關(guān)預(yù)測,到2020年時(shí),檔案館藏卷數(shù)可能會(huì)超過6億卷,并且隨著我國檔案工作的繼續(xù)開展,檔案資源還將進(jìn)一步豐富。在大數(shù)據(jù)時(shí)代,電子檔案的增長復(fù)讀也會(huì)繼續(xù)加快,并且包含的內(nèi)容十分豐富,一方面包括電子文件和相關(guān)的影視音頻資料,另一方面也包括那些在紙質(zhì)檔案時(shí)代進(jìn)行保管的原始檔案資料。但是隨著信息技術(shù)的發(fā)展,很多過去我們無法利用到的檔案形式也會(huì)相繼被發(fā)掘出來,例如瀏覽記錄和來訪記錄等等,所以檔案數(shù)據(jù)正在以前所未有的速度增長。
(二)檔案資源的分布范圍更加寬泛
隨著大數(shù)據(jù)時(shí)代的到來,檔案管理工作也突破了原有的局限性,信息資源在分布上呈現(xiàn)出了更加廣泛的趨勢。當(dāng)前人們對于數(shù)字資源的利用率正在不斷提高,這使得數(shù)字資源的發(fā)展速度正在不斷加快,當(dāng)前也不斷有越來越多形式的移動(dòng)社誒投入使用,產(chǎn)生數(shù)據(jù)的方式更為多種多樣。通過上文的總結(jié),我們就可以看出,在大數(shù)據(jù)時(shí)代進(jìn)行的檔案管理工作,由于其涵蓋面更為廣泛,所以難度也有所提高了。而結(jié)構(gòu)化的信息和非結(jié)構(gòu)化信息之間互相形成了融合,數(shù)據(jù)結(jié)構(gòu)上存在較大的差異。
(三)數(shù)據(jù)資源可靠性得到提高
對于數(shù)據(jù)資源來說,人們往往非常重視其可靠性和真實(shí)性。在當(dāng)前大數(shù)據(jù)背景之下數(shù)據(jù)的密度得到了很大的提高,所以人們就更加容易獲取信息。在當(dāng)前很多人在不了解事實(shí)的時(shí)候通過查閱資料來達(dá)到目的,并且以此為基礎(chǔ)進(jìn)行判斷,從這個(gè)角度上看,信息資源的真實(shí)性將會(huì)直接決定人的判斷能力是否準(zhǔn)確。而檔案就其性質(zhì)來說,其真實(shí)性也是毋庸置疑的。所以在當(dāng)前大數(shù)據(jù)的背景之下,相關(guān)工作人員也要完善自身的知識(shí)體系,完善整個(gè)檔案管理的開發(fā)工作和管理工作,這樣才能讓檔案管理工作更加具有價(jià)值,給人們帶去更為真實(shí)的信息。
二、數(shù)字化檔案資源的整合中的難點(diǎn)
(一)數(shù)據(jù)存儲(chǔ)間題
在大數(shù)據(jù)時(shí)代,檔案數(shù)字資源整合的首要挑戰(zhàn)來自數(shù)據(jù)存儲(chǔ)。一是檔案管理系統(tǒng)在面對海量數(shù)據(jù)時(shí)需要高可擴(kuò)展性的支撐二而目前集中式的數(shù)據(jù)存儲(chǔ)和管理模式非但資金投入較大,更無法適應(yīng)檔案數(shù)字資源體量激增的新情況,在檔案數(shù)字資源的高效存儲(chǔ)和快捷訪間方面面臨嚴(yán)峻挑戰(zhàn)。二是目前基于關(guān)系型數(shù)據(jù)庫研發(fā)的檔案管理系統(tǒng)無法適應(yīng)大數(shù)據(jù)時(shí)代占數(shù)據(jù)總量80%以下的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和處理的需要。
(二)數(shù)據(jù)分析間題
大數(shù)據(jù)時(shí)代是一個(gè)泛在信息、泛在知識(shí)的時(shí)代,隨著信息化程度的加深,檔案數(shù)字資源的來源結(jié)構(gòu)將發(fā)生巨大變化,傳統(tǒng)的基于封閉的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行的數(shù)據(jù)挖掘算法在分析處理非結(jié)構(gòu)化數(shù)據(jù)時(shí)存在局限。而且,要獲得大數(shù)據(jù)分析的價(jià)值,就應(yīng)關(guān)注檔案數(shù)字資源中的數(shù)據(jù)關(guān)系和語義表征,實(shí)現(xiàn)信息整合與知識(shí)整合。
三、解決問題的對策
想要解決資源整合問題,就需要對檔案數(shù)字資源的管理工作進(jìn)行相關(guān)改進(jìn)。工作人員需要靈活應(yīng)用云技術(shù)和數(shù)字處理技術(shù),來提高檔案部門的工作效率。
大數(shù)據(jù)時(shí)代賦予了檔案數(shù)字資源新的特征,因此要實(shí)現(xiàn)其整合在很大程度上考驗(yàn)著檔案基礎(chǔ)數(shù)據(jù)的質(zhì)與量。這就要求檔案工作者突破固有狹義的檔案資源觀的局限,在大數(shù)據(jù)技術(shù)和理念的指引下,積極構(gòu)建適應(yīng)大數(shù)據(jù)時(shí)代的“大檔案觀”。即要從“社會(huì)記憶”的高度重新審視檔案數(shù)字資源的構(gòu)成范圍和收集視角,改變過去以黨政機(jī)關(guān)文書檔案為主體的收集模式,加大對社會(huì)民生、對個(gè)人等復(fù)雜化、碎片化信息的關(guān)注,使檔案能真正反映政治、經(jīng)濟(jì)、科技、文化、社會(huì)生活等的全貌,反映國家和社會(huì)的實(shí)時(shí)變遷。
從技術(shù)上來說,實(shí)現(xiàn)大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的關(guān)鍵是要建立適應(yīng)大數(shù)據(jù)要求的檔案數(shù)字資源分析生態(tài)系統(tǒng),這就需要云計(jì)算技術(shù)與大數(shù)據(jù)處理工具的協(xié)調(diào)配合。云計(jì)算(CloudComputing)技術(shù)具有虛擬資源池化、高可擴(kuò)展性、高可靠性、按需付費(fèi)、泛在接入等顯著的特征。它適應(yīng)了大數(shù)據(jù)時(shí)代分布式存儲(chǔ)與海量數(shù)據(jù)并行處理的需要,實(shí)現(xiàn)了計(jì)算機(jī)資源的服務(wù)化,是大數(shù)據(jù)時(shí)代擋案數(shù)字資源整合的基礎(chǔ)平臺(tái)和支撐技術(shù)。結(jié)束語為適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展趨勢,檔案數(shù)字資源整合工作必須得到有效的保障。
四、結(jié)語
在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,運(yùn)用數(shù)字資源對檔案進(jìn)行整合已經(jīng)被提上了日程,所以檔案管理人員應(yīng)該從當(dāng)前的管理工作出發(fā),積極尋找現(xiàn)行工作方式中的缺點(diǎn)和不足,并且進(jìn)行完善,才能保證我國檔案管理工作的先進(jìn)性,適應(yīng)當(dāng)前時(shí)代的需要。
參考文獻(xiàn):
[1] 周峰林.大數(shù)據(jù)時(shí)代的數(shù)字檔案館(室)建設(shè)——專訪國家檔案局檔案館(室)業(yè)務(wù)指導(dǎo)司司長孫鋼[J].浙江檔案.2013(08)
[2] 楊冬權(quán).關(guān)于隨館藏?cái)?shù)量增加而相應(yīng)增加各級國家檔案館人員編制的提案[J].中國檔案.2013(04)
[3] 王飛躍.知識(shí)產(chǎn)生方式和科技決策支撐的重大變革——面向大數(shù)據(jù)和開源信息的科技態(tài)勢解析與決策服務(wù)[J].中國科學(xué)院院刊.2012(05)