(中鐵大橋局集團(tuán)第四工程有限公司 江蘇 南京 210000)
?
企業(yè)檔案工作如何跟上大數(shù)據(jù)時(shí)代步伐
何三燕
(中鐵大橋局集團(tuán)第四工程有限公司江蘇南京210000)
大數(shù)據(jù)時(shí)代檔案工作面臨的機(jī)遇,有利于社會(huì)檔案觀的形成。檔案事業(yè)由“國家模式”逐漸轉(zhuǎn)變?yōu)椤吧鐣?huì)模式”是新時(shí)期我國檔案工作的風(fēng)向標(biāo),這既是檔案部門內(nèi)部主動(dòng)變革的需要,又是外部環(huán)境驅(qū)動(dòng)的結(jié)果。要想檔案走數(shù)字之路并非一蹴而就,而是一個(gè)循序漸進(jìn)的過程,對(duì)這個(gè)過程的各個(gè)環(huán)節(jié)進(jìn)行深入的分析研究是十分必要的,只有在有了清楚認(rèn)識(shí)的基礎(chǔ)上,才能規(guī)劃和解決好檔案館的數(shù)字化之路,為今后建立數(shù)字化檔案館打好基礎(chǔ)。
企業(yè)檔案;大數(shù)據(jù);時(shí)代步伐
(一)有利于社會(huì)檔案觀的形成
檔案事業(yè)由“國家模式”逐漸轉(zhuǎn)變?yōu)椤吧鐣?huì)模式”是新時(shí)期我國檔案工作的風(fēng)向標(biāo),這既是檔案部門內(nèi)部主動(dòng)變革的需要,又是外部環(huán)境驅(qū)動(dòng)的結(jié)果。大數(shù)據(jù)更是為這種內(nèi)部變革和外部驅(qū)動(dòng)提供了新契機(jī),對(duì)社會(huì)檔案觀的形成起到了促進(jìn)作用。大數(shù)據(jù)的核心在于從海量的數(shù)據(jù)中挖掘價(jià)值,這將為檔案價(jià)值的進(jìn)一步發(fā)現(xiàn)和提升,提供了新的方法。檔案館的館藏資源無疑就是一個(gè)海量的大數(shù)據(jù),如何從如此龐大的數(shù)據(jù)資源中提取有價(jià)值的檔案知識(shí)、信息,如何對(duì)分散的海量數(shù)據(jù)進(jìn)行組配并挖掘信息價(jià)值,這是大數(shù)據(jù)應(yīng)用于檔案工作必須解決的問題之一,即如何幫助用戶挖掘他們所需要或者關(guān)心的分散于海量檔案數(shù)據(jù)中的信息價(jià)值,如何激發(fā)用戶的潛在需求。毋庸置疑,在這一過程中檔案價(jià)值將會(huì)得到進(jìn)一步擴(kuò)展和提升,同時(shí)社會(huì)公眾也將會(huì)倍感檔案資源的重要性和親民性,一旦這樣的檔案意識(shí)逐步成型,檔案社會(huì)觀將得到廣泛認(rèn)可。
(二)為電子文件的有效管理開辟新途徑
如何有效保障電子文件的真實(shí)性一直是困擾電子文件管理的一大難題,而且該難題至今尚未得到很好地解決。電子文件每年呈指數(shù)增長,其量大驚人,對(duì)電子文件的真實(shí)性鑒定無法采用傳統(tǒng)的“直接鑒定法”,因?yàn)檫@樣操作會(huì)消耗大量的人力物力,投入成本過高。大數(shù)據(jù)在處理海量數(shù)據(jù)和分析復(fù)雜數(shù)據(jù)方面具有超強(qiáng)的能力,大數(shù)據(jù)技術(shù)能夠提升電子文件管理的有效性,為保證電子文件的真實(shí)性提供新的技術(shù)路徑。此外,大數(shù)據(jù)技術(shù)框架中還可以借助云平臺(tái)提升檔案數(shù)據(jù)處理的及時(shí)性,保證電子文件管理的及時(shí)性,防止電子文件游離于監(jiān)管之外或者流失。
(三)促進(jìn)檔案工作的變革和檔案理論的創(chuàng)新
我國檔案工作可以歸納為“八大環(huán)節(jié)”或者“管”和“用”兩大方面。無論是在檔案工作的各業(yè)務(wù)環(huán)節(jié),還是在管和用上,我們都離不開“卷”或“件”這樣的檔案保管單位,傳統(tǒng)檔案管理的科學(xué)性在某種程度上需依托于特定的基本單位。而隨著大數(shù)據(jù)時(shí)代的到來,以“卷”或“件”為單位的檔案管理方法或許已經(jīng)無法適應(yīng)一些特殊情況。大數(shù)據(jù)所具有的即時(shí)性、碎片化、非結(jié)構(gòu)化特征,我們很難再沿用“卷”或“件”為單位進(jìn)行管理。大數(shù)據(jù)對(duì)傳統(tǒng)檔案資源本身的組織形式的弱化,使得檔案工作逐漸轉(zhuǎn)向依靠智能化的檢索技術(shù)和挖掘技術(shù),提高檔案管理水平,而不再受傳統(tǒng)檔案組織形式的束縛。檔案實(shí)踐的不斷深入,必將使檔案理論得到相應(yīng)的擴(kuò)充。大數(shù)據(jù)時(shí)代,檔案學(xué)理論體系本身很有可能實(shí)現(xiàn)新的突破,檔案意義的大數(shù)據(jù)資源、理念模式、技術(shù)平臺(tái)等等都將擴(kuò)充檔案學(xué)理論體系,甚至對(duì)來源原則、鑒定理論等核心理論提出革命性觀點(diǎn)。
大數(shù)據(jù)時(shí)代的到來,在給檔案工作帶來機(jī)遇的同時(shí),也帶來了諸多沖擊和挑戰(zhàn)。只有認(rèn)清各種形勢(shì),檔案工作才可能趨利避害,迎難而上,開創(chuàng)一片新天地。
(一)傳統(tǒng)檔案管理模式受到?jīng)_擊
大數(shù)據(jù)時(shí)代,檔案等大量信息載體正由傳統(tǒng)的形態(tài)和傳播方式轉(zhuǎn)向基于信息系統(tǒng)的方向發(fā)展,信息系統(tǒng)正逐漸成為當(dāng)前世界信息資源產(chǎn)生、處理、流轉(zhuǎn)和存儲(chǔ)的主要平臺(tái)。檔案的產(chǎn)生形成、運(yùn)轉(zhuǎn)傳輸、提供利用等對(duì)網(wǎng)絡(luò)和信息系統(tǒng)的依賴性會(huì)大大提高。在統(tǒng)一平臺(tái)上實(shí)現(xiàn)檔案的形成、處理、移交、保存、利用等業(yè)務(wù)環(huán)節(jié)的無縫鏈接將是檔案管理的發(fā)展趨勢(shì),這無疑極大地沖擊了傳統(tǒng)線性的檔案管理方式。傳統(tǒng)的檔案收集范圍、保管方式、利用手段等方面也將隨之受到?jīng)_擊并引發(fā)變革。傳統(tǒng)紙質(zhì)檔案管理以“卷”或“件”為基本單位,比較直觀且便于操作,而在大數(shù)據(jù)時(shí)代,面對(duì)海量的檔案數(shù)據(jù),我們根本無法對(duì)其進(jìn)行立卷,只能以“件”或“數(shù)據(jù)庫”為管理對(duì)象。隨之,后續(xù)的檔案鑒定和檔案統(tǒng)計(jì)都要進(jìn)行相應(yīng)的調(diào)整,對(duì)海量的檔案數(shù)據(jù)不能再逐份鑒定,只能以項(xiàng)目、事件為單元項(xiàng)進(jìn)行宏觀鑒定;檔案統(tǒng)計(jì)也從原有的“頁”、“米”為單位改為以“GB”為檔案數(shù)據(jù)統(tǒng)計(jì)單位。大數(shù)據(jù)的到來對(duì)檔案工作的影響是廣泛而深遠(yuǎn)的,今后檔案更多的是以一種信息資源的方式融入到相應(yīng)的信息管理系統(tǒng)中,實(shí)現(xiàn)統(tǒng)一平臺(tái)的一體化管理,這必將對(duì)原有的檔案管理理念和方法帶來極大的沖擊和挑戰(zhàn)。
(二)數(shù)據(jù)的安全與隱私成難題
大數(shù)據(jù)在給人們帶來便捷獲取檔案資源的同時(shí),也在數(shù)據(jù)安全與隱私的維護(hù)上存在很大的隱患,這既有理念和技術(shù)層面上的因素,同時(shí)也涉及法律方面的問題。從國家層面上來看,帶有密級(jí)的國家檔案的泄露,會(huì)給國家造成重大的損失,嚴(yán)重的還可能危及國家安全。就公民個(gè)人而言,公民個(gè)人隱私的泄露或者被他人惡意傳播,會(huì)對(duì)個(gè)人的生活、工作帶來許多不利影響。據(jù)不完全統(tǒng)計(jì),2013年我國就有近千萬公民個(gè)人信息泄漏,造成經(jīng)濟(jì)損失高達(dá)數(shù)十億元。在面對(duì)數(shù)據(jù)的安全與隱私問題上,我們肩負(fù)三大任務(wù):一是完善各種軟硬件系統(tǒng)將安全風(fēng)險(xiǎn)降到最低程度;二是處理敏感數(shù)據(jù)過程中要設(shè)法保護(hù)數(shù)據(jù)隱私,實(shí)現(xiàn)信息的保密,解決所謂的數(shù)據(jù)隱私問題;三是在開放的數(shù)據(jù)環(huán)境下設(shè)法避免數(shù)據(jù)被惡意使用,保證合法數(shù)據(jù)在正常狀態(tài)下使用。
(三)技術(shù)挑戰(zhàn)
首先,大數(shù)據(jù)的容錯(cuò)計(jì)算相當(dāng)困難,算法也極為復(fù)雜,目前根本無法設(shè)計(jì)出絕對(duì)安全可靠的容錯(cuò)設(shè)備或軟件。檔案管理系統(tǒng)只能將失敗的概率盡可能降低到可接受的范圍,而不能完全消除,而且在這過程中系統(tǒng)的成本是要不斷增加的。其次,大數(shù)據(jù)環(huán)境下的檔案管理系統(tǒng)采用的是云計(jì)算技術(shù),云技術(shù)的優(yōu)勢(shì)在于聚集工作負(fù)載,提高資源共享度,如此一來必然導(dǎo)致檔案管理系統(tǒng)運(yùn)行成本增加,而且還會(huì)加大系統(tǒng)出現(xiàn)故障的頻率。再次,海量數(shù)據(jù)的獲取和存儲(chǔ)都需要較大的成本,當(dāng)然,獲取有價(jià)值的數(shù)據(jù)量越大,越有助于管理決策。現(xiàn)在檔案管理系統(tǒng)遇到的關(guān)鍵問題是如何鑒定和區(qū)分?jǐn)?shù)據(jù)的有用與無用,還有需要多少量的數(shù)據(jù)才能夠支撐一個(gè)正確的決策。最后,異構(gòu)數(shù)據(jù)增加了檔案管理系統(tǒng)的運(yùn)行負(fù)擔(dān)。大數(shù)據(jù)時(shí)代的檔案數(shù)據(jù)種類繁多,結(jié)構(gòu)多樣,有結(jié)構(gòu)數(shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)、半結(jié)構(gòu)數(shù)據(jù)等。結(jié)構(gòu)數(shù)據(jù)與系統(tǒng)有良好的集成性,便于系統(tǒng)的處理,而非結(jié)構(gòu)化數(shù)據(jù)則不一樣,處理非結(jié)構(gòu)化數(shù)據(jù)比較繁瑣且成本高。
無論面對(duì)的是機(jī)遇還是各種嚴(yán)峻挑戰(zhàn),我們都應(yīng)該積極應(yīng)對(duì),不失時(shí)機(jī)地將檔案工作推到一個(gè)新高度。大數(shù)據(jù)時(shí)代檔案工作是大有可為的,為此我們應(yīng)做好以下應(yīng)對(duì)措施。
(一)樹立檔案大數(shù)據(jù)意識(shí)
在信息時(shí)代,檔案工作強(qiáng)調(diào)檔案數(shù)字化,而且經(jīng)過一段時(shí)期的數(shù)字化,取得了一定成效。但是,在這一階段的數(shù)字化僅僅解決了檔案載體形式的應(yīng)用問題或者說是信息技術(shù)初步應(yīng)用于檔案管理。而在大數(shù)據(jù)時(shí)代,無論是信息管理者還是公眾用戶已不再滿足于更易于管理和共享的信息形式,而是更關(guān)注信息的價(jià)值,強(qiáng)調(diào)信息技術(shù)應(yīng)用于檔案管理領(lǐng)域所產(chǎn)生的檔案價(jià)值,從改變信息形式轉(zhuǎn)向挖掘信息價(jià)值。要完成這一轉(zhuǎn)變,就要樹立檔案大數(shù)據(jù)意識(shí),只有如此才能從海量的檔案大數(shù)據(jù)中挖掘信息價(jià)值。大數(shù)據(jù)時(shí)代對(duì)檔案的管理將會(huì)越來越深入,從信息載體形式深入到數(shù)據(jù)層面,從信息共享深入到信息價(jià)值共享,這是大數(shù)據(jù)技術(shù)框架下對(duì)數(shù)據(jù)的“流處理”模式,這也是檔案工作大環(huán)境的大勢(shì)所趨。只有樹立檔案大數(shù)據(jù)意識(shí),才能夠?qū)n案數(shù)據(jù)、檔案信息價(jià)值共享產(chǎn)生更為敏感的“嗅覺”,這對(duì)檔案工作者來說尤其重要??上驳氖?,一些檔案部門也開始形成這種意識(shí)并嘗試性地開展檔案服務(wù)工作,如,北京房山區(qū)提出“基于數(shù)據(jù)挖掘的檔案信息資源深度開發(fā)與利用”等。
(二)革新檔案管理技術(shù)
在傳統(tǒng)的檔案實(shí)體管理階段,檔案工作的直接對(duì)象就是檔案實(shí)體,檔案管理的手段與方式主要是依靠手工,諸如檔案的整理、編目、裝訂等等都是純手工的勞動(dòng)。在計(jì)算機(jī)應(yīng)用于檔案管理之后,計(jì)算機(jī)輔助檔案管理逐漸普及,計(jì)算機(jī)可以輔助檔案管理提升其管理水平,這現(xiàn)在看來只是計(jì)算機(jī)技術(shù)在檔案管理領(lǐng)域的初級(jí)應(yīng)用。隨著現(xiàn)代信息技術(shù)不斷引入檔案管理,電子文件的大量出現(xiàn),數(shù)字檔案(館)室建設(shè)也已初見成效。這讓人們?cè)桨l(fā)感到現(xiàn)代信息技術(shù)與檔案工作的密切關(guān)系。檔案管理技術(shù)的每一次變革無不都是現(xiàn)代科技進(jìn)步的驅(qū)動(dòng)。由此,要使檔案工作跟得上時(shí)代步伐,不落后于社會(huì)發(fā)展的腳步,就要求檔案工作對(duì)新技術(shù)具有相當(dāng)高的敏感度,并有選擇性的、及時(shí)的引入檔案管理領(lǐng)域。在大數(shù)據(jù)時(shí)代,檔案工作更應(yīng)該反應(yīng)迅速,積極應(yīng)對(duì)。大數(shù)據(jù)環(huán)境下的檔案管理完全可以借助云技術(shù)建立一個(gè)統(tǒng)一的檔案云平臺(tái),實(shí)現(xiàn)一體化的管理。
(三)再造檔案業(yè)務(wù)環(huán)節(jié)
整體上來看,檔案業(yè)務(wù)環(huán)節(jié)可以用“收”、“管”、“用”來概括。在大數(shù)據(jù)時(shí)代,檔案工作的收、管、用將被賦予更多內(nèi)容?!笆铡币桓囊酝鞑块T的定期移交,而是轉(zhuǎn)為對(duì)檔案數(shù)據(jù)的實(shí)時(shí)接收或自動(dòng)歸集,做到全流程控制。“管”由手工管理轉(zhuǎn)為通過統(tǒng)一的檔案云平臺(tái),實(shí)現(xiàn)檔案數(shù)據(jù)統(tǒng)一存儲(chǔ)、處理、利用,做到全技術(shù)支持?!坝谩庇商峁┍粍?dòng)的檔案查詢閱覽服務(wù)轉(zhuǎn)為主動(dòng)挖掘信息價(jià)值、分析和預(yù)測檔案用戶需求,為檔案用戶及社會(huì)提供高價(jià)值的檔案服務(wù),做到全智能服務(wù)。對(duì)檔案業(yè)務(wù)環(huán)節(jié)進(jìn)行再造,使其朝著知識(shí)管理、知識(shí)服務(wù)的方向發(fā)展,提升檔案管理在組織內(nèi)部,甚至在社會(huì)大環(huán)境中的地位,這也是大數(shù)據(jù)賦予檔案工作的新任務(wù)。
(四)自上而下建章立制
為應(yīng)對(duì)大數(shù)據(jù)給檔案工作造成的沖擊,國家層面應(yīng)該制定統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,以規(guī)范各行業(yè)業(yè)務(wù)信息管理系統(tǒng)的形成。各單位也應(yīng)在遵循國家統(tǒng)一規(guī)范的前提下,根據(jù)自身實(shí)際情況制定本單位的管理規(guī)范,加強(qiáng)組織內(nèi)部的檔案信息管理,使之更加科學(xué)化、規(guī)范化。必要時(shí)還可以借鑒或引入國際通用的相關(guān)標(biāo)準(zhǔn)規(guī)范,結(jié)合實(shí)際應(yīng)用,定期進(jìn)行檢查梳理,推進(jìn)檔案工作再上新臺(tái)階。