盧 珊
(南京大學信息管理學院 南京 210008)
暢談大數(shù)據(jù)時代檔案行業(yè)的轉(zhuǎn)型升級
盧 珊
(南京大學信息管理學院 南京 210008)
大數(shù)據(jù)時代的到來,給人類的工作生活都帶來了巨大的變化,各行各業(yè)都緊跟趨勢,希望借助大數(shù)據(jù)的力量提高自己的實力,對于檔案行業(yè)來說同樣如此。首先設想了大數(shù)據(jù)應用于檔案工作的可能性,接著提出了在大數(shù)據(jù)背景下,檔案部門應當如何實現(xiàn)轉(zhuǎn)型升級。
大數(shù)據(jù) 檔案 服務 轉(zhuǎn)型
G270.7
A
2017-09-23
早在2009年谷歌公司就可以通過大數(shù)據(jù)分析網(wǎng)上的檢索記錄,在甲型H1N1流感疫情暴發(fā)的幾周前便判斷出了病毒的傳播源頭。梅西百貨通過對大量的銷售數(shù)據(jù)進行分析,能夠根據(jù)需求和庫存的情況,對多達7300萬種貨品進行實時調(diào)價。微信中提供的城市熱力圖,能夠顯示你所在城市的實時人流聚集狀況,為你的出行提供參考。如今,大數(shù)據(jù)已經(jīng)滲透到各個行業(yè)各個領域,與我們的生產(chǎn)生活息息相關,人們對于海量數(shù)據(jù)的挖掘和運用,顛覆了我們曾經(jīng)對于數(shù)據(jù)的認識。
大數(shù)據(jù)的時代正全面爆發(fā),誰擁有了數(shù)據(jù)誰就擁有了話語權(quán)。在這樣的大背景下,檔案部門應該充分發(fā)掘自身的價值,不要身處金庫不自知。如何挖掘“檔案”這一金庫,讓死檔案變成活數(shù)據(jù),值得我們深思和探索。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征[1]。它打破了事件之間因果關系的固定格局,使相關關系的可用性浮出水面,在看似沒有關系的事件之間探索出關聯(lián),用戶只用知道是什么而不用知道為什么。例如,今日頭條會推薦讀者想讀的新聞,淘寶等購物網(wǎng)站會推薦購物者想買的商品等,這些軟件并不認識我們,但是它們卻能清楚地了解我們的喜好。羅振宇在2016年跨年演講上的一個例子,能夠讓我們更加容易理解大數(shù)據(jù)是如何工作的。假設教機器辨識出一只貓,原來的方法是通過描述貓的特征,例如貓的皮毛、眼睛的特征,通過疊加條件得出結(jié)果。但是最新的大數(shù)據(jù)技術,直接給出一百萬張貓的圖片,就是通過數(shù)據(jù)的疊加,讓機器自己去辨識貓,沒有為什么,直接給出結(jié)果。數(shù)據(jù)越多,準確性就越高。
雖然業(yè)內(nèi)對于檔案的定義并沒有一個統(tǒng)一的說法,但所表述的含義大概一致,這里采用馮惠玲、張輯哲主編的《檔案學概論》(第2版)中對檔案的定義:“檔案是社會組織和個人在社會實踐活動中直接形成的具有清晰、確定的原始記錄作用的固化信息?!卑俣劝倏浦袑?shù)據(jù)的解釋是:“數(shù)據(jù)是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質(zhì)、狀態(tài)以及相互關系等進行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號?!盵2]可見檔案與數(shù)據(jù)都屬于信息的范疇,都具有社會性、歷史性、確定性及原始記錄性等類似特征,有一定的相似性,但是檔案并不等于就是數(shù)據(jù),更不是大數(shù)據(jù)。檔案除了其包含的信息的價值,檔案本身也是有意義的,檔案的載體也是多種多樣的。而數(shù)據(jù)也絕不僅僅局限于檔案的范疇,所以檔案與數(shù)據(jù)相互包含,密切聯(lián)系。
檔案與大數(shù)據(jù)的關系不是一概而論的,從檔案的現(xiàn)狀來看,目前的檔案數(shù)據(jù)更接近于傳統(tǒng)意義上的數(shù)據(jù),不能很好地應用于大數(shù)據(jù)的使用中,然而從大數(shù)據(jù)的基本特征和本質(zhì)上來說,檔案數(shù)據(jù)又符合大數(shù)據(jù)的本質(zhì)含義;從理論層面分析,大數(shù)據(jù)應當屬于檔案范疇,而從實踐層面分析,大數(shù)據(jù)并沒有納入檔案管理的范疇[3]38??偠灾?,檔案與大數(shù)據(jù)雖有區(qū)別,但是卻有著非常緊密的聯(lián)系。
隨著計算機和信息技術的發(fā)展,檔案工作經(jīng)歷了從最初的計算機單機模式輔助檔案管理,發(fā)展到通過信息網(wǎng)絡幫助檔案業(yè)務綜合管理,再發(fā)展到當前以雙套制管理為核心的檔案信息資源管理的過程,技術的革新推動了管理手段的變革,促進了檔案事業(yè)的發(fā)展。
第一階段(從20世紀80年代末到1995年):計算機技術剛剛應用于檔案行業(yè),以目錄管理為主,主要是通過單機的方式對傳統(tǒng)紙質(zhì)檔案進行管理。
第二階段(從1996年到2005年):隨著計算機技術的不斷發(fā)展,其在檔案領域的應用越來越廣泛,從單機發(fā)展到網(wǎng)絡化的檔案綜合業(yè)務管理,從目錄管理發(fā)展到全文管理,檔案數(shù)字化逐漸發(fā)展,檔案信息資源庫的建設初見成果。
第三階段(從2006年到2015年):檔案管理發(fā)展到以電子文件管理為主,能夠借助網(wǎng)絡實現(xiàn)檔案資源的互通和共享,數(shù)字檔案館建設如火如荼。
在之前的幾次技術革新過程中,主要是對檔案的保存、管理以及提供檔案服務等環(huán)節(jié)產(chǎn)生了較大的影響,而大數(shù)據(jù)的來臨則將徹底顛覆傳統(tǒng)檔案的管理模式。由于大數(shù)據(jù)與檔案的緊密聯(lián)系,它比前面幾次技術革新更加契合檔案工作的需要,能夠幫助完成檔案從收到存到管到用的一系列工作,尤其是對于檔案數(shù)據(jù)的開發(fā)與利用,有著得天獨厚的優(yōu)勢。
從檔案本身的工作來說,大數(shù)據(jù)能夠幫助我們更好更快地解決檔案工作中的問題。目前的檔案工作除去實體檔案的保存工作以外,其他大部分都屬于信息處理的范疇,借助大數(shù)據(jù),所有的信息處理環(huán)節(jié)都可以自主實現(xiàn)。我們可以利用大數(shù)據(jù)信息處理技術,實現(xiàn)檔案的自動存儲,將電子文件直接分類歸檔,將紙質(zhì)文件中的數(shù)據(jù)進行自動提取轉(zhuǎn)變?yōu)殡娮訑?shù)據(jù),接著通過大數(shù)據(jù)實現(xiàn)電子文件的鑒定和分類,并提供檔案智能檢索服務、檔案信息定制服務、檔案信息決策服務、檔案信息跟蹤與推送服務等,所有的流程都不需要人工的干預,可以減少大量的人力物力。同時,機器完成工作的準確率和效率都是人工無法比擬的,通過這些技術手段解決傳統(tǒng)紙質(zhì)檔案在檔案管理工作中所存在的弊端。
從檔案工作的意義上來說,大數(shù)據(jù)能進一步挖掘檔案的價值,真正發(fā)揮檔案的作用。大數(shù)據(jù)技術發(fā)展到現(xiàn)在已經(jīng)比較成熟,其算法和分析工具的門檻都越來越低,掌握大數(shù)據(jù)技術的公司越來越多,而數(shù)據(jù)的意義就更加凸顯。誰掌握數(shù)據(jù),誰就有話語權(quán)。而我國還沒有形成專業(yè)的管理數(shù)據(jù)的政府機構(gòu),大數(shù)據(jù)發(fā)展至今也主要在企業(yè)內(nèi)發(fā)展和提供服務。檔案部門掌管著檔案,擁有先天的優(yōu)勢,應該解放思想,不要把檔案工作局限于管好檔案上,要看到檔案背后數(shù)據(jù)的力量,把手上掌握的檔案轉(zhuǎn)變?yōu)榭梢詣?chuàng)造生產(chǎn)力的數(shù)據(jù),從而為政府提供更多的決策依據(jù),為老百姓提供各種民生服務,成為能夠為國家管理數(shù)據(jù)的專業(yè)機構(gòu)。
要促使檔案行業(yè)轉(zhuǎn)型升級,首先思想觀念必須轉(zhuǎn)變,要擺脫之前固有的檔案思維,用全新的視角去審視檔案部門掌握的檔案資源,把死的檔案轉(zhuǎn)變成活的數(shù)據(jù),用大數(shù)據(jù)的思維去思考工作中的每個步驟。運用相關關系的并聯(lián)思維來思考檔案工作,不僅要考慮已經(jīng)有的檔案數(shù)據(jù)的聯(lián)系,還要考慮館藏以外的檔案數(shù)據(jù)的聯(lián)系。下面我將從三個方面探討檔案部門在大數(shù)據(jù)的背景下該如何轉(zhuǎn)變自己的角色。
1.檔案資源是根本。目前,我國各級檔案部門保存的數(shù)據(jù)量與“大數(shù)據(jù)”的數(shù)據(jù)級別還存在一定差距,其中電子文件的數(shù)量尤其不足,要發(fā)揮“大數(shù)據(jù)”的優(yōu)勢,就必須擴充檔案資源。以前由于人力物力等條件的制約,征集到檔案部門的資源都會進行一定的取舍,而如果重新審視檔案部門的工作意義,重新定位檔案資源的價值,則檔案的管理范圍必將擴大。大數(shù)據(jù)時代,一切具有保存價值的文件、數(shù)據(jù)、視頻、實物都應被視為檔案[4]70。對于各個單位內(nèi)部的檔案,檔案行政管理部門要加強引導,做好檔案的整合,讓之前許多被忽略的數(shù)據(jù)資源得到重視,納入檔案管理的范疇。例如醫(yī)院類的檔案,需要大量的病歷進行資源整合,僅靠一家醫(yī)院的一己之力是無法實現(xiàn)的,需要跨醫(yī)院、跨部門進行資源整合,但是沒有單位牽頭很難實現(xiàn),檔案行政管理部門可以擔任這個組織牽頭的角色,幫助更多的行業(yè)做好數(shù)據(jù)整合歸類。
2.技術介入是關鍵。大數(shù)據(jù)雖然已經(jīng)發(fā)展得比較成熟,但在檔案行業(yè)的應用還是一個全新的開始,僅靠檔案部門的一己之力是無法實現(xiàn)的。一方面要引進專業(yè)型人才,培養(yǎng)出懂技術又懂檔案的復合型人才,另一方面要加強與外部公司的深度合作,借助他們已經(jīng)成熟的技術和管理模式,打造檔案里的大數(shù)據(jù)。合作的形式應該豐富多樣,既可以以外包的形式請科技公司直接介入檔案工作,也可以以項目合作的方式,共同運用檔案中的數(shù)據(jù)實現(xiàn)各種服務。以杭州的交通管理為例,杭州市公安局交警支隊與數(shù)夢工場合作,利用已有的交通數(shù)據(jù)、公安數(shù)據(jù)等,建設交通管理大數(shù)據(jù)平臺,基于數(shù)據(jù)分析提供決策支持,從而大幅提升了杭州道路交通通行能力。
3.執(zhí)法監(jiān)督是保障。大數(shù)據(jù)的應用勢必會產(chǎn)生利益,而利益的驅(qū)動就容易滋生出一些違法行為,所以必須完善相關法律法規(guī),增加檔案法律法規(guī)、知識產(chǎn)權(quán)法律法規(guī)中相關的條例,明確各部門的職責,對大數(shù)據(jù)應用過程中可能出現(xiàn)的問題進行規(guī)避,保障數(shù)據(jù)安全和個人隱私不被泄露。另外,雖然《檔案法》中明確了檔案行政管理部門擁有哪些執(zhí)法權(quán),但是實際工作中檔案行政管理部門對各單位、企業(yè)、機關的檔案部門也主要是業(yè)務指導關系,面對大數(shù)據(jù)時代的到來,這些執(zhí)法權(quán)遠遠無法滿足數(shù)據(jù)監(jiān)管的需要。要把好數(shù)據(jù)關,就需要拓寬檔案行政管理部門的執(zhí)法范圍和權(quán)限,對于可能涉及個人知識產(chǎn)權(quán)和隱私的數(shù)據(jù)進行監(jiān)督和干預,讓檔案行政管理部門成為數(shù)據(jù)的守門員。
雖然大數(shù)據(jù)的到來已經(jīng)是一個不折不扣的現(xiàn)實,但將大數(shù)據(jù)應用到檔案工作中還停留在理論階段,下一步如何緊扣熱點,運用最新技術,實現(xiàn)檔案工作的轉(zhuǎn)型仍有待各位檔案同仁的努力。
[1]百度百科.大數(shù)據(jù)[EB/OL].https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=aladdin.
[2]百度百科.數(shù)據(jù) [EB/OL].https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE/5947370.
[3]鄭金月.關于檔案與大數(shù)據(jù)關系問題的思辨[J].檔案學研究,2016(6):37-40.
[4]許桂清.大數(shù)據(jù)背景下的檔案行業(yè)發(fā)展[J].中國檔案,2015(6):70-71.
On the Transformation and Upgrading of Archives Industry in the Context of Big Data
Lu Shan
(Information Management Department of Nanjing University,Nanjing 210008,China)
The arrival of the big data era has brought great changes to people's work and life,and all walks of life follow the trend in hope of improving its strength through big data,which is also true of archives industry.First the possibility of applying big data to archives is assumed,and then how to realize the transformation and upgrading of the archives department in the context of big data is discussed.
big data;archives;service;transformation
盧珊,南京大學信息管理學院檔案學專業(yè)碩士,江蘇省檔案局(館)助理館員,研究方向為檔案信息化服務。