李江瑤 崔旭
(西北大學(xué)公共管理學(xué)院 陜西西安 710127)
2008年,《科學(xué)》雜志上發(fā)表文章《Big Data:Science in the Petabyte Era》,此后,“大數(shù)據(jù)”一詞開始廣泛傳播。一般意義上, 大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合,其特點可以總結(jié)為4個V, 即Volume (體量浩大)、Variety (模態(tài)繁多) 、Velocity (生成快速) 和Value (價值巨大但密度很低)[1],而其組成要素則是開放、在線、關(guān)聯(lián)。由大體量數(shù)據(jù)推動的數(shù)據(jù)計算、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)安全、可視化等理論與技術(shù)當(dāng)中蘊含的關(guān)于數(shù)據(jù)的科學(xué),即是我們所稱的數(shù)據(jù)科學(xué)。檔案學(xué)作為信息管理學(xué)科的重要組成部分,數(shù)據(jù)科學(xué)的發(fā)展勢必給我們學(xué)科的理論與實踐帶來巨大影響。由此,筆者統(tǒng)計了近5年檔案類中文核心期刊(2017)的文章以及國家社會科學(xué)基金項目,探究數(shù)據(jù)科學(xué)驅(qū)動下檔案學(xué)的研究熱點及動態(tài)[2-4]。
本文選取中國學(xué)術(shù)期刊網(wǎng)CNKI期刊全文數(shù)據(jù)庫,以刊名為檢索對象,檢索檔案學(xué)核心期刊《檔案學(xué)研究》、《檔案學(xué)通訊》、《中國檔案》、《檔案管理》、《檔案與建設(shè)》、《浙江檔案》、《北京檔案》自2014年1月1日至2019年6月13日發(fā)表的論文,共計10990篇,剔除會議通知、學(xué)會簡介、征稿啟事等無關(guān)文章后,獲得有效論文9722篇。本文將下載的題錄信息采用ROST CM6進行預(yù)處理后,對文章標(biāo)題進行了分詞及詞頻分析。
標(biāo)題分詞使用了ROST CM6自帶的分詞詞表,并輔以筆者自己整理的檔案學(xué)常見關(guān)鍵詞表,整理出了檔案學(xué)核心期刊詞頻前100的關(guān)鍵詞(見表1)。筆者利用ROST CM6中的社會網(wǎng)絡(luò)與語義網(wǎng)絡(luò)分析功能,選取了詞頻前150位的關(guān)鍵詞,使用NetDraw繪制了語義網(wǎng)絡(luò)圖(見圖1)。
表1 檔案學(xué)核心期刊標(biāo)題詞頻前100的關(guān)鍵詞
筆者又以全國哲學(xué)社會科學(xué)工作辦公室官網(wǎng)公布的2014至2018各年度《國家社科基金重大項目立項名單》、《國家社科基金年度項目、青年項目和西部項目立項名單》為檢索來源,以“檔案”、“文件”、“記錄”、“歸檔”、“政府”、“政務(wù)”為關(guān)鍵詞,共檢索出了2014至2018年檔案學(xué)立項106項。筆者將其著錄信息導(dǎo)入Excel表格,并使用ROST CM6對其標(biāo)題進行分詞與詞頻統(tǒng)計,詞頻前30位的詞匯排列如下(見表2),又以NetDraw繪制了語義網(wǎng)絡(luò)圖(見圖2)。
表2 2014—2018國家社科基金項目詞頻前30位的詞匯
由此可見,國家社科立項項目的關(guān)注重點與核心期刊的發(fā)文重點基本符合,除了傳統(tǒng)的“保護”、“服務(wù)”、“歸檔”、“檔案法”、“信息資源”之類的長期研究主題,還聚焦于“大數(shù)據(jù)”、“數(shù)據(jù)”、“數(shù)字”、“數(shù)字檔案”、“媒體”、“社交媒體”、“電子文件”等與計算機技術(shù)緊密相連的主題。將期刊論文與基金項目進行比較,發(fā)現(xiàn)國家社科基金項目對于技術(shù)前沿的嗅覺更加敏銳,更善于對新興技術(shù)領(lǐng)域進行探索,受到數(shù)據(jù)科學(xué)的影響也更加明顯。
通過上述的詞頻分析、語義網(wǎng)絡(luò)繪制,加之對相同主題的論文與項目的聚類,筆者總結(jié)出在數(shù)據(jù)科學(xué)的推動下,檔案學(xué)近五年的研究熱點如下:
2008年大數(shù)據(jù)這一概念提出,2011年起研究熱度漸升,近五年以大數(shù)據(jù)為背景的研究依然熱度不減。檔案學(xué)領(lǐng)域研究的大數(shù)據(jù)主要是網(wǎng)絡(luò)環(huán)境中的大數(shù)據(jù),它有多源異構(gòu)、交互性、時效性、社會性、突發(fā)性和高噪聲等特性, 不僅非結(jié)構(gòu)化數(shù)據(jù)多, 而且數(shù)據(jù)的實時性強, 大量數(shù)據(jù)都是隨機動態(tài)產(chǎn)生的。鄭金月[5]、何嘉蓀[6]以思辨的方式從大數(shù)據(jù)的本質(zhì)、檔案是不是大數(shù)據(jù)、大數(shù)據(jù)是不是檔案、“檔案大數(shù)據(jù)”的內(nèi)涵等方面解讀了檔案與大數(shù)據(jù)的關(guān)系;安小米[7]、楊來青[8]、陶水龍[9]、肖秋會[10]宏觀上講述了大數(shù)據(jù)在檔案領(lǐng)域的應(yīng)用現(xiàn)狀與發(fā)展趨勢、數(shù)字檔案資源整合、社會化媒體信息挖掘、檔案信息化建設(shè)、信息安全等方面的問題;談清輝[11]、顧寧紅[12]、張婉瑩[13]、顧珂[14]等針對科技檔案、城建檔案、會計檔案、人事代理檔案等專門檔案領(lǐng)域展開研究;于英香[15]則另辟蹊徑,對檔案學(xué)的大數(shù)據(jù)研究熱進行了冷思考,得出了大數(shù)據(jù)時代檔案信息化建設(shè)應(yīng)在創(chuàng)新中堅守傳統(tǒng)的結(jié)論。國家社科基金項目方面,近五年有十個項目立項,覆蓋了大數(shù)據(jù)環(huán)境的檔案管理理論、治理體系、平臺構(gòu)建、服務(wù)創(chuàng)新等諸多方面。
此外,大數(shù)據(jù)時代的編研工作創(chuàng)新受到了格外的重視。檔案的開發(fā)利用、編研是檔案館工作的最終目的和重要組成部分。大數(shù)據(jù)時代,不僅數(shù)據(jù)來源拓寬,支撐研究的硬件系統(tǒng)與應(yīng)用軟件也能輔助檔案工作人員進行更高效、更有深度的編研。李莉[16]、阮發(fā)俊[17]、王永梅[18]等對信息時代編研工作的發(fā)展趨勢、管理體系構(gòu)建、編研與開發(fā)方式進行了闡述;黃夏基[19]從“恒”與“變”的視角,結(jié)合實踐中的案例和數(shù)據(jù),分析了檔案編研的主體、客體、行為和成果產(chǎn)生的變化,但仍面臨檔案編研成果界定、檔案編研成果重“編”輕“示”、經(jīng)濟效益低下的問題。
社交媒體的廣泛應(yīng)用使得官方政務(wù)微博、微信開始遍地開花,社交媒體中的信息也更加具備了存檔價值。因此,對社交媒體檔案部門對社交媒體的利用研究以及社交媒體中信息的歸檔范圍和標(biāo)準(zhǔn)的確定兩大類型。張江珊[20]、蔡明娜[21]等作者對國外檔案部門應(yīng)用方式、狀況等進行了概述;高晨翔[22]、蔣冠[23]、何思源[24]等作者則對社交媒體檔案的定位、歸檔、保存、鑒定、管理策略等全過程進行了探討。近三年國家社科基金項目亦有五項針對于社交媒體歸檔、管理、資源聚合等方面展開研究。
數(shù)據(jù)時代,不僅是檔案類型拓展到文本之外的圖像、音頻和視頻等,檔案的來源平臺也已經(jīng)不止于紙質(zhì)檔案的收集,而是擴展到了電子文件、政務(wù)網(wǎng)站、社交媒體、機構(gòu)數(shù)據(jù)庫等多平臺。因此,需要把各種類型文件、各個平臺的數(shù)據(jù)進行有效的整合勢在必行。梁孟華[25]、呂元智[26]兩位學(xué)者依托其國家社科項目對數(shù)字檔案資源跨媒體、跨平臺的知識集成、語義關(guān)聯(lián)、資源架構(gòu)、檢索框架等方面進行了全面的探討。
信息載體從紙質(zhì)轉(zhuǎn)向電子之后,數(shù)字載體、網(wǎng)絡(luò)環(huán)境下的信息安全保障也是一個新的研究重點。國家社科基金項目有三項專門針對數(shù)字檔案風(fēng)險治理與生態(tài)安全的研究。在期刊論文方面,高晨翔[27]、吳曉紅[28]、管先海[29]等從檔案館的層面出發(fā),從宏觀角度對其安全體系建設(shè)、評估進行研究;孫大東[30]、白茹花[31]、袁雙云[32]等使用區(qū)塊鏈等手段,對電子文件保密性、憑證性、流轉(zhuǎn)中的安全控制進行了研究;聶云霞[33]則對數(shù)字檔案用戶信息安全保障問題加以關(guān)注。他們之中的共性認識即信息安全的關(guān)鍵是在檔案管理的全過程中就進行安全控制,而非事后再來彌補。
傳統(tǒng)互聯(lián)網(wǎng)時代, 人們主要使用PC機來獲取信息資源和相關(guān)服務(wù)。如今,移動互聯(lián)網(wǎng)時代,移動通信、無線網(wǎng)絡(luò)等移動網(wǎng)絡(luò)技術(shù)迅速發(fā)展,手機、平板電腦等終端極大普及,開展移動服務(wù)是順應(yīng)潮流的有益探索。黃麗華[34]、王協(xié)舟[35]對當(dāng)前檔案部門使用微信、手機APP等移動服務(wù)的現(xiàn)狀進行了調(diào)查;薛辰[36]、劉春年[37]、王曉雪[38]對移動檔案館服務(wù)方式、服務(wù)體系、實現(xiàn)功能等進行了框架構(gòu)建;國家社科項目也對檔案信息服務(wù)與移動數(shù)據(jù)終端的融合進行了研究。
物聯(lián)網(wǎng)是一個基于互聯(lián)網(wǎng)、傳統(tǒng)電信網(wǎng)等信息承載體,讓所有能夠被獨立尋址的普通物理對象實現(xiàn)互聯(lián)互通的網(wǎng)絡(luò)[39]。物聯(lián)網(wǎng)技術(shù)的核心和基礎(chǔ)仍然是互聯(lián)網(wǎng)技術(shù),它是一種在互聯(lián)網(wǎng)技術(shù)基礎(chǔ)上延伸和拓展的網(wǎng)絡(luò)技術(shù),它將互聯(lián)網(wǎng)技術(shù)的終端由傳統(tǒng)的信息技術(shù)設(shè)備延伸和擴展到了任意物體,并使任意物體之間可以通訊[40]。具體在檔案學(xué)領(lǐng)域,學(xué)者們將物聯(lián)網(wǎng)技術(shù)與檔案館建設(shè)相結(jié)合,搭建出一套智能檔案館的構(gòu)建體系。楊智勇[41]提出檔案館提供的“智慧服務(wù)”應(yīng)是網(wǎng)絡(luò)化、感知化、系統(tǒng)化和智能化的服務(wù);陳勇[42]指出了檔案自動入庫、智能調(diào)節(jié)庫房環(huán)境、智能化追蹤管理、安全防盜自動報警等能使物聯(lián)網(wǎng)技術(shù)融入到檔案管理實踐當(dāng)中;另有學(xué)者將檔案館建設(shè)置于智慧城市、智慧養(yǎng)老的大背景下進行探討,并引入了人工智能、邊緣計算等新技術(shù)、新理論發(fā)展智慧檔案館的技術(shù)與實踐。三項國家社科基金項目研究對物聯(lián)網(wǎng)環(huán)境下檔案信息化以及資源建設(shè)進行了新的思考。
在數(shù)據(jù)科學(xué)的推動之下,檔案學(xué)的研究視野越來越寬,不止于文件領(lǐng)域的管理,而是將目光投射于更廣闊的網(wǎng)絡(luò)平臺、數(shù)據(jù)環(huán)境。檔案服務(wù)不停留于檔案館當(dāng)中,走向了網(wǎng)絡(luò)服務(wù)、社交媒體、移動終端,越來越想走進尋常百姓的生活。傳統(tǒng)檔案學(xué)研究主要是面向資源的研究,現(xiàn)如今,電子商務(wù)等領(lǐng)域推出了更多面向用戶的服務(wù)之后,也更加激發(fā)了檔案學(xué)的服務(wù)意識,檔案領(lǐng)域?qū)τ谟脩舻难芯恳查_始跟進,更加注重面向用戶的優(yōu)化服務(wù),在“管”“用”關(guān)系的平衡之間向著便于社會公眾利用的方向邁進。
身處于這樣一個技術(shù)領(lǐng)域發(fā)生著巨變的時代,盲目追求新技術(shù)與執(zhí)著固守老觀念,二者都不可取?;蛟S認清發(fā)展潮流,找到技術(shù)前沿與檔案學(xué)最恰當(dāng)?shù)钠鹾宵c,取長補短充實檔案學(xué)理論與實踐,才能在保持本學(xué)科相對獨立性的基礎(chǔ)上實現(xiàn)檔案學(xué)在數(shù)據(jù)科學(xué)時代的融合性、跨越式發(fā)展。