張琦 蔣冠
摘要:數(shù)字檔案資源建設已成為檔案界關(guān)注的熱點問題,目前國內(nèi)外已有較多研究成果。對有關(guān)此熱點問題的代表性研究進行綜述,梳理其研究主題,總結(jié)其研究特點,找出其存在的問題并加以思考,以期對我國數(shù)字檔案資源建設后續(xù)研究有所裨益。
關(guān)鍵詞:數(shù)字檔案資源電子文件數(shù)字館藏
Abstract:The construction of digital archival re? sources, in which many achievements have been made, has become a hot issue in archival circle re? cently. In order to tease out the theme and character? istics, and also, to point out the shortcomings, this pa? per made a review of the representative research both in China and abroad. Moreover it made reflec? tion on the direction of this area to provide reference for our digital archival resources construction re? search.
Keywords:Digital archival resource;Digital re? cords;Digital collection
所謂信息資源建設,就是人類對處于無序狀態(tài)的各種媒介信息進行選擇、采集、組織和開發(fā)等活動,使之形成可利用的信息資源體系的全過程。[1]數(shù)字信息資源與固化在傳統(tǒng)載體上的信息資源相比,在傳播與利用上有著不可比擬的優(yōu)勢。開展數(shù)字檔案資源建設,使館藏檔案資源突破時空限制,變“被動提供”為“主動挖掘”,以提高利用率。隨著檔案數(shù)字化工作的推進、電子文件的大量增長,以及用戶信息利用需求的日趨多樣化,如何科學有效地進行數(shù)字檔案資源建設已成為檔案事業(yè)發(fā)展的重點問題。本文從數(shù)字檔案信息資源基礎建設、數(shù)字檔案資源服務平臺構(gòu)建以及涉及資源建設的其他問題這三個方面,對國內(nèi)外關(guān)于數(shù)字檔案資源建設的代表性研究進行綜述分析。
一、國內(nèi)外文獻載文情況
國外關(guān)于數(shù)字檔案資源建設的研究起步較早,20世紀90年代歐美各國圖情檔等信息機構(gòu)就先后開展了多個數(shù)字資源建設項目??紤]到中英學術(shù)術(shù)語的表達差異,筆者于2014年12月24日通過Google學術(shù)搜索引擎,以不同的題名在2001~2014年度范圍內(nèi)進行檢索,具體結(jié)果見表1。經(jīng)人工剔除弱相關(guān)文獻后,共收集到具有代表性的國外數(shù)字檔案資源研究成果121篇,主要發(fā)表于《Library Trends》、《The Electronic Library》、《Li? brary Resources & Technical Services》、《Information Management Journal》等期刊。相較而言,我國在數(shù)字檔案信息資源建設方面的研究發(fā)展較晚。筆者于2014年12月28日,利用CNKI數(shù)據(jù)庫,以“數(shù)字檔案資源建設”或含“檔案數(shù)字化建設”為組合檢索詞,以主題為路徑進行檢索,得到2001~2014年國內(nèi)數(shù)字檔案資源建設相關(guān)領(lǐng)域研究文獻結(jié)果1611條,見圖1。
二、研究內(nèi)容分析
筆者對所檢索的文獻中涉及主題進行歸納分析后發(fā)現(xiàn),國外在數(shù)字檔案資源建設領(lǐng)域的研究從基礎層面,如數(shù)字圖書館的構(gòu)建條件、數(shù)字檔案資源的可持續(xù)管理框架、數(shù)字資源效益分析、信息素養(yǎng)教育等,逐漸向資源整合、數(shù)據(jù)長期存取等應用層面轉(zhuǎn)變。國內(nèi)則涉及多個細節(jié)問題,如數(shù)字檔案館的形成條件、檔案數(shù)字化歸檔系統(tǒng)的構(gòu)建、電子出版物、電子郵件、網(wǎng)上檔案遺產(chǎn)、數(shù)字檔案館與實體檔案館之間的關(guān)系、檔案數(shù)字化建設法規(guī)、數(shù)字化環(huán)節(jié)中的知識產(chǎn)權(quán)等。
(一)數(shù)字檔案資源基礎建設研究
1.數(shù)字化建設的原則。數(shù)字檔案資源建設是一項涉及多方面內(nèi)容的系統(tǒng)工程,除了在源頭上控制數(shù)字檔案,即加強電子文件歸檔和電子檔案的規(guī)范化管理外,各檔案館館藏檔案的數(shù)字化建設是核心工作。為了確保館藏檔案數(shù)字化的科學性,必須明確其建設原則。典型觀點如表2所示。目前普遍認同的是實用性原則,即根據(jù)定期的統(tǒng)計數(shù)據(jù),優(yōu)先選擇利用率較高的館藏檔案進行數(shù)字化。[9]另外,也有學者提出按照特殊載體檔案優(yōu)先、珍貴檔案優(yōu)先、高危檔案優(yōu)先、利用率高檔案優(yōu)先、共享性強檔案優(yōu)先的原則,[10]加快對傳統(tǒng)載體檔案數(shù)字化的觀點。
表2國內(nèi)外有關(guān)檔案數(shù)字化建設原則的代表性觀點
2.數(shù)字檔案資源采集范圍。各國檔案館館藏資源的迅速增長,一方面是社會經(jīng)濟的發(fā)展造就,另一方面則是由于檔案部門偏重館藏的管理理念、文牘主義式管理手段,造成了館藏檔案來源的冗余。[11]建成優(yōu)質(zhì)的館藏數(shù)字資源庫需要從源頭上明確檔案數(shù)字化的范圍。20世紀,Rainer曾論述了圖書館對于德語國家工人階級文化信息的收集。[12]美國國會圖書館牽頭建設的“美國記憶”工程內(nèi)容定位于美國歷史、文化和立法等方面。[13]Debo? ra[14]認為在法律允許范圍內(nèi),高校圖書館出于幫助決策,應以多種形式收集政府信息。李廣建等則指出數(shù)字資源的范圍應逐步擴展至網(wǎng)絡數(shù)據(jù)庫、網(wǎng)頁、文件等結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化信息資源。[15]現(xiàn)今常用的采集范圍包括本館傳統(tǒng)館藏檔案、各立檔單位檔案、具有檔案性質(zhì)的行業(yè)、專題信息資源庫、互聯(lián)網(wǎng)上具有檔案價值的信息。
3.數(shù)字檔案資源長期保存。數(shù)字信息的長期保存的關(guān)鍵在于技術(shù)淘汰的高速率。[16]如何推進數(shù)字資源長期保存工作規(guī)范化、規(guī)模化,改善保存工具性能,成為各國著力思考的問題。1996年,RLG(Research Li? brary Group,圖書館研究小組)和CLIR(Council on Li? brary and Information Resources,圖書館與信息資源委員會)等機構(gòu)就對數(shù)字資源保存進行了技術(shù)限制、保存對象擴展、保存機構(gòu)、保存政策制定等范例研究。[17]目前,加拿大InterPARES項目、英國數(shù)字保存聯(lián)盟項目、美國數(shù)字信息資源保存項目等研究成果均可供參考借鑒。出于節(jié)省保存成本的考慮,一些機構(gòu)還參考了Shelby Sannet、Brian Lavoie等學者構(gòu)建的長期保存框架和操作流程。[18]目前公認的四種長期保存方法是拷貝、遷移、虛擬仿真和硬件留存。此外還有學者提出過再生性技術(shù)保護[19]的方法。
4.數(shù)字檔案資源整合。國外數(shù)字檔案資源有多種整合方式,典型性的模式[20]見表3。國內(nèi)學者提出的整合構(gòu)想有:“建立由國家中心、省級分中心、基層中心組成的整合與共享體系[21]”、“合理規(guī)劃國家檔案資源的流向,以發(fā)展國家綜合檔案館為重點[22]”、“關(guān)注整合建設的方向和導向性問題,積極的以共享、效率為導向,加強成本—效益分析[23]”、“通過IT服務集約化將集成管理思想應用到現(xiàn)代檔案管理[24]”、“組建數(shù)字檔案信息資源總庫[25]”等。從檔案資源整合方面的文獻數(shù)量和研究課題來看,實現(xiàn)數(shù)字檔案資源信息整合程度的高低,已引起廣泛關(guān)注。
(二)數(shù)字檔案資源服務平臺建設研究
數(shù)字檔案資源建設除了對檔案信息資源本身的重視外,構(gòu)建良好的檔案信息平臺,提供利用是其最終目的。國內(nèi)外在該方面有多種視角,如檔案工作人員服務素質(zhì)、[26]檔案館提供利用的組織方式方法、利用效益的獲得等。檔案網(wǎng)站是檔案部門提供電子化管理和服務的窗口,所以這部分內(nèi)容主要從檔案網(wǎng)站的構(gòu)建角度進行綜述。20世紀90年代,國外檔案界就已經(jīng)大規(guī)模地建立起檔案網(wǎng)站。我國最初建立檔案網(wǎng)站是在1996年,繼北京市檔案館的首次嘗試后,檔案網(wǎng)站逐漸興起。
1.國內(nèi)檔案網(wǎng)站的建設現(xiàn)狀。至2014年年底,筆者通過百度、搜狐、雅虎等門戶網(wǎng)站進行搜索,能實現(xiàn)有效鏈接的各類檔案網(wǎng)站已超過400個??梢灶A見,隨著檔案網(wǎng)站數(shù)量的增加,網(wǎng)站建設成效日益顯著。[27]但現(xiàn)有網(wǎng)站建設仍有不足。首先,網(wǎng)站建設發(fā)展水平具有不平衡性。一是東西部或南北方差距明顯。各省市級檔案部門建立的檔案網(wǎng)站中,東部發(fā)達地區(qū)比例為87.31%,而西部只有12.69%;同理,經(jīng)濟較發(fā)達的南方沿海地區(qū)數(shù)量比例為75.62%,北方僅24.38%;[28]二是檔案機構(gòu)之間差距較大。我國縣級檔案機構(gòu)建設水平遠不如省市級;三是我國綜合性檔案館建設的數(shù)量和質(zhì)量明顯高于專業(yè)檔案館;而在專業(yè)檔案館中,高校檔案館、城建檔案館覆蓋率高于企業(yè)檔案館覆蓋率。[29]其次,檢索系統(tǒng)不完善,檔案網(wǎng)站的用戶體驗度不高。一是數(shù)據(jù)庫資源不豐富;二是檢索技術(shù)的不健全。我國大部分的檔案門戶網(wǎng)站的檢索工具開發(fā)水平不高,生成的信息檢索工具相對簡單,甚至連模糊檢索功能都不能實現(xiàn)。再次,網(wǎng)站信息構(gòu)建形式不合理。(1)網(wǎng)頁界面設計單調(diào)。目前國內(nèi)大多檔案網(wǎng)站主要以文本為主要載體提供信息服務,版式設計上大多為上下或左右分欄,不能充分利用圖標文字美化頁面。(2)網(wǎng)站欄目內(nèi)容不合理。欄目設置簡單,特色檔案、民生檔案、家族檔案或生活服務信息欠缺。最后,網(wǎng)站信息服務被動。內(nèi)容更新不及時,部分內(nèi)容滯后陳舊;后期維護欠缺,“重建設、輕管理”;溝通互動不積極,“互動門檻高、互動途徑貧乏、互動反饋欠缺”。
2.國外檔案網(wǎng)站建設的啟示。依據(jù)第三方網(wǎng)絡流量統(tǒng)計機構(gòu)Alexa的統(tǒng)計,中國國家檔案局、中國國家圖書館、北京、上海等省級檔案館網(wǎng)站在全球網(wǎng)站的月平均排名約在兩百萬名左右,另據(jù)NARA數(shù)據(jù)顯示,英美等國的主要檔案網(wǎng)站網(wǎng)絡流量統(tǒng)計月平均排名幾乎就已經(jīng)保持在三萬名以內(nèi)。根據(jù)我國對國外檔案網(wǎng)站研究成果的描述,可以發(fā)現(xiàn)國外檔案網(wǎng)站有著頁面布局新穎、內(nèi)容豐富更新快、檢索工具現(xiàn)代化、數(shù)據(jù)庫龐大、互動功能健全等優(yōu)點。(1)體現(xiàn)檔案網(wǎng)站的特色性。檔案網(wǎng)站建設反映館藏特色和地區(qū)文化特征、網(wǎng)站的特色體現(xiàn)在網(wǎng)站資源的儲備上。國內(nèi)應給予重視,加大在線檔案資源的數(shù)字化程度,提高數(shù)字檔案全文開放的比重。[30](2)強化網(wǎng)站構(gòu)建的技術(shù)性。最大限度地實現(xiàn)各檔案館的技術(shù)和智力資源共享,尤其是在檢索系統(tǒng)的開發(fā)方面,滿足不同用戶的多樣化查詢需求。例如,在國外檔案館網(wǎng)站中盛行的RSS,在國內(nèi)網(wǎng)站建設中尚未應用。(3)重視用戶需求的導向性。國外網(wǎng)站普遍以人為本,重視網(wǎng)站內(nèi)容定位。
(三)數(shù)字檔案資源建設中的其他問題
除了上述數(shù)字檔案資源的基礎建設和服務利用平臺構(gòu)建的研究外,國內(nèi)外學者還關(guān)注了諸如數(shù)字檔案資源效益分析、數(shù)字檔案風險管理、數(shù)字化信息鏈接、電子檔案出版、網(wǎng)上檔案遺產(chǎn)、災難及其恢復、數(shù)字檔案館與實體檔案館之間的關(guān)系、檔案數(shù)字化建設法規(guī)、數(shù)字化環(huán)節(jié)中的知識產(chǎn)權(quán)等數(shù)字檔案資源建設的相關(guān)問題。其中,尤以探討數(shù)字檔案建設過程中涉及的法律法規(guī)這類問題的文獻數(shù)量較多。例如,數(shù)字化建設過程中產(chǎn)生的關(guān)于檔案法律效力問題一直是學術(shù)界關(guān)注的焦點。數(shù)字檔案的不穩(wěn)定性、信息與特定載體之間的可分離性等特點,導致檔案容易失真。因其法律效力和憑證作用降低而難以成為合法有效的證據(jù)。所以,在數(shù)字檔案資源建設中,充分貫徹前端控制和全程管理思想、保證檔案形成背景和元數(shù)據(jù)的完整性至關(guān)重要。又如,數(shù)字檔案信息在網(wǎng)絡傳輸、利用過程中產(chǎn)生的網(wǎng)絡傳輸權(quán)問題。將數(shù)字檔案“搬”上網(wǎng)絡平臺,能夠?qū)崿F(xiàn)檔案信息資源的共享,將檔案的價值最大化,但是檔案網(wǎng)絡傳輸權(quán)的歸屬問題往往被忽視。再如,數(shù)字化建設中涉及的隱私權(quán)、著作權(quán)問題。數(shù)字化檔案建設中,不加注意便會造成信息泄露或侵權(quán)行為。網(wǎng)絡環(huán)境下,檔案信息數(shù)字化傳播中,對隱私權(quán)的侵犯表現(xiàn)為非法搜集、盜取、加工、傳播、利用檔案數(shù)據(jù)。
三、結(jié)語
總體看來,國內(nèi)外在數(shù)字檔案資源建設研究領(lǐng)域的熱點大體一致,只是在表達上略有差異,國外相關(guān)文獻偏向于將圖書館與檔案館數(shù)字資源建設視為一體,而國內(nèi)則嚴格區(qū)分了二者。值得注意的是,雖然我國數(shù)字檔案資源建設已進行多年,相關(guān)論文發(fā)表數(shù)量呈穩(wěn)中有升趨勢,研究內(nèi)容涵蓋基礎設施、標準規(guī)范、安全保障、人才建設等多個方面,但大多數(shù)研究成果都存在內(nèi)容交叉重復、缺乏創(chuàng)新性等問題。從目前我國研究狀況看,形成一個完整的數(shù)字檔案資源理論體系尚不可能,相關(guān)研究局限于從宏觀層面對數(shù)字檔案資源建設進行闡述,缺乏權(quán)威性和系統(tǒng)性。系統(tǒng)的建設指南、可操作的技術(shù)方案、安全保障條件、高效便捷的服務體系等方面有待學術(shù)界深入研究。
*本文為國家社科基金青年項目“質(zhì)量導向型數(shù)字檔案資源建設模式研究”(批號:12CTQ041)與“基于檔案部門視角的存檔網(wǎng)絡信息采集模式研究”(項目編號:12CTQ039)的研究成果之一。
注釋及參考文獻:
[1]肖希明.信息資源建設的變革與發(fā)展[M].北京:國家圖書館出版社,2010:161-162.
[2]Alexa.T,Marie.E.Principles for digital library development[J].Communications of the ACM.2001(5): 48-54.
[3]王健.關(guān)于檔案數(shù)字化優(yōu)化模式的探討——檔案數(shù)字化對象之優(yōu)化鑒選[J].檔案學通訊,2007(1):55-58.
[4]羅顯明.淺談在檔案數(shù)字化中應遵守的基本原則[J].蘭臺世界,2010(12):141.
[5]方毓寧.館藏檔案數(shù)字化十原則[J].中國檔案,2004(1):38.
[6]卞咸杰.檔案數(shù)字化建設中應遵循的原則[J].檔案時空,2006(12):29.
[7]崔玉海.館藏檔案數(shù)字化要堅持的四項原則[J].山東檔案,2006(5):29-30.
[8]潘積仁.檔案資源建設:原則實踐策略[J].中國檔案,2009(7):16-18.
[9]Peter Michel.Digitizing special collections: to boldly go where weve been before[J].Library Hi Tech,2005(3): 379 - 395.
[10][25]金波,丁華東.數(shù)字檔案信息資源的協(xié)調(diào)與競爭[J].浙江檔案2013(9):11-13.
[11][22]傅華.國家檔案資源建設研究[J].檔案學通訊,2005(5):41-43.
[12]Rainer Noltenius.A Class and its Culture:A Spe? cial Library in the Ruhr [J].New Library World,2009(3): 135-147.
[13]馮惠玲.檔案記憶觀、資源觀與“中國記憶”數(shù)字資源建設[J].檔案學通訊,2012(3):4-8.
[14]Debora C.Government Information Collections and Services in the Social Sciences: The subject specialist integration[J].The Journal of Academic Librarianship,2006(3):303-312.
[15]李廣建,汪語宇,張麗.數(shù)字資源整合的實現(xiàn)機制及關(guān)鍵技術(shù)——對國外數(shù)字資源整合系統(tǒng)的實證研究[J].中國圖書館學報,2007(2):75-80.
[16]王萍.國外電子文件/檔案長期存取技術(shù)追蹤[J].情報科學,2002(2):213-216.
[17]McGovern N.A Digital Decade: Where Have We Been and Where Are We Going in Digital Preserva? tion [J/OL].RLG DigiNew,2007(1).
[18]Strodl S,Becker C,Neumayer B.How to Choose a Digital Preservation Strategy: Evaluating a Pres? ervation Planning Procedure [C].Proceedings of the 7th ACM/IEEE-CS Joint Conference on Digital Libraries. New York: ACM Press 2007:29-42.
[19]Lorie,R.A.Long term archiving of digital infor? mation [C].Proceedings of the first ACM\IEEE- CS Joint Conference on Digital Libraries 2004:346-352.
[20]安小米等.21世紀的數(shù)字檔案資源整合與服務:國外研究及借鑒[J].檔案學通訊,2014(2):47-51.
[21]蔣冠,何振.我國電子政務環(huán)境下檔案資源的整合與共享[J].檔案學通訊,2004(6):44-47.
[23]趙愛國.試論檔案信息資源整合與檔案館館藏建設[J].檔案學通訊,2006(6):33-36.
[24]薛四新,張利.基于集成管理思想的服務型數(shù)字檔案館研究[J].檔案學通訊,2010(2):59-63.
[26]Ping Wang,In- Lin Hu,Chen- Chi Chang. Exploring the value and innovative pricing strategy of dig? ital archives[J].Electronic Library,2014(1):96-105.
[27]吳建華等.中國檔案網(wǎng)站建設概況與重點分析[J].檔案學通訊,2008(4):50-54.
[28]張帥.我國檔案網(wǎng)站建設的問題與對策分析[J].蘭臺內(nèi)外,2008(2):53.
[29]陳曉暉,趙屹.我國檔案網(wǎng)站建設情況綜述[J].檔案學研究,2013(4):55-63.
[30]加拿大國家圖書館與檔案館網(wǎng)站
[EB/OL].[2014-11-23].http://www.collectionscan? ada.gc.ca/index-e.html.
作者單位:天津師范大學管理學院