●張華艷(曲阜師范大學 圖書館,山東 曲阜 273165)
開放存取信息服務是當今社會信息量劇增、信息流通迅速催生出的一種新型服務方式,它迎合了網(wǎng)絡時代信息交流的特點,開創(chuàng)了一種新的、高效的交流模式。[1]開放存取的服務模式,促進了信息的傳遞與共享,同時也使各種資源的利用率得到了極大地提升。古籍文獻是一種不可再生的有限資源,由于它的這種特性及數(shù)量的有限性,使得古籍整理工作受到了很大的限制,也使得古籍利用與保護的矛盾日漸突出。在這種情況下,我們需要借助于一些外在的力量,尋找館藏實體資源之外的數(shù)字古籍資源和已有的古籍研究成果來開展工作。開放存取信息服務理念的提出為古籍整理保護工作開創(chuàng)了新的契機。當前國內(nèi)一些高校已經(jīng)將開放存取服務模式引入古籍資源的共享上,但無論在服務體系的完善還是在平臺的建設上還存在諸多問題,因此有必要對古籍資源的開放存取作更深入的探討,以期更好地服務于古籍整理與保護工作。
“古籍數(shù)字化就是從利用和保護古籍的目的出發(fā),采用計算機技術,將常見的語言文字或圖形符號轉化為能被計算機識別的數(shù)字符號,從而制成古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,用以揭示古籍文獻信息資源的一項系統(tǒng)工作”。[2]近年來,隨著計算機網(wǎng)絡技術的不斷發(fā)展,圖書館、學術機構以及數(shù)字企業(yè)等機構都相繼開發(fā)了適應學術研究與交流需求的古籍數(shù)字化產(chǎn)品,使得古籍數(shù)字化資源從最初的書目數(shù)據(jù)庫,發(fā)展到了全圖像型數(shù)據(jù)庫,再到后來的古籍全文數(shù)據(jù)庫,直至如今的網(wǎng)絡綜合檢索系統(tǒng)。越來越多的古籍資源擁有了可供快速查檢的電子版本。
筆者通過網(wǎng)絡調(diào)查與文獻調(diào)查發(fā)現(xiàn),目前古籍數(shù)字資源種類繁多。這些數(shù)字資源類型不一,既有純書目的數(shù)據(jù)庫,也有能提供全文與影像信息的數(shù)據(jù)檢索系統(tǒng),如“中國古籍善本導航系統(tǒng)”“數(shù)字方志”等。一些圖書館根據(jù)自己館藏特色,進行了古籍數(shù)字化開發(fā)工作,如國家圖書館的“碑帖菁華(中文拓片資源庫)”“敦煌在線資源庫”;南京圖書館的“中國傳統(tǒng)體育圖片數(shù)據(jù)庫”;上海圖書館的“名人家譜庫”“宋元善本全文數(shù)據(jù)庫”等。除此之外,一些致力于古籍數(shù)字化的學術機構及其數(shù)字企業(yè)也相繼開發(fā)了150多種古籍數(shù)字資源。如香港中文大學中國文化研究所中國古籍研究中心的“甲骨文全文數(shù)據(jù)庫”“金文全文數(shù)據(jù)庫”“竹簡帛書出土文獻數(shù)據(jù)庫”“中國傳統(tǒng)類書數(shù)據(jù)庫”等;北京國學時代文化傳播股份有限公司的“國學寶典”“宋詞備覽”;北京愛如生數(shù)字化技術研究中心的“中國基本古籍庫”“中國史學庫”“永樂大典”等。這些數(shù)字資源多集中于各類圖書館及其科研機構的主頁上,也有的以光盤的形式集中于各使用單位。研究者可以利用各種檢索系統(tǒng),對其所需的資源進行檢索、復制、閱讀、下載、傳播、打印等,也可以通過鏈接的方式了解相關的學術前沿與發(fā)展方向,極大地節(jié)省了古籍整理工作的時間與精力。這不僅為古籍的整理與研究開啟了一扇便捷之門,同時也為古籍資源的開放存取奠定了堅實的基礎。
開放存取的內(nèi)涵包括兩層含義:一是指學術信息免費向公眾開放,它打破了價格障礙;二是指學術信息的可獲得性,它打破了使用權限障礙。筆者根據(jù)開放存取的這一概念內(nèi)涵對10家“全國古籍重點保護單位”在古籍數(shù)字資源的開放性問題上進行了網(wǎng)絡調(diào)查。調(diào)查結果如表1所示。表1所選取的圖書館有公共圖書館、高校圖書館以及科研機構圖書館,這些圖書館在各自的類型中有著較高的檔次,能夠代表同類別圖書館的水平。經(jīng)分析總結,發(fā)現(xiàn)問題如下:
(1)各類圖書館古籍數(shù)字資源的開發(fā)利用不平衡、不開放。由于各類圖書館服務的讀者群體不同,服務的內(nèi)容和層次也不一樣,它們在古籍數(shù)字資源的開發(fā)利用程度上表現(xiàn)也不同??蒲蓄悎D書館、高校圖書館的古籍資源的讀者由于科研和教學的任務較重,他們對有關的信息資源需求比較強烈,這就使得這類圖書館對古籍學術信息資源的建設和開發(fā)比較有力。而公共圖書館是面向社會服務的,其讀者類型多種多樣,信息需求不一,對于古籍資源需求的讀者占比重很少,所以在古籍數(shù)字資源的開發(fā)利用上表現(xiàn)出了明顯的差異性。另外,由于受經(jīng)費的限制,大部分圖書館對古籍資源以及相關信息共享意識淡薄。多數(shù)圖書館對自己開發(fā)及其所購買的資源“保護意識”特別強烈,對于本單位服務對象之外的讀者則設置重重“關卡”,致使館外讀者所需資源無從檢索、下載、復制等。即使有的能復制、下載,但卻不能生成可編輯文件。這與開放存取所倡導的“學術信息免費向公眾開放”相去甚遠。
(2)古籍數(shù)字資源的組織利用方式不規(guī)范,缺乏統(tǒng)一的平臺。數(shù)字資源格式不一。從文件格式上來看,數(shù)字化古籍除了目前常見的tet、doc、html格式外,還有 exe、pdf、wdl、pdg、ebk、edb等。各古籍數(shù)字資源信息存儲形式差異性大,各格式之間互不兼容。因此,目前許多圖書館古籍數(shù)字資源雖然比較豐富,但卻因每一個檢索系統(tǒng)都有著不同的檢索界面、不同的使用方式、不同的身份認證、不同的資料屬性,而且呈現(xiàn)的格式不一,使得用戶無法一次獲取各數(shù)據(jù)庫的信息,這為開放資源與館內(nèi)資源的整合帶來了困難。目前在國外,開放存取主要有3種基本的形式:機構資源庫、學科資源庫和開放獲取期刊。[3]這3種類型都有自己的發(fā)行軟件,但遵從統(tǒng)一的存儲標準,各系統(tǒng)間具有良好的兼容性,具有統(tǒng)一的檢索平臺。國內(nèi)也有一些圖書館建立了統(tǒng)一的平臺,如清華大學圖書館的“中國知識資源總庫”傳播共享平臺、清華同方電子資源統(tǒng)一檢索平臺和南京大學圖書館的一站式檢索,利用這些統(tǒng)一檢索平臺可以將搜集到的古籍數(shù)字資源與本館的數(shù)字資源進行整合,實現(xiàn)多數(shù)據(jù)庫同時檢索、分數(shù)據(jù)庫展示檢索結果,檢索系統(tǒng)算是走出了成功的一步。但是,離建立一種兼容的信息存儲模式,進行信息資源的整合,真正實現(xiàn)全國范圍內(nèi)的信息流通還存在很大的差距。
表 不同圖書館對古籍數(shù)字資源的組織利用情況
古籍數(shù)字資源已經(jīng)碩果累累,這些成果借助于計算機與網(wǎng)絡平臺為讀者教學與科研提供了前所未有的便利,促進了學術的交流與發(fā)展。但由于各圖書館對于這些資源開放共享的重要性認識不足,導致圖書館各自為政,在很大程度上又限制了這些資源的開放與共享。要徹底實現(xiàn)古籍數(shù)字資源的開放存取目標,大力宣傳其開放共享的意義,提高其社會認知度是非常關鍵的一步。在圖書館之間實行古籍數(shù)字資源的開放共享對于各個圖書館來說是一種互贏互利的雙贏活動。目前,古籍數(shù)字資源數(shù)量繁多,況且都價格昂貴,在圖書館之間實行資源共享可以保證各圖書館在存儲大量信息的前提下節(jié)省大量經(jīng)費。因此各圖書館之間應該改變觀念,打破封閉與半封閉狀態(tài),加強交流與協(xié)作,實現(xiàn)不同圖書館間的信息融合,使得各個高校圖書館間的信息資源互補原則通過電子交流的方式得以實現(xiàn)。
如上所述,目前古籍數(shù)字化產(chǎn)品種類繁多,但卻因每一個檢索系統(tǒng)都有著不同的檢索界面、不同的使用方式、不同的身份認證、不同的資料屬性,而且呈現(xiàn)的格式不一,使得用戶無法一次獲取各數(shù)據(jù)庫的信息,各信息資源的使用權限遇到了障礙,違背了開放存取“信息可獲得性”的宗旨。為了打破這種權限障礙,各圖書館應遵從統(tǒng)一的存儲標準,取消查檢信息資料時的“身份認證”限制,搭建統(tǒng)一的檢索平臺,使用戶不僅可以在集成檢索界面上同時檢索各種網(wǎng)絡數(shù)字資源,也可以實現(xiàn)不同類型、不同層次資源之間的動態(tài)鏈接,還可以與原文傳遞、館際互借等服務進行整合。因此只有構建統(tǒng)一的平臺,使讀者能夠輕松快捷地檢索到自己所需資源,了解相關的學術信息,才能對古籍數(shù)字資源的開放存取有新的認識以及新的渴求,也才能更好地加快其開放存取的進度。
目前,一方面由于古籍數(shù)字資源的開發(fā)者與組織者素質(zhì)高低各不相同,資源的水平與質(zhì)量也是參差不齊,加之古籍數(shù)字資源缺乏像開放存取期刊一樣的同行評審制度,使得網(wǎng)絡上資源的權威性與可靠性受到質(zhì)疑。另一方面,多數(shù)古籍數(shù)字資源僅限于提供古籍資料的目錄檢索及全文檢索和簡單的復制、下載、統(tǒng)計等功能,離古籍整理平臺差距甚遠。因此有必要研究行之有效的古籍整理與開發(fā)模式和方法,深度開發(fā)古籍數(shù)字資源,使得古籍數(shù)字化不僅能全文檢索,還要深入文獻內(nèi)部的知識單元,通過古籍文本內(nèi)容的深入揭示和關聯(lián)重組,達到知識發(fā)現(xiàn)的目的。將古籍的文本內(nèi)容與相關知識的輔助工具相配備,如聯(lián)機古漢語字典、年號與公元紀年對照表、室名別號、官職制度等,力求從任何角度都能檢索到讀者所需要的信息。同時讓計算機模擬人腦從大量古籍文本及其相關輔助工具中作出判斷選擇,從而達到能自動編纂、自動標點、自動斷句、自動注釋、自動??钡取4]將全文檢索的古文信息化建設轉向古籍資料的數(shù)據(jù)分析和處理,滿足實際古籍整理工作需要。古籍數(shù)字資源的智能化可以為古籍研究者提供全面的多維度的幫助,能大大提高古籍整理及研究的效率,會受越來越多的使用者歡迎與倡導,從這一點來說,古籍數(shù)字資源的智能化會極大地推動其開放存取的步伐。
[1]王大偉.高校圖書館開放存取信息服務的若干問題 [J].圖書館,2010(1):110.
[2]毛建軍.古籍數(shù)字化的概念與內(nèi)涵[J].圖書館理論與實踐,2007(4):82-84.
[3]喻文.開放存取對高校圖書館的影響及對策思考[J].圖書館,2008(6):50-52.
[4]常娥,等.古籍智能整理與開發(fā)系統(tǒng)構建研究[J].情報資料工作,2009(4):45.