黃紫涵,劉孟瑩,范 瑞
(吉首大學(xué)旅游學(xué)院,湖南 張家界 427000)
自20 世紀(jì)七八十年代以來,我國(guó)在保護(hù)古籍、傳承與發(fā)揚(yáng)傳統(tǒng)文化的宗旨下頒布了一些關(guān)于古籍資源數(shù)字化的法律法規(guī)。 中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》提出,推進(jìn)古籍?dāng)?shù)字化,建立健全國(guó)家古籍?dāng)?shù)字化工作指導(dǎo)協(xié)調(diào)機(jī)制,統(tǒng)籌實(shí)施國(guó)家古籍?dāng)?shù)字化工程,旨在實(shí)現(xiàn)古籍?dāng)?shù)字化資源匯聚共享。 《中華人民共和國(guó)公共圖書館法》要求,相關(guān)部門應(yīng)推動(dòng)古籍專業(yè)數(shù)據(jù)庫(kù)的開發(fā)與利用,加強(qiáng)古籍?dāng)?shù)字化資源管理和開放共享。
我國(guó)的古代文獻(xiàn)整理在漫長(zhǎng)的進(jìn)程中形成了優(yōu)良的學(xué)術(shù)傳統(tǒng),李明杰將其歸納為最具代表性的五大學(xué)術(shù)傳統(tǒng):一是在搜集時(shí)的“廣勘異本,擇善而從”,二是在文字校注時(shí)的“述而不作,信而好古”,三是在版本源流上追求“萬流同歸,百慮一致”,四是在書目編制時(shí)的“辨章學(xué)術(shù),考鏡源流”,五是在文獻(xiàn)編纂時(shí)的“會(huì)通”[1]。
古籍資源數(shù)字化整合是古代文獻(xiàn)整理的延續(xù),在古代文獻(xiàn)整理過程中形成的五大學(xué)術(shù)傳統(tǒng)為古籍?dāng)?shù)字資源整理提供了經(jīng)驗(yàn)與啟發(fā)[2]。 首先,“廣勘異本,擇善而從”與“述而不作,信而好古”強(qiáng)調(diào)的是在古籍?dāng)?shù)字資源整合過程中選擇內(nèi)容優(yōu)良、結(jié)構(gòu)完好、易于整合的數(shù)字資源,在數(shù)字資源表達(dá)方面盡量展示古籍原始信息與初始面貌,寧可保留原狀也不妄加亂改。 其次,“萬流同歸,百慮一致”與“辨章學(xué)術(shù),考鏡源流”帶給古籍?dāng)?shù)字資源整理的啟發(fā)是:在資源整合過程中,注重知識(shí)的關(guān)聯(lián)、體系的構(gòu)建,旨在建立統(tǒng)一的整合機(jī)制。 再次,“會(huì)通”帶給古籍?dāng)?shù)字資源整理的啟發(fā)是:在資源整合過程中,不僅要對(duì)古籍?dāng)?shù)字資源進(jìn)行分門別類,還要打破學(xué)科之間、文獻(xiàn)之間、學(xué)派之間的隔閡,達(dá)到將信息資源融會(huì)貫通的目的。
古代文獻(xiàn)整理的五大學(xué)術(shù)傳統(tǒng)是推動(dòng)古籍?dāng)?shù)字資源整理的內(nèi)在因素,現(xiàn)實(shí)驅(qū)動(dòng)是外部動(dòng)力。 2007年,國(guó)務(wù)院辦公廳發(fā)起“中華古籍保護(hù)計(jì)劃”,由國(guó)家圖書館主要負(fù)責(zé)實(shí)施,截至2016 年年底先后公布五批《國(guó)家珍貴古籍名錄》,收錄古籍12,274 部,超過2,000 萬冊(cè)件古籍得到妥善保護(hù)[3]。 2022 年4月,國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》,旨在加強(qiáng)古籍搶救保護(hù)、整理研究和出版利用,加強(qiáng)古籍?dāng)?shù)字化整理與資源共享。
我國(guó)針對(duì)數(shù)字資源的整合研究成果較多,但針對(duì)古籍?dāng)?shù)字資源的整合研究成果較少,主要原因有兩個(gè)方面:一是古籍相對(duì)于其他信息資源的特殊性,數(shù)字化技術(shù)的發(fā)展不一定能滿足古籍?dāng)?shù)字資源整合的需求。 二是缺乏對(duì)古籍?dāng)?shù)字資源利用者需求的深入挖掘,導(dǎo)致資源利用率不高。
我國(guó)古籍?dāng)?shù)字資源的整合研究現(xiàn)狀可歸納為以下三個(gè)方面:一是對(duì)古籍?dāng)?shù)字資源整合模式的探索。毛建軍在探索過程中總結(jié)了古籍?dāng)?shù)字化資源建設(shè)的三大特點(diǎn),并提出了古籍?dāng)?shù)字資源導(dǎo)航庫(kù)的三種建設(shè)模式,即數(shù)據(jù)庫(kù)類型導(dǎo)航庫(kù)、建置單元導(dǎo)航庫(kù)、數(shù)據(jù)庫(kù)主題導(dǎo)航庫(kù)三種參考模式;李榮艷、李云龍等通過對(duì)中華古籍?dāng)?shù)字資源在國(guó)際上的運(yùn)作情況進(jìn)行了整合研究及思考,提出了古籍?dāng)?shù)字資源共建共享的整合模型[4]。 二是對(duì)國(guó)內(nèi)外漢文古籍?dāng)?shù)字資源整合的成果進(jìn)行梳理。 張惠婷對(duì)中文古籍?dāng)?shù)字資源的三大建設(shè)主體即公共圖書館、學(xué)術(shù)機(jī)構(gòu)、古籍?dāng)?shù)字化企業(yè)的建設(shè)成果及特點(diǎn)進(jìn)行了分析,并對(duì)三大圖文版中文古籍?dāng)?shù)據(jù)庫(kù)的利用功能進(jìn)行了對(duì)比研究[5];董強(qiáng)、張敏以日本漢籍?dāng)?shù)據(jù)庫(kù)為例,介紹了日本漢文古籍?dāng)?shù)據(jù)庫(kù)的利用與發(fā)展情況,并總結(jié)了相關(guān)可借鑒經(jīng)驗(yàn)[6]。 三是對(duì)圖書館古籍?dāng)?shù)字資源的整合研究。 薩蕾歸納了圖書館開展古籍?dāng)?shù)字資源整合工作的特點(diǎn),并針對(duì)館藏?cái)?shù)字資源所存在的問題,提出了加強(qiáng)文本分析技術(shù)的研究、基于本體構(gòu)建語義知識(shí)庫(kù)、加強(qiáng)合作實(shí)現(xiàn)同源異構(gòu)資源的統(tǒng)一發(fā)現(xiàn)等策略[7];張敏歸納了新的古籍資源獲取方式,分析了古籍資源建設(shè)發(fā)展的重要因素[8];黃曉華主要對(duì)中醫(yī)院校圖書館的古籍資源整合進(jìn)行了探討,并從古籍書目的客觀著錄與信息完善、編制分類目錄建設(shè)專題資源、促進(jìn)館藏資源整合、版本源流調(diào)研四個(gè)角度進(jìn)行了分析[9]。
國(guó)外針對(duì)信息資源整合的研究成果較多,但針對(duì)古籍?dāng)?shù)字資源整合的研究成果較少,因此,研究國(guó)外中文古籍?dāng)?shù)字資源的整合情況,學(xué)者可從國(guó)外圖書館的古籍?dāng)?shù)字資源建設(shè)情況入手。 美國(guó)國(guó)會(huì)圖書館擁有大量中文古籍善本資源,1939 年美國(guó)國(guó)會(huì)圖書館邀請(qǐng)我國(guó)文獻(xiàn)學(xué)家王重民前往整理研究,至此開始涌現(xiàn)出大量成果。 2005 年,我國(guó)學(xué)者范邦瑾受美國(guó)國(guó)會(huì)圖書館的邀請(qǐng),參加該館與臺(tái)灣合作的中文善本書數(shù)字化整理項(xiàng)目[10]。 近年來,美國(guó)國(guó)會(huì)圖書館與臺(tái)灣“中央研究院”合作,建立了美國(guó)國(guó)會(huì)圖書館典藏之中國(guó)相關(guān)地圖文獻(xiàn)查詢系統(tǒng)。 美國(guó)國(guó)會(huì)圖書館還對(duì)亞洲分部所收藏的5,300 種中文古籍善本進(jìn)行數(shù)字化處理,構(gòu)建了中文善本數(shù)字資源庫(kù),該數(shù)據(jù)庫(kù)目前有1,696 條數(shù)據(jù),數(shù)據(jù)格式采用MARCXML、MODS 和都柏林核心元素集三種形式,可供下載的文件格式以圖像為主,如TIFF、gif 格式。大英圖書館實(shí)施的數(shù)字化手稿項(xiàng)目,對(duì)部分館藏中文古籍資源進(jìn)行了數(shù)字化處理,所藏的24 卷《永樂大典》目前有14,375 份手稿可供查閱,其線上展覽館可查閱瀏覽部分漢籍。 日本所藏中文古籍?dāng)?shù)據(jù)庫(kù)古籍目錄的分類方法與我國(guó)的傳統(tǒng)目錄學(xué)分類方法相似;2009 年11 月,東洋文化研究所將所藏中文古籍4,000 余種,以數(shù)字化方式無償提供給中國(guó)國(guó)家圖書館。
4.1.1 以中國(guó)國(guó)家圖書館為主體。 中國(guó)國(guó)家圖書館作為信息中心,肩負(fù)著信息資源建設(shè)的任務(wù)。 中國(guó)國(guó)家圖書館實(shí)施的“中華古籍保護(hù)計(jì)劃”旨在建設(shè)共享資源整合平臺(tái),主要成果有:截至2019 年11月全國(guó)古籍普查登記基本數(shù)據(jù)庫(kù)收錄217 家單位的772,861 條古籍?dāng)?shù)據(jù)[11];“中華古籍資源庫(kù)”目前在線發(fā)布的古籍影像資源包括中國(guó)國(guó)家圖書館藏善本和普通古籍、法國(guó)國(guó)家圖書館藏敦煌遺書、《趙城金藏》等資源。 此外,中國(guó)國(guó)家圖書館還建成中華醫(yī)藥典籍資源庫(kù)及數(shù)字方志資源庫(kù),為用戶獲取古籍資源提供了便利。
4.1.2 高校圖書館之間。 高校圖書館積極開展古籍資源的共建共享工作,組建了圖書館聯(lián)盟。 例如,高校古文獻(xiàn)資源庫(kù)是中國(guó)高等教育保障系統(tǒng)(CALIS)第三期的子項(xiàng)目,由北京大學(xué)圖書館發(fā)起,旨在聯(lián)合高校圖書館對(duì)館藏古籍資源進(jìn)行數(shù)字化整合。
北京愛如生數(shù)字化技術(shù)研究中心整合了中國(guó)基本古籍庫(kù)、四庫(kù)系列數(shù)據(jù)庫(kù)、近代文獻(xiàn)數(shù)據(jù)庫(kù)等數(shù)字化產(chǎn)品,并將這些數(shù)字化產(chǎn)品整合到統(tǒng)一的數(shù)據(jù)平臺(tái),即愛如生典海數(shù)字平臺(tái)。 北京時(shí)代瀚堂科技有限公司通過整合相關(guān)古籍資源,構(gòu)建了瀚堂典藏?cái)?shù)據(jù)庫(kù)。古聯(lián)(北京)數(shù)字傳媒科技有限公司建設(shè)的“籍合網(wǎng)”是我國(guó)首款古籍整理與數(shù)字化綜合服務(wù)平臺(tái),“籍合網(wǎng)”旗下的數(shù)字產(chǎn)品包括中華經(jīng)典古籍庫(kù)、中華文史學(xué)術(shù)論著庫(kù)、中華古籍書目數(shù)據(jù)庫(kù)、中華善本古籍?dāng)?shù)據(jù)庫(kù)、中華文史工具書數(shù)據(jù)庫(kù)、西南聯(lián)大專題數(shù)據(jù)庫(kù)、中華石刻數(shù)據(jù)庫(kù)等,滿足了不同用戶的需求。
4.3.1 B/S 模式。 B/S 模式即瀏覽/服務(wù)模式,用戶打開瀏覽器輸入檢索詞,點(diǎn)擊檢索,便能鏈接到數(shù)據(jù)庫(kù),獲取相關(guān)資源。 這些網(wǎng)站的資源數(shù)量較少,具有不穩(wěn)定性,存在鏈接失效等問題。
4.3.2 資源導(dǎo)航系統(tǒng)。 資源導(dǎo)航系統(tǒng)主要有兩種:一種是僅提供資源鏈接,不提供原文鏈接;另一種是提供古籍資源的瀏覽,對(duì)資源內(nèi)容進(jìn)行一定程度的揭示。 例如,中國(guó)古典文獻(xiàn)資源導(dǎo)航系統(tǒng)是由安徽大學(xué)的一名教師搭建的,國(guó)家社科基金項(xiàng)目資助的,資源比較豐富、內(nèi)容比較全面的數(shù)據(jù)庫(kù)系統(tǒng)[12]。
數(shù)字時(shí)代,相關(guān)單位要與時(shí)俱進(jìn),積極加強(qiáng)數(shù)字資源建設(shè),制定長(zhǎng)期規(guī)劃與目標(biāo),構(gòu)建數(shù)字資源整合標(biāo)準(zhǔn)與流程,做好古籍?dāng)?shù)字資源調(diào)查工作,加強(qiáng)與聯(lián)合國(guó)教科文組織、國(guó)際圖書館協(xié)會(huì)的合作,共同對(duì)國(guó)內(nèi)外的古籍?dāng)?shù)字資源進(jìn)行整合,推動(dòng)中華優(yōu)秀傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展。