陳文韜
籍資源數(shù)字化開(kāi)發(fā)與利用是新時(shí)代古籍整理出版的新趨勢(shì)和新方向。目前古籍資源數(shù)字化的主要類(lèi)型有原典的數(shù)字化和古籍整理成果的數(shù)字化兩種,面臨缺乏整體規(guī)劃、古籍整理成果資源有限、缺乏統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)、尚未形成明晰的盈利模式等主要問(wèn)題。未來(lái)應(yīng)當(dāng)加強(qiáng)對(duì)古籍資源數(shù)字化的行業(yè)監(jiān)管和引導(dǎo),進(jìn)行項(xiàng)目資助,建立古籍資源數(shù)字化版權(quán)保護(hù)規(guī)章制度,加強(qiáng)古籍資源數(shù)字化人才培養(yǎng),加強(qiáng)多種途徑的嘗試,探索古籍資源數(shù)字化的更多可能性。
古籍資源數(shù)字化是指利用現(xiàn)代信息技術(shù)對(duì)古籍文獻(xiàn)進(jìn)行加工處理,使其轉(zhuǎn)化為電子數(shù)據(jù)形式,通過(guò)光盤(pán)、網(wǎng)絡(luò)等介質(zhì)保存和傳播。古籍資源的數(shù)字化開(kāi)發(fā)和利用,已經(jīng)成為古籍整理出版的新趨勢(shì)和新方向。
古籍資源數(shù)字化
開(kāi)發(fā)與利用的現(xiàn)狀
一是對(duì)古籍善本的原物掃描和原樣復(fù)制。海內(nèi)外各圖書(shū)館和其他收藏機(jī)構(gòu)進(jìn)行了大量的古籍原典數(shù)字化的工作,很多古籍善本通過(guò)掃描制作成圖片的方式,實(shí)現(xiàn)了網(wǎng)絡(luò)存儲(chǔ)、查詢、下載和共享,對(duì)我們接觸和研究古籍文獻(xiàn)提供了極大的便利。如國(guó)家圖書(shū)館出版社近年來(lái)開(kāi)發(fā)的“中華再造善本數(shù)據(jù)庫(kù)”,便將“中華再造善本工程”中影印出版的珍貴古籍善本進(jìn)行圖像數(shù)字化,并通過(guò)對(duì)珍貴古籍善本的數(shù)字化加工和多元應(yīng)用,實(shí)現(xiàn)珍貴古籍善本的再開(kāi)發(fā)和再利用,是一個(gè)具有重要學(xué)術(shù)研究?jī)r(jià)值的古籍?dāng)?shù)字資源平臺(tái)。
二是用數(shù)字化的形式展現(xiàn)古籍整理的已有成果,發(fā)布專業(yè)文本供讀者瀏覽,還可實(shí)現(xiàn)多功能檢索。經(jīng)過(guò)多年的努力,出版機(jī)構(gòu)尤其是專業(yè)古籍出版社積累了大量的古籍整理出版成果,將這些古籍整理出版資源數(shù)字化,提供網(wǎng)絡(luò)閱讀和檢索服務(wù),將使古籍整理出版成果得到更廣泛的利用。由中華書(shū)局下屬古聯(lián)(北京)數(shù)字傳媒科技有限公司開(kāi)發(fā)的“中華經(jīng)典古籍庫(kù)”,便在這一方向進(jìn)行了很好的實(shí)踐,取得了一定的成績(jī)。“中華經(jīng)典古籍庫(kù)”收錄了中華書(shū)局及其他古籍出版社出版的整理本古籍圖書(shū),涵蓋經(jīng)史子集各部,包含了“二十四史”、“史料筆記叢刊”、“古典文學(xué)基本叢書(shū)”、“佛教典籍選刊”、《資治通鑒》、《新編諸子集成》、《清人十三經(jīng)注疏》等經(jīng)典系列?!爸腥A經(jīng)典古籍庫(kù)”提供了豐富的古籍?dāng)?shù)字化閱讀、檢索服務(wù)以及必備的輔助工具,特別提供了文本數(shù)據(jù)與原書(shū)圖像的對(duì)照,并能自動(dòng)生成引用格式,便于了解版式信息,省去了核對(duì)紙書(shū)的麻煩,為用戶帶來(lái)了便利。
古籍資源數(shù)字化
開(kāi)發(fā)與利用面臨的問(wèn)題
1.重復(fù)建設(shè)的情況嚴(yán)重
除了“中華再造善本數(shù)據(jù)庫(kù)”“中華經(jīng)典古籍庫(kù)”這些較為知名的古籍?dāng)?shù)據(jù)庫(kù)之外,還有大量的機(jī)構(gòu)在進(jìn)行古籍資源數(shù)字化的工作,如“中國(guó)哲學(xué)書(shū)電子化計(jì)劃”“書(shū)同文古籍?dāng)?shù)據(jù)庫(kù)”“中國(guó)基本古籍庫(kù)”“國(guó)學(xué)寶典”等等。由于缺少統(tǒng)一的規(guī)劃,這些數(shù)據(jù)庫(kù)出現(xiàn)了重復(fù)建設(shè)的問(wèn)題。一些熱門(mén)古籍不斷重復(fù)地被不同的數(shù)據(jù)庫(kù)進(jìn)行數(shù)字加工,如多個(gè)數(shù)據(jù)庫(kù)都收錄了《四庫(kù)全書(shū)》和《二十五史》;數(shù)字化成果質(zhì)量良莠不齊,既有可以代表古籍整理較高水平的數(shù)字化資源,也有粗制濫造的簡(jiǎn)單圖片掃描??傮w來(lái)說(shuō),結(jié)合???、輯佚等深度整理的精良本的數(shù)據(jù)庫(kù)較少。
2.古籍資源數(shù)字化缺乏“源頭活水”
古籍原典數(shù)字化面臨較為嚴(yán)重的資源限制。以各大圖書(shū)館為代表的收藏機(jī)構(gòu)保存了大量的古籍善本,其中不乏稀見(jiàn)文獻(xiàn)資料。但大部分收藏機(jī)構(gòu)將這些古籍資源視為自己的獨(dú)有資源,不愿輕易示人,更不要說(shuō)進(jìn)行數(shù)字化傳播了。因此,受資源壟斷的限制,一些珍稀古籍文獻(xiàn)和善本得不到進(jìn)行數(shù)字化的機(jī)會(huì)。古籍整理成果資源有限。數(shù)字化的古籍應(yīng)該是經(jīng)過(guò)認(rèn)真整理的古籍,需要運(yùn)用目錄學(xué)、版本學(xué)、校勘學(xué)、文字學(xué)、音韻學(xué)、歷史文獻(xiàn)學(xué)等各方面專業(yè)知識(shí)進(jìn)行點(diǎn)校,成為現(xiàn)有最好或較好的版本。否則,將會(huì)造成謬誤流傳,劣本取代善本。但目前流傳的古籍?dāng)?shù)字化資源,有很多是未經(jīng)專業(yè)整理的粗制濫造的版本。目前“中華經(jīng)典古籍庫(kù)”收書(shū)2300余種,12.6億字,預(yù)計(jì)再經(jīng)過(guò)數(shù)年的努力,可以達(dá)到5000種、20億字的規(guī)模。這一數(shù)據(jù)相較我國(guó)現(xiàn)存的古籍圖書(shū)規(guī)模,屬于九牛一毛、冰山一角。制約“中華經(jīng)典古籍庫(kù)”規(guī)模的最大因素,在于優(yōu)質(zhì)古籍整理成果的匱乏。
3.缺乏統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)
各機(jī)構(gòu)開(kāi)發(fā)的數(shù)據(jù)庫(kù)都有自己的數(shù)字化標(biāo)準(zhǔn),沒(méi)有形成統(tǒng)一的跨平臺(tái)接口。古籍資源數(shù)字化的技術(shù)標(biāo)準(zhǔn)必須符合中文古籍的特點(diǎn)。古籍?dāng)?shù)字化流程中,數(shù)據(jù)采集標(biāo)準(zhǔn)規(guī)范、圖像采集處理規(guī)范、文字采集規(guī)范、資源內(nèi)容表示規(guī)范、古籍用字標(biāo)準(zhǔn)、專有名詞標(biāo)準(zhǔn)、整理本古籍元數(shù)據(jù)標(biāo)準(zhǔn)、整理本古籍文獻(xiàn)數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)等等,都必須符合中文古籍的特點(diǎn)。目前國(guó)內(nèi)對(duì)古籍?dāng)?shù)字化缺少統(tǒng)一的行業(yè)標(biāo)準(zhǔn),各數(shù)據(jù)庫(kù)自行制定的標(biāo)準(zhǔn)存在較大差異,導(dǎo)致各數(shù)據(jù)庫(kù)的質(zhì)量良莠不齊,也不利于不同數(shù)據(jù)庫(kù)之間的合作開(kāi)發(fā)與利用。
4.尚未形成很明晰的盈利模式
進(jìn)行古籍資源的數(shù)字化,需要投入大量的人力、物力和財(cái)力,并且周期長(zhǎng),投資回報(bào)率不高。從目前來(lái)看,古籍資源的數(shù)字化尚處于探索期,并未形成明晰的盈利模式。由出版單位開(kāi)發(fā)的各類(lèi)數(shù)據(jù)庫(kù),主要依靠圖書(shū)館、高校等專業(yè)組織的購(gòu)買(mǎi),難以形成廣泛的零售需求,很難擴(kuò)大銷(xiāo)售規(guī)模,難以帶來(lái)巨大收益。以“國(guó)學(xué)大師”“書(shū)格”等為代表的共享數(shù)據(jù)庫(kù),主要通過(guò)收取網(wǎng)站廣告費(fèi)、網(wǎng)友捐贈(zèng)、移動(dòng)硬盤(pán)拷貝資料銷(xiāo)售等方式來(lái)維持運(yùn)營(yíng),未能找到更好的盈利模式。
對(duì)古籍資源數(shù)字化
開(kāi)發(fā)與利用的建議
1.政府部門(mén)設(shè)立相關(guān)機(jī)構(gòu),加強(qiáng)對(duì)古籍資源數(shù)字化的行業(yè)監(jiān)管和引導(dǎo)
制定古籍資源數(shù)字化發(fā)展規(guī)劃,協(xié)調(diào)各出版機(jī)構(gòu)的古籍資源數(shù)字化工作,整合各出版機(jī)構(gòu)的優(yōu)勢(shì)資源,可以避免同質(zhì)化重復(fù)建設(shè)。主管部門(mén)制定統(tǒng)一的古籍資源數(shù)字化標(biāo)準(zhǔn),建立跨平臺(tái)、跨數(shù)據(jù)庫(kù)的統(tǒng)一接口,使各數(shù)據(jù)庫(kù)能夠?qū)崿F(xiàn)跨平臺(tái)資源檢索和使用,充分實(shí)現(xiàn)各平臺(tái)優(yōu)質(zhì)資源的共享。
2.在古籍資源數(shù)字化盈利模式尚不明晰的情況下通過(guò)項(xiàng)目資助的方式,對(duì)古籍資源數(shù)字化進(jìn)行引導(dǎo)
為古籍資源數(shù)字化提供必要的資金支持。以項(xiàng)目資助的方式,引導(dǎo)圖書(shū)館等收藏單位將已有古籍善本進(jìn)行數(shù)字化開(kāi)發(fā)和利用,鼓勵(lì)圖書(shū)館進(jìn)行稀有古籍善本的數(shù)字化開(kāi)發(fā)和網(wǎng)絡(luò)共享,使更多研究者和讀者能夠通過(guò)數(shù)字化平臺(tái)接觸古籍善本影像資料,實(shí)現(xiàn)對(duì)古籍善本的有效保護(hù)和利用。通過(guò)資金扶持,引導(dǎo)出版機(jī)構(gòu)進(jìn)行古籍整理出版資源的數(shù)字化。鼓勵(lì)出版機(jī)構(gòu)加大古籍整理工作力度,整理出版更多古籍善本,為古籍資源數(shù)字化不斷提供新的古籍整理優(yōu)質(zhì)內(nèi)容。此外,還可以通過(guò)稅費(fèi)減免等方式,降低古籍資源數(shù)字化機(jī)構(gòu)的運(yùn)營(yíng)成本,鼓勵(lì)更多的企業(yè)參與到古籍資源數(shù)字化工作中來(lái)。
3.對(duì)古籍資源數(shù)字化版權(quán)進(jìn)行有效保護(hù)建立古籍資源數(shù)字化版權(quán)保護(hù)規(guī)章制度
古籍資源數(shù)字化存在難制作、易被侵權(quán)的問(wèn)題。應(yīng)當(dāng)做好古籍資源數(shù)字化版權(quán)登記,加強(qiáng)對(duì)古籍資源數(shù)字化版權(quán)的保護(hù)力度,嚴(yán)厲打擊侵犯古籍資源數(shù)字化版權(quán)的行為。
4.加強(qiáng)多種途徑的嘗試探索古籍資源數(shù)字化的更多可能性
除了古籍原典的數(shù)字化、古籍整理成果的數(shù)字化這兩大最主要的古籍資源數(shù)字化途徑之外,我們還應(yīng)積極嘗試更多可行的途徑。(1)古籍的數(shù)字化整理。古籍的數(shù)字化整古理可以通過(guò)數(shù)字化平臺(tái)實(shí)現(xiàn)古籍的自動(dòng)???、自動(dòng)標(biāo)點(diǎn)、自動(dòng)編纂、自動(dòng)注釋、自動(dòng)索引、自動(dòng)排版等功能,可以極大提高古籍整理出版工作效率,并降低人力成本。筆者相信,在技術(shù)不斷成熟和完善的基礎(chǔ)上,古籍的數(shù)字化整理必將成為古籍整理出版工作的新動(dòng)力。(2)古籍資源的數(shù)據(jù)庫(kù)開(kāi)發(fā)與利用。目前大多數(shù)的古籍?dāng)?shù)據(jù)庫(kù)還處于“資料庫(kù)”的階段,只能提供較為簡(jiǎn)單的檢索和閱讀服務(wù)。而古籍資源的數(shù)據(jù)庫(kù)采用社會(huì)科學(xué)的方法論和電腦運(yùn)算工具,如超文本、資料視覺(jué)化、統(tǒng)計(jì)學(xué)、文本探勘、數(shù)位制圖等,實(shí)現(xiàn)運(yùn)算、分析、統(tǒng)計(jì)等功能,可以將古籍資源進(jìn)行更深入的開(kāi)發(fā)和利用,產(chǎn)生新的價(jià)值。(3)古籍資源的融合出版。古籍出版單位可以在紙質(zhì)圖書(shū)中加入AR、VR等新技術(shù),使閱讀體驗(yàn)更加豐富,更加富有層次。如對(duì)文博考古類(lèi)圖書(shū)中出現(xiàn)的圖片進(jìn)行AR處理,使圖片中器物的細(xì)節(jié)更加豐富立體;對(duì)圖書(shū)中展示的考古發(fā)掘現(xiàn)場(chǎng)進(jìn)行VR展示,使讀者能進(jìn)行全方位、多角度的觀看,如身臨其境。
(湖南岳麓書(shū)社有限責(zé)任公司)