任 靜 林衛(wèi)東 李洪梅
(山東省圖書(shū)館,山東濟(jì)南 250100)
民國(guó)報(bào)刊是歷史的忠實(shí)記錄者和具象體現(xiàn)者,也是社會(huì)發(fā)展變革的助推動(dòng)力和必要條件。民國(guó)報(bào)刊能夠還原更多民國(guó)時(shí)期的歷史細(xì)節(jié),具有更為重要的史料研究及現(xiàn)實(shí)意義。民國(guó)報(bào)刊年代久遠(yuǎn)且保存情況不容樂(lè)觀,嚴(yán)重影響了它的利用。民國(guó)出版的報(bào)刊多為土紙,俗稱(chēng)“馬蘭紙”“毛頭紙”,紙張主要用稻草制成,在造紙過(guò)程中加入了漂白劑和松香、明礬等添加劑,酸化嚴(yán)重,不易長(zhǎng)期保存。國(guó)內(nèi)大部分圖書(shū)館保存庫(kù)房雖然能夠做到防火、防水、避光、恒溫等措施,可是保存狀況仍然堪憂。目前民國(guó)文獻(xiàn)保存狀況,按照《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》,進(jìn)行定級(jí),民國(guó)報(bào)刊接近一級(jí)破損。有相當(dāng)數(shù)量的報(bào)刊開(kāi)始散佚漫漶,甚至一觸即破,瀕于損毀。面對(duì)驚人的老化速度,將紙質(zhì)民國(guó)報(bào)刊數(shù)字化可以延長(zhǎng)民國(guó)報(bào)刊的使用壽命,也有利于實(shí)現(xiàn)民國(guó)報(bào)刊的共建共享。
數(shù)字化是對(duì)民國(guó)報(bào)刊原件最大程度的保護(hù),是延續(xù)民國(guó)報(bào)刊生命的有效措施,一方面可使得民國(guó)報(bào)刊信息得以永久保存,另一方面也可為讀者高效率的獲取一次文獻(xiàn)提供便捷。通過(guò)數(shù)字化建設(shè),讀者可以高效便捷的獲取一次文獻(xiàn),還可實(shí)現(xiàn)民國(guó)報(bào)刊數(shù)字信息資源的全方位、便捷、高效的信息傳遞服務(wù)。數(shù)字化可以節(jié)約科研工作者的時(shí)間,還可以極大地便利全國(guó)各地讀者和海內(nèi)外專(zhuān)家的檢索,并有效地節(jié)約了讀者和海內(nèi)外專(zhuān)家在文獻(xiàn)收集方面所需的時(shí)間成本。大部分館藏豐富的圖書(shū)館,多已經(jīng)建成了包括期刊全文庫(kù)、報(bào)紙全文庫(kù)、館藏書(shū)目數(shù)據(jù)庫(kù)和報(bào)刊類(lèi)專(zhuān)題數(shù)據(jù)庫(kù)等多種類(lèi)型數(shù)據(jù)庫(kù)。
目前公共圖書(shū)館共建有各種類(lèi)型民國(guó)報(bào)刊數(shù)據(jù)庫(kù)約60種,其中可通過(guò)購(gòu)買(mǎi)獲取的綜合性民國(guó)報(bào)刊數(shù)據(jù)庫(kù)有十余種,如“全國(guó)報(bào)刊索引——民國(guó)時(shí)期期刊全文數(shù)據(jù)庫(kù)”“大成老舊刊全文數(shù)據(jù)庫(kù)”“全國(guó)報(bào)刊索引——中國(guó)近代中文報(bào)紙全文數(shù)據(jù)庫(kù)”“古聯(lián)——晚清民國(guó)文獻(xiàn)平臺(tái)”“瀚堂——近代報(bào)刊數(shù)據(jù)庫(kù)”“睿則恩——中國(guó)近代報(bào)刊原文影像數(shù)據(jù)庫(kù)”“商務(wù)印書(shū)館《東方雜志》期刊全文檢索數(shù)據(jù)庫(kù)”“愛(ài)如生——中國(guó)近代報(bào)刊庫(kù)”等[1]。這些可購(gòu)買(mǎi)的數(shù)據(jù)庫(kù)都是文獻(xiàn)開(kāi)發(fā)程度較高,收錄資源的范圍和數(shù)量大,已經(jīng)有一定市場(chǎng)影響的產(chǎn)品。
筆者對(duì)31個(gè)省級(jí)公共圖書(shū)館和15個(gè)副省級(jí)公共圖書(shū)館進(jìn)行調(diào)研,調(diào)研主要集中在五個(gè)方面,包括建設(shè)類(lèi)型、建設(shè)時(shí)間、數(shù)字化形式、資源數(shù)量和建設(shè)形式。經(jīng)統(tǒng)計(jì),在民國(guó)期刊數(shù)據(jù)庫(kù)的建設(shè)中,有7家公共圖書(shū)館建設(shè)了綜合性期刊全文數(shù)據(jù)庫(kù),建設(shè)時(shí)間最早的是上海圖書(shū)館和重慶圖書(shū)館,都實(shí)現(xiàn)了PDF格式全文數(shù)字化,建設(shè)形式采取自建和外包相結(jié)合建設(shè)的的圖書(shū)館較多。建成民國(guó)期刊書(shū)目數(shù)字化的公共圖書(shū)館有20家,書(shū)目數(shù)據(jù)庫(kù)能實(shí)現(xiàn)民國(guó)報(bào)刊基本檢索信息,都能提供網(wǎng)上書(shū)目查檢,部分期刊可進(jìn)行篇目查檢。多家公共圖書(shū)館結(jié)合自身館藏特色建有以館藏特色為基礎(chǔ)的期刊專(zhuān)題數(shù)據(jù)庫(kù)。專(zhuān)題數(shù)據(jù)庫(kù)相對(duì)于全文數(shù)據(jù)庫(kù)來(lái)說(shuō)規(guī)模較小,但是能夠挖掘館藏特色,是全文數(shù)據(jù)庫(kù)很好的補(bǔ)充。在民國(guó)報(bào)紙數(shù)據(jù)庫(kù)的建設(shè)中,建有綜合性報(bào)紙數(shù)據(jù)庫(kù)的公共圖書(shū)館有8家,除國(guó)家圖書(shū)館的“民國(guó)中文報(bào)紙資源庫(kù)”實(shí)現(xiàn)了標(biāo)題OCR文字識(shí)別,其他數(shù)據(jù)庫(kù)都是PDF格式全文數(shù)字化。建成民國(guó)報(bào)紙書(shū)目數(shù)據(jù)庫(kù)的公共圖書(shū)館有10多家,民國(guó)報(bào)紙專(zhuān)題數(shù)據(jù)庫(kù)一般以大型有影響力的報(bào)紙為開(kāi)發(fā)對(duì)象,突出地方特色。另外,由于文獻(xiàn)集中保存的原因,很多公共圖書(shū)館的民國(guó)報(bào)刊與民國(guó)圖書(shū)、古籍共同保存,所以在數(shù)字化時(shí)也存在民國(guó)報(bào)刊與民國(guó)圖書(shū)、古籍共建的情況。專(zhuān)題數(shù)據(jù)庫(kù)的建設(shè)中,尤其是圖片數(shù)據(jù)庫(kù)中,部分資料或者圖片來(lái)源于民國(guó)報(bào)刊。
民國(guó)期刊相對(duì)于民國(guó)報(bào)紙得到了有效的開(kāi)發(fā)和整理,民國(guó)期刊數(shù)據(jù)庫(kù)按類(lèi)型又可分為綜合性全文數(shù)據(jù)庫(kù)、書(shū)目數(shù)據(jù)庫(kù)和專(zhuān)題數(shù)據(jù)庫(kù)。
2.1.1 綜合性全文數(shù)據(jù)庫(kù)
目前共有7家公共圖書(shū)館建設(shè)了綜合性期刊全文數(shù)據(jù)庫(kù),以“全國(guó)報(bào)刊索引——民國(guó)時(shí)期期刊全文數(shù)據(jù)庫(kù)”為例,是目前所有民國(guó)報(bào)刊數(shù)據(jù)庫(kù)中收入期刊種數(shù)和數(shù)量最多的數(shù)據(jù)庫(kù),共收錄民國(guó)期刊2萬(wàn)余種。該數(shù)據(jù)庫(kù)影響力也非常大,已經(jīng)服務(wù)到300多家國(guó)內(nèi)和海外的公共圖書(shū)館、高校圖書(shū)館以及情報(bào)研究機(jī)構(gòu)等[2]。公共圖書(shū)館建設(shè)的綜合性期刊全文數(shù)據(jù)庫(kù)具體概況如表1所示。
表1 公共圖書(shū)館民國(guó)期刊綜合性全文數(shù)據(jù)庫(kù)建設(shè)概況
已經(jīng)建成的綜合性民國(guó)期刊數(shù)據(jù)庫(kù)有三個(gè)特點(diǎn):第一,在建設(shè)原則和建設(shè)規(guī)模上,都是以館藏特色為基礎(chǔ),采取邊建設(shè)邊完善的原則。也有部分圖書(shū)館采取縮微膠片的形式進(jìn)行轉(zhuǎn)換,分期分批進(jìn)行數(shù)字化轉(zhuǎn)換,如國(guó)家圖書(shū)館、天津圖書(shū)館、浙江圖書(shū)館等;第二,在檢索功能和閱讀功能上,目前已開(kāi)發(fā)的民國(guó)期刊數(shù)據(jù)庫(kù)在功能上非常注重檢索功能,能實(shí)現(xiàn)按照題名、責(zé)任者、出版者、出版時(shí)間等多個(gè)檢索字段進(jìn)行檢索。大部分?jǐn)?shù)據(jù)庫(kù)都能實(shí)現(xiàn)界面友好便捷的閱讀體驗(yàn),部分?jǐn)?shù)據(jù)庫(kù)閱讀界面能夠?qū)崿F(xiàn)圖文對(duì)照;第三,在開(kāi)放獲取上,只有國(guó)家圖書(shū)館和杭州圖書(shū)館可在外網(wǎng)提供免費(fèi)全文瀏覽服務(wù),其他數(shù)據(jù)庫(kù)僅限于館內(nèi)獲取,所有數(shù)據(jù)庫(kù)登錄之后都可實(shí)現(xiàn)全文瀏覽并且提供全文下載。因此,公共圖書(shū)館可以考慮如何最大程度地放寬用戶(hù)限制,有意識(shí)地?cái)U(kuò)大數(shù)字資源的用戶(hù)范圍,使數(shù)字資源實(shí)現(xiàn)最大化的共享。
2.1.2 書(shū)目數(shù)據(jù)庫(kù)
民國(guó)期刊書(shū)目數(shù)據(jù)庫(kù)包含了民國(guó)期刊的基本著錄信息,目前完成期刊書(shū)目數(shù)字化的公共圖書(shū)館有20家,如大連圖書(shū)館、重慶圖書(shū)館、江西省圖書(shū)館、首都圖書(shū)館、安徽省圖書(shū)館、山東省圖書(shū)館等。公共圖書(shū)館在進(jìn)行全文數(shù)字化之前基本都建立了書(shū)目數(shù)據(jù)庫(kù),如重慶圖書(shū)館的“民國(guó)期刊書(shū)目數(shù)據(jù)庫(kù)”包括題名、著者、出版地、出版者、出版時(shí)間、分類(lèi)號(hào)等基本書(shū)目信息。后來(lái)重慶圖書(shū)館建設(shè)的“館藏民國(guó)文獻(xiàn)檢索系統(tǒng)”投入使用,該庫(kù)結(jié)合書(shū)目數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù),提供多種查詢(xún)途徑,可以全文下載閱讀。此外,南京圖書(shū)館建設(shè)了“南京圖書(shū)館建國(guó)前中文期刊分類(lèi)目錄”、廣東省立中山圖書(shū)館建設(shè)了“建國(guó)前廣東期刊庫(kù)”、大連圖書(shū)館建設(shè)了“館藏舊報(bào)刊目錄數(shù)據(jù)庫(kù)”、四川省圖書(shū)館建設(shè)了“館藏新中國(guó)成立前期刊(縮微品)目錄”、遼寧省圖書(shū)館建設(shè)了“館藏建國(guó)前東北地區(qū)期刊庫(kù)”等。也有公共圖書(shū)館沒(méi)有建庫(kù),但是已經(jīng)完成了書(shū)目數(shù)字化工作,如2003年首都圖書(shū)館館藏的2900余種期刊就全部數(shù)字化完畢,在此基礎(chǔ)上又進(jìn)一步開(kāi)發(fā)了多個(gè)專(zhuān)題數(shù)據(jù)庫(kù)。山東省圖書(shū)館在2013年也完成了館藏2500余種民國(guó)期刊的書(shū)目數(shù)字化工作,并以此為基礎(chǔ)近些年共完成了國(guó)家圖書(shū)館民國(guó)時(shí)期文獻(xiàn)保護(hù)中心資助的四個(gè)民國(guó)時(shí)期文獻(xiàn)整理出版項(xiàng)目。
2.1.3 專(zhuān)題數(shù)據(jù)庫(kù)
很多圖書(shū)館在專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)上獨(dú)具特色,有單獨(dú)的民國(guó)期刊專(zhuān)題數(shù)據(jù)庫(kù),有從民國(guó)文獻(xiàn)資料中析出的專(zhuān)題數(shù)據(jù)庫(kù)。目前單獨(dú)的民國(guó)期刊專(zhuān)題數(shù)據(jù)庫(kù)數(shù)量不多,有上海圖書(shū)館開(kāi)發(fā)的以學(xué)科為主題的專(zhuān)題期刊數(shù)據(jù)庫(kù)“近代民國(guó)中醫(yī)藥專(zhuān)題數(shù)據(jù)庫(kù)”和“上海年華——中國(guó)現(xiàn)代電影期刊全目書(shū)志”(非全文數(shù)據(jù)庫(kù))[3],前者從民國(guó)著名中醫(yī)藥學(xué)期刊中精選專(zhuān)題數(shù)據(jù)17萬(wàn)余條,全面收錄近代中醫(yī)藥重要期刊,是研究近代中醫(yī)藥史重要的檢索工具,后者共收錄電影類(lèi)期刊雜志300余種,全面客觀地展示中國(guó)現(xiàn)代電影類(lèi)期刊的發(fā)展歷程。
公共圖書(shū)館開(kāi)展民國(guó)圖書(shū)和民國(guó)期刊的數(shù)字化工作較早,民國(guó)報(bào)紙卻因出版頻率高、發(fā)行量大、收藏完整性難以保證、原件脆弱等原因,數(shù)字化工作進(jìn)展緩慢。
2.2.1 綜合性全文數(shù)據(jù)庫(kù)
民國(guó)報(bào)紙數(shù)據(jù)庫(kù)收錄規(guī)模最大的當(dāng)屬?lài)?guó)家圖書(shū)館建設(shè)的“近代報(bào)紙數(shù)據(jù)庫(kù)”和上海圖書(shū)館建設(shè)的“中國(guó)近代中文報(bào)紙全文數(shù)據(jù)庫(kù)”。國(guó)家圖書(shū)館的“近代報(bào)紙數(shù)據(jù)庫(kù)”共收錄民國(guó)報(bào)紙400余種,以國(guó)家圖書(shū)館的館藏為主,其他圖書(shū)館所藏的報(bào)紙為輔,收錄具有全國(guó)影響或在某一地域影響較大的報(bào)紙,提供基于標(biāo)題的篇目檢索,報(bào)紙篇目?jī)?nèi)容(包括引題、標(biāo)題和副題)進(jìn)行OCR文字識(shí)別,并能夠準(zhǔn)確定位到單篇內(nèi)容位置,方便使用者進(jìn)行查閱[4]。上海圖書(shū)館的“中國(guó)近代中文報(bào)紙全文數(shù)據(jù)庫(kù)”收錄了《新聞報(bào)》《時(shí)報(bào)》《大公報(bào)》《小報(bào)》《上海泰晤士報(bào)(英)》《大美晚報(bào)(英)》《民國(guó)日?qǐng)?bào)》《益世報(bào)(天津)》《中央日?qǐng)?bào)》《大陸報(bào)(英)》《上海晚郵(英)》《上海差報(bào)(英)》《中華快報(bào)(英)》13個(gè)報(bào)紙數(shù)據(jù)庫(kù),每種報(bào)紙都收錄了從創(chuàng)刊至終刊的所有版面?!兑媸缊?bào)》除收錄天津版外,還收錄了西安版、上海版,《大公報(bào)》收錄了天津、上海、漢口、香港、重慶、桂林多地出版的報(bào)紙?!缎?bào)》包含近千種民國(guó)時(shí)期有廣泛讀者的報(bào)紙。另外,國(guó)內(nèi)多個(gè)圖書(shū)館也開(kāi)展了民國(guó)報(bào)紙數(shù)字化工作,具體概況見(jiàn)表2。
表2 公共圖書(shū)館民國(guó)報(bào)紙綜合性全文數(shù)據(jù)庫(kù)建設(shè)概況
民國(guó)報(bào)紙數(shù)字化建設(shè)存在以下三個(gè)特點(diǎn):第一,民國(guó)報(bào)紙數(shù)字化主要是集中在館藏和數(shù)字化經(jīng)驗(yàn)較豐富的圖書(shū)館,民國(guó)報(bào)紙數(shù)字化工作要晚于民國(guó)期刊數(shù)字化。民國(guó)報(bào)紙的大規(guī)模整理和保護(hù)工作還未完全開(kāi)始,已數(shù)字化的報(bào)紙種類(lèi)均不多,存在扎堆大型官報(bào)或影響力大的報(bào)紙的情況;第二,目前已經(jīng)建設(shè)的民國(guó)報(bào)紙數(shù)據(jù)庫(kù)采用縮微膠片轉(zhuǎn)換形式較多,縮微膠片轉(zhuǎn)換可以保護(hù)民國(guó)報(bào)刊原件的二次損傷,但是縮微膠片受印本質(zhì)量、縮微倍率等因素限制,圖像的清晰度差異較大,文字識(shí)別難度比較大;第三,民國(guó)報(bào)紙數(shù)字化過(guò)程中遇到的問(wèn)題較多,如排版無(wú)規(guī)律、版面不確定、報(bào)紙副刊多、篇目?jī)?nèi)容、廣告、無(wú)標(biāo)題的照片、漫畫(huà)、題詞、簡(jiǎn)訊、信件等的處理等問(wèn)題深深影響著數(shù)字化工作的各個(gè)操作細(xì)節(jié)。
2.2.2 書(shū)目數(shù)據(jù)庫(kù)
目前完成報(bào)紙書(shū)目數(shù)字化的公共圖書(shū)館有10余家,如重慶圖書(shū)館的“民國(guó)報(bào)紙書(shū)目數(shù)據(jù)庫(kù)”、四川省圖書(shū)館建設(shè)的“館藏新中國(guó)成立前報(bào)紙(縮微品)目錄”、南京圖書(shū)館建設(shè)的“南京圖書(shū)館建國(guó)前中文報(bào)紙目錄”、廣東省立中山圖書(shū)館建設(shè)的“解放前廣東報(bào)紙庫(kù)”等。首都圖書(shū)館也完成了館藏200余種報(bào)紙的書(shū)目數(shù)字化工作,山東省圖書(shū)館完成了館藏300余種民國(guó)報(bào)紙的書(shū)目數(shù)字化工作。這些書(shū)目數(shù)據(jù)庫(kù)都是建設(shè)綜合性全文數(shù)據(jù)庫(kù)和專(zhuān)題數(shù)據(jù)庫(kù)的有力支撐。
2.2.3 專(zhuān)題數(shù)據(jù)庫(kù)
專(zhuān)題數(shù)據(jù)庫(kù)一般以大型有影響力的報(bào)紙為開(kāi)發(fā)對(duì)象,突出地方特色。民國(guó)報(bào)紙專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)有突出地方特色的報(bào)紙專(zhuān)題數(shù)據(jù)庫(kù),如上海圖書(shū)館建設(shè)的“字林洋行中英文報(bào)紙全文數(shù)據(jù)庫(kù)(1850-1951)”,收錄了7種中英文報(bào)紙,真實(shí)生動(dòng)還原了近代中國(guó)的歷史。首都圖書(shū)館建設(shè)的“北京記憶·昨日?qǐng)?bào)章”專(zhuān)題數(shù)據(jù)庫(kù),包括《京報(bào)》《順天時(shí)報(bào)》《北平日?qǐng)?bào)》《京話日?qǐng)?bào)》《群強(qiáng)報(bào)》《益世報(bào)》等報(bào)紙。寧波圖書(shū)館建設(shè)的“《申報(bào)》寧波史料(1872-1949)”主要收錄《申報(bào)》中所有寧波的史料。這些專(zhuān)題數(shù)據(jù)庫(kù)充分展示了公共圖書(shū)館的地方特色資源,充實(shí)了公共圖書(shū)館的數(shù)字化內(nèi)容。
部分圖書(shū)館民國(guó)報(bào)刊與民國(guó)圖書(shū)、古籍同時(shí)建設(shè),沒(méi)有單獨(dú)分類(lèi),如廈門(mén)圖書(shū)館建設(shè)的“館藏民國(guó)文獻(xiàn)數(shù)據(jù)庫(kù)”收錄有民國(guó)文獻(xiàn)1萬(wàn)多種包括圖書(shū)、期刊、報(bào)紙等不同載體的文獻(xiàn)。廣東省立中山圖書(shū)館建設(shè)的“縮微文獻(xiàn)全文數(shù)據(jù)庫(kù)”不僅包含民國(guó)期刊554種如《外交公報(bào)》《商業(yè)月報(bào)》《籌賑月刊》《賞奇畫(huà)報(bào)》等[5],民國(guó)報(bào)紙490種如《廣州民國(guó)日?qǐng)?bào)》《廣州民生日?qǐng)?bào)》《中山日?qǐng)?bào)》《廣東日?qǐng)?bào)》《粵江日?qǐng)?bào)》等,還包含民國(guó)圖書(shū)和古籍。廣東省立中山圖書(shū)館建設(shè)的另一個(gè)數(shù)據(jù)庫(kù)“特藏文獻(xiàn)數(shù)據(jù)庫(kù)”除了收錄民國(guó)期刊和解放前民國(guó)報(bào)紙外,還包括廣東圖書(shū)(解放前)、民國(guó)書(shū)目、廣東辛亥革命圖片等多種文獻(xiàn)類(lèi)型。
這種情況也存在于專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)中,如南京圖書(shū)館建設(shè)的“中國(guó)近代文獻(xiàn)圖像數(shù)據(jù)庫(kù)”收錄了143種館藏文獻(xiàn)中析出的歷史照片和圖像近12萬(wàn)張,涉及民國(guó)歷史、人物、藝術(shù)、商業(yè)等多個(gè)領(lǐng)域,包括“抗日戰(zhàn)爭(zhēng)歷史圖庫(kù)”“百年商標(biāo)”“老商標(biāo)老廣告數(shù)據(jù)庫(kù)”“紅色記憶圖片數(shù)據(jù)庫(kù)”“百年人物”等圖片庫(kù),基本涵蓋了民國(guó)時(shí)期出版的圖片資料[6];首都圖書(shū)館2017年自建的《世紀(jì)寫(xiě)真——民國(guó)時(shí)期的百態(tài)民生圖文庫(kù)》專(zhuān)題數(shù)據(jù)庫(kù),收錄反映民國(guó)時(shí)期社會(huì)發(fā)展的文章和圖片,有文教天地、社會(huì)萬(wàn)象、市井風(fēng)情、時(shí)事寫(xiě)真、影劇國(guó)粹、帝都舊影等幾個(gè)欄目;“上海圖書(shū)館藏淞滬抗戰(zhàn)圖片庫(kù)”以圖片形式再現(xiàn)兩次淞滬戰(zhàn)役的全貌,從館藏的中、英、日語(yǔ)歷史文獻(xiàn)中選錄相關(guān)圖片達(dá)8000余幀;廣西壯族自治區(qū)圖書(shū)館“廣西民國(guó)照片數(shù)據(jù)庫(kù)”匯集民國(guó)時(shí)期老照片1228張;重慶圖書(shū)館研發(fā)的“中國(guó)抗戰(zhàn)大后方3D數(shù)字圖書(shū)館”,既包括抗戰(zhàn)時(shí)期出版的各種報(bào)紙和期刊,還有抗戰(zhàn)時(shí)期的視頻資料和名人手跡等。
根據(jù)上述介紹和分析,公共圖書(shū)館建設(shè)的民國(guó)報(bào)刊數(shù)據(jù)庫(kù)已經(jīng)提供了很多可供參考的經(jīng)驗(yàn),公共圖書(shū)館在進(jìn)行數(shù)字化建設(shè)時(shí)還應(yīng)考慮以下四個(gè)方面:
已經(jīng)建設(shè)的民國(guó)報(bào)刊數(shù)據(jù)庫(kù),基本都是基于本館館藏建設(shè)的,有許多與其它館重復(fù)的報(bào)刊。比如《大公報(bào)》,首都圖書(shū)館的“北京記憶·昨日?qǐng)?bào)章”專(zhuān)題數(shù)據(jù)庫(kù)、上海圖書(shū)館的“中國(guó)近代中文報(bào)紙全文數(shù)據(jù)庫(kù)”、天津圖書(shū)館的“民國(guó)報(bào)紙數(shù)據(jù)庫(kù)”都收錄了該報(bào)。造成這種情況的一部分原因是無(wú)法準(zhǔn)確查到各館館藏情況。目前民國(guó)報(bào)刊只有《全國(guó)中文期刊聯(lián)合目錄(1833-1949)增訂本》和《解放前中文報(bào)紙聯(lián)合目錄草目》兩個(gè)收錄比較全面的目錄,民國(guó)報(bào)刊底數(shù)不清,存藏情況不明。2018年國(guó)家圖書(shū)館民國(guó)文獻(xiàn)保護(hù)中心啟動(dòng)了民國(guó)報(bào)刊普查工作,有十幾家單位申報(bào)試點(diǎn),綜合評(píng)估后有國(guó)家圖書(shū)館、上海圖書(shū)館、重慶圖書(shū)館、山東省圖書(shū)館、廣東省立中山圖書(shū)館等八家單位先做起來(lái),目前國(guó)家圖書(shū)館已經(jīng)完成報(bào)刊數(shù)據(jù)普查,上海圖書(shū)館和重慶圖書(shū)館已經(jīng)提交了部分?jǐn)?shù)據(jù)。通過(guò)全國(guó)性民國(guó)報(bào)刊的普查和整理工作,可以為民國(guó)報(bào)刊整理開(kāi)發(fā)的總體規(guī)劃、各收藏單位的特色專(zhuān)題規(guī)劃提供分析依據(jù)。準(zhǔn)備進(jìn)行民國(guó)報(bào)刊數(shù)字化的公共圖書(shū)館建設(shè)時(shí)可以有的放矢,還可以查漏補(bǔ)缺,保證每種報(bào)刊的連續(xù)性和完整性。
已建設(shè)的民國(guó)報(bào)刊數(shù)據(jù)庫(kù),數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)質(zhì)量也有差別。數(shù)字化程度也不盡相同,有的能實(shí)現(xiàn)題名檢索,有的只能實(shí)現(xiàn)報(bào)刊名檢索,只有少數(shù)能實(shí)現(xiàn)全文檢索。民國(guó)報(bào)刊數(shù)字化目的是盡量減少文獻(xiàn)原件的流通使用,因此應(yīng)該在項(xiàng)目立項(xiàng)之初慎重考慮,做好調(diào)研工作,高標(biāo)準(zhǔn)地制定技術(shù)標(biāo)準(zhǔn),數(shù)據(jù)庫(kù)建設(shè)的標(biāo)準(zhǔn)化包括掃描工作的標(biāo)準(zhǔn)化、數(shù)據(jù)著錄的標(biāo)準(zhǔn)化和質(zhì)檢工作的標(biāo)準(zhǔn)化。掃描工作最好一步到位,考慮到數(shù)據(jù)質(zhì)量以及未來(lái)靈活轉(zhuǎn)換,掃描格式建議為RAW無(wú)損格式,建議存檔文件選取色彩為24位彩色,格式選擇為T(mén)IFF、JPEG2000,圖像分辨率至少要達(dá)到600dpi,為民國(guó)報(bào)刊的后期開(kāi)發(fā)利用和長(zhǎng)期保存奠定堅(jiān)實(shí)的基礎(chǔ)。建庫(kù)時(shí)上傳數(shù)據(jù)最好選擇PDF格式,這樣各種瀏覽器、數(shù)據(jù)庫(kù)都能兼容支持。數(shù)據(jù)著錄和質(zhì)檢工作可利用計(jì)算機(jī)技術(shù)和現(xiàn)代化手段提高數(shù)據(jù)質(zhì)量。
專(zhuān)題數(shù)據(jù)庫(kù)的建設(shè)已經(jīng)開(kāi)始受到關(guān)注并將有統(tǒng)籌地推進(jìn),為專(zhuān)業(yè)學(xué)科或某一領(lǐng)域的研究提供更全面和專(zhuān)業(yè)的資源。專(zhuān)題數(shù)據(jù)庫(kù)的建設(shè)可借鑒民國(guó)報(bào)刊影印出版物的選題模式[7]。近年國(guó)家圖書(shū)館出版社、線裝書(shū)局、中華書(shū)局、岳麓書(shū)院、上海辭書(shū)出版社等各大出版社出版了很多民國(guó)報(bào)刊專(zhuān)題匯編。如國(guó)家圖書(shū)館出版社出版的《民國(guó)時(shí)期漫畫(huà)雜志匯編》《國(guó)立北平圖書(shū)館英文期刊匯編》《民國(guó)期刊資料分類(lèi)匯編》《民國(guó)時(shí)期山東革命根據(jù)地紅色期刊匯編》《二戰(zhàn)后日本戰(zhàn)犯審判報(bào)刊資料匯編》、線裝書(shū)局出版的《中國(guó)近現(xiàn)代女性期刊匯編》、中國(guó)書(shū)店出版的《民國(guó)國(guó)術(shù)期刊文獻(xiàn)集成》《民國(guó)佛教期刊文獻(xiàn)集成》、上海辭書(shū)出版社出版的《中國(guó)近代中醫(yī)藥期刊匯編》等[8]。這些專(zhuān)題匯編也可以做成專(zhuān)題數(shù)據(jù)庫(kù)更好地為讀者利用。
近年,隨著信息技術(shù)的發(fā)展,開(kāi)展古籍和民國(guó)文獻(xiàn)數(shù)字化的公司也增多了,同時(shí)已經(jīng)破解了很多技術(shù)難題。圖書(shū)館除了自建數(shù)據(jù)庫(kù)外,在開(kāi)展民國(guó)報(bào)刊數(shù)字化時(shí),需要多考察有經(jīng)驗(yàn)且技術(shù)成熟的數(shù)字化加工公司合作來(lái)保證數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量。目前,全國(guó)有很多數(shù)字化公司能夠?qū)崿F(xiàn)民國(guó)報(bào)刊數(shù)字化工作,有多個(gè)數(shù)字化方案可供選擇,比如,國(guó)家圖書(shū)館依托中國(guó)數(shù)字圖書(shū)有限責(zé)任公司開(kāi)展了民國(guó)報(bào)刊的數(shù)字化工作,重慶圖書(shū)館依托重慶西信天元數(shù)據(jù)資訊有限公司開(kāi)展了民國(guó)報(bào)刊數(shù)字化工作,浙江圖書(shū)館、寧波市圖書(shū)館和杭州市圖書(shū)館依托杭州中元數(shù)據(jù)科技有限公司開(kāi)展了民國(guó)報(bào)刊數(shù)字化工作,遼寧省圖書(shū)館和首都圖書(shū)館依托超星公司數(shù)字集團(tuán)進(jìn)行了數(shù)字化工作等。