丁小蕾
關鍵詞:地方文獻;民國文獻;報紙;數(shù)字化;數(shù)字資源建設
摘要:民國報紙在長期積累中形成完整系統(tǒng)的地方史料,已成為地方文獻近代資料專藏的主體之一。但是隨著時代的變遷,很多民國報刊都面臨著遺失或是損壞的危險,從保護歷史文化、搶救珍貴文獻的角度來看,民國報刊的數(shù)字化有著十分重要而緊迫的意義。文章以作者實際經(jīng)驗闡述圖書館應如何進行民國報紙數(shù)字化工作,并針對民國報紙數(shù)字化資源在地方文獻工作中的作用提出個人的認識。
中圖分類號:G250.7文獻標識碼:A文章編號:1003-1588(2016)12-0098-03
1民國報紙在地方文獻中的重要地位及數(shù)字化的意義
報紙是地方文獻專藏建設中不可或缺的類型之一,包括地方上出版的綜合性報紙及內(nèi)容上具有地域特征的專業(yè)性報紙。由于具有涵蓋內(nèi)容廣泛,出版周期短,信息報導及時等特點,使得報紙的情報性極強。民國報紙作為地方文獻中近代資料的重要一環(huán),以當時人報道當時事物,在內(nèi)容上相對客觀、準確。隨著連續(xù)性的出版,民國報紙在長期積累中形成完整系統(tǒng)的地方史料,已成為地方文獻近代資料專藏的主體之一。隨著時代的變遷,很多民國報刊都面臨著遺失或是損壞的危險,從保護歷史文化、搶救珍貴文獻的角度來看,民國報刊的數(shù)字化有著十分重要而緊迫的意義。
2國內(nèi)圖書館民國報紙資源建設及服務現(xiàn)狀
目前,國內(nèi)圖書館對民國報紙的數(shù)字資源建設大體分為:外購商業(yè)數(shù)據(jù)庫和自建數(shù)據(jù)庫兩種。從單一品種的資源完整性和用戶體驗角度看,商業(yè)數(shù)據(jù)庫明顯優(yōu)于自建數(shù)據(jù)庫。但自建數(shù)據(jù)庫也有其優(yōu)勢,主要體現(xiàn)在對資源的選取上。自建數(shù)據(jù)庫一般以地方資源建設為方向,因而有其獨特性。
筆者選取國家圖書館、北京大學圖書館以及首都圖書館、上海圖書館四家圖書館,從數(shù)字化報刊品種、資源數(shù)量以及服務方式等方面看民國報紙資源建設現(xiàn)狀(見表1)。
在對以上數(shù)據(jù)進行采集時,筆者發(fā)現(xiàn)當前圖書館報刊數(shù)字資源以期刊為主,報紙資源在品種上所占比例較小。從服務方式上看,能夠提供跨地域免費公開信息的圖書館比例較小。而兩個省館所建設的報紙資源均為在當?shù)貏?chuàng)刊、發(fā)行的報紙,屬地方文獻范疇。
3地方文獻民國報紙數(shù)字化建設實踐
3.1加工品種選取并調(diào)研
本階段需要依照一定的原則或需求選取報紙加工品種,并對選取品種的現(xiàn)有紙質(zhì)破損情況、印刷清晰度情況、內(nèi)容的信息價值情況及連續(xù)性情況有基本的了解,就選取原則而言具備以下情況者優(yōu)先選擇:①年代為清末民初的且只以紙質(zhì)載體形態(tài)保存的品種宜最先選取。民國時期老報紙保存期限較短,受到空氣中有害物質(zhì)及濕度等環(huán)境因素的影響,加之讀者的反復翻閱,年代越久遠的越不容易保存。②具有地域特征的專業(yè)性報紙品種優(yōu)先考慮。該類報紙一般不易被其他地域外機構(gòu)所關注,因而降低重復建設的概率。③館藏文獻內(nèi)容完整性強的品種優(yōu)先考慮。圖書館文獻數(shù)字化脫離不開堅實的館藏建設。報紙作為連續(xù)出版物,館藏收錄的完整與否決定了品種的收藏質(zhì)量,零散或缺失嚴重的報紙種類一般不會優(yōu)選選取,除非具有極高的珍稀性。
在確定對某種報紙進行數(shù)字化加工后,還要對報紙的不同載體版本進行選擇。報紙的文獻載體形態(tài)有紙質(zhì)和縮微膠片兩種。目前國外的一些圖書館數(shù)字化項目,如:澳大利亞國家圖書館的報紙信息化項目采用縮微膠片進行數(shù)字化制作,原因是縮微復制比原報掃描要快速且價格低廉。但從實際數(shù)字化后的圖像質(zhì)量來看,縮微復制差于原報掃描,這種情況在原件印刷質(zhì)量較差的文獻上表現(xiàn)得尤為明顯。因此,對于加工文獻載體類型的選取上,筆者建議在紙質(zhì)報刊形態(tài)較完好的情況下遵循紙質(zhì)文獻即原始形態(tài)優(yōu)先的原則。
3.2加工標準制定并掃描
所制定的加工標準應包括:文件掃描標準、唯一標識符標注規(guī)則和存儲規(guī)則。以上標準規(guī)范均是在加工過程中必須要參照的,因此在掃描前要將標準和規(guī)則制定完備。
3.2.1文件掃描標準。根據(jù)中華人民共和國文化部發(fā)布的行業(yè)標準《WH/T46-2012圖像數(shù)據(jù)加工規(guī)范》要求,報紙數(shù)字化掃描標準具體內(nèi)容見表2??紤]到數(shù)據(jù)質(zhì)量以及未來靈活轉(zhuǎn)換,筆者建議存檔文件選取色彩為24位彩色。
3.2.2唯一標識符標注規(guī)則。對象數(shù)據(jù)的唯一標識可以理解為掃描圖像或元數(shù)據(jù)文件定義的名稱。清晰的唯一標識體系能夠使資源管理者僅通過文件名稱便可了解數(shù)據(jù)對應的紙質(zhì)文獻信息,從而節(jié)省了大量數(shù)據(jù)查找時間。唯一標識符一般為數(shù)字型,包括資源信息和數(shù)據(jù)序列兩部分,如報紙品種代碼+出版時間+版號+其他輔助信息。
3.2.3存儲規(guī)則。文獻加工前需制定統(tǒng)一的存儲規(guī)則,以便于加工數(shù)據(jù)的管理。報紙數(shù)據(jù)一般按照報紙品種、數(shù)據(jù)格式、對象數(shù)據(jù)文件三級順序進行存儲。數(shù)據(jù)存儲時應將加工過程中的說明文件一并存入。
3.2.4元數(shù)據(jù)設計并著錄。元數(shù)據(jù)是數(shù)字資源需求分析和系統(tǒng)設計時需要首先考慮的因素,是數(shù)據(jù)加工制作和系統(tǒng)設計與功能實現(xiàn)的基礎。元數(shù)據(jù)方案決定了系統(tǒng)的整個架構(gòu)以及系統(tǒng)設計的需求,設計時必須詳盡地考慮和滿足資源管理、保存、揭示、檢索、利用等各方面需求。這里所設計的元數(shù)據(jù)并非將報紙作為一種文獻載體進行揭示,而是將報紙的內(nèi)容作為可查閱、檢索的信息載體而進行描述。
根據(jù)文獻加工深度不同,報紙元數(shù)據(jù)的設計一般分為三個層級:版次級、篇目級和全文級。版次級元數(shù)據(jù)一般所具有的元素詳見表3。篇目級元數(shù)據(jù)可分為以版為單位設計的元數(shù)據(jù)和以單篇文章為單位設計的元數(shù)據(jù),后者較于前者靈活性更強,因此,篇目級元數(shù)據(jù)一般以文章為單位進行描述。全文級元數(shù)據(jù)可視為文獻內(nèi)容信息揭示的最高級,為文獻檢索提供最便利的條件。在元素設定上一般是在篇目級元數(shù)據(jù)設計基礎上加上全文字段,標注時注意關聯(lián)資源和全文部分要相互對應即可,篇目級元數(shù)據(jù)所具有的元素詳見表4。
4民國報紙中地方信息選取
在進行篇目一級元數(shù)據(jù)制作時,圖書館地方文獻工作者對于是否進行民國報紙資源中地方信息的專門性提取存在兩種態(tài)度:一種認為應該進行提取,理由是希望在選取過程中排除報紙里與地方資料無關的信息,從而建立地方文獻精粹資源。但在信息選取過程中勢必會受到選取人員對地方信息了解程度、知識層次深淺的影響,造成收錄不全面的現(xiàn)象。而不認為有提取必要的人覺得全盤元數(shù)據(jù)制作可以不受人員限制,最大限度地避免資源的缺失,同時還可以保留報紙數(shù)字化品種在內(nèi)容上的完整性。但是這樣也確實造成大量與地方無關數(shù)據(jù)的產(chǎn)生,并加大了資金的投入。兩種選取方式各有利弊,因此在做資源建設時需根據(jù)自身情況加以考慮。
在收錄范圍上有關本地區(qū)過去的、現(xiàn)在的、人文的、自然的有文獻使用價值的資料均應在選擇范圍之內(nèi)。其中自然地理的資料選擇宜寬。如:跨區(qū)域的河流、山脈;在體裁方面包括新聞報道、時評社論、紀事調(diào)查、雜文、文學(詩詞、小說)等。關于軍政事件、政治運動資料的選擇:一般以本地區(qū)發(fā)生的軍政事件、政治運動為主要選擇對象。關于國際交流資料的選擇:本地區(qū)各種代表團、機構(gòu)及知名人士在外地(包括國外)的活動資料應詳盡選擇,這類資料大多可反映本地區(qū)的經(jīng)濟發(fā)展水平,在全國或國際上的影響以及區(qū)域間、國際間經(jīng)濟交流的狀況。關于文化交流資料的選擇:本地區(qū)文化團體在外地(包括在國外)舉辦或參加的各項展覽、演出、體育比賽等活動資料,均應列入地方文獻,在本地區(qū)舉辦的各種上述活動也應予以收集。關于各種學術(shù)會議資料的選擇:中央召集的各種全國性會議,凡涉及本地區(qū)或有本地區(qū)代表參加的各項活動、言論等資料;本地區(qū)舉辦的,有一定學術(shù)價值和史料價值的會議資料亦應選擇。關于人物界限的選擇:不論籍貫、居住時間長短,反對地方歷史形成影響力,且不論好壞的人士均可收錄。
5民國報紙數(shù)字資源在地方文獻工作中的服務
5.1為地方參考咨詢工作的檢索提供極大便利
在以往的參考咨詢工作中,當咨詢?nèi)藛T面對浩如煙海的報紙資源進行信息查找時會望而卻步。基于此種原因,首都圖書館在70年代開展了《北京報刊資料索引》的制作工作,盡管當時因條件制約只能制作索引目錄,卻也為咨詢工作帶來極大的便利。如今,隨著數(shù)字成像技術(shù)的發(fā)展,通過計算機掃描的報紙影像數(shù)據(jù)已經(jīng)完全可以替代紙質(zhì)報紙,通過一系列檢索機制能夠快速查找資源,并按需獲取必要的電子文獻。如:首都圖書館北京地方文獻中心在為用戶進行《北京地區(qū)道教遺跡資料》《歐美同學會·中國留學人員聯(lián)誼會歷史文化資料匯編》《國子監(jiān)、孔廟清末、民國年間相關資料查詢》等課題咨詢時,曾大量使用首都圖書館數(shù)字化加工的《益世報》《京報》等報紙資源,在對內(nèi)容檢索之后可以直接調(diào)取電子文件或?qū)ζ溥M行紙質(zhì)復制,這與圖書館傳統(tǒng)剪報服務相比大大提高了咨詢工作的效率,同時也避免了因多次翻閱、裁剪或靜電復印而給舊報帶來的傷害。
5.2是建設地方特色專題數(shù)據(jù)庫的有力文獻支撐
建設并利用好民國報紙數(shù)字資源,不但可以為地方文獻的參考咨詢工作帶來益處,同時也為圖書館特色資源專題數(shù)據(jù)庫建設提供有力支撐。特色資源一般指地域性較強的資源或某一專業(yè)領域的資源。報紙具有信息量大、報道及時、信息連續(xù)、出版周期快等特點,使它在信息內(nèi)容的廣泛性、新穎性以及時效性方面遠遠優(yōu)于一般書刊資料。面對這樣一種文獻,無論是在內(nèi)容上汲取專題性資源進行整合或是以地域為限定將報紙資源品種進行綜合性分類展示,都將是特色數(shù)字資源建設的一筆重彩。
5.3為地方文獻的復制再版提供可能
在數(shù)字資源鋪天蓋地的今天,圖書館員在實際工作中發(fā)現(xiàn)目前紙質(zhì)文獻的閱讀需求依然遠遠大于電子形式的文獻。民國報紙限于當時造紙材料和制作工藝等原因,時至今日很多已難以保存和修復,導致其使用價值的流失。而報紙作為記錄人類文明活動和人類思想的重要文獻載體,如果因其原始形態(tài)的消融而使內(nèi)容信息丟失實屬可惜。為此,首都圖書館做了相關工作,如對《戲劇旬刊》《劇學月刊》等民國刊物進行了再版。盡管再版的這些不是報紙,但卻能讓我們對行將消失的民國報紙文獻的重生看到了希望。
6結(jié)語
民國時期的報紙對于研究當時的歷史、人文風物具有極其重要的參考價值。曾經(jīng)有位讀者感慨自己在圖書館閱讀一年的民國報紙勝過之前十年的圖書文獻研究。由此可見,報紙作為圖書館文獻專藏的主體之一,其文獻史料涵蓋廣泛,內(nèi)容的豐富是其他文獻資源所無法比擬的。地方信息現(xiàn)已被廣泛利用和重視,地方文獻的數(shù)字化工作不僅有助于民國文獻內(nèi)容的保存及利用,同時還將跨越時間和地域的限制,將地方文化遠播至世界各地。
參考文獻:
[1]王玲麗.民國報刊文獻數(shù)字化建設探究[J].信息技術(shù)與信息化,2015(2):235-238.
[2]周崇潤.談談圖書館紙質(zhì)文獻的酸化與脫酸[J].圖書館界,2004(4):55-56.
[3]錢承軍.高校圖書館應重視對民國文獻的保護與利用[J].山東圖書館學刊,2008(1):76.
[4]郭偉德.民國文獻數(shù)字化是文化遺產(chǎn)的保存和延續(xù)[J].四川圖書館學報,2009(6):32-33.
[5]張丁,王兆輝.試論民國文獻的數(shù)字化建設[J].數(shù)字與縮微影像,2011(1):22-23.
(編校:崔萌)