李芳+陳進(jìn)+王昕
摘要 長(zhǎng)期以來(lái),圖書(shū)館對(duì)地方歷史文獻(xiàn)重發(fā)現(xiàn)和收藏、輕科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示和充分利用。此文以上海交通大學(xué)圖書(shū)館新藏地方歷史文獻(xiàn)的整理和數(shù)字化建設(shè)為例,分析地方歷史文獻(xiàn)的特點(diǎn)及對(duì)其數(shù)字化的方案,通過(guò)行業(yè)掃描和自身環(huán)境分析,在數(shù)字化建設(shè)通用原則的基礎(chǔ)上,提出了“求真”、“求用”的補(bǔ)充性原則,從資料整理、數(shù)字化標(biāo)準(zhǔn)、元數(shù)據(jù)規(guī)范、質(zhì)量審核、資源保存和過(guò)程管理六個(gè)方面,系統(tǒng)深入地論述了地方歷史文獻(xiàn)的數(shù)字化管理和規(guī)范體系建設(shè)。
關(guān)鍵詞 地方歷史文獻(xiàn) 數(shù)字化 上海交通大學(xué)圖書(shū)館
l 引言
近十年來(lái),地方歷史文獻(xiàn)的發(fā)現(xiàn)、收藏?cái)?shù)量呈井噴態(tài)勢(shì),“徽州、清水江流域、浙南,是目前發(fā)現(xiàn)量最大的三個(gè)地域,總數(shù)已超過(guò)100萬(wàn)件”[1],其中徽州文書(shū)被譽(yù)為是“繼甲骨文字、漢晉簡(jiǎn)帛、敦煌文書(shū)、明清檔案之后中國(guó)文獻(xiàn)史上第五大發(fā)現(xiàn)”[2]。但是在規(guī)模不斷增長(zhǎng)的地方歷史文獻(xiàn)中,經(jīng)過(guò)整理、出版和數(shù)字化的只是極少部分,對(duì)地方歷史文獻(xiàn)重發(fā)現(xiàn)收藏、輕科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示和充分利用。近年來(lái),“史學(xué)研究與數(shù)字化時(shí)代同步推進(jìn)趨勢(shì)日益明顯”[3],數(shù)字資源已成為學(xué)術(shù)交流與研究的重要基礎(chǔ),作為為歷史研究提供原始文獻(xiàn)資料加工的基礎(chǔ)工作,地方歷史文獻(xiàn)的數(shù)字化是當(dāng)務(wù)之急。
上海交通大學(xué)圖書(shū)館目前新藏地方歷史文獻(xiàn)33萬(wàn)件,主要來(lái)自浙江、安徽、福建、江西,此外還有湖北、河北、遼寧、云南等多個(gè)省份,最北至遼寧喀喇沁左旗,最南至云南蒙自縣。入藏文獻(xiàn)已覆蓋浙江、安徽、福建、江西四省總計(jì)36%的縣份,是目前最能夠系統(tǒng)反映東南地區(qū)傳統(tǒng)社會(huì)的文獻(xiàn)群。上海交通大學(xué)圖書(shū)館聯(lián)合上海交通大學(xué)歷史系,依托?!?85計(jì)劃”三期專(zhuān)項(xiàng)建設(shè)項(xiàng)目——契約文書(shū)的數(shù)字化加工及編目、教育部CALIS三期專(zhuān)題特色數(shù)據(jù)庫(kù)建設(shè)項(xiàng)目等,對(duì)館藏地方歷史文獻(xiàn)開(kāi)展了系統(tǒng)的整理、保護(hù)性修復(fù)和數(shù)字化工作。在文獻(xiàn)調(diào)研和分析的基礎(chǔ)上,探索和總結(jié)出一套完整的數(shù)字化管理和規(guī)范體系,以期激發(fā)圖書(shū)館界對(duì)地方特色文獻(xiàn)的組織和揭示的重視,為地方歷史文獻(xiàn)的數(shù)字化建設(shè)提供參考。
2 文獻(xiàn)特點(diǎn)及其對(duì)數(shù)字化的影響
2.1 特點(diǎn)
地方歷史文獻(xiàn)主要產(chǎn)生于民間的日常生活,目前尚無(wú)達(dá)成學(xué)界共識(shí)的定義,在不同的語(yǔ)境中也被稱(chēng)為民間歷史文獻(xiàn)、民間文書(shū)、歷史文書(shū)檔案等。主要包括買(mǎi)賣(mài)契約、賬本、家譜、書(shū)信、收據(jù)、分家文書(shū)等,學(xué)者可從中窺見(jiàn)民間的歷史記憶,復(fù)原活生生的、豐富多彩的民間社會(huì)生活。從整理和數(shù)字化的角度看,地方歷史文獻(xiàn)的特點(diǎn)也明顯區(qū)別于其他文獻(xiàn):
(1) 民間性。地方歷史文獻(xiàn)的創(chuàng)造主體或使用主體是普通老百姓。未經(jīng)過(guò)知識(shí)再整理的過(guò)程,是地方歷史文獻(xiàn)民間性最顯著的特點(diǎn),其原始留存狀態(tài)往往是學(xué)術(shù)研究中重要的線(xiàn)索。
(2) 歸戶(hù)性。整理者和研究者將收集到的文獻(xiàn)以家族為單位進(jìn)行分類(lèi)整理,這一過(guò)程稱(chēng)為歸戶(hù)[4]。民間文獻(xiàn)的特性在于其具有特定的生產(chǎn)使用機(jī)制、流傳方式、保存系統(tǒng),尤其是同一家庭的各種文獻(xiàn)之間有內(nèi)在的系統(tǒng)性和關(guān)聯(lián)性。
(3) 非組織化。地方歷史文獻(xiàn)是一種非組織化的知識(shí)載體,不存在學(xué)術(shù)傳承脈絡(luò)?,F(xiàn)代文獻(xiàn)分類(lèi)使用《中國(guó)圖館分類(lèi)法》以及古籍圖書(shū)使用的四部分類(lèi)法等具有共同的特點(diǎn),它們主要是針對(duì)有組織的知識(shí)載體的分類(lèi)體系,無(wú)法適用于地方歷史文獻(xiàn),需要設(shè)計(jì)新的分類(lèi)法。
(4) 動(dòng)態(tài)性。地方歷史文獻(xiàn)的時(shí)間跨度長(zhǎng),跨越明、清,延至民國(guó)時(shí)期,數(shù)量龐大,分散于民間,隨著學(xué)者的不斷收集和發(fā)掘,其收藏?cái)?shù)量與涉及的內(nèi)容,都將持續(xù)擴(kuò)增,因此是一個(gè)動(dòng)態(tài)的概念。
2.2 對(duì)文獻(xiàn)整理和數(shù)字化的影響
地方歷史文獻(xiàn)從其載體形態(tài)到文獻(xiàn)內(nèi)容都與現(xiàn)代文獻(xiàn)、外國(guó)文獻(xiàn)不同,與成冊(cè)的古籍文獻(xiàn)不同,分析其文獻(xiàn)特點(diǎn)及其對(duì)數(shù)字化的影響,是文獻(xiàn)整理和數(shù)字化管理的基礎(chǔ)和前提。
(1) 原始狀態(tài)的記錄和保存??紤]到原始留存狀態(tài)對(duì)文獻(xiàn)研究的重要作用,為避免原始留存記錄受到文獻(xiàn)買(mǎi)賣(mài)中介的阻斷和影響,有必要在收購(gòu)過(guò)程中,對(duì)文獻(xiàn)中介持有人進(jìn)行深入了解和記錄;在清點(diǎn)、登記、入藏、修復(fù)和數(shù)字化過(guò)程中,保存文獻(xiàn)原始的留存狀態(tài),保持文獻(xiàn)狀態(tài)在數(shù)字化前后的一致性。
(2) 歸戶(hù)與文獻(xiàn)編目:歸戶(hù)有利于揭示文獻(xiàn)內(nèi)在的關(guān)聯(lián)性,因此地方歷史文獻(xiàn)的整理和編目必須歸戶(hù),并以村落為中心,元數(shù)據(jù)集的設(shè)計(jì)必須考慮歸戶(hù)信息,才能保證文書(shū)具有完整性和配套性,從而避免打破文獻(xiàn)之間既有的有機(jī)聯(lián)系。
(3) 分類(lèi)及其擴(kuò)展性。設(shè)計(jì)新的分類(lèi)體系來(lái)組織和揭示地方歷史文獻(xiàn)應(yīng)考慮人工判定的快速有效;數(shù)字化信息時(shí)代,分類(lèi)法的應(yīng)用與數(shù)據(jù)庫(kù)開(kāi)發(fā)、知識(shí)庫(kù)的構(gòu)建有關(guān),便于檢索和知識(shí)組織體系的兼容都是必須考慮的因素。此外,地方歷史文獻(xiàn)的動(dòng)態(tài)性為其分類(lèi)法的編制提出了挑戰(zhàn),我們不能僅僅著眼于已入藏的文獻(xiàn),還要考慮較強(qiáng)的可擴(kuò)展性。
3 地方歷史文獻(xiàn)的數(shù)字化建設(shè)規(guī)劃
地方歷史文獻(xiàn)具有的民間性和原生態(tài)、動(dòng)態(tài)性和非組織化,使其數(shù)字化處理和編目的難度更大,但也因此更具探索性和挑戰(zhàn)性。面對(duì)規(guī)??捎^、獨(dú)具特色、珍貴稀缺的史料,其數(shù)字化建設(shè)發(fā)展規(guī)劃要有充分的調(diào)研和多角度的整體考量,既要符合數(shù)字圖書(shū)館的發(fā)展特點(diǎn),又能滿(mǎn)足歷史學(xué)研究的需求;既要為人文社會(huì)科學(xué)的信息化、數(shù)字化發(fā)展提供支持,也要為今后的資源共享提供服務(wù),以滿(mǎn)足多層次的需求。為制定數(shù)字化建設(shè)的規(guī)劃,上海交通大學(xué)圖書(shū)館開(kāi)展了行業(yè)掃描,行業(yè)包括圖書(shū)館和史學(xué)研究領(lǐng)域,以明確建設(shè)目標(biāo);并對(duì)所處的內(nèi)部環(huán)境進(jìn)行剖析,確定關(guān)鍵問(wèn)題和突破點(diǎn)。
3.1 行業(yè)掃描:明確目標(biāo)和關(guān)鍵點(diǎn)
行業(yè)掃描是一種橫向考察和比較,通過(guò)與同行進(jìn)行比較分析,發(fā)現(xiàn)地方歷史文獻(xiàn)數(shù)字化建設(shè)的現(xiàn)狀和存在的問(wèn)題,同時(shí)還可以參考相關(guān)機(jī)構(gòu)的做法,制定更具特色和前瞻性的發(fā)展規(guī)劃和目標(biāo)。地方歷史文獻(xiàn)數(shù)字化建設(shè)的行業(yè)掃描不應(yīng)僅局限于圖書(shū)館行業(yè),還應(yīng)擴(kuò)展到歷史學(xué)研究機(jī)構(gòu)。endprint
首先,我們對(duì)圖書(shū)館行業(yè)、地方歷史文獻(xiàn)研究機(jī)構(gòu)進(jìn)行了調(diào)研,調(diào)研數(shù)據(jù)顯示[5],國(guó)內(nèi)徽州民間歷史文獻(xiàn)的收藏單位約20家,極少數(shù)單位開(kāi)展了數(shù)字化和數(shù)據(jù)庫(kù)建設(shè),且均處于小批量嘗試階段,摸索和總結(jié)地方歷史文獻(xiàn)數(shù)字化的科學(xué)管理流程和規(guī)范,既具有基礎(chǔ)性,又具有前沿性。通過(guò)網(wǎng)上調(diào)研、文獻(xiàn)調(diào)研和實(shí)地考察我們發(fā)現(xiàn),地方歷史文獻(xiàn)的數(shù)字化和數(shù)據(jù)庫(kù)建設(shè)存在一些問(wèn)題,大體可概括為:
1) 缺乏針對(duì)地方歷史文獻(xiàn)的數(shù)字化標(biāo)準(zhǔn)。在過(guò)去的十年中,世界各國(guó)各地的圖書(shū)館及機(jī)構(gòu),如美國(guó)國(guó)會(huì)圖書(shū)館、英國(guó)的AHRC(Arts and HumanitiesResearch Council)、歐洲的TAPE(Training for Audiovisual Preservation in Europe)項(xiàng)目、美國(guó)馬里蘭大學(xué)圖書(shū)館和哈佛大學(xué)圖書(shū)館等開(kāi)展了一系列數(shù)字化項(xiàng)目,積累了大量的數(shù)字資源和標(biāo)準(zhǔn)規(guī)范成果。在國(guó)內(nèi),國(guó)家科技部的《我國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)與規(guī)范建設(shè)》(CDLS)項(xiàng)目和國(guó)家數(shù)字圖書(shū)館工程標(biāo)準(zhǔn)規(guī)范項(xiàng)目等也在這方面取得了階段性進(jìn)展。但是在現(xiàn)有的數(shù)字資源加工標(biāo)準(zhǔn)規(guī)范中,通用數(shù)字資源一般包括文本、圖像、視頻和音頻等。而地方歷史文獻(xiàn)并非普通的文本資源,由于來(lái)自民間,其載體多樣(紙、皮、布)、幅面不規(guī)則、顏色深淺不一,沒(méi)有現(xiàn)成的標(biāo)準(zhǔn)可以直接用于其數(shù)字化,給文獻(xiàn)數(shù)字化標(biāo)準(zhǔn)的選擇和加工帶來(lái)難度。
2) 學(xué)界尚無(wú)統(tǒng)一的分類(lèi)標(biāo)準(zhǔn)。地方歷史文獻(xiàn)的分類(lèi)復(fù)雜,20世紀(jì)90年代初,“徽學(xué)界提出了兩種分類(lèi)方法《徽學(xué)文書(shū)類(lèi)目》和《徽州歷史檔案總目提要》”[1],這是大陸學(xué)界較早編制的民間文書(shū)目錄與分類(lèi)體系,根據(jù)文獻(xiàn)敘述內(nèi)容進(jìn)行分類(lèi),代表了當(dāng)時(shí)大陸學(xué)界的意見(jiàn)。黃山學(xué)院圖書(shū)館特藏部徽學(xué)資料中心[3]就是使用《徽學(xué)文書(shū)類(lèi)目》,將文書(shū)劃分成9大類(lèi)。中山大學(xué)圖書(shū)館“采用文獻(xiàn)類(lèi)型分類(lèi)和文獻(xiàn)內(nèi)容分類(lèi)相結(jié)合的綜合分類(lèi)原則”[4],將徽州民間歷史文獻(xiàn)分為16大類(lèi)。分類(lèi)整理工作陷于眾多收藏研究機(jī)構(gòu)各自為戰(zhàn)的混亂狀態(tài)。
3)專(zhuān)門(mén)元數(shù)據(jù)規(guī)范尚未建立。2007年,國(guó)家科技部推出《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范》[6],元數(shù)據(jù)規(guī)范涉及十余項(xiàng)不同類(lèi)型的資源對(duì)象,包括具有中國(guó)文化特色的文獻(xiàn)資料類(lèi)型(如古籍、拓片、輿圖等),但地方歷史文獻(xiàn)不在其列。2011年國(guó)家數(shù)字圖書(shū)館工程標(biāo)準(zhǔn)規(guī)范項(xiàng)目相關(guān)研究成果推出,專(zhuān)門(mén)元數(shù)據(jù)規(guī)范分為古文獻(xiàn)、電子書(shū)刊和網(wǎng)絡(luò)多媒體資源三大類(lèi)型,共涉及13種文獻(xiàn)[7]。地方歷史文獻(xiàn)的元數(shù)據(jù)規(guī)范均未列入現(xiàn)有的專(zhuān)門(mén)元數(shù)據(jù)規(guī)范中。
4) 資源分散收藏,不利于系統(tǒng)研究。通過(guò)調(diào)研發(fā)現(xiàn),被譽(yù)為中國(guó)文獻(xiàn)史上第五大發(fā)現(xiàn)的徽州文書(shū),目前分散在中山大學(xué)、安徽大學(xué)、黃山學(xué)院、上海交通大學(xué)、中國(guó)社會(huì)科學(xué)院等多家不同機(jī)構(gòu),這種因征集渠道、征集地點(diǎn)和征集時(shí)間的不同,而導(dǎo)致收藏分散,破壞了文獻(xiàn)研究的整體性和系統(tǒng)性,不利于徽州文書(shū)的研究和利用。
在對(duì)環(huán)境掃描進(jìn)行綜合分析后,上海交通大學(xué)圖書(shū)館明確了在現(xiàn)有國(guó)家標(biāo)準(zhǔn)和規(guī)范框架的指導(dǎo)下,開(kāi)展數(shù)字化建設(shè)工作,并最終建成地方歷史文獻(xiàn)特色數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)的基本目標(biāo)。為實(shí)現(xiàn)上述目標(biāo),明確了任務(wù)和關(guān)鍵點(diǎn),包括:
1) 通過(guò)對(duì)國(guó)內(nèi)外數(shù)字化加工標(biāo)準(zhǔn)和規(guī)范的調(diào)研,盡可能直接引用或參考國(guó)際上已經(jīng)普遍應(yīng)用的技術(shù)標(biāo)準(zhǔn),如國(guó)家圖書(shū)館數(shù)字資源唯一標(biāo)識(shí)符規(guī)范研究成果可直接成為地方歷史文獻(xiàn)的參考標(biāo)準(zhǔn)。
2) 尋求專(zhuān)業(yè)合作,依托學(xué)校地方歷史文獻(xiàn)研究中心,“根據(jù)文書(shū)特定的產(chǎn)生源流和社會(huì)功能,提出以數(shù)據(jù)庫(kù)應(yīng)用為導(dǎo)向的分類(lèi)原則,分類(lèi)法的原則遵循批量處理時(shí)的效率、分類(lèi)概念間的不相容性以及二次檢索的效率”[1],并進(jìn)行分類(lèi)法的適用性測(cè)試??紤]到文書(shū)作為一個(gè)不斷擴(kuò)展的資料群,分類(lèi)法應(yīng)具有可擴(kuò)展性。3)元數(shù)據(jù)規(guī)范方面,遵從科技部《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范設(shè)計(jì)指南》的總體框架,在將復(fù)用DC15個(gè)元素中的大部分元素作為核心元素集的同時(shí),根據(jù)地方歷史文獻(xiàn)的特點(diǎn),制定所需的個(gè)別元素。
4) 數(shù)字資源合作共享,在調(diào)研、比較的基礎(chǔ)上,明確數(shù)字化建設(shè)應(yīng)遵循的標(biāo)準(zhǔn)化、兼容性等原則,開(kāi)展數(shù)字化和知識(shí)組織,建設(shè)地方歷史文獻(xiàn)特色數(shù)據(jù)庫(kù)。數(shù)字資源將有利于實(shí)現(xiàn)珍貴歷史文獻(xiàn)的共享,有助于研究者發(fā)現(xiàn)文獻(xiàn)內(nèi)部的有機(jī)聯(lián)系,拓展新的研究議題。
3.2 微觀審視:找準(zhǔn)問(wèn)題和突破口
在制定地方歷史文獻(xiàn)數(shù)字化建設(shè)規(guī)劃時(shí),要在掃描宏觀環(huán)境、行業(yè)形勢(shì)后,對(duì)所處的微觀環(huán)境(即內(nèi)部環(huán)境)進(jìn)行剖析。微觀環(huán)境直接決定著具體規(guī)劃的實(shí)施,是確定數(shù)字化建設(shè)發(fā)展目標(biāo)的決定性因素。
上海交通大學(xué)的文科建設(shè)正處于重點(diǎn)扶持和大力發(fā)展階段,地方歷史文獻(xiàn)是由學(xué)校出巨資、由歷史系深人民間收購(gòu)而來(lái),它對(duì)于文化保存與學(xué)術(shù)研究所具有的重要性不言而喻,只有開(kāi)展文獻(xiàn)的整理和數(shù)字化才是對(duì)這些珍貴史料的保護(hù)和利用。歷史系、地方歷史文獻(xiàn)研究中心的研究團(tuán)隊(duì)依托這些文獻(xiàn),可以展開(kāi)對(duì)中國(guó)東南山區(qū)社會(huì)經(jīng)濟(jì)史的全面研究,研究團(tuán)隊(duì)現(xiàn)已開(kāi)辟多個(gè)專(zhuān)項(xiàng)研究,正迫切希望通過(guò)文獻(xiàn)的整理和數(shù)字化建設(shè),挖掘并開(kāi)拓出一系列嶄新的研究課題。
通過(guò)對(duì)學(xué)校發(fā)展要求、用戶(hù)群的需求分析,圖書(shū)館積極爭(zhēng)取學(xué)校領(lǐng)導(dǎo)的支持,與歷史系、地方歷史文獻(xiàn)研究中心聯(lián)合并保持密切協(xié)同,主動(dòng)與學(xué)校相關(guān)部門(mén)溝通,就項(xiàng)目建設(shè)的經(jīng)費(fèi)、專(zhuān)業(yè)隊(duì)伍、合作建設(shè)、業(yè)務(wù)規(guī)范等逐一規(guī)劃、落實(shí)。
1) 經(jīng)費(fèi)問(wèn)題:在項(xiàng)目規(guī)劃建設(shè)初期,經(jīng)費(fèi)的落實(shí)成為首要問(wèn)題。圖書(shū)館積極爭(zhēng)取分管校領(lǐng)導(dǎo)的支持,學(xué)校支持并召開(kāi)了項(xiàng)目建設(shè)任務(wù)和經(jīng)費(fèi)落實(shí)的會(huì)議,并設(shè)立985專(zhuān)項(xiàng)建設(shè)項(xiàng)目,數(shù)字化加工、殺蟲(chóng)除菌設(shè)備等費(fèi)用得以落實(shí),項(xiàng)目的實(shí)質(zhì)性啟動(dòng)具備了條件;
2) 專(zhuān)業(yè)隊(duì)伍:圖書(shū)館成立專(zhuān)項(xiàng)小組開(kāi)展地方歷史文獻(xiàn)的數(shù)字化和編目,以保證人員的穩(wěn)定性;并開(kāi)辟專(zhuān)門(mén)空間開(kāi)展數(shù)字化、編目和修復(fù)工作;
3) 合作建設(shè):地方歷史文獻(xiàn)的整理工作是融研究于整理,需要史學(xué)專(zhuān)業(yè)人員的參與和指導(dǎo),圖書(shū)館與歷史系、地方歷史文獻(xiàn)研究中心聯(lián)合開(kāi)展文獻(xiàn)整理工作,歷史系派專(zhuān)業(yè)人員全程參與現(xiàn)場(chǎng)指導(dǎo),并開(kāi)展文獻(xiàn)的保護(hù)性修復(fù);在數(shù)據(jù)庫(kù)建設(shè)上,與出版社結(jié)成戰(zhàn)略合作伙伴,在數(shù)字出版和數(shù)據(jù)庫(kù)制作、搜索等方面緊密合作,使數(shù)字產(chǎn)品更加易用化、人性化。endprint
4) 業(yè)務(wù)規(guī)范:編制《上海交通大學(xué)圖書(shū)館地方歷史文獻(xiàn)業(yè)務(wù)規(guī)范手冊(cè)》,就文獻(xiàn)的整理、編號(hào)、掃描、修復(fù)、編目、包裝等業(yè)務(wù)流程進(jìn)行規(guī)劃設(shè)計(jì)。
上海交通大學(xué)圖書(shū)館通過(guò)對(duì)行業(yè)環(huán)境掃描和對(duì)所處微觀環(huán)境的全面分析,向?qū)W校提交了地方歷史文獻(xiàn)專(zhuān)項(xiàng)建設(shè)的申請(qǐng)和任務(wù)計(jì)劃書(shū),提出了建設(shè)目標(biāo):基本建成國(guó)內(nèi)外有影響力的地方文化研究專(zhuān)題特色資源的元數(shù)據(jù)倉(cāng)儲(chǔ)服務(wù)系統(tǒng),為學(xué)校歷史學(xué)、社會(huì)學(xué)等學(xué)科發(fā)展和研究提供保障,并力爭(zhēng)成為國(guó)內(nèi)乃至世界上最好、最完整的地方歷史文獻(xiàn)服務(wù)中心。在這一目標(biāo)的引領(lǐng)下,科學(xué)規(guī)范地開(kāi)展地方歷史文獻(xiàn)的數(shù)字化建設(shè)工作。
4 地方歷史文獻(xiàn)數(shù)字化建設(shè)的總體原則
在數(shù)字化建設(shè)總體規(guī)劃和目標(biāo)的指導(dǎo)下,首先確定了建設(shè)過(guò)程中應(yīng)遵循的原則??傮w上,地方歷史文獻(xiàn)的數(shù)字化遵循“我國(guó)數(shù)字圖書(shū)館工程標(biāo)準(zhǔn)規(guī)范建設(shè)”的通用性原則,同時(shí)結(jié)合地方歷史文獻(xiàn)的特點(diǎn)和需求,還提出地方歷史文獻(xiàn)數(shù)字化的兩個(gè)補(bǔ)充性原則。
4.1 通周性原則
1) 標(biāo)準(zhǔn)化原則。
標(biāo)準(zhǔn)化將提升地方歷史文獻(xiàn)數(shù)字化產(chǎn)品在將來(lái)使用的可能性,有助于數(shù)據(jù)交換和資源共享。具體表現(xiàn)在元數(shù)據(jù)標(biāo)準(zhǔn)的選擇、內(nèi)容主題描述語(yǔ)言的選擇、資源組織描述的標(biāo)準(zhǔn)規(guī)范、數(shù)字資源系統(tǒng)服務(wù)的標(biāo)準(zhǔn)規(guī)范、數(shù)字資源長(zhǎng)期保存的標(biāo)準(zhǔn)規(guī)范等多個(gè)方面。上述標(biāo)準(zhǔn)規(guī)范的選擇須認(rèn)真參照和采用國(guó)家科技部和國(guó)家圖書(shū)館的研究成果。
2) 可擴(kuò)展性原則。
遵從《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范設(shè)計(jì)指南》的總體框架,在地方歷史文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)選擇和制定中,一方面應(yīng)盡可能采用國(guó)際主流元數(shù)據(jù)標(biāo)準(zhǔn)都柏林核心元數(shù)據(jù)集(Dublin Core,DC),同時(shí)按需復(fù)用DC各應(yīng)用方案和其他元數(shù)據(jù)規(guī)范中的元素或修飾詞,并建立相應(yīng)的映射關(guān)系。
同時(shí),考慮到地方歷史文獻(xiàn)既不是一般檔案資料,又非單一內(nèi)容的專(zhuān)業(yè)學(xué)科主題文獻(xiàn),加之目前尚未形成統(tǒng)一的分類(lèi)標(biāo)準(zhǔn),其數(shù)字化產(chǎn)品的分類(lèi)法宜結(jié)合文獻(xiàn)的動(dòng)態(tài)性,著眼于未來(lái)發(fā)展,提供較高的可擴(kuò)展性。
3) 兼容性原則。
考慮與國(guó)內(nèi)代表性元數(shù)據(jù)應(yīng)用方案,如《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范》的兼容問(wèn)題;同時(shí),要充分考慮與CALIS、中科院以及其他一些行業(yè)的數(shù)字圖書(shū)館系統(tǒng)的標(biāo)準(zhǔn)兼容問(wèn)題,以保證各系統(tǒng)間互操作的實(shí)現(xiàn)。
4.2 補(bǔ)充性原則
1)求“真”原則。
地方歷史文獻(xiàn)的重要功能是保存,所以必須求真。在整理方式上通過(guò)一次編號(hào)、二次編號(hào)以確保文獻(xiàn)的原有留存狀態(tài)和次序。在數(shù)字化加工時(shí),對(duì)不規(guī)則幅面等細(xì)節(jié),在圖像中保留毛邊等原始文獻(xiàn)的物理狀態(tài)。
2) 求“用”原則。
地方歷史文獻(xiàn)的地域特征明顯,無(wú)論是對(duì)于單件還是成冊(cè)的地方歷史文獻(xiàn),在元數(shù)據(jù)的元素設(shè)置時(shí),都要求我們對(duì)研究者和使用者的需求進(jìn)行深入的調(diào)研和分析,找出最重要的著錄事項(xiàng),如事主、歸戶(hù)、標(biāo)的等信息,使得元素設(shè)置能滿(mǎn)足研究者的檢索需求。如用戶(hù)有需求,還應(yīng)對(duì)重要文獻(xiàn)進(jìn)行全文抄錄,融研究于整理,在此基礎(chǔ)上構(gòu)建便于檢索、便于研究的全文數(shù)據(jù)庫(kù)。
5 地方歷史文獻(xiàn)的數(shù)字化規(guī)范設(shè)計(jì)
在整體規(guī)劃、目標(biāo)和建設(shè)原則的指導(dǎo)下,數(shù)字化建設(shè)的規(guī)范設(shè)計(jì)主要涉及:資料整理規(guī)范、數(shù)字化加工標(biāo)準(zhǔn)、元數(shù)據(jù)規(guī)范與設(shè)計(jì)、質(zhì)量審核標(biāo)準(zhǔn)、保存和過(guò)程管理。
5.1 資料整理規(guī)范
地方歷史文獻(xiàn)的整理既要考慮保持地方歷史文獻(xiàn)的原始關(guān)聯(lián)性,又要揭示不同文本類(lèi)型的意義,上海交通大學(xué)圖書(shū)館通過(guò)地方歷史文獻(xiàn)的整理實(shí)踐,融研究人整理,建立了科學(xué)的地方歷史文獻(xiàn)整理流程和規(guī)范。
(1) 編制了符合地方歷史文獻(xiàn)特點(diǎn)和研究需求的《上海交通大學(xué)圖書(shū)館地方歷史文獻(xiàn)業(yè)務(wù)規(guī)范手冊(cè)》,用以指導(dǎo)數(shù)字化工作的開(kāi)展;
(2) 明確了文獻(xiàn)著錄中參照采用的規(guī)范,包括“常見(jiàn)異體字及俗字與規(guī)范字對(duì)照表”、“中西歷法轉(zhuǎn)換系統(tǒng)”、“上海交通大學(xué)地方文獻(xiàn)整理分類(lèi)法”等;
(3) 制定了清晰的業(yè)務(wù)流程,包括清點(diǎn)、登記、編號(hào)、殺蟲(chóng)除菌、入藏、拍照、保護(hù)性修復(fù)、數(shù)字化、編目著錄、包裝、整理入庫(kù)等步驟;
(4) 建立了規(guī)范的清點(diǎn)、登記、著錄的制度,如“待掃描文書(shū)登記表”、“轉(zhuǎn)出修復(fù)登記表”、“需修復(fù)文獻(xiàn)跟蹤表”、“文獻(xiàn)編號(hào)工作手冊(cè)”等。
為確保文獻(xiàn)的原有留存狀態(tài)和歸戶(hù),設(shè)計(jì)了分次、分級(jí)編號(hào),因此文獻(xiàn)的編號(hào)分為初次編號(hào)、二次編號(hào)和分級(jí)編號(hào)。初次編號(hào)是文獻(xiàn)清點(diǎn)時(shí),根據(jù)初始的保存形態(tài),以袋、包為依據(jù)對(duì)每一袋、每一包編號(hào)。二次編號(hào)是對(duì)每一件歷史文獻(xiàn)進(jìn)行編號(hào),包含來(lái)源碼(文獻(xiàn)的收集來(lái)源)、收集日期編碼、歸戶(hù)信息碼、掃描件編碼(整理時(shí)自然產(chǎn)生的流水號(hào))等信息。由于大量的地方歷史文獻(xiàn)需修復(fù)后才能正式編號(hào)、分級(jí)編號(hào),是依據(jù)《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》對(duì)文獻(xiàn)的破損等級(jí)進(jìn)行分級(jí),判斷為A、B級(jí)的文獻(xiàn)歸為不需修復(fù)一類(lèi),C級(jí)文獻(xiàn)歸為需要修復(fù)一類(lèi)。需要修復(fù)的文書(shū)在修復(fù)完成后再正式編號(hào)。
5.2 數(shù)字化標(biāo)準(zhǔn)
分析確立應(yīng)采用的數(shù)字編碼與內(nèi)容標(biāo)記標(biāo)準(zhǔn),針對(duì)保存格式、瀏覽格式提出該采用的數(shù)字內(nèi)容格式標(biāo)準(zhǔn),確立數(shù)字資源加工標(biāo)準(zhǔn)和程序的選擇原則,編制數(shù)字資源建設(shè)指南的基本操作規(guī)范。我們將地方歷史文獻(xiàn)的數(shù)字化分為長(zhǎng)期保存級(jí)和發(fā)布服務(wù)級(jí),并根據(jù)文獻(xiàn)特點(diǎn)制定了相應(yīng)的技術(shù)標(biāo)準(zhǔn)和格式,詳見(jiàn)表1。
5.3 元數(shù)據(jù)規(guī)范與設(shè)計(jì)
(1) 元數(shù)據(jù)規(guī)范的基本結(jié)構(gòu)及擴(kuò)展。
我國(guó)科技部重大項(xiàng)目《我國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范建設(shè)》的子項(xiàng)目《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范》,對(duì)14種不同類(lèi)型的元數(shù)據(jù)規(guī)范進(jìn)行了設(shè)計(jì),并且推出了《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范設(shè)計(jì)指南》,以保證各種元數(shù)據(jù)規(guī)范在功能、數(shù)據(jù)結(jié)構(gòu)、格式、語(yǔ)義、語(yǔ)法等方面的一致性和整體性。
地方歷史文獻(xiàn)元數(shù)據(jù)規(guī)范遵從《專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范設(shè)計(jì)指南》的總體框架,在復(fù)用DC15個(gè)元素中的大部分元素作為核心元素集的同時(shí),根據(jù)地方歷史文獻(xiàn)的特點(diǎn),制定所需的個(gè)別元素。地方歷史文獻(xiàn)描述元數(shù)據(jù)規(guī)范的基本結(jié)構(gòu)由核心元素、個(gè)別元素兩部分組成。這兩個(gè)層次的劃分目的是為了在保證各種不同元數(shù)據(jù)標(biāo)準(zhǔn)的一致性與整體性的基礎(chǔ)上,最大限度地體現(xiàn)地方歷史文獻(xiàn)的個(gè)性特征,使標(biāo)準(zhǔn)具有更強(qiáng)的包容性和靈活性,支持?jǐn)?shù)據(jù)交換和檢索,實(shí)現(xiàn)數(shù)據(jù)共享。遵循這一結(jié)構(gòu),地方歷史文獻(xiàn)元數(shù)據(jù)設(shè)置了核心元素、個(gè)別元素共20個(gè)。endprint
(2) 元數(shù)據(jù)關(guān)聯(lián)。
對(duì)下列情況建立關(guān)聯(lián),主要是文獻(xiàn)、事件、記錄和對(duì)象的關(guān)聯(lián)。
文獻(xiàn)關(guān)聯(lián)——設(shè)置元素“歸戶(hù)”,將來(lái)源于同一家戶(hù)、不同類(lèi)型的文獻(xiàn)之問(wèn)實(shí)現(xiàn)關(guān)聯(lián)。示例:同一家戶(hù)的地契、賬本,通過(guò)歸戶(hù)建立關(guān)聯(lián)。
事件關(guān)聯(lián)——設(shè)置元素“事主”和“第一事主”等,將同一事主參與的不同的經(jīng)濟(jì)活動(dòng)、鄉(xiāng)俗活動(dòng)等事件實(shí)現(xiàn)關(guān)聯(lián)。
對(duì)象關(guān)聯(lián)——制定編碼和編號(hào)規(guī)則,在數(shù)字對(duì)象和記錄之間建立關(guān)聯(lián)。示例:編碼為011109150144的文獻(xiàn)和編號(hào)為0111091501440001至011109150144——0012的數(shù)字對(duì)象表明來(lái)自于“歙縣三十七區(qū)八段三甲歸戶(hù)清冊(cè)”的文獻(xiàn)和數(shù)字對(duì)象。
除元數(shù)據(jù)關(guān)聯(lián)外,在元數(shù)據(jù)加工時(shí),規(guī)范了計(jì)算機(jī)用字,積累了大量民間屬性數(shù)據(jù),自動(dòng)進(jìn)行繁簡(jiǎn)字關(guān)聯(lián),收錄了異體字字典的內(nèi)容,從而實(shí)現(xiàn)異體關(guān)聯(lián)。檢索功能有特色,實(shí)現(xiàn)了正文、事主、標(biāo)的等小范圍內(nèi)的全文檢索。
(3) 分類(lèi)標(biāo)準(zhǔn)的建立。
當(dāng)代出版物使用的《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》以及古籍圖書(shū)使用的四部分類(lèi)法等,是針對(duì)有組織的知識(shí)載體的分類(lèi)體系;地方歷史文獻(xiàn)的特色恰在于其非組織化,不能適用于以上分類(lèi)法。而目前史學(xué)界和圖書(shū)館界尚無(wú)統(tǒng)一的地方歷史文獻(xiàn)的分類(lèi)標(biāo)準(zhǔn)。
上海交通大學(xué)圖書(shū)館嘗試探索分類(lèi)法的設(shè)計(jì)及其理論依據(jù),和歷史系聯(lián)合編制設(shè)計(jì)了地方歷史文獻(xiàn)分類(lèi)法。該分類(lèi)法的設(shè)計(jì)以文獻(xiàn)的產(chǎn)生源流和社會(huì)功能為依據(jù),以數(shù)據(jù)庫(kù)應(yīng)用為導(dǎo)向,遵循四項(xiàng)原則:①分類(lèi)主要依照文書(shū)性質(zhì);②確保批量處理的效率;③分類(lèi)概念間不相容;④確保二次檢索效率。分類(lèi)法設(shè)置一級(jí)類(lèi)目13個(gè),分別用字母A——M表示,包括:契約、賬本、賦役、訴訟、行政、家譜、信函、日用類(lèi)書(shū)與工具書(shū)、家禮、宗教、戲劇、教育考試、醫(yī)藥。此外,考慮到地方歷史文獻(xiàn)的動(dòng)態(tài)擴(kuò)增,其數(shù)字化產(chǎn)品的分類(lèi)法設(shè)計(jì)應(yīng)結(jié)合文獻(xiàn)的動(dòng)態(tài)性,著眼于未來(lái)發(fā)展,該分類(lèi)法在設(shè)計(jì)時(shí)提供了較高的可擴(kuò)展性?!霸诿恳淮箢?lèi)下,都設(shè)置一個(gè)0號(hào)二級(jí)分類(lèi),供未來(lái)這一大類(lèi)中新發(fā)現(xiàn)的尚無(wú)法歸人已有二級(jí)分類(lèi)的文獻(xiàn)歸類(lèi),直到可以確定其性質(zhì)或建立新的二級(jí)分類(lèi)?!盵1]見(jiàn)表2。
為測(cè)定分類(lèi)法的適用性,利用編目抽檢結(jié)果、文獻(xiàn)計(jì)量等方法進(jìn)行了檢測(cè),驗(yàn)證該分類(lèi)法在編目著錄中的有效性,該分類(lèi)法在上海交通大學(xué)圖書(shū)館地方歷史文獻(xiàn)數(shù)字化項(xiàng)目建設(shè)中得以實(shí)際應(yīng)用。內(nèi)有表格
5.4 質(zhì)量審核
質(zhì)量審核主要針對(duì)元數(shù)據(jù)和數(shù)字對(duì)象質(zhì)量的審校。
(1) 元數(shù)據(jù)質(zhì)量檢驗(yàn)。明確規(guī)定元數(shù)據(jù)的檢驗(yàn)范圍,主要包括必備字段的完整著錄、各字段描述的準(zhǔn)確性、元數(shù)據(jù)和數(shù)字對(duì)象的對(duì)應(yīng)等。
(2) 數(shù)字對(duì)象質(zhì)量檢驗(yàn)。檢驗(yàn)范圍主要針對(duì)可用性信息和格式信息,可用性主要檢查數(shù)字對(duì)象是否可用、文件名命名是否正確、是否符合命名規(guī)范、附屬文件是否齊備、存儲(chǔ)路徑是否正確、掃描完整性等。各項(xiàng)技術(shù)指標(biāo)應(yīng)達(dá)到表1中的加工標(biāo)準(zhǔn)和規(guī)范,嚴(yán)格控制各種數(shù)據(jù)的綜合錯(cuò)誤率。出現(xiàn)問(wèn)題的應(yīng)進(jìn)行修正或重新掃描。
5.5 資源保存
數(shù)字資源的保存分為長(zhǎng)期保存級(jí)和發(fā)布服務(wù)級(jí),分別滿(mǎn)足長(zhǎng)期保存和數(shù)據(jù)庫(kù)利用的需要。主要參考“國(guó)家圖書(shū)館數(shù)字資源對(duì)象管理規(guī)范”以及“數(shù)字資源加工標(biāo)準(zhǔn)與工作規(guī)范”的研究成果。
5.6 過(guò)程管理
(1) 過(guò)程管理表。
建立過(guò)程管理表,包括“待掃描文書(shū)登記表”、“轉(zhuǎn)出修復(fù)登記表”、“需修復(fù)文獻(xiàn)跟蹤表”、“文獻(xiàn)編號(hào)工作手冊(cè)”等,及時(shí)整理匯總,在數(shù)字化工作完成的同時(shí)建立完整規(guī)范的記錄。
(2) 安全管理機(jī)制。
為維護(hù)地方歷史文獻(xiàn)的稀缺性和珍貴性,應(yīng)建立數(shù)字加工各環(huán)節(jié)的安全管理機(jī)制,確保實(shí)物在掃描和修復(fù)等加工過(guò)程中不丟失、不損壞。例如,文獻(xiàn)入庫(kù)前,用真空除氮設(shè)備開(kāi)展殺蟲(chóng)除菌工作;文獻(xiàn)加工過(guò)程中采取全記錄跟蹤,建立各種登記表;依據(jù)國(guó)家《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》,對(duì)破損文獻(xiàn)進(jìn)行分級(jí),開(kāi)展不同程度的保護(hù)性修復(fù)。
6 結(jié)語(yǔ)
各收藏機(jī)構(gòu)對(duì)地方歷史文獻(xiàn)重發(fā)現(xiàn)、收藏,而不重科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示,阻礙了以地方歷史文獻(xiàn)為基礎(chǔ)的各項(xiàng)人文社會(huì)科學(xué)的研究。上海交通大學(xué)將地方歷史文獻(xiàn)與數(shù)字化這一現(xiàn)代信息組織和處理技術(shù)有機(jī)結(jié)合,探索和總結(jié)出一套完整的數(shù)字化管理和規(guī)范體系,全面科學(xué)地揭示新藏歷史文獻(xiàn)。希望這些有益探索對(duì)當(dāng)前的地方歷史文獻(xiàn)整理機(jī)構(gòu)或個(gè)人有所啟發(fā)和借鑒,我們同時(shí)希望能與相關(guān)機(jī)構(gòu)開(kāi)展資源共享和合作,發(fā)揮資源規(guī)模優(yōu)勢(shì),幫助史學(xué)研究者拓展新的研究課題。
參考文獻(xiàn)
1 趙思淵,湯萌.上海交通大學(xué)新藏地方歷史文獻(xiàn)的分類(lèi)法及其依據(jù)[J].上海交通大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2014(3):76-86
2 張曉峰.徽州文書(shū)分類(lèi)整理要點(diǎn)和疑難解析[J].大學(xué)圖書(shū)情報(bào)學(xué)刊,2008,(2):58-61,67
3 陸航,張翼.史學(xué)文獻(xiàn)數(shù)字化呼喚學(xué)者主動(dòng)介入.中國(guó)社會(huì)科學(xué)報(bào),2014年4月2日第A02版
4 劉伯山.徽州文書(shū)的整理與遺存.徽州文書(shū)(第一輯).桂林:廣西師范大學(xué)出版社,2005
5 王蕾,申斌.徽州民間歷史文獻(xiàn)整理方法研究——以中山大學(xué)圖書(shū)館館藏為例.圖書(shū)館論壇,2014,(4):120-126
6 “我國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范專(zhuān)門(mén)數(shù)字對(duì)象捕述元數(shù)據(jù)規(guī)范”子項(xiàng)目.[2014 - 10 - 30]. http://cdls. nstl. gov. cn/2003/SpcMetadata/
7 國(guó)家數(shù)字圖書(shū)館工程標(biāo)準(zhǔn)規(guī)范.[2014 -10 - 30].http://jwww.nlc.gov.cn/newstgc/gjsztsggc/bzgf/
8 訪談郊振滿(mǎn):為什么我們要進(jìn)村找廟、進(jìn)廟找碑?endprint
大學(xué)圖書(shū)館學(xué)報(bào)2015年2期