趙莉莉
(云南省圖書館,云南 昆明 650031)
地方志的記載豐富詳實,現(xiàn)存古今地方志卷帙浩繁、種類繁多、內(nèi)容豐富,享有“地方百科全書”的美譽。
過去,因為社會條件的限制,特別是技術(shù)手段的落后,地方志文獻資源難以廣泛傳播。隨著近年來電子信息技術(shù)的發(fā)展,依托新技術(shù)的古籍文獻數(shù)字化工作開始興起,為地方志資源的傳播、開發(fā)和利用提供新模式,“方志資源數(shù)字化既是今天經(jīng)濟文化建設(shè)、學(xué)術(shù)研究的需要,也是時代對方志整理工作的必然要求?!雹馘X曉琴.地方志計算機數(shù)據(jù)庫建設(shè)初探[J].伊犁教育學(xué)院學(xué)報,2003(3):112.但現(xiàn)階段,相關(guān)古籍管理機構(gòu)對于方志資源數(shù)字化整個流程還未形成統(tǒng)一標(biāo)準(zhǔn)和規(guī)范,仍有諸多方面的內(nèi)容需要完善。
地方志標(biāo)引著錄是數(shù)據(jù)庫檢索功能的依據(jù),提高文獻的查詢、利用效率,進一步增強地方志工作的科學(xué)性和技術(shù)性,提高地方志工作效率和服務(wù)水平保障。因而,地方志數(shù)字化需要結(jié)合方志學(xué)、方志目錄學(xué)、方志書籍本身的特點進行地方志書的標(biāo)引著錄,同時也需要有統(tǒng)一的方志著錄標(biāo)準(zhǔn)和格式,為實現(xiàn)志書資源共享奠定基礎(chǔ)。
2004年5月,科技部科技基礎(chǔ)工作專項資金重大項目《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)》課題組的徐周亞等發(fā)布《地方志描述元數(shù)據(jù)規(guī)范》和《地方志描述元數(shù)據(jù)著錄規(guī)則》標(biāo)準(zhǔn)草案。《地方志描述元數(shù)據(jù)著錄規(guī)則》著錄的項目有:名稱、主要責(zé)任者、主題、描述、出版者、其他責(zé)任者、日期、類型、格式、標(biāo)識符、來源、語種、相關(guān)資源、時空范圍、權(quán)限、版本、載體形態(tài)、收藏歷史、館藏信息、體例、方志類型、一般附注、復(fù)本記錄,共計23項元數(shù)據(jù)描述內(nèi)容?!兜胤街久枋鲈獢?shù)據(jù)規(guī)范》定義了15個核心元素,4個古文獻系列資源類型核心元素和4個個別元素。
地方志數(shù)字化著錄,包括古籍方志和新方志的著錄。但目前所頒布的《地方志描述元數(shù)據(jù)規(guī)范》和《地方志描述元數(shù)據(jù)著錄規(guī)則》沒有對古籍方志和新方志的的元數(shù)據(jù)著錄加以區(qū)分,新方志雖然體例、內(nèi)容等古籍方志有著延續(xù)性,也存在一些較大差別,如隨著社會發(fā)展和多樣化新方志的內(nèi)容和種類更加的豐富,新方志的目錄也更加的細(xì)化明晰,章節(jié)、內(nèi)容條目都有頁標(biāo)示,著錄時都需要認(rèn)真記錄,以便后期編輯、查詢和使用。對于古籍方志和新方志的著錄應(yīng)該根據(jù)其不同特點制定與之相應(yīng)描述和著錄的規(guī)范、規(guī)則。
地方志長期以來被看作“博物之書”,由于是代有編纂,無論在內(nèi)容、體例上多有延續(xù)性,且面廣、信息量大,想要有效地利用它,必須借助于某種路徑,這種路徑就是方志目錄學(xué)。如果對館藏新舊方志不進行整理編目或目錄編得不科學(xué),勢必會影響日常管理和方志資源的開發(fā)、利用。①王憲洪.對北京方志數(shù)字化的思考[J].中國地方志,2008(5):10.因而,數(shù)字化中對地方志進行科學(xué)的分類、準(zhǔn)確詳細(xì)的標(biāo)引著錄,能讓我們在最短的時間內(nèi)獲取最大的信息量,提高資料查詢效率,有利于擴展方志研究的深度和廣度。
雖然目前所具有的地方志描述和著錄的規(guī)范、規(guī)則存在不足,但對地方志數(shù)字化標(biāo)引著錄具有重要的指導(dǎo)意義,經(jīng)不斷的實踐反饋和修改完善并推廣執(zhí)行,地方志數(shù)字化著錄將會實現(xiàn)統(tǒng)一、標(biāo)準(zhǔn)及系統(tǒng)化,更好的提供共享及服務(wù)。
地方志書由紙質(zhì)文獻載體形式轉(zhuǎn)換為具備高效、準(zhǔn)確、快捷、便利以及節(jié)約等多種優(yōu)勢的電子文獻,首先必須對其紙質(zhì)文獻進行掃描采集圖像。為了更好地保護地方志文獻特別是古籍方志,在地方志掃描圖像采集中我們需要專業(yè)的數(shù)字化設(shè)備和專業(yè)的技術(shù)人員進行掃描的數(shù)字化工作,對于嚴(yán)重脆化、破損、蟲蛀及夾字等情況書籍也應(yīng)該采取與之相適宜的解決方案。
1.古籍方志圖像采集
古籍方志由于年代久遠(yuǎn),人為因素和自然因素的長期作用,部分古籍方志存在紙張風(fēng)化粉碎、殘破、變形、霉變等不同程度的損壞,甚至破舊不堪,因此保護與利用的矛盾越來越突出,而數(shù)字化是目前解決這一矛盾的最有效方式。
古籍方志在數(shù)字化掃描時,考慮其保存時間長久,紙質(zhì)易受高溫影響,掃描時需要冷光光源掃描儀,不僅有利于掃描影像的品質(zhì)保證,也使得在掃描古籍時不會由于溫度過高對善本產(chǎn)生不良影響。對于殘破、蟲蛀等較為嚴(yán)重的古籍方志需要修復(fù)后再掃描,以防再數(shù)字化掃描中加重對古籍方志的損壞。而部分由于紙質(zhì)較薄出現(xiàn)透字情況,一般的處理方法是以“襯紙”的方式把兩個半頁隔開,從而杜絕透字。部分方志古籍由于裝訂線距離板框太近,有時甚至重合,造成夾字現(xiàn)象,往往會用拆書來解決,掃描完成需要及時地裝訂還原。同時,還有部分古籍幅面較大,或書籍里夾有地圖等大幅頁面,超出掃描儀掃描范圍的古籍,需要將大幅面古籍進行分段掃描,最后使用軟件進行無縫拼接處理,形成與原始古籍頁面完整的圖像。
數(shù)字化掃描既能保存書籍原貌,又有利于便捷傳播,“已成為解決古籍再生保護性的最有效手段,在進行數(shù)字化掃描時,需按照規(guī)范要求操作,妥善處理好透字、拆書、還原修復(fù)、圖像處理等問題,加強專業(yè)人員業(yè)務(wù)培訓(xùn)”。②巴兆祥.方志目錄學(xué)芻議[J].中國地方志,2003(3):6.
2.新方志圖像采集
“新方志品種齊全,數(shù)量眾多,系統(tǒng)完備,方志文獻的‘功用’已經(jīng)不再僅局限于‘資治、教化、存史’三個方面,而是成了中國政治經(jīng)濟發(fā)展必不可少的國情和地情資源寶庫,能夠促進歷史學(xué)、社會學(xué)、法學(xué)、地理學(xué)、生物學(xué)等學(xué)科的發(fā)展,具有非常重要的意義?!雹叟诵且?淺談古籍?dāng)?shù)字化掃描工作需注意的問題[J].新世紀(jì)圖書館,2016(12):60.加快新方志數(shù)字化,推廣使用是當(dāng)前地方志的重要工作。
新方志成書距今時間短,一般保存的書況都比較完好,較少出現(xiàn)蟲蛀、破損及脆化等情況。但新方志的裝幀形式與古籍方志不同,都是采用平裝形式,以一頁雙面印刷,這樣的書籍隨著時間的推移,以后出現(xiàn)破損、蟲蛀等問題時修復(fù)難度更大。因而現(xiàn)在對其進行數(shù)字化掃描,不僅有助于新方志的開發(fā)使用,更有利于新方志的保存。
數(shù)字化掃描完成后需要對采集圖像進行糾偏、影像拼接等處理,要求頁面端正,基本原則是最大程度保持文獻資料的原始性。
目前,數(shù)字圖像采集輸出儲存的格式不統(tǒng)一?!坝谐R姷膖xt、doc、pdf等,也有chm、hlp、exe、xml等較少見的格式。這些不同格式文件格式,往往都需要各自專門的閱讀器才能進行瀏覽,相互之間難以兼容。”①趙嘉朱.方志資源知識組織方法研究[J].數(shù)字圖書館論壇,2016(4):61.因而,我們在做好地方志掃描圖像采集的同時,需要統(tǒng)一輸出儲存格式,或不同格式間轉(zhuǎn)換,以實現(xiàn)跨平臺間的資源共享。
數(shù)據(jù)庫模式是現(xiàn)在文獻資源儲存、傳輸最便捷有效的方式,“應(yīng)用于地方志系統(tǒng)有利于有效地開發(fā)、利用地方志中的文獻信息資源,有利于提高人們對地方志的利用,有利于促進社會經(jīng)濟、文化科學(xué)的發(fā)展”。②趙海良.廣西地方志文獻數(shù)字化標(biāo)準(zhǔn)建設(shè)[J].廣西地方志,2015(4):28.
1.數(shù)據(jù)庫建設(shè)
目前國內(nèi)文獻數(shù)據(jù)庫建設(shè)主要有三種模式,分別為圖像全文數(shù)據(jù)庫、文本全文數(shù)據(jù)庫、圖像加文本的圖文數(shù)據(jù)庫,這三種模式各有其優(yōu)劣。
圖像全文數(shù)據(jù)庫是將書頁進行原文圖像掃描,并將掃描圖像進行存儲,通過網(wǎng)絡(luò)為讀者提供文獻圖像信息服務(wù)。圖像全文數(shù)據(jù)庫的優(yōu)勢是:技術(shù)實現(xiàn)容易,運行成本低廉,能夠忠實地長期保存古籍文獻原貌,同時能夠快速傳播,便于使用。其缺點是:占據(jù)空間大,只能根據(jù)標(biāo)引著錄的信息如題目、作者、地名、年代等限制檢索,而不能進行全文檢索。
文本數(shù)據(jù)庫,是指將文獻內(nèi)容轉(zhuǎn)換成文本字符的形式,一是通過人工錄入,二是經(jīng)掃描成圖像后用軟件進行識別。將錄入或識別的文字進行存儲從而為讀者提供全文閱讀或者全文檢索服務(wù)。文本數(shù)據(jù)庫的優(yōu)勢:存儲空間小,可以進行多角度、多范圍的檢索、排序、分析數(shù)據(jù),并可以編輯,使用起來非常方便;其缺點是:文字錄入難度較大,開發(fā)成本高,不能保持古籍原貌。
圖文數(shù)據(jù)庫是圖像版與文字版的結(jié)合,可以實現(xiàn)全文檢索、文本與圖像相互對照,研究者可根據(jù)需要隨時參考原文圖像。圖文數(shù)據(jù)庫是最理想的數(shù)字化文獻開發(fā)模式,但其投入也相對較多。
2.地方志數(shù)據(jù)庫建設(shè)
對地方志數(shù)據(jù)庫而言,越是理想的數(shù)據(jù)庫模式就會更高效、準(zhǔn)確、快捷和便利。然而,方志數(shù)據(jù)庫的建設(shè)一般還需根據(jù)館藏單位的財力、人力等具體情況而決定,循序漸進的開發(fā)建設(shè)。
古籍方志數(shù)據(jù)庫建設(shè)根據(jù)現(xiàn)實條件逐漸由圖像全文數(shù)據(jù)庫向文本數(shù)據(jù)庫發(fā)展,進而遞進為圖文數(shù)據(jù)庫的系統(tǒng)開發(fā)建設(shè)。對于新方志而言,應(yīng)該以圖文數(shù)據(jù)的模式進行建設(shè),新方志書籍中極少的繁、異字體,其文本形式可以經(jīng)過掃描后通過軟件識圖像文字別獲取,且錯誤率低。新方志的圖文數(shù)據(jù)庫不宜圖像與文本分開而是合一形式,如采取雙層PDF等格式。
現(xiàn)在信息化、網(wǎng)絡(luò)化延伸到生活的每一個角落,地方志工作的發(fā)展必須適應(yīng)信息時代的挑戰(zhàn),地方志數(shù)據(jù)庫建設(shè)勢在必行。地方志數(shù)據(jù)庫建設(shè)需要滿足資料在網(wǎng)絡(luò)上的實時共享、檢索方便、更新及時的要求,充分發(fā)揮地方志的資源優(yōu)勢。
隨著地方志資源不斷的深入研究和普及,而數(shù)字化應(yīng)時而生,對推動地方志資源的保存、開發(fā)及使用等具有重要的價值。
(一)地方志資源數(shù)字化,有利于對方志資源進行及時有效的保存與保護
現(xiàn)存的方志資源,尤其是年代久遠(yuǎn)的古籍方志,需要進行有效地保護。利用現(xiàn)代網(wǎng)絡(luò)信息技術(shù)對這些方志文本進行數(shù)字化整理,就是最大限度地還原其主要內(nèi)容,用電子文本的方式全面展示,相關(guān)方志館藏單位可以對數(shù)字化的地方志資料進行永久保存。在此基礎(chǔ)上,今后研究者可直接使用網(wǎng)絡(luò)電子版本進行閱讀整理,從而避免在使用紙質(zhì)文獻時所造成的損耗。保存與保護文獻,是地方志資源數(shù)字化的基本價值。
(二)數(shù)字化的地方志資源,更有助于學(xué)者和研究者研讀使用,從而為地方志文獻的流傳創(chuàng)造了條件
數(shù)字化地方志文獻使用起來更為簡單便捷,讀者不必到專門的館藏機構(gòu)去尋訪,可以通過相應(yīng)的網(wǎng)絡(luò)平臺直接閱讀學(xué)習(xí),從整體上減少了研究方志的成本,同時,也使得更多的讀者可以通過數(shù)字地方志共享平臺閱覽相關(guān)資料。這既滿足了學(xué)者和研究者的研讀需求,同時也便于方志資料的廣泛傳播,是地方志資源數(shù)字化的重要價值。
(三)伴隨著數(shù)字化工作的全面開展,為地方志研究工作的展開提供了新的思路
數(shù)字化應(yīng)用于地方志資源的整理與研究,便于編纂資料的收集與整理。對于研究者,利用數(shù)字化的地方志資源,可及時有效地搜集、比對、解析相關(guān)數(shù)據(jù)與信息,減少了原先查閱、分析資料所消耗的各種成本。與此同時,地方志資源數(shù)字化工作的開展,也有利于今后方志工作編纂適應(yīng)網(wǎng)絡(luò)化、信息化、數(shù)字化的發(fā)展模式,為提高工作效率,完善工作內(nèi)容創(chuàng)造了條件。改進舊有的方式,開展更具科技功效的工作新路徑,是方志數(shù)字化工作的創(chuàng)新價值。
21世紀(jì)是大數(shù)據(jù)的時代,地方志的工作須與之相適應(yīng),信息化、網(wǎng)絡(luò)化將會是今后地方志工作的主流,即“采用科學(xué)、快捷、高效的方式,利用信息化、網(wǎng)絡(luò)化的快捷優(yōu)勢,發(fā)揮志書最大的實用功效,是今后修志工作者的新要求,也是時代的迫切需要。”①李衛(wèi)東.地方志工作信息化網(wǎng)絡(luò)化建設(shè)探討[J].黑龍江史志,2007(9):17.因此,地方志資源數(shù)字化不應(yīng)該僅僅是地方志書的保存的新方式,更應(yīng)該是不斷地深入研究和挖掘,以高科技的方式開發(fā)利用好地方志資源,實現(xiàn)地方志資源共享,滿足廣大人民的文化需求,促進經(jīng)濟文化的發(fā)展需要。