陳誠
?
數(shù)字人文時代圖書館古籍文獻資源的數(shù)字化長期保存機制探討
陳誠
上海市松江區(qū)圖書館,上海 201699
數(shù)字人文改變了現(xiàn)代科研面貌,為古籍文獻的深層次開發(fā)提供了新思路。文章從古籍文獻保存的客觀要求、深層次開發(fā)古籍文獻的需求及傳承中華優(yōu)秀傳統(tǒng)文化的需求等方面,介紹了數(shù)字人文時代古籍文獻數(shù)字化建設(shè)的意義;分析了圖書館常用的文本挖掘、地理信息系統(tǒng)及知識發(fā)現(xiàn)等古籍文獻資源數(shù)字化建設(shè)的常用技術(shù);研究了圖書館古籍文獻專題數(shù)據(jù)庫的構(gòu)建技術(shù)及規(guī)范;著重從建立統(tǒng)一的古籍長期保存標(biāo)準(zhǔn)、人才培養(yǎng)機制、數(shù)字化共享等方面,提出建立圖書館古籍文獻長期保存機制的策略。
數(shù)字人文;古籍文獻;數(shù)字化;保存;圖書館
古籍記錄著我國各民族的文化歷史與發(fā)展?fàn)顩r,具有科學(xué)研究價值與文化傳承價值,是檔案文獻遺產(chǎn)的重要部分。古籍文獻多為紙質(zhì)資料,易受到自然與人為因素的影響,增加了存儲利用的難度。作為文獻存儲與流通機構(gòu),無論何種類型的圖書館,均有不同規(guī)模的古籍收藏。古籍存儲對環(huán)境、技術(shù)等要求較高,很多圖書館由于修復(fù)技術(shù)落后、設(shè)施不完善等問題,難以保障古籍文獻管理的有效性[1]。如今數(shù)字化技術(shù)的高速發(fā)展,深刻影響著現(xiàn)代社會的科研面貌,給傳統(tǒng)人文科研帶來新的理論與方法。這種改變沖擊著傳統(tǒng)人文的研究維度,促進了人文科學(xué)與數(shù)字化技術(shù)的融合,也標(biāo)志著數(shù)字人文時代的來臨。數(shù)字人文強調(diào)依托先進信息技術(shù),開展數(shù)字化資源整合與可視化服務(wù),實現(xiàn)知識挖掘,提升數(shù)據(jù)資源的利用價值。將數(shù)字人文理念引入古籍保護領(lǐng)域,加快古籍文獻數(shù)字化建設(shè),可以為古籍文獻的深度開發(fā)創(chuàng)造條件,也有助于圖書館古籍文獻的長期保存與利用。
古籍文獻資源是寶貴的文化遺產(chǎn),強化圖書館古籍?dāng)?shù)字化建設(shè),是順應(yīng)數(shù)字人文時代趨勢的要求,也是深入挖掘古籍科研價值、促進優(yōu)秀文化傳承的需求。
古籍文獻多為紙質(zhì)資料,易出現(xiàn)蟲蛀、潮濕、紙張老化等,對物理保存條件要求高。如何對這些資源進行長期保存,是圖書館等文獻存儲機構(gòu)需要解決的問題。一些圖書館為了保護好珍貴文獻,采用了多種文獻修復(fù)與管理方式,如通過文本影印的方式復(fù)制古籍善本,避免紙質(zhì)原件丟失;或通過制作微縮光盤減少存儲空間,延長古籍存儲周期。然而,由于古籍文獻種類繁多,來源復(fù)雜,需要投入大量資金與人力,采用上述方法并不能緩解古籍保護的壓力,也難以滿足用戶對古籍利用的需求。而數(shù)字化技術(shù)的引入,為古籍文獻數(shù)字化創(chuàng)造了條件,有助于提高古籍文獻存儲、檢索和利用效率[2]。
目前很多圖書館在古籍文獻保存方面,由于受設(shè)施設(shè)備落后、人員不足等限制,或者由于重視度不夠,導(dǎo)致館藏古籍流通率不高,變成鮮有人問津的“古董”。從收錄范圍來看,部分圖書館收藏的古籍文獻不夠系統(tǒng)完整;從服務(wù)內(nèi)容來看,多以提供借閱服務(wù)為主,缺乏對古籍資源的深層次開發(fā),難以真正體現(xiàn)古籍的作用。圖書館必須改變“重藏輕用”的局面,將古籍文獻更好地利用起來,保障古籍文獻的可持續(xù)性,為科研、教學(xué)等提供多元化的服務(wù)。尤其是借助數(shù)字化技術(shù),改變圖書館古籍文獻的存儲狀態(tài),不僅可以方便用戶借閱與傳播,也可以促進隱性知識顯性化,進一步提升古籍的社會利用價值。
古籍屬于不可再生資源,是我國悠久歷史文化的傳播載體,蘊藏著前人智慧的結(jié)晶。古籍文獻有極高的存儲價值,一旦毀損或消失,也意味著寶貴文化遺產(chǎn)的消亡。圖書館對典藏的古籍文獻進行數(shù)字化處理,是一種替代性的再開發(fā)方式,既能夠代替紙質(zhì)文本,也可以讓孤本不孤,讓更多的人接觸到經(jīng)典。尤其是在我國大力倡導(dǎo)弘揚傳統(tǒng)文化的背景下,圖書館結(jié)合用戶閱讀需求,依托數(shù)字化技術(shù)促進古籍文獻傳播,本身就是傳承優(yōu)秀文化的必要方式,也是圖書館在社會教育方面必須承擔(dān)的使命。因此,圖書館要保障古籍文獻保護的專業(yè)性,以先進信息技術(shù)讓古籍文獻源遠流長,讓其變?yōu)榻?jīng)典閱讀的重要源泉。
數(shù)字人文時代各種前沿技術(shù)的應(yīng)用,顛覆了傳統(tǒng)的信息資源整合傳播方式,也改變了人們對信息的利用習(xí)慣。將這些前沿技術(shù)應(yīng)用于圖書館古籍保護工作中,將促進古籍文獻從采集、檢索到利用等多個環(huán)節(jié)質(zhì)的飛躍,全面提高古籍文獻管理的智能化水平。
文本挖掘是從語料庫或文本集合中信息抽取,從中發(fā)現(xiàn)潛在的、有價值的知識。文本挖掘技術(shù)是數(shù)據(jù)挖掘的分支,可以滿足古籍文獻的深層次挖掘需求[3]。圖書館在對古籍文獻進行數(shù)字化處理過程中,借助該技術(shù)分析古籍文獻的人物關(guān)系、篇章結(jié)構(gòu)等,或者對大規(guī)模文獻進行整體分析,可以把握某一時期、流派或作者的風(fēng)格特點,擺脫依賴權(quán)威的傳統(tǒng)人文研究方法,在對比分析上厘清不同文本之間復(fù)雜的關(guān)系,從中提煉可供傳播的知識與經(jīng)驗。針對歷史檔案資料,研究者也可以借助文本挖掘技術(shù),對同類作品進行??睂Ρ龋钊胪诰蛲粫r期人們對社會、人文等方面認知的差異,進而更為準(zhǔn)確地還原歷史真相。
地理信息系統(tǒng)(Geographic Information System , GIS)是在對大量空間數(shù)據(jù)進行采集、組織與分析基礎(chǔ)上,將事物的屬性數(shù)據(jù)與空間數(shù)據(jù)相結(jié)合,幫助用戶提高信息查詢效率的應(yīng)用軟件。GIS技術(shù)在圖書館古籍文獻數(shù)字化中的應(yīng)用,可以在計算機中迅速整合空間數(shù)據(jù),呈現(xiàn)獨特的地圖分析、視覺化與信息分層方式,獲得包含時間與空間兩重維度的檢索結(jié)果,提高檢索的準(zhǔn)確與直觀性[4]。如針對特定作者,可以借助該技術(shù)自動采集分析其綜合信息,生成作者生平的行蹤路線圖[5]。GIS為用戶提供了全新的檢索入口,方便圖書館在古籍文獻數(shù)字化基礎(chǔ)上,促進古籍文獻圖表化、可視化,生成動態(tài)古籍?dāng)?shù)字化地圖,以清晰的知識圖譜體系,提高古籍文獻的易讀性,擴大古籍文獻的傳播范圍。
圖書館古籍文獻類型復(fù)雜,為避免重復(fù)建設(shè)和資源浪費,可以利用知識發(fā)現(xiàn)技術(shù)建立文獻管理系統(tǒng),實現(xiàn)古籍文獻的高效整合與科學(xué)管理[6]。該系統(tǒng)分為古籍導(dǎo)入、分類管理、知識發(fā)現(xiàn)檢索等模塊,可以通過館藏文獻調(diào)取、網(wǎng)絡(luò)資源采集和自動掃描識別等方式,將既有的古籍文獻資源導(dǎo)入原始數(shù)據(jù)庫中,并對原始數(shù)據(jù)進行分類處理,根據(jù)分類結(jié)果設(shè)計檢索頁面,依托知識發(fā)現(xiàn)獲得有價值的知識,滿足用戶的全文檢索需求。系統(tǒng)運行過程中,知識發(fā)現(xiàn)技術(shù)的作用在于從大量文獻中自動提取特征信息,然后借助神經(jīng)網(wǎng)絡(luò)與決策樹等,對不同的特征項進行分類,賦予對應(yīng)項目唯一的標(biāo)識[7]。此后對這些文獻資源進行相關(guān)性分析,發(fā)現(xiàn)不同數(shù)據(jù)之間的隱含關(guān)系,從中挖掘有價值的知識。
數(shù)字人文時代數(shù)字化資源的應(yīng)用日益普遍,圖書館有必要應(yīng)用數(shù)字化技術(shù),建立古籍文獻資源專題數(shù)據(jù)庫,不斷補充與完善數(shù)據(jù)信息,更好地滿足古籍文獻的長期保存需求。
移動信息技術(shù)的廣泛應(yīng)用,推動了圖書館數(shù)字化建設(shè)的進程,很多新的數(shù)字化處理工具被開發(fā)出來,也為古籍文獻的數(shù)字化保存提供了可行方案。例如方正集團研發(fā)的古籍資源數(shù)字化加工系統(tǒng),可以實現(xiàn)對古籍文獻的全文數(shù)字化,加工準(zhǔn)確度高,為用戶對古籍資源的全文檢索、閱讀與分析提供了便利。圖書館在古籍文獻數(shù)據(jù)庫建設(shè)的準(zhǔn)備階段,要根據(jù)館藏規(guī)模與需求,選擇優(yōu)質(zhì)數(shù)字化供應(yīng)商合作,切實保障數(shù)字化處理工具的性能[8]。在數(shù)據(jù)庫設(shè)計方面,盡量選擇高吞吐量、兼容性好的內(nèi)部數(shù)據(jù)存儲器,滿足對大規(guī)模數(shù)據(jù)的實時統(tǒng)計、存儲與調(diào)用需求,避免由于頻繁讀取導(dǎo)致的系統(tǒng)卡頓與延遲。
圖書館古籍文獻數(shù)據(jù)庫的構(gòu)建耗資巨大,涉及范圍廣,建設(shè)周期長。為了降低建庫成本,提高建庫效率,圖書館可以通過以下步驟保障建庫的有效性。首先,做好古籍文獻采訪工作。目前很多商業(yè)信息機構(gòu)存儲有數(shù)字化古籍文獻資源,圖書館為拓展古籍來源,可以與這些商業(yè)機構(gòu)合作,直接購買他們的數(shù)字化產(chǎn)品[9]。其次,對網(wǎng)絡(luò)資源進行鏈接與整合,可以利用網(wǎng)頁檢索工具,實現(xiàn)對這些資源的迅速采集,并直接填充至專題數(shù)據(jù)庫中。此外,做好古籍文獻資源的分類整理工作,借助數(shù)字化工具進行深入挖掘,形成可視化的古籍資源地圖,滿足用戶的多元化檢索需求。如國家圖書館建立的“全文影像數(shù)據(jù)庫”,涵蓋敦煌遺珍、數(shù)字方志等內(nèi)容,可以滿足用戶的關(guān)聯(lián)檢索、高級檢索等個性化需求。
圖書館做好古籍文獻數(shù)字化處理后,還需要設(shè)置合理的數(shù)據(jù)庫運作規(guī)范,保障數(shù)據(jù)庫的合理使用(見圖1)。對古籍文獻的采集整理,要求設(shè)計統(tǒng)一的采訪、編目與閱覽標(biāo)準(zhǔn),避免重復(fù)建設(shè)和資源浪費。在古籍文獻數(shù)字化制作階段,需要做好圖文對照、特征匹配和專業(yè)校對等工作,然后對這些資源進行排序整理,保障入庫信息的完整、準(zhǔn)確、有序性。對古籍文獻的數(shù)字化存儲,可以設(shè)置包括分類掃描、信息識別、圖像處理等在內(nèi)的操作流程,針對每個環(huán)節(jié)設(shè)計合理的操作標(biāo)準(zhǔn),要求館員嚴格執(zhí)行。此外,保障數(shù)據(jù)庫檢索界面的簡潔友好性,設(shè)置資源導(dǎo)航、聯(lián)機字典等輔助功能,方便用戶的便捷、高效檢索,并可以在古籍文本與圖片預(yù)覽之間自由切換。
圖1 圖書館古籍文獻數(shù)據(jù)庫運作流程
由于長期以來受到管理體制的制約,不同古籍管理機構(gòu)之間各自為政,對古籍文獻的采集、修復(fù)、挖掘與管理力度不夠,缺乏共享渠道,尚未建立可靠的古籍長期保存機制。為此,圖書館有必要發(fā)揮自身優(yōu)勢,積極承擔(dān)起保護與挖掘古籍文獻的重任,聯(lián)合其他信息機構(gòu),共同建立完善古籍開發(fā)與保存機制,促進我國古籍保護事業(yè)的發(fā)展。
數(shù)字人文時代古籍文獻的研究利用價值進一步凸顯,圖書館在強化古籍?dāng)?shù)字化建設(shè)的同時,也有必要聯(lián)合博物館、出版社、地方志研究所等機構(gòu),共同探討古籍文獻的數(shù)字化保存標(biāo)準(zhǔn),建立統(tǒng)一規(guī)范的古籍保存標(biāo)準(zhǔn)體系。這是因為古籍文獻種類復(fù)雜多樣,若編目、存儲標(biāo)準(zhǔn)不統(tǒng)一,將直接制約古籍的可持續(xù)開發(fā)[10]。地方政府在古籍保護方面,要發(fā)揮牽頭和引領(lǐng)作用,指導(dǎo)圖書館等文獻存儲機構(gòu)協(xié)同合作,成立專門的古籍文獻開發(fā)標(biāo)準(zhǔn)委員會,專門負責(zé)標(biāo)準(zhǔn)制定與調(diào)整工作,建立古籍開發(fā)、評價與保存的嚴格技術(shù)體系。各級信息機構(gòu)要嚴格規(guī)范,做好古籍文獻數(shù)字化建設(shè)工作,并保障數(shù)據(jù)格式、編目規(guī)則、應(yīng)用系統(tǒng)的統(tǒng)一性。
在古籍文獻保護方面,目前很多機構(gòu)存在規(guī)模不完整、修復(fù)技術(shù)落后、保護人才匱乏等問題,導(dǎo)致很多珍貴的民族文化遺產(chǎn)毀損或流失。我國一些學(xué)者也指出,如今精通古籍修復(fù)與研究的人員越來越少,后繼人才青黃不接。由于古籍文獻的保護與利用,對相關(guān)管理者的要求較高。為了保障可靠的人才儲備,國家要盡快建立古籍保護人才培養(yǎng)方案,指導(dǎo)各級高校設(shè)置古籍保護專業(yè),或開設(shè)與古籍保護相關(guān)的課程,讓更多的年輕人加入到古籍保護工作中。圖書館也可以與其他機構(gòu)合作,強化古籍保護人員的在職培訓(xùn)工作,指導(dǎo)他們掌握與古籍翻譯、編目、修復(fù)等相關(guān)的技能,以更好地實現(xiàn)古籍長期保存的目標(biāo)。
圖書館開展古籍文獻數(shù)字化建設(shè)的目標(biāo)之一,就是促進古籍典藏共享,讓更多的人認識到古籍的應(yīng)用價值。隨著古籍?dāng)?shù)字化保護工作的推進,很多古籍存儲機構(gòu)建立了古籍全文數(shù)據(jù)庫或書目數(shù)據(jù)庫,實現(xiàn)了古籍文獻的全文數(shù)字化和快速在線檢索。然而部分機構(gòu)將古籍文獻作為特色館藏,不愿意與其他機構(gòu)共享,不僅導(dǎo)致古籍?dāng)?shù)字化的重復(fù)建設(shè),也勢必增加資金、人力成本。只有各級信息機構(gòu)聯(lián)合起來,在古籍文獻保護方面合理分工,充分利用數(shù)字化技術(shù)建立區(qū)域乃至全國性的數(shù)據(jù)庫,形成古籍文獻自由流通的在線共享平臺,才能真正提升古籍的利用水平。
古籍文獻資源是我國珍貴的歷史遺存,是中華文明演變的見證者,在弘揚民族文化和促進中外交流方面發(fā)揮著重要作用。數(shù)字人文時代各類先進技術(shù)的應(yīng)用,促進了古籍文獻數(shù)字化建設(shè),更加強調(diào)知識挖掘與信息共享。圖書館作為古籍存儲機構(gòu),有必要引入新理念與新技術(shù),將數(shù)字人文思想融入古籍文獻保護中,從先進的數(shù)字化實踐項目中吸取經(jīng)驗,與信息機構(gòu)開展廣泛合作,全面提高古籍整合質(zhì)量,實現(xiàn)古籍保護事業(yè)的可持續(xù)發(fā)展。
[1] 陳暢.論古籍資源數(shù)字化的信息資源建設(shè)[J].山西科技,2017,33(2):73-74,77.
[2] 韓晶.新疆古籍文獻資源數(shù)字化保護探析[J].圖書館學(xué)刊,2015(11):59-61.
[3] 文秀華,王蓮霞.新媒體環(huán)境下高校圖書館古籍的閱讀推廣[J].農(nóng)業(yè)圖書情報學(xué)刊,2017,29(12):143-146.
[4] 王向真.基于地理信息系統(tǒng)的圖書館讀者借閱行為研究[J].中國中醫(yī)藥圖書情報雜志,2014,38(5):19-22.
[5] 鐘勁松.文化傳承視角下公共圖書館古籍保護問題與對策[J].圖書館學(xué)刊,2018(4):26-29.
[6] 左瑾.公共圖書館古籍資源數(shù)字化開發(fā)與閱讀推廣研究[J].圖書館學(xué)刊,2017(12):67-70.
[7] 李小平,張憶雄,沈洋,等.醫(yī)藥古籍文獻數(shù)字化標(biāo)準(zhǔn)體系的構(gòu)建[J].中華醫(yī)學(xué)圖書情報雜志,2017,26(1):11-14.
[8] 曹麗.大數(shù)據(jù)環(huán)境下高校圖書館古文獻資源數(shù)字化現(xiàn)狀分析[J].圖書情報導(dǎo)刊,2016,1(2):1-3,8.
[9] 吳茗.提高古籍?dāng)?shù)字資源服務(wù)質(zhì)量的實踐與思考[J].情報探索,2016(8):102-105.
[10] 溫麗君.論數(shù)字化時代高校圖書館紙本文獻資源建設(shè)[J].中國中醫(yī)藥圖書情報雜志,2015,39(6):27-29.
Discussion on Digitalization Long-term Preservation Mechanism of Ancient Literature Resources in Libraries under Digital Humanities Era
CHEN Cheng
(Songjiang Library of Shanghai, Shanghai 201699, China)
Digital humanities has changed the face of modern scientific research and provided new ideas for the deep development of ancient literature. This article introduced the significance of digitalization construction of ancient literature under the digital humanities era from the aspects of objective requirements for preservation of ancient literature, the need for deep development of ancient literature, and the need for inheriting excellent traditional Chinese culture. It also analyzed the common digitalization construction technology of ancient literature resources, such as text mining, geographic information system and knowledge discovery, which are commonly used in libraries, studied the ancient literature in libraries, and finally, put forward the establishment of the long-term preservation mechanism of ancient literature in libraries from the perspectives of long-term preservation standards, personnel training mechanism and digital sharing.
digital humanities; ancient literature; digitalization; preservation; libraries
10.3969/j.issn.2095-5707.2019.03.002
G255.1;G258.2
A
2095-5707(2019)03-0006-04
陳誠.數(shù)字人文時代圖書館古籍文獻資源的數(shù)字化長期保存機制探討[J].中國中醫(yī)藥圖書情報雜志,2019,43(3): 6-9.
陳誠,E-mail: yrtajgbn@sina.com
2018-12-14
2018-12-21
(編輯:魏民)