呂玉爽 倪華陽(yáng)
摘 要:數(shù)字人文是當(dāng)代信息技術(shù)與人文領(lǐng)域融合衍生出的新興領(lǐng)域,其為古籍資源的整理與研究帶來(lái)了新的發(fā)展機(jī)遇。本文從數(shù)字人文的興起與發(fā)展出發(fā),分析數(shù)字人文對(duì)古籍研究領(lǐng)域產(chǎn)生的影響,探討古籍資源數(shù)字化的意義。
關(guān)鍵詞:數(shù)字人文;古籍資源數(shù)字化;意義
中圖分類(lèi)號(hào):G255.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-0037(2018)3-87-3
DOI:10.19345/j.cxkj.1671-0037.2018.03.023
Exploring the Significance of Digitalization of Ancient Books Resources under the Background of Digital Humanities
Lv Yushuang ,Ni Huayang
(1. School of Information Management,Zhengzhou University, Zhengzhou Henan 450001;
2.Army Infantry Academy, Shijiazhuang Hebei 050200)
Abstract: Digital humanities is an emerging field that is derived from the fusion of contemporary information technology and humanities. It brings new development opportunities for the consolidation and research of ancient books resources. Starting from the rise and development of digital humanities, this paper analyzes the influence of digital humanities on the field of ancient books research, and explores the significance of the digitization of ancient books resources.
Key words: digital humanities; digitization of ancient books resources; significance
1 引言
古籍是中國(guó)古代書(shū)籍的簡(jiǎn)稱(chēng),據(jù)國(guó)家標(biāo)準(zhǔn)《古籍著錄規(guī)則》(GB/T 3792.7—2008)古籍主要指1911(含)年以前中國(guó)書(shū)寫(xiě)或印刷的書(shū)籍,在實(shí)際工作中,常有圖書(shū)館將民國(guó)甚至現(xiàn)代影印的線(xiàn)裝書(shū)視為古籍[1]。古籍資源是我國(guó)古代勞動(dòng)人民智慧的結(jié)晶,更是華夏兒女寶貴的文化遺產(chǎn)與精神財(cái)富。長(zhǎng)期以來(lái),由于古籍資源的稀缺性與不可再生性,其“藏”與“用”的矛盾十分突出,現(xiàn)代古籍資源開(kāi)發(fā)形勢(shì)不容樂(lè)觀。古籍資源的整理與研究一直是困擾學(xué)術(shù)界的一大難題。
隨著信息技術(shù)的迅猛發(fā)展,現(xiàn)代科學(xué)研究領(lǐng)域日新月異,計(jì)算機(jī)通信技術(shù)與現(xiàn)代互聯(lián)網(wǎng)技術(shù)已經(jīng)逐步滲透到人文研究的各個(gè)領(lǐng)域,在數(shù)字技術(shù)與人文領(lǐng)域深度融合下,產(chǎn)生了數(shù)字人文這一新的交叉領(lǐng)域。其發(fā)展與興起,為古籍資源的整理與開(kāi)發(fā)研究注入了新的活力。在數(shù)字人文環(huán)境下開(kāi)展古籍資源數(shù)字化工作具有重要意義。
2 數(shù)字人文的興起與發(fā)展
數(shù)字人文(Digital Humanities),又稱(chēng)作人文計(jì)算(Humanities Computing),是一個(gè)將現(xiàn)代計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)深入應(yīng)用于傳統(tǒng)的人文研究與教學(xué)的新型跨學(xué)科研究領(lǐng)域。其源起,最早可追溯至20世紀(jì)40年代末興起的人文計(jì)算,而后隨著支持人文研究的工具與技術(shù)的更新,經(jīng)歷了起步階段(1949—1970年)、鞏固階段(1971—1980年)、新發(fā)展階段(1981—1990年)以及互聯(lián)網(wǎng)時(shí)代(1991年—)等4個(gè)不同的演進(jìn)時(shí)期[2]。而隨著數(shù)字時(shí)代的到來(lái),正式演變?yōu)閿?shù)字人文。
我國(guó)數(shù)字人文研究與實(shí)踐剛剛起步,其在我國(guó)學(xué)術(shù)界還是個(gè)新概念,相關(guān)的研究工作都仍在探索之中,挑戰(zhàn)與機(jī)遇并存。數(shù)字人文作為一個(gè)跨學(xué)科領(lǐng)域,涉及學(xué)科范圍廣泛,包括語(yǔ)言學(xué)、文學(xué)、歷史、計(jì)算機(jī)科學(xué)等[3]。其是新興技術(shù)與人文探究之間動(dòng)態(tài)對(duì)話(huà)的結(jié)果,不能簡(jiǎn)單地被界定為利用計(jì)算機(jī)技術(shù)開(kāi)展人文活動(dòng),或者在計(jì)算機(jī)科學(xué)領(lǐng)域內(nèi)進(jìn)行感興趣的人文實(shí)驗(yàn)[4]。數(shù)字人文學(xué)科從一個(gè)新的理論高度看待數(shù)字技術(shù)與人文研究的關(guān)系及其帶來(lái)的影響,帶來(lái)的是人文研究范式與方法體系的更迭,為人文研究者提供了嶄新的工具和平臺(tái),可以實(shí)現(xiàn)海量的數(shù)字資源組織、標(biāo)引、檢索、挖掘和分析利用,從而有效提升了人文研究各個(gè)環(huán)節(jié)的效率。
3 數(shù)字人文與古籍資源數(shù)字化
我國(guó)古籍汗牛充棟、類(lèi)目繁多。但由于自然環(huán)境與人為因素的影響,古籍紙本資源流失嚴(yán)重,數(shù)量愈發(fā)減少,現(xiàn)存古籍壽命也大大降低。據(jù)不完全統(tǒng)計(jì),目前我國(guó)現(xiàn)藏古籍在5 000萬(wàn)冊(cè)以上,其中1/3破損嚴(yán)重,亟待保護(hù)[5]。由于古籍資源物理載體的限制,其對(duì)保存環(huán)境具有極高的要求。圖書(shū)館、博物館等古籍研究部門(mén)付出大量人力物力資源實(shí)施古籍紙本資源的保護(hù),卻見(jiàn)效甚微。而數(shù)字人文的興起,為古籍資源的整理與開(kāi)發(fā)提供了創(chuàng)造性的理論和實(shí)踐性的方法。即首先可以對(duì)現(xiàn)存古籍資源進(jìn)行數(shù)字化,而后基于數(shù)字化的古籍資源,從文本挖掘、GIS技術(shù)、文本可視化和古籍語(yǔ)料庫(kù)等方面可以進(jìn)行古籍?dāng)?shù)字化資源的深度開(kāi)發(fā)[6]。
所謂古籍?dāng)?shù)字化,相關(guān)理論還處在不斷探索中,其概念尚未能統(tǒng)一。毛建軍[7]曾這樣定義:“古籍?dāng)?shù)字化就是從利用和保護(hù)古籍的目的出發(fā),采用計(jì)算機(jī)技術(shù),將常見(jiàn)的語(yǔ)言文字或圖形符號(hào)轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成古籍文獻(xiàn)書(shū)目數(shù)據(jù)庫(kù)和古籍全文數(shù)據(jù)庫(kù),用以揭示古籍文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作?!?/p>
古籍?dāng)?shù)字化所帶來(lái)的是一種新的學(xué)術(shù)交流形式,有助于形成開(kāi)放共享的學(xué)術(shù)交流平臺(tái)。數(shù)字人文的大環(huán)境加快了人文學(xué)科資源的大眾化獲取和知識(shí)流動(dòng),突破了原有自主探索的封閉學(xué)術(shù)文化,形成了跨學(xué)科與公眾參與的開(kāi)放學(xué)術(shù)文化與科研運(yùn)行機(jī)制[3]。
4 古籍資源數(shù)字化的意義探討
數(shù)字人文運(yùn)動(dòng)的深入發(fā)展深刻影響了古籍研究領(lǐng)域,圖書(shū)館、古籍研究部門(mén)等機(jī)構(gòu)也意識(shí)到了數(shù)字化技術(shù)帶來(lái)的變革,紛紛開(kāi)展古籍資源的數(shù)字化工作。
相較于傳統(tǒng)古籍,數(shù)字化的古籍資源有更多優(yōu)勢(shì)。古籍資源數(shù)字化不僅為古籍資源的保存與使用打開(kāi)了新的大門(mén),也為古籍資源研究與開(kāi)發(fā)翻開(kāi)了新的篇章,更為古籍資源的開(kāi)放共享打下了堅(jiān)實(shí)基礎(chǔ)。數(shù)字人文背景下進(jìn)行古籍資源數(shù)字化建設(shè)具有重要意義。
4.1 古籍?dāng)?shù)字化有利于古籍資源的長(zhǎng)久保存
由于傳統(tǒng)古籍文獻(xiàn)載體的脆弱性,隨著歲月流逝,古籍資源損壞嚴(yán)重。在簡(jiǎn)帛和紙質(zhì)古籍的時(shí)代,每逢天災(zāi)或者戰(zhàn)亂,古籍都無(wú)法逃脫焚掠散佚的厄運(yùn)[8]。傳統(tǒng)的古籍資源壽命有限,對(duì)保存環(huán)境的溫度濕度要求極高,易受自然因素與人為因素的影響,甚至大量人為翻閱都有可能對(duì)古籍造成嚴(yán)重?fù)p壞。
但隨著計(jì)算機(jī)數(shù)字化技術(shù)的飛速發(fā)展,借助于數(shù)字化技術(shù)以字符、圖片等形式保存于計(jì)算機(jī)中的古籍資源徹底掙脫了紙質(zhì)載體的桎梏,使得古籍資源的自由存取與長(zhǎng)期保存成為可能。與此同時(shí),古籍紙本原件的使用率降低,從而減少了古籍原件磨損消耗,大大延長(zhǎng)了古籍原件的壽命,有利于更好地傳存古籍。
4.2 古籍?dāng)?shù)字化方便了古籍資源的查閱使用
古籍資源大多由全國(guó)圖書(shū)館、博物館系統(tǒng)保存,其服務(wù)模式受時(shí)間、空間的限制,甚至部分館藏單位將其看作“鎮(zhèn)館之寶”,束之高閣,不予示人。更有圖書(shū)館設(shè)置多項(xiàng)閱覽規(guī)則,限制讀者借閱時(shí)間與數(shù)量,讀者獲取古籍文獻(xiàn)難上加難。
而且,傳統(tǒng)的手工檢索方式速度慢、查全率查準(zhǔn)率低下,不僅在查詢(xún)過(guò)程中會(huì)對(duì)古籍造成二次損害,更會(huì)耗費(fèi)大量人力與時(shí)間資源。
古籍?dāng)?shù)字化帶來(lái)的與時(shí)俱進(jìn)的存儲(chǔ)與管理方式,使得古籍資源服務(wù)方式發(fā)生改變?;诠偶Y源數(shù)據(jù)庫(kù),使用者可以更加快速、方便地查閱電子古籍文獻(xiàn),省時(shí)省力,極大地提高了工作效率與古籍資源利用率。同時(shí),數(shù)字化古籍文獻(xiàn)具有其優(yōu)越性,其中的超鏈接設(shè)計(jì)使得讀者可以通過(guò)鏈接快速地查看到相關(guān)注釋和資料,甚至可以輕松查看典籍內(nèi)容與網(wǎng)站[9]。使用者在瀏覽閱讀古籍時(shí)就可以根據(jù)個(gè)性化目標(biāo)需求改變傳統(tǒng)印刷版的線(xiàn)性順序,以語(yǔ)詞點(diǎn)、知識(shí)點(diǎn)為中心,發(fā)散性地、及時(shí)性地、有選擇性地尋找需要的內(nèi)容[10],極大地方便了人們對(duì)古籍資源的查閱與使用,滿(mǎn)足了當(dāng)代社會(huì)人們?nèi)找嬖鲩L(zhǎng)的信息需求。
4.3 古籍?dāng)?shù)字化有利于古籍資源的研究開(kāi)發(fā)
中華古籍卷帙浩繁、類(lèi)目繁多,大部分藏于世界各地的圖書(shū)館、博物館。古籍研究領(lǐng)域的專(zhuān)家學(xué)者往往需要耗費(fèi)較長(zhǎng)時(shí)間,常常需奔波于全國(guó)各地的古籍收藏點(diǎn)。再者,進(jìn)行古籍研究需要研究人員大量閱讀與統(tǒng)計(jì),完全基于人力,耗時(shí)長(zhǎng)且效果不佳。傳統(tǒng)的古籍應(yīng)用與開(kāi)發(fā)模式已難以適應(yīng)新時(shí)代下人文學(xué)科研究的需要。
隨著數(shù)字人文理念的出現(xiàn),傳統(tǒng)古籍整理研究方法的局限性越發(fā)突出。古籍資源數(shù)字化帶來(lái)的不僅僅是龐大的古籍資源存儲(chǔ)數(shù)據(jù)庫(kù),更是構(gòu)建了數(shù)字技術(shù)與人文研究合流的新平臺(tái),構(gòu)建可持續(xù)完善和豐富的數(shù)據(jù)集和分析工具,充分利用新的信息技術(shù)與跨學(xué)科方法對(duì)古籍進(jìn)行深層次的分析與挖掘。極大地改善了研究者的研究條件,在計(jì)算機(jī)中保存的數(shù)字化古籍信息對(duì)古籍內(nèi)容實(shí)現(xiàn)更系統(tǒng)、全面地揭示,并能夠?yàn)檠芯空咛峁┫嚓P(guān)的背景知識(shí)、鏈接類(lèi)似的古籍資源等。另外,基于古籍全文數(shù)據(jù)庫(kù),借助于大數(shù)據(jù)時(shí)代的文本挖掘、詞頻分析、可視化等技術(shù)手段可以輕松實(shí)現(xiàn)海量古籍資源的深度分析,例如對(duì)某一時(shí)代、某一流派等作品內(nèi)在聯(lián)系的發(fā)掘,實(shí)現(xiàn)古籍資源潛在價(jià)值的挖掘與增值研究。
古籍?dāng)?shù)字化為古籍研究界注入了新的活力,激發(fā)了學(xué)術(shù)研究者的熱情與動(dòng)力,從而有助于推動(dòng)傳統(tǒng)文化的現(xiàn)代化進(jìn)程,帶動(dòng)古籍開(kāi)發(fā)研究方法的進(jìn)步與研究范式的創(chuàng)新,從而推動(dòng)科學(xué)研究的發(fā)展[12]。
4.4 古籍?dāng)?shù)字化對(duì)中華文化的傳承有重要意義
中華古籍是中華民族上下五千年歷史文明的產(chǎn)物,是古代勞動(dòng)人民智慧的結(jié)晶,更是古代珍貴典藏的重要部分。古籍記錄了我國(guó)古代政治、經(jīng)濟(jì)、文化、宗教等各領(lǐng)域的發(fā)展,是體現(xiàn)中國(guó)古代各時(shí)期發(fā)展?fàn)顩r的關(guān)鍵史料,具有重要的文物價(jià)值與學(xué)術(shù)價(jià)值,是祖先留給我們的珍貴遺產(chǎn),是不可再生的珍貴資源。
一個(gè)民族的文化精神得以傳承和發(fā)揚(yáng)是一個(gè)民族長(zhǎng)久發(fā)展的必要條件。隨著互聯(lián)網(wǎng)技術(shù)與計(jì)算機(jī)技術(shù)的迅猛發(fā)展,古籍?dāng)?shù)字化技術(shù)使得古籍資源實(shí)現(xiàn)了網(wǎng)絡(luò)共享。使古籍資源的傳播更加現(xiàn)代化、網(wǎng)絡(luò)化、數(shù)字化,實(shí)現(xiàn)了在任意時(shí)間任意空間的大范圍共享。處于全球互聯(lián)網(wǎng)環(huán)境中的人們可以隨時(shí)隨地獲取到古籍信息,并可以超低的成本、超快的速度實(shí)現(xiàn)古籍資源的復(fù)制與利用。信息傳播量大,資源利用率高,古籍資源的使用不再受時(shí)間和空間的限制。社會(huì)公眾可以極為方便地接觸中華古籍,感受中華傳統(tǒng)文化的熏陶,深入學(xué)習(xí)并將其發(fā)揚(yáng)光大。古籍?dāng)?shù)字化不僅拉近了普通大眾與古籍資源的距離,還激發(fā)了有志之士致力于古籍資源的開(kāi)發(fā)研究,這對(duì)古籍資源普及與中華文化傳承具有重要意義。
5 結(jié)語(yǔ)
數(shù)字人文浪潮襲來(lái),對(duì)古籍資源研究領(lǐng)域來(lái)說(shuō),是挑戰(zhàn),也是機(jī)遇。本文站在數(shù)字人文領(lǐng)域的視角下分析古籍資源數(shù)字化的意義與必要性。我們應(yīng)該利用大數(shù)據(jù)時(shí)代的優(yōu)勢(shì),充分利用計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)資源,積極進(jìn)行古籍資源的數(shù)字化建設(shè),共同推進(jìn)古籍資源研究領(lǐng)域甚至于整個(gè)人文研究領(lǐng)域朝著更深更廣的方向發(fā)展。
參考文獻(xiàn):
[1] 張敏.信息時(shí)代高校圖書(shū)館古籍資源整合與建設(shè)[J].大學(xué)圖書(shū)情報(bào)學(xué)刊,2012(2):29-31.
[2] Hockey S. The History of Humanities Computing[M]. Blackwell Publishing Ltd,2004:1-19.
[3] 柯平,宮平.數(shù)字人文研究演化路徑與熱點(diǎn)領(lǐng)域分析[J].中國(guó)圖書(shū)館學(xué)報(bào),2016(6):13-30.
[4] Varner S,Hswe P.Special Report:Digital Hu-manitiesin Libraries[R].2016-05-20.
[5] 吳敏霞.古籍保護(hù)堪憂(yōu)[N].中國(guó)社會(huì)科學(xué)報(bào),2011-10-13(18).
[6] 范佳.“數(shù)字人文”內(nèi)涵與古籍?dāng)?shù)字化的深度開(kāi)發(fā)[J].圖書(shū)館學(xué)研究,2013(3):29-32.
[7] 毛建軍.古籍?dāng)?shù)字化的概念與內(nèi)涵[J].圖書(shū)館理論與實(shí)踐,2007(4):82-84.
[8] 曹天曉.新技術(shù)下古籍?dāng)?shù)字化分類(lèi)及意義探究[J].圖書(shū)館研究與工作,2017(9):37-41.
[9] 陳暢.論古籍資源數(shù)字化的信息資源建設(shè)[J].山西科技,2017(2):73-74,77.
[10] 李國(guó)新.中國(guó)古籍資源數(shù)字化的進(jìn)展與任務(wù)[J].大學(xué)圖書(shū)館學(xué)報(bào),2002(1):21-26,41-91.
[11] 歐陽(yáng)劍.面向數(shù)字人文研究的大規(guī)模古籍文本可視化分析與挖掘[J].中國(guó)圖書(shū)館學(xué)報(bào),2016(2):66-80.
[12] 米淑琴,謝紅.網(wǎng)絡(luò)環(huán)境下古籍?dāng)?shù)字化的現(xiàn)狀與對(duì)策[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010(14):53-55.