国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

地方和高校圖書館古籍資料數(shù)字化方案探討

2021-12-06 13:04■鄧
法治新聞傳播 2021年6期
關(guān)鍵詞:古籍檢索學(xué)者

■鄧 逾

浩如煙海的紛繁古籍是中華民族的文化瑰寶,記載著我國悠久的連綿不斷的文化。從不計其數(shù)的古籍中找尋最有價值的菁華部分,傳承弘揚中華優(yōu)秀的傳統(tǒng)文化并服務(wù)當(dāng)前社會,成為一批批人文學(xué)者畢生孜孜以求的目標(biāo)。

通常,人文學(xué)者為了搜集更多資料支撐其研究,可能需要翻閱數(shù)以千計的多種古籍,跨越多個朝代,并隨時根據(jù)閱讀做大量的筆記摘錄,再進一步整理研究并考證這些資料,往往耗時多年。

電子資源日益增多和網(wǎng)絡(luò)的普及帶來更為廣泛的多元化信息,不同領(lǐng)域的研究人員在利用圖書館的行為上發(fā)生了顯著的變化。從事自然科學(xué)的研究人員,更加關(guān)注追蹤世界同行前沿的最新動態(tài),充分利用網(wǎng)絡(luò)帶來的信息查詢便捷性和高效性,越來越脫離實體圖書館。

人文學(xué)者,尤其是需要古籍藏書之類資料的人文學(xué)者,他們在電子資源使用上與自然科學(xué)的同行有著很大的差異,無論是使用目的、使用頻率及使用方法上都有明顯的不同①。一方面的原因在于古籍藏書之類的數(shù)據(jù)庫的電子資源相對匱乏;另一方面人文學(xué)者在計算機的使用技巧和能力上還有差距,他們在對信息處理的方式上也與自然科學(xué)的學(xué)者有差異。目前,人文學(xué)者主要還是依賴圖書館的藏書來獲取研究信息。因此,圖書館能否利用現(xiàn)代科技提供一種嶄新的服務(wù),讓人文學(xué)者從艱苦、繁重、低效的文獻搜索整理過程中解脫出來,是一個非常有價值的工作。

為了加大對古籍資料進行保護與利用的力度,2007年國家啟動中華古籍保護計劃工程②,對許多重要的古籍圖書進行了數(shù)字化,從根本上解決古籍文獻遭受蟲噬鼠咬、水火侵害的問題。但是,大量古籍的數(shù)字化需要巨額的資金支持。據(jù)估算,如果將目前尚未數(shù)字化的古籍全部數(shù)字化,采集、組織、加工、存儲、管理等費用大約需要60億元。③只有國家圖書館等單位承擔(dān)國家級的項目,才有能力對重要古籍資料進行全面的數(shù)字化。

很多地方和高校圖書館也藏有大量有特色的古籍資料,由于缺少專項經(jīng)費,無法開展深入的數(shù)字化工作。因此,在沒有足夠?qū)m椊?jīng)費支持的情況下,如何利用有限的經(jīng)費開展部分或者分階段的古籍資料數(shù)字化,是非常有意義的工作。

地方及高校圖書館的古籍資料利用現(xiàn)狀

傳統(tǒng)圖書館所提供的資源主要是服務(wù)大眾化讀者的,查閱古籍資料的人文學(xué)者相對來說是小眾讀者,他們的特點在于專業(yè)屬性強,參考資料相對較少。普通圖書館如何在滿足大眾服務(wù)的情況下,兼顧特殊的小眾讀者,為他們盡可能地提供滿意的服務(wù)是一個發(fā)展趨勢。

尤其是各高校的圖書館,在服務(wù)主流學(xué)科研究人員和學(xué)生的同時,還要兼顧學(xué)校學(xué)科的均衡發(fā)展,為一些冷門學(xué)科,如古籍資料的研究和利用,提供足夠的服務(wù)和需求保障。所以,圖書館館藏建設(shè)越完善,就越能保障小眾讀者的需求。

以筆者工作的華中科技大學(xué)圖書館藏書為例,華中科技大學(xué)是一個多學(xué)科的以理工醫(yī)為主的,包括人文經(jīng)濟類全面協(xié)同發(fā)展的大學(xué)。該校圖書館是學(xué)校的文獻信息中心,是為教學(xué)和科學(xué)研究提供信息化服務(wù)的重要基地。與強勢的理工醫(yī)類學(xué)科相比,文史學(xué)科的研究相對弱小。為了適應(yīng)學(xué)校多學(xué)科的教學(xué)科研需求,古籍文獻也是該校圖書館的重要館藏文獻,保障了圖書資料的完備性和多樣性。利用圖書館的館藏古籍的研究人員屬于小眾人員,但他們對圖書館的依賴性更強,去圖書館查閱資料的時間更多。

在古籍資料查閱過程中,人文學(xué)者付出的工作相當(dāng)艱辛。圖書館有責(zé)任和義務(wù)來對這些古籍文獻進行現(xiàn)代化處理,使得專業(yè)的人文學(xué)者能夠充分利用現(xiàn)代信息技術(shù)為自己的科研與教學(xué)服務(wù),利用數(shù)字資料庫來完成對原始資料的收集與整理工作,把學(xué)者從繁重的“體力”工作中解脫出來,把更多精力放在資料的分析、比較和研究上。

隨著文化教育事業(yè)的迅速發(fā)展,古籍文獻的學(xué)術(shù)參考價值必將受到越來越多的人文專家學(xué)者的關(guān)注。不斷增長的客觀需求要求圖書館在做好古籍文獻保護的同時,還要讓館藏古籍盡可能借助現(xiàn)代信息技術(shù)以嶄新的形態(tài)呈現(xiàn)給讀者,進而提高古籍文獻的利用率。對于古籍?dāng)?shù)字化過程中的關(guān)鍵技術(shù),即信息的獲取、識別、分析以及歸納整理,高校在這些方面無疑具有得天獨厚的優(yōu)勢。此外,高校在古籍?dāng)?shù)字化的應(yīng)用和推廣方面相對于普通地方圖書館來說在多方面具有優(yōu)勢,比如流通優(yōu)勢、融合優(yōu)勢④。如何在有限的經(jīng)費條件下建設(shè)數(shù)字化古籍文獻資料庫,對大學(xué)圖書館來說是一個值得探討的課題。

人文學(xué)者查閱古籍的行為方式

由于華中科技大學(xué)圖書館中文古籍資料庫大多數(shù)是文史領(lǐng)域的,因此本研究的目標(biāo)人群是中國文學(xué)以及歷史領(lǐng)域的學(xué)者。了解他們在古籍資料室的查閱行為,對古籍資料的數(shù)字化如何更好地服務(wù)讀者有著重要的意義。

人文學(xué)者利用古籍資料庫主要是為社科類研究項目準(zhǔn)備資料或者為課堂教學(xué)制作教材。查閱古籍資料主要希望獲得以下信息:歷史人物、事件的演化、確定已有資料的完整性和正確性等⑤。當(dāng)研究關(guān)鍵歷史人物在歷史演變過程中的重要地位和作用時,通常需要搜索古籍資料庫中的各個階段關(guān)鍵事件及相關(guān)聯(lián)的其他人物,由此可以得到整個歷史過程中的復(fù)雜的人物關(guān)系圖,有助于全面理解這個人物在歷史發(fā)展過程中的作用。在制作教材時,為了豐富學(xué)生的知識面而要引用某段句子,老師需要確認(rèn)資料的完整出處,以保證資料的準(zhǔn)確性和完整性。這種資料的查閱及確認(rèn),人文學(xué)者往往需要閱讀多種古籍,在整個古籍資料庫內(nèi)完整搜索,極其耗時。

對于人文學(xué)者來說,單一關(guān)鍵字檢索是最常用的檢索方式。最常用的檢索關(guān)鍵詞主要有人物、地點、年代、事件、時間等,對文學(xué)研究的檢索,常用的有作品、作者、專有名詞、專有概念等。

當(dāng)古籍資料有多個不同時代的版本時,版本信息同樣非常重要,可以使學(xué)者確定哪個時代的版本更為準(zhǔn)確。古籍資料頁面中的正文字體、序跋、注釋、批注、評語等都是學(xué)者所關(guān)注的,是準(zhǔn)確理解正文的重要信息來源。

準(zhǔn)確理解人文學(xué)者對古籍的查閱方式是圖書館對古籍?dāng)?shù)字化的基礎(chǔ),有助于在數(shù)字化過程中為他們盡可能提供精準(zhǔn)的服務(wù)。比如,古籍版面非常復(fù)雜,包括序跋、批注等各種信息,字體的大小、位置、字形都有顯著的差異。但是,現(xiàn)在文字識別技術(shù)難以準(zhǔn)確地重現(xiàn)圖書頁面的原貌,需要在數(shù)字化過程中,既注重文字的準(zhǔn)確性與可檢索性,又能為讀者提供圖書的圖形化頁面,兼顧搜索和閱讀。

古籍文獻的低成本數(shù)字化方案

實現(xiàn)古籍文獻資源數(shù)字化的完整呈現(xiàn)非常復(fù)雜,工程浩大,涉及到資源的數(shù)字釆集、數(shù)字處理、數(shù)字修復(fù)、數(shù)字保存、數(shù)字管理、數(shù)字傳播等。作為地方和大學(xué)圖書館只能根據(jù)有限目標(biāo)、優(yōu)先程度,逐步完成。

(一)數(shù)字化目標(biāo)

數(shù)字技術(shù)為古籍資源的保存、整理與利用帶來了嶄新的方法,互聯(lián)網(wǎng)的迅捷傳播特性也為數(shù)字化古籍資源的廣泛共享奠定了堅實的基礎(chǔ),加速了人文研究的電子信息廣泛應(yīng)用的進程。在此背景下,人文學(xué)者對古籍藏書資源的利用也提出了新的需求。隨著人文學(xué)術(shù)研究的多樣化和深入化,學(xué)者不僅僅大量閱讀古籍藏書的文本內(nèi)容,更希望古籍內(nèi)容有靈活搜索、關(guān)鍵信息的統(tǒng)計、分析等功能。因此在有限的經(jīng)費條件下,盡可能滿足人文學(xué)者的使用需求,主要包括關(guān)鍵詞搜索功能以及古籍資料原貌的在線閱讀。

(二)數(shù)字化的主要困難

古籍文獻數(shù)字化的本質(zhì)是將其中的文字或圖形轉(zhuǎn)化成能被計算機識別的信息,如何完整地重現(xiàn)古籍文獻信息是核心和基礎(chǔ),從而實現(xiàn)古籍的完整保存和準(zhǔn)確利用。由于古籍文獻資料年代久遠(yuǎn),字體模糊,并且有很多復(fù)雜的繁體字或者異體字,為計算機的識別系統(tǒng)帶來一定困難。如果對無法識別的文字簡單地只提供古籍文本掃描影像,僅能提供在線閱讀的視覺呈現(xiàn),則無法滿足學(xué)者的專業(yè)研究需要。所以需要投入大量的人力物力,對計算機識別的文字進行精準(zhǔn)的文字校對,這對地方或者大學(xué)圖書館來說是難以承受的。

(三)數(shù)字化方案

古籍?dāng)?shù)字化是利用專業(yè)的古籍掃描儀來掃描古籍文獻,然后再進行信息的處理。由于古籍文獻很珍貴,數(shù)字化過程需要精心保護古籍文獻,進行無損操作。

1.分階段實施

為了后續(xù)更好地管理和利用,古籍?dāng)?shù)字化分為書目和全文的數(shù)字化兩個階段。第一階段是建設(shè)書目庫的信息資源,為開展多種途徑檢索奠定基礎(chǔ)⑥,初步滿足學(xué)者科研與教學(xué)的需求。書目信息可包括題名、創(chuàng)建者、主題詞、關(guān)鍵詞等標(biāo)準(zhǔn)信息。讀者通過目錄檢索可迅速發(fā)現(xiàn)所需的圖書資料,從而提高工作效率。第二階段是建設(shè)全文數(shù)據(jù)庫。早期的古籍全文數(shù)據(jù)庫是通過人工錄入的文本格式,其最大優(yōu)勢是可實現(xiàn)全文檢索等操作⑦。但是古籍文獻的文字非常復(fù)雜,有篆、隸、楷等字體差異,還有繁、簡、異等文字差別,人工輸入不僅工作量大而且難度高,此外還不能保持古籍原貌。在有限的經(jīng)費下,可以采用計算機識別的文本與掃描圖形相結(jié)合的方式,建立全文數(shù)據(jù)庫。首先對古籍正文進行掃描,然后利用識別軟件把掃描的繁體、篆體等不同字體變成繁、簡體字的文本文件,輔以人工初步檢測提高識別準(zhǔn)確度。這樣,初步簡潔的全文數(shù)據(jù)庫可建立,而這樣的簡易文本數(shù)據(jù)庫雖然閱讀不便,但滿足了初步信息搜索的要求。

2.主要功能優(yōu)先

大學(xué)圖書館古籍?dāng)?shù)字化的服務(wù)對象首先是人文學(xué)者,人文學(xué)者最關(guān)心的是資料的檢索功能和全文材料閱讀功能。檢索功能可以依據(jù)計算機文字識別所產(chǎn)生的繁體文本和簡體版本,利用現(xiàn)有的成熟檢索技術(shù)。其中簡體文本為青年學(xué)者的使用提供了便捷。

由于條件所限,計算機識別產(chǎn)生的文本古籍?dāng)?shù)據(jù)與古籍的原始面貌截然不同,且有一定的誤差,不適合直接閱讀,只提供檢索信息。根據(jù)檢索結(jié)果,再直接調(diào)用全文的圖像數(shù)據(jù)庫閱讀原貌的古籍資料。為了讓研究者能查閱古籍原文的正文、批注、印章等信息,數(shù)字圖像處理技術(shù)是古籍文獻全文信息資源數(shù)字化的關(guān)鍵。在保證古籍全文信息準(zhǔn)確的條件下,通過對采集古籍全文圖像特征提取、圖像校正、圖像拼接、圖像壓縮等技術(shù)⑧,把信息量盡可能壓縮,方便保存,提高讀取速度。這樣兼顧了學(xué)者快速檢索與準(zhǔn)確原文的要求。

3.逐步深化

隨著對古籍?dāng)?shù)字化支持力度的加大和計算機技術(shù)水平的不斷提高,其數(shù)字化程度不斷加深。主要包括在以下方面:(1)文本資料的準(zhǔn)確性、完備性進一步增強,不斷優(yōu)化組合搜索功能提升準(zhǔn)確性,實現(xiàn)跨資料庫的精準(zhǔn)快速定位搜索,并且完善后續(xù)智能處理,為讀者提供更深入的服務(wù)。(2)利用現(xiàn)代計算機圖像技術(shù),再現(xiàn)古籍原始風(fēng)貌,實現(xiàn)圖像與文本完美結(jié)合,閱讀古籍的同時還有摘抄、搜索、處理文字等功能。在此基礎(chǔ)上,結(jié)合虛擬現(xiàn)實等現(xiàn)代數(shù)字技術(shù),讓古籍資料以圖像、文本、聲頻、視頻等形式全方位傳播我國文化。(3)進一步對外開放,并且和其他圖書館資源聯(lián)網(wǎng),實現(xiàn)資源共享。

古籍文獻的數(shù)字化為其再生復(fù)現(xiàn)提供了重要手段,不但易于存儲保護,更利于傳播與利用。隨著數(shù)字化理論與技術(shù)的不斷發(fā)展,計算機、網(wǎng)絡(luò)與智能手機的不斷普及,為我國優(yōu)秀歷史文化創(chuàng)新保護、開發(fā)、傳承奠定了基礎(chǔ)。歷史文化資源數(shù)字化是提高我國文化軟實力、弘揚我國悠久歷史文化的重要舉措,地方及大學(xué)圖書館在推進古籍文獻數(shù)字化潮流中將發(fā)揮越來越重要的作用。

注釋:

①吳明德、黃文琪、陳世娟:《人文學(xué)者使用中文古籍全文資料庫之研究》,《圖書資訊學(xué)刊》1995年第4卷第1/2期。

②趙文友、林世田:《“中華古籍保護計劃”成果——以“中華古籍資源庫”建設(shè)為中心的古籍?dāng)?shù)字化工作》,《新世紀(jì)圖書館》2018年第3期。

③杜羽:《數(shù)字化古籍:走出深閨待人識》,《光明日報》2019年10月30日。

④張爽:《高校圖書館與古籍?dāng)?shù)字化》,《黑龍江教育學(xué)院學(xué)報》2012年第6期。

⑤呂姿玲:《創(chuàng)新古籍?dāng)?shù)位應(yīng)用——以“通用型古籍?dāng)?shù)位人文研究平臺”為例》,《新世紀(jì)圖書館》2019年第2期。

⑥毛建軍:《國內(nèi)公共圖書館古籍書目數(shù)據(jù)庫的建設(shè)與思考》,《公共圖書館》2007年第2期。

⑦劉聰明:《古籍全文數(shù)據(jù)庫的建設(shè)》,《圖書館學(xué)刊》2011年第7期。

⑧趙東:《數(shù)字化生存下的歷史文化資源保護與開發(fā)研究——以陜西為中心》,山東大學(xué)博士論文,2014年4月。

猜你喜歡
古籍檢索學(xué)者
學(xué)者介紹
學(xué)者簡介
學(xué)者介紹
中醫(yī)古籍“疒”部俗字考辨舉隅
CNKI檢索模式結(jié)合關(guān)鍵詞選取在檢索中的應(yīng)用探討
西藏大批珍貴藏文古籍實現(xiàn)“云閱讀”
瑞典專利數(shù)據(jù)庫的檢索技巧
2019年第4-6期便捷檢索目錄
英國知識產(chǎn)權(quán)局商標(biāo)數(shù)據(jù)庫信息檢索
我是古籍修復(fù)師
靖江市| 饶阳县| 南皮县| 张家口市| 石屏县| 内黄县| 秀山| 南汇区| 开平市| 梁河县| 庄浪县| 略阳县| 贺兰县| 庆阳市| 陆河县| 攀枝花市| 阿拉尔市| 手游| 洛隆县| 云梦县| 玉环县| 浮山县| 唐山市| 旬邑县| 雷州市| 忻州市| 甘肃省| 淅川县| 西藏| 濉溪县| 清新县| 皮山县| 定襄县| 兴业县| 勐海县| 察隅县| 无极县| 神池县| 五峰| 渝北区| 永川市|