国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字化技術(shù)在古籍整理工作中的應(yīng)用

2019-03-20 16:05
傳媒論壇 2019年15期

梁 郁

(中州古籍出版社有限公司,河南 鄭州 450016)

一、引言

古籍是一個(gè)國家的珍貴文物,有著不可再生性,記錄了國家傳統(tǒng)文化,是國家各個(gè)時(shí)期文化的精華,對(duì)國家歷史、文學(xué)等方面有著重要的借鑒意義。但由于長期的使用、流通會(huì)導(dǎo)致紙張的受損、變質(zhì),失去利用價(jià)值,因此,如何才能有效地保護(hù)古籍,是相關(guān)工作人員需要不斷探索的課題。近年來,隨著信息技術(shù)的發(fā)展,給古籍的保護(hù)、整理帶來了新的方式,通過數(shù)字化處理,減少直接使用古籍原本的概率,并能進(jìn)一步有利于開發(fā)和利用。

二、數(shù)字化技術(shù)在古籍整理中的意義

古籍一般產(chǎn)生于1911年以前,擔(dān)負(fù)著將國家傳統(tǒng)文化流傳后世的使命,但在長期的流傳中,經(jīng)歷了不同人的翻閱,必將存在紙張上的受損、泛黃,若未能妥善保存,還會(huì)出現(xiàn)受潮、發(fā)霉的情況,影響到再次使用。古籍整理,即是指通過影印、??薄⒆⑨?、編纂等方式加工古籍,使之更利于后世的閱讀和利用,保證古籍在后世的流傳。自從數(shù)字化技術(shù)出現(xiàn)以后,古籍整理也有了新的方式,并逐漸成為今后的發(fā)展方向。通過對(duì)古籍的信息錄入,整編成書目和全文兩種數(shù)據(jù)庫,書目數(shù)據(jù)庫便于讀者查找,全文即電子文本,方便讀者閱讀,數(shù)據(jù)庫的建立和網(wǎng)絡(luò)技術(shù)普及后,通過在網(wǎng)絡(luò)上有償或無償?shù)陌l(fā)布古籍資源,能進(jìn)一步擴(kuò)大資源共享的范圍。這種方式有助于減少紙本的流通,減少紙張的損傷,也更便于工作人員的管理。在檢索上,通過搜索引擎、關(guān)鍵字詞的匹配,可以去除冗余信息,大大提高搜索效率。[1]

三、數(shù)字化技術(shù)在古籍整理中的應(yīng)用

進(jìn)入信息化時(shí)代后,數(shù)字化技術(shù)往往取代了大量繁復(fù)的手工工作,并能大大減少原本手工操作伴隨的差錯(cuò),提高速度和準(zhǔn)確率。

(一)古籍標(biāo)點(diǎn)符號(hào)的標(biāo)注

不少古籍并沒有斷句的標(biāo)志,增加了古籍整理的難度,如果由人工去整理,首先需要辨認(rèn)清楚古文意思,再標(biāo)注標(biāo)點(diǎn)符號(hào),無疑會(huì)造成相當(dāng)巨大的工作量,并且,很可能會(huì)存在人工誤差。但若能找到能有效判讀、斷句的辦法,則可明顯提高工作效率及準(zhǔn)確度。數(shù)字化技術(shù)利用事先建立的巨大數(shù)據(jù)庫,即有標(biāo)點(diǎn)的大量古籍文獻(xiàn)錄入后建立的標(biāo)點(diǎn)符號(hào)數(shù)據(jù)庫(包括各類古體詩、地名、官職等),再將古籍中的句子和數(shù)據(jù)庫內(nèi)的句子進(jìn)行比較,將字符間親和度作為依據(jù)來作句首、句尾的判斷,之后再進(jìn)行標(biāo)點(diǎn)的標(biāo)注。

(二)古籍語法勘誤

古籍的作者在編寫中,由于完全手工進(jìn)行,難免會(huì)存在一些錯(cuò)誤,在之后古籍的流傳中,經(jīng)歷了純手工的整理印刷,也同樣會(huì)出現(xiàn)不少人為的錯(cuò)誤。因此,在古籍整理中,需要對(duì)其進(jìn)行勘誤。但人工進(jìn)行這項(xiàng)工作時(shí),常常會(huì)因?yàn)楸旧淼囊曈X、底稿清楚程度、文獻(xiàn)資料的殘缺不全等因素,影響到錯(cuò)誤的矯正效率。運(yùn)用數(shù)字化技術(shù),有著能避免人為誤差的優(yōu)勢。通過事先編寫可以讓計(jì)算機(jī)自動(dòng)執(zhí)行比對(duì),讓其在底本和校驗(yàn)本之間進(jìn)行嚴(yán)格對(duì)比,不但能夠?qū)⑽墨I(xiàn)中的錯(cuò)別字完全糾正,還能橫向?qū)Ρ炔煌姹?,?lián)系上下文環(huán)境,從中查找出最恰當(dāng)?shù)奈淖纸M合,提出校正建議。

(三)添加筏注

古籍資料中往往存在許多較為生僻的字句,需要工作人員在查閱大量文獻(xiàn)的基礎(chǔ)上,才能對(duì)其做出較正確的分析判斷,并進(jìn)行筏注。這一項(xiàng)工作若是人為操作,必然是工程量巨大,但若能通過數(shù)字化技術(shù)操作,必然會(huì)節(jié)省較多時(shí)間。當(dāng)然,這也需要事先建立好儲(chǔ)存量巨大的古籍?dāng)?shù)據(jù)庫,以作為利用數(shù)字化技術(shù)筏注時(shí)的參照。計(jì)算機(jī)在處理這些生僻字句時(shí),會(huì)自動(dòng)從數(shù)據(jù)庫中找到最相似的內(nèi)容自動(dòng)筏注?;谖覈偶Z言的多樣性,工作人員需要事先盡可能全地將古籍文獻(xiàn)納入數(shù)據(jù)庫,并設(shè)計(jì)出模糊查詢語言,以助于減少筏注的出錯(cuò)率。

(四)古籍?dāng)?shù)據(jù)庫建設(shè)

上述古籍整理工作,都脫離不了數(shù)據(jù)庫的建設(shè)。根據(jù)介質(zhì)的不同,主要分為網(wǎng)絡(luò)數(shù)據(jù)庫和光盤數(shù)據(jù)庫兩類。數(shù)據(jù)庫最早于20世紀(jì)80年代開始建設(shè),最早的資料庫是書目型數(shù)據(jù)庫,僅包含古籍的作者、書名等信息,方便讀者檢索,能更快地找到庫本。之后又出現(xiàn)了全文型數(shù)據(jù)庫即包含完整的文本內(nèi)容,使得對(duì)內(nèi)部內(nèi)容的檢索變得更方便。而后,為了解決錄入過程中可能存在的缺陷,出現(xiàn)了全圖像型數(shù)據(jù)庫,又因其占儲(chǔ)存資源多且檢索不便,終于催生了圖文型數(shù)據(jù)庫。光盤版的數(shù)據(jù)庫相當(dāng)于離線的網(wǎng)絡(luò)數(shù)據(jù)庫,基于保存、使用、攜帶的目的而產(chǎn)生。[2]

四、結(jié)束語

總之,古籍是我國歷史留存下來的寶貴財(cái)富,需要后人對(duì)其進(jìn)行專業(yè)的整理,提高古籍的保存率和利用率。運(yùn)用數(shù)字化技術(shù),可以在建立巨大數(shù)據(jù)庫的基礎(chǔ)上,完成標(biāo)點(diǎn)標(biāo)注、勘誤、筏注等整理工作,并能減少古籍紙本流通,最大程度的實(shí)現(xiàn)古籍保存。

白朗县| 腾冲县| 黔西县| 伊金霍洛旗| 东海县| 拜城县| 钟祥市| 乡城县| 桃园县| 上饶县| 会东县| 白朗县| 新巴尔虎左旗| 始兴县| 潼关县| 新竹县| 若尔盖县| 兴义市| 阳江市| 阳谷县| 黎城县| 贵阳市| 罗源县| 磴口县| 普格县| 靖安县| 青河县| 高密市| 安西县| 武胜县| 安庆市| 潞西市| 曲阳县| 平湖市| 乳山市| 阳原县| 海安县| 盱眙县| 海淀区| 澎湖县| 沙田区|