国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

彝文古籍?dāng)?shù)字化保護(hù)及利用策略研究

2016-05-14 14:34高建輝李全華李仲良
新世紀(jì)圖書館 2016年5期

高建輝 李全華 李仲良

摘 要 根據(jù)我國彝文古籍的特點及其保存現(xiàn)狀,論文設(shè)計了適合于我國彝文古籍?dāng)?shù)字化保護(hù)及利用的具體步驟,詳細(xì)研究了每個工作環(huán)節(jié)的實施策略,研究成果不但可以指導(dǎo)彝文古籍的數(shù)字化工程,在進(jìn)行其他民族古籍的數(shù)字化保護(hù)與利用時也可以借鑒。

關(guān)鍵詞 彝文古籍 古籍?dāng)?shù)字化 古籍保護(hù)與利用

分類號 G255.1

Abstract According to the characteristics of Yi language ancient books in China and their preservation situation, this paper designs specific steps of digital protection and utilization which are suitable for our countrys Yi language ancient books preservation, expounds the implementation strategy of each work link. Its research results can not only guide the digital protection and utilization of Yi language ancient books, but also provide reference for digital protection work of other ethnic ancient books.

Keywords Yi language ancient books. Ancient books digitization. Protection and utilization of ancient books.

隨著計算機技術(shù)和通信網(wǎng)絡(luò)技術(shù)的發(fā)展,古籍?dāng)?shù)字化已成為古籍保護(hù)與利用的主要手段和趨勢。我國古籍?dāng)?shù)字化開始于20世界80年代,經(jīng)過三十多年的發(fā)展與積累,許多經(jīng)典古籍著作得到了數(shù)字化保護(hù),如北京大學(xué)的《中國基本古籍光盤庫》和書同文公司的《四庫全書》全文檢索版等,但對于少數(shù)民族古籍的數(shù)字化保護(hù)目前關(guān)注的還不多。2014年10月11日舉行的全國古籍保護(hù)工作會議重點討論了我國“十三五”時期的古籍保護(hù)發(fā)展規(guī)劃,提出了要加強民族古籍的數(shù)字化保護(hù)和利用,推進(jìn)了《古籍保護(hù)條例》和各類相關(guān)標(biāo)準(zhǔn)的修訂和升級,使古籍?dāng)?shù)字化保護(hù)與利用目標(biāo)更為明確、有法可依[1]。

1 彝文古籍及其數(shù)字化工程

彝族有著悠久的歷史和獨特的文化,彝文作為一種重要的少數(shù)民族文字一直沿用至今,并在歷史上留下了許多珍貴的典籍。彝文古籍一般是指1949年以前用彝文寫成的圖書資料,具有較高的文化價值、學(xué)術(shù)價值和實用價值,目前大量散落民間,數(shù)量在十萬卷以上,大多數(shù)損壞嚴(yán)重,急需進(jìn)行數(shù)字化保護(hù)與利用。

彝文古籍?dāng)?shù)字化保護(hù)與利用是一項系統(tǒng)工程,主要目的如圖1所示。工程實施前需要確立一個機構(gòu)進(jìn)行統(tǒng)一協(xié)調(diào),做好頂層設(shè)計和理論研究,按照一定的原則和策略,結(jié)合我國彝文古籍的實際情況,選用適合的數(shù)字化轉(zhuǎn)換、存儲、建庫和共享技術(shù),制定科學(xué)合理的數(shù)據(jù)庫建設(shè)與利用方案,才能使數(shù)字化保護(hù)及利用工程順利實施,實現(xiàn)既定目標(biāo)[1]。彝文古籍?dāng)?shù)字化保護(hù)與利用的步驟設(shè)計如圖2所示。根據(jù)彝文古籍的種類、分布、載體特點和數(shù)字化現(xiàn)狀,研究數(shù)字化保護(hù)與利用中存在的問題,制定具體可行的實施策略是該工程的首要任務(wù),本文將按這一步驟詳細(xì)闡述每個環(huán)節(jié)的工作策略。

2 彝文古籍?dāng)?shù)字化保護(hù)的前期工作策略

2.1 制定規(guī)劃

彝文古籍?dāng)?shù)字化保護(hù)與利用是一項巨大的工程,不可能一蹴而就,需要在政府和有關(guān)單位的協(xié)調(diào)與支持下制定長期規(guī)劃,分階段實施。當(dāng)數(shù)字化及建庫工作完成后,數(shù)據(jù)庫還需要不斷地進(jìn)行更新擴(kuò)充和開發(fā)利用。在項目實施過程中,由于有很多單位都擁有彝文古籍?dāng)?shù)字化資源和原件,所以首先要確立項目實施的主體機構(gòu),由一個單位牽頭進(jìn)行資源整合與建庫工作。其次要做好整體規(guī)劃,做出實施該項目的費用計劃、時間進(jìn)度安排,質(zhì)量要求和建成后的后續(xù)工作方案,以保證項目按質(zhì)按量完成和可持續(xù)發(fā)展。

2.2 信息調(diào)研

在進(jìn)行彝文古籍?dāng)?shù)字化工程之前,要事先了解我國彝文古籍的規(guī)模、數(shù)量、分布地點、內(nèi)容、種類、形式、載體特點和收藏單位等相關(guān)信息,由于各單位彝文古籍的收藏信息一般不對外公布,所以信息來源應(yīng)以實地考察調(diào)研為主,查閱資料為輔。在全國范圍內(nèi)開展調(diào)研時,重點調(diào)研對象是西南三省彝族聚居地區(qū)的民委、圖書館、博物館及彝族文化研究機構(gòu),調(diào)研的目的是了解我國彝文古籍的總體分布情況,各單位所擁有的彝文古籍信息以及當(dāng)?shù)孛耖g的分布和收藏信息。調(diào)研時力求和收藏單位初步達(dá)成共建共享的合作意向。通過調(diào)研,可以確定古籍的大致數(shù)量、征集范圍、收集地點和合作單位,并估算出數(shù)據(jù)庫的規(guī)模。

2.3 古籍資源獲取

彝文古籍資源的獲取應(yīng)以合作共建和資源共享為主,零星征集為輔,力爭以最小的成本支出換取最多的資源。第一,在調(diào)研過程中部分彝族村寨的居民會無償贈予,一些收藏單位也會授權(quán)可以無償進(jìn)行數(shù)字化;此外,還可以對石刻或畢摩的表演進(jìn)行拍攝以獲取素材。第二,由項目組或合作單位向民間征集或定向購買古籍原件,如可以向當(dāng)?shù)氐拿耖g收藏愛好者購買,也可以設(shè)立固定征集點長期征集。第三,由于彝文古籍中很大一部分還掌握在畢摩手中,這些古籍是他們生存的必需品,不可能出售,這種情況下可以和畢摩協(xié)商利用手抄的高仿古籍替代原版古籍,使原版古籍得到保護(hù)。第四,如果能和收藏單位簽訂共建共享合作協(xié)議,就可以得到海量的古籍資源,這是目前獲取古籍最主要的方式。

3 數(shù)字化預(yù)處理及轉(zhuǎn)換存儲策略

3.1 古籍甄選與整理

彝文古籍?dāng)?shù)字化前要選擇好的底本。(1)版本的甄選。首先可以通過影印本、目錄圖書和網(wǎng)絡(luò)搜索相結(jié)合的方式保證版本鑒定的準(zhǔn)確性,然后優(yōu)先選擇學(xué)術(shù)界公認(rèn)的最佳版本或價值較大的版本。(2)載體現(xiàn)狀的甄選。應(yīng)綜合考慮印刷、裝訂、紙張等條件,優(yōu)先選擇完整度、清晰度較高和保存較完整的古籍。(3)內(nèi)容甄選。要對所有古籍進(jìn)行辨?zhèn)巍⑽淖中?焙蛢?nèi)容考證,優(yōu)先選擇價值較高和經(jīng)典的古籍。彝文古籍的整理翻譯要考慮規(guī)范性,應(yīng)聘請權(quán)威專家對古籍進(jìn)行翻譯,如貴州畢節(jié)地區(qū)彝文翻譯組就是國內(nèi)知名的彝文古籍整理翻譯機構(gòu),此外在各地民委和高校也有一些這方面的專家。古籍目錄最好能形成知識體系,最后可以根據(jù)內(nèi)容進(jìn)行目錄的分類匯總。

3.2 古籍原件的修復(fù)與保護(hù)

古籍修復(fù)質(zhì)量是影響數(shù)字化質(zhì)量最基本的因素。根據(jù)文化部頒布的《古籍修復(fù)技術(shù)規(guī)范與質(zhì)量標(biāo)準(zhǔn)》和《古籍特藏破損定級標(biāo)準(zhǔn)》的要求,總體上遵循“整舊為舊、搶救為主,治病為輔、最少干預(yù)、過程可逆”五條原則進(jìn)行修復(fù)[2]。彝文古籍的紙張有土質(zhì)、皮紙、綿紙、草紙、宣紙五種,其中以皮紙最多,為了防蟲一般都經(jīng)過煙熏處理,容易發(fā)黑,而且大多數(shù)為邊殘。因此,修復(fù)時所選取的材料、顏色和紙紋應(yīng)和原件一致或者相近,配置的漿糊要相對濃一些,修復(fù)手段以補邊為主,裝幀遵循整舊如舊顏色,封面一般采用原件相同的小牛皮和麻布等材料。此外,修復(fù)前最好根據(jù)每本古籍的破損情況先鑒定破損程度,然后制定修復(fù)方案,并建立修復(fù)檔案,記錄修復(fù)材料的資料、修復(fù)手段和部位,并對古籍修復(fù)前后進(jìn)行對比拍照,作為修復(fù)歷史進(jìn)行保存。

彝文古籍原件的保護(hù)包括兩個方面。一方面是數(shù)字化過程中的保護(hù),如掃描時為追求速度,按壓造成古籍損壞的情況時有發(fā)生;對于不容易數(shù)字化的古籍最好等有了更好的技術(shù)后再進(jìn)行數(shù)字化。另一方面是數(shù)字化后的古籍作為文物需要長期保存,保護(hù)策略主要是對存放環(huán)境的嚴(yán)格管理和控制,包括對溫度、濕度、光照等自然條件的控制,霉菌蟲害的防治,空氣污染物和通風(fēng)性等影響空氣質(zhì)量因素的控制和火災(zāi)等人為損害的防護(hù)四個方面[3]。

3.3 模數(shù)轉(zhuǎn)換及數(shù)據(jù)存儲

古籍的模數(shù)轉(zhuǎn)換是指把古籍原件通過數(shù)字化手段轉(zhuǎn)換成電子信息的過程。數(shù)字化的工作既可以由項目組自己完成,也可以外包給專業(yè)公司。如外包給專業(yè)數(shù)字化企業(yè),按項目組要求進(jìn)行數(shù)字化,等數(shù)據(jù)和原件驗收合格后支付相關(guān)費用,或者是外包給數(shù)據(jù)庫生產(chǎn)商,合作共建并共享資源。

目前,適用于彝文古籍?dāng)?shù)字化的手段主要有手工錄入(包括手工繪圖)、掃描、拍照、彝文識別(包括語音識別)、錄音錄像(包括縮微影像)等。手工錄入適用于彝文古籍編目數(shù)據(jù)和電子全文的錄入,但錄入工作需要耗費大量的人力和時間。它采用的技術(shù)是彝文輸入法及其字庫,比較權(quán)威的是 “YWWIN2000”系統(tǒng)、“滇南彝文輸入法”和沙馬拉毅教授主導(dǎo)的“信息交換用彝文24×24點陣字模集及數(shù)據(jù)集”。手工錄入的數(shù)據(jù)保存格式可以采用TXT、DOC、DOCX、ODT、WPS、RTF等文本格式。彝文識別主要用于古籍電子全文的錄入,它先對古籍按統(tǒng)一規(guī)格進(jìn)行掃描,再利用彝文識別軟件將掃描的圖像轉(zhuǎn)換成文本,最后經(jīng)過校對后保存,這方面目前尚未有更多突破。古籍全文圖像版可以最大限度地保存古籍原貌,是目前古籍全文數(shù)字化的主要手段。掃描時要注意四個要點。第一是所有古籍頁面的掃描都要遵循事先制定的規(guī)范和流程進(jìn)行。第二是掃描設(shè)備最好采用非接觸式“V”型書稿臺大幅面掃描儀,以小角度翻頁掃描為主,并且可以自動糾偏、剪裁和大小識別,掃描結(jié)果能直接生成需要的封裝格式。第三是掃描的分辨率、圖像大小、文件大小和格式的選擇要合理。分辨率越高,圖像越清晰,文件也就越大,需要的存儲空間也就會相應(yīng)增大且網(wǎng)絡(luò)傳輸速度慢;文件格式可以采用TIFF、JPGE、PSD、GIF、PNG、DjVn等,它們各有優(yōu)缺點。第四,根據(jù)彝文古籍的紙張?zhí)攸c,掃描時光源最好選用零紫外和零紅外低亮度冷光源。拍照方式主要用于臨時獲取且不能長久擁有的紙質(zhì)古籍和非紙質(zhì)古籍的數(shù)字化處理,它的優(yōu)點是數(shù)字化速度快,環(huán)境適應(yīng)性強,可以隨時隨地進(jìn)行操作。此外,還可以利用平角鏡頭和專業(yè)工作臺對古籍進(jìn)行固定照相以代替掃描儀。拍照的設(shè)備最好選用暗光條件下成像性能較好的單反相機,拍照時需要多拍幾個角度,以便最終篩選。照片的像素、尺寸、IOS、光圈、顏色位深度等參數(shù)對照片質(zhì)量和文件大小的影響較大,需要反復(fù)測試找出合理的參數(shù)設(shè)置。錄音錄像主要用于記錄口傳古籍和特殊情況下的古籍全貌及其動態(tài)特征,目前用得不多,在錄制時同樣要考慮音視頻的編碼格式、封裝格式、分辨率、碼率、聲道、采樣數(shù)、圖像尺寸、文件大小等參數(shù),需要通過實驗確定最優(yōu)配置[4]。

通過以上方法得到基本數(shù)據(jù)后,需要對全文數(shù)據(jù)進(jìn)行分類匯總,為下一步的規(guī)范存儲做準(zhǔn)備。首先要把全文數(shù)據(jù)封裝成最終所需要的格式,常用的全文資源封裝格式有PDF、HTML、CAJ、EXE、WDL、PDG、EBK、EBD、NLC、SGML、FLV、MKV、MP3等,不同的封裝格式將影響閱讀的方式。文本和圖片目前用得較多的是PDF、HTML,音視頻用得較多的是MKV或FLV。其次要對全文的存儲文件進(jìn)行標(biāo)識,建議用題名作為標(biāo)識字段,以便于后續(xù)的數(shù)據(jù)庫建設(shè)工作。最后要考慮存儲及其災(zāi)備設(shè)備。目前的存儲技術(shù)主要有RAID、DAS、NAS、SAN、SAS等,它們各有優(yōu)缺點,考慮到全天候無故障運轉(zhuǎn)時間、容量易擴(kuò)展、文件交互共享方便和數(shù)據(jù)安全及備份功能,建議選擇企業(yè)級產(chǎn)品。

4 彝文古籍?dāng)?shù)據(jù)庫的建設(shè)及資源共享策略

彝文古籍?dāng)?shù)據(jù)庫的建設(shè)主要包括軟硬件平臺建設(shè)和數(shù)據(jù)庫內(nèi)容建設(shè)兩個方面,軟硬件平臺建設(shè)既可以直接租用云端設(shè)備,也可以自建。彝文古籍?dāng)?shù)據(jù)庫內(nèi)容建設(shè)的資源應(yīng)積極采用各收藏單位已經(jīng)數(shù)字化了的古籍資源,以提高建設(shè)效率。

4.1 數(shù)據(jù)庫平臺建設(shè)

彝文古籍?dāng)?shù)據(jù)庫屬于中等規(guī)模數(shù)據(jù)庫,對軟硬件環(huán)境的要求不是太高,但要考慮將來進(jìn)一步的開發(fā)和利用,按照應(yīng)用層次至少要選擇部門級以上服務(wù)器,比如DELL PowerEdge R430、IBM X3750 M4和HP DL560 G8等機架式服務(wù)器,存儲可按需求逐步增加。此外,建議把服務(wù)器進(jìn)行虛擬化,如果采用虛擬服務(wù)器作為硬件平臺,當(dāng)服務(wù)器發(fā)生故障時可以自動進(jìn)行應(yīng)用的動態(tài)遷移,保證數(shù)據(jù)庫的正常運行。虛擬化軟件可以采用VMware公司的vSphere系列軟件,其中的ESXI既具備了基本的功能,又可以免費使用。

軟件平臺建設(shè)包括系統(tǒng)、數(shù)據(jù)庫、數(shù)據(jù)庫管理平臺建設(shè)及管理模塊設(shè)計。服務(wù)器的操作系統(tǒng)有Windows Server、Linux、Netware、Unix等,按需選擇即可;數(shù)據(jù)庫可用的有MYSQL、Oracl、DB2、SQLServer等,需要根據(jù)數(shù)據(jù)庫規(guī)模和應(yīng)用平臺的支持類型進(jìn)行選用,彝文古籍?dāng)?shù)據(jù)屬于中等規(guī)模關(guān)系數(shù)據(jù)庫,建議選用SQL Server;目前的數(shù)據(jù)庫管理平臺比較多,如DSpace、EPrints、Fedora等,建設(shè)時既可以選擇直接購買和定制成品,也可以自己開發(fā)或者采用免費開源軟件進(jìn)行修改使之符合需求[5]。如果考慮到節(jié)約成本和數(shù)據(jù)安全的需要,可以使用免費的開源軟件DSpace,其已被清華大學(xué)和北京大學(xué)等知名高校圖書館廣泛應(yīng)用。管理模塊一般由有以下四個部分組成:第一是用于控制用戶權(quán)限的用戶管理模塊;第二是用于廣泛收集資料而設(shè)計的彝文古籍文獻(xiàn)采集模塊;第三是用于質(zhì)量審核和錯誤修正的古籍管理模塊;第四是用于呈現(xiàn)和在網(wǎng)絡(luò)上發(fā)布的古籍檢索與展示模塊。

4.2 數(shù)據(jù)庫內(nèi)容建設(shè)

彝文古籍?dāng)?shù)據(jù)庫內(nèi)容的創(chuàng)建是一個長期的過程,需要分階段進(jìn)行。第一步是創(chuàng)建提要數(shù)據(jù)庫。它包含了書目及文獻(xiàn)有關(guān)數(shù)據(jù)的基本信息,其著錄的目錄信息主要包括中彝文題名、收集人/單位、收集地點、資料完整度、收集時間、全文資源格式等。編目規(guī)則可參照“CALIS古籍聯(lián)機合作編目規(guī)則”和“古籍著錄規(guī)范”,創(chuàng)建方式主要是手工錄入,錄入時可以由各數(shù)據(jù)錄入人員或單位聯(lián)網(wǎng)遠(yuǎn)程操作,也可以填寫統(tǒng)一制作的EXCEL表格,然后把表格匯總至項目組檢查數(shù)據(jù)的準(zhǔn)確性與規(guī)范性,最后由技術(shù)人員統(tǒng)一導(dǎo)入數(shù)據(jù)庫。這里建議采用后者的操作模式,可以有效地保證數(shù)據(jù)庫質(zhì)量。第二步是創(chuàng)建圖片版全文數(shù)據(jù)庫。首先將以掃描、拍照等方式獲取的古籍全文圖片、多角度拍攝的外觀圖片等古籍全文資料封裝成統(tǒng)一的圖書格式,存儲到計算機中,然后把古籍全文與其目錄數(shù)據(jù)條目一一對應(yīng),并建立鏈接,最后通過網(wǎng)站進(jìn)行發(fā)布。第三步是創(chuàng)建詳細(xì)書目數(shù)據(jù)庫,它包含了更加詳細(xì)和完善的中彝文書目數(shù)據(jù),如中彝文內(nèi)容摘要、中彝文關(guān)鍵詞、版本、中彝文內(nèi)容分類、中彝文用途等。第四步是創(chuàng)建全文檢索版數(shù)據(jù)庫,主要工作就是將圖片版的彝文古籍圖書請專家整理翻譯及校對后,形成彝文古籍全文電子文檔和中文譯注全文電子文檔,最后將這些文檔和對應(yīng)的目錄數(shù)據(jù)庫中的條目進(jìn)行關(guān)聯(lián),建成中彝文對照和圖文對照的全文數(shù)據(jù)庫。

4.3 資源檢索及共享

資源檢索是古籍?dāng)?shù)據(jù)庫最重要的功能和應(yīng)用。在數(shù)據(jù)庫系統(tǒng)構(gòu)建過程中,只要對文獻(xiàn)進(jìn)行了統(tǒng)一的標(biāo)識和組織,對文獻(xiàn)內(nèi)容的描述和揭示清楚規(guī)范,就可以實現(xiàn)對古籍的中文或彝文全文檢索、圖像檢索、精確和模糊檢索等檢索方式。檢索功能設(shè)計時,要考慮界面、檢索策略、信息量等方面的問題。依照用戶習(xí)慣,界面及操作應(yīng)盡量簡化。此外,還應(yīng)注重單位門戶網(wǎng)站和數(shù)據(jù)庫的信息關(guān)聯(lián),為讀者提供集成化、專業(yè)化的信息檢索途徑[6]。在移動互聯(lián)網(wǎng)快速發(fā)展的今天,數(shù)據(jù)庫建設(shè)時必須考慮讀者對移動閱讀和個性化服務(wù)的需求。古籍?dāng)?shù)據(jù)庫可以和移動圖書館系統(tǒng)掛接,使用戶在移動轉(zhuǎn)端上就可以直接訪問、檢索和獲取古籍信息及全文。由于彝文古籍?dāng)?shù)據(jù)庫是凝聚了眾多人力物力和財力的勞動成果,有時需要對訪問權(quán)限進(jìn)行控制。一般情況下書目和提要數(shù)據(jù)可以完全共享,但全文數(shù)據(jù)可以采用IP控制或賬號控制的手段有償獲取。為提高數(shù)據(jù)庫的利用效率和使用效益,書目數(shù)據(jù)庫還可以加入云圖書館、高校特色數(shù)據(jù)庫共享平臺、CALIS特色中心服務(wù)系統(tǒng)等資源共享平臺,擴(kuò)大其認(rèn)知度和影響力。

5 彝文數(shù)字化古籍的深度開發(fā)與利用策略

為了使數(shù)據(jù)庫功能不斷完善和增值,為讀者提供更好的資源和使用體驗,彝文古籍?dāng)?shù)據(jù)庫建成后需要借助新興的信息技術(shù)手段進(jìn)行深度開發(fā),對古籍蘊含的多重信息盡可能地進(jìn)行組織與揭示,使其成為一個立體的彝族文化信息知識庫。

5.1 構(gòu)建可擴(kuò)展性古籍?dāng)?shù)據(jù)庫,提供立體閱讀環(huán)境

彝文古籍?dāng)?shù)據(jù)庫除了是紙本圖書的簡單翻版外,應(yīng)在原著的基礎(chǔ)上進(jìn)行拓展。第一,可以在古籍的不同類別、用途和版本之間建立元數(shù)據(jù)關(guān)聯(lián)。比如圖像版和文本版之間的對照與切換。圖像版主要展示版本類型、版刻形式、字體和墨色等信息,用于版本、書史的研究和文物的鑒定。第二,可以在原文與相關(guān)知識點之間創(chuàng)建鏈接,為讀者提供立體閱讀環(huán)境。這些知識點主要包括彝文古籍的注疏、傳注、章句、義疏、集解、音譯等,其中包含了豐富的內(nèi)容,是后人閱讀理解原文和繼續(xù)研究的重要材料。此外,還可以建立相關(guān)文獻(xiàn)之間的鏈接和文獻(xiàn)與相關(guān)網(wǎng)站之間的鏈接,比如古籍關(guān)鍵詞和現(xiàn)代研究成果之間的鏈接。第三,可以開發(fā)一些輔助性工具加入數(shù)據(jù)庫中,如彝文查詢工具(字典),歷史年表、電子地圖等。這樣就可以避免研究者為了獲得某些繁瑣細(xì)碎的知識而耗費大量的時間另行查找相關(guān)資料。

5.2 建立智能檢索系統(tǒng),開發(fā)數(shù)據(jù)庫的統(tǒng)計和分析功能

當(dāng)數(shù)據(jù)庫內(nèi)容建設(shè)完成了第四步后,就可以開發(fā)智能檢索系統(tǒng),這將極大地節(jié)省研究者在文獻(xiàn)檢索方面所花的時間,啟發(fā)和擴(kuò)張研究的深度和廣度。根據(jù)不同文獻(xiàn)自身的特點,針對性地開辟各種特殊檢索項目,系統(tǒng)從已有的信息中自動提取信息,構(gòu)成一個基本信息數(shù)據(jù)庫,再結(jié)合一個規(guī)則庫,實現(xiàn)對基本信息數(shù)據(jù)庫的智能檢索。另外,還可以對有關(guān)古籍內(nèi)容和各類檢索結(jié)果進(jìn)行計量統(tǒng)計,把統(tǒng)計結(jié)果作為后續(xù)研究的基礎(chǔ)數(shù)據(jù),最終建立一個統(tǒng)計知識庫,包括詞匯知識庫和作者信息庫等在內(nèi)的相關(guān)統(tǒng)計信息。并利用“知識發(fā)現(xiàn)”領(lǐng)域的一些技術(shù)和方法,如元數(shù)據(jù)倉儲、知識挖掘和聚類分析方法,為研究者展示一個多維度的統(tǒng)計和分析結(jié)果,提供可視化的知識關(guān)聯(lián)圖譜,把各種統(tǒng)計結(jié)果相互結(jié)合、參照、對比,獲得更大的思考和研究空間[7]。

5.3 利用數(shù)字化資源提高彝文古籍的整理效率

利用數(shù)字化了的彝文古籍?dāng)?shù)據(jù)庫,研究者可以方便高效地完成原始資料搜集,極大地提高了古籍整理的效率和精確度,開闊了整理工作者的眼界。首先,要厘清彝文古籍版本源流,離不開書目數(shù)據(jù)庫,它可以快速地查閱版本有哪些、藏在哪里等信息,借助詳細(xì)的著錄信息,可以精準(zhǔn)高效地進(jìn)行版本考辨。其次,許多非彝文古籍的相關(guān)資料,對古籍整理有重要的輯佚、箋注和編年價值,通過古籍?dāng)?shù)據(jù)庫的知識鏈接功能,在任何時候都可以便捷地獲取相關(guān)資料。另外,在沒有古籍?dāng)?shù)據(jù)庫之前,完全靠整理者的知識積累、有限的工具書和自己擁有的古籍資料,古籍之間注釋和翻譯的準(zhǔn)確度無法相互印證,有了數(shù)字化版本后,古籍整理者可以利用高質(zhì)量的在線工具書,方便快捷地獲取大量的已經(jīng)整理好的古籍文本進(jìn)行借鑒。

5.4 利用數(shù)字化彝文古籍傳播彝族文化

彝文古籍?dāng)?shù)據(jù)庫建成后要充分利用各種媒體拓展宣傳途徑,依托CALIS中心站促進(jìn)資源信息共享,積極創(chuàng)造條件,使數(shù)據(jù)庫走向開放存取,最終讓廣大群眾也能學(xué)習(xí)和繼承彝族曾經(jīng)創(chuàng)造的輝煌文化,并把這些優(yōu)秀的文化和精神傳播開來,傳承下去。對于普通民眾,目前的技術(shù)方法還有些不足,難以滿足他們的求知和審美需求,需要利用更有力的技術(shù)對古籍進(jìn)行更加直觀的展示。對于紙本古籍,首先可以把零星的圖片進(jìn)行拼接并制作背景,最大限度還原古籍原貌,然后利用FLASH制作成動畫,最后配上相關(guān)的彝族歌曲作為背景音樂,必然能產(chǎn)生較好的文化傳播效果。對于碑刻古籍,可以使用虛擬現(xiàn)實技術(shù)進(jìn)行場景重現(xiàn),制作3D動畫碑林進(jìn)行展示,讓讀者產(chǎn)生身臨其境的感覺[8]。除此之外,應(yīng)不失時機地將商業(yè)化運作與彝文古籍保護(hù)相結(jié)合,通過周邊產(chǎn)品的開發(fā)和市場營銷,讓廣大人民群眾切實地受到彝族優(yōu)秀文化的熏陶,促成相關(guān)文化創(chuàng)意產(chǎn)業(yè)的誕生。

6 彝文數(shù)字化古籍知識產(chǎn)權(quán)的保護(hù)策略

彝文古籍?dāng)?shù)據(jù)庫建設(shè)需要長期持續(xù)地進(jìn)行,投入較大,如果要以市場化方式運作,這就涉及到古籍如何避免非法商業(yè)利用的問題。目前,我們可以借助計算機技術(shù)和制定相關(guān)法律法規(guī)來保護(hù)數(shù)字化古籍文獻(xiàn)的版權(quán)。

6.1 利用先進(jìn)的版權(quán)保護(hù)技術(shù)

現(xiàn)有版權(quán)保護(hù)的技術(shù)手段主要有水印、數(shù)字證書和PKI體系等。為了有效地追蹤版權(quán)的歸屬信息,建議采用水印技術(shù)。如基于二值圖像水印的古籍?dāng)?shù)字化圖像版權(quán)保護(hù)技術(shù),利用小波變換和余弦函數(shù)變換相結(jié)合的數(shù)字水印技術(shù)等[9]。由于彝文古籍大多是由兩種對比度極強的顏色組成的二值圖像,因此前者的技術(shù)更加適合,其原理是先對水印信號置亂加密以提高安全性,然后將水印信息嵌入到數(shù)字資源中,在進(jìn)行版權(quán)鑒定時,提取水印解密后和原數(shù)據(jù)對比,如果一致,表明對其具有版權(quán),反之則說明對該圖書不具有版權(quán),從而為其版權(quán)歸屬提供參考依據(jù)。

6.2 積極推動相關(guān)法律法規(guī)的立法與支持

數(shù)字化古籍文獻(xiàn)的版權(quán)保護(hù),還要靠制定相關(guān)法律法規(guī)來保障古籍?dāng)?shù)字化產(chǎn)業(yè)的健康發(fā)展。古籍的“文獻(xiàn)保真”和“文獻(xiàn)整理”的界定和處理原則,紙質(zhì)古籍產(chǎn)品對應(yīng)電子產(chǎn)品的著作權(quán)界定,數(shù)字化古籍在知識產(chǎn)權(quán)保護(hù)中的特殊性等問題,都必須通過制定相關(guān)法規(guī)加以解決。古籍?dāng)?shù)字化雖然極大地方便了讀者閱覽古代文獻(xiàn),但對于立法原則的爭議也比較多。比如近年來我國涉及“古文點?!背晒娮踊闹鳈?quán)糾紛,有的學(xué)者認(rèn)為基于事實和對事實的思想觀點不受著作權(quán)法保護(hù),有的學(xué)者認(rèn)為絕大多數(shù)人閱讀古籍只能通過點校版本閱讀,古代文獻(xiàn)的點校者和出版者應(yīng)當(dāng)受到保護(hù)。對于此類古籍知識產(chǎn)權(quán)立法的爭議,立法時既要考慮符合著作權(quán)法基本原理,又要使點校者和出版者受到合理期限的保護(hù)。

7 結(jié)語

通過彝族文化與現(xiàn)代信息技術(shù)的完美結(jié)合,建設(shè)彝文古籍?dāng)?shù)據(jù)庫,開發(fā)相關(guān)擴(kuò)展功能,開拓數(shù)字化彝文古籍利用的新方式,是目前彝族古籍搶救、保護(hù)和開發(fā)利用的主要手段,也是弘揚彝族文化的重要途徑和彝文古籍整理技術(shù)的發(fā)展方向。數(shù)據(jù)庫的建成將為彝文古籍研究者提供一個便捷的研究平臺和研究利器,滿足新時代彝文古籍多方面多層次的需求。彝文古籍?dāng)?shù)字化工程是一個龐大的系統(tǒng)工程,肩負(fù)著保護(hù)和傳承彝族文化的歷史使命,功在當(dāng)代,利在千秋,任重而道遠(yuǎn)。

參考文獻(xiàn):

[ 1 ] 高娟,劉家真.中國大陸地區(qū)古籍?dāng)?shù)字化問題及對策[J].中國圖書館學(xué)報,2013(4):110-119.

[ 2 ] 楊楠郡.修復(fù)彝文古籍基本方法回顧[J].云南檔案,2013(4):35-37.

[ 3 ] 欒偉平.數(shù)字化過程中的古籍保護(hù)問題:“明別集叢刊”項目的工作體會[J].大學(xué)圖書館學(xué)報,2013(3):84-86,121.

[ 4 ] 傅榮校,翁敏曦.檔案數(shù)字化掃描與存儲格式比較研究[J].檔案學(xué)通訊,2007(2):61-64.

[ 5 ] 張旺強,祝忠明,盧利農(nóng).幾種典型新型開源機構(gòu)知識庫軟件的比較分析[J].現(xiàn)代圖書情報技術(shù),2014(2):17-24.

[ 6 ] 郭春鳳.圖書館古籍?dāng)?shù)字化保護(hù)平臺的構(gòu)建[J].圖書館學(xué)刊,2012(12):49-51.

[ 7 ] 徐清,石向?qū)崳跷?古籍?dāng)?shù)字化資源的深度開發(fā)[J]. 圖書情報工作,2007(3):95-97,79.

[ 8 ] 朱宗曉,王江晴,田微,等.少數(shù)民族古籍的數(shù)字化傳播[J].圖書館建設(shè),2013(3):23-26,29.

[ 9 ] 張軍亮,朱學(xué)芳.基于二值圖像水印的古籍?dāng)?shù)字化圖像版權(quán)保護(hù)及其實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2010(9):79-83.