王成平,田宜宣,孫某姑,曾慶雅
(1.西南民族大學(xué):a.民族語言文字信息處理重點實驗室,b.中國語言文學(xué)學(xué)院,四川成都 610041;2.四川省雅安市名山區(qū)政府辦,四川雅安 625100)
我國的古文獻(xiàn)學(xué)源遠(yuǎn)流長,其任務(wù)是研究中國古文獻(xiàn)產(chǎn)生、發(fā)展的歷史,介紹中國古文獻(xiàn)研究、整理的歷史概況,總結(jié)歷史古文獻(xiàn)學(xué)家的經(jīng)驗和戰(zhàn)果,為古文獻(xiàn)研究和整理提供借鑒作用[1]。民族古籍文獻(xiàn)典籍體例嚴(yán)密,特色鮮明,內(nèi)容豐富,全面反映了中華民族輝煌燦爛的文化。在信息化時代應(yīng)重視我國少數(shù)民族文獻(xiàn)的發(fā)展,以建設(shè)民族古籍文獻(xiàn)為核心要務(wù),傳承民族文獻(xiàn)文化,最終實現(xiàn)民族文化的發(fā)揚和傳播。
彝文古籍文獻(xiàn)種類頗多,卷帙浩繁,體系龐大,內(nèi)容豐富。它作為彝族歷代先民留給子孫后代的文化遺產(chǎn),是一筆巨大的珍貴的知識財富,是認(rèn)識和了解彝族古代社會歷史與傳統(tǒng)文化的主要載體。然而,在各種自然和人為的因素,彝文古籍文獻(xiàn)的長期保存、流通與利用受到了嚴(yán)重的制約和威脅。即使進(jìn)入信息化時代,各種因素對彝文古籍文獻(xiàn)的自然損壞和人為被壞等不利因素仍然存在,針對現(xiàn)有的彝文古籍文獻(xiàn)有必要進(jìn)行搶救與保護(hù)[2]。本文通過梳理彝文古籍文獻(xiàn)現(xiàn)有成果,結(jié)合當(dāng)前時代背景,對彝文古籍文獻(xiàn)數(shù)字化博物館建設(shè)作一些探討,并在此基礎(chǔ)上探討民族古籍文獻(xiàn)進(jìn)一步發(fā)展的方向。
彝族是中華民族大家庭中人口較多、分布較廣的一員。據(jù)2010年統(tǒng)計,彝族人口有900多萬,分布在滇、川、黔、桂四?。▍^(qū))。1980年國務(wù)院以[1980]70號文件批準(zhǔn)推行《彝文規(guī)范方案》。2010年11月全國彝語術(shù)語標(biāo)準(zhǔn)化工作委員會審定通過了滇川黔桂民委、民語委根據(jù)滇、川、黔、桂四?。▍^(qū))彝學(xué)學(xué)會提出的《關(guān)于進(jìn)一步完善規(guī)范彝文的建議》[3]。規(guī)范彝文方案的實施加速了彝文的傳播和數(shù)字化建設(shè)的步伐,特別是在西南民族大學(xué)沙馬拉毅教授為首的彝語言信息處理團(tuán)隊的推動下,彝文正式步入信息化的道路,以彝文為載體的數(shù)字文本資源迅速發(fā)展,使得古老的彝文成為了數(shù)字化時代煥發(fā)出活態(tài)的民族語言文字。然而,古彝文數(shù)量多,同意異字、同字異意且不同類型文獻(xiàn)表意不一等現(xiàn)象也多,用規(guī)范彝文方案解讀彝文古籍文獻(xiàn)存在著艱巨的翻譯工作量和誤解、誤讀等諸多情況,且國內(nèi)彝文文獻(xiàn)專業(yè)在高校開設(shè)較少,導(dǎo)致彝文古籍文獻(xiàn)專業(yè)研究人員斷層,進(jìn)一步限制彝文古籍文獻(xiàn)的解讀和翻譯等工作的建設(shè)。再者,彝文古籍文獻(xiàn)分布廣、類型多、文字不統(tǒng)一等因素嚴(yán)重制約了彝文古籍文獻(xiàn)數(shù)字化發(fā)展,使得部分彝文古籍文獻(xiàn)未得到充分的開發(fā)利用,而且由于原生性保護(hù)存在很大的局限性,彝文古籍文獻(xiàn)趨向瀕危狀態(tài)。因此,亟需出臺新的策略解決彝文古籍文獻(xiàn)傳承和保護(hù)面臨的困境。
民族古籍文獻(xiàn)數(shù)字化建設(shè)是當(dāng)下國內(nèi)外對民族古籍文獻(xiàn)進(jìn)行保護(hù)和傳播的重要途徑,對民族古籍、古典文獻(xiàn)的傳承和發(fā)展具有劃時代的意義。針對彝文古籍文獻(xiàn),需要借助通用彝文字,并借鑒國內(nèi)外保護(hù)文獻(xiàn)的思路,結(jié)合現(xiàn)有的彝文信息化技術(shù),促進(jìn)并實現(xiàn)彝文古籍文獻(xiàn)數(shù)字信息化建設(shè)、數(shù)字化保護(hù)乃至傳承。
目前,國內(nèi)外均有不同層次地創(chuàng)建了語言文字庫、文獻(xiàn)庫,乃至影像庫或數(shù)字化博物館。1990年美國國會圖書館成功開啟美國數(shù)字圖書館時代。1992年聯(lián)合國教科文組織發(fā)起的“世界記憶”工程首次將數(shù)字化技術(shù)帶入到全球文化遺產(chǎn)的保護(hù)工作之中。1995年,包括美國博物館、法國盧浮宮在內(nèi)的多家歐美博物館著手開展數(shù)字化存儲項目等工程,數(shù)字化技術(shù)的運用范圍愈加廣闊。2015年挪威文化中心對全球范圍內(nèi)31個國家和地區(qū)59座語言文字主題博物館的調(diào)查,列出了45個語言網(wǎng)站、語言資料庫,以及30個紀(jì)念碑和83個世界范圍內(nèi)的語言性節(jié)日。中國語言主題類博物館有4個,僅次于德國和美國,與法國并列第三。語言文字為主題的數(shù)字化博物館包括National Museum of Language、Musée des langues,du langage et de la linguistique、Museum of the Alphabet、Museu da LínguaPortuguesa、中國文字博物館等數(shù)字化館藏[4]。
除此,其他文獻(xiàn)典籍?dāng)?shù)字化館藏,如:國家典籍博物館,是我國第一家國家級古籍文獻(xiàn)博物館,開創(chuàng)了國內(nèi)全圖書、文獻(xiàn)典籍的閱覽新形式。成吉思汗文獻(xiàn)博物館則是以成吉思汗文化為主題,集齊圖書、圖片與繪畫、文物與紀(jì)念品及研究成果為一體的,具有收藏、展示、傳承、研究和傳播功能的陳列型博物館。2017年,蒙古文字文獻(xiàn)博物館在內(nèi)蒙古成立,其是第一家以少數(shù)民族——蒙古文字文獻(xiàn)為主的專題型博物館。國內(nèi)古籍文獻(xiàn)數(shù)據(jù)庫有北京書同文數(shù)字化技術(shù)有限公司的書同文古籍庫,其內(nèi)容含有《四部叢刊》《中國歷代石刻史料匯編》《十通》《大明會典》等全文檢索庫。明清檔案文獻(xiàn)網(wǎng)、中華書局有限公司的中華古籍網(wǎng)、大成古籍文獻(xiàn)全文數(shù)據(jù)庫等也是國內(nèi)知名文獻(xiàn)數(shù)字庫。國內(nèi)目前涉及彝文古籍文獻(xiàn)的藏館主要以實體館為主,包括滇、川、黔、桂四省(區(qū))均有不同規(guī)模的彝文古籍文獻(xiàn)館和彝族語言文化博物館,但缺乏以彝族語言、文字、文獻(xiàn)、文化等為主題的數(shù)字化博物館。建設(shè)數(shù)字化博物館是當(dāng)下發(fā)展民族文獻(xiàn)資料、語言文字、文化藝術(shù)等載體的更為有效的方式。
彝文古籍文獻(xiàn)涉及諸多種類和領(lǐng)域,包括百科全書類如《西南彝志》、創(chuàng)世史詩如:《勒俄特依》《查姆》《梅葛》《阿細(xì)的先基》、占卜類如《哈體特依》教育類如:《瑪牧特依》、《勸善經(jīng)》、天文類如《宇宙人文論》及譜牒類等類型。它是由多樣化的載體形式存在,有紙質(zhì)書籍、文書檔案、碑刻、竹簡、金屬等和口耳相傳的口述史料。當(dāng)下彝文古籍文獻(xiàn)傳世較多,但保留下來的許多文獻(xiàn)破損情況十分嚴(yán)重,如傳抄本經(jīng)時間的推移,部分出現(xiàn)了人為的破損及潮濕、蟲咬、發(fā)黃、酸化、腐損等諸多情況。各種類型載體的彝文古籍文獻(xiàn)仍難擺脫繼續(xù)破損和亡失的危險[2]。
在社會大趨勢下,彝文古籍文獻(xiàn)必須走出傳統(tǒng)圖書館、文獻(xiàn)館、博物館等傳承制約,開發(fā)出數(shù)字化博物館。利用網(wǎng)絡(luò)建庫、VR/AR影像互動等技術(shù),以多維度數(shù)字化博物館的形式,全方位、立體化地面向大眾進(jìn)行文化資源的傳播和共享,讓彝文古籍文獻(xiàn)得以在信息化時代重新煥發(fā)生機(jī)。彝文古籍文獻(xiàn)數(shù)字化博物館建設(shè)工作的開展,有利于彝文古籍文獻(xiàn)通過數(shù)字化規(guī)范整理的方式使持久性保護(hù),促進(jìn)彝文古籍文獻(xiàn)資源共享,有效地傳承和發(fā)揚彝族文化,為彝文古籍文獻(xiàn)挖掘和分析提供數(shù)據(jù)支持,同時為其他民族古籍文獻(xiàn)資源數(shù)字化開發(fā)提供思路和參考。
1.開展彝文字基礎(chǔ)性建設(shè)。選取彝文古籍文獻(xiàn)進(jìn)行光學(xué)字符識別工作作為第一階段的研究建設(shè)內(nèi)容。首先提取形狀特征較為相似的各地古彝文字,并進(jìn)一步錄入,然后進(jìn)行下一步的實驗。在實驗過程中通過黑盒、白盒的實驗數(shù)據(jù)測試,對識別質(zhì)量的評估,根據(jù)識別率判定實驗的科學(xué)性、合理性以及可行性。注重實驗校驗的準(zhǔn)確率、精確率和召回率,高標(biāo)準(zhǔn)、高質(zhì)量地完成實驗,奠定以光學(xué)字符識別為中心內(nèi)容的彝文古籍文獻(xiàn)數(shù)字信息化的研究工作,總結(jié)并探索彝文字光學(xué)字符識別技術(shù)實驗中遇到的困難和經(jīng)驗,著重分析其中存在的問題,并提出解決思路,附加人工的檢查校注,準(zhǔn)確無誤地解讀出彝文古籍文獻(xiàn)。
2.開展彝文古籍文獻(xiàn)的搜集整理。全面實現(xiàn)彝文古籍文獻(xiàn)的搜集和整合??梢酝ㄟ^兩個方式進(jìn)行彝文古籍文獻(xiàn)分類:一是通過方言區(qū)進(jìn)行分類;二是通過所記載的類別進(jìn)行分類,如占卜、律算、文學(xué)、史詩、傳說等進(jìn)行各方言區(qū)同一故事的整理結(jié)合。數(shù)字化博物館建設(shè),需要全面、科學(xué)地提取彝文古籍文獻(xiàn)數(shù)字化展品。彝文古籍文獻(xiàn),數(shù)字化博物館在選擇時應(yīng)取其精華,尋找比較齊全的古籍文獻(xiàn)展品。
3.多維度建立數(shù)字化博物館。采用多媒體技術(shù)多維度采集和展示滇、川、黔、桂四?。▍^(qū))的彝文古籍文獻(xiàn)。彝文古籍文獻(xiàn)的全面信息化需要文字、圖像、音視頻、VR/AR技術(shù)等結(jié)合,打造立體的數(shù)字化博物館。古籍文獻(xiàn)的文字主要依賴光學(xué)字符識別技術(shù);圖像的獲取主要靠高清晰度的掃描設(shè)備以及拍照設(shè)備;音視頻主要采集古籍文獻(xiàn)傳承人的錄音攝影資料,也可找到古籍文獻(xiàn)相關(guān)研究者進(jìn)行數(shù)據(jù)采集;VR/AR技術(shù)將彝文古籍文獻(xiàn)從時間、空間范圍內(nèi)通過計算機(jī)科學(xué)技術(shù),模擬仿真后再疊加,將虛擬的信息應(yīng)用到真實的世界中,讓數(shù)字化博物館“游覽者”從視聽感官系統(tǒng)上超越以往傳統(tǒng)的感官體驗,全方位接觸到古老的民族古籍文獻(xiàn)在新時代活力和珍貴的文化價值。這不僅有利于數(shù)字化博物館的推廣使用,也利于后臺的管理控制。
彝文古籍文獻(xiàn)數(shù)字化博物館是一個面向公眾平臺服務(wù)的民族語言文獻(xiàn)類數(shù)字化博物館,將利用多媒體、數(shù)據(jù)庫、Web程序、三維技術(shù)、圖像全景技術(shù)開發(fā)等技術(shù)開發(fā),以全方位視角呈現(xiàn)彝文古籍文獻(xiàn)。無論是知識庫、語言庫或博物館,分類檢索管理始終是數(shù)據(jù)資源庫建設(shè)的重點。分類檢索的科學(xué)性,將影響到數(shù)字化博物館的推廣和使用。人性化的管理和簡便的用戶界面將是數(shù)字化博物館建設(shè)的核心問題,將最大程度地方便“游覽者”使用博物館,以簡單化的指令查詢和閱覽需要的文獻(xiàn)資源。
1.用戶管理。用戶管理可根據(jù)不同的用戶設(shè)定不同的用戶權(quán)限。用戶權(quán)限可分為管理員權(quán)限、超級用戶和普通用戶等。管理員用戶是直接面向系統(tǒng)進(jìn)行布局調(diào)試的超級權(quán)限所有者;超級用戶是為除去系統(tǒng)管理外的內(nèi)部信息注入的工作人員的用戶群體;普通用戶是為享有訪問、讀取、閱覽權(quán)限的用戶集合。
2.安全管理。彝文古籍文獻(xiàn)數(shù)字化博物館是將全力保護(hù)彝文古籍文獻(xiàn)信息不被剽竊。制定功能限制,防止機(jī)密信息被不法竊取。權(quán)限設(shè)置將運用數(shù)字加密技術(shù)防止古籍文獻(xiàn)被“復(fù)制”“臨摹”的可能,保護(hù)文獻(xiàn)傳承所有人數(shù)據(jù)資源的安全性。
3.主題界面。數(shù)字化博物館以2D、3D技術(shù)相結(jié)合的方式,全面虛擬文獻(xiàn)博物館。從形式到內(nèi)容簡介,突出彝文古籍文獻(xiàn)的特點。通過視頻錄像資料作為基礎(chǔ)介紹,可以了解到文獻(xiàn)作品的背景知識;使用導(dǎo)讀,可以明確文獻(xiàn)的解答范圍;通過高分辨率圖片,可以清晰查看更多細(xì)節(jié);通過VR/AR虛擬現(xiàn)實技術(shù)增加互動和推廣,可以讓“參觀者”全面感受文獻(xiàn)的細(xì)節(jié)和整體。
1.檢索功能。查詢系統(tǒng)的優(yōu)劣和快慢是衡量一個數(shù)字化博物館活力的評判標(biāo)準(zhǔn)。查詢系統(tǒng)的便利與否,直接影響到數(shù)字化博物館古籍文獻(xiàn)閱覽者查詢時的直觀感受。為了服務(wù)廣大閱覽者,查詢系統(tǒng)更需人們平時的生活習(xí)慣,盡量方便用戶的需求。由此,可以根據(jù)文獻(xiàn)的屬性、類別、內(nèi)容及方言區(qū)等制定策略來部署和關(guān)聯(lián)查詢的關(guān)鍵詞。通過AI智能管理,結(jié)合云計算,科學(xué)創(chuàng)建具有民族特色風(fēng)格的古籍文獻(xiàn)博物館,將是時代的選擇,同時也將有利于研究者開展相關(guān)研究工作,最大便捷地服務(wù)大眾。
彝文古籍文獻(xiàn)數(shù)字化博物館的建設(shè)與運用是一個循序漸進(jìn)的工程。運用計算機(jī)技術(shù)、文獻(xiàn)學(xué)、語言學(xué)等多學(xué)科交叉知識來構(gòu)建,按照統(tǒng)一規(guī)劃、標(biāo)準(zhǔn)的原則進(jìn)行整合管理,融合動靜態(tài)網(wǎng)頁形式,結(jié)合多媒體、VR/AR虛擬技術(shù)等展示方式,多維度呈現(xiàn)彝文為載體的古籍文獻(xiàn)和文化特征。多媒體技術(shù)嵌合傳統(tǒng)文獻(xiàn)學(xué)是構(gòu)建彝文古籍文獻(xiàn)數(shù)字化博物館的核心工作。隨著數(shù)字化技術(shù)覆蓋更多國內(nèi)外民族類博物館,運用新技術(shù)、新媒體去了解多元文化將激活更多發(fā)展路徑,創(chuàng)建數(shù)字化博物館發(fā)展走上新臺階,促進(jìn)更多具有民族風(fēng)格的多元文化傳播到世界各地。
彝文古籍文獻(xiàn)數(shù)字化博物館是一個面向數(shù)以萬計的網(wǎng)上“游覽者”開展的一個兼容彝族人文的文獻(xiàn)類數(shù)字化博物館。該數(shù)字化博物館的建設(shè)為彝文古籍文獻(xiàn)呈現(xiàn)活態(tài)的良性的發(fā)展提供信息化建設(shè)的道路。利用現(xiàn)代技術(shù)對古籍進(jìn)行數(shù)字化處理,既是保護(hù)珍貴古籍的有效方法,也是研究與傳播傳統(tǒng)文化的重要手段。彝文古籍文獻(xiàn)數(shù)字化博物館建設(shè),盡量集齊六大方言區(qū)的古籍文獻(xiàn),是國內(nèi)首個彝族文獻(xiàn)的創(chuàng)新性,也是民族古籍文獻(xiàn)典藏在信息化時代的革命性先例,為保護(hù)、傳播、傳承民族文明奠定了數(shù)字信息化基石,同時也為其他少數(shù)民族古籍文獻(xiàn)乃至其他文化資源保護(hù)和傳承起到示范性作用。