趙生輝 胡瑩
摘 要:少數(shù)民族語言檔案的科學(xué)管理是我國民族地區(qū)檔案管理工作面臨的特殊性任務(wù)。本文在介紹我國民族地區(qū)語言文字多樣性特征的基礎(chǔ)上,提出并界定了少數(shù)民族語言檔案雙語著錄的概念,分析其現(xiàn)實(shí)意義,探討了少數(shù)民族語言檔案雙語著錄的內(nèi)容與過程、質(zhì)量控制、多語言主題標(biāo)引支持等問題。本文的結(jié)論對我國少數(shù)民族語言檔案管理水平的提升和多語種檔案信息資源的共享具有重要的參考價(jià)值。
關(guān)鍵詞:檔案著錄;雙語主題詞表;多語言信息管理
Abstract: The Scientific management of archives in minority languages is the specially task of archival organizations in minority residences regions of China. Based on introduction of language diversity characters of China, the conception of bilingual description is suggested and its practical meaning is analyzed. Then, the issues such as content, procedures, quality control, multilingual subject indexing are discussed. The conclusion of this paper is significant to management standard enhancing on archives in minority languages as well as multilingual archival information sharing.
Keywords: Archive description; bilingual thesauri; multilingual information access
1 中國少數(shù)民族語言檔案雙語著錄概念與意義
著錄(Description)是檔案整理和編目工作的基本環(huán)節(jié),其成果構(gòu)成檔案檢索和利用的基礎(chǔ)。在絕大多數(shù)情況下,我國檔案工作者需要進(jìn)行著錄的檔案是以國家通用的漢語和漢字作為記錄符號的,著錄用文字也是漢字。然而,我國絕大多數(shù)民族地區(qū)的檔案管理工作是在多語言環(huán)境下進(jìn)行的,管理的對象除了國家通用語言文字檔案之外,還涉及為數(shù)眾多的少數(shù)民族語言檔案。由于語言文字的差異性,少數(shù)民族語言檔案的著錄工作所面臨的管理需求要更加復(fù)雜。例如,檔案著錄要盡可能保證著錄信息的“原始性”,對題名、責(zé)任者等關(guān)鍵信息原則上要進(jìn)行“照錄”,而不是將其翻譯為另外一種語言文字,因此少數(shù)民族語言檔案最好采用對應(yīng)語種的文字進(jìn)行著錄。然而,民族地區(qū)檔案管理工作最終是要為所在地區(qū)的社會大眾提供服務(wù)的,在絕大多數(shù)當(dāng)?shù)毓癫⒉荒茏R讀少數(shù)民族語言文字的情況下,將其翻譯為國家通用語言文字版本以便更多的人可以理解又是一種現(xiàn)實(shí)的需求。因此,對少數(shù)民族語言檔案同時(shí)采用對應(yīng)語種的少數(shù)民族文字和國家通用語言文字進(jìn)行著錄就是一種可以兼顧上述兩種需求的解決方案,即本文所述的“雙語著錄(Bilingual Description)”。中國少數(shù)民族語言檔案的雙語著錄也符合行業(yè)標(biāo)準(zhǔn)的要求,《DA/T 18-1999 檔案著錄規(guī)則》規(guī)定:著錄用文字必須規(guī)范化,漢字應(yīng)使用規(guī)范化的簡化漢字,外文與少數(shù)民族文字應(yīng)依照其文字規(guī)則書寫。由此可見,漢字、少數(shù)民族語言文字、外文都是可以作為檔案著錄用文字的。
綜上所述,少數(shù)民族語言檔案雙語著錄是指民族地區(qū)檔案管理人員遵照國家檔案著錄規(guī)則,在各類受控檢索語言的支持下,采用特定語種少數(shù)民族文字和國家通用文字分析記錄少數(shù)民族語言檔案內(nèi)容和形式特征并生成兩種文字版本檔案目錄數(shù)據(jù)的過程。需要說明的是,本文所述雙語著錄主要限于當(dāng)前在民族地區(qū)社會生活中具有較強(qiáng)社會影響力,文字信息處理技術(shù)相對成熟的蒙古文、藏文、維吾爾文、哈薩克文、柯爾克孜文、壯文、彝文、傣文、朝鮮文等少數(shù)民族語言文字形成的檔案,我國歷史上曾經(jīng)存在過但目前已經(jīng)完全退出社會生活的西夏文、契丹文、女真文等古文字的歷史檔案不在雙語著錄工作的范疇當(dāng)中。
少數(shù)民族語言檔案的雙語著錄最大限度保障了檔案目錄信息的“本真性”特征,又考慮到絕大多數(shù)檔案利用者的服務(wù)需求,對于提升民族地區(qū)少數(shù)民族語言檔案管理工作的水平具有非常重要的意義。更為重要的是,如果全國各少數(shù)民族地區(qū)都基于統(tǒng)一的受控語言進(jìn)行當(dāng)?shù)厣贁?shù)民族語言檔案的雙語著錄,則可以通過國家通用語言文字為中介,將各少數(shù)民族語言檔案信息聯(lián)結(jié)為統(tǒng)一的整體,為更大范圍內(nèi)的跨語言檔案檢索與利用提供支持。因此,中國少數(shù)民族語言檔案雙語著錄是民族地區(qū)檔案管理工作科學(xué)化的客觀需求,也是推動(dòng)我國多民族語言檔案資源共享的重要舉措。
2 中國少數(shù)民族語言檔案雙語著錄內(nèi)容與過程
中國少數(shù)民族語言檔案雙語著錄需要遵循《DA/T 18-1999 檔案著錄規(guī)則》要求,對題名與責(zé)任說明項(xiàng)、稿本與文種項(xiàng)、密級與保管期限項(xiàng)、時(shí)間項(xiàng)、載體形態(tài)項(xiàng)、附注與提要項(xiàng)、排檢與編號項(xiàng)等著錄項(xiàng)目進(jìn)行全面著錄。與單一語種檔案著錄有所不同的是,雙語著錄是將一種語言文字檔案的語義信息通過兩種語言文字進(jìn)行描述和記錄的過程,需要盡最大可能保障兩種語言文字版本檔案目錄數(shù)據(jù)的語義對等性。為此,需要在著錄之前確立以下原則:第一,雙語著錄只需要對語言文字進(jìn)行轉(zhuǎn)換,所有涉及編號的著錄項(xiàng)目不需要進(jìn)行翻譯,照錄原有著錄結(jié)果。例如,排檢與編號項(xiàng)、檔案館代碼、檔號、電子文檔號、縮微號等著錄項(xiàng)兩種文字版本的著錄結(jié)果保持一致。第二,分類號、主題詞等涉及檔案標(biāo)引的著錄項(xiàng)目可以留到最后進(jìn)行著錄,例如,在國家通用語言文字版本的絕大多數(shù)著錄項(xiàng)完成的情況下,可以通過查閱《中國檔案分類法》和《中國檔案主題詞表》確定國家通用語言文字版本的標(biāo)引結(jié)果,分類號可以保持不變,主題詞需要翻譯成為與其內(nèi)容最接近的少數(shù)民族語言詞匯。第三,原則上雙語著錄過程中著錄項(xiàng)目的排列順序和格式保持不變,個(gè)別語種少數(shù)民族語言文字除外。例如,蒙古文的書寫規(guī)則是自上而下豎行排列,維吾爾文的書寫規(guī)則是自右到左,這部分少數(shù)民族語言文字的著錄需要在保持著錄項(xiàng)目內(nèi)容和順序不變的情況下遵從其原有書寫規(guī)范,設(shè)計(jì)不同形式的著錄目錄格式。第四,著錄過程中盡可能使用與檔案本身內(nèi)容信息較為接近的詞語,如果少數(shù)民族語言檔案中使用的某個(gè)詞匯在國家通用語言文字當(dāng)中找不到對應(yīng)的詞匯,也可以采用音譯方式表示,例如,我國民族地區(qū)的地名、人名等信息都是采用音譯方式產(chǎn)生的特定詞匯。第五,針對古代文字和現(xiàn)代文字差異性較大的少數(shù)民族古文字歷史檔案,可以在題名照錄的情況下,對其他著錄項(xiàng)目采用現(xiàn)代文字進(jìn)行著錄。在對少數(shù)民族語言古文字無法識讀和理解的情況下,可以向相關(guān)領(lǐng)域?qū)<覍W(xué)者尋求幫助。例如,回鶻蒙古文與目前我國內(nèi)蒙古自治區(qū)正在使用的現(xiàn)代蒙古文有著非常大的差異,如果要對這些古文字歷史檔案進(jìn)行著錄,需要可以識讀這種文字的專家參與才可以完成。第六,當(dāng)同一檔案當(dāng)中包含有兩種或兩種以上少數(shù)民族語言文字時(shí),對其著錄可以根據(jù)需要靈活安排,可以選擇當(dāng)?shù)赝ㄓ玫纳贁?shù)民族文字和國家通用語言文字雙語進(jìn)行著錄,也可以采用每一種少數(shù)民族語言文字進(jìn)行單獨(dú)著錄,檔案著錄結(jié)果有可能出現(xiàn)三種文字甚至更多的文字。例如,西藏自治區(qū)檔案館所收藏的一些歷史檔案就是同時(shí)采用藏文和蒙古文兩種少數(shù)民族文字,此時(shí)可以分別采用三種文字進(jìn)行著錄。第七,為保障著錄結(jié)果不出現(xiàn)亂碼,著錄用文字處理軟件最好使用Unicode作為底層代碼方案。如果個(gè)別詞匯無法通過計(jì)算機(jī)進(jìn)行錄入,也無法通過符號組合生成新字詞,可以在系統(tǒng)中采用特點(diǎn)代碼進(jìn)行標(biāo)注。
少數(shù)民族語言檔案的雙語著錄通??梢酝ㄟ^以下模式來實(shí)現(xiàn):第一,直接雙語著錄模式。由同時(shí)掌握國家通用語言文字和少數(shù)民族語言文字的著錄工作人員對同一檔案采用兩種語言文字分別進(jìn)行著錄。這種方式對著錄人員的語言能力和專業(yè)素質(zhì)有著非常高的要求,實(shí)踐中符合這一條件的工作人員數(shù)量較少。第二,階段雙語著錄模式。階段雙語著錄分兩個(gè)階段進(jìn)行:首先由精通少數(shù)民族語言的檔案著錄人員先采用少數(shù)民族語言文字進(jìn)行著錄,之后由另外一名同時(shí)掌握兩種語言文字的工作人員將著錄結(jié)果翻譯為國家通用語言文字。第三,并行雙語著錄模式。所謂并行雙語著錄,是指針對已有國家通用語言文字版本的少數(shù)民族檔案,由兩名工作人員按照統(tǒng)一要求分別進(jìn)行少數(shù)民族語言文字的著錄和國家通用語言文字兩種文字的著錄。這種模式對翻譯人員要求較低,但兩種版本分別進(jìn)行著錄,可能會出現(xiàn)部分著錄項(xiàng)目不完全一致的情況。第四,反饋雙語著錄模式。反饋雙語著錄主要針對國家通用語言文字檔案少數(shù)民族語言文字譯本的著錄需要,首先根據(jù)國家通用語言文字版本內(nèi)容,采用國家通用語言文字進(jìn)行檔案著錄,之后將著錄結(jié)果再翻譯為對應(yīng)語種的少數(shù)民族語言。這種模式主要針對漢語檔案的譯本,不能直接針對少數(shù)民族語言檔案進(jìn)行著錄。在實(shí)踐中,民族地區(qū)檔案管理機(jī)構(gòu)究竟采用哪種模式著錄,需要綜合考慮著錄對象類型、雙語版本是否存在、機(jī)構(gòu)雙語工作人員的數(shù)量和語言能力等多方面的因素,選擇最適合的雙語著錄模式。
3 中國少數(shù)民族語言檔案雙語著錄控制與優(yōu)化
民族地區(qū)檔案管理機(jī)構(gòu)無論采用哪種模式進(jìn)行少數(shù)民族語言檔案的雙語著錄,都需要至少在其中一個(gè)環(huán)節(jié)對整篇檔案或者檔案目錄數(shù)據(jù)進(jìn)行翻譯,翻譯工作的質(zhì)量直接決定了檔案著錄數(shù)據(jù)的質(zhì)量。因此,雙語著錄的核心矛盾就是如何將源語言檔案信息準(zhǔn)確無誤地轉(zhuǎn)換成為另外一種語言文字的等價(jià)語素。為了確保雙語著錄工作成果的數(shù)據(jù)質(zhì)量,民族地區(qū)檔案管理機(jī)構(gòu)通常需要對著錄過程中可能影響翻譯質(zhì)量的因素入手,逐一采取措施,盡可能減少這些因素可能造成的著錄結(jié)果的偏差。第一,人才是從事檔案管理和服務(wù)工作最為關(guān)鍵的要素。民族地區(qū)檔案管理機(jī)構(gòu)應(yīng)該配備精通少數(shù)民族語言文字和國家通用語言文字的雙語翻譯人才,同時(shí)加強(qiáng)檔案管理相關(guān)知識的培訓(xùn),使其能夠準(zhǔn)確把握檔案著錄工作中對著錄成果翻譯的規(guī)則與要求,滿足高質(zhì)量完成少數(shù)民族語言檔案雙語著錄工作的需要。為此,民族地區(qū)檔案管理機(jī)構(gòu)需要把高素質(zhì)雙語檔案管理人才的培育納入工作規(guī)劃,通過與相關(guān)高校聯(lián)合培養(yǎng)方式,使其同時(shí)在語言能力和專業(yè)能力方面得到全面提升。第二,建立科學(xué)規(guī)范的雙語著錄工作流程,通過多重校核降低出現(xiàn)語言文字失誤的概率。例如,雙語著錄結(jié)果通常需要不少于兩名工作人員的相互審核,以便發(fā)現(xiàn)翻譯過程可能存在的問題。對于部分內(nèi)容非常重要的少數(shù)民族語言檔案,除本機(jī)構(gòu)內(nèi)部校核之外,還應(yīng)該尋求中國民族語文翻譯局、地方政府下屬的民族語言文字翻譯機(jī)構(gòu)的支持,進(jìn)一步確認(rèn)雙語著錄結(jié)果的質(zhì)量。對于部分內(nèi)容相對專業(yè)的少數(shù)民族語言檔案,如果工作人員難以準(zhǔn)確把握檔案的內(nèi)容,則雙語著錄的結(jié)果除了要由至少兩名從事少數(shù)民族語言檔案管理的工作人員相互審校之外,還應(yīng)該由對應(yīng)領(lǐng)域的專家學(xué)者進(jìn)行把關(guān),以確保著錄結(jié)果的準(zhǔn)確性。第三,開發(fā)專門的少數(shù)民族語言檔案雙語著錄計(jì)算機(jī)輔助系統(tǒng),內(nèi)置少數(shù)民族語言文字和國家通用語言文字的機(jī)器翻譯程序模塊,為工作人員選擇對應(yīng)的詞匯提供自動(dòng)化支持。例如,中國民族語文翻譯局目前可以提供漢文、蒙古文、藏文、拉丁維吾爾文、現(xiàn)代維吾爾文、哈薩克文、朝鮮文、彝文、壯文等文字信息的計(jì)算機(jī)在線翻譯和智能校對等服務(wù)??傊?,民族地區(qū)檔案管理機(jī)構(gòu)在進(jìn)行少數(shù)民族語言檔案雙語著錄時(shí)應(yīng)該從人、流程和技術(shù)等多個(gè)方面采取措施,使雙語著錄工作始終處于可控狀態(tài)。
主題標(biāo)引是檔案著錄工作的核心任務(wù),通常需要根據(jù)統(tǒng)一的邏輯參照體系,對著錄對象的主題信息進(jìn)行描述和記錄。由于語言文字的復(fù)雜性,“一詞多義”“多詞近義”“歧義”等現(xiàn)象在各類語言當(dāng)中普遍存在,完全依靠人工翻譯費(fèi)時(shí)費(fèi)力且著錄成果的一致性得不到保障。因此,如果民族地區(qū)檔案管理機(jī)構(gòu)可以為其著錄人員提供雙語自動(dòng)關(guān)聯(lián)支持,使其在進(jìn)行檔案著錄時(shí)可以較為熟悉的語言文字進(jìn)行著錄,著錄結(jié)果一旦選定則自動(dòng)與另外一種語言對應(yīng)的語言要素建立聯(lián)系,自動(dòng)組成生成另外一種語言文字的檔案目錄數(shù)據(jù),而上述構(gòu)想可以使用“受控語言”來實(shí)現(xiàn)。受控語言是為保證信息組織和檢索的一致性而設(shè)計(jì)開發(fā)的一種人工語言,在檔案管理領(lǐng)域通常是以檔案分類表和檔案主題詞表的形式來體現(xiàn)。主題詞表即敘詞表,是一種以經(jīng)過規(guī)范化處理的自然語言詞或詞組作為檢索標(biāo)識來表達(dá)文獻(xiàn)主題概念的人工檢索語言,是進(jìn)行文獻(xiàn)主題標(biāo)引、建立主題索引和開發(fā)目錄數(shù)據(jù)庫的重要工具。在檔案管理領(lǐng)域,我國政府所編制和頒布的《中國檔案主題詞表》屬于單語種主題詞表。隨著我國主要語種少數(shù)民族語言文字信息處理技術(shù)的逐步成熟和應(yīng)用范圍的逐步擴(kuò)大,在《中國檔案主題詞表》的基礎(chǔ)上開發(fā)可以融合國家通用語言文字和少數(shù)民族語言文字的多語言版本檔案主題詞表,為少數(shù)民族語言檔案的高精度主題標(biāo)引和高水平多語種檔案信息管理系統(tǒng)的建設(shè)提供邏輯參照體系就成為亟待研究和解決的問題?!岸嗝褡逭Z言檔案主題詞表”是以國家通用語言文字為核心,可以實(shí)現(xiàn)國家通用語言文字主題詞和各少數(shù)民族語言文字主題詞之間語義映射和關(guān)聯(lián)關(guān)系的多語種檔案主題詞表,是實(shí)現(xiàn)跨語言檔案主題信息檢索的基礎(chǔ)性工具。根據(jù)我國語言文字工作的實(shí)際,“多民族語言檔案主題詞表”由若干個(gè)雙語子表構(gòu)成,各個(gè)子表可以獨(dú)立運(yùn)行,也可以按照總表模式統(tǒng)一運(yùn)行。按照子表獨(dú)立模式運(yùn)行時(shí),參照各子表進(jìn)行少數(shù)民族語言文字主題標(biāo)引的結(jié)果主要用來支持當(dāng)?shù)厣贁?shù)民族語言文字與國家通用語言文字檔案信息的跨語言檢索。例如,內(nèi)蒙古自治區(qū)檔案管理部門可以參照《中國檔案主題詞表M-ZH(蒙漢版)》進(jìn)行蒙古文檔案的精準(zhǔn)主題標(biāo)引,標(biāo)引的結(jié)果是用蒙古文來標(biāo)注的,但是邏輯上與用漢語的等價(jià)主題詞進(jìn)行標(biāo)注是一致的,檔案信息檢索系統(tǒng)可以根據(jù)詞表的邏輯關(guān)聯(lián)將其作一體化處理,用戶無論是通過漢字還是蒙古文主題詞進(jìn)行檔案信息檢索,都可以得到蒙漢兩種語言文字的檔案信息。“多民族語言檔案主題詞表”可以使檔案管理人員擺脫繁重的少數(shù)民族語言檔案翻譯工作,直接使用少數(shù)民族語言文字進(jìn)行主題詞標(biāo)引,通過詞表映射與國家通用語言文字、其他語種少數(shù)民族語言檔案主題詞建立隱含的邏輯關(guān)聯(lián)。
參考文獻(xiàn):
[1]中華人民共和國檔案局官網(wǎng). DA/T 18-1999 檔案著錄規(guī)則[EB/OL].http://www.saac.gov.cn/xxgk/2015-05/28/content_100320.htm.[2018-05-16].
[2]中國民族語文翻譯局官網(wǎng).智能翻譯系統(tǒng)[EB/OL].http://www.mzywfy.org.cn/translate.jsp.[2018-05-16].
[3]洪漪.檔案信息組織與檢索[M].武漢:武漢大學(xué)出版社,1999.11:45-47.
[4]肖秋會.檔案信息檢索[M].武漢:武漢大學(xué)出版社,2011.8:58-61.
[5]馮惠玲.檔案文獻(xiàn)檢索[M].北京:高等教育出版社,1999.6:33-35.
[6]趙生輝.中國少數(shù)民族語言數(shù)字檔案管理協(xié)同管理的戰(zhàn)略構(gòu)想[J].檔案學(xué)通訊,2016(3):88-92.
[7]趙生輝.中國少數(shù)民族語言數(shù)字檔案館的建設(shè)構(gòu)想[J].檔案學(xué)通訊,2012(3):52-57.
[8]趙生輝.中國少數(shù)民族語言電子文件雙語著錄研究[J].蘭臺世界,2012(2):39-41.
[9]尚姍,高文靜.國內(nèi)外檔案著錄準(zhǔn)則比較研究[J].檔案學(xué)通訊,2014(2):100-104.
(作者單位:趙生輝:西藏民族大學(xué)管理學(xué)院;胡瑩:云南大學(xué)歷史與檔案學(xué)院 來稿日期:2018-12-13)