黃玉婧/南昌大學人文學院 周耀林 姬榮偉/武漢大學信息管理學院
瀕危語言問題已經(jīng)引起了越來越多的關(guān)注。1992年,第15屆世界語言學家代表大會將瀕危語言列入兩大主題之一;1993年,聯(lián)合國大會正式通過“瀕危語言方案”,并將該年定為搶救瀕危語言年;為了保護世界語言的多樣性,聯(lián)合國將每年的2月21日定為“國際母語日”,以喚醒人們尤其是少數(shù)人對自己語言保護的意識。2011年10月,我國政府在十七屆六中全會中提出要“科學保護各民族語言文字”。各種針對搶救瀕危語言的保護項目也在世界各地紛紛啟動,國外對瀕危語言的保護項目主要是就“語言建檔”(Languages Documentation)(注:documentation原意為文件、文檔,此處表達的是對瀕危語言進行記錄然后建立檔案保存,故在此處將Language Documentation譯為語言建檔)和“語言振興”(Language Devitalization )兩個目標而開展[1][2]。聯(lián)合國教科文組織和我國政府于2018年在長沙舉辦世界語言資源保護大會時發(fā)布的《岳麓宣言》中明確指出,信息、記憶、檔案和文化組織,無論是實體的還是虛擬的,都將對保護和促進語言多樣性發(fā)揮積極作用[3]。
可見,對瀕危語言建檔不僅能夠為語言振興提供基礎,同樣也是保護語言多樣性的重要方式之一,對瀕危語言建檔保護已經(jīng)成為了信息時代的必然選擇。為此,本文主要從檔案學視角出發(fā),對國外典型瀕危語言保護案例進行梳理和分析,以期能從中窺見當前國外瀕危語言建檔保護的進展和特點,對我國瀕危語言保護提供一定的參考。
語言建檔與保存計劃(Language Documentation &Conservation,LD&C)[4]隸屬于夏威夷大學語言學系。夏威夷大學是目前美國唯一一家開設語言建檔和保存研究生課程的學校,其語言學系自1963年成立以來,一直致力于對世界各地瀕危語言開展實地考察與研究教學工作,旨在解決由于語言瀕危對人類語言和文化多樣性造成的威脅,是全球記錄、保存和振興世界各地瀕危語言的領頭羊。
該項目主要包含以下6個部分的內(nèi)容:①瀕危語言目錄(ELCat),目錄涵蓋3422種瀕危語言共7023條瀕危語言數(shù)字資源,是全世界最權(quán)威、更新最快的瀕危語言數(shù)字資源庫,為學術(shù)研究提供了豐富的參考信息。②夏威夷語言學習評估項目(HALA),主要采用心理語言學技術(shù)對說話者的語言活動進行評估,可以反映出不同類型的雙語地區(qū)的語言磨蝕和恢復情況。③語言記錄和保存國際會議(ICLDC),成立于于2009年3月,定期召集世界各地科學家、學生和社區(qū)成員共同探討新技術(shù)環(huán)境下瀕危語言的建檔和保存問題。④同名在線期刊(LD&C)?!禠anguage Documentation & Conservation》(ISSN:1934-5275)于2007年6月首次出版,是由國家外語資源中心贊助并由夏威夷大學出版社發(fā)行的電子期刊,主要收錄數(shù)據(jù)管理、數(shù)據(jù)收集、實地調(diào)研方法、語言活力評估等有關(guān)語言建檔和保存的所有主題的論文。⑤語言建檔培訓中心(LTDC),由研究生發(fā)起和管理,旨在幫助指導瀕危語言族群提升建檔技巧和管理能力,并鼓勵他們向大眾宣傳語言多樣性的重要性和語言瀕危的嚴重性。⑥ Kaipuleohone數(shù)字檔案館,成立于2008年,是開放語言檔案聯(lián)盟(OLAC)的主要成員之一,館內(nèi)藏有大量的照片、筆記、詞典、轉(zhuǎn)錄內(nèi)容和其他瀕危語言數(shù)字材料。
歐洲瀕危語言建檔計劃(Endangered Languages Documentation Programme,ELDP)[5]成立于2002年,屬于漢斯·拉斯瀕危語言記錄項目的一部分,其啟動資金來源于Arcadia基金會向英國倫敦大學亞非學院提供的2000萬英鎊捐贈,旨在為個人管理的瀕危語言建檔項目提供資助,支持受助者使用這些資金進行實地考察、音視頻錄制,瀕危語言紀錄片集制作等建檔保護活動的順利開展。
該項目主要包含以下4個部分的內(nèi)容:①建立瀕危語言地圖,在瀕危語言地圖中可以全面清晰地了解到世界范圍內(nèi)所有的瀕危語言點,用戶可以通過點擊地圖上具體位置和具體語言了解其簡介、語言系屬、使用人口和使用區(qū)域等詳細信息。②瀕危語言項目目錄,涵蓋2003年至今已完成的350多個瀕危語言保護項目。用戶在主頁的搜索界面通過搜索國家、機構(gòu)、語言和個人4項基本信息搜索自己想了解的瀕危語言項目信息,項目信息包括:項目受資助人、項目結(jié)構(gòu)、項目細節(jié)和項目簡介。③開設瀕危語言畫廊,畫廊是一系列瀕危語言項目照片的展示,用戶通過照片中展示的發(fā)音人、調(diào)查人以及調(diào)查過程可以更加直觀清楚地了解到當?shù)氐恼Z言和傳統(tǒng)文化。④建立瀕危語言檔案館,一個保存和發(fā)布來自世界各地的瀕危語言文檔資料的數(shù)字資源庫。截至目前已收錄并免費開放來自非洲、中東、亞洲、澳大利亞等地區(qū)共450多種語言的文檔資料、音頻和視頻。
DoBeS 計劃(Dokumentation bedrohter Sprachen)[6]由大眾汽車基金會于2000年啟動,以記錄在幾年內(nèi)可能面臨滅絕的瀕危語言。自成立以來,DoBeS對整個瀕危語言建檔保存理論、實踐、技術(shù)工具和標準方面都產(chǎn)生了重大影響。在對瀕危語言建檔的過程中,DoBeS除了考慮到對各種類型的音頻和視頻數(shù)據(jù)的收集、對元數(shù)據(jù)的描述以及各項標準外,還注重對數(shù)字材料的長期保存。為此,DoBeS計劃從一開始就利用最先進的技術(shù)以滿足建檔保存工作的需要。
該項目主要包含以下5個部分的內(nèi)容:①制定指導文件,包括:“概述”(描述所有文件狀態(tài)和用途的概述性文件)、“行為守則”(指導文件編制及存檔工作各方面的守則)、“數(shù)據(jù)訪問及保護規(guī)則”(指導檔案館員工作的文檔)、“存放者·檔案館員協(xié)議”(描述存放者所提供的數(shù)據(jù)在何種條件下可供他人使用的條款)。②建立語言咨詢委員會,應檔案館員的要求以及在大眾汽車基金會的充分支持和鼓勵下,DoBeS成立了一個由在語言建檔方面經(jīng)驗充足的研究人員組成的獨立國際語言咨詢委員會,為有關(guān)瀕危語言建檔領域的專業(yè)知識問題提供指導,包括檔案館的訪問和使用權(quán)、社區(qū)和倫理問題、培訓需求、軟件工具、語言問題等。③開展DoBeS會議,組織一些重要會議(包括DoBeS研討會、咨詢委員會會議、DoBeS團隊組織的國際會議以及與TLA合辦的國際會議)。DoBeS研討會從2000年開始每年召開一次,內(nèi)容主要以介紹瀕危語言對人類重要性,宣傳語言多樣性為主。④開設瀕危語言存檔訓練課程,在DoBeS計劃中開展一些培訓和教育活動,所有活動中使用過的材料都是公開的可供公眾免費使用。到目前為止,DoBeS建檔團隊一共舉辦過23次培訓課程,地點主要設在奈梅亨。⑤建立DoBeS檔案館,其中包含來自世界各地有可能滅絕的各種語言文檔數(shù)據(jù),是屬于Nijmegen的Max Planck心理語言學研究所的語言檔案館(TLA)的一部分。TLA專門從事語言記錄和其他類型數(shù)據(jù)的歸檔和保存,以及對語言工具和歸檔工具的開發(fā)。
隨著在實地調(diào)研中記錄保存瀕危語言的方式受到越來越多專家學者的推崇,一門新興的交叉學科“語檔語言學”(Documentary Linguistics)也應運而生[7],其中包含了計算機技術(shù)、多媒體技術(shù)、音視頻錄制技術(shù)等。國外瀕危語言建檔保護項目都強調(diào)要在基于實地調(diào)研之上利用現(xiàn)代化技術(shù)進行多媒體記錄與建檔保存。在LD&C項目的田野調(diào)查過程中,研究者們使用心理語言學技術(shù)來評估說話者的語言活動,以此來檢測語言瀕危的程度和不同語言族群之間的語言差異;在ELDP項目中,瀕危語言畫廊里所展示出來的所有圖片與音頻皆為ELDP受助者和培訓機構(gòu)的校友們在實地調(diào)研期間所拍攝。通過照片中所展示出來的發(fā)音人、調(diào)查人以及調(diào)查過程可以更加直觀清楚地了解到當?shù)氐恼Z言與傳統(tǒng)文化。在瀕危語言畫廊中展示的俄羅斯東部漢特人的照片,2003年普查中還有30%的漢特人保持著一定程度的母語水平,而到了2010年的普查顯示該地區(qū)718個漢特人中說漢特語的人不超過10人。由此可見,全面加強瀕危語言實地調(diào)研的力度和范圍,及時記錄語言活力較弱的瀕危語言顯得尤為重要。而項目調(diào)查人在調(diào)查過程中學習該地區(qū)的瀕危語言,會使其逐步明白其中內(nèi)涵的深刻寓意與巨大價值,該瀕危語言族群又在接受調(diào)查的過程中宣傳自己本族語言,從而進一步激發(fā)民族認同感與自豪感。這種雙方互贏的模式為瀕危語言保護項目的持續(xù)開展打下了良好的基礎。
除此之外,美國加利福尼亞大學圣塔芭芭拉分校2008年主辦的第一屆、在美國俄勒岡大學主辦的第二屆“田野調(diào)查實踐研習會”都得到了美國國家科學基金會、美國國家人文基金會瀕危語言建檔項目的資助,證明了國外對于田野調(diào)查的支持與重視程度[8]。國外的瀕危語言建檔保護工作都堅持貫徹深入實地調(diào)研的思想,為后期的保護工作打下了堅實基礎。
國外瀕危語言建檔保護項目非常重視多元主體協(xié)同參與。LD&C、ELDP、DoBeS三個項目都通過組織國際會議、開展宣講會等形式定期將來自世界各地的語言族群成員、語言研究者、檔案工作者以及技術(shù)開發(fā)人員聚集在一起,分享瀕危語言記錄與建檔的最新進展,并探討如何更好的開展瀕危語言保護工作。例如:LD&C兩年一度的語言存檔和保護國際會議(ICLDC)主要以如何使用數(shù)字工具和更多的技術(shù)加快瀕危語言保護工作為主題召開,目前已有435位學者與社區(qū)成員加入;DoBeS自2000年發(fā)起第一屆瀕危語言建檔的研討會后,每年定期舉辦相關(guān)會議,內(nèi)容包括“制定存檔協(xié)議”“介紹語言存檔和保護的網(wǎng)站和書籍”“瀕危語言研究進展”“使用語言檔案資源”“語言檔案:它在語言學、人類學和語言維護中的作用”“記錄語言學的進步”“語言檔案:過去—現(xiàn)在—未來”等;ELAP舉辦的“瀕危語言:我們現(xiàn)在在做什么”“語言資料建檔”國際會議也引起了各界的廣泛關(guān)注,會議內(nèi)容主要以向公眾宣傳語言瀕危的危害和人類多樣性對我們的重要性為主,同時對語言建檔理論和方法進行介紹。各類學術(shù)會議的廣泛召開旨在提升公眾對瀕危語言的認識,同時給各相關(guān)行業(yè)的專業(yè)人士一個交流溝通的機會,為保護瀕危語言貢獻自己的一份力量。
除了通過召開國際會議凝聚各專家學者和語言工作者之外,國外瀕危語言保護項目還尤其重視加入語言族群的力量,充分調(diào)動他們的積極性,保證他們與研究人員以及保護團隊進行有效的配合。數(shù)據(jù)的收集、檔案的整理和使用等方面都必須要有語言組群的參與[9],從協(xié)調(diào)能力、人力資源分配、互通性的標準、權(quán)益和反饋5個維度來加強瀕危語言建檔的協(xié)調(diào)性和互通能力[10]。國外瀕危語言建檔保護項目如此積極地召開國際會議并加強與語言族群之間的合作,反映出瀕危語言建檔保護僅依靠某一方力量的支撐是遠遠不夠的,需要聯(lián)合各專業(yè)學者、工作人員及語言族群等多方力量共同推進。
瀕危語言建檔保存項目大都建立了龐大的瀕危語言檔案館用以保存數(shù)量巨大形式多樣的瀕危語言數(shù)字資源,以便日后的多維度呈現(xiàn)。ELDP項目建立的數(shù)字語言檔案館ELAR目前已經(jīng)已經(jīng)收錄了來自非洲、中東、亞洲、澳大利亞等地區(qū)500多種語言的文檔資料,包括錄音、錄像、筆記、轉(zhuǎn)錄、翻譯/或注釋、照片、圖表、掃描圖像等;而LD&C項目的“Kaipuleohone數(shù)字檔案館”目前已經(jīng)收錄在“開放語言檔案社區(qū)(OLAC)”中,收藏了由語言學家、人類學家和民族音樂學家等從世界各地搜集的文字、圖像、音頻和視頻,藏品包含大量的照片、筆記、詞典、轉(zhuǎn)錄內(nèi)容和其他與少數(shù)民族瀕危語言相關(guān)的數(shù)字材料,共有199種不同語言組成的4785個條目;DoBeS項目所建立的“DoBeS檔案館”則包含來自世界各地有可能滅絕的各種語言文檔數(shù)據(jù),是位于Nijmegen的Max Planck心理語言學研究所的語言檔案館(TLA)的一部分。TLA專門從事語言記錄和其他類型數(shù)據(jù)的歸檔和保存,同時在語言歸檔工具的開發(fā)領域也頗有造詣。而如何對海量且形式豐富的瀕危語言數(shù)字資源進行組織以及呈現(xiàn),同樣是研究探討的核心所在。
除此之外,國外還有很多收錄了形式多樣瀕危語言數(shù)字資料的數(shù)字檔案館,同樣也是以多元化的資源呈現(xiàn)作為他們的核心內(nèi)容。比如:澳大利亞原住民和托雷斯海峽島民研究會的“原住民研究電子資源檔案館(ASEDA)”[11]收藏有數(shù)百種澳洲土著語言研究文獻和音像記錄資料;“美國阿拉斯加本土語言檔案館(ANLA)”[12],收錄有阿拉斯加主要以印第安人瀕危語言為主的共20種本土語言文獻、音像和數(shù)字資源,其中還有20世紀初印第安語言的蠟筒錄音轉(zhuǎn)錄資料;墨爾本大學、澳大利亞國立大學、悉尼大學、戈羅卡大學與國家檔案館聯(lián)合建立的“太平洋和區(qū)域瀕危文化數(shù)字化資源檔案館(PARADISEC)”[13],保存了100多種本土語言數(shù)字音視頻資料[14];斯夸米什人語檔案館(ASNC)中保存了加拿大大不列顛哥倫比亞省的北美印第安人(斯夸米什人)的語言資源;拉丁美洲的土著語言檔案館(AILLA)中保存著所有來自中美洲和南美洲的瀕危語言;澳大利亞的環(huán)太平洋地區(qū)瀕危文化數(shù)字化資源檔案館(PARADISEC)中也擁有數(shù)量龐大的瀕危語言資料。這些瀕危語言檔案館中數(shù)字資源種類豐富多樣,以多維的角度再現(xiàn)了語言族群的文化特色。
作為一項長期的系統(tǒng)工程,國外瀕危語言建檔項目都有充足的資金做保障。例如,ELDP獲Arcadia基金為期10年共計1700萬英鎊的資助,是目前世界上瀕危語言建檔研究最大的基金來源。自成立以來,ELDP已資助全球400多個瀕危語言建檔項目,資金投入用于支持世界各地學者的實地調(diào)研、開展培訓、宣傳和推廣等各種工作;DoBeS目前已資助超過50個研究項目,金額超過3000萬歐元。資金用于組織包括DOBES研討會、咨詢委員會會議、DOBES團隊組織的國際會議等一系列重要會議,還被用以開展一些培訓與教育活動,并在每次培訓之后將教育材料總結(jié)后傳上網(wǎng)站供大眾免費使用;LD&C投入大量資金用于進行瀕危語言評估、自閉癥兒童語言熟練度評估及開展國際會議。
除此之外,其他機構(gòu)也為瀕危語言建檔提供了充足的資金支持。美國國家科學基金會瀕危語言存檔項目由國家科學基金和國家人文科學基金組成資助合作伙伴,預計每年提供約480萬美元的資金供瀕危語言檔建實地工作、研究生和本科生的獎學金和舉辦會議所使用[15]。拉丁美洲的土著語言檔案館(AILLA)獲得國家人文基金會(NEH)和國家科學學會(NSF)的資助,共計140萬美元;2005年,美國政府出資440萬美元對26個機構(gòu)和13名學者提供支持,幫助他們對全球約70種瀕危語言進行現(xiàn)狀調(diào)查[16]。
國外大量實踐顯示,充足的資金能夠調(diào)動研究人員和項目參與者的積極性,為建檔工作中各項活動的展開提供有效的保障。
國外瀕危語言建檔保護十分重視對語言多樣性重要性的宣傳工作并努力提高瀕危語言族群自救深層覺悟,通過各種各種方式讓瀕危語言族群意識到保護自己語言的重要性并且增強自己的文化認同感,讓他們自發(fā)地參與到瀕危語言建檔保護實踐中,以搶救即將面臨滅絕的瀕危語言。當下,我國部分人持有“瀕危語言消亡是必然趨勢”“弱勢語言定然會被強勢語言所取代,不需要進行保護”“保護瀕危語言與推廣普通話相互矛盾”等論調(diào)。鑒于此,需要通過各種途徑對保護瀕危語言的重要性加以宣傳,增強社會公眾對瀕危語言保護意識,認同每種語言存在的合理性,尊重瀕危語言,堅決抵制各種形式的歧視。瀕危語言建檔保護主體主要由政府、語言群體和專家構(gòu)成,而政府的行政效力只能從外圍進行扶持,專家在建檔保護中所發(fā)揮的作用也僅限于專業(yè)技術(shù)上的指導。這就意味著語言族群在整個建檔保護過程中發(fā)揮著至關(guān)重要的作用[17]。
準確對語言活力進行劃分是采取不同保護策略措施的前提,因此必須深入開展瀕危語言活力評估研究[18]。國外瀕危語言保護項目都十分強調(diào)對語言活力的評估,對評估指標的研究起步較早,已有了一系列的成果,以不同的等級來劃分語言瀕危的程度與語言活力。如Fishman的分級代際干擾量表[19](GIDS)、聯(lián)合國教科文組織《語言活力與語言瀕?!肺募⒄Z言危害指數(shù)(LEI)等。目前國內(nèi)學者所提出的瀕危語言活力評估指標缺乏體系,并沒有某一個評估指標被用于權(quán)威機構(gòu)的瀕危語言等級劃分中,且整體缺乏系統(tǒng)客觀的統(tǒng)計分析。學術(shù)界對語言活力的評估缺乏嚴謹?shù)脑u估標準,許多少數(shù)民族語言和方言存在“被瀕?!钡默F(xiàn)象。部分學者使用自己主觀理解的評估標準直接定義瀕危語言,部分學者通過參考聯(lián)合國教科文組織《語言活力與語言瀕?!肺募o瀕危語言定級,但文件中的許多指標,有些是普遍適用,有些仍有待完善[20]。我國目前開展瀕危語言建檔保護的當務之急是應該結(jié)合我國基本國情,在該文件的基礎上建立適合中國的瀕危語言活力評估指標體系。
盡管從《總體規(guī)劃》中可以看出我國已經(jīng)邁出瀕危語言建檔保護的步伐,但步伐并不穩(wěn),采集資源還在沿用以往非瀕危語言田野調(diào)查的方式,工作路線和思維方式都未轉(zhuǎn)向;使用現(xiàn)代化技術(shù)手段的技能明顯普遍不足;對語言資源加工、處理、開發(fā)利用的技能還比較陌生;跨學科的合作和支持也沒有形成普遍的學術(shù)行為。無論是創(chuàng)建瀕危語言有聲語檔、建設瀕危語言多媒體語料庫或者是開發(fā)有聲數(shù)據(jù)庫,都面臨語料采集和錄制,分析、加工和處理,資料永久保存、服務和利用等問題,這些問題都需要有規(guī)范的理論做指導。而國外基本上所有的建檔保護項目都開辦了以瀕危語言有聲資源采集、記錄、加工和存檔等內(nèi)容為主的假期培訓班和技術(shù)實訓班。面對我國復雜多樣且類型迥異的語言類型,只有擁有具有完備瀕危語言建檔技能的人才隊伍,才能夠滿足我國瀕危語言建檔保護的需求。通過開展瀕危語言建檔培訓,從建檔理論方面和實踐方面都進行深入系統(tǒng)的學習,為瀕危語言建檔保護起到科學的保障。培訓內(nèi)容可以包括瀕危語言記錄方法、瀕危語言存檔工具學習、瀕危語言語料庫建設以及維護等。
國內(nèi)之前有很多語言學者個人收藏的一些瀕危語言錄音材料,由于在建檔之初未對語檔質(zhì)量進行嚴格控制,使得這些材料無法進行共建共享,造成資源的極大浪費。為了實現(xiàn)日后瀕危語言數(shù)字資源的共建共享,在整個建檔過程中從規(guī)劃到實施,包括語檔的采集、攝錄、轉(zhuǎn)寫、注釋、數(shù)字化、保存等等,都應遵循工作規(guī)范和技術(shù)標準,保證語檔的質(zhì)量,最大程度提高語檔的可利用價值,使之發(fā)揮最大效益。瀕危語言建檔保護務必堅持規(guī)范和標準先行的工作思路,嚴格控制語檔質(zhì)量。瀕危語言建檔的規(guī)范和標準主要是瀕危語言語料的采集和記錄用表、瀕危語言有聲語檔的數(shù)據(jù)規(guī)范和標準。瀕危語言采集和記錄用表應包括詞匯表、句子表(日常用句和語法例句)以及話語提綱。其中,既要有和其他漢語方言相同的通用調(diào)查內(nèi)容,也要有適用于不同瀕危語言的擴充內(nèi)容。例如,詞匯調(diào)查表應包括音系詞、基本詞匯和擴充詞匯,并對詞匯按照常用度分級。話語提綱應體現(xiàn)題材的代表性和多樣性。瀕危語言語檔的數(shù)據(jù)規(guī)范和標準是語檔資源的質(zhì)量及資源共建共享的保證,包括語檔的架構(gòu)、數(shù)據(jù)模式、元數(shù)據(jù),音視頻數(shù)據(jù)的采集和加工規(guī)范,數(shù)據(jù)質(zhì)量評估標準,建檔流程規(guī)范,設備和工具的技術(shù)指標等等。必須從源頭上以及整個建檔過程的方方面面嚴格控制,以確保后期瀕危語言數(shù)字資源的共建共享。
本文系國家社科基金重大項目“邊疆民族地區(qū)瀕危少數(shù)民族檔案文獻遺產(chǎn)保護及數(shù)據(jù)庫建設”(項目編號:17ZDA294)研究成果之一。