提 要 “中國語言資源保護工程”以其空前規(guī)模及統(tǒng)一規(guī)范方法實施調(diào)研所采集的活態(tài)語料資源,兼具真實性、可靠性和科學性,并為語言資源的精準保護和合理開發(fā)應(yīng)用提供了科學依據(jù)。語保工程實現(xiàn)了新時期對中國境內(nèi)的少數(shù)民族語言及方言與土語情況較為全面的摸底與排查,調(diào)查數(shù)據(jù)和相關(guān)材料同時也提供了少數(shù)民族語言資源保護及開發(fā)應(yīng)用的諸多信息。本文以5年來民語專項調(diào)研任務(wù)語料資源數(shù)據(jù)及任務(wù)進程中發(fā)音合作人遴選時透露的語言資源保持類型存在的層次差異等為問題導(dǎo)向,對中國少數(shù)民族語言資源的開發(fā)應(yīng)用及相關(guān)論題進行初步探討。本文認為,基于語保工程民語調(diào)研專項任務(wù)所獲大量語料資源數(shù)據(jù),中國少數(shù)民族語言資源的開發(fā)應(yīng)用可實施整體統(tǒng)一開發(fā)應(yīng)用與分類開發(fā)應(yīng)用兩種推進思路。整體統(tǒng)一開發(fā)應(yīng)用思路包括大數(shù)據(jù)研究、語言服務(wù)、政策咨詢等內(nèi)容;分類開發(fā)應(yīng)用思路則包括深度開發(fā)應(yīng)用、深度規(guī)范性開發(fā)應(yīng)用、深度保護性開發(fā)應(yīng)用及深度典藏性開發(fā)應(yīng)用等內(nèi)容。
關(guān)鍵詞 語保工程;少數(shù)民族語言資源;開發(fā)應(yīng)用;統(tǒng)一;分類
中圖分類號 H002 文獻標識碼 A 文章編號 2096-1014(2019)03-0038-07
Abstract The National Project of Chinese Language Resource Preservation (hereinafter Preservation Project) is an unprecedented megaproject with a unified standard and framework. The live linguistic resources it contains are featured as authentic, reliable and scientific, thus providing a scientific ground for precise preservation of minority language resource and controlled development and utilization. The implementation of the Preservation Project enables a thorough survey and rectification of minority languages, regionalects, and colloquialisms. The data collected provide abundant information for language resource preservation and utilization. Over the past five years, the Project team has obtained rich information form the native speakers of minority languages during special focused tasks. Guided by the hierarchical differences in need of protection as revealed by these minority languages, this study attempts to make a preliminary proposal on the development and utilization of the data from the project. I argue that, based on the big data, the development and utilization of minority language resources in China should be implemented with a scheme of unified development and utilization and a scheme of categorized development and utilization. The former includes big-data study, language service, policy consultancy, and the latter contains in-depth development and utilization, in-depth standardized development and utilization, in-depth controlled development and utilization and in-depth archived development and utilization for individual languages. In short, more considerations should be given to post-project preservation and utilization.
Key words Preservation Project; minority language resource; development and utilization; unified scheme; categorized scheme
“中國語言資源保護工程”(以下簡稱語保工程)經(jīng)5年的建設(shè),已進入一期的攻堅收官階段。目前,語保工程正面臨如何開展在語言資源保護條件下的開發(fā)應(yīng)用等后續(xù)任務(wù)。相較于漢語方言資源,中國少數(shù)民族語言資源的開發(fā)應(yīng)用面臨語種多、類型雜、差異大的形勢,需解決的問題也極其特殊,難以一刀切。本文結(jié)合語保工程民語調(diào)研專項任務(wù)實施以來的實踐,就中國少數(shù)民族語言資源及其開發(fā)應(yīng)用的相關(guān)論題予以初步探討,以期獲得拋磚引玉之效。
一、論題緣起
語保工程兼具史無前例的開創(chuàng)性和重大的現(xiàn)實意義,其投入的經(jīng)費、人力、持續(xù)的時間以及獲得的語言資源容量,是空前的。尤其首次采用統(tǒng)一的規(guī)范標準所收集的國內(nèi)漢語方言與少數(shù)民族語料資源兼具真實性、可靠性和科學性。調(diào)查所獲相關(guān)數(shù)據(jù)提供了中國語言資源的分布地域、密度、類型,各語系、各語族、各語支、各語言及其方言土語資源等多種最新信息,也為我們進行語言資源保護與語言資源開發(fā)應(yīng)用規(guī)劃提供了科學依據(jù)。
(一)語保工程民語調(diào)研任務(wù)所獲語料數(shù)據(jù)
語保工程實現(xiàn)了新時期對中國境內(nèi)的少數(shù)民族語言及方言與土語情況較為全面的摸底與排查。據(jù)語保工程民語調(diào)研專項任務(wù)相關(guān)數(shù)據(jù)統(tǒng)計,2015至2019年的5年內(nèi),共計立項410個點。其中,一般點立項323個,已結(jié)項255個;瀕危點87個,已結(jié)項74個。立項與已完成任務(wù)的調(diào)研點涵蓋了分布于中國大陸和臺灣的56個民族使用的130余種語言及新發(fā)現(xiàn)的若干語言。各語系語言點分布情況如表1所示。各語族設(shè)點情況如表2所示。
以上數(shù)據(jù)中包括需待確認的若干種新發(fā)現(xiàn)語言,還包括30~50余種跨境語言(戴慶廈1993;黃行,許峰2013;周慶生2013;朱艷華2016)。
(二)民語“發(fā)音合作人”遴選中透露的相關(guān)信息
在語保工程實施過程中,每個調(diào)研點提供各種語料資源的發(fā)音合作人無疑是最重要的角色,而其中尤為關(guān)鍵的是主要發(fā)音合作人。語保工程民語調(diào)研專項任務(wù)實施進程中不同語言及方言調(diào)研點發(fā)音合作人遴選條件存在一定的差異,大致可分為以下幾類情況:
A.發(fā)音合作人的遴選有較為充分的選擇余地,甚至在某些調(diào)研點可海選;具體來說,除了少量借詞和絕對缺失詞匯外,可圓滿完成詞匯采集任務(wù);尤其是口頭文化語料采集方面的發(fā)音合作人的遴選可做到精選,提供的語料內(nèi)容異常豐富,樣式齊全且多樣,音像攝錄過程十分順利。
B.有較多符合條件的發(fā)音合作人,也有一定的選擇余地,但稍需花費一些時間與精力;上述幾個環(huán)節(jié)的語料采集和音像攝錄工作一般也較為順利。
C.符合條件的主要發(fā)音合作人有限,且某些調(diào)研點需要適當放寬諸如年齡、性別或文化程度等條件;上述幾個環(huán)節(jié)中,詞匯部分有一部分抽象詞匯缺失現(xiàn)象,口頭文化部分提供的語料內(nèi)容和形式都有一定局限性。有些調(diào)研點課題組與發(fā)音合作人的音像攝錄磨合過程較長。
D.符合部分條件的發(fā)音合作人很有限,且單人無法承擔主要發(fā)音合作人需完成的全部任務(wù),需要數(shù)個人合作才能完成部分任務(wù);因詞匯缺失現(xiàn)象較為嚴重,口頭文化材料內(nèi)容和形式較為單一,無法采集到足量的語料;音像攝錄也困難重重。
E.符合部分條件的發(fā)音合作人也很難覓,僅存的數(shù)量有限的自然母語人也或因年事已高、身體多病、發(fā)音器官患病及其他原因無法配合課題組的音像攝錄工作,課題組不得已在部分“學得”母語人中尋找到符合部分條件的發(fā)音合作人,所提供的各類語料在各方面都存在一定局限性。
另外,諸如崩如、蘇龍等數(shù)種瀕危語言因無法尋覓到符合條件的發(fā)音合作人,無條件立項;臺灣語群除阿美語和鄒語外的10余種瀕危語言也因各種原因未能列入語保工程一期調(diào)研計劃。
上述發(fā)音人遴選過程中出現(xiàn)的情況分別涵蓋了不同的語言:其中,A類一般可涵蓋蒙古、藏、維吾爾、哈薩克、朝鮮、壯、傣等數(shù)個具有傳統(tǒng)文字或布依、哈尼、白等幾個新創(chuàng)文字且人口數(shù)量較多民族的語言;B類包括彝、苗、侗、拉祜、傈僳、黎、水等人口數(shù)量較多、方言分歧較大的民族語言;C類絕大多數(shù)是人口較少民族中仍保持一定活力的語言,其中僅有錫伯、柯爾克孜、景頗、土族等幾種語言有文字,其余全部是無文字語言;D類大多是有一定瀕危跡象的語言,如烏孜別克、塔塔爾、圖瓦、東部裕固、西部裕固、保安、康加、鄂倫春、鄂溫克、俄羅斯、門巴等民族的語言,也包括臺灣絕大多數(shù)南島語系的語言;E類則涵蓋了滿、土家、赫哲等語言,也包括一部分南島語系臺灣語群的羿、卡那卡那富、沙阿魯阿、巴則海、邵等語言。
由于不同語言因各種情況存在的許多差異,以上歸類具有一定相對性。因每一種語言甚至方言土語間內(nèi)部也存在著各種不平衡現(xiàn)象,某些語言的下位分類還需參照相關(guān)條件有待進一步確認。
(三)相關(guān)分析
語保工程民語調(diào)研專項任務(wù)相關(guān)數(shù)據(jù)統(tǒng)計顯示,漢藏語系約占設(shè)點總數(shù)的73.66%,是中國語言數(shù)量最多的語系。其次是阿爾泰語系,約占設(shè)點總數(shù)的16.83%。兩個語系設(shè)點約占總數(shù)的90.49%。而各語族設(shè)點數(shù)據(jù)統(tǒng)計顯示,各語族占比依序為:漢藏語系藏緬語族、壯侗語族、苗瑤語族,阿爾泰語系突厥語族與蒙古語族、南亞語系孟高棉語族、阿爾泰語系滿-通古斯語族。以上統(tǒng)計數(shù)據(jù)同時也反映了中國少數(shù)民族語言分布的基本情況。從總體上看,北方民族語言中除了蒙古語、維吾爾語等個別語言外,其他語言基本完成了規(guī)劃的布點任務(wù)。漢藏語系中,藏緬語族、苗瑤語族等因方言、次方言、土語間分歧較大,尤其是藏緬語族中彝緬語支的彝語分六大方言,數(shù)十種次方言,還有諸多土語,目前布點密度仍顯不足。苗語和瑤語的情況則較為復(fù)雜,除了語言內(nèi)部方言分歧大導(dǎo)致無法交流外,苗族與瑤族內(nèi)部不同支系間甚至語言兼用,瑤族內(nèi)部不同支系還使用不同的語言。盡管如此,語保工程民語調(diào)研專項任務(wù)所獲語料資源已形成了龐大的數(shù)據(jù)信息,基于補充采集相關(guān)語料的基礎(chǔ)上進行統(tǒng)一開發(fā)應(yīng)用的條件業(yè)已成熟。
另外,從發(fā)音合作人遴選過程中透露的語言資源保持類型的差異給我們提供了少數(shù)民族語言資源進行開發(fā)應(yīng)用的重要依據(jù)。我們將各調(diào)研點發(fā)音合作人遴選的具體情況和各類語言資源的情況綜合分析如下:A類語言因人口數(shù)量較大,普遍具有悠久的傳統(tǒng)文字或新創(chuàng)文字,積累了大量的歷史文獻,有較早的母語教育史或雙語教育體系,加之國家長期的推進和整體的建設(shè),其本體規(guī)范化程度已達到很高的水平。B類語言多為新創(chuàng)文字語言,部分因其內(nèi)部方言或土語差異較大,各語言間規(guī)范化程度不一,無法對同一種語言甚至不同方言實施統(tǒng)一的開發(fā)應(yīng)用方案。C類包括大部分人口較少民族的語言,因人口數(shù)量少、居住分散、多數(shù)沒有文字等多種原因,尤其是內(nèi)部民族內(nèi)部母語實際使用人數(shù)較少,各語言保護及本體化程度差強人意,有一定母語資源開發(fā)應(yīng)用的潛力及空間,但需考慮人口居住分散等情況應(yīng)實施先保護、后開發(fā)應(yīng)用的方案。D類和E類包括了所有瀕危語言,因普遍處于嚴重的衰變狀態(tài),當務(wù)之急是語言資源的搶救性保護。從以上相關(guān)數(shù)據(jù)和材料來推斷,A類語言資源具備深度開發(fā)應(yīng)用的基本條件,且極具產(chǎn)業(yè)化的潛力。B類語言資源中有一部分也具有深度開發(fā)應(yīng)用的條件,但可能還存在不足,如方言間需進一步深度規(guī)范化。另一部分語言則需要解決方言間無法溝通交流的問題后實施不同的開發(fā)應(yīng)用方案。C類語言資源開發(fā)基礎(chǔ)較為薄弱,還需要繼續(xù)打造和夯實基礎(chǔ)之后再將開發(fā)應(yīng)用的問題提到議事日程上。對此類中有文字的數(shù)種語言則可以采取邊積累邊開發(fā)的辦法。D、E類語言資源則亟待深度典藏性保護。由此,我們認為,在中國少數(shù)民族資源的統(tǒng)一開發(fā)的基礎(chǔ)上,針對不同語言資源保持類型的少數(shù)民族語言的開發(fā)應(yīng)用還應(yīng)同時實施分類梯次開發(fā)方案。
二、關(guān)于整體統(tǒng)一開發(fā)應(yīng)用的問題
(一)大數(shù)據(jù)研發(fā)及應(yīng)用
語保工程民語語料資源具有大數(shù)據(jù)研究的多元可比性、應(yīng)用開發(fā)性、可持續(xù)性(丁石慶2018),這將成為少數(shù)民族語言資源開發(fā)應(yīng)用最核心的,也是極具潛力的挖掘重點。雖然目前的語料資源在大數(shù)據(jù)的學術(shù)研究方面還存在一定的局限性,如縱向性的歷史比較對比方面條件還不甚成熟,但橫向的共時比較或?qū)Ρ妊芯窟€是有很大空間的。如1200條通用詞可開展同語系的詞匯比較研究或不同語系間的對比研究;以語族為單位的1800條擴展詞加上1200條通用詞共計3000條詞匯可為同語族少數(shù)民族語言之間的初步比較研究提供可能。此外,經(jīng)過擴展后的語料資源也可為在線詞典、在線教材、語言地圖集的編制提供基礎(chǔ)。經(jīng)長期建設(shè)的語保工程民語語料資源還可持續(xù)地為語言學及相關(guān)專業(yè)的本科生、碩士生、博士生撰寫學位論文提供選題,并同時為少數(shù)民族語言資源的深度開發(fā)和應(yīng)用貢獻力量。
中國少數(shù)民族語言的識別和方言、土語的劃分等雖然經(jīng)過近百年數(shù)代人的努力,取得了目前的成就,但仍存在一些遺留問題,甚至還因語言的系屬定位、語言身份定性等方面在國內(nèi)外語言學界始終存在著較大分歧(孫宏開2005,2013;黃行2018)。少數(shù)民族語言資源的深度開發(fā)應(yīng)用將為此提供大數(shù)據(jù)支持,也將有極大的可能通過大量有力的佐證而達成國內(nèi)外語言學界的共識。極具特殊的學術(shù)研究價值的混合語一直也是國內(nèi)外語言學界長期爭論的焦點,主要涉及其概念、性質(zhì)、特征等內(nèi)容。民語語料資源中的6種混合語樣本將為此提供個案及對比樣本,也將為學界進行充分甄別、定性、定位等研究提供相關(guān)數(shù)據(jù)和語料支持。
(二)智能化軟件與文創(chuàng)產(chǎn)品研發(fā)及應(yīng)用
少數(shù)民族語言資源的開發(fā)應(yīng)用是一項極其繁重的工作,僅語料的標音、翻譯、標注等工作,就需要耗費大量時間、精力。由于語保工程一期相關(guān)軟件開發(fā)應(yīng)用的滯后,許多語保人在模板整理的工作中耗費了大量時間和精力,苦不堪言。雖然目前情況有很大改善,但某些軟件仍存在各種不太適合民語語料資源的整理和開發(fā)應(yīng)用的問題,還需進行改進和磨合。因此,語保工程尤其是“后語保”時期,少數(shù)民族語言資源的保護及開發(fā)應(yīng)用迫切需要相關(guān)的各種軟件,以節(jié)省大量的人力與時間。
簡言之,語言資源的開發(fā)利用應(yīng)“與時俱進”地共享現(xiàn)代科技和互聯(lián)網(wǎng)經(jīng)濟帶來的各種便利條件和先進手段,如通過各種新媒體形式、網(wǎng)絡(luò)、手機APP應(yīng)用軟件等助力語言資源的開發(fā)利用。編撰各種音像同步,圖文聲并茂的教材、數(shù)字詞典、APP詞典等,詞典也應(yīng)努力開發(fā)為多種語言對照,并附上音頻或視頻例句,也可在新媒體平臺上將目標語言的數(shù)字化信息及音視頻資料予以開放,為需求方提供各種服務(wù)。構(gòu)建內(nèi)容涵蓋民族學、人類學、語言學、宗教學、教育學、文化學、旅游學等多行業(yè)的領(lǐng)域知識圖譜,實現(xiàn)多領(lǐng)域多學科知識的多維度關(guān)聯(lián)與信息共享,滿足相關(guān)領(lǐng)域的不同需求。開展諸如自然語言理解、人工智能、智慧系統(tǒng)建設(shè)等特定語言服務(wù)產(chǎn)品的研發(fā),其成果也將反哺少數(shù)民族語言資源的開發(fā)應(yīng)用事業(yè)。
另外,中國少數(shù)民族語言資源復(fù)雜多樣的特征決定了少數(shù)民族語言資源開發(fā)后的應(yīng)用也具有多元性。其中,少數(shù)民族語言資源開發(fā)應(yīng)用的語言服務(wù)領(lǐng)域十分廣闊,也極具發(fā)展前景,同時兼具社會效益與經(jīng)濟效益,最易形成語言產(chǎn)業(yè)。而最具潛力的是民族語言資源的翻譯,這也是目前在開發(fā)上取得初步規(guī)模并在應(yīng)用上已初見成效的一個領(lǐng)域。此外,面向國家和社會安全領(lǐng)域,國家安全需求的公安刑偵語言系統(tǒng)、語言特征鑒別系統(tǒng)的少數(shù)民族語言資源的應(yīng)用也具有極大空間,并將在維護國家和社會安全等方面做出應(yīng)有的貢獻。
少數(shù)民族語言資源的開發(fā)應(yīng)用還可為國家民族語文政策、中國語言國情、國家語言安全等多個領(lǐng)域提供咨詢服務(wù)。如對近年來國家的語言政策發(fā)生的變化予以大力宣傳和科學解讀,尤其是通用語與少數(shù)民族的關(guān)系問題和民族地區(qū)的雙語教育問題等,亟待基于少數(shù)民族語言資源保護及開發(fā)應(yīng)用的成果提供更多的科學依據(jù)。
三、關(guān)于分類開發(fā)應(yīng)用的問題
(一) A類語言
語言翻譯層面上的開發(fā)應(yīng)用在A類及部分B類少數(shù)民族語言資源中可謂獨占鰲頭。尤其是數(shù)種具有傳統(tǒng)通用文字的民族語言,因已有雄厚的資源積累及開發(fā)基礎(chǔ),極具廣闊的深度開發(fā)應(yīng)用前景。其中,“中國民族語文翻譯局(中心)”作為國家級民族語文翻譯機構(gòu),一直致力于民族語文軟件的研發(fā)與推廣應(yīng)用工作,已陸續(xù)完成了蒙古文、藏文、維吾爾文、哈薩克文、朝鮮文、彝文、壯文(新創(chuàng)文字)等7種民族語文電子詞典及輔助翻譯軟件。目前,蒙古、藏、維吾爾、哈薩克、朝鮮、彝、傣、壯等數(shù)種具有文字傳統(tǒng)的民族語言資源已經(jīng)在標準化、規(guī)范化、信息化等“三化”方面取得了較好的業(yè)績,并在翻譯、編輯、出版等方面積累了大量的資源,有的已經(jīng)出現(xiàn)了大量相關(guān)的語言資源衍生品。民族語文智能翻譯,特別是智能語音翻譯的深入研發(fā),也已列入“十三五”期間國家語言文字工作、民族工作、信息化工作的重點內(nèi)容。近期,已有蒙古、藏、維吾爾、哈薩克、朝鮮、彝、壯等7種民族語文近40款機器翻譯軟件相繼研發(fā)成功并推廣應(yīng)用,受到社會各界廣泛好評(江白2018)。近期,中國民族語文翻譯中心與內(nèi)蒙古蒙科立蒙古文化股份有限公司舉行了戰(zhàn)略合作簽約儀式,蒙古語文人工智能技術(shù)也已經(jīng)提到議事日程上來。其中涉及蒙古語文人工智能技術(shù)合作及產(chǎn)品研制推廣等相關(guān)內(nèi)容。語言翻譯的產(chǎn)業(yè)化過程也將帶動諸如民族語言教育、民族語言出版、民族語言測試等領(lǐng)域資源的開發(fā)和應(yīng)用。
(二) B類語言
B類語言中包括部分人口數(shù)量較多的民族,也包括了部分人口數(shù)量不多但有新創(chuàng)文字的民族,如布依族、苗族、侗族、哈尼族、傈僳族等使用的是中華人民共和國成立后新創(chuàng)制的拉丁字母文字。另外,因考慮到某些語言的內(nèi)部方言甚至土語間分歧較大,根據(jù)不同的語言的情況還創(chuàng)制了多種文字,如苗族有黔東苗文、湘西苗文、川黔滇苗文、滇東北苗文共4種文字。新創(chuàng)文字為上述民族的語言資源傳承和保護起到了重要作用。但鑒于上述情況,該類語言適宜以不同方言為單位實施個性化開發(fā)應(yīng)用方案。
(三) C類語言
此類語言中,包括了部分有傳統(tǒng)文字的民族,如柯爾克孜族、錫伯族、俄羅斯族;也包括部分擁有新創(chuàng)文字的民族,如土族、景頗族。也有部分不屬于人口較少民族的東鄉(xiāng)族、仡佬族、拉祜族、佤族、水族、納西族等。這幾個民族的人口數(shù)量在31萬至70萬之間,整體仍顯人口偏少。其語言因使用人口較少,大多數(shù)都主要在家庭語言環(huán)境中使用,缺少社區(qū)這樣的語言強化群體氛圍,導(dǎo)致傳承進程中出現(xiàn)各種缺失或磨蝕現(xiàn)象。母語個體僅在家庭環(huán)境中熏陶和成長,可能會獲得并鞏固其母語能力,但從語言能力發(fā)展來說還需要一個重要環(huán)節(jié),就是母語能力的強化過程。母語的強化有多種途徑,包括社區(qū)母語環(huán)境、母語的書面形式——文字、學校母語文教育、使用母語的各種媒體形式等。就個體成長的單一的家庭母語環(huán)境來說,社區(qū)環(huán)境無疑是母語個體更大的語言操練課堂。在這個更大的母語環(huán)境中,母語個體的口語能力會得到進一步的實質(zhì)性提升和拓展。一般來說,享有一定社會地位且母語個體數(shù)量占優(yōu)勢的社區(qū)環(huán)境里,母語的使用密度相對較大,使用頻度也高。這樣,無形中就營造了一個良好的社區(qū)母語環(huán)境,個體在家庭氛圍內(nèi)獲得的母語在更大的語言交往環(huán)境中得到了進一步鞏固和強化。
(四) D、E類語言
這兩類語言中除了人口數(shù)量較多但趨于衰亡的滿族和土家族這兩種語言外,絕大多數(shù)是5萬以下的人口較少民族,除俄羅斯族以外均無文字,總數(shù)上超過了30種。整體特征表現(xiàn)為母語使用人口稀少,絕大多數(shù)母語人普遍年齡老化,家庭和社區(qū)母語環(huán)境缺失而導(dǎo)致代際傳承出現(xiàn)嚴重危機。這兩類語言的當務(wù)之急是搶救性保護現(xiàn)存的活態(tài)語料,并加速完成語言文化典藏的語料采集和瀕危語言志的撰寫任務(wù)。
四、結(jié) 語
(一)語保工程一期民語調(diào)研專項任務(wù)所獲巨量少數(shù)民族語料資源數(shù)據(jù),反映了中國少數(shù)民族語言資源的分布上以漢藏語系和阿爾泰語系語言為主,從各調(diào)研點發(fā)音合作人遴選過程中透露的信息體現(xiàn)了不同類別的語言間語言資源保持類型上存在著顯著差異,這些數(shù)據(jù)及相關(guān)信息為我們進行后續(xù)工作推進提供了可靠信息和科學依據(jù)。
(二)基于相關(guān)調(diào)研數(shù)據(jù)所提供的信息,并根據(jù)實際情況,中國少數(shù)民族語言資源的開發(fā)應(yīng)用可采用整體統(tǒng)一開發(fā)和分類開發(fā)兩種思路。統(tǒng)一開發(fā)主要聚焦于大數(shù)據(jù)研發(fā)及服務(wù)、智能化軟件及文創(chuàng)產(chǎn)品的研發(fā)應(yīng)用等方面。分類開發(fā)則應(yīng)著眼于語言資源保持類型的不同特點,實施深度開發(fā)應(yīng)用、深度規(guī)范性的開發(fā)應(yīng)用、深度保護性開發(fā)應(yīng)用及深度典藏性開發(fā)應(yīng)用等。
(三)中國少數(shù)民族語言資源的開發(fā)應(yīng)用的長遠規(guī)劃和具體實施方案必須秉持實事求是的態(tài)度,依據(jù)相關(guān)數(shù)據(jù)和信息,力求做到精準、科學、可行,避免一刀切或削足適履的做法。
(四)語言資源開發(fā)應(yīng)用是一個系統(tǒng)工程,也是一項長期的人文關(guān)懷工程。需要參與各方秉持工匠精神,擁有人文情懷,齊心協(xié)力,同舟共濟。在夯實語言資源保護與開發(fā)應(yīng)用基礎(chǔ)之上,統(tǒng)一認識,更新理念,整合資源,科學規(guī)劃,積極探索可持續(xù)發(fā)展的新路徑。
參考文獻
戴慶廈 1993 《跨境語言研究》,北京:中央民族學院出版社。
丁石慶 2018 《中國語言資源保護工程民語語料資源的質(zhì)量、價值和效用——以少數(shù)民族語言為例》,《暨南學報》第5期。
黃 行 2018 《中國民族語言識別:分歧及成因》,《語言戰(zhàn)略研究》第2期。
黃 行,許 峰 2013 《我國與周邊國家跨境語言的基本情況與問題》,《中國語情》第3期。
江 白 2018 《中國民族語文翻譯局藏文智能翻譯軟件發(fā)布會在成都舉行》,http://www.tibet.cn/cn/news/yc/201806/t20180606_5916359.html。
孫宏開 2005 《用科學的眼光看待我國的語言識別問題》,《語言文字應(yīng)用》第3期。
孫宏開 2013 《關(guān)于語言身份的識別問題》,《語言科學》第5期。
周慶生 2013 《中國跨境少數(shù)民族語言類型及人口狀況》,《中國語情》第3期。
朱艷華 2016 《論跨境語言資源保護》,《貴州民族研究》第3期。
責任編輯:魏曉明