提 要 語言資源概念的提出有40多年的時(shí)間。20世紀(jì)80年代,澳大利亞曾依照語言資源理念制定了《國(guó)家語言政策》。中國(guó)在21世紀(jì)初開始在語言規(guī)劃中實(shí)踐語言資源理念,建立了國(guó)家語言資源監(jiān)測(cè)與研究中心,相繼開展了中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè)和中國(guó)語言資源保護(hù)工程,并與聯(lián)合國(guó)教科文組織聯(lián)合召開了“世界語言資源保護(hù)大會(huì)”,發(fā)布了《岳麓宣言》,成為世界上提倡語言資源理念、開展語言保護(hù)最為突出的國(guó)家。中國(guó)語言資源研究在語言規(guī)劃的實(shí)踐推動(dòng)下展開,且與語言規(guī)劃實(shí)踐形成良性互動(dòng)。語言資源研究從論證語言的資源性質(zhì)到劃分語言資源的類型,再發(fā)展到對(duì)語言資源功能的認(rèn)識(shí)。本文較為詳細(xì)地論述了語言資源的認(rèn)識(shí)史、中國(guó)有關(guān)語言資源的實(shí)踐和研究,并嘗試把語言資源分為口頭語言資源、書面語言資源和語言衍生資源(語言知識(shí)、語言技術(shù)、語言藝術(shù)、語言人才等)三類,分析了語言保護(hù)、語言信息處理和語言學(xué)習(xí)等語言資源的三大功能域,還提出了“語言知識(shí)觀”,即語言不僅是一個(gè)符號(hào)系統(tǒng),更是一個(gè)貯存人類語言知識(shí)體系及文化體系的知識(shí)庫(kù)。依照“語言知識(shí)觀”建設(shè)語言資源,才能滿足語言保護(hù)和機(jī)器語言學(xué)習(xí)、人類語言學(xué)習(xí)的資源需要。
關(guān)鍵詞 語言規(guī)劃;語言資源;類型;功能;語言知識(shí)觀
中圖分類號(hào) H002 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-1014(2019)03-0016-13
Abstract Forty years have passed since the concept of language resources was advanced. In the 1980s, Australia formulated the National Language Policy based on this concept. Since the beginning of the 21st century, China has started to put this concept into practice. National Language Resources Monitoring and Research Center was established, and projects such as the Chinese Language Audio Database Resources and the National Project of Chinese Language Resource Preservation carried out. In cooperation with the UNESCO, China successfully held International Conference on Role of Linguistic Diversity in Building a Global Community with Shared Future and Yuelu Proclamation was adopted. China is outstanding for advocating the concept of language resources and implementing language protection. Research on Chinas language resources is carried out on the bases of the practices of language planning. The focus of research has moved from the nature of language as resources and their classification to the understanding of the functions of language resources. This article offers a detailed historical survey of the theories and practices of Chinas language resources. It classifies language resources into three kinds: oral, written, and derivative resources, and analyzes three functional domains of language resources: language reservation, language information processing and language learning. In addition, this paper proposes the view of language knowledge and regards language as not only a semiotic system, but also a bank for storing human language knowledge system and cultural system.
Key words language planning; language resources; types; functions; the view of language knowledge
中國(guó)有100多種語言,漢語的方言燦若星空,漢語文獻(xiàn)有數(shù)千年積累,汗牛充棟,是世界上語言資源十分豐富的國(guó)度。同時(shí),語言信息處理的重要基礎(chǔ)是語言數(shù)據(jù)庫(kù),中國(guó)的語言信息處理事業(yè)發(fā)展一直在努力追趕世界先進(jìn)水平,有些技術(shù)及應(yīng)用已經(jīng)處在世界第一方陣,這也促使中國(guó)學(xué)人能夠從信息化的時(shí)代高度來認(rèn)識(shí)語言資源。中國(guó)在歷史上也比較重視對(duì)語言資源的保護(hù)和開發(fā)利用,如漢靈帝熹平年間的“熹平石經(jīng)”、三國(guó)時(shí)魏齊王正始年間的“三體石經(jīng)”,是通過勒石立碑來保護(hù)、展示經(jīng)書和文字的范本,歷代的韻書、字典就更是直接的語言資源保護(hù)產(chǎn)品。中國(guó)傳統(tǒng)重視書面語,對(duì)于經(jīng)典和文字的敬重保護(hù)做得十分到位;但對(duì)于口語相對(duì)輕視,歷代口語資源的記錄保護(hù)工作做得不好,雖然也有漢代揚(yáng)雄的《方言》,歷代的方志中也多有詞語俗諺的內(nèi)容。中國(guó)歷史上的語言資源意識(shí)及其保護(hù)利用等,有許多經(jīng)驗(yàn)值得總結(jié)和繼承。
但是,真正理性地認(rèn)識(shí)到語言的資源意義,特別是把語言資源作為國(guó)家語言規(guī)劃的重要理念,并在國(guó)家層面、在全國(guó)范圍采取語言資源保護(hù)行動(dòng),還是近十幾年來的事情。語言作為社會(huì)資源,也是近些年來才得到社會(huì)的認(rèn)可和重視的。
一、語言是資源
認(rèn)識(shí)語言的資源性質(zhì),十分不易,語言必然不如煤炭、石油、電力、水力那樣直接作用于人類的物質(zhì)生活。這也是符合人類的資源認(rèn)識(shí)規(guī)律的。
(一)資源的認(rèn)知路徑:由自然資源到社會(huì)資源
資源是人類生產(chǎn)、生活所憑借的資料。某種資料能否成為社會(huì)認(rèn)可的資源,取決于兩個(gè)條件:
第一,資源的“有用性”。
科學(xué)技術(shù)的發(fā)展可以將過去不能使用的資料用于生產(chǎn)和生活,將不能這樣或那樣使用的資料這樣地或那樣地用于生產(chǎn)和生活。比如,電和石油,古來存在,但是人類的科學(xué)技術(shù)發(fā)展到可以把電、石油作為能源的時(shí)代,電和石油才成為人類的資源。如此說來,資源與科技進(jìn)步密切相關(guān)。我們既要全面認(rèn)識(shí)、充分利用現(xiàn)代科技狀態(tài)下的“可用資源”,也要對(duì)那些隨著科技發(fā)展將來能用的“潛在資源”保持關(guān)注,特別是要對(duì)前沿科技所可能產(chǎn)生的資源效益密切關(guān)注,從而使資源建設(shè)具有預(yù)見性。
第二,資源“有用性”的被認(rèn)識(shí)。
有些資料本來是生產(chǎn)生活所憑借的、不可或缺的,但是由于某種原因,人們沒有認(rèn)識(shí)到它的資源性質(zhì),或者忽視了它的資源性質(zhì)。例如當(dāng)霧霾不嚴(yán)重時(shí),人們認(rèn)識(shí)不到清新空氣的資源性質(zhì);當(dāng)污染不嚴(yán)重時(shí),人們認(rèn)識(shí)不到清潔水的資源性質(zhì)。如此說來,資源有“被認(rèn)識(shí)資源”和“未被認(rèn)識(shí)資源”。我們要特別關(guān)注那些“未被認(rèn)識(shí)資源”,包括已在我們的生產(chǎn)生活中使用的“可用資源”,也包括將來可能會(huì)進(jìn)入我們生產(chǎn)生活的“潛在資源”。
資源的“有用性”能否被認(rèn)識(shí),可從四方面來看:第一,社會(huì)有無科學(xué)的資源觀,作為一門學(xué)科的資源科學(xué)是否發(fā)達(dá);第二,對(duì)某種資源與人類關(guān)系的研究達(dá)到何種水平;第三,對(duì)科技的敏感性;第四,稀缺性。最易被社會(huì)感知到的資源是稀缺資源,有用而稀缺的資源,必然會(huì)具有昂貴的價(jià)格,因此,“稀缺性”也幾乎成為資源的一種附加屬性。
資源有自然資源和社會(huì)資源兩大類。在人類的資源意識(shí)中,首先被認(rèn)識(shí)的是自然資源,然后是社會(huì)資源?!冬F(xiàn)代漢語詞典》是反映“公民常識(shí)”的詞典,從第1版到第6版,對(duì)“資源”詞條的解釋,一直強(qiáng)調(diào)是生產(chǎn)資料和生活資料的“天然來源”,所舉的例子共涉及“地下資源”“水力資源”“人力資源”“旅游資源”等4種。2016年第7版對(duì)“資源”的解釋有了較大發(fā)展:
【資源】生產(chǎn)資料或生活資料的來源,包括自然資源和社會(huì)資源:地下~|水力~|旅游~|人力~|信息~。(第1732頁(yè))
第7版的釋義,不再?gòu)?qiáng)調(diào)資源的“天然性”,明確把資源分為自然資源和社會(huì)資源,舉例中增加了“信息資源”,這些都是信息時(shí)代新資源意識(shí)的反映。
《辭海》是一部帶有百科性質(zhì)的工具書,第1版到第4版都把“資源”解釋為“資財(cái)?shù)膩碓?。一般指天然的?cái)源”,顯然其對(duì)“資源”的認(rèn)識(shí)比同時(shí)的《現(xiàn)代漢語詞典》還狹窄。到1999年第5版,《辭?!窞椤百Y源”增加了一個(gè)新義項(xiàng):
一國(guó)或一定地區(qū)內(nèi)擁有的物力、財(cái)力、人力等物質(zhì)要素的總稱。分為自然資源和社會(huì)資源兩大類。前者如陽(yáng)光、空氣、水、土地、森林、草原、動(dòng)物、礦藏等;后者包括人力資源、信息資源以及勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富。(第3881頁(yè))
這個(gè)認(rèn)識(shí)應(yīng)該說已比較到位,不僅不再?gòu)?qiáng)調(diào)資源的“天然性”,不僅把資源分為自然資源和社會(huì)資源,而且認(rèn)為社會(huì)資源包括“勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富”。當(dāng)然,如果更進(jìn)一步看,社會(huì)資源不僅包括“勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富”,也許還應(yīng)包括“勞動(dòng)創(chuàng)造的精神財(cái)富”。
(二)語言資源意識(shí)的建立
回看《現(xiàn)代漢語詞典》和《辭海》關(guān)于資源的定義,會(huì)發(fā)現(xiàn)它們?cè)谂e例中都沒有提及“語言資源”。這不大可能是因?yàn)榕e例的緣故而沒有列出語言資源,而更可能是當(dāng)時(shí)的社會(huì)和辭書編纂者還沒有認(rèn)識(shí)到語言的資源性質(zhì)。
人類對(duì)語言資源的認(rèn)識(shí)也的確是比較晚近的事情。國(guó)外語言規(guī)劃學(xué)界也有提及語言資源問題的,但其研究并不系統(tǒng)。費(fèi)什曼(1973)開始提及“語言資源”:“語言跟農(nóng)業(yè)、工業(yè)、勞力、水電等資源不同……顯然只是從其具有價(jià)值的意義上講,語言才是一種資源。……無論怎么說,語言都是一種特殊資源,很難用現(xiàn)有的成本-效益理論來管理。原因是我們很難對(duì)語言進(jìn)行度量,也很難把它同其他資源分割開來。然而,我們?nèi)杂凶銐虻睦碛商接懻Z言與其他資源以及資源規(guī)劃之間的異同?!保ㄒ娭軕c生,2001:422~423)
王輝(2007)指出,Ruiz于1984年曾提出影響語言規(guī)劃的3種取向:語言作為問題、語言作為權(quán)利、語言作為資源。語言資源取向可以緩解前兩種取向帶來的語言沖突,有助于重新樹立人們對(duì)語言和語言群體的態(tài)度。語言是一種需要管理、發(fā)展和保護(hù)的資源,雙語和多語能力是語言資源,少數(shù)族群的語言是一種專門的重要資源。Kaplan(1997)、Grin(2003)把語言看作重要的“人力資源”,看作重要的“人力資本”,語言規(guī)劃應(yīng)是國(guó)家規(guī)劃的一個(gè)方面。
在國(guó)家語言規(guī)劃實(shí)踐上,澳大利亞在20世紀(jì)70年代至80年代末,提倡文化多元政策,在《Grassby報(bào)告》(Grassby Report,1973)、《Galbally報(bào)告》(Galbally Report,1978)、《邁向國(guó)家語言政策報(bào)告》(Towards a National Language Policy,1982)、《一項(xiàng)國(guó)家語言政策》(A National Language Policy,1984)等“四報(bào)告”基礎(chǔ)上,1987年出臺(tái)了《國(guó)家語言政策》(National Policy on Languages)?!秶?guó)家語言政策》提出了指導(dǎo)澳大利亞語言政策的4條戰(zhàn)略:第一,保護(hù)澳大利亞的語言資源;第二,開發(fā)、擴(kuò)展這些語言資源;第三,將澳大利亞語言教學(xué)與語言使用的舉措同國(guó)家經(jīng)濟(jì)、社會(huì)與文化政策結(jié)合起來;第四,用客戶能理解的語言提供信息和服務(wù)。這是將語言資源理念變?yōu)閲?guó)家語言政策的不多案例。不過令人遺憾的是,進(jìn)入20世紀(jì)90年代,隨著《綠皮書》(1990)、《白皮書》(1991)的出臺(tái),澳大利亞的語言政策衍變?yōu)橛⒄Z讀寫能力優(yōu)先,這相對(duì)削弱了語言資源在語言政策中的比重。
中國(guó)最早使用“語言資源”概念是在20世紀(jì)80年代。邱質(zhì)樸(1981)從信息化、語言教學(xué)、語言規(guī)劃等角度討論語言資源的開發(fā)問題,尤為關(guān)注“語言工程”和漢語國(guó)際傳播這兩個(gè)領(lǐng)域的語言資源開發(fā)問題?!墩Z文建設(shè)》1988年發(fā)表了樓必安可(Lo Bianco)的《澳大利亞的國(guó)家語言政策》。樓必安可是澳大利亞著名的語言規(guī)劃學(xué)家,是澳大利亞《國(guó)家語言政策》(1987)的撰稿人?!墩Z文建設(shè)》發(fā)表的樓必安可(1988:55~57)的這篇文章,是《國(guó)家語言政策》(1987)的摘要,雖然是摘要,但對(duì)于澳大利亞語言資源理念及相關(guān)措施的介紹已經(jīng)較為詳細(xì),如:“但仍有許多人的母語卻是英語以外的其他語言。這是很寶貴的語言資源,充分利用這些語言資源有很重要的意義。”“國(guó)家語言政策的主要目標(biāo)就是使澳大利亞因能善加利用豐富的語言資源而獲最大利益?!薄翱偠灾?,只有細(xì)致周密的計(jì)劃才能收到利用澳大利亞語言資源的最大效果?!薄罢Z言資源的計(jì)劃需要各級(jí)政府……的合作和協(xié)調(diào)。”
20世紀(jì)90年代,邱質(zhì)樸、樓必安可的語言資源概念似乎并沒有在語言學(xué)界產(chǎn)生反響,只有陶原珂(1996)提出要注意開發(fā)利用澳門社會(huì)的語言資源,邱質(zhì)樸(2000)再次申明他1981年的觀點(diǎn),張政飚(2000)例舉西部方言在語言研究中的價(jià)值。不過據(jù)王世凱(2009:25~28)研究,中國(guó)文學(xué)界倒是在討論如何發(fā)掘、利用語言資源(舊白話、方言、民間語言等)搞好創(chuàng)作的問題,討論西方語言資源與中國(guó)文學(xué)創(chuàng)作的關(guān)系。在中國(guó),語言與文學(xué)雖然同在一個(gè)“語言文學(xué)”學(xué)科里,有“中國(guó)語言文學(xué)”和“外國(guó)語言文學(xué)”兩個(gè)一級(jí)學(xué)科,但是語言與文學(xué)之間卻很少發(fā)生學(xué)術(shù)互動(dòng),仿佛是“雞犬之聲相聞,老死不相往來”。在語言資源等問題上,直到今天,語言、文學(xué)兩家也沒有對(duì)話。
進(jìn)入21世紀(jì),語言資源的討論逐漸增多,語言資源意識(shí)開始在中國(guó)建立。2004年前后,張普教授常與李宇明、王鐵琨等教育部語言文字信息管理司的同人討論語言資源問題。大家認(rèn)識(shí)到:語言是資源;語言資源是信息社會(huì)最重要的資源,是與礦產(chǎn)資源、土地資源、海洋資源、水資源、森林資源一樣的國(guó)家資源,國(guó)家應(yīng)當(dāng)對(duì)語言資源立法管理,進(jìn)行監(jiān)測(cè)、保護(hù)和開發(fā)利用。這些討論的學(xué)術(shù)成果反映在張普的重要論文《論國(guó)家語言資源》(2007),其實(shí)踐成果就是國(guó)家語委組建“國(guó)家語言資源監(jiān)測(cè)與研究中心”。國(guó)家語言資源監(jiān)測(cè)與研究中心2004年6月正式掛牌,并逐漸建立了平面媒體(北京語言大學(xué))、有聲媒體(中國(guó)傳媒大學(xué))、網(wǎng)絡(luò)媒體(華中師范大學(xué))、民族語言(中央民族大學(xué))、教育教材(廈門大學(xué))、海外華語(暨南大學(xué))等6個(gè)分中心和中國(guó)語言資源開發(fā)應(yīng)用中心(商務(wù)印書館)。
2005年7月,教育部、國(guó)家語委在烏魯木齊市召開“民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作會(huì)議”,時(shí)任國(guó)家語委主任袁貴仁做了《樹立科學(xué)發(fā)展觀,開創(chuàng)民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作的新局面》的書面講話,提出要“保護(hù)文化多樣性,開發(fā)民族語言資源”,認(rèn)為“語言資源是重要的信息資源和文化資源”。國(guó)家語言資源監(jiān)測(cè)與研究中心的建立,國(guó)家語委主任袁貴仁的這一講話,標(biāo)志著中國(guó)的語言資源意識(shí)逐漸明晰,語言資源理念在國(guó)家語言規(guī)劃中得到確立。
二、中國(guó)有關(guān)語言資源的實(shí)踐活動(dòng)
中國(guó)的語言資源理念及其學(xué)術(shù)發(fā)展,是由語言規(guī)劃的實(shí)踐帶動(dòng)的。了解21世紀(jì)中國(guó)有關(guān)語言資源的實(shí)踐活動(dòng),可以從一個(gè)側(cè)面更好地了解中國(guó)的語言規(guī)劃,也可以更好地了解中國(guó)的語言資源研究。
(一)國(guó)家語言資源監(jiān)測(cè)與研究中心
國(guó)家語言資源監(jiān)測(cè)與研究中心的工作,是通過它的分中心完成的。各分中心依照共同的理念和技術(shù)規(guī)范,采錄、經(jīng)營(yíng)著“平面媒體、有聲媒體、網(wǎng)絡(luò)媒體、民族語言、教育教材、海外華語”的語料庫(kù)。采錄、維護(hù)這些語料庫(kù)就是對(duì)語言資源的保存。中心還通過語料庫(kù)發(fā)現(xiàn)語言使用特點(diǎn)、新的語言現(xiàn)象和一些重要的“實(shí)態(tài)”統(tǒng)計(jì)數(shù)據(jù),比如每年的漢字使用頻率、詞匯使用頻率、新詞語、流行語、網(wǎng)絡(luò)語言狀況等,許多數(shù)據(jù)常通過教育部新聞發(fā)布會(huì)和“漢語盤點(diǎn)”活動(dòng)向社會(huì)發(fā)布,并成為每年的《中國(guó)語言生活狀況報(bào)告》(綠皮書)的重要篇章。這些數(shù)據(jù)對(duì)于《通用規(guī)范漢字表》的研制、中小學(xué)語文課標(biāo)和漢語國(guó)際教育有關(guān)標(biāo)準(zhǔn)的制定、語文教材的編寫等,都發(fā)揮了一定作用。
2007年9月,語信司與北京語言大學(xué)共同主辦了“國(guó)家語言資源與應(yīng)用語言學(xué)”的高峰論壇,這也是國(guó)家語言資源監(jiān)測(cè)與研究中心的幾個(gè)分中心共同邀請(qǐng)國(guó)內(nèi)外學(xué)者參加的學(xué)術(shù)會(huì)議。這是國(guó)內(nèi)首次召開的語言資源的大型學(xué)術(shù)會(huì)議,討論議題除“國(guó)家語言資源建設(shè)、監(jiān)測(cè)與研究”之外,還有國(guó)家語言資源與語言服務(wù)、語言規(guī)劃、語言文字規(guī)范、語言文字社會(huì)應(yīng)用、母語教學(xué)、國(guó)際漢語傳播、民族地區(qū)漢語教學(xué)、語言信息處理的關(guān)系,研究范圍比較廣泛。會(huì)議收到論文50篇,擇28篇結(jié)集為《中國(guó)語言資源論叢》,由商務(wù)印書館出版。這也是中國(guó)第一部討論語言資源問題的論文集,至今仍發(fā)揮著學(xué)術(shù)影響。
(二)中國(guó)語言資源有聲數(shù)據(jù)庫(kù)
2006年前后,不少學(xué)者認(rèn)為,要保護(hù)國(guó)家語言資源,就需要了解語言資源的國(guó)情,語言普查是了解語言資源國(guó)情的最好舉措。1956年,根據(jù)國(guó)務(wù)院指示進(jìn)行了漢語和少數(shù)民族語言調(diào)查。1999年,教育部等11部委聯(lián)合開展了中國(guó)語言文字使用情況調(diào)查。這兩次調(diào)查對(duì)于了解語言國(guó)情起了較大作用,但都沒有達(dá)到“語言普查”的水平,特別是沒有采錄語料,不能了解語言及方言的話語情況。這一時(shí)期,還有學(xué)者專門了解國(guó)際上某些國(guó)家語言普查的情況,著手設(shè)計(jì)我國(guó)語言普查的方案。
后與有關(guān)部門協(xié)商,被告知在全國(guó)進(jìn)行語言普查的時(shí)機(jī)尚不成熟,于是國(guó)家語委另辟蹊徑,組織課題組研究“中國(guó)語言資源有聲數(shù)據(jù)庫(kù)”的建設(shè)問題。名為“有聲數(shù)據(jù)庫(kù)”,就是要強(qiáng)調(diào)口語與音頻,強(qiáng)調(diào)數(shù)據(jù)庫(kù)技術(shù);嵌入“語言資源”四字,是要彰顯、傳播語言資源理念;將語言普查的一些內(nèi)容體現(xiàn)在調(diào)查項(xiàng)目中。
參加研究的專家主要有曹志耘、戴慶廈、郭龍生、何瑞、黃行、李如龍、劉丹青、潘悟云、喬全生、魏暉、謝俊英、徐大明、張振興等先生。中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè)領(lǐng)導(dǎo)小組辦公室,根據(jù)這些研究成果編寫了《中國(guó)語言資源有聲數(shù)據(jù)庫(kù)調(diào)查手冊(cè)》的漢語方言部分,曹志耘執(zhí)筆,顧黔、侯精一、劉俐李、孫茂松、汪平、楊爾弘、趙曉群先生等也參與了討論。這些研究成果反映在手冊(cè)中,也反映在李宇明的《論中國(guó)語言資源有聲數(shù)據(jù)庫(kù)的建設(shè)》(2010)論文中。
根據(jù)《中國(guó)語言資源有聲數(shù)據(jù)庫(kù)調(diào)查手冊(cè)》規(guī)定的管理規(guī)范和技術(shù)要求,2008年國(guó)家語委正式啟動(dòng)中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè)。先試點(diǎn),后鋪開,江蘇承擔(dān)了有聲數(shù)據(jù)庫(kù)建設(shè)的試點(diǎn)工作,歷時(shí)年余。2009年江蘇正式啟動(dòng)有聲數(shù)據(jù)庫(kù)建設(shè),之后上海、北京、遼寧、廣西、山東、河北、福建、湖北等地,也陸續(xù)開展調(diào)研、建庫(kù)工作。中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè),在學(xué)界和社會(huì)上普及了語言資源理念,培養(yǎng)了一支骨干隊(duì)伍,形成了一套管理規(guī)程和技術(shù)標(biāo)準(zhǔn),積累了一批語言資源數(shù)據(jù)。
(三)中國(guó)語言資源保護(hù)工程
在中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè)的基礎(chǔ)上,2015年,教育部、國(guó)家語委印發(fā)了《關(guān)于啟動(dòng)中國(guó)語言資源保護(hù)工程的通知》,開啟了中國(guó)乃至世界最宏大的語言保護(hù)工程(以下簡(jiǎn)稱語保工程)。到2018年底,語保工程在全國(guó)34個(gè)省域全面展開,參與高校和科研院所超過350所,參與專業(yè)人員達(dá)4500余名,進(jìn)行了1495個(gè)調(diào)查點(diǎn)的調(diào)查,所獲數(shù)據(jù)包括所有漢語方言和120多個(gè)語種。
語保工程在《中國(guó)語言資源有聲數(shù)據(jù)庫(kù)調(diào)查手冊(cè)》漢語方言部分的基礎(chǔ)上,制定了《中國(guó)語言資源調(diào)查手冊(cè)·漢語方言》,同時(shí)又制定了《中國(guó)語言資源調(diào)查手冊(cè)·民族語言》(按語族分冊(cè),共計(jì)8冊(cè))、《中國(guó)方言文化典藏調(diào)查手冊(cè)》等,設(shè)計(jì)了“語保攝錄機(jī)”“語保標(biāo)注軟件”等語言調(diào)查加工軟件,陸續(xù)推出“中國(guó)語言文化典藏”(20冊(cè))、“中國(guó)瀕危語言志”(30冊(cè),將于2019年底全部出版)等標(biāo)志性成果。
2018年9月,中國(guó)政府與聯(lián)合國(guó)教科文組織在長(zhǎng)沙聯(lián)合召開首屆“世界語言資源保護(hù)大會(huì)”。會(huì)上,聯(lián)合國(guó)教科文組織及各國(guó)政府、相關(guān)學(xué)術(shù)機(jī)構(gòu)代表和與會(huì)專家學(xué)者討論并通過了《保護(hù)和促進(jìn)世界語言多樣性 岳麓宣言(草案)》。會(huì)后,聯(lián)合國(guó)教科文組織按照程序廣泛征求意見并形成宣言最終文本,于2019年1月18日通過其官網(wǎng)正式公布。2019年2月21日,中國(guó)教育部、聯(lián)合國(guó)教科文組織駐華代表處、中國(guó)聯(lián)合國(guó)教科文組織全國(guó)委員會(huì)、中國(guó)國(guó)家語委在中國(guó)共同舉行發(fā)布會(huì),正式發(fā)布《岳麓宣言》。首屆“世界語言資源保護(hù)大會(huì)”能夠在長(zhǎng)沙召開,是因?yàn)橹袊?guó)語保工作得到了國(guó)際社會(huì)的認(rèn)可;《岳麓宣言》能夠制定,是得到了中國(guó)語言資源有聲數(shù)據(jù)庫(kù)和中國(guó)語保工程的理念及經(jīng)驗(yàn)的支撐。
(四)中文語言資源聯(lián)盟
大規(guī)模的語言資源是計(jì)算機(jī)進(jìn)行語言信息處理的基礎(chǔ)。根據(jù)徐波、孫茂松、靳光瑾(2003:218~224)的介紹,2003年,在“973計(jì)劃”的特別專項(xiàng)“中文語料庫(kù)建設(shè)”支持下,中國(guó)科學(xué)院自動(dòng)化所、清華大學(xué)、北京大學(xué)、中國(guó)科學(xué)院計(jì)算所、山西大學(xué)、上海交通大學(xué)、教育部語言文字應(yīng)用研究所等單位,共同承擔(dān)了“中文語言資源聯(lián)盟”(Chinese Linguistic Data Consortium,縮寫為CLDC)的首批資源建設(shè)。之后,中國(guó)中文信息學(xué)會(huì)專門成立“語言資源建設(shè)和管理工作委員會(huì)”,負(fù)責(zé)CLDC的資源建設(shè)及數(shù)據(jù)庫(kù)的運(yùn)行。
中文語言資源聯(lián)盟的建立,是借鑒美國(guó)“語言資源聯(lián)盟”(Linguistic Data Consortium,縮寫為L(zhǎng)DC)的經(jīng)驗(yàn),目的是共建共享中文資源、促進(jìn)語言信息處理的技術(shù)進(jìn)步。提供資源者計(jì)有36家。中文語言資源聯(lián)盟的成立與發(fā)展,是面向語言信息處理的語言資源匯聚實(shí)踐,是語言資源共建共享模式在中國(guó)的實(shí)踐,反映著語言信息化的科學(xué)需求。
(五)語言資源高精尖創(chuàng)新中心
2015年10月,“北京高等學(xué)校高精尖創(chuàng)新中心建設(shè)計(jì)劃”正式啟動(dòng)。2016年5月,北京語言大學(xué)語言資源高精尖創(chuàng)新中心成立。這是中國(guó)第一家以世界語言資源的收集整理、開發(fā)利用為目的的研究機(jī)構(gòu),其主要學(xué)術(shù)目標(biāo)是:讓全世界的語言(7000余種)都在中國(guó)有一份保有本,幫助機(jī)器理解人類語言。
語言資源高精尖創(chuàng)新中心重點(diǎn)收集A、B兩類語言資源:A類是面向語言庫(kù)藏和展示的語言資源,主要是自然語言資源;B類是面向語言智能的語言資源,包括各種生語料、經(jīng)過加工標(biāo)注的熟語料、語言知識(shí)、社會(huì)常識(shí)等。就A類語言資源來說,目前語言資源高精尖創(chuàng)新中心正在實(shí)施“第三圈”戰(zhàn)略,即在中國(guó)語言資源有聲數(shù)據(jù)庫(kù)和語保工程的基礎(chǔ)上,在中國(guó)基本完成了方言圈(第一圈)、民族語言圈(第二圈)語料采集的情況下,集中精力采集中國(guó)跨境語言和邊境語言(第三圈)語料。并期望在不久的將來,完成“一帶一路”60余國(guó)的200余種主要語言的采集。
除了以上介紹的5項(xiàng)重大語言資源實(shí)踐活動(dòng)之外,中國(guó)還有許多語言資源庫(kù)的建設(shè)項(xiàng)目。例如20世紀(jì)末侯精一先生主持的《現(xiàn)代漢語方言音庫(kù)》,收錄了40種現(xiàn)代漢語方言音檔,由上海教育出版社于1995~1999年出版。錢乃榮(1995)評(píng)價(jià)說:“現(xiàn)代漢語方言音庫(kù)的建立結(jié)束了我國(guó)漢語方言的出版物僅停留于書面描寫各地方言現(xiàn)象的歷史?!痹偃鐑?nèi)蒙古也建有蒙古語和鄂溫克語、鄂倫春語、達(dá)斡爾語的語言資源庫(kù)。例子難以一一枚舉,可以說時(shí)至今日,中國(guó)已經(jīng)成為世界上推進(jìn)語言資源建設(shè)的最重要的國(guó)度。
三、中國(guó)有關(guān)語言資源的學(xué)術(shù)研究
關(guān)于語言資源的學(xué)術(shù)研究,前面已有多處涉及。下面就幾個(gè)問題做些專門討論。
(一)語言規(guī)劃實(shí)踐與語言資源研究
知網(wǎng)是一個(gè)很好的科技文獻(xiàn)數(shù)據(jù)庫(kù),利用知網(wǎng)做文獻(xiàn)分析是當(dāng)前可選的一條路徑,盡管知網(wǎng)的文獻(xiàn)檢索也可能有缺陷,比如有些文獻(xiàn)未必被收錄,有些文獻(xiàn)因關(guān)鍵詞標(biāo)注也未必適合檢索。在知網(wǎng)中用“語言資源”作為主題和關(guān)鍵詞精確匹配檢索,截至2019年3月31日,檢索到文獻(xiàn)403篇,涉及作者370余人。從圖1看,1981年最早有文獻(xiàn)出現(xiàn),到2003年論文年發(fā)表量還在5篇以下,22年來總共發(fā)表論文只有17篇,這是學(xué)人較少涉足之地。2004年出現(xiàn)一個(gè)研究的小高峰,年發(fā)表論文達(dá)到7篇。2007年研究熱度明顯升高,年發(fā)表論文達(dá)到16篇;這一趨勢(shì)持續(xù)到2011年,年發(fā)表論文達(dá)到26篇;2007~2011年形成第二個(gè)高峰區(qū);2015~2017年出現(xiàn)第三個(gè)高峰區(qū),峰巔在2016年,年發(fā)表論文達(dá)到55篇。
這種情況表明:第一,20世紀(jì),“語言資源”領(lǐng)域幾乎還是一片處女地,它是21世紀(jì)才開始開發(fā)的學(xué)術(shù)領(lǐng)域。第二,語言資源研究與語言規(guī)劃實(shí)踐密切相關(guān)。2004年的小高峰,對(duì)應(yīng)于國(guó)家語言資源監(jiān)測(cè)與研究中心成立;2007年到2011年,正是“中國(guó)語言資源有聲數(shù)據(jù)庫(kù)”從醞釀到正式建設(shè)的時(shí)期;2015年到2017年,是語保工程開始建設(shè)的時(shí)期,也是語言資源高精尖創(chuàng)新中心的創(chuàng)立時(shí)期。研究高峰與實(shí)踐活動(dòng)的關(guān)節(jié)點(diǎn)大致對(duì)應(yīng),是因?yàn)閷?shí)踐活動(dòng)開始前總要做些研究,開始后又能帶動(dòng)研究。在中國(guó),的確是語言規(guī)劃的實(shí)踐在推動(dòng)語言資源的研究,為研究提供需求、材料和用場(chǎng);語言資源研究也為實(shí)踐提供了學(xué)術(shù)支撐;學(xué)術(shù)與實(shí)踐相互推動(dòng),是因?yàn)樵谡?、社?huì)、學(xué)界之間建造有一個(gè)現(xiàn)代化的“智力旋轉(zhuǎn)門”??梢灶A(yù)測(cè),2019年也會(huì)是語言資源研究的大年,因?yàn)?018年在長(zhǎng)沙召開了首屆“世界語言資源保護(hù)大會(huì)”,2019年春季正式發(fā)布了《岳麓宣言》。
(二)語言的資源性質(zhì)與語言資源類型
我國(guó)早期的語言資源研究,主要是論證語言具有資源的性質(zhì),確立語言資源的合理性。張普(2007)《論國(guó)家語言資源》用較大的篇幅論證語言是資源。先從資源說到資源科學(xué),再談自然資源和社會(huì)資源,繞這么大的彎子就是為了說明語言也是資源,是社會(huì)資源??梢姰?dāng)時(shí)要說“語言是資源”這么個(gè)道理還是多么困難。陳章太(2008)《論語言資源》也用了不少筆墨,來說明“語言是一種特殊的社會(huì)資源”。
在論證語言具有資源的性質(zhì)之后,研究者的精力便集中在列舉語言資源、為語言資源分類上。陳章太(2008)從廣狹兩個(gè)方面來看待語言資源:狹義的語言資源是指“語言信息處理用的各種語料庫(kù)和語言數(shù)據(jù)庫(kù),以及各種語言詞典等”;廣義的語言資源是指“語言本體及其社會(huì)、文化等價(jià)值”。而他要討論的是廣義的語言資源,這可能說明兩個(gè)問題:第一,“語言資源”這一概念在當(dāng)時(shí)語言信息處理學(xué)界較多使用;第二,把語言資源推及語言本體,還具有較大新意。
張普(2007)把語言資源分為三類:語言資源類、言語資源類、語言學(xué)習(xí)資源類。把語言學(xué)習(xí)資源劃出一類,是考慮到了語言資源的用途。從學(xué)界開始關(guān)注語言資源,如邱質(zhì)樸(1981),就比較關(guān)注語言資源在教學(xué)中的應(yīng)用。張普先生又是數(shù)字化教學(xué)的研究者、提倡者,語言學(xué)習(xí)資源更易進(jìn)入他的研究視野。但是他把語言資源分為“語言資源類、言語資源類”表面上符合“語言、言語”的“抽象-具體”這一學(xué)界思維習(xí)慣,特別是慧眼獨(dú)到地強(qiáng)調(diào)了語言運(yùn)用所產(chǎn)生的語言資源,但實(shí)際上就語言數(shù)據(jù)庫(kù)建設(shè)來說,不可能拿“語言”來建庫(kù),文字的或音頻的材料都只能是具體的“言語”。
王世凱(2009)是中國(guó)第一部論述語言資源的專著,在提出建立“語言資源學(xué)”的同時(shí),在著力探討語言資源的多種性質(zhì)的同時(shí),還把語言資源看作由底層資源(語音資源、詞匯資源、語法資源、語義資源、文字資源)和高層資源(修辭、語體、風(fēng)格)構(gòu)成的體系。這基本上是根據(jù)語言的結(jié)構(gòu)要素來劃分語言資源,同時(shí)考慮到文字和修辭、語體、風(fēng)格等。
魏暉(2015)認(rèn)為語言資源包括四大類:(1)語言本體(知識(shí))資源,由語音、詞匯、語法和語義等構(gòu)成;(2)語言應(yīng)用資源,包括各種通用的、專用的、靜態(tài)的、動(dòng)態(tài)的、多語的、平行的語料庫(kù),還包括與語料的加工處理相關(guān)的知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、規(guī)范標(biāo)準(zhǔn)(庫(kù))等;(3)語言學(xué)習(xí)資源;(4)人力資源,即掌握不同語種(包括外語)的人才。魏暉(2016)重申這一觀點(diǎn),并再次強(qiáng)調(diào)“人力資源是最核心的語言資源,也是最具能動(dòng)性的語言資源”。
很顯然,在語言資源的認(rèn)定和分類方面,學(xué)界意見至今并不一致,甚至還沒有建立語言資源的認(rèn)定標(biāo)準(zhǔn),也沒有找到一個(gè)較為合適的分類體系。本文認(rèn)為,語言資源基本屬性是其“有用性”,語言及其相關(guān)的事物有哪些作用,亦即哪些東西可以成為語言資源,還是一個(gè)需要探索的問題,特別是語言智能的發(fā)展一日千里,很多我們意識(shí)不到的東西都可能進(jìn)入語言資源的行列。綜合時(shí)賢的研究,就當(dāng)前的認(rèn)識(shí)水平看,語言資源可以包括3類:(1)口頭語言資源;(2)書面語言資源;(3)語言衍生資源,包括語言知識(shí)、語言技術(shù)、語言藝術(shù)、語言人才等。
自然語言的存在形態(tài)主要是口語和書面語,它們是最為基本的語言資源。就資源的收集、整理、建庫(kù)、保護(hù)而言,不存在語言和言語的對(duì)立,接觸到的都是言語類的語言資源?!把哉Z”是現(xiàn)實(shí)存在,“語言”存在于語言學(xué)中,存在于語言學(xué)家的大腦里和學(xué)術(shù)抽繹的操作中。就此而言,沒有必要區(qū)分“語言資源”和“言語資源”,或者說,只有“言語資源”沒有“語言資源”。
“口頭語言資源”和“書面語言資源”是對(duì)自然語言資源的再分類。在許多文獻(xiàn)中語言資源也就只指這兩類資源。其實(shí)“語言衍生資源”也非常重要:其一,語言知識(shí)、語言技術(shù)、語言人才等,在語言資源的收集整理、標(biāo)注入庫(kù)、分析研究、開發(fā)應(yīng)用等各個(gè)關(guān)節(jié)都在發(fā)揮作用;其二,語言藝術(shù)(包括書法、文學(xué),還有主要憑借語言的藝術(shù),如話劇、相聲、小品、笑話等)本身就是很有價(jià)值的語言資源。故而,語言資源應(yīng)當(dāng)包括語言衍生資源。
(三)語言資源的功能視角
語言資源的社會(huì)意義在于功能??创Z言資源必須建立“功能視角”,應(yīng)從功能的角度去認(rèn)識(shí)語言資源,去評(píng)價(jià)語言資源的建設(shè)工作,去開發(fā)利用語言資源。語言資源的功能是隨著社會(huì)的進(jìn)步而逐漸被開發(fā)、被認(rèn)識(shí)的。在我們的文化傳統(tǒng)中,文字和書面語比口語更受重視。但在近來以語言保護(hù)為首要任務(wù)的語言資源研究與實(shí)踐中,口語的語言資源意義得到了較多關(guān)注,而書面語的語言資源意義則反而關(guān)注較少,研究較少,至于語言知識(shí)、語言技術(shù)、語言藝術(shù)、語言人才等衍生性的語言資源,雖不同程度地被涉及,但尚缺乏認(rèn)真梳理。
就當(dāng)前語言資源利用的實(shí)踐來看,語言資源的功能域主要有3個(gè)方面:語言保護(hù)、語言信息處理、語言學(xué)習(xí)。
1.語言保護(hù)
語言保護(hù)是當(dāng)今全球的熱點(diǎn)話題,據(jù)專家預(yù)測(cè),本世紀(jì)末90%的語言將瀕危甚至消亡。若從交際的角度看,這些語言的瀕?;蛳鲆苍S并不是嚴(yán)重問題;但是若從文化的角度看,語言的瀕?;蛳鰠s是文化的災(zāi)難,因?yàn)槊糠N語言都記載著某民族(部族)的歷史、經(jīng)驗(yàn)及世界觀,而這些精神財(cái)富絕大多數(shù)還沒有被現(xiàn)代人類社會(huì)所了解,沒有成為現(xiàn)代人類知識(shí)的一部分。語言保護(hù)就是與時(shí)間賽跑,搶救失而不可復(fù)得的人類精神資財(cái)。中國(guó)的百余種語言以及大量的漢語方言,也有許多處在瀕危狀態(tài)或是出現(xiàn)瀕危態(tài)勢(shì),語言保護(hù)的任務(wù)也是急迫而沉重的。
語言保護(hù)有3個(gè)層次:第一個(gè)層次是“語言保存”。即通過書面記錄方式和錄音錄像方式,將語言(包括方言)記錄下來,并建立起數(shù)據(jù)庫(kù)、博物館,把這些“語言標(biāo)本”保存下來。當(dāng)前學(xué)者進(jìn)行的多是語言保存層面的工作。語言保存所涉及的語言資源,主要是口語資源,特別是瀕危語言的口語資源。其實(shí)古代書面文獻(xiàn)、民間語言藝術(shù)等,也具有重要的語言保存價(jià)值。進(jìn)一步研究會(huì)發(fā)現(xiàn),作為“語言樣本”的語言資源可以再分為兩種,一種是“展示本”,一種是“全息本”。展示本主要用于語言展示、語言教學(xué)、基本研究等,要求語言資源能夠反映出某語言的基本特征,比如基本的結(jié)構(gòu)特征、交際運(yùn)用特征和文化特征。全息本要求盡可能多地保存某語言的語言信息和文化信息,一旦有需要,可以在虛擬技術(shù)的幫助下利用這些信息“復(fù)活”該語言。這是語言保護(hù)最為浪漫的理想。
第二個(gè)層次是“語言活態(tài)保護(hù)”。即通過各種措施來延長(zhǎng)語言的生命,維護(hù)語言的活力。由于語言活態(tài)保護(hù)必然會(huì)對(duì)語言使用者的生存、生活方式及生存、生活環(huán)境進(jìn)行不同程度的干預(yù),倫理學(xué)上的要求很高,工作的難度很大。國(guó)內(nèi)外在語言活態(tài)保護(hù)方面都做了一些探索,積累了一些經(jīng)驗(yàn),比如北美地區(qū)對(duì)印第安語的活態(tài)保護(hù),大洋洲對(duì)毛利語的活態(tài)保護(hù),中國(guó)對(duì)裕固語、貴州苗語的活態(tài)保護(hù)等。但總體上看成效并不明顯,前景并不清晰。
第三個(gè)層次是“語言資源的開發(fā)利用”。即對(duì)語言保存、語言活態(tài)保護(hù)的成果進(jìn)一步開發(fā),獲取語言保護(hù)的社會(huì)“紅利”?!凹t利”意識(shí)十分重要,它可激發(fā)語言保護(hù)的動(dòng)力,及時(shí)發(fā)揮語言保護(hù)的效力,不斷增加語言保護(hù)的實(shí)力,保證語言保護(hù)事業(yè)可持續(xù)發(fā)展。需要注意的是,語言保護(hù)“紅利”的獲取者,首先應(yīng)考慮語言資源的提供者,包括發(fā)音合作人及其所屬社團(tuán)。
2.語言信息處理
語言信息處理是當(dāng)前語言資源的最大用戶,也是當(dāng)下語言資源理念的積極提倡者和語言資源的積極建設(shè)者。在中國(guó),中文語言資源聯(lián)盟的建立便是上述認(rèn)識(shí)的最佳“背書”。語言信息處理絕不只是科學(xué)技術(shù)之事,而是推進(jìn)社會(huì)進(jìn)步的重要力量;正是它的發(fā)展進(jìn)步,使當(dāng)今社會(huì)正在向“智能時(shí)代”邁進(jìn)。人工智能是智能時(shí)代最主要的技術(shù)力量,其核心是語言智能。機(jī)器獲取語言智能主要靠語言大數(shù)據(jù)的訓(xùn)練。語言大數(shù)據(jù)也就是語言資源,從語言智能的視角看,語言資源是生產(chǎn)資料的范疇,對(duì)人類的意義就更加不一般了。
語言保護(hù)所涉及的語言資源,主要保存的是以往的人類世界,是人類的歷史,是人類已有的經(jīng)驗(yàn)及世界觀;而語言信息處理所涉及的語言資源,是用于創(chuàng)造新的知識(shí)、發(fā)現(xiàn)新的世界的。語言保護(hù)是面向過去的,語言信息處理是面向未來的,雖然認(rèn)識(shí)既有世界對(duì)發(fā)現(xiàn)新世界會(huì)有幫助。
用于語言信息處理的語言資源,還可以進(jìn)一步劃分為兩種:一種是幫助解決“語言通”的,一種是幫助解決“信息通”的。語言通是讓機(jī)器能夠理解和使用語言,包括機(jī)器翻譯、機(jī)器寫作等。信息通是讓機(jī)器對(duì)各領(lǐng)域信息能夠加工處理,包括“社會(huì)計(jì)算”、科技文獻(xiàn)的二次加工等。當(dāng)然,語言通也需要機(jī)器有一定的專業(yè)知識(shí)和社會(huì)常識(shí),亦即需要信息通的支持,信息通更需要在語言通的基礎(chǔ)上來進(jìn)行。用于語言通的語言資源和用于信息通的語言資源是有不同要求的,因此可以把用于語言信息處理的語言資源再行劃分。
3.語言學(xué)習(xí)
語言學(xué)習(xí)是人類最為重要的語言生活之一。隨著社會(huì)的發(fā)展,語言學(xué)習(xí)的任務(wù)越來越重,不僅要學(xué)習(xí)母語(特別是書面語),還要學(xué)習(xí)外語,甚至是多門外語。即使語言智能發(fā)展到相當(dāng)?shù)母叨?,機(jī)器翻譯可以滿足基本的翻譯需求,外語學(xué)習(xí)仍然是需要的,因?yàn)樗侨祟惾姘l(fā)展的素養(yǎng)。
語言學(xué)習(xí)必須依靠語言資源才能進(jìn)行,語言學(xué)習(xí)資源是語言資源研究者較早進(jìn)入的學(xué)術(shù)領(lǐng)域。傳統(tǒng)的語言學(xué)習(xí)資源有教科書、工具書、課外讀物、語言教師、必要的語言環(huán)境等。而今進(jìn)入到信息化的時(shí)代,智能學(xué)習(xí)、智慧學(xué)習(xí)、慕課、微課等新概念炫人耳目,構(gòu)建適合于“互聯(lián)網(wǎng)+”的語言學(xué)習(xí)資源,成為教育改革的時(shí)代命題。語言知識(shí)、語言技術(shù)、語言人才、語言課程、語言學(xué)習(xí)環(huán)境等,是新時(shí)代語言學(xué)習(xí)資源中的重要組塊。這方面的實(shí)踐已經(jīng)很多,但是真正的研究和應(yīng)用還是比較有限的。
(四)語言知識(shí)觀
語言資源的功能還有很多,但是有此三者,已經(jīng)足以說明語言資源的重大價(jià)值,足以說明語言資源建設(shè)的意義及其急迫性,足以說明語言資源研究及建立語言資源學(xué)的意義。
自從索緒爾建立了現(xiàn)代語言學(xué)之后,“語言是一個(gè)符號(hào)系統(tǒng)”便成為公理性的學(xué)術(shù)常識(shí)。但是,從語言資源的視角、特別是語言資源功能的視角看“語言”,語言就不只是一個(gè)“符號(hào)系統(tǒng)”,而更是一個(gè)“知識(shí)系統(tǒng)”。比如語言保護(hù),不應(yīng)只是記錄、保護(hù)語言符號(hào),而是記錄、保護(hù)人類的語言知識(shí)體系及文化體系。語言學(xué)家傳統(tǒng)的語言調(diào)查,目的主要是揭示語言的符號(hào)系統(tǒng),而在揭示語言的知識(shí)系統(tǒng)、文化體系方面明顯不足。從“語言知識(shí)觀”的立場(chǎng)出發(fā),詞匯、語法、語用、篇章最為重要,人類的知識(shí)和思維運(yùn)作主要貯存在、表現(xiàn)在詞匯、語法、語用和篇章之中。由此來看,語言保護(hù)工作必須在語言調(diào)查方法、語言調(diào)查內(nèi)容等方面進(jìn)行大幅度改進(jìn)。
如果從語言信息處理的角度看語言,計(jì)算機(jī)理解人類語言,只理解語言的符號(hào)系統(tǒng)是完全不夠的;計(jì)算機(jī)從語言大數(shù)據(jù)中學(xué)到的也不僅僅是語言的符號(hào)體系,而是語言的知識(shí)體系甚至也包括文化體系。這也許就是計(jì)算機(jī)只學(xué)習(xí)語言學(xué)家給它的“規(guī)則”并不能夠?qū)崿F(xiàn)語言通的原因。語言信息處理也可以通俗地表述為“機(jī)器語言學(xué)習(xí)”,人類語言學(xué)習(xí)也是如此,現(xiàn)在人們強(qiáng)調(diào)外語學(xué)習(xí)要從“學(xué)外語”變成“用外語學(xué)”,也包含著這個(gè)道理。
四、結(jié) 語
語言的社會(huì)資源性質(zhì),是人類從20世紀(jì)70年代才開始逐漸認(rèn)識(shí)到的,澳大利亞在80年代率先把語言資源意識(shí)落實(shí)到國(guó)家語言規(guī)劃中。中國(guó)的語言信息處理學(xué)界2003年開始籌建“中文語言資源聯(lián)盟”,是語言資源建設(shè)最早的行動(dòng)者。2004年國(guó)家語委成立“國(guó)家語言資源監(jiān)測(cè)與研究中心”,語言資源理念開始進(jìn)入國(guó)家的語言規(guī)劃。之后,隨著“中國(guó)語言資源有聲數(shù)據(jù)庫(kù)”和“中國(guó)語言資源保護(hù)工程”的相繼開展,中國(guó)成為世界上在國(guó)家層面大力提倡語言資源理念、開展語言保護(hù)的最為突出的國(guó)家。2018年,中國(guó)與聯(lián)合國(guó)教科文組織在長(zhǎng)沙共同召開首屆“世界語言資源保護(hù)大會(huì)”,并形成《岳麓宣言(草案)》,中國(guó)的語言規(guī)劃又一次為國(guó)際社會(huì)提供了公共產(chǎn)品。
中國(guó)語言資源研究是在語言規(guī)劃的實(shí)踐推動(dòng)下展開的,并與語言規(guī)劃的實(shí)踐形成了良性互動(dòng)。1981年到2003年可以看作語言資源的學(xué)術(shù)醞釀期,2004年、2007~2011年、2015~2017年出現(xiàn)3次學(xué)術(shù)高峰或高峰區(qū),語言資源已經(jīng)發(fā)展為重要的具有魅力的學(xué)術(shù)領(lǐng)域,語言資源學(xué)的學(xué)科建設(shè)提上日程。
早期的研究主要確定語言的資源屬性,之后較多地研究語言資源的類型。語言資源有哪些類型,學(xué)界認(rèn)識(shí)還很不一致,本文嘗試把語言資源分為口頭語言資源、書面語言資源和語言衍生資源(語言知識(shí)、語言技術(shù)、語言藝術(shù)、語言人才等)三類,并認(rèn)為要較好地解決語言資源分類問題,必須建立語言資源的功能觀。當(dāng)前語言資源最為重要的功能域是語言保護(hù)、語言信息處理和語言學(xué)習(xí),應(yīng)當(dāng)根據(jù)這些功能來考慮語言資源的分類、建設(shè)規(guī)格和評(píng)價(jià)標(biāo)準(zhǔn)。
從語言資源的角度,特別是語言資源功能的角度來看語言,語言就不僅僅是一個(gè)符號(hào)系統(tǒng),它更是一個(gè)“知識(shí)庫(kù)”,里面貯存著人類的語言知識(shí)體系及文化體系。只有樹立了“語言知識(shí)觀”,語言資源建設(shè)才能滿足語言保護(hù)和機(jī)器語言學(xué)習(xí)、人類語言學(xué)習(xí)的需要。
最后需要指出的是,語言資源的保護(hù)與集聚需要人類社會(huì)的合作,包括不同地區(qū)、不同國(guó)家、不同國(guó)際組織的合作,不同社會(huì)部門和不同學(xué)科的合作。為了保證這種合作的順利開展,需要制定一系列國(guó)際標(biāo)準(zhǔn),包括技術(shù)標(biāo)準(zhǔn)、工作標(biāo)準(zhǔn)和社會(huì)倫理標(biāo)準(zhǔn)。語言資源關(guān)涉到人類的知識(shí)庫(kù)存、精神家園和生產(chǎn)資料的集聚管理,必須加強(qiáng)學(xué)術(shù)研究,加大加快社會(huì)行動(dòng)。
參考文獻(xiàn)
陳章太 2008 《論語言資源》,《語言文字應(yīng)用》第1期。
范俊軍 2006 《聯(lián)合國(guó)教科文組織關(guān)于保護(hù)語言與文化多樣性文件匯編》,北京:民族出版社。
范俊軍,肖自輝 2008 《語言資源論綱》,《南京社會(huì)科學(xué)》第4期。
費(fèi)什曼 1973 《語言現(xiàn)代化和規(guī)劃與國(guó)家現(xiàn)代化和規(guī)劃的比較》(高建平譯),載周慶生主編(2001)。
國(guó)家民委民族問題研究中心 2007 《歐安組織民族問題資料匯編》(內(nèi)部資料),北京:民族出版社。
黃 行 2018 《中國(guó)語言資源多樣性及其創(chuàng)新與保護(hù)規(guī)劃》,載閆國(guó)華主編《語言科技與人類福祉——首屆中國(guó)北京國(guó)際語言文化博覽會(huì)論文集》,北京:外語教學(xué)與研究出版社。
李如龍 2008 《漢語方言資源及其開發(fā)利用》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)第1期。
李宇明 2006 《關(guān)注語言生活》(語言生活熱點(diǎn)問題開欄寄語),《長(zhǎng)江學(xué)術(shù)》第1期。
李宇明 2008a 《語言資源觀及中國(guó)語言普查》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)第1期。
李宇明 2008b 《當(dāng)今人類三大語言話題》,《云南師范大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)第4期。
李宇明 2009 《公民語言能力是國(guó)家語言資源——序〈母語·文章·教育〉》,《中國(guó)大學(xué)教學(xué)》第2期。
李宇明 2010 《論中國(guó)語言資源有聲數(shù)據(jù)庫(kù)的建設(shè)》,《中國(guó)語文》第4期。
樓必安可(Lo Bianco) 1988 《澳大利亞的國(guó)家語言政策》,《語文建設(shè)》第5期。
錢乃榮 1995 《漢語方言研究中的新收獲——祝賀現(xiàn)代漢語方言音庫(kù)發(fā)行兼評(píng)〈上海話音檔〉》,《語文研究》第4期。
邱質(zhì)樸 1981 《試論語言資源的開發(fā)——兼論漢語面向世界問題》,《語言教學(xué)與研究》第3期。
邱質(zhì)樸 2000 《應(yīng)用語言學(xué)的新概念》,《鎮(zhèn)江師專學(xué)報(bào)》(社會(huì)科學(xué)版)第3期。
陶原珂 1996 《應(yīng)注意開發(fā)利用澳門社會(huì)的語言資源》,《學(xué)術(shù)研究》第4期。
王 輝 2007 《語言規(guī)劃的資源觀》,《北華大學(xué)學(xué)報(bào)》(社會(huì)科學(xué)版)第4期。
王 輝 2010 《澳大利亞語言政策研究》,北京:中國(guó)社會(huì)科學(xué)出版社。
王世凱 2009 《語言資源與語言研究》,上海:學(xué)林出版社。
魏 暉 2015 《國(guó)家語言能力有關(guān)問題探討》,《語言文字應(yīng)用》第4期。
魏 暉 2016 《文化強(qiáng)國(guó)視角的國(guó)家語言戰(zhàn)略探討》,《文化軟實(shí)力研究》第3期。
徐 波,孫茂松,靳光瑾 2003 《中文信息處理若干重要問題》,北京:科學(xué)出版社。
徐大明 2008 《語言資源管理規(guī)劃及語言資源議題》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)第1期。
袁貴仁 2005 《樹立科學(xué)發(fā)展觀,開創(chuàng)民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作的新局面》,《教育部通報(bào)》第17期,教育部辦公廳2005年9月2日印發(fā)。
張 普 2007 《論國(guó)家語言資源》,《民族語言文字信息技術(shù)研究——第十一屆全國(guó)民族語言文字信息學(xué)術(shù)研討會(huì)論文集》。另載張普(2012)。
張 普 2012 《張普應(yīng)用語言學(xué)論文集》,北京:北京語言大學(xué)出版社。
張 普,王鐵琨 2009 《中國(guó)語言資源論叢》,北京:商務(wù)印書館。
張政飚 2000 《西部語言資源重要性例議》,《中國(guó)語文》第1期。
趙 軍,徐 波,孫茂松,等 2003 《中文語言資源聯(lián)盟的建設(shè)和發(fā)展》,載徐波,孫茂松,靳光瑾主編《中文信息處理若干重要問題》,北京:科學(xué)出版社。
中國(guó)語言資源有聲數(shù)據(jù)庫(kù)建設(shè)領(lǐng)導(dǎo)小組辦公室 2010 《中國(guó)語言資源有聲數(shù)據(jù)庫(kù)調(diào)查手冊(cè)·漢語方言》,北京:商務(wù)印書館。
周慶生 2001 《國(guó)外語言政策與語言規(guī)劃進(jìn)程》,北京:語文出版社。
周慶生 2015 《語言生活與語言政策》,北京:社會(huì)科學(xué)文獻(xiàn)出版社。
Grin, F. 2003. Language planning and economics. Current Issues in Language Planning 4(1), 1–66.
Kaplan, R. B. & R. B. Baldauf. 1997. Language Planning from Practice to Theory. Clevedon: Multilingual Matters Ltd.
責(zé)任編輯:魏曉明