国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于編輯距離的漢語中介語語音計(jì)算分類

2020-04-12 11:24于爽冉啟斌史晴琳
現(xiàn)代語文 2020年11期

于爽 冉啟斌 史晴琳

摘 ?要:借鑒ASJP模式的語檔距離計(jì)算方法,對(duì)25個(gè)母語背景的漢語學(xué)習(xí)者的中介語語音表現(xiàn)進(jìn)行分類,并借助統(tǒng)計(jì)學(xué)和系統(tǒng)發(fā)生學(xué)方法,繪制漢語普通話與25種中介語距離關(guān)系樹圖。這些樹圖均顯示出,母語在同一語系的中介語基本分布在同一總分支上,反映出母語對(duì)中介語的形成產(chǎn)生主導(dǎo)影響。同時(shí),樹圖中也存在母語屬于同一語系的中介語分開、或是與其他語系中介語歸入同一小分支的現(xiàn)象。由此看出,不同語系的母語影響大小有一定區(qū)別,偏誤共性對(duì)距離關(guān)系的形成也會(huì)產(chǎn)生較大影響。

關(guān)鍵詞:漢語中介語;編輯距離;計(jì)算分類;ASJP

一、引言

就目前的研究現(xiàn)狀來看,國內(nèi)學(xué)界對(duì)漢語作為第二語言學(xué)習(xí)者的中介語語音研究,方法多種多樣,并取得了豐碩的成果。施光亨通過記錄語音資料的方法,統(tǒng)計(jì)出阿拉伯學(xué)生在習(xí)得漢語時(shí)的語音偏誤[1](P106-112)。傅氏梅、張維佳采用對(duì)比聽辨的方法,從聽感和發(fā)音能力兩個(gè)方面,考察了越南學(xué)生中介語中的聲母偏誤[2](P69-80)。李紅印在研究泰國學(xué)生學(xué)習(xí)漢語的語音偏誤時(shí),借助了實(shí)驗(yàn)語音學(xué)的聲學(xué)分析方法[3](P66-71)。梅麗利用一至兩年的跟蹤實(shí)驗(yàn),對(duì)日本學(xué)習(xí)者學(xué)習(xí)漢語卷舌聲母的語音變異情況進(jìn)行了探討[4](P97-105)。張林軍從感知的角度,采用實(shí)驗(yàn)手段,闡釋了日本留學(xué)生的聲調(diào)習(xí)得情況[5](P9-15)。冉啟斌、于爽的《漢語語音偏誤的特點(diǎn)與模式——基于25種母語背景學(xué)習(xí)者的偏誤條目數(shù)據(jù)的分析》一文,利用528條偏誤條目數(shù)據(jù),歸納了第二語言學(xué)習(xí)者中介語語音中的偏誤特點(diǎn),如學(xué)習(xí)者聲母、韻母、聲調(diào)在漢語學(xué)習(xí)中發(fā)生偏誤的情形并不是均衡的,學(xué)習(xí)者個(gè)別語音表現(xiàn)受母語影響,會(huì)呈現(xiàn)出不同于其他學(xué)習(xí)者的個(gè)性偏誤表現(xiàn)等[6](P417-432)。

本文以冉啟斌、于爽整理出的各母語背景的偏誤條目為依據(jù)[6],借鑒ASJP模式的語檔距離計(jì)算方法,分析不同母語背景學(xué)習(xí)者的中介語語音之間的距離關(guān)系,并對(duì)25種母語背景帶有偏誤的漢語中介語語音進(jìn)行分類,探討影響中介語分類的各種因素。

“相似性自動(dòng)判斷程序數(shù)據(jù)庫(Automated Similarity Judgment Program,網(wǎng)址是https://asjp.clld.org/)”,簡稱“ASJP”,是馬普研究院建立的“跨語言關(guān)聯(lián)(Cross Linguistic Linked Database)”在線數(shù)據(jù)庫之一。該數(shù)據(jù)庫收集了龐大的數(shù)據(jù)量,其第19版數(shù)據(jù)庫收錄了世界語言中的9788個(gè)語檔,語檔涉及到世界范圍的5499種語言。同時(shí),項(xiàng)目團(tuán)隊(duì)在該數(shù)據(jù)庫基礎(chǔ)上,發(fā)展出一套完備的相似度計(jì)算方法,并開放提供計(jì)算所需的軟件程序。ASJP模式的語言距離及相似度計(jì)算,在世界語言研究中產(chǎn)生了廣泛影響。其中,Wichmann et al探究了不同語系語言的發(fā)源地[7](P50-60);Holman et al考察了不同語言的分化年代[8](P841-875);Müller et al通過對(duì)第16版數(shù)據(jù)庫資源進(jìn)行距離計(jì)算,制作了6895個(gè)語檔的世界語言分類樹圖[9](P1-67);江荻采用萊文斯坦編輯距離計(jì)算的方法,以斯瓦迪士100核心詞為材料,對(duì)195種藏緬語族語言或方言進(jìn)行了自動(dòng)分類[10](P62-80)。在漢藏語系研究領(lǐng)域,維希曼、冉啟斌對(duì)65個(gè)漢語方言語檔做了系統(tǒng)發(fā)生學(xué)分析[11](P4-13);趙志靖、江荻通過計(jì)算元、輔音間的距離,再計(jì)算編輯距離,從而對(duì)數(shù)種藏語方言進(jìn)行了分類[12](P43-48)。在第二語言習(xí)得領(lǐng)域,崔萌等以漢語水平考試(HSK)作為研究對(duì)象,通過引入漢語與學(xué)習(xí)者母語的距離計(jì)算,分析了學(xué)習(xí)者的母語差異對(duì)漢語作為第二語言習(xí)得的影響,指出語言距離與漢語習(xí)得呈負(fù)相關(guān)關(guān)系[13](P280-288)??偟膩碚f,在目前以多個(gè)母語背景學(xué)習(xí)者的中介語研究中,借助距離計(jì)算方法對(duì)中介語語音表現(xiàn)進(jìn)行的分析,還較少有人涉及。

本文首先確定40個(gè)能夠典型體現(xiàn)漢語語音特點(diǎn)的詞語,按照冉啟斌、于爽歸納的偏誤條目,對(duì)25種母語背景的中介語進(jìn)行轉(zhuǎn)寫;然后,利用ASJP工具計(jì)算不同中介語之間的距離和相似度,并采用聚類分析、系統(tǒng)發(fā)生學(xué)分類方法對(duì)中介語進(jìn)行分類。在此基礎(chǔ)上,探討學(xué)習(xí)者中介語受其母語影響的程度、不同母語背景學(xué)習(xí)者中介語語音之間的關(guān)系。

二、研究設(shè)計(jì)

(一)研究對(duì)象

本文以美國、俄羅斯、韓國、泰國、西班牙、德國、荷蘭、法國、日本、埃及、烏克蘭、哈薩克斯坦、巴西、意大利、土耳其、蒙古、白俄羅斯、芬蘭、尼泊爾、巴基斯坦、尼日利亞、印度尼西亞等22個(gè)國家和中國壯族、藏族、維吾爾族3個(gè)少數(shù)民族的學(xué)習(xí)者為研究對(duì)象,對(duì)以上25個(gè)母語背景的學(xué)習(xí)者的中介語語音表現(xiàn)與漢語普通話進(jìn)行相似度和距離計(jì)算。這25個(gè)國家或民族的母語語種相應(yīng)為:英語、俄語、韓語、泰語、西班牙語、德語、荷蘭語、法語、日語、阿拉伯語、烏克蘭語、哈薩克語、巴西葡萄牙語、意大利語、土耳其語、蒙語、白俄羅斯語、芬蘭語、尼泊爾語、烏爾都語、尼日利亞(英語)①、印度尼西亞語、壯語、藏語、維吾爾語等。以上25種語言與語種的情況如表1所示:

以上25個(gè)國家或民族分布于世界七大洲中的五個(gè)大洲、所涉及母語語種涵蓋了九個(gè)主要語系中的六個(gè)語系,研究對(duì)象的覆蓋范圍較為均勻。以上25種母語背景所形成的漢語中介語,不僅能夠很好地體現(xiàn)出世界漢語學(xué)習(xí)者中介語的特點(diǎn),而且對(duì)探究學(xué)習(xí)者母語與中介語的關(guān)系也具有較高的學(xué)術(shù)價(jià)值。

(二)中介語語檔的構(gòu)建

ASJP數(shù)據(jù)庫以“斯瓦迪士100核心詞”為內(nèi)容,盡可能多地收集世界上各種語言或方言中不少于斯瓦迪士核心詞表中40個(gè)詞的語音形式。這40個(gè)詞均是經(jīng)過檢測和論證得到的、用于距離和相似度計(jì)算的最穩(wěn)定的詞。以往的研究表明,在第二語言學(xué)習(xí)中,漢語的22個(gè)聲母(含零聲母)、39個(gè)韻母發(fā)生偏誤的情況并不均衡,如聲母和韻母中最易產(chǎn)生偏誤的前5種語音類型是:舌尖后聲母r,舌尖后聲母zh、ch、sh,舌尖元音(-?、-?),復(fù)韻母,鼻音韻尾-n、-ng等。因此,根據(jù)漢語語音的實(shí)際情況,本文單獨(dú)設(shè)計(jì)了能夠典型體現(xiàn)漢語語音特點(diǎn)的中介語詞表。該詞表共包含40個(gè)詞語,具體如表2所示:

該詞表的設(shè)計(jì)主要遵循兩個(gè)原則。一是詞表對(duì)漢語普通話單念和語流中的語音音位(音素)進(jìn)行了全方位的覆蓋,它既包括普通話單念時(shí)的22個(gè)聲母(含零聲母)、39個(gè)韻母和4個(gè)聲調(diào),也包括語流中的三聲變調(diào)、輕聲、兒化、“一、不”的變調(diào)等音變現(xiàn)象。二是詞表著重凸顯了二語學(xué)習(xí)中容易發(fā)生的語音偏誤。根據(jù)冉啟斌、于爽的研究結(jié)論[6],該詞表包含了更多的舌尖后音聲母、舌尖元音、[er]韻母、前后鼻音、送氣音等,目的是為了更充分地展現(xiàn)學(xué)習(xí)者中介語之間的特點(diǎn)和差異。

為了構(gòu)建25個(gè)母語背景學(xué)習(xí)者學(xué)習(xí)漢語的中介語語檔,本文將上述40個(gè)詞語按照冉啟斌、于爽研究中的偏誤條目描述進(jìn)行國際音標(biāo)轉(zhuǎn)寫,使之成為帶有偏誤特征的語音表現(xiàn)。比如,泰國學(xué)習(xí)者的常見偏誤主要有將舌面擦音x[?]發(fā)為[s]、將舌尖后音發(fā)為舌尖前音、將送氣塞擦音發(fā)為同部位的擦音等,因此,可以將泰國學(xué)習(xí)者“大學(xué)”一詞的國際音標(biāo)轉(zhuǎn)寫為[ta su?],“中秋”一詞的國際音標(biāo)轉(zhuǎn)寫為[tsu? ?i?u]。之后,再將帶有學(xué)習(xí)者偏誤發(fā)音的中介語和漢語普通話的國際音標(biāo)標(biāo)音形式轉(zhuǎn)換為ASJP碼的標(biāo)寫形式,最終形成漢語普通話和25個(gè)中介語共26個(gè)語檔。

(三)語檔相似度與距離計(jì)算方法

我們之所以將26個(gè)語檔由國際音標(biāo)轉(zhuǎn)換為ASJP碼的標(biāo)寫方式,是因?yàn)樗梢允褂?jì)算得到的語檔距離和相似度更加符合語言之間的實(shí)際距離和相似度。語檔轉(zhuǎn)寫后,使用ASJP的工具軟件,計(jì)算各語檔的LDND距離,形成距離矩陣。具體的距離計(jì)算方法為“萊文斯坦編輯距離(Levenshtein Distance)”,簡稱“LD”。所謂的“萊文斯坦編輯距離”,就是由一個(gè)字符串轉(zhuǎn)換為另一個(gè)字符串所需的最少操作次數(shù)。這一計(jì)算方法只允許插入、刪除、替換三種操作。ASJP模式的距離計(jì)算有不同的方法,如“歸一化萊文斯坦距離(Levenshtein Distance Normalized)”、“歸一化萊文斯坦距離商(Levenshtein Distance Normalized Divided)”等,前者簡稱“LDN”,后者簡稱“LDND”。本文計(jì)算語檔之間的距離均采用LDND這一方法。LDND距離計(jì)算的公式是:

最后,依據(jù)距離矩陣進(jìn)行計(jì)算分類,形成統(tǒng)計(jì)學(xué)系統(tǒng)聚類樹圖和系統(tǒng)發(fā)生學(xué)樹圖等。

三、漢語中介語語音的計(jì)算和分類

(一)漢語中介語語音的距離與相似度

在形成距離矩陣后,本文首先將25種中介語與漢語普通話的LDND距離數(shù)據(jù)單獨(dú)提取出來,并計(jì)算出各中介語與普通話之間的相似度。具體數(shù)據(jù)如表3所示(為便于觀察,將漢語普通話放在第1行):

如表3所示,在25種中介語中,藏族學(xué)習(xí)者的中介語與漢語普通話距離最近,為23.65,兩者的相似度達(dá)到了76.35%;而日本學(xué)習(xí)者的中介語與漢語普通話距離最遠(yuǎn),為63.96,兩者的相似度最低,僅有36.04%。維希曼、冉啟斌曾根據(jù)世界語言語檔中語言變體之間的關(guān)系層級(jí)問題,給出了不同關(guān)系層級(jí)的參考指標(biāo):如果兩種語言的相似度大于50.90%,則屬于相同方言;相似度在50.90%~18.64%之間的,屬于相同語族之間的語言;相似度在18.64%~2.37%之間的,屬于相同語系不同語族之間的語言;低于2.37%的,則屬于不同語系[14](P126-135)。根據(jù)這一參考指標(biāo)可以看出,藏族、白俄羅斯、尼日利亞等12個(gè)民族或國家的學(xué)習(xí)者的中介語相似度均大于50.90%,若將中介語視作是一種獨(dú)立的世界語言,它們的語音表現(xiàn)都接近漢語方言;這其中就包括了母語與漢語在同一語系的藏族、泰國、壯族學(xué)習(xí)者。而其余13個(gè)民族或國家的學(xué)習(xí)者的中介語相似度,均在50.90% ~18.64%之間,若將中介語視作是一種獨(dú)立的世界語言,它們的語音表現(xiàn)都接近于漢語同一語族的語言。同時(shí),從表3還可看出,同樣為英語背景,尼日利亞跟美國學(xué)習(xí)者的中介語與漢語相似度差別較大,其原因可能是在于我們所收集到的尼日利亞偏誤條目較少、不夠完備,因此,沒有完全體現(xiàn)出尼日利亞學(xué)習(xí)者的特點(diǎn)。

我們還將以上相似度的數(shù)據(jù)繪制為折線圖,具體如圖1所示:

從圖1可以看出,25種中介語的下降較為平緩,僅在白俄羅斯、泰國和蒙古處有輕微的陡坡;大部分中介語相似度緊密集中在40%~60%之間。由此可以得知,漢語學(xué)習(xí)者的語音發(fā)音表現(xiàn)較為集中和一致。

(二)漢語中介語語音的聚類分析

我們又采用了SPSS軟件,對(duì)26個(gè)語檔的距離數(shù)據(jù)進(jìn)行分析。這里采取平均聯(lián)接(組間)的方法進(jìn)行系統(tǒng)聚類,其度量標(biāo)準(zhǔn)為平方歐氏距離,從而得到Ward聯(lián)接的分類樹狀圖。具體如圖2所示:

從圖2可以看出,該樹狀圖可以分為四大分支。在第一大分支中,漢語普通話正好位于最上端,藏語中介語與漢語普通話處于同一末端節(jié)點(diǎn)上,其次是泰語與壯語中介語。與之較近的第二大分支為意大利語、烏爾都語、俄語、法語、白俄羅斯語與尼泊爾語中介語,其中,意大利語與烏爾都語中介語、俄語與法語、白俄羅斯語與尼泊爾語中介語分別在同一末端節(jié)點(diǎn)上。其次較遠(yuǎn)的第三大分支又被分成兩個(gè)分支:一個(gè)為土耳其語、蒙語、芬蘭語中介語分支;另一個(gè)則為烏克蘭語、巴西葡萄牙語、西班牙語等印歐語系中介語主導(dǎo)(其中的哈薩克語為阿爾泰語系、印尼語為南島語系)的分支。最遠(yuǎn)的第四大分支里包括了韓語、日語、美國英語、維吾爾語、阿拉伯語、荷蘭語中介語,它們形成了一個(gè)非常特別的組合。

在圖2的基礎(chǔ)上,我們可以對(duì)漢語學(xué)習(xí)者的中介語語音表現(xiàn)進(jìn)行一個(gè)初步分析。

第一,學(xué)習(xí)者的中介語的語音形成受到自身母語的影響,而且其影響程度較強(qiáng)??傮w來看,中介語總的分支分布基本符合其對(duì)應(yīng)母語在世界語言中的語系分布。與漢語普通話在同一末端節(jié)點(diǎn)的為母語同是漢藏語系的藏語中介語,而壯語、泰語也同屬漢藏語系,以其為母語背景的中介語也與它們在同一分支。土耳其語與蒙語的中介語分屬在同一末端。同時(shí),第三大分支中除哈薩克和印尼語外,其他中介語均為印歐語系中介語的集合。而日語、韓語語系未定,以其母語為背景的中介語則處于距漢語最遠(yuǎn)的一個(gè)大的分支中;雖然在地緣上中、日、韓距離非常接近,但并沒有拉近漢語與二者中介語的距離。

第二,雖然學(xué)習(xí)者中介語語音的形成受到了自身母語的影響,但并未成為影響其語音表現(xiàn)的充分條件。冉啟斌、于爽指出,在學(xué)習(xí)者中介語中,某些音素會(huì)產(chǎn)生一致的偏誤表現(xiàn),如舌尖后音最易產(chǎn)生的偏誤是發(fā)為舌葉音等[6]。因此,漢語學(xué)習(xí)者的偏誤共性對(duì)于中介語的形成也產(chǎn)生了較大影響,母語背景原本屬于不同語系的中介語,可能會(huì)由此突破母語的語系分類而歸屬于同一分支內(nèi)。從圖2可以看出,部分中介語并沒有按照其母語的規(guī)律歸入相應(yīng)語系的分支中,甚至有些語系的中介語散落在不同的分支中,從而形成了與漢語普通話距離遠(yuǎn)近不一的情況;或者是雖同屬一個(gè)語系、但屬于不同語族的語言,其中介語卻被重組到了同一個(gè)末端內(nèi)。比如,母語同屬于印歐語系,意大利語、法語、烏爾都語等的中介語,就位于漢語最近的一個(gè)大分支內(nèi);而烏克蘭語、西班牙語、德語等的中介語,位于更遠(yuǎn)的分支上;美國英語、荷蘭語則距離漢語最遠(yuǎn)。再如,母語同屬于阿爾泰語系,哈薩克語中介語與土耳其語中介語并未進(jìn)入同一個(gè)末端;維吾爾語中介語則更是處在距漢語最遠(yuǎn)處的分支中。此外,印歐語系中各語族的語言,其形成的中介語也并未能進(jìn)入同一個(gè)末端,反而是進(jìn)行了重新組合,如拉丁語族中的意大利語與印度語族中的烏爾都語的中介語位于同一末端,而拉丁語族的另一語言法語則與斯拉夫語族的俄語的中介語位于同一末端等。

四、漢語中介語語音的系統(tǒng)發(fā)生學(xué)分析

上文主要運(yùn)用了統(tǒng)計(jì)分析的方法,對(duì)26個(gè)語檔進(jìn)行了聚類分析;下面,我們將采用分子生物學(xué)中的發(fā)生學(xué)分類法,對(duì)漢語中介語語檔進(jìn)行分類。通常情況下,學(xué)習(xí)者的中介語之間彼此獨(dú)立,不具有發(fā)生學(xué)關(guān)系,不過,本文主要是借鑒發(fā)生學(xué)的分類方法,為其提供一個(gè)分類的參照。筆者使用分子生物學(xué)軟件MEGA7(Molecular Evolutionary Genetics Analysis),采用鄰接樹法(Neighbor-Joining Tree),構(gòu)建26個(gè)語檔的分類關(guān)系,從而得到有根分類樹圖。具體如圖3所示:

經(jīng)過發(fā)生學(xué)分類法繪制的樹形圖,與聚類分析得到的結(jié)果大體一致,同時(shí)也有一定的區(qū)別。最外圍的是美國英語和韓語中介語分支,維吾爾語中介語單獨(dú)在一個(gè)分支。其次,是日語中介語與荷蘭語中介語相連的分支,這一點(diǎn)與聚類分析的結(jié)果有所不同。再次,是含有漢語普通話的一個(gè)大分支,這一分支中漢語與藏語中介語仍然在同一分支,與之相接近的是泰語與壯語中介語分支,這些均與聚類分析的結(jié)果一致;不過,白俄羅斯語中介語成為單獨(dú)一個(gè)分支,同歸在這一分支之內(nèi),這一點(diǎn)又與聚類分析不同。芬蘭語單獨(dú)成為一個(gè)分支。接下來的一個(gè)分支被分為兩個(gè)大組??可系囊唤M基本與聚類分析一致:烏克蘭語和巴西葡萄牙語中介語、西班牙語與德語中介語在同一分支,不同的是哈薩克語中介語與蒙語中介語成為了單獨(dú)的分支??肯碌囊唤M是與聚類分析分歧最大的部分。這一分支中,最外部的土耳其語成為單獨(dú)一個(gè)分支,其次是烏爾都語分支,意大利語與其分開成為下一層單獨(dú)一個(gè)分支,內(nèi)部是俄語和法語、阿拉伯語與尼泊爾語兩個(gè)小分支。

為了能更清晰地顯示26個(gè)語檔的分支關(guān)系,本文又在MEGA中繪制了放射狀的無根分類樹圖。具體如圖4所示(見下頁):

在放射狀模式中,各語檔的分支關(guān)系更為明顯。圖4中,芬蘭語中介語處在單獨(dú)的分支,其余語檔則分為三簇:以漢語為代表的漢藏語系中介語分支(其中也出現(xiàn)了非漢藏語系的白俄羅斯語的中介語),韓語、日語、美國英語等中介語的分支,剩下的語檔則組成的一個(gè)大的分支。最后這一大的分支以印歐語系中介語為主導(dǎo),阿爾泰語系的中介語亦夾雜其間。

由系統(tǒng)發(fā)生學(xué)鄰接法形成的兩種樹狀圖,再次印證了上文的分析;同時(shí),我們還可以從其與聚類分析的不同之處,發(fā)現(xiàn)一些新的特點(diǎn)。

第一,系統(tǒng)發(fā)生學(xué)樹圖再次印證了學(xué)習(xí)者的中介語的語音形成受自身母語的影響,但不同語系的影響強(qiáng)弱有一定區(qū)別。維吾爾語、蒙語、哈薩克語、土耳其語同屬于阿爾泰語系,但以它們作為母語背景的中介語分別進(jìn)入了不同分支中,而且它們之間相距較遠(yuǎn)。印歐語系中的斯拉夫語族——俄語、烏克蘭語、白俄羅斯語,以其母語為背景的漢語中介語也出現(xiàn)了同樣的狀況。而接近漢語的漢藏語系其他語言、印歐語系除斯拉夫語族的其他語言的中介語,則較為集中。這種現(xiàn)象也可以歸結(jié)為印歐語系的語言自身的影響力較大,在一定程度上更容易影響漢語習(xí)得。

第二,與母語負(fù)遷移相比,地理上的位置遠(yuǎn)近對(duì)中介語的形成影響較小。雖然藏語、壯語中介語與漢語普通話距離較近,但同樣屬于中國少數(shù)民族的維吾爾語中介語則距離漢語較遠(yuǎn),蒙語中介語甚至位于距離漢語最遠(yuǎn)的一個(gè)大分支內(nèi)。地緣、文化相近的烏克蘭、白俄羅斯、俄羅斯也有相同的情況。反觀各小分支中,烏克蘭與巴西、尼日利亞與印度尼西亞、荷蘭與日本、美國與韓國,它們甚至不在一個(gè)大洲內(nèi),但它們學(xué)習(xí)者的中介語則位于同一分支下。至于出現(xiàn)這一現(xiàn)象的原因,上文亦曾提及,主要是在于這些學(xué)習(xí)者的中介語內(nèi)部存在著一定的偏誤共性,如美國與韓國學(xué)習(xí)者的聲母zh、ch、sh均產(chǎn)生了偏誤,而且其偏誤表現(xiàn)均為“舌葉音[?]、[?]、[?]”。由系統(tǒng)發(fā)生學(xué)鄰接法形成的兩種樹狀圖也再次印證了這一分析。

五、結(jié)語

本文采用ASJP的計(jì)算模式和方法,并結(jié)合漢語普通話,對(duì)25個(gè)母語背景的漢語中介語語檔進(jìn)行了距離計(jì)算。通過對(duì)統(tǒng)計(jì)系統(tǒng)聚類和系統(tǒng)發(fā)生學(xué)分類進(jìn)行的分析,進(jìn)一步深化了對(duì)漢語中介語的認(rèn)識(shí)。首先,大部分學(xué)習(xí)者的中介語水平較為集中,如果將之視作一種獨(dú)立的世界語言,可以達(dá)到接近漢語方言或與漢語同語族的水平。其次,漢語學(xué)習(xí)者的自身母語的影響在中介語的形成中起到了主導(dǎo)作用,但不同語系的影響大小有一定區(qū)別,如印歐語系母語的影響就比較大。除母語影響之外,漢語學(xué)習(xí)者的偏誤共性也對(duì)中介語的形成產(chǎn)生了一定影響。當(dāng)然,本文的研究也存在不足之處,部分國家或民族(如尼日利亞)的偏誤條目收集不夠完備,或許會(huì)對(duì)分析的結(jié)果產(chǎn)生一定影響。今后將針對(duì)這些國家集中收集學(xué)習(xí)者實(shí)際的語音表現(xiàn),并通過實(shí)驗(yàn)語音學(xué)方法測量,獲得更為完備的偏誤條目,以期完善距離分析計(jì)算研究。

參考文獻(xiàn):

[1]施光亨.對(duì)阿拉伯學(xué)生進(jìn)行漢語語音教學(xué)的幾個(gè)問題[J].語言教學(xué)與研究,1980,(2).

[2]傅氏梅,張維佳.越南留學(xué)生的漢語聲母偏誤分析[J].世界漢語教學(xué),2004,(2).

[3]李紅印.泰國學(xué)生漢語學(xué)習(xí)的語音偏誤[J].世界漢語教學(xué),1995,(2).

[4]梅麗.日本學(xué)習(xí)者習(xí)得普通話卷舌聲母的語音變異研究[J].世界漢語教學(xué),2005,(1).

[5]張林軍.日本留學(xué)生漢語聲調(diào)的范疇化知覺[J].語言教學(xué)與研究,2010,(3).

[6]冉啟斌,于爽.漢語語音偏誤的特點(diǎn)與模式——基于25種母語背景學(xué)習(xí)者的偏誤條目數(shù)據(jù)的分析[J].世界漢語教學(xué),2019,(3).

[7]冉啟斌.基于詞匯聲學(xué)距離的語言計(jì)算分類實(shí)驗(yàn)[J].民族語文,2020,(3).

[8]Holman,E.W.,Brown,C.H.,Wichmann,S.et al.Automated Dating of the Worlds Language Families Based on Lexical Similarity[J].Current Anthropology,2011,(6).

[9]Müller,A.,Velupillai,V.,Wichmann,S.et al.ASJP world language tree of lexical similarity:Version 4 (October 2013).

[10]江荻.藏緬語譜系的自動(dòng)分類實(shí)驗(yàn)[A].《中國民族語言學(xué)報(bào)》編委會(huì).中國民族語言學(xué)報(bào)(第一輯)[C].北京:商務(wù)印書館,2017.

[11]索倫·維希曼,冉啟斌.ASJP模式的漢語方言計(jì)算分析——以65個(gè)漢語方言語檔為例[J].現(xiàn)代語文,2019,(5).

[12]趙志靖,江荻.基于編輯距離的語言分類研究[J].語言研究,2020,(6).

[13]崔萌,張衛(wèi)國,孫濤.語言距離、母語差異與漢語習(xí)得:基于語言經(jīng)濟(jì)學(xué)的實(shí)證研究[J].世界漢語教學(xué), 2018,(2).

[14]索倫·維希曼,冉啟斌.語言與方言的區(qū)分層級(jí)——ASJP模式的核心詞匯距離計(jì)算再分析[J].南開語言學(xué)刊,2019,(2).

基金項(xiàng)目:國家社會(huì)科學(xué)基金重大項(xiàng)目“中國境內(nèi)語言核心詞匯聲學(xué)數(shù)據(jù)庫及計(jì)算研究”(19ZDA300);南開大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)項(xiàng)目“數(shù)字中文實(shí)驗(yàn)室建設(shè)啟動(dòng)項(xiàng)目”(63202924)

Quantitative Classification on Phonological Transcriptions for Interlanguages:

with Mandarin as Target Language

Yu Shuang1,Ran Qibin2,Shi Qinglin3

(1.School of Foreign Languages, Tian University of Technology and Educaion, Tianjin 300222;

2.School of Literature, Nankai University, Tianjin 300071;

3.School of Foreign Languages, Tianshi College, Tianjin 301700)

Abstract:Drawing on the pholonogical distance calculation method of the ASJP, with the speech performance in the interlanguages of 25 learners with native language backgrounds classified, tree diagrams of the distance relationship between Chinese Mandarin and 25 interlanguages above mentioned are drawn in this paper, using statistical and phylogenetic methods. Several tree diagrams indicate that the interlanguages whose native languages belong to the same language family are largely distributed over the same general branch, reflecting the dominant influence of the native language on the formation of the interlanguage. However, there are also the cases that the interlanguages of the same language family are grouped into the same sub-branch with those of other language families. The analysis reveals that the degree of the native languages influence on the interlanguage differs across language families, and that the commonality of speech errors can have a large impact on the formation of distance relations.

Key words:Chinese interlanguage;edit distance;quantitative classification;ASJP

作者簡介:1.于 ?爽,女,天津職業(yè)技術(shù)師范大學(xué)外國語學(xué)院助教,漢語國際教育碩士。

2.冉啟斌,男,南開大學(xué)文學(xué)院教授,博士生導(dǎo)師,文學(xué)博士。

3.史晴琳,女,天津天獅學(xué)院外國語學(xué)院講師,文學(xué)碩士。

武隆县| 五原县| 桑植县| 壤塘县| 衢州市| 和静县| 青州市| 景洪市| 石景山区| 通江县| 太保市| 秦皇岛市| 云霄县| 阿图什市| 闻喜县| 赞皇县| 新郑市| 尤溪县| 辉县市| 岱山县| 北安市| 望江县| 岢岚县| 古蔺县| 宝兴县| 鹤峰县| 武邑县| 乡城县| 长垣县| 卓资县| 高阳县| 栾川县| 昌吉市| 龙泉市| 奎屯市| 永定县| 金堂县| 甘孜县| 岑巩县| 西峡县| 四子王旗|