国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

普通話測試信息分析

2010-07-18 03:12:04趙欣如嚴志宇譚軍華肖云鵬張學波葉衛(wèi)平
中文信息學報 2010年4期
關鍵詞:易錯音節(jié)普通話

王 璐,趙欣如,謝 簪,嚴志宇,譚軍華,肖云鵬,李 嶠,張學波,葉衛(wèi)平

(1.北京師范大學 教務處,北京100875;2.北京師范大學 信息科學與技術學院,北京100875)

0 引言

1994年國家語委、國家教委和廣電部聯(lián)合發(fā)布《關于開展普通話水平測試工作的決定》,啟動了全國范圍的普通話水平測試。測試加快了普通話推廣進程,提高了普通話水平,加深了我國各地區(qū)各民族人民之間的了解與溝通,促進了和諧社會建設,在我國擴大國際交往和對外文化交流中也發(fā)揮了巨大作用。

隨著測試的開展,相關研究也初見成效[1],為完善測試、推動普通話普及提供了相關依據(jù)。與此同時,定期舉行的普通話測試還積累了大量測試信息。分析利用這些信息有助于了解普通話測試、普通話學習以及普通話自身的某些規(guī)律。本文選擇某普通話測試中心一次測試(1 095名考生)的全部信息作為研究樣本。對普通話測試信息進行了嘗試性統(tǒng)計,得到有意義的結論。

本文統(tǒng)計了考生方言背景和專業(yè)背景與測試成績的關系,二者對測試成績影響較大。文學類專業(yè)普通話水平最高,其他學科不分仲伯;本文統(tǒng)計了普通話測試字詞部分的常見錯誤及不同類型錯誤發(fā)生的頻率;本文最后從總分和內容關聯(lián)相關性兩方面統(tǒng)計得出測評員評分一致性很好。

本文第1節(jié)介紹數(shù)據(jù)樣本;2、3、4節(jié)介紹考生背景的影響,常見錯誤及測評分數(shù)一致性統(tǒng)計結果;第5節(jié)介紹數(shù)據(jù)采集及本文使用的“普通話測試信息數(shù)據(jù)庫”;第6節(jié)總結全文。

1 數(shù)據(jù)來源

數(shù)據(jù)選自某普通話測試中心一次測試1 095名考生的全部樣本。中心設在北京某一高校,考生多為該校在校本科生、研究生和留學生。該校國內生源地覆蓋各大方言區(qū)和少數(shù)民族語言區(qū),留學生來自世界各大洲。考生專業(yè)分屬哲學、經(jīng)濟學、法學、教育學、歷史學、文學、管理學、理學和工學九個學科??忌窖员尘昂蛯W科背景分布都比較全面。另外,中心所在學校是師范院校,由于所有師范生都參加普通話測試,因而成績基本反映該校學生的普通話水平全貌。測試使用了5份單音節(jié)詞和雙音節(jié)詞試題,與短文朗讀作品、命題說話題目一起供測試抽取。每位考生均由兩位測評員評分。

2 不同背景考生普通話測試成績分析

不同方言所含音素及聲調不同、字詞讀法不同,所以不同方言背景的學習者學習普通話語音遇到的問題和學習的難度也不盡相同。不同學科學習內容與研究范疇不同,對普通話的關注程度存在差異,所以不同學科背景的學習者,普通話使用水平也存在差異。二者的影響會反映在普通話測試成績當中。2.1、2.2節(jié)將分別分析測試成績與方言背景及學科背景的關系。

2.1 普通話測試成績和方言背景的關系

1 095名考生多為在校大學生,來自各地,并已在北京學習生活了一段時間。其中來自北方方言區(qū)的考生436人,閩方言75人(包括閩南閩北),粵方言18人,贛方言55人,湘方言79人,吳方言36人,少數(shù)民族語言區(qū)25人,留學生133人,“方言背景”為普通話的238人。圖1是不同方言背景考生成績分布狀況。其中“其他”包含少數(shù)民族語言和外國語,“粵方言”考生人數(shù)少,數(shù)據(jù)不一定有代表性。

圖1 不同方言背景普通話測試成績分布

本次測試最好成績?yōu)椤耙患壱业取?一乙),最差成績?yōu)椤叭壖椎取?三甲)。

分析圖1得到三點結論:第一,方言背景對普通話測試成績影響較大[2],由于成績體現(xiàn)普通話水平,因此可以推論方言背景對普通話水平有較大影響;

第二,“普通話”背景考生表現(xiàn)最佳,“一乙”率達66.37%。因為成長于普通話環(huán)境之中,考生表現(xiàn)優(yōu)異符合邏輯;

第三,除普通話背景的考生之外,“北方方言”背景的考生成績明顯高于其他方言。“一乙”率47.58%,高于名列其后的“贛方言”19.01個百分點。按照定義,普通話“以北京語音為標準音,以北方話為基礎方言”。北方方言區(qū)又多與北京地域接近,歷史上人員流動較多,因此普通話在語言語音上與“北方方言”較為接近,“北方方言”背景的人學說普通話也較為容易[3]。

2.2 普通話測試成績和學科背景的關系

本次測試的考生按教育部學科分類分屬九個不同學科。其中哲學38人,經(jīng)濟學和管理學兩學科合計108人,法學(法律、政治、國際關系)30人,教育學(教育、心理、體育)144人,文學(中文、外語、藝術與傳媒)314人,歷史學 46人,理學(數(shù)學、物理、化學、生物、地理)341,工學54人,其他20人。圖2是考生總分按學科背景分布圖。分析圖2可以得到三點結論:

第一,不同學科背景考生的成績存在較大差異;

第二,“文學”類專業(yè)考生的普通話水平明顯好于其他學科。“一乙”率達到58.78%,高于排位第二的“工學”22.11個百分點。文學類專業(yè)語言方面的學習內容較多,對從業(yè)人員的普通話要求普遍較高,選擇這類專業(yè)的學生語言天分往往也較高。這些因素共同作用使得其普通話整體水平遠好于其他專業(yè)。統(tǒng)計結果符合預期;

第三,“文學”之外的其他學科普通話水平不分伯仲。文理工科之間普通話水平?jīng)]有明顯差異,結果出乎“文科應該好于理工科”的預期。

哲學、法學人數(shù)較少(40以下),數(shù)據(jù)不一定具有代表性,在此不做分析。

圖2 不同學科背景普通話測試成績分布

綜上所述,方言背景影響普通話水平,“北方方言”考生普通話水平僅次于“普通話”背景考生;學科背景也影響普通話水平,文學類考生普通話水平高于其他學科,其他學科普通話水平差異不大。根據(jù)本文作者統(tǒng)計,本次測試中各個學科考生的方言背景分布基本相同,因此本文關于學科背景的結論是可信的。

3 單音節(jié)詞和多音節(jié)詞部分錯誤分析

普通話測試分四部分:單音節(jié)詞朗讀、多音節(jié)詞朗讀、短文作品朗讀和命題說話[4]。字詞、作品及話題涵蓋了普通話各種音質[5]、聲調現(xiàn)象及韻律特征。試題難易結合,照顧到測試不同等級的需要??梢哉f普通話測試比較全面地考察了考生的普通話水平。

為了了解測試內容在普通話測試中的表現(xiàn),本文考察了本次測試5份字詞試卷的成績??偨Y出普通話測試中的常見錯音,并對各類錯音進行了具體分析。

3.1 常見錯音分析

分數(shù)能夠告知一個音節(jié)讀音是“正確”、“錯誤”還是“有缺陷”,但是分數(shù)并不指出錯讀音節(jié)的出錯環(huán)節(jié)。以音節(jié)“ken3”為例。分數(shù)可以認定一名考生的“ken3”有錯,但并不指出是聲母讀錯,韻母讀錯,聲調讀錯還是聲韻調皆錯?也不指出“ken3”對該考生來說是聲母難讀,韻母難讀,還是聲調難讀?是不知道規(guī)范讀音,還是一時疏忽?即便如此,我們仍然可以依據(jù)分數(shù)得到關于發(fā)音難點的啟示。

如果含有某音素的音節(jié)出錯比例遠大于其他音節(jié),那么判定它是易錯音素是合乎邏輯的。表1列出了5份試卷中出錯最多的10個音節(jié),并按平均得分由低到高的順序排列。

首先分析易錯、易缺陷聲調。表1中50個最易出錯、易缺陷音節(jié)中包含26個上聲(3聲)音節(jié),占易錯、易缺陷音節(jié)總數(shù)的52%。由此不難判定上聲是普通話最容易產(chǎn)生錯誤和缺陷的聲調;

第二,考察易錯、易缺陷韻母。50個易錯、易缺陷音中含36個鼻韻母音節(jié),占易錯、易缺陷音節(jié)總數(shù)的72%。鼻韻母高出錯率的統(tǒng)計結果與生活中常見的前后鼻音不分現(xiàn)象相吻合。

第三,分析易錯、易缺陷聲母[6]。表 1中 50個音節(jié)基本涵蓋了所有聲母類型。其中擦音類(j、q、x 、z、c、s、zh 、ch、sh)26 個,零聲母(y 、w 、e)9 個,鼻邊通音類(l、n)8 個,爆破音類(b、k、d、t)7 個 。

擦音是最易產(chǎn)生錯誤和缺陷的聲母,這與普通話使用中常見平舌、翹舌、舌面擦音不分的現(xiàn)象相吻合;第二類易產(chǎn)生錯誤和缺陷的聲母是鼻邊通音中的n、l,和常見的 n、l不分現(xiàn)象相吻合;零聲母和爆破音等不易出現(xiàn)問題的聲母與最易出現(xiàn)錯誤和缺陷的鼻韻母組合,也容易出錯。

表1 常見錯音統(tǒng)計表

綜上所述,普通話聲調中上聲讀音不容易掌握,韻母易錯、易缺陷音大量發(fā)生在鼻韻母音節(jié),而聲母易錯、易缺陷音則集中在平翹舌和舌面擦音,以及n、l上 。

3.2 易錯音出錯頻率統(tǒng)計

為了解各類易錯音素發(fā)生錯誤的頻率,本文將典型易錯音錯誤頻率列于圖4。

圖4 典型易錯音出錯概率統(tǒng)計

圖4可見各類常見錯音中,生僻字正確率最低,讀錯22.9%、缺陷6.16%,兩項合計有近三分之一的音節(jié)不正確;位居第二的是兒化音,16.31%不正確;3、4、5、6 位分別是翹舌擦音(zh、ch、sh)10.23%,前鼻韻母(n結尾)9.85%,后鼻韻母(ing、eng、ang結尾)9.33%,以及邊音(l)9.16%。

雖然生僻字和兒化音出錯頻率很高,但是在最容易出錯的音節(jié)表1中并不顯眼,這是因為它們在試卷中所占比例較小的緣故。

3.3 不同方言背景易錯音分析

不同方言的音素、聲調和語匯集合不同,學說普通話易錯、易缺陷的音也不相同。表2列舉了不同方言背景考生最容易出現(xiàn)錯誤和缺陷的音節(jié),按平均得分由低到高排列。

由表2首先可以看出不同方言背景考生的讀音缺陷方面的共同點:如聲母中的平翹舌擦音和韻母中的鼻韻母缺陷;

第二,從表2也可以看出不同方言背景考生普通話發(fā)音易錯、易缺陷的不同點。同是擦音,粵方言考生發(fā)生在平舌音(z、c、s),閩方言贛方言考生發(fā)生在翹舌音(zh、ch、sh),吳方言考生則二者都有發(fā)生。同是鼻韻母錯誤,吳方言多發(fā)生在后鼻韻母(ng),其他方言前后鼻韻母(n、ng)沒有不同。

表2 不同方言背景易錯音

4 分數(shù)一致性分析

普通話測試采用主觀評分,每位考生分數(shù)由兩位測評員獨立評分再平均。兩位測評員分數(shù)的一致性是最令人關注的問題。本次測試共有15組測評員,每組2人為相同的考生評分。本文選擇其中數(shù)據(jù)量較大的13組,考察兩名測評員分數(shù)的一致性,一致性用兩組分數(shù)的相關性衡量。定義如下:

其中x和y分別為兩個測評員評出的兩組分數(shù),r為兩組分數(shù)的歸一化相關系數(shù)。

4.1 考生總分一致性分析

首先考察兩名測評員為每位考生評出的總成績之間的相關性。計算方法如下:測評員1評出的全部考生的總分組成一個一維序列,測評員2評出的全部考生的總分組成第二個一維序列,兩個序列中考生的排列順序相同。計算這兩個序列的相關性。13組測評員總分相關性繪于圖5。

圖5可見,各組測評員評分相關性分布在0.84到0.99之間,13組測評員平均相關性為0.929 877。說明測評員的判斷高度一致。

4.2 內容關聯(lián)相關性分析

普通話測試分單音節(jié)詞、多音節(jié)詞、短文朗讀和命題說話四部分。以下計算各部分分數(shù)之間的相關性,即內容關聯(lián)相關性。計算方法如下:單音節(jié)詞的100個分數(shù)(滿分0.1)順序排列,多音節(jié)詞的100個分數(shù)(滿分0.2)順序排列其后,短文朗讀分數(shù)(滿分30)和命題說話分數(shù)(滿分40)依次排列其后,得到包含202個分數(shù)的一維序列。兩個測評員為一個考生評出兩個分數(shù)序列。首先計算每個考生的兩個

圖5 考生總分相關性

序列的相關性,然后再對二測評員共同評測的所有考生平均。13組測評員的內容關聯(lián)相關性繪于圖6。

圖6可見內容關聯(lián)相關性分布在0.81到0.976之間,均值0.841 952。

圖6 內容關聯(lián)相關性

結果表明,首先,關于一個考生在各部分測試內容上的表現(xiàn),不同測評員的看法基本一致。

其次,與圖5比較,內容關聯(lián)相關性低于總分相關性。說明測評員對考生具體音節(jié)正確與否的意見略有相左,但是關于考生普通話總體水平的看法高度一致。

事實上,不同測評員對不同錯音的敏感度不同。如有些測評員對平舌翹舌極為嚴謹,另一些測評員則對前后鼻音更為敏銳。普通話測試的最終成績由兩個測評員平均得到,而互有差異的測評員的分數(shù)平均恰恰保障了測試的完備性。

綜合4.1和4.2我們看到,不同測評員對考生普通話總體水平的判斷高度一致;對考生在測試各部分內容上的分別表現(xiàn)的判斷也基本一致。測試分數(shù)具有高度穩(wěn)定性。換句話說,對于一個特定的考生,無論由哪個測評員作測評,分數(shù)都不會有大的波動。求取均值的步驟進一步提高了分數(shù)穩(wěn)定性。普通話測試的方案設計在分數(shù)穩(wěn)定性角度看來十分合理。

本文統(tǒng)計數(shù)據(jù)表明,普通話測試盡管是主觀評分,但是評出的分數(shù)高度穩(wěn)定,因而也是相對客觀的。

另外,內容關聯(lián)相關性是兩個測評員差異的度量。差異包含對不同錯音的敏感度不同、也包含對所有錯誤的總體容忍度不同。如果能夠進一步分析差異,有效利用,選擇具有不同錯音敏感取向的測評員組成測評組,更可以收到相互補充、完善測試的功效。

5 數(shù)據(jù)采集

為了便于統(tǒng)計,本文建立了“普通話測試信息數(shù)據(jù)庫”(普測庫)。用來采集和統(tǒng)計試題、考生、分數(shù)以及測試音頻等信息。

試題信息包括測試使用的5份字詞試題的漢字內容和拼音,人工錄入“普測庫”??忌畔忌胺窖员尘啊?、“學科背景”等信息,由考生通過網(wǎng)上報名系統(tǒng)填寫,自動導入“普測庫”。分數(shù)信息包括總分、單音節(jié)和多音節(jié)詞中各音節(jié)分數(shù)、短文朗讀和命題說話分數(shù)。利用“普測庫”分數(shù)錄入工具人工錄入。(少數(shù)試卷沒有字詞部分各音節(jié)分數(shù),則不參加內容關聯(lián)相關性統(tǒng)計。)音頻信息在測試現(xiàn)場錄音,經(jīng)數(shù)字化后,由“普測庫”自動切分工具切分成100個單音節(jié)詞、48或49個多音節(jié)詞、短文和命題說話諸部分。以音頻文件的形式存放在預設的分類目錄之下。各個音頻文件的存放路徑收入“普測庫”。

“普測庫”實現(xiàn)了各種考生信息、分數(shù)信息、音頻信息的關聯(lián)查詢。查詢細化到聲韻母及聲調。

本文全部數(shù)據(jù)都是首先通過“普測庫”關聯(lián)查詢得到基礎數(shù)據(jù),用Excel或本文編寫的統(tǒng)計軟件自動計算得到的。

6 小結

本文以普通話測試數(shù)據(jù)為依據(jù),分析了方言背景和學科背景對普通話水平的影響,發(fā)現(xiàn)文學類學科普通話水平較高,其他學科普通話水平不相上下。本文從主要失分音素和發(fā)音難點兩方面考察了普通話測試中的易錯音節(jié)。文中分數(shù)相關性統(tǒng)計表明,不同測評員主觀測評之間有很高的相關度,評出的分數(shù)是比較客觀的。本文還指出基于測評員錯音敏感差異分析的測評員分組將會有助于提高測試的完備性。

[1] 賀靜坤.普通話水平測試研究綜述[J].魯東大學學報:哲學社會科學版,2008,25(6):63-67.

[2] 林燾,王理嘉.語音學教程[M].北京:北京大學出版社,1992.

[3] 李印久.多方言環(huán)境條件下的普通話教學[J].湖南科技學院學報,2009,30(7):145-147.

[4] 國家語言文字工作委員會普通話培訓測試中心.普通話水平測試實施綱要[M].北京:商務印書館,2004.

[5] 周同春.漢語語音學[M].北京:北京師范大學出版社,2003.

[6] 徐秉錚,邱偉.漢語普通話聲母的分類與識別[J].中文信息學報,1993,7(1):33-39.

猜你喜歡
易錯音節(jié)普通話
攻克“不等式與不等式組”易錯點
『壓強』易錯警示
立體幾何易錯警示
三角函數(shù)中防不勝防的易錯點
拼拼 讀讀 寫寫
我教爸爸說普通話
藏文音節(jié)字的頻次統(tǒng)計
如果古人也說普通話
學生天地(2016年19期)2016-04-16 05:15:26
快樂拼音
17
太仆寺旗| 江安县| 淮阳县| 隆德县| 阿拉尔市| 班玛县| 富民县| 南召县| 正定县| 万盛区| 大庆市| 遂溪县| 荔波县| 博客| 灌云县| 台山市| 黔西| 镇沅| 夹江县| 太康县| 嘉祥县| 大关县| 永城市| 兴化市| 尼勒克县| 青川县| 黄石市| 扎赉特旗| 哈巴河县| 桂东县| 阜城县| 桑日县| 句容市| 安西县| 东宁县| 大新县| 吴忠市| 晋中市| 涿州市| 台东县| 青海省|