任翠榮
(濰坊學(xué)院 幼教特教師范學(xué)院,山東 濰坊 261061)
普通話水平測試是對應(yīng)試人員運(yùn)用普通話所達(dá)到的標(biāo)準(zhǔn)程度的檢測和評定。普通話的標(biāo)準(zhǔn)只有一個(gè),普通話水平測試是用這把唯一的標(biāo)準(zhǔn)“尺子”對應(yīng)試人的普通話水平進(jìn)行測量。宋欣橋在 《普通話水平測試中的評分差異》一文中針對等級中正常的非臨界評分差異指出:一級,差異在0.9分以內(nèi)。二級,差異在1.5分以內(nèi)。三級,差異在2分以內(nèi)。如果評分差異過大,超出這一正常范圍,那么測試結(jié)果將會受到質(zhì)疑,影響測試的信度。
每每參加普通話水平測試,經(jīng)常見到分?jǐn)?shù)懸殊的情況。第一次合作的測試員往往要經(jīng)過一個(gè)“磨合期”,分?jǐn)?shù)才慢慢接近。“普通話的標(biāo)準(zhǔn)只有一個(gè)”,測試員心中的這把“尺子”應(yīng)該是一樣的,那為什么評分會有較大差異呢?經(jīng)觀察分析,我認(rèn)為這與測試員的素質(zhì)有很大關(guān)系,可以說測試員的素質(zhì)直接影響到測試信度。
測試員的素質(zhì)主要應(yīng)該包括業(yè)務(wù)素質(zhì)和工作態(tài)度兩個(gè)方面。國家語委頒發(fā)的《關(guān)于普通話水平測試管理工作的若干規(guī)定(試行)》(國語[1997]32號)對測試員提出了明確要求:熟悉推廣普通話工作方針政策和普通話語音理論,掌握《漢語拼音方案》和常用國際音標(biāo),熟悉方言和普通話的一般對應(yīng)規(guī)律,普通話口語水平達(dá)到一級,有較強(qiáng)的普通話水平測試能力和較豐富的測試工作經(jīng)驗(yàn),有高度的事業(yè)心、責(zé)任感和工作熱情。然而現(xiàn)實(shí)情況并非如此。在參加培訓(xùn)的學(xué)員中,科班出身從事漢語教學(xué)與研究工作的內(nèi)行較少,有的教理化,或在某些行政崗位工作。這些人雖然普通話說得標(biāo)準(zhǔn),但缺乏必要的漢語語音理論知識及較強(qiáng)的聽音、辨音、記音能力,即使通過了測試員資格考試,也會對普通話水平的測試質(zhì)量有影響。有的測試員責(zé)任心不強(qiáng),導(dǎo)致了測試結(jié)果信度的降低。
測試員素質(zhì)不高對測試質(zhì)量的影響主要表現(xiàn)在以下幾方面。
首先,普通話水平測試作為一種口試形式,應(yīng)試人發(fā)出的聲音轉(zhuǎn)瞬即逝,這就要求測試員能迅速捕捉應(yīng)試人的發(fā)音特點(diǎn),并對其做出準(zhǔn)確及時(shí)的分析與評判。這一過程要求瞬間完成。訓(xùn)練有素的測試員的這種反應(yīng)幾乎是自動化的,不存在“思索”過程。如果測試員經(jīng)驗(yàn)不足,或?qū)υu分標(biāo)準(zhǔn)不熟悉,對某一字音的評判有猶豫,耽誤了時(shí)間,就會影響到對后面字詞的聽辨。特別是低分段考生,速度可能很快,但錯(cuò)誤百出,根本不容測試員充分思考。第二題是雙音節(jié)詞連讀,實(shí)際速度會更快,這就要求測評員注意力更集中。朗讀項(xiàng)要同時(shí)考查應(yīng)試人的方言語調(diào)、停頓不當(dāng)?shù)葐栴},說話項(xiàng)要同時(shí)考查說話人的語音面貌和詞匯語法使用情況及自然流暢度,可能會顧此失彼,以致漏判。
其次,有些測評員聽辨語音能力不強(qiáng),對有些語音現(xiàn)象不夠敏感,也易造成漏判。例如,陰平調(diào)調(diào)值讀成44,應(yīng)該判缺陷,但測試員沒有感覺到,從而漏判。
再次,評分標(biāo)準(zhǔn)模糊,對所謂定性分析的認(rèn)識不清,造成誤判。如上聲調(diào),許多應(yīng)試者在讀單音節(jié)字詞時(shí)讀成半上,有的測試員判為錯(cuò)誤,有的測試員判為缺陷,分值差別較大。根據(jù)對語音錯(cuò)誤的描述,把“甲”讀作“乙”才算錯(cuò),那么這些讀音應(yīng)判缺陷,因?yàn)楸M管調(diào)值不到位,畢竟還沒有讀成另外的音。如鼻化元音,如果對這一“定性”存在認(rèn)識上的模糊,就易誤判。
最后,測試員個(gè)人的好惡、偏見也易影響評分。有些測試員對某些方音特別反感,把缺陷判成錯(cuò)誤,造成評分過嚴(yán);而對那些能容忍的方音則視而不見,造成評分過松。
雖然錯(cuò)判、漏判一個(gè)字音只有0.2、0.1或0.05分的差異,但是量的積累會產(chǎn)生質(zhì)的變化。
《大綱》規(guī)定:“語調(diào)偏誤,視程度扣0.5分、1分;聲母或韻母的系統(tǒng)性語音缺陷,視程度扣0.5分、1分、2分;停連不當(dāng),視程度扣0.5分、1分、2分;朗讀不流暢(包括回讀),視程度扣0.5分、1分、2分?!边@種描述,本身有其模糊性。如果在“定量”的基礎(chǔ)上“定性”,評分就會多一些依據(jù)、會更客觀些。但是《大綱》對這一項(xiàng)沒有更詳細(xì)的說明,給測試員評分帶來困難。我參加測試員培訓(xùn)班學(xué)習(xí),在該項(xiàng)測評練習(xí)時(shí),全體學(xué)員對同一個(gè)例子進(jìn)行分析評分,有扣2分的,也有扣1分的,甚至有扣0.5分的。在實(shí)際測試過程中,有些測試員只是憑感覺評分,或者以各自的經(jīng)驗(yàn)為參照,主觀隨意性大,寬嚴(yán)尺度不一。僅此一項(xiàng),就可能出現(xiàn)較大的差距。
說話項(xiàng)是考查應(yīng)試人在沒有文字憑借的情況下說普通話的水平,重點(diǎn)測查語音標(biāo)準(zhǔn)程度、詞匯語法規(guī)范程度和自然流暢程度。此項(xiàng)成績占總分的30%,而我省把第三項(xiàng)“選擇和判斷題”刪去,其10分的分值加在了說話語音面貌一欄。這樣,僅語音面貌一欄就占去30分。因此,對語音面貌評分的正確把握相當(dāng)重要,而測試員對這一項(xiàng)的把握也最感困難。首先是對“有方音但不明顯”、“方音比較明顯”、“方音明顯”的理解有分歧。我在考核驗(yàn)證班學(xué)習(xí)時(shí),對一個(gè)案例印象很深:放完一個(gè)考生的說話錄音后,各自打分。多數(shù)測試員認(rèn)為該考生語音面貌不錯(cuò),就扣去4分。最后老師總結(jié)說他方音比較明顯。理由是一些詞輕重音格式不對,應(yīng)歸入三至四檔,應(yīng)扣5—6分。這是各位測試員評分分歧最大的一項(xiàng)。一些測試員只了解一些評分規(guī)則,缺少實(shí)踐經(jīng)驗(yàn),一遇上具體問題就猶豫不決,對自己信心不足,“參考”其他測試員的評分,使自己的評分失去獨(dú)立性。還有一些測試員憑“經(jīng)驗(yàn)”打分或受“經(jīng)驗(yàn)”的負(fù)面影響,僅憑幾句話就給出一個(gè)分?jǐn)?shù),對字音失誤缺少統(tǒng)計(jì)、對語音失誤類型和方言色彩及方音成分缺乏分析。這些都是造成此項(xiàng)評分錯(cuò)檔、出現(xiàn)重大失誤的常見原因。
此外,在實(shí)際測試工作中,任何一項(xiàng)測試,要想得到可信的評分,就必須注意保持測驗(yàn)的必要長度(所謂測驗(yàn)的長度,就是測驗(yàn)項(xiàng)目的多少,測驗(yàn)項(xiàng)目越全面、越多,測驗(yàn)的可靠性就越高)。應(yīng)保證說話的足夠長度,只有這樣,應(yīng)試人真實(shí)的語音面貌才可能全面地展現(xiàn)出來,使評分更客觀、公正,從而提高測試的信度。
測試工作專業(yè)性強(qiáng),測試員一方面要努力加強(qiáng)學(xué)習(xí),開闊視野,提高自己的測評能力,避免技術(shù)層面上的失誤,另一方面要認(rèn)真對待,避免非技術(shù)層面上的偏差,使評分盡可能客觀公正。
普通話測試管理部門也要加大對測試員的監(jiān)管力度,堅(jiān)持后續(xù)培訓(xùn),定期考核,開展測試?yán)碚撗芯浚以诿看螠y試前統(tǒng)一測試標(biāo)準(zhǔn),縮小誤差,提高測試信度。
[1]國家語言文字工作委員會普通話培訓(xùn)測試中心編制.普通話水平測試實(shí)施綱要.北京:商務(wù)印書館,2006.
[2]國家語言文字工作委員會普通話培訓(xùn)測試中心,《語言文字應(yīng)用》編輯部合編.普通話水平測試的理論與實(shí)踐.北京:商務(wù)印書館,1998.