国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

影響普通話水平測試(PSC)成績的因素分析

2020-05-10 19:34楊青
關(guān)鍵詞:區(qū)分度評測普通話

楊青

[摘? ? ? ? ? ?要]? 測試員在進(jìn)行普通話水平測試時,有時不可避免地受到一些因素干擾,使測試成績出現(xiàn)偏差,無法反映應(yīng)試者的真實水平。承認(rèn)普通話測評誤差是真實存在的,不可避免,基于這種認(rèn)識,試圖總結(jié)測試員測試過程中影響測試成績的因素,探討如何能最大限度縮小這些因素對測試成績的影響,使考生普通話水平測試成績更加接近真實水平。

[關(guān)? ? 鍵? ?詞]? 普通話水平測試;測試員;影響因素;測試成績

[中圖分類號]? H102-4? ? ? ? ? ? ?[文獻(xiàn)標(biāo)志碼]? A? ? ? ? ? ? ? [文章編號]? 2096-0603(2020)16-0150-02

普通話水平測試(漢語拼音簡稱為PSC)是一種國家考試,是對語言有較高要求的一些行業(yè)工作人員掌握普通話水平的測試。依據(jù)全國統(tǒng)一標(biāo)準(zhǔn),通過朗讀單字、詞語、短文及說話等項目的口頭測試,對他們掌握普通話的程度進(jìn)行評定。普通話水平測試作為推廣普通話的重要組成部分,無疑是使普通話工作逐步走向現(xiàn)代化的重要措施之一。實行多年發(fā)揮了巨大的作用。但是,無論什么考試,考試本身都不可能百分之百反映受試者的真實水平,都會存在誤差,如何才能最大限度地把誤差限定在最小的范圍內(nèi),這是PSC所有工作人員應(yīng)該探索的問題。本文就測試員主觀因素對PSC考試的影響,做出分析,提出相應(yīng)對策。

現(xiàn)階段的PSC采用計算機輔助測試(CAT-Computer-aided test)的方式進(jìn)行,應(yīng)試者朗讀單字、詞語、短文及說話等項目的口頭測試,全部用計算機錄音保存,之后機器識別評分。機器識別語音有其客觀上的公平性、準(zhǔn)確性,如在測試單音節(jié)、雙音節(jié)時,機器識別相對真實正確。但是有些內(nèi)容的識別相對失真,比如朗讀、說話,機器識別就比較機械,測試成績有偏差,與應(yīng)試者朗讀技巧的真實水平有距離,在語感、情感、結(jié)構(gòu)特點、思想內(nèi)容等方面,機器無法像人一樣細(xì)膩、深刻、靈活地感知。因此,普通話水平測試的后兩道題部分地方采取人工評價的方式進(jìn)行,把應(yīng)試人的應(yīng)試語料用計算機保存,然后線上分發(fā)給3個測試員(通過國家、省普通話水平測試員培訓(xùn)考試成績合格者,被聘為PSC測試員)來評分。人工評價不可避免地受到“人”的主觀影響。

一、主觀原因

就是與“人”有關(guān)的原因,主要指由于測試員的原因造成的評測結(jié)果失準(zhǔn)。

(一)個人評測水平不同

由于評估者的思想水準(zhǔn)、技術(shù)水準(zhǔn)、測試經(jīng)驗多少不同,測試水平也不同。評估標(biāo)準(zhǔn)的理解運用差異性較大,評估結(jié)果也就差異性較大。測試中有的測試員無法反映并記錄錯誤、缺陷,造成測試結(jié)果失真。還有一種情況就是,測試員自己的普通話水平較低、知識掌握有限、經(jīng)驗不足、對錯標(biāo)準(zhǔn)含糊不清,導(dǎo)致把應(yīng)試者正確的答案記錄成錯誤,錯誤的答案記錄成正確,影響測試結(jié)果。雖然這種評分差距已經(jīng)在努力縮小,例如測試誤差越級的,那么評測無效,其他測試員重新評測;不越級的測試誤差采用平均數(shù)計分,也會縮小誤差。

(二)情緒化評價

情緒控制著人們的行為,也控制著對事物的評價。每個測試員都是一個相對獨立的個體,都有各自相對獨立的個性特征、價值體系、情緒體驗。測試員的測試行為總是在各自的價值系統(tǒng)情緒體驗下進(jìn)行,個人的價值系統(tǒng)在測試過程中發(fā)揮著標(biāo)準(zhǔn)的作用(或者說代替標(biāo)準(zhǔn)行職),相對于被試者所表現(xiàn)出來的真實或?qū)嶋H的成績,有些測試員評分過高,有些則過低。有的人成績被高估了,即比他的實際水平要高;有的成績則被低估了,低于應(yīng)得的成績,這種錯誤產(chǎn)生的原因是測試員的情緒體驗,應(yīng)試者關(guān)聯(lián)到測試員高興的情緒體驗,或應(yīng)試者的某些方面激發(fā)了測試員自身的情緒體驗,從而得到增量評價,相反獲得測試員的減量評價。增量評價與減量評價都是能夠避免或者縮小差量的。

(三)偏見式評價

在生活中我們往往會遇到這樣的情況:如果一個人老實忠厚,而另一個人狡詐陰險,那么就會有這樣的評價,好事都是忠厚老實的人去做,而壞事都是陰險狡詐的人干的。其實有時也不盡然,這就是偏見。測試者對應(yīng)試者偏見式的評價,影響到這個人各方面的正確評價,也就是戴有色眼鏡看人。應(yīng)試者的許多特質(zhì)都可能影響測試員對其正確評價,如甜美的聲音可能使測試員產(chǎn)生好感,使其犯增量評價錯誤,忽略其讀音不準(zhǔn)確或朗讀不流暢的失誤,給其一個夸大的評分。還有容貌美麗與丑陋、舉止大方或心理緊張而忸怩、朗讀方式等都可能獲得增量減量評價,而不是正確的評價。

(四)相似性評價

這個名詞來自Stephen P.Robbins的Organiazation Behavior一書,意思是說如果評估者對其他人進(jìn)行評估時,特別注意別人是否具有他自己所具有的某些特點,那他就犯了相似性評價錯誤。例如,假如一個評估者認(rèn)為自己進(jìn)取心很強,在評估他人時,他就可能尋找進(jìn)取心的特點。那么表現(xiàn)出這種特點行為的人就會受益,而其他人則會吃虧。在PSC測試中,如果測試員自己平翹舌音特別好,那么應(yīng)試者的平翹舌音處理好的,就會得高分,即使他的調(diào)值、流暢度以及準(zhǔn)確度都不好。相反,那些不好的應(yīng)試者則會得低分,即使其他方面都不錯。

(五)低區(qū)分度評價

一般來講,PSC測試員可分兩類,一種是高區(qū)分度者,能用測評標(biāo)準(zhǔn)各個分?jǐn)?shù)級別進(jìn)行評估;另一種是低區(qū)分者,只能用其中有限的等級評測。低區(qū)分度者傾向于忽視或縮小差別,他們看到的同一性比實際情況要高。相反,高區(qū)分度者則能更好地發(fā)現(xiàn)差異。在實際測試中,低區(qū)分度的測試員常常不能發(fā)現(xiàn)差別、錯誤,無法按評測標(biāo)準(zhǔn)評測出正確的成績。而高區(qū)分度的測試員則能按標(biāo)準(zhǔn)評測出錯誤缺陷,記錄詳細(xì)完備,能夠做出正確的評價。

二、客觀原因

主要指試題命題及測試管理工作存在的不足。

(一)試題的歧義性

命題要求應(yīng)該具有唯一性,口語測試是有時間限制的瞬間口語反應(yīng),如答案具有歧義性,則勢必影響時間。所以岐義性試題應(yīng)設(shè)置解題情境,避免答案的岐義性。例如,測試讀單音節(jié)字詞,經(jīng)常出現(xiàn)多音字,本題最好不要出現(xiàn)多音字,即便出現(xiàn),也應(yīng)設(shè)計出具體的語言環(huán)境,使其讀音在具體的語言環(huán)境中具有唯一性標(biāo)準(zhǔn)答案。測試題二,讀多音節(jié)詞語,應(yīng)極力避免讀音的雙解,如“孫子”是讀輕聲sun zi,還是讀sun zǐ。如果出現(xiàn)也應(yīng)加注語言環(huán)境。部分測試題為了卷面整齊美觀就忽略了標(biāo)注語言環(huán)境,使應(yīng)試者答案與試題標(biāo)準(zhǔn)答案有所不同,答案出現(xiàn)歧義。

(二)考試的信度

一項考試的信度,就是這項考試的一組成績和對同一組考生實施等價考試所得的另一組成績相比較,它們的一致性程度。在實際的測試過程中,PSC測試存在的問題,除了測試員問題外,應(yīng)試者由于心理緊張、焦慮等因素外,可能還與試題的難易度區(qū)分度有關(guān)系。試題的區(qū)分能力就是試題用于考試時使水平高的考生得高分,水平低的考生得低分的傾向力。要做到區(qū)分度高,就應(yīng)注意試題的難易程度,試題應(yīng)難易程度適當(dāng),都在同一水平上波動。

(三)試題的針對性

由于漢語使用地域的廣泛,使得各方言區(qū)的漢語語料有所不同。普通話是建立在“以北京語音為標(biāo)準(zhǔn)音,以北方話為基礎(chǔ)方言,以典范的現(xiàn)代白話文著作為語法規(guī)范”的標(biāo)準(zhǔn)之上,所以普通話與各地區(qū)方言的差異是存在的。PSC除了要測出應(yīng)試者的普通話水平等級之外,還有一個任務(wù),就是推廣普通話,使各地區(qū)的人們使用普通話工作、生活,所以可以研究各方言區(qū)人們的語料特點,學(xué)習(xí)普通話的難點,在擬題時,在滿足評測標(biāo)準(zhǔn)覆蓋率的前提下,擬定有針對性的題目并控制每一題型的比重,做到有針對性。這是建立在滿足PSC標(biāo)準(zhǔn)試題的前提下進(jìn)行的,只有這樣,才能站在國家的立場公平地評估各方言區(qū)的應(yīng)試者,使PSC公正公平地展開,并且能極大地在各方言區(qū)推廣普通話。

(四)管理制度方面

就當(dāng)前來說,測試工作的管理制度已經(jīng)建立,但在具體測試中還存在不完善的地方,存在不能依法執(zhí)行科學(xué)評測程序的問題。測試是由人來安排的,人有其主觀的因素在支配著對測評結(jié)果的界定。測試人員的短缺,受試人數(shù)的倍增,導(dǎo)致測試人員的工作量增加,迫使測試員減免測試的步驟與程序。如試題口頭說話,測試員評測時不按照評測量表評分,忽略量表的科學(xué)性計算,而采取缺乏細(xì)化的等級來評估應(yīng)試者的成績,使測試的精確度降低。可能也存在作弊現(xiàn)象,工作人員數(shù)量不足,勢必要使用一些臨時的借用人員,就給受測人員提供了作弊的機會,出現(xiàn)替考現(xiàn)象,機器儲存的語料非本人的真實語料。

三、改進(jìn)措施

(一)針對主觀原因

一方面擴大機器評測的內(nèi)容,加強機器評測的準(zhǔn)確性、智能評測性,使機器語音識別的準(zhǔn)確性增強。另一方面應(yīng)加大培訓(xùn)測試員的力度,重點培訓(xùn)口語課教師的測試水平。對普通話測試的內(nèi)容、評測標(biāo)準(zhǔn)、評測流程都有深入的了解,培訓(xùn)是建立在已有的知識經(jīng)驗基礎(chǔ)上,培訓(xùn)雙方都很輕松。他們還能把培訓(xùn)成果運用到實際的教學(xué)中,加強課堂教學(xué)實效,對推廣普通話有著更大的意義。

加強制度的監(jiān)管,加強工作人員的評測紀(jì)律約束。由于測試安排完全操縱在測試管理人員手中,管理人員又不足,加上受試者與日俱增使測試量增大,從而有可能導(dǎo)致管理人員工作量劇增,使他們根本忙不過來,于是就必須從下面各學(xué)校借人幫忙,抽調(diào)人的素質(zhì)良莠不齊,應(yīng)該加強監(jiān)管和教育,制定相對的約束規(guī)則。避免可能出現(xiàn)的測試步驟與程序的監(jiān)管不力,如替考、口頭說話帶草稿、提前指定考題等偶發(fā)事件。

(二)針對客觀原因

一方面更加科學(xué)地制訂評測內(nèi)容,避免因測試內(nèi)容難易不同造成測試評分的失真。擬題人員已經(jīng)做出調(diào)整,新大綱已經(jīng)把原40號作品《神奇的燕子洞》、39號作品《世界民居奇葩》拿掉了,因為確實很難。其實也可以把新大綱朗讀作品54號《贈你四味長壽藥》拿掉,因為文章中出現(xiàn)了四次“當(dāng)”這個多音字,一個錯了,四個都得錯,這是不公平的。再如說話題目30個,難度也不一樣,雖然從題目上看,在尋求最大化的難度一致性,可要做到完全一樣的難度,是不可能的,只能縮小差別。還有就是針對多音字的試題,要加注其字的讀音環(huán)境,以確保答案的唯一性,確保測試的規(guī)范性、科學(xué)性。

另一方面使用機器評測。機器語音識別度高于人,更準(zhǔn)確、更高效、更科學(xué),消滅了人為的不確定性、差異性。

綜上所述,PSC誤差消失的最主要因素就是實現(xiàn)更高水平、科學(xué)化、現(xiàn)代化、標(biāo)準(zhǔn)化??茖W(xué)化就是測試過程及試題制定的科學(xué)化管理,它是提高測試信度與效度的重要保證,是克服上述客觀原因的保證?,F(xiàn)代化就是考試手段現(xiàn)代化,是解決測試完全由人所帶來的主觀原因造成誤差的關(guān)鍵,要加強機器語音識別的精準(zhǔn)度,是解決社會測試需求不斷增加的根本出路。標(biāo)準(zhǔn)化就是在科學(xué)化現(xiàn)代化的基礎(chǔ)上,按照最優(yōu)化要求建立統(tǒng)一高效的工作程序。

參考文獻(xiàn):

[1]國家語言文字工作委員會普通話培訓(xùn)測試中心.普通話水平測試大綱[M].北京:商務(wù)印書館,2004.

[2]斯蒂芬·羅賓斯,蒂莫西·賈奇.組織行為淡定[M].北京:中國人民大學(xué)出版社,2008-01.

[3]安妮特·西蒙斯.你的團(tuán)隊需要一個會講故事的人[M].尹曉虹,譯.南京:江蘇鳳凰文藝出版社,2016.

編輯 王海文

猜你喜歡
區(qū)分度評測普通話
我是中國娃愛講普通話
《生物統(tǒng)計》的試卷分析與解讀
淺觀一道題的“區(qū)分度”
利用垂直平分線的定義巧解題
17
廣而告之推廣普通話
從北京奧運走來聯(lián)想IdeapadY530長期評測
現(xiàn)代計算機(2009年9期)2009-12-02
MI評測產(chǎn)品排行榜
6款網(wǎng)絡(luò)電視直播軟件橫向評測
襄垣县| 新乡市| 龙里县| 特克斯县| 偃师市| 卢湾区| 乳源| 班戈县| 焦作市| 中宁县| 安丘市| 南投县| 溧阳市| 鹤壁市| 德保县| 凭祥市| 重庆市| 库尔勒市| 北票市| 永兴县| 桂林市| 瑞昌市| 海宁市| 灌云县| 板桥市| 沙雅县| 大厂| 临湘市| 积石山| 渝北区| 同江市| 观塘区| 富宁县| 汨罗市| 凉城县| 浪卡子县| 鄂伦春自治旗| 江孜县| 平塘县| 芦山县| 张家界市|