摘 要:計(jì)算機(jī)智能測(cè)試和信息管理系統(tǒng)的結(jié)合規(guī)范了普通話水平測(cè)試程序,提高了測(cè)試效率,降低了測(cè)試成本,促進(jìn)了普通話水平測(cè)試管理工作的發(fā)展。但“說話”仍是依賴人工評(píng)判的測(cè)試項(xiàng),新的測(cè)試手段、測(cè)試模式以及測(cè)試時(shí)出現(xiàn)的新情況、新問題會(huì)影響測(cè)試的信度。因此,把人文關(guān)懷滲透到測(cè)試的方方面面,是進(jìn)一步提高“說話”的測(cè)試信度,完善普通話水平測(cè)試的有效嘗試。
關(guān)鍵詞:普通話水平智能測(cè)試 說話 信度 影響 對(duì)策
普通話水平測(cè)試(以下簡(jiǎn)稱PSC)是國(guó)家推廣普通話工作的重要組成部分。自2007年國(guó)家語委正式推廣應(yīng)用計(jì)算機(jī)智能測(cè)試和信息管理系統(tǒng)后,許多省市已實(shí)現(xiàn)了計(jì)算機(jī)輔助測(cè)試普通話。利用智能測(cè)試系統(tǒng),計(jì)算機(jī)可以自動(dòng)完成對(duì)有文字憑借的前三題的測(cè)評(píng),而對(duì)于無文字憑借的“說話”測(cè)試項(xiàng),則由信息管理系統(tǒng)分配給測(cè)試員進(jìn)行評(píng)分,然后管理系統(tǒng)自動(dòng)將計(jì)算機(jī)測(cè)評(píng)的前三題的分?jǐn)?shù)和測(cè)試員評(píng)判的第四題的分?jǐn)?shù)相加,計(jì)算出考生的測(cè)試總成績(jī),并評(píng)定出相應(yīng)等級(jí)。普通話智能測(cè)試簡(jiǎn)化了評(píng)測(cè)程序,降低了測(cè)試站組織評(píng)測(cè)的難度和成本,減輕了測(cè)試員的工作量和勞動(dòng)強(qiáng)度,提高了測(cè)試質(zhì)量。但《普通話水平測(cè)試大綱》規(guī)定的考核內(nèi)容與評(píng)分標(biāo)準(zhǔn)是既定的,特別是“說話”仍是依賴人工評(píng)判的測(cè)試項(xiàng),免不了還是會(huì)受到測(cè)試員經(jīng)驗(yàn)?zāi)芰?、心理因素或自身素養(yǎng)的影響。測(cè)試手段改變之初,一些新情況、新問題的出現(xiàn),也會(huì)影響到測(cè)試的信度。
信度是指測(cè)試的可靠性或穩(wěn)定性,指測(cè)試結(jié)果在多大程度上反映了受試者的實(shí)際語言水平。信度是測(cè)試的基本保證,一個(gè)良好的語言測(cè)試,必須要有較高的信度。影響信度的因素很多,并且存在于語言測(cè)試的每個(gè)環(huán)節(jié)中,如試卷樣本的大小與區(qū)分度、測(cè)試環(huán)境、試題管理、考生的心理因素、評(píng)分者的經(jīng)驗(yàn)?zāi)芰靶睦硪蛩氐取?/p>
為了進(jìn)一步完善PSC,考察機(jī)輔測(cè)試中影響“說話”測(cè)試項(xiàng)信度的因素并探尋其改進(jìn)途徑具有重要意義。
一、普通話水平智能測(cè)試對(duì)說話信度的影響
(一)普通話水平智能測(cè)試中“說話”測(cè)試項(xiàng)的測(cè)評(píng)特點(diǎn)
普通話水平智能測(cè)試對(duì)“說話”測(cè)試項(xiàng)的測(cè)評(píng)方式具有以下特點(diǎn):第一,機(jī)測(cè)人評(píng),測(cè)評(píng)分離,測(cè)在前,評(píng)在后。機(jī)測(cè)結(jié)束后,由測(cè)試中心管理員按照登記的測(cè)試員和試卷的情況,將“說話”語音分配給各個(gè)測(cè)試員進(jìn)行人工評(píng)判。第二,測(cè)試員通過網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程判分。登錄測(cè)試中心網(wǎng)頁(yè)后,測(cè)試員通過網(wǎng)絡(luò)對(duì)考生“說話”語音進(jìn)行在線評(píng)分。第三,增加了評(píng)分標(biāo)準(zhǔn)。除了對(duì)語音檔、詞匯語法規(guī)范程度、自然流暢度進(jìn)行測(cè)評(píng)外,還對(duì)離題、缺時(shí)、無效語料等方面做了規(guī)定。第四,測(cè)試員分散,“背靠背”獨(dú)立評(píng)測(cè),不能與其他測(cè)試員就同一應(yīng)試者的評(píng)定進(jìn)行溝通與商討。第五,定時(shí)嚴(yán)格,測(cè)試過程完整。
與傳統(tǒng)的人工測(cè)評(píng)相比,新的測(cè)評(píng)方式可以有效地防止以前存在的對(duì)“說話”測(cè)試項(xiàng)隨意增刪內(nèi)容或時(shí)間的現(xiàn)象,可以避免在測(cè)試過程中由于測(cè)試員測(cè)試疲勞而導(dǎo)致的漏判和誤判現(xiàn)象,可以杜絕人情分,加上“說話”由全省測(cè)試員獨(dú)立打分,較以前多了一個(gè)復(fù)審環(huán)節(jié),因此,從某種程度上說,其準(zhǔn)確性有了一定的保證。但從測(cè)試實(shí)踐來看,我們發(fā)現(xiàn),新的測(cè)試方式帶來了一些新問題、新情況,而這些新問題與新情況影響到了測(cè)試的信度。
(二)普通話水平智能測(cè)試對(duì)“說話”信度的影響
為了對(duì)機(jī)測(cè)的信度進(jìn)行測(cè)定,我們運(yùn)用重測(cè)法與重判法做了一些考察和實(shí)驗(yàn)。先拿同一份試卷用重測(cè)法對(duì)同一組受試者分時(shí)段進(jìn)行傳統(tǒng)的人工測(cè)試與機(jī)輔測(cè)試,發(fā)現(xiàn)應(yīng)試者的應(yīng)試狀態(tài)有異,機(jī)輔測(cè)試時(shí)應(yīng)試者的緊張、不自然等非語音因素較重。再用重判法比較測(cè)試員對(duì)“說話”測(cè)試項(xiàng)先后兩次的評(píng)分結(jié)果,發(fā)現(xiàn)機(jī)測(cè)結(jié)果與人測(cè)結(jié)果之間存在較大差距。我們認(rèn)為,測(cè)試手段的改變,對(duì)測(cè)試環(huán)境與測(cè)試方式、測(cè)試員的評(píng)分習(xí)慣、評(píng)分標(biāo)準(zhǔn)以及應(yīng)試者的測(cè)試心理與狀態(tài)都產(chǎn)生了較大的影響,這些都是測(cè)試信度受損的直接因素。
1.測(cè)試環(huán)境、測(cè)試方式及其對(duì)應(yīng)試者應(yīng)試心理的影響
“普通話水平測(cè)試是一種能力考察,因此測(cè)試環(huán)境越接近生活,越容易測(cè)查出真實(shí)的水平?!盵1]“說話”本身就是一種傾訴,它需要傾聽者與說話者進(jìn)行思想與情感的互動(dòng)。在傳統(tǒng)的測(cè)試環(huán)境中,應(yīng)試者需面對(duì)幾位測(cè)試員就某一話題發(fā)表單向談話,這種“三堂會(huì)審”式的陣勢(shì)可能會(huì)增加受測(cè)者的心理緊張程度,但測(cè)試員可以通過表情、態(tài)度、眼神或偶爾的雙向談話來緩解應(yīng)試者的緊張情緒。同時(shí),遇到諸如聲音過小、語速過慢過快、離題、缺時(shí)等不良現(xiàn)象時(shí),測(cè)試員可對(duì)應(yīng)試者加以提醒,這在一定程度上有助于應(yīng)試者語言水平的正常發(fā)揮。但在機(jī)輔測(cè)試下,卻是另一種情形。首先,應(yīng)試者完全沒有交流對(duì)象,沒有互動(dòng),沒有提醒,只有電腦屏幕下方不斷累積時(shí)長(zhǎng)的計(jì)分條,這有可能導(dǎo)致部分應(yīng)試者緊張程度加劇,不可避免地出現(xiàn)嚴(yán)重缺時(shí)、無效語料、簡(jiǎn)單重復(fù)、離題等現(xiàn)象。其次,應(yīng)試者測(cè)試過程的語速、音量把握不好會(huì)影響到錄音質(zhì)量,無意中把玩麥克風(fēng)、數(shù)據(jù)線或其他物品,也會(huì)影響到錄音效果。第三,機(jī)測(cè)時(shí)如果隔音效果不好,同一測(cè)試室中應(yīng)試者之間的測(cè)查內(nèi)容會(huì)相互干擾,這會(huì)在一定程度上影響應(yīng)試者的測(cè)試情緒與測(cè)試成績(jī)。最后,應(yīng)試者一旦進(jìn)入測(cè)試,就失去了對(duì)考試環(huán)境與考試模式熟悉的過程,為了不影響測(cè)試成績(jī),應(yīng)試者必須在規(guī)定的時(shí)間內(nèi)一道題接一道題地讀下去,特別是語音提示后單調(diào)的一聲“嘟”,更平添了許多緊張與壓抑,尤其是“說話”,除非考前做好了充分的準(zhǔn)備,否則是難以在瞬間的應(yīng)急狀態(tài)下做到思路清晰、語言流暢、言之有物的。
2.新增評(píng)分標(biāo)準(zhǔn)可行性不強(qiáng)
“說話”向來是測(cè)評(píng)難度最高、評(píng)分出入最大的測(cè)試項(xiàng),主要原因在于評(píng)分標(biāo)準(zhǔn)難以把握。
在傳統(tǒng)的測(cè)試中,《大綱》規(guī)定“說話”有4個(gè)評(píng)分項(xiàng):語音標(biāo)準(zhǔn)程度、詞匯語法規(guī)范程度、自然流暢程度、缺時(shí)扣分。開展計(jì)算機(jī)輔測(cè)后,由于考場(chǎng)的特殊性,考生極易出現(xiàn)無效語料、延時(shí)開口、內(nèi)容雷同、離題、停頓過多等新情況,為了解決這些問題,國(guó)家新增了對(duì)離題、無效語料、朗讀文本、缺時(shí)等評(píng)分項(xiàng)的補(bǔ)充規(guī)定。如對(duì)離題、雷同、無效話語等情況給出的標(biāo)準(zhǔn)是視程度扣4、5、6分。暫且不論如何準(zhǔn)確地把握“視程度”,僅就扣分來看,就有點(diǎn)太過嚴(yán)格,扣分是為了懲戒測(cè)試中的惡意離題、雷同者,但這種情況的出現(xiàn)與測(cè)試自身存在的諸多不足有著莫大的聯(lián)系。同時(shí),對(duì)于出現(xiàn)的這些新問題,國(guó)家也沒有形成統(tǒng)一明確的定性描述。如在朗讀文本這一項(xiàng)中,對(duì)何為朗讀文本,又有哪些具體表現(xiàn),應(yīng)如何判定,它和自然流暢度里的背稿子有何質(zhì)的區(qū)別等問題沒有做出明確的說明。再如,缺時(shí)與無效語料、自然流暢度之間有沒有同質(zhì)性?有沒有重復(fù)扣分的可能?不同的理解會(huì)出現(xiàn)不同的評(píng)分細(xì)則,如何靈活地變通評(píng)分標(biāo)準(zhǔn),對(duì)各種新情況做出客觀公正的判斷,對(duì)測(cè)試員來說無疑是一個(gè)嚴(yán)峻的考驗(yàn)。
3.新的評(píng)分方式太過孤立
“PSC得出的結(jié)論是建立在精確的定量評(píng)估和模糊的定性評(píng)價(jià)的對(duì)立統(tǒng)一之上的?!痹趥鹘y(tǒng)的測(cè)試中,對(duì)“說話”的等級(jí)定性可以前三題測(cè)試的定量評(píng)估為參考依據(jù)。實(shí)施機(jī)輔測(cè)試后,測(cè)試員通過測(cè)試管理系統(tǒng)接受評(píng)分任務(wù),對(duì)“說話”項(xiàng)進(jìn)行在線評(píng)分,這樣一方面失去了對(duì)前三項(xiàng)的定量參照與應(yīng)試者語音面貌的整體感知,另一方面也失去了與其他測(cè)試員面對(duì)面互相參考的機(jī)會(huì)。測(cè)試方式的改變,使測(cè)試員在評(píng)分過程中難以改變?cè)械脑u(píng)測(cè)思維與習(xí)慣,評(píng)分尺度不好把握,甚至無所適從,不可避免地會(huì)出現(xiàn)評(píng)分較之前過嚴(yán)或過松的現(xiàn)象。
4.測(cè)試員對(duì)新的測(cè)試方式的適應(yīng)能力有差異
普通話智能測(cè)試對(duì)測(cè)試員的素質(zhì)提出了更高的標(biāo)準(zhǔn)與更嚴(yán)的要求。計(jì)算機(jī)輔助測(cè)試中出現(xiàn)的新情況、新問題,必然要求測(cè)試員改變固有的測(cè)試經(jīng)驗(yàn)與評(píng)測(cè)習(xí)慣,在短期內(nèi)適應(yīng)和熟悉新的測(cè)試模式,準(zhǔn)確把握新的評(píng)分標(biāo)準(zhǔn),熟練地進(jìn)行上機(jī)操作。但是測(cè)試員的職業(yè)、專業(yè)背景、文化素養(yǎng)、業(yè)務(wù)素質(zhì)及測(cè)試工作經(jīng)驗(yàn)等存在著個(gè)體差異性,他們適應(yīng)能力的高低、責(zé)任心的大小、聽辨能力的高低、語言理論知識(shí)的強(qiáng)弱、語音心理定勢(shì)的有無、對(duì)評(píng)分標(biāo)準(zhǔn)理解程度的深淺等都有可能影響到“說話”評(píng)分的準(zhǔn)確性。
二、突出人文關(guān)懷,提高普通話水平智能測(cè)試的信度
“人文關(guān)懷是社會(huì)文明進(jìn)步的標(biāo)志,是人類自覺意識(shí)提高的反映,簡(jiǎn)言之,就是關(guān)心人、愛護(hù)人、尊重人、關(guān)注人的生存與發(fā)展”。普通話水平測(cè)試中的“說話”不是語言知識(shí)、文化水平的測(cè)試,也不是演講口才的評(píng)估,而是對(duì)應(yīng)試者語言水平的考查,是對(duì)被測(cè)人在無文字憑借下運(yùn)用普通話所達(dá)到的標(biāo)準(zhǔn)程度的檢測(cè)和評(píng)定。普通話水平測(cè)試的最終目的是促進(jìn)全社會(huì)普通話水平的提高,推動(dòng)全國(guó)普通話的普及。測(cè)試只是一種手段而不是目的,機(jī)輔測(cè)試需要更多的人文關(guān)懷。堅(jiān)持“以人為本”,關(guān)注應(yīng)試者的感受和體驗(yàn),使受試人始終保持一種輕松愉快的測(cè)試心態(tài),對(duì)其進(jìn)行公平公正的評(píng)測(cè),可最大限度地反映受試者的實(shí)際語言水平,從而提高測(cè)試的可靠性。
(一)采取靈動(dòng)自然的考核形式
“說話”測(cè)試項(xiàng)的主要目的是為了檢測(cè)應(yīng)試者在自然狀態(tài)下使用普通話的能力,側(cè)重語言形式的考核。目前“說話”測(cè)試采用的是“命題說話”形式,雖以言語內(nèi)容為載體,但表達(dá)的內(nèi)容卻不是測(cè)試的初衷,同時(shí)單向的說話方式也增加了應(yīng)試者表達(dá)的尷尬?;诖?我們認(rèn)為有必要采取靈動(dòng)自然的考核形式,比如在題后可就主題設(shè)置多個(gè)提問或作答提綱,這些提示的設(shè)計(jì)可以幫助應(yīng)試者理順說話思路,克服緊張狀態(tài),實(shí)現(xiàn)應(yīng)試者與計(jì)算機(jī)的“雙向”交流,把應(yīng)試者從“無話可說”的窘境中解脫出來,讓內(nèi)容不再成為表達(dá)形式的羈絆,還應(yīng)試者一個(gè)真正的自然狀態(tài)。
(二)研制明確理性的評(píng)分標(biāo)準(zhǔn)
測(cè)試方式的改變,使測(cè)試員失去了對(duì)前三項(xiàng)的定量參照,從而在在線評(píng)分時(shí)可能會(huì)出現(xiàn)評(píng)分尺度把握不當(dāng)?shù)那闆r。解決這個(gè)問題的前提是必須研制出科學(xué)、細(xì)致、明確、操作性較強(qiáng)的評(píng)分標(biāo)準(zhǔn),能對(duì)測(cè)試時(shí)出現(xiàn)的不同程度的新情況、新問題做出準(zhǔn)確的定性判斷與理性的定量裁定。并列評(píng)分指標(biāo)之間要有明確的界限,不可籠統(tǒng)含糊,更不能有重復(fù)扣分或扣分過嚴(yán)過松的現(xiàn)象,真正實(shí)現(xiàn)測(cè)試的公平與公正,體現(xiàn)測(cè)試的人文關(guān)懷。
(三)設(shè)計(jì)人性化的說話測(cè)試模式
首先,進(jìn)入測(cè)試后,系統(tǒng)應(yīng)留有一定的時(shí)間,讓應(yīng)試者有一個(gè)思維緩沖、熟悉環(huán)境的過程,應(yīng)試者做好適當(dāng)?shù)臏?zhǔn)備后再點(diǎn)擊“開始錄音”,讓測(cè)試生效。其次,可賦予計(jì)算機(jī)以“靈性”與“生命”。如通過建立友好活潑和諧的界面給應(yīng)試者營(yíng)造一種輕松愉快的測(cè)試氛圍;設(shè)計(jì)親切可愛的小卡通與應(yīng)試者進(jìn)行簡(jiǎn)單的互動(dòng),如缺時(shí)或無效語料提醒等;在題目切換時(shí),可輔以簡(jiǎn)短動(dòng)聽的音樂??傊?要盡量創(chuàng)造仿真的生活環(huán)境與語言情景,消除應(yīng)試者面對(duì)計(jì)算機(jī)時(shí)因缺乏交流對(duì)象而產(chǎn)生的不適感或因特殊的測(cè)試環(huán)境而產(chǎn)生的緊張感。
(四)測(cè)試員要樹立“以人為本”的理念
一個(gè)優(yōu)秀的測(cè)試員應(yīng)把應(yīng)試者作為一個(gè)特殊的交際對(duì)象來對(duì)待,雖然在評(píng)分過程中只聞其聲,不見其人,但也應(yīng)給應(yīng)試者一些人文關(guān)懷。由于沒有考場(chǎng)監(jiān)測(cè),測(cè)試員更應(yīng)對(duì)測(cè)試時(shí)出現(xiàn)的新問題盡量做出全面的分析與正確的判斷,不能憑主觀猜測(cè),更不能憑已有經(jīng)驗(yàn)草率評(píng)分,而要做到謹(jǐn)慎但不失靈活,嚴(yán)格但不失關(guān)愛。同時(shí),要更多地學(xué)習(xí)與掌握有關(guān)的語言學(xué)知識(shí),與時(shí)俱進(jìn),“適應(yīng)新形勢(shì),研究新問題,了解新政策,學(xué)習(xí)新規(guī)章,掌握新措施”[2],做到以測(cè)促學(xué)、以測(cè)促研,不斷提高自身素養(yǎng),努力實(shí)現(xiàn)人文關(guān)懷與科學(xué)精神的有機(jī)統(tǒng)一。
注 釋:
[1]佟樂泉.不斷提高普通話水平測(cè)試的科學(xué)水平[J].語言文字應(yīng)用,1997,(3):22.
[2]周小兵.論普通話水平測(cè)試的信度[Z].廣東語言文字網(wǎng),2005.
參考文獻(xiàn):
[1]沈昌明.國(guó)家普通話水平智能測(cè)試系統(tǒng)與人工測(cè)試之比較(上)[N].語言文字周報(bào),2007-6-27.
[2]王永紅.計(jì)算機(jī)智能測(cè)試系統(tǒng)輔助普通話水平測(cè)試應(yīng)注意的問題[N].語言文字周報(bào),2008-5-7.
[3]劉潤(rùn)清.語言測(cè)試和它的方法[M].北京:外語教學(xué)與研究出版社,1991.
(劉湘濤 重慶 長(zhǎng)江師范學(xué)院教師教育學(xué)院 408100)