高校大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口語(yǔ)測(cè)試實(shí)證研究

2013-04-29 00:44:03徐智鑫謝小苑劉長(zhǎng)江陳向俊劉芳谷健飛

現(xiàn)代教育技術(shù) 2013年8期

徐智鑫　謝小苑　劉長(zhǎng)江　陳向俊　劉芳　谷健飛

[摘要]文章是關(guān)于大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口語(yǔ)測(cè)試效果的實(shí)證研究報(bào)告。文章首先通過對(duì)比發(fā)現(xiàn)，計(jì)算機(jī)系統(tǒng)自動(dòng)化判分與教師評(píng)分所得成績(jī)的相關(guān)度為0.911，說明計(jì)算機(jī)評(píng)分基本可代替教師評(píng)分完成直接型口試任務(wù)。其次采用定量和定性分析方法，從受試者和教師角度對(duì)大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的效度和信度進(jìn)行分析，論證了高校口語(yǔ)機(jī)考的可行性和整體測(cè)試效果。

[關(guān)鍵詞]計(jì)算機(jī)口語(yǔ)測(cè)試；效度；信度；可行性

[中圖分類號(hào)]G420 [文獻(xiàn)標(biāo)識(shí)碼]A [論文編號(hào)]1009-8097（2013）08-0076-05 [DOI]10.3969/j.issn.1009-8097.2013.08.015

一、引言

隨著大學(xué)英語(yǔ)教學(xué)改革的不斷深入，口語(yǔ)教學(xué)與測(cè)試日益受到重視。如何為口語(yǔ)教學(xué)提供更高效科學(xué)的測(cè)試方法，已成為諸多學(xué)者研究的熱點(diǎn)之一。為解決傳統(tǒng)口試成本過高、學(xué)生基數(shù)大、教師資源不足、測(cè)試者間信度等問題，大學(xué)英語(yǔ)口試引入了計(jì)算機(jī)輔助語(yǔ)言測(cè)試（Computer-assisted Language Testing，CALT）。目前無論是國(guó)內(nèi)還是國(guó)外，CALT都處于實(shí)驗(yàn)與探索階段，尚未成為一種成熟的大規(guī)?？荚囆问?。為了最大程度的利用計(jì)算機(jī)技術(shù)測(cè)試學(xué)生的真實(shí)口語(yǔ)水平，對(duì)大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的整體效果進(jìn)行全面、深入地研究是非常有必要的。鑒于此，本研究從目前我校大學(xué)英語(yǔ)正在實(shí)施的大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試入手，以受試者和教師參與口語(yǔ)機(jī)考時(shí)的認(rèn)知和態(tài)度為切入點(diǎn)，通過對(duì)比分析直接型口試教師評(píng)分與計(jì)算機(jī)輔助口試系統(tǒng)自動(dòng)化判分的實(shí)驗(yàn)結(jié)果，探究大規(guī)模口語(yǔ)機(jī)考的效度與信度，從而為高校更有效地實(shí)施大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試提供可行性建議。

二、文獻(xiàn)綜述

隨著我國(guó)大學(xué)英語(yǔ)口語(yǔ)教學(xué)重要性的日益凸顯，國(guó)內(nèi)許多學(xué)者進(jìn)行了各種口語(yǔ)測(cè)試方法的研究和實(shí)踐，包括直接型口試、半直接型錄音口試和基于現(xiàn)代化手段的計(jì)算機(jī)輔助口語(yǔ)測(cè)試。目前我國(guó)高校普遍采用直接型口試來測(cè)量學(xué)生的口語(yǔ)交際能力，研究者認(rèn)為，傳統(tǒng)的直接型口試比較貼近現(xiàn)實(shí)生活中的口語(yǔ)交際活動(dòng)，在內(nèi)涵上也體現(xiàn)了語(yǔ)言的交際功能，考官直接參與考生真實(shí)的交際活動(dòng)，直接觀察到考生的面部表情以及身體語(yǔ)言，因此具有“表面效度高、靈活性大、針對(duì)性強(qiáng)的特點(diǎn)”。但是，受考官資源、評(píng)分標(biāo)準(zhǔn)等因素影響，直接型口試的評(píng)分信度通常較低。在半直接型錄音口試中，考生更注重話語(yǔ)輸出的正確性，口語(yǔ)水平的發(fā)揮不受考官的語(yǔ)言水平和情緒的影響，因?yàn)榭谠嚺c評(píng)分分開進(jìn)行，半直接型錄音口試能采集到更多的語(yǔ)言樣本，具有評(píng)分信度高和可操作性強(qiáng)等特點(diǎn)，但是其缺乏真實(shí)口語(yǔ)交際互動(dòng)性的弊端也較為突出。

計(jì)算機(jī)化考試研究始于上世紀(jì)70年代，至90年代才開始走向成熟，并真正開始應(yīng)用于考試的實(shí)踐中。邱東林等基于高校三次大學(xué)英語(yǔ)口語(yǔ)機(jī)考實(shí)驗(yàn)的基礎(chǔ)上，對(duì)比分析了直接型口試與計(jì)算機(jī)口試的利弊，指出后者具有省時(shí)省力、操作簡(jiǎn)便易行、評(píng)分相對(duì)客觀公正、考試語(yǔ)料易于保管的優(yōu)點(diǎn)。蔡基剛通過對(duì)四、六級(jí)計(jì)算機(jī)口試與直接型口試成績(jī)的對(duì)比分析，驗(yàn)證了計(jì)算機(jī)口試的信度和效度，指出計(jì)算機(jī)口語(yǔ)測(cè)試適合目前的社會(huì)需求，能夠解決考生人數(shù)多、考試成本大的難題。高丙梁在比較和分析非英語(yǔ)專業(yè)學(xué)生在計(jì)算機(jī)口試與直接型口試中的表現(xiàn)和應(yīng)試反應(yīng)后發(fā)現(xiàn)，計(jì)算機(jī)口試不僅在形式和內(nèi)容上更豐富，而且在評(píng)分的準(zhǔn)確性和組織實(shí)施的效率上都優(yōu)于其他口試形式。李玉平和金力的問卷調(diào)查也表明大部分學(xué)生對(duì)計(jì)算機(jī)口試持認(rèn)同態(tài)度，并指出在設(shè)計(jì)計(jì)算機(jī)口試的題型時(shí)，測(cè)試者和測(cè)試管理者應(yīng)充分考慮考生的情感因素，通過聽覺、視覺等多感官刺激和多形式試題內(nèi)容，為考生創(chuàng)造較為真實(shí)、輕松的語(yǔ)言交際環(huán)境。此外，國(guó)內(nèi)許多研究者在肯定了計(jì)算機(jī)口試優(yōu)勢(shì)的同時(shí)，也發(fā)現(xiàn)其最不容忽視的問題在于缺乏真實(shí)口語(yǔ)的交際交互性。

總的來說，國(guó)內(nèi)專家對(duì)計(jì)算機(jī)口語(yǔ)測(cè)試的可行性以及反拔作用等方面進(jìn)行了初步研究和論證。但是，將計(jì)算機(jī)口試作為大學(xué)英語(yǔ)課程成就測(cè)試的一個(gè)部分，探討大規(guī)模計(jì)算機(jī)口試的信度、效度和可行性的研究屈指可數(shù)。計(jì)算機(jī)口試能否在高校大規(guī)模使用，取決于其是否具有和直接型口試同樣高的信度和效度。根據(jù)Shohamy等的觀點(diǎn)，如果同一批考生在直接型口試考官評(píng)分與計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分中所得成績(jī)具有高相關(guān)度，則說明這兩個(gè)考試具有相同的效度和可替代性。鑒于此，本研究作為對(duì)比性研究，將詳細(xì)介紹我校進(jìn)行計(jì)算機(jī)口試的實(shí)驗(yàn)，并對(duì)計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和直接型口試教師評(píng)分的結(jié)果進(jìn)行對(duì)比分析，以學(xué)生和教師參與口語(yǔ)機(jī)考時(shí)的認(rèn)知和態(tài)度為切入點(diǎn)，探究口語(yǔ)機(jī)考的效度和信度，為高校實(shí)施大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口試提供實(shí)證依據(jù)和可行性意見。

三、研究過程與研究方法

1.研究對(duì)象及方法

研究對(duì)象為南京航空航天大學(xué)2011級(jí)雙語(yǔ)前期大學(xué)英語(yǔ)教學(xué)實(shí)驗(yàn)班的680名學(xué)生，通過對(duì)研究對(duì)象一次計(jì)算機(jī)口試和一次直接型口試成績(jī)的收集和比較，同時(shí)結(jié)合學(xué)生問卷和教師訪談，分析計(jì)算機(jī)口試的效度、信度和可行性。

2.研究問題與假設(shè)

本研究擬通過對(duì)比實(shí)驗(yàn)，并結(jié)合定量和定性分析，回答三個(gè)問題：（1）計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和直接型口試教師評(píng)分的成績(jī)相關(guān)性是否一致？（2）比起直接型口試，計(jì)算機(jī)口試的效度和信度如何？（3）大規(guī)模計(jì)算機(jī)口試的可行性如何？

3.題型設(shè)計(jì)與要求

兩次口試均以2007年教育部頒布的《大學(xué)英語(yǔ)課程教學(xué)要求》中對(duì)口語(yǔ)表達(dá)能力的較高要求為依據(jù)，即考生能用英語(yǔ)就一般性話題進(jìn)行比較流利的會(huì)話，能基本表達(dá)個(gè)人意見、情感、觀點(diǎn)等，能基本陳述事實(shí)、理由和描述事件，表達(dá)清楚，語(yǔ)音、語(yǔ)調(diào)基本正確。

本研究首先對(duì)參與實(shí)驗(yàn)的680名學(xué)生進(jìn)行了直接型口試，口試題型圍繞所學(xué)教材內(nèi)容展開，包括簡(jiǎn)答題（short-answer question）和6個(gè)主題式對(duì)話（talk based on a given topic）。每場(chǎng)口試由任課教師主持，2名學(xué)生參加。學(xué)生在分別回答完簡(jiǎn)答題后。抽取一個(gè)話題，經(jīng)3分鐘準(zhǔn)備后進(jìn)行連續(xù)2分鐘的對(duì)話交流。

計(jì)算機(jī)口試使用的軟件系統(tǒng)是由安徽科大訊飛信息科技股份有限公司研制的“暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)”。該學(xué)習(xí)平臺(tái)的口試題型由短文跟讀（60分）和話題表述（40分）組成。短文跟讀要求學(xué)生在聽完示范朗讀后，大聲朗讀出現(xiàn)在測(cè)試軟件屏幕上的文字，約250詞，時(shí)間約2分鐘。話題表述由學(xué)生根據(jù)所給提示，自行組織語(yǔ)言進(jìn)行表述。經(jīng)2分鐘準(zhǔn)備后，就所給話題進(jìn)行連續(xù)1分鐘的表述，錄音時(shí)間為2分鐘。每種題型只有一次錄音機(jī)會(huì)。學(xué)生會(huì)看到準(zhǔn)備時(shí)間和答題時(shí)間提示，屏幕下方顯示剩余時(shí)間?？荚嚱Y(jié)束后，學(xué)生提交試卷，計(jì)算機(jī)將收集記錄學(xué)生答案的錄音文件包，并在屏幕上顯示學(xué)生的口試成績(jī)（分別給出單項(xiàng)分和總分）。為了契合期末考試內(nèi)容，話題表述由任課教師從暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)的口試題庫(kù)中抽選了與教材主題一致的六套試題，確保話題難易程度接近直接型口試話題。

兩次考試的評(píng)分依據(jù)包括三個(gè)方面：語(yǔ)言的準(zhǔn)確性和范圍、話題的長(zhǎng)短和連貫性以及語(yǔ)言的靈活性和適切性。計(jì)算機(jī)口試系統(tǒng)采取題型分項(xiàng)評(píng)分法：短文跟讀側(cè)重考察語(yǔ)音語(yǔ)調(diào)：話題表述側(cè)重考察語(yǔ)言組織和連貫表達(dá)能力。直接型口試采用綜合評(píng)分法，由任課教師獨(dú)立打分。每場(chǎng)考試滿分均為100分。

4.研究過程

參與計(jì)算機(jī)口試前，實(shí)驗(yàn)對(duì)象在計(jì)算機(jī)中心先行體驗(yàn)了暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)及其考試程序，以熟悉該系統(tǒng)的使用。我校計(jì)算機(jī)中心有250臺(tái)電腦，分為A、B、C、D、E五個(gè)區(qū)域?？荚嚠?dāng)天，學(xué)生分三批先后進(jìn)入計(jì)算機(jī)中心進(jìn)行考試，按班級(jí)就坐在B、C、D、E四個(gè)區(qū)域，每人一臺(tái)電腦，一個(gè)帶有話筒的耳機(jī)。每個(gè)區(qū)域內(nèi)有兩名監(jiān)考教師，其中一名為任課教師，另一名為技術(shù)人員。學(xué)生在電腦上輸入學(xué)號(hào)和密碼即可進(jìn)入考試界面準(zhǔn)備考試。試題由事先準(zhǔn)備好的題庫(kù)隨機(jī)發(fā)放，共有六套試題，每場(chǎng)試題有所不同。相鄰座位學(xué)生的試題形式相同，內(nèi)容不同。每場(chǎng)考試時(shí)間約為20分鐘，其中答題時(shí)間為10分鐘。A區(qū)為備用區(qū)域，如果學(xué)生在口試過程中遇到機(jī)器故障等問題，為了不影響下一批考試，這些學(xué)生將統(tǒng)一在A區(qū)進(jìn)行補(bǔ)測(cè)。

計(jì)算機(jī)口試結(jié)束后首先對(duì)學(xué)生進(jìn)行問卷調(diào)查，問卷共有六個(gè)問題，調(diào)查學(xué)生對(duì)口語(yǔ)機(jī)考的態(tài)度，共發(fā)放問卷680份，有效問卷674份。隨后對(duì)參與口語(yǔ)機(jī)考的六位任課教師進(jìn)行集中訪談，了解她們對(duì)機(jī)考整體效果的認(rèn)知和態(tài)度。

四、研究結(jié)果與討論分析

1.學(xué)生成績(jī)對(duì)比分析

語(yǔ)言交際能力的評(píng)價(jià)最終要以測(cè)試成績(jī)?yōu)橐罁?jù)。為此，對(duì)兩種測(cè)試形式所得的口試成績(jī)進(jìn)行了描述性統(tǒng)計(jì)和相關(guān)性分析。

表1和表2顯示計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分的分?jǐn)?shù)呈正態(tài)分布趨勢(shì)，成績(jī)集中分布80-84分之間，該分?jǐn)?shù)段集中了25.3%的學(xué)生，接近教師評(píng)分的分布比例（32.4%），得分在75-79分之間的考生占24.7%，也很接近教師評(píng)分（27.4%）。但計(jì)算機(jī)系統(tǒng)自動(dòng)化判分的均分低于教師評(píng)分，其差異在于前者在70-74分之間集中了25%的學(xué)生，而教師評(píng)分只占3.5%；同樣，前者在85-89分?jǐn)?shù)段只集中了10.7%的學(xué)生，而教師評(píng)分的分布比例為27.4%，這可能是因?yàn)閷W(xué)生第一次參加計(jì)算機(jī)口試，難免會(huì)感到緊張，或多或少會(huì)影響到口試成績(jī)。此外，直接型口試中教師對(duì)學(xué)生成績(jī)分布的總體主觀把握也會(huì)影響學(xué)生口試成績(jī)的分布狀態(tài)。

表3是對(duì)計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和任課教師主觀評(píng)分的Pearson相關(guān)分析，結(jié)果表明兩者之間的相關(guān)度達(dá)到0.911。根據(jù)金艷和郭杰克的觀點(diǎn)，兩個(gè)不同的考試進(jìn)行同期效度研究，如果相關(guān)達(dá)到0.700，應(yīng)該說是較為滿意的。由此可見，這次實(shí)驗(yàn)中的計(jì)算機(jī)系統(tǒng)自動(dòng)化判分與教師評(píng)分具有相當(dāng)高的一致性。以上分析結(jié)果表明，計(jì)算機(jī)口試在很大程度上能夠反映學(xué)生的真實(shí)口語(yǔ)能力，基本可代替教師批量評(píng)分完成直接型口試任務(wù)。

2.學(xué)生問卷和教師訪談的歸納分析

我們以學(xué)生問卷和教師訪談的形式進(jìn)一步探究了大規(guī)模計(jì)算機(jī)口試的信度、效度和可行性。表4列出了學(xué)生對(duì)口語(yǔ)機(jī)考的認(rèn)知和態(tài)度。

（1）表面效度

效度是語(yǔ)言測(cè)試?yán)碚撝械囊豁?xiàng)重要指標(biāo)，包括表面效度和內(nèi)容效度。表面效度指考生對(duì)測(cè)試的看法和態(tài)度。我們通過問卷（見表4）了解學(xué)生對(duì)計(jì)算機(jī)口試態(tài)度的數(shù)據(jù)顯示：學(xué)生的接受程度高達(dá)66%，也有22.3%的學(xué)生不能接受口語(yǔ)機(jī)考。在測(cè)試過程中，學(xué)生的情感狀態(tài)也會(huì)影響到他們對(duì)計(jì)算機(jī)口試的態(tài)度。直接型口試中，教師的態(tài)度會(huì)影響學(xué)生的焦慮程度。在沒有教師直接參與口語(yǔ)交流的情況下，50.3%的學(xué)生認(rèn)為機(jī)考能緩解焦慮感，29.3%的學(xué)生則表現(xiàn)得更為緊張，這說明在計(jì)算機(jī)口試中，學(xué)生面對(duì)新的測(cè)試手段內(nèi)心的焦慮是不可避免的。此外，61.3%的學(xué)生認(rèn)為自己下一次機(jī)考的口試成績(jī)會(huì)有提高，只有19%的學(xué)生持消極態(tài)度。

以上這些數(shù)據(jù)基本說明計(jì)算機(jī)口試總體上受到了學(xué)生的普遍認(rèn)可，學(xué)生大多持積極態(tài)度，并且對(duì)下一次機(jī)考的成績(jī)抱有信心，也就是說，此次大規(guī)模計(jì)算機(jī)口試具有比較令人滿意的表面效度。

（2）內(nèi)容效度

內(nèi)容效度指測(cè)試中的項(xiàng)目與任務(wù)是否與測(cè)試的總體目標(biāo)相符。問卷要求學(xué)生對(duì)自己的整體表現(xiàn)進(jìn)行自我評(píng)價(jià)，結(jié)果顯示，53.7%的學(xué)生認(rèn)為計(jì)算機(jī)口試能夠真實(shí)反映他們的口語(yǔ)水平。我校的口語(yǔ)測(cè)試為學(xué)業(yè)考試，所測(cè)即所學(xué)，試題難易程度取決于教材難度，考試中的口語(yǔ)交際任務(wù)與測(cè)試的整體目標(biāo)基本相符，因此學(xué)生比較熟悉試題內(nèi)容，在口語(yǔ)機(jī)考中能夠發(fā)揮自己的正常水平，對(duì)自己的表現(xiàn)較為滿意。但是，相對(duì)于直接型口試而言，有49.7%的學(xué)生認(rèn)為計(jì)算機(jī)口試缺乏真實(shí)性。

參與訪談的教師也一致認(rèn)為，事先從口試系統(tǒng)的題庫(kù)中抽取試題，既保障了口試話題與所學(xué)教材內(nèi)容一致，也確保了話題之間的難度系數(shù)比較接近。與直接型口試相比，計(jì)算機(jī)口試解決了耗時(shí)多、效率低的問題。但是，有五位受訪教師也指出，口試系統(tǒng)雖然可以考察學(xué)生的語(yǔ)音語(yǔ)調(diào)、語(yǔ)言組織和連貫表達(dá)能力，卻無法測(cè)試學(xué)生的語(yǔ)言交際能力，由于是人機(jī)對(duì)話，學(xué)生也無法利用身體語(yǔ)言等手段輔助交際，因此，計(jì)算機(jī)口試過程缺乏了一定的真實(shí)性。針對(duì)這一問題，有兩位教師認(rèn)為如果從多維度、全方位去分析口語(yǔ)測(cè)試，其真實(shí)性是一個(gè)相對(duì)的動(dòng)態(tài)概念，無論是直接型口試，還是計(jì)算機(jī)口試，都不可能達(dá)到絕對(duì)的真實(shí)性。經(jīng)過討論，受訪的六位教師最后達(dá)成一致：僅僅通過一場(chǎng)考試就評(píng)判學(xué)生的語(yǔ)言交際能力是片面的，因?yàn)橛行W(xué)生會(huì)因?yàn)榭谠嚂r(shí)面對(duì)教師而感到緊張，出現(xiàn)忘詞或肢體語(yǔ)言不自然等情況，而口語(yǔ)機(jī)考則很難做到互動(dòng)。因此，為了更加全面地評(píng)價(jià)學(xué)生的口語(yǔ)交際能力，需要平衡形成性評(píng)價(jià)和終結(jié)性評(píng)價(jià)兩種考察方式，這樣既可以公正地反映出學(xué)生口語(yǔ)的真實(shí)水平，又可以減輕計(jì)算機(jī)口試無法考察交際能力的弊端。

因此，以上數(shù)據(jù)分析部分證明了計(jì)算機(jī)口試能夠反映學(xué)生的真實(shí)口語(yǔ)水平，同時(shí)，口語(yǔ)試題具有較高的內(nèi)容效度。

（3）信度分析

信度是指測(cè)試的可靠性程度，表現(xiàn)為測(cè)試結(jié)果的穩(wěn)定性，本研究中主要指施考的條件要一致以及閱卷評(píng)分要一致。

針對(duì)施考條件，受訪教師一致認(rèn)為在直接型口試中，學(xué)生在準(zhǔn)備話題時(shí)會(huì)故意讓口語(yǔ)好的學(xué)生獨(dú)占話輪，口語(yǔ)較弱的學(xué)生則“臺(tái)詞”較少，難以保證每個(gè)學(xué)生同樣的發(fā)言時(shí)間。此外，直接型口試中排在后面的學(xué)生可以向已經(jīng)考過的學(xué)生打聽話題內(nèi)容，這些都影響了考試的公平性。而計(jì)算機(jī)口試由屏幕出示話題，相鄰的學(xué)生題目不同，屏幕同時(shí)顯示每個(gè)學(xué)生的發(fā)言時(shí)間，確保了每個(gè)學(xué)生的樣本的量是相同的，公平性也就因此體現(xiàn)出來了。

就閱卷評(píng)分而言，58.3%的學(xué)生認(rèn)為計(jì)算機(jī)口試的評(píng)分更加客觀公正，只有19.2%的學(xué)生持反對(duì)意見（見表4）。受訪教師也指出直接型口試與評(píng)分同時(shí)進(jìn)行，是瞬間的，具有不可重復(fù)性，教師必須對(duì)每組學(xué)生的口語(yǔ)樣本當(dāng)場(chǎng)做出準(zhǔn)確地判斷，給出整體分?jǐn)?shù)，壓力較大，如果沒有較高的專業(yè)素質(zhì)很難做到公正客觀地評(píng)分，而且直接型口試評(píng)分與教師對(duì)學(xué)生成績(jī)分布的總體主觀把握有關(guān)，同時(shí)也受教師之間的評(píng)分標(biāo)準(zhǔn)不一致、個(gè)人喜好、連續(xù)評(píng)分產(chǎn)生疲勞等眾多因素的影響。相較而言，計(jì)算機(jī)系統(tǒng)自動(dòng)化判分采取題型分項(xiàng)評(píng)分法，不受主觀因素影響，使得評(píng)分結(jié)果更客觀、穩(wěn)定、公正。

由此可見，本次計(jì)算機(jī)口試在一定程度上保障了施考的條件，確保了評(píng)分的一致性，由此提高了測(cè)試的信度。

（4）大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的可行性

根據(jù)以上分析，在保證同樣的效度、信度前提下，大規(guī)模計(jì)算機(jī)口試的可行性涉及考試組織實(shí)施、考官評(píng)分資源、考場(chǎng)設(shè)備、考試時(shí)間等成本因素。

與直接型口試相比，受訪教師認(rèn)為計(jì)算機(jī)口試有三點(diǎn)優(yōu)勢(shì)：（1）省時(shí)、省力。以往需要一周的課時(shí)進(jìn)行隨堂口試，而大規(guī)模計(jì)算機(jī)口試只需1.5小時(shí)即可完成。（2）語(yǔ)料易于保管。學(xué)生的原始聲音資料可以完整保留?？荚嚱Y(jié)束后，教師可以按需要進(jìn)行各種分析，為以后的考試、科研和教學(xué)提供各種有益的參考依據(jù)，而直接型口試卻做不到這點(diǎn)。（3）調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性。這次的口語(yǔ)機(jī)考對(duì)雙語(yǔ)班學(xué)生的視聽說自主學(xué)習(xí)起到了督促作用。自從通知學(xué)生期末采取機(jī)考后，學(xué)生對(duì)視聽說更加重視，課后更是利用“暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)”練習(xí)口語(yǔ)。因此，計(jì)算機(jī)口試對(duì)大學(xué)英語(yǔ)的導(dǎo)向作用很好，不僅緩解了教師的工作壓力，還可以有效改變學(xué)生啞巴英語(yǔ)的現(xiàn)象。

部分受訪教師也指出，盡管計(jì)算機(jī)口試有較高的效度和信度，系統(tǒng)自動(dòng)化判分也與教師評(píng)分趨于一致，但要讓學(xué)生完全接受和習(xí)慣計(jì)算機(jī)口試這一新型測(cè)試方法，還需要一個(gè)適應(yīng)過程。這次考試也存在一些問題，例如與直接型口試相比，此次計(jì)算機(jī)口試的題目難度要低一些，題型相對(duì)單一。如果建立了試題庫(kù)的話，就可以事先利用屏幕設(shè)計(jì)現(xiàn)實(shí)生活中各種口語(yǔ)交流的真實(shí)情景，使整個(gè)考試過程更貼近真實(shí)，互動(dòng)性更好。此外，考試期間，少數(shù)計(jì)算機(jī)發(fā)生故障無法使用，雖然對(duì)于這類突發(fā)事件事先有所準(zhǔn)備，學(xué)生可以在預(yù)留考場(chǎng)重新考試，但是在一定程度上會(huì)對(duì)學(xué)生的考試心理產(chǎn)生負(fù)面影響，考試心理素質(zhì)不夠好的學(xué)生極易產(chǎn)生焦慮感。

五、結(jié)論

計(jì)算機(jī)口語(yǔ)測(cè)試已成為我校大學(xué)英語(yǔ)教學(xué)中一個(gè)新的評(píng)估手段。本研究通過對(duì)比分析證明計(jì)算機(jī)系統(tǒng)自動(dòng)化判分性能與教師評(píng)分已非常接近，基本可代替教師批量評(píng)分完成直接型口試任務(wù)。通過學(xué)生問卷和教師訪談發(fā)現(xiàn)，計(jì)算機(jī)口試得到學(xué)生和教師的普遍認(rèn)可，不僅能反映學(xué)生的真實(shí)口語(yǔ)水平，還降低了學(xué)生的考試焦慮感，更能夠公正、有效地測(cè)試出學(xué)生的口語(yǔ)能力，具有較好的測(cè)試效度和信度，在高校大規(guī)模使用具有可行性。當(dāng)然，計(jì)算機(jī)口試的完善有一個(gè)以點(diǎn)到面的問題，例如建立試題庫(kù)、完善考場(chǎng)設(shè)備等。大規(guī)模計(jì)算機(jī)口試是我國(guó)英語(yǔ)教學(xué)改革和教學(xué)手段多樣化的產(chǎn)物。就目前來看，利用現(xiàn)有的教學(xué)技術(shù)，實(shí)現(xiàn)英語(yǔ)口語(yǔ)測(cè)試的現(xiàn)代化，不僅能提高口試的效度和信度、減輕教師工作壓力，而且對(duì)整個(gè)口語(yǔ)教學(xué)將會(huì)產(chǎn)生正面的反撥作用。目前利用計(jì)算機(jī)系統(tǒng)自動(dòng)化判分進(jìn)行口語(yǔ)測(cè)試在高校英語(yǔ)口語(yǔ)測(cè)試中尚處于探索階段，如何更大程度地利用計(jì)算機(jī)實(shí)現(xiàn)接近于真實(shí)語(yǔ)言環(huán)境的測(cè)試，如何將測(cè)試目的與測(cè)試形式統(tǒng)一起來，還需要進(jìn)一步的研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

高校大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口語(yǔ)測(cè)試實(shí)證研究