徐智鑫 謝小苑 劉長(zhǎng)江 陳向俊 劉芳 谷健飛
[摘要]文章是關(guān)于大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口語(yǔ)測(cè)試效果的實(shí)證研究報(bào)告。文章首先通過對(duì)比發(fā)現(xiàn),計(jì)算機(jī)系統(tǒng)自動(dòng)化判分與教師評(píng)分所得成績(jī)的相關(guān)度為0.911,說明計(jì)算機(jī)評(píng)分基本可代替教師評(píng)分完成直接型口試任務(wù)。其次采用定量和定性分析方法,從受試者和教師角度對(duì)大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的效度和信度進(jìn)行分析,論證了高校口語(yǔ)機(jī)考的可行性和整體測(cè)試效果。
[關(guān)鍵詞]計(jì)算機(jī)口語(yǔ)測(cè)試;效度;信度;可行性
[中圖分類號(hào)]G420 [文獻(xiàn)標(biāo)識(shí)碼]A [論文編號(hào)]1009-8097(2013)08-0076-05 [DOI]10.3969/j.issn.1009-8097.2013.08.015
一、引言
隨著大學(xué)英語(yǔ)教學(xué)改革的不斷深入,口語(yǔ)教學(xué)與測(cè)試日益受到重視。如何為口語(yǔ)教學(xué)提供更高效科學(xué)的測(cè)試方法,已成為諸多學(xué)者研究的熱點(diǎn)之一。為解決傳統(tǒng)口試成本過高、學(xué)生基數(shù)大、教師資源不足、測(cè)試者間信度等問題,大學(xué)英語(yǔ)口試引入了計(jì)算機(jī)輔助語(yǔ)言測(cè)試(Computer-assisted Language Testing,CALT)。目前無論是國(guó)內(nèi)還是國(guó)外,CALT都處于實(shí)驗(yàn)與探索階段,尚未成為一種成熟的大規(guī)??荚囆问?。為了最大程度的利用計(jì)算機(jī)技術(shù)測(cè)試學(xué)生的真實(shí)口語(yǔ)水平,對(duì)大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的整體效果進(jìn)行全面、深入地研究是非常有必要的。鑒于此,本研究從目前我校大學(xué)英語(yǔ)正在實(shí)施的大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試入手,以受試者和教師參與口語(yǔ)機(jī)考時(shí)的認(rèn)知和態(tài)度為切入點(diǎn),通過對(duì)比分析直接型口試教師評(píng)分與計(jì)算機(jī)輔助口試系統(tǒng)自動(dòng)化判分的實(shí)驗(yàn)結(jié)果,探究大規(guī)模口語(yǔ)機(jī)考的效度與信度,從而為高校更有效地實(shí)施大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試提供可行性建議。
二、文獻(xiàn)綜述
隨著我國(guó)大學(xué)英語(yǔ)口語(yǔ)教學(xué)重要性的日益凸顯,國(guó)內(nèi)許多學(xué)者進(jìn)行了各種口語(yǔ)測(cè)試方法的研究和實(shí)踐,包括直接型口試、半直接型錄音口試和基于現(xiàn)代化手段的計(jì)算機(jī)輔助口語(yǔ)測(cè)試。目前我國(guó)高校普遍采用直接型口試來測(cè)量學(xué)生的口語(yǔ)交際能力,研究者認(rèn)為,傳統(tǒng)的直接型口試比較貼近現(xiàn)實(shí)生活中的口語(yǔ)交際活動(dòng),在內(nèi)涵上也體現(xiàn)了語(yǔ)言的交際功能,考官直接參與考生真實(shí)的交際活動(dòng),直接觀察到考生的面部表情以及身體語(yǔ)言,因此具有“表面效度高、靈活性大、針對(duì)性強(qiáng)的特點(diǎn)”。但是,受考官資源、評(píng)分標(biāo)準(zhǔn)等因素影響,直接型口試的評(píng)分信度通常較低。在半直接型錄音口試中,考生更注重話語(yǔ)輸出的正確性,口語(yǔ)水平的發(fā)揮不受考官的語(yǔ)言水平和情緒的影響,因?yàn)榭谠嚺c評(píng)分分開進(jìn)行,半直接型錄音口試能采集到更多的語(yǔ)言樣本,具有評(píng)分信度高和可操作性強(qiáng)等特點(diǎn),但是其缺乏真實(shí)口語(yǔ)交際互動(dòng)性的弊端也較為突出。
計(jì)算機(jī)化考試研究始于上世紀(jì)70年代,至90年代才開始走向成熟,并真正開始應(yīng)用于考試的實(shí)踐中。邱東林等基于高校三次大學(xué)英語(yǔ)口語(yǔ)機(jī)考實(shí)驗(yàn)的基礎(chǔ)上,對(duì)比分析了直接型口試與計(jì)算機(jī)口試的利弊,指出后者具有省時(shí)省力、操作簡(jiǎn)便易行、評(píng)分相對(duì)客觀公正、考試語(yǔ)料易于保管的優(yōu)點(diǎn)。蔡基剛通過對(duì)四、六級(jí)計(jì)算機(jī)口試與直接型口試成績(jī)的對(duì)比分析,驗(yàn)證了計(jì)算機(jī)口試的信度和效度,指出計(jì)算機(jī)口語(yǔ)測(cè)試適合目前的社會(huì)需求,能夠解決考生人數(shù)多、考試成本大的難題。高丙梁在比較和分析非英語(yǔ)專業(yè)學(xué)生在計(jì)算機(jī)口試與直接型口試中的表現(xiàn)和應(yīng)試反應(yīng)后發(fā)現(xiàn),計(jì)算機(jī)口試不僅在形式和內(nèi)容上更豐富,而且在評(píng)分的準(zhǔn)確性和組織實(shí)施的效率上都優(yōu)于其他口試形式。李玉平和金力的問卷調(diào)查也表明大部分學(xué)生對(duì)計(jì)算機(jī)口試持認(rèn)同態(tài)度,并指出在設(shè)計(jì)計(jì)算機(jī)口試的題型時(shí),測(cè)試者和測(cè)試管理者應(yīng)充分考慮考生的情感因素,通過聽覺、視覺等多感官刺激和多形式試題內(nèi)容,為考生創(chuàng)造較為真實(shí)、輕松的語(yǔ)言交際環(huán)境。此外,國(guó)內(nèi)許多研究者在肯定了計(jì)算機(jī)口試優(yōu)勢(shì)的同時(shí),也發(fā)現(xiàn)其最不容忽視的問題在于缺乏真實(shí)口語(yǔ)的交際交互性。
總的來說,國(guó)內(nèi)專家對(duì)計(jì)算機(jī)口語(yǔ)測(cè)試的可行性以及反拔作用等方面進(jìn)行了初步研究和論證。但是,將計(jì)算機(jī)口試作為大學(xué)英語(yǔ)課程成就測(cè)試的一個(gè)部分,探討大規(guī)模計(jì)算機(jī)口試的信度、效度和可行性的研究屈指可數(shù)。計(jì)算機(jī)口試能否在高校大規(guī)模使用,取決于其是否具有和直接型口試同樣高的信度和效度。根據(jù)Shohamy等的觀點(diǎn),如果同一批考生在直接型口試考官評(píng)分與計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分中所得成績(jī)具有高相關(guān)度,則說明這兩個(gè)考試具有相同的效度和可替代性。鑒于此,本研究作為對(duì)比性研究,將詳細(xì)介紹我校進(jìn)行計(jì)算機(jī)口試的實(shí)驗(yàn),并對(duì)計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和直接型口試教師評(píng)分的結(jié)果進(jìn)行對(duì)比分析,以學(xué)生和教師參與口語(yǔ)機(jī)考時(shí)的認(rèn)知和態(tài)度為切入點(diǎn),探究口語(yǔ)機(jī)考的效度和信度,為高校實(shí)施大規(guī)模計(jì)算機(jī)輔助英語(yǔ)口試提供實(shí)證依據(jù)和可行性意見。
三、研究過程與研究方法
1.研究對(duì)象及方法
研究對(duì)象為南京航空航天大學(xué)2011級(jí)雙語(yǔ)前期大學(xué)英語(yǔ)教學(xué)實(shí)驗(yàn)班的680名學(xué)生,通過對(duì)研究對(duì)象一次計(jì)算機(jī)口試和一次直接型口試成績(jī)的收集和比較,同時(shí)結(jié)合學(xué)生問卷和教師訪談,分析計(jì)算機(jī)口試的效度、信度和可行性。
2.研究問題與假設(shè)
本研究擬通過對(duì)比實(shí)驗(yàn),并結(jié)合定量和定性分析,回答三個(gè)問題:(1)計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和直接型口試教師評(píng)分的成績(jī)相關(guān)性是否一致?(2)比起直接型口試,計(jì)算機(jī)口試的效度和信度如何?(3)大規(guī)模計(jì)算機(jī)口試的可行性如何?
3.題型設(shè)計(jì)與要求
兩次口試均以2007年教育部頒布的《大學(xué)英語(yǔ)課程教學(xué)要求》中對(duì)口語(yǔ)表達(dá)能力的較高要求為依據(jù),即考生能用英語(yǔ)就一般性話題進(jìn)行比較流利的會(huì)話,能基本表達(dá)個(gè)人意見、情感、觀點(diǎn)等,能基本陳述事實(shí)、理由和描述事件,表達(dá)清楚,語(yǔ)音、語(yǔ)調(diào)基本正確。
本研究首先對(duì)參與實(shí)驗(yàn)的680名學(xué)生進(jìn)行了直接型口試,口試題型圍繞所學(xué)教材內(nèi)容展開,包括簡(jiǎn)答題(short-answer question)和6個(gè)主題式對(duì)話(talk based on a given topic)。每場(chǎng)口試由任課教師主持,2名學(xué)生參加。學(xué)生在分別回答完簡(jiǎn)答題后。抽取一個(gè)話題,經(jīng)3分鐘準(zhǔn)備后進(jìn)行連續(xù)2分鐘的對(duì)話交流。
計(jì)算機(jī)口試使用的軟件系統(tǒng)是由安徽科大訊飛信息科技股份有限公司研制的“暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)”。該學(xué)習(xí)平臺(tái)的口試題型由短文跟讀(60分)和話題表述(40分)組成。短文跟讀要求學(xué)生在聽完示范朗讀后,大聲朗讀出現(xiàn)在測(cè)試軟件屏幕上的文字,約250詞,時(shí)間約2分鐘。話題表述由學(xué)生根據(jù)所給提示,自行組織語(yǔ)言進(jìn)行表述。經(jīng)2分鐘準(zhǔn)備后,就所給話題進(jìn)行連續(xù)1分鐘的表述,錄音時(shí)間為2分鐘。每種題型只有一次錄音機(jī)會(huì)。學(xué)生會(huì)看到準(zhǔn)備時(shí)間和答題時(shí)間提示,屏幕下方顯示剩余時(shí)間??荚嚱Y(jié)束后,學(xué)生提交試卷,計(jì)算機(jī)將收集記錄學(xué)生答案的錄音文件包,并在屏幕上顯示學(xué)生的口試成績(jī)(分別給出單項(xiàng)分和總分)。為了契合期末考試內(nèi)容,話題表述由任課教師從暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)的口試題庫(kù)中抽選了與教材主題一致的六套試題,確保話題難易程度接近直接型口試話題。
兩次考試的評(píng)分依據(jù)包括三個(gè)方面:語(yǔ)言的準(zhǔn)確性和范圍、話題的長(zhǎng)短和連貫性以及語(yǔ)言的靈活性和適切性。計(jì)算機(jī)口試系統(tǒng)采取題型分項(xiàng)評(píng)分法:短文跟讀側(cè)重考察語(yǔ)音語(yǔ)調(diào):話題表述側(cè)重考察語(yǔ)言組織和連貫表達(dá)能力。直接型口試采用綜合評(píng)分法,由任課教師獨(dú)立打分。每場(chǎng)考試滿分均為100分。
4.研究過程
參與計(jì)算機(jī)口試前,實(shí)驗(yàn)對(duì)象在計(jì)算機(jī)中心先行體驗(yàn)了暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)及其考試程序,以熟悉該系統(tǒng)的使用。我校計(jì)算機(jī)中心有250臺(tái)電腦,分為A、B、C、D、E五個(gè)區(qū)域??荚嚠?dāng)天,學(xué)生分三批先后進(jìn)入計(jì)算機(jī)中心進(jìn)行考試,按班級(jí)就坐在B、C、D、E四個(gè)區(qū)域,每人一臺(tái)電腦,一個(gè)帶有話筒的耳機(jī)。每個(gè)區(qū)域內(nèi)有兩名監(jiān)考教師,其中一名為任課教師,另一名為技術(shù)人員。學(xué)生在電腦上輸入學(xué)號(hào)和密碼即可進(jìn)入考試界面準(zhǔn)備考試。試題由事先準(zhǔn)備好的題庫(kù)隨機(jī)發(fā)放,共有六套試題,每場(chǎng)試題有所不同。相鄰座位學(xué)生的試題形式相同,內(nèi)容不同。每場(chǎng)考試時(shí)間約為20分鐘,其中答題時(shí)間為10分鐘。A區(qū)為備用區(qū)域,如果學(xué)生在口試過程中遇到機(jī)器故障等問題,為了不影響下一批考試,這些學(xué)生將統(tǒng)一在A區(qū)進(jìn)行補(bǔ)測(cè)。
計(jì)算機(jī)口試結(jié)束后首先對(duì)學(xué)生進(jìn)行問卷調(diào)查,問卷共有六個(gè)問題,調(diào)查學(xué)生對(duì)口語(yǔ)機(jī)考的態(tài)度,共發(fā)放問卷680份,有效問卷674份。隨后對(duì)參與口語(yǔ)機(jī)考的六位任課教師進(jìn)行集中訪談,了解她們對(duì)機(jī)考整體效果的認(rèn)知和態(tài)度。
四、研究結(jié)果與討論分析
1.學(xué)生成績(jī)對(duì)比分析
語(yǔ)言交際能力的評(píng)價(jià)最終要以測(cè)試成績(jī)?yōu)橐罁?jù)。為此,對(duì)兩種測(cè)試形式所得的口試成績(jī)進(jìn)行了描述性統(tǒng)計(jì)和相關(guān)性分析。
表1和表2顯示計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分的分?jǐn)?shù)呈正態(tài)分布趨勢(shì),成績(jī)集中分布80-84分之間,該分?jǐn)?shù)段集中了25.3%的學(xué)生,接近教師評(píng)分的分布比例(32.4%),得分在75-79分之間的考生占24.7%,也很接近教師評(píng)分(27.4%)。但計(jì)算機(jī)系統(tǒng)自動(dòng)化判分的均分低于教師評(píng)分,其差異在于前者在70-74分之間集中了25%的學(xué)生,而教師評(píng)分只占3.5%;同樣,前者在85-89分?jǐn)?shù)段只集中了10.7%的學(xué)生,而教師評(píng)分的分布比例為27.4%,這可能是因?yàn)閷W(xué)生第一次參加計(jì)算機(jī)口試,難免會(huì)感到緊張,或多或少會(huì)影響到口試成績(jī)。此外,直接型口試中教師對(duì)學(xué)生成績(jī)分布的總體主觀把握也會(huì)影響學(xué)生口試成績(jī)的分布狀態(tài)。
表3是對(duì)計(jì)算機(jī)口試系統(tǒng)自動(dòng)化判分和任課教師主觀評(píng)分的Pearson相關(guān)分析,結(jié)果表明兩者之間的相關(guān)度達(dá)到0.911。根據(jù)金艷和郭杰克的觀點(diǎn),兩個(gè)不同的考試進(jìn)行同期效度研究,如果相關(guān)達(dá)到0.700,應(yīng)該說是較為滿意的。由此可見,這次實(shí)驗(yàn)中的計(jì)算機(jī)系統(tǒng)自動(dòng)化判分與教師評(píng)分具有相當(dāng)高的一致性。以上分析結(jié)果表明,計(jì)算機(jī)口試在很大程度上能夠反映學(xué)生的真實(shí)口語(yǔ)能力,基本可代替教師批量評(píng)分完成直接型口試任務(wù)。
2.學(xué)生問卷和教師訪談的歸納分析
我們以學(xué)生問卷和教師訪談的形式進(jìn)一步探究了大規(guī)模計(jì)算機(jī)口試的信度、效度和可行性。表4列出了學(xué)生對(duì)口語(yǔ)機(jī)考的認(rèn)知和態(tài)度。
(1)表面效度
效度是語(yǔ)言測(cè)試?yán)碚撝械囊豁?xiàng)重要指標(biāo),包括表面效度和內(nèi)容效度。表面效度指考生對(duì)測(cè)試的看法和態(tài)度。我們通過問卷(見表4)了解學(xué)生對(duì)計(jì)算機(jī)口試態(tài)度的數(shù)據(jù)顯示:學(xué)生的接受程度高達(dá)66%,也有22.3%的學(xué)生不能接受口語(yǔ)機(jī)考。在測(cè)試過程中,學(xué)生的情感狀態(tài)也會(huì)影響到他們對(duì)計(jì)算機(jī)口試的態(tài)度。直接型口試中,教師的態(tài)度會(huì)影響學(xué)生的焦慮程度。在沒有教師直接參與口語(yǔ)交流的情況下,50.3%的學(xué)生認(rèn)為機(jī)考能緩解焦慮感,29.3%的學(xué)生則表現(xiàn)得更為緊張,這說明在計(jì)算機(jī)口試中,學(xué)生面對(duì)新的測(cè)試手段內(nèi)心的焦慮是不可避免的。此外,61.3%的學(xué)生認(rèn)為自己下一次機(jī)考的口試成績(jī)會(huì)有提高,只有19%的學(xué)生持消極態(tài)度。
以上這些數(shù)據(jù)基本說明計(jì)算機(jī)口試總體上受到了學(xué)生的普遍認(rèn)可,學(xué)生大多持積極態(tài)度,并且對(duì)下一次機(jī)考的成績(jī)抱有信心,也就是說,此次大規(guī)模計(jì)算機(jī)口試具有比較令人滿意的表面效度。
(2)內(nèi)容效度
內(nèi)容效度指測(cè)試中的項(xiàng)目與任務(wù)是否與測(cè)試的總體目標(biāo)相符。問卷要求學(xué)生對(duì)自己的整體表現(xiàn)進(jìn)行自我評(píng)價(jià),結(jié)果顯示,53.7%的學(xué)生認(rèn)為計(jì)算機(jī)口試能夠真實(shí)反映他們的口語(yǔ)水平。我校的口語(yǔ)測(cè)試為學(xué)業(yè)考試,所測(cè)即所學(xué),試題難易程度取決于教材難度,考試中的口語(yǔ)交際任務(wù)與測(cè)試的整體目標(biāo)基本相符,因此學(xué)生比較熟悉試題內(nèi)容,在口語(yǔ)機(jī)考中能夠發(fā)揮自己的正常水平,對(duì)自己的表現(xiàn)較為滿意。但是,相對(duì)于直接型口試而言,有49.7%的學(xué)生認(rèn)為計(jì)算機(jī)口試缺乏真實(shí)性。
參與訪談的教師也一致認(rèn)為,事先從口試系統(tǒng)的題庫(kù)中抽取試題,既保障了口試話題與所學(xué)教材內(nèi)容一致,也確保了話題之間的難度系數(shù)比較接近。與直接型口試相比,計(jì)算機(jī)口試解決了耗時(shí)多、效率低的問題。但是,有五位受訪教師也指出,口試系統(tǒng)雖然可以考察學(xué)生的語(yǔ)音語(yǔ)調(diào)、語(yǔ)言組織和連貫表達(dá)能力,卻無法測(cè)試學(xué)生的語(yǔ)言交際能力,由于是人機(jī)對(duì)話,學(xué)生也無法利用身體語(yǔ)言等手段輔助交際,因此,計(jì)算機(jī)口試過程缺乏了一定的真實(shí)性。針對(duì)這一問題,有兩位教師認(rèn)為如果從多維度、全方位去分析口語(yǔ)測(cè)試,其真實(shí)性是一個(gè)相對(duì)的動(dòng)態(tài)概念,無論是直接型口試,還是計(jì)算機(jī)口試,都不可能達(dá)到絕對(duì)的真實(shí)性。經(jīng)過討論,受訪的六位教師最后達(dá)成一致:僅僅通過一場(chǎng)考試就評(píng)判學(xué)生的語(yǔ)言交際能力是片面的,因?yàn)橛行W(xué)生會(huì)因?yàn)榭谠嚂r(shí)面對(duì)教師而感到緊張,出現(xiàn)忘詞或肢體語(yǔ)言不自然等情況,而口語(yǔ)機(jī)考則很難做到互動(dòng)。因此,為了更加全面地評(píng)價(jià)學(xué)生的口語(yǔ)交際能力,需要平衡形成性評(píng)價(jià)和終結(jié)性評(píng)價(jià)兩種考察方式,這樣既可以公正地反映出學(xué)生口語(yǔ)的真實(shí)水平,又可以減輕計(jì)算機(jī)口試無法考察交際能力的弊端。
因此,以上數(shù)據(jù)分析部分證明了計(jì)算機(jī)口試能夠反映學(xué)生的真實(shí)口語(yǔ)水平,同時(shí),口語(yǔ)試題具有較高的內(nèi)容效度。
(3)信度分析
信度是指測(cè)試的可靠性程度,表現(xiàn)為測(cè)試結(jié)果的穩(wěn)定性,本研究中主要指施考的條件要一致以及閱卷評(píng)分要一致。
針對(duì)施考條件,受訪教師一致認(rèn)為在直接型口試中,學(xué)生在準(zhǔn)備話題時(shí)會(huì)故意讓口語(yǔ)好的學(xué)生獨(dú)占話輪,口語(yǔ)較弱的學(xué)生則“臺(tái)詞”較少,難以保證每個(gè)學(xué)生同樣的發(fā)言時(shí)間。此外,直接型口試中排在后面的學(xué)生可以向已經(jīng)考過的學(xué)生打聽話題內(nèi)容,這些都影響了考試的公平性。而計(jì)算機(jī)口試由屏幕出示話題,相鄰的學(xué)生題目不同,屏幕同時(shí)顯示每個(gè)學(xué)生的發(fā)言時(shí)間,確保了每個(gè)學(xué)生的樣本的量是相同的,公平性也就因此體現(xiàn)出來了。
就閱卷評(píng)分而言,58.3%的學(xué)生認(rèn)為計(jì)算機(jī)口試的評(píng)分更加客觀公正,只有19.2%的學(xué)生持反對(duì)意見(見表4)。受訪教師也指出直接型口試與評(píng)分同時(shí)進(jìn)行,是瞬間的,具有不可重復(fù)性,教師必須對(duì)每組學(xué)生的口語(yǔ)樣本當(dāng)場(chǎng)做出準(zhǔn)確地判斷,給出整體分?jǐn)?shù),壓力較大,如果沒有較高的專業(yè)素質(zhì)很難做到公正客觀地評(píng)分,而且直接型口試評(píng)分與教師對(duì)學(xué)生成績(jī)分布的總體主觀把握有關(guān),同時(shí)也受教師之間的評(píng)分標(biāo)準(zhǔn)不一致、個(gè)人喜好、連續(xù)評(píng)分產(chǎn)生疲勞等眾多因素的影響。相較而言,計(jì)算機(jī)系統(tǒng)自動(dòng)化判分采取題型分項(xiàng)評(píng)分法,不受主觀因素影響,使得評(píng)分結(jié)果更客觀、穩(wěn)定、公正。
由此可見,本次計(jì)算機(jī)口試在一定程度上保障了施考的條件,確保了評(píng)分的一致性,由此提高了測(cè)試的信度。
(4)大規(guī)模計(jì)算機(jī)口語(yǔ)測(cè)試的可行性
根據(jù)以上分析,在保證同樣的效度、信度前提下,大規(guī)模計(jì)算機(jī)口試的可行性涉及考試組織實(shí)施、考官評(píng)分資源、考場(chǎng)設(shè)備、考試時(shí)間等成本因素。
與直接型口試相比,受訪教師認(rèn)為計(jì)算機(jī)口試有三點(diǎn)優(yōu)勢(shì):(1)省時(shí)、省力。以往需要一周的課時(shí)進(jìn)行隨堂口試,而大規(guī)模計(jì)算機(jī)口試只需1.5小時(shí)即可完成。(2)語(yǔ)料易于保管。學(xué)生的原始聲音資料可以完整保留??荚嚱Y(jié)束后,教師可以按需要進(jìn)行各種分析,為以后的考試、科研和教學(xué)提供各種有益的參考依據(jù),而直接型口試卻做不到這點(diǎn)。(3)調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性。這次的口語(yǔ)機(jī)考對(duì)雙語(yǔ)班學(xué)生的視聽說自主學(xué)習(xí)起到了督促作用。自從通知學(xué)生期末采取機(jī)考后,學(xué)生對(duì)視聽說更加重視,課后更是利用“暢言英語(yǔ)互動(dòng)學(xué)習(xí)平臺(tái)”練習(xí)口語(yǔ)。因此,計(jì)算機(jī)口試對(duì)大學(xué)英語(yǔ)的導(dǎo)向作用很好,不僅緩解了教師的工作壓力,還可以有效改變學(xué)生啞巴英語(yǔ)的現(xiàn)象。
部分受訪教師也指出,盡管計(jì)算機(jī)口試有較高的效度和信度,系統(tǒng)自動(dòng)化判分也與教師評(píng)分趨于一致,但要讓學(xué)生完全接受和習(xí)慣計(jì)算機(jī)口試這一新型測(cè)試方法,還需要一個(gè)適應(yīng)過程。這次考試也存在一些問題,例如與直接型口試相比,此次計(jì)算機(jī)口試的題目難度要低一些,題型相對(duì)單一。如果建立了試題庫(kù)的話,就可以事先利用屏幕設(shè)計(jì)現(xiàn)實(shí)生活中各種口語(yǔ)交流的真實(shí)情景,使整個(gè)考試過程更貼近真實(shí),互動(dòng)性更好。此外,考試期間,少數(shù)計(jì)算機(jī)發(fā)生故障無法使用,雖然對(duì)于這類突發(fā)事件事先有所準(zhǔn)備,學(xué)生可以在預(yù)留考場(chǎng)重新考試,但是在一定程度上會(huì)對(duì)學(xué)生的考試心理產(chǎn)生負(fù)面影響,考試心理素質(zhì)不夠好的學(xué)生極易產(chǎn)生焦慮感。
五、結(jié)論
計(jì)算機(jī)口語(yǔ)測(cè)試已成為我校大學(xué)英語(yǔ)教學(xué)中一個(gè)新的評(píng)估手段。本研究通過對(duì)比分析證明計(jì)算機(jī)系統(tǒng)自動(dòng)化判分性能與教師評(píng)分已非常接近,基本可代替教師批量評(píng)分完成直接型口試任務(wù)。通過學(xué)生問卷和教師訪談發(fā)現(xiàn),計(jì)算機(jī)口試得到學(xué)生和教師的普遍認(rèn)可,不僅能反映學(xué)生的真實(shí)口語(yǔ)水平,還降低了學(xué)生的考試焦慮感,更能夠公正、有效地測(cè)試出學(xué)生的口語(yǔ)能力,具有較好的測(cè)試效度和信度,在高校大規(guī)模使用具有可行性。當(dāng)然,計(jì)算機(jī)口試的完善有一個(gè)以點(diǎn)到面的問題,例如建立試題庫(kù)、完善考場(chǎng)設(shè)備等。大規(guī)模計(jì)算機(jī)口試是我國(guó)英語(yǔ)教學(xué)改革和教學(xué)手段多樣化的產(chǎn)物。就目前來看,利用現(xiàn)有的教學(xué)技術(shù),實(shí)現(xiàn)英語(yǔ)口語(yǔ)測(cè)試的現(xiàn)代化,不僅能提高口試的效度和信度、減輕教師工作壓力,而且對(duì)整個(gè)口語(yǔ)教學(xué)將會(huì)產(chǎn)生正面的反撥作用。目前利用計(jì)算機(jī)系統(tǒng)自動(dòng)化判分進(jìn)行口語(yǔ)測(cè)試在高校英語(yǔ)口語(yǔ)測(cè)試中尚處于探索階段,如何更大程度地利用計(jì)算機(jī)實(shí)現(xiàn)接近于真實(shí)語(yǔ)言環(huán)境的測(cè)試,如何將測(cè)試目的與測(cè)試形式統(tǒng)一起來,還需要進(jìn)一步的研究。