趙春榮 劉永權(quán)
[摘要]文章采用定量和定性分析方法,以北京廣播電視大學遠郊區(qū)縣分校159名學習者為被試對象,使用網(wǎng)絡語音電話Skype進行遠程條件下英語口語測試的實證研究,探索英語口語測試的新形式。研究發(fā)現(xiàn):利用Skype進行口語測試不僅能解決計算機輔助口語測試缺乏交互性和真實性的問題,還能夠有效降低管理成本,平衡了口語測試效度和信度,是適合對英語專業(yè)學生進行測試的新型口語測試形式。
[關(guān)鍵詞]直接型口試;半直接型口試;計算機輔助口試;Skype語音電話
[中圖分類號]G420[文獻標識碼]A[論文編號]1009-8097(2012)02-0095-04
一引言
口語測試是外語語言測試的重要組成部分。隨著大學英語教學改革的不斷深入,外語測試理論研究的深入和社會需求的不斷擴大,口語教學與測試日益受到重視。如何為口語教學提供科學、高效的測試方法,已成為國內(nèi)英語教育專家和學者研究和探索的熱點之一。在計算機技術(shù)持續(xù)快速發(fā)展的今天,最大程度地利用計算機網(wǎng)絡技術(shù)測試學生的真實口語水平,使計算機輔助口語測試能夠大規(guī)模的施行并日臻完善,從不同視角、不同層次、采用不同方法探索口語測試的新途徑和新方法是非常有必要的。
北京廣播電視大學(以下簡稱“北京電大”)以網(wǎng)絡教學為基礎,在全市18個區(qū)縣和部分行業(yè)系統(tǒng)設有50余個基層教學單位,其中英語專業(yè)每年招生人數(shù)約為400人,分布在北京城八區(qū)和遠郊區(qū)縣的各個分校。近十年來,北京電大采用直接型口語測試為主,錄制磁帶或者光盤為輔的形式對英語專業(yè)學生口語測試。直接型口語測試在實施過程中面臨著測試評價難、考官資源有限和考試管理成本高等諸多問題。
在遠程教育和考試中,基于計算機和網(wǎng)絡技術(shù)的語言測試已經(jīng)顯示出巨大的優(yōu)勢,代表著未來我國高校外語口語測試的發(fā)展方向,并將逐步成為測試的主流。故而,以辦學規(guī)模巨大、大量采用現(xiàn)代教育技術(shù)為特點的遠程高校更應探索遠程英語口語考試的新形式,實施遠程條件下的口語測試實證研究將對計算機輔助口語測試的形式、效度、信度和效率的深入探索具有重要意義。
二文獻綜述
近十年來,國內(nèi)學者對口語測試的研究內(nèi)容主要涵蓋以下三個方面:1)測試形式、題型和評價方法研究;2)測試的信度和效度研究;3)測試的反撥作用研究。其中,口語測試方法和形式的研究成為國內(nèi)研究者關(guān)注的焦點。隨著教育技術(shù)的發(fā)展,英語口語測試經(jīng)歷了三個發(fā)展階段:直接型、半直接型和計算機輔助口語測試。直接型口試,簡稱OPI(OralProficiency Interview),指由考官和學生面對面進行的口試,即面試。大學英語四、六級以及雅思(IELTS)口語考試采用直接型口試形式。半直接型口試簡稱SOPI(Simulated OralProficiency Interview),通常指錄音口試。測試利用磁帶、光盤或電腦錄音設備獲取考生的話語樣本,由考官聽取錄音并進行評分。英語專業(yè)四級、八級、托福(TOEFL)口試和自學考試英語口試大多采用此種方式。而網(wǎng)絡學院和各省級電大采用直接型和半直接型口試兼而有之的英語口試方式。進入新世紀以來,各個普通高校英語專業(yè)開始嘗試采用計算機輔助口語測試,簡稱CALT(Computer Assisted LanguageTesting)。目前研究的熱點問題主要集中在以下幾個方面:
1三種口試形式的利弊
國內(nèi)外學者從不同角度闡述了各種口語測試的利弊。研究者認為,傳統(tǒng)的直接型口語考試比較貼近現(xiàn)實生活中的口語交際活動,在內(nèi)涵上也體現(xiàn)了語言的交際功能,考官直接參與考生真實的交際活動,直接觀察到考生的面部表情以及身體語言,因此具有“表面效度高,靈活性大、針對性強的特點”。但是,受考官資源、評分標準等因素的影響,“直接型口試的評分信度通常較低?!?/p>
國內(nèi)外研究者對直接型和半直接型口試進行了對比探討。Shohamy對直接和半直接型口試進行分析發(fā)現(xiàn),兩種口試形式在交際策略和話語特點方面存在較大差異。在半直接型口試中,考生更注重話語輸出的正確性,輸出的話語較正式、嚴謹,更接近于書面表達;而直接口試更能使考生融于話語的交際中,比半直接型口試中使用的語言更口語化,考生更注重交際互動和意義傳達,多使用對話性語言。因此,Shohamy的結(jié)論是直接口試和半直接型口試不能完全互換。
金艷、郭杰克等通過面試和半直接型錄音口試對比研究,認為錄音口試較面試口試更為經(jīng)濟合理,且具可操作性,能采集到更多的語言樣本,考生口語水平的發(fā)揮不受考官的語言水平和情緒的影響,但是其缺乏真實口語交際交互性的弊端也較為突出。
隨著計算機的迅速發(fā)展,半直接型錄音口試已經(jīng)逐步被計算機輔助口語測試所替代。蔡基剛通過對計算機口語考試和面試型考試成績的對比分析,驗證了計算機口語測試的信度和效度,指出計算機口語測試適合目前的社會需求,能夠解決考生人數(shù)多、考試成本大的難題。邱東林等在三次大規(guī)模計算機輔助口語測試實踐的基礎上,指出計算機輔助口語測試省時省力、操作簡便易行、評分相對客觀公正、考試語料易于保管。此外,國內(nèi)許多研究者在肯定了計算機輔助英語口語測試優(yōu)勢的同時,也發(fā)現(xiàn)計算機輔助口語測試最不容忽視的問題在于缺乏真實口語的交際交互性。可以看出,計算機輔助口試是半直接型口試的發(fā)展和延伸,因此,其優(yōu)缺點存在大量共通之處。
2計算機輔助口試題型設計的局限性
“受語言學、語言教學和心理測量學的影響,九十年代以來,基于任務的語言教學和測試成為研究熱點?!眹鴥?nèi)英語口試采用的任務型試題通常指,“提供一定的任務情景,讓考生運用英語完成特定的交際任務,考官通過考生的話語產(chǎn)出和完成任務的情況進行判分”。然而我國現(xiàn)行的計算機輔助大學英語口語測試的試題類型大致可以歸納如下:
從以上的試題設計不難看出,朗讀、復述、回答問題、看圖說話和口頭報告等題型要求考生進行的交流是單向的,無法體現(xiàn)交際的真實性和互動性。另外,計算機輔助口試存在引出的話語功能和話語范圍比直接口試狹窄的問題,如只局限于描述、報告和敘述等語言功能上,無法測試較高級的語言能力。而試題設計的局限性主要是受技術(shù)支持層面的限制。如小組辯論、討論等題型在計算機輔助測試環(huán)境下的實現(xiàn)比較困難。要充分發(fā)揮對較高級語言能力測試的人機對話的作用,則需要得到更高層次的計算機智能支持,而“真正智能化的英語口語考試軟件目前很難設計出來,對基于語料庫語言學的計算機輔助自適應口語測試系統(tǒng)需的研究要投入更多”。
鑒于以上計算機輔助口語測試題型設計的局限性,目前計算機輔助口語測試的研究對象通常是大學英語四、六級的考生。朗讀、復述、回答問題、看圖說話等題型基本能體現(xiàn)四、六級考試對于非英語專業(yè)學生的口語考察要求,然而,對于英語專業(yè)本科或者中級以上英語水平的受試者,我們通常要通過角色扮演、對話、小組討論這些形式才能考察出考
生的口語交際能力。正是因為上述困難,國內(nèi)以英語專業(yè)學生為研究對象的遠程條件下口語測試研究可謂是鳳毛麟角。
3信度和效度的平衡——利用Skype網(wǎng)絡語音電話進行直接型口試
信度(Reliabity)和效度(validity)是評價口語測試的兩個重要的質(zhì)量指標。信度指考官評分的一致性或穩(wěn)定程度;效度則保證了測試結(jié)果的有效性和正確性??谡Z測試形式的發(fā)展與演變過程中一個特點是,“在不摒棄效度的前提下尋求信度的提高,在信度和效度之間求得平衡”。
如何融合直接口試與計算機輔助口試各自的優(yōu)點,兼顧直接型口試效度高,計算機輔助口試信度高的特點,在信度和效度之間達到相對平衡,采用Skype網(wǎng)絡語音電話進行口語測試具有開拓性的意義。
Skype網(wǎng)絡語音電話是全球最大的網(wǎng)絡電話公司產(chǎn)品,在網(wǎng)絡電話界享有盛名,總注冊用戶超過10億人。在網(wǎng)絡語音聊天功能方面,Skype是一款專門的通訊軟件,它的語音引擎優(yōu)于QQ和MsN,視頻方面也比QQ清晰、流暢,得到了網(wǎng)民的“音質(zhì)超過電話”、“無需任何復雜的設置”高度評價,成為目前最受歡迎的、國際通行的專業(yè)聊天軟件。
本研究認為通過遠程條件下新的測試途徑——SkyDe網(wǎng)絡語音電話——對英語專業(yè)學生進行直接型英語口語測試,能夠綜合直接型和半直接型口語測試優(yōu)勢,既發(fā)揮出計算機輔助口語測試的管理成本低的優(yōu)勢,又能解決測試中交互性和真實性的問題,達到口語測試效度和信度的相對平衡,而且能夠解決開發(fā)專門軟件成本高,而采用雙向視頻無法成規(guī)模實旅口試的問題。
三研究過程與研究方法
1研究對象及方法
本研究的對象為來自北京電大郊區(qū)分校英語本科二年級的159名學生。本研究采用定性和定量研究相結(jié)合的方法,分別對教師、學生以及技術(shù)人員進行了問卷調(diào)查和訪談。
2研究問題與假設
本研究為了了解考生對利用網(wǎng)絡語音電話Skvpe進行口語測試這種新測試形式的態(tài)度和反應,主要回答三個問題:(1)新的口語測試是否能得到考生的認可?考試效度如何?(2)新的口語測試是否會在情感方面(特別是焦慮度)影響考生真實水平的發(fā)揮?考試的信度如何?(3)新的口語測試是否具有可行性?
針對這些問題,研究者做出如下假設:(1)使用Skype網(wǎng)絡語音電話進行口語測試能夠得到考生的認可,具有較高的表面效度;(2)使用Skype網(wǎng)絡語音電話進行口語測試,考生能夠發(fā)揮真實的口語水平;(3)使用Skype網(wǎng)絡語音電話進行口語測試具有可行性。
3研究設計與實施
北京電大英語口語測試為學業(yè)考試(Performance Test),所測即所學,試題難易程度取決于教材難度。在試題的類型方面,英語本科的口語測試采用任務型(task-based)試題設計,即提供一定的任務情景和話題,要求考生運用英語完成特定的交際任務??谡Z測試集中考察考生就與課程相關(guān)的指定話題進行表達和會話的能力。
2009年7月和2010年1月,延慶電大以及房山電大的159名學生參加利用Skype網(wǎng)絡語音軟件進行口試的研究。根據(jù)大規(guī)模的英語口語考試的需要,利用網(wǎng)絡電話進行口語測試按照“領(lǐng)取考試題簽.考務安排一考試一公布成績”四大步驟的操作,模擬傳統(tǒng)“面對面”對話進行口語考試??谠嚂r考生進入備考場后,抽簽組成“AB考伴”,每組考生抽取一套考卷進行對話。每套考卷包括兩個不同的會話命題(提供文字提示),考生分別開始一個話題。此次口試中,主考教師通過攝像頭和耳麥從考生交際的有效性、流利程度、語音、語法、用詞五個方面對兩位考生分別當場進行綜合性評分。
四研究結(jié)果與討論分析
此次遠程條件下進行口語測試研究采用定量以及定性分析的方法以獲得相關(guān)數(shù)據(jù)。研究者通過學生、教師以及技術(shù)人員問卷,以調(diào)查學生參加遠程條件下口語測試的態(tài)度、測試的信度和效度以及測試的可操作性。此次調(diào)查于2010年1月進行,共發(fā)放問卷159份,有效問卷142份,結(jié)果如下:
1表面效度
效度是語言測試理論中的一項重要指標,其中包括表面效度(Face Validity)和內(nèi)容效度(ContentValidny)?!氨砻嫘Ф仁侵缚忌鷮y試的看法和態(tài)度?!蔽覀兺ㄟ^問卷了解考生對利用Skype口試滿意程度的數(shù)據(jù)顯示:考生對遠程口語測試的滿意度高達81%,沒有一個學生選擇“不滿意”。當然也有19%的學生對遠程條件下口語測試“感覺一般”。另外,調(diào)查考生參加遠程條件下口語測試的積極性時,我們發(fā)現(xiàn),88%的學生愿意積極參加遠程口語考試,8%的學生不置可否,只有4%的學生持消極態(tài)度。
以上這些數(shù)據(jù)基本證明了本研究的第一個假設:即利用Skype網(wǎng)絡語音電話進行遠程口語測試總體上受到了考生的普遍認可,學生大多持積極態(tài)度,也就是說,此次遠程口語測試具有比較令人滿意的表面效度。
2語言輸出的真實性
大量研究表明,在錄音口試和普通的計算機輔助口語考試中,考生對著錄音機或者計算機發(fā)表講話,很難找到真實的感覺,考生是在與假想的聽眾或?qū)υ捳哌M行“不自然”的“單向交流”。與傳統(tǒng)考試相比,我們發(fā)現(xiàn)41%的學生認為自己在遠程條件下口語考試中的表達內(nèi)容“更豐富”;48%的學生認為自己的發(fā)揮正常,與平常考試無異:也有11%的學生感覺自己發(fā)揮欠佳。本次調(diào)查的數(shù)據(jù)說明,在增加攝像頭后考生和考官同時在電腦屏幕上看到對方,因為有視覺和聽覺的雙重刺激而更接近真實的口語交際,提高了計算機口語測試的交互性和真實性,有助于考生的語言輸出,能客觀高效反映學生口語水平。
3內(nèi)容效度
“內(nèi)容效度是指測試中的項目與任務是否與測試的總體目標相符?!睖y試只有能夠準確地測出它所希望測試的內(nèi)容才具有效度。研究者請考生對自己的整體表現(xiàn)進行自我評價,結(jié)果顯示:與傳統(tǒng)考試相比,54%的學生覺得采用遠程條件下口語測試,自己的表現(xiàn)更為令人滿意,40%的學生認為網(wǎng)絡環(huán)境下自己的口語水平與傳統(tǒng)測試沒有太大差異,能夠正常發(fā)揮。北京電大英語口語測試為學業(yè)考試,試題難易程度取決于教材難度,考試中的口語交際任務與測試的整體目標基本相符,因此考生比較熟悉試題內(nèi)容,在口試中能夠發(fā)揮自己的正常水平,對自己的表現(xiàn)滿意。因此,以上數(shù)據(jù)分析部分證明了本研究的第二條假設:利用Skype網(wǎng)絡語音電話進行口語學業(yè)測試,考生能夠發(fā)揮真實的口語水平,同時,此次任務型口語試題具有較高的內(nèi)容效度。
4焦慮程度
在測試過程中,考生能否充分發(fā)揮真實水平在很大程度上受到當時的情感狀態(tài)影響。傳統(tǒng)的面試型口試中,考官的態(tài)度親切有利于緩解考生的緊張情緒,而考官態(tài)度生硬則會加重學生的焦慮,影響水平的發(fā)揮。遠程條件下口語測試環(huán)境下,在沒有考官直接參與口語交流的情況下考生的焦慮程度是否有所降低?根據(jù)調(diào)查,59%的學生感覺在遠距離面對考官的情況下“更為放松”;31%的學生覺得在網(wǎng)絡環(huán)境下口語
考試心理“更加緊張”。這說明在遠程口語考試中,考生面對新的測試手段內(nèi)心的焦慮是不可避免的。由于此次口語測試主考教師并不參與學生討論。考生不直接面對考官測試,一方面能使考生的緊張心理在很大程度上得到減輕,能夠正常發(fā)揮;另一方面,考官也能夠避免受到學生外貌、著裝和舉止等影響進行主觀判斷,實現(xiàn)了評價的公平性,避免了面對面直接型口試信度相對較低的弊端。因此,以上數(shù)據(jù)也證明了研究的第二條假設:利用Skype網(wǎng)絡語音電話進行口語測試,考生能夠發(fā)揮真實水平,并使他們的焦慮程度有所降低。
5考試管理的可操作性
遠程口語測試的可操作性如何呢?這個問題涉及考試組織實施、考官評分資源、場地設備、考試時間等成本因素。也就是說,在保證同樣的信度、效度前提下,考試時間越短,所用的考官或評分人員越少,使用的場地和設備越少,成本越低,可操作性就越強。對于此次考試的組織形式,學生普遍態(tài)度比較積極,57%的學生認為遠程條件下口語考試的組織“更加靈活”,33%的考生認為考試組織更加“節(jié)省時間”。
在訪談分校技術(shù)人員和監(jiān)考教師時,遠程條件下口語考試的優(yōu)勢也充分得到了肯定。他們認為“相較于原來要花費4、5個小時派車前往市區(qū)接送主考教師的情況,通過網(wǎng)絡進行口語測試節(jié)約了學??荚嚱M織的管理和時間成本,提高了效率”。另外,由于遠程口語考試大大減少了考官的考試路途往返時間負擔,增加了單個考官考試人數(shù)的基數(shù),從而在一定程度上提高了評分的一致性,間接提高了測試的信度。
6Skype口語測試的優(yōu)勢及問題
在調(diào)查通過Skype進行口語考試最大的優(yōu)勢時,52%的學生認為它具有“方便”的特點,另外37%的學生認為“心理放松”,11%的學生認為這種方式“節(jié)省時間”。這些數(shù)據(jù)說明,學生們普遍認同遠程條件下口語考試的優(yōu)勢。
但是,在訪談“網(wǎng)絡條件下口語考試存在的主要困難”時,我們發(fā)現(xiàn)在口語考試的過程中網(wǎng)速成為了一個主要問題。當網(wǎng)速慢時,有時學生聽到的聲音有延時,這既耽誤了考試時間,也會造成學生心理壓力增加。
7三種口試的認可度
實際上,北京電大在以往的英語口語測試中,直接型面對面口試和半直接型口試都曾實施過,所以這些被試對象有親身的體驗。最后,我們調(diào)查了考生最喜歡的口語考試形式。其中,57%的學生最喜歡的是基于網(wǎng)絡的利用Skype進行口語測試,20%的學生喜歡光盤錄制口試的半直接型口試形式,另外也有23%的學生喜歡面對面的傳統(tǒng)考試。這其中,利用網(wǎng)絡進行遠程條件下的口語考試形式最受學生歡迎。這說明學生普遍認為遠程條件下進行口語測試是一種可行、有效的測試形式,能夠反映出他們的真實水平,但要讓學生們完全接受和習慣于遠程口試這一新型測試方法,還需要一個適應過程。從以上遠程口語考試的效度、信度以及組織管理和認可度方面的分析,我們基本證明了本研究的第三個假設:利用sloe網(wǎng)絡語音電話進行口語測試具有可行性。
五結(jié)論與建議
計算機技術(shù)在其他領(lǐng)域的應用,大大提高了該領(lǐng)域的工作效率。本次遠程條件下的利用Skype網(wǎng)絡語音軟件進行口語測試是計算機網(wǎng)絡技術(shù)在外語測試領(lǐng)域的應用,它對遠程條件下外語口語測試的形式進行了新的探索。本研究證明,與半直接型和直接型口試相比,遠程條件下的口語測試不僅能夠有效降低管理成本,還展示了考生對話中的交互性和真實性,降低了考生的焦慮度,提高了口試信度和效度,能夠公正、有效地測試出考生的口語能力,是一種適合對英語中高級水平學習者進行測試的有效方法。遠程條件下口語考試也存在一些技術(shù)問題,如:網(wǎng)速慢時,考生的發(fā)言存在聲音延后的問題:同一考場的考生人數(shù)過多時造成的雜音會影響考生發(fā)揮;攝像頭和麥克風需要提前調(diào)試。
遠程條件下口語測試順應大學英語教育發(fā)展的新形勢和新趨勢,是適合我國高校教育實際需要的一種口語測試方法。Skype網(wǎng)絡語音電話在英語口語測試中的應用目前尚處于探索階段,如何更大程度地利用計算機技術(shù)實現(xiàn)接近于真實語言環(huán)境的測試,如何將測試的目的與形式的統(tǒng)一做進一步探索,是目前需要大力研究的問題。
參考文獻
[1]鄒申.試論口語測試的真實性[J]外語界,2001,0):74-78
[2]李玉平.大規(guī)模計算機輔助英語口語測試效果實證研究[J]外語屆,2009,(4):69-76
[3]金艷,郭杰克.大學英語四、六級考試非面試型口語考試效度研究[J]外語界,2002,(5):72-79
[4] Shohamy, E. The Validity of Direct Versus Semi-direct OralTests [J]. Language testing, 1994,(11):99-123
[5]蔡基剛.大學英語四、六級計算機口語測試效度、信度和可操作性研究[J]外語界,2005,(4):66-75
[6]邱東林等.大學英語聽說機考嘗試[J]外語界,2005,(4):76-79.
[7]韓寶成.語言測試的新進展:基于任務的語言測試[J]外語教學與研究,2003,(5):352
[8]龐繼賢,陳嬋,外語口語考試的效度和信度研究述評[J]外語與外語教學,2005,(7):19-22
[9]高丙梁.大學英語口語測試研究熱點述評[J]外語教育理論與實踐,2008,(11:92-96
[10]司耀龍.基于計算機的大規(guī)模商務英語口語診斷測試實踐研究[J]外語電化教學2008,(1):67-71
[11]Bachman L.Fundamental Considerations in LanguageTesting[M]Oxford University Press,1990:160
[12]朱音爾,張肖瑩.基于網(wǎng)絡的大學英語機考探索與實踐[J].外語電化教學,2009,(3):63