周桂華,李 瑜
(1.集美大學誠毅學院,福建 廈門 361021;2.菏澤學院外國語學院,山東 菏澤 274015)
大學英語課是非英語專業(yè)本科學生必修的課程,課時比較多,學生覆蓋面廣。大學英語課一般包括綜合課和視聽說課,旨在培養(yǎng)學生聽、說、讀、寫、譯的能力和跨文化交際等語用能力。有效實施課堂教學測試對于檢查學生的學習成果、更好地促進學生的學習尤為重要。Pope指出,在課堂教學測試中,包括一切終結性評價和形成性評價,教師行為首先必須符合職業(yè)道德規(guī)范,方可保證測試結果客觀公正[1]。對于課堂教學測試中的教師職業(yè)道德問題學界關注不多,課堂教學與測試相結合,形成性測評和終結性測評相結合,教師能夠更全面、客觀地獲取反饋信息。作為課堂教學測試的設計者、實施者,教師在教學測試中所體現(xiàn)的職業(yè)道德不僅影響到測試結果的客觀性、公正性,同時對培養(yǎng)學生學習興趣、保護學生自尊心、示范學生正確的職業(yè)道德觀等都會產(chǎn)生深遠影響[2]。努力探尋其對學生的影響,通過調(diào)整和提高教師在課堂教學測試中對于道德問題的認知水平,改進教學質(zhì)量,對于滿是詬病的大學英語來說應該是一次有意義的嘗試。
美國教育測試標準委員會(JCSEE)強調(diào)對學生的測評應遵循“ethical, fair, useful, feasible, and accurate”原則[3]。Pope提出在教學測試中,要對教師職業(yè)道德問題高度關注[4]。Green提出了教學測試中教師必須遵守“Do no harm”和“Avoid score pollution”的原則,并且認為課堂教學測試在以下七個維度與教師職業(yè)道德密切相關: Standardized Test Preparation, Standardized Test Administration, Multiple Assessment Opportunities, Communication about Grading, Grading Practices, Bias, and Confidentiality[5]。Pope等學者就教師在教學測試中面臨道德困境展開的研究主要集中在評分、標準測試以及如何對待學生特殊群體等方面[6]。
在國內(nèi),對于課堂教學測試中的教師職業(yè)道德問題研究還比較少。Jin Liu就中美就職前的教師對于課堂教學測試中道德問題的認知進行了對比研究,發(fā)現(xiàn)在其設計的22個教學測評情景中(總共設計36個教學測評情景)存在顯著差異[7]。劉秀梅等研究了大學英語教師對于課堂教學測試中道德問題的認知水平,發(fā)現(xiàn)大學英語教師整體認知水平不理想[8]。
參照Green 設計的七個維度下的課堂教學測評情景,在問卷調(diào)查中總結為六個方面:評價標準制定、測試公正性、測試保密性、成績評定、測試形式和測試實施,盡可能多地囊括大學英語課堂教學測試中的真實情景。詢問有豐富大學英語教學經(jīng)驗的教師們的意見,觀摩同事的課堂測試,并結合自己教學測試中出現(xiàn)的問題,設計調(diào)查問卷。大學英語教師和學生的調(diào)查問卷分別包含了六個維度中的22個和19個問題。通過問卷和訪談我們了解大學英語教學測試中教師們所存在的職業(yè)道德問題和學生在教學測試中的情況。通過問卷調(diào)查、訪談、課堂觀察和對比試驗的方式了解學生對于教師在教學測試中做法的評價以及對自身的評價。兩相對比分析大學英語教師在教學測試中的道德問題對學生的影響。調(diào)查通過線上工具問卷星進行,來自10所不同高校的98名大學英語教師和543名不同專業(yè)的學生參加了本次調(diào)查。
用SPSS軟件統(tǒng)計每個維度中不同測試情景中教師們的做法,從而分析大學英語課堂教學測試中存在的教師職業(yè)道德問題。再統(tǒng)計每個維度中不同測試情景中學生們的不同做法和反應,從而了解教學測試中教師職業(yè)道德問題對學生們的影響。
教師應在教學和評價前讓學生知道用以評價的具體指標或評分規(guī)則[9]。
從表1可見,76%的教師是沒有提供項目評分標準的,其中58.2%的教師認為有無評價標準對學生影響不大。有些教師認為有些課堂教學測試沒有必要(或很難)制定統(tǒng)一標準,學生可以自由發(fā)揮,教師可以根據(jù)自己的經(jīng)驗做出靈活的評判。提供評分標準的教師認為這樣可以更客觀地考查學生的學習,幫助學生更好地完成任務。55.3%的被調(diào)查學生認為“教師是否制定課堂教學測試標準”會影響他們的學習,但被問及具體有什么影響時,很多學生回答不太清楚;也有學生認為會影響平時分。
表1 課堂教學測試評分標準
我們就教師們經(jīng)常進行的英語口語小測(就某一話題進行討論)進行了對比試驗。一個班級只是告訴大家就某一話題進行討論,兩人一組完成對話;一個班級明確告知口語小測評分標準,評分標準參考歐洲共同語言參考標準(CEFR)B2/C1級口語能力制定[10]。
1.兩人一組完成對話,時長兩分鐘左右,需脫稿;
2.注意語法措詞、語音語調(diào);
3.對話流暢自然(注意手勢、表情、眼神交流等);
4.話輪轉換,避免無效會話。
兩個班級都是提前兩周布置討論話題。測評中,沒有評分標準的班級呈現(xiàn)的情況如下:1.大多數(shù)學生都沒有脫稿,時間一分鐘左右;2.文本有不少語法錯誤、措辭不當?shù)?,或者干脆直接網(wǎng)上搜索相關內(nèi)容,原封不動抄下來;3.有將近一半的小組由一名學生負責對話文本,另一名學生只負責讀出自己的那部分;4.大部分學生能流暢地讀下來,但也有不少學生讀得磕磕絆絆、錯誤百出,沒有手勢、表情,甚至沒有眼神的交流;5.有些小組不是就某一話題進行討論,而是一個提問一個回答,或者一人讀一段。這樣的口語練習進行多少次應該也不會對學生有很大的幫助。
另一個班級明確告知評價標準,學生們的表現(xiàn)是完全不同的:1.絕大多數(shù)的小組對話時間超過兩分鐘,基本脫稿;2.文本少有語法錯誤,措辭相對準確。學生提前網(wǎng)上搜索資料,主動找教師指導,積極表達自己的看法,在互相討論中不斷完善對話文本;3.語音少有錯誤,語調(diào)相對自然流暢,適當加以手勢,全程進行眼神的交流;4.清晰地表達觀點,有效地遵守話輪順序,偶有對話卡殼,也能相互提示。
通過對比,我們發(fā)現(xiàn)第二個班級的學生在測評標準的指導下,不但掌握了討論主題相關內(nèi)容,也了解了此類口語測試的一些方法和技巧。
目前大學英語期末總評成績包括平時分和期末考試卷面分。平時分和期末卷面分通常是三七、四六或五五分,各高校會有所不同。平時分的構成也是各不相同,包括綜合、聽力小測、口語練習、作文翻譯練習、段落背誦、課堂表現(xiàn)(回答問題等情況)、出勤等,各部分構成所占比重由教師決定。
通過問卷調(diào)查發(fā)現(xiàn),90%的教師和87.2%的學生選擇大學英語平時分是由教師制定的。在問及“教師是否會把平時分的構成告訴學生”時,從表2可知,95.6%的教師和94%的學生選擇了“是”。84.7%的教師和75.3%的學生認為平時分制度對于學生的學習具有促進作用,其理由分別是:平時分制度可使更多學生踴躍回答問題、積極參與小組討論、認真對待作業(yè)和小測;平時分制度是一個基本導向,跟著教師掌握所學內(nèi)容的同時,不斷提高自主學習能力。15.3%的教師和24.7%的學生認為平時分制度不能促進學生的學習,是一種很討厭的制度,讓學生一切向分數(shù)看齊,通過作弊獲取高分。
表2 平時分構成及作用
針對平時分的問題,我們也在一些班級嘗試著進行改變,在學期初和學生共同協(xié)商制定平時分,詳細探討平時分的構成和占比以及平時課堂測試作弊所面臨的懲罰。根據(jù)期末考試大綱和備戰(zhàn)大學英語四級的需求,我們制定了平時分的構成和占比: 1.出勤(10%);2.綜合課(五個單元作業(yè)和小測 50%;五個單元段落背誦 10%);3.視聽說課(五個單元聽力Part D課堂派自主完成 10%;聽力小測 10%;口語練習10%)。另外,要完成四篇四級作文和十篇主題文化漢譯英練習,沒有完成實行扣分制,一次扣2分。小測作弊,第一次成績作廢,給一次補救機會;第二次成績作廢,沒有補救機會。
在整個學期中,大家會認真對待每次的作業(yè)、練習和小測,作弊情況減少,期末考試通過率也有了提高。
美國教育測試標準委員會(JCSEE)指出教學測試應當遵守“合乎道德、客觀、有用、可行且準確”的原則[11]。
從表3可知,87%的教師和91%的學生選擇“教師會點評課堂教學測試”。但就“教師對于課堂教學測試的點評是否客觀有用”這一問題,63%的教師和61%的學生選擇了“是”。有些教師認為他們會詳細總結課堂教學測試中出現(xiàn)的問題,及時反饋給學生。有些學生認為教師點評細致,優(yōu)點和不足之處一并指出,并提出改進意見。37%的教師和39%的學生持否定態(tài)度,認為教師對于課堂教學測試的點評比較籠統(tǒng),僅僅是“非常好、很好、不錯、差、很差等”,沒有任何實質(zhì)性的內(nèi)容;有的教師出于對學生的鼓勵,僅僅指出課堂教學測試中學生做得好的地方,對于不足的地方一筆帶過,或者即便指出缺點、不足之處,也沒有告知學生如何改進。
表3 課堂教學測試考核及反饋
第三個問題,選擇“是”的教師(15.8%)和學生(21.3%)認為“降低難度或縮小范圍”才不會打擊學生的學習興趣和自信心。84.2%的教師和78.7%的學生選擇“否”,他們認為這對其他同學不公平,對基礎差的同學也未必有幫助作用,還可能讓他們產(chǎn)生學習惰性。有些教師提出要多關注這些學生,多給他們提供幫助,鼓勵他們加倍努力,認真完成課后練習和作業(yè)。就這一問題大多教師的職業(yè)道德認知水平較理想。
《教育與心理測驗標準》提出測試結果應當保密,如果要報告,應當保證準確且不被誤解[12]。
從表4可知,90%的教師和94%的學生選擇了教師會親自批改學生作業(yè)和測試,原因是“這樣能全面了解學生對所學內(nèi)容的掌握情況”“學生的測試成績要保密”。就“教師是否會在班級公布所有學生的成績”這一問題, 80.4%的教師和75.5%的學生選擇了“否”。88%的教師和86.2%的學生認為不應該允許學生把全班成績拍照轉發(fā),其理由是“要保護學生隱私”。從調(diào)查數(shù)據(jù)看,對于測試保密性教師們認知比較高,從對學生的調(diào)查也得到了印證。但在訪談中教師們也提到還要再提高這方面的意識,如在學生詢問成績時,可以單獨告知,不要把課堂登記冊或全班成績單拿給學生查看;測試后講評時不要提及學生姓名。
表4 測試保密性
任何課堂評價,包括分數(shù)評定,都應只反映學生對于教學目標的掌握程度。教師在評定學生單次成績時,不應受到學生努力程度、作業(yè)是否及時完成、行為問題等因素的影響[13]。
表5表明,前兩個問題,60.1%和69.9%的教師回答“是”。教師們可能會摻雜個人的主觀判斷,從而影響分數(shù)的客觀性,這不符合教師的職業(yè)道德準則。期末考試在學生差一點就及格的情況下,76%的教師會給平時表現(xiàn)好的學生提高平時分。有的教師認為這種做法降低了成績的真實性,對其他同學不公平。但不少教師認為,如果一個學生基礎不算好但平時學習很刻苦,給他及格更能提高他學習的積極性和自信心。
表5 測試評定
多元化的測試模式和測試題型能全面準確地呈現(xiàn)學生對知識的掌握情況[14]。任何單一的測試都難免失之偏頗。
通過問卷調(diào)查發(fā)現(xiàn),75%的教師和70.2%的學生認為大學英語課堂教學測試形式多元化:聽寫詞匯、翻譯、寫作、背誦、聽力小測和口語練習等。從表6可見,不論是對教師還是對學生的問卷調(diào)查中,占比最高的課堂測試是“聽寫詞匯”和“聽力小測”,高達90%以上;占比最小的是“寫作”,只有40%多。通過采訪教師我們了解到:聽寫詞匯和聽力小測相對比較好操作,不會占用太多時間。班級多,人數(shù)多,教師們時間投入有限。改作文就需要更長的時間。所以不少教師是以詞匯聽寫和聽力小測為主要課堂測試形式,翻譯、寫作、口語練習等為輔助。這種測試模式是否是有效的多元化值得我們進一步思考。但是很多教師也反應疫情期間進行了線上課程,課堂測試形式更加多樣化合理化。詞匯單選題、閱讀理解題、視聽題等簡單易行,課堂表現(xiàn)分也可以通過獎勵星星的形式更為直觀化。通過采訪學生我們了解到:多元化的課堂測試形式有一定的效果,比如詞匯聽寫、背誦可以幫助他們更好地掌握課本內(nèi)容。學生也提出希望多一些寫作、翻譯的測試,這樣會有助于他們準備英語四六級考試。
表6 測試形式
在測試中,對每個學生都應一視同仁,不能區(qū)別對待。教師如果干預測試過程,測試結果準確性就會受到影響。Popham指出考試過程中以任何形式暗示學生的做法都是錯誤的[15]。
從表7可見,教師對于平時小測和期末考試中學生作弊的處理方式有很大不同。平時小測中,90.4%的教師選擇“提醒、警告”;但在期末考試中,84.3%的教師選擇“沒收試卷”,接下來是“上報學校處理”(70.4%)和“成績作廢”(65.1%)。不論是對學生還是對教師的調(diào)查問卷和訪談都表明,期末考試中教師對學生要求更嚴格,作弊情況相對較少;平時小測時學生作弊較嚴重,單純的提醒警告作用不大。通過問卷調(diào)查發(fā)現(xiàn),78%的教師和59.6%的學生認為教師處理作弊的方式會影響他們的學習態(tài)度。教師認為,平時小測監(jiān)管不嚴,學生就會有僥幸心理,不去認真準備。學生認為,作弊沒有被處罰,還能拿到高分,其他學生可能會效仿,會影響整個班級的學習勁頭。當然也有學生認為不會影響學習態(tài)度,學習是自己的事,平時小測是對所學內(nèi)容階段性的檢查,幫助查漏補缺。
表7 學生作弊處理方式
從表8可見,第一種情況下,91.6%的教師會及時提醒學生,認為不會牽涉到實質(zhì)性問題,還可以避免改卷時的麻煩。第二種情況下,89.4%的教師選擇不會提醒,認為有失考試的公允和嚴肅性。對學生的問卷調(diào)查中,就這兩個問題,分別有56.4%和39.4%的學生選擇教師會提醒。但在問及“這兩種情況是否該提醒時”,75.7%的教師和86.5的同學認為不應該,理由是這是學生自己的事情,不是教師的責任;教師應該考前清楚告知學生答題卡填涂內(nèi)容及不填涂所造成的后果,如果學生沒有填涂,就應該承擔相應后果,對其他學生也會起到警告的作用。
表8 教師監(jiān)考行為
研究發(fā)現(xiàn)參與調(diào)查的大學英語教師在課堂教學測試中存在不少的職業(yè)道德問題,尤其是在測試標準制定、測試公正性、測試評定和測試實施維度。
參與調(diào)查的教師將近八成是沒有制定課堂教學測試標準的,而且將近六成的教師認為有無評價標準對學生影響不大。但通過口語練習的對比試驗,可以觀察到有無評價標準對學生們影響很大。調(diào)查發(fā)現(xiàn)不少教師讓學生練習口語、寫作時,沒有意識到應該要有評價標準;有的教師認為制定評價標準無綱可循。作為教師,我們迫切需要提高自己在這方面的職業(yè)道德認知水平。我們可以參照歐洲共同語言參考標準(CEFR)和中國英語能力等級量表,根據(jù)大學英語教學大綱、學生的英語基礎和學習需求,嘗試制定聽說讀寫譯各方面的課堂教學測試標準。例如,學生課堂的口語練習還要結合大學英語四、六級口語考試評分標準才能有的放矢,學生才能學有所獲。學生根據(jù)評價標準完成課堂教學測試后,教師應當及時反饋。研究發(fā)現(xiàn)13%的大學英語教師對學生的課堂教學測試是沒有點評的,39%的學生認為教師的點評籠統(tǒng)片面,不具備指導意義。前蘇聯(lián)心理學家阿莫納什維利指出,評價的本質(zhì)在于激勵學生學習,幫助其糾正錯誤,樹立信心[16]。因此,對于學生的課堂測試點評要及時、客觀地指出優(yōu)劣,具有診斷性;依據(jù)一定的標準,具有指導性;針對不同個體,具有促進性。
在測試標準制定方面,大學英語平時分也需要我們高度關注。調(diào)查發(fā)現(xiàn)平時分絕大多數(shù)情況下由教師制定并告知學生。80%左右的教師和學生認為平時分制度能促進學生的學習,但學生仍有不少的意見,認為教師根本沒有告知平時分各部分的比例,也不清楚怎么計算平時分;平時分各部分的占比不合理導致平時分偏低,拉低了總評成績;教師評分過于隨意,誰和教師關系好誰的分數(shù)就高;教師不公平,一樣按時出勤、按時交作業(yè),平時分卻比同學低。要解決以上問題,教師應該在學期初和學生們共同協(xié)商平時分的構成和占比、作弊處罰等,讓學生明確作業(yè)質(zhì)量好壞、小測分數(shù)高低都會影響平時分。
在大學英語課堂教學測試評定中,70%多的教師在期末評定學生成績時考慮學生平時努力程度。近70%的教師會根據(jù)學生機讀成績衡量學生整體分數(shù),如果差一點就能及格的情況下,他們會放松翻譯和作文題的評分標準,提高學生成績。成績評定時,不論是考慮學生努力程度還是放松評分標準都會導致“score pollution”。教師不應只從情感出發(fā),而違背職業(yè)道德。
大學英語教師在課堂教學測試實施過程的行為和表現(xiàn)也急需改進。在平時小測中,90.4%的教師對于作弊學生僅僅是“提醒、警告”,對學生監(jiān)管不夠嚴格導致學生作弊嚴重。不少被調(diào)查教師表達了自己的無奈,教室大,學生多,無法全面監(jiān)管;有些教師擔心對學生過于嚴格會適得其反。但“提醒、警告”無法制止學生的作弊行為時,教師就應該采取更嚴厲的措施,不能聽之任之,否則,對其他學生有失公平。當然,教師可以在平時幫助學生認識到測試的嚴肅性,也可以調(diào)整小測形式,降低作弊可能性。期末考試中發(fā)現(xiàn)學生答題卡信息漏涂或涂錯時,91.6%的教師會及時提醒學生。不少被調(diào)查教師提到答題卡信息填涂不完整,機讀不出成績,按照考試規(guī)定,可以不給學生這部分分數(shù),但又于心不忍,選擇手改,補上分數(shù)。為了減少改卷麻煩,教師除了在開考前按照規(guī)定指導全體學生填涂答題卡,還在考試中不時單獨提醒學生。教師應該在平時課堂上告知學生答題卡填涂內(nèi)容并強調(diào)正確填涂的重要性。
課堂教學測試是教學的有機組成部分和重要基礎,促進學生的學習應當是課堂教學測試的核心目的。但有效的課堂教學測試需要教師高度的職業(yè)道德素養(yǎng)。大學英語課堂教學測試相對較復雜,要真正有效地提高學生聽、說、讀、寫、譯各方面的能力,更需要教師們不斷提高自己的職業(yè)道德認知水平,能有更多的教師關注并且深入研究大學英語課堂教學測試中存在的教師職業(yè)道德問題。