(浙江工業(yè)大學(xué) 之江學(xué)院,浙江 杭州 310024)
長(zhǎng)期以來,我國高校英語教學(xué)的評(píng)估方式一直過多地依賴于終結(jié)性評(píng)估(summative assessment),即僅以考試成績(jī)?cè)u(píng)定學(xué)生的學(xué)習(xí)能力和教學(xué)質(zhì)量。盡管這種評(píng)價(jià)省時(shí)省力,有其自身的一些優(yōu)點(diǎn),但它重結(jié)果、輕過程,不能提供全面、準(zhǔn)確的信息來描述學(xué)習(xí)者的學(xué)習(xí)行為、能力發(fā)展和成績(jī)進(jìn)步等方面的情況[1],在很大程度上忽視了學(xué)生在學(xué)習(xí)上的主體性、能動(dòng)性和創(chuàng)造性。在英語教學(xué)日益強(qiáng)調(diào)自主學(xué)習(xí)的今天,這種評(píng)價(jià)體系的缺點(diǎn)也日益暴露出來,具體表現(xiàn)為:學(xué)生學(xué)習(xí)的動(dòng)機(jī)是為了通過考試;不能因材施教,扼殺學(xué)生個(gè)性;不利于學(xué)生創(chuàng)新精神和實(shí)踐能力的培養(yǎng)。
教學(xué)評(píng)估研究從二十世紀(jì)中葉算起,已經(jīng)發(fā)展了半個(gè)多世紀(jì)。在這期間,越來越多的專家學(xué)者逐漸意識(shí)到教學(xué)評(píng)估不僅包括以標(biāo)準(zhǔn)化考試為代表的終結(jié)性評(píng)估,也包括以學(xué)習(xí)為目的、注重學(xué)習(xí)過程的形成性評(píng)估(formative assessment) 。形成性評(píng)估以建構(gòu)主義、人本主義為基礎(chǔ),根據(jù)學(xué)生在各項(xiàng)學(xué)習(xí)活動(dòng)中的行為表現(xiàn),對(duì)其學(xué)習(xí)過程、學(xué)習(xí)態(tài)度、學(xué)習(xí)策略和學(xué)習(xí)效果等進(jìn)行綜合性的評(píng)估,這在一定程度上彌補(bǔ)了終結(jié)性評(píng)估的不足。
與國外相比,國內(nèi)形成性評(píng)估方面的研究始于二十世紀(jì)九十年代末,起步較晚,以理論研究為先導(dǎo)。最近十幾年,有些研究者將形成性評(píng)估的理論應(yīng)用到大學(xué)英語的口語、寫作等課程的實(shí)踐上,并取得了一些成果[2]。但到目前為止,涉及到英語專業(yè)尤其是實(shí)證方面的研究仍然很少[3],這有待于我們通過試驗(yàn)來檢驗(yàn)形成性評(píng)估的理論成果,找出適用于英語專業(yè)各門課程的行之有效的評(píng)估方式,克服終結(jié)性評(píng)估固有的缺陷。
形成性評(píng)估以建構(gòu)主義為依據(jù),把建構(gòu)主義、人本主義等觀點(diǎn)有機(jī)結(jié)合起來,是基于目標(biāo)、注重過程、及時(shí)反饋、促進(jìn)發(fā)展的、在教學(xué)過程中進(jìn)行的過程性、發(fā)展性評(píng)估,使教與學(xué)能夠相互促進(jìn)、相互提高[3]。
根據(jù)建構(gòu)主義(Constructivism),學(xué)習(xí)不是知識(shí)由教師向?qū)W生的傳遞,而是學(xué)生建構(gòu)自己知識(shí)的過程,這意味著學(xué)習(xí)是主動(dòng)的,學(xué)習(xí)不是被動(dòng)地接受外來信息,而是主動(dòng)地進(jìn)行選擇加工[4],因而不是行為主義所描述的S-R(Stimulus-Response)過程。學(xué)生不是被動(dòng)的信息吸收者,而是意義的主動(dòng)建構(gòu)者,這種建構(gòu)不可能由其他人代替。建構(gòu)主義的核心是個(gè)體內(nèi)化知識(shí),強(qiáng)調(diào)學(xué)習(xí)者的主觀能動(dòng)性。而形成性評(píng)估恰恰從動(dòng)態(tài)的、構(gòu)建的角度為學(xué)習(xí)者提供了檢測(cè)知識(shí)內(nèi)化的工具,為學(xué)生和教師提供了知識(shí)建構(gòu)的檢測(cè)手段。
羅杰斯在二十世紀(jì)六十年代提出的“自由學(xué)習(xí)”和“學(xué)生中心”(student-centered)的學(xué)習(xí)與教學(xué)觀進(jìn)一步強(qiáng)調(diào)了發(fā)揮學(xué)習(xí)者個(gè)人主觀能動(dòng)性的重要性[5]。他所倡導(dǎo)的人本主義認(rèn)為,人天然具有學(xué)習(xí)的潛力,學(xué)習(xí)是人的終生需求。教育要尊重學(xué)習(xí)者個(gè)體,尊重學(xué)習(xí)者的個(gè)人需求和情感,鼓勵(lì)學(xué)習(xí)者對(duì)自己負(fù)責(zé),自己選擇??梢姡吮局髁x重視的是教學(xué)過程而非教學(xué)內(nèi)容,重視的是教學(xué)方法而非教學(xué)結(jié)果。而形成性評(píng)估能夠有效滿足學(xué)生認(rèn)知自我的要求,培養(yǎng)學(xué)生自我負(fù)責(zé)、自我發(fā)展的能力,從而為學(xué)生的全面進(jìn)步提供客觀的衡量尺度。
概言之,基于以人為本、建構(gòu)主義的形成性評(píng)估強(qiáng)調(diào)對(duì)學(xué)生的學(xué)習(xí)過程進(jìn)行評(píng)價(jià),提供反饋信息,并對(duì)學(xué)生的情感、態(tài)度和策略等方面的發(fā)展做出評(píng)價(jià)[5]。
與國外相比,國內(nèi)形成性評(píng)估的研究起步較晚,主要集中于介紹形成性評(píng)估的理論基礎(chǔ)、實(shí)施方法、原則、優(yōu)缺點(diǎn)等內(nèi)容,大多停留在理論研究層面,或僅僅是簡(jiǎn)單的經(jīng)驗(yàn)介紹。實(shí)證研究相對(duì)較少,主要集中于大學(xué)英語的口語、寫作等課程方面[3]。如將形成性評(píng)估應(yīng)用于網(wǎng)絡(luò)教學(xué)[5],監(jiān)控寫作的各個(gè)環(huán)節(jié)[6],評(píng)價(jià)學(xué)生的自主學(xué)習(xí)能力[1]。這些實(shí)證研究表明,形成性評(píng)估可以激發(fā)學(xué)生學(xué)習(xí)語言的動(dòng)機(jī)和學(xué)習(xí)興趣,能有效地監(jiān)控學(xué)生的學(xué)習(xí)過程,同時(shí)培養(yǎng)了學(xué)習(xí)者的自主學(xué)習(xí)和交際能力。在為數(shù)不多的實(shí)證研究中,周文博[7]借鑒于廣的“235多元評(píng)價(jià)體系”[8]所進(jìn)行的研究對(duì)于形成性評(píng)估的實(shí)踐應(yīng)用有一定的指導(dǎo)意義。于廣針對(duì)大學(xué)英語的教學(xué),以多元智能為理論依據(jù),將過程性評(píng)估與終結(jié)性評(píng)估相結(jié)合,嘗試提出了一個(gè)激勵(lì)多元智能發(fā)展、突出聽說能力培養(yǎng)的“235多元評(píng)價(jià)體系”,即把原有的終結(jié)性評(píng)價(jià)的100分轉(zhuǎn)換為20%的口語成績(jī)、30%的平時(shí)成績(jī)、50%的卷面成績(jī)。這個(gè)體系有一定的創(chuàng)新性、科學(xué)性和實(shí)用性,但于廣并未將該評(píng)價(jià)體系應(yīng)用于實(shí)踐。而周文博[7]在“235多元評(píng)價(jià)體系”的基礎(chǔ)上,針對(duì)自己所教授課程的特點(diǎn)對(duì)該體系進(jìn)行了調(diào)整、細(xì)化,在大學(xué)英語這門課程的教學(xué)和評(píng)估中進(jìn)行了實(shí)踐。研究結(jié)果表明:學(xué)生對(duì)“235多元評(píng)價(jià)體系”的各個(gè)細(xì)節(jié)滿意度均較高,普遍認(rèn)為該體系能夠有效地促進(jìn)學(xué)習(xí),激發(fā)自己學(xué)習(xí)英語的積極性,多數(shù)學(xué)生認(rèn)為這種評(píng)價(jià)方式更加公平公正。但該研究也發(fā)現(xiàn)了一些問題,如學(xué)生對(duì)一些形式較為傳統(tǒng)的期中測(cè)試、隨機(jī)測(cè)試的認(rèn)同率非常低,對(duì)小組討論、網(wǎng)上自主學(xué)習(xí)等比較新的教學(xué)手段也不太認(rèn)同。
那么,上述研究中發(fā)現(xiàn)的有關(guān)形成性評(píng)估的優(yōu)點(diǎn)和問題是大學(xué)英語這門課程所獨(dú)有的,還是其他課程所共有的?該體系中提到的各項(xiàng)指標(biāo)及其所占比例是否也適用于其他課程?該研究的結(jié)果是否可以復(fù)制?這些問題均有待于我們通過實(shí)證研究來解答。
形成性評(píng)估的實(shí)證研究以往主要集中于非英語專業(yè)即大學(xué)英語上[3]。因此,本研究旨在通過試驗(yàn)來驗(yàn)證形成性評(píng)估是否能成功地應(yīng)用于英語專業(yè)課程的教學(xué)實(shí)踐。
本研究的試驗(yàn)對(duì)象為浙江工業(yè)大學(xué)之江學(xué)院2009級(jí)和2010級(jí)英語專業(yè)的本科生,其中2009級(jí)學(xué)生為對(duì)照組,2010級(jí)學(xué)生為試驗(yàn)組。試驗(yàn)課程為中級(jí)英語測(cè)試,該課程的性質(zhì)為英語專業(yè)四級(jí)(TEM4)備考課程,內(nèi)容包括聽寫、聽力、詞匯語法、完形填空、閱讀等TEM4考查的題型。試驗(yàn)從2010年9月開始,至2012年5月結(jié)束,前后歷時(shí)將近兩年。對(duì)照組采用的評(píng)估方法是終結(jié)性評(píng)估,而試驗(yàn)組采用了形成性的評(píng)估方法。
在該門課程第二次上課時(shí),即學(xué)生基本上熟悉了TEM4題型之后,筆者分別于2010年9月和2011年9月對(duì)對(duì)照組和試驗(yàn)組進(jìn)行了模擬考試(前測(cè)),試題完全相同,考查了除寫作外的全部TEM4題型,滿分為75分。經(jīng)獨(dú)立樣本T檢驗(yàn),T值為1.794,雙尾顯著性為0.74,這說明試驗(yàn)組和對(duì)照組的英語水平總的來說是一致的,沒有顯著性差異。T檢驗(yàn)的具體結(jié)果如表1:
表1 試驗(yàn)組與對(duì)照組的英語水平T檢驗(yàn)
由于所試驗(yàn)課程的性質(zhì)為應(yīng)試課,因此,本研究在235多元評(píng)價(jià)體系[7-8]的基礎(chǔ)上,主要采用了作業(yè)、隨堂測(cè)試、課堂表現(xiàn)、自評(píng)互評(píng)、教師評(píng)價(jià)、階段總結(jié)、模擬考試、期末考試等考核方式。在試驗(yàn)初期,筆者制定了上述各部分在學(xué)生總評(píng)成績(jī)中的比例,即期末考試30%,模擬考試20%,課堂測(cè)驗(yàn)15%,課后作業(yè)15%,課堂表現(xiàn)10%,自評(píng)2%,他評(píng)3%,出席5%。
經(jīng)過為期近兩年的試驗(yàn),對(duì)照組和試驗(yàn)組分別于2011年4月和2012年4月進(jìn)行了后測(cè),除增加寫作之外,其他試題與前測(cè)完全一致。試驗(yàn)組的平均分為61.05,明顯高于對(duì)照組的57.96分,經(jīng)過獨(dú)立樣本T檢驗(yàn),T值的顯著性達(dá)到了.009(表2)。這說明,不同的評(píng)估方法對(duì)試驗(yàn)組和對(duì)照組的最終成績(jī)產(chǎn)生了顯著性的影響:采用形成性評(píng)估的試驗(yàn)組學(xué)生學(xué)習(xí)成績(jī)提高幅度更大,這在2010級(jí)的TEM4通過率上也得到了充分的驗(yàn)證(表3)。
表2 試驗(yàn)后試驗(yàn)組與對(duì)照組的英語水平T檢驗(yàn)
注:**表示顯著性水平在0.01。
表3 試驗(yàn)組與對(duì)照組專業(yè)四級(jí)考試通過率
注:*表示顯著性水平在0.05; **表示顯著性水平在0.01。
對(duì)照組與試驗(yàn)組的學(xué)生分別于2011年4月和2012年4月參加了TEM4全國統(tǒng)考。從表3的結(jié)果來看,在獨(dú)立學(xué)院和全國的英語專業(yè)學(xué)生TEM4通過率顯著下降的大背景下,試驗(yàn)組的平均分(62.65)和通過率(74.77%)均取得了顯著性的提高,這再次驗(yàn)證了過程性評(píng)估在注重教學(xué)過程的同時(shí),對(duì)學(xué)生的學(xué)習(xí)結(jié)果確實(shí)產(chǎn)生了顯著性的影響,收到了良好的成效。
形成性評(píng)估在測(cè)試性質(zhì)的課程上的試驗(yàn)無疑是成功的,那么在本試驗(yàn)中哪些做法是值得肯定的呢?2012年5月,筆者對(duì)試驗(yàn)組的學(xué)生進(jìn)行了問卷調(diào)查及訪談,主要的問題有:總評(píng)成績(jī)中應(yīng)該包括哪些內(nèi)容、過去一年我們的評(píng)估中哪些做法對(duì)他們的學(xué)習(xí)是起促進(jìn)作用的、總評(píng)成績(jī)是否能反映他們的真實(shí)成績(jī)及其在班級(jí)中的排名等。共收回107份有效問卷。
從調(diào)查結(jié)果看,學(xué)生仍然認(rèn)為期末考試非常重要(40.8%),是總評(píng)成績(jī)中最重要的部分。而課堂測(cè)驗(yàn)(15.6%)和模擬考試(11.6%)的比重也均超過了10%。對(duì)于教師評(píng)價(jià)(2.8%)、自評(píng)(1.7%)、他評(píng)(2.4%)、課堂表現(xiàn)(4.5%)等可能會(huì)受人為因素影響的考核方式,學(xué)生認(rèn)為不應(yīng)在總評(píng)成績(jī)中占很大的比例。在被問及哪些評(píng)估內(nèi)容對(duì)他們的學(xué)習(xí)有促進(jìn)作用時(shí),學(xué)生認(rèn)同度較高的評(píng)估方法有:課堂測(cè)驗(yàn)(86.9%)、事先告知上交課后作業(yè)(65.4%)、期末考試(54.2%)、模擬考試(50.5%)、突擊抽查作業(yè)(36.4%)、事先告知不上交課后作業(yè)(30.8%)、課堂表現(xiàn)(20.6%),而出席(11.2%)、教師評(píng)價(jià)(8.4%)、自評(píng)(2.8%)、他評(píng)(1.9%)的認(rèn)同度幾乎可以忽略不計(jì)了。由此,我們可以得出如下結(jié)論:
第一,課堂測(cè)驗(yàn)、課后作業(yè)、考試等傳統(tǒng)評(píng)估方式的反撥效應(yīng)(washback)較好。反撥效應(yīng)指測(cè)試(評(píng)估方式)對(duì)教學(xué)和學(xué)習(xí)的影響[9]。如上文所述,學(xué)生認(rèn)為對(duì)他們成績(jī)最有幫助的仍然是那些非常傳統(tǒng)的評(píng)估方式:測(cè)驗(yàn)、作業(yè)和考試等。另外,有78.5%的學(xué)生認(rèn)為,老師對(duì)所留的作業(yè)是需要全部檢查的,而抽查和不上交作業(yè)的做法所起到的作用是有限的,因?yàn)榭傆幸恍W(xué)生存在僥幸的心理。
第二,自評(píng)、他評(píng)、教師評(píng)價(jià)等考核方式的信度、效度受到質(zhì)疑。任何測(cè)量手段包括測(cè)試都需要具備一定的信度(reliability)和效度(validity)[10]。從問卷調(diào)查結(jié)果看,學(xué)生普遍認(rèn)為這三種考核方式對(duì)于他們成績(jī)的提高幫助很小。筆者在與一些學(xué)生的訪談中,他們均提到了自評(píng)、他評(píng)、教師評(píng)價(jià)等方式對(duì)他們的課內(nèi)外學(xué)習(xí)有一定的督促作用,但主觀性強(qiáng),其科學(xué)性和公平性受到了質(zhì)疑,他們擔(dān)心這些評(píng)價(jià)方式容易受人為因素的影響,不好操作,如學(xué)生或老師可能會(huì)給評(píng)價(jià)對(duì)象人情分。因此,信度、效度較低,缺少可行性(practicality)。
第三,235多元評(píng)價(jià)體系基本能適用于應(yīng)試性質(zhì)的英語專業(yè)課程的評(píng)估。在問卷調(diào)查的最后兩個(gè)問題上,分別有86% 和81.3%的被調(diào)查的學(xué)生認(rèn)為該門課程期末的總評(píng)成績(jī)能完全或基本上反映出他們的英語能力及其在所在班級(jí)的排名。這說明,經(jīng)過修改的235多元評(píng)價(jià)體系總體來說具有很高的信度、效度和可行性。
目前,中國的大專院校普遍存在輕過程、重結(jié)果的問題,對(duì)學(xué)生的考核主要看學(xué)生在期末考試中能取得什么樣的成績(jī)[3]。教師與學(xué)生之間形成了評(píng)價(jià)與被評(píng)價(jià)的關(guān)系,學(xué)生對(duì)作業(yè)和考試等傳統(tǒng)評(píng)估方法已習(xí)以為常。因此,對(duì)本研究中的自評(píng)、他評(píng)、教師評(píng)價(jià)等過程性評(píng)估的做法普遍不太認(rèn)同。
從本試驗(yàn)中我們得到的啟示是:考試、測(cè)驗(yàn)等傳統(tǒng)的考核方式仍是約束學(xué)生的學(xué)習(xí)行為、提高學(xué)習(xí)成績(jī)的最好方式,這與周文博[7]的研究結(jié)果有些出入。與本研究一樣,他的學(xué)生總的來說是贊同這種評(píng)估方法的,但與本研究不同的是,他的學(xué)生對(duì)這些傳統(tǒng)的考核方式是不太認(rèn)同的。究其原因,本文的研究對(duì)象為獨(dú)立學(xué)院的學(xué)生,他們的自我約束能力、自主學(xué)習(xí)能力總體上不如一本、二本院校。因此,他們希望教師能對(duì)其學(xué)習(xí)行為進(jìn)行嚴(yán)格的約束,而約束的最好的、最傳統(tǒng)的方法就是考試(包括課堂測(cè)驗(yàn))和作業(yè),調(diào)查的結(jié)果也恰恰證明了這一點(diǎn):傳統(tǒng)的考核方式對(duì)他們的學(xué)習(xí)幫助最大。
整體而言,基于235多元評(píng)價(jià)體系的過程性評(píng)估在本研究中取得了良好的教學(xué)效果。這種評(píng)估方式充分體現(xiàn)了以人為本的教學(xué)理念,使學(xué)生也成為了評(píng)估的主體,師生之間多了合作,不再是簡(jiǎn)單的評(píng)價(jià)與被評(píng)價(jià)的關(guān)系,實(shí)現(xiàn)了重過程也重結(jié)果的目的。因此,這種評(píng)估方式是可以在不同的課程中復(fù)制的。
參考文獻(xiàn):
[1] 沈梅英.形成性評(píng)估在學(xué)生自主學(xué)習(xí)能力評(píng)價(jià)中作用的實(shí)證研究[J].天津外國語學(xué)院學(xué)報(bào),2010,(2): 71-76.
[2] 魏薇.大學(xué)英語口語測(cè)試中的形成性評(píng)價(jià)[J].文教資料,2005,(24): 36-38.
[3] 解芳.形成性評(píng)估與外語教學(xué)研究述評(píng)[J].邊疆經(jīng)濟(jì)與文化,2008, (6): 119-120.
[4] 莫雷.教育心理學(xué)[M].廣州: 廣東高等教育出版社, 2005. 127,150-151.
[5] 周娉娣, 秦秀白.形成性評(píng)估在大學(xué)英語網(wǎng)絡(luò)教學(xué)中的應(yīng)用[J].外語電化教學(xué),2005,(5): 9-13.
[6] 曹榮平, 等.形成性評(píng)估在中國大學(xué)非英語專業(yè)英語寫作教學(xué)中的運(yùn)用[J].外語教學(xué), 2004, (9):82-87.
[7] 周文博.“235多元評(píng)價(jià)”體系在大學(xué)英語課堂的應(yīng)用[J].齊齊哈爾師范高等專科學(xué)校學(xué)報(bào), 2010, (2): 139-140.
[8] 于廣.大學(xué)英語教學(xué)多元評(píng)價(jià)體系探析與思考[J].中國高教研究,2008, (8): 92-93.
[9] Brown J D. Testing in Language Programs: A Comprehensive Guide to English Language Assessment[M].北京:高等教育出版社,2006. 242.
[10] 李筱菊.語言測(cè)試科學(xué)與藝術(shù)[M].長(zhǎng)沙:湖南教育出版社,2001. 34,398.
浙江工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2014年2期