課堂評價,即教師在日常專業(yè)實踐層面對學生學習實施的評價,對學生的學習有直接影響,也會通過影響課程、教學間接影響學生學習。課堂評價實踐的改善是實現(xiàn)“輕負高質(zhì)”,促進學生學習的有效路徑。十余年前,王少非教授從“校內(nèi)考試研究”開始,逐步將研究領(lǐng)域擴展到“課堂評價”,研究成果豐碩,近期又出版了《促進學習的課堂評價》一書,就教師日常專業(yè)實踐層面實施的評價提出了一些新穎的觀點,也為教師做好評價以有效促進學生學習提供了一些可行的建議,對教師日常的作業(yè)設(shè)計與批改、試卷編制與批改、課堂提問和理答等評價活動有重要啟發(fā)。日前,本刊記者就“促進學習的課堂評價”對王少非教授進行了專訪,現(xiàn)將訪談刊出,以饗讀者。
【專家名片】王少非,男,教育學博士,臺州學院教授,華東師范大學課程與教學研究所兼職研究員。一直從事教師培養(yǎng)和培訓工作,主要從事教師教育、教師專業(yè)發(fā)展、課程教學、教育評價等方面的研究,曾為教育部師范教育改革重大項目“教師教育課程標準”研制專家組核心成員,承擔過浙江省哲學社會科學研究項目、教育部人文社科研究項目和教育部人文社科研究重點基地重大項目。發(fā)表論文50余篇,出版著作6部。
記:王教授好!最近看到您在華東師范大學出版社出版的新作《促進學習的課堂評價》,印象中,您對評價相關(guān)領(lǐng)域的關(guān)注已經(jīng)有好些年了吧?
王:很榮幸能得到貴刊的關(guān)注。非常感謝!的確如您所說,我涉足這個領(lǐng)域是有些年頭了。說起來,介入這一領(lǐng)域并非興趣,而是任務所迫。在2004年,華東師范大學課程與教學研究所鐘啟泉教授作為首席專家的教育部哲學社會科學重大攻關(guān)項目“素質(zhì)教育課程評價體系研究”獲批,作為課程與教學研究所的博士生,我參與了其中的一些外圍工作。在研究過程中,我發(fā)現(xiàn)了一個以往很少被關(guān)注的領(lǐng)域,那就是教師在日常教學層面對學生學習實施的評價。限于當時的積累,我從“校內(nèi)考試”這一領(lǐng)域著手,完成了我的博士論文。之后,就從這一領(lǐng)域擴展開來,關(guān)注了“教師評價素養(yǎng)”問題。近年來,主要開展課堂評價全領(lǐng)域的研究。
記:就我視野所及,課堂評價這一概念還并不太普及,我個人也并不十分明了。這個領(lǐng)域主要關(guān)注什么?
王:課堂評價這一術(shù)語其實來自于英文中的classroom assessment。在我們的日常教育話語中有個字面上很接近的術(shù)語,就是課堂教學評價,我們很容易將兩者混同。但課堂評價與課堂教學評價的關(guān)注點完全不同:課堂評價關(guān)注的是對學生學習的評價,而課堂教學評價關(guān)注的是對教師教學活動的評價。在“課堂教學評價”中,“課堂”是用來修飾教學的,而教學則是評價的對象;在“課堂評價”中,“課堂”卻是“評價”的情境,就是指教師在日常教學實踐層面實施,強調(diào)了其與各種大規(guī)模評價之間的區(qū)別,指的是教師對自己的學生在教學過程中實施的各種形式的正式和非正式的評價。特別需要強調(diào)的是,課堂評價中的評價,英文中用了assessment這個詞,而不是更常見的evaluation,實際上就是不強調(diào)評價的價值判斷,而是強調(diào)評價的信息收集功能。因此,課堂評價關(guān)注的就是教師在日常教學實踐活動中收集自己學生的學習信息并運用這些信息來改進學習的活動。具體來說,教師實施的考試、測驗,作業(yè)批改,課堂提問,甚至在課堂中對學生的觀察等都包含在課堂評價之中。
記:為何要關(guān)注課堂評價?
王:美國學者斯蒂金斯曾說:“如果評價不能在課堂層面有效地實施,那么其他層面的評價都是在浪費時間?!彼f的其他層面的評價,包括了學區(qū)的、州的、國家以及國際層面的。對于我們來說,這個論斷幾乎是顛覆性的,因為我們尤其是教育管理者一直相信,統(tǒng)考之類的外部評價是提升教學質(zhì)量的最重要的手段。開始我并不認可這一論斷,但在研究過程中發(fā)現(xiàn),越來越多的證據(jù)在支持斯蒂金斯的論斷,讓我相信,教學上的低效很多是因為教師評價的問題,課堂評價的改進是提升教學質(zhì)量,實現(xiàn)“輕負高質(zhì)”的重要路徑。另一方面,我們對課堂評價的關(guān)注非常有限。盡管我們有專門的教育評價學,可遺憾的是,傳統(tǒng)的教育評價學源于心理測量學,并不完全適用于對教育目的的評價;我們的教師非常關(guān)注如何教,但很少關(guān)注日常評價問題——即使有關(guān)注,可能更多也是在關(guān)注課堂評價語,關(guān)注評價的激勵功能,對于課堂評價如何更好地促進學生學習,關(guān)注實在有限,實踐中也存在許多問題。
記:您認為存在對促進學習不起作用的課堂評價嗎?這就是您在“課堂評價”之前加上“促進學習”這一修飾語的理由嗎?
王:教師從事專業(yè)實踐,出發(fā)點一定是促進學生學習,教師進行各種各樣的評價活動,初衷一定也是促進學生學習。然而,正如您所說,教師的有些評價實踐還真不能促進學習,至少可以說,評價對于促進學習的效果并不確定,有些評價能夠促進學習,有些評價對學習沒有明顯的促進作用,有些評價甚至可能阻礙學習。舉個例子說,曾經(jīng)有一段時間,小學課堂中流行諸如“你真聰明”“你真棒”之類的評價語,表面上看,得到此類評價的學生似乎表現(xiàn)出了更高的積極性。然而,如果學生不知道朝哪個方向去努力,如何努力的話,更高的積極性并不一定能帶來更好的學習表現(xiàn)。相反,這類評價甚至可能在鼓勵學生進行錯誤的歸因,將學習成敗歸因于很難改變的聰明或愚笨,結(jié)果導致所謂的“學業(yè)宿命論”。再比如說,我們許多教師都認真批改每一次作業(yè)、每一次測驗,但有些學生卻會在某些題上一錯再錯,原因很可能在于教師只指出學生某道題做錯了,但未能指出他錯在哪里。這說明教師的評價未能對學生學習起到良好的促進作用。
這些判斷也許與教師的觀感有些出入。在許多教師的經(jīng)驗中,激勵性的評價語似乎很有效,能夠?qū)W生學習帶來正面的影響。我不否認這一點。但是,最近有一本非常火的書,叫《可見的學習》,其作者在綜合了800余項關(guān)于影響學生學習的因素的元分析的基礎(chǔ)上得出一個結(jié)論:“幾乎一切都對學習有影響”,所有因素都對學習有一定的效應量。因此作者經(jīng)過分析后認為,只有效應量大于0.40的才算是真正有效的影響。而表揚之類的效應量僅為0.14。
記:教師評價不能對學生學習產(chǎn)生真正有效的影響,原因在哪里?
王:我認為,概括起來講,原因在于兩個方面:一個是評價未能收集到關(guān)于學生學習的準確的信息;二是所收集的信息未能為學生學習提供持續(xù)的充分的支持。
前一方面的表現(xiàn)之一是評非所教。在學生的作業(yè)、試題中,我們經(jīng)常會發(fā)現(xiàn)一些教師未教過也未對學生提要求的題目,我的一些學生在做家庭輔導,也反映說經(jīng)常碰到一些解決不了的小學作業(yè)題;網(wǎng)上也經(jīng)常有些被稱為“神題”的中小學生作業(yè)題,意指不僅適齡的學生難以解決,甚至受過良好教育的成年人也難以解決的題。這些題在本質(zhì)上有個共同特點,那就是偏離了教學目標和學習目標。教師的評價中若容納了偏離教學目標和學習目標的題,后果可能很糟糕。20世紀60年代,美國有過一個大規(guī)模調(diào)查,試圖搞清楚影響學生學業(yè)成績的因素,其結(jié)論是,學校教育對學生學業(yè)成績幾乎沒有影響,對學生學業(yè)成績起決定作用的是家庭背景。這一結(jié)論顯然難以為人所接受,對我們從事教育工作的人來說尤其難以接受。但我可以很容易驗證他們的結(jié)論——我只需要在用來確定“學生學業(yè)成績”的測驗中將學生在學校課程中所學的內(nèi)容排除在外,只安排那些與學生生活環(huán)境相關(guān)的題目即可。這樣的評價能夠收集學生的信息,但不能收集到學生在達成學習目標的過程中的學習狀況的準確信息。如果評價獲得的信息與學生達成學習目標的狀況無關(guān),那么這些信息就無助于學習目標的達成。
表現(xiàn)之二是評價的方法與目標不匹配。怎么評,其實受制于評什么,評價的目標決定了評價的方法。評價目標就是教學目標,就是學習目標。學習目標是多領(lǐng)域的,評價目標也是多領(lǐng)域的,適用于某些目標領(lǐng)域的評價方法可能對檢測另一領(lǐng)域目標的達成狀況完全無能為力,例如,肯定無法用紙筆測驗來檢測學生的口頭表達能力或?qū)嶒灢僮骷寄堋D硞€領(lǐng)域的目標也有不同的類型或?qū)蛹?,比如按布盧姆的教育目標分類學,認知領(lǐng)域的目標就有知識、領(lǐng)會、應用、分析、綜合、評價六種類型,每一種類型對學生都有不同的要求。學生是否達成這些要求就需要用不同的方法來檢測。填空題能否檢測學生的分析能力?簡答題能否檢測分析綜合能力?如果目標是分析,我們卻用填空題或選擇題來檢測,我們得到的信息就可能是不準確的。
記:如果GPS做不到準確定位,也就無法給我們精準導航,就是這個意思吧?
王:對。準確定位是精準導航的前提,準確把握學生當前的學習狀況就是運用信息來促進改進的前提。僅僅收集到信息,但不運用這些信息,改進就無法預期。當然,所收集的信息還要能正確運用。剛才我們提到評價不能有效促進學習還有一方面的原因,就是所收集的信息未能為學生的學習提供持續(xù)的充分的支持。就像您提到的GPS,如果GPS收集到您所在位置的信息,卻不告知您,就像現(xiàn)在許多網(wǎng)站都在收集您的信息,卻不讓您知道,那么它所收集的信息就對您到達目的地沒有幫助。只有GPS把所收集的信息轉(zhuǎn)化成對您有用的信息,才能持續(xù)地告知您,“在當前道路上繼續(xù)行駛3.6公里”或“在下一路口右轉(zhuǎn)”。
記:可在大多數(shù)實際情況下,教師會把批改過的作業(yè)、試卷等發(fā)還給學生,這不是將所收集的信息告知學生了嗎?為什么還會出現(xiàn)某些學生在某些題上一錯再錯的情況?
王:還是拿GPS來說吧。如果GPS告知您下一路口右轉(zhuǎn),您偏不右轉(zhuǎn),GPS對您就沒有任何意義。教師通過評價收集到的信息只有為學生所知且所用,才能真正幫助學生達成學習目標。如果信息不能為學生所用,信息對學生就沒有價值。教師的確會把相關(guān)信息反饋給學生,但在很多情況下,教師反饋的信息無法為學生所用,比如,作業(yè)、試卷上老師經(jīng)常以√、×以及√上加個點來批改,有時可能有分數(shù)或等級。這樣的信息能否為學生所用?顯然不確定。對于一個缺乏自我評價能力的學生來說,看到某道題上教師給的√上加個點的符號,很可能完全不知道因為哪里有問題才有這個點;又比如一篇作文,教師給了80分,學生很可能完全不知道自己的文章與教師心目中95分的文章差距在哪里。能夠為學生所用的信息通常應該是具體的信息、描述性的信息。就像您可能會碰到的情境,作者投稿,如果您覺得他的稿子不行,可能就不給任何回復,也可能會給個退稿信,說“您的稿件不符合本刊要求”。前一種情況是沒反饋,后一種情況給了反饋,但這種反饋能否有助于他進一步修改?顯然不能。當然,編輯沒有義務來幫助所有作者改進。但如果有作者就他的論文向您請教,您一定會指出一些具體的問題,提出一些相對具體的意見或建議。向?qū)W生提供關(guān)于他作業(yè)情況的具體信息,也就是所謂的描述性反饋。所有研究都表明,相對于只給對錯或分數(shù)等級的評價性反饋,描述性反饋對于改進更有效。
記:是這個道理。我們也想幫助作者提升他的文章質(zhì)量,但稿件太多,真的沒有時間。教師也一樣,這樣打√、打×的批改,就已花了那么多時間,若還要提供一些具體的描述性反饋,哪來那么多時間???
王:這的確是個問題。但并非不能解決。事實上,實踐中很多教師有些做法能夠較好地解決這個問題,比如面對面批改,比如集體講評,都能節(jié)省教師批改作業(yè)的時間。隨著現(xiàn)代通信手段的普及,語音反饋也能部分減輕教師批改作業(yè)的壓力。在這里我想主要講兩種做法。首先,作業(yè)要精簡,一方面作業(yè)量要減下來,但更重要的是作業(yè)的品質(zhì)要提高,其關(guān)鍵在于保證作業(yè)與學習目標的匹配,也就是說作業(yè)要求應當與學習目標的要求保持一致,不能布置與當前學習目標無關(guān)的作業(yè)。其次,批改無須面面俱到,每次作業(yè)只就與本次作業(yè)目標相關(guān)的那些錯誤提供描述性反饋,其他的錯誤就別管了。
記:其他的錯誤完全不給反饋?那這些錯誤可能會一直存在,該怎么辦?
王:設(shè)想一下一臺GPS,功能非常強大,能夠關(guān)注到很多東西,一路上喋喋不休,告訴您許多信息,不僅告訴您怎么走,而且一直指出您在開車技術(shù)動作上存在的問題,那會怎樣?關(guān)于怎么走的信息就可能被淹沒在繁雜的信息之中。所有的研究都告訴我們,太多的反饋通常不起作用。一種做法是,我們把看到的所有問題都指出來,結(jié)果都改不了。另一種做法是,只指出與當前學習目標相關(guān)的少量問題,然后確保其得以解決。在這兩種做法中,我們一定會選擇后一種做法。如果每次作業(yè)都達成預期的學習目標,學生慢慢就會有余力來解決其他的錯誤了。
記:如果學生能夠自己發(fā)現(xiàn)并解決存在的問題,教師批改作業(yè)的壓力就會輕很多。就像本刊的一些作者,持續(xù)向本刊投稿,開始時不行,到后來稿子質(zhì)量越來越高,我們編輯基本上無須修改,可以直接發(fā)表了。
王:我相信,如果您說的那些作者不是得到他人的指點并持續(xù)改進,他一定在不斷研究貴刊所發(fā)表的那些文章,而且一定會拿自己的文章與貴刊所發(fā)的文章作比較,在比較中發(fā)現(xiàn)問題,然后加以改進。這是一種自我評價能力。我的研究中也關(guān)注到了這個主題。學生自我評價能力的提高是減輕教師評價壓力的最根本的路徑。我經(jīng)常對一些教師說,要讓學生知道,老師是靠不住的。我的意思是,人不可能一輩子都有個類似于老師的人在身邊,隨時幫自己指出問題;人最終是要靠自己來發(fā)現(xiàn)自己的問題的。但自我評價的能力需要培養(yǎng),缺乏有意識的培養(yǎng),學生自我評價能力的發(fā)展會受到局限。不能只將學生當作評價的對象,而要讓學生參與到評價過程之中,比如創(chuàng)造機會讓學生自評、互評。比如有一個實驗學校的教師就經(jīng)常性在課后作業(yè)中減掉一些重復性的練習,加上一兩道促進自我評價的題,比如,“在上面4題中,你認為答得最滿意的題是?最不滿意的題是?為什么?”“與同伴交流后的作業(yè)中,你哪些做得好,哪些需要改善?”當然,僅給學生提供自評互評的機會是不夠的,有效的自評互評需要學生知道評價的標準——貴刊的那些作者研究貴刊所發(fā)表的文章其實就是在揣摩貴刊的錄用標準——為此必須讓學生清楚自己的學習目標,并幫助他們將學習目標具體化為清晰的評價指標。如果一個人明確知道自己要去哪里,而且很清楚到那里去要走的路,要經(jīng)過的各種標志物,這個人就可以根據(jù)這些標志物來判斷自己是否行進在正確的道路上,也就無須GPS來導航了。
記:您說“好的課堂評價等于GPS”,除了上面提到的那些之外,好的課堂評價還能從GPS中借鑒什么?此外,我覺得好的課堂評價也應該超越GPS,需要做得比GPS更多。您覺得呢?
王:課堂評價要有效促進學生學習,的確還可以從GPS那里借鑒更多。比如,GPS會實時收集信息,及時提供反饋,您肯定不會用一臺會滯后一個小時向您提供反饋信息的GPS。課堂評價也一樣,如果教師收集到學生學習的信息,間隔很長時間才向?qū)W生提供反饋,這種反饋對幫助學生改進就可能失去意義。再比如,GPS會持續(xù)提供反饋,如果您用一臺間隔半個小時才提供一次反饋的GPS,那么很可能在上一次反饋時您還在正確的道路上,而在那次之后,您走錯了,當您得到反饋時,其實您已經(jīng)在錯誤的路上走了半個小時了。
好的課堂評價是否應當超越GPS?您的問題給我很大的啟發(fā)。的確,好的課堂評價應該做得比GPS更多,GPS的有效運行需要人來設(shè)定目的地,好的課堂評價不能依賴外人來設(shè)定目標,教師必須非常清楚自己的教學目標。GPS只需要向駕駛員提供指令性反饋,駕駛員無須知道GPS為何及如何給出這樣的反饋;好的課堂評價還要向?qū)W生示范良好的評價,幫助學生學會評價。也許還有其他方面需要超越的,我在后續(xù)研究中會特別關(guān)注。
記:您說的“好的課堂評價等于GPS”,更多是從課堂評價對學生學習的直接影響角度來講的。記得您書中還提到“好的課堂評價影響學習的另一條路,即通過改進教師的教學來促進學生的學習”。
王:對的。關(guān)于好的課堂評價,我還有另一個類比,就是空調(diào)中的溫度計。這個溫度計干什么用?測定室溫。但它測定室溫之后不告訴人,而是告訴空調(diào)中的恒溫調(diào)節(jié)器,恒溫調(diào)節(jié)器會根據(jù)測定的室溫與使用者設(shè)定的目標溫度的關(guān)系,向空調(diào)中的工作系統(tǒng)發(fā)布繼續(xù)工作或暫停工作的指令。其實,這也相當于將來無人駕駛時代GPS的作用。評價所獲信息也有這樣一種用途,給教師自己用,教師根據(jù)所收集的學生學習信息來支持自己的教學決策,做出有利于學生學習的調(diào)整。這一領(lǐng)域與之前流行的“以學定教”以及當今很熱門的“精準教學”的關(guān)聯(lián)非常緊密,今后較長一段時間我會關(guān)注這一領(lǐng)域的研究。
記:謝謝您接受我的訪談!您能在本刊主持一個關(guān)于“課堂評價”的主題專欄嗎?
王:這是您和貴刊給了我與貴刊讀者一個交流的機會和平臺,謝謝您!我非常樂意與貴刊的讀者繼續(xù)交流,再次謝謝您!