孟 莉,劉 巖,譚 小 月
(1 北京建筑大學 文法學院,北京 100044;2 北京教育學院 朝陽分院,北京 100026;3 阿姆斯特丹自由大學 行為與運動科學學院,阿姆斯特丹 荷蘭 1081BT)
優(yōu)秀教師評價學生學業(yè)的策略與技巧
孟 莉1,劉 巖2,譚 小 月3
(1 北京建筑大學 文法學院,北京 100044;2 北京教育學院 朝陽分院,北京 100026;3 阿姆斯特丹自由大學 行為與運動科學學院,阿姆斯特丹 荷蘭 1081BT)
學業(yè)評價是教師教育教學中的重要環(huán)節(jié),不僅關系到對學生的評價,也關系到學生對學習的情感態(tài)度和努力投入,以及師生關系的質量。優(yōu)秀的中小學教師在評定學生學業(yè)成績時,能夠從學生長遠發(fā)展角度考慮評價對學生的全面影響,重視評分的發(fā)展性評價目的;在具體評分實踐中,能充分考慮學生對分數的認識、理解和感受,評分目的明確;能夠運用多種評價方式,從多個來源對學生多個方面的表現實施多元綜合評價;能夠根據評分目的和條件合理恰當地選擇評分標準,評分靈活可靠,又不失評價原則。這些理念和策略作法,確保了他們的評分能夠真正發(fā)揮鼓勵學生學習,促進學生成長的廣闊而深遠的目的。
優(yōu)秀教師;學業(yè)評價; 評分
對學生在校表現、學業(yè)成就進行評價和報告,是教育教學活動中極為重要的環(huán)節(jié)。中小學老師通常用分數來評定學生。而評價方式直接決定了評價結果以及結果帶來的各種影響。一個地區(qū)的教育政策最有可能影響學生和家長生活的就是與評分相關的部分,因為評分可以打開或者關閉對學生來說非常重要的學習機會。[1]什么時候讓老師給學生打分,打分時應考慮哪些因素,現有研究還沒有一致結論。[2]學生和老師對待分數的態(tài)度反映了教師的評分理念,也折射出整個教育評價體系的導向。通過評價,可以實現讓每一位學生成長與發(fā)展的目標。因此,反思并考量教師評分意義重大。
在國外,評價學生常用的分數有百分制、百分等級和用數字、字母、詞語表示的等級分數,或其他一些成績報告方法。在國內常見的學生分數評定方式主要有百分制評分和用“優(yōu)、良、中、及格、差”這樣的等級評分。不同的老師,對學業(yè)評價分數尺度掌握的寬嚴程度相互之間有差異,對分數價值的運用也不太一樣,有些老師惜分如金會用分數制裁學生,有些老師給學生評分數幾乎相同缺乏區(qū)分度,也有老師會根據不同類型測試目的靈活運用。研究指出,我國高中教師評價學生的內容不夠全面,偏重知識記憶層面,評價內容和手段單一,忽略了綜合素質考察;[3]過度以考試成績作為評價學生的唯一依據,過分注重分數,淡化了對評價結果的分析。[4]那么,優(yōu)秀的教師他們在學業(yè)評價中是如何用分數評定學生的呢?
1.會充分考慮學生對分數的認識和理解
在學生看來,分數就是對自己學業(yè)成績的測量,許多學生會因低分而覺得自己無法融入學校。有研究者用問卷調查了以色列402名中學生和174名老師,發(fā)現老師和學生都傾向于把評分當作評價學生成績的手段,而不是提高學習動機或者塑造課堂行為的首要目標。[5]一項研究曾發(fā)現,小學四年級以下的學生對評分的意義理解不多,但他們會從老師、家長對分數的強調中感受到分數的意義和價值。隨著年齡增加,學生自己對評分概念和意義的理解逐漸加深。到了初二、初三,大多數學生對評分中使用的如分數線、學分和加權評分等一些復雜概念才開始有所理解。小學六年級以下的學生不太看重分數,對他們的分數影響較大的是不可控的外部因素。相比年齡小的學生,年齡大的學生則比較看重分數,認為評分與內部可控因素相關聯,并很清楚評分的來由,逐漸認為分數對未來有重要影響,對評分產生擔憂,甚至持批判態(tài)度,更不愿接受低的評分等級 。[6]
雖然,教育家更加強調學生的內部學習動機,但評分方式的確對學生付出努力多少有重要影響。大多數學生把高分視為成功的標志,有些學生努力學習就是為了避免得低分。得低分的學生畏懼學習,會減少學習努力。為了保護自我形象,許多得低分的學生認為分數低無所謂,沒有什么意義;也有一些學生因低分可能會自責,但卻感到無力改進。由此可見,低分會極大的損毀學生自我形象和學習動機。如果學生得到比自己真實學業(yè)水平低的分數,可能會導致他們認為自己缺少成功的能力,從而降低他們的自我效能感和學習動力。[7]
國內研究者發(fā)現,分數會對學生的心理產生影響。[8]在學習過程中,學生追求的是對自己學業(yè)公正的評價,但往往為了追求好成績和高分數這種迫切的眼前目標而忘卻了遠大目標。在學校生活中,有許多現象也都反映了學習和分數、分數與師生間這種相互交織的奇特關系。甚至會出現教師給學生評分低,學生會給老師評教也低,分數竟然成為師生博弈的籌碼。
分數對中小學學生,尤其是高年級學生的自我價值感、學習興趣、學習行為、師生關系質量等有重要影響。優(yōu)秀教師會注意了解、觀察分數對學生心理的影響,懂得如何發(fā)揮評分對學生學習和成功的鼓勵和支持作用,發(fā)揮評分的積極反饋和引導價值,為了促進每一個學生的健康發(fā)展,相應他們也會對自己的評分理念和評分實踐活動做出調整。
2.重視評分的發(fā)展性評價目的
評分目的往往與評分用途相關聯,對整個評分過程具有指導作用。對學生進行評價的最初目的,其實就是為了了解學生掌握了什么,教師可以做什么,從而與學生進行交流。有很多研究揭示了評分對于學生的意義,發(fā)現評分可以幫助學生更有效的學習。[9-12]一般而言,評分可以證明學生對具體學習內容掌握或達到的水平,能夠選拔、鑒別學生或將學生分類,能夠指導學生或為某個診斷發(fā)展計劃提供有效信息,能夠激勵或強調學生要學會的具體內容和技巧,能夠幫助學生理解和提高他們的表現,能夠方便教師與學生家長或其他人員交流學生學習取得的成就,能夠給學生自我評價提供信息,能夠刺激學生的學習。[13,14]在這些眾多的目的中,O’Connor十分強調溝通交流和發(fā)展性評價目的,認為它們是評分的最主要目的,評分應當對學生的學習和成功起到支持和鼓勵作用。[14]根據評分,老師可以確定學生的優(yōu)勢和弱勢,從而進行更好的指導,但是如果教師僅僅用分數來評價學生就會出現很多的問題,學生和家長就會把分數當成進步和提高的標準,從而使學生的學術能力、學習興趣和內在動機下降。
在國內的學業(yè)評價實踐中,被普通人感知到也是學校教師最常使用的目的就是看重評分的選拔和鑒別目的。在重大考試中,幾分之差帶來的變化讓學生有天地之別,致使教育者和受教育者唯“分數”論成敗,忽略了評分對學生個人發(fā)展的指導、激勵、交流等價值。甚至有的老師將評分作為懲罰、控制學生的工具。Guskey強調,分數作為獎賞會有一定價值,但如果將其作為懲罰則毫無價值,堅決反對教師采用評分作為懲罰學生的工具。[15]
優(yōu)秀教師在給學生評分時,他們會考慮不同的評分目的,并有所側重,采用發(fā)展性評價方式,發(fā)揮評分對學生學習的鼓勵和支持作用,將分數帶給學生的消極影響降到最低,并且從評分中反映出學生的發(fā)展狀況,便于學生、家長、教師以及社會用人單位的理解和溝通。
3.運用多種評價方式,實施多元綜合評價
學生的得分,一類是課堂上老師給的分數,一類是標準化測驗分數。但是學生在校表現形式很多:期中期末考試、課堂小測驗、學校作業(yè)、家庭作業(yè)、小論文、口頭報告表現、課堂參與度、出勤率、學習態(tài)度、努力情況、人際交往、品行習慣等等。是否需要全面考察這些因素,將其納入學生綜合素質考評中呢?全部納入,又如何對它們加權呢?
中小學生的得分應該反映什么,對此問題測量專家和研究者爭議很大。許多學者提出,分數應該反映學生的學術成就或者掌握的知識內容。[16-19]然而,現有研究已經表明,教師在評分時并不是完全按照這個標準,很多老師評分時會考慮各種學術和非學術因素,比如努力、能力和進步的情況等。[12,20]一項大樣本的問卷調查研究結果顯示,大部分老師承認在評分時綜合考慮了各方面因素,49%的老師表示評分時不應該考慮學生的天賦,但是72%的老師會給天賦不好但付出努力的學生加分,這表明老師對學生評分的認知與其評分行為相互矛盾。學生中有一半也認為,評分時綜合考慮是公平的。[20]另一項研究調查了小學六年級到高三年級的任課老師,也發(fā)現老師評分時綜合考慮了兩種因素:一種是學術因素,比如做一套題的正確率;另一種是非學術因素,比如課堂表現、努力或者天賦。前者是首要考慮的因素,后者不會經??紤]。[18]以中國學生為被試的一項研究也發(fā)現了同樣的結果。[21]多元智力理論表明,一個人的智力由多種成分構成,另外,非智力因素的影響也很重要。所以,學生評價需要用多種工具對其學習成績、學習態(tài)度、創(chuàng)新精神、合作意識等多個方面進行全面綜合評價。但O’Connor認為,評分是一種相對單一的測量,含義必須清晰,應當只針對學業(yè)成就,評分不應用作對努力不夠或行為不當的懲罰工具。紀律問題應當依據紀律規(guī)則本身去解決。是否努力用功、學習態(tài)度是否主動積極、是否按時到校、是否按時提交作業(yè)、參與度如何等等其他帶有價值特性的這些個人或社會特征,不應包括在評分中,因為它們難以界定和測評,應當單獨報告。當然,應該報告這些變量,它們都非常重要,對學業(yè)成就都有直接影響,但不應包含在評分中,這樣會混淆評分含義。[14]比如,一個學生遲交了論文,評分應反映他的論文水平,對他遲交的習慣則應另外單獨報告。
在美國一所州立學校發(fā)現,美國小學一年級期末成績報告單中,列了學生八種智力要素的評價結果,還考察了學生的努力程度。如果一個學生的SAT分數很高,但他因參加課外活動少缺少這部分學分的話,就會喪失升入大學的機會。這種升學體制,也為全面實現以衡量學生能力為導向的多元學生評價提供了制度保障。[22]目前我國小學和中學的學籍卡,除了填寫主科信息之外,也包含了一些其他信息,并全部采用等級方式呈現,體現了多元評價色彩,但尚未與升學體制緊密結合。
Guskey指出,沒有哪種評分和報告成績的方法可以實現所有目的。[15]O’Connor也承認應當采用多樣化的綜合評價方式,以解釋不同的學習風格和多元智力。[14]但問題是綜合評價的各項指標該如何加權?分數代表的意義究竟是什么呢?由于有些因素無法客觀評價,有些權重的確定比較隨意,學生對分數背后意義的理解,尤其是當分數包括了對其學習態(tài)度、努力程度、課堂參與度等因素的評價時,其清晰度下降。
優(yōu)秀教師在評定學生時,為實施綜合素質評價,促進學生發(fā)展,會傾向保留評分的單純含義,也會采用適當方式單獨報告要考察的其他重要變量,包括非智力因素方面的表現,以便于學生、家長等其他人員之間理解、交流評分。
4.根據評分目的和條件合理恰當地選擇評分標準
評分標準是教師在給學生評分的依據和具體參照準則?;跇藴蔬M行評估和評分是世界范圍內熱議的話題。[23,24]在教師評分實踐中常用的標準多種多樣:有絕對標準和相對標準,主觀標準和客觀標準,結果標準、過程標準和進步標準。如何選擇使用這些評分標準,主要取決于評分目的和客觀條件。
絕對標準是指事先確定好的固定標準。使用絕對標準評分,評分的控制權其實掌握在學生手中,只要標準符合實際而且公平,學生只要努力學習就可獲得好的評分,但是,教師自己必須清晰地明確期望學生要學到什么,并把這些結果與學生的評分結合起來。[13,14]在教學過程中,教師就應將評分標準向學生解釋清楚,讓學生明確學習目標。標準也不能定得太高,以免學生感到無法實現而放棄努力。這種評分方式容易受考試難度的影響。相對標準是學生所在群體的其他同學的表現。實際使用時,是將學生的成績與其他學生比較,參照學生所在群體的平均水平進行評分。一個班級學生得分是一個圍繞平均數的正態(tài)分布。少數學生得優(yōu)或差,大多數學生得中,許多學生得良或及格,教師事先可確定每個等級的百分比。以這種評價標準給學生劃分等級,考慮到了測評的難度指標,不同教師之間的評分具有更大的一致性,但這樣做對教學有不利影響。由于得高分的人數比例很小,在這種情況下,學生會認為幫助同學解決學習困難會威脅到自己取得高分的機會,這不利于學生社會關系的發(fā)展。[13,15]而且,對于智力水平相當的學生,當教師的教學質量很高,能夠很好滿足學生學習需求,大部分學生都能取得高分。[15]另外,當班級學生人數不多時,學生的表現未必服從正態(tài)分布。在不同評分標準下,同一場考試同一學生的成績,評分等級很有可能不一樣。如果一個學生得了80分,其他大多數學生都在90分以上,按正態(tài)分布看,他的表現低于平均水平。但如果用絕對標準,該同學可以得到良;相反,在相對標準下,該同學可能只得中。
評分中的主觀標準是指教師的個人觀察經驗,客觀標準是依據先確定好的具體可操作的評分體系。無論用什么方法,給學生的評分都不可避免帶有主觀性。實際上,報告方法越細致,分析過程越多,結果的主觀性越強。教師的評分主觀性如果成為一種偏差時,它就會導致消極后果。比如有行為問題的學生得高分的機會很少,因為他們的瑕疵遮蔽了他們的表現,這類在對男生的評價上尤其明顯。分數或數量化的評分等級比較公平客觀,但這種評分體系減少了教師的判斷成分,減少了評分的靈活性,容易引起誤解,不便于交流溝通。[13]
Guskey提倡,評分等級及其報告應當與學習結果、過程和進步三個標準相關聯。[15]結果標準是依據學生最終取得的學業(yè)成就。過程標準是依據學生在學習過程中的表現。進步標準是依據學生在學習過程中所取得的進步。采用結果標準的教師經常以期末考試分數、總體評價或其他最后學習展示為依據進行評分,關注學生在知道什么,會做什么。采用過程標準評分的教師認為,評分還應當反映學生是怎樣達到那個水平的,報告學生學習分數時他們會考慮學生的努力和習慣,會將課堂測驗、家庭作業(yè)、課堂參與或出勤率考慮在內。采用進步標準評分的教師,更看重學生分數進步了多少,從學習中收獲了多少,而不是他處于哪個水平,分數標準高度個性化。后一種評分代表了一種新的趨勢,真正有利于個性化的教育和學生個體的發(fā)展。對于這三種標準的選擇,大部分研究者和測量學家建議只采用結果標準。他們指出過程與進步標準參與越多,評分的主觀性和偏差也會越多。在用進步標準評分時,聰明學生由于原來水平較高展現出來的進步和努力可能最少,低成就學生也有可能只是由于成績趨向均數的簡單回歸顯現出進步。過程標準和進步標準能更全面地反映學生在學習過程中所付出的努力和取得的進步,能給學生帶來積極反饋,尤其是對那些學習能力一般或偏低的學生而言,可以彌補只采用機械的結果標準評分的局限。優(yōu)秀教師在評分過程中,會以基于標準的評分理論做指導,也應給評分實踐留有一定自由空間,在最后評分中,會選擇采用多個標準,常常會以結果標準為主,同時參考過程標準和進步標準。
5.評分過程中值得考慮的其他因素
在學生學業(yè)評價過程中,當遇到下面一些情況時,優(yōu)秀教師能夠靈活做出更適合學生發(fā)展的選擇:
當學生接受評估時有意外發(fā)生,學生有爭取第二次評估機會的愿望時,他們會給學生提供接受第二次評價的機會。雖然這給其他同學會造成不公平,但現實生活中不缺乏重來的機會。在學生更正自己的錯誤后,爭取重來,正是學生對學習負責任的表現,應當給予機會,可以用平行卷,考察內容一樣,計分時采取更嚴格的標準,以保證公平。
評分會更重視參照最近的信息。在課程剛開始學習初期,學生能力必定有限,通過學習學生們豐富了知識,提高了能力,后期學習表現體現了他們學習取得的成就。所以,評分應當是暫時性的、階段性,它表示的是某個時段的水平和成就,因而,評分時應該用最近的能夠顯示學生真實學業(yè)成就的信息取代舊信息,尤其是學科評分,應該根據最近的成績。[20]
根據分數類型,參照平均數或中位數轉換評定結果分數。通常,將分數轉化為等級評分時,大多數教師會用平均分作為計算的參考點。雖然,平均分是用來描述數據分布集中趨勢最常用的統(tǒng)計量,但它容易受極端值影響,如果教師的評分是順序型數據,描述集中趨勢的統(tǒng)計量則最好采用中位數。[25]
評價學生時會把評分與評語結合起來。教師給學生給出評分等級只是學生評價的一部分,成績報告單是評分等級帶給學生、家長心理效應的主要媒介。清晰、易懂的報告單便于教師與家長的溝通、對話,對共同幫助孩子進步有重要意義。同時,成績報告單對學生也有重要影響。調查發(fā)現,只有教師提供了具體或個性化的評語時,成績評定結果對學生學習的有利影響作用才會顯現出來。[26]優(yōu)秀教師給學生的評分等級通常會結合文字評語一起來報告。
6.給一般教師評分的啟示
隨著教育改革的深化,教師對學業(yè)評價目的的認識越來越清晰,為促進學生發(fā)展,也更加重視評分的反饋。前述這些優(yōu)秀教師在評定學生學業(yè)時的理念和實踐中運用的策略技巧,對于一般教師的專業(yè)成長和發(fā)展,有重要借鑒意義和指導價值,可供一般教師在學生評分實踐中參考,以支持學生學習、鼓勵學生成功、促進學生發(fā)展。
概而言之,在評價學生時,教師需要考慮不同學生的心理發(fā)展水平和經驗感受,盡量以鼓勵學生進步為主,避免分數帶給學生較大的消極影響。其次,教師在每次評分之前需要明確評分目的,在平時側重評分的反饋作用,淡化評分的甄選、分類用途。再者,評價學生時不僅僅要考慮教師個人對學生的觀察,還要考察學生周圍的其他人,如同伴、家人對他的觀察和評價;同時,不能只看測試成績,還要結合教師的個人觀察、訪談、對學生作業(yè)的批改等多種方式對學生的知情意行、付出的努力等多方面進行多源和多元評估;第四,要根據評價目標選擇恰當的評價標準,平時評分不能以追求客觀為理由,過度利用相對標準,要提前告知學生絕對標準,并根據學生原有的不同水平判斷他們進步程度;評價標準不能過于主觀,但又不失靈活性,最好能給家長提供詳細的文字評語,便于理解溝通。最后,還需要多給學生提供進步機會,側重考查學生最近的狀況。
現代教育要求,教師的評分應當在發(fā)展性評價思想指導下,與教師的課堂真實性評價和指導結合起來,為學生的健康、快樂成長服務。希望這些做法能夠對一線教師有所幫助。
[1] ALLEN, J. D. Grades as valid measures of academic achievement of classroom learning[J]. The Clearing House, 2005 (5): 218-223.
[2] GUSKEY, T. R. Helping standards make the grade[J]. Educational Leadership, 2001 (1): 20-27.
[3] 郭丹.英語教學中對學生評價存在的問題研究[J].消費導報,2009(16): 167.
[4] 陳玉華.普通高中學生評價改革的視點與評析[J].現代教育科學, 2009(3): 26-27.
[5] ZEIDNER, M. Reactions of students and teachers towards key facets of classroom testing[J].School Psychology International,1994 (1):39-53.
[6] BURTON, F. A Study of the Better Grade System and Its Effects on the Curriculum[Z]. ERIC No. 238143, 1983.
[7] PINTRICH, P.R, SCHUNK, D. H. Motivation in education (2nd ed.)[M]. Upper Saddle River, NJ: Merrill/Prentice Hall, 2002.
[8] 黃澤良, 姚玲.新課改下教師評分藝術探析[J].四川教育學院學報,2006 (12):16-18.
[9] KOHN, A. GRADING. The issue is not how but why[J]. Educational Leadership, 1994(2): 38.
[10] BROOKHART, S. M. Grading[M]. Upper Saddle River, NJ: Pearson, Merrill, Prentice-Hall, 2004.
[11] GUSKEY, T. R, BAILEY, J. M. Developing grading and reporting systems for student learning[M]. Corwin Press,2001.
[12] BROOKHART, S. M. Teacher grading practices: Meaning and values[J]. Journal of Educational Measurement, 1993 (2):123-142.
[13] ORNSTEIN, A. C. Grading practices and policies: An overview and some suggestions[J]. NASSP Bulletin, 1994(561):55-64.
[14] O’CONNOR, K. Guidelines for grading that support learning and student success[J]. NASSP Bulletin, 1995(571):91-101.
[15] GUSKEY, T. R. Making the grade: What benefits students?[J]. Educational Leadership, 1994(52): 15-20.
[16] GRONLUND, N. E, WAUGH, C. K. Assessment of Student Achievement[M]. Pearson, Upper Saddle River NJ,2009.
[17] MCMILLAN, J. H. Formative classroom assessment: Theory into practice[M]. Teachers College Press,2007.
[18] MCMILLAN, J. H, MYRAN, S, WORKMAN, D. Elementary teachers’ classroom assessment and grading practices[J]. The Journal of Educational Research, 2002 (4):203-213.
[19] MILLER, M. D, LINN, R. L, GRONLUND, N. E. Measurement and assessment in teaching[M]. Upper Saddle River, NJ: Merrill/Pearson, 2009.
[20] CROSS, L. H., FRARY, R. B. Hodgepodge grading: Endorsed by students and teachers alike[J]. Applied measurement in Education, 1999 (1): 53-72.
[21] SUN, Y, CHENG, L. Teachers’ grading practices: meaning and values assigned[J]. Assessment in Education: Principles, Policy & Practice, 2014(3): 326-343.
[22] 單麗梅.以衡量學生能力為導向得多元評價——由一張美國普通得成績報告單所想到的[J].計算機教與學, 2005(9):7-8.
[23] GUSKEY, T. R, JUNG, L. A. The challenges of standards-based grading[J]. Leadership Compass, 2006(4): 2.
[24] O’CONNOR, K. How to grade for learning[M]. Thousand Oaks, CA: Corwin Press,2002.
[25] 張厚粲,徐建平. 現代心理與教育統(tǒng)計學[M]. 北京: 北京師范大學出版社, 2009:76.
[26] PAGE, E.B. Teacher comments and student performance: a seventy-four classroom experiment in school motivation[J]. Journal of Educational Psychology, 1958(49):173-181.
[責任編輯 向 寧]
Grading Strategy and Tactics of Excellent Teachers
MENG Li1, LIU Yan2, TAN Xiao-yue3
(1SchoolofHumanityandLaw,BeijingUniversityofCivilEngineeringandArchitecture,Beijing100044;2ChaoyangBranchofBeijingInstituteofEducation,Beijing100026;3DepartmentofExperimentalandAppliedPsychology,FacultyofBehaviouralandMovementSciences,VUUniversityAmsterdam)
Students’ achievement assessment is an important part of teaching, which involves a teacher’s emotional attitude toward and investment into students, the relationship between students and teachers, as well as student’s performance. An excellent teacher lays emphasis upon the goal of dynamic grading with regards to students long-term development; in grading, they put students reaction into full consideration; they are able to evaluate from multiple aspects and resources with a variety of methods; they are able to choose just, flexible and reliable grading. All the ideas and strategies ensure their grading to be capable of inspire students to strive for their goals of life.
excellent teachers; academic evaluation; grading
G451
A
1674-2087(2015)02-0023-05
2014-12-08
北京市教育科學“十一五”規(guī)劃2008年度重點課題(AIA08065)
孟莉,女,陜西銅川人,北京建筑大學文法學院副教授,碩士生導師,碩士;劉巖,女,內蒙古古磴口人,北京教育學院朝陽分院高級教師;譚小月,女,湖南桂陽人,北京師范大學心里學院碩士,阿姆斯特丹自由大學行為與運動科學實驗與應用心理學系博士研究生。