◎ 何 穗 閆亞瑞 莊 璟
教育部在2012年發(fā)布《中學(xué)教師專業(yè)標(biāo)準(zhǔn)(試行)》,明確指出教師教育評價(jià)能力是六項(xiàng)專業(yè)能力要求之一,要求教師能利用評價(jià)工具,掌握多元評價(jià)方法,多視角、全過程評價(jià)學(xué)生發(fā)展;引導(dǎo)學(xué)生進(jìn)行自我評價(jià);自我評價(jià)教育教學(xué)效果,及時(shí)調(diào)整和改進(jìn)教育教學(xué)工作。數(shù)年過去,學(xué)校教師的評價(jià)素養(yǎng)現(xiàn)狀如何?如何測評?優(yōu)勢與不足表現(xiàn)在哪些方面?原因何在?如何提升教師評價(jià)素養(yǎng)?本文試圖通過調(diào)研來尋找問題答案。
“評價(jià)素養(yǎng)”最早由美國教育測評專家斯蒂金斯(Stiggins)提出。斯蒂金斯指出:“有評價(jià)素養(yǎng)的教師知道合理與不合理的評價(jià)之間的區(qū)別,知道評價(jià)什么,為什么評價(jià),怎樣更好地評價(jià),以及如何促成良好的學(xué)生表現(xiàn)行為,知道評價(jià)可能會(huì)出現(xiàn)什么錯(cuò)誤以及如何防止錯(cuò)誤,知道不準(zhǔn)確的評價(jià)所帶來的潛在后果”。[1]帕特諾(Paterno)認(rèn)為評價(jià)素養(yǎng)是指“擁有關(guān)于合理的評價(jià)實(shí)踐基本原理的知識(shí)”。韋布(Webb)認(rèn)為評價(jià)素養(yǎng)是“關(guān)于評價(jià)學(xué)生所知、所能的方法類知識(shí),怎樣解釋評價(jià)結(jié)果的知識(shí),以及如何運(yùn)用評價(jià)結(jié)果去改善學(xué)生學(xué)習(xí)和課程效果的知識(shí)”。[2]由此可見,“評價(jià)素養(yǎng)是實(shí)施學(xué)生學(xué)業(yè)質(zhì)量評價(jià)時(shí)所應(yīng)具備的素養(yǎng)”是研究者的共識(shí),但不同研究者闡述的視角不同,斯蒂金斯是基于具備評價(jià)素養(yǎng)人的特征視角,而帕特諾和韋布則是基于評價(jià)素養(yǎng)的知識(shí)視角。
從素養(yǎng)本義看,素養(yǎng)不僅包括知識(shí)層面,還包括技能、態(tài)度與價(jià)值觀層面。因此,本文采用本體視角對教師評價(jià)素養(yǎng)予以界定:教師評價(jià)素養(yǎng)是教師在教育實(shí)踐中從事學(xué)業(yè)評價(jià)活動(dòng)所需要的評價(jià)能力與品質(zhì),學(xué)業(yè)評價(jià)包括認(rèn)知、情感、態(tài)度與價(jià)值觀領(lǐng)域的評價(jià)。
測評需要建立測評框架以及與之匹配的測評工具,建立測評框架的首要前提是確定測評維度和標(biāo)準(zhǔn)。
由于素養(yǎng)是知識(shí)、能力與觀念的綜合表現(xiàn),評價(jià)素養(yǎng)應(yīng)包括評價(jià)知識(shí)、評價(jià)能力與評價(jià)觀念三個(gè)維度。評價(jià)知識(shí)、評價(jià)觀念是評價(jià)能力的基礎(chǔ),評價(jià)能力是評價(jià)知識(shí)與評價(jià)觀念的外在表現(xiàn)。
評價(jià)能力具體表現(xiàn)在哪些方面呢?代表性觀點(diǎn)主要有三個(gè):美國教師聯(lián)盟開發(fā)的“教師教育評價(jià)能力標(biāo)準(zhǔn)”、斯蒂金斯的“七要素說”和謝弗(Schafer)的“八領(lǐng)域說”。這些評價(jià)標(biāo)準(zhǔn)雖然說法各異,但內(nèi)容相近,都圍繞教師的教育教學(xué)實(shí)踐,從評價(jià)目標(biāo)設(shè)定、評價(jià)方法選擇以及評價(jià)結(jié)果解釋及應(yīng)用、評價(jià)倫理等角度闡述教師評價(jià)素養(yǎng)。本文以認(rèn)可度最為廣泛的美國教師教育評價(jià)能力標(biāo)準(zhǔn)作為本研究測評依據(jù),如表1所示。
表1 美國教師評價(jià)素養(yǎng)標(biāo)準(zhǔn)
基于教師教育評價(jià)能力的七個(gè)標(biāo)準(zhǔn),研究者進(jìn)行了教師評價(jià)素養(yǎng)的測評工具的開發(fā),其中由普萊克(Plake)等在1991年研制的教師評估素養(yǎng)問卷,是教師評估素養(yǎng)研究中引用最多的一份問卷[3]。此份問卷覆蓋7個(gè)評價(jià)標(biāo)準(zhǔn),共35個(gè)問題,問卷經(jīng)過大范圍效度檢驗(yàn),得到學(xué)界廣泛認(rèn)可。
本研究以普萊克等的問卷為藍(lán)本,基于中國教育實(shí)際情況對問卷進(jìn)行改編,刪除了與中國教育實(shí)情不符的題目。改編后問卷分三個(gè)部分:第一部分是教師基本情況以及評價(jià)基礎(chǔ),共12道題;第二部分是教師評價(jià)素養(yǎng),共21道題;第三部分是教師意見,共36道題。問卷結(jié)構(gòu)及對應(yīng)題號(hào)如表2所示。
表2 問卷結(jié)構(gòu)及對應(yīng)題號(hào)
本研究采用“問卷+訪談”調(diào)研方式,通過“問卷星”平臺(tái)共收集91位初中教師和63位高中教師共154人的有效問卷,其中選擇6位教師進(jìn)行問卷訪談。采用SPSS24.0與Excel的量化分析工具,題型設(shè)置有單選題與多選題,問卷第二部分計(jì)分,每題1分,每個(gè)維度3分共21分。
參加問卷的男女教師比例約為1∶4,各年齡段分布均勻,學(xué)歷水平是大學(xué)本科居多(占比66.88%),任教學(xué)科涉及中學(xué)所有學(xué)科??梢哉f,無論是性別、年齡,還是學(xué)歷與學(xué)科,參加問卷的教師比例與中學(xué)教師實(shí)際比例相符,樣本具有代表性。
問卷顯示, 55%的教師沒有學(xué)過教育評價(jià)相關(guān)課程;63.58%的教師沒有主持或參與過評價(jià)相關(guān)的項(xiàng)目或課題研究;38.90%的教師從來沒有參加過評價(jià)相關(guān)培訓(xùn)??梢哉f,無論是職前師范教育,還是職后教育與繼續(xù)教育,教師的評價(jià)素養(yǎng)并未得到應(yīng)有的重視,評價(jià)基礎(chǔ)普遍較弱。
教師的評價(jià)素養(yǎng)總分及每個(gè)維度的平均值和標(biāo)準(zhǔn)差如表3所示。
表3 教師評價(jià)素養(yǎng)問卷分析結(jié)果
從表3可見,教師評價(jià)素養(yǎng)總分均值為10.66,滿分值為21,相當(dāng)于百分制的51分,即低于及格水平,教師評價(jià)素養(yǎng)的現(xiàn)狀總體表現(xiàn)有待提升。
通過訪談發(fā)現(xiàn),教師對專業(yè)標(biāo)準(zhǔn)中教師評價(jià)要求不甚清楚,反映“沒有教育評價(jià)課程學(xué)習(xí)和評價(jià)研究的經(jīng)歷,但聽過一些講座”“學(xué)過統(tǒng)計(jì)課程,但沒有參與過評價(jià)相關(guān)的課題研究”,這與問卷結(jié)果基本相符,也表明教師評價(jià)素養(yǎng)欠佳與評價(jià)基礎(chǔ)較弱有一定關(guān)聯(lián)。
由表3可見,維度得分在1.30—1.99之間,總體來說,教師在7個(gè)維度的表現(xiàn)為均衡的弱水平。但教師在不同維度間表現(xiàn)不一,如教師在維度6上得分最高為1.99,也是唯一一個(gè)達(dá)到及格水平的維度;其次是維度5、維度2、維度3和維度4表現(xiàn)相當(dāng);而維度1與維度7表現(xiàn)相對較弱。教師的評價(jià)素養(yǎng)欠佳主要是評價(jià)方法和倫理認(rèn)識(shí)不清晰,評價(jià)結(jié)果的解釋和應(yīng)用能力有待提升。
1.教師的評價(jià)方法和倫理認(rèn)知有所缺失
教師在評價(jià)方法選擇上表現(xiàn)不佳,主要表現(xiàn)在對能力與策略維度的評價(jià)方法選擇上。如題15“李老師一直在教學(xué)生問題解決方法,她想要評價(jià)學(xué)生對問題解決方法的理解程度。以下哪種策略最有效?”只有42.86%的教師選擇了正確答案“開發(fā)一份與課堂教學(xué)內(nèi)容一致的評估工具”,約60%的教師沒能選擇基于方法維度評價(jià)的合適工具。
公平公正是評價(jià)基本倫理,但教師對哪些行為有違公正的辨識(shí)力不夠。如題33“ 李老師擔(dān)心學(xué)生正式統(tǒng)考做得不好,她預(yù)先拿到了統(tǒng)考試卷,采取下面方法幫助提高分?jǐn)?shù)。哪個(gè)活動(dòng)不符合評價(jià)倫理?”只有約30%教師選擇了“改變考卷考題的形式給學(xué)生做”,每個(gè)選項(xiàng)都有一定比例的教師選擇。
有教師坦言,平??荚囍饕疾閷W(xué)生知識(shí)點(diǎn)掌握情況,對于問題解決和能力方面的評價(jià)的確不擅長,對評價(jià)倫理也未做細(xì)究,同時(shí)希望區(qū)域開展一些評價(jià)培訓(xùn)的教研活動(dòng),幫助他們提升評價(jià)能力。
2. 評價(jià)結(jié)果的解釋和應(yīng)用能力有待提升
解釋結(jié)果的能力是評價(jià)素養(yǎng)中的重要能力,包括對評價(jià)術(shù)語、概念的理解與解釋。如題30“學(xué)生三門主課成績:語文70分、 數(shù)學(xué)70分、英語70分,以下哪一項(xiàng)是對此評分報(bào)告的有效解釋?”只有54.50%的教師選擇了正確答案,約半數(shù)教師對于日常教學(xué)用的百分制概念比較模糊。
教師的評價(jià)應(yīng)用能力,一方面表現(xiàn)在基于情境的評價(jià)方法選擇上;另一方面表現(xiàn)在基于評價(jià)方法的應(yīng)用情境選擇上。如題16“教師要求學(xué)生陳述解決問題的詳細(xì)步驟或邏輯思路,這種評價(jià)方法在下面哪個(gè)情境中發(fā)揮最大價(jià)值?”僅7.14%的教師選擇了“為學(xué)生提供個(gè)性化反饋”,教師要求學(xué)生陳述詳細(xì)步驟,主要想了解學(xué)生的問題解決思路和過程,方便對學(xué)生的思維和問題解決過程進(jìn)行診斷和反饋。
基于情境的評價(jià)選擇,如題21“李老師班上的幾位學(xué)生在數(shù)學(xué)測驗(yàn)的多步問題解決題目上得分很低,她想知道哪些學(xué)生有類似問題,便于分組指導(dǎo)。下列哪種評估策略適合學(xué)生分組?”回答正確率不到一半,錯(cuò)誤選項(xiàng)的共同問題是評價(jià)策略與評價(jià)目標(biāo)不匹配,不能篩選出在“多步問題解決”方面有問題的學(xué)生。評價(jià)方法與情境的雙向選擇題,需要教師對方法和情境有深度理解,才能建立方法與應(yīng)用情境之間的關(guān)聯(lián)。
訪談中教師表示,日??荚嚸}更多還是經(jīng)驗(yàn),能力評價(jià)也比較空泛,但隨著大數(shù)據(jù)時(shí)代的教育變革,教師的數(shù)據(jù)解讀和運(yùn)用能力需要提升。
統(tǒng)計(jì)不同年齡教師的評價(jià)素養(yǎng)得分,如表4所示,30歲以下教師得分最高,50歲以上的得分最低,整體趨勢是年輕教師評價(jià)素養(yǎng)略高于資深教師,方差分析顯示沒有達(dá)到顯著差異,年輕教師略有不明顯優(yōu)勢。
表4 不同年齡教師的評價(jià)素養(yǎng)得分
交叉分析后發(fā)現(xiàn),年輕教師的優(yōu)勢有兩個(gè):一是有一定評價(jià)基礎(chǔ),如圖1的題27“教師在單元成績評分時(shí),以下哪一項(xiàng)有關(guān)學(xué)生表現(xiàn)的信息最可靠?”,不同考試題型的信度不同,論述題比選擇題信息量大,信度更高,只有46.10%的教師選擇正確,30歲以下教師的正確率最高,50歲以上教師的正確率最低,隨著年齡增長,正確率呈下降趨勢;二是有正確評價(jià)倫理觀念,如圖2的題31“老師想讓學(xué)生盡快知道成績,告訴學(xué)生放學(xué)后將改過考卷放在她房間外椅子上,學(xué)生可以查找自己的試卷。老師的行為有什么問題?”76.62%的教師選擇正確,正確率最高的是30歲以下教師,最低的是50歲以上教師,年輕教師的優(yōu)勢較為明顯。
基于以上調(diào)研分析,得出結(jié)論如下:教師平均評價(jià)素養(yǎng)總體欠佳,處于不及格水平,年輕教師評價(jià)素養(yǎng)水平略高于資深教師;教師的不同評價(jià)維度的表現(xiàn)較為均衡,具備較大提升空間;教師的評價(jià)方法和倫理認(rèn)知有所缺失,解釋與應(yīng)用評價(jià)結(jié)果能力有待提升;教師有提升自身評價(jià)素養(yǎng)的較強(qiáng)愿望,希望有機(jī)會(huì)參與評價(jià)實(shí)踐項(xiàng)目研究。
評價(jià)素養(yǎng)提升是一個(gè)綜合工程,需要政府、教研部門、學(xué)校以及教師各方面的共同努力。綜合本文的現(xiàn)狀分析及教師的訴求,提出建議如下。
圖1 年齡與題27的交叉分析
圖2 年齡與題31的交叉分析
國家中學(xué)教師專業(yè)標(biāo)準(zhǔn)有教師教育評價(jià)能力的要求,但沒有明確提出教師評價(jià)素養(yǎng)的專業(yè)標(biāo)準(zhǔn)。而且在師范生的職前教育及在職教師的職后教育中,少有開設(shè)評價(jià)素養(yǎng)專題的學(xué)習(xí)和培訓(xùn),是教師評價(jià)素養(yǎng)水平整體不高的主因。
制定教師評價(jià)素養(yǎng)專業(yè)標(biāo)準(zhǔn),納入教師資格認(rèn)定制度之中,對在職教師進(jìn)修制度也提出評價(jià)能力明確要求。這樣,國家教師專業(yè)標(biāo)準(zhǔn)與教師評價(jià)素養(yǎng)標(biāo)準(zhǔn),共同為教師評價(jià)素養(yǎng)發(fā)展指引方向。
采用線上基礎(chǔ)課程與線下進(jìn)階課程相結(jié)合的方式。制訂教師評價(jià)培訓(xùn)課程大綱和培訓(xùn)方案,開發(fā)研制一套教師評價(jià)培訓(xùn)系統(tǒng)課程。組織各區(qū)教育評價(jià)教研員分工合作,參與研制線上教師評價(jià)基礎(chǔ)課程,服務(wù)于所有教師;同時(shí)開展線下評價(jià)進(jìn)階課程,可以是項(xiàng)目研究、學(xué)術(shù)講座、交流分享等多種形式,為區(qū)域評價(jià)教研員和喜愛教育評價(jià)的教師提供發(fā)展平臺(tái)。
用教師的評價(jià)課程學(xué)習(xí)、命題機(jī)會(huì)、評價(jià)培訓(xùn)以及評價(jià)研究四個(gè)變量分別與教師評價(jià)素養(yǎng)總分作方差分析,發(fā)現(xiàn)前三個(gè)變量對評價(jià)素養(yǎng)總分沒有明顯作用,但評價(jià)實(shí)踐研究與評價(jià)素養(yǎng)總分之間存在著正向相關(guān)性,如圖3所示。
圖3 參與評價(jià)實(shí)踐項(xiàng)目教師的評價(jià)素養(yǎng)得分
由圖3可見,參加評價(jià)實(shí)踐與研究的頻次越高,教師的評價(jià)素養(yǎng)得分越高??梢哉f,評價(jià)研究與實(shí)踐是教師評價(jià)素養(yǎng)提升的一條有效途徑。
教師認(rèn)為提升教師評價(jià)素養(yǎng)最為重要的一項(xiàng)是“加強(qiáng)對學(xué)校教師評價(jià)素養(yǎng)的實(shí)踐指導(dǎo)”,74.30%的教師認(rèn)為“請專家進(jìn)行教育教學(xué)評價(jià)專題指導(dǎo)”是教師希望得到學(xué)校幫助的首選項(xiàng)目。數(shù)據(jù)表明,評價(jià)實(shí)踐研究與評價(jià)素養(yǎng)之間有正向相關(guān)性,教師的期望與數(shù)據(jù)結(jié)果吻合。職前教育增加評價(jià)理論學(xué)習(xí),加強(qiáng)評價(jià)案例實(shí)踐分析以及指導(dǎo),職后教育采用項(xiàng)目化學(xué)習(xí)方式,以教師真實(shí)評價(jià)案例問題為導(dǎo)向,采取實(shí)踐和理論相融合的學(xué)習(xí)方式,逐步提升教師的評價(jià)素養(yǎng)。
教研制度是中國教育的特色,對中國基礎(chǔ)教育發(fā)展起著重要的推動(dòng)作用?,F(xiàn)在市、區(qū)兩級(jí)教研室都有質(zhì)量監(jiān)測部門,市、區(qū)質(zhì)量監(jiān)測中心開展學(xué)科中心組活動(dòng)。教師問卷顯示,65.60%的教師認(rèn)為很有必要“組織有關(guān)教育教學(xué)評價(jià)的教研活動(dòng)”。常規(guī)教師評價(jià)研修制度是提升教師評價(jià)素養(yǎng)的制度保證。
建立區(qū)域的評價(jià)中心組和常規(guī)評價(jià)研修制度,組織中心組教師開發(fā)教師評價(jià)素養(yǎng)課程、研究教育評價(jià)疑難問題,發(fā)揮評價(jià)中心組教師的輻射作用,引領(lǐng)教師形成正確評價(jià)觀,夯實(shí)評價(jià)基礎(chǔ),提升整體教師專業(yè)評價(jià)素養(yǎng)。