摘要增值性評價在控制影響學(xué)生成績有關(guān)因素的條件下,分析教師對學(xué)生成績變化的貢獻(xiàn)程度,這種評價方法可在很大程度上提高教師績效考核的客觀性與公平性,有力引導(dǎo)教師關(guān)注和改善工作結(jié)果,因此將在未來教師人力資源管理實踐中發(fā)揮重要作用。在分析美國哥倫比亞學(xué)區(qū)相關(guān)評價經(jīng)驗的基礎(chǔ)上,建議我國在推進(jìn)教師增值性評價中要做到:修訂有關(guān)政策,為增值性評價實施創(chuàng)造數(shù)據(jù)條件;做好評價數(shù)據(jù)庫建設(shè),全面收集相關(guān)數(shù)據(jù);關(guān)注測驗效度,確保數(shù)據(jù)質(zhì)量;積極穩(wěn)妥地推動有關(guān)改革,防止急躁冒進(jìn)。
關(guān)鍵詞 增值性評價;教師評價;績效考核;教師績效工資;增值模型;美國哥倫比亞學(xué)區(qū)
中圖分類號G63
文獻(xiàn)標(biāo)識碼B
文章編號1002-2384(2020)10-0016-05
注釋:① 本文系北京市教育科學(xué)“十三五”規(guī)劃重點課題“中小學(xué)學(xué)校治理現(xiàn)代化:問題、原因分析與改進(jìn)”(課題批準(zhǔn)號:CCAA2020037)的研究成果之一。
我國自2009年在義務(wù)教育階段中小學(xué)推行教師績效工資制度,要求中小學(xué)在績效考核的基礎(chǔ)上,根據(jù)教師實際貢獻(xiàn)分配獎勵性績效工資,將教師工資收入與其工作績效聯(lián)系起來,逐步建立多勞多得、優(yōu)績優(yōu)酬的分配制度。教師績效工資制度順利推行的一個重要前提,是建立科學(xué)的評價考核機(jī)制和辦法。最近,中央深改委審議通過的《深化新時代教育評價改革總體方案》明確強(qiáng)調(diào),各類教育評價要積極“探索增值評價”。
在這樣的政策背景下,增值性評價逐漸成為我國教育管理領(lǐng)域的一個熱點問題,如何在教師績效考核中有效應(yīng)用增值性評價也備受關(guān)注。那么在教師績效考核中引入增值性評價有何現(xiàn)實意義,國外有無相關(guān)經(jīng)驗可以借鑒,我們在實踐中應(yīng)該規(guī)避哪些可能出現(xiàn)的問題?筆者結(jié)合研究實踐提出自己的思考與建議。
增值性評價在控制影響學(xué)生成績有關(guān)因素的條件下,將一名教師在一個學(xué)年中所教學(xué)生的測驗分?jǐn)?shù),與這些學(xué)生在上一學(xué)年或上幾學(xué)年的分?jǐn)?shù)以及同一年級其他學(xué)生的分?jǐn)?shù)進(jìn)行比較,從而分析教師對學(xué)生成績變化的貢獻(xiàn)程度。這種評價方法起源于上世紀(jì)70年代,進(jìn)入21世紀(jì)以來,隨著計算機(jī)技術(shù)的發(fā)展及數(shù)據(jù)庫建設(shè)的普及,加之教育問責(zé)制度的推動,在美英國家教育管理實踐中的應(yīng)用越來越廣泛。相對于傳統(tǒng)的教師績效考核方法,增值性評價具有一些明顯優(yōu)勢,將成為未來教師績效考核改革的突破口。其優(yōu)勢可歸納為以下幾點。
1. 克服傳統(tǒng)評價方法的主觀性弊端
近些年來,國內(nèi)各地市都在努力探索教師績效考核的機(jī)制與方法,多數(shù)中小學(xué)遵循“定性與定量相結(jié)合”“教師自評與學(xué)科組評議、年級組評議、考核組評議相結(jié)合”以及“形成性評價和階段性評價相結(jié)合”原則,[1]采用多主體多元化的評價方法。這種考核思路借鑒了工商管理領(lǐng)域常用的360度考核法,克服了評價自上而下、教師被動接受、領(lǐng)導(dǎo)說了算的制度弊端,在一定程度上體現(xiàn)了管理民主,避免了“暈輪效應(yīng)”“個人偏見”與“考核盲點”等實際問題,較好地反映了教師的工作績效。但必須承認(rèn)的是,這種多主體評價仍然不能有效克服評價中的主觀性,有人會在評價中憑個人感覺、偏好甚至恩怨評分。更普遍的情況是,在教師群體中,很多人本著“你好、我好、大家好”的“好人主義”給自己和同事都打高分。
相較于多主體評價,增值性評價對教師績效的考核更加客觀、準(zhǔn)確和有效,可成為傳統(tǒng)評價的補(bǔ)充辦法。因為增值性評價是用教師所教學(xué)生分?jǐn)?shù)的變化作為績效考核的主要依據(jù),一名教師在任教一段時期后,所教學(xué)生的絕對評價分?jǐn)?shù)或相對評價分?jǐn)?shù)有明顯增值,說明他/她的教學(xué)效能好,績效水平高;相反,所教學(xué)生的分?jǐn)?shù)下降了,則說明他/她教得不好。增值性評價在控制了非教師因素的條件下,用分?jǐn)?shù)增長變化的幅度說話,能夠有效克服傳統(tǒng)評價的主觀性。
2. 引導(dǎo)教師關(guān)注和不斷改進(jìn)工作結(jié)果
教師績效考核主要是評價教師依法執(zhí)教以及完成學(xué)校規(guī)定崗位職責(zé)和工作任務(wù)的情況。而在實踐中績效考核評什么,與管理者對績效的理解有很大關(guān)系。對績效的理解不同,績效考核的重點和方法也就不同。在學(xué)術(shù)界和公眾眼中,人們對績效的理解主要有三種。[2]第一種觀點認(rèn)為績效是結(jié)果,是在特定時間內(nèi)、由特定的工作職能或活動所產(chǎn)生的產(chǎn)出記錄;第二種觀點認(rèn)為績效是行為,是員工與工作相關(guān)的實際表現(xiàn);第三種觀點則將前兩種觀點整合起來,認(rèn)為績效是過程與結(jié)果的結(jié)合,這種整合、平衡的觀點在學(xué)術(shù)界與實踐中得到更為廣泛的認(rèn)同,應(yīng)該成為指導(dǎo)教師績效考核實踐的重要依據(jù)。
目前,在中小學(xué)教師績效考核實踐中,既存在過分強(qiáng)調(diào)結(jié)果特別是把中高考成績與升學(xué)率作為重要考核指標(biāo)的問題,又存在片面關(guān)注過程、忽視結(jié)果導(dǎo)向、對學(xué)生成績和發(fā)展重視不足的問題。相對而言,前一種問題已經(jīng)受到較多重視,而后一種問題則亟待更多的關(guān)注。近些年來,我國一直倡導(dǎo)發(fā)展性教師評價,淡化分?jǐn)?shù)、甄別與獎懲,反對以分?jǐn)?shù)作為唯一標(biāo)準(zhǔn)[3]和以升學(xué)率作為考核指標(biāo)[4],所以義務(wù)教育階段的教師評價多強(qiáng)調(diào)過程、工作表現(xiàn)和工作量,這是相關(guān)改革成功的標(biāo)志。但值得警惕的是,在有些學(xué)校,特別是沒有升學(xué)壓力的小學(xué),出現(xiàn)了從一個極端走向另外一個極端、過分關(guān)注過程的現(xiàn)象。教師們努力工作,把過程做足,但這些工作究竟在多大程度上促進(jìn)了學(xué)生成績的提升以及其他方面的多樣化發(fā)展,工作效果和效率怎么樣,分析略顯不足,在不同程度上引發(fā)高一級學(xué)校和家長的不滿。
在教師評價實踐中引入增值性評價,以教師對學(xué)生成績變化的實際貢獻(xiàn)作為一項重要的考核指標(biāo),將在一定程度上平衡過程與結(jié)果的關(guān)系,適當(dāng)增加結(jié)果在教師績效考核中的權(quán)重,從而引導(dǎo)教師強(qiáng)化結(jié)果導(dǎo)向,為改善結(jié)果而不斷分析與優(yōu)化工作過程,最終更好地促進(jìn)學(xué)生的學(xué)習(xí)與發(fā)展。
3. 提高教師評價的公平性
公平性是影響教師評價實效性的重要因素。很多地方和中小學(xué)在教師評價實踐中淡化分?jǐn)?shù),除了擔(dān)心以分評教可能導(dǎo)致教師為分?jǐn)?shù)而教,還因為學(xué)生分?jǐn)?shù)的高低乃至變化受到多種因素的復(fù)雜影響,不是教師個人所能決定的。如果教師評價簡單地以學(xué)生分?jǐn)?shù)作為主要依據(jù),會被教師們認(rèn)為不公平,從而影響評價激勵和發(fā)展性功能的發(fā)揮。如果再將教師評價的結(jié)果與教師留用、晉升、獎懲等高利害決策聯(lián)系起來,很可能引發(fā)教師的不滿。在這一意義上而言,難以保障公平性已然成為中小學(xué)建立多勞多得、優(yōu)績優(yōu)酬、能進(jìn)能出、能上能下人事制度的一個重大技術(shù)障礙。
而增值性評價通過追蹤研究設(shè)計,收集學(xué)生在一段時期內(nèi)不同時間點上的標(biāo)準(zhǔn)化測驗成績,在控制學(xué)生先前測驗成績及其他教師無法左右的各種因素之后,考查教師因素對學(xué)生成績變化的凈影響。有了增值性評價,教師績效水平的高低主要取決于自己的努力、投入和專業(yè)能力,受生源、學(xué)校辦學(xué)條件、同事工作表現(xiàn)等其他因素的影響小到可以忽略的程度,那么教師們對績效考核公平性的主觀感受就會明顯改善,就更愿意接受績效考核的結(jié)果。如果績效工資、職稱晉升等相關(guān)制度也與之配套,區(qū)域內(nèi)對學(xué)生分?jǐn)?shù)增值貢獻(xiàn)大的教師可以有更多的機(jī)會獲得獎勵和晉升,那么教師也就更愿意向薄弱學(xué)校流動,所謂的“后進(jìn)生”也可以獲得教師更多的關(guān)注與支持,這將在很大程度上推動區(qū)域教育均衡與公平。
如何在教師績效考核中有效應(yīng)用增值性評價,國外是否有可資借鑒的成熟經(jīng)驗?美英國家在教師績效考核中應(yīng)用增值性評價的地區(qū)有很多,其中美國哥倫比亞學(xué)區(qū)(District of Columbia Public Schools,DCPS)是啟動相關(guān)探索較早、持續(xù)時間最長、成效較為顯著的學(xué)區(qū)之一。該學(xué)區(qū)現(xiàn)有116所學(xué)校,4025名教師和4萬多名K-12年級的學(xué)生,是美國首都華盛頓特區(qū)最大的一個公立學(xué)區(qū)。[5]2009年,為推動教師績效工資改革,該區(qū)開始對教師進(jìn)行較為嚴(yán)格的績效考核,個體增值測量是考核內(nèi)容中一個重要的組成部分。其核心經(jīng)驗可以概括為以下三點。
1. 全面考核教師績效,增值性評價只是其中一個方面
哥倫比亞學(xué)區(qū)大力推動教師績效工資改革,將教師薪酬與學(xué)生學(xué)業(yè)成績增長情況聯(lián)系起來,加大獎懲力度,拉開收入差距,力圖建立優(yōu)績優(yōu)酬的工資分配制度。因此,他們在教師績效考核中重視學(xué)生學(xué)業(yè)成績及其增值。但他們不唯分?jǐn)?shù),而是從個體增值測量(Individual Value-Added,IVA)、教師評定的學(xué)生成績數(shù)據(jù)(Teacher-Assessed Student Achievement Data,TAS)、教學(xué)觀察框架(Teaching and Learning Framework,TLF)、學(xué)校共同體承諾(Commitment to School Community,CSC)、核心專業(yè)精神(Core Professionalism,CP)等五個方面考核教師績效。[6]表1列舉了五個方面的評分辦法與分?jǐn)?shù)合成方式。
由表1可見,IVA是教師績效考核體系中一個重要的組成部分,主要針對任教于考試學(xué)科的教師,包括4~10年級英語教師、4~8年級數(shù)學(xué)教師,以及其他有年度標(biāo)準(zhǔn)化測驗的學(xué)科教師。在考試學(xué)科教師績效考核中,IVA占35%的權(quán)重,TAS占15%的權(quán)重,兩個反映學(xué)生學(xué)習(xí)結(jié)果的方面總計占一半分?jǐn)?shù)。在非考試學(xué)科教師的績效考核中,TAS仍然占15%的權(quán)重,其余反映教師績效過程表現(xiàn)的指標(biāo)占另外85%的權(quán)重。在計算得分時,以TAS為例,A老師教得好,得3.5分;B老師弱一點,得2分。因為這個教學(xué)分權(quán)重是15分,所以A老師和B老師分別有52.5分(3.5×15)和30分(2×15)計入總分。
可以說,哥倫比亞學(xué)區(qū)全面考核教師績效,較好地平衡了結(jié)果與過程的關(guān)系,既強(qiáng)調(diào)結(jié)果,又關(guān)注過程,而且對考試學(xué)科與非考試學(xué)科教師區(qū)別對待,不搞“一刀切”,尊重學(xué)科差異。
2. 控制來自學(xué)生和班級層面的多種變量,準(zhǔn)確分析教師的凈影響
哥倫比亞學(xué)區(qū)采用多元線性回歸分析方法構(gòu)建增值模型,在模型中控制了來自學(xué)生和班級層面的多個變量。其中學(xué)生變量有同一學(xué)科之前的測試成績、其他學(xué)科此前的成績、免費(fèi)午餐的資格、減費(fèi)午餐的資格、特殊教育狀態(tài)、英語熟練水平、學(xué)習(xí)障礙、轉(zhuǎn)學(xué)經(jīng)歷以及上一學(xué)年的出勤率;班級變量有上學(xué)年的班級平均成績、上學(xué)年學(xué)生成績的變異程度、減免午餐的學(xué)生比例??刂谱兞康倪x擇一方面基于前期對數(shù)據(jù)的探索性分析,另一方面也回應(yīng)了教師對績效考核的關(guān)切。比如:許多教師認(rèn)為學(xué)生成績的多少及變化在很大程度上受其學(xué)習(xí)基礎(chǔ)的影響,這個基礎(chǔ)不僅包括學(xué)生上一學(xué)年在同一學(xué)科上的測驗成績,而且包括學(xué)生上一學(xué)年在其他學(xué)科上的測驗成績。多元回歸分析結(jié)果支持教師們的意見,兩個變量的回歸系數(shù)在統(tǒng)計學(xué)意義上都達(dá)到了十分顯著的水平。增值模型控制了無關(guān)變量的干擾,就可以更準(zhǔn)確地考查教師工作對學(xué)生成績變化的凈影響。在這樣的考核制度下,教師不用擔(dān)心任教于薄弱學(xué)?;蛘呱床缓枚绊懽约旱目冃Э己耍瑥亩敢夥墓ぷ靼才?,為促進(jìn)教師資源分配上的均衡創(chuàng)造了條件。
3. 注重細(xì)節(jié),確保增值性評價的可靠性與公平性
因為深知績效考核在績效工資制度體系中的重要性,哥倫比亞學(xué)區(qū)以務(wù)實的態(tài)度謹(jǐn)慎推動績效考核與增值性評價,在考核數(shù)據(jù)收集、處理與分析細(xì)節(jié)上做了很多精心設(shè)計,以保證評價的客觀可靠與公平公正。比如:在IVA評價中,為保證數(shù)據(jù)的可靠性,學(xué)區(qū)要求參評教師的選課人數(shù)不得少于15人,以保證學(xué)生樣本的代表性及數(shù)據(jù)的可靠性。如果考試學(xué)科教師的選課人數(shù)少于15人,他就不能/無須參加IVA評價,而是參加非考試科目組教師只有四個方面的考核。又如:學(xué)區(qū)還根據(jù)選課學(xué)生的出勤率和聽課時間,給每個學(xué)生賦予相應(yīng)權(quán)重,出勤率低和聽課時間少的學(xué)生在回歸分析中占的權(quán)重相應(yīng)減少,以確保IVA估計結(jié)果不受學(xué)生投入水平的影響。
在我國,關(guān)于增值性評價的研究尚處于起步階段,嚴(yán)格意義上在教師人力資源管理實踐中應(yīng)用增值性評價的實踐案例幾乎沒有報道。隨著《深化新時代教育評價改革總體方案》的頒布,增值性評價將逐漸從研究和政策文本走向?qū)嵺`,成為教師績效考核的新趨勢。那么,在教師績效考核實踐中做好增值性評價需要注意哪些問題,筆者結(jié)合我國實際提出如下建議。
1. 修訂有關(guān)政策,為增值性評價實施創(chuàng)造數(shù)據(jù)條件
增值性評價的核心數(shù)據(jù)是學(xué)生參加標(biāo)準(zhǔn)化測驗所取得的成績。這就必然面臨一個現(xiàn)實問題:近些年來不少地市為減輕中小學(xué)生過重學(xué)業(yè)負(fù)擔(dān),明確要求嚴(yán)格規(guī)范考試和評價工作。比如:許多省市規(guī)定,除組織初中畢業(yè)升學(xué)考試外,區(qū)縣不得在初中其他年級和小學(xué)組織統(tǒng)一考試。而增值性評價一般不能由學(xué)校單獨實施,需要在學(xué)區(qū)乃至區(qū)縣、地市等更大層面上統(tǒng)籌推動,如果沒有跨校的統(tǒng)一考試,那么增值性評價就無法實施。
有人建議將增值性評價與區(qū)縣教育教學(xué)質(zhì)量監(jiān)測數(shù)據(jù)聯(lián)系起來。但值得注意的是,多數(shù)質(zhì)量監(jiān)測項目采用概率比例抽樣或其他方式抽取一個學(xué)生樣本參與,而不是針對區(qū)域內(nèi)所有學(xué)生;測驗內(nèi)容只覆蓋語文、數(shù)學(xué)、科學(xué)等部分學(xué)科,且通常情況下為避免學(xué)校之間對學(xué)生學(xué)業(yè)成就水平進(jìn)行比較,參與質(zhì)量監(jiān)測的學(xué)生只完成若干題組中的部分測驗,而不是完整的學(xué)科測驗;另外,質(zhì)量監(jiān)測項目只針對4年級、8年級等少數(shù)年級,缺乏逐學(xué)年的連續(xù)追蹤數(shù)據(jù),所以質(zhì)量監(jiān)測項目也難以為教師增值性評價提供數(shù)據(jù)支持。有關(guān)部門需要對有關(guān)政策和工作安排進(jìn)行系統(tǒng)反思與改進(jìn),一方面使收集區(qū)域性跨年級學(xué)生學(xué)科學(xué)業(yè)成就連續(xù)數(shù)據(jù)成為可能,另一方面又不能因此加劇應(yīng)試教育傾向,增加學(xué)生負(fù)擔(dān)。
2. 做好評價數(shù)據(jù)庫建設(shè),全面收集相關(guān)數(shù)據(jù)
評價數(shù)據(jù)庫建設(shè)是增值性評價實施的前提。增值性評價采用追蹤測驗的研究范式,不僅要保存學(xué)生在多次標(biāo)準(zhǔn)化測驗中的成績數(shù)據(jù),而且要收集來自學(xué)生、家庭、班級、教師、學(xué)校等多方面的相關(guān)數(shù)據(jù)。增值模型構(gòu)建是一個不斷探索與完善的過程。已有研究發(fā)現(xiàn),在同一地區(qū)針對同一批教師,采用不同的模型,在增值分析中控制不同的變量,可能導(dǎo)致對教師績效的高估或者低估。[7]有時候,在同一地區(qū),針對不同學(xué)科教師的增值性評價也需要采用不同的模型,因為對學(xué)生成績有重要影響的因素具有學(xué)科差異。要確保模型能納入各種影響學(xué)生成績但教師又無法控制的因素,使模型能為管理者和教師廣泛接受,我們就需要注意數(shù)據(jù)的全面性,尤其是在改革初期的探索階段。當(dāng)然,這種全面也是有限度的,究竟收集什么數(shù)據(jù)不僅要充分借鑒已有研究,而且要結(jié)合當(dāng)?shù)貙嶋H,廣泛聽取干部和教師意見,收集各種可能有用的信息。而且在收集過程中要注意減輕師生負(fù)擔(dān),如果有些數(shù)據(jù)在其他數(shù)據(jù)庫中已經(jīng)存在,就不要重復(fù)收集,只要開放數(shù)據(jù)接口和做好鏈接就可以。
3. 關(guān)注教育測驗效度,確保數(shù)據(jù)質(zhì)量
在評價考試改革與大規(guī)模質(zhì)量監(jiān)測項目的推動下,我國在教育測驗領(lǐng)域取得了長足的進(jìn)步,多維項目反應(yīng)理論、概化理論、認(rèn)知診斷模型、垂直等值方法等前沿理論與技術(shù)都已開始在實踐中得到不同程度的應(yīng)用。但需要注意的是,在各種教育測驗編制與改進(jìn)過程中,測驗效度這個基礎(chǔ)性問題尚未受到足夠重視。
效度反映了一個測驗題目或一整套測驗準(zhǔn)確測量欲測特質(zhì)(如口語交際能力、邏輯推理、批判性思考)、針對既定目標(biāo)做出推論和解釋的有用性程度,它是衡量測驗質(zhì)量的首要指標(biāo)。當(dāng)前,全球最具影響力的測驗質(zhì)量分析框架—《教育與心理測試標(biāo)準(zhǔn)》,在1999年版[8]及2014年最新版[9]中都強(qiáng)調(diào)效度是教育測驗最根本的要求,將其放在首要位置進(jìn)行分析與討論。如果測驗不能有效描述學(xué)生在預(yù)測特質(zhì)上的表現(xiàn),不能準(zhǔn)確推論學(xué)生達(dá)成既定學(xué)習(xí)目標(biāo)的程度,比如一項歷史測驗本意要考查學(xué)生對歷史知識的掌握程度,但實際考查到的是學(xué)生的閱讀理解能力,那么即使它的難度、區(qū)分度、信度合乎測量學(xué)要求,也是不合格的測驗。題目參數(shù)估計、等值化處理等復(fù)雜技術(shù)必須在測驗效度達(dá)標(biāo)的前提下才有意義。
同樣的道理,只有學(xué)科測驗的效度合乎測量學(xué)要求,基于測驗成績及相關(guān)因素所進(jìn)行的增值性評價才是可以接受的,也才能在實踐中真正發(fā)揮對教師教學(xué)行為以及課程改革的積極導(dǎo)向作用。所以,各區(qū)縣和學(xué)區(qū)在推動增值性評價過程中,必須高度重視學(xué)科測驗的效度,改善測驗質(zhì)量,同時也要確保其他數(shù)據(jù)的真實性、有效性與可靠性。
4. 積極穩(wěn)妥地推動有關(guān)改革,防止急躁冒進(jìn)
美國哥倫比亞學(xué)區(qū)的教師績效工資改革能在加大獎懲力度、拉開收入差距的背景下成功推動十多年,不僅是因為他們構(gòu)建的增值模型控制了多種非教師因素,從細(xì)節(jié)上保障了評價的公平性,而且更重要的經(jīng)驗是他們在改革中采取積極而謹(jǐn)慎的態(tài)度。他們不盲目追求分析技術(shù)的復(fù)雜性,沒有采用多水平模型,而是采取便于理解與實施的多元線性回歸分析模型;他們在控制變量選取上不僅參考已有研究,而且積極聽取和響應(yīng)教師的關(guān)切;他們沒有因為聯(lián)邦教育部和資助方要求加強(qiáng)教師工資與學(xué)生分?jǐn)?shù)增值的聯(lián)系,就在實踐中擴(kuò)大化應(yīng)用增值性評價,在他們的教師考核方案中,增值性評價只是教師整體績效考核的一部分,而且只針對考試學(xué)科教師。
為此,各區(qū)縣和學(xué)區(qū)探索在教師績效考核實踐中應(yīng)用增值性評價,應(yīng)借鑒哥倫比亞學(xué)區(qū)的經(jīng)驗,積極穩(wěn)妥地推動有關(guān)改革,防止急躁冒進(jìn),尤其需要預(yù)防以下可能出現(xiàn)的問題。(1)搞“一刀切”,在所有學(xué)科都推動教師增值性評價。(2)顧此失彼,從原來的沒有增值性評價變成過分依賴增值性評價,忽視教師基于自編測驗評定的學(xué)生成績、學(xué)生全面發(fā)展?fàn)顩r以及教師績效過程表現(xiàn),引發(fā)和加劇應(yīng)試教育。(3)將合格率和升學(xué)率等指標(biāo)納入教師增值性評價,既違背有關(guān)政策,又可能導(dǎo)致教師關(guān)注部分學(xué)生而忽視另外一部分學(xué)生。(4)有條件要上,沒條件也要上。測驗質(zhì)量、數(shù)據(jù)條件以及教師心理準(zhǔn)備程度都將在不同程度上影響增值性評價的實效性,如果條件不具備,非要推動增值性評價就可能引發(fā)各種問題。比如:有地方編制的學(xué)科測驗或質(zhì)量監(jiān)測題目不僅存在效度不良的問題,難度也亟待關(guān)注。他們不是嚴(yán)格依據(jù)課標(biāo)編制測驗,而是人為降低測驗難度,讓每個學(xué)生和學(xué)校都能獲得體面的分?jǐn)?shù),都“獲得成功”,但難度過低時題目的區(qū)分度也會下降,基于這種測驗的學(xué)生分?jǐn)?shù)增值性分析,其信效度就難以保證。
總之,在教師績效考核實踐中應(yīng)用增值性評價,關(guān)系到每一位教師的切身利益與專業(yè)發(fā)展,大而言之更是關(guān)系到學(xué)校、地區(qū)乃至國家的教師隊伍建設(shè)。政策制定者、管理者和研究者要加強(qiáng)合作溝通,積極穩(wěn)妥地推動有關(guān)改革。
參考文獻(xiàn):
[1][4] 教育部.教育部關(guān)于做好義務(wù)教育學(xué)校教師績效考核工作的指導(dǎo)意見[EB/OL].(2008-12-31)[2020-8-19]. http://old.moe.gov.cn/ publicfiles/business/htmlfiles/moe/s7051/201412/xxgk_180682.html.
[2] 趙德成.教師績效工資改革難以深入推動的原因及對策[J].中小學(xué)管理,2020(9):28-32.
[3] 教育部.教育部關(guān)于積極推進(jìn)中小學(xué)評價與考試制度改革的通知[EB/OL]. (2002-12-18)[2020-8-20]. http://www.moe.gov.cn/srcsite/A26/ s7054/200212/t20021218_78509.html.
[5] DCPS.DCPS at a Glance:Enrollment[EB/OL].(2019-12-08)[2020-8-20]. https://dcps.dc.gov/node/966292.
[6] Gitomer D H,Crouse K,Joyce J.A Review of the DC IMPACT Teacher Evaluation System[R/OL].(2018-02-26)[2020-08-20]. https:// www.researchgate.net/publication/280718857_A_review_of_the_DC_ IMPACT_teacher_evaluation_system.
[7] 邊玉芳,孫麗萍.教師增值性評價的進(jìn)展及在我國應(yīng)用的建議[J].教師教育研究,2015(1):88-95+112.
[8]美國教育研究學(xué)會,美國心理學(xué)會,美國教育測量學(xué)會.教育與心理測試標(biāo)準(zhǔn)[S].燕娓琴,謝小慶,譯.沈陽:沈陽出版社,2003:12-15.
[9] AERA, APA, NCME.Standards for Educational and Psychological Testing[S].Washington, DC: American Educational Research Association, 2014:11.
(編輯 王淑清)