涂秋元 姚正鑫 向春艷 龐新軍
教育評價是辦學導向的指揮棒,評價改革事關教育發(fā)展方向如何激發(fā)各層次學校的辦學活力、引導樹立“育人為本、德育為先、能力為重、全面發(fā)展”的辦學理念,全面推動素質(zhì)教育,實現(xiàn)區(qū)域教育可持續(xù)發(fā)展,回應人民對優(yōu)質(zhì)均衡教育的需求,是廣州市荔灣區(qū)基礎教育面臨的系列問題中最主要的問題之一。實施教育評價改革,探索基于區(qū)域質(zhì)量監(jiān)測大數(shù)據(jù)的初中學生學業(yè)水平增值評價,是學校全面實施課程改革、促進教師專業(yè)發(fā)展的有效途徑。本文以2021屆初中區(qū)域教育質(zhì)量監(jiān)測數(shù)據(jù)為基礎,以不同基礎模型進行簡單試算初一起點測至初三終點測增值分數(shù), 闡明不同增值性評價模型可能帶來的差異。
一、基于相對位次的區(qū)域增值評價
基于相對位次的區(qū)域增值評價以學?;虬嗉墳檎w,以區(qū)域質(zhì)量監(jiān)測學生的有效分數(shù)作為計算對象,根據(jù)其總平均分在區(qū)域排名的變化來對教育教學水平進行分析。學校的位次增值(Y)計算公式如下:
Y=W0-Wn
其中:W0、W1分別為起點監(jiān)測以及第n次監(jiān)測中學校的均分在區(qū)域全體學校中的位次。Y=0表示位次沒有變化;Y>0為正增值,表示位次進步;Y<0為負增值,表示位次退步。圖1顯示了29所學??偡志值奈淮卧鲋蛋l(fā)展。
基于位次的增值數(shù)據(jù)可以說明學校整體均分的相對增值情況,但也存在一些問題。從圖1可知高水平組學校上升難度遠高于低水平組,位次前5的學校中僅有1所增值為1的微小變動,而組別二和組別三的學校增值數(shù)量和幅度都遠超組別一,因此不同水平的學校位次提升的難度是不同的。提升同樣位次,因其層次不同其表達的學業(yè)水平變化的意義及學校所付出的教育投入都有著極大的差異。而且,高組別學校存在天花板效應,而低組別學校則存在地板效應,因此基于均分位次的增值性評價是相對不準確的。
二、基于等級達成率的區(qū)域增值性評價
等級達成率是一種簡易的增值性評價方式,以出口測學校各等級人數(shù)除以基于入口測預測的學校各等級人數(shù)獲得。如圖2所示,為區(qū)域部分學校等級達成率發(fā)展分析。等級劃分標準參照學業(yè)水平標準進行換算后獲得,選取前三等級進行分析,以避免D、E等級學生因進行職業(yè)生涯規(guī)劃時較大概率可能出現(xiàn)的出口測數(shù)據(jù)缺失的影響。
如圖2示,組別一G校C達成率接近190%,但其A、B達成率卻無明顯異常,該情況主要是由于其參加測試人數(shù)變化造成,而其A達成率低于100%,說明其優(yōu)秀學生培養(yǎng)工作有所欠缺。組別一尾段和組別二前段都存在A、B達成率較低,而C達成率偏高的主要原因,在于該區(qū)段學校多數(shù)學生為等級臨界生,其受參測人數(shù)變化導致等級邊界偏移的影響最大。組別三學校則普遍存在A達成率超高,而B、C達成率較低的情況。主要由于組別三學校入口測A等級人數(shù)多為個位數(shù),一兩名學生的變動都會導致其數(shù)據(jù)異常偏高。與此同時,其B、C等級學生存在部分因職業(yè)生涯規(guī)劃選擇或隨遷子女返鄉(xiāng)等情況,導致區(qū)域監(jiān)測數(shù)據(jù)下的等級達成率反映情況有所局限。整體而言,對于在各等級有一定基數(shù)的學校,等級達成率能較好反映學校的增值能力;對于部分數(shù)據(jù)異常的學校需要做個案分析進行評價調(diào)整;對于部分臨界學生較多的學校,等級達成率的評價模式存在較大的不確定性。
三、基于提高度的區(qū)域增值評價
提高度反映學生個體發(fā)展水平提高的幅度,同時反映學校的加工能力。其原理是通過對學校的區(qū)域監(jiān)測數(shù)據(jù)進行回溯,根據(jù)學生的入學基礎、發(fā)展?jié)摿?、學校的發(fā)展趨勢綜合分析,對各學校前樣、中樣人數(shù)作出預測,按學校表現(xiàn)將所有學校分為相應組別,不同組別的提高度預測標準有所不同,作為分析測算基礎數(shù)據(jù)。提高度(P)的計算公式如下:
如圖3示,組別一學校提高度整體不高,隨著學校排位后移,提高度的增值幅度不斷提升。與圖1對比,X校的均分排位僅前進一名,與其提高度增值180%有著明顯落差。在均分排位中前進8名的V校,其提高度卻為負增值。在組別一中僅有的排位前進的E校,在提高度評價中為負增值。究其原因,提高度主要關注學校中前段學生的學業(yè)能力,而均分排位則主要關注學校整體學生的學業(yè)能力,其在關注群體有所不同;且均分評價維度較為單一,未考慮學校內(nèi)部的差異性,且以排位方式進行評價,區(qū)域學校整體波動未加入考量。而提高度通過多維度預測的模式,將區(qū)域整體情況和學校自身情況綜合考慮,主要關注學校培優(yōu)固本的能力,特別是前樣率,對學校的加工能力提出了較高的要求。因此,提高度評價作為增值性評價的一個方法,有其科學性。但提高度計算方法依然存在部分與達成率模式相同的問題。
四、基于學生成長百分位法增值評價
學生成長百分位法(SGP)增值評價,以學生前測成績對學生進行分組,比較同組學生的后測成績的百分位位次以判斷學生的增值情況。其強調(diào)學生后測成績僅與學生前測同組別的學生進行比較,可以部分緩解優(yōu)秀學生上升空間不足的問題。 計算公式如下:
學生成長百分位法是一種相對科學的增值性評價方式,其學生僅與和自身初次測試水平相近的學生進行對比,以其自身在該批次學生中的二次測試百分比作為增量。雖然該模型較好的考慮了學生分層情況,但由于其模型局限性,在統(tǒng)計上仍屬于零和游戲。因而,后續(xù)研究將進一步優(yōu)化模型分層應用,考慮更多荔灣區(qū)域特色因素加以優(yōu)化調(diào)參。如圖4示,優(yōu)秀學校在該體系下依舊面臨增值幅度不大的問題,中后段學校反而表現(xiàn)較好。造成該情況的可能原因是該評價以初一起點測為基準對學生進行分組,而初一起點測科目較少,難度較低,區(qū)分度相對不足,導致優(yōu)秀學生和中段學生沒有拉開差距,使得計算中并未能完全將同等級學生進行區(qū)分。此外,通過對一線教育工作者的訪談,個別學生在初中階段可以通過自身努力,實現(xiàn)學業(yè)水平的跨層次飛躍;而高水平學生多數(shù)成績較為穩(wěn)定,波動較小,僅有部分學生會因為各種原因大幅下滑。因此,后續(xù)研究中應加強對起點數(shù)據(jù)的分組統(tǒng)計工作,加入更多變量進行分組,同時探索采用循環(huán)前測模式,不以單次起點測試作為增值起點,而以前次區(qū)域調(diào)研測成績作為后次調(diào)研測增值評價起點,以改善分組集中的情況。
注:本文系廣東省2021年度中小學教師教育科研能力提升計劃項目“基于區(qū)域教育大數(shù)據(jù)的初中學生學業(yè)水平增值評價研究”(課題編號:2021YQJK045)階段性研究成果。
本欄責任編輯 黃博彥