国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于初中學(xué)生成長百分等級模型的增值評價實踐探索

2023-12-12 22:27:17陳科武
考試研究 2023年3期
關(guān)鍵詞:增值評價教育評價

陳科武

[摘要]重點介紹和分析學(xué)生成長百分等級模型的原理、優(yōu)缺點及改進方向,并在Visual Studio 2015下實現(xiàn)了相關(guān)算法。通過某區(qū)域某屆初中學(xué)生的成績追蹤分析,初步驗證了該模型用于增值評價和學(xué)生成績等級呈現(xiàn)的效用。

[關(guān)鍵詞]增值評價;學(xué)生成長百分等級模型;教育評價;學(xué)生成長評價

[中圖分類號]G424.74[文獻標識碼]A

[文章編號]1673—1654(2023)03—042—009

教育評價是教育教學(xué)研究的關(guān)鍵環(huán)節(jié),正確的評價能對教育教學(xué)行為和成效進行準確的鑒定和診斷,為后續(xù)教育教學(xué)工作提供激勵與導(dǎo)向。傳統(tǒng)上,我國教育評價手段傾向于關(guān)注學(xué)生的考試分數(shù)和排名,關(guān)注學(xué)校的升學(xué)率,由此導(dǎo)致學(xué)生學(xué)業(yè)負擔過重,引發(fā)家長和社會普遍的教育焦慮。2020年10月,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》,指出要“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性”[1],意在引導(dǎo)教育評價向正確的方向發(fā)展。增值評價作為近年教育評價的研究熱點,從成績起點看進步,有助于引導(dǎo)教學(xué)利益相關(guān)各方關(guān)注學(xué)生的學(xué)業(yè)成長和進步,而不是具體的考試分數(shù),克服“唯分數(shù)”論的傾向,從而有助于減輕學(xué)生和家長的焦慮。本文是以初中學(xué)生為案例,使用學(xué)生成長百分等級模型進行增值評價的實踐探索。

一、學(xué)生成長百分等級模型簡介

用于對學(xué)生進行增值評價的模型很多,這其中,學(xué)生成長百分等級模型因其使用靈活、易于理解等特點得到了較為廣泛的應(yīng)用。學(xué)生成長百分等級模型,即Student Growth Percentile(SGP),是美國學(xué)者Damien Betebeener于2009年基于百分位回歸提出的學(xué)生成長評估模型。當前,該模型已成為全美國使用最為廣泛的教育增值評價模型之一[2]。

(一)SGP

將學(xué)生的當前考試百分等級與先驗成績相同學(xué)生(學(xué)術(shù)伙伴)的百分等級比較,獲得的百分等級作為該生的SGP。所有學(xué)生的SGP平均約為50,一般認為35—65為正常成長范圍,65以上為成長優(yōu)異,35以下為成長不足[3]。

(二)mSGP(median or mean SGP)

將學(xué)校(或班級)所有學(xué)生某學(xué)科的SGP取中位數(shù)或平均值,稱為該學(xué)校(或班級)該學(xué)科的mSGP。mSGP可以用于學(xué)校(或班級)效能的增值評價。

(三)SGP的計算方法

1.標準方法

2.百分位回歸估計

如果學(xué)生樣本數(shù)量不夠大,每組“學(xué)術(shù)伙伴”的當前考試成績不足以形成一個分布,可以通過百分位回歸來估計SGP。

首先根據(jù)前一次考試成績,找到該學(xué)生的“學(xué)術(shù)伙伴”,假設(shè)人數(shù)為N,計算當前考試“學(xué)術(shù)伙伴”組的成績等級,并分別統(tǒng)計低于和等于該學(xué)生當前成績等級的人數(shù),記為L、E,由以下公式計算該學(xué)生的成長百分等級PR(Percentile Rank),即為SGP:

PR=(L+0.5×E)/N×100[5]。

如圖1所示,在7年級期末測試中,學(xué)生A(圖中白色小人)和其他9位學(xué)生的百分等級均為60,這樣就構(gòu)成了一個“學(xué)術(shù)伙伴”組。在8年級期末測試中,此學(xué)術(shù)伙伴組發(fā)生了分化,學(xué)生A和組內(nèi)另外1人的百分等級為70,另有3人百分等級高于70,5人百分等級低于70,代入公式,可以得出PR等于60:PR=(L+0.5×E)/N×100=(5+0.5×2)/10×100=60,即學(xué)生A的成長百分等級為60,高于平均增長水平。

二、學(xué)生成長百分等級模型的實證分析

(一)研究方法

1.數(shù)據(jù)來源和變量選取

選取深圳市某區(qū)8所初中學(xué)校2018級學(xué)生的三次統(tǒng)考成績。其中,7年級入學(xué)考試成績作為基準測試成績,并跟蹤7年級期末考試和8年級期末考試成績作為對比,對三次考試成績的學(xué)生名單進行匹配,剔除因休學(xué)、疾病等原因存在部分或全部學(xué)科缺考的學(xué)生,實際納入學(xué)生樣本2178人,分別來自8所學(xué)校的49個班。考慮到初中學(xué)科的變化,選取語文、數(shù)學(xué)、英語及三科總分成績構(gòu)建增值評價模型。

2.統(tǒng)計方法

根據(jù)百分位回歸估計的原理,在Visual Studio 2015下,使用C#語言開發(fā)SGP計算程序,同時使用SPSS 26.0和Excel 2016進行數(shù)據(jù)統(tǒng)計分析。

(二)學(xué)生、班級、學(xué)校層面的相關(guān)性分析

1.學(xué)生層面的相關(guān)性分析

從表1的統(tǒng)計結(jié)果可以看出,在學(xué)生個體層面,各學(xué)科SGP及總分SGP均與基準測試的百分等級無關(guān),說明從學(xué)生層面來講,用SGP模型衡量進步值不依賴于先驗成績。語文、數(shù)學(xué)、英語三科SGP及總分 SGP均存在顯著的正相關(guān)(p<0.01),相關(guān)系數(shù)在0.208-0.702之間,其中數(shù)學(xué)SGP與總分SGP有最大的正相關(guān)值0.702。

2.班級層面的相關(guān)性分析

從表2的統(tǒng)計結(jié)果可以看出,在班級層面,各學(xué)科mSGP及總分mSGP與基準測試的百分等級存在一定程度的正相關(guān),其中英語學(xué)科存在顯著的正相關(guān)(p<0.01,相關(guān)系數(shù)0.407),提示班級的學(xué)習(xí)基礎(chǔ)對學(xué)生的學(xué)業(yè)進步存在一定的影響。需要說明的是,8所學(xué)校均按政策要求實行均衡分班,由于各校所在學(xué)區(qū)招生競爭激烈程度不同,各校生源質(zhì)量存在一定的差異。分析結(jié)果也可以從側(cè)面驗證教育均衡化政策的正確性和必要性。語文、數(shù)學(xué)、英語三科mSGP及總分mSGP均存在顯著的正相關(guān)(p< 0.01或p<0.05),相關(guān)系數(shù)在0.321~0.815之間,與總分mSGP存在最大正相關(guān)值的是語文mSGP,相關(guān)系數(shù)為0.815。

3.學(xué)校層面的相關(guān)性分析

從表3可以看出,在學(xué)校層面,各學(xué)科包括總分mSGP與基準測試的百分等級的相關(guān)性不明顯。語文、數(shù)學(xué)、英語三科都與總分mSGP存在顯著的正相關(guān)(p<0.05),相關(guān)系數(shù)在0.735~0.786之間。語文、英語兩科之間存在顯著的正相關(guān)(p<0.01),相關(guān)系數(shù)為0.842。

(三)班級、學(xué)校層面mSGP與正態(tài)化標準分升降比較

標準分數(shù)(standard score),又被稱為z分數(shù),是計算分數(shù)與平均數(shù)的差再除以標準差,它反映的是一個分數(shù)距離平均數(shù)的相對標準距離。由于z分數(shù)考慮到了分數(shù)分布的離散程度因素,相對于使用原始分比較,能更精確地反映學(xué)業(yè)水平。理想化的z分數(shù)要求原始分數(shù)遵循正態(tài)分布,但這在一般考試中通常難以被滿足,所以在實際工作中,首先根據(jù)標準正態(tài)分布常模量表,建立標準分與百分等級對照表,然后將原始分轉(zhuǎn)化成百分等級分,通過查詢上述對照表,獲得正態(tài)化標準分。正態(tài)化標準分是一種基于考試常模的排位分,用正態(tài)化標準分增長來評價學(xué)生的學(xué)業(yè)進步,比直接比較成績相對排位變化更加科學(xué)。筆者所在學(xué)校使用平均分為500、標準差為100的統(tǒng)考正態(tài)化標準分進行班級、學(xué)校層面的學(xué)業(yè)增值評價,并將其作為教師工作績效考核的依據(jù)之一,同時也用于兄弟學(xué)校之間學(xué)業(yè)水平進步情況的比較。多年的實踐證明,這種模式是較為準確的,且能獲得一線教師的認同。將班級、學(xué)校層面mSGP與正態(tài)化標準分升降進行比較,也可以從側(cè)面驗證mSGP用于班級、學(xué)校層面增值評價的有效性。

1.學(xué)校層面mSGP與正態(tài)化標準分升降比較

2.班級層面mSGP與正態(tài)化標準分升降比較

從圖2和圖3的統(tǒng)計結(jié)果可以看出,無論是學(xué)校層面還是班級層面,mSGP與對應(yīng)學(xué)科的正態(tài)化標準分變化的趨勢基本一致,mSGP大于50,標準分升降一般為正值,mSGP越大,標準分增加的值越大,反之亦然??梢?,與標準分升降類似,mSGP可以作為學(xué)校、班級層面進行增值評價的依據(jù)。

(四)SGP用于學(xué)生個人成長評價

目前在“雙減”政策指引下,學(xué)生學(xué)年考試成績只能用等級分的方式呈現(xiàn)。本質(zhì)上來說,等級分是一種含糊的終結(jié)性評價,因為“含糊”,單純呈現(xiàn)等級分在一定程度上反而會加劇學(xué)生家長的成績焦慮。SGP體現(xiàn)的是學(xué)生的努力程度和學(xué)業(yè)進步程度,與等級分一起呈現(xiàn),有助于引導(dǎo)學(xué)生家長關(guān)注學(xué)生的學(xué)業(yè)成長和進步,緩解成績焦慮。SGP不僅能體現(xiàn)學(xué)生的學(xué)業(yè)成長是否符合要求,還能提供學(xué)生不同學(xué)科成長是否相似、是否偏科等信息,為家長和教師提供相關(guān)預(yù)警。

1.成績等級計算

參照深圳中考相關(guān)標準,設(shè)定成績等級并劃定各等級比例為:A+(5%)、A(20%)、B+(25%)、B(25%)、C+(20%)、C(5%)。在SPSS 26.0統(tǒng)計的百分等級分的基礎(chǔ)上,使用Excel 2016的if函數(shù)進行轉(zhuǎn)化。

2. SGP評價點數(shù)計算

為了方便學(xué)生和家長理解,參考美國新澤西州教育署的評價點數(shù)轉(zhuǎn)換表,使用Excel 2016的vlookup函數(shù)將SGP轉(zhuǎn)化為如表3所示的SGP評價點數(shù)[6]。

3.學(xué)生成績呈現(xiàn)

由前面的數(shù)據(jù)統(tǒng)計分析可知,在學(xué)生個體層面,各學(xué)科SGP都與基準測試的百分等級無關(guān)。因此,每位學(xué)生成績同時呈現(xiàn)相對獨立的成績等級和學(xué)生成長百分等級點數(shù),要注意引導(dǎo)家長在關(guān)注成績等級之余,更要關(guān)注學(xué)生成長百分等級。

從表4學(xué)生成績典型個案可以看出,1班林同學(xué),語、數(shù)、英三科均為“A+”,且三科SGP點數(shù)都是4,可見該同學(xué)成績優(yōu)異,且進步穩(wěn)定。2班龍同學(xué),三科成績等級分別為“B+”“C+”“C+”,但是三科SGP點數(shù)分別為4、4、3.8,說明該同學(xué)起點雖然較低,但是各科都進步明顯,值得大力表揚和鼓勵。4班陳同學(xué),三科成績等級分別為“A+”“B+”“B+”,三科SGP點數(shù)分別為4、2.4、1,從數(shù)據(jù)可以看出,該同學(xué)整體成績雖然尚可,但數(shù)學(xué)、英語兩科成績下滑,尤其是英語,下滑明顯,提示老師和家長應(yīng)當引起重視。4班楊同學(xué)三科成績等級分別為“B+”“A+”“A”,三科SGP點數(shù)分別為1、3.8、1,該同學(xué)聰明外向,是典型的理科男生,單純從成績等級來看尚可,但從SGP點數(shù)可以看出,語文、英語兩科下滑非常嚴重,這與該生家庭問題有著密切的關(guān)系,只有同時呈現(xiàn)成績等級和SGP點數(shù),兩者相結(jié)合,才能觸動家長;楊同學(xué)第一次英語成績96分,本次英語成績83分,假設(shè)他的預(yù)期英語SGP成長目標是50,老師查成績表與他的英語“學(xué)術(shù)伙伴”比較可知,本次英語成績必須達到91分。2班廖同學(xué)三科成績等級分都為“C”,但是英語SGP為4,這一點也成為老師激勵該生的契機??梢钥闯?,由于成績等級和SGP點數(shù)相對獨立,家長能夠更全面地了解學(xué)生的成績和學(xué)業(yè)進步情況,緩解成績焦慮;教師可以通過SGP了解學(xué)生的學(xué)業(yè)成長是否符合學(xué)校要求、要達到預(yù)期成長目標學(xué)生需要的成長程度、是否有個別低成長學(xué)生應(yīng)當引起特別關(guān)注等。SGP與成績等級相結(jié)合,更加有利于發(fā)揮評價的鑒定、診斷、監(jiān)督、導(dǎo)向、激勵等作用。

(五)mSGP用于學(xué)校的評價

在國際上,使用mSGP對學(xué)校效能進行增值評價已經(jīng)得到廣泛應(yīng)用[2];除此以外,mSGP還能提供很多有用的信息,例如在學(xué)校層面,校長可以知道本校的學(xué)生學(xué)業(yè)成長與其它學(xué)校比較是否符合要求、不同年級的學(xué)生成長是否相似等。

容易看出,學(xué)校5總分mSGP為64,在8所學(xué)校中位居第一,整體成績進步最佳,學(xué)校5的語文mSGP、數(shù)學(xué)mSGP、英語mSGP分別為62、53、68,說明三科都有進步,其中又以英語成績進步最大;學(xué)校2、學(xué)校3大部分學(xué)科mSGP值小于50,整體退步。

三、SGP模型的優(yōu)勢和不足以及改進方法

(一)優(yōu)勢

1. SGP模型不依賴歷次考試的垂直等值,同時不依賴線性假設(shè)和方差齊性假設(shè),具有較大的靈活性。

2. SGP模型使用成績的百分等級位的相對變化衡量學(xué)生成績的進步,容易被一線教育工作者和學(xué)生、家長理解接受。

3. SGP模型關(guān)注的不是學(xué)生的絕對成績或者成績排位,而是百分等級位的進步程度,符合發(fā)展性評價的理念。

4. SGP模型不僅可以通過對學(xué)生歷次考試各科的SGP值進行記錄,從而描述學(xué)生的成長軌跡,而且還可以對成長軌跡進行線性回歸,從而實現(xiàn)對學(xué)生成長的預(yù)測。

5.將學(xué)生的SGP在班級、學(xué)校層面累積,計算平均值或中位數(shù),得到mSGP,可以作為對班級、學(xué)校進行增值評價的有效手段。

(二)不足與改進方法

1.從SGP的原理和計算過程可以看出,SGP是一種關(guān)于測量結(jié)果的常模參照解釋,也就是說,它測量的是在常模群體中的相對排名變化,并不能判斷被測者是否達到指定的測量標準[5]。

2. SGP取決于“學(xué)術(shù)伙伴”的百分等級進步值,屬于條件狀態(tài)(conditional status)的測量,它的準確性首先依賴于每位考生有足夠多的“學(xué)術(shù)伙伴”,這一點對考試規(guī)模提出了比標準分模型更高的要求,為了使測量結(jié)果更加精確,建議考生總數(shù)在5000人或更多[5],因此,SGP更適合區(qū)域性的考試評估。本文數(shù)據(jù)來源選自深圳市某區(qū)8所初中學(xué)校2018—2019年統(tǒng)考成績,因疫情原因,無法獲取原計劃中的更大規(guī)模的數(shù)據(jù)樣本,這也是本文的一個不足之處。

3.在理想情況下,“學(xué)術(shù)伙伴”的百分等級應(yīng)當形成正態(tài)分布,實際上在“學(xué)術(shù)伙伴”百分等級非理想分布情況下,會引入一定的誤差。改進方法如下。

(1)因為中位數(shù)疊加了多種誤差來源,可以使用SGP平均值而不是中位數(shù)計算mSGP[7]。

(2)數(shù)據(jù)源可以使用多年考試的數(shù)據(jù),有研究指出,與使用一年的數(shù)據(jù)比較,使用兩年的數(shù)據(jù)能夠減少40%的偏差[7]。

(3)有學(xué)者提出了模擬-外推(SimulationExtrapolation,SIMEX)算法和等級化模擬-外推(Ranked Simulation-Extrapolation)算法,最多可以減少75%的誤差[7]。

(4)因為是常模參照,SGP要求2次考試的被試群體一致,對于區(qū)域性考試而言,學(xué)生因休學(xué)、疾病等原因缺考導(dǎo)致相關(guān)數(shù)據(jù)缺失是常見的,被試群體的不穩(wěn)定會降低SGP結(jié)果的準確性。因此,一方面應(yīng)當加強對考試的管理,做好數(shù)據(jù)清理工作,進行大數(shù)據(jù)分析與預(yù)警,改進算法;另一方面,可以降低mSGP在學(xué)校、教師績效考核中的權(quán)重,正確引導(dǎo)相關(guān)決策。

四、結(jié)語

學(xué)生成長百分等級模型關(guān)注學(xué)生的學(xué)業(yè)進步而非具體分數(shù),同時還可以對學(xué)生的成長進行預(yù)測,既能用于評價學(xué)生個體的學(xué)業(yè)進步水平,也能用于評價班級、學(xué)校的效能,且其基本理念容易被一線教育工作者和學(xué)生、家長理解、接受,是值得探索應(yīng)用的增值評價方法。然而,教育評價是一個復(fù)雜的問題,必須結(jié)合其他評價手段和評價指標進行全面、綜合的評價,方能實現(xiàn)科學(xué)決策。

參考文獻:

[1]深化新時代教育評價改革總體方案[EB/OL].[2022-08-06]. http://www.gov.cn/zhengce/2020/10/13/content_5551032.htm.

[2] Michael D K. Value-Added and Student Growth Percentile Models:What Drives Differences in Estimated Classroom Effects [J]. Statistics and Public Policy,2018,5(1):1-8.

[3]謝小慶.用于成長評估的學(xué)生成長百分等級模型——來自美國的經(jīng)驗[J].教育測量與評價,2019,(6):3-9.

[4]周園.增值評價中學(xué)生增長百分位模型及其估計方法概述[J].教育導(dǎo)刊,2019,(11):61-67.

[5]符華均,等.基于學(xué)生成長百分等級模型的學(xué)業(yè)進步評價[J].中國考試,2019,(2):14-18.

[6] New Jersey Department of Education. Median Student Growth Percentile(mSGP)Conversion Chart [EB/OL]. [2022-08-06]. https:// www.state.nj.us/education/AchieveNJ/re-sources/mSGPConversionChart. pdf.

[7] Castellano K E,Mccaffrey D F. The Accuracy of Aggregate Student Growth Percentiles as Indicators of Educator Performance [J]. Educational Measurement:Issues and Practice,2017,36:14-27.

Practical Exploration of Educational Value-added Evaluation Based on Student Growth Percentile Model

Chen Kewu

Shatangbu School,Shenzhen,Guangdong,518114

Abstract:Value-added evaluation is a hot research topic of educational evaluation in recent years. This paper attaches importance to the introduction and analysis of the principle,advantages and disadvantages,and improvement direction of the student growth percentile model. Moreover,the relevant algorithms under Visual Studio 2015 are accomplished. Through the performance tracking analysis of students in 8 junior high schools in a certain region,the utility of the model for value-added evaluation and the presentation of studentsgrades is preliminarily verified.

Key words:Value-added Evaluation,Student Growth Percentile Model,Educational Evaluation,Student Growth Evaluation

(責(zé)任編輯:吳茳、白云)

猜你喜歡
增值評價教育評價
以增值評價為基點的高校學(xué)生發(fā)展性評價體系探索
以增值評價為基點的高校學(xué)生發(fā)展性評價體系探索
以增值評價為基點的高校學(xué)生發(fā)展性評價體系探索
以增值評價為基點的高校學(xué)生發(fā)展性評價體系探索
莫讓“后進生”成為教育之殤
基于學(xué)業(yè)質(zhì)量的增值性評價系統(tǒng)的分析與構(gòu)建
談?wù)劷逃u價與學(xué)校教育管理的重要性
關(guān)注“人的發(fā)展”:“核心素養(yǎng)”觀下學(xué)校教育的召喚
基于幼兒成長的有效教育評價研究
成才之路(2016年32期)2016-11-19 17:13:08
中小學(xué)綜合素質(zhì)評價的價值取向和育人導(dǎo)向探析
考試周刊(2016年54期)2016-07-18 09:10:29
郸城县| 安新县| 寻乌县| 南平市| 巨鹿县| 水城县| 赤壁市| 怀仁县| 即墨市| 措勤县| 舒城县| 华坪县| 盖州市| 阳山县| 平凉市| 锦州市| 宁陵县| 华坪县| 石嘴山市| 饶河县| 西乌珠穆沁旗| 新乡县| 玉山县| 灵石县| 十堰市| 安徽省| 汶川县| 南充市| 五华县| 宁安市| 琼中| 桃源县| 江阴市| 米泉市| 宜阳县| 甘洛县| 泊头市| 长海县| 葵青区| 广河县| 岑巩县|