●姚春艷 張勇
對(duì)改進(jìn)評(píng)價(jià)方法的思考
●姚春艷 張勇
改進(jìn)評(píng)價(jià)方法是2013年《教育部關(guān)于推進(jìn)中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革的意見》中提出的要求。文件明確提出中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革的評(píng)價(jià)方法應(yīng)以測(cè)試和問卷調(diào)查等方法為主,輔以必要的現(xiàn)場(chǎng)觀察、訪談和資料查閱;其中測(cè)試和問卷調(diào)查是較為常見的定量評(píng)價(jià)方法;現(xiàn)場(chǎng)觀察、訪談和資料查閱則屬于定性的評(píng)價(jià)方法。中小學(xué)教育質(zhì)量綜合評(píng)價(jià)的內(nèi)容包括5大方面20項(xiàng)關(guān)鍵指標(biāo),每一項(xiàng)指標(biāo)應(yīng)采用何種評(píng)價(jià)方法更為恰當(dāng),能獲得有效的信息或數(shù)據(jù),一方面要基于對(duì)各種評(píng)價(jià)方法特點(diǎn)、功能、分類等情況的正確認(rèn)識(shí),另一方面要基于對(duì)各項(xiàng)指標(biāo)應(yīng)評(píng)定的內(nèi)容的理解。此外,還需要認(rèn)識(shí)到,同一指標(biāo)可以采取多種評(píng)價(jià)方法,不同方法得出的結(jié)論可以相互校驗(yàn),以獲得對(duì)被評(píng)價(jià)對(duì)象更為全面的認(rèn)識(shí)。為此,筆者對(duì)教育評(píng)價(jià)中可使用的幾種評(píng)價(jià)方法逐一介紹,并對(duì)中小學(xué)教育質(zhì)量綜合評(píng)價(jià)的20項(xiàng)關(guān)鍵指標(biāo)適用的評(píng)價(jià)方法進(jìn)行簡(jiǎn)要說明,希望能為教育評(píng)價(jià)改革先行的地區(qū)提供一些參考。
考查學(xué)業(yè)成就的紙筆測(cè)試根據(jù)測(cè)試的標(biāo)準(zhǔn)化程度不同,可以分為標(biāo)準(zhǔn)化測(cè)試和教師自編測(cè)驗(yàn)兩種。標(biāo)準(zhǔn)化測(cè)試一般是指根據(jù)統(tǒng)一、規(guī)范的標(biāo)準(zhǔn),對(duì)考試的各個(gè)環(huán)節(jié)包括測(cè)試目的、命題、施測(cè)、評(píng)分、計(jì)分、分?jǐn)?shù)解釋等按照系統(tǒng)的科學(xué)程序組織,從而嚴(yán)格控制誤差的考試,試卷的編制通常由專業(yè)機(jī)構(gòu)和專業(yè)人員承擔(dān)。教師自編測(cè)驗(yàn)是由教師根據(jù)具體的教學(xué)目標(biāo)、教材內(nèi)容和測(cè)驗(yàn)?zāi)康淖约壕幹频臏y(cè)試題,是為特定的教學(xué)服務(wù)的。由于學(xué)??颇糠倍?,教學(xué)檢查需要經(jīng)常進(jìn)行。而教師自編測(cè)驗(yàn)操作過程容易,應(yīng)用范圍一般限于本班、本年級(jí),施測(cè)方便,是學(xué)校中最多和教師最常用的測(cè)驗(yàn)。
教育質(zhì)量綜合評(píng)價(jià)實(shí)驗(yàn)過程中,因?yàn)橐獙?shí)現(xiàn)多所學(xué)校之間的比較,一般采用標(biāo)準(zhǔn)化測(cè)試。在學(xué)校內(nèi)部評(píng)價(jià)中,則可以采用教師自編測(cè)驗(yàn)。
中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革中的20項(xiàng)關(guān)鍵指標(biāo)適合采用紙筆測(cè)試的指標(biāo)有:品德發(fā)展水平中與課程有關(guān)的、需要識(shí)記的部分;學(xué)業(yè)發(fā)展水平中的知識(shí)技能、學(xué)科思想方法指標(biāo);身心發(fā)展水平中的健康生活方式和審美修養(yǎng)中的認(rèn)知部分。
問卷調(diào)查法是一種將要調(diào)查的內(nèi)容以問題的形式提出,設(shè)計(jì)成問卷,然后讓調(diào)查對(duì)象來回答,借此來收集所需信息的方法。
有兩類不同性質(zhì)的問卷:一種是由一些測(cè)量獨(dú)立的變量的問題組成的問卷,這類問卷僅用于了解調(diào)查對(duì)象在某些方面的教育心理狀況,有時(shí)可作為編制嚴(yán)格量表的前期工作和基礎(chǔ)。這類調(diào)查通常設(shè)計(jì)一些以多項(xiàng)選擇為主的問卷,調(diào)查結(jié)果的分析以描述統(tǒng)計(jì)分析為主,如某答案選擇的頻次、百分比等。
另一種是具有內(nèi)在邏輯結(jié)構(gòu),用于測(cè)量某些心理特質(zhì)的量表,這類問卷需要嚴(yán)格檢驗(yàn)問卷的信度、效度;調(diào)查結(jié)果分析除了描述統(tǒng)計(jì)分析之外,還使用推理統(tǒng)計(jì)分析的方法,如差異檢驗(yàn)、回歸分析等。由于量表式的問卷的編制對(duì)專業(yè)性要求較高,在中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革實(shí)驗(yàn)中,可以選擇一些經(jīng)過實(shí)證驗(yàn)證的成熟量表。
20項(xiàng)關(guān)鍵指標(biāo)中,適合采用非量表式問卷調(diào)查的指標(biāo)有:品德發(fā)展水平中各項(xiàng)指標(biāo)中的部分行為表現(xiàn);學(xué)業(yè)發(fā)展水平中的實(shí)踐能力;健康生活方式中的人際溝通、興趣特長(zhǎng)養(yǎng)成中的愛好特長(zhǎng)以及課業(yè)負(fù)擔(dān)中的學(xué)習(xí)時(shí)間、課業(yè)質(zhì)量、課業(yè)難度、學(xué)習(xí)壓力。宜采用量表式問卷調(diào)查的指標(biāo)有:人格品質(zhì)、創(chuàng)新意識(shí)、情緒行為調(diào)控、好奇心和求知欲、潛能發(fā)展等。
指在自然情境或?qū)iT設(shè)計(jì)的情景中對(duì)學(xué)生的特定行為進(jìn)行觀察的方法。行為觀察法有以下特點(diǎn):可提供學(xué)生人際行為和學(xué)習(xí)風(fēng)格的信息;可提供學(xué)生行為與其他人行為的系統(tǒng)記錄,這些記錄可用于評(píng)價(jià)、干預(yù)計(jì)劃以及監(jiān)測(cè)干預(yù)實(shí)施后的變化;觀察所提供的信息不受學(xué)生能力或報(bào)告信息意愿的影響。
行為觀察法的操作流程包括:定義要觀察的行為,如觀察學(xué)生考試是否作弊,作為評(píng)價(jià)學(xué)生誠(chéng)實(shí)的一個(gè)方面;確定觀察時(shí)間和頻次,假設(shè)要觀察學(xué)生考試是否作弊,則需要確定一學(xué)期觀察幾次,以及在哪些考試中進(jìn)行觀察等;實(shí)施觀察,記錄觀察結(jié)果。
在記錄觀察結(jié)果時(shí),可以采用行為記錄表的方式。行為記錄表設(shè)計(jì)樣式如下:
表1:品德發(fā)展水平評(píng)價(jià)指標(biāo)行為觀察記錄表(示例)
通過將不同頻次轉(zhuǎn)換為分?jǐn)?shù),即可得到學(xué)生在某一行為表現(xiàn)的量化分?jǐn)?shù)。以上表為例,如果將條目1、2、3、5的分?jǐn)?shù)轉(zhuǎn)換規(guī)則定義為A=1,B=2,C=3,將條目4的分?jǐn)?shù)轉(zhuǎn)換規(guī)則定義為A=3,B=2,C=1,則該生在遵紀(jì)守法方面獲得的分?jǐn)?shù)為12分。
行為觀察法的缺陷是,教師對(duì)學(xué)生行為的觀察可能會(huì)受到教師對(duì)學(xué)生的偏見以及觀察時(shí)間取樣限制而產(chǎn)生觀察偏差。為避免行為觀察可能產(chǎn)生的不公平,行為觀察結(jié)果應(yīng)與學(xué)生或家長(zhǎng)確認(rèn),對(duì)于有爭(zhēng)議的項(xiàng)目,雙方需要協(xié)商確定。唯有學(xué)生或家長(zhǎng)確認(rèn)后的行為觀察結(jié)果才能計(jì)入學(xué)生檔案中。這種協(xié)商的過程也恰恰是“第四代評(píng)價(jià)”所倡導(dǎo)的,評(píng)價(jià)結(jié)果應(yīng)該是各方協(xié)商的結(jié)果。
20項(xiàng)關(guān)鍵指標(biāo)中適合采用行為觀察的指標(biāo)有:品德發(fā)展水平中的部分行為;實(shí)踐能力、創(chuàng)新意識(shí)、健康生活方式、情緒行為調(diào)控、人際溝通、好奇心求知欲、愛好特長(zhǎng)。
1.概述。表現(xiàn)評(píng)定法是對(duì)學(xué)生實(shí)際的表現(xiàn)進(jìn)行直接的、系統(tǒng)的觀察,并根據(jù)預(yù)先設(shè)定的表現(xiàn)標(biāo)準(zhǔn)對(duì)其表現(xiàn)進(jìn)行評(píng)分的方法。在這種方法中,一般要求學(xué)生執(zhí)行一個(gè)復(fù)雜的表現(xiàn)性任務(wù)或者創(chuàng)作一個(gè)作品。這種方法既可以用于個(gè)體評(píng)價(jià)也可用于小組評(píng)價(jià)。所設(shè)定的任務(wù)通常是與考察高級(jí)思維技能的真實(shí)生活有關(guān)的任務(wù)。表現(xiàn)評(píng)定法的難點(diǎn)主要有三個(gè):一是表現(xiàn)評(píng)定標(biāo)準(zhǔn)的制定,包括在一項(xiàng)任務(wù)中,應(yīng)從哪些方面進(jìn)行觀察,如何定義不同的表現(xiàn)水平,如何對(duì)不同的表現(xiàn)水平賦予分值等問題;二是任務(wù)的設(shè)定,包括希望通過這項(xiàng)任務(wù)考察學(xué)生哪些思維技能或者動(dòng)手能力或者創(chuàng)造能力,為了要考察這幾個(gè)方面,哪些任務(wù)是最恰當(dāng)、最合適的問題;三是評(píng)分者的專業(yè)性,即評(píng)分者必須熟悉評(píng)分標(biāo)準(zhǔn)的含義及其指向,并能夠根據(jù)評(píng)分標(biāo)準(zhǔn)選取恰當(dāng)?shù)男袨檫M(jìn)行觀察,同時(shí)也能對(duì)不同的水平作出恰當(dāng)?shù)呐袛?,并給予相應(yīng)的分?jǐn)?shù)。
由于表現(xiàn)性評(píng)定法會(huì)受到評(píng)分者主觀因素的影響,為了使結(jié)果更為公平,通常會(huì)采用2-3人同時(shí)評(píng)分,取平均分的方式來處理。
以下為英語作文表現(xiàn)性評(píng)定標(biāo)準(zhǔn)的示例。須選擇和判斷放入檔案袋中的內(nèi)容;設(shè)定學(xué)習(xí)目標(biāo);監(jiān)控學(xué)習(xí)進(jìn)程。在目標(biāo)的指引下,學(xué)生可以反思他們自己的進(jìn)步和作品的質(zhì)量。學(xué)生可以在自己的水平上進(jìn)行工作,展示自己的學(xué)習(xí)風(fēng)格和表達(dá)方式。
表2:表現(xiàn)性評(píng)定標(biāo)準(zhǔn)(示例)——英語作文
檔案袋作為學(xué)生綜合素質(zhì)能力展現(xiàn)的一種重要手段,是對(duì)傳統(tǒng)的紙筆測(cè)試的重要補(bǔ)充??茖W(xué)、有效的檔案袋評(píng)價(jià),需要根據(jù)評(píng)價(jià)的目的精心設(shè)計(jì)檔案袋內(nèi)容,需要有科學(xué)的評(píng)分標(biāo)準(zhǔn)和評(píng)分量表,需要對(duì)評(píng)價(jià)結(jié)果加以解釋并對(duì)應(yīng)用做出指導(dǎo),同時(shí)還需要對(duì)評(píng)分者進(jìn)行培訓(xùn),規(guī)范評(píng)分過程以保證評(píng)分信度。
20項(xiàng)關(guān)鍵指標(biāo)中除了學(xué)業(yè)負(fù)擔(dān)的各項(xiàng)指標(biāo)不宜采用檔案袋評(píng)價(jià)方法之外,其他四個(gè)方面的各項(xiàng)指標(biāo)都可以采用檔案袋方式來獲得其他評(píng)價(jià)方法所不易獲得的學(xué)生的信息。
較多的低頻詞,且低頻詞的使用恰當(dāng)。低頻詞的使用較少,且部分低頻詞的使用不恰當(dāng)。所使用的單詞基本上都是高頻詞,或者是低頻詞的使用不恰當(dāng)。正確使用過渡詞或過渡句,主題突出,有主題句可以統(tǒng)攝全篇,每段具有中心句,段落之間緊湊,結(jié)構(gòu)清晰,讀者能很容易把握結(jié)構(gòu)。段落之間銜接合理,有些段落與中心無關(guān),使得邏輯主線的清晰度稍差,讀者尚能理解文章結(jié)構(gòu)。段落之間銜接不合理,東拼西湊,使得文章結(jié)構(gòu)混亂。遵循文章的特定文體格式,能根據(jù)寫作目的和特定的讀者,恰當(dāng)?shù)剡x用語域?;灸軌蜃裱恼碌奶囟ㄎ捏w格式,能根據(jù)寫作目的和特定的讀者,較為恰當(dāng)?shù)剡x用語域。文章的格式不正確,或不能根據(jù)寫作的目的和特定的讀者選用語域。沒有拼寫錯(cuò)誤和標(biāo)點(diǎn)錯(cuò)誤。拼寫錯(cuò)誤(遺漏或者多填字母,或者創(chuàng)造不存在的新詞)和標(biāo)點(diǎn)錯(cuò)誤(出現(xiàn)漢語標(biāo)點(diǎn))較少。拼寫錯(cuò)誤(遺漏或者多填字母,或者創(chuàng)造不存在的新詞)和標(biāo)點(diǎn)錯(cuò)誤(出現(xiàn)漢語標(biāo)點(diǎn))很多。字?jǐn)?shù)達(dá)到寫作要求的字?jǐn)?shù)。字?jǐn)?shù)少于寫作要求的字?jǐn)?shù)。距離規(guī)定字?jǐn)?shù)相差很多。詞匯結(jié)構(gòu)格式拼寫與標(biāo)點(diǎn)字?jǐn)?shù)1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
20項(xiàng)關(guān)鍵指標(biāo)中適合采用表現(xiàn)評(píng)定法的指標(biāo)有:實(shí)踐能力、創(chuàng)新意識(shí)、審美修養(yǎng)。
2.檔案袋評(píng)價(jià)。檔案袋評(píng)價(jià)又稱為“學(xué)習(xí)檔案評(píng)價(jià)”或“學(xué)生成長(zhǎng)記錄袋評(píng)價(jià)”,是表現(xiàn)性評(píng)價(jià)的一種重要形式。檔案袋是指學(xué)生在教師的指導(dǎo)下搜集起來的,可以反映學(xué)生的努力情況、進(jìn)步情況、學(xué)習(xí)成就等一系列學(xué)習(xí)作品的匯集。它展示了學(xué)生某一時(shí)間段內(nèi)、某一領(lǐng)域內(nèi)的綜合發(fā)展情況。
檔案袋評(píng)價(jià)在西方國(guó)家得到較為普遍的應(yīng)用,主要是因?yàn)槠渚哂幸韵乱恍┨攸c(diǎn):①全面深入地展示學(xué)生的多種才能。沒有壓力和時(shí)間限制的情況下,學(xué)生可以利用各種資源和參考資料,與他人合作完成高質(zhì)量的工作,從而展示學(xué)生多方面的才能,這些才能是單純的紙筆測(cè)試無法檢測(cè)到的,如口頭表達(dá)能力、實(shí)驗(yàn)操作能力、創(chuàng)新性等。②促進(jìn)學(xué)生主動(dòng)學(xué)習(xí)與自我反思。學(xué)生必
本次評(píng)價(jià)改革提出了改變?cè)u(píng)價(jià)方法的要求,然而,需要我們注意的一個(gè)問題是:評(píng)價(jià)方法的轉(zhuǎn)變,不僅僅只是在評(píng)價(jià)中引入定性評(píng)價(jià)方法而已,更為重要的也是最為困難的問題在于,如何將由定性評(píng)價(jià)方法獲得的結(jié)果以量化的形式呈現(xiàn),使得定性評(píng)價(jià)的結(jié)果也可以參與學(xué)校教育質(zhì)量綜合評(píng)價(jià)的計(jì)算,如此才能確保對(duì)學(xué)校的評(píng)價(jià)不是以單純的升學(xué)率或者是學(xué)業(yè)成績(jī)?yōu)橹饕罁?jù)。因此,定性評(píng)價(jià)結(jié)果的量化呈現(xiàn),應(yīng)成為改變?cè)u(píng)價(jià)方法研究中的一個(gè)重點(diǎn)。
作者
姚春艷公眾教育研究院副院長(zhǎng),公眾考試研究院執(zhí)行院長(zhǎng);
張勇中國(guó)教育學(xué)會(huì)中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革實(shí)驗(yàn)區(qū)辦公室副主任,公眾教育研究院、公眾考試研究院院長(zhǎng)。
(責(zé)任編輯曾憲波)