摘要中小學(xué)在未來(lái)教育評(píng)價(jià)研究與實(shí)踐中需關(guān)注三個(gè)重點(diǎn)問(wèn)題:一是聚焦核心素養(yǎng),探索表現(xiàn)性評(píng)價(jià)的設(shè)計(jì)與應(yīng)用,使評(píng)價(jià)嵌套進(jìn)真實(shí)的生產(chǎn)生活情境中;二是注重效度分析,使評(píng)價(jià)能有效測(cè)量欲測(cè)的特質(zhì),并為有關(guān)推論與決策提供有價(jià)值的依據(jù),提升評(píng)價(jià)的科學(xué)性;三是承認(rèn)評(píng)價(jià)的局限性,適時(shí)適度地評(píng)價(jià),避免過(guò)度評(píng)價(jià)所引發(fā)的負(fù)效應(yīng)。
關(guān)鍵詞教育質(zhì)量評(píng)價(jià);學(xué)科評(píng)價(jià);核心素養(yǎng);綜合素質(zhì)評(píng)價(jià);表現(xiàn)性評(píng)價(jià);發(fā)展性評(píng)價(jià);效度分析
中圖分類號(hào)G63
文獻(xiàn)標(biāo)識(shí)碼B
文章編號(hào)1002-2384(2018)02-0005-03
當(dāng)前,很多中小學(xué)校已開始在課改理念與核心素養(yǎng)框架的引領(lǐng)下,從明確學(xué)校發(fā)展愿景與培養(yǎng)目標(biāo)入手,系統(tǒng)思考與設(shè)計(jì)教育評(píng)價(jià)改革思路,并在評(píng)價(jià)主體多元化、新興評(píng)價(jià)方式應(yīng)用、教學(xué)評(píng)一致性等方面取得了明顯突破。同時(shí),如何在現(xiàn)有基礎(chǔ)上進(jìn)一步推動(dòng)評(píng)價(jià)研究,以充分發(fā)揮其激勵(lì)與導(dǎo)向性功能,也成為擺在教育者面前的新課題?;谌粘T谝痪€的深入觀察,筆者認(rèn)為,未來(lái)中小學(xué)教育評(píng)價(jià)研究尤其是學(xué)科評(píng)價(jià)中應(yīng)關(guān)注三個(gè)重點(diǎn)問(wèn)題。
一、聚焦核心素養(yǎng),探索表現(xiàn)性評(píng)價(jià)的設(shè)計(jì)與應(yīng)用
為全面深化課程改革,落實(shí)立德樹人根本任務(wù),2016年,《中國(guó)學(xué)生發(fā)展核心素養(yǎng)》總體框架正式公布,基于核心素養(yǎng)的課標(biāo)修訂、教材編寫及評(píng)價(jià)改革也陸續(xù)啟動(dòng)。盡管仍有人對(duì)核心素養(yǎng)框架的表述存在質(zhì)疑,但對(duì)于學(xué)校和教師究竟應(yīng)重點(diǎn)培養(yǎng)學(xué)生哪些具體能力,教育者并不難達(dá)成共識(shí)。例如:褚宏啟提出在基礎(chǔ)教育領(lǐng)域應(yīng)關(guān)注學(xué)生的六項(xiàng)核心素養(yǎng),分別是創(chuàng)新能力、批判性思維、公民素養(yǎng)、合作與交流能力、自我發(fā)展素養(yǎng)與信息素養(yǎng)。[1]這一提法不僅與我國(guó)官方認(rèn)可的核心素養(yǎng)框架保持基本一致,且由于更具體化而更容易使教育者找到操作抓手,故得到比較廣泛的認(rèn)可。因此,在核心素養(yǎng)培育的宏觀背景下,中小學(xué)不能將目光仍然局限于學(xué)科教學(xué)以及對(duì)學(xué)科知識(shí)的掌握,而要參考國(guó)內(nèi)外有關(guān)框架和思路,結(jié)合本校實(shí)際情況,明確學(xué)校所關(guān)注的核心素養(yǎng),并在評(píng)價(jià)研究中關(guān)注對(duì)學(xué)生必備品質(zhì)與關(guān)鍵能力的培育。
具體到核心素養(yǎng)評(píng)價(jià),教育者需要借鑒國(guó)外經(jīng)驗(yàn),在實(shí)踐中探索表現(xiàn)性評(píng)價(jià)技術(shù)的應(yīng)用。表現(xiàn)性評(píng)價(jià)通常要求學(xué)生運(yùn)用先前所獲得的知識(shí),解決某個(gè)生產(chǎn)生活情境中的真實(shí)問(wèn)題或創(chuàng)造出符合某種特定標(biāo)準(zhǔn)的成果,教師通過(guò)觀察學(xué)生完成任務(wù)的過(guò)程與結(jié)果評(píng)價(jià)學(xué)生表現(xiàn)。[2]這種評(píng)價(jià)方式克服了傳統(tǒng)測(cè)驗(yàn)中僅能測(cè)試低水平知識(shí)和孤立技能的弊端,能有效評(píng)價(jià)學(xué)生在真實(shí)世界中應(yīng)用所學(xué)知識(shí)與技能解決問(wèn)題、交流合作及批判性思考等多種復(fù)雜能力,特別適合于核心素養(yǎng)評(píng)價(jià)。
以一道小學(xué)五年級(jí)數(shù)學(xué)題為例,有教師在教完“組合圖形面積”一課后,在當(dāng)堂檢測(cè)中出了這樣一道題:
智慧老人要裝修自家的客廳,客廳形狀及各面墻的長(zhǎng)度如右圖所示,他家的客廳面積有多大?
從整體上看,這道題已經(jīng)具備了表現(xiàn)性評(píng)價(jià)的雛形,創(chuàng)設(shè)了一個(gè)看上去比較生活化的情境,但由于智慧老人不是真實(shí)的人物,其情境本身是虛假的,加之題目難度太低,因此并不能有效考查學(xué)生在真實(shí)生產(chǎn)生活情境中運(yùn)用學(xué)科知識(shí)解決問(wèn)題的能力。
如果將題目修改成:“張爺爺買了套小單元房,房產(chǎn)證上注明這套房子的建筑面積是38平方米,可張爺爺感覺(jué)家里沒(méi)有那么大。他測(cè)量了家里幾面墻的長(zhǎng)度,如圖(同智慧老人一題),請(qǐng)問(wèn)開發(fā)商是不是測(cè)量錯(cuò)了?”那么我們可以看到,題目修改后所涉及的情境相對(duì)真實(shí)得多,學(xué)生在解題過(guò)程中需要分清商品房的建筑面積、套內(nèi)面積及使用面積等相關(guān)概念,能較好地評(píng)價(jià)學(xué)生的問(wèn)題解決能力。如果所提供的房屋平面圖再稍復(fù)雜一點(diǎn),增加學(xué)科知識(shí)的難度,那么這道題就變成了一道優(yōu)秀的表現(xiàn)性評(píng)價(jià)題目。
因此,深入研究表現(xiàn)性評(píng)價(jià),特別是非紙筆類表現(xiàn)性評(píng)價(jià),使評(píng)價(jià)嵌套進(jìn)真實(shí)的生產(chǎn)生活情境中,有效考查學(xué)生的問(wèn)題解決能力、溝通合作能力、批判性思考能力、信息媒體技術(shù)等多種跨學(xué)科核心素養(yǎng),這是未來(lái)評(píng)價(jià)改革應(yīng)該關(guān)注的重點(diǎn)。
二、注重效度分析,提升評(píng)價(jià)研究的科學(xué)性
評(píng)價(jià)的質(zhì)量如何也需要被評(píng)價(jià)。學(xué)術(shù)界將對(duì)評(píng)價(jià)的評(píng)價(jià)稱為元評(píng)價(jià)。[3]通常,人們?cè)谠u(píng)價(jià)中主要分析試題的難度和區(qū)分度,即便是建立在項(xiàng)目反應(yīng)理論基礎(chǔ)上的深入分析也是如此。但實(shí)際上,教師在實(shí)踐中接觸最多的當(dāng)堂檢測(cè)、單元驗(yàn)收、期末考試、畢業(yè)水平測(cè)試,乃至大規(guī)模的教育質(zhì)量監(jiān)測(cè),都是標(biāo)準(zhǔn)參照性質(zhì)的測(cè)試,是絕對(duì)評(píng)價(jià),其主要目的是檢測(cè)學(xué)生達(dá)到既定學(xué)習(xí)目標(biāo)的程度。在這種測(cè)驗(yàn)中,教師不需要刻意控制題目的難度和區(qū)分度,只要嚴(yán)格依照課程標(biāo)準(zhǔn)、教材和教學(xué)目標(biāo)編制題目,同時(shí)考查點(diǎn)在預(yù)測(cè)目標(biāo)范圍內(nèi),是教學(xué)的重點(diǎn),即使題目特別容易或特別難,都可以是好的題目,也可以出現(xiàn)在測(cè)驗(yàn)中。[4]
因此,反映評(píng)價(jià)質(zhì)量好壞的最重要指標(biāo)不是難度和區(qū)分度,而是效度。很多人會(huì)望文生義地認(rèn)為,效度就是評(píng)價(jià)有效性的程度,以及有效促進(jìn)學(xué)生學(xué)習(xí)與發(fā)展的程度。這種理解在方向上似乎沒(méi)有錯(cuò)誤,但專業(yè)性不夠。從專業(yè)角度來(lái)看,效度是一個(gè)綜合性概念,是指評(píng)價(jià)能測(cè)到所要測(cè)量特質(zhì)的程度以及能為有關(guān)推論與決策提供有價(jià)值依據(jù)的程度。以七年級(jí)語(yǔ)文“口語(yǔ)交際”教學(xué)評(píng)價(jià)為例,有教師在單元驗(yàn)收中出了這樣一道題目:
“同學(xué)們,我們每個(gè)人心底都有自己的秘密。今天晚上回家后,請(qǐng)和你的父母說(shuō)說(shuō)你心底的秘密。你會(huì)如何說(shuō)呢?請(qǐng)把它寫下來(lái)。”
這道題要考查的是學(xué)生口語(yǔ)交際能力達(dá)成單元目標(biāo)的程度,但它讓學(xué)生將想說(shuō)的話寫出來(lái),實(shí)際上考查的主要是書面語(yǔ)言表達(dá)能力,而不是口語(yǔ)交際能力。想測(cè)量的特質(zhì)沒(méi)有測(cè)量到,就是效度不良。一旦效度不良,我們就無(wú)法對(duì)學(xué)生的學(xué)習(xí)水平和教師的教學(xué)質(zhì)量做出準(zhǔn)確有效的判斷??梢?jiàn),一道測(cè)試題或者一套評(píng)價(jià)方案,只有效度良好,才能產(chǎn)生好的評(píng)價(jià)。如果試題效度不良,即使其難度、區(qū)分度等指標(biāo)都合乎測(cè)量學(xué)要求,也沒(méi)有什么實(shí)質(zhì)意義,也不是好的評(píng)價(jià)。endprint
效度好是高質(zhì)量評(píng)價(jià)的首要條件。由美國(guó)教育研究協(xié)會(huì)、美國(guó)心理學(xué)協(xié)會(huì)與全美教育測(cè)量學(xué)會(huì)共同編定的《教育與心理測(cè)試標(biāo)準(zhǔn)》是當(dāng)前元評(píng)價(jià)領(lǐng)域影響最大的一個(gè)分析框架。1999年版及2014年最新版本的《教育與心理測(cè)試標(biāo)準(zhǔn)》都強(qiáng)調(diào)效度是評(píng)價(jià)最基本的要求,所有評(píng)價(jià)必須保證其能測(cè)到所欲測(cè)的特質(zhì),能依據(jù)所收集的信息做出準(zhǔn)確而有效的推論。[5]在實(shí)踐層面最具影響力的美國(guó)教育考試服務(wù)中心也反復(fù)強(qiáng)調(diào),效度是反映試題質(zhì)量最為重要的指標(biāo),測(cè)驗(yàn)編制者必須清晰界定要測(cè)量的特質(zhì),并提供概念性、實(shí)證性或理論性證據(jù)說(shuō)明推論解釋的有效性。[6]
但必須承認(rèn)的是,效度分析在我國(guó)尚未受到足夠重視。教師、教研員、研究者,特別是參與各種考試命題的人,需要認(rèn)真學(xué)習(xí)有關(guān)專業(yè)知識(shí),掌握分析試題、試卷及評(píng)價(jià)方案效度的技能,提高評(píng)價(jià)研究的科學(xué)性。
三、適時(shí)適度評(píng)價(jià),避免過(guò)度評(píng)價(jià)引發(fā)的負(fù)效應(yīng)
評(píng)價(jià)是質(zhì)量管理體系中的重要環(huán)節(jié),在課程改革與教學(xué)實(shí)踐中受到廣泛重視?!敖逃郎y(cè)量學(xué)之父”桑代克曾說(shuō)過(guò),“凡客觀存在的事物都有數(shù)量,凡有數(shù)量的事物都可以測(cè)量”。[7]但我們必須承認(rèn),這只是經(jīng)典測(cè)量理論的一個(gè)假設(shè),就人類所掌握的技術(shù)而言,不少心理特質(zhì)因?yàn)榫哂虚g接性、隱蔽性、隨機(jī)性與復(fù)雜性等特點(diǎn),目前仍難以進(jìn)行準(zhǔn)確有效的評(píng)價(jià)。所以,教育者必須注意到評(píng)價(jià)工作的這種局限性,不能急躁冒進(jìn),更不能為評(píng)價(jià)而評(píng)價(jià)。
為評(píng)價(jià)而評(píng)價(jià),如果評(píng)價(jià)效度不良,抑或在難度、區(qū)分度、信度等方面存在瑕疵,不僅不能準(zhǔn)確評(píng)判學(xué)與教的質(zhì)量,而且會(huì)對(duì)實(shí)踐產(chǎn)生或大或小的誤導(dǎo)。有些地區(qū)或?qū)W校在綜合素質(zhì)評(píng)價(jià)實(shí)踐中評(píng)價(jià)學(xué)生個(gè)體道德品質(zhì)、學(xué)習(xí)能力、創(chuàng)造性,或者審美情趣的某些做法,已經(jīng)顯現(xiàn)出這種負(fù)效應(yīng)。
“為評(píng)價(jià)而評(píng)價(jià)”現(xiàn)象中還有一種亟待關(guān)注的表現(xiàn)就是教師評(píng)價(jià)過(guò)多。在本輪新課改推進(jìn)過(guò)程中,教師開始接受發(fā)展性評(píng)價(jià)理念,將終結(jié)性評(píng)價(jià)與形成性評(píng)價(jià)結(jié)合起來(lái),注重在教學(xué)過(guò)程中開展即時(shí)和動(dòng)態(tài)呈現(xiàn)的形成性評(píng)價(jià)。但有些課堂出現(xiàn)了滿堂評(píng)的問(wèn)題,有些學(xué)校甚至謀劃以各種方式記錄和評(píng)價(jià)學(xué)生的一言一行,導(dǎo)致學(xué)生無(wú)時(shí)無(wú)刻不被評(píng)價(jià)。這在無(wú)形中織就了一張大網(wǎng),不要說(shuō)消極的評(píng)價(jià),即使是完全無(wú)條件的賞識(shí)性評(píng)價(jià),也會(huì)給學(xué)生造成難以想象的壓力。
1973年,心理學(xué)家萊珀基于兒童繪畫興趣實(shí)驗(yàn)的發(fā)現(xiàn)提出過(guò)分肯定理論。她指出,當(dāng)個(gè)體從事一項(xiàng)自身感興趣的活動(dòng)時(shí),外界所給予其的獎(jiǎng)勵(lì)會(huì)使活動(dòng)成為一種達(dá)到目的(獲獎(jiǎng))的手段,那么個(gè)體以后從事這種活動(dòng)的興趣就會(huì)降低。[8]將這一理論嫁接到評(píng)價(jià)實(shí)踐可以預(yù)見(jiàn),如果一個(gè)學(xué)生的某種努力、進(jìn)步或成就頻繁得到教師的賞識(shí)性評(píng)價(jià),學(xué)生擔(dān)心失敗的壓力會(huì)增大,而且追求進(jìn)步的動(dòng)機(jī)會(huì)由內(nèi)在動(dòng)機(jī)轉(zhuǎn)變成外在的工具性動(dòng)機(jī),會(huì)在很大程度上影響其長(zhǎng)遠(yuǎn)發(fā)展。相反,如果教師適當(dāng)減少評(píng)價(jià)和激勵(lì),反而可以激發(fā)學(xué)生的內(nèi)在成就動(dòng)機(jī),培養(yǎng)其自我評(píng)價(jià)、監(jiān)控與發(fā)展的能力。
因此,評(píng)價(jià)很重要,但也要適度。“好雨知時(shí)節(jié),當(dāng)春乃發(fā)生”,只有評(píng)價(jià)做到適時(shí)、適量,且科學(xué)有效,才能更好地發(fā)揮其導(dǎo)向、激勵(lì)、診斷和發(fā)展的積極功用,促進(jìn)教與學(xué)的改進(jìn),也服務(wù)于學(xué)生的成長(zhǎng)。
參考文獻(xiàn):
[1] 褚宏啟. 核心素養(yǎng)的國(guó)際視野與中國(guó)立場(chǎng)—21世紀(jì)中國(guó)的國(guó)民素質(zhì)提升與教育目標(biāo)轉(zhuǎn)型[J]. 教育研究,2016,(11).
[2][4] 趙德成. 促進(jìn)教學(xué)的測(cè)驗(yàn)與評(píng)價(jià)[M]. 上海:華東師范大學(xué)出版社,2016.
[3] Kevin S, Scott B.Meta-assessment:assessing the learning outcomes assessment program[J]. Innovative Higher Education,2016,41(4).
[5] 美國(guó)教育研究協(xié)會(huì),美國(guó)心理學(xué)協(xié)會(huì),全美教育測(cè)量學(xué)會(huì). 教育與心理測(cè)試標(biāo)準(zhǔn)[M]. 燕娓琴,謝小慶,譯. 沈陽(yáng):沈陽(yáng)出版社,2003.
[6] Educational Testing Service. 2014 ETS Standards for Quality and Fairness[EB/OL].(2015-05-01)[2018-01-29]. http://www.ets.org/ s/about/pdf/standards.pdf.
[7] Thorndike E L.The nature,purposes and general methods of measurements of educational products[M]// Whipple G M (ed.) National Society for the Study of Educational Products:Seventeenth Yearbook. Bloomington, IL: Public School Publishing, 1918.
[8] Lepper M R,Greene D,Nisbett R E. Undermining childrens intrinsic motivation with extrinsic reward: A test of the“over-justification”hypothesis[J]. Journal of Personality and Social Psychology, 1973, (28).endprint