国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

考試評(píng)價(jià)在教學(xué)診斷中的應(yīng)用探索

2024-01-04 07:56:54丁秀濤
考試研究 2023年5期
關(guān)鍵詞:教學(xué)診斷高考

丁秀濤

[摘要]“加強(qiáng)考試評(píng)價(jià)研究,挖掘考試數(shù)據(jù)中蘊(yùn)藏的教育教學(xué)信息”是實(shí)現(xiàn)高考引導(dǎo)基礎(chǔ)教育教學(xué)的一個(gè)重要途徑。實(shí)踐中,模型簡(jiǎn)單、淺顯易懂的經(jīng)典測(cè)量理論在群體教學(xué)診斷方面具有明顯優(yōu)勢(shì)?;诔D?duì)高考各學(xué)科試卷進(jìn)行知識(shí)、能力、素養(yǎng)等多維度的結(jié)構(gòu)分析,通過(guò)分層分類(lèi)分析法對(duì)考試數(shù)據(jù)進(jìn)行深入挖掘,用考試數(shù)據(jù)進(jìn)行區(qū)域教學(xué)診斷,能夠發(fā)現(xiàn)不同區(qū)域、不同考生群體的學(xué)科優(yōu)勢(shì)與不足,引導(dǎo)教師更加關(guān)注學(xué)生的學(xué)科知識(shí)掌握情況、能力發(fā)展情況、素養(yǎng)形成情況,有利于破除唯分?jǐn)?shù)、唯升學(xué)的弊端。未來(lái)需要進(jìn)一步加強(qiáng)對(duì)考試數(shù)據(jù)挖掘分析方法的研究;進(jìn)行“無(wú)錨”等值技術(shù)和方法的研究;將結(jié)果性考試數(shù)據(jù)與學(xué)校過(guò)程性考試數(shù)據(jù)相結(jié)合,進(jìn)行教學(xué)綜合診斷。

[關(guān)鍵詞]高考;考試數(shù)據(jù)分析;考試評(píng)價(jià);教學(xué)診斷

[中圖分類(lèi)號(hào)]G424.74[文獻(xiàn)標(biāo)識(shí)碼]A

[文章編號(hào)]1673—1654(2023)05—041—009

基金項(xiàng)目北京市教育科學(xué)“十三五”規(guī)劃2019年度優(yōu)先關(guān)注課題“高考綜合改革背景下的考試評(píng)價(jià)研究與實(shí)踐”(CDEA19057)。

有什么樣的評(píng)價(jià)指揮棒,就有什么樣的辦學(xué)導(dǎo)向。為深入貫徹落實(shí)習(xí)近平總書(shū)記關(guān)于教育的重要論述和全國(guó)教育大會(huì)精神,2020年10月,中共中央、國(guó)務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,提出“堅(jiān)持科學(xué)有效,改進(jìn)結(jié)果評(píng)價(jià),強(qiáng)化過(guò)程評(píng)價(jià),探索增值評(píng)價(jià),健全綜合評(píng)價(jià)”。旨在破除“唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子”的痼疾,扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向[1]。

高考是連接基礎(chǔ)教育和高等教育的重要樞紐,對(duì)基礎(chǔ)教育發(fā)揮著“指揮棒”作用?!吨袊?guó)高考評(píng)價(jià)體系》將高考的核心功能確定為“立德樹(shù)人、服務(wù)選才、引導(dǎo)教學(xué)”[2]??梢?jiàn),正在推進(jìn)實(shí)施的新一輪高考改革特別注重高考對(duì)基礎(chǔ)教育教學(xué)的引導(dǎo)。如何讓考試正確引導(dǎo)教育教學(xué)?一個(gè)重要途徑就是加強(qiáng)考試評(píng)價(jià)研究,通過(guò)分析考試數(shù)據(jù),挖掘考試數(shù)據(jù)中蘊(yùn)藏的教育教學(xué)信息,反饋指導(dǎo)教育教學(xué),充分發(fā)揮考試數(shù)據(jù)在教學(xué)評(píng)價(jià)與診斷中的作用。

有研究者基于中國(guó)知網(wǎng)2010-2019年的文獻(xiàn),對(duì)近10年來(lái)普通高考考試數(shù)據(jù)的研究現(xiàn)狀進(jìn)行了計(jì)量分析,發(fā)現(xiàn):高考數(shù)據(jù)在使用量方面極其有限,基于高考考試數(shù)據(jù)研究的期刊論文數(shù)量偏少,只占高考研究文獻(xiàn)的1%;而且研究中所挖掘的數(shù)據(jù)量有限,很多文獻(xiàn)僅是基于當(dāng)年某個(gè)學(xué)校或某個(gè)地區(qū)的數(shù)據(jù)進(jìn)行挖掘,數(shù)據(jù)樣本很小,基于全國(guó)、全省級(jí)行政區(qū)的高考數(shù)據(jù)分析十分有限[3]。

作為大規(guī)模教育考試,高考不僅能夠完成公平評(píng)價(jià)、選拔新生的任務(wù),而且其考試數(shù)據(jù)中蘊(yùn)藏著豐富的教育教學(xué)信息,如果只將高考作為高校錄取的工具,是一種巨大的資源浪費(fèi)。應(yīng)當(dāng)以問(wèn)題為導(dǎo)向,以改進(jìn)教學(xué)為目的,充分挖掘、分析考試數(shù)據(jù),發(fā)揮考試數(shù)據(jù)診斷、引導(dǎo)教學(xué)的功能。

本著在我國(guó)現(xiàn)階段可操作、可推廣的原則,本文提出一些能夠運(yùn)用于反饋、診斷實(shí)際教學(xué)的考試數(shù)據(jù)分析方法,以期為挖掘、利用考試數(shù)據(jù),促進(jìn)教、學(xué)、考、招協(xié)同共進(jìn)提供借鑒與參考。

一、研究方法

(一)測(cè)量理論的選擇

從利用考試數(shù)據(jù)反饋、診斷、指導(dǎo)教育教學(xué)的角度而言,考試評(píng)價(jià)研究的客體是教育教學(xué)情況,媒介是各學(xué)科試卷(測(cè)試工具)與考試數(shù)據(jù),考試評(píng)價(jià)研究的最終目的是改進(jìn)教育教學(xué)。2019年6月,國(guó)務(wù)院辦公廳印發(fā)《關(guān)于新時(shí)代推進(jìn)普通高中育人方式改革的指導(dǎo)意見(jiàn)》(以下簡(jiǎn)稱(chēng)《意見(jiàn)》),提出:減少高中統(tǒng)考統(tǒng)測(cè)和日??荚嚕訌?qiáng)考試數(shù)據(jù)分析,認(rèn)真做好反饋,引導(dǎo)改進(jìn)教學(xué)[4]。文件明確了對(duì)于考試及考試數(shù)據(jù)分析利用的要求。減少考試與統(tǒng)測(cè)次數(shù),就需要更加充分地分析利用考試數(shù)據(jù),更加充分地發(fā)揮每一次考試的功能,利用考試數(shù)據(jù)診斷教學(xué)效果,利用考試數(shù)據(jù)反饋、改進(jìn)教學(xué)。

在教育考試評(píng)價(jià)領(lǐng)域里,經(jīng)典測(cè)量理論(Classical Testing Theory,CTT)與項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)是目前被廣泛使用的兩種測(cè)驗(yàn)理論,二者各有優(yōu)勢(shì)[5]。近年來(lái),項(xiàng)目反應(yīng)理論得到業(yè)內(nèi)的廣泛重視,這對(duì)考試評(píng)價(jià)領(lǐng)域來(lái)說(shuō)是一大進(jìn)步。項(xiàng)目反應(yīng)理論在測(cè)驗(yàn)等值、題庫(kù)建設(shè)、量表開(kāi)發(fā)等方面明顯優(yōu)于經(jīng)典測(cè)量理論,但項(xiàng)目反應(yīng)理論卻不能替代經(jīng)典測(cè)量理論,尤其在我國(guó)現(xiàn)階段,對(duì)于廣大一線(xiàn)教育工作者來(lái)說(shuō),項(xiàng)目反應(yīng)理論專(zhuān)業(yè)性較強(qiáng),需要一定的專(zhuān)業(yè)背景方能理解與使用,在短時(shí)間內(nèi)很難大范圍運(yùn)用于分析、診斷教學(xué)。

從廣泛理解與接受度來(lái)說(shuō),模型簡(jiǎn)單、淺顯易懂的經(jīng)典測(cè)量理論具有明顯優(yōu)勢(shì)。因此,選用更容易被普遍理解和接受的經(jīng)典測(cè)量理論與方法展開(kāi)相關(guān)研究。

(二)研究假設(shè)

基于考試數(shù)據(jù)進(jìn)行教學(xué)診斷的前提是各學(xué)科試題能夠考查出考生的真實(shí)水平,達(dá)到應(yīng)有的信度、效度、區(qū)分度等測(cè)量學(xué)指標(biāo)。為驗(yàn)證這一點(diǎn),北京市每年在高考各學(xué)科考后都會(huì)第一時(shí)間召開(kāi)各區(qū)教研員、教師代表參加的考后座談會(huì);進(jìn)行試卷質(zhì)量的無(wú)記名問(wèn)卷調(diào)查;出成績(jī)后進(jìn)行相應(yīng)測(cè)量學(xué)指標(biāo)的檢驗(yàn)。多年來(lái),無(wú)論是定性調(diào)研還是定量檢驗(yàn),都證明北京市各學(xué)科高考試題達(dá)到了包括信度、效度、區(qū)分度等在內(nèi)的相關(guān)測(cè)量學(xué)要求。

因此,提出以下三點(diǎn)假設(shè)作為研究的前提:(1)考生的各學(xué)科考試成績(jī)能夠反映考生各學(xué)科知識(shí)、能力的水平;(2)考生群體的各學(xué)科成績(jī)能夠反映相應(yīng)考生群體的學(xué)科知識(shí)、能力的水平;(3)不同考生群體的學(xué)科知識(shí)、能力水平可以反映一個(gè)區(qū)域的教育教學(xué)情況。

(三)評(píng)價(jià)依據(jù)

一直以來(lái),《普通高中課程標(biāo)準(zhǔn)》和《高考考試大綱》是課程教學(xué)和高考命題的依據(jù),也是考試評(píng)價(jià)的依據(jù)。2018年1月,教育部發(fā)布《普通高中課程方案和課程標(biāo)準(zhǔn)(2017年版)》,首次基于學(xué)科本質(zhì)凝練了各學(xué)科的核心素養(yǎng),研制了各學(xué)科的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),明確了學(xué)生完成各學(xué)科學(xué)習(xí)任務(wù)后,學(xué)科核心素養(yǎng)應(yīng)達(dá)到的水平,應(yīng)達(dá)成的正確價(jià)值觀(guān)念、必備品格和關(guān)鍵能力、關(guān)鍵表現(xiàn)。明確要求“校內(nèi)評(píng)價(jià)或考試、學(xué)業(yè)水平考試、普通高等學(xué)校招生全國(guó)統(tǒng)一考試均應(yīng)以本課程方案、課程標(biāo)準(zhǔn)和國(guó)家相關(guān)教學(xué)文件為依據(jù)”[6]。同時(shí),國(guó)務(wù)院辦公廳在《意見(jiàn)》中也明確提出:學(xué)業(yè)水平選擇性考試與高等學(xué)校招生全國(guó)統(tǒng)一考試命題要以普通高中課程標(biāo)準(zhǔn)和高校人才選拔要求為依據(jù),實(shí)施普通高中新課程的省份不再制定考試大綱[4]。因此,在高考綜合改革背景下,《普通高中課程方案和課程標(biāo)準(zhǔn)》既是課程教學(xué)的依據(jù),也是考試命題的依據(jù),更是考試評(píng)價(jià)的標(biāo)準(zhǔn)與尺度。在考試評(píng)價(jià)研究中,遵循《普通高中課程方案和課程標(biāo)準(zhǔn)》,是保證評(píng)價(jià)結(jié)果科學(xué)性的前提與基礎(chǔ)。

(四)在定量分析的基礎(chǔ)上進(jìn)行質(zhì)性研究

20世紀(jì)80年代,以庫(kù)巴(Egong Guba)和林肯(Y. S.Lincoln)等為代表創(chuàng)立了“第四代教育評(píng)價(jià)理論”。第四代評(píng)價(jià)理論在實(shí)證的基礎(chǔ)上,引進(jìn)了質(zhì)性研究方法,注意了評(píng)價(jià)過(guò)程中評(píng)價(jià)雙方的互動(dòng)作用及動(dòng)態(tài)分析。他們提倡在評(píng)價(jià)中充分聽(tīng)取不同方面的意見(jiàn),并把評(píng)價(jià)看作是一個(gè)由評(píng)價(jià)者不斷協(xié)調(diào)各種價(jià)值標(biāo)準(zhǔn)間的分歧、縮短不同意見(jiàn)間的距離、最后形成公認(rèn)的一致看法的過(guò)程。這是在將基于考試數(shù)據(jù)的考試評(píng)價(jià)應(yīng)用于診斷、指導(dǎo)教育教學(xué)中可以借鑒的。

為此,北京高考考試評(píng)價(jià)將定量分析與質(zhì)性研究相結(jié)合,在對(duì)考試數(shù)據(jù)量化研究的基礎(chǔ)上進(jìn)一步采用質(zhì)性評(píng)價(jià)方法。量化評(píng)價(jià)使用測(cè)量手段,用統(tǒng)計(jì)分析方法和數(shù)學(xué)量來(lái)評(píng)價(jià)教育現(xiàn)象;質(zhì)性評(píng)價(jià)通過(guò)觀(guān)察和實(shí)踐,用定性的分析辯證地認(rèn)識(shí)教育現(xiàn)象。質(zhì)性評(píng)價(jià)既是量化評(píng)價(jià)的基礎(chǔ),也使量化數(shù)據(jù)分析得以深入,對(duì)問(wèn)題間的交互影響和因果關(guān)系的分析具有獨(dú)到的優(yōu)勢(shì)。把統(tǒng)計(jì)數(shù)據(jù)和評(píng)價(jià)者的經(jīng)驗(yàn)、對(duì)教學(xué)現(xiàn)狀的把握結(jié)合在一起,在評(píng)價(jià)中與中學(xué)教師互動(dòng),就是力求將學(xué)生的學(xué)習(xí)過(guò)程和教學(xué)過(guò)程體現(xiàn)在評(píng)價(jià)中。

二、基于診斷教學(xué)的考試數(shù)據(jù)分析方法

(一)分層分類(lèi)分析法

我國(guó)幅員遼闊,各省市基礎(chǔ)教育發(fā)展存在較大差異,而對(duì)于一個(gè)省市來(lái)說(shuō),不同地區(qū)基礎(chǔ)教育發(fā)展也不均衡。這種差異、不均衡與當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)展、生源、師資、學(xué)校軟硬件、學(xué)生家庭背景等條件密切相關(guān)。如果忽視這些不同條件,只用一個(gè)標(biāo)準(zhǔn)來(lái)衡量不同區(qū)域、不同學(xué)校學(xué)生的學(xué)業(yè)水平是不科學(xué)的。因此,在利用考試數(shù)據(jù)分析、診斷教育教學(xué)時(shí),有必要對(duì)各地區(qū)、各學(xué)校進(jìn)行分層和分類(lèi),不同區(qū)域、不同類(lèi)別學(xué)校用更適合各自的尺度來(lái)衡量,這樣才能夠準(zhǔn)確診斷不同區(qū)域、不同學(xué)校的教育教學(xué)情況。

與全國(guó)多數(shù)省市相比,北京市總體基礎(chǔ)教育規(guī)模較小且相對(duì)均衡,即便如此,就北京市基礎(chǔ)教育內(nèi)部來(lái)說(shuō),仍然存在發(fā)展不均衡問(wèn)題。例如,城區(qū)與郊區(qū)基礎(chǔ)教育之間存在較大差異,加上初中升高中,使郊區(qū)優(yōu)質(zhì)生源向城區(qū)的流動(dòng)、優(yōu)秀教師從郊區(qū)向城區(qū)的流動(dòng),進(jìn)一步加大了城郊之間高中教育的差距。同樣,在一個(gè)區(qū)的不同學(xué)校之間,也存在相似情況。因此,必須進(jìn)行分層分類(lèi)分析。同時(shí),為了避免片面的唯高考成績(jī)論英雄評(píng)價(jià)各個(gè)學(xué)校,與各區(qū)約定:不進(jìn)行單個(gè)學(xué)??荚嚁?shù)據(jù)分析,請(qǐng)各區(qū)根據(jù)本區(qū)教育教學(xué)實(shí)際情況將高中學(xué)校分為三至四類(lèi)(同一類(lèi)別學(xué)校的基本情況大致相同或相近)。根據(jù)各區(qū)劃分的學(xué)校類(lèi)別,對(duì)各區(qū)高考數(shù)據(jù)進(jìn)行多層次分析,形成各區(qū)的高考數(shù)據(jù)分析報(bào)告。各區(qū)的數(shù)據(jù)報(bào)告包括北京市整體、城區(qū)、郊區(qū)、本區(qū)整體、本區(qū)各類(lèi)別學(xué)校5個(gè)層次。

(二)常模參照、相對(duì)比較法

高考的高利害性使得基于錨人、錨題等測(cè)驗(yàn)等值的測(cè)量技術(shù)難以實(shí)現(xiàn)。這就使得直接利用高考數(shù)據(jù)進(jìn)行教學(xué)診斷分析帶有局限性。為此,提出常模參照、相對(duì)比較法。

常模是一種供比較的標(biāo)準(zhǔn)量數(shù),由標(biāo)準(zhǔn)化樣本測(cè)試結(jié)果計(jì)算而來(lái),即某一標(biāo)準(zhǔn)化樣本的平均數(shù)和標(biāo)準(zhǔn)差,它是用于比較和解釋測(cè)驗(yàn)結(jié)果時(shí)的參照分?jǐn)?shù)標(biāo)準(zhǔn)??杉?xì)分為組間常模、組內(nèi)常模。

北京采取的是全樣本分析,首先將市整體、城區(qū)、郊區(qū)的全樣本作為三個(gè)組間常模群體。為了便于各區(qū)優(yōu)勢(shì)類(lèi)別學(xué)校找到合適的參照目標(biāo),另從原來(lái)的市級(jí)示范校與區(qū)級(jí)示范校中分別抽取10所學(xué)校,形成示范校一、示范校二作為示范校抽樣的組間常模。

為了更精準(zhǔn)地分析一個(gè)群體內(nèi)不同層次考生的特點(diǎn)及其相應(yīng)的教育教學(xué)情況,進(jìn)一步按照各考生群體的學(xué)科總分從低到高平均分成10個(gè)學(xué)科能力水平組,形成該考生群體的10個(gè)組內(nèi)常模群體G1—G10。

這樣,提供給各區(qū)用于診斷教學(xué)的高考數(shù)據(jù),除了該區(qū)考試數(shù)據(jù),還有北京市整體、城區(qū)、郊區(qū)、示范校一、示范校二5個(gè)組間常模數(shù)據(jù),各區(qū)數(shù)據(jù)與各組間常模數(shù)據(jù)又都包括10個(gè)組內(nèi)常模數(shù)據(jù),供各區(qū)對(duì)區(qū)整體以及各類(lèi)學(xué)校、各能力水平組學(xué)生進(jìn)行學(xué)習(xí)情況的對(duì)比研究和分析。

三、多維度挖掘,讓考試數(shù)據(jù)發(fā)揮獨(dú)有價(jià)值

考試數(shù)據(jù)中蘊(yùn)藏著豐富的教育教學(xué)信息,只有結(jié)合學(xué)科特點(diǎn),依據(jù)學(xué)科課程標(biāo)準(zhǔn),進(jìn)行多維度深入分析,才能發(fā)現(xiàn)考試數(shù)據(jù)獨(dú)有的價(jià)值。

(一)維度劃分

北京在高考評(píng)價(jià)中,對(duì)每一類(lèi)別的考生群體數(shù)據(jù)進(jìn)行了分學(xué)科、多維度的挖掘分析。以某年度高考語(yǔ)文學(xué)科為例,分析維度包括:總分分析、題型分析、各內(nèi)容組塊分析、各能力組塊分析、各專(zhuān)題分析以及各大題、各小題、各選項(xiàng)分析,等等。其中內(nèi)容組塊包括:多文本閱讀、文言文閱讀、古代詩(shī)歌閱讀、文學(xué)作品閱讀、微寫(xiě)作與大作文;能力組塊包括:識(shí)記、理解、運(yùn)用、分析綜合、鑒賞評(píng)價(jià)與綜合表達(dá);專(zhuān)題分析包括:文言文文本內(nèi)容的理解、文言文文本內(nèi)容的歸納概括、古典詩(shī)歌內(nèi)容的理解和作者情感的體察、古詩(shī)文名句名篇的識(shí)記理解和運(yùn)用、現(xiàn)代文中信息的篩選整合、現(xiàn)代文作者思想感情觀(guān)點(diǎn)態(tài)度的理解分析等。

(二)客觀(guān)、科學(xué)解讀,賦予考試數(shù)據(jù)實(shí)踐價(jià)值

經(jīng)過(guò)對(duì)各學(xué)科的每一個(gè)能夠?qū)虒W(xué)診斷作為證據(jù)的維度進(jìn)行統(tǒng)計(jì)分析,完成各學(xué)科的考試數(shù)據(jù)分析報(bào)告,只是完成了對(duì)各學(xué)科考試數(shù)據(jù)的定量研究,更加重要的是對(duì)這些數(shù)據(jù)報(bào)告進(jìn)行客觀(guān)、科學(xué)的解讀,對(duì)考試數(shù)據(jù)進(jìn)行質(zhì)性分析,賦予考試數(shù)據(jù)實(shí)踐價(jià)值。這時(shí),需要各學(xué)科的評(píng)價(jià)專(zhuān)家在聽(tīng)取各區(qū)教師、教研員對(duì)各學(xué)科試卷的意見(jiàn)以及一線(xiàn)教師與考生反饋的基礎(chǔ)上,對(duì)照《普通高中課程方案和課程標(biāo)準(zhǔn)》,運(yùn)用自己的教學(xué)經(jīng)驗(yàn)和對(duì)教學(xué)現(xiàn)狀的客觀(guān)把握,分析數(shù)據(jù)統(tǒng)計(jì)結(jié)果、考生的學(xué)科知識(shí)掌握情況、學(xué)科能力發(fā)展水平以及學(xué)科素養(yǎng)形成情況,研究所映射出的學(xué)科教育教學(xué)情況,探究影響教學(xué)的各種因素,進(jìn)行歸因分析,提出教學(xué)改進(jìn)建議。

(三)案例分析

從《某年度北京市高考語(yǔ)文學(xué)科考生水平評(píng)價(jià)及教學(xué)建議》中選取一個(gè)案例,介紹高考評(píng)價(jià)在教學(xué)診斷中的具體應(yīng)用方法。

評(píng)價(jià)研究組將當(dāng)年語(yǔ)文學(xué)科試卷按照考查內(nèi)容分為多文本閱讀、文言文閱讀、古代詩(shī)歌閱讀、文學(xué)作品閱讀、微寫(xiě)作、大作文6個(gè)組塊。全市考生在各組塊的整體表現(xiàn)如表1所示:

從表1可以看出,各內(nèi)容組塊考生得分率由高到低依次為多文本閱讀、作文、微寫(xiě)作、文學(xué)作品閱讀、古代詩(shī)歌閱讀、文言文閱讀,考生得分率最低的是古詩(shī)文閱讀。結(jié)合標(biāo)準(zhǔn)差和差異系數(shù)看,考生成績(jī)?cè)诠糯?shī)歌閱讀和文言文閱讀兩個(gè)組塊離散程度最大。為了解不同能力水平學(xué)生的特點(diǎn),將考生按照語(yǔ)文學(xué)科總分從低到高平均分為10組(G1-G10),根據(jù)各組考生在各知識(shí)組塊的得分率做出該年度高考語(yǔ)文各內(nèi)容組塊分組得分率曲線(xiàn)圖。

從圖1可以明顯看出,各內(nèi)容組塊高分組與低分組水平差距由大到小依次為古代詩(shī)歌閱讀、文言文閱讀、文學(xué)作品閱讀、多文本閱讀、作文、微寫(xiě)作。可以說(shuō),古詩(shī)文閱讀是拉開(kāi)考生差距的關(guān)鍵組塊。對(duì)于古代詩(shī)歌閱讀,全市前20%的優(yōu)秀學(xué)生得分率能夠達(dá)到0.7以上,而后20%的學(xué)生得分率低于0.4。對(duì)于文言文閱讀,無(wú)論哪個(gè)層次的考生,表現(xiàn)都不令人滿(mǎn)意,全市前10%的優(yōu)秀學(xué)生得分率也未能達(dá)到0.8,全市中等生(G3-G7)得分率在0.5左右,而后20%的學(xué)生得分率僅在0.3左右。這固然有命題難度的原因,但也暴露出學(xué)生在古詩(shī)文閱讀方面的薄弱之處[7]。

進(jìn)一步從當(dāng)年古詩(shī)文閱讀組塊中選取第12題進(jìn)行分析。

第12題考查了傳統(tǒng)文化經(jīng)典《論語(yǔ)》的閱讀。其中,第12_1題需要考生在理解文意的基礎(chǔ)上把握孔子的思想,第12_2題則要求考生能夠準(zhǔn)確解說(shuō)不同學(xué)者對(duì)同一句子的解讀,既考查獨(dú)立閱讀文言文的能力,又考查對(duì)孔子思想的把握。

結(jié)合表2相關(guān)數(shù)據(jù)及圖2可知,第12題得分率為0.41,考生整體表現(xiàn)不理想。G10組考生優(yōu)勢(shì)較明顯,平均得分率為0.72,G1-G3組得分率均在0.30之下,其中G1組得分率只有0.14。

評(píng)價(jià)專(zhuān)家認(rèn)為,客觀(guān)地說(shuō),在本屆學(xué)生的教學(xué)過(guò)程中,廣大一線(xiàn)教師對(duì)《論語(yǔ)》的閱讀非常重視,在內(nèi)容整合、專(zhuān)題教學(xué)、策略?xún)?yōu)化等方面付出了許多努力,但從第12題考生的表現(xiàn)看,成效還有待提升。文化經(jīng)典論著教學(xué)面臨著諸多挑戰(zhàn):閱讀時(shí)有較大的文字障礙,基礎(chǔ)薄弱的學(xué)生讀懂尤其困難;內(nèi)涵豐厚,博大精深,對(duì)學(xué)生的認(rèn)識(shí)水平、思維能力要求較高。但是,無(wú)論是弘揚(yáng)中華民族優(yōu)秀的傳統(tǒng)文化,還是為各學(xué)科閱讀古代文獻(xiàn)提供助力,都需要切實(shí)提高學(xué)生的古文閱讀能力。因此,建議教學(xué)中進(jìn)一步加大古文閱讀量的積累,且注重“面”(不同文體)的拓展,在此基礎(chǔ)之上,將古文當(dāng)作現(xiàn)代文來(lái)教,培養(yǎng)閱讀理解能力,尤其是讀懂文意的能力[7]。

四、基于考試數(shù)據(jù)進(jìn)行區(qū)域教學(xué)診斷

(一)參照常模群體的選擇確定

測(cè)驗(yàn)分?jǐn)?shù)必須與某種標(biāo)準(zhǔn)比較,才能顯示出它所代表的意義。選擇參照常模群體就是為所研究的考生群體尋找一個(gè)參照標(biāo)準(zhǔn)。如果參照標(biāo)準(zhǔn)過(guò)高,將會(huì)直接影響研究對(duì)象改進(jìn)的積極性與自信心,認(rèn)為自己無(wú)論怎樣努力也趕不上目標(biāo);而參照標(biāo)準(zhǔn)過(guò)低又會(huì)使研究對(duì)象認(rèn)為自己已經(jīng)達(dá)標(biāo)而缺少繼續(xù)改進(jìn)的動(dòng)力。因此,選擇參照常模群體的原則是“跳一跳,夠得著”,選擇略高于研究對(duì)象水平的常模群體作為參照標(biāo)準(zhǔn)。

當(dāng)利用高考考試數(shù)據(jù)進(jìn)行某研究區(qū)域各學(xué)科教學(xué)情況分析時(shí),可以通過(guò)對(duì)各群體總分的分析,找到略高于該區(qū)域總分得分率、分?jǐn)?shù)分布相近的組內(nèi)常模群體作為參照常模群體。為便于進(jìn)行連續(xù)追蹤研究,參照常模群體選定后應(yīng)穩(wěn)定一個(gè)時(shí)期。進(jìn)入新一輪高考綜合改革后,高中學(xué)業(yè)水平選擇性考試(即等級(jí)考)等級(jí)轉(zhuǎn)換分的加入使得高考總分的教學(xué)診斷意義降低。但是,由于各組間常模群體的整體水平是相對(duì)穩(wěn)定的,故仍可使用改革前的高考總分來(lái)確定參照常模群體,這樣,也有利于進(jìn)行改革前后的對(duì)比研究。

因高考數(shù)據(jù)的敏感性,不便選用近兩年的數(shù)據(jù)。因此,下面以改革前某區(qū)某年理科數(shù)據(jù)為例,演示如何選擇確定參照常模群體。

從表3可以看出:該區(qū)理科考生整體水平介于城區(qū)與全市平均水平之間,其中,一類(lèi)校學(xué)生最為均衡,水平略低于示范校二,離散程度接近;二類(lèi)校水平與北京市整體接近,但學(xué)生差異明顯小于全市整體;三類(lèi)校是該區(qū)教學(xué)的薄弱點(diǎn),考生間差異最大,不僅與一、二類(lèi)校有較大差距,而且水平遠(yuǎn)低于郊區(qū)平均水平。因此,選定城區(qū)作為該區(qū)整體的參照常模群體,選擇示范校二作為該區(qū)一類(lèi)校的參照常模群體,選擇市整體作為該區(qū)二類(lèi)校的參照常模群體,選擇郊區(qū)作為該區(qū)三類(lèi)校的參照常模群體,進(jìn)行各學(xué)科橫向與縱向的對(duì)比分析,以找到各類(lèi)學(xué)校教育教學(xué)中的優(yōu)勢(shì)與不足。

(二)各學(xué)科考試數(shù)據(jù)的具體分析方法

1.確定差異基準(zhǔn)

基準(zhǔn)是在測(cè)量工作中用作起始尺度的標(biāo)準(zhǔn)。差異基準(zhǔn)是指研究對(duì)象與參照常模群體高考成績(jī)的整體差異,用R表示。

如上所述,在進(jìn)行某區(qū)域?qū)W科分析之前,首先要確定該區(qū)域各群體的組間參照常模群體。確定組間參照常模之后,計(jì)算研究對(duì)象的總分得分率與參照常模的差異,該差異即可作為研究對(duì)象與參照目標(biāo)的差異基準(zhǔn)R。

2.學(xué)科教學(xué)分析:計(jì)算學(xué)科差異,診斷優(yōu)勢(shì)與不足

有了差異基準(zhǔn)R,再逐一計(jì)算該區(qū)域各學(xué)科的得分率與參照常模群體得分率的學(xué)科差異D;用學(xué)科差異D減去差異基準(zhǔn)R,即可得到學(xué)科水平L;當(dāng)L大于0時(shí),說(shuō)明相對(duì)參照常模,該學(xué)科為優(yōu)勢(shì)學(xué)科,當(dāng)L小于0時(shí),說(shuō)明相對(duì)參照常模,該學(xué)科為劣勢(shì)學(xué)科。

為避免一次考試的局限性,無(wú)論是在尋找參照常模群體時(shí),還是在分析優(yōu)勢(shì)、劣勢(shì)學(xué)科時(shí),應(yīng)采用同樣的方法對(duì)比連續(xù)1-3年的歷史數(shù)據(jù)。

下面仍以改革前的一組數(shù)據(jù)為例說(shuō)明具體分析方法。假設(shè)某區(qū)某年理科考生各學(xué)科得分率如表4所示:

從表4可知,在各學(xué)科中,得分率最高的是數(shù)學(xué)(理)0.74,得分率最低的是語(yǔ)文0.67,如果按照以往不考慮各學(xué)科試題難度、直接用各學(xué)科平均成績(jī)來(lái)衡量各學(xué)科的教學(xué)情況,無(wú)疑是數(shù)學(xué)成績(jī)最好,語(yǔ)文成績(jī)最低。

事實(shí)果然如此嗎?假設(shè)通過(guò)總分分析,已經(jīng)確定城區(qū)作為該區(qū)的參照常模群體。利用前面介紹的計(jì)算方法得出差異基準(zhǔn)R,以及各學(xué)科的學(xué)科差異D和學(xué)科水平L,匯總形成表5:

由表5可知,對(duì)比該區(qū)與參照常模群體城區(qū),他們之間的差異基準(zhǔn)R=-0.01。該區(qū)理科考生的語(yǔ)文、英語(yǔ)兩科得分率與城區(qū)持平,其他學(xué)科都比城區(qū)平均水平低0.01。用學(xué)科差異D減去差異基準(zhǔn)R,得到各學(xué)科水平L,語(yǔ)文、英語(yǔ)學(xué)科的學(xué)科水平L為0.01,其他學(xué)科為0,說(shuō)明該區(qū)語(yǔ)文、英語(yǔ)為優(yōu)勢(shì)學(xué)科。用同樣的方法追溯往年數(shù)據(jù),發(fā)現(xiàn)該區(qū)理科學(xué)生的語(yǔ)文、英語(yǔ)的學(xué)科水平L一直大于0,兩科成績(jī)與參照常模城區(qū)的差距一直小于理綜、數(shù)學(xué)與城區(qū)的差距。因此判斷,該區(qū)理科的優(yōu)勢(shì)學(xué)科是語(yǔ)文與英語(yǔ),弱勢(shì)學(xué)科是理綜與數(shù)學(xué)。如果想改進(jìn)提升教學(xué),達(dá)到城區(qū)平均水平,應(yīng)在數(shù)學(xué)與理綜各科上多下功夫。

3.學(xué)科內(nèi)部知識(shí)、能力、素養(yǎng)教學(xué)分析:確定學(xué)科差異基準(zhǔn)r,計(jì)算組塊差異d,診斷教學(xué)不足

要診斷、改進(jìn)教學(xué),只分析到學(xué)科層面是不夠的,還需要深入到學(xué)科內(nèi)部進(jìn)行考生學(xué)科知識(shí)掌握情況、學(xué)科能力發(fā)展情況以及學(xué)科素養(yǎng)形成情況的分析。前面的分析方法同樣可以適用到學(xué)科內(nèi)部的各組塊、各個(gè)題目。

當(dāng)進(jìn)行學(xué)科內(nèi)部知識(shí)、能力、素養(yǎng)分析時(shí),將某區(qū)域某學(xué)科得分率與參照常模得分率的學(xué)科差異D作為學(xué)科差異基準(zhǔn)r,然后計(jì)算該學(xué)科各知識(shí)、能力、素養(yǎng)組塊的得分率與參照常模相應(yīng)組塊得分率的差異d;用學(xué)科組塊差異d減去學(xué)科差異基準(zhǔn)r,得到學(xué)科各知識(shí)(能力、素養(yǎng))水平l;當(dāng)l大于0時(shí),說(shuō)明在該學(xué)科中,本區(qū)域考生的某知識(shí)掌握情況(或能力發(fā)展水平、素養(yǎng)形成情況)較好;當(dāng)l小于0時(shí),說(shuō)明在該學(xué)科中,本區(qū)域考生的某知識(shí)掌握情況(或能力發(fā)展水平、素養(yǎng)形成情況)較弱。

通過(guò)對(duì)學(xué)科內(nèi)部知識(shí)、能力、素養(yǎng)的分析,就可以更加精準(zhǔn)地找到學(xué)科教學(xué)中存在的問(wèn)題與不足,再結(jié)合區(qū)域、學(xué)校的教育教學(xué)實(shí)際,進(jìn)行具體的歸因分析,就可以對(duì)癥下藥,找到解決問(wèn)題、彌補(bǔ)不足的方法,從而提升學(xué)科教學(xué)水平。

這種選擇確定參照常模群體進(jìn)行相對(duì)比較的解讀考試數(shù)據(jù)方法,在一定程度上彌補(bǔ)了因缺少測(cè)驗(yàn)等值給考試數(shù)據(jù)分析帶來(lái)的局限與誤差。

五、適應(yīng)綜合改革需要,強(qiáng)化考試評(píng)價(jià)研究

隨著高考綜合改革逐步向縱深推進(jìn),教、考、招構(gòu)成嚴(yán)謹(jǐn)?shù)膹?qiáng)耦合系統(tǒng),任何一個(gè)環(huán)節(jié)的改革都必須放在這個(gè)全鏈條中進(jìn)行考慮,以增強(qiáng)改革推進(jìn)的系統(tǒng)性[8]。其中,高考內(nèi)容改革是各項(xiàng)改革的一個(gè)重要樞紐。由于高考的高利害性和保密性,能得到并使用高考原始數(shù)據(jù)的研究人員極其有限。因此,專(zhuān)業(yè)化教育考試機(jī)構(gòu)不僅需要研究構(gòu)建引導(dǎo)學(xué)生德智體美勞全面發(fā)展的考試內(nèi)容體系,而且需要加強(qiáng)考試數(shù)據(jù)的分析,以服務(wù)教學(xué)為目的,強(qiáng)化考試評(píng)價(jià)研究。

基于高考數(shù)據(jù)進(jìn)行教學(xué)診斷的考試評(píng)價(jià)研究,會(huì)不會(huì)更加強(qiáng)化高考分?jǐn)?shù)的作用,強(qiáng)化唯分?jǐn)?shù)、唯升學(xué)?筆者認(rèn)為恰恰相反。原因有三:

(一)考試評(píng)價(jià)研究有利于克服唯總分、唯升學(xué)的簡(jiǎn)單排隊(duì)

破除唯分?jǐn)?shù)、唯升學(xué),并非不要分?jǐn)?shù)、不要升學(xué),而是要改變只重視高考總分、只看高考錄取率的痼疾。基于高考數(shù)據(jù)進(jìn)行學(xué)科教學(xué)診斷,能夠引導(dǎo)學(xué)校、教師更加關(guān)注教學(xué)過(guò)程,在一定程度上淡化高考總分、學(xué)科總分、錄取率的影響,克服唯總分、唯升學(xué)的簡(jiǎn)單排隊(duì),減輕唯分?jǐn)?shù)、唯升學(xué)對(duì)教師的壓力。

(二)考試評(píng)價(jià)研究有利于引導(dǎo)“從育分走向育人”

基于高考數(shù)據(jù),通過(guò)分層分類(lèi)、常模參照、相對(duì)比較法進(jìn)行教學(xué)診斷,能夠讓高考數(shù)據(jù)發(fā)揮獨(dú)有的價(jià)值,發(fā)現(xiàn)不同區(qū)域、不同考生群體的學(xué)科優(yōu)勢(shì)與不足,引導(dǎo)區(qū)縣、學(xué)校更加重視對(duì)學(xué)科教學(xué)效果的分析,引導(dǎo)教師更加關(guān)注學(xué)生的學(xué)科知識(shí)掌握情況、能力發(fā)展情況、素養(yǎng)形成情況,引導(dǎo)基礎(chǔ)教育“從育分走向育人”。

(三)考試評(píng)價(jià)研究可以為教育督導(dǎo)、教育管理以及教育教學(xué)決策提供科學(xué)依據(jù)

作為國(guó)家教育考試,高考、學(xué)業(yè)水平考試具有很高的權(quán)威性、科學(xué)性,各學(xué)科考生水平評(píng)價(jià)及教學(xué)質(zhì)量分析報(bào)告的反饋,讓教育督導(dǎo)部門(mén)、管理部門(mén)、教研部門(mén)能夠及時(shí)了解學(xué)生學(xué)科知識(shí)掌握、學(xué)科能力發(fā)展、學(xué)科素養(yǎng)形成情況,為教育督導(dǎo)、教育管理和教學(xué)決策提供科學(xué)依據(jù)。

大規(guī)模教育考試形成、積累了海量的考試數(shù)據(jù),其中蘊(yùn)藏著許多非常珍貴的教育教學(xué)信息。為了適應(yīng)改革需要,更好地挖掘利用考試數(shù)據(jù)反饋、診斷、指導(dǎo)教育教學(xué),建議專(zhuān)家、學(xué)者加強(qiáng)以下方面研究:一是運(yùn)用項(xiàng)目反應(yīng)理論、認(rèn)知診斷理論等進(jìn)一步加強(qiáng)對(duì)考試數(shù)據(jù)挖掘、分析方法的研究,開(kāi)展對(duì)考生個(gè)體的評(píng)價(jià);二是進(jìn)行基于無(wú)錨題、無(wú)錨人條件下的“無(wú)錨”等值技術(shù)、方法的研究,以實(shí)現(xiàn)對(duì)考試數(shù)據(jù)的縱向?qū)Ρ确治?;三是將高考、學(xué)業(yè)水平考試等結(jié)果性考試數(shù)據(jù)與學(xué)校過(guò)程性考試數(shù)據(jù)相結(jié)合,進(jìn)行教學(xué)的綜合分析診斷。

考試評(píng)價(jià)研究的目的是改進(jìn),發(fā)現(xiàn)每個(gè)區(qū)域、每個(gè)群體、每個(gè)考生的優(yōu)勢(shì)與不足,讓每個(gè)區(qū)域、每個(gè)群體、每個(gè)考生都能取得進(jìn)步。只有這樣,考試才能與教學(xué)形成良性互動(dòng),助力素質(zhì)教育發(fā)展,助力學(xué)生全面而有個(gè)性的成長(zhǎng)。

參考文獻(xiàn):

[1]中共中央國(guó)務(wù)院.深化新時(shí)代教育評(píng)價(jià)改革總體方案[EB/ OL].(2020-10-13)[2021-02-10].http://www.moe.gov.cn/jyb_xxgk/moe_ 1777/moe_1778/202010/t20201013_494381.html.

[2]教育部考試中心.中國(guó)高考評(píng)價(jià)體系[M].北京:人民教育出版社,2019:12.

[3]朱文琪.近十年來(lái)普通高考考試數(shù)據(jù)研究的現(xiàn)狀與思考——基于中國(guó)知網(wǎng)2010-2019年的文獻(xiàn)計(jì)量分析[J].教育理論與實(shí)踐,2021,41(7):17-24.

[4]國(guó)務(wù)院辦公廳.關(guān)于新時(shí)代推進(jìn)普通高中育人方式改革的指導(dǎo)意見(jiàn)[EB/OL].(2019-06-19)[2021-2-10].http://www.gov.cn/zhengce/ content/2019-06/19/content_5401568.htm.

[5]張敏強(qiáng),梁正妍.新高考改革背景下的教育考試數(shù)據(jù)評(píng)價(jià)[J].中國(guó)考試,2020,(1):22-25.

[6]教育部.普通高中課程方案(2017年版)[M].北京:人民教育出版社,2018:3.

[7]北京教育考試院.北京市高考考生水平評(píng)價(jià)報(bào)告[M].北京:開(kāi)明出版社,2019:12.

[8]孫海波.把握新時(shí)代改革方法論,以系統(tǒng)觀(guān)念全面協(xié)調(diào)推進(jìn)高考改革[J].中國(guó)考試,2021,(7):1-6.

Research on the Application of Examination Evaluation in Teaching Diagnosis

Ding Xiutao

Beijing Education Examinations Authority,Beijing,100083

Abstract:The new round of college entrance examination reform pays special attention to the guidance of elementary education and teaching.The important way to realize it is to strengthen the research of examination evaluation through the analysis of examination data,excavating the education and teaching information contained in the data,and guiding education and teaching. In practice,the classical measurement theory has obvious advantages in group teaching diagnosis.Based on the norm,this paper analyzes the knowledge,ability,literacy and other multi-dimensional structure of the college entrance examination data.Through the hierarchical classification analysis method,this paper deeply excavates the test data,and uses the test data for regional teaching diagnosis,which can find the subject advantages of different regions and different candidate groups.It can guide teachers to pay more attention to studentsmastery of subject knowledge,ability development and quality formation.This evaluation help to breaking the disadvantages of score only and entering a higher school only,and promoting the formation of benign interaction between examination and teaching.In the future,the research can be strengthened in three aspects. Firstly,the research could further strengthen the research on the test data mining analysis methods and carry out the evaluation of individuals. Secondly,the research could study the technology and method of“anchor-free”equivalence,so as to realize the vertical comparative analysis of test data.Thirdly,the research could combine the result test data of collage entrance examination and academic level test with the school process test data to carry out comprehensive analysis and diagnosis of teaching.

Key words:College Entrance Examination,Examination Data Analysis,Examination Evaluation,Teaching Diagnosis

(責(zé)任編輯:吳茳)

猜你喜歡
教學(xué)診斷高考
農(nóng)村小學(xué)綜合實(shí)踐教學(xué)診斷與改進(jìn)路徑
以?xún)?yōu)質(zhì)教學(xué)資源推進(jìn)“一課堂”教學(xué)質(zhì)量的思考與對(duì)策
中職教學(xué)診斷與改進(jìn)機(jī)制的校本實(shí)踐研究
考試周刊(2016年99期)2016-12-26 16:07:11
現(xiàn)代學(xué)徒制試點(diǎn)項(xiàng)目教學(xué)診斷與改進(jìn)的研究與實(shí)踐
高考物理新動(dòng)向——逆向分析
透過(guò)高考把握《生活中的圓周運(yùn)動(dòng)》 教學(xué)
考試周刊(2016年76期)2016-10-09 08:16:59
讓“教學(xué)診斷”成為教師成長(zhǎng)的契機(jī)
中學(xué)生歷史學(xué)科能力表現(xiàn)及測(cè)評(píng)初探
算錯(cuò)分,英“高考”推遲放榜
肥西县| 广汉市| 襄垣县| 南康市| 疏勒县| 社旗县| 营口市| 钟山县| 锡林郭勒盟| 司法| 常州市| 梧州市| 静宁县| 巩义市| 河南省| 广饶县| 沐川县| 于田县| 澎湖县| 社会| 青海省| 波密县| 蒙山县| 资溪县| 绥芬河市| 株洲县| 扬中市| 武清区| 新乡市| 新营市| 紫金县| 巴林左旗| 桃源县| 彩票| 远安县| 吉木乃县| 阳泉市| 池州市| 灌阳县| 清远市| 汝州市|