国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

學(xué)業(yè)質(zhì)量評(píng)價(jià)的技術(shù)突破

2021-12-29 00:00:00何永紅

摘要:面對(duì)新時(shí)代教育評(píng)價(jià)改革的要求,文章分析了學(xué)業(yè)質(zhì)量評(píng)價(jià)的歷史、現(xiàn)狀和發(fā)展趨勢(shì),明晰了當(dāng)前學(xué)業(yè)質(zhì)量評(píng)價(jià)發(fā)展面臨的技術(shù)問(wèn)題和需求。根據(jù)上海市MH區(qū)學(xué)業(yè)質(zhì)量評(píng)價(jià)在證據(jù)采集、分析挖掘等方面的具體實(shí)踐,文章提出了學(xué)業(yè)質(zhì)量評(píng)價(jià)的技術(shù)突破點(diǎn)。研究認(rèn)為,學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)的常態(tài)實(shí)施,需要實(shí)現(xiàn)證據(jù)采集的智能化和數(shù)據(jù)挖掘的專(zhuān)業(yè)化;學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)的優(yōu)化改進(jìn),需要利用組合測(cè)試技術(shù)讓評(píng)價(jià)走出“唯分?jǐn)?shù)”,并利用分析反饋技術(shù)讓評(píng)價(jià)更具價(jià)值。

關(guān)鍵詞:學(xué)業(yè)質(zhì)量評(píng)價(jià);測(cè)評(píng)理論;數(shù)據(jù)挖掘;區(qū)域;智能化

《中國(guó)教育現(xiàn)代化2035》提出,要“建立健全中小學(xué)各學(xué)科學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和體質(zhì)健康標(biāo)準(zhǔn)……構(gòu)建教育質(zhì)量評(píng)估監(jiān)測(cè)機(jī)制,建立更加科學(xué)公正的考試評(píng)價(jià)制度,建立全過(guò)程、全方位人才培養(yǎng)質(zhì)量反饋監(jiān)控體系”。中共中央、國(guó)務(wù)院《深化新時(shí)代教育評(píng)價(jià)改革總體方案》要求“改進(jìn)結(jié)果評(píng)價(jià),強(qiáng)化過(guò)程評(píng)價(jià),探索增值評(píng)價(jià),健全綜合評(píng)價(jià),充分利用信息技術(shù),提高教育評(píng)價(jià)的科學(xué)性、專(zhuān)業(yè)性、客觀性”。學(xué)業(yè)質(zhì)量評(píng)價(jià)是教育質(zhì)量體系的重要組成部分,與學(xué)生日常學(xué)習(xí)生活最為緊密相關(guān)。隨著互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)的廣泛應(yīng)用,學(xué)業(yè)質(zhì)量評(píng)價(jià)要發(fā)展,應(yīng)充分重視并靈活運(yùn)用現(xiàn)代信息技術(shù)、數(shù)理統(tǒng)計(jì)技術(shù)等。為此,本文從學(xué)業(yè)質(zhì)量評(píng)價(jià)的基礎(chǔ)理論出發(fā),從技術(shù)應(yīng)用的角度,探析當(dāng)前學(xué)業(yè)質(zhì)量評(píng)價(jià)的堅(jiān)守與突破。

一、回顧:學(xué)業(yè)質(zhì)量評(píng)價(jià)的理論發(fā)展

(一)CTT與IRT在學(xué)業(yè)質(zhì)量評(píng)價(jià)中的應(yīng)用概況

經(jīng)典測(cè)量理論(簡(jiǎn)稱CTT)奠定了傳統(tǒng)中小學(xué)學(xué)業(yè)質(zhì)量評(píng)價(jià)的基礎(chǔ)。CTT提出的“真分?jǐn)?shù)、誤差分?jǐn)?shù)、信度、效度、難度、區(qū)分度、常?!钡仁菍W(xué)業(yè)質(zhì)量評(píng)價(jià)的主要參數(shù)。這也蘊(yùn)含著學(xué)業(yè)質(zhì)量評(píng)價(jià)的傳統(tǒng)技術(shù)要求。當(dāng)前,在日常學(xué)業(yè)質(zhì)量評(píng)價(jià)實(shí)踐中尤其在紙筆式學(xué)業(yè)質(zhì)量評(píng)價(jià)中,CTT依然得到廣泛應(yīng)用。在遇到一般問(wèn)題不需要精確求解的情況下,運(yùn)用CTT進(jìn)行項(xiàng)目分析是恰當(dāng)?shù)模驗(yàn)楸容^簡(jiǎn)單、易于掌握,而且作為一種傳統(tǒng)方法,它已經(jīng)發(fā)展得較為充分了[1]。CTT從流程、技術(shù)、模型等方面保障了紙筆測(cè)試式學(xué)業(yè)質(zhì)量評(píng)價(jià)的基本質(zhì)量。

但是,CTT也有不足。如有學(xué)者認(rèn)為,它會(huì)在試題特征和考生特征之間建立起一種不可分離的相互依賴關(guān)系,而二者都建立在具體的測(cè)試題目和考生樣本的基礎(chǔ)上[2],即CTT需要在個(gè)性化評(píng)價(jià)、試題影響等方面具有更高的適應(yīng)性或發(fā)展性。項(xiàng)目反應(yīng)理論(簡(jiǎn)稱IRT)就是在針對(duì)并克服傳統(tǒng)測(cè)量理論不足過(guò)程中逐步發(fā)展起來(lái)的現(xiàn)代測(cè)量理論。IRT主要用于建立各種與數(shù)據(jù)擬合的模型,以此確定被試的潛在特質(zhì)值和他們對(duì)項(xiàng)目的反應(yīng)之間的關(guān)系[3]。所以,項(xiàng)目反應(yīng)理論也常被稱為潛在特質(zhì)理論或潛在特質(zhì)模型。目前,最常用的三種IRT模型分別是:?jiǎn)螀?shù)Logistic模型(簡(jiǎn)稱“1PL”或者“Rasch模型”)、雙參數(shù)Logistic模型(簡(jiǎn)稱“2PL”)、三參數(shù)Logistic模型(簡(jiǎn)稱“3PbAOkPlzU2Jiuw0vrSXLMGe9LfprdY0njT/Gh9sjdpDE=L”)[4]。當(dāng)前,國(guó)際許多大規(guī)模測(cè)試都借鑒使用了IRT理論,如PISA測(cè)試就是使用Rasch模型進(jìn)行題目的建構(gòu)校準(zhǔn)和學(xué)生能力在同一量表上的估計(jì)[5]。但是,因IRT深?yuàn)W復(fù)雜、操作困難等原因,其在中國(guó)實(shí)踐領(lǐng)域未見(jiàn)流行。

(二)從測(cè)評(píng)理論發(fā)展看學(xué)業(yè)質(zhì)量評(píng)價(jià)的變革

今后,我國(guó)測(cè)評(píng)理論發(fā)展的新趨向?qū)⑹且訧RT為主體、與其他理論并存的一種局面,建立在IRT基礎(chǔ)上的計(jì)算機(jī)適性測(cè)驗(yàn)則成為未來(lái)發(fā)展的新趨勢(shì)[6]。從整體來(lái)看,當(dāng)前學(xué)業(yè)質(zhì)量評(píng)價(jià)處于CTT和IRT共同使用的階段。在學(xué)業(yè)質(zhì)量評(píng)價(jià)過(guò)程中,許多地區(qū)會(huì)根據(jù)教育發(fā)展目標(biāo)和要求,從科學(xué)性、實(shí)踐性、有效性等角度,綜合測(cè)量理論、評(píng)價(jià)理論、教學(xué)理論等,形成適合實(shí)際的區(qū)域教育評(píng)價(jià)體系或模型,如BEAR評(píng)估系統(tǒng)[7]、SBAC 學(xué)業(yè)評(píng)價(jià)體系[8]、SOLO評(píng)價(jià)法、綠色指標(biāo)評(píng)價(jià)體系[9]等。這些模型,一方面對(duì)評(píng)價(jià)體系進(jìn)行了修正和完善,如評(píng)價(jià)指標(biāo)更科學(xué)、完整,測(cè)評(píng)手段更豐富、多元等;另一方面對(duì)統(tǒng)計(jì)技術(shù)和分析方法提出了更高的要求,如要求基于CTT、IRT,并整合運(yùn)用各類(lèi)數(shù)據(jù)分析和挖掘技術(shù)。

測(cè)評(píng)理論的發(fā)展、評(píng)價(jià)模型的建構(gòu),都預(yù)示著學(xué)業(yè)質(zhì)量評(píng)價(jià)正從傳統(tǒng)走向現(xiàn)代,從經(jīng)驗(yàn)走向科學(xué),從單一走向多元。學(xué)業(yè)質(zhì)量評(píng)價(jià)要在繼承和發(fā)揚(yáng)傳統(tǒng)學(xué)業(yè)質(zhì)量評(píng)價(jià)優(yōu)勢(shì)的基礎(chǔ)上,探索順應(yīng)教育發(fā)展、促進(jìn)師生發(fā)展、符合技術(shù)發(fā)展的學(xué)業(yè)質(zhì)量評(píng)價(jià)。從對(duì)象上看,學(xué)業(yè)質(zhì)量評(píng)價(jià)不僅要關(guān)注“全體”,也要關(guān)注“個(gè)體”,更要關(guān)注“群組”;從評(píng)價(jià)時(shí)機(jī)上看,不僅要關(guān)注學(xué)期或?qū)W年或?qū)W段結(jié)束時(shí)的質(zhì)量,也要關(guān)注學(xué)習(xí)過(guò)程中的質(zhì)量;從評(píng)價(jià)手段上看,不僅要運(yùn)用紙筆測(cè)試,還要運(yùn)用其他手段協(xié)同評(píng)價(jià);從評(píng)價(jià)內(nèi)容上看,不僅要評(píng)價(jià)“知識(shí)與技能”,還要關(guān)注其他維度,并逐步走向核心素養(yǎng)評(píng)價(jià);從評(píng)價(jià)維度上看,不僅要關(guān)注“質(zhì)與量”,還要關(guān)注“質(zhì)與量”的影響因素。由此可見(jiàn),學(xué)業(yè)質(zhì)量評(píng)價(jià)不僅要在理念上更新、程序上規(guī)范、內(nèi)容上科學(xué),更需要在技術(shù)上突破、方法上改進(jìn)、實(shí)踐上創(chuàng)新。

二、實(shí)踐:學(xué)業(yè)質(zhì)量評(píng)價(jià)的技術(shù)應(yīng)用

作為全國(guó)智慧教育創(chuàng)建示范區(qū),上海市MH區(qū)一直根據(jù)教育發(fā)展目標(biāo)和要求,整合運(yùn)用、科學(xué)應(yīng)用各類(lèi)技術(shù),以提升學(xué)業(yè)質(zhì)量評(píng)價(jià)的科學(xué)性、有效性和便捷性。從區(qū)域?qū)用?,探索區(qū)域整體性學(xué)業(yè)質(zhì)量評(píng)價(jià)的發(fā)展辦法;從學(xué)校層面,引導(dǎo)學(xué)校與教師探究日常學(xué)業(yè)質(zhì)量評(píng)價(jià)的突破之處。

(一)學(xué)校學(xué)業(yè)質(zhì)量評(píng)價(jià):人工觀測(cè)與自動(dòng)記錄相結(jié)合的多元證據(jù)采集

1.使用可穿戴設(shè)備伴隨采集關(guān)鍵性證據(jù)

學(xué)生學(xué)習(xí)過(guò)程質(zhì)量如何?除經(jīng)驗(yàn)判斷外,還需要更精確、更及時(shí)的證據(jù),以便更科學(xué)地評(píng)估和支持學(xué)生發(fā)展。由此,MH區(qū)部分學(xué)校引入技術(shù)手段,使用可穿戴設(shè)備精準(zhǔn)捕捉學(xué)生學(xué)習(xí)證據(jù)。如PN小學(xué)針對(duì)學(xué)生體質(zhì)健康質(zhì)量不太高、學(xué)生間差異較大等現(xiàn)象,統(tǒng)一使用“運(yùn)動(dòng)手環(huán)”,讓學(xué)生在體育課上統(tǒng)一佩戴;教師根據(jù)班級(jí)學(xué)生體質(zhì)健康情況,課前為各類(lèi)學(xué)生設(shè)置好匹配性“預(yù)警值”,課中通過(guò)“運(yùn)動(dòng)手環(huán)”進(jìn)行數(shù)據(jù)采集和數(shù)據(jù)傳輸,實(shí)時(shí)觀察每位學(xué)生的運(yùn)動(dòng)強(qiáng)度。借助“運(yùn)動(dòng)手環(huán)”采集的關(guān)鍵性數(shù)據(jù),教師在教學(xué)中能夠及時(shí)調(diào)整方法或手段,并聚焦特需學(xué)生進(jìn)行及時(shí)、科學(xué)干預(yù)。通過(guò)一定時(shí)間數(shù)據(jù)的積累,教師還可以對(duì)學(xué)生階段性體質(zhì)發(fā)展情況進(jìn)行綜合判斷。為了促進(jìn)學(xué)生更好地學(xué)習(xí),MH區(qū)有一批學(xué)校正在探索在什么學(xué)科、在什么場(chǎng)景、如何運(yùn)用可穿戴設(shè)備,以讓學(xué)業(yè)質(zhì)量評(píng)價(jià)更好地服務(wù)學(xué)習(xí)、支持學(xué)習(xí)、促進(jìn)學(xué)習(xí)。

2.運(yùn)用機(jī)器識(shí)別自動(dòng)采集多類(lèi)型證據(jù)

學(xué)生學(xué)習(xí)過(guò)程中的變化和表現(xiàn)是過(guò)程質(zhì)量的重要證據(jù),但因諸多原因,它們無(wú)法被有效捕捉和識(shí)別。在智慧教育導(dǎo)引下,MH區(qū)部分學(xué)校大膽突破傳統(tǒng)教育評(píng)價(jià)的桎梏,探索使用“機(jī)器學(xué)習(xí)”輔助教學(xué)與評(píng)價(jià)。如QW小學(xué)以“數(shù)學(xué)概念形成”為例,利用視頻捕捉和人臉識(shí)別,記錄學(xué)生在課堂學(xué)習(xí)中的表情變化;課后再通過(guò)基于機(jī)器學(xué)習(xí)的姿態(tài)分析、人臉識(shí)別、人臉關(guān)鍵點(diǎn)檢測(cè)、表情分析等技術(shù),將學(xué)生的變化和表現(xiàn)進(jìn)行可視化表征,并分析其學(xué)習(xí)的參與度、思考度、專(zhuān)注度等;最后,對(duì)學(xué)生數(shù)學(xué)概念形成的過(guò)程質(zhì)量進(jìn)行評(píng)價(jià)。PY小學(xué)則在“手球+”校本課程教學(xué)中,利用視頻分析和熱點(diǎn)捕捉,開(kāi)展基于深度學(xué)習(xí)的動(dòng)作識(shí)別,觀測(cè)和評(píng)估學(xué)生在集體運(yùn)動(dòng)中規(guī)則意識(shí)的養(yǎng)成。

機(jī)器學(xué)習(xí)是通過(guò)經(jīng)驗(yàn)或數(shù)據(jù)來(lái)改進(jìn)算法的研究,旨在通過(guò)算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,自動(dòng)發(fā)現(xiàn)模式并用于預(yù)測(cè)[10]。目前,MH區(qū)的探索處于機(jī)器學(xué)習(xí)的初級(jí)階段,這既受制于技術(shù)本身的成熟度、便捷性等,也受教育需求或研究問(wèn)題的復(fù)雜性、專(zhuān)業(yè)性等影響。

3.運(yùn)用學(xué)習(xí)平臺(tái)跟蹤采集全過(guò)程證據(jù)

隨著教育大數(shù)據(jù)的興起,對(duì)評(píng)價(jià)數(shù)據(jù)源的研究開(kāi)始發(fā)生變化,不僅關(guān)注關(guān)鍵數(shù)據(jù),還關(guān)注全樣本數(shù)據(jù)的價(jià)值。信息化學(xué)習(xí)平臺(tái)在教與學(xué)中的常態(tài)化應(yīng)用為全樣本數(shù)據(jù)的積累提供了可能。如MH區(qū)LY小學(xué)利用超星校園閱讀系統(tǒng)、Aischool學(xué)習(xí)平臺(tái)等對(duì)四年級(jí)學(xué)生的閱讀行為(如閱讀篇目、閱讀數(shù)量、閱讀時(shí)機(jī)、閱讀時(shí)間、閱讀行為等)進(jìn)行全程記錄和采集,并據(jù)此對(duì)學(xué)生閱讀能力進(jìn)行評(píng)價(jià)。GM高中運(yùn)用電子書(shū)包、Happyclass學(xué)習(xí)平臺(tái)等支持學(xué)生課前、課中、課后的學(xué)習(xí),同時(shí)伴隨式采集和記錄學(xué)生學(xué)習(xí)過(guò)程全數(shù)據(jù),如課前預(yù)習(xí)時(shí)間和時(shí)機(jī)、課前測(cè)結(jié)果,課中舉手作答次數(shù)、資源分享情況、生生互動(dòng)及師生互動(dòng)頻次與互動(dòng)內(nèi)容,課后作業(yè)時(shí)間與質(zhì)量等。這些數(shù)據(jù)為準(zhǔn)確評(píng)估學(xué)生的學(xué)習(xí)習(xí)慣、單元學(xué)習(xí)過(guò)程質(zhì)量等奠定了基礎(chǔ)。

信息化學(xué)習(xí)平臺(tái)的使用,讓自動(dòng)化采集學(xué)習(xí)全樣本數(shù)據(jù)得以初步實(shí)現(xiàn)。但是,這些學(xué)習(xí)平臺(tái)對(duì)學(xué)生學(xué)習(xí)的適應(yīng)性、匹配性以及基于學(xué)習(xí)平臺(tái)積累的海量結(jié)構(gòu)性、非結(jié)構(gòu)性數(shù)據(jù)的分析與挖掘等問(wèn)題,還需要進(jìn)一步研究。

(二)區(qū)域?qū)W業(yè)質(zhì)量評(píng)價(jià):基于組合測(cè)評(píng)和專(zhuān)業(yè)模型的智能化數(shù)據(jù)挖掘

1.建設(shè)平臺(tái),讓測(cè)評(píng)數(shù)據(jù)匯聚和沉積

基于信息化的學(xué)業(yè)質(zhì)量評(píng)價(jià)是教育發(fā)展的必然要求。MH區(qū)通過(guò)多年實(shí)踐和研究,建設(shè)了“學(xué)業(yè)質(zhì)量評(píng)價(jià)智能系統(tǒng)”(包括問(wèn)卷等六大子系統(tǒng)),使中小學(xué)學(xué)業(yè)質(zhì)量評(píng)價(jià)更加規(guī)范化、自動(dòng)化和智能化。該系統(tǒng)按照國(guó)家相關(guān)專(zhuān)業(yè)和技術(shù)標(biāo)準(zhǔn),規(guī)范定義了所有子系統(tǒng)數(shù)據(jù)的格式、層級(jí)、標(biāo)準(zhǔn)及相互關(guān)系,包括基礎(chǔ)信息、考試數(shù)據(jù)、問(wèn)卷數(shù)據(jù)等,對(duì)其進(jìn)行統(tǒng)一編碼。這使得歷次學(xué)業(yè)質(zhì)量評(píng)價(jià)數(shù)據(jù)能夠匯聚,形成數(shù)據(jù)倉(cāng)庫(kù)。該系統(tǒng)還進(jìn)一步規(guī)范了學(xué)科命題、問(wèn)卷調(diào)研、閱卷批卷等技術(shù)流程,明確了數(shù)據(jù)流向,確定了數(shù)據(jù)全過(guò)程中的責(zé)任主體和服務(wù)對(duì)象。這讓所有學(xué)校、所有學(xué)生、所有學(xué)科的學(xué)業(yè)質(zhì)量評(píng)價(jià)數(shù)據(jù)得以積累,并逐漸形成學(xué)業(yè)評(píng)價(jià)大數(shù)據(jù)。至2019年6月,該系統(tǒng)已完成576 066人次的學(xué)業(yè)水平測(cè)試,21次區(qū)級(jí)問(wèn)卷調(diào)查,已生成區(qū)級(jí)學(xué)科質(zhì)量報(bào)告513份,積累數(shù)據(jù)35.3G。借助這些數(shù)據(jù),區(qū)域可以實(shí)現(xiàn)對(duì)學(xué)校、教師、學(xué)生的橫向比較和具體評(píng)價(jià),也可以進(jìn)行縱向追蹤和發(fā)展評(píng)價(jià)。

2.運(yùn)用模型,讓數(shù)據(jù)挖掘更加科學(xué)和便捷

區(qū)域?qū)W業(yè)質(zhì)量評(píng)價(jià)大數(shù)據(jù)的積累,為進(jìn)一步數(shù)據(jù)分析和深度挖掘提供了可能。多年來(lái),MH區(qū)回歸育人本源,從學(xué)生終身學(xué)習(xí)和學(xué)校教育的可持續(xù)發(fā)展角度出發(fā),細(xì)化和明確了學(xué)業(yè)質(zhì)量測(cè)評(píng)目的。基于該目的,整合運(yùn)用多種技術(shù)手段,優(yōu)化數(shù)據(jù)分析方法,形成數(shù)據(jù)挖掘模型,并將其植入平臺(tái),初步實(shí)現(xiàn)智能化數(shù)據(jù)分析。MH區(qū)“學(xué)業(yè)質(zhì)量評(píng)價(jià)智能系統(tǒng)”繼續(xù)運(yùn)用CTT的基本方法,對(duì)區(qū)域和學(xué)校的學(xué)業(yè)水平進(jìn)行基本統(tǒng)計(jì)和基礎(chǔ)分析,如百分等級(jí)、眾數(shù)、中位數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤差、差異系數(shù)、方差、峰值、超X均率、全距等。除此之外,聚焦教與學(xué)的改進(jìn)和發(fā)展,該系統(tǒng)綜合運(yùn)用了多種方法加強(qiáng)對(duì)數(shù)據(jù)的分析和挖掘。如基于學(xué)生個(gè)性化成長(zhǎng)和發(fā)展預(yù)測(cè)的需要,運(yùn)用IRT模型,實(shí)現(xiàn)對(duì)每一個(gè)學(xué)生的潛能測(cè)評(píng);基于學(xué)生學(xué)業(yè)發(fā)展影響因素的干預(yù)需要,運(yùn)用線性回歸、決策樹(shù)分析等方法,對(duì)學(xué)業(yè)水平的影響因素進(jìn)行挖掘;基于教師分層教學(xué)和學(xué)生改進(jìn)學(xué)習(xí)的需要,運(yùn)用聚類(lèi)分析方法,從知識(shí)點(diǎn)、能力水平等多個(gè)角度進(jìn)行聚類(lèi)挖掘;基于學(xué)業(yè)質(zhì)量評(píng)價(jià)的可持續(xù)發(fā)展,對(duì)試題質(zhì)量進(jìn)行評(píng)估等。

綜上所述,上海市MH區(qū)在《教育信息化2.0行動(dòng)計(jì)劃》引導(dǎo)下,聚焦“立德樹(shù)人”的根本任務(wù),區(qū)校協(xié)同、點(diǎn)面結(jié)合、分步推進(jìn),運(yùn)用信息技術(shù)和數(shù)理技術(shù),在實(shí)踐中逐步優(yōu)化學(xué)業(yè)質(zhì)量評(píng)價(jià),探索了技術(shù)支持下的區(qū)校學(xué)業(yè)質(zhì)量評(píng)價(jià)的改革辦法。實(shí)踐發(fā)現(xiàn),要讓學(xué)業(yè)質(zhì)量評(píng)價(jià)改革更持久、更有效,還需要整體思考和設(shè)計(jì)技術(shù)及其應(yīng)用路徑。

三、展望:學(xué)業(yè)質(zhì)量評(píng)價(jià)需要的技術(shù)突破

縱觀學(xué)業(yè)質(zhì)量評(píng)價(jià)的發(fā)展歷史,基于MH區(qū)學(xué)業(yè)質(zhì)量評(píng)價(jià)的實(shí)踐探究,面向教育現(xiàn)代化的發(fā)展要求,從“過(guò)程評(píng)價(jià)的實(shí)現(xiàn)、結(jié)果評(píng)價(jià)的改進(jìn)”角度看,學(xué)業(yè)質(zhì)量評(píng)價(jià)下一步需要在以下方面實(shí)現(xiàn)技術(shù)突破。

(一)學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)“何以可能”

評(píng)價(jià)不應(yīng)僅關(guān)注學(xué)習(xí)過(guò)程的最后產(chǎn)出,還應(yīng)著眼于學(xué)習(xí)過(guò)程所帶來(lái)的增長(zhǎng)[11]。關(guān)注學(xué)生學(xué)習(xí)過(guò)程中的學(xué)業(yè)質(zhì)量,關(guān)注學(xué)生學(xué)業(yè)的發(fā)展或變化,關(guān)注學(xué)生的學(xué)習(xí)狀態(tài)——學(xué)習(xí)感受、學(xué)習(xí)方式、學(xué)習(xí)付出、學(xué)習(xí)代價(jià)、學(xué)習(xí)環(huán)境等,是學(xué)業(yè)質(zhì)量評(píng)價(jià)發(fā)展的趨勢(shì)?;貧w到具體的學(xué)生,回歸到真實(shí)的過(guò)程,方能讓學(xué)業(yè)質(zhì)量評(píng)價(jià)實(shí)現(xiàn)真正的轉(zhuǎn)型。

1.證據(jù)采集技術(shù):讓評(píng)價(jià)走向智能化

長(zhǎng)久以來(lái),學(xué)業(yè)質(zhì)量評(píng)價(jià)堅(jiān)持“基于證據(jù)的客觀性評(píng)價(jià)”原則,而非經(jīng)驗(yàn)型、主觀性評(píng)價(jià)。證據(jù)成為制約學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)的瓶頸之一。一方面,在互聯(lián)網(wǎng)+教育背景下,需要借助現(xiàn)代信息技術(shù),更完整、更便捷地采集多元證據(jù),讓學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)更真實(shí)、更全面;另一方面,要根據(jù)教育現(xiàn)代化發(fā)展要求,進(jìn)一步完善傳統(tǒng)證據(jù)采集技術(shù),提升證據(jù)采集的科學(xué)性、精準(zhǔn)性,讓學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)更有效、更可信。

學(xué)業(yè)質(zhì)量評(píng)價(jià)證據(jù)要注意全面性、相關(guān)性、可信性[12]。證據(jù)的“質(zhì)”和“量”,與學(xué)業(yè)質(zhì)量評(píng)價(jià)的質(zhì)量直接關(guān)聯(lián)。如果說(shuō)結(jié)果評(píng)價(jià)尚可通過(guò)自主開(kāi)發(fā)的工具來(lái)獲取證據(jù),那么過(guò)程評(píng)價(jià)的證據(jù)方式更需要趨向自動(dòng)。MH區(qū)多所學(xué)校的實(shí)踐證明,伴隨學(xué)習(xí)過(guò)程的自動(dòng)化采集技術(shù)對(duì)于過(guò)程評(píng)價(jià)的推進(jìn)大有裨益。在線課程或電子教材、嵌入教與學(xué)過(guò)程中的App、輔助學(xué)習(xí)管理的信息平臺(tái)、支持教師專(zhuān)業(yè)發(fā)展的視頻采集或識(shí)別技術(shù)等,皆可成為學(xué)業(yè)質(zhì)量過(guò)程性評(píng)價(jià)中證據(jù)采集的重要技術(shù)。但是,使用這些技術(shù)所采集到的證據(jù),需要按照一定的標(biāo)準(zhǔn)和結(jié)構(gòu)等進(jìn)行積累、清洗和儲(chǔ)存。

2.分析挖掘技術(shù):讓評(píng)價(jià)更趨專(zhuān)業(yè)化

學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)需要從“多”證據(jù)到“好”證據(jù)、從“一類(lèi)”證據(jù)到“多元”證據(jù)、從“一次”證據(jù)到“累積”證據(jù)。但是,要讓學(xué)業(yè)質(zhì)量的過(guò)程評(píng)價(jià)真正落地,關(guān)鍵是要讓“證據(jù)”說(shuō)話。這要求學(xué)業(yè)質(zhì)量評(píng)價(jià)聚焦學(xué)習(xí)者,通過(guò)學(xué)習(xí)分析和數(shù)據(jù)挖掘技術(shù),讓證據(jù)可感、可視、可用。

長(zhǎng)久以來(lái),學(xué)業(yè)水平測(cè)試較多地使用CTT而非IRT,其原因之一是兩者之間數(shù)據(jù)分析挖掘技術(shù)難度的差異。當(dāng)學(xué)業(yè)質(zhì)量評(píng)價(jià)從小數(shù)據(jù)到大數(shù)據(jù)、從大數(shù)據(jù)到巧數(shù)據(jù)時(shí),運(yùn)用專(zhuān)業(yè)工具對(duì)數(shù)據(jù)進(jìn)行及時(shí)性、多元化分析挖掘則成為學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)的難點(diǎn)。MH區(qū)的實(shí)踐表明,目前還沒(méi)有成熟的模型和技術(shù)能夠滿足學(xué)生各學(xué)科學(xué)業(yè)質(zhì)量過(guò)程評(píng)價(jià)的需要。這需要數(shù)據(jù)科學(xué)、信息技術(shù)科學(xué)、學(xué)科課程與教學(xué)等多方協(xié)同,通過(guò)共同探索,逐漸形成面向個(gè)體、群組、群體的各學(xué)科學(xué)業(yè)過(guò)程評(píng)價(jià)的模型和技術(shù)。

(二)學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)“如何優(yōu)化”

對(duì)于學(xué)業(yè)質(zhì)cldxJNRy3/VWpRYhLsg3INiSJyYktut7Yp6GlF8teG0=量結(jié)果評(píng)價(jià)來(lái)說(shuō),要破除“唯分?jǐn)?shù)”的桎梏,其價(jià)值要從“學(xué)生間學(xué)業(yè)水平的差距”走向“影響學(xué)業(yè)水平的因素或變量”,通過(guò)探求不同學(xué)生群組之間的一致性和差異性,讓教學(xué)與管理的變革更有針對(duì)性、更具個(gè)性化。

1.組合測(cè)試技術(shù):讓評(píng)價(jià)走出唯分?jǐn)?shù)

學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)要突破單一紙筆測(cè)試的桎梏,不再是單一維度、單一水平、單一手段、單一時(shí)空的方式方法,而是要建構(gòu)立體的、多維的、長(zhǎng)程的、連續(xù)的學(xué)業(yè)質(zhì)量評(píng)價(jià)與保障體系。因此,“測(cè)驗(yàn)+問(wèn)卷+其他”的組合測(cè)試成為學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)發(fā)展的必然。

組合測(cè)試技術(shù)在國(guó)際學(xué)業(yè)質(zhì)量評(píng)價(jià)或教育質(zhì)量評(píng)價(jià)中早有探索,即學(xué)業(yè)成就水平測(cè)驗(yàn)和系列背景問(wèn)卷調(diào)查相結(jié)合的技術(shù)路線。其中,學(xué)業(yè)成就水平測(cè)驗(yàn)常用于考查學(xué)生學(xué)業(yè)狀況,而系列背景問(wèn)卷則集中于獲取人口學(xué)、教育經(jīng)歷及教育質(zhì)量影響因素信息等[13]。MH區(qū)多年的實(shí)踐證明,組合測(cè)試技術(shù)也可以進(jìn)入實(shí)踐常態(tài)。在此過(guò)程中,區(qū)域要根據(jù)不同學(xué)段、不同學(xué)科的課程標(biāo)準(zhǔn)以及學(xué)生發(fā)展需求等,確定如何組合、如何出卷、如何實(shí)施、如何分析等,涉及組合測(cè)試的體系或框架設(shè)計(jì)技術(shù)、學(xué)業(yè)水平測(cè)試的命題技術(shù)、問(wèn)卷設(shè)計(jì)及組卷技術(shù)、抽樣與測(cè)試技術(shù)、數(shù)據(jù)自動(dòng)化錄入與分析技術(shù)、試題庫(kù)和問(wèn)卷庫(kù)建設(shè)技術(shù)等。

2.反饋應(yīng)用技術(shù):讓評(píng)價(jià)彰顯促進(jìn)性

評(píng)價(jià)是為了促進(jìn)和發(fā)展,工具和證據(jù)皆是手段,對(duì)結(jié)果的應(yīng)用才是目的。在學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)中,為了更好地促進(jìn)學(xué)生發(fā)展,從時(shí)機(jī)上看,要從單次走向連續(xù);從主體上看,要從單一走向多元;從內(nèi)容上看,要從診斷走向相關(guān)。因此,學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)要以學(xué)生的當(dāng)下和未來(lái)為中心,從學(xué)習(xí)生態(tài)或關(guān)系的視角,讓學(xué)業(yè)質(zhì)量評(píng)價(jià)的分析反饋技術(shù)和結(jié)果應(yīng)用技術(shù)得以突破。

學(xué)業(yè)質(zhì)量的發(fā)展和提升是多因素作用的結(jié)果。MH區(qū)的實(shí)踐表明,學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)不能只服務(wù)或只作用于一類(lèi)對(duì)象,而要讓校長(zhǎng)、教研組長(zhǎng)、教師、學(xué)生、家長(zhǎng)等從不同角度獲得學(xué)生學(xué)業(yè)改進(jìn)和發(fā)展信息,讓每個(gè)主體都認(rèn)識(shí)到自己在學(xué)習(xí)生態(tài)中的角色、責(zé)任和影響方式。從學(xué)業(yè)質(zhì)量評(píng)價(jià)結(jié)果的呈現(xiàn)內(nèi)容和方式看,不能孤立地看單次結(jié)果情況,而要從持續(xù)性、連貫性、發(fā)展性的角度,對(duì)學(xué)業(yè)質(zhì)量評(píng)價(jià)結(jié)果進(jìn)行反饋,即不僅反饋當(dāng)次分?jǐn)?shù),更要結(jié)合測(cè)試工具的結(jié)構(gòu)和學(xué)生過(guò)往的學(xué)業(yè)情況,反饋學(xué)生的學(xué)業(yè)潛能、變化情況、關(guān)系關(guān)聯(lián)和發(fā)展傾向。所以,學(xué)業(yè)質(zhì)量結(jié)果評(píng)價(jià)要重視基于數(shù)據(jù)挖掘技術(shù)的可視化呈現(xiàn)、多主體報(bào)告、實(shí)踐性應(yīng)用等。

總之,在教育發(fā)展的歷史長(zhǎng)河中,作為教育評(píng)價(jià)的重要組成部分,學(xué)業(yè)質(zhì)量評(píng)價(jià)應(yīng)伴隨著教育的發(fā)展而發(fā)展。一方面,要堅(jiān)守傳統(tǒng)的基礎(chǔ)分析方法,發(fā)揮其基本診斷和管理功能;另一方面,要轉(zhuǎn)變觀念,改變思路,突破發(fā)展瓶頸,基于內(nèi)涵需求,關(guān)注過(guò)程評(píng)價(jià),完善組合測(cè)試,開(kāi)發(fā)分析模型,強(qiáng)化數(shù)據(jù)挖掘,發(fā)揮評(píng)價(jià)的預(yù)測(cè)和導(dǎo)向功能。貫通過(guò)程評(píng)價(jià)和結(jié)果評(píng)價(jià),破除唯分?jǐn)?shù)的評(píng)價(jià)困局,不斷繼承與創(chuàng)新,共同推動(dòng)學(xué)業(yè)質(zhì)量評(píng)價(jià)的改革和發(fā)展,助推教育現(xiàn)代化。

(注:本文系國(guó)家社會(huì)科學(xué)基金教育學(xué)一般課題 “基于學(xué)習(xí)分析技術(shù)的中小學(xué)學(xué)業(yè)質(zhì)量評(píng)價(jià)研究”(BHA140111)的研究成果。)

參考文獻(xiàn)

[1] 俞曉琳.項(xiàng)目反應(yīng)理論與經(jīng)典測(cè)驗(yàn)理論之比較[J].南京師大學(xué)報(bào)(社會(huì)科學(xué)版),1998(4):74-77.

[2][4]約瑟夫·M.瑞安(美).基于經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論的等值與連接——主要概念和基本術(shù)語(yǔ)[J].考試研究,2011(1):81-94.

[3][6]熊江玲.經(jīng)典測(cè)量理論、概化理論及項(xiàng)目反應(yīng)理論比較研究[J].求索,2004(4):99-100.

[5][11]王蕾.大規(guī)模考試和學(xué)業(yè)質(zhì)量評(píng)價(jià)[M].北京:高等教育出版社,2013:96.

[7] 劉洋,蔡敏.“BEAR 評(píng)估系統(tǒng)”:美國(guó)學(xué)生學(xué)業(yè)評(píng)價(jià)的新框架[J].外國(guó)教育研究,2009(11):40-44.

[8] 劉學(xué)智,乞佳,陳瑩.美國(guó)基礎(chǔ)教育中SBAC 學(xué)業(yè)評(píng)價(jià)體系研制模式與啟示[J].外國(guó)教育研究,2013(9):104-111.

[9] 徐淀芳,紀(jì)明澤,汪茂華.學(xué)業(yè)質(zhì)量綠色指標(biāo):促進(jìn)學(xué)生全面發(fā)展的利器——上海市中小學(xué)生學(xué)業(yè)質(zhì)量綠色指標(biāo)評(píng)價(jià)改革概況[J].人民教育,2013(18):13-16.

[10]余明華,馮翔,祝智庭.人工智能視域下機(jī)器學(xué)習(xí)的教育應(yīng)用與創(chuàng)新探索[J].遠(yuǎn)程教育雜志,2017(3):11-21.

[12]姚林群,戴根元.論基于證據(jù)的學(xué)業(yè)質(zhì)量評(píng)價(jià)[J].全球教育展望,2016(5)):49-57.

[13]張?jiān)伱?,郝懿,田一,李美?大規(guī)模學(xué)業(yè)成就調(diào)查系列背景問(wèn)卷的設(shè)計(jì)與建構(gòu)[J].教育科學(xué)研究,2016(5):5-11.

(作者系上海市閔行區(qū)教育學(xué)院科研室主任,教育學(xué)博士)

責(zé)任編輯:牟艷娜

乐昌市| 安福县| 郸城县| 修文县| 太原市| 博兴县| 泗洪县| 张掖市| 禄丰县| 新建县| 花莲县| 柳林县| 浮山县| 龙江县| 开化县| 利川市| 莱阳市| 贵定县| 江口县| 华容县| 依兰县| 永济市| 边坝县| 革吉县| 南平市| 大宁县| 定结县| 虹口区| 密云县| 黄梅县| 香港 | 聂拉木县| 肇东市| 芒康县| 凌源市| 沁阳市| 雅安市| 女性| 双流县| 临澧县| 沅陵县|