国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

教育評(píng)價(jià)中的信息技術(shù)應(yīng)用:賦能、挑戰(zhàn)與對(duì)策

2021-04-02 03:40張志禎齊文鑫
中國(guó)遠(yuǎn)程教育 2021年3期
關(guān)鍵詞:信息技術(shù)評(píng)價(jià)教育

張志禎 齊文鑫

【摘要】教育評(píng)價(jià)事關(guān)教育事業(yè)發(fā)展方向。中共中央、國(guó)務(wù)院印發(fā)的《深化新時(shí)代教育評(píng)價(jià)改革總體方案》對(duì)新時(shí)代教育評(píng)價(jià)改革做出了全面部署,指出應(yīng)充分利用信息技術(shù),創(chuàng)新評(píng)價(jià)工具。作為教育活動(dòng)的“指揮棒”,教育評(píng)價(jià)中信息技術(shù)應(yīng)用不能僅處于自發(fā)水平,需要達(dá)到自覺理性的水平。通過分析教育評(píng)價(jià)一般過程與信息技術(shù)特點(diǎn)可以看到,信息技術(shù)賦能教育評(píng)價(jià)主要體現(xiàn)在“增強(qiáng)”評(píng)價(jià)工具、“創(chuàng)新”評(píng)價(jià)工具、優(yōu)化評(píng)價(jià)管理、提升評(píng)價(jià)質(zhì)量和拓展評(píng)價(jià)結(jié)果等方面。同時(shí),在教育評(píng)價(jià)中利用信息技術(shù)也存在挑戰(zhàn)與風(fēng)險(xiǎn),主要是評(píng)價(jià)主體應(yīng)用能力不足、信息技術(shù)自身不穩(wěn)定不可靠、易流于“數(shù)據(jù)驅(qū)動(dòng)”、易形成“算法霸權(quán)”及易濫用過程性數(shù)據(jù)等。為此,可采取的對(duì)策包括:提升評(píng)價(jià)主體教育評(píng)價(jià)信息技術(shù)應(yīng)用能力、研制教育評(píng)價(jià)數(shù)據(jù)規(guī)范與建立公開測(cè)試數(shù)據(jù)集、建立評(píng)價(jià)迭代更新機(jī)制、發(fā)展評(píng)價(jià)對(duì)象自評(píng)能力、提高全社會(huì)教育評(píng)價(jià)素養(yǎng)等。

【關(guān)鍵詞】? 教育評(píng)價(jià);信息技術(shù)應(yīng)用;評(píng)價(jià)過程;評(píng)價(jià)質(zhì)量;數(shù)據(jù)驅(qū)動(dòng);算法霸權(quán);再評(píng)價(jià);信息化

2020年10月,中共中央、國(guó)務(wù)院印發(fā)了《深化新時(shí)代教育評(píng)價(jià)改革總體方案》(以下簡(jiǎn)稱“《方案》”),對(duì)新時(shí)代教育評(píng)價(jià)改革做出了全面部署。《方案》打開了教育系統(tǒng)“黑箱”,明確了教育系統(tǒng)內(nèi)、外的重點(diǎn)評(píng)價(jià)對(duì)象,即學(xué)校、教師與學(xué)生三類教育系統(tǒng)主體,黨委與政府、選人用人社會(huì)機(jī)構(gòu)兩類與教育系統(tǒng)直接相關(guān)的社會(huì)子系統(tǒng);明確了結(jié)果評(píng)價(jià)、過程評(píng)價(jià)、增值評(píng)價(jià)、綜合評(píng)價(jià)、綜合素質(zhì)評(píng)價(jià)、德育評(píng)價(jià)、選拔評(píng)價(jià)等評(píng)價(jià)任務(wù)。

《方案》指出教育評(píng)價(jià)應(yīng)充分利用信息技術(shù),創(chuàng)新評(píng)價(jià)工具。教育評(píng)價(jià)活動(dòng)類型多樣,都是數(shù)據(jù)與知識(shí)“密集型”實(shí)踐,高度依賴客觀數(shù)據(jù)與對(duì)數(shù)據(jù)的分析處理,因此教育評(píng)價(jià)領(lǐng)域歷來(lái)對(duì)信息技術(shù)的新進(jìn)展十分敏感,往往新技術(shù)一經(jīng)出現(xiàn),很快就有相關(guān)研究探索其在教育評(píng)價(jià)中的運(yùn)用,如柯林斯(2013, p.114)、蘆詠莉等(2012, p.27)。

但是,這并不意味著不需要對(duì)信息技術(shù)在教育評(píng)價(jià)中的應(yīng)用做系統(tǒng)探討。理由如下:一是教育評(píng)價(jià)中信息技術(shù)應(yīng)用存在不同水平,可以是用新技術(shù)按照已有方式行事,也可以是創(chuàng)造新的行事方式;二是正式教育評(píng)價(jià)多為自上而下的任務(wù),學(xué)校、教師被“裹挾”到教育評(píng)價(jià)活動(dòng)中,或許對(duì)信息技術(shù)應(yīng)用有體驗(yàn),但難以有系統(tǒng)理性的認(rèn)識(shí);三是教育評(píng)價(jià)是教育活動(dòng)的“指揮棒”,對(duì)教育活動(dòng)的影響廣泛、深遠(yuǎn)、持久,信息技術(shù)應(yīng)用不能只停留在自發(fā)水平,需要達(dá)到自覺理性的水平,只有明確信息技術(shù)的優(yōu)勢(shì)與問題,才能充分發(fā)揮信息技術(shù)的預(yù)期作用,避免濫用誤用;四是信息技術(shù)在其他領(lǐng)域的廣泛應(yīng)用已產(chǎn)生了未預(yù)料到的社會(huì)后果,與“信息迷”的樂觀聲稱背道而馳。例如,充滿不同聲音的互聯(lián)網(wǎng)讓很多人變得更加狹隘偏激(尼科爾斯, 2019, p.128),解放勞動(dòng)力的自動(dòng)化改變了工作性質(zhì)(卡爾, 2015, p.78),互聯(lián)網(wǎng)新聞推送讓傳統(tǒng)新聞業(yè)哀鴻遍野、獨(dú)立思想日漸式微(福爾, 2019, pp.156-157),掠奪式廣告讓窮人陷入更深的窘境(奧尼爾, 2018, pp.72-73),MOOC不但并未顛覆傳統(tǒng)高等機(jī)構(gòu),反而被逐漸吸收整合(Reich, 2020, p.43),等等。教育評(píng)價(jià)事關(guān)國(guó)家教育事業(yè)發(fā)展方向與個(gè)體命運(yùn),因此有必要對(duì)信息技術(shù)應(yīng)用的可能影響做系統(tǒng)分析。

一、作為特殊知識(shí)生產(chǎn)實(shí)踐的教育評(píng)價(jià)

教育評(píng)價(jià)是對(duì)教育主體、活動(dòng)或現(xiàn)象的價(jià)值評(píng)定,是一種特殊的“知識(shí)生產(chǎn)”實(shí)踐。Gronlund提出“評(píng)價(jià)=測(cè)量(定量研究)或非測(cè)量(定性描述)+價(jià)值判斷”,這抓住了評(píng)價(jià)活動(dòng)的本質(zhì)(陳玉琨, 2019, p.13)。在實(shí)踐中教育評(píng)價(jià)人員大量運(yùn)用研究設(shè)計(jì)、測(cè)量工具、數(shù)據(jù)分析技術(shù)等教育研究方法,因此也常常將評(píng)價(jià)活動(dòng)稱為評(píng)價(jià)研究。教育評(píng)價(jià)與教育研究的區(qū)別不在于方法與方法論,而在于目的與追求(高爾等, 2002, p.558):評(píng)價(jià)的目的通常是改進(jìn)或支持決策、評(píng)定績(jī)效,而教育研究的目的則是增進(jìn)對(duì)教育現(xiàn)象的理解。這導(dǎo)致研究結(jié)果與評(píng)價(jià)結(jié)果的概括程度不同:教育研究結(jié)果更概括,追求對(duì)“某類現(xiàn)象”(that)或者關(guān)系的普遍理解,希望產(chǎn)生的知識(shí)是超越情境的;評(píng)價(jià)結(jié)果則非常具體,明確指向“某個(gè)對(duì)象”(that one),希望產(chǎn)生的知識(shí)是特定情境中準(zhǔn)確、可靠和有用的,即基于某對(duì)象的知識(shí)能夠做出有效可信的價(jià)值判斷。

正如生產(chǎn)工具只能作用于具體的生產(chǎn)過程,信息技術(shù)也只能在教育評(píng)價(jià)的微觀活動(dòng)過程中起作用。為了更深入地探討教育評(píng)價(jià)中如何充分利用信息技術(shù),需要明確教育評(píng)價(jià)活動(dòng)的微觀過程。基于陳玉琨(2019, p.38)、吳鋼(2018, p.46)、希爾倫斯等(2017, p.21)和高爾等(2002, pp.559-566)的教育評(píng)價(jià)過程模式,可概括出教育評(píng)價(jià)的一般過程(見圖1)。

教育評(píng)價(jià)的評(píng)價(jià)主體包括評(píng)價(jià)者和評(píng)價(jià)實(shí)施者,前者是評(píng)價(jià)的發(fā)起者,如政府、用人單位等;后者是具有實(shí)施評(píng)價(jià)能力的專業(yè)人員或機(jī)構(gòu)。評(píng)價(jià)對(duì)象是學(xué)校、教師、學(xué)生等教育系統(tǒng)主體。教育評(píng)價(jià)的一般過程為:①確定目的,即評(píng)價(jià)者確定評(píng)價(jià)目的、被評(píng)價(jià)者、評(píng)價(jià)實(shí)施者,組織安排評(píng)價(jià)活動(dòng)資源;②制定方案,即確定評(píng)價(jià)的具體目標(biāo)、指標(biāo)體系與標(biāo)準(zhǔn)、評(píng)價(jià)工具(數(shù)據(jù)收集和分析方法工具)、數(shù)據(jù)來(lái)源、評(píng)價(jià)結(jié)果使用方式與呈現(xiàn)形式、評(píng)價(jià)過程安排等,大規(guī)模評(píng)價(jià)還需要明確分工合作機(jī)制、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)管理平臺(tái)等;③收集數(shù)據(jù),包括定量數(shù)據(jù)和定性數(shù)據(jù)、專門收集的數(shù)據(jù)和日常運(yùn)作產(chǎn)生的數(shù)據(jù)(伴隨式收集數(shù)據(jù));④分析數(shù)據(jù),即整合不同來(lái)源的數(shù)據(jù),開展定量與定性分析;⑤價(jià)值判斷,即匯總分析結(jié)果,對(duì)照評(píng)價(jià)目的、指標(biāo)體系和標(biāo)準(zhǔn),做出價(jià)值判斷,形成評(píng)價(jià)結(jié)果;⑥反饋應(yīng)用,即向評(píng)價(jià)者、被評(píng)價(jià)者和公眾反饋評(píng)價(jià)結(jié)果,利用評(píng)價(jià)結(jié)果進(jìn)行選拔鑒定、問責(zé)或者改進(jìn)教學(xué)??傊?,在評(píng)價(jià)中“收集數(shù)據(jù)”“分析數(shù)據(jù)”是為了獲得有關(guān)評(píng)價(jià)對(duì)象的知識(shí),是情境性很強(qiáng)的本地知識(shí);價(jià)值判斷以前面的步驟獲得的知識(shí)為基礎(chǔ);評(píng)價(jià)結(jié)果的“反饋應(yīng)用”特別重要,且具有直接的社會(huì)后果,例如高校專業(yè)的級(jí)別、考生是否被錄取、應(yīng)聘者是否被錄用等。

有研究者(吳鋼, 2018, p.179; 陶西平, 2012, pp.164-166)強(qiáng)調(diào)應(yīng)對(duì)評(píng)價(jià)進(jìn)行評(píng)價(jià),即“再評(píng)價(jià)”。鑒于“再評(píng)價(jià)”以評(píng)價(jià)活動(dòng)為評(píng)價(jià)對(duì)象,是新的、獨(dú)立的“元”評(píng)價(jià)活動(dòng),其過程也符合圖1中的一般過程,故未在圖中體現(xiàn)。

二、信息技術(shù)賦能教育評(píng)價(jià)

信息技術(shù)已經(jīng)成為日常工作、生活、學(xué)習(xí)中的普遍技術(shù)。為了使分析基礎(chǔ)更加牢靠,仍有必要進(jìn)一步明確對(duì)于信息技術(shù)的認(rèn)識(shí)。

(一)對(duì)信息技術(shù)特點(diǎn)的再認(rèn)識(shí)

這里的信息技術(shù)特點(diǎn)指現(xiàn)代信息技術(shù),即以電子數(shù)字計(jì)算機(jī)系統(tǒng)為核心的信息獲取、處理、存儲(chǔ)、傳輸、呈現(xiàn)與管理的系列技術(shù),是一個(gè)多層次多樣化的技術(shù)體系。圖2是與教育評(píng)價(jià)應(yīng)用直接相關(guān)的信息技術(shù)三層次結(jié)構(gòu)與特點(diǎn)示意圖。

在最“底層”,數(shù)字化是數(shù)據(jù)與信息進(jìn)入信息技術(shù)營(yíng)造的“比特世界”的前提條件。數(shù)字化后信息就脫離了原子的束縛,可以自由穿梭于數(shù)字世界(尼葛洛龐帝, 1997, pp.22-23)。自由是有代價(jià)的:經(jīng)過采樣量化,信息通常會(huì)失去“上下文(context)”,導(dǎo)致其意義難以自明,完整性難以保證,易被曲解、篡改(布朗等, 2003, p.116)。在早期,數(shù)字化需要人來(lái)完成,即人工用紙帶打孔、鍵盤等方式為計(jì)算機(jī)輸入數(shù)據(jù);聲卡、數(shù)碼相機(jī)、二維碼掃描器等多媒體設(shè)備,能夠自動(dòng)實(shí)現(xiàn)比特層次的數(shù)字化;“傳感器+人工智能技術(shù)”則實(shí)現(xiàn)了具有人類感知特點(diǎn)的數(shù)字化,如人臉識(shí)別、拍照翻譯、語(yǔ)言識(shí)別等。

中間層是通用的計(jì)算、存儲(chǔ)與交互基本服務(wù)。計(jì)算不僅是數(shù)值計(jì)算,還包括文本查找、邏輯判斷等非數(shù)值計(jì)算,高速、準(zhǔn)確是計(jì)算機(jī)計(jì)算的突出特點(diǎn)。計(jì)算機(jī)存儲(chǔ)的基本特點(diǎn)是容量大、讀寫速度快,且數(shù)據(jù)與處理程序的存儲(chǔ)機(jī)制相同。交互指通過鍵盤、鼠標(biāo)、顯示器等輸入輸出設(shè)備實(shí)現(xiàn)與計(jì)算機(jī)的“人機(jī)交互”。

最上層是專門技術(shù),和教育評(píng)價(jià)密切相關(guān)的是統(tǒng)計(jì)技術(shù)、多媒體技術(shù)、通信技術(shù)和智能技術(shù)?!敖y(tǒng)計(jì)技術(shù)”指計(jì)算機(jī)實(shí)現(xiàn)定量與定性數(shù)據(jù)統(tǒng)計(jì)分析的軟硬件技術(shù),集中體現(xiàn)在R、SPSS、Excel等軟件包中。統(tǒng)計(jì)技術(shù)是信息技術(shù)用于評(píng)價(jià)的切入點(diǎn),極大提高了數(shù)據(jù)分析的效率與準(zhǔn)確性,在“分析數(shù)據(jù)”中普遍應(yīng)用?!岸嗝襟w技術(shù)”指語(yǔ)音、圖像等視聽信息的輸入、處理與輸出技術(shù),是真實(shí)社會(huì)場(chǎng)景與活動(dòng)的捕獲、分析與呈現(xiàn)的有效手段。多媒體技術(shù)包括虛擬現(xiàn)實(shí)技術(shù),通過它可以創(chuàng)建沉浸式體驗(yàn)(張志禎, 2016),在“收集數(shù)據(jù)”“分析數(shù)據(jù)”“反饋應(yīng)用”中應(yīng)用廣泛。“通信技術(shù)”包括實(shí)現(xiàn)人際通信的互聯(lián)網(wǎng)服務(wù)與實(shí)現(xiàn)“物體間通信”的傳感器與物聯(lián)網(wǎng)技術(shù)。前者使大規(guī)模的教育評(píng)價(jià)合作成為可能,也為數(shù)據(jù)管理、傳遞提供了新的平臺(tái);后者為新的測(cè)評(píng)工具研發(fā)開辟了道路。通信技術(shù)在“收集數(shù)據(jù)”“分析數(shù)據(jù)”“反饋應(yīng)用”中應(yīng)用廣泛。“智能技術(shù)”指與實(shí)現(xiàn)人類個(gè)體特有的感知、推理與行動(dòng)的“智能行為”相關(guān)的計(jì)算機(jī)技術(shù),如圖像識(shí)別、自然語(yǔ)言處理、知識(shí)推理等(周志華, 2018; Russell, 等, 2013),大致上可以分為自上而下賦予計(jì)算機(jī)知識(shí)的知識(shí)工程技術(shù)(如專家系統(tǒng))和自下而上從大量數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)“模式”以做出預(yù)測(cè)的機(jī)器學(xué)習(xí)(如圖像識(shí)別深度神經(jīng)網(wǎng)絡(luò))。有經(jīng)濟(jì)學(xué)家認(rèn)為智能技術(shù)的基本特點(diǎn)是使預(yù)測(cè)變得廉價(jià)(阿格拉沃爾, 等, 2018, p.19)。智能技術(shù)對(duì)于教育評(píng)價(jià)的影響正在逐步顯現(xiàn),這一影響將是全過程、全方位的。

總體上看,上述多層次的信息技術(shù)表現(xiàn)出如下特點(diǎn)①:①去情境化,這是“采樣量化”數(shù)字化過程的結(jié)果,這一處理有得有失,具體請(qǐng)參見前文“數(shù)字化”相關(guān)分析;②易重用重組,數(shù)字世界的數(shù)據(jù)資料與軟件程序功能多姿多彩,但由于其底層都是比特,因此易于重新利用,借助超文本超鏈接技術(shù),不同來(lái)源的信息很容易就能并置、整合在一起(重組),方便了跨越時(shí)空、情境的比較分析;③高開放性,主要表現(xiàn)在可進(jìn)一步做編碼、加工、轉(zhuǎn)換和通過網(wǎng)絡(luò)進(jìn)行不受時(shí)空限制的訪問;④不穩(wěn)定(instability),指信息技術(shù)軟硬件總是處于發(fā)展過程中,硬件設(shè)備的使用壽命不長(zhǎng),軟件則受制于操作系統(tǒng)的頻繁更新,一款軟件可能幾年之后就難以找到適合的運(yùn)行環(huán)境,這導(dǎo)致信息技術(shù)應(yīng)用需要持續(xù)的經(jīng)費(fèi)與人力投入;⑤不可靠(unreliability),指計(jì)算機(jī)軟硬件可能包含錯(cuò)誤,糾正錯(cuò)誤的“補(bǔ)丁”常常會(huì)引入新的錯(cuò)誤,若功能依賴互聯(lián)網(wǎng)在線服務(wù),則互聯(lián)網(wǎng)連接、網(wǎng)絡(luò)速度與服務(wù)器的不可控與不確定,進(jìn)一步增加了信息技術(shù)的不可靠。

(二)信息技術(shù)“增強(qiáng)”教育評(píng)價(jià)工具

教育評(píng)價(jià)工具通常指對(duì)評(píng)價(jià)對(duì)象進(jìn)行測(cè)定時(shí)所采取的方式和手段,如論文考試、標(biāo)準(zhǔn)化測(cè)驗(yàn)、行動(dòng)觀察記錄、作品分析等(顧明遠(yuǎn), 1998, p.767)。由于數(shù)據(jù)分析處理與數(shù)據(jù)收集方法密切關(guān)聯(lián),本文擴(kuò)展“教育評(píng)價(jià)工具”的外延,將數(shù)據(jù)分析處理方式與手段也包括進(jìn)來(lái)。

本部分的“增強(qiáng)”指穿新鞋走“老路”,即用信息技術(shù)完成了之前需人工完成的工作。信息技術(shù)增強(qiáng)使教育評(píng)價(jià)工作更快速準(zhǔn)確、更規(guī)范、更大規(guī)模。

“更快速準(zhǔn)確”突出表現(xiàn)在數(shù)據(jù)收集與分析環(huán)節(jié),尤其是定量數(shù)據(jù)的統(tǒng)計(jì)分析上。以考試評(píng)分與成績(jī)統(tǒng)計(jì)為例,借助數(shù)據(jù)處理軟件,教師可以實(shí)時(shí)對(duì)成百上千學(xué)生的成績(jī)做交互式統(tǒng)計(jì)分析、可視化呈現(xiàn)、多角度對(duì)比,快捷、準(zhǔn)確。自動(dòng)閱卷技術(shù)提高了閱卷速度和準(zhǔn)確率,極大節(jié)省了人力。在線調(diào)查網(wǎng)站使采用問卷、量表、測(cè)驗(yàn)等方式收集數(shù)據(jù)變得更加高效。對(duì)于教育評(píng)價(jià)而言,數(shù)據(jù)收集與分析的“快速準(zhǔn)確”可縮短評(píng)價(jià)周期,降低評(píng)價(jià)成本,使反饋應(yīng)用更及時(shí),有利于提高實(shí)踐改進(jìn)所需的時(shí)效性,更好地落實(shí)評(píng)價(jià)促進(jìn)發(fā)展的功能。

“更規(guī)范”指在利用計(jì)算機(jī)收集與分析數(shù)據(jù)時(shí),能夠標(biāo)準(zhǔn)化數(shù)據(jù)測(cè)量、存儲(chǔ)、傳輸與分析方法,嚴(yán)格控制數(shù)據(jù)收集流程與時(shí)間,使數(shù)據(jù)處理方法標(biāo)準(zhǔn)化、規(guī)范化。例如,在2018年寧夏普通高等學(xué)校招生體育專業(yè)術(shù)科測(cè)試中采用信息技術(shù)測(cè)量?jī)x器與設(shè)備,測(cè)試過程更加科學(xué)、規(guī)范、準(zhǔn)確(賈海生, 2019)。

“更大規(guī)模”指即使采用同樣的評(píng)價(jià)工具,由于信息技術(shù)增強(qiáng)了數(shù)據(jù)收集能力和數(shù)據(jù)處理能力,使得可以在更大規(guī)模開展評(píng)價(jià)。如利用計(jì)算機(jī)網(wǎng)絡(luò)匯總分析數(shù)據(jù),5個(gè)人的小團(tuán)隊(duì)就可以在有限的時(shí)間內(nèi)高質(zhì)量地完成涉及1,816個(gè)高職專業(yè)的全國(guó)項(xiàng)目的績(jī)效評(píng)價(jià)與報(bào)告撰寫(張志禎, 等, 2015, p.473)。

信息技術(shù)工具將部分?jǐn)?shù)據(jù)收集、統(tǒng)計(jì)工作自動(dòng)化,大大簡(jiǎn)化了某些評(píng)價(jià)活動(dòng),使這些評(píng)價(jià)活動(dòng)能夠整合到日常教學(xué)中。例如,用Excel做成績(jī)分析,用“問卷星”收集數(shù)據(jù),使用課堂教學(xué)互動(dòng)系統(tǒng)、QQ群的投票功能等,這些都有助于教師在教學(xué)中開展形成性與診斷性教學(xué)評(píng)價(jià)。也就是說,信息技術(shù)的“增強(qiáng)”作用,有時(shí)體現(xiàn)在降低評(píng)價(jià)活動(dòng)技術(shù)門檻與時(shí)間成本的“簡(jiǎn)單化”上,這對(duì)于評(píng)價(jià)活動(dòng)的“日常化”至關(guān)重要,對(duì)于日常教育實(shí)踐非常有價(jià)值。

(三)信息技術(shù)“創(chuàng)新”教育評(píng)價(jià)工具

信息技術(shù)不僅能使已有工具與方法更加高效,還能夠創(chuàng)造出新的工具與方法,實(shí)現(xiàn)穿新鞋走“新路”。信息技術(shù)的創(chuàng)新應(yīng)用使教育評(píng)價(jià)有了新數(shù)據(jù)、新工具、新模式。

“新數(shù)據(jù)”,信息技術(shù)大大拓寬了評(píng)價(jià)數(shù)據(jù)來(lái)源。例如,有關(guān)真實(shí)社會(huì)場(chǎng)景與活動(dòng)的多媒體信息(如視頻)、活動(dòng)過程中伴隨式采集的實(shí)時(shí)生理與心理數(shù)據(jù)(如腦電波、情緒、注意力等)、在線學(xué)習(xí)行為數(shù)據(jù)、機(jī)構(gòu)運(yùn)作過程中自然產(chǎn)生的數(shù)據(jù)記錄等。新型數(shù)據(jù)已運(yùn)用于各種教育評(píng)價(jià)研究與實(shí)踐,例如課堂教學(xué)視頻已在美國(guó)NBPTS專家教師的認(rèn)證中長(zhǎng)期使用(袁銳鍔, 等, 2004)。

“新工具”,信息技術(shù)催生了很多新型“評(píng)價(jià)工具”,典型的如適應(yīng)性測(cè)試、游戲測(cè)評(píng)、虛擬現(xiàn)實(shí)仿真場(chǎng)景測(cè)試以及合作問題解決測(cè)試等。適應(yīng)性測(cè)試能夠根據(jù)考生的表現(xiàn),動(dòng)態(tài)選擇下一道題目,“每道題都被看作是一項(xiàng)獨(dú)立的迷你測(cè)試……(考生)回答會(huì)不斷改變我們對(duì)其真實(shí)分值的推測(cè)”(Thorndike, 等, 2018, pp.165-166)?;陧?xiàng)目反應(yīng)理論的適應(yīng)性測(cè)試能夠縮短測(cè)試時(shí)間,提高測(cè)試信度和效度,已大規(guī)模用于GRE考試,也用于Knewton等大型適應(yīng)性學(xué)習(xí)系統(tǒng)(Reich, 2020, p.53)。適應(yīng)性測(cè)試的實(shí)現(xiàn)依賴高強(qiáng)度的實(shí)時(shí)計(jì)算,只能在計(jì)算機(jī)上實(shí)現(xiàn)。電子游戲測(cè)評(píng)提高了測(cè)試任務(wù)真實(shí)性,能夠動(dòng)態(tài)檢測(cè)任務(wù)監(jiān)控等復(fù)雜能力,是更為真實(shí)的表現(xiàn)性測(cè)試(孫鑫, 等, 2018)。PISA測(cè)驗(yàn)采用的合作問題解決也在計(jì)算機(jī)、互聯(lián)網(wǎng)環(huán)境中開展(檀慧玲, 等, 2018)。此外,《方案》強(qiáng)調(diào)的綜合素質(zhì)評(píng)價(jià),需要處理大量的非結(jié)構(gòu)化數(shù)據(jù),其分析與綜合評(píng)價(jià)有賴于新的智能分析技術(shù)。

“新模式”,簡(jiǎn)單而言,對(duì)于信息化比較成熟的機(jī)構(gòu),由于日常運(yùn)作能夠產(chǎn)生大量的過程性數(shù)據(jù),為更好地利用這些數(shù)據(jù),提高評(píng)價(jià)效果與效益,需轉(zhuǎn)變?cè)u(píng)價(jià)思路,探索采用“伴隨式數(shù)據(jù)收集—確定目的—制定方案—數(shù)據(jù)選擇與分析—價(jià)值判斷—反饋應(yīng)用” 這一新的過程模式。

(四)信息技術(shù)優(yōu)化教育評(píng)價(jià)管理

在計(jì)算機(jī)時(shí)代開啟之際,維納就預(yù)言了計(jì)算機(jī)的生產(chǎn)、社會(huì)控制潛力(維納, 1978, pp.138-139)。大規(guī)模教育評(píng)價(jià)是涉及面很廣的復(fù)雜活動(dòng),需要有效管理才能有序可控,保證質(zhì)量。對(duì)于這類評(píng)價(jià)而言,信息技術(shù)已經(jīng)不是可選項(xiàng),而是不可或缺的。

信息技術(shù)增強(qiáng)了大規(guī)模、高利害教育評(píng)價(jià)的管理與控制。我國(guó)的高考是個(gè)典型例子。高考的考務(wù)管理包括報(bào)名、投檔、錄取、身份識(shí)別等,早已實(shí)現(xiàn)全程信息化,信息技術(shù)為高考保駕護(hù)航,推動(dòng)了高考現(xiàn)代化改革(游忠惠, 2013)。

信息技術(shù)使大型教育評(píng)價(jià)項(xiàng)目合作開發(fā)與實(shí)施成為可能。例如,經(jīng)合組織(OECD)的PISA測(cè)試、國(guó)際教育成就評(píng)價(jià)協(xié)會(huì)(IEA)的TIMSS研究、我國(guó)的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)、美國(guó)的國(guó)家教育進(jìn)步評(píng)價(jià)(NEAP)等都依托互聯(lián)網(wǎng)實(shí)現(xiàn)大范圍合作式評(píng)價(jià)開發(fā)、施測(cè)、過程與數(shù)據(jù)管理。

信息技術(shù)使對(duì)于教育機(jī)構(gòu)的增值評(píng)價(jià)具備可操作性。增值評(píng)價(jià)涉及復(fù)雜的數(shù)據(jù)收集與統(tǒng)計(jì),尤其是分層次、分塊以及歷史數(shù)據(jù)的對(duì)比分析(辛濤, 2020),若沒有信息技術(shù)數(shù)據(jù)管理與統(tǒng)計(jì)分析的支撐,增值評(píng)價(jià)的時(shí)間與人力成本會(huì)極其高昂。

信息技術(shù)還開辟了課程教學(xué)資源有效性評(píng)價(jià)的新方式?;诨ヂ?lián)網(wǎng)的智能教學(xué)系統(tǒng)可以作為被試分配、資源傳遞與展示、學(xué)習(xí)過程開展、評(píng)價(jià)數(shù)據(jù)收集、評(píng)價(jià)結(jié)果報(bào)告的新型教學(xué)實(shí)驗(yàn)平臺(tái),實(shí)現(xiàn)了對(duì)大規(guī)模、高生態(tài)效度的教學(xué)實(shí)驗(yàn)的全過程自動(dòng)化管理(Heffernan, et al., 2014)。

(五)信息技術(shù)提升教育評(píng)價(jià)質(zhì)量

陶西平(2012, p.166)認(rèn)為評(píng)價(jià)具有雙重性,好的評(píng)價(jià)促使教學(xué)工作變得更好,不好的評(píng)價(jià)可能使教學(xué)工作的方向更偏。這個(gè)判斷也適用于其他類型的教育評(píng)價(jià)?!斗桨浮穼ⅰ俺浞掷眯畔⒓夹g(shù),提高教育評(píng)價(jià)的科學(xué)性、客觀性與專業(yè)性”作為改革的原則之一,明確了教育評(píng)價(jià)的質(zhì)量標(biāo)準(zhǔn)、信息技術(shù)應(yīng)用的目標(biāo)和價(jià)值。

對(duì)于教育評(píng)價(jià)而言,“科學(xué)性”主要表現(xiàn)為評(píng)價(jià)的高信度、高效度①(吳鋼, 2016, p.180);“客觀性”是信度的一種,即評(píng)分者一致性信度(梅耶, 2016, pp.96-97);“專業(yè)性”主要表現(xiàn)在評(píng)價(jià)實(shí)踐的倫理性、高效性和規(guī)范性,即高質(zhì)量的教育評(píng)價(jià)應(yīng)該是高信度、高效度、合乎倫理、高效、規(guī)范。對(duì)于運(yùn)用信息技術(shù)為何能夠提高評(píng)價(jià)質(zhì)量,“高效、規(guī)范”前文已多有涉及,含義也較為明確,限于篇幅,不再討論。下面分析信息技術(shù)對(duì)于信度、效度、倫理性的促進(jìn)作用。

“信度”指教育評(píng)價(jià)指標(biāo)和工具的準(zhǔn)確性和精確度,表示通過某一特定測(cè)量程序得出的分值的一致性和可復(fù)制性的程度(Thorndike, 等, 2018, p.130)。在評(píng)價(jià)過程中產(chǎn)生誤差、影響信度的因素很多,如評(píng)價(jià)對(duì)象與評(píng)價(jià)者狀態(tài)、評(píng)價(jià)工具、評(píng)價(jià)實(shí)施環(huán)境、評(píng)價(jià)過程等(吳鋼, 2015, p.195)。信息技術(shù)通過測(cè)試過程與任務(wù)呈現(xiàn)的標(biāo)準(zhǔn)化、數(shù)據(jù)統(tǒng)計(jì)分析的準(zhǔn)確性以及利用項(xiàng)目反應(yīng)理論模型動(dòng)態(tài)計(jì)算等方式提高評(píng)價(jià)信度。在互聯(lián)網(wǎng)在線數(shù)據(jù)收集中,如在線問卷填寫或者在線測(cè)驗(yàn)時(shí),計(jì)算機(jī)可以通過強(qiáng)制作答、自動(dòng)呈現(xiàn)/跳過題目、檢測(cè)回答有效性等方式,減少答題誤差,提高評(píng)價(jià)信度。此外,配備特定的硬件后,計(jì)算機(jī)還可以實(shí)時(shí)檢測(cè)被試的注意力、情緒狀態(tài)是否異常等,從而進(jìn)一步提高評(píng)價(jià)信度。

“效度”指教育評(píng)價(jià)在多大程度上測(cè)量了所要測(cè)量的。教育評(píng)價(jià)的效度主要取決于指標(biāo)體系的合理性和所用測(cè)量工具(如測(cè)驗(yàn))的效度。測(cè)驗(yàn)效度指在運(yùn)用測(cè)驗(yàn)時(shí)對(duì)于測(cè)驗(yàn)分?jǐn)?shù)的解讀可以得到證據(jù)和理論支持的程度(Thorndike, 等, 2018, p.172)。具有一定效度的評(píng)價(jià)結(jié)果才是有決策參考價(jià)值的。具有一定的信度是高效度的前提,但高信度不能保證高效度。例如,學(xué)生頭圍的測(cè)量信度很高,但用其測(cè)量學(xué)生閱讀能力則效度很低,而用來(lái)決定買多大的帽子則效度很高。效度取決于解釋與使用評(píng)價(jià)結(jié)果達(dá)到特定目的的程度。教育評(píng)價(jià)至少應(yīng)具備內(nèi)容效度、結(jié)構(gòu)效度與效標(biāo)關(guān)聯(lián)效度。內(nèi)容效度的鑒定主要采用邏輯分析的方法,常用專家判斷的方式(吳鋼, 2015, p.184),信息技術(shù)的作用不大。結(jié)構(gòu)效度的鑒定多采用因子分析法,計(jì)算量很大,需要借助計(jì)算機(jī)完成(吳鋼, 2015, p.184)。效標(biāo)關(guān)聯(lián)效度是看評(píng)價(jià)結(jié)果與外部效標(biāo)(如:在研發(fā)新型測(cè)試時(shí),其他成熟的等價(jià)測(cè)驗(yàn);在招聘中,被錄取人員在工作中的實(shí)際績(jī)效可作為外部效標(biāo)),評(píng)價(jià)系統(tǒng)若能與其他系統(tǒng)對(duì)接,關(guān)聯(lián)相關(guān)數(shù)據(jù),對(duì)于未來(lái)考察評(píng)價(jià)的效標(biāo)關(guān)聯(lián)效度將是很有益的。影響評(píng)價(jià)度的因素和影響信度的因素很多是重合的(吳鋼, 2015, pp.187-188),因此“信度”部分所提到的信息技術(shù)作用也有利于效度的提高。此外,由于計(jì)算機(jī)多媒體技術(shù),尤其是虛擬現(xiàn)實(shí)技術(shù)能夠構(gòu)建交互式虛擬仿真環(huán)境,且能夠跟蹤環(huán)境中問題解決的步驟,對(duì)于問題解決能力、認(rèn)知與動(dòng)作技能、認(rèn)知策略的測(cè)評(píng)可能是效度更高的測(cè)評(píng)方法(孫鑫, 等, 2018)。

“倫理性”指教育評(píng)價(jià)不應(yīng)歧視任何評(píng)價(jià)對(duì)象,應(yīng)公平公正,重視隱私保護(hù),維護(hù)評(píng)價(jià)對(duì)象利益。對(duì)于教育評(píng)價(jià)而言這應(yīng)該是第一位的。信息技術(shù)在這方面的應(yīng)用空間很大。例如,通過合理設(shè)計(jì)測(cè)試系統(tǒng),保證學(xué)生匿名及評(píng)分閱卷過程的身份隱藏;借助視覺、聽覺輔助技術(shù),使特殊需要學(xué)生也能夠參加測(cè)試;根據(jù)學(xué)生情況,生成文化公平的測(cè)試,等等。

(六)信息技術(shù)拓展教育評(píng)價(jià)結(jié)果應(yīng)用

信息技術(shù)的信息重組重用能力以及開放性,為評(píng)價(jià)過程與結(jié)果信息的重用提供了更多的可能,主要可用于改進(jìn)教學(xué)、改進(jìn)評(píng)價(jià)、促進(jìn)相關(guān)者實(shí)踐反思。

改進(jìn)教學(xué)指教師或者計(jì)算機(jī)根據(jù)對(duì)學(xué)生表現(xiàn)做出的形成性評(píng)價(jià),調(diào)整學(xué)習(xí)內(nèi)容或方法,實(shí)現(xiàn)教學(xué)個(gè)性化。智能輔導(dǎo)系統(tǒng)(如Cognitive Tutor)是用“算法”調(diào)整教學(xué)的典型,其調(diào)整教學(xué)所依據(jù)的學(xué)生模型就是在監(jiān)控學(xué)生問題解決的過程中實(shí)時(shí)評(píng)價(jià)數(shù)據(jù)的匯總(Anderson, et al., 1995)。對(duì)于學(xué)生的在線測(cè)試,系統(tǒng)能夠?qū)崿F(xiàn)自動(dòng)統(tǒng)計(jì)與可視化呈現(xiàn),幫助教師客觀、全面地把握學(xué)生學(xué)習(xí)情況,輔助教師的教學(xué)決策,比如高中物理精準(zhǔn)教學(xué)(祝令健, 等, 2020)和ASSISTments系統(tǒng)在教學(xué)中的使用方式(Heffernan, et al., 2014)。

改進(jìn)評(píng)價(jià)指利用評(píng)價(jià)過程與結(jié)果的信息,對(duì)評(píng)價(jià)全過程進(jìn)行“再評(píng)價(jià)”,以提升評(píng)價(jià)質(zhì)量。若能在評(píng)價(jià)活動(dòng)中注意利用信息技術(shù)收集整理過程性數(shù)據(jù),就可以完整、真實(shí)地再現(xiàn)評(píng)價(jià)過程,使再評(píng)價(jià)過程“基于真實(shí)數(shù)據(jù)”,提高客觀性與準(zhǔn)確性。

促進(jìn)相關(guān)者實(shí)踐反思指信息技術(shù)為評(píng)價(jià)結(jié)果提供了新的傳播展示途徑?;ヂ?lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng)是評(píng)價(jià)結(jié)果傳播的有效平臺(tái)。例如,視頻網(wǎng)站、微信公眾號(hào)、微信群等,不但可以把評(píng)價(jià)結(jié)果精準(zhǔn)推送給特定人群,還可以提供閱讀量、轉(zhuǎn)發(fā)量等統(tǒng)計(jì)數(shù)據(jù),而且具有互動(dòng)功能,有利于基于評(píng)價(jià)結(jié)果形成實(shí)踐改進(jìn)共同體,更好地發(fā)揮評(píng)價(jià)的實(shí)踐改進(jìn)作用。

三、教育評(píng)價(jià)中利用信息技術(shù)的挑戰(zhàn)與風(fēng)險(xiǎn)

教育評(píng)價(jià)是價(jià)值導(dǎo)向的活動(dòng),信息技術(shù)應(yīng)該只在工具層面起作用,但是工具會(huì)改變主體的實(shí)踐方式,會(huì)潛移默化地改變主體的認(rèn)知方式與主體間的相互作用方式。對(duì)組織機(jī)構(gòu)來(lái)說,信息系統(tǒng)有時(shí)像打入機(jī)構(gòu)內(nèi)部的“木馬”,可能會(huì)打破組織的邊界與平衡。工具性信息技術(shù)應(yīng)用也會(huì)產(chǎn)生社會(huì)后果。鑒于教育評(píng)價(jià)影響的滯后性和自我強(qiáng)化性①,必須警惕信息技術(shù)應(yīng)用帶來(lái)的挑戰(zhàn)與可能風(fēng)險(xiǎn)。

(一)評(píng)價(jià)主體評(píng)價(jià)信息應(yīng)用能力不足,影響信息技術(shù)應(yīng)用效果

李政濤(2020)認(rèn)為《方案》的落實(shí)關(guān)鍵在于“落實(shí)主體”,即教育局局長(zhǎng)、校長(zhǎng)和教師對(duì)方案具有足夠的“理解能力、運(yùn)用能力,以及運(yùn)用之后的反思能力與重建能力”,落實(shí)過程充滿挑戰(zhàn)。

在教育評(píng)價(jià)中有效運(yùn)用信息技術(shù),對(duì)評(píng)價(jià)主體提出了更高要求。在認(rèn)識(shí)層面,需要對(duì)教育評(píng)價(jià)改革理念和運(yùn)作方式有深刻理解,需要明確信息技術(shù)的微觀作用方式,中觀層面上對(duì)于組織行為的影響,以及對(duì)組織和個(gè)體信息技術(shù)條件、能力的要求;能夠開闊視野,了解社會(huì)系統(tǒng)中可以憑借的信息化力量;能夠充分估計(jì)到信息技術(shù)應(yīng)用的預(yù)期作用和副作用。在實(shí)踐層面,能夠設(shè)計(jì)開放靈活的機(jī)制,整合資源,充分利用社會(huì)專業(yè)力量補(bǔ)齊能力短板,創(chuàng)造條件,保障評(píng)價(jià)順利實(shí)施,確保善用評(píng)價(jià)結(jié)果,控制總體成本與潛在風(fēng)險(xiǎn)。這些要求與前面的挑戰(zhàn)相疊加,一方面凸顯信息技術(shù)賦能評(píng)價(jià)的潛力,另一方面讓評(píng)價(jià)過程更加復(fù)雜動(dòng)態(tài),若支持與管理跟不上、方法設(shè)計(jì)不合理,可能反而會(huì)增加評(píng)價(jià)成本,降低評(píng)價(jià)質(zhì)量。

(二)信息技術(shù)自身不穩(wěn)定、不可靠,增加評(píng)價(jià)成本

對(duì)于評(píng)價(jià)者而言,信息技術(shù)的不穩(wěn)定,尤其是硬件、平臺(tái)類軟件技術(shù)(如操作系統(tǒng)、瀏覽器、Flash②、Java、Python、辦公套件等)的更新,可能會(huì)導(dǎo)致已有“投資”成為沉沒成本。所謂“投資”,不僅包括硬件和操作系統(tǒng),可能還包括評(píng)價(jià)應(yīng)用系統(tǒng)、人員的知識(shí)經(jīng)驗(yàn)與技能、培訓(xùn)資料等。若軟硬件升級(jí)導(dǎo)致歷史數(shù)據(jù)無(wú)法使用,可能會(huì)造成更嚴(yán)重的后果。因此,對(duì)于常規(guī)性的評(píng)價(jià)工作,信息技術(shù)的不穩(wěn)定所造成的成本增加,是必須要充分考慮的。

信息技術(shù)的不可靠性很隱蔽,給教育評(píng)價(jià)質(zhì)量造成的影響可能很大,可能會(huì)導(dǎo)致數(shù)據(jù)收集失敗,或者數(shù)據(jù)分析出現(xiàn)難以察覺的錯(cuò)誤。為應(yīng)對(duì)這種不可靠、不確定,在正式數(shù)據(jù)收集之前應(yīng)進(jìn)行全流程的充分測(cè)試,而且要制定備用計(jì)劃,如利用本地服務(wù)器、預(yù)留備用數(shù)據(jù)收集時(shí)間、保持備份服務(wù)器同時(shí)運(yùn)行等,這都會(huì)增加組織、時(shí)間、人力成本。

(三)易流于“數(shù)據(jù)驅(qū)動(dòng)”,不利于評(píng)價(jià)的價(jià)值導(dǎo)向與問題驅(qū)動(dòng)

“數(shù)據(jù)驅(qū)動(dòng)”是當(dāng)前教育信息化領(lǐng)域的“日常”用語(yǔ)。和所有教育術(shù)語(yǔ)一樣,數(shù)據(jù)驅(qū)動(dòng)并沒有其字面意思所暗示的那樣客觀、中立、直截了當(dāng)。就“數(shù)據(jù)”一詞而言,盡管人們仔細(xì)厘清了現(xiàn)象、數(shù)據(jù)、信息、知識(shí)等相關(guān)術(shù)語(yǔ)的含義,也達(dá)成了一些共識(shí),但在實(shí)踐或研究中數(shù)據(jù)指代的東西非常多樣化。例如,以下都被稱為“數(shù)據(jù)”:學(xué)生的身高、一節(jié)微課的觀看次數(shù)、一節(jié)數(shù)學(xué)課的視頻、學(xué)生期末考試的排名、用回歸方程預(yù)測(cè)的學(xué)生高考分?jǐn)?shù)、學(xué)生志愿活動(dòng)的記錄單……,但它們的確定性以及所包含的加工處理、推斷程度,代表的意義、價(jià)值(信息量)存在很大差異。也就是說,“數(shù)據(jù)”自身就是多樣多層次的。最基礎(chǔ)的原始數(shù)據(jù)只是“原油”,量大、龐雜、價(jià)值稀疏,需要“精煉”才能使用。在“數(shù)據(jù)驅(qū)動(dòng)”過程中,選擇什么樣的數(shù)據(jù),如何分析數(shù)據(jù),如何呈現(xiàn)分析結(jié)果,分析結(jié)果和預(yù)期有出入,尤其是數(shù)據(jù)對(duì)于目標(biāo)產(chǎn)生懷疑時(shí)該如何處理沖突,這些問題的解決有賴于隱含在背后的價(jià)值導(dǎo)向與問題定位。若望文生義,僅從字面上看容易忽略這些問題。具體到教育評(píng)價(jià),在利用信息技術(shù)獲取大量數(shù)據(jù)后,一味強(qiáng)調(diào)“數(shù)據(jù)驅(qū)動(dòng)”存在如下風(fēng)險(xiǎn):

第一,過分關(guān)注指標(biāo)操作定義的便利性,降低評(píng)價(jià)效度,影響價(jià)值導(dǎo)向。在確定評(píng)價(jià)指標(biāo)體系與指標(biāo)的操作定義時(shí),不應(yīng)僅考慮數(shù)據(jù)易獲取性,更要注重價(jià)值導(dǎo)向與問題邏輯,否則會(huì)降低評(píng)價(jià)效度。例如,在高校學(xué)科排名中,指標(biāo)“課程教學(xué)質(zhì)量”的操作定義就不盡合理(石中英, 2019)。

第二,滿足于相關(guān)關(guān)系,不去探究因果機(jī)制,降低評(píng)價(jià)結(jié)果的發(fā)展作用。評(píng)價(jià)結(jié)果要改變實(shí)踐,就需要提供明確的操作建議,在不清楚因果機(jī)制和作用路徑的情況下,僅靠相關(guān)(調(diào)查同一現(xiàn)象的多側(cè)面數(shù)據(jù),數(shù)據(jù)之間很容易相關(guān),樣本量足夠大,也很容易在統(tǒng)計(jì)上顯著)實(shí)踐建議是否有效是隨機(jī)的,長(zhǎng)此以往會(huì)弱化評(píng)價(jià)的發(fā)展作用。

第三,在教育研究領(lǐng)域,“數(shù)據(jù)驅(qū)動(dòng)”研究取向的結(jié)果令人失望,這給同樣是知識(shí)生產(chǎn)的評(píng)價(jià)領(lǐng)域敲響了警鐘。MOOC讓教育研究領(lǐng)域興奮不已的原因之一是可以獲取大規(guī)模真實(shí)的學(xué)習(xí)行為數(shù)據(jù),有望極大推動(dòng)教育規(guī)律的探索。但是,2013年充滿希望的預(yù)期(李曼麗, 等, 2013, pp.176-177)并沒有成為現(xiàn)實(shí);七年后,Reich梳理了相關(guān)研究,發(fā)出“海量大數(shù)據(jù),微量新洞見(terabytes of data, little new insight)”的慨嘆;即便有一些發(fā)現(xiàn),也只是類似“學(xué)習(xí)行為越多,學(xué)習(xí)成績(jī)?cè)胶谩钡某WR(shí)性結(jié)論(Reich, 2020, p.37)。

(四)易形成“算法霸權(quán)”,降低評(píng)價(jià)結(jié)果的可解釋性

《算法霸權(quán)》是奧尼爾(2018)著作的中文譯名。書名直譯應(yīng)為《殺傷性數(shù)學(xué)武器——大數(shù)據(jù)是如何擴(kuò)大不平等和威脅民主的》?!八惴ò詸?quán)”生動(dòng)地表達(dá)出某些控制數(shù)據(jù)和算法的機(jī)構(gòu)對(duì)個(gè)體泰山壓頂式、不容置疑的威權(quán)性,故在此直接借用。

數(shù)據(jù)驅(qū)動(dòng)這一術(shù)語(yǔ)簡(jiǎn)短有力,但其背后有復(fù)雜的數(shù)據(jù)處理過程。如前文所述,原始數(shù)據(jù)復(fù)雜多樣、意義不彰,難以驅(qū)動(dòng)決策;由于其量大且形式多樣,處理復(fù)雜,個(gè)體難以在有限的時(shí)間內(nèi)進(jìn)行有效分析處理進(jìn)而把握其意義,因此需要借助計(jì)算機(jī)計(jì)算分析。借助算法從數(shù)據(jù)中提煉出“模型”,基于算法和模型所得出的“結(jié)論”才是真正能夠驅(qū)動(dòng)決策與行動(dòng)的。

在商業(yè)、體育、金融、娛樂、招聘等領(lǐng)域,算法模型已得到廣泛應(yīng)用。算法在為資本賺取高額利潤(rùn)的同時(shí),惡化了處境不利群體的生存狀況(奧尼爾,2018, p.172)。奧尼爾(2018, p.17)認(rèn)為信息技術(shù)不僅能夠造就好的模型,更容易造就不好的模型(殺傷性數(shù)學(xué)武器)。前者如棒球隊(duì)模型,使用者(教練和球員)清楚模型的原理、能夠用最新的真實(shí)數(shù)據(jù)調(diào)整模型、模型使用直接變量(如隊(duì)員的比賽得分),而不是間接、替代變量(如隊(duì)員的胡子長(zhǎng)短)做預(yù)測(cè);后者如營(yíng)利性大學(xué)招生廣告投放算法、招聘簡(jiǎn)歷篩選模型,與棒球隊(duì)模型相反,不透明(學(xué)生不了解其運(yùn)作機(jī)制)、大量使用替代變量(種族、居住地等與學(xué)術(shù)表現(xiàn)無(wú)直接關(guān)系的變量)、模型更新不及時(shí)(模型訓(xùn)練出來(lái)后持續(xù)運(yùn)行,不會(huì)根據(jù)最新數(shù)據(jù)更新),使迫切需要教育機(jī)會(huì)的不利人群為教育花費(fèi)更多,背負(fù)上沉重的貸款負(fù)擔(dān),處境更糟。

教育評(píng)價(jià)應(yīng)具備權(quán)威性。因某些評(píng)價(jià)的高利害性,公平公正的權(quán)威性有時(shí)會(huì)給評(píng)價(jià)對(duì)象造成很大的心理壓力。信息技術(shù)尤其是互聯(lián)網(wǎng)和以數(shù)據(jù)為基礎(chǔ)的智能技術(shù),會(huì)大規(guī)模擴(kuò)大專業(yè)權(quán)威的作用面,可能加劇其不透明性傾向,使其成為更具社會(huì)壓迫性的力量。

可以預(yù)期,在未來(lái)評(píng)價(jià)中算法自動(dòng)做出的判斷會(huì)越來(lái)越多。“算法霸權(quán)”因判斷過程的不同特點(diǎn),存在很大差異。具體來(lái)說,第一類是人類個(gè)體能夠達(dá)成高度一致、能夠解釋判斷過程的,在這種情況下算法的危害不大,即使有問題也能很快調(diào)整。比如,閱卷時(shí)的題目切分、單詞拼寫、自動(dòng)推薦的學(xué)習(xí)材料的適切性等。第二類是人類個(gè)體能夠基本達(dá)成共識(shí),但不容易解釋清楚評(píng)價(jià)過程和依據(jù)的,在這種情況下算法如果有問題會(huì)造成混亂和不公平,雖然模型能調(diào)整,但是代價(jià)很高。比如,作文質(zhì)量判斷、一節(jié)課的教學(xué)效果、英語(yǔ)口語(yǔ)水平測(cè)試等。以英語(yǔ)口語(yǔ)自動(dòng)評(píng)價(jià)為例,用東南沿海地區(qū)初中生的英語(yǔ)口語(yǔ)語(yǔ)料訓(xùn)練出來(lái)的模型,在全國(guó)使用或者用于西部地區(qū)就可能存在公平性問題。第三類是對(duì)于個(gè)體未來(lái)表現(xiàn)的預(yù)測(cè)性評(píng)價(jià),其影響因素眾多,且效果驗(yàn)證具有滯后性,人類專家有時(shí)也難以達(dá)成共識(shí),在這種情況下算法霸權(quán)的危害可能會(huì)極大。例如招生考試、企業(yè)招聘等。預(yù)測(cè)正是智能技術(shù)的特長(zhǎng),但這也是智能算法最受詬病的地方。目前企業(yè)招聘部門普遍利用智能算法篩選簡(jiǎn)歷,其結(jié)果是,很多應(yīng)聘者因?yàn)橄嚓P(guān)變量,如性別、居住地、第一學(xué)歷學(xué)校級(jí)別等就被刷掉,根本沒有展示與崗位相關(guān)能力的機(jī)會(huì)(奧尼爾, 2018, p.126)。這樣一來(lái),短期是對(duì)特定群體中的個(gè)體利益的侵害,長(zhǎng)期將降低社會(huì)的垂直流動(dòng)性,助長(zhǎng)階層固化。這是評(píng)價(jià)缺乏效度的典型案例。這警示我們利用信息技術(shù)并不一定能夠提高評(píng)價(jià)質(zhì)量。

當(dāng)智能技術(shù)大規(guī)模應(yīng)用于評(píng)價(jià),尤其要警惕這種現(xiàn)象的出現(xiàn),要警惕不可解釋、不透明的算法所做出的評(píng)價(jià)判斷。這里的不可解釋指技術(shù)上的不可解釋,如深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練出的模型;不透明,指人為設(shè)置制度障礙來(lái)阻止利益相關(guān)者理解算法決策原理,比如以商業(yè)機(jī)密為由拒絕公開算法細(xì)節(jié),不透明算法的倫理風(fēng)險(xiǎn)更高。不管哪種情況,都需要逐步糾正改進(jìn)。教育評(píng)價(jià)發(fā)展功能的實(shí)現(xiàn),需要評(píng)價(jià)對(duì)象理解評(píng)價(jià)標(biāo)準(zhǔn)和過程,需要算法具有可解釋性、透明性。

(五)易濫用過程性數(shù)據(jù),混淆形成性評(píng)價(jià)與過程評(píng)價(jià)

《方案》將“強(qiáng)化過程評(píng)價(jià)”作為改革的主要原則之一。鑒于信息技術(shù)極其擅長(zhǎng)過程跟蹤、數(shù)據(jù)整合(重組重用)、數(shù)據(jù)管理,再加上目前對(duì)教育大數(shù)據(jù)、學(xué)習(xí)分析的普遍關(guān)注,這些因素與對(duì)過程評(píng)價(jià)創(chuàng)新的熱望與壓力重疊,可以想象在未來(lái)幾年,用信息技術(shù)創(chuàng)新過程評(píng)價(jià)一定是研究與實(shí)踐的熱點(diǎn)。信息技術(shù)會(huì)在過程評(píng)價(jià)變革中起到重要作用,甚至?xí)蔀檫^程評(píng)價(jià)創(chuàng)新的基礎(chǔ)。但也需要注意一些可以預(yù)見的挑戰(zhàn)與風(fēng)險(xiǎn):

第一,對(duì)于過程評(píng)價(jià)的認(rèn)識(shí)不統(tǒng)一,容易導(dǎo)致實(shí)踐偏差。過程評(píng)價(jià)不是新鮮事物,在研究與實(shí)踐中已長(zhǎng)期存在。但即使在學(xué)界,對(duì)其也存在多種認(rèn)識(shí)。雷新勇(2020)列舉了三種理解,即對(duì)學(xué)生發(fā)展的過程性評(píng)價(jià)(如檔案袋)、對(duì)學(xué)生知識(shí)技能習(xí)得過程的評(píng)價(jià)以及對(duì)教師教學(xué)過程的評(píng)價(jià)。邊新燦(2016)探討了高考中的過程評(píng)價(jià),認(rèn)為它是為了緩解結(jié)果評(píng)價(jià)獨(dú)大、“一考定終身”的不良影響而設(shè)計(jì)的,其實(shí)現(xiàn)路徑包括把高中學(xué)業(yè)水平考試納入高考評(píng)價(jià)體系、部分科目實(shí)行一年多考等。就學(xué)生評(píng)價(jià)而言,雷新勇(2020)的第一種理解和邊新燦(2016)的理解是一致的,也是合理的,即過程評(píng)價(jià)與結(jié)果評(píng)價(jià)相對(duì),強(qiáng)調(diào)在為選拔、問責(zé)而評(píng)價(jià)時(shí),要綜合某一時(shí)間段的多次表現(xiàn)信息(過程評(píng)價(jià))和最后某一時(shí)間點(diǎn)的表現(xiàn)信息(結(jié)果評(píng)價(jià)),而不僅僅靠最后一次結(jié)果進(jìn)行評(píng)價(jià)決策。

第二,易混淆形成性評(píng)價(jià)與過程評(píng)價(jià),濫用過程性數(shù)據(jù),造成外部總結(jié)性評(píng)價(jià)泛化。形成性評(píng)價(jià)以為正在進(jìn)行的教育活動(dòng)提供反饋為目的,旨在改進(jìn)課程設(shè)計(jì)、教學(xué)實(shí)施和學(xué)生學(xué)習(xí);它與總結(jié)性評(píng)價(jià)相對(duì)(陳玉琨, 2019, p.18)。形成性評(píng)價(jià)是課程與教學(xué)的有機(jī)組成部分,是教師教學(xué)工作的重要方面,應(yīng)該在教師專業(yè)自主權(quán)范圍之內(nèi)。例如,單元測(cè)試是很常用的形成性評(píng)價(jià)手段,幫助教師了解教學(xué)效果,幫助學(xué)生查漏補(bǔ)缺。這類測(cè)試成績(jī)一旦變?yōu)榭偨Y(jié)性評(píng)價(jià)(如初中學(xué)業(yè)水平考試、中考、高考)的一部分,它就不再是形成性評(píng)價(jià),而是過程評(píng)價(jià)(陶西平, 2012, p173)。由于信息技術(shù)在學(xué)校教學(xué)中的廣泛應(yīng)用,使學(xué)習(xí)過程數(shù)據(jù)極易收集,盡管過程評(píng)價(jià)改革的壓力很大,教育局、學(xué)校一定要抑制將形成性評(píng)價(jià)轉(zhuǎn)變?yōu)檫^程評(píng)價(jià)的沖動(dòng),這有很高的倫理風(fēng)險(xiǎn),同時(shí)可能會(huì)鎖定學(xué)生成長(zhǎng),增加學(xué)生學(xué)業(yè)負(fù)擔(dān),還可能導(dǎo)致家庭對(duì)學(xué)生學(xué)習(xí)產(chǎn)生更大的影響力。

第三,區(qū)分評(píng)價(jià)對(duì)象與評(píng)價(jià)類型,合理設(shè)定過程評(píng)價(jià)與結(jié)果評(píng)價(jià)的比重。對(duì)處于成長(zhǎng)中的兒童和青少年個(gè)體,過程評(píng)價(jià)存在鎖定效應(yīng)與可信性風(fēng)險(xiǎn),應(yīng)充分尊重個(gè)體生命成長(zhǎng)的不確定性、非線性與獨(dú)特性,慎用過程評(píng)價(jià),防止過程評(píng)價(jià)限制、鎖定學(xué)生發(fā)展,導(dǎo)致“浪子”無(wú)法“回頭”。對(duì)于教育機(jī)構(gòu)(如學(xué)校),過程評(píng)價(jià)有助于提升教育供給質(zhì)量,提高日常教學(xué)、服務(wù)、管理質(zhì)量,故宜增加過程評(píng)價(jià)占比。

四、教育評(píng)價(jià)中信息技術(shù)可持續(xù)

應(yīng)用的對(duì)策建議

基于以上分析,為促進(jìn)教育評(píng)價(jià)中信息技術(shù)的可持續(xù)應(yīng)用,使之切實(shí)為教育評(píng)價(jià)服務(wù),進(jìn)一步提高教育評(píng)價(jià)的科學(xué)性、客觀性與專業(yè)性,建議如下:

(一)開展評(píng)價(jià)主體的教育評(píng)價(jià)信息技術(shù)應(yīng)用能力建設(shè),提升教育評(píng)價(jià)質(zhì)量

學(xué)校和教育局是教育評(píng)價(jià)信息技術(shù)應(yīng)用能力建設(shè)最重要的主體,其能力建設(shè)主要體現(xiàn)在人才儲(chǔ)備和體制機(jī)制建設(shè)兩個(gè)層面。信息技術(shù)只有通過專業(yè)技術(shù)人才方能實(shí)現(xiàn)“賦能”?!斗桨浮芬矊ⅰ芭囵B(yǎng)教育評(píng)價(jià)專門人才”作為組織實(shí)施的保障性舉措。具體建議:第一,變革教育評(píng)價(jià)、教育測(cè)量等相關(guān)專業(yè)課程設(shè)置,在常規(guī)統(tǒng)計(jì)學(xué)、測(cè)量學(xué)課程之外適當(dāng)增加線性代數(shù)、計(jì)算機(jī)編程和數(shù)據(jù)科學(xué)等相關(guān)課程,提高學(xué)生的信息技術(shù)素養(yǎng)、數(shù)據(jù)素養(yǎng);第二,對(duì)于在職的教育評(píng)價(jià)專業(yè)人員,鑒于MOOC在在職/專業(yè)碩士教育中的有效應(yīng)用(Reich, 2020, p.20),可以通過由專業(yè)機(jī)構(gòu)(如統(tǒng)計(jì)與測(cè)量專業(yè)相關(guān)協(xié)會(huì))開設(shè)網(wǎng)絡(luò)直播講座、MOOC課程等方式,提供課程學(xué)分認(rèn)證,促進(jìn)其專業(yè)發(fā)展;第三,在國(guó)家或區(qū)域?qū)用?,建設(shè)教育評(píng)價(jià)信息技術(shù)應(yīng)用案例庫(kù),以傳播先進(jìn)經(jīng)驗(yàn);第四,倡導(dǎo)科教、產(chǎn)教融合,鼓勵(lì)引導(dǎo)專業(yè)評(píng)價(jià)機(jī)構(gòu)與信息技術(shù)行業(yè)企業(yè)探索整合力量的開放機(jī)制。

(二)研制教育評(píng)價(jià)數(shù)據(jù)規(guī)范,保證數(shù)據(jù)向后兼容,緩解信息技術(shù)不穩(wěn)定帶來(lái)的影響

數(shù)據(jù)規(guī)范的作用主要體現(xiàn)在以下幾個(gè)方面:一是在信息技術(shù)快速更新(不穩(wěn)定)仍會(huì)持續(xù)的情況下保證數(shù)據(jù)的向后兼容性①,保護(hù)最重要的資產(chǎn)“數(shù)據(jù)”在未來(lái)的可用性。二是在鼓勵(lì)利用信息技術(shù)創(chuàng)新評(píng)價(jià)工具的情況下,為了降低創(chuàng)新成本,“數(shù)據(jù)孤島”現(xiàn)象在所難免,關(guān)鍵是這些系統(tǒng)之間在必要的時(shí)候能夠交換、集成數(shù)據(jù),這時(shí)數(shù)據(jù)規(guī)范就能夠起到作用。例如,目前各省的高中生綜合素質(zhì)評(píng)價(jià)數(shù)據(jù)不兼容、難以整合的現(xiàn)實(shí)問題,是招生高校在操作層面面臨的難題,即評(píng)價(jià)數(shù)據(jù)規(guī)范已有現(xiàn)實(shí)需求。三是好的規(guī)范能夠起到引導(dǎo)發(fā)展、幫助評(píng)價(jià)主體提高數(shù)據(jù)意識(shí)的作用。四是對(duì)于國(guó)家省部級(jí)立項(xiàng)的課題或行動(dòng)計(jì)劃,可以強(qiáng)制其遵循數(shù)據(jù)規(guī)范,逐步規(guī)范數(shù)據(jù)采集、存儲(chǔ),在這些項(xiàng)目的引導(dǎo)與示范下,數(shù)據(jù)規(guī)范有望更好地落地。

另外,在研制數(shù)據(jù)規(guī)范的同時(shí),為促進(jìn)規(guī)范落地,也為了更大規(guī)模的研究與人才培養(yǎng),還應(yīng)同時(shí)建立符合規(guī)范的、經(jīng)過匿名化處理的、由真實(shí)數(shù)據(jù)構(gòu)成的公共測(cè)試數(shù)據(jù)集。一方面是為了實(shí)際測(cè)試教育評(píng)價(jià)數(shù)據(jù)規(guī)范的可行性,另一方面也是希望起到ImageNet對(duì)于人工智能計(jì)算機(jī)視覺領(lǐng)域的作用②,促進(jìn)教育評(píng)價(jià)行業(yè)的健康發(fā)展。

(三)建立評(píng)價(jià)迭代更新機(jī)制,落實(shí)價(jià)值導(dǎo)向與問題驅(qū)動(dòng),規(guī)范“數(shù)據(jù)驅(qū)動(dòng)”

教育評(píng)價(jià)改革不可能一蹴而就,教育評(píng)價(jià)中的信息技術(shù)應(yīng)用也是如此。教育評(píng)價(jià)的“再評(píng)價(jià)”能夠提高教育評(píng)價(jià)信度、效度和效益,但再評(píng)價(jià)的實(shí)踐還不普遍(吳鋼, 2015, p.180)??梢砸孕畔⒓夹g(shù)應(yīng)用為契機(jī),建立鼓勵(lì)再評(píng)價(jià)的機(jī)制,逐步完善評(píng)價(jià)迭代更新的機(jī)制。在再評(píng)價(jià)過程中,為避免過分強(qiáng)調(diào)數(shù)據(jù)而忽略價(jià)值導(dǎo)向,應(yīng)重點(diǎn)核查評(píng)價(jià)的效度,尤其是指標(biāo)體系操作化涉及的數(shù)據(jù)與評(píng)價(jià)目的、內(nèi)容的直接相關(guān)性。應(yīng)實(shí)現(xiàn)評(píng)價(jià)指標(biāo)和操作方法的公開透明,向評(píng)價(jià)對(duì)象說明評(píng)價(jià)各項(xiàng)指標(biāo)的意義,以及指標(biāo)數(shù)據(jù)對(duì)于實(shí)踐活動(dòng)的促進(jìn)作用。以此逐漸杜絕為了方便而進(jìn)入評(píng)價(jià)指標(biāo)的數(shù)據(jù),并規(guī)范、約束和引導(dǎo)“數(shù)據(jù)驅(qū)動(dòng)”。

(四)發(fā)展評(píng)價(jià)對(duì)象自評(píng)能力,探索評(píng)價(jià)決策知情與算法透明機(jī)制,對(duì)抗“算法霸權(quán)”

為對(duì)抗“算法霸權(quán)”,提高算法與模型的可解釋,建議采取兩方面的舉措:

第一,建立關(guān)鍵算法與模型的公共審查機(jī)制。為防止“算法霸權(quán)”,應(yīng)要求產(chǎn)品研發(fā)機(jī)構(gòu)向公眾或者利益相關(guān)者說明算法和模型原理,將其作為教育產(chǎn)品準(zhǔn)入或者認(rèn)證的基本要求。例如,在消費(fèi)領(lǐng)域大數(shù)據(jù)殺熟等現(xiàn)象已引起普遍關(guān)注,中國(guó)消費(fèi)者協(xié)會(huì)于2021年1月召開座談會(huì)呼吁加強(qiáng)網(wǎng)絡(luò)消費(fèi)領(lǐng)域算法規(guī)制,保障消費(fèi)者知情權(quán)、選擇權(quán)和公平交易權(quán)①。

第二,激發(fā)評(píng)價(jià)對(duì)象知情權(quán)意識(shí),發(fā)展利用信息技術(shù)的自評(píng)價(jià)能力。教育評(píng)價(jià)的“初心”是為了提高教育質(zhì)量。正如王策三(2005, p.305)所指出的,在教學(xué)過程中的評(píng)價(jià),最有效的是發(fā)展“自評(píng)價(jià)”能力。在個(gè)體對(duì)抗“算法霸權(quán)”時(shí),個(gè)體知情權(quán)意識(shí)的覺醒、對(duì)于評(píng)價(jià)本身的批判分析能力是最根本的?;ヂ?lián)網(wǎng)與人工智能在這方面作用空間很大,一方面提供了評(píng)價(jià)對(duì)象共同體,可以匯聚發(fā)現(xiàn)的問題,另一方面也提供了公共數(shù)據(jù)、算力和工具(涂子沛, 2014, p.272),因此有沒有意識(shí)與能力運(yùn)用這些工具就非常關(guān)鍵,而這有賴于個(gè)體評(píng)價(jià)素養(yǎng)的提升。

(五)提升全社會(huì)教育評(píng)價(jià)素養(yǎng),確保教育評(píng)價(jià)的發(fā)展功能落實(shí)

《方案》落實(shí)是需要全社會(huì)參與的系統(tǒng)工程。由于教育評(píng)價(jià)的專業(yè)性與綜合性,教育評(píng)價(jià)的直接利益相關(guān)者——教師、學(xué)生和家長(zhǎng),都需要提升教育評(píng)價(jià)素養(yǎng)(評(píng)價(jià)意識(shí)、知識(shí)、技能與能力)。

教師是核心,而且要起到引導(dǎo)和輻射的作用。應(yīng)為教師提供系統(tǒng)的培訓(xùn),幫助教師認(rèn)識(shí)到教育評(píng)價(jià)對(duì)于自身、學(xué)生以及課程教學(xué)的影響,尤其要明確形成性評(píng)價(jià)與過程評(píng)價(jià)的區(qū)別,尊重學(xué)生發(fā)展的規(guī)律,明確信息技術(shù)自動(dòng)評(píng)價(jià)的問題與風(fēng)險(xiǎn)。

學(xué)生往往是大規(guī)模評(píng)價(jià)的直接對(duì)象,但因年齡段的差異,對(duì)評(píng)價(jià)的認(rèn)識(shí)深淺不同。對(duì)于初中及以上的學(xué)生,需要教師在教學(xué)中明確培養(yǎng)學(xué)生的“自評(píng)價(jià)”能力。同時(shí),對(duì)于各種正式評(píng)價(jià)的目的、方式、后果,要幫助學(xué)生對(duì)此有日益清晰的認(rèn)識(shí)。

對(duì)于學(xué)生的正式評(píng)價(jià),尤其是在基礎(chǔ)教育階段,真正感興趣的可能是家長(zhǎng),而不是學(xué)生。對(duì)于家長(zhǎng)的教育評(píng)價(jià)素養(yǎng)提升,可借助兩個(gè)途徑:一是依托學(xué)區(qū)學(xué)校的家長(zhǎng)學(xué)校,通過專題講座等方式系統(tǒng)地幫助家長(zhǎng)改變觀念、提升認(rèn)識(shí)水平;二是依托我國(guó)的科學(xué)普及體系,通過科協(xié)的科普活動(dòng)在科技場(chǎng)館、網(wǎng)站、電視等各種平臺(tái)上增加有關(guān)心理測(cè)量、考試、大數(shù)據(jù)與機(jī)器學(xué)習(xí)基本原理等知識(shí)。畢竟基于證據(jù)進(jìn)行審慎判斷與決策,也是科學(xué)素養(yǎng)的應(yīng)有之義。

五、小結(jié)

本文一開始就強(qiáng)調(diào)教育評(píng)價(jià)是特殊的知識(shí)生產(chǎn)實(shí)踐,是為了更突出評(píng)價(jià)也是對(duì)于未知的探索。對(duì)于教育評(píng)價(jià),最根本的對(duì)象恰恰是充滿可能性與不確定性的人類個(gè)體的身心成長(zhǎng)與發(fā)展?fàn)顟B(tài)。評(píng)價(jià)者只能依靠數(shù)據(jù)去推測(cè)其真實(shí)狀態(tài)。由于我們價(jià)值觀念與認(rèn)識(shí)能力的局限,推測(cè)是有可能與客觀事實(shí)不相符的。因此,應(yīng)對(duì)評(píng)價(jià)對(duì)象始終抱有認(rèn)知上的謙卑與謹(jǐn)慎。評(píng)價(jià)的特殊性在于評(píng)價(jià)所產(chǎn)生的知識(shí)是針對(duì)特定對(duì)象的,情境性很強(qiáng),而且具有直接的行動(dòng)意蘊(yùn),會(huì)對(duì)特定的人類個(gè)體命運(yùn)產(chǎn)生直接影響。在這個(gè)意義上,與其他教育研究相比,評(píng)價(jià)要求更高的知識(shí)與倫理標(biāo)準(zhǔn)。

在信息與智能時(shí)代,信息技術(shù)之于評(píng)價(jià)活動(dòng),正如技術(shù)之于人類的現(xiàn)代生活,“技術(shù)搭建起了我們居住的這所房屋……與早先的人類相比,我們幾乎已沒有生活在房屋之外的機(jī)會(huì)”(富蘭克林, 2019, p.9)。教育評(píng)價(jià)也已很難走到信息技術(shù)搭建的“房屋”之外。因此,在教育評(píng)價(jià)中用不用信息技術(shù)已經(jīng)是偽問題,如何用好信息技術(shù)才是真問題?!斗桨浮穼?duì)教育評(píng)價(jià)應(yīng)充分利用信息技術(shù)的強(qiáng)調(diào)和要求,能夠推動(dòng)信息技術(shù)應(yīng)用的實(shí)踐創(chuàng)新,推動(dòng)其進(jìn)一步規(guī)范化與規(guī)?;材軌蛱岣哐芯康淖杂X性、前瞻性與系統(tǒng)性。

信息技術(shù),尤其是新興的智能與網(wǎng)絡(luò)技術(shù),讓教育評(píng)價(jià)者有了強(qiáng)大的數(shù)據(jù)收集、分析與應(yīng)用工具。評(píng)價(jià)者對(duì)于數(shù)據(jù)收集過程的控制力,數(shù)據(jù)分析可用的數(shù)據(jù)規(guī)模、計(jì)算資源,評(píng)價(jià)可能影響的個(gè)體范圍,都有了很大的擴(kuò)展。智能技術(shù)的廣泛采用更有可能大大加強(qiáng)評(píng)價(jià)的自動(dòng)化、泛在性與影響力。但是,需要認(rèn)識(shí)到,對(duì)于教育評(píng)價(jià),即使全過程都利用了信息技術(shù),有所謂全過程的“大數(shù)據(jù)”,也并不會(huì)改變?cè)u(píng)價(jià)的取樣與推測(cè)本質(zhì),即評(píng)價(jià)本質(zhì)上依然是利用證據(jù)推測(cè)“未知”特質(zhì)的研究性活動(dòng)。信息技術(shù)支撐的評(píng)價(jià)活動(dòng),其推測(cè)推理成分并未減少,價(jià)值導(dǎo)向與問題驅(qū)動(dòng)反而前所未有地重要。

[參考文獻(xiàn)]

[美]阿杰伊·阿格拉沃爾,喬舒亞·甘斯,阿維·戈徳法布. 2018. AI極簡(jiǎn)經(jīng)濟(jì)學(xué)[M]. 長(zhǎng)沙:湖南科學(xué)技術(shù)出版社.

[美]阿蘭·柯林斯,理查德·哈爾弗森. 2013. 技術(shù)時(shí)代重新思考教育:數(shù)字革命與美國(guó)的學(xué)校教育[M]. 陳家剛,程佳銘,譯. 上海:華東師范大學(xué)出版社.

邊新燦. 2016. 過程評(píng)價(jià):高考改革和高中課程改革的共同探索——兼論高中學(xué)考、綜合素質(zhì)評(píng)價(jià)納入高考評(píng)價(jià)體系的內(nèi)在邏輯和現(xiàn)實(shí)途徑[J]. 考試研究(5):37-43.

陳玉琨. 2019. 教育評(píng)價(jià)學(xué)[M]. 北京:人民教育出版社.

[加]厄休拉 M. 富蘭克林. 2019. 技術(shù)的真相[M]. 田奧,譯. 南京:南京大學(xué)出版社.

[美]富蘭克林·福爾. 2019. 沒有思想的世界:科技巨頭對(duì)獨(dú)立思考的威脅[M]. 舍其,譯. 北京:中信出版集團(tuán).

顧明遠(yuǎn). 1998. 教育大辭典[M]. 上海:上海教育出版社.

賈海生. 2019. 高考體育術(shù)科測(cè)試信息化的實(shí)踐與思考[J]. 寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)(3):198-200.

[美]凱西·奧尼爾. 2018. 算法霸權(quán):數(shù)學(xué)殺傷性武器的威脅[M]. 馬青玲,譯. 北京:中信出版集團(tuán).

雷新勇. 2020. 關(guān)于教育評(píng)價(jià)改革的若干思考[J]. 中國(guó)考試(9):10-14.

李曼麗,張羽,葉賦桂. 2013. 解碼MOOC:大規(guī)模在線開放課程的教育學(xué)考察[M]. 北京:清華大學(xué)出版社.

李政濤. 2020. 把新時(shí)代教育評(píng)價(jià)改革深化到“評(píng)價(jià)能力”的提升那里去[J]. 中國(guó)教育學(xué)刊(12):8.

[美]理查德·E. 梅耶. 2016. 應(yīng)用學(xué)習(xí)科學(xué):心理學(xué)大師給教師的建議[M]. 盛群力,丁旭,鐘麗佳,譯. 北京:中國(guó)輕工業(yè)出版社.

蘆詠莉,申繼亮. 2012. 教師評(píng)價(jià)[M]. 北京:北京師范大學(xué)出版社.

[美]梅雷迪斯-D. 高爾,沃爾特-R. 博格,喬伊斯-P. 高爾. 2002. 教育研究方法導(dǎo)論[M]. 許慶豫,等,譯. 南京:江蘇教育出版社.

[美]尼葛洛龐帝. 1997. 數(shù)字化生存[M]. 海口:海南出版社.

[美]尼古拉斯·卡爾. 2015. 玻璃籠子:自動(dòng)化時(shí)代和我們的未來(lái)[M]. 楊柳,譯. 北京:中信出版社.

石中英. 2019. 學(xué)科排名的幾點(diǎn)認(rèn)識(shí)[M]//朱永新,袁振國(guó),馬國(guó)川. 重構(gòu)教育評(píng)價(jià)體系. 太原:山西教育出版社,99-106.

孫鑫,黎堅(jiān),符植煜. 2018. 利用游戲log-file預(yù)測(cè)學(xué)生推理能力和數(shù)學(xué)成績(jī)——機(jī)器學(xué)習(xí)的應(yīng)用[J]. 心理學(xué)報(bào)(7):761-770.

檀慧玲,李文燕,萬(wàn)興睿. 2018. 國(guó)際教育評(píng)價(jià)項(xiàng)目合作問題解決能力測(cè)評(píng):指標(biāo)框架、評(píng)價(jià)標(biāo)準(zhǔn)及技術(shù)分析[J]. 電化教育研究(9):123-128.

陶西平. 2012. 在反思中創(chuàng)新[M]. 北京:教育科學(xué)出版社.

涂子沛. 2014. 數(shù)據(jù)之巔——大數(shù)據(jù)革命,歷史、現(xiàn)實(shí)與未來(lái)[M]. 北京:中信出版集團(tuán).

[美]托馬斯·M. 尼科爾斯. 2019. 專家之死:反智主義的盛行及其影響[M]. 舒琦,譯. 北京:中信出版集團(tuán).

王策三. 2005. 教學(xué)論稿[M]. 第3版. 北京:人民教育出版社.

吳鋼. 2015. 現(xiàn)代教育評(píng)價(jià)教程[M]. 北京:北京大學(xué)出版社.

辛濤. 2020. “探索增值評(píng)價(jià)”的幾個(gè)關(guān)鍵問題[J]. 中小學(xué)管理(10):1.

[荷]雅普·希爾倫斯,賽斯·格拉斯,薩利·M. 托馬斯. 2017. 教育評(píng)價(jià)與監(jiān)測(cè)——一種系統(tǒng)的方法[M]. 北京:教育科學(xué)出版社.

游忠惠. 2013. 高考全面進(jìn)入信息化時(shí)代[N]. 中國(guó)教育報(bào),06-10(7).

袁銳鍔,易軼. 2004. 試析NBPTS優(yōu)秀教師認(rèn)定的標(biāo)準(zhǔn)與程序[J]. 比較教育研究(12):71-75.

[美]約翰·希利·布朗,保羅·杜奎德. 2003. 信息的社會(huì)層面[M]. 北京:商務(wù)印書館.

張志禎,童衛(wèi)軍,王博. 2015. “支持高等職業(yè)學(xué)校提升專業(yè)服務(wù)產(chǎn)業(yè)發(fā)展能力”項(xiàng)目——績(jī)效評(píng)價(jià)報(bào)告[M]. 北京:機(jī)械工業(yè)出版社.

張志禎. 2016. 虛擬現(xiàn)實(shí)教育應(yīng)用:追求身心一體的教育——從北京師范大學(xué)“智慧學(xué)習(xí)與VR教育應(yīng)用學(xué)術(shù)周”說起[J]. 中國(guó)遠(yuǎn)程教育(6):5-15,79.

周洪宇. 2020. 以科學(xué)的教育評(píng)價(jià)推動(dòng)新時(shí)代教育學(xué)發(fā)展[J]. 中國(guó)教育學(xué)刊(12):1-2.

周志華. 2018. 創(chuàng)辦一流大學(xué)人工智能教育的思考[J]. 中國(guó)高等教育(9):52-53.

祝令健,沈旭東. 2020. 大數(shù)據(jù)技術(shù)下基于精準(zhǔn)預(yù)習(xí)的高中物理精準(zhǔn)教學(xué)探討——以“向心加速度”為例[J]. 物理通報(bào)(2):40-44.

[美]N. 維納. 1978. 人有人的用途:控制論和社會(huì)[M]. 陳步,譯. 北京:商務(wù)印書館.

[美]Russell, S. J. & Norvig, P. 2013. 人工智能:一種現(xiàn)代的方法[M]. 第3版. 殷建平,祝恩,劉越,陳躍新,王挺,譯. 北京:清華大學(xué)出版社.

[美]Thorndike, R M. & Thorndike-Christ, T. 2018. 教育評(píng)價(jià):教育和心理學(xué)中的測(cè)量與評(píng)估[M]. 方群,等,譯. 北京:商務(wù)印書館.

Heffernan, N. T. , & Heffernan, C. L. . (2014). The ASSISTments ecosystem: building a platform that brings scientists and teachers together for minimally invasive research on human learning and teaching. International Journal of Artificial Intelligence in Education, 24(4), 470-497.

Reich, J. (2020). Failure to disrupt: why technology alone can't transform education. Cambridge: Harvard University Press. (Kindle edition).

收稿日期:2021-01-05

定稿日期:2021-01-15

作者簡(jiǎn)介:張志禎,博士,副教授,碩士生導(dǎo)師,北京師范大學(xué)教育學(xué)部教育技術(shù)學(xué)院(100875)。

齊文鑫,碩士,助理研究員,副部長(zhǎng),國(guó)家開放大學(xué)教務(wù)部(100039)。

責(zé)任編輯 劉 莉

猜你喜歡
信息技術(shù)評(píng)價(jià)教育
國(guó)外教育奇趣
題解教育『三問』
新一代信息技術(shù)征稿啟示
新一代信息技術(shù)征稿啟示
新一代信息技術(shù)征稿啟示
中藥治療室性早搏系統(tǒng)評(píng)價(jià)再評(píng)價(jià)
信息技術(shù)在幼兒教育中的有效應(yīng)用
教育有道——關(guān)于閩派教育的一點(diǎn)思考
基于Moodle的學(xué)習(xí)評(píng)價(jià)
保加利亞轉(zhuǎn)軌20年評(píng)價(jià)
阜新市| 右玉县| 贺州市| 珠海市| 法库县| 凤山县| 彩票| 山东省| 和静县| 合江县| 本溪| 育儿| 茶陵县| 彝良县| 徐汇区| 同江市| 青岛市| 芜湖市| 鸡泽县| 涿州市| 西宁市| 泸定县| 五大连池市| 长治市| 罗定市| 高邑县| 洛阳市| 沧源| 普定县| 华安县| 错那县| 鄂托克前旗| 云南省| 张家川| 萝北县| 五大连池市| 德保县| 泽普县| 新平| 新津县| 东海县|