黃濤 趙媛 耿晶 王涵 張浩 楊華利
摘要:綜合素質(zhì)評(píng)價(jià)是深化教育改革、落實(shí)立德樹(shù)人根本任務(wù)的必然要求。信息技術(shù)賦能教育教學(xué)過(guò)程,使得傳統(tǒng)教育評(píng)價(jià)機(jī)制向數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)方向邁進(jìn)。數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)是一種不斷獲取、整合、分析學(xué)習(xí)過(guò)程中的多模態(tài)數(shù)據(jù),對(duì)教學(xué)和學(xué)習(xí)活動(dòng)的信息流與運(yùn)行軌跡作出觀(guān)測(cè)、解釋和反饋,以發(fā)現(xiàn)教育中存在的問(wèn)題,輔助課堂教學(xué)干預(yù)的評(píng)價(jià)方法,包含多場(chǎng)景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化四個(gè)關(guān)鍵組成部分。多場(chǎng)景數(shù)據(jù)采集為學(xué)習(xí)評(píng)價(jià)提供數(shù)據(jù)來(lái)源和量化手段支撐,多空間數(shù)據(jù)融合為學(xué)習(xí)評(píng)價(jià)提供統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),精準(zhǔn)分析模型為學(xué)習(xí)評(píng)價(jià)提供數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)分析與評(píng)價(jià)方法,分析結(jié)果可視化為學(xué)習(xí)評(píng)價(jià)提供反饋和應(yīng)用服務(wù)。數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)框架,應(yīng)以區(qū)塊鏈技術(shù)為基礎(chǔ),融合人工智能、云計(jì)算、學(xué)習(xí)分析、情境感知等新興技術(shù),在多維時(shí)空尺度上全面采集學(xué)習(xí)過(guò)程中的多元海量數(shù)據(jù),通過(guò)全面、系統(tǒng)的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘,從學(xué)習(xí)者的內(nèi)在動(dòng)機(jī)到認(rèn)知發(fā)展、情感表現(xiàn),再到社會(huì)綜合交互能力,多維度、及時(shí)、準(zhǔn)確地評(píng)估學(xué)生的學(xué)習(xí)狀況。當(dāng)前,探索數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià),可從構(gòu)建符合多空間數(shù)據(jù)特征的綜合素質(zhì)評(píng)價(jià)框架,完善過(guò)程性數(shù)據(jù)的采集與共享機(jī)制,突破情感、認(rèn)知、動(dòng)機(jī)與社交評(píng)價(jià)的關(guān)鍵技術(shù),以及研制數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)評(píng)價(jià)平臺(tái)等方面入手。
關(guān)鍵詞:數(shù)據(jù)驅(qū)動(dòng);精準(zhǔn)化;學(xué)習(xí)評(píng)價(jià);評(píng)價(jià)機(jī)制;評(píng)價(jià)方法
中圖分類(lèi)號(hào):G434? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):1009-5195(2021)01-0003-10? doi10.3969/j.issn.1009-5195.2021.01.001
基金項(xiàng)目:國(guó)家自然科學(xué)基金面上項(xiàng)目“面向時(shí)空融合的學(xué)習(xí)者認(rèn)知診斷理論及關(guān)鍵技術(shù)研究”(619770332);中國(guó)科學(xué)院院士咨詢(xún)項(xiàng)目“我國(guó)科學(xué)教育發(fā)展戰(zhàn)略研究”(2018-Z10-A-025)。
作者簡(jiǎn)介:黃濤,博士,教授,博士生導(dǎo)師,華中師范大學(xué)人工智能教育學(xué)部、教育大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室(湖北武漢 430079)。趙媛,博士研究生,華中師范大學(xué)國(guó)家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079);講師,九江學(xué)院(江西九江 332005)。耿晶(通訊作者),博士研究生,華中師范大學(xué)教育大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室(湖北武漢 430079)。王涵,博士研究生,華中師范大學(xué)國(guó)家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079)。張浩,博士,副教授,碩士生導(dǎo)師,華中師范大學(xué)教育大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室(湖北武漢 430079)。楊華利,博士研究生,華中師范大學(xué)國(guó)家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079)。
2019年7月,中共中央、國(guó)務(wù)院印發(fā)《關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見(jiàn)》,提出要 “構(gòu)建以發(fā)展素質(zhì)教育為導(dǎo)向的科學(xué)評(píng)價(jià)體系,強(qiáng)化過(guò)程性和發(fā)展性評(píng)價(jià)”(新華網(wǎng),2019)。2020年10月,中共中央、國(guó)務(wù)院發(fā)布《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,將“改革學(xué)生評(píng)價(jià),促進(jìn)德智體美勞全面發(fā)展”列為重點(diǎn)內(nèi)容,提出“促進(jìn)學(xué)生全面發(fā)展的評(píng)價(jià)辦法更加多元”的改革目標(biāo)(新華網(wǎng),2020)。構(gòu)建多元、全過(guò)程、全要素的學(xué)生綜合評(píng)價(jià),需要改革傳統(tǒng)的以紙筆測(cè)試為主的學(xué)業(yè)評(píng)價(jià),充分利用信息技術(shù),探究以多種教學(xué)場(chǎng)景為背景,基于學(xué)生學(xué)習(xí)行為、認(rèn)知建構(gòu)、情感體驗(yàn)、思維變化、學(xué)業(yè)表現(xiàn)等多模態(tài)數(shù)據(jù),實(shí)現(xiàn)教學(xué)相長(zhǎng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)方式。
一、信息時(shí)代的學(xué)習(xí)評(píng)價(jià)現(xiàn)狀
學(xué)習(xí)評(píng)價(jià)經(jīng)歷測(cè)量、描述、價(jià)值判斷時(shí)代,逐步向意義建構(gòu)發(fā)展。傳統(tǒng)以紙筆測(cè)試為主的學(xué)業(yè)評(píng)價(jià),往往側(cè)重測(cè)試學(xué)生認(rèn)知方面的知識(shí)記憶與理解程度,對(duì)學(xué)生高階認(rèn)知能力如創(chuàng)造力的重視不夠,效果也不佳(田愛(ài)麗,2020)。對(duì)非認(rèn)知能力如學(xué)生的盡責(zé)表現(xiàn)、情緒調(diào)節(jié)、合作能力、思想開(kāi)放、社會(huì)交往等(OECD,2019)的發(fā)展情況,傳統(tǒng)的紙筆測(cè)試更是顯得無(wú)能為力。而且囿于數(shù)據(jù)和技術(shù)的雙重缺失,傳統(tǒng)學(xué)習(xí)評(píng)價(jià)與反饋結(jié)果呈現(xiàn)出模糊性和延時(shí)性等特征,這制約了其價(jià)值實(shí)現(xiàn)。隨著信息技術(shù)與教育的深度融合,學(xué)習(xí)環(huán)境、學(xué)習(xí)內(nèi)容、學(xué)習(xí)交互方式發(fā)生翻天覆地的變化,學(xué)習(xí)評(píng)價(jià)也隨之發(fā)生變化。依據(jù)教學(xué)評(píng)價(jià)場(chǎng)景的不同,本文從大規(guī)模學(xué)習(xí)評(píng)價(jià)、課堂學(xué)習(xí)評(píng)價(jià)和在線(xiàn)學(xué)習(xí)評(píng)價(jià)三個(gè)方面,對(duì)信息時(shí)代學(xué)習(xí)評(píng)價(jià)的規(guī)?;?、過(guò)程化和精準(zhǔn)化等特征進(jìn)行闡述。
1.大規(guī)模學(xué)習(xí)評(píng)價(jià)
大規(guī)模學(xué)習(xí)評(píng)價(jià)(Large-Scale Assessment)是一種通過(guò)對(duì)特定數(shù)量學(xué)生群體的整體成就水平和教育相關(guān)性因素進(jìn)行價(jià)值判斷,來(lái)監(jiān)測(cè)學(xué)生學(xué)習(xí)效果和判斷教育政策績(jī)效的評(píng)價(jià)方式(郭元祥等,2014)。與傳統(tǒng)教育評(píng)價(jià)使用經(jīng)典測(cè)量理論模型對(duì)學(xué)習(xí)者個(gè)體進(jìn)行比較和評(píng)估不同,大規(guī)模學(xué)習(xí)評(píng)價(jià)更注重對(duì)不同學(xué)習(xí)者群體的能力評(píng)價(jià)。
國(guó)外大規(guī)模學(xué)習(xí)評(píng)價(jià)中最有影響力的當(dāng)屬?lài)?guó)際教育成就評(píng)價(jià)協(xié)會(huì)發(fā)起的國(guó)際數(shù)學(xué)教育比較研究項(xiàng)目(The Trends in International Mathematics and Science Study,TIMSS)與聯(lián)合國(guó)經(jīng)濟(jì)合作與發(fā)展組織發(fā)起的國(guó)際學(xué)生評(píng)估項(xiàng)目(Program for International Student Assessment,PISA)。 TIMSS測(cè)評(píng)從1995年開(kāi)始以4年為一個(gè)周期,通過(guò)測(cè)試和問(wèn)卷,測(cè)量不同國(guó)家學(xué)生數(shù)學(xué)和科學(xué)學(xué)習(xí)狀況,以此了解各國(guó)課程目標(biāo)的實(shí)現(xiàn)程度。其最初的目標(biāo)分析框架由課程內(nèi)容、表現(xiàn)期望和觀(guān)點(diǎn)三個(gè)方面構(gòu)成,其中觀(guān)點(diǎn)涉及學(xué)生的態(tài)度、興趣等;自2003年開(kāi)始,知識(shí)和認(rèn)知維度成為其測(cè)評(píng)的主要維度(Mullis et al., 2014)。PISA測(cè)評(píng)自2000年起每3年為一個(gè)周期,測(cè)評(píng)不同國(guó)家15歲在校生的科學(xué)、數(shù)學(xué)、閱讀等核心素養(yǎng)及相關(guān)影響因素,以科學(xué)反映學(xué)生參與未來(lái)社會(huì)生活的能力,是對(duì)基礎(chǔ)教育進(jìn)行跨國(guó)家(地區(qū))、跨文化的評(píng)價(jià),為教育教學(xué)改進(jìn)提供有效證據(jù)。其測(cè)評(píng)框架由情景、能力、知識(shí)、態(tài)度四個(gè)指標(biāo)構(gòu)成,重點(diǎn)評(píng)估學(xué)生在知識(shí)掌握與運(yùn)用、認(rèn)知與思維發(fā)展、價(jià)值觀(guān)念與個(gè)人能力等方面的發(fā)展?fàn)顩r,同時(shí)研究影響學(xué)生學(xué)業(yè)成就的因素(OECD, 2014)。
我國(guó)近年來(lái)也非常重視對(duì)學(xué)生的大規(guī)模學(xué)習(xí)評(píng)價(jià)。2007年,我國(guó)連續(xù)8年開(kāi)展了義務(wù)教育階段6個(gè)學(xué)科領(lǐng)域的試點(diǎn)測(cè)試,其中5次為全國(guó)范圍的大規(guī)模測(cè)試,檢測(cè)樣本包括全國(guó)31個(gè)?。ㄖ陛犑?自治區(qū))和新疆生產(chǎn)建設(shè)兵團(tuán),695個(gè)樣本縣(市/區(qū))的46萬(wàn)余名學(xué)生、11萬(wàn)余名教師和校長(zhǎng)。監(jiān)測(cè)結(jié)果除了呈現(xiàn)全國(guó)學(xué)生相關(guān)學(xué)科領(lǐng)域的總體表現(xiàn)、測(cè)查學(xué)生綜合運(yùn)用知識(shí)能力和解決問(wèn)題能力外,還關(guān)注學(xué)生的綜合素質(zhì)和健康成長(zhǎng),對(duì)學(xué)生的情感態(tài)度、課業(yè)負(fù)擔(dān)、學(xué)校間和區(qū)域間的均衡狀況進(jìn)行調(diào)查,體現(xiàn)了促進(jìn)學(xué)生全面發(fā)展的素質(zhì)教育理念(中國(guó)政府網(wǎng),2015)。2015年4月,國(guó)務(wù)院教育督導(dǎo)委員會(huì)辦公室印發(fā)《國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)方案》,依據(jù)我國(guó)義務(wù)教育課程設(shè)置的基本要求,以義務(wù)教育階段四年級(jí)和八年級(jí)學(xué)生為監(jiān)測(cè)對(duì)象,利用紙筆測(cè)試工具(學(xué)科測(cè)試卷和調(diào)查問(wèn)卷)和現(xiàn)場(chǎng)測(cè)試工具(現(xiàn)場(chǎng)演示和項(xiàng)目參與),監(jiān)測(cè)義務(wù)教育階段學(xué)生語(yǔ)文、數(shù)學(xué)、科學(xué)、體育、藝術(shù)、德育等學(xué)科學(xué)業(yè)質(zhì)量、身心健康及變化情況,深入分析影響義務(wù)教育質(zhì)量的主要原因(柴葳等,2015)。
2.課堂學(xué)習(xí)評(píng)價(jià)
學(xué)習(xí)評(píng)價(jià)最重要的目的不是為了證明,而是為了“改進(jìn)”(Stufflebeam,1998)。課堂學(xué)習(xí)評(píng)價(jià)的最終目的是改進(jìn)教學(xué)和促進(jìn)學(xué)生學(xué)習(xí)。傳統(tǒng)的課堂學(xué)習(xí)評(píng)價(jià)是在教師個(gè)人經(jīng)驗(yàn)的基礎(chǔ)上,對(duì)學(xué)生課堂學(xué)習(xí)情況做出的主觀(guān)判斷。這種基于個(gè)人經(jīng)驗(yàn)的分析,結(jié)果難免受觀(guān)察人的主觀(guān)意識(shí)的影響。Yamtim等(2014)通過(guò)研究發(fā)現(xiàn),課堂學(xué)習(xí)評(píng)價(jià)的現(xiàn)狀并不樂(lè)觀(guān),課堂學(xué)習(xí)評(píng)價(jià)受到各種因素的限制,其可操作性差。一些研究者提出了操作性改進(jìn)策略,如日本學(xué)者提出在教學(xué)中實(shí)踐“一頁(yè)紙檔案袋評(píng)價(jià)”(田中耕治等,2012),即鼓勵(lì)學(xué)生將學(xué)習(xí)經(jīng)歷記錄在一頁(yè)紙上,借此讓學(xué)生了解個(gè)人的學(xué)習(xí)歷程,同時(shí)也讓教師可以給予適當(dāng)?shù)闹笇?dǎo)來(lái)幫助學(xué)生改進(jìn)。荷蘭的研究者和教師通過(guò)緊密合作,共同開(kāi)發(fā)了課堂形成性評(píng)價(jià)模型(Classroom Formative Assessment,CFA),用于幫助教師判斷學(xué)生是否達(dá)到學(xué)習(xí)目標(biāo)并提供及時(shí)的反饋(Van den Berg et al., 2016)。還有一些學(xué)者旨在開(kāi)發(fā)評(píng)價(jià)工具來(lái)優(yōu)化課堂評(píng)價(jià)過(guò)程。如瑞士學(xué)者Smit等(2017)開(kāi)發(fā)了一款叫Rubies的工具,該工具能夠記錄課堂師生的互動(dòng)信息,智能分析與診斷學(xué)生的技能狀態(tài)和能力水平,以此來(lái)提升教師對(duì)學(xué)生學(xué)習(xí)的感知和診斷能力,同時(shí)完善學(xué)生自我評(píng)價(jià)和課堂形成性評(píng)價(jià)。
隨著人工智能等新技術(shù)在課堂教學(xué)中的廣泛應(yīng)用,學(xué)習(xí)行為數(shù)據(jù)呈現(xiàn)出全時(shí)段、全方位、多模態(tài)的特征,基于過(guò)程性數(shù)據(jù)的學(xué)習(xí)評(píng)價(jià)引起了廣泛關(guān)注,越來(lái)越多的研究開(kāi)始關(guān)注學(xué)習(xí)情緒、學(xué)習(xí)態(tài)度、學(xué)習(xí)習(xí)慣等多元特征(Fredricks et al.,2004)。一些研究者提出通過(guò)對(duì)視頻中學(xué)生面部、眼部等特征進(jìn)行分析,以此來(lái)判斷學(xué)生學(xué)習(xí)專(zhuān)注程度,進(jìn)而評(píng)估課堂學(xué)習(xí)效果。如Whitehill等(2014)根據(jù)面部表情,進(jìn)行學(xué)生專(zhuān)注度的自動(dòng)識(shí)別;Psaltis等(2017)提出從頭部運(yùn)動(dòng)、眼睛運(yùn)動(dòng)模式中獲取線(xiàn)索,推斷電子學(xué)習(xí)環(huán)境中的學(xué)生學(xué)習(xí)專(zhuān)注度;Kamath等(2016)使用開(kāi)源工具庫(kù) OpenFace和 OpenPose提取包括眼睛注視、頭部姿勢(shì)和身體姿勢(shì)在內(nèi)的多模態(tài)特征,進(jìn)行學(xué)生專(zhuān)注度預(yù)測(cè)。還有一些學(xué)者關(guān)注學(xué)生學(xué)習(xí)情緒與成績(jī)的關(guān)系,如有研究發(fā)現(xiàn)學(xué)業(yè)情緒與學(xué)生的認(rèn)知和行為密切相關(guān),是影響智力投入、行為持久性以及學(xué)習(xí)成績(jī)的重要因素(藥文靜等,2020)。Hsieh等(2019)探討了在任務(wù)轉(zhuǎn)換范式下不同情緒如何調(diào)節(jié)認(rèn)知靈活性的問(wèn)題,發(fā)現(xiàn)積極情緒并不能調(diào)節(jié)短期或長(zhǎng)期認(rèn)知的靈活性,而消極情緒有助于認(rèn)知的瞬間轉(zhuǎn)換,并導(dǎo)致較小的轉(zhuǎn)換成本。劉君玲等(2019)強(qiáng)調(diào)了學(xué)業(yè)情緒在在線(xiàn)協(xié)作問(wèn)題解決中的重要性,并從環(huán)境、活動(dòng)設(shè)計(jì)、學(xué)習(xí)者等方面提出了提高學(xué)生協(xié)作問(wèn)題解決能力的策略。Eilam(2019)為檢驗(yàn)情緒氛圍在課堂中的作用和功能提出了新的分析框架。Ashwin等(2020)通過(guò)識(shí)別學(xué)生的面部表情、手勢(shì)和身體姿勢(shì)來(lái)分析教室中學(xué)生的情感狀態(tài)。Deniz等(2019)開(kāi)發(fā)了可以通過(guò)學(xué)生的面部表情監(jiān)測(cè)學(xué)生情緒,并進(jìn)行情緒預(yù)警的工具。
3.在線(xiàn)學(xué)習(xí)評(píng)價(jià)
信息時(shí)代,在線(xiàn)學(xué)習(xí)已成為人們學(xué)習(xí)的重要方式。關(guān)于在線(xiàn)學(xué)習(xí)評(píng)價(jià),國(guó)內(nèi)外也已展開(kāi)廣泛的研究。虛擬現(xiàn)實(shí)技術(shù)(Johnson-Glenberg,2019)、腦波監(jiān)測(cè)(Liu et al.,2016)和眼動(dòng)(Lambert et al.,2007)等智能感知技術(shù)為多模態(tài)數(shù)據(jù)的采集提供了可能。伴隨深度學(xué)習(xí)等人工智能技術(shù)快速發(fā)展,基于多模態(tài)數(shù)據(jù)的統(tǒng)一表征來(lái)開(kāi)展精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)已成為在線(xiàn)學(xué)習(xí)評(píng)價(jià)的一大趨勢(shì)。當(dāng)前在線(xiàn)學(xué)習(xí)評(píng)價(jià)的內(nèi)容,主要包含以下幾方面:
學(xué)習(xí)者認(rèn)知診斷。隨著心理測(cè)量學(xué)和認(rèn)知心理學(xué)的進(jìn)一步發(fā)展和現(xiàn)代教育技術(shù)水平的不斷進(jìn)步,診斷測(cè)試的價(jià)值和意義不再僅僅是提供分?jǐn)?shù),而是對(duì)學(xué)習(xí)者認(rèn)知結(jié)構(gòu)的測(cè)量與評(píng)估?;趥鹘y(tǒng)概率圖模型的認(rèn)知診斷技術(shù),可以對(duì)學(xué)生知識(shí)結(jié)構(gòu)進(jìn)行深入分析。如美國(guó)教育巨頭McGraw Hill基于人工智能技術(shù)開(kāi)發(fā)的學(xué)習(xí)評(píng)估系統(tǒng)(Assessment and Learning in Knowledge Spaces,ALEKS)。該系統(tǒng)基于知識(shí)空間理論,使用人工智能引擎為每位學(xué)生繪制個(gè)人知識(shí)圖譜,以此來(lái)幫助學(xué)習(xí)者開(kāi)展適應(yīng)性學(xué)習(xí)(Canfield, 2001)。而基于深度學(xué)習(xí)方法的知識(shí)跟蹤技術(shù),還可以獲取學(xué)生的知識(shí)掌握動(dòng)態(tài),從而分析其學(xué)業(yè)發(fā)展情況。
情感態(tài)度分析。學(xué)習(xí)者的認(rèn)知加工過(guò)程是非常復(fù)雜的,存在諸多顯性與隱性的相關(guān)因素,已有的認(rèn)知診斷只能診斷顯性認(rèn)知屬性(認(rèn)知行為),即學(xué)習(xí)者對(duì)知識(shí)、技能的掌握情況;而對(duì)于隱性的相關(guān)因素,如心理、情感等,并未加以考慮。然而這些隱性因素也是影響診斷結(jié)果的重要因素,忽略了這些因素就容易造成診斷模型和真實(shí)認(rèn)知加工過(guò)程之間的不匹配,從而導(dǎo)致結(jié)論片面化、經(jīng)驗(yàn)化。傳統(tǒng)教育情境下對(duì)學(xué)習(xí)者情感態(tài)度的分析,通常是通過(guò)問(wèn)卷、對(duì)話(huà)、觀(guān)察等方式進(jìn)行,教師難以有效獲得學(xué)生的真實(shí)情緒狀態(tài)。計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,使得課堂學(xué)習(xí)者的情緒監(jiān)測(cè)成為可能。孟菲斯大學(xué)研發(fā)的AutoTutor智能助手系統(tǒng),能夠感知學(xué)習(xí)者的情感和注意狀態(tài)變化(Craig et al., 2013),并根據(jù)這些變化對(duì)學(xué)習(xí)者展開(kāi)情感和注意力評(píng)價(jià),進(jìn)而調(diào)整對(duì)學(xué)習(xí)者學(xué)習(xí)的輔導(dǎo)。
數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)預(yù)測(cè)。利用學(xué)生數(shù)據(jù)來(lái)預(yù)測(cè)學(xué)生學(xué)習(xí)行為和成績(jī)已成為近年來(lái)教育領(lǐng)域的一個(gè)重要層面(Lodge et al.,2017)。大數(shù)據(jù)技術(shù)可以幫助教師、學(xué)生和其他利益相關(guān)者洞察學(xué)習(xí)過(guò)程(Jacqueleen,2015)。如賓夕法尼亞州立大學(xué)基于2005-2016年850萬(wàn)條學(xué)生數(shù)據(jù)的分析,構(gòu)建了數(shù)據(jù)驅(qū)動(dòng)的高校學(xué)生學(xué)業(yè)表現(xiàn)預(yù)測(cè)模型,通過(guò)綜合評(píng)估,識(shí)別可能面臨風(fēng)險(xiǎn)的學(xué)生,幫助學(xué)校管理部門(mén)提前制定干預(yù)策略(陳新亞等,2020)。
綜上所述,在信息技術(shù)的支持下,學(xué)習(xí)評(píng)價(jià)的規(guī)?;⑦^(guò)程化、精準(zhǔn)化等都已取得較大進(jìn)步,但是也還面臨一些問(wèn)題。如在大規(guī)模學(xué)習(xí)評(píng)價(jià)方面,由于評(píng)價(jià)對(duì)象數(shù)量大、覆蓋范圍廣,使得數(shù)據(jù)的采集與分析呈現(xiàn)一定的難度。而且,大規(guī)模學(xué)習(xí)評(píng)價(jià)多以學(xué)習(xí)者的知識(shí)技能、課業(yè)負(fù)擔(dān)等顯性?xún)?nèi)容為主,對(duì)學(xué)習(xí)者的綜合素養(yǎng)以及學(xué)習(xí)能力的評(píng)價(jià)稍顯不足。又如在課堂學(xué)習(xí)評(píng)價(jià)方面,雖然信息技術(shù)嵌入課堂,使得學(xué)習(xí)評(píng)價(jià)從單一的結(jié)果性評(píng)價(jià)向關(guān)注過(guò)程性評(píng)價(jià)轉(zhuǎn)變,但還存在非認(rèn)知行為判斷標(biāo)準(zhǔn)缺失、學(xué)習(xí)分析手段和工具還有待進(jìn)一步多樣化等問(wèn)題。而在在線(xiàn)學(xué)習(xí)評(píng)價(jià)方面,雖然深度學(xué)習(xí)等人工智能方法在學(xué)習(xí)評(píng)價(jià)中得到應(yīng)用,但其評(píng)價(jià)結(jié)果的解釋性問(wèn)題還需與多元評(píng)價(jià)方法相結(jié)合。
二、數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)機(jī)制
數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)是對(duì)多空間、多場(chǎng)景、多時(shí)段、多過(guò)程的數(shù)據(jù)進(jìn)行記錄、采集、加工、處理,使得數(shù)據(jù)在平臺(tái)間流轉(zhuǎn)累加,實(shí)現(xiàn)“1+1>2”的能效的一種評(píng)價(jià)方法。它由多場(chǎng)景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化等要素組成。多場(chǎng)景數(shù)據(jù)采集為學(xué)習(xí)評(píng)價(jià)提供數(shù)據(jù)來(lái)源和量化手段支撐,多空間數(shù)據(jù)融合為學(xué)習(xí)評(píng)價(jià)提供統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),精準(zhǔn)分析模型為學(xué)習(xí)評(píng)價(jià)提供數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)分析與評(píng)價(jià)方法,分析結(jié)果可視化表達(dá)為學(xué)習(xí)評(píng)價(jià)提供反饋和應(yīng)用服務(wù)(如圖1所示)。
1.多場(chǎng)景數(shù)據(jù)采集
學(xué)習(xí)空間是開(kāi)展學(xué)習(xí)活動(dòng)的基礎(chǔ)環(huán)境,也是教育數(shù)據(jù)產(chǎn)生、應(yīng)用與迭代流轉(zhuǎn)的重要場(chǎng)所。由于信息技術(shù)的介入,學(xué)習(xí)空間從傳統(tǒng)單一的教室實(shí)體學(xué)習(xí)空間向物理空間和網(wǎng)絡(luò)空間高度融合的融合式學(xué)習(xí)空間變遷。學(xué)習(xí)者無(wú)論在何種學(xué)習(xí)空間開(kāi)展學(xué)習(xí)活動(dòng),都會(huì)產(chǎn)生相應(yīng)的教育場(chǎng)景數(shù)據(jù)(McAfee et al.,2012)。相較于單維學(xué)習(xí)空間,融合式學(xué)習(xí)空間場(chǎng)景較為多元,不僅包括圖書(shū)館、教室、閱覽室等物理環(huán)境,同時(shí)也包括角色分配的社會(huì)環(huán)境以及思維意識(shí)介入的認(rèn)知情境(楊現(xiàn)民等,2020)。由于傳統(tǒng)教學(xué)場(chǎng)景如學(xué)校、圖書(shū)館的數(shù)字化與智能化水平相對(duì)滯后,教學(xué)場(chǎng)景中的學(xué)習(xí)數(shù)據(jù)采集,主要依賴(lài)于人工觀(guān)察和用戶(hù)自報(bào)告等手段,采集到的數(shù)據(jù)往往不夠全面,且具有一定的主觀(guān)性(劉智等,2019)。隨著可穿戴技術(shù)、物聯(lián)網(wǎng)與人工智能技術(shù)的興起,傳統(tǒng)教學(xué)場(chǎng)景中的多元化數(shù)據(jù)得以采集。研究者可以利用數(shù)據(jù)感知技術(shù)、一卡通、視頻監(jiān)控、智能移動(dòng)終端、穿戴設(shè)備、二維碼、無(wú)線(xiàn)網(wǎng)網(wǎng)絡(luò)設(shè)施等,隨時(shí)感知與測(cè)量學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù)、生理數(shù)據(jù)、行為數(shù)據(jù)、管理數(shù)據(jù)等并對(duì)其進(jìn)行記錄和存儲(chǔ)。
2.多空間數(shù)據(jù)融合
在評(píng)價(jià)中,已獲取的教育數(shù)據(jù)并非在同一時(shí)刻被分析處理,而是依據(jù)評(píng)價(jià)目標(biāo)、評(píng)價(jià)對(duì)象,選擇不同場(chǎng)景、不同時(shí)間節(jié)點(diǎn)、不同頻次、不同時(shí)長(zhǎng)、不同維度的數(shù)據(jù)進(jìn)行綜合分析,因此數(shù)據(jù)的采集可能會(huì)出現(xiàn)數(shù)據(jù)不統(tǒng)一、噪聲干擾、數(shù)值缺失等問(wèn)題。為了將獲取的數(shù)據(jù)轉(zhuǎn)變?yōu)橛?jì)算機(jī)能夠識(shí)別并處理的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),為下一步數(shù)據(jù)建模做準(zhǔn)備,需要對(duì)已獲取的數(shù)據(jù)進(jìn)行規(guī)范,涉及的關(guān)鍵步驟包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約和數(shù)據(jù)變換(劉明吉等,2000)。值得注意的是,一些數(shù)據(jù)既可以用于建模,也可以用于分析,如學(xué)習(xí)投入度的評(píng)價(jià)可采集學(xué)習(xí)者觀(guān)看視頻時(shí)回答問(wèn)題的頻次與中斷視頻的頻次,也可以依據(jù)學(xué)習(xí)者面部表情與坐姿進(jìn)行分析(Ashwin et al., 2018);而面部表情同樣也可作為學(xué)習(xí)興趣的分析方法(孫發(fā)勤等,2019)。
3.精準(zhǔn)分析模型構(gòu)建
分析建模是精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)過(guò)程中至關(guān)重要的一步。其實(shí)質(zhì)是首先依據(jù)評(píng)價(jià)目標(biāo)的不同,構(gòu)建相應(yīng)的評(píng)價(jià)指標(biāo)體系;然后對(duì)評(píng)價(jià)指標(biāo)體系中的評(píng)價(jià)維度進(jìn)行數(shù)據(jù)化表征,采集多源數(shù)據(jù);最后基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)等技術(shù),對(duì)所獲取的規(guī)范化數(shù)據(jù)進(jìn)行建模,最終獲得分析結(jié)果。分析建模主要包括學(xué)習(xí)者畫(huà)像、預(yù)測(cè)模型與預(yù)警模型三類(lèi)。學(xué)習(xí)者畫(huà)像通過(guò)采集到的基礎(chǔ)信息、學(xué)業(yè)數(shù)據(jù)、學(xué)習(xí)資源等實(shí)時(shí)數(shù)據(jù),基于文本挖掘、自然語(yǔ)言處理等方法,對(duì)學(xué)習(xí)者的學(xué)習(xí)特征與個(gè)性特征進(jìn)行描述, 幫助教學(xué)利益相關(guān)者了解學(xué)習(xí)者學(xué)習(xí)情況。預(yù)測(cè)模型是基于學(xué)習(xí)者持續(xù)變化的學(xué)業(yè)數(shù)據(jù)、心理數(shù)據(jù)與生理數(shù)據(jù),通過(guò)語(yǔ)義關(guān)聯(lián)及相關(guān)性分析方法,診斷學(xué)習(xí)狀態(tài)并預(yù)測(cè)未來(lái)變化趨勢(shì)。預(yù)警模式建立在預(yù)測(cè)模型的基礎(chǔ)之上,是預(yù)測(cè)的下一個(gè)階段,對(duì)預(yù)測(cè)的結(jié)果進(jìn)行預(yù)警。構(gòu)建預(yù)警模型的主要方法是關(guān)聯(lián)規(guī)則、K-means算法等。
4.分析結(jié)果可視化
計(jì)算機(jī)構(gòu)建的分析模型較為抽象,不易理解。如果計(jì)算機(jī)內(nèi)部自動(dòng)分析與判別,然后為教師或?qū)W習(xí)者提供相關(guān)學(xué)習(xí)資源,其分析結(jié)果則不需要進(jìn)行可視化呈現(xiàn)。然而,人在教育中的作用是無(wú)法取代的。無(wú)論空間如何融合,最終學(xué)習(xí)數(shù)據(jù)及學(xué)習(xí)分析結(jié)果都需要方便教師使用。因此精準(zhǔn)分析建模后需將分析結(jié)果轉(zhuǎn)變?yōu)槿藗円子诶斫獾膱D形、圖像,即將分析結(jié)果可視化??梢暬治龉ぞ叩脑O(shè)計(jì)是“數(shù)據(jù)驅(qū)動(dòng)教學(xué)”的核心。當(dāng)前應(yīng)用較多的學(xué)習(xí)儀表盤(pán),被定義為“為了支撐和改進(jìn)學(xué)習(xí)和表現(xiàn),對(duì)學(xué)習(xí)分析結(jié)果進(jìn)行可視化和直觀(guān)顯示的學(xué)習(xí)分析工具”(Yoo et al.,2015)。它能夠直觀(guān)地呈現(xiàn)學(xué)習(xí)者學(xué)習(xí)的相關(guān)信息,如學(xué)習(xí)者對(duì)知識(shí)點(diǎn)的掌握程度、學(xué)習(xí)進(jìn)展情況、登錄次數(shù)等。知識(shí)圖譜(Knowledge Graph)是另一個(gè)可視化工具,用于繪制、分析和顯示學(xué)科或?qū)W術(shù)研究主體之間的相互聯(lián)系,是揭示科學(xué)知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的可視化工具。還有社會(huì)網(wǎng)絡(luò),能夠?qū)W(xué)習(xí)者群體中溝通與交流的路徑可視化,找出意見(jiàn)領(lǐng)袖、邊緣人物等。
三、數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)方法
改進(jìn)教學(xué)和學(xué)習(xí)的目的,對(duì)學(xué)習(xí)評(píng)價(jià)的及時(shí)性和精準(zhǔn)性提出了很高的要求。為了滿(mǎn)足新型教育情境下精準(zhǔn)評(píng)價(jià)需求,需要對(duì)現(xiàn)有的教育評(píng)價(jià)理論以及關(guān)鍵技術(shù)進(jìn)行深度剖析,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)新模式。
針對(duì)傳統(tǒng)的教學(xué)場(chǎng)景,新課標(biāo)提出了“知識(shí)與技能、過(guò)程與方法、情感與價(jià)值觀(guān)”的三維教學(xué)目標(biāo)。針對(duì)在線(xiàn)教學(xué)場(chǎng)景,F(xiàn)redricks等(2004)提出了行為、認(rèn)知、情感三維學(xué)習(xí)評(píng)價(jià)指標(biāo)體系;王敏娟構(gòu)建了以學(xué)習(xí)者參與為核心的Cybergogy模型,提出學(xué)生在線(xiàn)學(xué)習(xí)效果應(yīng)涉及認(rèn)知、情感和社會(huì)三個(gè)領(lǐng)域的因素。然而,以上評(píng)價(jià)框架都忽略了學(xué)習(xí)動(dòng)機(jī)對(duì)學(xué)習(xí)成就的影響。學(xué)習(xí)動(dòng)機(jī)是推動(dòng)學(xué)習(xí)者學(xué)習(xí)的直接原因和內(nèi)部動(dòng)力,是激發(fā)、指引和維持學(xué)習(xí)行為的心理過(guò)程(張雪蓮等,2009),因此,學(xué)習(xí)評(píng)價(jià)首先需要對(duì)學(xué)習(xí)者學(xué)習(xí)動(dòng)機(jī)進(jìn)行評(píng)價(jià)。其次,無(wú)論是在傳統(tǒng)的物理學(xué)習(xí)空間,還是在線(xiàn)的云學(xué)習(xí)空間,學(xué)習(xí)者的學(xué)習(xí)情況主要是通過(guò)認(rèn)知與情感變化來(lái)體現(xiàn)的,故二者是學(xué)習(xí)評(píng)價(jià)必須關(guān)注的重要指標(biāo)。最后,傳統(tǒng)的行為指標(biāo)在云學(xué)習(xí)空間中顯得過(guò)于籠統(tǒng),在物理空間與云空間相融合的學(xué)習(xí)空間中,學(xué)習(xí)者的社會(huì)交互行為等社會(huì)因素對(duì)學(xué)習(xí)者的學(xué)習(xí)成就有非常重要的影響,因此,社會(huì)因素分析也是學(xué)習(xí)評(píng)價(jià)的重要方面。基于以上分析,本研究建構(gòu)了內(nèi)外部因素共同驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)框架,即從“動(dòng)機(jī)、認(rèn)知、情感與社會(huì)”四個(gè)方面來(lái)對(duì)學(xué)習(xí)者進(jìn)行全面的分析與評(píng)價(jià),其框架如圖2所示。
圖2 數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)框架
由圖2可知,數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)框架,以區(qū)塊鏈技術(shù)為基礎(chǔ),融合人工智能、云計(jì)算、學(xué)習(xí)分析、情境感知等新興技術(shù),在多維時(shí)空尺度上全面采集學(xué)習(xí)過(guò)程中的多元海量數(shù)據(jù),通過(guò)全面、系統(tǒng)的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘,從學(xué)習(xí)者的內(nèi)在動(dòng)機(jī)到認(rèn)知發(fā)展、情感表現(xiàn),再到社會(huì)綜合交互能力,多維度、及時(shí)、準(zhǔn)確地評(píng)估學(xué)生的學(xué)習(xí)真實(shí)狀況。在這個(gè)過(guò)程中,區(qū)塊鏈技術(shù)作為核心,可以對(duì)學(xué)習(xí)者數(shù)據(jù)進(jìn)行安全存儲(chǔ)和隱私保護(hù),使評(píng)價(jià)結(jié)果可信、可靠、安全且一致,為促進(jìn)學(xué)生全面發(fā)展提供了支持。
1.學(xué)習(xí)動(dòng)機(jī)與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)
學(xué)習(xí)動(dòng)機(jī)是引發(fā)與維持學(xué)生學(xué)習(xí)行為,并使之指向一定學(xué)業(yè)目標(biāo)的一種動(dòng)力傾向。傳統(tǒng)的學(xué)習(xí)動(dòng)機(jī)評(píng)價(jià)主要通過(guò)自我知覺(jué)、歸因或教師對(duì)學(xué)生面部表情等的觀(guān)察來(lái)判斷。但自我知覺(jué)或歸因受主觀(guān)意識(shí)影響較大,而教師觀(guān)察也易受經(jīng)驗(yàn)和視覺(jué)范圍等限制。智能感知技術(shù)及設(shè)備的發(fā)展為學(xué)習(xí)動(dòng)機(jī)的評(píng)價(jià)提供了便利。如Psaltis等(2017)通過(guò)眼動(dòng)儀采集學(xué)生課堂學(xué)習(xí)的眼動(dòng)數(shù)據(jù),并進(jìn)行量化和聚類(lèi)分析,以此來(lái)判斷學(xué)生的注意力焦點(diǎn),進(jìn)而獲得學(xué)習(xí)者在學(xué)習(xí)過(guò)程中的專(zhuān)注度情況。Li等(2020)利用神經(jīng)網(wǎng)絡(luò)對(duì)采集到的學(xué)生課堂學(xué)習(xí)圖像數(shù)據(jù)和學(xué)習(xí)軌跡進(jìn)行分析,以判斷學(xué)生在學(xué)習(xí)過(guò)程中的參與度。Chan等 (2020)利用深度學(xué)習(xí)技術(shù)分析學(xué)習(xí)過(guò)程中產(chǎn)生的多模態(tài)數(shù)據(jù),對(duì)學(xué)生的情感態(tài)度、學(xué)業(yè)投入、課堂專(zhuān)注等進(jìn)行量化評(píng)價(jià),進(jìn)而分析學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī)。
2.認(rèn)知計(jì)算與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)
數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)模型強(qiáng)調(diào)在大數(shù)據(jù)時(shí)代通過(guò)“讓數(shù)據(jù)發(fā)聲”,對(duì)學(xué)習(xí)者進(jìn)行多維度多層次的精準(zhǔn)評(píng)價(jià),以充分發(fā)揮學(xué)習(xí)評(píng)價(jià)的診斷、調(diào)節(jié)、反饋、激勵(lì)等作用?;诎驳律↙orin W. Anderson)的認(rèn)知目標(biāo)分類(lèi),學(xué)習(xí)者的認(rèn)知由低到高可分為“記憶、理解、應(yīng)用、分析、評(píng)價(jià)和創(chuàng)造”等6個(gè)層次。數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)模型不僅要關(guān)注學(xué)習(xí)者的知識(shí)掌握情況,還需關(guān)注高層次的認(rèn)知技能;不僅要關(guān)注學(xué)生的行為表現(xiàn),還需關(guān)注學(xué)習(xí)者的認(rèn)知心理建構(gòu)過(guò)程。認(rèn)知診斷模型是一種基于認(rèn)知心理學(xué)與統(tǒng)計(jì)學(xué)相結(jié)合的認(rèn)知計(jì)算模型(涂冬波等,2012),可以通過(guò)對(duì)學(xué)習(xí)者的認(rèn)知心理過(guò)程進(jìn)行建模,挖掘?qū)W生的技能掌握狀態(tài)。然而,傳統(tǒng)的認(rèn)知診斷模型僅僅是對(duì)單次測(cè)評(píng)的診斷,診斷結(jié)果不夠穩(wěn)定。動(dòng)態(tài)認(rèn)知診斷評(píng)價(jià)方法對(duì)學(xué)習(xí)者的認(rèn)知加工過(guò)程進(jìn)行建模,既注重對(duì)高階認(rèn)知能力的診斷評(píng)價(jià),又結(jié)合學(xué)習(xí)者在學(xué)習(xí)過(guò)程中學(xué)習(xí)與遺忘等認(rèn)知規(guī)律,可以動(dòng)態(tài)跟蹤學(xué)習(xí)者的認(rèn)知狀態(tài)變化,通過(guò)及時(shí)反饋和干預(yù)來(lái)影響學(xué)習(xí)者的學(xué)習(xí)表現(xiàn)。將認(rèn)知計(jì)算與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)相結(jié)合,可以提高學(xué)習(xí)評(píng)價(jià)的動(dòng)態(tài)性、全面性與科學(xué)性,為培養(yǎng)學(xué)生的高階思維能力提供幫助。
3.情感計(jì)算與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)
情感影響著人的認(rèn)知過(guò)程與行為,情感評(píng)價(jià)是學(xué)習(xí)評(píng)價(jià)的重要組成部分。傳統(tǒng)的情感評(píng)價(jià)方法主要為觀(guān)察法、訪(fǎng)談法和問(wèn)卷法,費(fèi)時(shí)費(fèi)力,且以總結(jié)性評(píng)價(jià)為主,脫離課堂情境,主觀(guān)性較強(qiáng)。人工智能技術(shù)、視頻捕捉技術(shù)、視頻分析技術(shù)的出現(xiàn)為學(xué)習(xí)過(guò)程中的情感評(píng)價(jià)提供了有力的技術(shù)支撐。情感計(jì)算是人工智能發(fā)展的重要方向之一,主要包括情感識(shí)別、情感建模和情感反應(yīng)三大部分。將情感計(jì)算與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)結(jié)合,可以對(duì)學(xué)習(xí)者在學(xué)習(xí)過(guò)程中產(chǎn)生的多元數(shù)據(jù)進(jìn)行捕捉與采集,整合多模態(tài)數(shù)據(jù),實(shí)現(xiàn)對(duì)學(xué)習(xí)者情感狀態(tài)及變化趨勢(shì)的實(shí)時(shí)評(píng)價(jià)。與音頻技術(shù)相比,視頻分析技術(shù)在實(shí)時(shí)性與持續(xù)性捕捉方面具有得天獨(dú)厚的優(yōu)勢(shì),能夠?qū)W(xué)習(xí)者在學(xué)習(xí)過(guò)程中的面部表情、身體姿態(tài)、坐姿等圖像進(jìn)行實(shí)時(shí)捕捉,結(jié)合其他模態(tài)數(shù)據(jù)如腦電波、血壓等數(shù)據(jù),通過(guò)神經(jīng)網(wǎng)絡(luò)等技術(shù)進(jìn)行建模與分類(lèi),可以追蹤學(xué)習(xí)者學(xué)習(xí)過(guò)程中情緒的變化,精準(zhǔn)判斷學(xué)生的情緒。多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的視頻情感評(píng)價(jià)方法,利用圖像識(shí)別、語(yǔ)義識(shí)別和深度學(xué)習(xí)技術(shù)來(lái)量化表征教學(xué)視頻并構(gòu)建情感識(shí)別模型,自動(dòng)分析學(xué)生在學(xué)習(xí)過(guò)程中的情緒態(tài)度,進(jìn)而推斷學(xué)生的學(xué)習(xí)興趣、學(xué)習(xí)意志與學(xué)習(xí)投入度。目前,已開(kāi)展的相關(guān)研究包括通過(guò)靜態(tài)圖像對(duì)學(xué)習(xí)者情緒的識(shí)別(韓麗等,2017);通過(guò)視頻分析技術(shù),對(duì)傳統(tǒng)課堂中學(xué)習(xí)者的面部表情與姿勢(shì)進(jìn)行采集與評(píng)價(jià),判斷學(xué)習(xí)者在學(xué)習(xí)過(guò)程中的學(xué)習(xí)情緒及其變化過(guò)程(郭雯雯等,2019)等。還有研究將視頻中的表情圖片與腦電波的多模態(tài)數(shù)據(jù)集合,構(gòu)建了多模態(tài)融合的深度學(xué)習(xí)模型,判斷學(xué)習(xí)者的學(xué)習(xí)參與度(曹曉明等,2019);或是對(duì)視頻中的人臉及表情進(jìn)行識(shí)別,評(píng)價(jià)班級(jí)和個(gè)人的情感,包括學(xué)習(xí)興趣和學(xué)習(xí)態(tài)度、學(xué)業(yè)價(jià)值觀(guān)、學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)信念與學(xué)習(xí)意志(孫發(fā)勤等, 2019)。
4.社會(huì)計(jì)算與精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)
思維的根本在于對(duì)話(huà),對(duì)話(huà)可以利用社會(huì)建構(gòu)的語(yǔ)境賦予思想以意義(Hudson,2002)。社會(huì)互動(dòng)是教育過(guò)程的關(guān)鍵組成部分,學(xué)習(xí)中的互動(dòng)是學(xué)習(xí)者獲取知識(shí)和發(fā)展認(rèn)知技能的必要條件(Barker,1994)。社會(huì)計(jì)算是信息技術(shù)在社會(huì)活動(dòng)中的應(yīng)用。從計(jì)算技術(shù)到社會(huì)活動(dòng)這一角度出發(fā),社會(huì)計(jì)算就是利用先進(jìn)的信息技術(shù)達(dá)到高度有效的交流?;趯W(xué)習(xí)者社交特性的學(xué)習(xí)者群體評(píng)價(jià)方法,可以通過(guò)分析群體聯(lián)系的緊密程度和活躍程度來(lái)了解群體特性,通過(guò)測(cè)量群體內(nèi)部的聯(lián)結(jié)度來(lái)分析知識(shí)和情感傳遞的有效性,還可以利用群體權(quán)力分析量化學(xué)習(xí)者個(gè)體在群體中所處的位置。社會(huì)計(jì)算和精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)的結(jié)合,可以通過(guò)對(duì)群體層次結(jié)構(gòu)的分析,幫助我們了解群體內(nèi)部凝聚力的高低;比較不同學(xué)習(xí)者群體的互動(dòng)內(nèi)容和深度,發(fā)現(xiàn)學(xué)習(xí)者群體之間互動(dòng)模式的差異(Shu et al.,2018)。
5.學(xué)習(xí)者數(shù)據(jù)的可信存儲(chǔ)及隱私保護(hù)方法
研究數(shù)據(jù)的可信存儲(chǔ)方法是確保評(píng)價(jià)真實(shí)可靠的基礎(chǔ)。采用區(qū)塊鏈技術(shù),構(gòu)建學(xué)習(xí)者行為鏈,用以記錄學(xué)習(xí)者過(guò)程數(shù)據(jù),為精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)提供可信數(shù)據(jù)支撐;同時(shí),研究基于區(qū)塊鏈的學(xué)生評(píng)價(jià)數(shù)據(jù)安全與隱私保護(hù)技術(shù),以便為多主體評(píng)價(jià)信息提供可靠的保障,這些都是學(xué)習(xí)評(píng)價(jià)參與主體重點(diǎn)關(guān)注的問(wèn)題。面向區(qū)塊鏈的訪(fǎng)問(wèn)控制、安全多方計(jì)算、同態(tài)加密等信息安全手段越來(lái)越受研究者青睞。在區(qū)塊鏈+教育場(chǎng)景中,參與計(jì)算的各方能夠保證在不向驗(yàn)證者提供任何有用信息的情況下,使驗(yàn)證者相信某個(gè)論斷是正確的,因而能夠有效避免引入第三方造成對(duì)數(shù)據(jù)的竊取或者窺視,進(jìn)一步保護(hù)教育數(shù)據(jù)的安全性和隱私性,實(shí)現(xiàn)在完全不透露任何隱私信息的同時(shí)維持信息的一致性。
四、發(fā)展展望與政策建議
目前,數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)評(píng)價(jià)研究在我國(guó)仍處于起步階段。但隨著教育與信息技術(shù)的深度融合,大數(shù)據(jù)背景下的學(xué)習(xí)評(píng)價(jià)研究呈快速發(fā)展趨勢(shì)。未來(lái),在政策的指引及技術(shù)的支持下,探索數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)大有可為。
1.構(gòu)建符合多空間數(shù)據(jù)特征的綜合素質(zhì)評(píng)價(jià)框架
智能教育時(shí)代,智能感知技術(shù)為多空間、多場(chǎng)景和全過(guò)程的學(xué)習(xí)數(shù)據(jù)采集提供了有效的工具,使得學(xué)習(xí)過(guò)程數(shù)據(jù)的全面采集成為可能。從數(shù)據(jù)空間來(lái)看,通過(guò)智能感知設(shè)備,我們不僅可以獲得在教室等物理空間學(xué)習(xí)時(shí)的課堂交互數(shù)據(jù),同時(shí)也可獲得在網(wǎng)絡(luò)學(xué)習(xí)空間中的在線(xiàn)學(xué)習(xí)數(shù)據(jù)。這些數(shù)據(jù)覆蓋課程、作業(yè)、生活、社交等多個(gè)學(xué)習(xí)場(chǎng)景, 各個(gè)場(chǎng)景有各自的評(píng)價(jià)標(biāo)準(zhǔn)。同時(shí)這些學(xué)習(xí)數(shù)據(jù)具有多模態(tài)特性,包括視頻、語(yǔ)音、文本和圖片等,亟需歸一化標(biāo)準(zhǔn)和通用的評(píng)價(jià)框架。因此,精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)亟需建立符合多空間全數(shù)據(jù)的綜合評(píng)價(jià)框架和指標(biāo)體系,用于匯聚來(lái)自不同場(chǎng)景、不同模態(tài)的學(xué)習(xí)評(píng)價(jià)數(shù)據(jù),為后續(xù)大數(shù)據(jù)精準(zhǔn)分析做好準(zhǔn)備。
2.完善過(guò)程性數(shù)據(jù)的采集與共享機(jī)制
學(xué)生綜合素質(zhì)的評(píng)價(jià)需要全面采集學(xué)生德育、智育、體育、美育、勞動(dòng)教育等多維過(guò)程性數(shù)據(jù),數(shù)據(jù)來(lái)源場(chǎng)景多樣、涉及的信息維度多、模態(tài)不一。因此,完善國(guó)家、區(qū)域、學(xué)校和班級(jí)等多級(jí)資源與數(shù)據(jù)的采集與共享機(jī)制,是實(shí)施數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)的前提。人工智能技術(shù)與感知設(shè)備的快速發(fā)展為完善過(guò)程性數(shù)據(jù)的采集奠定了技術(shù)基礎(chǔ)。研究者可以通過(guò)多種傳感器設(shè)備實(shí)時(shí)記錄學(xué)生行為數(shù)據(jù),同時(shí),結(jié)合觀(guān)察、訪(fǎng)談、資料分析等不同方法,多維度、多層次地采集學(xué)習(xí)者的學(xué)習(xí)結(jié)果數(shù)據(jù)和學(xué)習(xí)過(guò)程數(shù)據(jù)。如可以通過(guò)手環(huán)等傳感器設(shè)備來(lái)實(shí)時(shí)感知學(xué)生的運(yùn)動(dòng)、位置、睡眠狀態(tài)等生理數(shù)據(jù),通過(guò)攝像機(jī)等設(shè)備自動(dòng)采集學(xué)生課堂學(xué)習(xí)行為數(shù)據(jù),通過(guò)個(gè)人檔案、問(wèn)卷調(diào)查等方式記錄學(xué)生綜合發(fā)展數(shù)據(jù),通過(guò)階段性測(cè)評(píng)與診斷性測(cè)評(píng)采集學(xué)生學(xué)業(yè)數(shù)據(jù)等等。同時(shí),研究者還要注意完善真實(shí)的情景化任務(wù)、成果、行為等多源、異構(gòu)、多模態(tài)、不連貫語(yǔ)義的海量數(shù)據(jù)的共享。不同教育機(jī)構(gòu)的數(shù)據(jù)與資源共享機(jī)制是保證學(xué)習(xí)評(píng)價(jià)大數(shù)據(jù)的完整性與全面性的基礎(chǔ)。
3.突破學(xué)習(xí)評(píng)價(jià)中情感、認(rèn)知、動(dòng)機(jī)和社交評(píng)價(jià)方面的關(guān)鍵技術(shù)
當(dāng)前學(xué)生的綜合素質(zhì)評(píng)價(jià)大多采用填報(bào)與統(tǒng)計(jì)方式,其評(píng)價(jià)的效度和真實(shí)性受到質(zhì)疑。而傳統(tǒng)的評(píng)價(jià)模型側(cè)重學(xué)習(xí)者的知識(shí)掌握情況,忽略了更高層次的知識(shí)遷移能力、學(xué)習(xí)方法、情感態(tài)度和社會(huì)交往能力的發(fā)展情況。這既是重結(jié)果、輕過(guò)程的評(píng)價(jià)理念所致,同時(shí)也受到評(píng)價(jià)技術(shù)的制約。要實(shí)現(xiàn)精準(zhǔn)化的學(xué)習(xí)評(píng)價(jià),必須在情感、認(rèn)知、動(dòng)機(jī)和社交評(píng)價(jià)的關(guān)鍵技術(shù)方面有所突破,通過(guò)采集文字、語(yǔ)音、圖像、視頻等包含認(rèn)知、情感、注意力等的多模態(tài)數(shù)據(jù),利用自然語(yǔ)言處理、圖像識(shí)別、情感、計(jì)算等深度學(xué)習(xí)技術(shù)和統(tǒng)計(jì)建模方法,分析學(xué)習(xí)者的學(xué)習(xí)過(guò)程、學(xué)習(xí)內(nèi)容、知識(shí)遷移、情感獲得、交流互動(dòng)等,以此對(duì)學(xué)生綜合素質(zhì)進(jìn)行全面、精準(zhǔn)、多維度的評(píng)價(jià)與反饋。
4.研制數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)評(píng)價(jià)平臺(tái),加快學(xué)習(xí)評(píng)價(jià)在教育教學(xué)中的應(yīng)用
數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)評(píng)價(jià)平臺(tái)需要云計(jì)算、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘等技術(shù)和應(yīng)用的配合,實(shí)現(xiàn)低成本的大規(guī)模分布式存儲(chǔ)、及時(shí)響應(yīng)的用戶(hù)體驗(yàn),以及更加綠色節(jié)能的新一代數(shù)據(jù)中心。即在有效面對(duì)大數(shù)據(jù)處理需求的同時(shí),實(shí)現(xiàn)最大化資源利用率、最小化系統(tǒng)能耗的目標(biāo)。為此,數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)評(píng)價(jià)平臺(tái)需要為教育大數(shù)據(jù)的匯集融合、海量存儲(chǔ)、高效計(jì)算、深入分析挖掘以及教育應(yīng)用的開(kāi)發(fā)與運(yùn)行提供基礎(chǔ)支撐?;谶@個(gè)原理搭建教學(xué)、管理與學(xué)習(xí)的全生態(tài)應(yīng)用平臺(tái),構(gòu)建不同業(yè)務(wù)系統(tǒng)共享數(shù)據(jù)中心的數(shù)據(jù)聚合型平臺(tái)。在規(guī)范化的數(shù)據(jù)基礎(chǔ)之上構(gòu)建特色型分析模型滿(mǎn)足分析需要,為管理者、教師、學(xué)生、家長(zhǎng)以及合作學(xué)校提供智能服務(wù)。學(xué)校需將校內(nèi)與校外、課內(nèi)與課外、線(xiàn)上與線(xiàn)下、網(wǎng)絡(luò)空間與物理空間產(chǎn)生的數(shù)據(jù)匯集到學(xué)習(xí)評(píng)價(jià)平臺(tái)中,通過(guò)數(shù)據(jù)不斷的流轉(zhuǎn)迭代,幫助管理部門(mén)、教師、學(xué)生、家長(zhǎng)等利益相關(guān)者了解學(xué)生的學(xué)習(xí)情況,開(kāi)展精準(zhǔn)的教育干預(yù)與輔助。教師應(yīng)不斷提升信息化教學(xué)能力與數(shù)據(jù)素養(yǎng),能夠?qū)W(xué)習(xí)者不同學(xué)習(xí)時(shí)段產(chǎn)生的數(shù)據(jù)進(jìn)行分析,基于相關(guān)數(shù)據(jù)開(kāi)展精準(zhǔn)化教學(xué)及互動(dòng);家長(zhǎng)應(yīng)努力提升育兒專(zhuān)業(yè)知識(shí),學(xué)會(huì)客觀(guān)看待學(xué)習(xí)者產(chǎn)生的相關(guān)數(shù)據(jù)并提供個(gè)性化的輔助;學(xué)校管理者應(yīng)提升信息化領(lǐng)導(dǎo)力,能夠依據(jù)年級(jí)數(shù)據(jù)或全校性數(shù)據(jù)進(jìn)行科學(xué)歸因與精準(zhǔn)決策,促進(jìn)學(xué)校教學(xué)資源的均衡配置與教學(xué)效能的提升。
五、結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代,學(xué)習(xí)評(píng)價(jià)作為教育生態(tài)中的一環(huán),對(duì)實(shí)現(xiàn)人的德智體美勞全面發(fā)展起著非常重要的作用。數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià),通過(guò)不斷獲取、整合、分析學(xué)習(xí)過(guò)程中的文字、聲音、圖像、視頻與人體感知等多模態(tài)數(shù)據(jù),對(duì)教學(xué)和學(xué)習(xí)活動(dòng)的信息流與運(yùn)行軌跡作出觀(guān)測(cè)、解釋和反饋,幫助教育相關(guān)者發(fā)現(xiàn)教育中存在的問(wèn)題,輔助課堂學(xué)習(xí)中個(gè)性化干預(yù)的實(shí)現(xiàn)(朱曉玲,2019)。本文基于對(duì)信息時(shí)代學(xué)習(xí)評(píng)價(jià)現(xiàn)狀的分析,構(gòu)建了包含多場(chǎng)景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)機(jī)制,并提出以區(qū)塊鏈技術(shù)為核心,從認(rèn)知、情感、動(dòng)機(jī)和社會(huì)四個(gè)方面進(jìn)行學(xué)習(xí)綜合素質(zhì)評(píng)價(jià)的方法,為促進(jìn)教育教學(xué)的改進(jìn)與學(xué)業(yè)質(zhì)量的提升提供了借鑒。
總之,相對(duì)于傳統(tǒng)結(jié)果性教育評(píng)價(jià),數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)從多維度關(guān)注學(xué)習(xí)者的學(xué)習(xí)過(guò)程,能夠促進(jìn)教育管理者和教師對(duì)學(xué)習(xí)者的理解,為實(shí)施精準(zhǔn)化的教學(xué)干預(yù)提供輔助。不過(guò),要建立一個(gè)全面、可靠、真正對(duì)學(xué)習(xí)者有效的學(xué)習(xí)評(píng)價(jià)機(jī)制需要教育教學(xué)論專(zhuān)家、學(xué)校管理者和技術(shù)專(zhuān)家等多方協(xié)作。
參考文獻(xiàn):
[1][日]田中耕治(2012).日本形成性評(píng)價(jià)發(fā)展的回顧與展望[J].項(xiàng)純.全球教育展望,41(3):3-6,18.
[2]曹曉明,張永和,潘萌等(2019).人工智能視域下的學(xué)習(xí)參與度識(shí)別方法研究——基于一項(xiàng)多模態(tài)數(shù)據(jù)融合的深度學(xué)習(xí)實(shí)驗(yàn)分析[J].遠(yuǎn)程教育雜志,37(1):32-44.
[3]柴葳,向倩蕓(2015). 我國(guó)建立義務(wù)教育質(zhì)量監(jiān)測(cè)制度,今年起開(kāi)展監(jiān)測(cè)工作——中國(guó)特色“PISA”揭開(kāi)面紗[EB/OL].[2020-11-07].http://www.moe.gov.cn/jyb_xwfb/xw_fbh/moe_
2069/xwfbh_2015n/xwfb_150415/150415_mtbd/201504/t20150
416_187197.html.
[4]陳新亞,李艷(2020).《2020地平線(xiàn)報(bào)告: 教與學(xué)版》的解讀及思考——疫情之下高等教育面臨的挑戰(zhàn)與變革[J].遠(yuǎn)程教育雜志,38(2):3-16.
[5]郭雯雯,楊鳳梅(2019).課堂環(huán)境雙模態(tài)情感評(píng)價(jià)系統(tǒng)設(shè)計(jì)與效果分析[J].教學(xué)研究, 42(3):27-33.
[6]郭元祥,劉曉慶(2014).大規(guī)模學(xué)業(yè)評(píng)價(jià)的發(fā)展歷程、新趨勢(shì)及啟示[J].教育研究與實(shí)驗(yàn),(1):27-32.
[7]韓麗,李洋,周子佳等(2017).課堂環(huán)境中基于面部表情的教學(xué)效果分析[J].現(xiàn)代遠(yuǎn)程教育研究,(4):97-103,112.
[8]劉君玲,劉斌,張文蘭(2019).學(xué)業(yè)情緒對(duì)在線(xiàn)協(xié)作問(wèn)題解決的影響研究[J].中國(guó)電化教育,(7):82-90.
[9]劉明吉,王秀峰,黃亞樓(2000).數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[J].計(jì)算機(jī)科學(xué),27(4):54-57.
[10]劉智,方常麗,劉三
[11]孫發(fā)勤,鄧雯心(2019).基于人工智能的課堂學(xué)習(xí)情感評(píng)價(jià)研究[J].中國(guó)教育信息化,(23):58-62.
[12]田愛(ài)麗(2020).綜合素質(zhì)評(píng)價(jià): 智能化時(shí)代學(xué)習(xí)評(píng)價(jià)的變革與實(shí)施[J].中國(guó)電化教育,(1):109-113,121.
[13]涂冬波,蔡艷,丁樹(shù)良(2012).認(rèn)知診斷理論、方法與應(yīng)用[M].北京:北京師范大學(xué)出版社.
[14]新華網(wǎng)(2019). 中共中央 國(guó)務(wù)院關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見(jiàn)[EB/OL].[2020-11-07].http://www.xinhuanet.com/politics/2019-07/08/c_1124725254.htm.
[15]新華網(wǎng)(2020). 中共中央 國(guó)務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》[EB/OL].[2020-11-07].http://www.xinhuanet.com/2020-10/13/c_1126601551.htm.
[16]楊現(xiàn)民,李怡斐,王東麗等(2020).智能時(shí)代學(xué)習(xí)空間的融合樣態(tài)與融合路徑[J].中國(guó)遠(yuǎn)程教育,(1):46-53,72,77.
[17]藥文靜,姜強(qiáng),李月等(2020).眾包知識(shí)建構(gòu)下學(xué)業(yè)情緒影響因素及喚醒機(jī)制的科學(xué)學(xué)研究——面向深度學(xué)習(xí)的課堂教學(xué)結(jié)構(gòu)化變革研究之五[J].現(xiàn)代遠(yuǎn)距離教育,(5):33-42.
[18]張雪蓮,高玲(2009).學(xué)習(xí)動(dòng)機(jī)及其相關(guān)研究[J].教育理論與實(shí)踐,29(18):32-34.
[19]中國(guó)政府網(wǎng)(2015).教育部督導(dǎo)辦負(fù)責(zé)人就《國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)方案》答記者問(wèn)[EB/OL].[2020-08-11].http://www.gov.cn/xinwen/2015-04/15/content_2847308.htm.
[20]朱曉玲(2019).小學(xué)數(shù)學(xué)課堂學(xué)習(xí)評(píng)價(jià)的現(xiàn)狀及改進(jìn)策略研究[D].南京:南京師范大學(xué).
[21]Ashwin, T. S., & Guddeti, R. M. R. (2018). Unobtrusive StudentsEngagement Analysis in Computer Science Laboratory Using Deep Learning Techniques[C]// Proceedings of 2018 IEEE 18th International Conference on Advanced Learning Technologies (ICALT). IEEE: 436-440.
[22]Ashwin, T. S., & Guddeti, R. M. R. (2020). Automatic Detection of StudentsAffective States in Classroom Environment Using Hybrid Convolutional Neural Networks[J]. Education and Information Technologies, 25(2): 1387-1415.
[23]Barker, P. (1994). Designing Interactive Learning[M]. Dordrecht: Springer: 1-30.
[24]Canfield, W. (2001). ALEKS: A Web-Based Intelligent Tutoring System[J]. Mathematics and Computer Education, 35(2): 152-158.
[25]Chan, M. C. E., Ochoa, X., & Clarke, D. (2020). Multimodal Learning Analytics in a Laboratory Classroom[M]. Cham: Springer: 131-156.
[26]Craig, S. D., Hu, X., & Graesser, A. C. et al. (2013). The Impact of a Technology-Based Mathematics After-School Program Using ALEKS on Students Knowledge and Behaviors[J]. Computers & Education, 68: 495-504.
[27]Deniz, S., Lee, D., & Kurian, G. et al. (2019). Computer Vision for Attendance and Emotion Analysis in School Settings[C]// 2019 IEEE 9th Annual Computing and Communication Workshop and Conference (CCWC). IEEE: 134-139.
[28]Eilam, E. (2019). Synchronization: A Framework for Examining Emotional Climate in Classes[J].Palgrave Communications,5(1):1-11.
[29]Fredricks, J. A., & Paris, B. A. H. (2004). School Engagement: Potential of the Concept, State of the Evidence[J]. Review of Educational Research, 74(1): 59-109.
[30]Hsieh, S., & Lin, S. J. (2019). The Dissociable Effects of Induced Positive and Negative Moods on Cognitive Flexibility[J].Scientific reports,9(1):1-10
[31]Hudson, B. (2002). Critical Dialogue Online: Personas, Covenants, and Candlepower[M]. London: Sage: 53-90.
[32]Jacqueleen, A. R. (2015). The Skinny on Big Data in Education: Learning analytics Simplified[J]. TechTrends, 59(2): 75-79.
[33]Johnson-Glenberg, M. C. (2019). The Necessary Nine: Design Principles for Embodied VR and Active Stem Education[M]. Singapore: Springer: 83-112.
[34]Kamath, A., Biswas, A., & Balasubramanian, V. (2016). A Crowdsourced Approach to Student Engagement Recognition in E-Learning Environments[C]// Proceedings of 2016 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE: 1-9.
[35]Lambert, A. D., Terenzini, P. T., & Lattuca, L. R. (2007). More Than Meets the Eye: Curricular and Programmatic Effects on Student Learning[J]. Research in Higher Education, 48(2): 141-168.
[36]Li, Z., & Zhan, Z. (2020). Integrated Infrared Imaging Techniques and Multi-Model Information via Convolution Neural Network for Learning Engagement Evaluation[J]. Infrared Physics & Technology, 109: 103430.
[37]Liu, C. J., & Huang, C. F. (2016). Innovative Science Educational Neuroscience: Strategies for Engaging Brain Waves in Science Education Research[M]. Singapore: Springer: 233-247.
[38]Lodge, J. M., & Corrin, L. (2017). What Data and Analytics Can and Do Say About Effective Learning [J/OL]. NPJ Science of Learning. https://www.nature.com/articles/s41539-017-
0006-5.
[39]McAfee, A., Brynjolfsson, E., & Davenport, T. H. et al. (2012). Big Data: The Management Revolution[J]. Harvard Business Review, 90(10): 60-68.
[40]Mullis, I. V., & Martin, M. O. (2014). TIMMS Advanced 2015 Assessment Frameworks[DB/OL]. [2020-12-05]. https://files.eric.ed.gov/fulltext/ED559364.pdf.
[41]OECD (2014). PISA 2012 Results: Creative Problem Solving: StudentsSkills in Tackling Real-Life Problems (Volume V)[DB/OL]. [2020-08-01]. http://www.oecd.org/pisa/keyfindings/PISA-2012-results-volume-V.pdf.
[42]OECD (2019). Social and Emotional Skills Well-Being, Connectedness and Success[EB/OL]. [2020-08-01]. https://www.oecd.org/edu/school/UPDATED%20Social%20and%20
Emotional%20Skills%20-%20Well-being,%20connectedness%20and%20success.pdf%20(website).pdf.
[43]Psaltis, A., Apostolakis, K. C., & Dimitropoulos, K. et al. (2017). Multimodal Student Engagement Recognition in Prosocial Games[J]. IEEE Transactions on Games, 10(3): 292-303.
[44]Shu, H., & Gu, X. (2018). Determining the Differences Between Online and Face-to-Face Student–Group Interactions in a Blended Learning Course[J]. The Internet and Higher Education, 39:13-21.
[45]Smit, R., Bachmann, P., & Blum, V. et al. (2017). Effects of a Rubric for Mathematical Reasoning on Teaching and Learning in Primary School[J]. Instructional Science, 45(5): 603-622.
[46]Stufflebeam, D. L. (1998). Conflicts Between Standards-Based and Postmodernist Evaluations: Toward Rapprochement[J]. Journal of Personnel Evaluation in Education, 12(3): 287-296.
[47]Van den Berg, M., Harskamp, E. G., & Suhre, C. J. M. (2016). Developing Classroom Formative Assessment in Dutch Primary Mathematics Education[J]. Educational Studies, 42(4): 305-322.
[48]Whitehill, J., Serpell, Z., & Lin, Y. C. et al. (2014). The Faces of Engagement: Automatic Recognition of Student Engagementfrom Facial Expressions[J]. IEEE Transactions on Affective Computing, 5(1): 86-98.
[49]Yamtim, V., & Wongwanich, S. (2014). A Study of Classroom Assessment Literacy of Primary School Teachers[J]. Procedia-Social and Behavioral Sciences, 116: 2998-3004.
[50]Yoo, Y., Lee, H., & Jo, I. H. et al. (2015). Educational Dashboards for Smart Learning: Review of Case Studies[M]// Emerging Issues in Smart Learning. Springer, Berlin, Heidelberg: 145-155.
收稿日期 2021-01-05 責(zé)任編輯 汪燕
Evaluation Mechanism and Method for Data-Driven Precision Learning
HUANG Tao, ZHAO Yuan, GENG JING, WANG Han, ZHANG Hao, YANG Huali
Abstract: Comprehensive quality evaluation is an inevitable requirement for implementing the fundamental task of deepening education reform and cultivating talents. Information technology promotes the process of education and teaching, which makes the traditional education evaluation mechanism move towards the direction of data-driven learning evaluation. Data-driven precision learning evaluation is an evaluation method that observes, explains and feedbacks on the information flow and running track of teaching and learning activities by continuously obtaining, integrating and analyzing multi-modal data in the learning process, so as to find problems existed in education and assist the intervention of classroom teaching. It contains multi-scene data collection, multi-spatial data fusion, accurate analysis model construction, and analysis result visualization. Multi-scene data collection provides data sources and quantitative means for learning evaluation;multi-spatial data fusion provides unified data standards for learning evaluation;accurate analysis model provides data-driven learning analysis and evaluation methods for learning evaluation and analysis results visualization provides feedback and application services for learning evaluation. The data-driven precision learning evaluation framework should integrate technologies such as artificial intelligence, cloud computing, learning analysis and context awareness based on the block chain technology. It can comprehensively collect multiple massive data in the learning process on multi-dimensional spatial-temporal scale. Through comprehensive and systematic statistical analysis and data mining, it can evaluate students learning status from their intrinsic motivation, cognitive development, emotional performance, to comprehensive social interaction ability in a multi-dimensional, timely and accurate way. At present, to explore data-driven accurate learning evaluation, we can carry out research on building a comprehensive quality evaluation framework in line with the characteristics of multi-spatial data, improving the collection and sharing mechanism of process data, breaking through the key technologies of emotion, cognition, motivation and social evaluation, and developing a data-driven learning evaluation platform.
Keywords: Data Driven; Precision; Learning Evaluation; Evaluation Mechanism; Evaluation Method