高維嘉
(云南師范大學(xué) 信息學(xué)院,云南 昆明 650500)
近年來,人工智能、大數(shù)據(jù)等一系列信息技術(shù)被廣泛應(yīng)用于教育領(lǐng)域,數(shù)據(jù)驅(qū)動教育評價成為數(shù)字技術(shù)與教育深度融合的熱點之一。2020 年10月,中共中央、國務(wù)院印發(fā)的《深化新時代教育評價總體方案》強調(diào),要充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性[1]。2022年,教育部發(fā)布的《教育部2022年工作要點》中明確提出:“實施教育數(shù)字化戰(zhàn)略行動?!保?]教育評價是教育發(fā)展的“指揮棒”,教育評價作為一種導(dǎo)向,影響著教育發(fā)展的方向。長期以來,我國的教育評價依然存在著模式陳舊、指標單一、數(shù)據(jù)資源匱乏、評價主觀性強和算法靈活性差等問題。當前,傳統(tǒng)的評價方式已無法滿足教學(xué)質(zhì)量監(jiān)測評估的需要,因此,必須將數(shù)字技術(shù)賦能于教育評價中,進一步規(guī)范評價工作,逐步扭轉(zhuǎn)當前評價工作中出現(xiàn)的“五唯”問題[3],構(gòu)建科學(xué)化、客觀化、智能化的教育評價體系。
基于此,本文借助CiteSpace 軟件對我國數(shù)據(jù)驅(qū)動教育評價的相關(guān)文獻進行可視化分析,通過對關(guān)鍵詞、高頻詞、突現(xiàn)詞的分析,探討數(shù)據(jù)驅(qū)動教育評價的研究現(xiàn)狀與熱點,以期為未來我國教育評價的研究與實踐提供參考。
本文采用系統(tǒng)文獻綜述法對收集的文獻進行分析[4],這種方法可以清晰梳理要研究的文獻的內(nèi)容,通過選擇、評價和整合等幫助研究者更好地開展研究。知識圖譜以圖形、圖像形式來表示節(jié)點和關(guān)系,可以直觀呈現(xiàn)相關(guān)知識概念并挖掘概念間的復(fù)雜關(guān)系,最終輔助用戶決策[5];CiteSpace 軟件能夠用知識圖譜的方式將研究內(nèi)容的演化路徑和前沿問題進行分析與預(yù)測[6]。因此,為了探索數(shù)據(jù)驅(qū)動教育評價的最新研究進展,本文以CiteSpace5.7R 5 為主要研究工具,對相關(guān)數(shù)據(jù)進行可視化分析處理,以直觀的知識圖譜方式展示作者合作、機構(gòu)合作、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞聚類、突現(xiàn)詞等內(nèi)容,并進行結(jié)果分析,以此揭示大量數(shù)據(jù)背后所隱含的規(guī)律,探究數(shù)據(jù)驅(qū)動教育評價的研究趨勢。
文獻數(shù)據(jù)來源于“中國知網(wǎng)”(CNKI),檢索時間范圍選定為2000 年—2022 年,采用高級文獻檢索方式。將“教育評價”設(shè)為第一個檢索主題詞,先后增加“數(shù)據(jù)驅(qū)動”“信息技術(shù)”“數(shù)字化”“智能化”“智慧化”“智能測評”等為第二個主題詞進行檢索,并精確匹配定位主題。篩選標準為:(1)國內(nèi)中文文獻;(2)排除學(xué)術(shù)會議論文、新聞報道、導(dǎo)讀、碩博論文,主要采用期刊文獻;(3)研究的核心主題要與技術(shù)賦能教育評價相關(guān)。按照以上標準,逐一檢驗和篩選結(jié)果,摘除相關(guān)性低、質(zhì)量差的文獻,選取與本次研究吻合度較高的文獻。篩選后共獲得955篇文獻,本研究主要選取2010年—2022年的論文作為研究數(shù)據(jù)。
本文將檢索到的955條文獻信息導(dǎo)入CiteSpace,去除重復(fù)文獻,選取了2010年—2022年發(fā)表的共813篇文獻來繪制年代分布圖,并按照論文發(fā)表的年份進行頻次計數(shù),得到2010 年—2022 年我國教育評價研究各年文獻數(shù)量分布圖(如圖1所示)。
圖1 近13年我國教育評價研究各年文獻數(shù)量分布圖
從圖1中可以看出,從2010年至2022年,技術(shù)賦能的我國教育評價研究文獻的數(shù)量呈直線上升的趨勢,尤其是近兩三年來增加的數(shù)量較為明顯,且刊發(fā)在核心期刊(包括SCI、北大核心、CSSCI)上的論文數(shù)年均都在35 篇以上,在一定程度上也體現(xiàn)了技術(shù)賦能教育評價的研究有趨熱的跡象。可以預(yù)見,在教育數(shù)字化發(fā)展的背景下,人工智能、大數(shù)據(jù)等新興技術(shù)能夠為重構(gòu)評價機制、推動智能評價、建立師生畫像、建設(shè)評價平臺等提供支持。
利用軟件對發(fā)文作者進行分析,可以得到數(shù)據(jù)驅(qū)動的教育評價研究領(lǐng)域的相關(guān)作者共現(xiàn)圖譜(如圖2所示)。該圖譜有326個節(jié)點,111條連接線,各節(jié)點之間的連接過少,呈點狀分布,僅有1/3的作者有合作關(guān)系,說明該領(lǐng)域的作者還缺乏團隊合作研究,還需要加強各作者之間的聯(lián)系。其中,圖譜中顯示該領(lǐng)域發(fā)文量排名前三的作者分別為:發(fā)文量為7 篇的董奇,其研究方向以科技賦能、智能教育評價為主;解成君、鄭勤華兩位作者并列排名第二,均發(fā)表了5 篇文章。解成君的研究方向為人工智能數(shù)字技術(shù)助力教育評價發(fā)展,鄭勤華的研究方向主要是人工智能監(jiān)測和在線學(xué)習(xí)測評;排名第三的是劉云生,發(fā)表了4 篇相關(guān)文章。除此之外,還有很多發(fā)文量為1-3篇的作者,他們構(gòu)成了數(shù)據(jù)驅(qū)動教育評價領(lǐng)域的核心作者群,為教育評價的相關(guān)研究做出了較大貢獻。
圖2 作者共現(xiàn)圖譜
進一步對排名前10 的發(fā)文機構(gòu)進行統(tǒng)計(如表1 所示),可以發(fā)現(xiàn):北京師范大學(xué)的發(fā)文量高達33篇,可見其已成為該領(lǐng)域的核心研究機構(gòu)。發(fā)文量排名靠前的研究機構(gòu)除了高校的教育學(xué)部外,還有部分高校(如華東師范大學(xué)和華南師范大學(xué)等)的教育信息技術(shù)學(xué)院和計算機學(xué)院??梢钥闯?,研究者越來越關(guān)注數(shù)字信息技術(shù)與教育評價的融合發(fā)展研究。根據(jù)發(fā)文數(shù)量可以看出,對教育評價的研究主要還是集中于各個高校和一些教育評估研究院所。另外,各大高校研究機構(gòu)之間的連接線幾乎為0,說明以獨立研究為主,機構(gòu)之間缺乏合作,需要加強交流和合作,這樣才能共同產(chǎn)出高質(zhì)量的研究成果。
1.關(guān)鍵詞分析
關(guān)鍵詞的高頻次和高中心性能夠從某個角度反映出一段時間內(nèi)該領(lǐng)域研究者普遍關(guān)注的核心內(nèi)容,因此可以被用來確定某個研究領(lǐng)域的熱點[3]。本文選取詞頻較高的前16 個關(guān)鍵詞進行展示(如表2所示)。結(jié)合關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜可知,目前研究者主要圍繞“教育大數(shù)據(jù)”“智能測評”“深度學(xué)習(xí)”“信息技術(shù)”等技術(shù)開展教育評價研究?!敖逃髷?shù)據(jù)”出現(xiàn)的頻次最多,說明大數(shù)據(jù)技術(shù)引起了研究者的高度重視。同時,“增值評價”“綜合素質(zhì)評價”也是學(xué)者研究的重點。
表2 我國數(shù)據(jù)驅(qū)動教育評價的文獻高頻關(guān)鍵詞表
“高等教育”“職業(yè)教育”不是檢索詞卻出現(xiàn)在了詞表中,反映了研究者對這兩個領(lǐng)域的高度重視。另外,“增值評價”“教學(xué)評價”“深度學(xué)習(xí)”等關(guān)鍵詞的中心性值分別為:0.5、0.16、0.24,說明其在該領(lǐng)域中也起到了重要作用,但其詞頻卻相對較低,說明研究者對其的重視程度還不夠。
2.關(guān)鍵詞聚類分析
為進一步明確學(xué)界對教育評價的研究主要集中在哪些細分領(lǐng)域,熱點主題及其相互關(guān)系,本文通過CiteSpace 軟件的關(guān)鍵詞聚類功能,對近13 年我國數(shù)據(jù)驅(qū)動的教育評價進行關(guān)鍵詞聚類分析(時間跨度選擇2010-2022 年,時間切片選擇1 年),生成關(guān)鍵詞共現(xiàn)聚類圖譜(如圖3 所示)。圖中關(guān)鍵詞出現(xiàn)頻率多少可由節(jié)點面積的大小展現(xiàn),節(jié)點越大則表示出現(xiàn)的頻率越高,可以從宏觀上反映當前數(shù)字化環(huán)境下教育評價的研究現(xiàn)狀。結(jié)合以上各細分領(lǐng)域,本文從新時代教育評價、評價理念、評價體系、評價主體、評價方法與工具五個方面總結(jié)教育評價研究的熱點。
圖3 關(guān)鍵詞聚類圖譜
(1)新時代教育評價
新時代教育評價是教育評價研究領(lǐng)域當前的重點和焦點,其關(guān)鍵詞包括“立德樹人”“破‘五唯’”“升學(xué)率”“考核評價”等,不同學(xué)者從不同角度發(fā)表了自己的觀點與看法。例如,破除“五唯”是國家就深化高考改革和高等教育評價提出的新的要求。為此,不少學(xué)者就多元化評價展開積極探索,如李浩等人指出“建立多元評價錄取標準,實現(xiàn)評價主體多元化,完善健全監(jiān)督機制是中國高考多元評價體系探索實踐之路的關(guān)鍵著力點”[7]。研究者積極探索教育評價的改革路徑,旨在為貫徹黨的教育方針,提高教育治理水平,促進教育現(xiàn)代化提供理論和實踐上的價值。
(2)評價理念
《深化新時代教育評價總體方案》提出了“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”的“四個評價”新理念,成為我國教育評價的重要行動指南?!斑^程性評價”與“發(fā)展性評價”是我國教學(xué)評價模式改革的重要方向,其研究的難點在于對學(xué)習(xí)者學(xué)習(xí)過程的全程跟蹤、數(shù)據(jù)收集和實時反饋。為此,上超望等學(xué)者研究了學(xué)習(xí)者的數(shù)據(jù)挖掘、學(xué)習(xí)分析和過程性評價數(shù)據(jù)結(jié)果展示等技術(shù),能充分發(fā)揮過程性評價的優(yōu)勢,促進學(xué)習(xí)者學(xué)習(xí)質(zhì)量的提升[8]。李景奇等試圖通過借助大數(shù)據(jù)技術(shù)建設(shè)大數(shù)據(jù)監(jiān)測預(yù)警平臺,將發(fā)展性評價推廣應(yīng)用[9]。
“增值評價”是以學(xué)生發(fā)展為核心的一種評價模式,是國內(nèi)外教育研究領(lǐng)域的熱點和難點。增值評價倡導(dǎo)學(xué)生的進步、縱向的發(fā)展,也就是“自己和自己比”的縱向成長。學(xué)者汶莎莎等指出,增值性評價以促進學(xué)生進步為主,兼顧教育評價的“診斷”“激勵”與“改進”功能,體現(xiàn)了教育教學(xué)評價的動態(tài)性和生成性,這種評價鼓勵學(xué)生用自身獨特的學(xué)習(xí)成果來展示個性化的發(fā)展“增值”,正是新時代教育評價的核心訴求[10]。但目前,增值性評價的數(shù)據(jù)獲取主要還是依靠自陳式量表與標準化測試等途徑,可見數(shù)據(jù)采集方式還比較傳統(tǒng)、單一。為了能讓數(shù)據(jù)更好地驅(qū)動評價方式的改革創(chuàng)新,研究者還需要不斷探索增值性評價系統(tǒng)的開發(fā),高效、客觀、公正地對學(xué)生的學(xué)習(xí)進行增值評價,從而促進學(xué)生的全面發(fā)展。
(3)評價體系
《深化新時代教育評價總體方案》明確指出,我國要從學(xué)校、教師、學(xué)生三個層面進行評價改革,建立更加科學(xué)健全的教育評價體系。關(guān)鍵詞聚類圖譜中的節(jié)點“教育評價體系”包括了“評價指標體系”“中小學(xué)”“高考評價體系”等主題詞,這說明我國教育評價體系的建設(shè)仍需在中小學(xué)評價、考試招生制度、教育督導(dǎo)、數(shù)據(jù)密集型評價新范式等重點領(lǐng)域持續(xù)發(fā)力[11]。目前,教育部考試中心發(fā)布了《中國高考評價體系》,有不少學(xué)者也對針對高考“學(xué)業(yè)評價”“綜合素質(zhì)評價”等相關(guān)主題開展了深入研究。
(4)評價主體
教育評價主體就是教育評價的實施者和組織者,評價主體多元化是當前評價改革的重要理念和方向。新課程改革要求,在課堂評價主體上要打破一元化評價的現(xiàn)狀,開展教師評價、學(xué)生自評、學(xué)生互評的主體多元化評價。然而,在“學(xué)生評價”中,存在評價主體錯位、學(xué)生自評意識不足、教師評價觀念落后、學(xué)校評價功利性較強等問題。“教師評價”容易被績效、問責、學(xué)生成績、標準化等因素所影響。彭波等學(xué)者依托大數(shù)據(jù)和智能化技術(shù),開展技術(shù)賦能的教育評價平臺建設(shè)研究,以教育大數(shù)據(jù)為中心,通過智慧教室、在線學(xué)校系統(tǒng)等采集數(shù)據(jù),實現(xiàn)人機交互的精準評價,關(guān)注學(xué)習(xí)過程的智慧多主體評價,消除主體單一、錯位等不利影響,激發(fā)多元評價主體參與的積極性[12]。
(5)評價方法與工具
評價方法創(chuàng)新是建立教育評價體系的重要內(nèi)容,當前國內(nèi)外有的評價工作過于依賴數(shù)據(jù),過于強調(diào)定量研究。其不足主要表現(xiàn)為:表征的教育現(xiàn)象單一,作為評價依據(jù)有孤立、偏向性和不全面性等缺點,數(shù)據(jù)本身可能存在可靠性問題[13]。因此,研究如何改進和應(yīng)用計量評價,提升評價質(zhì)量,成為新的課題。根據(jù)文獻統(tǒng)計,學(xué)者們在評價方法或評價工具上多選擇量化工具開展研究,量化評價研究成果的數(shù)量較多,如層次分析法、K-means算法、模糊數(shù)學(xué)、AHP 算法、BP 神經(jīng)網(wǎng)絡(luò)、矩陣理論等方面的研究較多??梢姡斍敖逃u價領(lǐng)域比較重視實證研究,存在數(shù)據(jù)至上的評價思維,在一定程度上忽略了教育評價的人文性。有學(xué)者就此指出,教育評價領(lǐng)域?qū)υu價工具通用性的關(guān)注不夠,工具設(shè)計面向的群體比較狹窄,因此要保證所有學(xué)習(xí)者無差別體驗,避免數(shù)字化評價帶來新一輪教育公平風險[14]。
教育評價是隨著時代的更新和人們對教育功能認識的變化而不斷演變的,本文對相關(guān)論文關(guān)鍵詞進行突現(xiàn)分析(選取時間段為2010-2022 年,時間切片為2 年),可以了解該領(lǐng)域的發(fā)展路徑和各階段所出現(xiàn)的熱點關(guān)鍵詞。
在突現(xiàn)圖譜中(如圖3所示),CiteSpace 軟件中默認了8 個突現(xiàn)詞,從關(guān)鍵詞突現(xiàn)強度來看,從強到弱的順序是:大數(shù)據(jù)時代、教育評價、智慧教育、教育質(zhì)量綜合評價、發(fā)展性評價、改革、學(xué)習(xí)評價、教育信息化。在2010年首次出現(xiàn)“評價改革”這一關(guān)鍵詞,說明在早期研究者就開始關(guān)注評價方式的改革,其熱點一直持續(xù)到2017年。從2014年起,研究者們開始關(guān)注教育評價的理念創(chuàng)新,加強了對“發(fā)展性評價”“教育質(zhì)量綜合評價”等主題的探索和研究,是我國教育評價理念轉(zhuǎn)變的一個轉(zhuǎn)折點。從2018年開始,隨著技術(shù)的不斷發(fā)展,技術(shù)與教育評價的融合發(fā)展成為新興研究方向,逐漸擴展到高等教育、基礎(chǔ)教育、職業(yè)教育等領(lǐng)域。在“智慧教育”中的智慧評價是當前教育數(shù)字化轉(zhuǎn)型中的重點問題,利用數(shù)字技術(shù)創(chuàng)新評價方式,已成為教育評價的大趨勢。智慧評價可以圍繞學(xué)習(xí)者特征,通過大數(shù)據(jù)技術(shù)開展教育質(zhì)量監(jiān)測,借助人工智能技術(shù)挖掘?qū)W生的學(xué)習(xí)潛能,動態(tài)監(jiān)測與展示學(xué)習(xí)過程與結(jié)果,實現(xiàn)精準的智能測評與分析,從而為優(yōu)化教學(xué)質(zhì)量提供決策指導(dǎo)意見。
圖3 8個突現(xiàn)關(guān)鍵詞圖譜
本文借助Citespace 軟件可視化分析了教育數(shù)字化背景下數(shù)據(jù)驅(qū)動的教育評價研究的相關(guān)文獻,主要有以下研究發(fā)現(xiàn):第一,從發(fā)文量看,我國教育評價研究自2010 年來熱度持續(xù)上升,于2021 年達到巔峰。在黨和政府的領(lǐng)導(dǎo)下,各地積極探索義務(wù)教育質(zhì)量評價改革,落實《深化新時代教育評價總體方案》,積累了大量有益經(jīng)驗,但評價方式方法還不夠有效,單純以升學(xué)率和分數(shù)評價學(xué)校與學(xué)生的傾向還沒有得到根本扭轉(zhuǎn)。第二,從研究作者與機構(gòu)來看,有不少核心研究者和研究機構(gòu)產(chǎn)出了很多優(yōu)秀的研究成果,產(chǎn)生了較大的影響力,但作者之間的緊密性較差,呈獨立分散狀態(tài)分布,缺乏合作。第三,從關(guān)鍵詞來看,我國教育評價研究離不開數(shù)據(jù)驅(qū)動和技術(shù)賦能,該領(lǐng)域的研究熱點分布廣泛、主題豐富,主要集中于新時代教育評價、評價理念、評價體系、評價主體、評價方法與工具等五個方面。大數(shù)據(jù)、人工智能、區(qū)塊鏈等數(shù)字技術(shù)快速融入教育評價領(lǐng)域,為推動教育教學(xué)評價改革創(chuàng)新提供了條件,有助于推動評價方式的變革和評價內(nèi)容的重構(gòu),為教育教學(xué)評價改革創(chuàng)新提供了可行途徑。
1.未來更關(guān)注人才培養(yǎng)和能力素質(zhì)評價
信息技術(shù)改變著人類的思維、工作和生活方式,各行各業(yè)對知識、能力和素質(zhì)的要求也更高。因此,數(shù)字素養(yǎng)、協(xié)同交互思維、創(chuàng)新人際交往關(guān)系等問題是未來教育研究將會持續(xù)關(guān)注的熱點。另外,傳統(tǒng)的教育評價大多是關(guān)注對學(xué)生知識、成績的測評,即對智力水平的評價,但在數(shù)字化時代,教育評價內(nèi)容、模式、工具變得更完整和全面,評價方式更加多元,更多關(guān)注教師、學(xué)生的核心素養(yǎng)、信息化素養(yǎng)、綜合素質(zhì)、身心健康等方面的問題。
2.未來更關(guān)注機器人教育,探索增值評價
隨著信息技術(shù)的快速發(fā)展,以機器學(xué)習(xí)、數(shù)據(jù)挖掘和學(xué)習(xí)分析為關(guān)鍵技術(shù)的智能技術(shù)也正深刻影響著人們的學(xué)習(xí)和生活方式。機器人教育是指利用工具,挖掘教育功能,通過機器人課程,開展一系列教育活動,激發(fā)學(xué)習(xí)者的興趣[15]。比如,通過編程課程、機器人大賽等教學(xué)方式來培養(yǎng)學(xué)生的編程能力、團隊合作能力、創(chuàng)新能力和動手實踐能力,提升學(xué)生的信息素養(yǎng)??梢?,機器人教育將成為未來教育的一種新趨勢。然而,目前很多中小學(xué)校依然未將機器人教育設(shè)為一門獨立課程,重視程度不夠,缺乏系統(tǒng)性的規(guī)劃和教學(xué)設(shè)計。同時,人工智能賦能的教育評價改革,要進一步探索增值評價,從關(guān)注結(jié)果評價過渡到聚焦關(guān)注教師教學(xué)全過程和學(xué)生學(xué)習(xí)生涯全過程,更加關(guān)注師生的思維能力成長過程,努力建立系統(tǒng)、科學(xué)的評價體系,促進人的全面發(fā)展。
3.未來更關(guān)注數(shù)據(jù)賦能的新發(fā)展價值研究
目前,數(shù)據(jù)技術(shù)不斷賦能教育評價,擺脫了以往依賴主觀經(jīng)驗和標準化測試來衡量和評價師生的傳統(tǒng)方式,但技術(shù)不是完美的,在教育道德倫理、人機協(xié)同關(guān)系的處理、師生隱私與數(shù)據(jù)安全等方面也存在著一定的風險。以此展望,未來的研究可能更多需要關(guān)注人機關(guān)系的處理,要求研究者具備以人為本的人機協(xié)同思維,積極應(yīng)對技術(shù)帶來的正負面影響,構(gòu)建和諧共生的新生態(tài),促進教育評價的高效性和客觀性。
數(shù)字化時代,大數(shù)據(jù)、人工智能等信息技術(shù)將進一步豐富教育評價的方法和手段,拓展教育評價的內(nèi)容,讓教師、學(xué)生、家長乃至全社會參與其中,對教與學(xué)的過程進行全方位實時監(jiān)測,讓評價變得更科學(xué)和客觀。數(shù)據(jù)成了驅(qū)動教育數(shù)字化變革的基礎(chǔ),面對教育評價的發(fā)展趨勢,研究者未來會更加關(guān)注如何利用教育大數(shù)據(jù)構(gòu)建以核心素養(yǎng)為導(dǎo)向、促進學(xué)生德智體美勞全面發(fā)展的教育評價體系等方面的問題??梢灶A(yù)見,在未來社會,大數(shù)據(jù)與教育評價的深度融合將成為必然趨勢,而其涉及的一系列安全問題、隱私保護問題、公平風險問題等也會成為未來研究者高度重視的研究方向。