如今人工智能、大數(shù)據(jù)、VR、AR等技術正在并將進一步地深刻影響教育評價的形態(tài),促進它的轉型,而教育評價的轉型將創(chuàng)造更好的健康的未來教育生態(tài)。在這樣健康的教育生態(tài)中,億萬兒童青少年將更愉快、更健康、全面?zhèn)€性化地得到發(fā)展。
建立新的教育評價制度迫在眉睫
面向未來就是創(chuàng)新發(fā)展。創(chuàng)新發(fā)展首先指的是通過跨界融合、人工智能和教育的結合,推動教育的發(fā)展。只有人工智能技術推動了教育實踐中很多重大現(xiàn)實問題的解決,才能夠反推、倒逼人工智能大數(shù)據(jù)等技術的進一步研究與研發(fā)。
教育評價的問題以及改進變革教育評價,是為了提高我們國家的教育質量,推進教育公平,促進兒童青少年的身心健康發(fā)展。只有我們找準了教育領域的真需求、剛性需求,我們的技術才能發(fā)揮更大的作用。
人工智能+教育,需要從社會的發(fā)展出發(fā)。未來社會對未來人才素養(yǎng)提出了新的要求,我們的工作在未來將會發(fā)生很大變化,我們需要具有信息素養(yǎng)、數(shù)據(jù)素養(yǎng),需要有更多的時間和精力去進行創(chuàng)造性的工作,去發(fā)展我們高階的問題解決能力,需要有更強的社會責任感、法制意識。在建設人類命運共同體的今天,還需要具有更強的全球意識。這些對未來社會、對人才的新需求,許多國際組織在各種戰(zhàn)略規(guī)劃中都給予了高度的重視,可以說,世界各國從來沒有像今天這樣高度關注未來人才的核心素養(yǎng)。
我們的教育要進行變革,目的就是為了幫助學生提升核心素養(yǎng)。但在當下的教育條件下,我們中小學生的發(fā)展仍然存在很多問題,涉及學生的身體健康、心理健康、社會責任感、實踐動手能力、創(chuàng)新能力、社會溝通交往能力等方面。這些問題的長期存在和今天在教育實踐中存在的重分數(shù)輕能力、重共性輕個性、重知識輕素養(yǎng),注重結果不注重過程,重視學習不注重健康等一系列問題密切相關。
造成這些問題的原因很多,關鍵的因素就是教育評價。由于沒有客觀權威的評價,今天的教育仍然存在比較突出的應試教育傾向,素質教育推進十分困難。譬如考試,作為人才選拔的一個重要方式,有人才選拔的主要功能,但不是用來評價全面教育質量的手段和方法。因此,教育評價制度體系的建立、教育評價方法的改革已到了必須要抓的地步。
2019年6月,中共中央、國務院印發(fā)《關于深化教育教學改革全面提高義務教育質量的意見》,第18條明確提出,健全質量評價監(jiān)測體系。建立以發(fā)展素質教育為導向的科學評價體系,國家制定縣域義務教育質量、學校辦學質量和學生發(fā)展質量評價標準。在深化教育體制改革中,要扭轉不科學的教育評價導向,建立促進學生德智體美勞全面發(fā)展的教育評價制度,從根本上解決教育評價的指揮棒問題。要做到這一點,光有政策導向、政府的決定是不夠的,還需要科學的方法作支撐。
智能化教育評價的新趨勢
云計算技術、5G技術物聯(lián)網以及智能終端等技術為開展智能的教育評價提供了支撐條件;AR、VR技術,各種智能識別技術,語音識別技術以及穿戴設備技術,使得我們能夠創(chuàng)設更加真實的情境來評價孩子;一系列計算建模技術、分析技術的發(fā)展,使得評價的結果能夠更加準確、高效、及時地反饋給個體。所有這些技術的整合、結合將推動教育評價進入新的發(fā)展階段。
過去教育評價由于技術的限制,只能注重知識和基本能力的評價,很難對德智體美勞進行全面評價?,F(xiàn)在新的智能化評價可以進行精準的改進指導(包括提供改進的方法和內容),具有了更強的促進人的全面發(fā)展的可能性。
過去的評價,由于手段方法、計算、儲存等技術的局限性,我們只能用抽樣的方法,選取有代表性的樣本進行,不可能針對所有的學生。即使針對某個樣本,我們也更多是給予一般的平均數(shù)標準差的描述,很難做到針對每一個學生。現(xiàn)在新技術的使用,使得我們可以面對所有的學生,甚至不用取樣,用整體取樣的方法就夠了。不僅如此,現(xiàn)在面對全體還能給每一個學生進行個性化的評價、指導。
過去我們收集的數(shù)據(jù)只能用比較簡單的文本信息或者一些圖片信息來呈現(xiàn),視頻信息都很有限;現(xiàn)在我們可以用大量的更多更豐富的多模態(tài)信息來呈現(xiàn),而且能對這些信息進行自動化的智能化的分析,加工評判。
智能化的評價還使我們這樣一種工作成為可能:過去的評價就是考試,無論小考還是大考,測驗就是測驗。現(xiàn)在的評價考試可以融入你日常的行為、日常中的學習以及老師日常的教育,帶有一些伴隨性、隱形性的特點,增加了評價結果的真實性,生態(tài)效度更高。
過去的評價分析成本很高,通常需要延遲反饋、指導?,F(xiàn)在可以做到及時反饋、及時指導,而且有針對性地個性化的推送。隨著未來新技術的進一步發(fā)展,這方面能力會越來越強大。
智能化教育評價可以實現(xiàn)更為全面的評價
現(xiàn)在世界各國,已經在應用智能化的教育測評方法方面取得了重要的進展。隨著時間的推移、應用的深入,它的應用水平將會越來越高。比如學生在學習過程、身心健康發(fā)展中,情緒是很重要的一個維度。比如數(shù)學學習過程中,有的孩子是焦慮的,有的甚至很嚴重。評價一個數(shù)學課的教學,不僅要看數(shù)學成績的高與低,還應包括學生對數(shù)學學習的情緒、情感,熱愛程度,以及自信心程度。這些我們可以利用文本分析技術、語音的分析技術、圖像識別技術以及學譜儀等一些新的方法,對它進行評價。
如今,無論在線下現(xiàn)實社會,還是網上虛擬世界,人與人之間都會發(fā)生很多社會交往,社會交往技能就顯得極其重要。用什么方法評價測試這種能力呢?我們可以通過兩個及以上同學間的群體的合作過程中形成的過程性的數(shù)據(jù),從中抽取關鍵的有用信息,對學生社會交往的水平進行評價。
語言表達能力是一種十分重要的能力。有了新的人工智能及其相關技術,我們對語言學習的評價就有了進一步擴展的可能。過去我們對語言學習的評價更多地集中在閱讀理解,對口語、聽力評價比較困難,研究成本也非常高?,F(xiàn)在語音技術以及人工智能技術的發(fā)展,使我們無論對母語學習,還是對中國人學第二語言,抑或對外國人學漢語,都提供了前所未有的新的評價方式的可能,對我們國家少數(shù)民族的孩子學好普通話也提供了新的可能。
藝術素養(yǎng)(如學習中國的傳統(tǒng)文化、書法)很重要。應用諸如OCR的智能書寫的測評技術,我們也可以對學生的書法水平進行更為客觀的大樣本的省時、省力的低成本的測量。藝術素養(yǎng)評價以前更多的只是填問卷,處于了解、欣賞的層面,但藝術培養(yǎng)更要學會表達?,F(xiàn)在我們可以用新的語音技術來推動對學生表現(xiàn)型藝術素養(yǎng)部分的測試。2019年5月,我們在同一天同時對20萬中小學生進行演唱的藝術素養(yǎng)的測試,實現(xiàn)了全國范圍內600多個區(qū)縣全程化的測評儲存、分析和加工。
我們還可以在學生實際的人機互動過程中了解他的信息素養(yǎng)狀況,了解更接近孩子真實的生活工作中的使用狀況;用新的信息技術和方法,譬如穿戴設備,使我們在日常生活中,在鍛煉過程中大大提高對學生健康結構性評價的精度和準確性。
推動教育智能評價的跨界合作研究
從國家層面,智能化教育評價需要作為國家相關戰(zhàn)略的重要部分,需要國家從科學研究、人才培養(yǎng)、學科建設方面給予更多的投入和關注。因為跨界融合需要高校之間結合來做,需要高校和科研院所利用各自的優(yōu)勢加強合作,一起推動智能評價理論的研究以及方法技術的研發(fā)。這包括一些應用模式、成功范式的研究。比如5G環(huán)境下教育智能評價的應用模式是一個非常值得探索的領域。在這方面,企業(yè)是“教育+人工智能”或者“人工智能+教育”創(chuàng)新的主力軍;高校要與企業(yè)深度合作,推動高校、企業(yè)的的研究成果及時地運用于實踐,同時在運用中發(fā)現(xiàn)需要研究的新問題。真正創(chuàng)造一個更好的生態(tài)來促進高??蒲?、企業(yè)的研發(fā),促進高校和企業(yè)一起服務于我們國家的教育現(xiàn)代化。
目前,我們正在建立一個國家層面的智能教育的評價平臺。其最大特點是高度開放、共享、提供服務。這需要眾多技術的整合。當然教育和人工智能等技術的結合,涉及一系列倫理問題、安全問題、隱私保護的問題。這項工作要走好走穩(wěn),我們必須高度重視這些問題。這是行業(yè)共同合作必須遵循的基礎。
總之,教育+人工智能需要跨界,進行大學和大學之間、大學和政府之間、大學和研究機構之間、大學和企業(yè)之間、企業(yè)和企業(yè)之間高度的跨界融合,加強對智能教育評價的研究,最終解決教育中的真問題、難問題、熱點問題,造福老師、造福學生,也為我們國家人力資源強國的建設創(chuàng)新做出我們應有的貢獻。
(本文根據(jù)董奇在“人工智能與教育大數(shù)據(jù)峰會·2019”上的演講整理)