陳 麗
學生綜合素質評價是拔尖創(chuàng)新人才培養(yǎng)的關鍵著力點,是當前基礎教育改革的重要方向,也是教育評價改革的重要任務,那么針對當前學生綜合素質評價在研究與實踐方面的局限,該如何利用智能技術支撐其改革與創(chuàng)新?為了解相關研究及實踐進展,我們邀訪了北京師范大學互聯(lián)網教育智能技術及應用國家工程研究中心技術委員會主任、北京師范大學基礎教育大數據應用研究院院長陳麗教授,針對該主題并圍繞正在進行的試點工作分享見解與看法。陳麗教授是國家重點研發(fā)計劃“大規(guī)??鐚W段學生成長跟蹤研究項目”的負責人;自2021年起,她一直擔任教育部信息技術支撐學生綜合素質評價試點工作指導組組長,圍繞智能技術支撐學生綜合素質評價,陳教授帶領來自九個單位學者組成的攻關團隊開展了大量卓有成效的研究工作,如構建學生綜合素質評價新理論模型、新評價方法和學生綜合發(fā)展評價平臺等。同時,陳教授也指導全國38個試點區(qū)域進行了試點探索,第一年共對近400萬名中小學的綜合素質進行了測評,學生覆蓋全國8000所中小學校。
智能技術支撐學生綜合素質評價:改革與創(chuàng)新1本文訪談者為《現代教育技術》編輯部主任焦麗珍。
陳 麗
(北京師范大學 教育學部,北京 100875)
隨著素質教育的全面推進和課程改革的日益深入,學生綜合素質評價在我國基礎教育改革中變得愈加重要。然而,現有學生綜合素質評價實踐已經暴露出理論與方法方面的局限,亟需開展智能技術支撐學生綜合素質評價的改革與創(chuàng)新工作。對此,陳麗教授團隊在理論層面以核心素養(yǎng)理論模型為底座,納入綜合素質評價內容,以綜合素養(yǎng)為核心概念初步構建了新理論模型;在方法層面提出了理論與技術雙向驅動的評價新范式和基于信息技術的表現性評價新方法論;在實踐層面指導全國38個區(qū)域進行了信息技術支撐學生綜合素質評價探索,并取得了初步成效。同時,陳麗教授闡述了未來發(fā)展方向在于優(yōu)化表現性評價工具、匯聚多源數據和挖掘學生成長規(guī)律。
綜合素質評價;智能技術;基礎教育;表現性評價
訪談者:您好,陳教授,非常感謝您接受我們的訪談。首先,請談談您對學生綜合素質評價的理解,以及為何需要重新構建學生綜合素質評價體系?
陳麗教授:非常感謝你的邀約!也希望貴刊后續(xù)能更多關注技術賦能教育評價改革的學術研究和實踐創(chuàng)新成果。
綜合素質評價是拔尖創(chuàng)新人才培養(yǎng)的關鍵著力點,是當前基礎教育改革的重要方向,是教育評價改革的重要任務。隨著素質教育的全面推進和課程改革的日益深入,綜合素質評價愈加重要。只有科學精準地評價學生綜合素質發(fā)展狀況,才能夠真正反映我國素質教育改革的實質性進展,才能夠為各級各類人才選拔提供實證依據,才能夠引導教師更新教育理念、變革教學模式,才能夠引導教師、家長和學生樹立正確人才觀。綜合素質評價是推進素質教育改革,促進學生全面發(fā)展的重要指揮棒。
我國開展綜合素質評價已近二十年,各級政府高度重視,頒布了一系列文件,強調綜合素質評價的重要性,部署了綜合素質評價工作方案,而且各個區(qū)域都進行了積極探索,但進展和成效差異較大,面臨一系列現實挑戰(zhàn)和困難?!渡罨聲r代教育評價改革總體方案》中明確要求“改革學生評價”“創(chuàng)新評價工具”“完善綜合素質評價體系”“健全綜合評價”,以扭轉不科學的評價導向、克服“五唯”頑瘴痼疾,提高教育治理能力和水平[1]。在該背景下,綜合素質評價改革工作已發(fā)展成為推動教育高質量發(fā)展的重要任務。
在政策層面,教育部于2014年發(fā)布《教育部關于加強和改進普通高中學生綜合素質評價的意見》,將綜合素質評價定義為對學生全面發(fā)展狀況的觀察、記錄、分析,包括思想品德、學業(yè)水平、身心健康、藝術素養(yǎng)、社會實踐[2]。學術界關于綜合素質評價的內涵理解雖汗牛充棟,但莫衷一是。綜合來看,我們項目團隊將綜合素質評價理解為針對學生跨學科的能力、必備品格和內隱價值觀的綜合評價,強調關注學生的全面發(fā)展(涵蓋“德智體美勞”所有方面),即兼顧學術素養(yǎng)和非學術素養(yǎng)的綜合發(fā)展,對于學生的能力、品格和價值觀等更上位的學生素質進行綜合考察。
前期學生綜合素質評價實踐已經暴露出理論與方法層面的局限:第一,在綜合素質的維度結構方面,將德智體美勞作為一級評價指標目錄,與核心素養(yǎng)口徑不一致,而且內容維度相對模糊且分立,難以反映學生的綜合表現。為了更好地反映學生的綜合素質,并將綜合素質評價與新課程標準緊密結合,需要在定義中更加突出綜合能力,且在維度中與核心素養(yǎng)口徑保持一致。為此,我們提出了新的概念——綜合素養(yǎng),即學生在受教育過程中形成的跨越學科的價值觀、必備品格和關鍵能力,是學生綜合素質和核心素養(yǎng)的有機整合??紤]到此概念尚未成為政策術語,我們僅在研究中使用術語“綜合素養(yǎng)”,在實踐中仍沿用術語“綜合素質”,但其內涵已經更新為綜合素養(yǎng)的內涵。第二,在實踐方法層面,現有學生綜合素質工作存在客觀性、過程性和真實性不足等問題。其中,客觀性和過程性不足體現在當前實踐仍然以測驗、調查、觀察和主觀記錄為主要評價手段和以結果性評價為重要抓手。這種方式固然有其自身的優(yōu)勢,包括容易操作、成本低、成效快等,但由于實施過程中存在填報過程的主觀性較強、人為干預因素較多等因素,導致大眾對評價結果存疑,從而制約了綜合素質評價結果的實際教育應用。
訪談者:當前我國學生綜合素質評價呈現出什么特點,面臨哪些挑戰(zhàn)?
陳麗教授:在政策頒布層面,中高考改革背景下我國政府對學生綜合素質評價進行了一系列政策部署,推動了綜合素質評價工作。例如,2004年,教育部辦公廳在《國家基礎教育課程改革實驗區(qū)2004年初中畢業(yè)考試與普通高中招生制度改革的指導意見》中首次提出“綜合素質評價”概念[3];2008年,《教育部關于普通高中新課程省份深化高校招生考試改革的指導意見》提出“建立和完善對普通高中學生的綜合評價制度”[4];2021年,教育部等六部門聯(lián)合印發(fā)的《義務教育質量評價指南》為學生綜合評價實施提供了相對具體的行動方案[5]。總之,在政策層面,開展綜合素質評價改革已成為我國教育現代化進程中不可或缺的重要環(huán)節(jié),成為推動基礎教育高質量發(fā)展的重要引擎和保障。
在實踐應用層面,針對教育部信息技術支撐學生綜合素質評價試點工作中38個試點區(qū)域的調查研究發(fā)現,當前我國學生綜合素質評價呈現出如下特點:
第一,評價內容逐級解構,評價指標與核心素養(yǎng)口徑不一致。主要體現在:在義務教育階段,綜合素質評價的一級維度主要參考德智體美勞五個方面,并進行適當延伸,而高中階段的綜合素質評價基本圍繞上述五個維度來展開。在此基礎上,教育工作者會進一步將一級維度逐級細分為二級、三級甚至四級維度??傮w上,這些評價內容與核心素養(yǎng)的自我發(fā)展、文化基礎和社會參與維度在指標口徑上不夠一致,因此不利于學生綜合素質評價與培養(yǎng)體系的融合統(tǒng)一。
第二,評價指標差異明顯,評價結果不支持跨校跨區(qū)比較。主要體現在:各地二級評價指標數量、指標內容差別顯著。例如,北京房山區(qū)將學生綜合素質評價工作中的5個一級指標細分為20個二級指標,青海海南州將其細分為12個二級指標,湖北省將其細分為11個二級指標??梢姡町惢u價指標體系給跨校甚至跨區(qū)域的學生綜合素質評價結果比較帶來了極大不便,導致評價結果應用存在局限,無法根據評價數據揭示我國學生的綜合素質發(fā)展狀況及成長規(guī)律。
第三,評價數據主要依據寫實記錄和主觀評語,在客觀性上存在極大不足。調研發(fā)現,有90%的區(qū)域采用了諸如寫實記錄、自我陳述和教師評語等填報方式采集學生綜合素質發(fā)展數據,71%的區(qū)域采用了諸如自評、他評等評語填寫方式,68%的區(qū)域采用了標準化測試方式,45%的區(qū)域采用了諸如問卷、量表等自陳報告方式。綜合來看,上述這些數據采集方式均屬于傳統(tǒng)教育測量與評價范式的范疇,難以客觀采集學生在關鍵能力、必備品格和深度價值觀上的真實表現。
第四,評價自定等級且標準差異大,全國學生整體發(fā)展狀態(tài)不清。調查研究發(fā)現,有近90%的區(qū)域采用自定等級呈現評價結果,有約8%的區(qū)域采用分值量化評價結果,5%的區(qū)域采取只“評價”不“量化”的方式。由此,導致難以綜合分析全國學生在綜合素質上的整體發(fā)展狀況,進而不利于整體揭示學生綜合成長規(guī)律。
第五,信息技術多用于采集學生寫實記錄,AI優(yōu)勢未體現。調查研究發(fā)現,超70%的區(qū)域明確表示已建有專屬的綜合素質評價平臺,但各地所使用的平臺功能較為單一,以收集和記錄學生寫實記錄材料為主,未能從數據采集、存儲、分析等方面發(fā)揮技術優(yōu)勢。如何借助AI賦能評價數據的采集、存儲、分析等,將會是未來發(fā)展的一大重要挑戰(zhàn)。
第六,評價結果主要作為升學最低標準,支撐人才選拔能力不足。調查研究發(fā)現,有74%的區(qū)域給出升學最低標準以實現升學“軟掛鉤”,有5%的區(qū)域嘗試將結果與升學進行“硬掛鉤”,另有21%的區(qū)域未將結果與升學進行掛鉤。顯然,綜合素質評價在人才選拔、促進學生個性化發(fā)展方面的作用非常有限。
總之,目前我國學生綜合素質評價改革工作呈現“頭重腳輕”的現狀,“頭重”是指各級政府和全社會對綜合素質評價具有極端重要性的高度共識,“腳輕”是指實踐中的改革進展緩慢,指揮棒作用嚴重不足[6]。我認為,綜合素質評價指揮棒作用不足,是導致“教育內卷”的主要原因,目前制約我國學生綜合素質評價改革工作的主要瓶頸是評價方法和能力不足,亟需運用信息技術,創(chuàng)新更加科學客觀的工具,完善評價體系。
訪談者:在學生綜合素質評價的理論概念層面上,您及團隊進行了哪些探索?
陳麗教授:我們以核心素養(yǎng)理論模型為底座,納入綜合素質評價內容,以綜合素養(yǎng)為核心概念初步形成了一種新的綜合素養(yǎng)理論模型,如圖1所示。該模型包含自主發(fā)展、文化修養(yǎng)和社會參與共三個維度,每個維度包含3~4個不等的指標(合計10個指標),各指標可以進一步分解為不同數量的基本要點(總計包含36個基本要點)。對于綜合素養(yǎng)的理解,存在如下四重意蘊[7]:
圖1 綜合素養(yǎng)理論模型
第一,強調綜合素養(yǎng)的整體綜合性,認為其并非綜合素質評價中“五育”內容的簡單相加或者核心素養(yǎng)評價中課程實踐活動內容的簡單組合,而是一個由各類素質通過有機融合而形成的全面綜合性整體。這是因為,學生綜合評價的目標內容內涵豐富、結構復雜,難以通過簡單的分解和合成來獲取對其的準確性和綜合性理解。
第二,強調綜合素養(yǎng)的個體獨特性和差異性,任何兩個個體都會在基礎知識、關鍵能力、必備品格和深層價值觀方面表現出一定程度的差異,因此絕不能采用傳統(tǒng)“冷冰冰的分數”來簡單、機械地刻畫分數背后的“活生生的人”。這是因為,學生綜合評價的目標對象是具有個體差異性和多樣性的學生,而單一分數只會掩蓋學生之間的多樣差異性,因此針對其的評價需要注重人文向度。
第三,就綜合素養(yǎng)和傳統(tǒng)學生綜合評價相關概念的關系來看,綜合素養(yǎng)同時包含學生素質發(fā)展中的基礎性和必要性成分,但這絕不是兩者的簡單相加,而是兩者的有機融合。也就是說,綜合素養(yǎng)既涵蓋德智體美勞全素質要素,也吸納了與自主發(fā)展、文化基礎和社會參與均關聯(lián)緊密的素養(yǎng)成分。相比綜合素質,綜合素養(yǎng)凸顯了素質教育中的綜合性成分;相比核心素養(yǎng),綜合素養(yǎng)所涵蓋的素質教育內容更為全面。
第四,綜合素養(yǎng)同時包含能力、品格和價值觀三種有機成分,而通過受教育而獲得的知識是這三者的基礎性成分。前文已經提到,素質由知識、能力和品格三者構成,而素養(yǎng)涉及知識、能力和價值觀三種成分。作為融合綜合素質和核心素養(yǎng)的全面性概念,綜合素養(yǎng)覆蓋知識、能力、品格和價值觀四種成分。此外,指向綜合素養(yǎng)的知識并非指片面追求升學率所必備的學科知識,而是跨越學科的各類知識集合。
訪談者:在學生綜合素質評價的研究范式和方法論層面上,你們進行了哪些創(chuàng)新性探索?
陳麗教授:國內外學生綜合評價實踐的經驗告訴我們,由于數據采集能力的局限,完全從理論出發(fā)構建模型開展評價往往難以落地,不具有可操作性;完全依賴技術采集數據、量化數據,進而得出評價結果,往往又不具有理論上的可解釋性。據此,我們提出了理論與技術雙向驅動的學生綜合素質評價新范式(如圖2所示)[8]。新范式以教育評價改革需求為導向,整體堅持理論科學性與技術可行性的有機統(tǒng)一;借助理論的知識積累優(yōu)勢,凝聚專家智慧構建學生綜合素養(yǎng)評價模型;依托數據采集智能技術,伴隨式采集多場域(包括學校、家庭、社區(qū)等)的學生活動多模態(tài)(包括音頻、視頻、圖像等)信息并對其進行自動化分類標注;基于數據智能分析技術,建立多模態(tài)數據指標與學生綜合素養(yǎng)特征之間的關聯(lián)映射關系;通過多方主體評價、強化過程評價以及主客觀評價結合等方式推動具體評價應用,發(fā)揮評價結果的導向、鑒定、診斷、調控和改進作用。
針對傳統(tǒng)學生綜合素質評價在評價工具上的客觀性和真實性不足、評價能力不夠等問題,我們提出了新型評價方法論——基于信息技術的表現性評價[9],這是一種利用信息技術變革評價實踐中任務的呈現方式、數據的采集和分析過程,考察學生在真實、復雜、未知情境中運用先驗知識完成某項任務或解決某個問題時的知識與技能掌握程度,以及問題解決、交流合作和批判性思考等多種復雜能力發(fā)展狀況的新型評價方法。究其內涵,該評價方法實現了從評價學生潛質到評價學生綜合能力、從主觀評價到客觀評價的突破。表現性評價方法將從根本上解決傳統(tǒng)評價方法面臨的客觀性和真實性不足的問題,實現對學生在真實場景中能力表現的評價。
此外,我們還從測評任務呈現、測評數據采集、測評數據分析三個環(huán)節(jié)出發(fā),通過技術創(chuàng)新,不斷優(yōu)化表現性評價工具:①創(chuàng)新測評任務呈現,即利用信息技術展示、豐富和定制表現性任務,如利用計算機技術將評價場景數字化、利用虛擬現實技術將評價場景真實化、利用自適應技術將評價場景靈活化。②在大數據視角下,針對特定測評目標的表現性任務不再局限于評價設計者預先創(chuàng)設的有限任務類型,而是囊括受測者在自然條件下參與的所有相關任務類型,從而可以在最大程度上實現測評任務呈現的真實性。③拓展數據采集,即綜合借助視頻監(jiān)控、智能錄播、物聯(lián)網、平臺自動記錄、網絡爬蟲等數據采集類信息技術來實現數據來源的多樣性、數據類型的繁雜性、數據分布的全時性。④優(yōu)化數據分析,即采用融合高級統(tǒng)計測量模型的數據分析技術來驅動測評數據分析的智能化、自動化和準確性,包括兩類具體做法:一是依據證據規(guī)則編寫算法程序,二是采用“機器學習”算法來自動評分。
訪談者:為提升學生綜合素質評價能力,助推學生綜合素質評價改革,您的團隊在技術層面進行了哪些創(chuàng)新性探索?
陳麗教授:我們首先研發(fā)了三類關鍵技術。第一,學生多場景表現性數據的采集和關鍵技術,具體包括:①基于復雜活動場景的伴隨式采集技術,即基于自主研發(fā)的表現性評價工具或“紅外+可見光”采集裝備,伴隨式采集學生在學校、家庭、社區(qū)和科技館四個場域的多模態(tài)(包括音頻、視頻、文本、圖片等)數據;②多源異構數據匯聚技術,即教育部信息技術支撐學生綜合素質評價試點工作數據和教育部教育技術與資源發(fā)展中心數據、教育部教育管理信息中心數據以及試點區(qū)域原有綜合素質評價數據的匯聚技術;③視頻數據標注增強技術,即針對教室、科技館等場景中多主體的多目標行為連續(xù)追蹤識別技術。
第二,學生多模態(tài)活動數據的智能處理技術,具體包括:①文本數據的自動識別技術,即基于光學字符識別(Optical Character Recognition,OCR)技術自動識別語言表達測評中學生上傳的文本圖片數據,并對難以辨識的新詞、特征詞等復雜標注任務進行矯正識別和標注增強;②音頻數據的音準識別與評測技術,即基于“音符轉錄—音符對齊—音高提取”智能化處理方法,自動識別音樂素養(yǎng)測評中學生上傳音頻數據的錯音符、漏唱音符和音調高低等;③視頻數據骨骼綁定與內容分析技術,即基于身體素質測評中學生的跳繩視頻將Mediapipe(一個用于構建機器學習管道的框架,可用于處理視頻、音頻等時間序列數據)獲取的骨骼坐標點輸入跳繩姿態(tài)判別模型,通過關聯(lián)信息融合模塊對多源異構數據進行融合,輸入時序模型計算耐力評分。
第三,大規(guī)模學生綜合發(fā)展數據的分析技術,具體包括:①學生成長發(fā)展知識庫引擎,可支持探索學生成長發(fā)展影響因素(如媒體使用或課外活動的類型和時間)、挖掘中國學生綜合素質發(fā)展規(guī)律(如自主學習能力的變化曲線),建設學生成長發(fā)展知識庫;②學生綜合素質常模庫引擎,可支持依據數據建設學生綜合素質發(fā)展常模,支持建設不同區(qū)域(如東部、中部和西部地區(qū)或城市、農村地區(qū))、不同學段(如小學低、中、高年級)學生成長發(fā)展特定理論維度的常模;③學生綜合素質隊列(流行病學術語,在教育領域中特指具有共同因素特征的一組學生群體[10])建設引擎,可支持不同區(qū)域/學段學生的成長發(fā)展隊列建設。
同時,我們整合上述技術,研發(fā)了學生綜合評價與發(fā)展平臺(Student Evaluation Enriching Development,SEED)平臺,主要功能包括:①呈現測評工具,支持大規(guī)模學生在線參與綜合素質測評;②呈現測評分析報告,面向區(qū)域、學校、學生和家長反饋學生綜合素質評價的結果及改進建議;③呈現學生綜合素質成長規(guī)律,包括學生綜合素質發(fā)展性規(guī)律、比較性規(guī)律、溯源性規(guī)律,學生常模庫、隊列等。
訪談者:去年11月,教育部正式啟動信息技術支撐學生綜合素質評價試點工作,進展如何?
陳麗教授:2022年11月,教育部通過文件《教育部辦公廳關于開展信息技術支撐學生綜合素質評價試點工作的通知》部署了試點工作[11]。試點工作的首要目標是在中小學生綜合素質評價基礎較好、常態(tài)化開展信息化教學應用的區(qū)域中,遴選30個左右的區(qū)域開展試點工作。其次,試點工作旨在運用5年左右時間,形成百萬級規(guī)模中小學生綜合素質發(fā)展基礎數據庫。再次,試點工作強調創(chuàng)新評價工具,利用人工智能、大數據等現代信息技術,探索開展學生各年級學習成長情況全過程縱向評價、德智體美勞全要素橫向評價,主要包括思想品德、學業(yè)水平、身心健康、藝術素養(yǎng)、勞動與社會實踐五個方面,以形成數據驅動的學生綜合素質評價解決方案。最后,試點工作希望客觀總結我國中小學生綜合素質發(fā)展的規(guī)律,確保評價正確方向,完善評價內容,強化技術支撐,促進學生德智體美勞全面發(fā)展。
試點工作啟動后,我國大陸各地積極申報,總計有來自29個省級行政單位(包括自治區(qū)、直轄市等;除西藏自治區(qū)和云南省外,其他省級行政單位均有參與)的84個區(qū)域申報此次試點。經評審,最終遴選出來自29個省級行政單位的38個區(qū)域作為本次試點區(qū)域。針對本次試點工作,北京師范大學組建專家指導團隊負責落實教育部的相關部署,為試點區(qū)域提供理論和技術方案支持,并對試點工作提供專業(yè)指導。
專家指導團隊與各區(qū)域緊密配合,制定了試點總體方案和第一年度工作方案。區(qū)域參與試點工作的技術模式分為兩種:第一種模式是以SEED平臺為主要依托,區(qū)域組織力量,參與平臺和工具的測試,組織學生開展測評活動,探索測評結果的應用;第二種模式是區(qū)域平臺與SEED平臺對接的技術模式,即區(qū)域在專家團隊的幫助下,通過區(qū)域平臺與SEED平臺數據對接的方法,形成區(qū)域學生綜合素質評價解決方案。試點區(qū)域高度重視教育部試點工作,除上海市和湖北省外,36個試點區(qū)域均成立了專班,啟動了試點工作。第一年的測評工作主要依托SEED平臺,自2023年4月~8月底,總計365萬名學生參與本年度試點測評,覆蓋了8000所學校,涵蓋了3~7年級的學生,其中有293萬名學生完成了所有測評活動。
目前,平臺已經向各試點區(qū)域反饋了區(qū)域、學校和學生個體的綜合素質測評分析報告。面向區(qū)域的反饋報告不僅提供學生整體水平的德智體美勞表現及其各指標表現,而且對不同指標的年級發(fā)展規(guī)律以及區(qū)域間對比、城鄉(xiāng)間對比、性別間對比情況進行清晰展示。面向學生的反饋報告不僅提供學生個體在德智體美勞及各指標上的表現,而且描述了學生縱向發(fā)展趨勢及其優(yōu)勢項和薄弱項;除此之外,反饋報告還提供彌補弱項的方法建議、實操方案等。
此外,專家指導團隊還面向區(qū)域、學校和家長做了問卷調查,聽取各方對測評工具和反饋報告的意見與建議。值得欣慰的是,各主體對測評工具及報告反饋高度肯定,認為評價結果符合日常觀察到的情況,對教育教學工作和孩子培養(yǎng)具有重要的參考價值。
訪談者:請您談談智能技術支撐的學生綜合素質評價改革的未來發(fā)展方向?
陳麗教授:從我的經驗來看,智能技術支撐學生綜合素質評價改革的未來發(fā)展方向是運用信息技術全面提升綜合素質評價能力,提高綜合素質評價的科學性、客觀性和反饋性,推動綜合素質評價結果在人才選拔和培養(yǎng)中的應用,增強綜合素質評價指揮棒的作用。這個方向本質上就是綜合素質評價的數字化轉型。主要在于以下幾個方面:
第一,加大研發(fā)投入,豐富與優(yōu)化表現性評價工具。研發(fā)與應用表現性評價工具是推動綜合素質評價改革的核心舉措,因此應當大力推動各教育利益相關方在表現性評價工具研發(fā)方面的協(xié)同合作,逐步實現綜合素質評價工具庫的豐富性、多樣性和完備性:一方面要建強人才隊伍,大力推動表現性評價的專業(yè)性、科學性和可靠性。表現性評價隊伍不僅需要涵蓋一線校長、學科教師、家長、學生、社會人員等多個利益相關主體,而且需要納入學科教學、心理與教育測量學、信息技術、教育管理等領域的人才儲備力量。另一方面是要推動基于政府、教育與企業(yè)三方協(xié)同的表現性評價工具的研發(fā)與迭代工作,并完善、統(tǒng)一技術與數據標準,以推動相關工具的大規(guī)模應用與推廣。相關技術標準包括數據采集技術、數據處理與分析技術、數據反饋技術、隱私保護技術等,需要通過不斷迭代和更新信息技術來降低服務于表現性評價的技術成本和操作難度,從而持續(xù)改進表現性評價的可用性、易用性與實用性;相關數據標準則涵蓋針對不同來源、類型、結構表現性數據的標準化處理規(guī)則體系,通過構建規(guī)范的數據標準體系,可穩(wěn)步提高表現性評價的規(guī)范性、統(tǒng)一性和效率性。
第二,打通堵點,實現多源數據的匯聚。目前各試點區(qū)域在教育信息化實踐、推進學生綜合素質評價的工作過程中已經積累了豐富多樣的教育信息化數據,涵蓋課堂教學視頻、在線學習記錄、學習反思總結文本等。這些數據是評價學生綜合素質的一大重要數據源,但由于數據管理和數據共享存在機制上的短缺,導致數據共享存在各種顧慮和阻力,造成數據共享進程緩慢。后續(xù),專家指導小組將與各方協(xié)商,推動建立和健全數據管理機制,爭取實現與各類數據管理部分的數據共享。同時,試點工作也將進一步配合區(qū)域,在SEED平臺的基礎上,結合區(qū)域數據特點,研發(fā)區(qū)域特色的學生綜合素質評價方案。
第三,建設學生綜合素質發(fā)展基礎數據庫,挖掘中國學生的成長規(guī)律。試點工作將建設中國學生綜合素質發(fā)展基礎數據庫,依據隊列技術,該數據庫可為研究和揭示中國學生成長規(guī)律提供數據支撐,為教育決策提供豐富、深入的科學依據。具體而言,項目專家指導團隊將基于中國學生綜合素養(yǎng)發(fā)展基礎數據庫,利用自主研發(fā)的分析引擎,挖掘中國學生綜合素質發(fā)展的規(guī)律,建設中國學生綜合素質發(fā)展的知識庫,具體包括特征型知識、比較型知識、發(fā)展型知識和因素型知識。其中,特征型知識是指特定學生群體在特定學段內的綜合素質整體或特定指標上的特征水平,比較型知識是指不同學生群體在特定學段內的綜合素質整體或特定指標上的特征水平差異,發(fā)展型知識是指特定學生群體的綜合素質整體或特定指標在跨學段上的發(fā)展趨勢,因素型知識是指特定學生群體的綜合素質整體或特定指標的影響因素及其影響大小和作用方式。知識庫將豐富學生發(fā)展規(guī)律,同時為進一步推動我國學生綜合素質評價改革提供重要支撐。
試點工作充分彰顯了信息技術破解教育改革瓶頸、賦能教育高質量發(fā)展的重要作用,也體現了教育數字化轉型階段科教融合的新著力點。但是,這項改革工作才剛剛開始,仍面臨許多困難。例如,區(qū)域改革熱情高漲,但專業(yè)力量不足,高度依賴專家指導團隊的技術支持,但專家團隊的技術儲備和研發(fā)力量無法立即滿意所有需求;數據匯聚缺乏機制保障,導致數據重復采集,教師和學生負擔重;社會與家長對試點工作的意義認識不足、存在負面言論等。
信息技術支撐學生綜合素質評價改革是綜合評價改革的必然選擇,這項改革工作需要更堅定的決心、更充實的投入、更強大的技術,上下多主體聯(lián)動,堅定不移地持續(xù)探索,才能走出一條利用信息技術開展學生綜合素質評價改革的中國道路。
[1]教育部.中共中央國務院印發(fā)《深化新時代教育評價改革總體方案》[OL].
[2]教育部.教育部關于加強和改進普通高中學生綜合素質評價的意見[OL].
[3]教育部辦公廳.國家基礎教育課程改革實驗區(qū)2004年初中畢業(yè)考試與普通高中招生制度改革的指導意見[OL].
[4]教育部.教育部關于普通高中新課程省份深化高校招生考試改革的指導意見[OL].
[5]教育部等六部門.義務教育質量評價標準[OL].
[6]王懷波,柴喚友,郭利明,等.智能技術賦能學生綜合素養(yǎng)評價:框架設計與實施路徑[J].中國電化教育,2022,(8):16-23.
[7]柴喚友,陳麗,鄭勤華,等.學生綜合評價研究新趨向:從綜合素質、核心素養(yǎng)到綜合素養(yǎng)[J].中國電化教育,2022,(3):36-43.
[8]鄭勤華,陳麗,郭利明,等.理論與技術雙向驅動的學生綜合素養(yǎng)評價新范式[J].中國電化教育,2022,(4):56-63.
[9]鄭勤華,陳麗,柴喚友,等.基于信息技術的表現性評價:內涵、作用點與發(fā)展路向[J].中國電化教育,2023,(3):55-61.
[10]王懷波,鄭勤華,孫洪濤,等.教育領域學生隊列資源的價值、框架與挑戰(zhàn)[J].現代教育技術,2023,(6):54-63.
[11]教育部辦公廳.教育部辦公廳關于開展信息技術支撐學生綜合素質評價試點工作的通知[OL].
Intelligent Technology Supports Students’ Comprehensive Quality Evaluation: Reform and Innovation
CHEN Li
With the comprehensive promotion of quality education and increasing development of curriculum reform, students’ comprehensive quality evaluation has become more important in the reform of basic education in our country. However, the existing practice of students’ comprehensive quality evaluation has exposed the limitations in terms of theory and methodology, and it is urgent to carry out the reform and innovation of intelligent technology to support students’ comprehensive quality evaluation. In this regard, Professor Chen Li’s team initially constructed a new theoretical model with comprehensive literacy as the core concepts, incorporating the contents of comprehensive quality evaluation, and with comprehensive literacy theoretical model as the base at the theory level. At the methodogical level, a new assessment paradigm driven by both theory and technology and a new methodology of performance assessment based on information technology were proposed. At the practical level, students’ comprehensive quality evaluation supported by information technology in 38 regions of the country was carried out under the guidance, and initial results were achieved. Finally, Professor Chen Li expoundethat the future development direction was to optimize performance assessment tools, gather multi-source data, and explore the law of student growth.
comprehensive quality evaluation; intelligent technology; basic education; performance assessment
G40-057
A
1009—8097(2023)12—0005—09
10.3969/j.issn.1009-8097.2023.12.001
本文為國家重點研發(fā)計劃“社會治理與智慧社會科技支撐”2021年度揭榜掛帥項目“大規(guī)模學生跨學段成長跟蹤研究”(項目編號:2021YFC3340800)的階段性研究成果。
陳麗,教授,博士,研究方向為“互聯(lián)網+”教育、遠程教育、終身學習,郵箱為lchen@bnu.edu.cn。
2023年10月6日
編輯:小時