賈積有 張譽月 劉懷亞 李雙雙
[摘? ?要] 為了驗證人工智能技術(shù)在貫徹落實中央出臺的多個關(guān)于中小學(xué)生學(xué)業(yè)評價改革和減負(fù)增效的政策文件中的作用,文章首先分析了宏觀政策在常規(guī)學(xué)校和班級環(huán)境下貫徹實施面臨的困境,指出智能評測和教學(xué)系統(tǒng)有助于解決現(xiàn)存的實施難題;然后基于在線學(xué)習(xí)系統(tǒng)的大規(guī)模學(xué)生學(xué)習(xí)數(shù)據(jù),開發(fā)了一個數(shù)學(xué)智能評測和輔導(dǎo)系統(tǒng)MIATS,在對學(xué)生個性化評測的基礎(chǔ)上,能對學(xué)生進行引導(dǎo)型的個性化輔導(dǎo)。通過在一所中學(xué)的準(zhǔn)實驗研究驗證該系統(tǒng)對學(xué)生數(shù)學(xué)學(xué)習(xí)的促進作用;對所收集的實驗數(shù)據(jù)的分析證明了該系統(tǒng)對減輕作業(yè)負(fù)擔(dān)、增強學(xué)習(xí)效果起到非常顯著的促進作用,是實現(xiàn)增值評價、測學(xué)結(jié)合、以測促學(xué)的有效手段。文章為智能評測和輔導(dǎo)系統(tǒng)助力落實學(xué)業(yè)評價改革和減負(fù)增效等宏觀政策提供了參考和借鑒。
[關(guān)鍵詞] 智能評測; 智能輔導(dǎo); 數(shù)學(xué)教學(xué); 引導(dǎo)型提示; 評價改革; 減負(fù)增效
[中圖分類號] G434? ? ? ? ? ? [文獻標(biāo)志碼] A
[作者簡介] 賈積有(1969—),男,河南獲嘉人。教授,博士,主要從事教育技術(shù)和人工智能教育應(yīng)用研究。E-mail:jjy@pku.edu.cn
一、宏觀政策貫徹實施和常規(guī)教學(xué)條件的矛盾
關(guān)于中小學(xué)生學(xué)業(yè)評價改革和減負(fù)增效,我國近幾年頒布了多項政策文件。例如:2020年10月,中共中央、國務(wù)院印發(fā)的《深化新時代教育評價改革總體方案》[1];2021年7月,中共中央、國務(wù)院印發(fā)的《關(guān)于進一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見》[2]。這些文件不僅指明了我國學(xué)生考試評價和作業(yè)改革的方向,還提出了一些具體措施,如教師要認(rèn)真批改作業(yè),及時做好反饋,加強面批講解,認(rèn)真分析學(xué)情,做好答疑輔導(dǎo);改變相對固化的試題形式,布置分層、彈性和個性化作業(yè),發(fā)揮作業(yè)診斷功能,壓減作業(yè)總量和時長;減少死記硬背和機械刷題,禁止懲罰性作業(yè);不得要求學(xué)生和家長批改作業(yè)。然而,在常規(guī)的學(xué)校和教室環(huán)境下,教師和學(xué)生比一般大于1∶30。一個教師在有限的時間和精力下,要落實以上各項具體措施就會面臨各種各樣的挑戰(zhàn)。
(一)教師布置分層、彈性乃至個性化作業(yè)和測試的難度大
學(xué)業(yè)評價改革和減負(fù)增效涉及學(xué)校教學(xué)過程的兩個重要環(huán)節(jié),即學(xué)生作業(yè)、測驗或者考試。學(xué)業(yè)評價包括過程性評價和總結(jié)性評價。日常作業(yè)是過程性評價的主要手段,測驗和考試則是總結(jié)性評價的主要手段。
如果給不同學(xué)生布置不同內(nèi)容的作業(yè),就要細(xì)致分析學(xué)生的學(xué)習(xí)情況,再設(shè)置不同的題目內(nèi)容。針對不同類別、層次的學(xué)生設(shè)置不同的題目,教師要依靠自己的經(jīng)驗進行主觀判斷,難度很大;針對每個學(xué)生設(shè)置個性化的題目,教師需要豐富的經(jīng)驗、高超的判斷能力、充沛的精力和大量的時間,難度更大。
(二)教師批改作業(yè)和測試并給出個性化反饋的難度更大
學(xué)生作業(yè)提交后,教師要給予反饋,以便反映學(xué)生對作業(yè)所要求的知識內(nèi)容和能力的掌握程度。如最常見、最必需的分?jǐn)?shù)反饋,便可以達(dá)到基本的評測目的。為了激勵學(xué)生,也可以根據(jù)得分加上一些簡單的評語,如優(yōu)、良、中、差。如果是分層次、分類別的作業(yè),或是個性化的作業(yè),教師就要根據(jù)不同作業(yè)內(nèi)容和不同學(xué)生的作答情況給出相應(yīng)的得分和評語,這會使教師的工作量倍增,也要求教師具備較高的輔導(dǎo)能力和水平[3-4]。
總之,雖然宏觀政策要求學(xué)校和教師實施規(guī)模個性化教學(xué)[5],布置層次化甚至個性化作業(yè),并根據(jù)作業(yè)情況診斷學(xué)情、做好答疑輔導(dǎo),但這些政策在具體實施中會遇到很多現(xiàn)實困難。
二、智能技術(shù)支持個性化評測和輔導(dǎo)的理論和實踐
人工智能技術(shù)的發(fā)展和應(yīng)用,如計算機支持的適應(yīng)性評測系統(tǒng) (Computerized Adaptive Test,簡稱CAT)和智能教學(xué)系統(tǒng)或者智能導(dǎo)學(xué)系統(tǒng)(Intelligent Tutoring System,簡稱ITS),可以為解決上述在常規(guī)教學(xué)環(huán)境中宏觀政策貫徹實施中遇到的問題提供有力支持。
(一)適應(yīng)性評測技術(shù)
適應(yīng)性評測系統(tǒng)針對大量已有的學(xué)生做題數(shù)據(jù)進行分析挖掘,提煉出題目的難度、區(qū)分度和猜測系數(shù)等參數(shù),基于項目反應(yīng)理論[6]和最近發(fā)展區(qū)等教育心理學(xué)理論[7-8],采用最大似然估計等算法,假設(shè)學(xué)生能力水平為中等或者最低,對每個做題的學(xué)生提供最適合的題目(即信息量最大的題目),再根據(jù)學(xué)生對這道題目的回答情況,計算出其能力值,據(jù)此繼續(xù)找出最適合的題目,如此循環(huán)往復(fù),直到能力值穩(wěn)定為止。相較于常規(guī)環(huán)境下所有學(xué)生都一樣的作業(yè)或者測試,這種適應(yīng)性測試能夠為不同學(xué)生提供適應(yīng)性的內(nèi)容,例如:基礎(chǔ)較差的學(xué)生就不必去做難度很大的題目,這些題目會徒增其挫折感和沮喪感;而基礎(chǔ)較好的學(xué)生也不必去做難度很小的題目,這些題目會徒增其枯燥感。
適應(yīng)性評測技術(shù)在國外的大規(guī)??荚囍幸呀?jīng)得到了廣泛應(yīng)用,如美國的NAEP(美國國家教育進展評估)[9]。國內(nèi)也有學(xué)者基于項目反應(yīng)理論對學(xué)生數(shù)學(xué)等學(xué)科知識進行增值評價,既可以科學(xué)測評學(xué)生的學(xué)業(yè)能力,也可以為教師和學(xué)生開展個性化學(xué)習(xí)提供有針對性的診斷報告[10-11]。但有關(guān)適應(yīng)性評測技術(shù)在學(xué)生作業(yè)中的應(yīng)用和效果評估研究還較為少見,原因主要是如果作業(yè)內(nèi)容沒有被大量學(xué)生使用,就沒有足夠的做題記錄提煉出題目的難度、區(qū)分度等參數(shù),無法設(shè)計針對這些作業(yè)題目的適應(yīng)性評測系統(tǒng)。
(二)智能教學(xué)系統(tǒng)
智能教學(xué)系統(tǒng)在認(rèn)知主義、行為主義、建構(gòu)主義等教學(xué)理論指導(dǎo)下,模擬優(yōu)秀學(xué)科教師,基于某個學(xué)科或者某個知識點,充分考慮每個學(xué)生的知識和能力基礎(chǔ)、學(xué)習(xí)風(fēng)格等特點,對學(xué)生進行個性化的輔導(dǎo),循循善誘,激發(fā)學(xué)生的學(xué)習(xí)積極性和主動性,起到亦師亦友的學(xué)伴作用[12]。在輔導(dǎo)過程中,系統(tǒng)可以通過二維或者三維的虛擬人物代表輔導(dǎo)教師,采用語音合成技術(shù)進行知識和技能講解,學(xué)生通過鍵盤輸入文字信息,或者通過麥克風(fēng)輸入語音,由語音識別技術(shù)轉(zhuǎn)換為文字,由此實現(xiàn)虛擬教師和學(xué)生的自然交互,進行蘇格拉底式的對話。當(dāng)然,系統(tǒng)也可以采取傳統(tǒng)的窗口菜單或者流行的網(wǎng)頁按鈕選項方式,根據(jù)學(xué)生的選擇或者點擊提供相應(yīng)的輔導(dǎo)提示[13]。
自20世紀(jì)50年代以來,各個學(xué)科的智能教學(xué)系統(tǒng)逐漸被設(shè)計出來,并廣泛應(yīng)用于學(xué)科教學(xué),其對學(xué)生學(xué)業(yè)表現(xiàn)和情感態(tài)度等多方面的積極促進作用也得到了較為嚴(yán)謹(jǐn)?shù)淖C明,并在多個嚴(yán)格的元分析研究中得到全面而綜合的論證[14-17]。
綜上所述,適應(yīng)性評測系統(tǒng)和智能教學(xué)系統(tǒng)作為兩個獨立的研究領(lǐng)域,其研究成果已經(jīng)被應(yīng)用到教學(xué)實踐中。但是,將兩者深度結(jié)合起來并付諸實踐的系統(tǒng)及其研究鮮有報道,而這種系統(tǒng)和研究對我國學(xué)生學(xué)業(yè)評價改革和減負(fù)增效等宏觀政策的落地實施具有重要的理論和現(xiàn)實價值。
三、數(shù)學(xué)智能評測和輔導(dǎo)系統(tǒng)MIATS——以勾股定理為例
基于以上適應(yīng)性評測和智能教學(xué)系統(tǒng)的相關(guān)文獻研究,本研究設(shè)計并開發(fā)了一個數(shù)學(xué)智能評測和輔導(dǎo)系統(tǒng)MIATS(Mathematics Intelligent Assessment and Tutoring System的簡稱),給學(xué)生數(shù)學(xué)學(xué)習(xí)提供智能評測和輔導(dǎo),其功能和流程如圖1所示。
(一)設(shè)計理念
在傳統(tǒng)學(xué)校教學(xué)中,對于教師布置的內(nèi)容完全相同的作業(yè)和測試,所有學(xué)生都需要認(rèn)真完成。這樣的形式看似公平,但事實上對某些學(xué)生來說卻是在浪費時間。如果能夠根據(jù)每個學(xué)生的實際能力和表現(xiàn),提供最適合的作業(yè)或者測試內(nèi)容,就必然節(jié)省學(xué)生的作業(yè)或者測試時間,減負(fù)增效,落實評價改革。MIATS系統(tǒng)的設(shè)計理念之一,就是給予學(xué)生完全個性化的測試,解決常規(guī)教學(xué)環(huán)境下個性化作業(yè)和測評的難題。
為了實現(xiàn)以測促學(xué),教師應(yīng)該在得分和評語之外,給予學(xué)生更多的提示性反饋,使得沒有完全掌握所學(xué)知識和技能的學(xué)生能夠了解錯在何處、如何糾正錯誤,從而增進對知識的理解和對能力的掌握。作業(yè)和測試題目中考查學(xué)生的知識主要分為兩種類型:事實性知識和程序性知識。2022年公布的中小學(xué)階段各個學(xué)科的新課程標(biāo)準(zhǔn),普遍要求學(xué)生能夠綜合運用所學(xué)知識解決問題,這其實是要求學(xué)生能夠解決更多的程序性問題?;A(chǔ)較為薄弱、思維存在某些局限的學(xué)生,在解答程序性問題的時候會存在困難,即使閱讀了教師給出的標(biāo)準(zhǔn)答案,也可能存在理解片面的問題,以至于在碰到其他類似問題的時候,仍然會束手無措。這樣的學(xué)生就亟須教師的個性化反饋和輔導(dǎo)。這很難依靠靜態(tài)的紙質(zhì)版或者電子版的輔導(dǎo)材料實現(xiàn),而是需要蘇格拉底式的對話才能達(dá)到較好的效果,對教師的輔導(dǎo)能力和水平要求較高。MIATS系統(tǒng)的設(shè)計理念之二,就是給予學(xué)生個性化的反饋和提示,解決常規(guī)教學(xué)環(huán)境下個性化輔導(dǎo)的難題。
(二)功能概述
MIATS的智能評測功能是在對一個在線學(xué)習(xí)系統(tǒng)的海量數(shù)據(jù)進行挖掘的基礎(chǔ)上,根據(jù)項目反應(yīng)理論,采用極大似然估計等方法計算題目難度、區(qū)分度和猜測系數(shù)等多維參數(shù),并鏈接這些參數(shù),實現(xiàn)對學(xué)生知識能力的個性化測試[18-19]。在測評的基礎(chǔ)上,MIATS將學(xué)生的自主練習(xí)和智能輔導(dǎo)有機結(jié)合,如果學(xué)生經(jīng)過思考會解決問題,則練習(xí)結(jié)束,否則出現(xiàn)通用型提示。如果借助通用型提示能夠解決問題,則練習(xí)結(jié)束,否則出現(xiàn)引導(dǎo)型提示,直到學(xué)生會正確解決問題為止。然后對輔導(dǎo)成效進行評測,即后測。后測題目是同構(gòu)異數(shù)題目,即和基礎(chǔ)題目結(jié)構(gòu)相同、但是題干的數(shù)字和相應(yīng)的答案都變化了的題目。同構(gòu)異數(shù)題目來源有兩個:一是題庫中的已有題目;二是借助編輯系統(tǒng)人工編制的題目。MIATS系統(tǒng)以測促學(xué),學(xué)中有教,學(xué)后即測,測評、輔導(dǎo)、學(xué)習(xí)三位一體,螺旋式上升地對學(xué)生進行輔導(dǎo)。同時,該系統(tǒng)以一個二維動畫人物表示虛擬教師,它會通過語音合成技術(shù)朗讀輔導(dǎo)文本,包括特殊的數(shù)學(xué)公式和符號,也會根據(jù)學(xué)生的學(xué)習(xí)狀態(tài)表達(dá)贊許或遺憾等情感,起到陪伴作用,并在學(xué)生完成練習(xí)后通過撒花和掌聲激勵學(xué)生。MIATS系統(tǒng)的教學(xué)按照知識點展開,即實施新課標(biāo)所提倡的單元教學(xué)法[5]。本研究以初中二年級數(shù)學(xué)的勾股定理為例,介紹其功能。勾股定理及其逆定理是綜合性知識單元,與多個知識點有密切關(guān)系,難度較大,具有代表性和典型性。
(三)同構(gòu)異數(shù)題目和相應(yīng)的通用型、引導(dǎo)型提示設(shè)計
通用型和引導(dǎo)型提示設(shè)計以支架式教學(xué)為基礎(chǔ),以波利亞的怎樣解題表為基礎(chǔ)思想,將大任務(wù)拆分成小任務(wù),通過方法論提示語、認(rèn)知提示語、反向思考的元認(rèn)知提示語、提問式的元認(rèn)知提示語四種方式給學(xué)生呈現(xiàn)提示,促進學(xué)生認(rèn)知水平的漸進提升。本研究以一道勾股定理的典型題目為例,介紹其設(shè)計思路。
例1:“如圖2所示,是一塊長寬高分別是6 cm,4 cm和3 cm的長方體木塊。一只螞蟻要從長方體木塊的一個頂點A處,沿著長方體的表面爬到和A相對的頂點B處吃食物,那么它需要爬行的最短路徑長是多少?”
其同構(gòu)異數(shù)題目是:“如圖所示,是一塊長寬高分別是function(va×6)cm, function(va×4)cm和function(va×3) cm的長方體木塊。一只螞蟻要從長方體木塊的一個頂點A處,沿著長方體的表面爬到和A相對的頂點B處吃食物,那么它需要爬行的最短路徑長是多少?”其中va是自然數(shù)1、2、3等。當(dāng)va=1時,為原題;function表示要被真實數(shù)值替換。
例1的通用型提示包括三個層次的難度,分別對應(yīng)三條提示:(1)分別沿著長、寬、高展開立方體,得到三個平面展開圖,因此,螞蟻有三條行走路徑;(2)根據(jù)線段公理和勾股定理,得出這三條路徑的長度;(3)比較路徑長度,數(shù)值最小的即為最短路徑。如果學(xué)生在第一層提示后會解題了,則不必出現(xiàn)第二層提示,以此類推。如果學(xué)生在看到通用型提示后仍不會解題,便會呈現(xiàn)引導(dǎo)型提示。本研究按照已經(jīng)公開的發(fā)明專利“引導(dǎo)型解題輔導(dǎo)方法及系統(tǒng)”的思路[20]和知識的腳本表示法[21],設(shè)計了適合該題目及其同構(gòu)異數(shù)題目的引導(dǎo)型提示腳本,引導(dǎo)學(xué)生選擇正確的解題思路和方法,糾正學(xué)生可能出現(xiàn)的錯誤。引導(dǎo)型提示按照樹狀結(jié)構(gòu)逐級深入,在任何一級上,如果學(xué)生看到提示后能給出正確答案,就結(jié)束該道題目的練習(xí),這個級數(shù)被稱為這次練習(xí)的最大引導(dǎo)深度。例1的引導(dǎo)型提示腳本設(shè)計思路如下:呈現(xiàn)提示性問題:“螞蟻要吃到食物,沿著哪個展開圖走,路徑最短?”;呈現(xiàn)三個選項:(1)沿著長展開的,“左面+上面”的展開圖;(2)沿著寬展開的,“前面+上面”的展開圖;(3)沿著高展開的,“前面+右面”的展開圖。如果學(xué)生看到這三個選項,在展開圖的提示下,根據(jù)展開圖的邊長求得相應(yīng)的路徑長,通過比較路徑長短得到最短路徑,則練習(xí)結(jié)束。如果學(xué)生看到三個選項后,未能給出正確答案,系統(tǒng)則根據(jù)學(xué)生的選項,分別呈現(xiàn)不同的啟發(fā)性提示:選項(1),表明選對了,呈現(xiàn)啟發(fā)性提示2;選項(2),表明未選對,呈現(xiàn)啟發(fā)性提示3;選項(3),表明未選對,呈現(xiàn)啟發(fā)性提示4。啟發(fā)性提示2:“因為沿著長展開,所以一條直角邊一定是長。而另一條直角邊,想一下把左面的面翻到上面,代表左面面上的高被翻上去了,所以另一條直角邊=高+寬?!眴l(fā)性提示3:“因為沿著寬展開,所以有一條直角邊一定是寬。想一下把前面的面翻到上面,代表前面面上的高被翻上去了,所以另一條直角邊=高+長”。啟發(fā)性提示4:“因為沿著高展開,所以有一條直角邊一定是高。想一下把右面的面翻到上面,代表右面被翻到前面了,所以另一條直角邊=寬+長?!睂W(xué)生看到上述啟發(fā)性提示,可知需分別計算三種情況的直角邊長度。如果學(xué)生可以聯(lián)想到勾股定理,則可以求得三種情況的路徑長,通過比較得到最短路徑,練習(xí)結(jié)束。如果學(xué)生仍未能給出正確答案,則進入啟發(fā)性提示5,引入解題需要的知識點。啟發(fā)性提示5:“請想一下勾股定理:如果直角三角形的兩直角邊長分別為a和b,斜邊長為c,那么a2+b2=c2,即直角三角形兩直角邊的平方和等于斜邊的平方。也請考慮一下線段公理:兩點之間,線段最短?!睂W(xué)生看到提示5后,如果能解答問題,則結(jié)束,否則呈現(xiàn)啟發(fā)提示6和三個選項。啟發(fā)性提示6:“三條路徑中最短的即為最短路徑。則最短距離為?(1)A'B2=(7×va)2+(6×va)2,從而求出A'B=×va;(2)A'B2=(9×va)2+(4×va)2,從而求出A'B=×va;(3)A'B2=(10×va)2+(3×va)2,從而求出AB'=×va?!比绻麑W(xué)生選擇(1),即最小值,則為正確答案,練習(xí)結(jié)束。如果學(xué)生選擇了(2)或者(3),即錯誤答案,則呈現(xiàn)提示7:“重新計算和比較三種情況的路徑值,最小值即為最短路徑?!比绻麑W(xué)生算出正確答案,則結(jié)束;否則呈現(xiàn)提示6。如此循環(huán),直到學(xué)生選擇正確答案。
四、數(shù)學(xué)智能評測和輔導(dǎo)系統(tǒng)教學(xué)效果驗證
(一)實驗設(shè)計
1. 實驗對象
為了驗證MIATS的教學(xué)效果,研究者進行了一項準(zhǔn)實驗研究。研究時間是2023年1月的寒假期間,研究對象是河南省鄭州市一所學(xué)校初二年級兩個班的學(xué)生。因變量是數(shù)學(xué)測試成績,自變量是是否使用引導(dǎo)型提示,無干擾變量。新冠疫情期間,學(xué)校經(jīng)常采用線上教學(xué)方式,學(xué)生和家長已經(jīng)適應(yīng)線上學(xué)習(xí)方式。學(xué)生和家長都擁有智能手機,大部分家庭擁有電腦,大都可以通過有線或者無線方式訪問課程網(wǎng)站,參與學(xué)習(xí)。兩個班學(xué)生性別比例均衡,在數(shù)學(xué)學(xué)習(xí)上差異不大。在初二年級上學(xué)期的階段性評價中,數(shù)學(xué)平均成績差異為4班略低于6班,差值為百分制的3.4分,但是以兩班數(shù)學(xué)成績作為獨立樣本進行T檢驗,所得概率p值為0.379,遠(yuǎn)大于0.05,表明兩班差異在統(tǒng)計意義上不顯著。隨機挑選4班為實驗組,6班為對照組,進行為期一周的學(xué)習(xí),練習(xí)勾股定理相關(guān)題目。
2. 實驗過程
兩組學(xué)生都可以在電腦或者手機上通過瀏覽器進入課程網(wǎng)站,參與課程學(xué)習(xí)。因為學(xué)生在剛剛結(jié)束的學(xué)期學(xué)習(xí)了勾股定理知識,為了解學(xué)生對所學(xué)內(nèi)容的掌握情況和將來經(jīng)過準(zhǔn)實驗后的改變,研究設(shè)計了前測和后測。兩次測驗內(nèi)容都包括8道題目,分別來自上述勾股定理的題庫。兩次測驗題目的內(nèi)容相似,難度相當(dāng),具有可比性。前測和后測題目必須在1小時內(nèi)完成,如果超過時限,系統(tǒng)就會自動收卷。在完成同樣的前測之后,兩組學(xué)生采用不同的學(xué)習(xí)方式進行學(xué)習(xí)。實驗組使用MIATS系統(tǒng)學(xué)習(xí),對照組則是常規(guī)練習(xí),即使用傳統(tǒng)的填寫答案方式學(xué)習(xí),內(nèi)容是21道勾股定理題目。為了幫助學(xué)生學(xué)習(xí)解題思路,學(xué)生在填寫答案后,可以立即看到通用型提示,并且這個練習(xí)不限制完成時間和次數(shù),可以重復(fù)練習(xí)。為保證兩組的均等性,學(xué)生未被告知自己是對照組還是實驗組,也不知道其他組的同伴使用何種系統(tǒng)。實驗組和對照組在分別完成適應(yīng)性練習(xí)和常規(guī)練習(xí)后,將參加同樣內(nèi)容的后測。
這次準(zhǔn)實驗作為學(xué)生的課外學(xué)習(xí)活動進行,不宜嚴(yán)格要求學(xué)生必須完成,為了激勵學(xué)生參加,課程設(shè)置了一個“學(xué)習(xí)之星”虛擬勛章。當(dāng)學(xué)生完成所有活動后,系統(tǒng)自動授予這個勛章。因為學(xué)生均自愿參加,實驗組和對照組中獲得勛章的學(xué)生都未能包括各組全體學(xué)生。有些學(xué)生參加了前測、后測和練習(xí),但是匆匆答題交卷,只得0分,不能作為有效答卷。
(二)實驗發(fā)現(xiàn)
1. 實驗組顯著減少了測驗用時,測驗成績從低于對照組提高到顯著高于對照組
將在前測和后測中都提交了有效答卷的學(xué)生視為準(zhǔn)實驗的有效參與者,計算結(jié)果見表1??梢姡谇皽y中,實驗組平均成績略低于對照組,但是差值3.6分在統(tǒng)計意義上并不顯著。在后測中,實驗組平均成績高于對照組,差值30.0分在統(tǒng)計意義上非常顯著(獨立樣本T檢驗p<0.01),效果量高達(dá)1.1。從前測到后測,實驗組提高了31.1分,成對樣本T檢驗表明,成績提高幅度非常顯著,效果量高達(dá)1.5。而對照組降低了2.5分,但是成對樣本T檢驗表明,成績降低幅度并不顯著。從活動用時上看,在前測中,實驗組用時少于對照組6.3分鐘,但是差異不顯著;后測中,實驗組用時多于對照組1.8分鐘,差異仍不顯著。從前測到后測,無論是實驗組還是對照組,活動用時都顯著減少。實驗組在顯著減少完成測驗所需時間的前提下,顯著提高了測驗成績;對照組在顯著減少完成測驗所需時間的前提下,降低了測驗成績。
2. 實驗組的練習(xí)個性而有效,對照組的練習(xí)淺顯而無效
為考察兩個組的練習(xí)過程,研究者分析了實驗組的智能評測和練習(xí)輔導(dǎo)記錄。有10名學(xué)生一次性通過前測,僅僅做了四道題目,無需繼續(xù)參加練習(xí)和后測,測驗時間平均僅為6.9分鐘。其他31名學(xué)生參加了練習(xí)和后測,所用時間(分鐘)、測驗和練習(xí)中用到的問題個數(shù)、練習(xí)中使用的引導(dǎo)提示深度等統(tǒng)計指標(biāo)見表2。實驗組學(xué)生為了糾正前測中出現(xiàn)的所有錯題,需要在練習(xí)中重新對這些錯題進行解答,如果仍然不理解,可以得到通用型提示和引導(dǎo)型提示的幫助,直到全部答對為止,所以每道練習(xí)題目上花費的時間平均為26.3分鐘,每道題目的引導(dǎo)深度最大值平均為11,中位數(shù)為7,眾數(shù)為5。因此,這些練習(xí)都是有效練習(xí)。平均而言,實驗組學(xué)生測試了8道不同的題目,深度練習(xí)了其中的4道題目,就在后測中取得了顯著高于對照組學(xué)生的優(yōu)良成績。每個學(xué)生練習(xí)過的所有不同題目所組成的集合中,沒有一個是后測中的題目集合的子集。也就是說,在智能輔導(dǎo)系統(tǒng)的深度引導(dǎo)下,學(xué)生不僅學(xué)會了本道題目的解法,更掌握了同類題目的解題思路,并可以將這種解題思路遷移到解決未曾見過和練習(xí)過的題目中。
對照組學(xué)生要完成21道練習(xí)題目,其中包括前測和后測中的所有題目,但是其完成質(zhì)量不能由系統(tǒng)保障。如果不會解題,也僅能在提交答案后看到通用型提示。這些題目的人均練習(xí)時長為104.5分鐘,平均每道題目只有4.9分鐘的練習(xí)時間,可以說是走馬觀花,不能充分理解題意和掌握解題思路,不能算是有效練習(xí)。即使是所考即所練,這種不求甚解的練習(xí)也達(dá)不到較好的學(xué)習(xí)效果。實驗組學(xué)生后測和前測成績的相關(guān)系數(shù)為0.117,不顯著;而對照組學(xué)生兩者的相關(guān)系數(shù)為0.607,比較顯著。這說明實驗組學(xué)生的適應(yīng)性學(xué)習(xí)結(jié)果不受前測成績影響,而對照組學(xué)生的練習(xí)結(jié)果受前測成績影響較大。
五、結(jié)論和討論
借助大數(shù)據(jù)挖掘和項目反應(yīng)理論等人工智能技術(shù),設(shè)計并開發(fā)了數(shù)學(xué)智能評測和輔導(dǎo)系統(tǒng)MIATS,它能夠給學(xué)生提供關(guān)于某一知識點的個性化評測,然后基于評測結(jié)果,為學(xué)生提供個性化作業(yè)和基于學(xué)生做題情況的個性化輔導(dǎo)。為了驗證該系統(tǒng)的教學(xué)效果,本研究以有關(guān)勾股定理的21道試題組成的題庫為例,在某所初中的兩個班進行了準(zhǔn)實驗研究。對收集到的實驗數(shù)據(jù)分析證明,在前測差異不大的前提下,使用MIATS的實驗組學(xué)生取得了顯著進步,后測表現(xiàn)顯著優(yōu)于僅看到通用型提示的對照組學(xué)生。實驗組學(xué)生的測試和練習(xí)內(nèi)容都不盡相同,個性化特點突出;練習(xí)中如果不能自主解決問題,則得到系統(tǒng)恰當(dāng)?shù)囊龑?dǎo)型提示和幫助,直到解決問題為止;在練習(xí)中所掌握的知識和技能能夠遷移到其他題目的解決中。
智能評測和輔導(dǎo)系統(tǒng)對學(xué)生數(shù)學(xué)學(xué)習(xí)取得的顯著影響,可以從以下三個理論得到解釋:
其一,認(rèn)知主義強調(diào)學(xué)習(xí)是一個信息加工的過程,對信息的深度加工就是深度學(xué)習(xí)。MIATS的同構(gòu)異數(shù)題目的設(shè)置,促進了對數(shù)學(xué)相關(guān)知識的深度加工和靈活運用,而不僅僅停留在對于所學(xué)數(shù)學(xué)定理、公式的死記硬背。在知識加工過程中,當(dāng)實驗組的學(xué)生出現(xiàn)疑惑、迷茫的時候,逐層詳盡的引導(dǎo)型提示起到糾錯、拋錨和點撥的作用。
其二,ICAP理論框架指出,在教學(xué)過程中,學(xué)生采用不同的學(xué)習(xí)方式會導(dǎo)致不同的學(xué)習(xí)效果,交互式(Interactive) ≥ 建構(gòu)式(Constructive) > 主動式(Active) > 被動式(Passive)[3]。在MIATS中,實驗組學(xué)生不是單純在學(xué)習(xí)和做題,而是在有需求的時候與虛擬輔導(dǎo)教師不停地進行有效互動,這種高交互性促進了學(xué)生學(xué)習(xí)效果的提升。而對照組學(xué)生僅能看到通用型提示,缺乏與教師的交互機會,即使主動思考,學(xué)習(xí)效果也不及交互頻繁的實驗組學(xué)生。
其三,根據(jù)心流理論,一個人面臨的挑戰(zhàn)與其能力相匹配時,就會進入一種心流狀態(tài),即一種身心合一、專注忘我的狀態(tài),完全沉浸其中,甚至感知不到時間的流逝,是一種投入全部精力并始終掌控的體驗[22-23]。事后不僅會感到滿足和快樂,還能獲得技巧、能力、成長和進步。在傳統(tǒng)的千篇一律的作業(yè)和測試面前,學(xué)困生常常面臨挑戰(zhàn)高、難以企及的題目,會感到擔(dān)心、焦慮和失控,甚至手足無措、沮喪放棄。為了使學(xué)生進入心流狀態(tài),能力與挑戰(zhàn)必須相匹配。MIATS通過前測逐漸測試出學(xué)生的真實水平,使學(xué)生面對的挑戰(zhàn)與自身能力相匹配,減少無關(guān)認(rèn)知加工[24],避免重復(fù)和機械性刷題,從而激發(fā)其興奮感和學(xué)習(xí)熱情,并適時提供引導(dǎo)幫助,促使其螺旋式上升、不斷進步。每次練習(xí)結(jié)束,系統(tǒng)報以鮮花、掌聲等正向激勵,更加激發(fā)學(xué)生戰(zhàn)勝挑戰(zhàn)、主動學(xué)習(xí)的意愿。
本研究借助智能技術(shù),為每個學(xué)生提供個性化測評和個性化輔導(dǎo),是貫徹落實教育評價改革和減負(fù)增效宏觀政策的一次有益嘗試。當(dāng)然,由于時間和條件有限,研究還有一些不足之處,如僅僅應(yīng)用于初中學(xué)生寒假課外復(fù)習(xí),未能將系統(tǒng)與常規(guī)教學(xué)有機整合,有待將來完善和改進,也有賴學(xué)校管理部門和學(xué)科教師對智能技術(shù)教育應(yīng)用的認(rèn)識和重視[25-26]。
[參考文獻]
[1] 新華社.中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》[EB/OL]. (2020-10-13)[2023-02-01]. http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
[2] 中華人民共和國教育部.中共中央辦公廳 國務(wù)院辦公廳印發(fā)《關(guān)于進一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見》[EB/OL].(2021-07-24) [2023-02-01]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202107/t20210724_546576.html.
[3] CHI M, SILER S A, JEONG H, et al.Learning from human tutoring[J]. Cognitive science, 2001,25(4):471-533.
[4] VANLEHN K. The relative effectiveness of human tutoring, intelligent tutoring systems, and other tutoring systems [J]. Educational psychologist,2011,46(4):197-221.
[5] 郭紹青,高海燕,華曉雨.“互聯(lián)網(wǎng)+”單元教學(xué)模式設(shè)計理論研究[J].電化教育研究,2022,43(6):104-114.
[6] 王曉華,文劍冰.項目反應(yīng)理論在教育考試命題質(zhì)量評價中的應(yīng)用[J].教育科學(xué),2010,26(3):20-26.
[7] 劉寧,余勝泉.基于最近發(fā)展區(qū)的精準(zhǔn)教學(xué)研究[J].電化教育研究,2020,41(07):77-85.
[8] 李明.基于最近發(fā)展區(qū)的數(shù)學(xué)教學(xué)策略[J].西部素質(zhì)教育,2020,6(8):240-243.
[9] 姚建欣.美國大規(guī)模教育評價項目對中國公民科學(xué)素質(zhì)調(diào)查的借鑒與啟示[J].科普研究,2015, 10(5):62-66.
[10] 朱哲民,孔祥一.基于IRT的數(shù)學(xué)學(xué)業(yè)質(zhì)量增值評價及其應(yīng)用[J].教育測量與評價,2022,(5):21-31.
[11] 齊宇歆.基于PISA的學(xué)習(xí)素養(yǎng)評價模式設(shè)計與實證研究——以鄭州E中學(xué)初三數(shù)學(xué)為例[J].中國電化教育,2018,(4):72-81.
[12] JIA J.Intelligent tutoring systems[M]//SPECTOR J M.Encyclopedia of educational technology. Thousand Oaks, CA: Sage,2015:411-413.
[13] JIA J, HE Y, LE H. A multimodal human-computer interaction system and its application in smart learning environments[C]//Proceedings of ICBL 2020.Berlin:Springer, 2020:3-14.
[14] 孟青泉,賈積有,張志永,顏澤忠.智能教學(xué)系統(tǒng)測評模型的構(gòu)建與實證研究[J].現(xiàn)代教育技術(shù),2022,32(5):68-74.
[15] KULIK J A, FLETCHER J D. Effectiveness of intelligent tutoring systems: a meta-analytic review[J]. Review of educational research, 2016,86(1):42-78.
[16] MA W, ADESOPE O O, NESBIT J C, et al.Intelligent tutoring systems and learning outcomes: a meta-analysis[J]. Journal of educational psychology,2014,106(4):901-918.
[17] ROSCHELLE J, FENG M, MURPHY R F,et al. Online mathematics homework increases student achievement[J]. Aera open, 2016,2(4):1-12.
[18] JIA J, LE H.The design and implementation of a computerized adaptive testing system for school mathematics based on item response theory[C]//Proceedings of ICTE 2020. Berlin:Springer,2020:100-111.
[19] 賈積有,樂惠驍,張譽月,劉懷亞,陳昂軒,李姍姍.基于大數(shù)據(jù)挖掘的智能評測和輔導(dǎo)系統(tǒng)設(shè)計[J].中國電化教育,2023(3):104-111.
[20] 賈積有,張譽月,劉懷亞,李姍姍,陳昂軒.引導(dǎo)型解題輔導(dǎo)方法及系統(tǒng)[P].北京:CN115662222A, 2023-01-31.
[21] JIA J,CHEN W. Script based design for human-computer dialog in given scenarios for english learners[C]//ICALT08:Eighth International Conference on Advanced Learning Technology. NEW York:IEEE Press,2008:739-744.
[22] 鄧鵬.心流:體驗生命的潛能和樂趣[J].遠(yuǎn)程教育雜志,2006(3):74-78.
[23] 喬愛玲,龔鑫,韓涵.形式差異的外部概念支架對學(xué)生游戲化學(xué)習(xí)心流和效果的影響[J].電化教育研究,2021,42(12):86-92,99.
[24] 高潔,彭紹東.矛盾與策略:數(shù)字化學(xué)習(xí)中基于外在認(rèn)知負(fù)荷的學(xué)習(xí)分析[J].電化教育研究,2023, 44(1):100-105,115.
[25] 郭紹青,華曉雨.論智慧教育與智能教育的關(guān)系[J].西北師大學(xué)報(社會科學(xué)版),2022,59(6):139-147.
[26] 徐振國,劉志,黨同桐,孔璽.教育智能體的發(fā)展歷程、應(yīng)用現(xiàn)狀與未來展望[J].電化教育研究,2021, 42(11):20-26,33.
[Abstract] In order to verify the role of artificial intelligence technology in the implementation of several policy documents issued by the central government on academic assessment reform and alleviating burdens for efficiency of primary and secondary school students, this paper first? analyzes the difficulties in implementing macro policies in conventional school and classroom settings, and points out that intelligent assessment and tutoring systems can help solve the existing implementation challenges. Then, based on the large-scale student learning data from an online learning system, a mathematics intelligent assessment and tutoring system, MIATS, is developed that enables guided personalized tutoring for students based on individualized assessment of students. A quasi-experimental study in a middle school was conducted to verify the effect of the system on students' mathematics learning. The analysis of the collected experimental data proves that the system plays a very significant role in reducing the homework burden and enhancing the learning effect, and is an effective means to realize value-added assessment, combining assessment with learning and promoting learning by assessment. This paper provides a reference for the intelligent evaluation and tutoring system to help implement macro policies such as academic assessment reform and alleviating burdens for efficiency.
[Abstract] Intelligent Assessment; Intelligent Tutoring; Mathematics Teaching; Guided Prompt; Assessment Reform; Alleviating Burdens for Efficiency