胡德鑫, 王耀榮
(天津大學(xué)教育學(xué)院, 天津 300350)
進(jìn)入21世紀(jì)以來,全球正處于百年未有之大變局,隨著以人工智能技術(shù)為代表的新科技革命不斷發(fā)展,全球資源配置形態(tài)、工業(yè)生產(chǎn)模式和人類生活方式正發(fā)生急遽變革。人工智能技術(shù)亟需在國家高科技戰(zhàn)略與前沿行業(yè)發(fā)展領(lǐng)域發(fā)揮引領(lǐng)與支撐作用,當(dāng)前人工智能已經(jīng)成為賦能學(xué)校教育治理現(xiàn)代化的關(guān)鍵工具,受到學(xué)術(shù)界和社會公眾的廣泛關(guān)注。尤其是2020年以來,關(guān)于人工智能技術(shù)在教育教學(xué)領(lǐng)域應(yīng)用的研究快速增加,主要集中在輔助學(xué)生學(xué)習(xí)的智能分析技術(shù)、教師智能技術(shù)運用能力提升、教學(xué)資源開發(fā)與共享機(jī)制、教學(xué)管理與評價智能平臺建設(shè)、學(xué)習(xí)環(huán)境技術(shù)支持與升級等諸多領(lǐng)域。人工智能進(jìn)一步賦能智慧教學(xué)、泛在學(xué)習(xí)、監(jiān)測評價等教育教學(xué)改革場域,為“人工智能+教育”的多場景、多模態(tài)、多時空運用奠定堅實技術(shù)基礎(chǔ)。
通過梳理發(fā)現(xiàn),目前學(xué)術(shù)界對人工智能技術(shù)是否影響學(xué)生的學(xué)習(xí)效果主要持有以下兩類觀點。諸多學(xué)者通過實驗證明人工智能技術(shù)對學(xué)生的學(xué)習(xí)效果有顯著影響。諸如,Abbasi等通過開發(fā)部署一個帶有面向?qū)ο缶幊陶Z言知識庫的聊天機(jī)器人系統(tǒng),使用谷歌搜索引擎和聊天機(jī)器人系統(tǒng)進(jìn)行實驗比較,實驗結(jié)果表明聊天機(jī)器人系統(tǒng)對學(xué)生的記憶保持和學(xué)習(xí)成績有顯著影響[1];Zafar等通過設(shè)計和開發(fā)一種智能輔導(dǎo)技術(shù),對在真實環(huán)境中計算機(jī)科學(xué)專業(yè)的研究生用SQL進(jìn)行測試,結(jié)果顯示該智能輔導(dǎo)系統(tǒng)對學(xué)生學(xué)習(xí)結(jié)果產(chǎn)生積極的影響[2];Julià等通過實驗組和對照組對比的視角,討論和分析教育機(jī)器人在培養(yǎng)12歲學(xué)生空間能力方面的效果,結(jié)果顯示機(jī)器人課程參與者對空間能力的積極變化大于未參加課程的學(xué)生的變化[3]。然而也有一些實證研究結(jié)果表明,人工智能技術(shù)并不能提升學(xué)生的學(xué)習(xí)效果。如Calvo-Ferrer通過前、后和延遲測試探究智能教育游戲?qū)W(xué)生詞匯習(xí)得和感知學(xué)習(xí)收益的激勵效應(yīng),結(jié)果顯示智能教育游戲?qū)W(xué)生的學(xué)習(xí)結(jié)果沒有影響[4],該作者認(rèn)為智能教育游戲作為教育環(huán)境中的一種創(chuàng)新技術(shù)工具,可能會讓學(xué)生過度興奮,進(jìn)而可能導(dǎo)致學(xué)生對教育內(nèi)容分心;Wrzesien等采用準(zhǔn)實驗設(shè)計對比虛擬班級(采用E-Junior智能程序以幫助學(xué)生理解自然科學(xué)的虛擬世界)和傳統(tǒng)類型的班級對學(xué)習(xí)效果的影響,結(jié)果顯示虛擬班級和傳統(tǒng)班級在學(xué)習(xí)效果上沒有統(tǒng)計學(xué)上的顯著差異[5-6]。
總的來看,目前學(xué)術(shù)界針對人工智能技術(shù)對學(xué)習(xí)效果影響這一論題仍未達(dá)成統(tǒng)一共識,人工智能對學(xué)習(xí)效果的影響尚不清楚。鑒于此,本研究采用元分析研究法,對2010至2022年國際權(quán)威數(shù)據(jù)庫中關(guān)于人工智能影響學(xué)生學(xué)習(xí)效果的實證研究文獻(xiàn)進(jìn)行篩選并分析。本研究試圖回答以下問題:1)與傳統(tǒng)學(xué)習(xí)方式相比,人工智能技術(shù)整體上能否提升學(xué)生學(xué)習(xí)效果?2)人工智能對學(xué)生學(xué)習(xí)效果在認(rèn)知層面和非認(rèn)知層面各維度的影響程度如何?對學(xué)生認(rèn)知和非認(rèn)知的學(xué)習(xí)效果有無差異?3)不同類型的人工智能技術(shù)應(yīng)用對學(xué)習(xí)效果的影響有沒有差異?4)人工智能在不同學(xué)科、學(xué)段和規(guī)模下是否會影響學(xué)習(xí)效果,影響程度有沒有差異?
本研究主要探究人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的潛在影響與基本特征。借鑒蔣鑫等學(xué)者對美國教育中的人工智能熱點分類,結(jié)合本研究所梳理的文獻(xiàn),把教育領(lǐng)域內(nèi)常用的人工智能技術(shù)劃分為可穿戴技術(shù)(Wearable Technology)、教育機(jī)器人(Educational Robot)、智能教育游戲(Smart Educational Games)和智能學(xué)習(xí)系統(tǒng)(Intelligent Learning System)四種類型[7]。本研究中的學(xué)習(xí)效果指基于人工智能技術(shù)的運用,學(xué)生在學(xué)習(xí)過程中產(chǎn)生的心理與行為上的變化。研究借鑒顧小清等學(xué)者將學(xué)習(xí)效果分為認(rèn)知和非認(rèn)知兩個層面,結(jié)合納入本研究的樣本文獻(xiàn),認(rèn)知層面劃分為創(chuàng)造性思維、問題解決能力、學(xué)習(xí)收獲、認(rèn)知能力和空間能力五個維度,非認(rèn)知層面主要包括學(xué)習(xí)意志、學(xué)習(xí)態(tài)度、學(xué)習(xí)參與、學(xué)習(xí)興趣和學(xué)習(xí)動機(jī)五個維度[8]。
本研究中選取的樣本文獻(xiàn)主要通過對Web of Science、Springer Link、ScienceDirect、ERIC、IEEE等國際權(quán)威文獻(xiàn)數(shù)據(jù)庫中2010—2022年間發(fā)表的論文進(jìn)行大范圍交叉檢索,檢索時用人工智能技術(shù)關(guān)鍵詞包括:人工智能(Artificial Intelligence)、教育(Education)、智能學(xué)習(xí)系統(tǒng)(Intelligent Learning System)、機(jī)器人(Robot)、可穿戴技術(shù)(Wearable Technology)、智能教育游戲(Smart Educational Games)等。學(xué)習(xí)效果相關(guān)關(guān)鍵詞有:學(xué)習(xí)成就(Learning Achievement)、學(xué)習(xí)表現(xiàn)(Learning Performance)、學(xué) 習(xí) 收 獲(Learning Gains)、學(xué)習(xí)結(jié)果(Learning Outcome)、學(xué)習(xí)影響(Learning Effect)等。首輪檢索結(jié)束后,為獲取更多相關(guān)研究權(quán)威文獻(xiàn),對相關(guān)研究的參考文獻(xiàn)進(jìn)行第二輪回溯檢索。
為保證研究的嚴(yán)謹(jǐn)性和有效性,本研究對文獻(xiàn)納入標(biāo)準(zhǔn)制定了以下規(guī)則:第一,研究主題必須為人工智能技術(shù)影響學(xué)生學(xué)習(xí)效果的高度相關(guān)研究;第二,研究必須為實證研究,排除非實證研究;第三,研究必須包括實驗組和對照組,實驗組學(xué)生使用人工智能技術(shù),對照組采用傳統(tǒng)學(xué)習(xí)方式,或者是實驗采取前測和后測,前測為人工智能技術(shù)干預(yù)前,后測為人工智能技術(shù)干預(yù)后;第四,研究必須包括能夠計算出效應(yīng)值的各項統(tǒng)計原始數(shù)據(jù)。經(jīng)過篩選后,最終完全符合元分析標(biāo)準(zhǔn)的文獻(xiàn)共有40篇,共計包含72個效應(yīng)值,具體流程如圖1所示[9-44]。
圖1 樣本文獻(xiàn)篩選Prisma流程
根據(jù)納入元分析樣本文獻(xiàn)的特點,對樣本文獻(xiàn)的特征值進(jìn)行編碼,從符合文件篩選要求的文獻(xiàn)中提取以下變量:作者、出版年、樣本量、學(xué)段、學(xué)科、技術(shù)應(yīng)用類型以及學(xué)習(xí)效果等信息,編碼標(biāo)準(zhǔn)如表1所 示[45]。為保證編碼的準(zhǔn)確性,本研究由兩位研究人員進(jìn)行雙重編碼,兩者編碼的Kappa值為0.913,說明編碼結(jié)果可信。
表1 文獻(xiàn)編碼標(biāo)準(zhǔn)
本研究采用的基本方法是元分析,元分析法是通過采用特定的測量與統(tǒng)計分析技術(shù)對諸多同一類主題的多項獨立的量化研究進(jìn)行再分析,避免單個研究結(jié)果可能帶來的結(jié)論偏差,從而得出一個具有普遍性意義的結(jié)論。目前可用于元分析的主流工具包括R語言、Stata、SAS、Review Manager和Comprehensive Meta-Analysis(CMA)等。結(jié)合研究實際情況,本研究采用CMA 3.0作為技術(shù)分析工具開展研究。在元分析研究中,常用的效應(yīng)量有Cohen’sd和Hedges’g,綜合對比分析這兩種效應(yīng)量,結(jié)合本研究中有部分文獻(xiàn)的研究對象樣本量小于20的實際情況,本研究采用Hedges’g作為效應(yīng)量指標(biāo)[46]。在解釋效應(yīng)量大小時,研究使用了科恩的效應(yīng)值分類:當(dāng)效應(yīng)值位于0.8左右時,有顯著的影響效果,且影響很大;當(dāng)效應(yīng)值位于0.5左右時,有中等程度的影響;當(dāng)效應(yīng)值在0.2左右時,通常認(rèn)為影響相對較小,效果不顯著[47]。除探究人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的總體影響外,本研究還引入樣本規(guī)模、學(xué)科、學(xué)段和技術(shù)應(yīng)用類型4類調(diào)節(jié)變量,從不同層面來評價人工智能技術(shù)對學(xué)習(xí)效果的影響,框架設(shè)計如圖2所示。
圖2 元分析框架設(shè)計路線
在元分析中,當(dāng)選擇樣本不能代表該領(lǐng)域的研究總體時,就有可能出現(xiàn)發(fā)表偏倚問題,從而影響研究結(jié)果的準(zhǔn)確性。為檢驗本研究是否存在發(fā)表偏倚現(xiàn)象, 評估采用漏斗圖和失安全系數(shù)(Fail-safe N)的綜合評價方法加以判定。圖3漏斗圖中橫坐標(biāo)表示平均標(biāo)準(zhǔn)差效應(yīng)值,縱坐標(biāo)表示效應(yīng)值的標(biāo)準(zhǔn)差。使用漏斗圖對發(fā)表偏倚進(jìn)行可視化,可以看出72項獨立研究效應(yīng)量絕大部分位于漏斗圖的上半部分,且分布在平均效應(yīng)值的兩側(cè),說明存在發(fā)表偏倚的可能性很小。失安全系數(shù)是評估發(fā)表偏倚是否發(fā)生的另一個有效指標(biāo),該系數(shù)強(qiáng)調(diào)在元分析結(jié)果有統(tǒng)計意義時,系數(shù)值越大,結(jié)論逆轉(zhuǎn)的可能性越低,即發(fā)表偏倚出現(xiàn)的概率越小。其具體評價標(biāo)準(zhǔn)為如果失安全系數(shù)小于5K+10,其中K代表納入元分析的樣本文獻(xiàn)數(shù)量,則存在發(fā)表偏倚。本研究中失安全系數(shù)為4 655,遠(yuǎn)超過210(即5×40+10),說明此研究存在發(fā)表偏倚的可能性很小。根據(jù)上述兩種評價方法綜合判斷,本研究的基本結(jié)果較為可靠,能夠得出較為穩(wěn)定的結(jié)論。
圖3 效應(yīng)值分布漏斗圖
異質(zhì)性檢驗主要用于測量研究中效應(yīng)值的變異程度,目的是確定各獨立研究結(jié)果是否具有可合并性。本研究中主要采用Q和I2來進(jìn)行檢驗,結(jié)果顯示Q為731.741(p<0.001),說明研究的樣本間存在異質(zhì)性;I2的值為90.297%,大于75%,說明90%的異質(zhì)性是來自于效應(yīng)值的真實差異,僅有10%是由系統(tǒng)誤差導(dǎo)致的。納入研究中樣本文獻(xiàn)的發(fā)表時間、來源國家、樣本規(guī)模、研究對象等多種因素可能是導(dǎo)致出現(xiàn)異質(zhì)性的原因。I2值反映異質(zhì)性部分在效應(yīng)量總的變異中所占的比重,其數(shù)值越大,表明異質(zhì)性越強(qiáng)。本研究采用隨機(jī)效應(yīng)模型進(jìn)行解析,以保證研究結(jié)果的有效性和可靠性,從而有效消除異質(zhì)性[48-49]。
將40項研究(共含72個效應(yīng)量)的實驗組和對照組或前測和后測的樣本量、均值和標(biāo)準(zhǔn)差等數(shù)據(jù)導(dǎo)入到元分析軟件CMA3.0中,人工智能對學(xué)習(xí)效果影響的整體效應(yīng)檢驗如表2所示。整體效應(yīng)值Hedges’g為0.845,且p<0.001,說明人工智能技術(shù)能夠顯著提升學(xué)生的學(xué)習(xí)效果。
表2 人工智能對學(xué)習(xí)效果影響的整體效應(yīng)檢驗
本研究將學(xué)習(xí)效果分為認(rèn)知層面和非認(rèn)知層面。通過表3可知,人工智能技術(shù)對學(xué)習(xí)效果認(rèn)知層面的效 應(yīng) 值Hedges’g為0.915,達(dá) 到 統(tǒng) 計 顯 著 水 平(p<0.001),效應(yīng)值大于0.8,說明人工智能技術(shù)對認(rèn)知層面的學(xué)習(xí)效果有顯著影響。非認(rèn)知層面的效應(yīng)值Hedges’g為0.783,達(dá) 到 統(tǒng) 計 意 義 上 的 顯 著 水 平(p<0.001),效應(yīng)值大于0.5且小于0.8,說明人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的影響在非認(rèn)知層面上有中等偏上程度的影響。組間效應(yīng)Q=0.739,沒有達(dá)到統(tǒng)計意義上的顯著水平(p>0.05),說明人工智能技術(shù)對學(xué)生學(xué)習(xí)效果在認(rèn)知層面和非認(rèn)知層面不存在顯著差異。研究結(jié)果表明人工智能技術(shù)對學(xué)生認(rèn)知層面和非認(rèn)知層面的學(xué)習(xí)效果均具有較高的提升效果。
表3 人工智能對認(rèn)知與非認(rèn)知層面學(xué)習(xí)效果影響的差異分析
人工智能技術(shù)對認(rèn)知和非認(rèn)知層面各個維度的影響如表4所示。在認(rèn)知層面,學(xué)習(xí)收獲效應(yīng)值為1.049,認(rèn)知能力效應(yīng)值為0.992,且都具有統(tǒng)計顯著性(p<0.001),表明人工智能技術(shù)對學(xué)生認(rèn)知能力和學(xué)習(xí)收獲有積極正向的影響。問題解決能力的效應(yīng)值為0.650(p<0.05),說明人工智能技術(shù)對學(xué)生問題解決能力有中等程度的積極正向影響。人工智能技術(shù)對學(xué)生創(chuàng)造性思維和空間能力影響方面,不具有統(tǒng)計學(xué)的顯著意義(p>0.05)。在非認(rèn)知層面,學(xué)習(xí)參與的效應(yīng)值為1.148,學(xué)習(xí)態(tài)度的效應(yīng)值為0.896,學(xué)習(xí)動機(jī)的效應(yīng)值為0.814,學(xué)習(xí)意志的效應(yīng)值為0.803,且都具有統(tǒng)計顯著性(p<0.05),說明人工智能對學(xué)生學(xué)習(xí)效果在這4個方面都具有積極正向的顯著影響,其中在學(xué)習(xí)參與方面影響最大。學(xué)習(xí)興趣的效應(yīng)值為0.562,具有統(tǒng)計顯著性(p<0.001),說明人工智能技術(shù)對學(xué)習(xí)興趣有中等程度的正向促進(jìn)作用。
表4 人工智能對各維度學(xué)習(xí)效果影響的差異分析
(1) 不同類型的人工智能技術(shù)應(yīng)用對學(xué)習(xí)效果影響的差異分析。本研究將人工智能技術(shù)的應(yīng)用類型分為教育機(jī)器人、可穿戴技術(shù)、智能教育游戲和智能學(xué)習(xí)系統(tǒng)。從表5可以看出,教育機(jī)器人效應(yīng)值為0.828,可穿戴技術(shù)效應(yīng)值為0.739,智能教育游戲效應(yīng)值為0.811,智能學(xué)習(xí)系統(tǒng)的效應(yīng)值為0.991,且都具有統(tǒng)計顯著性(p<0.001),說明四種不同類型的人工智能應(yīng)用對學(xué)生學(xué)習(xí)效果都具有積極正向的促進(jìn)作用。組間效應(yīng)Q=1.371,沒有達(dá)到統(tǒng)計意義上的顯著水平(p>0.05),表明不同技術(shù)應(yīng)用類型在促進(jìn)學(xué)生學(xué)習(xí)效果上不存在顯著差異。
表5 不同技術(shù)應(yīng)用類型對學(xué)習(xí)效果影響的差異分析
(2) 人工智能技術(shù)對不同學(xué)段學(xué)生學(xué)習(xí)效果影響的差異分析。將納入研究的樣本文獻(xiàn)中的學(xué)段分為幼教、小學(xué)、中學(xué)和大學(xué)4個學(xué)段。由表6結(jié)果可得,在大學(xué)階段的效應(yīng)值為1.207,幼教階段效應(yīng)值為1.382,效應(yīng)值均大于0.8,且達(dá)到統(tǒng)計學(xué)意義的顯著水平(p<0.05),說明在大學(xué)階段和幼教階段人工智能技術(shù)對學(xué)習(xí)效果的影響達(dá)到積極正向的顯著效果;小學(xué)階段效應(yīng)值為0.652,中學(xué)階段效應(yīng)值為0.625,且都具有統(tǒng)計學(xué)的顯著意義(p<0.001),說明人工智能技術(shù)在小學(xué)和中學(xué)階段有中等程度的正向影響。組間效應(yīng)Q=11.83,達(dá)到統(tǒng)計學(xué)意義的顯著水平(p<0.05),說明人工智能技術(shù)對不同學(xué)段學(xué)生的學(xué)習(xí)效果存在顯著差異。
表6 人工智能對不同學(xué)段學(xué)生學(xué)習(xí)效果影響的差異分析
(3) 人工智能技術(shù)對不同學(xué)科學(xué)習(xí)效果影響的差異分析。本研究將人工智能所應(yīng)用的學(xué)科領(lǐng)域劃分為英語、數(shù)學(xué)、物理、計算機(jī)、科學(xué)和生物6個學(xué)科,探究人工智能對學(xué)習(xí)效果的影響在不同學(xué)科間的差異。結(jié)果見表7所示,組間效應(yīng)Q=37.00,達(dá)到統(tǒng)計學(xué)意義的顯著水平(p<0.05),說明人工智能技術(shù)對不同學(xué)科的學(xué)習(xí)效果存在顯著差異。對計算機(jī)這一學(xué)科的影響最大,效應(yīng)值為1.334,其次生物學(xué)科效應(yīng)值為1.230,英語學(xué)科效應(yīng)值為0.919,這三個學(xué)科的效應(yīng)值都達(dá)到0.8以上,且均具有統(tǒng)計顯著性(p<0.001),說明人工智能對計算機(jī)、生物和英語學(xué)科的學(xué)習(xí)效果具有積極正向的顯著作用。數(shù)學(xué)學(xué)科效應(yīng)值為0.500,科學(xué)學(xué)科效應(yīng)值為0.501,數(shù)學(xué)和科學(xué)的效應(yīng)值在0.5~0.8之間,且都具有統(tǒng)計學(xué)的顯著意義(p<0.001),表明人工智能對數(shù)學(xué)和科學(xué)學(xué)科的學(xué)習(xí)效果具有中等程度的正向影響。而人工智能對物理學(xué)科影響的效應(yīng)值僅為0.119(p>0.05),不具有統(tǒng)計顯著性。
表7 人工智能對不同學(xué)科學(xué)習(xí)效果影響的差異分析
(4) 不同樣本規(guī)模下人工智能技術(shù)對學(xué)習(xí)效果影響的差異分析。不同樣本規(guī)模是否會影響到人工智能對學(xué)生的學(xué)習(xí)效果,研究結(jié)果如表8所示,組間效應(yīng)Q=15.866,達(dá)到了統(tǒng)計學(xué)意義的顯著水平(p<0.05),說明在不同樣本量下人工智能技術(shù)對學(xué)習(xí)效果的影響存在顯著差異。其中樣本量在50~100時效應(yīng)值為1.066,樣本量小于50時,效應(yīng)值為0.981,兩者效應(yīng)值都大于0.8,且都具有統(tǒng)計顯著性(p<0.001),說明人工智能在樣本量小于50和位于50到100之間都能達(dá)到積極正向的顯著作用。樣本量大于100時,效應(yīng)值為0.485,具有統(tǒng)計顯著性(p<0.001),表明人工智能在樣本量大于100時有較低的作用。
表8 人工智能對不同樣本規(guī)模學(xué)習(xí)效果影響的差異分析
研究通過運用元分析方法對2010至2022年間國際上關(guān)于人工智能技術(shù)對學(xué)習(xí)效果影響的40篇文獻(xiàn)(共含72個效應(yīng)量)進(jìn)行梳理分析。研究結(jié)果表明人工智能技術(shù)對學(xué)生學(xué)習(xí)效果影響的整體效應(yīng)值達(dá)0.845,說明人工智能技術(shù)能夠積極促進(jìn)學(xué)生的學(xué)習(xí)效果,不僅體現(xiàn)在認(rèn)知層面,也體現(xiàn)在非認(rèn)知層面;不同技術(shù)應(yīng)用類型之間不存在顯著差異,均能夠有效提升學(xué)生的學(xué)習(xí)效果。此外,從總體來看,人工智能技術(shù)在不同學(xué)段、學(xué)科和樣本規(guī)模下對學(xué)生的學(xué)習(xí)效果均能產(chǎn)生不同程度的積極影響?;诖耍瑥恼咴O(shè)計、教學(xué)改革和技術(shù)推廣三個層面提出未來人工智能技術(shù)促進(jìn)學(xué)生學(xué)習(xí)效果的行動路徑與提升策略。
(1) 政策設(shè)計:積極推動人工智能與教育的深度融合。由元分析結(jié)果可知,人工智能技術(shù)對學(xué)習(xí)效果影響的整體總效應(yīng)(g=0.845,p<0.001),說明人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的影響有積極正向的顯著作用。在認(rèn)知層面(g=0.915)和非認(rèn)知層面(g=0.783),結(jié)果顯示在認(rèn)知層面和非認(rèn)知層面沒有顯著差異(p>0.05),表明人工智能不僅能促進(jìn)學(xué)生在認(rèn)知層面的學(xué)習(xí)效果,也能促進(jìn)非認(rèn)知層面的學(xué)習(xí)效果。研究結(jié)果表明,人工智能與教育的深度融合有利于學(xué)生的學(xué)習(xí)效果提升,人工智能技術(shù)的發(fā)展對教育系統(tǒng)性改革起著內(nèi)驅(qū)源動力的作用。如何塑造與技術(shù)互動中的未來教育新模態(tài),進(jìn)而推動學(xué)生自主學(xué)習(xí)向自適應(yīng)學(xué)習(xí)的新范式轉(zhuǎn)型,是人工智能技術(shù)賦能教育改革應(yīng)關(guān)注的核心內(nèi)容。聚焦人工智能技術(shù)驅(qū)動下教育變革的政策設(shè)計,應(yīng)從教育教學(xué)模式創(chuàng)新、大規(guī)模個性化學(xué)習(xí)、重塑知識價值觀念、未來教師培訓(xùn)與發(fā)展等維度推進(jìn)系統(tǒng)性改革。
(2) 教學(xué)改革:人機(jī)協(xié)同引領(lǐng)未來學(xué)習(xí)新方式。為研究人工智能不同技術(shù)應(yīng)用類型對學(xué)習(xí)效果的影響,我們分析了4種不同類型的人工智能技術(shù)應(yīng)用類型,分別為教育機(jī)器人(g=0.828)、可穿戴技術(shù)(g=0.739)、智能教育游戲(g=0.811)和智能學(xué)習(xí)系統(tǒng)(g=0.991),結(jié)果表明不同的應(yīng)用類型之間沒有顯著差異(p>0.05),都可以提升學(xué)生的學(xué)習(xí)效果。從本研究中可看出未來將會有更多更深層次的人工智能技術(shù)應(yīng)用到教育領(lǐng)域,學(xué)校未來將會是更加智能化、個性化和系統(tǒng)化的生態(tài)圖景,人機(jī)協(xié)同將成為學(xué)校教育的新常態(tài)。在人機(jī)協(xié)同的管控下有效開展教學(xué)活動,讓人工智能技術(shù)更好輔助教育教學(xué)活動,代替教師更多機(jī)械的任務(wù),從而讓教師更多地投入到教學(xué)過程中的互動、參與等需要自主建構(gòu)的教學(xué)活動中。
(3) 技術(shù)推廣:推進(jìn)人工智能多學(xué)段、多學(xué)科和差異化應(yīng)用。從學(xué)段來看,人工智能在各個學(xué)段都有正向的促進(jìn)作用,但在不同學(xué)段的應(yīng)用效果不同(p<0.05)。由于幼教階段樣本量較少,主要比較小學(xué)、中學(xué)和大學(xué)階段學(xué)生的應(yīng)用效果。相比大學(xué)階段(g=1.207),人 工 智 能 在 小 學(xué)(g=0.652)和 中 學(xué)(g=0.625)階段的應(yīng)用效果相對較低。相比大學(xué)生,中學(xué)生和小學(xué)生自我控制能力相對較弱,自我管理方面能力不足,不具備良好的主動學(xué)習(xí)能力,所以對他們來說維持學(xué)習(xí)動機(jī)和學(xué)習(xí)意志比較困難,因此在人工智能運用到不同學(xué)段時,應(yīng)結(jié)合各學(xué)段學(xué)生的特征和差異來進(jìn)行設(shè)計,引入提高學(xué)生學(xué)習(xí)動機(jī)、學(xué)習(xí)意志、學(xué)習(xí)注意力等方面的元素。
從學(xué)科來看,人工智能對統(tǒng)計中的各個學(xué)科學(xué)習(xí)效果都有正向的影響,但影響程度有明顯區(qū)別(p<0.05)。根據(jù)實驗結(jié)果可看出,人工智能在英語(g=0.919)、計算機(jī)(g=1.334)和生物(g=1.230)這些科目上表現(xiàn)出更大的優(yōu)越性,說明這些學(xué)科長期以來在教學(xué)過程中善于借助信息技術(shù)手段。然而對于數(shù)學(xué)(g=0.500)、物理(g=0.119)和科學(xué)(g=0.501)學(xué)科,今后則需要更多借助人工智能技術(shù)開展教育教學(xué)活動,這些學(xué)科在借助人工智能技術(shù)提升學(xué)習(xí)效果方面仍有很大的發(fā)展空間。
從樣本量來看,不同樣本量對學(xué)習(xí)效果的影響是顯著的,樣本量在小于50和位于50~100之間時(g>0.8),人工智能技術(shù)對學(xué)習(xí)效果有積極的正向作用,而樣本量在大于100時(g<0.5),人工智能技術(shù)對學(xué)習(xí)效果的作用較小。斯滕貝格·胡與庫珀在研究時發(fā)現(xiàn)了類似的樣本量過大效應(yīng)量降低的情況,他提出當(dāng)樣本量過大時,開展實驗的過程中實驗條件一般情況下很難得到保證,可能對實驗結(jié)果造成一定的影 響[50]。由于樣本規(guī)模過大時學(xué)生之間個體差異較大,同時實驗過程中也會有教師的參與輔助,可能會對實驗結(jié)果造成一定程度的影響。
綜合人工智能在不同學(xué)段、學(xué)科和樣本量這幾個調(diào)節(jié)因素上的結(jié)果來看,人工智能技術(shù)在各個方面都有提升的空間。未來人工智能應(yīng)朝著多學(xué)段、多學(xué)科和差異化應(yīng)用的方向邁進(jìn),推動人工智能技術(shù)在教育領(lǐng)域應(yīng)用的供給側(cè)結(jié)構(gòu)性改革,依據(jù)不同學(xué)段、學(xué)科及規(guī)模的特征和差異,探究適合各層次學(xué)生的方案和設(shè)計,以滿足不同層次學(xué)生的需要,從而促進(jìn)人工智能在各學(xué)段、學(xué)科和規(guī)模的廣泛應(yīng)用。
本研究基于2010至2022年國際權(quán)威數(shù)據(jù)庫中關(guān)于人工智能對學(xué)習(xí)效果影響的實證研究文獻(xiàn),采用元分析方法探究人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的影響,并基于樣本規(guī)模、學(xué)科、學(xué)段和技術(shù)應(yīng)用類型4類調(diào)節(jié)變量分析其影響差異。該研究突出當(dāng)前人工智能技術(shù)應(yīng)用于教育教學(xué)過程中出現(xiàn)的問題與挑戰(zhàn),從而為人工智能技術(shù)在教育場域的廣泛應(yīng)用奠定基礎(chǔ)??傊瑥难芯拷Y(jié)果來看,人工智能技術(shù)對學(xué)生學(xué)習(xí)效果的提升還有很大的發(fā)展空間,未來應(yīng)在各階段教育中增加人工智能學(xué)習(xí)技術(shù)的開發(fā),在人工智能學(xué)習(xí)技術(shù)的開發(fā)過程中應(yīng)更多考慮學(xué)生自主學(xué)習(xí)能力的培養(yǎng),此外應(yīng)對教師進(jìn)行持續(xù)培訓(xùn),以增強(qiáng)教師應(yīng)用人工智能技術(shù)的信心和熟練程度。本研究在樣本文獻(xiàn)的收集和納入時依照嚴(yán)格的標(biāo)準(zhǔn)選取,并對數(shù)據(jù)進(jìn)行了量化分析,因此研究結(jié)果具有一定的可靠性和有效性。然而,這項研究還有一定局限性與進(jìn)一步完善的空間。首先,本研究只有40篇文獻(xiàn)符合元分析標(biāo)準(zhǔn),因此在研究結(jié)果的推廣方面應(yīng)謹(jǐn)慎。未來的研究應(yīng)擴(kuò)大數(shù)據(jù)來源,以獲得更多的研究,更好地了解人工智能對學(xué)習(xí)效果的影響。其次,目前的研究只分析了4個調(diào)節(jié)變量的影響,未來的研究應(yīng)考慮加入其他可能對學(xué)生學(xué)習(xí)效果產(chǎn)生影響的調(diào)節(jié)變量。最后,本研究分析框架尚有待進(jìn)一步完善,分類還需要更加細(xì)致,后續(xù)應(yīng)結(jié)合人工智能技術(shù)對學(xué)生學(xué)習(xí)效果影響相關(guān)研究的不斷增加,展開更深入的元分析量化研究,以得出更加全面、客觀與細(xì)致的科學(xué)論斷。