王勝蘭 彭 雙 鐘燕蘭
(1.華南師范大學 教育科學學院,廣州 510631; 2.國防科技大學 電子科學學院,長沙 410003; 3.嘉應學院 教育科學學院,梅州 514015)
深度學習作為信息時代學習方式變革的標志,有助于改變教學圍繞識記、領會、運用等淺層學習的現(xiàn)狀,將教學改進的目標指向深層認知能力和創(chuàng)造力的培養(yǎng)(何克抗,2018)。深度學習作為學生核心素養(yǎng)培育的重要途徑,是我國落實立德樹人根本任務的戰(zhàn)略重點(鄭葳等,2018)。對學生來說,他們只有通過深度學習,才能更好地掌握和理解學科知識,以及應用這些知識解決真實情境問題。
人們普遍認為,深度學習不是一種固定的學習方式,可以通過設計特定系統(tǒng)的教學來培養(yǎng)(Trigwell & Prosser, 1991; Entwistle, 2000)。國內(nèi)外已有許多學校將深度學習的培養(yǎng)納入教學,并通過實驗驗證教學干預對學生深度學習的影響,但并未達成共識。部分研究認為教學干預在促進學生深度學習方面效果顯著,部分研究指出教學干預不一定能促進學生深度學習,甚至存在負效應。教學干預對學生深度學習是否有效?各研究的影響效應之間是否存在顯著差異?哪些因素可以解釋各研究之間的差異?為回答上述問題,本研究采用元分析方法對國內(nèi)外有關實驗研究結論進行定量整合,分析不同調(diào)節(jié)變量對深度學習提升效果的影響,為教師開展教學干預提供指導。
“深度學習”(deep learning)也稱“深層學習”。付亦寧(2021)通過文獻分析發(fā)現(xiàn),不同時期人們對深度學習的理解和認識都存在差異。本研究通過回顧深度學習概念的發(fā)展歷程來把握其核心內(nèi)涵并合理界定概念。在早期研究中,研究者將深度學習描述為學生在學習過程中采用的學習方式。這一概念最早源于馬頓和薩爾喬(Marton & S?lj?, 1976)。他們通過質性研究比較學生閱讀學術文本的學習過程,區(qū)分出兩類不同的信息加工水平,即“深層加工”(deep-level processing)和“淺層加工”(surface-level processing)。斯文森(Svensson, 1977)在此基礎上,運用“原子論方式”和“整體論方式”探討了深層加工和淺層加工的區(qū)別,即在淺層加工中,學習者關注的是材料本身,采取的是死記硬背的策略;而在深層加工中,學習者更關注材料背后的意義,并采取積極主動的學習策略。比格斯(Biggs, 1978)發(fā)現(xiàn),學生在學習過程中通常會選擇與自己動機相一致的學習策略,學習策略與學習動機的組合即為學習方式。學生在學習過程中存在三種不同的學習方法,即深度學習方式(deep learning approach)、淺層學習方式(surface learning approach)與成就學習方式(achieving learning approach)。此外,恩特威斯爾(Entwistle, 1991)和拉姆斯登(Ramsden, 1981)等從學習方式的角度對深度學習的內(nèi)涵進行了界定。
進入21世紀后,國際組織與世界各國均致力于探究新世紀人才能力結構和信息技術的教育變革潛力。受人才培養(yǎng)理念以及信息技術引發(fā)的系列教育教學變革的影響,深度學習再次引發(fā)熱潮。此時,研究者對深度學習的關注開始從學習過程中采用的學習方式轉向學習結果。作為學習結果的深度學習將布魯姆的認知目標分類理論和比格斯的SOLO(Structure of the Observed Learning Outcome)分類層級框架與深度學習作為學習方式的概念相融合,以解析深度學習可達到的高階學習目標(彭紅超,2019)。如美國研究院(National Research Council, 2013)將深度學習結果劃分為認知領域、人際領域和個人領域,包含掌握核心學科知識、批判性思維和復雜問題解決能力、團隊協(xié)作、有效溝通、學會學習、學習毅力六個核心競爭力。
事實上,以上兩種深度學習的界定方式并不矛盾。大量研究表明,學生采用的學習方式與學習結果相互關聯(lián),深度學習往往與高質量的學習結果有關(Uiboleht et al., 2018; Gerritsen-van Leeuwenkamp et al., 2019)。因此,本研究的深度學習既包括學習過程中采用的學習方式,也包括學習結果。
研究者研制了很多經(jīng)濟有效、廣泛使用的測量工具。常用的有學習過程問卷(Study Process Questionnaire, SPQ)(Biggs, 1978)、認知過程問卷(Learning Process Questionnaire, LPQ)(Biggs, 1991)、認知過程量表(Inventory of Learning Process, ILP)(Schmeck et al., 1977)、學習方式量表(the Approaches to Studying Inventory, ASI)(Entwistle et al., 1979)、認知與學習方式量表(Approaches to Learning and Studying Inventory, ALSI)(Entwistle & McCune, 2004)、學習方式與技能量表(Approaches and Study Skills Inventory for Students, ASSIST)(Entwistle et al., 2000),以及在SPQ和LPQ基礎上修訂而成的雙因素學習過程問卷(a revised two-factor version of the Study Process Questionnaire, R-SPQ-2F)(Biggs et al., 2001)和雙因素認知過程問卷(a revised two-factor version of the Learning Process Questionnaire, R-LPQ-2F)(Kember et al., 2004)。作為學習結果的深度學習主要采用比格斯的SOLO分類層級框架進行測量。該框架將人的認知發(fā)展水平分為前結構、單一結構、多元結構、關聯(lián)結構和抽象拓展結構,后兩種結構對應深度學習(張浩等,2012)。國內(nèi)外研究者使用上述測量工具進行了大量的跨學科和跨文化比較研究,驗證其結構和維度的可靠性與有效性。本研究將其統(tǒng)稱為標準化測量。此外,還有其他的測量方式,如眼動追蹤(劉哲雨等,2019;She & Chen, 2009)、概念圖法(Hay, 2007)、面對面訪談(Chin & Brown, 2000;Higgins et al., 2002;Mitra et al., 2010)等,本研究將其統(tǒng)稱為自編測量。
教學干預作為一個約定俗成的概念,泛指一切對學習者學習產(chǎn)生影響的介入手段(李彤彤等,2016)。已有研究證實,學生是否進行深度學習,既受個體因素的影響,也受教學因素的影響。通過改變教學環(huán)境,不斷強化有效的教學干預,有可能促進學生深度學習(Parpala et al., 2010;Wierstra, 2003)。基于深度學習可教的信念,研究者將深度學習培養(yǎng)目標整合到教學中,在真實情境中探索有效的教學干預。如以學生為中心的教學法是應用最廣泛的深度學習教學策略之一,包括問題教學(Selcuk, 2010;Reid et al., 2005; Mok et al., 2009; Karagiannopoulou et al., 2014)、案例教學(Ellis et al., 2005; Baeten et al., 2013)、項目教學(Du et al., 2019)、合作教學(Beccaria et al., 2014; Hall et al., 2004)、體驗教學(Abraham et al., 2006)、翻轉課堂教學(Jeong et al., 2019)。教學評價作為教學過程的重要環(huán)節(jié),也是研究者關注較多的干預措施,包括學習成果檔案(Baeten et al., 2008)、反思性評價(Nieminen et al., 2019)、績效評價(Gijbels et al., 2008;Gijbels & Dochy, 2006;Gikandi et al., 2011)。教學過程中提供及時有效的學習工具,包括情境工具(Sung et al., 2018)、認知工具(Cai et al., 2019;Jones et al., 2014)、交流共享工具(Fong et al., 2017),有助于創(chuàng)設情景化的問題空間,支持學生的知識建構和社會交互。類似的教學干預還有真實性學習任務(劉哲雨等,2018; English et al., 2004)和教學反饋(Leenknecht et al., 2019; Filius et al., 2019)等。
根據(jù)作者報告的名稱,本研究將深度學習的教學干預分為教學法(問題教學、項目教學、體驗教學、案例教學、合作教學、翻轉課堂教學)、教學評價(反思性評價、學習成果檔案、績效評價)、學習工具(認知工具、情境工具、交流共享工具)、教學反饋(同伴反饋、教師反饋)和真實性學習任務。此外,隨著信息技術的快速發(fā)展,研究者也開始關注基于技術的教學干預,為此本研究還將教學干預分為有技術支持型和無技術支持型。
目前,國內(nèi)外研究者針對教學干預對學生深度學習的影響開展了大量實驗與準實驗研究,但認識尚未達成一致。有研究者發(fā)現(xiàn)教學干預對學生深度學習有顯著的正向作用。比如,蓋茨等(Geitz et al., 2016)以77名大學新生為研究對象,開展單組前后測實驗。結果表明,經(jīng)過八周的問題教學法干預后,學生的深度學習水平提高顯著。陳等(Chen et al., 2015)將績效評價應用于醫(yī)學教學,經(jīng)過一學期的實驗周期后,對實驗組(61人)和控制組(44人)的深度學習水平打分后比較發(fā)現(xiàn),采用績效評價的實驗組得分高于采用傳統(tǒng)教學評價的控制組,且兩者存在顯著差異。國內(nèi)學者姚佳佳(2020)對87名大學生進行了為期八周的實驗干預,分析同伴反饋策略對學生深度學習的影響。結果顯示,實驗干預后學生深度學習傾向提高顯著。
有研究者提出與上述研究結論完全相反的觀點,他們發(fā)現(xiàn)教學干預對學生深度學習具有顯著的負效應。尼梅寧等(Nieminen et al., 2019)將績效評價應用于數(shù)學教學中,測試采用傳統(tǒng)教學評價的控制組(152人)和采用績效評價的實驗組(149人)的深度學習得分差異。結果表明,傳統(tǒng)教學評價的效果明顯優(yōu)于績效評價。西格斯等(Segers et al., 2006)以參加國際商業(yè)戰(zhàn)略課程學習的718名大二學生為研究對象,控制組的406名學生采用傳統(tǒng)教學法,實驗組的312名學生采用問題教學。經(jīng)過一學期后,傳統(tǒng)教學組學生的深度學習水平高于問題教學組。奈豪斯等(Nijhuis et al., 2005)也有類似發(fā)現(xiàn)。其研究采用準實驗方法檢驗問題教學對學生深度學習的影響,結果表明傳統(tǒng)教學法的效果更好。
此外,還有研究者指出教學干預對學生深度學習無顯著影響。阿里和西巴伊(Ali & Sebai, 2010)選取30名護理專業(yè)大學生為研究對象,研究問題教學對學生深度學習的影響。結果顯示,實驗干預前后學生深度學習水平無顯著差異。阿爾庫利蒂等(Alquliti et al., 2019)和蓓特等(Baeten et al., 2013)也得出了類似結論。斯特魯伊文等(Struyven et al., 2006)將研究對象分為多項選擇題教學評價、學習成果檔案袋、績效評價和反思性評價四組,研究四種教學評價方式對學生深度學習的差異性影響。結果顯示,四組學生深度學習水平無顯著差異。奧古斯特-布雷迪(August-Brady, 2005)選取80名護理專業(yè)大學生,將其分為實驗組(35人)和控制組(45人),探討認知工具對學生深度學習的影響。經(jīng)過一學期后,兩組學生的深度學習得分結果顯示,實驗組的得分高于控制組,但差異未達到顯著水平。
由此可見,教學干預對學生深度學習影響的實驗研究并未得出統(tǒng)一結論。這說明,教學干預對學生深度學習影響或受多種因素的調(diào)節(jié),有著較為復雜的作用機制。因此,僅僅考察單個的實驗研究結果并不能指出教學干預對促進學生深度學習是否有效,以及哪些因素可能會影響研究效果。本研究嘗試通過元分析解答“教學干預是否有利于學生深度學習”問題存在的分歧,并探討造成差異的原因,重點回答三個問題:1)教學干預對學生深度學習有無正向影響?2)各研究的影響效應之間是否存在顯著差異?3)若存在顯著差異,哪些因素可以解釋各研究結果之間的差異?
1.文獻檢索
為保證文獻的代表性和全面性,本研究在國內(nèi)外多個數(shù)據(jù)庫檢索文獻。類型包括期刊論文、會議論文和學位論文,時間跨度為1976-2021年。其中,外文以 “approach(es) to learning” “l(fā)earning approach(es)” “deep learning” “deep-rooted learning” “deep understanding” “deep processing” “deep strategy” “deep learner” “pretest” “posttest” “control group” “experiment”為關鍵詞,從EBSCO、Web of Science、 ERIC、 Springer、 PQDD、 Google Scholar等數(shù)據(jù)庫中檢索。中文以“深層學習” “深度學習” “深層理解” “深層學習策略” “深層加工” “前測” “后測” “控制組” “實驗”為關鍵詞,從知網(wǎng)和萬方數(shù)據(jù)庫進行組合檢索。本研究還通過引文回溯進行二次檢索,確保文獻的全面覆蓋。
2.文獻納入標準
文獻納入標準為:1)主題為教學干預對學生深度學習的影響;2)類型為實驗研究或準實驗研究,包括單組前后測或雙組對照,雙組對照實驗中應設有實驗組和對照組;3)研究類型為前實驗設計或準實驗設計的需報告前測結果,參照張和斯萊文(Cheung & Slavin, 2013)標準,排除差異過大(效應量>0.5)的研究,隨機實驗可不進行前測;4)雙組對照實驗應至少由兩名老師分別對實驗組和控制組進行教學,減少教師因素帶來的影響,保證教學干預的獨立性;5)實驗過程中,不應告知學生研究的目的;6)實驗組與對照組的樣本量應相近,排除實驗組與對照組中有一組樣本量過小,且兩者差距過大的文獻;7)實驗干預周期應在1周以上,時間過短可能導致研究結果存在偏誤;8)研究必須報告完整的數(shù)據(jù)統(tǒng)計結果,包括均值、標準差、樣本量或t 值、F 值等統(tǒng)計信息,確保能夠計算出效應值;9)排除以不同形式發(fā)表的同一研究。
3.文獻篩選流程
本研究共檢索獲得671篇文獻,隨后進行了三輪篩選(見圖1):第一輪對標題進行篩選,剔除重復文獻或以不同形式發(fā)表的同一研究后,共獲得文獻651篇;第二輪對摘要進行篩選,剔除研究主題不相關或非實驗性研究后,共獲得文獻439篇;第三輪對內(nèi)容進行審讀,剔除前實驗設計或準實驗設計中前測差距過大、實驗干預周期過短、實驗組與對照組的樣本量差距過大、實驗組與對照組由同一教師任教、學生知曉研究目的或數(shù)據(jù)不完整的研究后,最終獲得62篇文獻,其中中文文獻3篇,英文文獻59篇。在滿足效應量計算獨立性前提下,若一篇文獻同時呈現(xiàn)多個獨立樣本,則分別提取,共提取出67個效應量。
圖1 文獻篩選流程
本研究以文獻的第一作者、發(fā)表年份、地區(qū)、學段、學科、樣本量、實驗類型、實驗周期、測量方式、教學干預為變量逐一編碼。1)地區(qū):以作者報告的地區(qū)名稱作為編碼;2)學段:分小學、中學和大學三個階段;3)學科:分自然科學、社會科學和人文學科三類,未報告學科或同時包含多個學科的統(tǒng)稱為其他學科;4)樣本量:大于250人的為大樣本,小于或等于250 人的為小樣本;5)實驗類型:分前實驗、準實驗和隨機實驗;6)實驗周期:分1-4周、 5-12周、12周以上;7)測量方式:將使用SPQ、LPQ、R-SPQ-2F、R-LPQ-2F、ILP、ASI、ALSI、ASSIST和SOLO分類層級框架作為測量工具的編碼為標準化測量,其余編碼為自編測量;8)教學干預:根據(jù)作者報告的教學干預名稱,分教學方法(問題教學、項目教學、合作教學、案例教學、體驗教學、翻轉課堂教學)、教學評價(反思性評價、學習成果檔案、績效評價)、學習工具(交流共享工具、情境工具、認知工具)、真實性學習任務、教學反饋(教師反饋、同伴反饋);根據(jù)教學干預中有無技術支持,分技術支持型和無技術支持型。
表一 文獻編碼信息
為保證編碼的準確性,本研究由兩位研究者進行雙重編碼,編碼的一致性系數(shù)為0.878,說明編碼結果具有較好的信度。文獻編碼信息略。
在元分析中,納入文獻的質量會影響最終結果。本研究參照瓦倫丁和庫珀(Valentine & Cooper, 2003)的文獻質量評估方法,按納入文獻是否清晰描述了干預措施、樣本特征、實驗設計、測量工具和測量過程五個方面對文獻質量打分。其中, “不清晰”為0分,“較清晰”為1分,“清晰”為2分。一篇文獻最高可獲得10分,得分越高說明文獻質量越高。為確保文獻質量評價結果的客觀性,評價過程由兩名研究者獨立進行,各文獻分值范圍為6-10 分,評分一致性為0.890(p<0.0001),說明納入文獻的質量基本滿足元分析要求。
元分析是對同一主題的多個研究結果進行再分析的方法,即運用統(tǒng)計手段綜合某一主題多項相關的實驗或準實驗研究數(shù)據(jù),通過獲得其合并效應量來研究整體效應的分析方法。相較于傳統(tǒng)的、描述性的文獻綜述,元分析能相對科學地探索研究結果存在差異的原因,有效解決研究爭議,得出綜合性的研究結論,現(xiàn)已經(jīng)成為醫(yī)學、教育學、心理學、經(jīng)濟學等多個學科領域的重要研究方法。本研究采用元分析方法,探討教學干預對學生深度學習的影響。由于學生深度學習為連續(xù)變量,納入的文獻皆為實驗或準實驗設計并比較組間或組內(nèi)差異,且總體樣本量均大于20,因此本研究選用Cohen’s d(簡稱d)作為效應量。元分析中的所有數(shù)據(jù)統(tǒng)計過程均使用軟件Comprehensive meta analysis3.0(CMA3.0)完成。
由于納入元分析的文獻在研究對象、研究設計和教學干預手段等方面各不相同,異質性在所難免。常用的異質性指標包括Q統(tǒng)計量、H統(tǒng)計量和I2統(tǒng)計量。Q統(tǒng)計量受納入文獻數(shù)量的影響, H統(tǒng)計量和I2統(tǒng)計量對Q統(tǒng)計量進行了自由度(文獻數(shù))的校正,不會隨納入研究的文獻數(shù)量變化而變化,結果更穩(wěn)定可靠。本研究的異質性檢驗主要參考I2值。根據(jù)希金斯等(Higgins et al., 2003)的標準,I2<25%表示研究存在低異質性,I2值在25%-75%之間表示研究存在中異質性,I2>75% 表示研究存在高異質性。本研究的異質性檢驗結果顯示,I2=88.247%,且達到顯著水平(p<0.0001),說明本研究選擇的文獻之間存在異質性。
異質性檢驗發(fā)現(xiàn)各初始研究間存在異質性,說明除隨機誤差外,還有其他因素導致各研究效應量之間的真實差異,故本研究選用隨機效應模型(random-effect model)分析教學干預對學生深度學習影響的效應量(見表二)。
表二 教學干預對學生深度學習影響的文獻效應量及合并效應量
各文獻的效應量分布在-0.524-2.035之間。參照哈蒂(Hattie, 2008)提出的教育相關研究的效應量標準,效應量在0.2-0.4之間屬于小效應,在0.4-0.6之間屬于中效應,大于0.6屬于大效應(楊九民等,2019)。納入文獻中,報告了大效應的有11篇,且都具有統(tǒng)計意義,其中6篇文獻的效應量大于1。效應量最大的是穆罕默德(Mahmoud, 2017)的研究,該研究采用單組前后測設計,測得合作教學對醫(yī)學生深度學習影響的效應量達2.035。報告了中效應的有7篇,其余文獻所報告的為小效應、負效應或不具統(tǒng)計意義。
前文的異質性檢驗結果表明,各文獻效應量在統(tǒng)計意義上具有顯著變異性,有必要通過調(diào)節(jié)效應檢驗分析這一變異性的來源。為深入了解教學干預對學生深度學習的影響機制,本研究將地區(qū)、學段、學科、樣本量、實驗類型、實驗周期、測量方式、教學干預措施、有無技術支持作為調(diào)節(jié)變量進行效果檢驗。結果表明,除學科、實驗類型、實驗周期、測量方式、有無技術支持外,地區(qū)、學段、樣本量、教學干預措施的不同是造成各研究效應量差異的原因。
1.教學干預對不同地區(qū)學生深度學習的影響
就地區(qū)而言(Q=58.792,p=0.000),中國臺灣、沙特阿拉伯、中國大陸、土耳其教學干預的效果比較好,效應量分別為0.937、0.803、0.785、0.766;西班牙教學干預對學生深度學習的影響為中效應(d=0.524);其余地區(qū)的效應量不具有統(tǒng)計意義(見表三)。
表三 教學干預對不同地區(qū)學生深度學習的影響
2.教學干預對不同學段學生深度學習的影響
就學段而言(Q=6.437,p=0.040),小學階段教學干預的效果最好(d=0.988),且為大效應;大學階段是一個小效應,效應量為0.259;中學階段的效應量不具有統(tǒng)計意義(見表四)。
表四 教學干預對不同學段學生深度學習的影響
3.教學干預對不同學科學生深度學習的影響
本文對舊混凝土路面共振碎石化技術進行了介紹,對路面的彎沉進行了分析,對碎石化的級配進行比較,得出了相應的結論。同時還對碎石化路面的加鋪瀝青路面的類型進行不同情況的分析,介紹了可參考的方案。舊混凝土路面共振碎石化技術是一種多面技術的綜合體,包含舊水泥混凝土破碎效果、路面的彎沉、回彈模量、地基的強度、投資的成本等眾多因素,必須依靠當?shù)氐幕A資料,全面、合理、科學地確定方案,才能豐富完善舊混凝土路面共振碎石化技術。
就學科而言(Q=7.807,p=0.167),人文學科的效應量不具有統(tǒng)計意義;自然科學和社會科學效應量雖具有統(tǒng)計意義上的顯著性,但都是小效應,分別為0.318和0.234(見表五)。
表五 教學干預對不同學科學生深度學習的影響
4.不同樣本量教學干預對學生深度學習的影響
就樣本量而言(Q=4.529,p=0.033),小樣本研究的效應量雖相較于大樣本研究而言較大,但也是小效應,為0.343;大樣本研究的效應量僅為0.080,且不具有統(tǒng)計意義(見表六)。
表六 不同樣本量教學干預對學生深度學習的影響
5.不同實驗類型教學干預對學生深度學習的影響
就實驗類型而言(Q=1.787,p=0.409),隨機試驗的效應量最大(d=0.433);前實驗和準實驗的效應量為小效應,分別為0.320和0.213(見表七)。
表七 不同實驗類型教學干預對學生深度學習的影響
6.不同實驗周期教學干預對學生深度學習的影響
就實驗周期而言(Q=3.013,p=0.222),實驗周期為1-4周和5-12周的效應量相近,分別為0.436和0.417,都是中效應;實驗周期為12周以上是小效應,效應量為0.226(見表八)。
表八 不同實驗周期教學干預對學生深度學習的影響
7.不同測量方式教學干預對學生深度學習的影響
就測量方式而言(Q=0.069,p=0.792),標準化測量的效應量為0.289,為小效應;自編測量的效應量不具有統(tǒng)計意義(見表九)。
表九 不同測量方式教學干預對學生深度學習的影響
8.不同教學干預措施對學生深度學習的影響
就教學干預措施而言(Q=32.212,p=0.004),效果最好的是同伴反饋(d=1.183),其次是項目教學(d=0.772)、情境工具(d=0.744)和案例教學(d=0.630),都是大效應;合作教學(d=0.509)在中等程度上有利于促進學生深度學習;問題教學、體驗教學、翻轉課堂教學、學習成果檔案、績效評價、反思性評價、交流共享工具、認知工具、教師反饋、真實性學習任務對學生深度學習的影響均不具有統(tǒng)計意義(見表十)。
9.有無技術支持對學生深度學習的影響
就有無技術支持而言(Q=3.597,p=0.058),有技術支持是中效應,為0.438;無技術支持的效應量為0.222,是小效應(見表十一)。
表十一 有無技術支持對學生深度學習的影響
表十 不同教學干預措施對學生深度學習的影響
發(fā)表偏倚是影響研究結果可靠性的重要因素,常用的檢驗方法是漏斗圖。若無法通過漏斗圖直觀判斷效應量是否對稱分布,可通過Egger檢驗確定。CMA3.0軟件所獲取的樣本發(fā)表偏倚檢驗漏斗圖(見圖2)顯示,研究樣本的效應量并未均勻分布在漏斗圖平均效應量的兩側,Egger檢驗的結果顯著(t=2.755,p1=0.004,p2=0.008),這表明本研究存在發(fā)表偏倚。為了最大限度地保證分析結果的穩(wěn)健性,本研究運用剪補法對效應量進行修正。修正后的合并效應量為0.436,95%的置信區(qū)間為0.315-0.557。
圖2 發(fā)表偏倚檢驗漏斗圖
為評估經(jīng)過修正的效應量是否可靠,還需要對結果進行敏感性分析。常用方法是失安全系數(shù)法(failed-safe N),通過失安全系數(shù)的計算判斷是否存在發(fā)表偏倚而逆轉元分析結論的可能性。根據(jù)羅森塔爾(Rosenthal, 1979)的觀點,失安全系數(shù)越大,元分析結果對缺失文獻的反應越不敏感。若新增研究個數(shù)小于5K+10(K為納入的文獻數(shù)量),則對所得結論要慎重對待。CMA3.0計算的Classic失安全系數(shù)N=2635(a=0.05,p<0.0001),即需要額外納入2635篇文獻,元分析的結論才能被推翻。
以上分析表明,本研究修正后的效應量在一定程度上消除了發(fā)表偏倚對元分析結果的影響,且結果較為穩(wěn)健。這說明,0.436更為接近教學干預影響學生深度學習的真實效應量。
本研究采用元分析方法,對62項教學干預對學生深度學習影響的實驗或準實驗研究進行了統(tǒng)計分析。研究發(fā)現(xiàn),修正后的合并效應量為0.436(p<0.0001),說明教學干預對學生深度學習具有中等程度的顯著正向影響。對比同類研究,本研究所得到的合并效應量明顯高于多爾曼等(Dolmans et al., 2016)的0.180。多爾曼等進行的元分析中僅納入了問題教學法等少量文獻,本研究中問題教學法對學生深度學習影響的效應量為0.121(見表十),與多爾曼等的研究結果非常相近。相較而言,本研究綜合考慮了不同教學干預對學生深度學習的影響,且進行了更嚴格的異質性分析、調(diào)節(jié)變量分析和結果的穩(wěn)定性檢驗。因此,可以認為本研究的結論更具穩(wěn)健性。
本研究還通過調(diào)節(jié)效應檢驗分析了造成各研究結果存在差異的原因。整體而言,納入的調(diào)節(jié)變量可分為兩類。一類是與研究設計本身有關的變量,包括地區(qū)、樣本量、實驗類型、實驗周期和測量方式。研究發(fā)現(xiàn),樣本所在地區(qū)不同,教學干預對學生深度學習的影響差異顯著,這可能是由于地區(qū)間文化差異引起的,因此或許可推斷文化因素會影響學生深度學習。就樣本量而言,小樣本的效應量遠高于大樣本研究,二者的效果差異達到了統(tǒng)計意義上的顯著性。雖然實驗周期的異質性分析結果不顯著,但干預時間過長(12周以上)的研究其效應量相比其他亞組要小得多。這說明,深度學習不能在長時間內(nèi)獲得大幅度提高,在短時間內(nèi)的提升效果更加明顯。此外,就實驗類型和測量方式而言,異質性分析結果不顯著。
另一類是與教學干預本身有關的變量,包括學段、學科、教學干預措施以及有無技術支持。對這類變量的分析,有助于了解什么樣的教學干預對學生深度學習的作用更為明顯。具體而言,學段的不同是造成各研究結果差異的原因,教學干預對學生深度學習的影響似乎最適合在小學實施,在大學實施教學干預的效果一般,中學階段的效應量不具統(tǒng)計意義。已有研究表明深度學習的教學效果或受學生學習經(jīng)驗(Gulikers et al., 2008)以及年齡(Chamorro-Premuzic, 2009)的影響,但這無法解釋為何深度學習教學在中學階段表現(xiàn)一般,其中機制有待揭示。就學科而言,教學干預在不同學科的影響效果不存在顯著差異,對自然科學和社會學科的影響為小效應,人文學科的效應量不具有統(tǒng)計意義。目前學界對學科與深度學習教學有效性的關系進行了大量探討。有研究者認為,相比自然科學,人文學科和社會科學似乎更有利于培養(yǎng)學生的深度學習(Kember et al., 2008),另一部分研究者提出了完全相反的觀點(Valk & Marandi, 2005)??梢?,學界關于哪一類學科更有利學生深度學習并未得出一致結論。在教學干預措施方面,本研究發(fā)現(xiàn)不同的教學干預措施在提升學生深度學習方面具有顯著差異。在教學方法中,項目教學和案例教學的效果更好,都是大效應。問題教學促進學生深度學習的效應量最小(d=0.121),這一結果與多爾曼等所得的結論(d=0.180)非常接近。在教學評價中,績效評價、學習成果檔案和反思性評價的效應量都不具有統(tǒng)計意義,表明三種評價方法對學生深度學習不具有明顯的促進作用。其中的原因可能是,這三種評價方法都需要學生主動規(guī)劃和反思自己的學習,這在一定程度上會增加學習的難度和工作量,產(chǎn)生認知負荷,不利于學生的深度學習。已有研究表明,當學生感知學業(yè)任務過重或學業(yè)壓力過大時,更傾向于淺層學習而不是深度學習(Kember, 2004)。在學習工具中,情境工具的效果最好,是個大效應。這說明在教學過程中,通過情景模擬和教育游戲等工具創(chuàng)設豐富的學習情境,能有效提升學習者的學習動機,引導學習者進行問題探究和知識建構。在教學反饋中,教師反饋對學生深度學習的影響不具有統(tǒng)計意義,而同伴反饋的提升作用非常明顯。同伴反饋表現(xiàn)為學習者之間高質量、有深度的社會交互。既有研究表明,同伴反饋不僅有利于提升教學反饋的質量(Zhu & Carless, 2018),而且是改善學習效果最有潛力的教學策略(Ajjawi & Boud, 2017)。真實性學習任務對學生深度學習的影響不具有統(tǒng)計意義,這可能與納入的文獻數(shù)量少有關。在有無技術支持方面,有技術支持是中效應,無技術支持是小效應,但兩者的差異未達到統(tǒng)計意義上的顯著性。這說明,技術介入與否對深度學習教學效果的影響不明顯。
受納入文獻信息所限,本研究無法通過調(diào)節(jié)變量判斷學生個體特征和學校特征是否會影響學生深度學習的教學效果。但已有研究指出,學生的個體特征如性別(Arteche et al., 2009)、智力水平(Chamorro-Premuzic et al., 2008)、個性(Chamorro-Premuzic et al., 2009)、初始學習方式(Fox et al., 2001),學校特征如學校類型(Richardson et al., 1999)和學校層次(陸根書等,2010)都是影響學生深度學習的重要因素。未來需要更多的循證性干預研究,分析學生個體特征、學校特征、教學干預與深度學習之間的作用機制,驗證教學干預對學生深度學習的價值。此外,未來還需重視理論與實證研究的雙向轉化與融通,在實證研究的基礎上,加強理論研究,為教師創(chuàng)設有效的教學干預提供指導。