王國華 聶勝欣 薛瑞鑫
[摘? ?要] 認(rèn)知負(fù)荷是在線學(xué)習(xí)及多媒體學(xué)習(xí)領(lǐng)域研究的焦點(diǎn)問題,如何科學(xué)、有效地測(cè)量學(xué)習(xí)者的認(rèn)知負(fù)荷是相關(guān)研究開展的基礎(chǔ),更是減少學(xué)習(xí)者認(rèn)知資源消耗、提升學(xué)習(xí)成效的關(guān)鍵。文章以國內(nèi)外近20年來的301篇實(shí)證研究論文為基礎(chǔ),使用客觀—因果二維四象限分類法對(duì)不同類型的認(rèn)知負(fù)荷測(cè)量方法與技術(shù)進(jìn)行分類,并對(duì)相關(guān)測(cè)量方法與技術(shù)的理論假設(shè)、優(yōu)點(diǎn)及不足進(jìn)行分類評(píng)述,并得出些許啟示。通過分析發(fā)現(xiàn),不同測(cè)量方法各有優(yōu)劣并具有互補(bǔ)性,基于認(rèn)知科學(xué)和信息科學(xué)的測(cè)量方法值得重點(diǎn)關(guān)注,深度學(xué)習(xí)技術(shù)會(huì)成為未來認(rèn)知負(fù)荷測(cè)量的關(guān)鍵技術(shù)。
[關(guān)鍵詞] 多媒體學(xué)習(xí); 在線學(xué)習(xí); 認(rèn)知負(fù)荷; 測(cè)量方法; 測(cè)量技術(shù)
[中圖分類號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡介] 王國華(1988—),男,河南濮陽人。講師,博士,主要從事在線學(xué)習(xí)及民族教育信息化研究。E-mail:wgh19892008@126.com。
一、引? ?言
在線學(xué)習(xí)具有場域開放、復(fù)雜度高、信息冗余的特點(diǎn),媒體及資源的不合理使用可能引起學(xué)習(xí)者的混亂和認(rèn)知超載,影響學(xué)習(xí)者學(xué)業(yè)表現(xiàn)。認(rèn)知負(fù)荷是學(xué)習(xí)者在進(jìn)行信息處理與加工過程中所消耗的認(rèn)知資源[1]。認(rèn)知負(fù)荷作為多媒體學(xué)習(xí)中最為重要的認(rèn)知要素,對(duì)多媒體學(xué)習(xí)效果產(chǎn)生重要影響,如何準(zhǔn)確衡量認(rèn)知負(fù)荷是當(dāng)前研究迫切需要解決的關(guān)鍵問題。
二、認(rèn)知負(fù)荷與多媒體學(xué)習(xí)
人類在學(xué)習(xí)和問題解決過程中不可避免地要消耗認(rèn)知資源,而個(gè)人單位時(shí)間內(nèi)所能處理和加工的信息元素是有限的,當(dāng)處理信息所需的認(rèn)知資源數(shù)量超過個(gè)人工作記憶資源容量時(shí)就會(huì)出現(xiàn)認(rèn)知超載現(xiàn)象。
多媒體環(huán)境下的學(xué)習(xí)涉及不同類型技術(shù)媒介的使用,不同的教學(xué)媒介、資源呈現(xiàn)方式及各類線索的應(yīng)用使得學(xué)習(xí)者的認(rèn)知負(fù)荷難以得到有效控制,因此,多媒體學(xué)習(xí)環(huán)境下的認(rèn)知負(fù)荷問題更值得研究。Mayer對(duì)多媒體學(xué)習(xí)領(lǐng)域中學(xué)習(xí)者的認(rèn)知過程進(jìn)行了探索,并總結(jié)出著名的多媒體學(xué)習(xí)理論以均衡學(xué)習(xí)者的認(rèn)知負(fù)荷水平。多媒體學(xué)習(xí)理論的基礎(chǔ)是雙編碼理論假設(shè)和雙通道理論假設(shè)。多媒體學(xué)習(xí)的生成理論將這兩個(gè)假設(shè)與生成學(xué)習(xí)方法相結(jié)合,指出學(xué)習(xí)者從學(xué)習(xí)材料中主動(dòng)選擇相關(guān)的視覺和語言信息,并通過在視覺和語言工作記憶之間建立聯(lián)系,分別將其存儲(chǔ)在視覺和語言工作記憶中,通過分配認(rèn)知資源和工作記憶容量建立參照鏈接,整合心理表征和先驗(yàn)知識(shí),當(dāng)學(xué)習(xí)者接收到的信息數(shù)量超出工作記憶容量時(shí)就會(huì)產(chǎn)生認(rèn)知負(fù)荷效應(yīng)[2]。
當(dāng)前,多媒體學(xué)習(xí)領(lǐng)域使用的認(rèn)知負(fù)荷測(cè)量方法包括主觀測(cè)量法、行為分析法、雙任務(wù)分析法、績效分析法、眼動(dòng)追蹤法以及生理測(cè)量法等。多種方法的應(yīng)用為認(rèn)知負(fù)荷測(cè)量的客觀性、準(zhǔn)確性提供了可能。本研究通過文獻(xiàn)分析的方法,梳理多媒體學(xué)習(xí)領(lǐng)域中使用的認(rèn)知負(fù)荷測(cè)量方法及相關(guān)指標(biāo),分析各類方法的優(yōu)點(diǎn)及不足,以期為后續(xù)研究提供借鑒。
三、研究設(shè)計(jì)
(一)數(shù)據(jù)來源
本研究所選用的數(shù)據(jù)來自Web of? Science、Education Resources Information Center(ERIC)、EBSCO以及國內(nèi)的CNKI等數(shù)據(jù)庫。將數(shù)據(jù)的時(shí)間檢索跨度設(shè)定為2001年1月1日至2021年9月10日。使用關(guān)鍵詞“多媒體”+“認(rèn)知負(fù)荷”、“多媒體學(xué)習(xí)”+“認(rèn)知負(fù)荷”、“Multimedia learning”+“Cognitive load”、“Multimedia”+“Cognitive load”進(jìn)行檢索。文獻(xiàn)來源篩選標(biāo)準(zhǔn)為:SSCI索引、SCI索引、SCIE索引、EI索引、CSSCI索引。內(nèi)容篩選標(biāo)準(zhǔn)為:涉及多媒體學(xué)習(xí)中的認(rèn)知負(fù)荷測(cè)量、正式刊發(fā)的量化學(xué)術(shù)論文或會(huì)議論文。通過篩選得到有效文獻(xiàn)301篇。
(二)分類框架
當(dāng)前測(cè)量認(rèn)知負(fù)荷的方法和工具眾多,因此,我們需要建立一個(gè)分析框架對(duì)認(rèn)知負(fù)荷測(cè)量方法進(jìn)行類屬的劃分,以便研究者能更加清晰地了解不同方法的特征。目前常用的認(rèn)知負(fù)荷評(píng)估方法可以從兩個(gè)維度進(jìn)行劃分,即主客觀性和因果關(guān)系。從測(cè)量方法的主客觀性上來看,可以分為主觀測(cè)量法和客觀測(cè)量法;從測(cè)量方法的因果關(guān)系上來看,可以分為直接測(cè)量法和間接測(cè)量法。上述兩種分類方法都屬于二分類法,雖然分類形式簡單明了,但卻無法從其他維度更進(jìn)一步分析每種方法的優(yōu)劣。而將兩種方法結(jié)合起來,使用主客觀性和因果關(guān)系兩個(gè)維度建立四象限分類方法,有助于我們更加清楚地對(duì)認(rèn)知負(fù)荷測(cè)量方法進(jìn)行分類描述。本研究將在文獻(xiàn)梳理的基礎(chǔ)上,對(duì)各項(xiàng)文獻(xiàn)中所出現(xiàn)的認(rèn)知負(fù)荷測(cè)量方法及工具進(jìn)行歸類劃分,分類框架如圖1所示。
(三)分析指標(biāo)
在對(duì)多媒體學(xué)習(xí)環(huán)境中認(rèn)知負(fù)荷測(cè)量方法及內(nèi)容進(jìn)行分類、總結(jié)與梳理的基礎(chǔ)上,從哪些方面分析認(rèn)知負(fù)荷測(cè)量的有效性和適切性,是需要關(guān)注的重要問題。Eggemeier提出了判斷認(rèn)知負(fù)荷測(cè)量方法恰當(dāng)性和有效性的準(zhǔn)則。具體而言,包括以下七個(gè)指標(biāo):靈敏度、診斷性、干擾性、效度、信度、便利性、測(cè)量對(duì)象接受度[3]。
四、研究結(jié)果
(一)直接—主觀類測(cè)量方法
主觀測(cè)量是認(rèn)知負(fù)荷研究中最常用的評(píng)估方法,一般使用“你認(rèn)為學(xué)習(xí)材料的難度如何?”的方式進(jìn)行提問與測(cè)量。主觀測(cè)量法的應(yīng)用基于這樣的假設(shè),即個(gè)人可以評(píng)估自己的認(rèn)知過程,對(duì)自身在完成任務(wù)過程中所消耗的認(rèn)知資源進(jìn)行自主評(píng)級(jí)[4]。在直接—主觀類測(cè)量方法中,使用單一維度量表讓學(xué)習(xí)者陳述學(xué)習(xí)材料困難度或負(fù)荷水平的可接受程度。常用的測(cè)量工具包括CH量表(Cooper-Harper Scale)和OW量表(Overall Workload Scale)。CH量表自1969年開發(fā)之后,一直用于測(cè)量人們的腦力負(fù)荷,研究者將其遷移到認(rèn)知負(fù)荷測(cè)量中,發(fā)現(xiàn)該量表也具有較高的信度及效度。CH量表將學(xué)習(xí)者操作性水平等級(jí)分為10級(jí),并具有對(duì)應(yīng)的定義解釋,等級(jí)越高所帶來的認(rèn)知負(fù)荷量越高[5]。OW量表在使用過程中,讓使用者根據(jù)學(xué)習(xí)過程中的整體負(fù)荷量進(jìn)行主觀評(píng)分,分值越高表明認(rèn)知負(fù)荷量越高[6]。
直接—主觀類測(cè)量方法使用單一維度的測(cè)量量表進(jìn)行學(xué)習(xí)者認(rèn)知負(fù)荷測(cè)量,這種方法具有較高的敏感性且易于使用,在使用過程中不具有侵入性,容易被測(cè)量對(duì)象所接受[7]。但是,由于這種評(píng)分方法主觀性過強(qiáng),并且沒有解釋性因素闡釋認(rèn)知負(fù)荷水平變化的原因,所以這種測(cè)量方法的弊端也是顯而易見的。學(xué)習(xí)者認(rèn)知負(fù)荷水平差異也可能是由任務(wù)難度、學(xué)習(xí)者的個(gè)人能力水平或不同的注意過程引起的。另外,自主評(píng)分通常是在學(xué)習(xí)活動(dòng)之后進(jìn)行的,因此,主觀測(cè)試等級(jí)量表不能提供學(xué)習(xí)過程中認(rèn)知負(fù)荷變化的連續(xù)信息。一維量表只能用來測(cè)量學(xué)習(xí)者認(rèn)知負(fù)荷的水平,而無法對(duì)相關(guān)數(shù)據(jù)作出解釋,適用場景較窄,因此,在多媒體學(xué)習(xí)研究中,這種方法應(yīng)用較少。
(二)直接—客觀類測(cè)量方法
直接—客觀類測(cè)量方法兼具認(rèn)知負(fù)荷測(cè)量的直接性和客觀性,是目前測(cè)量認(rèn)知負(fù)荷最為有效和精確的方法類型。其中一種直接—客觀測(cè)量認(rèn)知負(fù)荷的方法是實(shí)驗(yàn)心理學(xué)中經(jīng)常出現(xiàn)的雙任務(wù)范式。雙任務(wù)范式基于有限認(rèn)知資源的假設(shè),而這種資源可以靈活地分配給任務(wù)解決的不同方面[8]。雙任務(wù)范式是工作記憶研究中使用的重要方法,實(shí)驗(yàn)過程中被試對(duì)象需要在進(jìn)行主任務(wù)活動(dòng)的同時(shí)(如觀看視頻或閱讀文本等),完成一項(xiàng)次任務(wù)(如分辨音頻、打拍子、分辨圖片等)。次任務(wù)的效果與空閑的工作記憶容量直接相關(guān),空閑容量本身取決于主要任務(wù)所需的容量[9]。所以,為了使次任務(wù)成為一個(gè)具有敏感性的衡量指標(biāo),它需要與主要任務(wù)分配相同的認(rèn)知資源,否則次任務(wù)與主任務(wù)將不具有關(guān)聯(lián)性。此外,次任務(wù)必須要簡單可行,以免抑制同步學(xué)習(xí)過程。正如認(rèn)知負(fù)荷理論所認(rèn)為的,如果特定學(xué)習(xí)材料引起的額外負(fù)荷量取決于該材料的教學(xué)設(shè)計(jì),那么同一內(nèi)容的不同設(shè)計(jì)變量會(huì)導(dǎo)致次要任務(wù)的不同表現(xiàn)[10]。但是,雙任務(wù)實(shí)驗(yàn)范式需要研究者具有扎實(shí)的實(shí)驗(yàn)心理學(xué)基礎(chǔ),對(duì)實(shí)驗(yàn)程序及試驗(yàn)場地要求較高。并且,在研究過程中,次任務(wù)會(huì)施加額外的認(rèn)知負(fù)荷干擾主要任務(wù),雙任務(wù)范式由于較高的學(xué)習(xí)活動(dòng)侵入性受到批評(píng)。
使用腦成像技術(shù)觀測(cè)任務(wù)執(zhí)行過程中大腦影像的變化是具有廣闊前景的認(rèn)知負(fù)荷測(cè)量方法。腦成像技術(shù)測(cè)量認(rèn)知負(fù)荷的理論假設(shè)是“大腦不同區(qū)域負(fù)責(zé)不同的工作記憶功能,學(xué)習(xí)任務(wù)執(zhí)行過程中額外的認(rèn)知負(fù)荷會(huì)導(dǎo)致大腦的某些區(qū)域發(fā)生改變”[11]。多媒體學(xué)習(xí)中使用的腦成像技術(shù)一般包括功能性磁共振成像(fMRI)和功能性近紅外光譜技術(shù)(fNIRS)。功能性磁共振成像(fMRI)通過對(duì)不同認(rèn)知狀態(tài)下大腦活動(dòng)區(qū)域的活躍程度及變化的觀測(cè),建立參數(shù)化程序與認(rèn)知負(fù)荷之間的關(guān)聯(lián)性。O'Hare等人對(duì)高、中、低3個(gè)層次認(rèn)知負(fù)荷進(jìn)行了研究,發(fā)現(xiàn)額葉、頂葉和小腦區(qū)域具有顯著性的變化[12]。Cabeza等人的研究發(fā)現(xiàn),前額皮質(zhì)區(qū)域的布羅德曼(Brodmann)6區(qū)、9區(qū)、44區(qū)和46區(qū)也會(huì)隨著執(zhí)行學(xué)習(xí)任務(wù)的差異而變化[13]。fMRI在識(shí)別認(rèn)知負(fù)荷的準(zhǔn)確率方面具有無與倫比的優(yōu)勢(shì),但是其昂貴的價(jià)格及較大的體積在使用中帶來了諸多不便,使得fMRI無法得到廣泛應(yīng)用。功能性近紅外光譜技術(shù)(fNIRS)是一種非侵入性神經(jīng)影像技術(shù),它基于近紅外光譜(700納米~900納米)中吸收光的變化來測(cè)量大腦的血液動(dòng)力學(xué)反應(yīng)[14]。fNIRS作為一種腦活動(dòng)成像技術(shù),具有實(shí)時(shí)性特征,可以在學(xué)生學(xué)習(xí)過程中不間斷收集其大腦血液動(dòng)力學(xué)數(shù)據(jù),實(shí)現(xiàn)認(rèn)知負(fù)荷的全域檢測(cè)。例如,Yazidi等人基于N-back實(shí)驗(yàn)范式成功地誘發(fā)了學(xué)習(xí)者的不同層次的認(rèn)知負(fù)荷狀態(tài),通過fNIRS技術(shù)對(duì)學(xué)習(xí)者腦部血氧狀態(tài)的測(cè)量,發(fā)現(xiàn)使用額葉皮層中的六個(gè)通道獲得了86.20%的識(shí)別率,位于額葉區(qū)域的AFpz通道獲得了86.34%的識(shí)別率[15]。盡管fMRI研究在臨床上被認(rèn)為可以準(zhǔn)確識(shí)別大腦生理活動(dòng),但設(shè)備的固有成本、缺乏便攜性和低時(shí)效分辨率限制了可實(shí)驗(yàn)對(duì)象的數(shù)量和類型,相比之下,fNIRS提供了一種可靠的替代方法來收集學(xué)習(xí)者血液動(dòng)力學(xué)數(shù)據(jù),其時(shí)間分辨率可以達(dá)到fMRI的10倍。fNIRS技術(shù)成為認(rèn)知負(fù)荷測(cè)量中頗具潛力的測(cè)量技術(shù)。
直接—客觀類測(cè)量方法在有效識(shí)別認(rèn)知負(fù)荷過程中體現(xiàn)出了無與倫比的識(shí)別靈敏度,并且這種認(rèn)知負(fù)荷識(shí)別發(fā)生在學(xué)習(xí)者執(zhí)行學(xué)習(xí)任務(wù)的過程中,避免了主觀測(cè)量方法自我報(bào)告的滯后性,使得認(rèn)知負(fù)荷的識(shí)別更加精確。但是,直接—客觀類測(cè)量方法最大的問題在于其測(cè)量過程的侵入性過于明顯,無論是腦成像技術(shù)還是雙任務(wù)范式都會(huì)對(duì)學(xué)習(xí)者的學(xué)習(xí)任務(wù)產(chǎn)生影響。因此,這種測(cè)量方法只能適用于專業(yè)的心理研究實(shí)驗(yàn)室或腦科學(xué)研究實(shí)驗(yàn)室中的場景,認(rèn)知科學(xué)及腦科學(xué)研究者對(duì)這類方法情有獨(dú)鐘,測(cè)量方法的易用性、可接受性等都不具有優(yōu)勢(shì),適用范圍較窄。
(三)間接—主觀類測(cè)量方法
間接—主觀類測(cè)量方法是屬于主觀測(cè)量法的一種,其假設(shè)前提是學(xué)習(xí)者的認(rèn)知資源消耗與任務(wù)難度、心理努力、時(shí)間壓力等要素具有緊密關(guān)聯(lián)性[16]。與直接—主觀類測(cè)量方法中使用的單一維度量表不同,間接—主觀類測(cè)量方法使用多維量表測(cè)量學(xué)習(xí)者的認(rèn)知負(fù)荷水平,除了使用任務(wù)難度評(píng)級(jí)直接測(cè)評(píng)之外,還通過心理努力、投入、時(shí)間壓力等要素從側(cè)面衡量學(xué)習(xí)者認(rèn)知負(fù)荷水平。
Paas自我評(píng)定多維量表是多媒體學(xué)習(xí)中認(rèn)知負(fù)荷測(cè)量使用頻率最高的工具,該量表包括任務(wù)難度和心理努力兩個(gè)方面,任務(wù)難度直接表示學(xué)習(xí)者認(rèn)知負(fù)荷量,心理努力則從側(cè)面間接表示學(xué)習(xí)者認(rèn)知負(fù)荷量[17]。Paas量表因其簡單易操作且具有較高的信效度而成為最受歡迎的認(rèn)知負(fù)荷多維測(cè)量量表。
NASA-TLX(National Aeronautics and Space Administration-Task Load Index)自我評(píng)定量表是由美國國家宇航局開發(fā)用于測(cè)量宇航員腦力負(fù)荷量的多維量表工具,該量表包括績效水平、努力程度、時(shí)間需求、心理需求、體力需求、受挫程度6個(gè)維度,每個(gè)維度分為20個(gè)等級(jí),依據(jù)權(quán)重系數(shù)可計(jì)算出學(xué)習(xí)者認(rèn)知負(fù)荷水平[3]。NASA-TLX量表因其簡便易用、測(cè)量的敏感性以及結(jié)果的可解釋性受到多媒體學(xué)習(xí)研究者的青睞,應(yīng)用范圍較廣。
WP(the Workload Profile Index Ratings)自我評(píng)定量表以負(fù)荷多重資源模型為基礎(chǔ),涉及中樞處理、響應(yīng)、空間編碼、語言、視覺、聽覺、操作輸出、語言輸出8種認(rèn)知資源,完成學(xué)習(xí)任務(wù)后學(xué)習(xí)者分別對(duì)上述8種認(rèn)知資源占用量進(jìn)行賦值評(píng)分[18]。WP量表使用方法簡單,沒有使用場景的限制,并且在認(rèn)知負(fù)荷測(cè)量過程中具有較好的抗干擾性及敏感性,在多媒體學(xué)習(xí)研究中使用較為廣泛。
間接—主觀類測(cè)量方法在使用過程中具有簡便性、易用性、非侵入性、易于被接受等優(yōu)勢(shì)。相較于直接—主觀類測(cè)量方法而言,間接—主觀類測(cè)量方法所使用的測(cè)量工具包含了更多的內(nèi)容信息,除了可以對(duì)認(rèn)知負(fù)荷進(jìn)行直接測(cè)量,相關(guān)要素也可以對(duì)認(rèn)知負(fù)荷變化的原因作出解釋。另外,間接—主觀類測(cè)量方法可以進(jìn)行差異化任務(wù)類型之間認(rèn)知負(fù)荷測(cè)量結(jié)果的對(duì)比,并且對(duì)不同等級(jí)認(rèn)知負(fù)荷的變化比較敏感。針對(duì)特定維度的等級(jí)量表可以顯著區(qū)分不同類型的認(rèn)知負(fù)荷,這也是其他類型測(cè)量方法所不具備的優(yōu)勢(shì)。但是,此類方法最大的問題在于其主觀性太強(qiáng),評(píng)級(jí)尺度因客觀程度、有效性和可靠性的問題而受到批評(píng)[19]。學(xué)習(xí)者在自評(píng)過程中,不可避免地會(huì)出現(xiàn)所有自陳式量表的通病——“社會(huì)贊許效應(yīng)”,進(jìn)而影響結(jié)論的可靠性。雖然,間接—主觀類測(cè)量方法中使用的自陳式量表具有一定的局限性,但是這種方法仍然是當(dāng)前使用最為廣泛、較為可靠的認(rèn)知負(fù)荷測(cè)量方法,幾乎適用于所有研究場景,具有極強(qiáng)的適用范圍。
(四)間接—客觀類測(cè)量方法
行為測(cè)量法是指通過分析學(xué)習(xí)者行為特征而測(cè)量其認(rèn)知負(fù)荷的方法,行為測(cè)量法的前提假設(shè)是“不同學(xué)習(xí)任務(wù)或?qū)W習(xí)材料與個(gè)人行為具有關(guān)聯(lián)性,隨著任務(wù)難度等級(jí)的發(fā)展,學(xué)習(xí)者特征發(fā)生顯著變化”[20]。在線學(xué)習(xí)環(huán)境中一般使用鼠標(biāo)軌跡及點(diǎn)擊行為來衡量學(xué)習(xí)者認(rèn)知負(fù)荷水平。例如,有些研究者提出了一種基于鼠標(biāo)動(dòng)力學(xué)技術(shù)的測(cè)量方法,通過研究發(fā)現(xiàn)學(xué)習(xí)者在高認(rèn)知負(fù)荷下表現(xiàn)出更長的任務(wù)持續(xù)時(shí)間、更長的鼠標(biāo)移動(dòng)、更多的方向變化和較慢點(diǎn)擊的速度[21]。數(shù)字化環(huán)境下的書寫特征也可以作為測(cè)量學(xué)習(xí)者認(rèn)知負(fù)荷的要素, Luria等人使用數(shù)字化手寫板研究了學(xué)習(xí)者在不同認(rèn)知負(fù)荷水平中進(jìn)行書寫的特征,發(fā)現(xiàn)書寫的時(shí)間(書寫速度)、空隙(筆在空氣中停留時(shí)間)和角速度可以作為測(cè)量認(rèn)知負(fù)荷的有效指標(biāo)[22]。認(rèn)知行為測(cè)量通過隱性的行為記錄工具及方法,收集相關(guān)數(shù)據(jù)信息進(jìn)而實(shí)現(xiàn)對(duì)學(xué)習(xí)者認(rèn)知負(fù)荷的測(cè)量,具有較強(qiáng)的客觀性、隱蔽性、可接受性以及低侵入性。但是,行為分析法因存在較為復(fù)雜的技術(shù)難度和單一行為分析準(zhǔn)確度較低等問題而未被廣泛使用。
眼睛注視反映了注意力的過程,眼動(dòng)追蹤技術(shù)為多媒體學(xué)習(xí)環(huán)境下認(rèn)知狀態(tài)研究提供了有效方法[23]。眼動(dòng)追蹤技術(shù)應(yīng)用于認(rèn)知負(fù)荷測(cè)量的前提假設(shè)是“不同難度等級(jí)的學(xué)習(xí)材料或任務(wù)必然使學(xué)習(xí)者的眼動(dòng)軌跡及凝視時(shí)間發(fā)生改變”[24]。多媒體學(xué)習(xí)領(lǐng)域一般通過注視、掃視來測(cè)量認(rèn)知狀態(tài)。Liu等人認(rèn)為,可以從時(shí)間、空間和計(jì)數(shù)刻度3個(gè)尺度指標(biāo)來衡量學(xué)習(xí)者的認(rèn)知狀態(tài)[25]。除了上述常用指標(biāo)之外,Krzysztof等人通過研究發(fā)現(xiàn),瞳孔直徑和微眼跳幅度的試驗(yàn)間變化似乎可以充分區(qū)分不同層次的認(rèn)知負(fù)荷[26]。Kontogiorgos發(fā)現(xiàn),學(xué)習(xí)者的瞳孔直徑會(huì)隨著任務(wù)類型的難度改變而變化[27]。眼動(dòng)追蹤法以其易用性、敏感性及客觀性受到眾多研究者的青睞,成為生理測(cè)量中應(yīng)用最為廣泛的技術(shù)類型,使用眼動(dòng)追蹤法來測(cè)量多媒體學(xué)習(xí)者的認(rèn)知負(fù)荷得到了較為廣泛的應(yīng)用。
心電測(cè)量法測(cè)量學(xué)習(xí)者認(rèn)知負(fù)荷的理論假設(shè)是心臟狀態(tài)會(huì)隨著人認(rèn)知狀態(tài)的變化而發(fā)生改變,使用心電信號(hào)可以表征這種變化。心電測(cè)量一般使用心臟周期、心率及心率變異性作為衡量認(rèn)知負(fù)荷變化的尺度。從具體的分析指標(biāo)而言,每個(gè)尺度可分為時(shí)域指標(biāo)與頻域指標(biāo)。能夠顯著預(yù)測(cè)認(rèn)知狀態(tài)變化的時(shí)域指標(biāo)包括心率間隔的間期均值、間期標(biāo)準(zhǔn)差、間期差值均方、間期大于50ms的個(gè)數(shù)等,相關(guān)的頻域指標(biāo)包括低頻功率(0.04~0.15Hz)、高頻功率(0.15~0.4Hz)、標(biāo)準(zhǔn)化的高頻功率等[28]。心臟測(cè)量具有其他生理測(cè)量法不具備的優(yōu)勢(shì),例如:用于收集數(shù)據(jù)的設(shè)備相對(duì)便宜;設(shè)備操作相對(duì)比較簡單,無須進(jìn)行培訓(xùn);侵入性較低;能夠測(cè)量全過程數(shù)據(jù)。
使用腦電技術(shù)評(píng)估學(xué)習(xí)者認(rèn)知負(fù)荷是近些年興起的一種新型測(cè)量方法。相較于可以直接觀測(cè)腦部活動(dòng)的腦成像技術(shù)而言,腦電測(cè)量法是通過腦電波或認(rèn)知電位來間接衡量學(xué)習(xí)者認(rèn)知負(fù)荷的方法。腦電技術(shù)測(cè)量認(rèn)知負(fù)荷的假設(shè)前提是不同任務(wù)等級(jí)所對(duì)應(yīng)的腦部神經(jīng)點(diǎn)位會(huì)發(fā)生變化,這種變化是可記錄、可理解的。具體而言,腦電技術(shù)可以分為腦電圖(EEG)和事件相關(guān)電位(ERP)兩種。Castro發(fā)現(xiàn),在高工作記憶負(fù)荷條件下,使用θ波(4~7Hz)能夠顯著預(yù)測(cè)認(rèn)知負(fù)荷的發(fā)生及強(qiáng)度[29]。Ghani等人發(fā)現(xiàn),隨著認(rèn)知困難程度的增加,ERP各成分的振幅也發(fā)生變化,主要指標(biāo)包括N100、N200、P200、P300等不同ERP成分[30]。腦電測(cè)量法以其在認(rèn)知狀態(tài)評(píng)估中的可靠性、敏感性等特征受到多媒體學(xué)習(xí)研究領(lǐng)域的認(rèn)可,成為認(rèn)知測(cè)量的重要方法。
間接—客觀類測(cè)量方法具有其他測(cè)量方法所不具有的優(yōu)勢(shì),體現(xiàn)在以下幾點(diǎn):在認(rèn)知負(fù)荷測(cè)量過程中具有頗高的穩(wěn)定性;對(duì)認(rèn)知負(fù)荷水平的變化具有較高的敏感性;測(cè)量過程具有較低的侵入性,不會(huì)影響學(xué)習(xí)者的主任務(wù);抗干擾性更強(qiáng),不會(huì)因?yàn)閷W(xué)習(xí)者個(gè)人內(nèi)部特征而影響測(cè)量的可信度。但是,這種方法的劣勢(shì)也是顯而易見的:測(cè)量方法、程序以及技術(shù)工具需要研究者具有較高的操作基礎(chǔ);對(duì)測(cè)量的環(huán)境要求較高,必須在特定實(shí)驗(yàn)室完成;被實(shí)驗(yàn)對(duì)象接受度稍低。從適用場景來看,小型化的儀器設(shè)備推動(dòng)科學(xué)研究逐漸走出實(shí)驗(yàn)室進(jìn)入真實(shí)課堂,使得這種方法類型適用于多種研究場景。而從研究群體來看,認(rèn)知科學(xué)、信息科學(xué)及教育科學(xué)研究者都在關(guān)注間接—客觀類測(cè)量方法的使用,該類型方法應(yīng)用廣泛度會(huì)越來越高。
(五)綜合測(cè)量方法
綜合測(cè)量方法與其他測(cè)量方法有所不同,該方法并沒有明確的技術(shù)路線與評(píng)測(cè)指標(biāo),是屬于疊加性的測(cè)量方式,即將不同測(cè)量技術(shù)疊加使用以實(shí)現(xiàn)認(rèn)知狀態(tài)評(píng)估的多維校準(zhǔn),從而提升認(rèn)知負(fù)荷測(cè)量的可靠性和準(zhǔn)確性。事實(shí)上,使用綜合測(cè)量方法來測(cè)量多媒體學(xué)習(xí)中的認(rèn)知負(fù)荷現(xiàn)象已經(jīng)較為普遍,并且綜合測(cè)量方法對(duì)認(rèn)知負(fù)荷測(cè)量的精確度已經(jīng)超越單一測(cè)量技術(shù)的精確度,例如在認(rèn)知負(fù)荷測(cè)量中同時(shí)使用兩種或兩種以上的主觀量表能得到更加準(zhǔn)確的結(jié)果。李金波在對(duì)人機(jī)交互過程中的認(rèn)知負(fù)荷進(jìn)行研究中發(fā)現(xiàn),將Paas量表與眼動(dòng)追蹤技術(shù)相結(jié)合,使用機(jī)器學(xué)習(xí)算法對(duì)認(rèn)知負(fù)荷的識(shí)別率達(dá)到78%[31]。Wang等人通過對(duì)心率變異性(HRV)和脈搏率變異性(PRV)數(shù)據(jù)特征的提取與融合,發(fā)現(xiàn)這種方法能夠?qū)崿F(xiàn)高負(fù)荷狀態(tài)的準(zhǔn)確識(shí)別[32]。
綜合測(cè)量法的優(yōu)勢(shì)在于綜合了不同測(cè)量技術(shù)的特點(diǎn),可以實(shí)現(xiàn)認(rèn)知負(fù)荷測(cè)量的可靠性與準(zhǔn)確性。但是這種方法的弊端也是顯而易見的,操作程序與技術(shù)要求過高,尤其是涉及不同模態(tài)數(shù)據(jù)的測(cè)量需要進(jìn)行多模態(tài)數(shù)據(jù)的融合與計(jì)算,這就涉及深度學(xué)習(xí)算法方面的知識(shí),教育領(lǐng)域的研究者在面對(duì)上述問題時(shí)顯得比較被動(dòng)。因此,雖然該方法在認(rèn)知負(fù)荷的識(shí)別精度及適用范圍方面都具有天然的優(yōu)勢(shì),但是,數(shù)據(jù)科學(xué)的高門檻嚴(yán)重阻礙了研究者對(duì)該方法的使用。
五、研究結(jié)論及啟示
(一)研究結(jié)論
通過文獻(xiàn)梳理,本研究總結(jié)與分析了各類型認(rèn)知負(fù)荷測(cè)量方法及技術(shù)工具的優(yōu)缺點(diǎn),表1為不同方法橫向比較的結(jié)果。
(二)研究啟示
1. 不同測(cè)量方法各有優(yōu)劣,具有互補(bǔ)性
盡管學(xué)習(xí)者自主報(bào)告的測(cè)量形式因?yàn)槿菀资艿街饔^因素的影響而受到批評(píng),但是主觀測(cè)量法依然是認(rèn)知負(fù)荷測(cè)量的基礎(chǔ)方法,在所有方法類型中占據(jù)最大比重。得益于主觀測(cè)量法使用過程中較高的便利性、可接受度以及較低的使用門檻,尤其多維量表在認(rèn)知負(fù)荷診斷性方面的天然優(yōu)勢(shì),主觀測(cè)量法仍然是眾多研究者的首選方法。Merat的研究表明,在嚴(yán)格控制變量的環(huán)境中,主觀評(píng)級(jí)法與生理測(cè)量法在識(shí)別不同層次難度任務(wù)中具有同等的敏感度[33]。并且,基于認(rèn)知及數(shù)據(jù)科學(xué)的測(cè)量技術(shù)與方法嚴(yán)重依賴各種行為及生理信息采集設(shè)備,并且在應(yīng)用過程中存在較強(qiáng)的侵入性,應(yīng)用與推廣也受到如生理測(cè)量設(shè)備使用具有較高的技術(shù)要求等諸多因素制約,使用人員需要接受充分的培訓(xùn)。此外,諸如fMRI等過于昂貴的設(shè)備,使其難以被推廣應(yīng)用。因此,主觀測(cè)量法較高的性價(jià)比使其無法被替代,各類測(cè)量方法多元共存的局面會(huì)一直存在。
2. 基于認(rèn)知科學(xué)和信息科學(xué)的測(cè)量方法值得重點(diǎn)關(guān)注
雖然認(rèn)知行為和腦科學(xué)的研究嚴(yán)重依賴標(biāo)準(zhǔn)化的試驗(yàn)場景,但是該類型方法在揭示學(xué)習(xí)者認(rèn)知機(jī)制及狀態(tài)方面具有無與倫比的優(yōu)勢(shì)。從文獻(xiàn)數(shù)量及發(fā)文時(shí)間來看,近年來呈現(xiàn)出迅猛的增長態(tài)勢(shì)。不同于主觀測(cè)量法,生理測(cè)量以客觀生理數(shù)據(jù)作為衡量認(rèn)知負(fù)荷層級(jí)的尺度,生理測(cè)量的客觀性特征使其可以避免主觀經(jīng)驗(yàn)造成的偏差。此外,生理測(cè)量方法的另一優(yōu)勢(shì)是測(cè)量的過程性及連續(xù)性,可以不間斷收集與分析學(xué)習(xí)者的生理數(shù)據(jù),實(shí)現(xiàn)認(rèn)知負(fù)荷的全域測(cè)量,更加客觀準(zhǔn)確。
從測(cè)量方法的應(yīng)用狀況來看,行為測(cè)量法并未受到研究者的青睞,這可能是由于行為測(cè)量法在認(rèn)知負(fù)荷識(shí)別中的靈敏度不足造成的。當(dāng)前的研究更多地關(guān)注實(shí)驗(yàn)環(huán)境下多媒體學(xué)習(xí)認(rèn)知負(fù)荷的測(cè)量工作,而對(duì)開放性環(huán)境下的研究略顯不足,這可能與認(rèn)知實(shí)驗(yàn)需要進(jìn)行嚴(yán)格的變量控制有關(guān)。然而,常規(guī)課堂環(huán)境以及大規(guī)模在線學(xué)習(xí)環(huán)境中的認(rèn)知負(fù)荷測(cè)量對(duì)于教學(xué)活動(dòng)的開展更具有實(shí)踐意義,并且在開放性環(huán)境中不可能使用認(rèn)知實(shí)驗(yàn)的形式對(duì)學(xué)習(xí)者的認(rèn)知負(fù)荷進(jìn)行測(cè)量。在此種情形下,通過學(xué)習(xí)者行為數(shù)據(jù)分析繼而衡量學(xué)習(xí)者認(rèn)知狀況的方法將是值得關(guān)注的研究方向。具體而言,基于行為數(shù)據(jù)分析學(xué)習(xí)者認(rèn)知負(fù)荷可分為課堂教學(xué)和在線學(xué)習(xí)兩個(gè)方向。課堂教學(xué)中的認(rèn)知負(fù)荷識(shí)別是基于計(jì)算機(jī)視覺與數(shù)據(jù)技術(shù)實(shí)現(xiàn)的行為識(shí)別,在預(yù)先建立學(xué)習(xí)者行為與認(rèn)知負(fù)荷關(guān)聯(lián)模型的基礎(chǔ)上,通過深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)學(xué)習(xí)者認(rèn)知狀態(tài)的診斷。大規(guī)模在線學(xué)習(xí)環(huán)境中的認(rèn)知負(fù)荷識(shí)別,需要在基于海量數(shù)據(jù)分析基礎(chǔ)上構(gòu)建在線學(xué)習(xí)行為與認(rèn)知負(fù)荷狀態(tài)的關(guān)聯(lián)模型,使用深度學(xué)習(xí)算法(如注意力網(wǎng)絡(luò))評(píng)估學(xué)習(xí)者的認(rèn)知狀態(tài)。開放場景下基于行為數(shù)據(jù)分析的認(rèn)知負(fù)荷測(cè)量具有必要性和緊迫性,顯然,上述兩種分析方法需要有較強(qiáng)的信息科學(xué)與認(rèn)知科學(xué)研究背景,當(dāng)前認(rèn)知負(fù)荷的測(cè)量以認(rèn)知科學(xué)理論為基礎(chǔ),相關(guān)研究者主要以認(rèn)知科學(xué)背景為主,單一學(xué)科背景不利于認(rèn)知負(fù)荷測(cè)量方法及技術(shù)的發(fā)展。
3. 深度學(xué)習(xí)技術(shù)會(huì)成為未來認(rèn)知負(fù)荷測(cè)量的關(guān)鍵技術(shù)
綜合測(cè)量方法結(jié)合了諸多測(cè)量方法的優(yōu)勢(shì),兼具主觀性與客觀性、直接性與間接性等方法的優(yōu)勢(shì),使得認(rèn)知負(fù)荷的測(cè)量工作更為精確可靠。從文獻(xiàn)研究來看,綜合測(cè)量的內(nèi)容已經(jīng)從原來的“量表結(jié)合”向“跨模態(tài)結(jié)合”發(fā)展,計(jì)算方法也從原來的“簡單疊加”向“多模態(tài)數(shù)據(jù)融合”發(fā)展,可以使研究的可靠性、精確性更上一層樓。無論是基于行為數(shù)據(jù)的認(rèn)知負(fù)荷識(shí)別與分析,還是跨模態(tài)數(shù)據(jù)的分析,都需要進(jìn)行大量的數(shù)據(jù)融合與計(jì)算,其背后的核心技術(shù)都是深度學(xué)習(xí)技術(shù)。在研究過程中可能會(huì)涉及圖像模態(tài)表情與行為識(shí)別技術(shù)、多模態(tài)數(shù)據(jù)對(duì)齊與融合技術(shù)、多模態(tài)數(shù)據(jù)分類識(shí)別技術(shù)等,具體到算法可能會(huì)涉及隨機(jī)森林、支持向量機(jī)、深度神經(jīng)網(wǎng)絡(luò)等分類模型等。未來認(rèn)知負(fù)荷測(cè)量方法縱深發(fā)展的核心在于數(shù)據(jù),而數(shù)據(jù)分析與計(jì)算的關(guān)鍵在于深度學(xué)習(xí)技術(shù),因此,深度學(xué)習(xí)技術(shù)會(huì)成為未來認(rèn)知負(fù)荷測(cè)量的關(guān)鍵技術(shù)。
[參考文獻(xiàn)]
[1] 趙立影.基于工作記憶的多媒體學(xué)習(xí)設(shè)計(jì)[J].電化教育研究,2011(8):98-102.
[2] 李晶,郁舒蘭,金冬.均衡認(rèn)知負(fù)荷的教學(xué)設(shè)計(jì)及知識(shí)呈現(xiàn)[J].電化教育研究,2018,39(3):23-28.
[3] 孫崇勇,劉電芝.認(rèn)知負(fù)荷主觀評(píng)價(jià)量表比較[J].心理科學(xué),2013,36(1):194-201.
[4] ANMARKRUD F, ANDRESEN A, BRATEN I. Cognitive load and working memory in multimedia learning: conceptual and measurement issues[J]. Educational psychologist, 2019, 54(2): 1-23.
[5] COOPER G. Cognitive load theory as an aid for instructional design[J]. Australasian journal of educational technology,1990,6(2):108-113.
[6] HILL S G, IAVECCHIA H P, BYERS J C, et al. Comparison of four subjective workload rating scales[J]. Human factors: the journal of the human factors and ergonomics society, 1992, 34(4):429-439.
[7] WANG J, ANTONENKO P, KEIL A, DAWSON K. Converging subjective and psychophysiological measures of cognitive load to study the effects of instructor-present video[J]. Mind brain and education, 2020, 14(3): 279-291.
[8] WIRZBERGER M, HERMS R, BIJARSARI S E, et al. Schema-related cognitive load influences performance, speech, and physiology in a dual-task setting: a continuous multi-measure approach[J]. Cognitive research: principles and implications,2018,46(3):1-16.
[9] MEHLER B, REIMER B, COUGHLIN J F. Sensitivity of physiological measures for detecting systematic variations in cognitive demand from a working memory task: an on-road study across three age groups[J]. Human factors, 2012, 54(3):396-412.
[10] KORBACH A, BR?譈NKEN R, PARK B. Measurement of cognitive load in multimedia learning: a comparison of different objective measures[J]. Instructional science, 2017, 45(8):515-536.
[11] 理查德·克拉克,文森特·克拉克,姜敏.從教育新行為主義到神經(jīng)科學(xué):以認(rèn)知負(fù)荷研究的起源與未來為視角[J].現(xiàn)代遠(yuǎn)程教育研究,2014(3):52-65.
[12] O'HARE E D, LU L H, HOUSTON S M, BOOKHEIMER S Y, SOWELL E R. Neurodevelopmental changes in verbal working memory load-dependency: an fMRI investigation[J]. NeuroImage, 2008, 42(4):1678-1685.
[13] CABEZA R, NYBERG L. Imaging cognition II: an empirical review of 275 PET and fMRI studies[J]. Journal of cognitive neuroscience, 2000, 12(1):1-47.
[14] KIM H Y, SEO K, JEON H J, et al. Application of functional near-infrared spectroscopy to the study of brain function in humans and animal models[J]. Molecules & cells, 2017, 40(8):523-532.
[15] YAZIDI A, PINTO-ORELLANA M A, HAMMER H, et al. Solving sensor identification problem without knowledge of the ground truth using replicator dynamics[J]. IEEE transactions on cybernetics, 2020, 52(1):16-24.
[16] LEPPINK J, PAAS F, VLEUTEN C P M V D, et al. Development of an instrument for measuring different types of cognitive load[J]. Behavior research methods, 2013, 45(4):1058-1072.
[17] PAAS F G. Training strategies for attaining transfer of problem-solving skill in statistics: a cognitive-load approach[J]. Journal of educational psychology, 1992, 84(4):429-434.
[18] TSANG P S, VELAZQUEZ V L. Diagnosticity and multidimensional subjective workload ratings[J]. Ergonomics, 1996, 39(3):358-381.
[19] BRUNKEN R, PLASS J L, LEUTNER D. Direct measurement of cognitive load in multimedia learning[J]. Educational psychologist, 2003, 38(1):53-61.
[20] GAUVAIN M. Cognitive load theory[J]. Psychology of learning & motivation, 2010, 55(4):37-76.
[21] BANHOLZER N, FEUERRIEGEL S, FLEISCH E, et al. Computer mouse movements as an indicator of work stress: longitudinal observational field study[J]. Journal of medical internet research, 2021, 23(4):1-12.
[22] LURIA G, ROSENBLUM S. A computerized multidimensional measurement of mental workload via handwriting analysis[J]. Behavior research methods, 2012, 44(2):575-586.
[23] JUST M A, CARPENTER P A. A theory of reading: from eye fixations to comprehension[J]. Psychological review,1980,87(4):329-354.
[24] GOG T V, KESTER L, NIEVELSTEIN F, et al. Uncovering cognitive processes: different techniques that can contribute to cognitive load research and instruction[J]. Computers in human behavior, 2009, 25(2):325-331.
[25] LIU H C, LAI M L, CHUANG H H. Using eye-tracking technology to investigate the redundant effect of multimedia web pages on viewers' cognitive processes[J]. Computers in human behavior, 2011, 27(6):2410-2417.
[26] KRZYSZTOF K, ANDREW T D, ANNA N, et al. Eye tracking cognitive load using pupil diameter and microsaccades with fixed gaze[J]. PLoS ONE, 2018, 13(9):1-23.
[27] KONTOGIORGOS D, J GUSTAFSON. Measuring collaboration load with pupillary responses—implications for the design of instructions in task-oriented HRI[J]. Frontiers in psychology, 2021, 12(7):1-19.
[28] 鄭玲,喬旭強(qiáng),倪濤,楊威,李以農(nóng).基于多維信息特征分析的駕駛?cè)苏J(rèn)知負(fù)荷研究[J].中國公路學(xué)報(bào),2021,34(4):240-250.
[29] CASTRO-MENESES L J, KRUGER J L, DOHERTY S. Validating theta power as an objective measure of cognitive load in educational video[J]. Educational technology research and development, 2020, 68(2):181-202.
[30] GHANI U, SIGNAL N, NIAZI I K, et al. ERP based measures of cognitive workload: a review[J]. Neuroscience & biobehavioral reviews, 2020, 118(7):18-26.
[31] 李金波.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境中影響學(xué)習(xí)者認(rèn)知負(fù)荷的因素[J].電化教育研究,2009(9):37-41.
[32] WANG C, GUO J. A data-driven framework for learners' cognitive load detection using ECG-PPG physiological feature fusion and XGBoost classification[J]. Procedia computer science, 2019, 1479(1):338-348.
[33] MERAT N, LAI F, JAMSON S L. The comparative merits of expert observation, subjective and objective data in determining the effects of in-vehicle information systems on driving performance[J]. Safety science, 2011, 49(2):172-177.