陳志翰 邱飛岳
摘要:本文通過在線認(rèn)知游戲訓(xùn)練平臺,收集了389名小學(xué)四至六年級學(xué)生的認(rèn)知數(shù)據(jù),并結(jié)合能力差異模型對其進(jìn)行數(shù)學(xué)學(xué)習(xí)困難診斷,最后采用WEKA模型性能分析工具評價(jià)該診斷方法的準(zhǔn)確性,最終得出結(jié)論,即游戲化數(shù)學(xué)學(xué)習(xí)困難診斷方法可以較為快速準(zhǔn)確地診斷數(shù)學(xué)學(xué)習(xí)困難。針對不同年級數(shù)學(xué)學(xué)習(xí)內(nèi)容調(diào)整認(rèn)知游戲的選擇方案將有助于提高診斷準(zhǔn)確率,同時(shí)該方法也為其他學(xué)習(xí)困難診斷提供了一種新思路。
關(guān)鍵詞:數(shù)學(xué)學(xué)習(xí)困難;診斷方法;認(rèn)知游戲;WEKA
中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A 論文編號:1674-2117(2018)19-0095-04
引言
數(shù)學(xué)學(xué)習(xí)困難(以下簡稱“數(shù)學(xué)困難”)是學(xué)習(xí)困難的一個(gè)亞型,是指學(xué)生智力正常,但是數(shù)學(xué)成績明顯低于其年齡、智力水平和教育程度應(yīng)有水平的現(xiàn)象[1],其發(fā)生率約為6%~7%。[2]由于馬太效應(yīng),數(shù)學(xué)困難學(xué)生的數(shù)學(xué)成績將長期處于落后水平,嚴(yán)重影響其學(xué)習(xí)動機(jī)和學(xué)業(yè)發(fā)展[3],因此,快速準(zhǔn)確的數(shù)學(xué)困難診斷對數(shù)學(xué)困難學(xué)生的學(xué)業(yè)發(fā)展有重要意義。國內(nèi)外常用一些考察數(shù)學(xué)基本技能和與數(shù)學(xué)技能相關(guān)認(rèn)知能力的評估量表來進(jìn)行早期數(shù)學(xué)困難篩查[4],但是傳統(tǒng)的紙筆測驗(yàn)和簡單純粹的上機(jī)測試難以激發(fā)學(xué)生的動機(jī),這將導(dǎo)致測試中反映出的能力水平與其實(shí)際水平存在顯著差異[5,6],影響測試結(jié)果的準(zhǔn)確性。借助游戲在激發(fā)個(gè)體內(nèi)部動機(jī)方面的天然優(yōu)勢,研究人員開發(fā)出各種認(rèn)知游戲用于替代傳統(tǒng)的測試任務(wù)。這些游戲在維持被試較高內(nèi)部動機(jī)的同時(shí),還能準(zhǔn)確地反映被試的能力水平。[7-10]但使用這些游戲數(shù)據(jù)能否準(zhǔn)確診斷數(shù)學(xué)困難尚待探索。本文擬以廣泛應(yīng)用于臨床和教育中的能力差異模型的診斷結(jié)果為標(biāo)準(zhǔn),評價(jià)游戲化數(shù)學(xué)學(xué)習(xí)困難診斷方法在大范圍數(shù)學(xué)困難診斷中的有效性,為其他類型的學(xué)習(xí)困難診斷探索有效方法。
對象與方法
1.對象
本研究選取杭州市某小學(xué)四至六年級全體學(xué)生共389人作為實(shí)驗(yàn)對象,其中四年級學(xué)生127人(男生68人、女生59人),五年級學(xué)生105人(男生50人、女生55人),六年級學(xué)生157人(男生93人、女生64人)。被試篩選條件包括:①視力聽力正常,并可以獨(dú)立操作電腦;②可以按照主試的要求并做出相應(yīng)的反饋;③在實(shí)驗(yàn)前均已仔細(xì)了解實(shí)驗(yàn)?zāi)康暮蛯?shí)驗(yàn)過程,并簽署知情同意書;④前兩個(gè)學(xué)期無轉(zhuǎn)學(xué)情況,各項(xiàng)考試數(shù)據(jù)完整;⑤經(jīng)《瑞文標(biāo)準(zhǔn)推理測驗(yàn)》測試智力正常。
2.方法
(1)在線認(rèn)知游戲設(shè)計(jì)
研究所使用的在線認(rèn)知游戲均來自Cogdaily在線認(rèn)知訓(xùn)練平臺。該平臺目前共有17款認(rèn)知游戲,涉及工作記憶、加工速度、問題解決能力、注意力和任務(wù)切換能力等認(rèn)知能力。本研究選取了其中7個(gè)游戲,分別考察被試的心理旋轉(zhuǎn)、多任務(wù)處理能力、加工速度、任務(wù)切換能力、選擇性注意、視空間工作記憶和工作記憶容量。
在線認(rèn)知游戲在傳統(tǒng)實(shí)驗(yàn)任務(wù)的基礎(chǔ)上加入了以下游戲元素[11]:①在界面顯眼位置顯示不斷減少的游戲時(shí)間(除記憶類游戲外),造成緊迫感;②每次操作都會為被試提供反饋,即顯示被試的操作是否正確;③隨著操作正確率等指標(biāo)的變化,每次操作的獎勵分?jǐn)?shù)也在不斷變化,并將總得分實(shí)時(shí)顯示在界面的顯眼位置;④根據(jù)被試操作情況實(shí)時(shí)調(diào)整游戲難度,同時(shí)在調(diào)整難度時(shí),注意將難度提高的速度設(shè)置得比降低難度的速度慢,以利于游戲更快達(dá)到合適的難度并讓被試時(shí)刻感到挑戰(zhàn)性;⑤游戲結(jié)束后對游戲得分和排名情況進(jìn)行顯示;⑥游戲的界面和元素都有統(tǒng)一的美工風(fēng)格,不同游戲會有不同的設(shè)計(jì)主題。
該平臺部署在被試日常上課的機(jī)房中,每個(gè)被試都獨(dú)立操作一臺計(jì)算機(jī),并使用預(yù)先分配的實(shí)驗(yàn)賬號登錄平臺進(jìn)行操作。平臺將記錄下被試在游戲中的每一次操作信息,用于計(jì)算反應(yīng)時(shí)間、正確率等指標(biāo),并在游戲結(jié)束后隨游戲得分一起回傳到服務(wù)器。
(2)數(shù)學(xué)困難學(xué)生標(biāo)記
從被試所在學(xué)校的教務(wù)系統(tǒng)中收集被試近兩個(gè)學(xué)期的數(shù)學(xué)考試,每個(gè)學(xué)期有六個(gè)等級制分?jǐn)?shù)。分?jǐn)?shù)共三個(gè)等級,將這三個(gè)等級從高到低轉(zhuǎn)化為績點(diǎn),并分別取值3分、2分、1分,同時(shí)將6個(gè)成績的績點(diǎn)相加,作為被試該學(xué)期的最終數(shù)學(xué)成績,以此方法得到每個(gè)被試最近兩個(gè)學(xué)期的數(shù)學(xué)成績。另外由各班任課教師對學(xué)生數(shù)學(xué)能力進(jìn)行主觀評定,選擇近兩個(gè)學(xué)期數(shù)學(xué)成績均位于年級后25%[12,13]且同時(shí)被教師評定為數(shù)學(xué)學(xué)習(xí)困難的49名學(xué)生標(biāo)記為數(shù)學(xué)困難學(xué)生,其中男生29人、女生20人;選擇近兩個(gè)學(xué)期數(shù)學(xué)成績?nèi)珒?yōu)即兩個(gè)學(xué)期的總分均為18分的146名學(xué)生作為正常學(xué)生,其中男生79人、女生67人。
(3)在線認(rèn)知游戲數(shù)據(jù)采集與處理
①安排被試以班級為單位,進(jìn)入機(jī)房進(jìn)行游戲數(shù)據(jù)采集。采集過程由1名主試主持,同時(shí)配有3名工作人員負(fù)責(zé)解決被試可能遇到的操作性問題并維持紀(jì)律,同時(shí)進(jìn)行采集的被試不超過40人。被試使用預(yù)先分配好的賬號進(jìn)行登錄,并在主試的指導(dǎo)講解下逐一進(jìn)入各個(gè)游戲。
②從認(rèn)知訓(xùn)練平臺數(shù)據(jù)庫導(dǎo)出所有被試的游戲數(shù)據(jù)。由于在數(shù)據(jù)采集過程中發(fā)現(xiàn)存在被試第一次玩某個(gè)游戲時(shí)未正確理解游戲規(guī)則,導(dǎo)致得分異常的情況,但是經(jīng)過工作人員再次講解后得分正常,所以在考慮該年齡段學(xué)生的認(rèn)知能力和一般游戲得分范圍后,剔除低于500,即在游戲中正確判斷不到3次的得分?jǐn)?shù)據(jù)。然后選擇被試在所有游戲中的第一條數(shù)據(jù)作為其在該游戲的表現(xiàn)。
③游戲數(shù)據(jù)的標(biāo)準(zhǔn)化處理。除游戲總分外,與加工速度和注意力相關(guān)的游戲數(shù)據(jù)中還包含平均反應(yīng)時(shí)間、有效操作次數(shù)和操作準(zhǔn)確率等數(shù)據(jù),與記憶能力相關(guān)的游戲中還包含最大正確個(gè)數(shù)、完成率等信息。不同游戲數(shù)據(jù)因?yàn)橛螒蛐问胶蛿?shù)值計(jì)算方法的不同,取值區(qū)間可能有較大差異,這種差異可能導(dǎo)致預(yù)測中某些較小分?jǐn)?shù)區(qū)間的游戲數(shù)據(jù)被掩蓋。為了消除這種影響,對所有的游戲數(shù)據(jù)進(jìn)行組內(nèi)標(biāo)準(zhǔn)化處理,將所有維度的分?jǐn)?shù)都轉(zhuǎn)換到相同的區(qū)間。
以被試ID為關(guān)鍵字段,將每個(gè)被試的所有游戲數(shù)據(jù)共29個(gè)維度連同數(shù)值化處理后被試的“性別”“年齡”匯總成一條數(shù)據(jù),并按照能力差異模型的診斷結(jié)果為被試添加“數(shù)學(xué)表現(xiàn)”字段。
(4)數(shù)學(xué)困難診斷模型的建立與檢驗(yàn)
數(shù)學(xué)困難的診斷本質(zhì)上是一個(gè)分類問題,本研究使用新西蘭懷卡托大學(xué)開發(fā)的WEKA(Waikato Environment for Knowledge Analysis)作為建立模型和分析模型性能的工具。該工具可以使用已經(jīng)標(biāo)記好類別的數(shù)據(jù)集建立訓(xùn)練模型,并驗(yàn)證模型性能。將數(shù)據(jù)集導(dǎo)入WEKA后,使用SMOTE(Synthetic Minority Over-sampling Technique)過濾器[14]和LinearNNSearch最近鄰搜索算法構(gòu)建K近鄰分類器模型,選擇使用十折交叉驗(yàn)證并點(diǎn)擊開始。WEKA將自動把標(biāo)記好的數(shù)據(jù)集平均分為十份,并將每一份輪流作為測試集、剩余部分作為訓(xùn)練集對模型進(jìn)行訓(xùn)練和驗(yàn)證,重復(fù)10次,得到最優(yōu)模型并輸出分類結(jié)果。
3.結(jié)果
以能力差異模型的診斷結(jié)果為標(biāo)準(zhǔn),游戲化數(shù)學(xué)困難診斷模型的準(zhǔn)確率如下表所示。其中數(shù)學(xué)困難組真正率為0.965,表示數(shù)學(xué)困難組96.5%的學(xué)生被正確分類,精度為0.777,這表示被診斷為數(shù)學(xué)困難組的學(xué)生中77.7%確實(shí)為數(shù)學(xué)困難;數(shù)學(xué)正常組真正率為0.726,表示72.6%的正常學(xué)生被正確分類,精度為0.955,表示被診斷為數(shù)學(xué)困難組的學(xué)生中95.5%為數(shù)學(xué)正常學(xué)生。從整體來看,84.5%的學(xué)生被正確分類,接受者操作特征曲線下面積為0.910,大于0.9,表示模型診斷結(jié)果有較高的準(zhǔn)確度。
4.討論
從多元方差分析的結(jié)果可以看出,大部分認(rèn)知游戲的數(shù)據(jù)都可以很好地區(qū)分兩組學(xué)生,說明認(rèn)知游戲確實(shí)可以用于診斷數(shù)學(xué)困難,然而兩組在與工作記憶能力相關(guān)的數(shù)據(jù)上卻差異不大,這與一些研究的結(jié)果并不相符。究其原因,其一可能與實(shí)驗(yàn)中所使用的游戲的內(nèi)容有關(guān)。實(shí)驗(yàn)中采用的工作記憶容量游戲要求被試盡可能多地記住自己選擇過的圖案,而根據(jù)王恩國等人[15]的研究結(jié)果,數(shù)學(xué)困難學(xué)生的工作記憶缺陷主要在于數(shù)字工作記憶的不足,這可能導(dǎo)致數(shù)學(xué)困難學(xué)生與正常學(xué)生在與圖案相關(guān)的任務(wù)表現(xiàn)上并不會出現(xiàn)顯著差異。另外,不同的視空間工作記憶成分對不同類型的數(shù)學(xué)問題解決的影響是不同的,實(shí)驗(yàn)中的視空間工作記憶游戲要求被試記住界面中所有點(diǎn)亮的方塊,主要考察被動同時(shí)性視空間工作記憶。被動同時(shí)性視空間工作記憶是心算能力的顯著預(yù)測變量[16],而心算能力屬于較為基礎(chǔ)的數(shù)學(xué)能力,并不屬于四到六年級數(shù)學(xué)課程考查的范圍,所以在該群體的數(shù)學(xué)困難預(yù)測中作用并不大。其二可能與該被試群體的工作記憶水平有關(guān)。四到六年級的學(xué)生工作記憶能力尚屬于發(fā)展期,雖然工作記憶能力可以影響個(gè)體的數(shù)學(xué)表現(xiàn),但是在該群體中工作記憶水平的個(gè)體差異不明顯,所以并不能作為該群體數(shù)學(xué)表現(xiàn)的預(yù)測因子。故在選擇認(rèn)知游戲的種類時(shí),需要考慮到不同年級學(xué)習(xí)內(nèi)容的差異,詳細(xì)區(qū)分不同知識點(diǎn)對各認(rèn)知能力的需求。
從診斷結(jié)果來看,游戲化數(shù)學(xué)學(xué)習(xí)困難診斷方法的結(jié)果與基于能力差異模型的診斷結(jié)果相似度較高,說明游戲化的診斷方法具有較高的準(zhǔn)確性。其中幾乎所有的數(shù)學(xué)困難學(xué)生都被正確診斷出來,同時(shí)也有很小一部分的正常學(xué)生被錯(cuò)誤診斷為數(shù)學(xué)困難。這一現(xiàn)象在分類問題中時(shí)有發(fā)生,在本研究中,主要原因可能與學(xué)生成績?yōu)榈燃壷朴嘘P(guān)。等級制分?jǐn)?shù)降低了學(xué)生之間的差異性,只有成績極為落后的學(xué)生才被評為最低等級,而大部分學(xué)生成績都是優(yōu)秀,導(dǎo)致全優(yōu)的學(xué)生過多,正常組學(xué)生的數(shù)據(jù)特征不夠明顯。這一現(xiàn)象也說明本研究提出的診斷方法對于數(shù)學(xué)困難學(xué)生更為敏感,在數(shù)學(xué)困難診斷中,盡可能找到所有數(shù)學(xué)困難學(xué)生顯然也更加重要。
結(jié)語
本研究提出的游戲化數(shù)學(xué)學(xué)習(xí)困難診斷方法可以較為準(zhǔn)確地診斷數(shù)學(xué)學(xué)習(xí)困難,有望為其他類型的學(xué)習(xí)困難診斷提供一個(gè)新的方法。受限于研究樣本數(shù)量和認(rèn)知游戲種類,仍有一小部分正常學(xué)生被誤判為數(shù)學(xué)困難學(xué)生。在后續(xù)研究中仍需擴(kuò)大數(shù)據(jù)采集范圍,合理選擇游戲種類,提高診斷的準(zhǔn)確性。
參考文獻(xiàn):
[1]Geary D C. Mathematical Disabilities-Cognitive, Neuropsychological, and Genetic Components[J].Psychological Bulletin,1993(2):345-362.
[2]Geary D C, Hamson C O, Hoard M K. Numerical and arithmetical cognition: A longitudinal study of process and concept deficits in children with learning disability[J].Journal of Experimental Child Psychology,2000(3):236-263.
[3]Bull R, Espy SA K. Short-term memory, working memory, and executive functioning in preschoolers: longitudinal predictors of mathematical achievement at age 7 years[J].Developmental Neuropsychology,2008(3):205-228.
[4]王勇麗,周欣,宿淑華,等.兒童數(shù)學(xué)學(xué)習(xí)困難的診斷和評估量表[J].中華行為醫(yī)學(xué)與腦科學(xué)雜志,2014(10):949-952.
[5]Bauer L, O'Bryant S E, Lynch J K, et al. Examining the Test Of Memory Malingering Trial 1 and Word Memory Test Immediate Recognition as screening tools for insufficient effort[J].Assessment,2007(3):215-222.
[6]Courtney J C, Dinkins J P. Age related effects in children taking the computerized assessment of response bias and word memory test[J].Child Neuropsychology,2003(2):109-116.
[7]McPherson J, Burns N R. Assessing the validity of computer-game-like tests of processing speed and working memory[J]. Behavior Research Methods,2008(4):969-981.
[8]Angeles Quiroga M, Escorial S, Roman F J, et al. Can we reliably measure the general factor of intelligence (g) through commercial video games? Yes, we can! [J].Intelligence,2015(8):1-7.
[9]MF. Rosetti, MF. Gómez-Tello, Victoria G, et al. A video game for the neuropsychological screening of children[J]. Entertainment Computing,2017(5):1-9.
[10]Tenorio Delgado M, Arango Uribe P, Aparicio Alonso A, et al. TENI: A comprehensive battery for cognitive assessment based on games and technology[J].Child Neuropsychology,2016(3):276-291.
[11]Landers R. An Introduction to Game-based Assessment: Frameworks for the Measurement of Knowledge, Skills, Abilities and Other Human Characteristics using Behaviors Observed within Videogames,2015.
[12]Fuchs L S, Fuchs D, Prentice K. Responsiveness to mathematical problem-solving instruction: comparing students at risk of mathematics disability with and without risk of reading disability[J].Journal of Learning Disabilities,2004(4):293-306.
[13]Zheng X, Flynn L J, Swanson H L. Experimental Intervention Studies on Word Problem Solving and Math Disabilities: A Selective Analysis of the Literature[J].Learning Disability Quarterly,2013(5):97-111.
[14]曾志強(qiáng),吳群,廖備水,等.一種基于核SMOTE的非平衡數(shù)據(jù)集分類方法[J].電子學(xué)報(bào),2009(11):2489-2495.
[15]王恩國, 劉昌, 趙國祥.數(shù)學(xué)學(xué)習(xí)困難兒童的加工速度與工作記憶[J].心理科學(xué),2008(4):856-860+847.
[16]朱曉斌,王靜麗,李曉芳.視空間工作記憶和非言語流體智力在小學(xué)生數(shù)學(xué)問題解題中的作用[J].心理科學(xué),2011(4):845-851.