王麗彬 王華
摘要:大數據在教育領域的應用給教育帶來了重要的變革,教學資源題庫在教學中的應用為學生提供了多元化的教材,學生教學平臺上產生的學習數據改變了教學評價體系,促進了智慧型教師的發(fā)展,實現了以學生為中心的現代化教育。為本文運用大數據的數據分析技術對某數據庫題庫中三到六年級語數英三個科目的測試題目進行分析挖掘,以為教學、輔導及題庫優(yōu)化提供支持,促進教學資源平臺在教育教學過程中的合理應用,為教師對學生進行個性化教學提供支持策略。
關鍵詞:個性化教學;大數據;數據分析;教學資源題庫
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2019)04-0009-03
1 前言
隨著互聯網+和大數據產業(yè)的發(fā)展,教育領域也隨之發(fā)生著變革,大數據在教育領域的應用,改變了傳統(tǒng)的教學模式與教師角色。在傳統(tǒng)教學課程中,教師掌握著絕對的話語權,以知識權威者的姿態(tài)向學生傳遞知識,忽視學生在學習過程中的主體地位,缺乏有效的師生交互,學習過程強調學生的機械記憶與知識復述,教學信息的傳遞是單向性的,學生無法在原有經驗基礎上建構有意義的知識。大數據促進了教師角色的轉變,教師由知識的傳授者轉變?yōu)檎n堂的組織者、引導者、促進者,在教學過程中充分發(fā)揮學生的主體性地位,促進學生在學習過程中的主動性與創(chuàng)造力的發(fā)展,實現“教”和“學”的雙向溝通,并且能夠適時地對學生的學習情況進行反饋并建立有效的互動交流,完成以學習者為中心現代教學理念。
2012年Brookings Institute 研究機構的研究報告指出大數據能夠探查學生的學習和表現[1]。教育工作者通過大數據技術能深入了解學生知識盲點及難點;也能夠通過大數據技術為學生提供合理的教學計劃和課程安排。大數據對教育的改革是顛覆性的,從以往靠成績認識學生到根據全方位數據來了解學生;從停留在表面的成績到運用測驗、考后數據分析結果為學生提供更好的教學。此種基于數據分析的教育服務,將會成為教育界的必要模式。大數據系統(tǒng)平臺上的教學,能夠及時地捕捉學生產生的學習數據,通過對數據的分析、挖掘,能夠對學生的學習動態(tài)進行及時的評價與反饋,以了解學生的發(fā)展與變化,優(yōu)化學習資源庫為學生提供更加適宜學生發(fā)展水平的教學資源以促進學生的個性化發(fā)展。
2 大數據在教育領域中的應用
2.1 大數據的定義
大數據又稱巨量數據,指數據量大到人們不采用工具的前提下無法在合理的時間內對數據進行解讀。大數據擁有以下4個特點,又稱為4V,Volume,數據量巨大,數據級別在PB以上;Variety,數據的類型多種多樣,如文本文檔、XML、二進制文件等;Velocity,處理數據速度快,短時間內提取數據價值;Value,數據隱藏巨大價值,只要進行合理的運用都能帶來巨大的價值。
2.2 大數據的運用模式
大數據產業(yè)在發(fā)展的過程中,通過不斷的學習與摸索,借鑒其他產業(yè)的數據運用進而形成大數據從數據收集到得出數據的價值,最后運用數據存在的價值的運用模式。大數據技術的運用分為以下四個步驟:數據采集、數據導入/預處理、數據統(tǒng)計/分析、數據挖掘。數據采集是通過web應用、APP、網絡爬蟲等收集數據;數據導入/預處理是指運用數據處理技術對數據進行預處理并導入數據倉庫;數據統(tǒng)計/分析是指在數據倉庫里對數據做統(tǒng)計分析,初步提取數據的價值;數據挖掘是指通過數據挖掘技術,挖掘出數據里的價值。
2.3 教育大數據及應用價值
美國于1968年成立教育數據統(tǒng)計中心,全國性的成績評測體系于1969年完成,用來檢測學生的學業(yè)成績以及預測學生成績的趨勢[2];2002年美國通過的教育科學改革法中確定數據在教育領域中的決策作用[3];2012年美國教育部年發(fā)布《Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics》報告,對美國的教育大數據的發(fā)展、運用領域、案例、挑戰(zhàn)以及建議進行說明[4]。2014年我國教育部印發(fā)的《2014年教育信息化工作要點》指出要推動我國教育大數據的發(fā)展,同時教育大數據應用列入教育信息化工作中[5]。以上所述表明大數據在教育領域中具有重要作用。
當前應試教育背景下,老師主要是通過學習成績來了解學生,而對教師教學質量的評價也基于學生學習成績,教師對學生真實的學習現狀知之甚少。然而大數據分教育行業(yè)帶來改革:①實現個性化教育。大數據背景下,收集學生學習的數據變得愈加容易,運用大數據分析學生的學習數據能為學生提供個性化的教學輔導,實現精準教學,促進學生發(fā)展。②真正了解學生。全方位、長期的數據收集,為我們全方位了解學生提供數據基礎,能深入成績背后了解學生,擺脫了老師對學生僅停留在課堂和成績表面的膚淺了解。③為教育決策提供數據支持。在經濟領域,企業(yè)決策中商業(yè)智慧(Business Intelligence-BI)系統(tǒng)起著很重要的作用,商業(yè)智慧(BI)應用也是大數據應用的一種,從BI系統(tǒng)在經濟領域的作用可以看出,大數據在教育領域的決策作用是重要的,創(chuàng)造教育智慧(Education Intelligence,EI)同樣可為教育的決策提供了重要的數據支持。
2.4 國內題庫運用與發(fā)展
互聯網時代的到來推動線上教育的發(fā)展和在線測試系統(tǒng)的發(fā)展,在線測試系統(tǒng)的核心是題庫,良好的在線測試系統(tǒng)應有良好的題庫。
國內的題庫發(fā)展都是不斷的收納新題目,對舊題、老題很少投入時間去維護,最新納入的題目能測試當前學生對知識點的掌握情況,而舊題的測試實證往往和舊題定義不相稱,出現這種現象的原因是因為舊題是在納入題庫時其題目設計與當時學生能力相符,經過一段時間的測試訓練后與現有學生能力出現不相稱現象。
忽視對舊題的維護更新,長時間后就會造成學生測試與題目自身定義的部分屬性出現不相稱現象。長久下去,題庫對學生的能力測試就會出現差異性,測試就不能正確的反應學生的學習情況。一個良好的測試系統(tǒng)需要對題庫進行維護,能夠完整反映被測者的能力狀況,一個處于維護、更新的題庫就是一種活著的題庫,這也是題庫數據在未來的運用中更有發(fā)揮新的作用,使得測試數據更有價值的題庫。
3 教學資源系統(tǒng)數據庫分析研究
本研究對福建某輔導管理平臺(VOSMaP)的題庫中的題目難易度定義與題目測試后留下錯誤率的差異性研究。該平臺集測試、題庫、教學管理于一體。系統(tǒng)包含攜學測試數據、用戶信息數據、學生測試數據、題庫數據等,數據庫表39張,本文的研究主體是題目定義難易度與題目錯誤率的差異性,涉及的數據主要有題庫數據以及學生測試數據。
3.1 語數英錯題總體分析
該平臺(VOSMaP)在設計題庫時對題目的難易度、所屬知識點等信息都有明確定義。本文針對此平臺的題庫以及測試部分的數據進行數據分析并對結果進行探究。
在提取數據階段,本文運用SQL針對題庫以及學生測試數據進行清洗提取,最終數據包含了題目的難易度(易 = 1,中 = 3,難 = 5)、錯誤率及題目相關的知識點等信息,如下圖所示:
數據顯示,部分題目難易度的定義與題目對應的錯誤率存在不相稱現象。本文據此問題對數據進行了更深入的研究。在進一步數據統(tǒng)計處理后,本文的數據部分包含了1563道錯題,其中錯誤率與難易度定義不稱的有672道題目,占總題數的43%。原題目難易度定義如下:錯誤率小于45%的題目定義為簡單題;錯誤率在45%到75%之間的題目定義為中等題;錯誤率大于75%的題目定義為難題。從這里我們可以發(fā)現兩項可能的判斷,該平臺2011年中設計題庫時,存在:(1)當時出題人員對小學3-6年級科目知識點難易分級的認知,與2012-2013年小學3-6年級學生對該知識點難易分級的認知存在相當落差。(2)對2012-13年當時的3-6年級學生在知識點分類的測錯比值的非法,將?。?,1)之間(0.45,0.75)切分的三級比率與學生水平實際的切分并不十分相稱。由此分析可見,用于測知學生知識點學習效益的核心題庫,實質存在出題與測題學生的(時序)及(知識認知)的高度相稱性的問題;其現象也提示,任何題庫的完備都是一時可用,要真正符合測知問題及以個人化或群化解決知識學習問題的過程,以運用的題目,必須長期持續(xù)優(yōu)化,成為有機性且智慧高的題庫,只有(測與知)相稱的目標水平。
上圖為錯題分布的核密度圖,橫軸代表題目的錯誤率,縱軸代表題目的錯誤密度,從上到下分別是簡單題、中等題、難題的核密度圖。從圖中可以直觀地看到,容易題的錯誤率普遍在0.5以下,錯誤率在0.1左右時的密度最高,這樣的分布是比較科學的;中等題的錯誤率均勻地分布在0.7以下,在0.1是密度最高,這說明被定義為中等題的一部分題目是不相稱;難題的錯誤率主要集中在0.5至0.75,這與上文對難題錯誤率的定義不相稱,說明難題的定義也存在定義與實質的不相稱認知。針對上圖體現出來的問題,筆者對數據做了更進一步的處理,根據錯題錯誤率、知識點、難易度等信息運用R的tapply()函數得到知識點在不同難易度下的錯誤率,并運用上述提取的數據做進一步的數據分析挖掘。數據如下所示:
表中第一列表示知識點,第一行表示不同的難易度,難易度與知識點在表中的交集形成不同知識點在不同難易度下的題目錯誤率。
針對該數據集,本文運用R的kml第三方程序包根據知識點在不同難易度下的錯誤率進行聚類分析。kml分析函數繼承于k-means聚類分析算法,它針對的數據集是縱向數據。對三到六年級語數英三科進行聚類分析得出的結果如圖3所示。
根據結果可以看到,筆者運用聚類分析函數KML把所有的知識點分為了6類,其中D類、E類以及F類是題型難易定義與實測結果不相稱的知識點。分析如下:D類知識點難中易三類題目錯誤率都處于一條水平線上,不同難易度題目的錯誤率沒有明顯差異。E類知識點難題的錯誤率比中等題的錯誤率低,明顯不符合邏輯。F類知識點呈現的現象是中等題的錯誤率比簡單題的錯誤率低,這也是不符合邏輯的。圖中A、B、C三類知識點相對正常,隨著題目難易度升高,題目錯誤率也相應地升高,基本上題型難易的認知設計與實證值相稱性明較好。
3.2 優(yōu)化改進
筆者運用MySQL存儲過程與MySQL定時器功能提供了一套針對上述現象的解決方案,運用定時器定期對題目難易度根據題目錯誤率進行修改,從而達到對題庫題目難易度自動維護的效果,完整的代碼實現請閱讀附錄B。對 本研究所使用的測驗題量與實證錯誤比率值,將該對錯題難易度進行優(yōu)化后,新的不同難易度錯題分布圖如下所示。
從優(yōu)化后的核密度圖可以看出,現在簡單題錯誤主要集中在0.45以下,中等題主要集中在0.45到0.75之間,難題則集中在0.75以上,經過這次優(yōu)化后,錯題難易度與題目之間的相稱性得到了解決。
4研究過程發(fā)現的問題
4.1 題庫題型難易度無法準確反應學生的學習情況
本文研究發(fā)現,在題型難易程度設計時,設計人員通常會根據以往的經驗設計,忽視學生學習經驗的發(fā)展,因此常出現現階段題目測試情況反映出的難易度與題目錯誤率的實證并不相稱,學生的學習能力與學習需求是不斷發(fā)展變化的,例如以前學生的計算能力較強,而現在的學生因為計算器、手機等電子產品的影響,計算能力不如以前的學生;現在的學生因網絡或社會開放,接觸的信息多,閱讀能力比以前的學生能力強,題庫的設計沒有適時的根據學生的發(fā)展水平與認知變化而進行相應的調整,造成學生測試時測試情況與題目難易度設計與實證呈現出不相稱性。
4.2 題目難易度與錯誤率不相稱
本文的研究發(fā)現,題庫中的題目難易度與學生測試的題目錯誤率存在不相稱性。上述的分析結果中得出,福建師范大學學立方教育科技項目知識加值線上輔導管理平臺(VOSMaP)題庫部分題目難易度設置與學生測試后題目錯誤率所反映的難易度不相稱,上述分析過程中也反映出教師在設計題目難易度時,與學生對題目難易度的認知有一定的不相稱落差。形成的原因是多樣的,如老師對題目難易度的定義是根據以前學生的能力來定義。背景不同的學生在能力上有差異性,老師在進行題目難易度定義時是根據以前學生能力來定義,所以最新的學生在進行測試后,就形成了題目錯誤率與題目難易度不符的現象。
4.3 教師教學認知與學生能力存在不相稱現象
題目的難易度設計是老師在教學過程中積累的認知經驗來進行設置,而當學生進行測試后,發(fā)現學生的能力與老師的認知存在差異性,題目與難易程度無法良好的反應學生的認知水平。教師在教學過程中容易形成對知識重難點和對學生認知的固化認知,而學生的發(fā)展具有階段性與個性化的特點,固化的認知無法反應動態(tài)的發(fā)展,依據教師的認知設置的整齊劃一的題目難易程度無法準確反應學生的發(fā)展水平與認知能力。
5總結與建議
任何用于評量學生認知發(fā)展水平或老師教學效益的題庫,其題型設計的難易度必須跟學生認知發(fā)展的變化而變化。著名教育家皮亞杰認為學生的發(fā)展具有階段性,不同的發(fā)展階段具有不同的需求。因此,題目難易度的認知定義是需要實證分析及時常維護,題庫的有機性及活力是需要題庫的維護來實現,有機活力的智慧型題庫能夠依據學生認知能力的發(fā)展變化進行測試評量地同步變化,應根據不同階段學生的發(fā)展需求有針對性地對題庫進行優(yōu)化使之成為智慧型題庫,提高學生的學習水平。
教師根據對學生的固化認知和過往經驗進行教學會造成知識點難易度之間不相稱,教師應在大數據輔助測評下及時了解學生的認知發(fā)展水平,從而及時調整教學策略促進學生學習。建構主義強調學生原有的經驗背景,認為每個學生都不是空著腦袋進行學習的,他們在以往的學習過程中形成了豐富的知識與經驗,教學不能忽視甚至是無視學生原有的經驗背景,而應該以其作為新知識的生長點。大數據測評能夠追蹤學生認知水平的發(fā)展變化,有利于教師了解學生學習情況的動態(tài)變化,促進教師對學生原有知識經驗背景地深層理解,并以此知識的生長點學生制定“最近發(fā)展區(qū)”促進學生的發(fā)展。
良好的學習測試系統(tǒng)可以全面地收集學生學習測試過程中所產生的數據,為系統(tǒng)數據后續(xù)運用提供更多的可能。通過對學生學習行為的數據分析,能夠及時地對學生的學習情況進行分析與評價,有效的幫助教師及時地了解學生的學習情況,針對學生當前的學習情況有針對進行教學設計,對學生知識點的薄弱項進行強化學習,從而達到個性化學習的目的。
參考文獻:
[1] WEST D M,Big Data for Education: Data Mining,DataAnalytics,and Web Dashboards.Governance Studies at Brookings [J].Brookings Institution,2012.
[2] 滕珺, 朱曉玲. 大數據在美國基礎教育中的運用[J]. 人民教育, 2014, 1.
[3] SENATE U S. Education Sciences Reform Act of 2002, 107th Congress, 2nd Session (November 12, 2002). Report 107-337. Calendar Number 750 [J]. Us Senate, 2002.
[4] BIENKOWSKI M, FENG M, MEANS B. Enhancing teaching and learning through educational data mining and learning analytics: An issue brief [J]. US Department of Education, Office of Educational Technology, 2012:1-57.
[5] 本刊訊. 2014年教育信息化工作要點發(fā)布[J].中國教育信息化, 2014, 7.
【通聯編輯:代影】