王紅
摘要:隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)采集技術(shù)的快速發(fā)展,以及大數(shù)據(jù)的不斷崛起,大量的教育大數(shù)據(jù)以各種方式得到收集。使用恰當?shù)臄?shù)據(jù)表征學習過程,利用數(shù)據(jù)分析技術(shù)發(fā)現(xiàn)學習者學習過程中的問題,對學習者、教學者和管理者具有及其重要的意義。本文基于當前學習分析現(xiàn)狀,發(fā)現(xiàn)當前學習分析的相關(guān)研究中數(shù)據(jù)采集方面存在的不足,從不同角度體現(xiàn)數(shù)據(jù)表征內(nèi)容和數(shù)據(jù)表征結(jié)果,對教育領(lǐng)域?qū)W習分析平臺的開發(fā)及學習活動分析有一定的意義。
關(guān)鍵詞:學習分析;教育大數(shù)據(jù);數(shù)據(jù)表征
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)19-0027-02
學習分析和教育數(shù)據(jù)挖掘,是教育大數(shù)據(jù)的兩個主要應用領(lǐng)域。[1]美國新媒體聯(lián)盟(NMC)在地平線報告中連續(xù)四年把學習分析作為影響教育發(fā)展的趨勢和關(guān)鍵技術(shù)[2][3][4],而學習分析在許多方面指的是應用于教育領(lǐng)域的“大數(shù)據(jù)”分析。[5]目前絕大多數(shù)的學習者的數(shù)據(jù)來源于固有的平臺數(shù)據(jù),平臺開發(fā)者根據(jù)平臺不同的應用開發(fā)出相應功能的平臺采集學習者的數(shù)據(jù)。然而學習者的學習狀態(tài)受到很多其他因素的影響,而這對采集數(shù)據(jù)的完備性具有極大的挑戰(zhàn),通過多樣的數(shù)據(jù)表征還原教學活動的真實狀態(tài)具有現(xiàn)實的研究意義。
1 教育大數(shù)據(jù)與學習分析
1.1 教育大數(shù)據(jù)
大數(shù)據(jù)從產(chǎn)生之初一個特定領(lǐng)域的詞匯到目前各行各業(yè)都在不斷挖掘與探索的熱詞,大數(shù)據(jù)的核心特征常被概括為“4V”,即數(shù)據(jù)量大(Volume)、輸入和處理速度快(Velocity)、數(shù)據(jù)多樣(Variety)和精確性(Ve-racity)[6]。教育大數(shù)據(jù)是大數(shù)據(jù)的一個子集,特指教育領(lǐng)域的大數(shù)據(jù),是指整個教育活動過程中所產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價值的數(shù)據(jù)集合。[7]教育大數(shù)據(jù)簡而言之就是教育活動中的對象在教育活動或?qū)W習環(huán)境中一切行為數(shù)據(jù)的集合。教育活動的對象即教師、學生、教學活動管理者;教育活動對象所處的教育活動或?qū)W習環(huán)境分別是教學過程、學習過程、教育管理過程;教育大數(shù)據(jù)采集的數(shù)據(jù)即為教育對象在教育活動中做了什么以及如何做所產(chǎn)生的巨大的數(shù)據(jù)集。
1.2 學習分析
學習分析的定義源于美國高等教育信息化協(xié)會的“下一代的挑戰(zhàn)”,即使用數(shù)據(jù)和模型預測學生收獲和行為具備處理這些信息的能力[8]。第一屆“學習分析和知識國際會議”提出學習分析是用于對學習者及其學習環(huán)境數(shù)據(jù)進行測量、收集、分析和報告,以理解和優(yōu)化學習和學習環(huán)境的技術(shù)。[9]學習分析的定義自源起到后來的不斷發(fā)展,其對象主要是學習者及學習者所處的環(huán)境,主要目的是通過多樣化的數(shù)據(jù)預測學習者的學習行為,指導學習者的學習行為,調(diào)整或修正學習者的學習行為,促進學習者的發(fā)展。學習分析是根據(jù)學生活動,基于活動數(shù)據(jù),依托技術(shù)背景,通過不同視角,分析學生行為,以修正學生活動,優(yōu)化學習環(huán)境從而促進學生發(fā)展為主要目的的過程。
1.3 教育大數(shù)據(jù)與學習分析
學習分析是基于學習者在學習過程及學習環(huán)境中的一系列行為產(chǎn)生的數(shù)據(jù)進行的,學習者在學習過程及學習環(huán)境中的一系列行為數(shù)據(jù)是教育大數(shù)據(jù)的一個子集。
2 現(xiàn)階段學習分析中的數(shù)據(jù)表征不足
2.1 現(xiàn)階段學習分析中的數(shù)據(jù)
學習者、教學者在學習環(huán)境中的一舉一動、一言一行都可以轉(zhuǎn)化為數(shù)據(jù)。學習者通過學習平臺完成各種學習任務所產(chǎn)的行為與活動都可以作為大數(shù)據(jù)的來源。何克抗指出目前學習分析技術(shù)所需數(shù)據(jù)的主要來源有:數(shù)據(jù)倉庫中的基本信息數(shù)據(jù);用戶在網(wǎng)絡(luò)中的瀏覽記錄;學習平臺和各類學習系統(tǒng)中通過數(shù)據(jù)庫采集的數(shù)據(jù)。[10]張艷霞,孫洪濤指出網(wǎng)絡(luò)學習行為數(shù)據(jù)、情境數(shù)據(jù)和注意元數(shù)據(jù)是現(xiàn)有學習分析研究數(shù)據(jù)集的主要來源。[11]布朗(Brown,2012)從數(shù)據(jù)內(nèi)容表征的角度將學習分析研究對象劃分為個性特征指標(dispositional indicators)和行為表現(xiàn)指標(activity and performance indicators)。[12]前者主要是值與學習者自身相關(guān)的數(shù)據(jù),這些數(shù)據(jù)具有較高的客觀性,后者主要是指學習者在學習過程的各種學習行為產(chǎn)生的數(shù)據(jù)。
2.2 數(shù)據(jù)表征存在的不足
盡管當前對于學習分析過程中的數(shù)據(jù)進行了相關(guān)研究,對由于數(shù)據(jù)來源的廣泛性,數(shù)據(jù)完備性更備受關(guān)注和考驗?,F(xiàn)有的學習分析對數(shù)據(jù)采集及數(shù)據(jù)表征存在不足,主要體現(xiàn)在以下幾個方面。
(1) 對學習者產(chǎn)生的文本數(shù)據(jù)的采集與分析不夠完善
當前大多數(shù)學習平臺將學習者參與討論、測評等通過文本的形式存儲下來,對數(shù)據(jù)的處理大多數(shù)停留在對學習者參與的積極性,但對學習者對學習內(nèi)容的具體掌握情況的分析及判斷存在片面性。同時,對文本數(shù)據(jù)的采集絕大多數(shù)通過讓學習者寫的方式,但是對于特定的學習內(nèi)容,學習者直接表達出來會對學習者的學習狀態(tài)有更好的預測和指導作用,有聲思維相關(guān)研究在語義編碼方面也存在較大難度,因此將有聲思維相關(guān)技術(shù)結(jié)合到平臺中的研究較少。
(2) 對學習者生理數(shù)據(jù)的采集具有一定的局限性
通過學習平臺對學習者在線活動數(shù)據(jù)進行采集,但是對學習者的生理表征,相關(guān)數(shù)據(jù)的采集有一定的困難。盡管學習者的生理數(shù)據(jù)可以通過各種可穿戴設(shè)備的得到采集,但是由于網(wǎng)絡(luò)學習平臺使得學習者與教學者、管理者處于時空分離的狀態(tài),對于遠程學習者通過可穿戴設(shè)備體現(xiàn)學習者生理變化受到學習環(huán)境的限制。通過可穿戴設(shè)備采集學習者生理數(shù)據(jù)就目前大多數(shù)學習平臺,比較適合于管理者、教學者與學習者能夠處在同一現(xiàn)實學習環(huán)境中。
(3) 采集數(shù)據(jù)的連續(xù)性不足
開發(fā)者進行平臺開發(fā)時大多數(shù)考慮到平臺特定的學習對象以及其對學習內(nèi)容的階段性需求,但是對學習者學習前狀態(tài)了解的較少。對學習者各種數(shù)據(jù)的采集僅是對學習者當前階段的數(shù)據(jù)的統(tǒng)計。信息化時代,數(shù)字土著越來越多,如果可以通過特定的平臺形成學習者特有的電子檔案,跟蹤學習者不同階段學習狀態(tài)的變化,對學習者、教學者、管理者都將是一筆財富。
(4) 線上-線下結(jié)合不足
大部分的學習平臺僅通過線上方式采集學習者在線學習行為產(chǎn)生的相關(guān)數(shù)據(jù),線上-線下相結(jié)合的方式,更能夠反應學習者最真實的學習狀態(tài)。通過線下訪談,觀察,問卷等方式對學習者產(chǎn)生的學習數(shù)據(jù)進行采集統(tǒng)計。但是,線下的大多數(shù)方式要求學習者與教學者,管理者能夠處于同一現(xiàn)實學習環(huán)境中,對于遠程學習者的效果或許不佳。
3 學習分析中的數(shù)據(jù)表征內(nèi)容與表征結(jié)果
3.1 從數(shù)據(jù)類型上體現(xiàn)數(shù)據(jù)表征內(nèi)容
基于當前各類學習分析平臺和學習分析工具,將數(shù)據(jù)按照數(shù)據(jù)的不同特征進行劃分。教育大數(shù)據(jù)也具有大數(shù)據(jù)的“4V”特性,從不同的角度對采集到的數(shù)據(jù)可進行不同類型數(shù)據(jù)的劃分。
(1) 從數(shù)據(jù)事實性的角度
從數(shù)據(jù)事實性的角度,將數(shù)據(jù)類型分為靜態(tài)數(shù)據(jù)(如年齡、身份、學歷等)和動態(tài)數(shù)據(jù)(如瀏覽時長、腦電變化數(shù)據(jù)等),所謂靜態(tài)數(shù)據(jù)即與學習者直接相關(guān)的事實性數(shù)據(jù),動態(tài)數(shù)據(jù)集由于學習者一系列學習行為所產(chǎn)生的數(shù)據(jù)。
(2) 從資源類型的角度
從資源類型的角度,將數(shù)據(jù)類型分為文本(如參與討論的內(nèi)容、搜索的關(guān)鍵詞等)、圖片(圖片關(guān)注時間、關(guān)注次數(shù)等)、視音頻(如瀏覽視頻次數(shù)、點擊視頻次數(shù)等)、動畫及其他數(shù)據(jù)(如學習者心跳速率、情緒狀態(tài)等),對于不同的數(shù)據(jù)表現(xiàn)形式,進行相應的文本分析、圖文分析、視頻分析、音頻轉(zhuǎn)換分析、生理分析。
(3) 從數(shù)據(jù)的獲取設(shè)備要求的角度
從數(shù)據(jù)的獲取設(shè)備要求的角度,將數(shù)據(jù)類型分為行為數(shù)據(jù)(如下載文件、拖動滾動條次數(shù)等)和生理數(shù)據(jù)(表情特征、腦認知活動、注意力水平等),行為數(shù)據(jù)即學習者外顯能夠直接通過學習平臺表現(xiàn)出來的以及能夠直接記錄下來的數(shù)據(jù),生理數(shù)據(jù)即需要依托多種可穿戴設(shè)備(如,視覺跟蹤器、腦電儀器、心臟速率監(jiān)視器等)反應出來的學習者學習過程中內(nèi)隱的數(shù)據(jù)。
3.2 從用戶的出發(fā)體現(xiàn)數(shù)據(jù)表征結(jié)果
教育大數(shù)據(jù)視野下,數(shù)據(jù)的表征可以依據(jù)不同的目的分別從學習者、教學者、管理者的角度出發(fā)(即“Who”),考察不同的用戶在不同的情境下(即“Where”),所發(fā)生的不同的行為(即“What”),從而分別對不同用戶產(chǎn)生了什么樣的影響(即“How”),從而進行綜合考察。例如,通過學習者在課堂(學習過程)中抬頭和低頭次數(shù)和時長的統(tǒng)計了解學生課堂關(guān)注度;通過教師在(教學過程)中提問時學生舉手次數(shù)了解知識的難易程度;通過管理者在學習平臺上發(fā)布資源后學習者的點擊及閱讀數(shù)量確定發(fā)布該類型資源的情況。
4 結(jié)束語
本文對教育大數(shù)據(jù)視角下學習分析中有關(guān)數(shù)據(jù)表征進行了一定的研究,教育大數(shù)據(jù)的大量涌現(xiàn),信息技術(shù)的不斷發(fā)展,二者相結(jié)合的教學模式中,對數(shù)據(jù)表征的要求會越來越高。如何才能夠提高數(shù)據(jù)表征有效性,對學習者學習預測與評估、教學者教學效能改進以及管理者資源配置提供相對準確的服務與建議在未來的發(fā)展中也具有極高的意義與價值。
參考文獻:
[1] 王良周,于衛(wèi)紅.大數(shù)據(jù)視角下的學習分析綜述[J].中國遠程教育,2015(03):31-37.
[2] JOHNSON L, ADAMS BECKER S, WITCHEY H, et al. The NMC Horizon Report: 2011 Museum Edition[J]. Austin, Texas: The New Media Consortium, 2011.
[3] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[4] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2012 higher education edition, Austin [J].http://www.nmc org/publications/2013-horizon-report-higher-ed, 2013.
[5] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[6] 劉雍潛,楊現(xiàn)民.大數(shù)據(jù)時代區(qū)域教育均衡發(fā)展新思路[J].電化教育研究,2014(5):11-14.
[7] 楊現(xiàn)民,唐斯斯,李冀紅.發(fā)展教育大數(shù)據(jù):內(nèi)涵、價值和挑戰(zhàn)[J].現(xiàn)代遠程教育研究,2016(01):50-61.
[8] 吳永和,陳丹,馬曉玲,等. 學習分析:教育信息化的新浪潮[J]. 遠程教育雜志,2013,31(4):11-19.
[9]? Siemens G. Learning and knowledge analytics-knewton-thefuture of education? [EB/OL].[2017-01-17].http://www.learning -analytics.net/?p=126.
[10]? 何克抗.學習分析技術(shù)在我國的新發(fā)展[J].電化教育研究,2016,37(07):5-13.
[11] 張艷霞,孫洪濤,李爽,等.數(shù)據(jù)表征學習過程及其應用——學習分析數(shù)據(jù)集國際研究綜述[J].中國電化教育,2015(09):85-93.
[12] 吳青,羅儒國.學習分析:從源起到實踐與研究[J].開放教育研究,2015,21(01):71-79.
【通聯(lián)編輯:光文玲】