付麗琴
摘要:教師職能已由傳統(tǒng)的課堂講授轉(zhuǎn)變?yōu)樵O計、組織、幫助與指導學生的學習,而學習分析成為了現(xiàn)代教學中必不可少的輔助手段。與此同時,大數(shù)據(jù)技術(shù)的出現(xiàn)為數(shù)據(jù)的分析應用提供了全新的思維和方式,大大推動了教學的個性化、適應性研究。本文以大數(shù)據(jù)為背景,結(jié)合云存儲技術(shù),以教師教學設計為應用目標,討論學習分析的內(nèi)容和關(guān)鍵技術(shù),包括學生學習體驗數(shù)據(jù)的獲取、存儲和分析。
關(guān)鍵詞:學習分析;大數(shù)據(jù);云存儲;教學設計
引言
隨著Internet、4G等信息技術(shù)的普及,以及MOOC等開放教育資源的日漸豐富,學生獲取知識的渠道快速增加,基本實現(xiàn)了隨時隨地的學習。學習方式的改變導致了教師角色的轉(zhuǎn)變,教師不再是知識的唯一傳授者,而成為學生學習的干預者和引導者,教師職能由傳統(tǒng)的課堂講授轉(zhuǎn)變?yōu)樵O計、組織、幫助與指導學生的學習。在此環(huán)境下,教師的主要任務就是為學生量身定做最合適的學習環(huán)境和個性化指導,具體包括兩個方面:一是設計以學生為中心的教學方案,二是設計以學生為主體的教學形式。為了完成此任務,教師不僅要充分利用知識的結(jié)構(gòu)和內(nèi)在聯(lián)系,而且更多地依賴于對學生狀況的了解,只有預先了解學生的學習特點,才能做出恰當?shù)慕虒W設計。因此,學習分析成為現(xiàn)代教學中的必要的輔助手段。2013年美國新媒體聯(lián)盟(NMC)的《地平線報告》提出,2~3年內(nèi)學習分析這項技術(shù)將會被廣泛接受。
聯(lián)合國在2012年發(fā)布的大數(shù)據(jù)白皮書“BigData for Development:Challenges& opportunities”中宣告了大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代為數(shù)據(jù)的分析應用提供了全新的思維和方式。在高容量、高速度、多樣化數(shù)據(jù)結(jié)構(gòu)的大數(shù)據(jù)時代,我們不僅可以借助云服務端來存儲海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)的數(shù)據(jù),還可利用數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)從這些海量數(shù)據(jù)中提取具有重要價值的信息,從而對包括教育領(lǐng)域在內(nèi)的社會各個領(lǐng)域的發(fā)展產(chǎn)生巨大的推動作用。
“數(shù)據(jù)驅(qū)動學校,分析變革教育”的大數(shù)據(jù)時代已經(jīng)來臨,大數(shù)據(jù)技術(shù)使得我們可以獲取每個學生的海量時空軌跡的行為數(shù)據(jù),包括學生在學校里發(fā)生的每一件事情,學習過程中的全部表現(xiàn),以及在家用計算機終端學習過程中的一舉一動;然后,基于大數(shù)據(jù)的云計算平臺,教師不但可以對反映學生學習成果的各種量化或質(zhì)性數(shù)據(jù)進行分析預測,還可以對學生在學習活動中以及虛擬情境中的非結(jié)構(gòu)化行為進行分析,最終利用學習分析的結(jié)果做出最適合學生的教學設計,并且為學生推薦學習軌跡。
一、學習分析的內(nèi)容
以學生為中心的教學設計,包括為學生設計合理的學習任務單和課堂教學形式,提供相關(guān)的教學視頻和學習資源等。大數(shù)據(jù)時代的教學設計依賴于教師對學生學習狀況的了解,學習分析是從整個系統(tǒng)的角度出發(fā)幫助教師做出教學決策,學習分析需要對學生學習過程中形成的海量數(shù)據(jù)進行解釋和分析,以評估學生的學術(shù)進展,預測其未來表現(xiàn),并發(fā)現(xiàn)影響學生學習系統(tǒng)的因素,其目的是評估學生、發(fā)現(xiàn)潛在問題并最終優(yōu)化學習,對象是學生及其學習環(huán)境,基礎(chǔ)是海量數(shù)據(jù)。
為了準確地了解每個學生的學習需求,不僅要對學生當前的學業(yè)表現(xiàn)進行多元化評價,還要在一定程度上預測學生的未來表現(xiàn),要對每個學生進行全方位的發(fā)展性評價。為此,我們需要全面地跟蹤記錄一個學生的所有表現(xiàn),既有量化的也有行為表現(xiàn)的,既有課內(nèi)的也有課外的。根據(jù)大數(shù)據(jù)時代學生學習方式的多樣化和靈活性特點,學生的學習數(shù)據(jù)包括線上數(shù)據(jù)和線下數(shù)據(jù)兩種。對這些數(shù)據(jù)進行挖掘和分析,可以全面跟蹤和掌握學生的學習行為、學習過程和學習特點。學習是學生與學習內(nèi)容、教師、合作同學和學習環(huán)境之間的復雜交互過程。
(一)線上學習的評估內(nèi)容包括:
1.學生在線學習表現(xiàn)的統(tǒng)計描述,包括學習時間的投入(如學生在某個知識點上花費的時間)、學習活動頻次(如學生對某個知識點瀏覽的次數(shù))、學習資源瀏覽(如學生對教學視頻中某個片段瀏覽的次數(shù))、考試成績等;
2.學習者自主學習路徑,包括學習者提問、回答相關(guān)問題和師生交流(如師生交互行為分析、師生發(fā)帖的內(nèi)容分析、師生交互的社會網(wǎng)絡分析);
3.影響學習者在線學習表現(xiàn)的各種因素,如學習者的興趣愛好;
4.各種虛擬情境下的學生表現(xiàn),包括社會態(tài)度、責任感、處事方式等。
(二)線下學習的評估內(nèi)容包括:
1.學生在學習不同模塊的階段性成績和課堂觀察結(jié)果;
2.實訓表現(xiàn)及過程感受;
3.實習、實訓等環(huán)境的適應情況;
4.學習活動中與人溝通交流、團隊合作的表現(xiàn)。
二、學習數(shù)據(jù)的獲取與存儲
(一)學習數(shù)據(jù)獲取
學習數(shù)據(jù)是指通過對學生學習過程中所產(chǎn)生的學習日志進行濾處理后得到的數(shù)據(jù)。學習數(shù)據(jù)的類型非常豐富,其中一部分數(shù)據(jù)是事后搜集的,如采用傳統(tǒng)的考試分數(shù)采集的定量數(shù)據(jù),以及通過文件、檔案記錄、深度訪談、參與式觀察等多種方法采集得到的質(zhì)性數(shù)據(jù)等。大部分學習數(shù)據(jù)是在學生學習過程中自然發(fā)生的數(shù)據(jù),是即時產(chǎn)生的,需要實時采集。實時數(shù)據(jù)的采集主要依賴于傳感器、射頻識別技術(shù)或?qū)iT軟件等,例如,我們可以利用圖像傳感器捕捉學生在觀看教學視頻時的視線移動,用專門軟件跟蹤記錄學生學習時長和完成習題檢測的全過程,包括讀題的時間、做題的順序、做題時間、解答過程等;為了研究學生的學習與心理動態(tài),可以在線采集他們的行為蹤跡、交友網(wǎng)絡和微博等半結(jié)構(gòu)或非結(jié)構(gòu)數(shù)據(jù);為了了解學生的價值、態(tài)度和道德養(yǎng)成,可用軟件記錄學生對學術(shù)活動和社交活動的參與情況等。
經(jīng)過各種渠道獲取的學習分析數(shù)據(jù)的種類和結(jié)構(gòu)非常復雜,只有少部分是結(jié)構(gòu)化數(shù)據(jù),大部分是難以計量和分析的非結(jié)構(gòu)化數(shù)據(jù),如學生的學習路徑、學習體驗及學生對環(huán)境的感受等等,這些數(shù)據(jù)用傳統(tǒng)數(shù)據(jù)處理方法有很大的困難,需要先將結(jié)構(gòu)復雜的數(shù)據(jù)轉(zhuǎn)換為單一的或是便于處理的結(jié)構(gòu),然后才能做數(shù)據(jù)分析。
除直接采集的數(shù)據(jù)外,還可以利用其他信息化管理系統(tǒng)中的數(shù)據(jù),如學生處、教務處等高校業(yè)務部門的數(shù)據(jù)管理系統(tǒng)中的數(shù)據(jù)。由于不同部門運用不同的數(shù)據(jù)系統(tǒng)軟件,各個運行數(shù)據(jù)庫除包含進行學習分析所需的有用信息外,還會摻雜很多干擾信息,因此需要將多種來源的數(shù)據(jù)進行篩選,以主題為目標,建立以分析為主要功能的數(shù)據(jù)集合。
(二)學習數(shù)據(jù)存儲
將結(jié)構(gòu)和非結(jié)構(gòu)化的學習數(shù)據(jù)及時存儲到數(shù)據(jù)中心是實現(xiàn)數(shù)據(jù)訪問和實時分析的必要前提。直接采集或從各部門數(shù)據(jù)庫得到的學習數(shù)據(jù)具有不同格式,傳統(tǒng)數(shù)據(jù)存儲的方法需要解決過濾后數(shù)據(jù)的異構(gòu)性問題,如采用聯(lián)邦式、基于中間件模型和數(shù)據(jù)倉庫等方法。云存儲技術(shù)不但能夠兼容不同結(jié)構(gòu)的數(shù)據(jù),而且屏蔽了數(shù)據(jù)丟失、病毒入侵等問題,是安全可靠的數(shù)據(jù)存儲技術(shù)。利用云存儲技術(shù)來構(gòu)建學習數(shù)據(jù)的存儲環(huán)境,根據(jù)數(shù)據(jù)的類型、結(jié)構(gòu)不同而選擇不同的數(shù)據(jù)存儲方案,使各種類型的數(shù)據(jù)實時高效地同步到數(shù)據(jù)中心。
要對海量數(shù)據(jù)進行有效的分析,還需將這些來自前端的數(shù)據(jù)導人到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群。云計算開源平臺Hadoop提供了分布式文件系統(tǒng)、分布式數(shù)據(jù)庫以及數(shù)據(jù)分析處理等功能模塊在內(nèi)的完整生態(tài)系統(tǒng),現(xiàn)已經(jīng)發(fā)展成為目前最流行的大數(shù)據(jù)處理平臺?;贖a-doop來構(gòu)建學習數(shù)據(jù)存儲平臺,具有數(shù)據(jù)管理方便、訪問速度快等優(yōu)點。
三、學習分析
學習數(shù)據(jù)分析是對教學內(nèi)容、教學環(huán)境和學生學習活動中產(chǎn)生的各種結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)進行相關(guān)性分析的過程。在進行學習分析時,采用面向主題的數(shù)據(jù)組織方式。主題(subject)是在較高層次上將信息系統(tǒng)中的數(shù)據(jù)進行綜合、歸類和分析利用的一個抽象概念,每一個主題基本對應一個分析領(lǐng)域。根據(jù)教學設計需求,我們選擇三個主題實現(xiàn)學習分析:學生學習成果、學習體驗和學習能力,其中,學習能力既反映了學習的效果,又是預測學生未來學習表現(xiàn)的關(guān)鍵因素。
每個主題細分為幾項內(nèi)容,每項內(nèi)容都是若干分析對象數(shù)據(jù)的一個完整描述。Fulks認為,學生學習成果是期望學生在經(jīng)過學習后應該獲得的、具體的、可測量的目標和結(jié)果,包括認知、技能、態(tài)度等,因此,反映學習成果的內(nèi)容應當包括知識掌握程度、知識應用的能力、口頭與書面表達的能力、獨立制訂計劃的能力、創(chuàng)業(yè)能力、社會能力和社會責任意識等;學習體驗是指學生在學習過程中對學習內(nèi)容、任務安排、教學環(huán)境等的感受,以及實訓感受和對學習成果的滿意度等;學習能力指學生獲取信息、接受知識和應用知識的能力,具體包括:學習速度、領(lǐng)悟能力、獨立思考能力、獲取與利用信息的能力、分析判斷與決策的能力、遇挫表現(xiàn)、學習活動中的應急和應變情況、與其他學習者的互動與合作等。
在Hadoop平臺上,利用分布式數(shù)據(jù)庫或者分布式計算集群,來對存儲于其內(nèi)的海量學習數(shù)據(jù)進行分析整理,如對學生的學習行為、學習成果等非結(jié)構(gòu)數(shù)據(jù)進行維度分析和關(guān)聯(lián)規(guī)則分析等以推斷出各種類數(shù)據(jù)間的細微差異與關(guān)系,所得出的信息以可視化技術(shù)直觀地顯示,為教師教學決策及時提出預警和幫助。
四、結(jié)束語
大數(shù)據(jù)技術(shù)可以高速實時地處理不同結(jié)構(gòu)的復雜海量數(shù)據(jù),并對大量不相關(guān)信息進行深度復雜分析,可以幫助推動教學的個性化、適應性研究。利用大數(shù)據(jù)技術(shù)和云計算提供的軟件、存儲、安全等技術(shù),對學生學習活動中產(chǎn)生的數(shù)據(jù)進行分析,了解學生真實的學習狀況,使教師能夠根據(jù)學習者的需要選擇和設計教學內(nèi)容,是提高教學質(zhì)量的有效途徑。