国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向智慧課堂的數(shù)據(jù)挖掘與學(xué)習(xí)分析框架及應(yīng)用

2018-05-14 17:57孫曙輝劉邦奇李鑫
中國(guó)電化教育 2018年2期
關(guān)鍵詞:教育大數(shù)據(jù)學(xué)習(xí)分析數(shù)據(jù)挖掘

孫曙輝 劉邦奇 李鑫

摘要:國(guó)內(nèi)外對(duì)教育大數(shù)據(jù)的研究正從概念、理念層面走向建模分析與應(yīng)用層面,而應(yīng)用層面的研究也從教育質(zhì)量監(jiān)測(cè)統(tǒng)計(jì)、教育決策等宏觀層面向?qū)W校教學(xué)、學(xué)生學(xué)習(xí)等微觀層面深入發(fā)展。該文在教育數(shù)據(jù)挖掘與學(xué)習(xí)分析內(nèi)涵討論的基礎(chǔ)上,結(jié)合智慧教學(xué)實(shí)際提出了智慧課堂的數(shù)據(jù)模型和體系架構(gòu),闡述了“四建模三分析”的教育大數(shù)據(jù)研究方法論,構(gòu)建了智慧課堂數(shù)據(jù)挖掘分析的“整體棋盤”及13個(gè)具體研究問(wèn)題,并提出了智慧課堂數(shù)據(jù)挖掘分析的四類應(yīng)用模式,最后基于真實(shí)數(shù)據(jù)探討了學(xué)生主觀行為對(duì)成績(jī)的影響分析應(yīng)用案例。

關(guān)鍵詞:智慧課堂;教育大數(shù)據(jù);數(shù)據(jù)挖掘;學(xué)習(xí)分析;師生互動(dòng)指數(shù)

中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A

一、引言

教育大數(shù)據(jù)是教育過(guò)程中產(chǎn)生的或依據(jù)教育需求采集到的一切可用于教育發(fā)展的數(shù)據(jù)集合。目前進(jìn)行教育大數(shù)據(jù)分析應(yīng)用正在向教與學(xué)聚焦,主要包括教育數(shù)據(jù)挖掘和學(xué)習(xí)分析兩個(gè)方向。教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)是綜合運(yùn)用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)算法和數(shù)據(jù)挖掘技術(shù),對(duì)教育大數(shù)據(jù)進(jìn)行處理和分析,通過(guò)建模發(fā)現(xiàn)學(xué)生學(xué)習(xí)結(jié)果與學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源和教學(xué)行為等變量的相互關(guān)系,進(jìn)而預(yù)測(cè)學(xué)生未來(lái)的學(xué)習(xí)趨勢(shì)。而學(xué)習(xí)分析(Learning Analysis,LA)則是利用松散耦合的數(shù)據(jù)收集工具與分析技術(shù),研究分析學(xué)生學(xué)習(xí)參與、學(xué)習(xí)表現(xiàn)、學(xué)習(xí)過(guò)程的相關(guān)數(shù)據(jù),運(yùn)用不同的分析方法和數(shù)據(jù)模型來(lái)解釋這些數(shù)據(jù),根據(jù)解釋結(jié)果探究過(guò)程與情境,為其提供相應(yīng)的反饋進(jìn)而促進(jìn)有效學(xué)習(xí)。相較而言,教育數(shù)據(jù)挖掘主要側(cè)重于找出規(guī)律,即解決“為什么、是什么”的問(wèn)題;而學(xué)習(xí)分析則側(cè)重于應(yīng)用發(fā)現(xiàn)的規(guī)律,即落實(shí)“如何用”的場(chǎng)景。教育數(shù)據(jù)挖掘是針對(duì)學(xué)生進(jìn)行行為建模與學(xué)習(xí)趨勢(shì)預(yù)測(cè);而學(xué)習(xí)分析是利用分析得到的結(jié)果指導(dǎo)學(xué)習(xí),直接將反饋?zhàn)饔糜谂袆e與決策。在實(shí)際的教育大數(shù)據(jù)分析中,我們往往更多的采用歸納性方法來(lái)挖掘教育共性規(guī)律,采用異常發(fā)現(xiàn)來(lái)對(duì)待個(gè)性化需求,并使用演繹性方法來(lái)為發(fā)現(xiàn)的共性與個(gè)性規(guī)律尋找適用的應(yīng)用場(chǎng)景,從而促使有效學(xué)習(xí)的達(dá)成??梢?jiàn),教育數(shù)據(jù)挖掘與學(xué)習(xí)分析為我們應(yīng)用教育教學(xué)領(lǐng)域的大數(shù)據(jù)規(guī)律、開展課堂的教與學(xué)應(yīng)用,提供了完整的思路和方法。

總體上來(lái)說(shuō),國(guó)內(nèi)外對(duì)教育大數(shù)據(jù)的研究正從概念、理念層面走向建模分析與應(yīng)用層面,而應(yīng)用層面的研究也從教育質(zhì)量監(jiān)測(cè)統(tǒng)計(jì)、教育決策等宏觀層面向?qū)W校教學(xué)、學(xué)生學(xué)習(xí)等微觀層面深入發(fā)展。利用教育數(shù)據(jù)挖掘分析為受教育者量身定制教育目標(biāo)、計(jì)劃、方案、資源,有助于實(shí)現(xiàn)“因材施教”,為個(gè)性化教學(xué)指明方向。近幾年國(guó)內(nèi)一些學(xué)者結(jié)合教學(xué)過(guò)程的應(yīng)用開展教育大數(shù)據(jù)相關(guān)研究,如從“微課”“慕課”“翻轉(zhuǎn)課堂”等典型應(yīng)用人手探討大數(shù)據(jù)對(duì)教育模式轉(zhuǎn)變、教學(xué)方式變革的影響等理論研究,針對(duì)學(xué)習(xí)行為數(shù)據(jù)利用數(shù)據(jù)挖掘算法和學(xué)習(xí)分析技術(shù)圍繞學(xué)生進(jìn)行建模與預(yù)測(cè),進(jìn)行課堂教學(xué)的大數(shù)據(jù)應(yīng)用研究。基于課堂教學(xué)行為數(shù)據(jù)并運(yùn)用領(lǐng)域知識(shí)模型構(gòu)建技術(shù),研究課堂師生互動(dòng)、生生互動(dòng)的實(shí)時(shí)聯(lián)系,有助于揭示深層次教學(xué)規(guī)律,為改進(jìn)教學(xué)和提升教學(xué)質(zhì)量提供依據(jù)。本文從微觀層面上對(duì)目前的熱點(diǎn)“智慧課堂”進(jìn)行大數(shù)據(jù)挖掘分析專題研究,提出面向智慧課堂的數(shù)據(jù)挖掘和學(xué)習(xí)分析框架與應(yīng)用模型。

二、智慧課堂模式概述

(一)智慧課堂的定義

智慧課堂是基于新一代信息技術(shù)打造的智能、高效的課堂,是信息化課堂發(fā)展的新形態(tài)。目前對(duì)教育信息化的研究不斷向課堂、向教與學(xué)聚焦,智慧課堂成為實(shí)施智慧教育的核心載體,也是當(dāng)前學(xué)校信息化教學(xué)改革和企業(yè)教育信息化研發(fā)推廣所關(guān)注的焦點(diǎn)。無(wú)論是學(xué)術(shù)界對(duì)智慧課堂概念的理解還是實(shí)踐中智慧課堂的具體構(gòu)建都沒(méi)有唯一的模式,比如基于物聯(lián)網(wǎng)技術(shù)的“智能課堂”,基于電子書包應(yīng)用的“智慧課堂”系統(tǒng),基于云計(jì)算和網(wǎng)絡(luò)技術(shù)應(yīng)用的“智慧課堂”,等等。

關(guān)于智慧課堂的定義總體上有從教育的視角和從信息化的視角兩種類型,本研究是從信息化的角度進(jìn)行探討。我們?cè)鴱男畔⒒囊暯窍到y(tǒng)梳理了當(dāng)前各種智慧課堂概念或模型,在此基礎(chǔ)上對(duì)“智慧課堂”提出了一個(gè)明確的定義:即以建構(gòu)主義學(xué)習(xí)理論為依據(jù),利用大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)打造的,實(shí)現(xiàn)課前、課中、課后全過(guò)程應(yīng)用的智能、高效的課堂?;谛畔⒒暯堑闹腔壅n堂概念具有鮮明的技術(shù)特征:(1)教學(xué)決策數(shù)據(jù)化,即基于智慧課堂教學(xué)過(guò)程的海量行為數(shù)據(jù)進(jìn)行決策分析,在課堂教學(xué)中實(shí)現(xiàn)了基于數(shù)據(jù)的教育;(2)學(xué)習(xí)評(píng)價(jià)即時(shí)化,智慧課堂采取伴隨式數(shù)據(jù)采集與評(píng)價(jià),貫穿于課前、課中、課后全過(guò)程,進(jìn)行即時(shí)的學(xué)習(xí)診斷、評(píng)價(jià)與反饋;(3)交流互動(dòng)立體化,基于“云網(wǎng)端”平臺(tái),實(shí)現(xiàn)師生之間、生生之間、教師學(xué)生與家長(zhǎng)之間,全時(shí)空無(wú)障礙地立體化溝通、交流;(4)資源推送智能化,依據(jù)學(xué)生學(xué)習(xí)行為數(shù)據(jù)記錄和分析,智能化地推送微課、作業(yè)等學(xué)習(xí)資源,滿足學(xué)生個(gè)性化、多樣化學(xué)習(xí)需求;(5)教學(xué)呈現(xiàn)可視化,利用學(xué)科思維導(dǎo)圖、模型圖、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等可視化技術(shù),把本來(lái)不可見(jiàn)的“思維”、難以展現(xiàn)的復(fù)雜實(shí)驗(yàn)過(guò)程形象化地呈現(xiàn)出來(lái)。

(二)用于研究的智慧課堂平臺(tái)

科學(xué)研究需要真實(shí)、具體的數(shù)據(jù)為基礎(chǔ)?;谘芯康男枰?,我們選取了在當(dāng)前中小學(xué)使用較普遍的科大訊飛知名產(chǎn)品“智慧課堂”(以下除非特別說(shuō)明,智慧課堂均指科大訊飛的智慧課堂產(chǎn)品,簡(jiǎn)稱“智課”)作為研究的支撐平臺(tái)。該產(chǎn)品以建構(gòu)主義理論為依據(jù),結(jié)合諸如“翻轉(zhuǎn)課堂”“互動(dòng)課堂”“混合式學(xué)習(xí)”等先進(jìn)教學(xué)理念,建立“云網(wǎng)端”課堂信息化平臺(tái)(簡(jiǎn)稱“智課平臺(tái)”),幫助師生課前輕松備課、預(yù)習(xí),課上移動(dòng)教學(xué),課后個(gè)性學(xué)習(xí)、輔導(dǎo)。該產(chǎn)品已形成了理論定義、系統(tǒng)組成、教學(xué)模式、應(yīng)用案例的完整體系。

智課平臺(tái)是由“云”“網(wǎng)”“端”構(gòu)成的一體化課堂信息化平臺(tái)。其中云平臺(tái)主要包含資源管理與服務(wù)系統(tǒng)、作業(yè)與動(dòng)態(tài)評(píng)價(jià)系統(tǒng)和微課制作與應(yīng)用系統(tǒng)等核心應(yīng)用系統(tǒng);微云服務(wù)器主要實(shí)現(xiàn)教室內(nèi)構(gòu)建以教室為單元的局域網(wǎng)信息化環(huán)境,提供本地網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算服務(wù);端應(yīng)用工具即移動(dòng)智能終端,是實(shí)現(xiàn)智慧課堂教學(xué)應(yīng)用的基本工具。智慧課堂移動(dòng)端工具基本配備包括教師端、學(xué)生端,根據(jù)需要也可配備家長(zhǎng)端、管理端。教師端工具提供教師課堂教學(xué)的基本手段,主要包括PPT制作與投屏、微課制作與發(fā)布、互動(dòng)交流和學(xué)習(xí)測(cè)評(píng)等功能,可以進(jìn)行電子白板式的任意書寫、記錄與保存,實(shí)現(xiàn)任務(wù)布置、作業(yè)批改、答疑解惑、個(gè)別輔導(dǎo)等師生互動(dòng)。學(xué)生端工具包括微課學(xué)習(xí)、課堂互動(dòng)交流、作業(yè)與動(dòng)態(tài)評(píng)價(jià)等主要功能,可以進(jìn)行微課的學(xué)習(xí)、參與課堂師生、生生互動(dòng)、完成個(gè)性化作業(yè)、查看學(xué)習(xí)成績(jī)等。

三、智慧課堂用戶模型及行為數(shù)據(jù)

(一)智慧課堂“三角用戶模型”

對(duì)智慧課堂數(shù)據(jù)挖掘分析,首先要建立智慧課堂的數(shù)據(jù)模型。從信息系統(tǒng)的視角來(lái)分析,智慧課堂教學(xué)實(shí)際上就是教師、學(xué)生借助于信息媒介進(jìn)行信息交換、傳遞、接受、互動(dòng)的信息過(guò)程。在智慧課堂教學(xué)中,教師與學(xué)生是教學(xué)信息過(guò)程的兩個(gè)主要參與者,是產(chǎn)生信息、處理和使用信息的主體,是課堂信息系統(tǒng)的活力源泉。通過(guò)對(duì)智慧課堂信息數(shù)據(jù)的梳理以及對(duì)智慧課堂產(chǎn)品原型的還原,我們可以抽象得到(如圖1所示)智慧課堂的“三角用戶模型”,用以對(duì)智慧課堂用戶交互關(guān)系進(jìn)行系統(tǒng)描述。

具體來(lái)說(shuō),智慧課堂信息系統(tǒng)模型構(gòu)成包含兩個(gè)主要參與者與—個(gè)信息對(duì)象。兩個(gè)主要參與者分別是教師與學(xué)生,一個(gè)信息對(duì)象指的是由師生產(chǎn)生的uGC微課視頻資源、各種網(wǎng)絡(luò)互動(dòng)信息、文本信息等,我們統(tǒng)稱為泛在信息。在“三角用戶模型”中,總共有五大類行為,分別是教師生成、讀取泛在信息(A),學(xué)生生成、讀取泛在信息(B),教師與學(xué)生間的互動(dòng)(C、D),學(xué)生與學(xué)生間的互動(dòng)(E)。其中教師與學(xué)生的互動(dòng)C是指由教師主動(dòng)發(fā)起的互動(dòng),D是指由學(xué)生主動(dòng)發(fā)起的互動(dòng)。這五大類行為分別對(duì)應(yīng)的具體行為列表及數(shù)據(jù)中體現(xiàn)的發(fā)生頻率如表1所示。

(二)智慧課堂互動(dòng)數(shù)據(jù)分析

師生互動(dòng)是智慧課堂的核心標(biāo)志。由表1可知,師生互動(dòng)數(shù)據(jù)是智慧課堂中發(fā)生頻率較高的教學(xué)行為數(shù)據(jù)。教師與學(xué)生的互動(dòng)主要圍繞作業(yè)、微課視頻、分享圈帖子以及私信三類載體展開。從信息的流向來(lái)看,可以分為一對(duì)一或一對(duì)多,而從信息的私密性來(lái)看,可以分為公開信息與私密信息。師生互動(dòng)數(shù)據(jù)的具體內(nèi)涵及潛在價(jià)值分析如下:

作業(yè):作業(yè)傳遞是智課平臺(tái)的基本功能,是由教師發(fā)布、學(xué)生提交為形態(tài)的一對(duì)多的公開信息。作業(yè)的頻次與難度部分反映了教師的教學(xué)風(fēng)格,而學(xué)生完成作業(yè)的及時(shí)性、正確率則是學(xué)生學(xué)習(xí)態(tài)度與學(xué)業(yè)能力的體現(xiàn)。

微課視頻:是由個(gè)人(老師或?qū)W生)錄制并供智慧課堂用戶課前或課后觀看的一種信息載體形式,它是智慧課堂教學(xué)內(nèi)容建設(shè)的核心。微課視頻在智慧課堂中是由老師、學(xué)生共同參與的一對(duì)多(一個(gè)微課視頻只有一個(gè)作者、上傳者)的公開信息。通過(guò)微課發(fā)布的頻次、包含的知識(shí)點(diǎn)可以了解教師上課的進(jìn)度與狀態(tài),借助學(xué)生對(duì)微課視頻的瀏覽、觀看、回復(fù)、點(diǎn)贊、收藏以及其中一些付費(fèi)視頻的購(gòu)買行為,可以進(jìn)一步衡量教師的影響力與學(xué)生對(duì)課程、教師的滿意程度。學(xué)生學(xué)習(xí)微課的先后順序則可以用來(lái)構(gòu)建學(xué)生學(xué)習(xí)的知識(shí)圖譜,并進(jìn)一步用以比較不同學(xué)生之間的學(xué)習(xí)差異。

帖子與私信:是同一種網(wǎng)絡(luò)文本信息的兩種不同形態(tài),帖子是一對(duì)多的公開信息,而私信則是一對(duì)一的私密信息。教師與學(xué)生,學(xué)生與學(xué)生間通過(guò)帖子、私信相互交流、互動(dòng),反映了師生、生生間的聯(lián)系強(qiáng)弱?;诖祟悢?shù)據(jù),可以構(gòu)建校園的社交網(wǎng)絡(luò)地圖,進(jìn)一步分析網(wǎng)絡(luò)中影響力用戶以及基于文本進(jìn)行校園輿情洞察。

四、智慧課堂建模與挖掘分析體系框架

(一)“四建模三分析”框架

為了系統(tǒng)性地對(duì)智慧課堂中的教學(xué)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘與學(xué)習(xí)分析,我們參考2012年美國(guó)教育部發(fā)布的《通過(guò)教育數(shù)據(jù)挖掘與學(xué)習(xí)分析促進(jìn)教與學(xué)》(ETL-EDM LA)的報(bào)告,結(jié)合學(xué)術(shù)界部分專家觀點(diǎn),針對(duì)性地提出“四建模三分析”的智慧課堂大數(shù)據(jù)研究方法論。

具體來(lái)說(shuō),“四建模三分析”主要是基于教育數(shù)據(jù)挖掘與學(xué)習(xí)分析技術(shù)在教學(xué)領(lǐng)域的應(yīng)用提出的。建模與分析分別是圍繞著學(xué)習(xí)者的內(nèi)部特征與外部影響兩方面展開的。在研究學(xué)習(xí)者內(nèi)在行為、經(jīng)歷的基礎(chǔ)上針對(duì)學(xué)習(xí)者進(jìn)行畫像,并在此基礎(chǔ)上輔以知識(shí)領(lǐng)域的建模,全面刻畫學(xué)習(xí)者內(nèi)在學(xué)習(xí)特征。而在其外部,通過(guò)對(duì)學(xué)習(xí)組件以及環(huán)境進(jìn)行分析,從而得出針對(duì)未來(lái)的趨勢(shì)預(yù)判分析。“四建模三分析”的基本含義及著力解決的問(wèn)題如下:

1.行為建模:通過(guò)對(duì)學(xué)生主動(dòng)發(fā)生的學(xué)習(xí)行為進(jìn)行學(xué)生建模,著重了解學(xué)生主觀學(xué)習(xí)行為與學(xué)習(xí)結(jié)果關(guān)系、學(xué)生學(xué)習(xí)行為模式共性與差異、師生與生生互動(dòng)聯(lián)絡(luò)拓?fù)洹?/p>

2.經(jīng)歷建模:通過(guò)學(xué)生與教師的互動(dòng)情況,著重對(duì)學(xué)生的學(xué)習(xí)感受進(jìn)行建模,用以了解學(xué)生學(xué)習(xí)的主觀評(píng)價(jià)以及對(duì)授課教師的側(cè)面評(píng)價(jià)佐證。

3.畫像建模:通過(guò)對(duì)包含互動(dòng)對(duì)象、學(xué)習(xí)行為、學(xué)業(yè)結(jié)果數(shù)據(jù)在內(nèi)的全方位的數(shù)據(jù)進(jìn)行建模,對(duì)學(xué)生進(jìn)行聚類分組,充分刻畫學(xué)生的用戶畫像,以及發(fā)掘聯(lián)絡(luò)人網(wǎng)絡(luò)中的有影響力節(jié)點(diǎn)。

4.領(lǐng)域建模:通過(guò)學(xué)生學(xué)習(xí)路徑及其關(guān)聯(lián)的知識(shí)點(diǎn)數(shù)據(jù),自動(dòng)對(duì)知識(shí)圖譜進(jìn)行建模,構(gòu)建學(xué)科領(lǐng)域的知識(shí)圖譜。

5.組件分析:通過(guò)對(duì)學(xué)習(xí)過(guò)程中的各種客觀行為(組件)進(jìn)行分析,獲得其與學(xué)生學(xué)業(yè)結(jié)果的聯(lián)系。

6.策略分析:通過(guò)對(duì)教學(xué)者教學(xué)風(fēng)格等教學(xué)策略進(jìn)行抽象與歸納分析,獲得其對(duì)學(xué)生學(xué)業(yè)結(jié)果的影響。

7.趨勢(shì)分析:借助學(xué)業(yè)結(jié)果影響因素的主觀、客觀、策略等因素的分析,對(duì)學(xué)業(yè)進(jìn)行趨勢(shì)預(yù)測(cè);與此同時(shí),借助網(wǎng)絡(luò)文本數(shù)據(jù)分析對(duì)校園輿情進(jìn)行管窺。

(二)“四建模三分析”的范圍界定

上述七種建模與分析角度是目前教育大數(shù)據(jù)挖掘分析所公認(rèn)、且成果較為密集的研究領(lǐng)域,并不涵蓋課堂教育大數(shù)據(jù)分析的所有方向。通過(guò)“四建模三分析”方法,可以對(duì)智慧課堂的研究目標(biāo)具象化,有助于在研究過(guò)程中的聚焦。本研究對(duì)智慧課堂數(shù)據(jù)建模分析研究范圍界定如下:

1.對(duì)于研究目標(biāo)不清晰的領(lǐng)域不予涉及。在學(xué)生行為建模中,業(yè)界提出對(duì)學(xué)習(xí)行為范式進(jìn)行研究,這依賴于教育學(xué)、行為學(xué)等交叉學(xué)科的理論,有待于與這些領(lǐng)域?qū)<业纳钊胙芯亢秃献?,在此基礎(chǔ)上進(jìn)一步使用大數(shù)據(jù)作佐證,為共同深入該方向研究提供空間,因此本研究暫不涉及。

2.對(duì)于對(duì)象數(shù)據(jù)為傳統(tǒng)問(wèn)卷采集方式的研究未涉及。學(xué)生經(jīng)歷的建模在傳統(tǒng)的教學(xué)數(shù)據(jù)采集手段中使用問(wèn)卷形式進(jìn)行,雖然這也是一種有效度、信度的測(cè)量方式,但由于在訊飛智慧課堂產(chǎn)品中未有問(wèn)卷數(shù)據(jù)的體現(xiàn),而且我們認(rèn)為教育大數(shù)據(jù)分析能夠常態(tài)化應(yīng)用的前提是數(shù)據(jù)采集的常態(tài)化,因此對(duì)問(wèn)卷數(shù)據(jù)采集方式在研究中不予包括。

3.對(duì)于個(gè)性化學(xué)習(xí)與自適應(yīng)學(xué)習(xí)分析另有研究。個(gè)性化學(xué)習(xí)與自適應(yīng)學(xué)習(xí)毋庸置疑是最為前瞻、最具特色、最有價(jià)值的課堂教學(xué)數(shù)據(jù)挖掘分析研究方向。鑒于其研究重要性、方法的特殊性、以及內(nèi)容豐富及相對(duì)獨(dú)立等方面的考量,對(duì)個(gè)性化學(xué)習(xí)挖掘分析和自適應(yīng)學(xué)習(xí)研究將作為單獨(dú)領(lǐng)域另行開展研究。

(三)智慧課堂數(shù)據(jù)挖掘主要算法

“四建模三分析”的落地離不開數(shù)據(jù)挖掘算法與統(tǒng)計(jì)分析技術(shù)的應(yīng)用?;谝陨辖:头治龅男枰?,根據(jù)我們的研究,智慧課堂數(shù)據(jù)挖掘使用的常用算法與技術(shù)主要包括多元回歸分析、分類聚類算法、關(guān)聯(lián)規(guī)則挖掘、文本分析挖掘、圖構(gòu)建與挖掘等方面。主要算法與技術(shù)如表2所示。

五、智慧課堂數(shù)據(jù)挖掘分析實(shí)施方法

(一)構(gòu)建智慧課堂數(shù)據(jù)挖掘分析“整體棋盤”

基于“四建模三分析”總體框架以及五大類數(shù)據(jù)挖掘技術(shù)的概述,結(jié)合智慧課堂用戶模型和數(shù)據(jù)體系,我們采用棋盤法將研究問(wèn)題進(jìn)行具象與細(xì)化,形成智慧課堂數(shù)據(jù)挖掘分析的“整體棋盤”。棋盤的首行列出七大研究方向,首列給出五大數(shù)據(jù)挖掘技術(shù),在棋盤矩陣中縱橫交錯(cuò)的每一個(gè)棋盤格子處則是使用某種數(shù)據(jù)挖掘方法對(duì)該類研究方向的具體細(xì)化。智慧課堂數(shù)據(jù)挖掘分析的整體棋盤如表3所示。

(二)設(shè)計(jì)研究問(wèn)題及研究方法

利用教育數(shù)據(jù)挖掘和分析技術(shù)對(duì)每一項(xiàng)棋盤格中的研究問(wèn)題進(jìn)行建模分析,關(guān)鍵是要對(duì)具體的研究問(wèn)題進(jìn)行定義,設(shè)計(jì)基于行為數(shù)據(jù)的研究對(duì)象、方法和策略。根據(jù)“整體棋盤”框架,對(duì)13個(gè)具體研究問(wèn)題定義如下。

(1)學(xué)生主觀行為對(duì)學(xué)業(yè)的影響研究:學(xué)生在學(xué)習(xí)過(guò)程中的主動(dòng)參與狀態(tài)是影響學(xué)生學(xué)業(yè)結(jié)果的首要因素。通過(guò)對(duì)學(xué)生主觀行為進(jìn)行梳理并研究其對(duì)學(xué)業(yè)結(jié)果影響,有助于找出學(xué)業(yè)成績(jī)的學(xué)生個(gè)體主觀行為中的主要成分;(2)客觀行為因素對(duì)學(xué)業(yè)的影響研究:學(xué)生在學(xué)習(xí)過(guò)程中有不受自身控制的客觀行為會(huì)影響其學(xué)業(yè)成績(jī)。研究外界客觀行為對(duì)學(xué)業(yè)的影響,有助于刪繁就簡(jiǎn)地找出影響學(xué)業(yè)中的外界有利因素并加以因勢(shì)利導(dǎo);(3)師生互動(dòng)指數(shù)分析:學(xué)生學(xué)習(xí)受教師與同伴的共同影響,研究教師教學(xué)策略以及學(xué)習(xí)伙伴因素對(duì)學(xué)業(yè)的影響,可以進(jìn)一步印證教育中的有關(guān)成熟理論;(4)學(xué)生學(xué)業(yè)成績(jī)預(yù)測(cè):基于上述研究中的主、客觀行為以及策略等因素對(duì)學(xué)業(yè)影響關(guān)系,利用一定時(shí)間段內(nèi)用戶綜合行為數(shù)據(jù)對(duì)學(xué)業(yè)成績(jī)進(jìn)行預(yù)測(cè),可預(yù)判學(xué)習(xí)走勢(shì),提前干預(yù)學(xué)習(xí)行為;(5)學(xué)生智慧課堂忠誠(chéng)度分析:通過(guò)對(duì)學(xué)生在智慧課堂沉淀數(shù)據(jù)進(jìn)行分析,獲得用戶對(duì)該信息化產(chǎn)品的粘性程度指數(shù);(6)學(xué)生學(xué)習(xí)成績(jī)分檔模型研究:通過(guò)對(duì)學(xué)生的分學(xué)科學(xué)業(yè)成績(jī)進(jìn)行聚類分析,得出學(xué)生成績(jī)的分檔結(jié)果,與傳統(tǒng)的統(tǒng)計(jì)學(xué)分位點(diǎn)分檔模型進(jìn)行相互印證,了解學(xué)生偏科狀況;(7)學(xué)生群體的行為序列差異研究:不同學(xué)生的學(xué)習(xí)行為不同,其結(jié)果會(huì)反映在學(xué)業(yè)結(jié)果上。通過(guò)不同群體間行為序列差異的研究,在學(xué)生中推廣學(xué)業(yè)優(yōu)秀學(xué)生的學(xué)習(xí)行為序列,促進(jìn)有效學(xué)習(xí);(8)教師教學(xué)路徑可視化:通過(guò)可視化技術(shù)直觀顯示教師教學(xué)行為路徑,便于教育管理者進(jìn)行教學(xué)研討與比較反思;(9)泛在信息中的知識(shí)點(diǎn)提?。簭陌虢Y(jié)構(gòu)化與非結(jié)構(gòu)化的信息中利用文本分析方法自動(dòng)提取知識(shí)點(diǎn),用于后續(xù)知識(shí)圖譜構(gòu)建;(10)校園情感分析、預(yù)警:利用情感分析技術(shù)分析校園內(nèi)學(xué)生發(fā)布非結(jié)構(gòu)化文本信息中的正負(fù)情感傾向,對(duì)個(gè)別有負(fù)面情緒學(xué)生進(jìn)行預(yù)警預(yù)報(bào),管窺校園輿情;(11)班、校社交網(wǎng)絡(luò)的構(gòu)建:利用師生、生生互動(dòng)的數(shù)據(jù)構(gòu)建班級(jí)與校園維度的社交網(wǎng)絡(luò),用于校園社交網(wǎng)絡(luò)挖掘;(12)班、校社交網(wǎng)絡(luò)影響力人物挖掘:從班級(jí)、校園社交網(wǎng)絡(luò)中發(fā)現(xiàn)有影響力的學(xué)生,在教學(xué)中可利用其影響力,進(jìn)行教學(xué)策略擴(kuò)散的最大化;(13)自動(dòng)構(gòu)建領(lǐng)域知識(shí)圖譜:學(xué)生知識(shí)習(xí)得的程序遵從一定的順序,通過(guò)行為來(lái)自動(dòng)還原知識(shí)圖譜網(wǎng)絡(luò),并與人工構(gòu)建知識(shí)圖譜進(jìn)行比照、驗(yàn)證。

六、智慧課堂數(shù)據(jù)挖掘分析應(yīng)用模式

通過(guò)對(duì)5大項(xiàng)13個(gè)小項(xiàng)研究問(wèn)題的具體細(xì)化,一幅針對(duì)智慧課堂數(shù)據(jù)進(jìn)行應(yīng)用研究的全圖清晰地呈現(xiàn)在面前。在實(shí)踐應(yīng)用中,需要結(jié)合具體的專業(yè)領(lǐng)域應(yīng)用需求和應(yīng)用場(chǎng)景,將研究?jī)?nèi)容有機(jī)地組織起來(lái),形成具體的應(yīng)用模式。根據(jù)智慧課堂全過(guò)程、全方位的數(shù)據(jù)體系及應(yīng)用需求,這里從課堂互動(dòng)、學(xué)習(xí)行為、學(xué)習(xí)結(jié)果、校園社交等重點(diǎn)領(lǐng)域的分析應(yīng)用入手,構(gòu)建智慧課堂數(shù)據(jù)挖掘分析應(yīng)用的四種基本模式。

(一)課堂互動(dòng)分析應(yīng)用模式

課堂互動(dòng)是智慧課堂的核心特征。學(xué)生與教師互動(dòng)、與資源互動(dòng)、與平臺(tái)互動(dòng)等多向互動(dòng),很大程度上體現(xiàn)了學(xué)生投人學(xué)習(xí)的程度,反映了學(xué)生主動(dòng)學(xué)習(xí)、積極學(xué)習(xí)的情況?;趯W(xué)生和教師在智課平臺(tái)的行為數(shù)據(jù)建立學(xué)生與教師互動(dòng)、與平臺(tái)互動(dòng)的指標(biāo)體系,同時(shí)依據(jù)因子分析法計(jì)算出互動(dòng)指標(biāo)體系的權(quán)重,進(jìn)而建立教師與學(xué)生的互動(dòng)指數(shù)、學(xué)生對(duì)智課平臺(tái)的粘性程度指數(shù),為設(shè)計(jì)和改進(jìn)課堂教學(xué)互動(dòng)提供依據(jù)。

(二)學(xué)習(xí)行為分析應(yīng)用模式

學(xué)習(xí)行為數(shù)據(jù)是反映智慧課堂教學(xué)過(guò)程的最重要數(shù)據(jù)。通過(guò)從學(xué)生主觀行為、客觀行為、教學(xué)策略與學(xué)習(xí)環(huán)境等方面進(jìn)行可能因素的梳理,利用統(tǒng)計(jì)學(xué)中相關(guān)性分析、顯著性檢驗(yàn)、因子分析等手段,探尋出影響學(xué)業(yè)成績(jī)的主要指標(biāo)。在此基礎(chǔ)上通過(guò)對(duì)學(xué)生不同群體的學(xué)習(xí)行為序列利用關(guān)聯(lián)規(guī)則挖掘技術(shù)與可視化展現(xiàn)方式進(jìn)行差異研究,進(jìn)一步尋找學(xué)生個(gè)體的學(xué)習(xí)行為差異,為探究學(xué)生學(xué)習(xí)過(guò)程影響因素提供重要手段。

(三)學(xué)習(xí)結(jié)果分析應(yīng)用模式

學(xué)習(xí)結(jié)果數(shù)據(jù)是智慧課堂教學(xué)成效的基本體現(xiàn)。通過(guò)連續(xù)多次考試排名建立對(duì)學(xué)生成績(jī)上升/下降、學(xué)習(xí)成績(jī)分檔模型。對(duì)學(xué)生考試成績(jī)偏科情況探索,從整體角度分析偏科人數(shù)以及偏優(yōu)和偏弱學(xué)科,從個(gè)人角度分析學(xué)生偏科行為。通過(guò)對(duì)學(xué)生歷史考試成績(jī)排名數(shù)據(jù)以及近期在作業(yè)平臺(tái)上的行為數(shù)據(jù)進(jìn)行未來(lái)成績(jī)趨勢(shì)預(yù)測(cè)。通過(guò)學(xué)生在智課平臺(tái)的學(xué)習(xí)行為來(lái)自動(dòng)還原知識(shí)圖譜網(wǎng)絡(luò),并與人工構(gòu)建知識(shí)圖譜進(jìn)行對(duì)比分析,描述學(xué)生的知識(shí)結(jié)構(gòu)情況。

(四)校園社交分析應(yīng)用模式

學(xué)生校園社交數(shù)據(jù)是反映學(xué)生全面成長(zhǎng)、進(jìn)行校園輿情管窺的重要依據(jù)。利用學(xué)生與教師、學(xué)生與學(xué)生互動(dòng)的數(shù)據(jù),分別構(gòu)建校園維度和班級(jí)維度的社交網(wǎng)絡(luò)?;诮⒌陌嗉?jí)、校園社交網(wǎng)絡(luò)從中發(fā)現(xiàn)有影響力的教師和學(xué)生,在教學(xué)過(guò)程中,可利用其影響力,進(jìn)行有效教學(xué)干預(yù)的最大化。從校園輿情角度來(lái)看,通過(guò)學(xué)習(xí)者在智課平臺(tái)上私信、帖子等所涉及的文本內(nèi)容,利用自然語(yǔ)言中基于情感詞典的文本情感分析法,掌握學(xué)習(xí)者的情感傾向狀態(tài),以便于進(jìn)行校園輿情的管窺。智能引領(lǐng)與智慧教育

七、應(yīng)用實(shí)例:以學(xué)生主觀行為對(duì)成績(jī)的影響分析為例

(一)研究數(shù)據(jù)來(lái)源分析

本研究所使用的數(shù)據(jù)來(lái)源于智慧課堂產(chǎn)品在安徽省某重點(diǎn)中學(xué)2014級(jí)學(xué)生群體中使用的真實(shí)數(shù)據(jù),涉及35個(gè)教學(xué)班學(xué)生共計(jì)1973名,教師98人。由于該年級(jí)使用智慧課堂產(chǎn)品兩年有余,積累了大量的過(guò)程行為數(shù)據(jù)與學(xué)業(yè)結(jié)果數(shù)據(jù),為下面的數(shù)據(jù)分析提供了大數(shù)據(jù)的支撐。出于隱私安全考慮,在數(shù)據(jù)分析時(shí),采用學(xué)生匿名編碼的形式以保護(hù)學(xué)生隱私。

在數(shù)據(jù)采集周期內(nèi),共選取了4次全學(xué)科考試。這四次考試分別發(fā)生在2016年1月20日、4月28日、5月30日和6月12日。經(jīng)統(tǒng)計(jì),四次考試全部參加的理科學(xué)生為133 1人,文科學(xué)生為496人。本研究分別對(duì)理科和文科學(xué)生進(jìn)行了分析,由于篇幅限制,本文中只例舉理科學(xué)生的主觀行為對(duì)成績(jī)的影響分析。

(二)行為分析基本框架

分析學(xué)生主觀行為對(duì)成績(jī)的影響主要分為數(shù)據(jù)收集與處理、模型建立和結(jié)果分析三大部分,分析框架如圖2所示。在數(shù)據(jù)收集與處理的過(guò)程中,本文選取學(xué)生行為指標(biāo)數(shù)據(jù)和學(xué)生歷史成績(jī)數(shù)據(jù),在收集數(shù)據(jù)之后需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。基于以上數(shù)據(jù),本文使用相關(guān)性分析、多元回歸分析和因子分析三種方法建立模型分析行為指標(biāo)對(duì)成績(jī)的影響。其中相關(guān)性分析和多元回歸分析結(jié)合了學(xué)生的行為指標(biāo)和歷史成績(jī)數(shù)據(jù)來(lái)分析指標(biāo)之間的相關(guān)性并量化行為指標(biāo)對(duì)學(xué)生成績(jī)的影響;使用因子分析對(duì)多個(gè)行為指標(biāo)進(jìn)行降維處理,提取出影響學(xué)習(xí)成績(jī)的因子。在建立模型之后,綜合分析不同方法得出的結(jié)果,最終得出對(duì)學(xué)生成績(jī)有顯著影響的因素。

(三)分析過(guò)程與結(jié)果

1.指標(biāo)的篩選

初始提取出理科學(xué)生主觀行為對(duì)成績(jī)影響因素指標(biāo)20個(gè),包括根回復(fù)微課次數(shù)、非根回復(fù)微課次數(shù)、遞交作業(yè)數(shù)、錯(cuò)題總數(shù)、評(píng)級(jí)微課次數(shù)、評(píng)級(jí)非微課次數(shù)、微課觀看個(gè)數(shù)、微課觀看次數(shù)、微課收藏次數(shù)、通知回復(fù)數(shù)、微課點(diǎn)贊次數(shù)、非微課點(diǎn)贊次數(shù)、社區(qū)發(fā)帖數(shù)、回復(fù)貼數(shù)、帖子中交互人數(shù)、訪問(wèn)別人次數(shù)、訪問(wèn)別人人數(shù)、與學(xué)生互批作業(yè)數(shù)、作業(yè)修訂數(shù)、發(fā)給老師私信數(shù)。根據(jù)實(shí)際統(tǒng)計(jì)數(shù)據(jù)對(duì)這些指標(biāo)進(jìn)預(yù)處理,剔除統(tǒng)計(jì)量較小的數(shù)據(jù),最終得到12個(gè)指標(biāo),用于下面的建模分析。

2.相關(guān)性分析

使用學(xué)生在2016年6月考試成績(jī)作為成績(jī)變量與各個(gè)行為指標(biāo)進(jìn)行相關(guān)性分析,從各個(gè)指標(biāo)與成績(jī)之間的相關(guān)系數(shù)。從相關(guān)性分析可以看出:對(duì)于理科學(xué)生來(lái)說(shuō),遞交作業(yè)數(shù)、發(fā)給老師的私信數(shù)以及通知回復(fù)數(shù)這三個(gè)指標(biāo)與成績(jī)之間的相關(guān)性較高。

3.因子分析

利用因子分析法對(duì)多個(gè)行為指標(biāo)進(jìn)行降維處理,即用少量的綜合指標(biāo)來(lái)替代多個(gè)可觀測(cè)變量,便于把握主要影響因素。主要包括以下步驟:

首先,要判斷數(shù)據(jù)是否適合做因子分析,采用對(duì)數(shù)據(jù)進(jìn)行KMO值和Bartlett球形度檢驗(yàn)。基于實(shí)際數(shù)據(jù)計(jì)算,理科學(xué)生的KM0統(tǒng)計(jì)量的值分別為0.697,根據(jù)評(píng)判標(biāo)準(zhǔn)可知,KMO統(tǒng)計(jì)量的值大于0.6,適合做因子分析;Bartlett球形度檢驗(yàn)的卡方的P值小于0.01的顯著性水平,同樣顯示適合做因子分析。

其次,選取基于主成分分析的提取方式對(duì)原始變量進(jìn)行因子提取。運(yùn)用社會(huì)學(xué)統(tǒng)計(jì)軟件SPSS進(jìn)行因子分析。通過(guò)對(duì)原始變量采取主成分分析,依據(jù)Kaiser標(biāo)準(zhǔn)(特征根大于1)來(lái)提取因子,可以得出特征根大于1的因子有4個(gè)。在此基礎(chǔ)上使用正交旋轉(zhuǎn)的方式計(jì)算4個(gè)因子的方差貢獻(xiàn)率如下頁(yè)表4所示。

從下頁(yè)表4可以看出,這4個(gè)主因子的方差貢獻(xiàn)率分別為:23.297%,16.873%,14.859%,8.974%。累計(jì)方差貢獻(xiàn)率為64.003%,通過(guò)這4個(gè)主因子可以反映原有12個(gè)初始變量的64.003%信息量,因而可作為原有12個(gè)變量的主因子。其中因子1的解釋率為23.297%,顯著高于其他因子,是學(xué)生主觀行為對(duì)成績(jī)影響的首要因子。

第三,利用因子載荷陣進(jìn)行旋轉(zhuǎn),對(duì)4個(gè)因子所反映的變量信息進(jìn)行解釋。由于初始提取的公共因子的涵義并不是很清晰,需要對(duì)初始的因子載荷陣進(jìn)行旋轉(zhuǎn),這樣可以使因子載荷矩陣結(jié)構(gòu)更加簡(jiǎn)化,以方便對(duì)每個(gè)因子進(jìn)行解釋。按照方差最大正交旋轉(zhuǎn)對(duì)初始因子載荷矩陣進(jìn)行旋轉(zhuǎn),旋轉(zhuǎn)之后因子載荷矩陣如表5所示。

從表5可以看出,每個(gè)主因子都包含著各自的主要變量(表中每個(gè)因子灰度顯示的變量),根據(jù)各自變量的含義,對(duì)4個(gè)主因子進(jìn)行維度說(shuō)明。因子1主要反映了學(xué)生作業(yè)的遞交、修改和錯(cuò)題情況,以及對(duì)老師通知的回復(fù)和私信的發(fā)送,故將因子1命名為“自主學(xué)習(xí)因子”。同理,將因子2命名為“微課觀看因子”;因子3命名為“微課交流因子”;因子4命名為“非微課點(diǎn)贊因子”。

從因子分析的結(jié)果來(lái)看,影響理科生成績(jī)主要的主觀因子是自主學(xué)習(xí)因子、微課觀看因子、微課交流因子、非微課點(diǎn)贊因子;其中權(quán)重最大的自主學(xué)習(xí)因子主要包含遞交作業(yè)數(shù),通知回復(fù)數(shù),發(fā)給老師私信數(shù),與學(xué)生互批作業(yè)數(shù),錯(cuò)題總數(shù)等;自主學(xué)習(xí)因子與理科生成績(jī)有著直接關(guān)系。

4.多元回歸分析

為了擬合成績(jī)與主觀行為指標(biāo)之間的具體關(guān)系并確定對(duì)成績(jī)的顯著性影響指標(biāo),這里使用理科學(xué)生2016年6月考試成績(jī)作為因變量,并以提取的主觀行為指標(biāo)作為自變量進(jìn)行多元回歸分析。為防止變量間存在共線性現(xiàn)象,應(yīng)利用方差膨脹因子VIF進(jìn)行判斷。按照統(tǒng)計(jì)經(jīng)驗(yàn):當(dāng)O

通過(guò)首輪計(jì)算可以看出,微課觀看個(gè)數(shù)和微課觀看次數(shù)之間存在較強(qiáng)的多重共線性。刪除微課觀看個(gè)數(shù),再進(jìn)行多元回歸分析輸出結(jié)果如表6所示。

從輸出的VIF值可以看出,刪除微課觀看個(gè)數(shù)之后,指標(biāo)之間不存在多重共線性。

(四)結(jié)論

對(duì)于理科來(lái)說(shuō),從回歸分析的輸出結(jié)果可以看出,在0.05的顯著性水平下,根回復(fù)微課次數(shù)、遞交作業(yè)數(shù)、與學(xué)生互批作業(yè)數(shù)這3個(gè)變量對(duì)成績(jī)的影響是顯著的。根回復(fù)微課次數(shù)、與學(xué)生互批作業(yè)數(shù)的系數(shù)分別為-3.375、-3.658,對(duì)成績(jī)產(chǎn)生負(fù)的影響;遞交作業(yè)數(shù)的系數(shù)為0.326,對(duì)成績(jī)產(chǎn)生正的影響。影響理科學(xué)生成績(jī)的主要指標(biāo)是根回復(fù)微課次數(shù)、遞交作業(yè)數(shù)、與學(xué)生互批作業(yè)數(shù)。

收稿日期:2017年11月11日

責(zé)任編輯:宋靈青

猜你喜歡
教育大數(shù)據(jù)學(xué)習(xí)分析數(shù)據(jù)挖掘
數(shù)據(jù)挖掘綜述
“教育大數(shù)據(jù)”視角下的精準(zhǔn)教學(xué)的研究
教育大數(shù)據(jù)在教育管理中的運(yùn)用分析
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
大數(shù)據(jù)思維下教學(xué)過(guò)程數(shù)據(jù)分析及應(yīng)用研究
在線學(xué)習(xí)過(guò)程管理大數(shù)據(jù)的建設(shè)與應(yīng)用
簡(jiǎn)析小學(xué)勞動(dòng)與技術(shù)教育的有效合作學(xué)習(xí)
淺析大數(shù)據(jù)在教育中的應(yīng)用
基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
一本面向中高級(jí)讀者的數(shù)據(jù)挖掘好書
包头市| 来安县| 崇州市| 延安市| 土默特右旗| 剑阁县| 东安县| 梨树县| 丰镇市| 屯昌县| 晋城| 淮滨县| 枣强县| 蕲春县| 长白| 凌源市| 金沙县| 澎湖县| 岢岚县| 喀喇沁旗| 沾化县| 茂名市| 长沙市| 高唐县| 宾阳县| 景德镇市| 四平市| 阿拉尔市| 榆林市| 石嘴山市| 枣强县| 吉隆县| 舞钢市| 静乐县| 新兴县| 晋州市| 新密市| 左贡县| 和顺县| 稷山县| 嫩江县|