[摘?要]在線教育具有跨越時(shí)空局限性、聚集海量資源的優(yōu)勢,也因此成為開放教育的重要組織形式。對在線教育過程中產(chǎn)生的學(xué)生學(xué)習(xí)行為數(shù)據(jù)進(jìn)行挖掘和分析,可以為在線教學(xué)的課程改革、教學(xué)組織、資源建設(shè)、教學(xué)評價(jià)、學(xué)生學(xué)習(xí)行為及特征跟蹤識別提供有效支撐。本文結(jié)合聚類算法與Tableau 可視化軟件,對開放大學(xué)在線教育中的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行分析和可視化呈現(xiàn),為在線教育優(yōu)化設(shè)計(jì)提供有效支撐。
[關(guān)鍵詞]在線教育;開放大學(xué);聚類算法;可視化;Tableau
[中圖分類號]??G434?[文獻(xiàn)標(biāo)識碼]?A?[文章編號]1008-4649(2020)01-0015-04
Analysis of Education Data in Online Education
Dong Honghua
(Xi'an University of Architecture and Technology,Xi'an ?710055)
Abstract:Online education has the advantages of transcending the limitation of time and space and gathering massive resources, so it has become an important organizational form of open education. Mining and analyzing the data of students' learning behavior in the process of online education can provide effective support for the course reform, teaching organization, resource construction, teaching evaluation, students' learning behavior and feature tracking and recognition of online education. This paper combines clustering algorithm and tableau visualization software to analyze and visualize the learning behavior data in online education of Open University, which provides effective support for online education optimization design.
Key word: Online education;Open University;Clustering algorithm;Visualization;Tableau
引?言
面對海量的用戶和多元化的教育需求,如何實(shí)現(xiàn)精準(zhǔn)的教育服務(wù),是當(dāng)下在線教育發(fā)展面臨的主要問題,但是海量的教育學(xué)習(xí)行為數(shù)據(jù),又增加了統(tǒng)計(jì)分析的復(fù)雜性和難度。大數(shù)據(jù)時(shí)代的到來,大量數(shù)據(jù)挖掘分析工具和技術(shù)的涌入,為在線教育數(shù)據(jù)的分析提供了諸多支撐。Tableau是一款應(yīng)用于數(shù)據(jù)管理和數(shù)據(jù)可視化的工具軟件,其將數(shù)據(jù)運(yùn)算與可視化的圖標(biāo)有效融合為一體,可將海量的學(xué)習(xí)行為數(shù)據(jù),通過自帶的數(shù)據(jù)分析工具,創(chuàng)建直觀、可視化的圖表,幫助用戶簡化數(shù)據(jù)分析的過程,快速獲取數(shù)據(jù)分析結(jié)果,從而為優(yōu)化在線教育過程提供支撐依據(jù)。
1.在線教育數(shù)據(jù)分析的目標(biāo)定位
在線教育是一種基于網(wǎng)絡(luò)化教學(xué)平臺和資源,支持學(xué)生在線、自主、碎片式學(xué)習(xí)的應(yīng)用支撐,其融合了現(xiàn)代智能化設(shè)備和技術(shù),可利用圖文、音視頻等多媒體形式立體化呈現(xiàn)教學(xué)資源,并將師生的教與學(xué)的行為數(shù)據(jù)、學(xué)習(xí)者特征數(shù)據(jù)、評價(jià)互動、交互學(xué)習(xí)等海量數(shù)據(jù)記錄并存儲下來,成為在線教育數(shù)據(jù)中的重要組成。透過這些海量的、具有高度教育價(jià)值的大數(shù)據(jù)分析,經(jīng)由數(shù)據(jù)準(zhǔn)備、預(yù)處理、挖掘、統(tǒng)計(jì),可以從中提取出在線教育課堂在課時(shí)安排、資源內(nèi)容、教學(xué)方法上存在的顯著問題,也可以跟蹤、識別學(xué)生的學(xué)習(xí)狀態(tài)、偏好和行為習(xí)慣,從而有的放矢地整合課程資源、優(yōu)化教學(xué)模式、設(shè)計(jì)教學(xué)情景,滿足在線教育智能化服務(wù)需求和發(fā)展的要求,將在線教育推向更高的層次和水平。
2.在線教育數(shù)據(jù)分析的工具選擇董洪華.在線教育中的教育數(shù)據(jù)分析[J].陜西廣播電視大學(xué)學(xué)報(bào),2020,(1).
在線教育數(shù)據(jù)分析的意義在于利用數(shù)據(jù)挖掘工具和方法,準(zhǔn)確識別學(xué)生多樣性、個(gè)性化的學(xué)習(xí)特點(diǎn)和需求。目前,捕獲、存儲、處理和分析這些數(shù)據(jù)的工具和方法不斷涌現(xiàn),而如何高效、準(zhǔn)確提取有價(jià)值的信息,是在線教育數(shù)據(jù)分析的根本要求。
Tableau可視化分析軟件是應(yīng)用最為廣泛的一款可視化數(shù)據(jù)分析和顯示工具,其具有智能運(yùn)算和簡便操作性,能夠適用不同領(lǐng)域的數(shù)據(jù)分析,可以立體、形象的圖標(biāo)形式,將繁雜、海量的數(shù)據(jù)直觀的呈現(xiàn)出來。Tableau融合了文本形式、excel表格、統(tǒng)計(jì)文件、SON等不同類型數(shù)據(jù),可以遠(yuǎn)程鏈接數(shù)據(jù)庫服務(wù)器,便捷和數(shù)據(jù)的存儲、調(diào)取和分析,特別是Tableau軟件無需復(fù)雜的編程開發(fā),采用拖拽的方式便可快速生成數(shù)據(jù)圖表,簡化的運(yùn)算過程和步驟,并以優(yōu)化的圖形展示界面來為用戶提供數(shù)據(jù)查詢、分析支撐;同時(shí)無需導(dǎo)引或程序編寫,就可以跟隨不同用戶的思維軌跡,進(jìn)行視圖的智能切換,數(shù)據(jù)運(yùn)算分析效率顯著優(yōu)于一般工具。正是因?yàn)門ableau的以上特點(diǎn),本文將采用該軟件對國家開放大學(xué)陜西分部2019年秋季的學(xué)習(xí)行為數(shù)據(jù)集進(jìn)行挖掘和分析,力求從多維度提取學(xué)習(xí)者特征和學(xué)習(xí)情況,為進(jìn)一步提供個(gè)性化的在線教育服務(wù)提供支撐依據(jù)。
3.在線教育數(shù)據(jù)的可視化分析
3.1數(shù)據(jù)來源
就讀于國家開放大學(xué)陜西分部的學(xué)生在學(xué)業(yè)持續(xù)期,都需要通過指定平臺進(jìn)行注冊,選課、發(fā)帖、測試、課程學(xué)習(xí)、形成性考核,這些過程中產(chǎn)生的數(shù)據(jù)也成為對學(xué)生群體進(jìn)行分析的重要依據(jù),下面將通過選取2019年秋季國家開放大學(xué)陜西分部的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行分析。
3.2學(xué)習(xí)者行為的聚類分析
2019年秋季國家開放大學(xué)陜西分部的學(xué)生中包括了不同地域、學(xué)歷層次、年齡和性別的學(xué)習(xí)者,其學(xué)習(xí)基礎(chǔ)、能力和偏好等存在較大差異,為便于對海量學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,首先需要對學(xué)習(xí)者進(jìn)行聚類分析,以準(zhǔn)確識別、認(rèn)知不同類學(xué)習(xí)者的特征和學(xué)習(xí)狀態(tài)。
目前,大數(shù)據(jù)挖掘技術(shù)中聚類分析方法,基于距離的聚類算法K-means是應(yīng)用最廣泛的群組分類方法,下面將選用瀏覽數(shù)、行為總數(shù)、學(xué)習(xí)平臺登錄數(shù)、登陸次數(shù)、在線天數(shù)等建立聚類中心,應(yīng)用k-means聚類分析算法將特征相似的學(xué)習(xí)者劃歸為一類,對不同類學(xué)生的行為數(shù)據(jù)進(jìn)行聚類分析,具體的聚類分析依據(jù)如下:
(1)第一類學(xué)習(xí)者,筆者將其取名為過關(guān)取證型,這類學(xué)習(xí)者在線學(xué)習(xí)的時(shí)間和頻率較少,學(xué)習(xí)行為一般集中在形考作業(yè)布置的時(shí)間段,也就是說,這些學(xué)習(xí)者基于自我提升的學(xué)習(xí)要求并不高,僅僅是滿足于完成學(xué)習(xí)任務(wù),獲取學(xué)分,該類學(xué)習(xí)者只是在形式上關(guān)注師生的互動評論,但參與實(shí)質(zhì)性的課堂學(xué)習(xí)較少,對于相關(guān)課程內(nèi)容、教學(xué)資源更多的簡單瀏覽,形成性考核往往在最后要求的時(shí)間點(diǎn)完成,可將其歸類為觀測者類型。
(2)第二類學(xué)習(xí)者,筆者將其取名為勤奮學(xué)習(xí)型,這類學(xué)習(xí)者在線學(xué)習(xí)的時(shí)間較長,學(xué)習(xí)頻率較高,能夠根據(jù)教學(xué)安排學(xué)習(xí)教學(xué)資源、開展互動交流,按時(shí)甚至提前完成學(xué)習(xí)和作業(yè)任務(wù),作業(yè)完成質(zhì)量較好,特別是能夠結(jié)合自身的工作實(shí)踐與教師開展專業(yè)問題交流,該類學(xué)習(xí)者的學(xué)習(xí)目標(biāo)顯然不是定位于獲取學(xué)分和畢業(yè)證書,而是通過在線教育獲得更加切實(shí)有用的行業(yè)知識。可將其歸類為具有較強(qiáng)學(xué)習(xí)意愿的堅(jiān)持學(xué)習(xí)者。
Tableau軟件的集群統(tǒng)計(jì)功能可兼容K-means聚類分析方法,只需要拖拽擬分析的數(shù)據(jù)字段,便可實(shí)現(xiàn)高效、準(zhǔn)確的聚類分析,省略了復(fù)雜編程、數(shù)據(jù)運(yùn)算過程。根據(jù)上述聚類分析標(biāo)準(zhǔn),利用Tableau可視化軟件,運(yùn)用其儀表板中顯示的各類型圖形,使用Tableau的“Show Me”功能便可將聚類數(shù)據(jù)拖拽至圖表之中,完成可視化的聚類分析,聚類分析中,隨機(jī)劃分的中心點(diǎn)K值可自主設(shè)定也可由Tableau軟件自動判定,剔除無效數(shù)據(jù)后將生成兩種種群組,結(jié)果如圖1所示。
依據(jù)聚類分析結(jié)果,結(jié)合上圖1可以看出,對于2019年秋季國家開放大學(xué)陜西分部89978名學(xué)生的學(xué)習(xí)行為記錄聚類后,第一類過關(guān)取證型(group1),共聚集72639名學(xué)生,占學(xué)生總比例80.7%;第二類勤奮學(xué)習(xí)型(group2),共聚集17339名學(xué)生,占學(xué)生總比例19.3%。
3.3學(xué)習(xí)者學(xué)習(xí)狀態(tài)分析
鑒于在線教育的開放性、資源優(yōu)勢性,其學(xué)習(xí)者眾多,且特征和基礎(chǔ)不一,為了更進(jìn)一步測度不同類型學(xué)習(xí)者的學(xué)習(xí)狀態(tài),獲取更加有效的分析指標(biāo),從而對在線教育的教學(xué)方法、教學(xué)監(jiān)督過程、考核方式等進(jìn)行實(shí)時(shí)修正,有必要將經(jīng)過K-means聚類分析后的兩類學(xué)習(xí)者群組的學(xué)生行為各聚類指標(biāo)進(jìn)行對比,來分析影響學(xué)習(xí)效果的各項(xiàng)因素,分析結(jié)果如圖2所示。
由上圖可以看出,兩類學(xué)生學(xué)習(xí)行為的最主要差異在于xingweizongshu(行為總數(shù))和liulanshu(瀏覽數(shù)),第二類勤奮學(xué)習(xí)型學(xué)生(Cluster_grouping_1)的xingweizongshu、liulanshu數(shù)值明顯高于第一類過關(guān)取證型型學(xué)生(Cluster_grouping_0)數(shù)倍。在圖2中可以明顯看到第二類勤奮學(xué)習(xí)型學(xué)生(Cluster_grouping_1)的xuexipingtaidenglucishu數(shù)值線,而第一類過關(guān)取證型(Cluster_grouping_0)學(xué)生該項(xiàng)指標(biāo)幾乎沒有數(shù)值線。其相應(yīng)的學(xué)習(xí)效果無疑將存在很大差別。
接下來,再對兩類學(xué)生聚類指標(biāo)的均值進(jìn)行對比,用Tableau生成圖表如下圖3所示,可以看出,第一類過關(guān)取證型(一組聚類指標(biāo))學(xué)生的登錄平均次數(shù)為40.64次,其行為總數(shù)平均值634.62次和瀏覽數(shù)的平均值364.81次;而第二類勤奮學(xué)習(xí)型(二組聚類指標(biāo))學(xué)生的登錄次數(shù)為268.59次,其行為總數(shù)平均值為5208.56次和瀏覽數(shù)平均值為2909.12次。第二類學(xué)生的各項(xiàng)指標(biāo)明顯高于第一類學(xué)生,二者的學(xué)習(xí)效果頁體現(xiàn)在形考成績的較大差異。
綜合上述結(jié)果可知,為學(xué)生提供資源豐富的開放在線學(xué)習(xí)平臺,可以有效的適應(yīng)開放大學(xué)來源多樣的學(xué)習(xí)者,同時(shí)為學(xué)習(xí)者提供靈活自主的學(xué)習(xí)方式,但是有相當(dāng)一部分學(xué)習(xí)者,雖然具有較高的學(xué)習(xí)熱情,但是在學(xué)習(xí)過程中,只是為了獲得學(xué)分而開展學(xué)習(xí),這種功利化的學(xué)習(xí)方法大大影響了學(xué)習(xí)的主動性和持久性,更影響到實(shí)質(zhì)知識水平的提高。
結(jié)束語
信息化時(shí)代下,在線教育利用智能終端設(shè)備、無線通訊技術(shù)及網(wǎng)絡(luò)化平臺等優(yōu)勢,為學(xué)生提供隨時(shí)隨地的學(xué)習(xí)支撐,為了全面優(yōu)化在線教育服務(wù),在激烈的市場競爭中謀求發(fā)展優(yōu)勢,開放大學(xué)需要借助現(xiàn)代大數(shù)據(jù)挖掘分析技術(shù)對繁雜、無序的教育數(shù)據(jù)進(jìn)行深度分析、準(zhǔn)確識別,以得出有利于教育優(yōu)化的決策結(jié)論。本文針對大數(shù)據(jù)時(shí)代下,數(shù)據(jù)分析及可視化呈現(xiàn)的需求,結(jié)合開放大學(xué)的學(xué)習(xí)行為數(shù)據(jù)和聚類分析算法,應(yīng)用Tableau可視化分析軟件生成數(shù)據(jù)分析圖表,幫助管理者分析者快速識別不同的學(xué)習(xí)群體,為進(jìn)一步分析更加具有應(yīng)用價(jià)值的教育數(shù)據(jù),優(yōu)化在線教育的教學(xué)行為,提升在線教育教學(xué)效果提供依據(jù)。
[參考文獻(xiàn)]
[1]陳佳艷.基于Tableau實(shí)現(xiàn)在線教育大數(shù)據(jù)的可視化分析[J].江蘇商論,2018(02):123-125.
[2]陳雷.教師在線教育環(huán)境下大數(shù)據(jù)的應(yīng)用——以浙江省平臺中的課程為例[J].繼續(xù)教育,2017,31(09):7-11.
[3]申強(qiáng)華,張立群.在線教育的大數(shù)據(jù)分析實(shí)施探討[J].信息技術(shù)與信息化,2016(11):96-100.
[4]唐晉韜,劉越,寧洪,王挺.面向大規(guī)模在線學(xué)習(xí)平臺的教育數(shù)據(jù)分析研究綜述[J].計(jì)算機(jī)教育,2015(21):37-40.
[責(zé)任編輯?王愛萍]