国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的高校學(xué)生在線學(xué)習(xí)平臺(tái)數(shù)據(jù)研究

2021-11-04 11:01薛新鵬楊杉
現(xiàn)代信息科技 2021年9期
關(guān)鍵詞:可視化分析大數(shù)據(jù)分析

薛新鵬 楊杉

DOI:10.19850/j.cnki.2096-4706.2021.09.022

摘? 要:文章從四川某高校學(xué)生在線學(xué)習(xí)平臺(tái)的后臺(tái)分別獲取疫情前和疫情后的學(xué)習(xí)數(shù)據(jù),并進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘以及學(xué)生畫像這三大主題的分析。其中數(shù)據(jù)分析采用了頻數(shù)統(tǒng)計(jì),獨(dú)立樣本T檢驗(yàn)分析方法;數(shù)據(jù)挖掘則以貝葉斯分析為主題;學(xué)生畫像以學(xué)院作為主題,對(duì)數(shù)據(jù)內(nèi)的兩類數(shù)據(jù)進(jìn)行了可視化分析。

關(guān)鍵詞:大數(shù)據(jù)分析;可視化分析;SPSS;學(xué)習(xí)平臺(tái)后臺(tái)數(shù)據(jù)分析

中圖分類號(hào):TP391.4? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2021)09-0083-05

Data Research on College StudentsOnline Learning Platform Based on Big Data

XUE Xinpeng,YANG Shan

(School of Computer and Software,Jincheng College of Sichuan University,Chengdu? 611731,China)

Abstract:This paper obtains the learning data before and after the epidemic from the background of student online learning platform in a college in Sichuan,and carries out three themes of analysis,namely data analysis,data mining and student portrait. Among them,frequency statistics and independent sample student's T test analysis method are used for data analysis;data mining focuses on Bayesian analysis;takes the college as the theme for student portrait and makes a visual analysis of the two types of data in the data.

Keywords:big data analysis;visual analysis;SPSS;background data analysis of learning platform

0? 引? 言

互聯(lián)網(wǎng)所帶來的便利就是為我們的學(xué)習(xí)提供了更多的選擇,而大數(shù)據(jù)的發(fā)展也為我們提供了更多的可能性,通過搜集學(xué)生的學(xué)習(xí)行為數(shù)據(jù)推斷其學(xué)習(xí)的進(jìn)度和學(xué)習(xí)的狀態(tài)以及學(xué)習(xí)狀況,學(xué)校對(duì)學(xué)生的各項(xiàng)信息有更加直觀的了解,并對(duì)其進(jìn)行更好的學(xué)習(xí)提供指導(dǎo)。尤其是疫情以來,網(wǎng)絡(luò)教學(xué)成為各個(gè)學(xué)校最主要的教學(xué)方式,學(xué)生的學(xué)習(xí)數(shù)據(jù)是高等學(xué)校非常重要的一項(xiàng)數(shù)據(jù)資源,是一個(gè)教育機(jī)構(gòu)不可或缺的一部分,對(duì)于學(xué)生的日常表現(xiàn),成績情況,課堂表現(xiàn)以及后勤管理等都有很好的參考作用。并且根據(jù)線上的數(shù)據(jù)對(duì)各個(gè)學(xué)院進(jìn)行學(xué)生畫像可視化分析,也能夠清晰地看出各學(xué)院疫情前和疫情后的在線學(xué)習(xí)平臺(tái)的使用情況的變化。

1? 研究思路

以四川省某高校在線學(xué)習(xí)平臺(tái)疫情前后學(xué)習(xí)數(shù)據(jù)為研究對(duì)象,進(jìn)行數(shù)據(jù)預(yù)處理以及數(shù)據(jù)清洗等數(shù)據(jù)分析前的基本處理,隨后分別對(duì)疫情前和疫情后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)挖掘以及學(xué)生畫像可視化分析。其中數(shù)據(jù)分析以及數(shù)據(jù)挖掘采用了SPSS數(shù)據(jù)分析軟件,使用頻數(shù)統(tǒng)計(jì),獨(dú)立樣本T檢驗(yàn)和貝葉斯等分析方法;學(xué)生畫像可視化分析采用了Python以及圖表秀,以學(xué)院為基礎(chǔ),分類對(duì)各學(xué)院考試完成數(shù)以及各學(xué)院視頻任務(wù)點(diǎn)完成數(shù)進(jìn)行了各學(xué)院的畫像,并對(duì)其畫像所得出的分布比例進(jìn)行數(shù)據(jù)的對(duì)比分析。

2? 數(shù)據(jù)說明

2.1? 數(shù)據(jù)來源

以四川省某高校在線學(xué)習(xí)平臺(tái)疫情前后學(xué)習(xí)數(shù)據(jù)的統(tǒng)計(jì)表為基礎(chǔ)數(shù)據(jù),其中疫情前的數(shù)據(jù)為43 000條,疫情后的數(shù)據(jù)為26 000條,包括了觀看視頻總時(shí)長、任務(wù)點(diǎn)完成數(shù)、考試平均分、章節(jié)測(cè)驗(yàn)完成數(shù)等字段數(shù)據(jù)。

2.2? 數(shù)據(jù)清洗

我們對(duì)Excel數(shù)據(jù)工作表做了兩方面的清洗工作:第一是對(duì)與研究問題無關(guān)的行列進(jìn)行刪除和簡單的整理排序,將無用的或者是信息不完整的列或行進(jìn)行刪除,另外對(duì)部分不合理的數(shù)據(jù)進(jìn)行篩查,看其數(shù)值是否異常,如果存在異常,我們也對(duì)其進(jìn)行刪除處理。

3? 數(shù)據(jù)分析

3.1? 關(guān)于章節(jié)學(xué)習(xí)次數(shù)的疫情前后頻率統(tǒng)計(jì)

如表1、表2所示,根據(jù)疫情前后的數(shù)據(jù)對(duì)比,我們不難發(fā)現(xiàn)疫情前的學(xué)習(xí)數(shù)據(jù)大多在一百到兩百次的范圍區(qū)間內(nèi),學(xué)習(xí)次數(shù)為187次的占比達(dá)到了32%,而學(xué)習(xí)次數(shù)為0的占比為0.8%。再反觀疫情后的統(tǒng)計(jì)數(shù)據(jù),我們發(fā)現(xiàn)大多數(shù)的有效次數(shù)都在1 000左右,而有效次數(shù)為0的占比達(dá)到了4.8%,有效次數(shù)為1 166次的占比達(dá)到了12.3%,且1 000次左右的數(shù)據(jù)都相對(duì)分布較均勻,所以我們分析可以得出在疫情前的時(shí)期大家大多數(shù)都是在教室上課,并沒有太多的時(shí)間在學(xué)習(xí)通上學(xué)習(xí),而當(dāng)發(fā)生了疫情后,我們采用的為網(wǎng)絡(luò)教學(xué)的方式,在一定程度上增加了我們對(duì)學(xué)習(xí)通的使用次數(shù)。

3.2? 疫情前后不同年級(jí)學(xué)生的作業(yè)完成數(shù)與考試完成數(shù)的獨(dú)立樣本T檢驗(yàn)分析

如表3、表4所示,獨(dú)立樣本檢驗(yàn)表中作業(yè)完成數(shù)的顯著性為0,小于0.05,說明方差不具有齊次性,所以看第二行,根據(jù)顯著性(雙尾)為0.048,小于0.05,拒絕原假設(shè),即疫情前,高年級(jí)學(xué)生的作業(yè)完成數(shù)與低年級(jí)存在顯著差異,高年級(jí)學(xué)生的作業(yè)完成數(shù)平均值高于低年級(jí)的作業(yè)完成數(shù)平均值。獨(dú)立樣本檢驗(yàn)表中考試完成數(shù)的顯著性為0.098,大于0.05,說明方差具有齊次性,所以看第一行,根據(jù)顯著性(雙尾)為0.001,小于0.05,拒絕原假設(shè),即疫情前,高年級(jí)學(xué)生的考試完成數(shù)與低年級(jí)存在顯著差異,高年級(jí)學(xué)生的考試完成數(shù)平均高于低年級(jí)的考試完成數(shù)。

如表5、表6所示,獨(dú)立樣本檢驗(yàn)表中作業(yè)完成數(shù)的顯著性為0.005,小于0.05,說明方差不具有齊次性,所以看第二行,根據(jù)顯著性(雙尾)為0,小于0.05拒絕原假設(shè),即疫情后,高年級(jí)學(xué)生的作業(yè)完成數(shù)與低年級(jí)存在顯著差異,高年級(jí)學(xué)生的作業(yè)完成數(shù)平均低于低年級(jí)的作業(yè)完成數(shù)。獨(dú)立樣本檢驗(yàn)表中考試完成數(shù)的顯著性為0,小于0.05,說明方差不具有齊次性,所以看第二行,根據(jù)顯著性(雙尾)為0.447,大于0.05接受原假設(shè),即疫情后,高年級(jí)學(xué)生的考試完成數(shù)與低年級(jí)不存在顯著差異。

4? 數(shù)據(jù)挖掘

4.1? 對(duì)疫情前后作業(yè)完成數(shù)的數(shù)據(jù)進(jìn)行貝葉斯分析

疫情前后的貝葉斯分析如圖1所示。

圖1(a)中我們可以看到,疫情前的作業(yè)完成數(shù)對(duì)于視頻任務(wù)點(diǎn)完成數(shù)的依賴程度是最高的,其次是考試完成數(shù),對(duì)于章節(jié)學(xué)習(xí)次數(shù)基本沒有依賴,說明疫情前老師和學(xué)生們對(duì)于在線學(xué)習(xí)平臺(tái)的使用基本為視頻的學(xué)習(xí)。

圖1(b)中我們可以看到,疫情后的作業(yè)完成數(shù)對(duì)于考試完成數(shù)的依賴最大,其次是視頻任務(wù)點(diǎn)完成數(shù),同樣對(duì)于章節(jié)學(xué)習(xí)次數(shù)的依賴基本沒有,說明疫情期間老師和學(xué)生們大多都是進(jìn)行的網(wǎng)上學(xué)習(xí),因此對(duì)于網(wǎng)絡(luò)考試以及網(wǎng)絡(luò)視頻的學(xué)習(xí)次數(shù)增加,學(xué)習(xí)方式基本都為網(wǎng)絡(luò)學(xué)習(xí),而對(duì)于成績以及學(xué)習(xí)情況的檢查,也只能采取網(wǎng)絡(luò)考試來進(jìn)行,因此占比最大。

4.2? 疫情前關(guān)于學(xué)生考試完成數(shù)的支持向量機(jī)分析

首先在源數(shù)據(jù)的“類型”選項(xiàng)卡里對(duì)字段類型進(jìn)行設(shè)置。將將要預(yù)測(cè)的學(xué)生考試完成數(shù)作為目標(biāo)變量,其余變量作為預(yù)測(cè)變量,建立支持向量機(jī)模型,模式類型對(duì)比選擇RBF模式和專家模式,并且計(jì)算預(yù)測(cè)變量重要性,從而生成結(jié)果。

如圖2所示,當(dāng)內(nèi)核設(shè)置為RBF時(shí),模型正確率為97.01%,且最重要的變量是任務(wù)點(diǎn)完成數(shù),重要性是0.37,次要影響的變量為視頻任務(wù)點(diǎn)完成數(shù)為0.27,其他依次是作業(yè)完成數(shù)、章節(jié)測(cè)驗(yàn)完成數(shù)、課程專題閱讀時(shí)長、簽到完成樹、討論總數(shù)、發(fā)帖總數(shù)、回帖總數(shù)和課程積分。

當(dāng)內(nèi)核設(shè)置為多項(xiàng)式時(shí),模型正確率為97.06%,且最重要的變量是任務(wù)點(diǎn)完成數(shù),重要性是0.36,次要影響的變量為視頻任務(wù)點(diǎn)完成數(shù)為0.23,其他依次是作業(yè)完成數(shù)、章節(jié)測(cè)驗(yàn)完成數(shù)、簽到完成數(shù)、課程專題閱讀時(shí)長、討論總數(shù)、發(fā)帖總數(shù)、回帖總數(shù)和課程積分。

通過RBF模型與多項(xiàng)式模型預(yù)測(cè)正確率的對(duì)比,發(fā)現(xiàn)多項(xiàng)式的正確更高,顯然多項(xiàng)式模型更適合于預(yù)測(cè)本數(shù)據(jù)集。

5? 學(xué)生畫像可視化

從圖3中我們可以看到疫情后各個(gè)學(xué)院考試完成數(shù)的一個(gè)數(shù)量分布情況。我們可以清晰地看到在疫情后的考試完成數(shù)的一個(gè)環(huán)形的數(shù)量分布圖,其中計(jì)算機(jī)學(xué)院所占的比例最大,金融學(xué)院第二,建筑學(xué)院第三,外語學(xué)院第四,電子信息學(xué)院第四,藝術(shù)學(xué)院第五,土木與環(huán)境工程學(xué)院第六,文學(xué)與傳媒學(xué)院第七,工商管理學(xué)院排在最后。但是根據(jù)我們前面的頻數(shù)統(tǒng)計(jì),可以看到各學(xué)院的學(xué)習(xí)平臺(tái)的考試次數(shù)都得到了很大的提升,說明自疫情以來學(xué)習(xí)方式以及考試等方式都逐漸轉(zhuǎn)為了網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)進(jìn)行。

從圖4中我們可以看到疫情后各個(gè)學(xué)院視頻任務(wù)點(diǎn)完成數(shù)的一個(gè)數(shù)量分布情況。其中計(jì)算機(jī)與軟件學(xué)院的數(shù)量排在第一位,藝術(shù)學(xué)院排在第二位,金融學(xué)院排在第三位,外國語學(xué)院排在第四位,土木與環(huán)境工程學(xué)院排在第五位,文學(xué)與傳媒學(xué)院排在第六位,工商管理學(xué)院排在第七位,建筑學(xué)院排在第八位,電子信息學(xué)院排在最后。這說明了計(jì)算機(jī)與軟件學(xué)院對(duì)于學(xué)生在線學(xué)習(xí)平臺(tái)的使用要多于其他學(xué)院,并且計(jì)算機(jī)與軟件學(xué)院的教學(xué)方式可能主要是以觀看視頻進(jìn)行學(xué)習(xí),并結(jié)合課堂上的知識(shí)進(jìn)行學(xué)習(xí)。

6? 結(jié)? 論

根據(jù)對(duì)三個(gè)主題的分析,我們得出以下結(jié)論:首先疫情前同學(xué)們對(duì)于學(xué)生在線學(xué)習(xí)平臺(tái)的使用情況沒有疫情后那么頻繁。其次疫情前對(duì)于學(xué)生在線學(xué)習(xí)平臺(tái)的使用,大多都為視頻的觀看和章節(jié)測(cè)驗(yàn)等;而疫情后由于在家網(wǎng)上學(xué)習(xí),因此對(duì)于考試功能的使用相較于疫情前變得更加頻繁。而通過客戶畫像數(shù)據(jù)分析我們能夠得出,計(jì)算機(jī)與軟件學(xué)院對(duì)于學(xué)生在線學(xué)習(xí)平臺(tái)的使用頻率以及功能的使用情況遠(yuǎn)遠(yuǎn)高于其他學(xué)院。

根據(jù)對(duì)學(xué)生線上學(xué)習(xí)平臺(tái)的使用情況的分析,我們提出以下建議:首先可以適當(dāng)加強(qiáng)學(xué)生在線學(xué)習(xí)平臺(tái)其他功能的使用,如發(fā)帖回帖以及討論,因?yàn)橐恍W(xué)生害羞,不會(huì)直接當(dāng)面找老師進(jìn)行學(xué)習(xí)以及問問題,就可以在網(wǎng)絡(luò)上發(fā)帖與老師進(jìn)行學(xué)習(xí)上的探討。其次可以刪除對(duì)于學(xué)生在線學(xué)習(xí)平臺(tái)直播課的功能,因?yàn)橐咔槠陂g大家都是使用的騰訊會(huì)議,使用學(xué)生在線學(xué)習(xí)平臺(tái)直播課的功能的時(shí)候比較少,且平臺(tái)使用不穩(wěn)定,因此可以對(duì)這個(gè)功能進(jìn)行刪除。最后我們建議可以多使用課堂搶答的功能,這樣不僅能促進(jìn)課堂氣氛,也能培養(yǎng)學(xué)生的學(xué)習(xí)以及回答問題的積極性。

參考文獻(xiàn):

[1] 曹玉茹.基于SPSS的多選項(xiàng)問題研究 [J].統(tǒng)計(jì)與決策,2020,36(10):55-58.

[2] 吳華斌.大數(shù)據(jù)的統(tǒng)計(jì)分析淺議 [J].經(jīng)濟(jì)師,2014(10):277-280.

[3] 賀玲.大數(shù)據(jù)背景下統(tǒng)計(jì)軟件在數(shù)據(jù)分析中的運(yùn)用 [J].經(jīng)貿(mào)實(shí)踐,2018(4):328+330.

[4] 文穎.大數(shù)據(jù)時(shí)代數(shù)據(jù)分析中統(tǒng)計(jì)軟件的運(yùn)用研究 [J].信息與電腦(理論版),2017(6):97-98.

[5] 程澤凱,佘星星,謝寧宇.網(wǎng)絡(luò)教學(xué)平臺(tái)學(xué)生學(xué)習(xí)數(shù)據(jù)分析 [J].常州工學(xué)院學(xué)報(bào),2019,32(2):77-80.

作者簡介:薛新鵬(2000-),男,漢族,四川成都人,本科在讀,研究方向:數(shù)據(jù)挖掘、大數(shù)據(jù)。

收稿日期:2021-03-02

猜你喜歡
可視化分析大數(shù)據(jù)分析
我國職業(yè)教育師資研究熱點(diǎn)可視化分析
面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
聲波吹灰技術(shù)在SCR中的應(yīng)用研究
面向大數(shù)據(jù)分析的信息管理實(shí)踐教學(xué)體系構(gòu)建
傳媒變局中的人口電視欄目困境與創(chuàng)新
可視化分析技術(shù)在網(wǎng)絡(luò)輿情研究中的應(yīng)用
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)