国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在高校學(xué)生學(xué)業(yè)預(yù)警中的應(yīng)用

2017-03-27 10:49宮鋒
電子技術(shù)與軟件工程 2017年4期
關(guān)鍵詞:決策樹數(shù)據(jù)挖掘

摘 要 使用ID3算法對(duì)高校學(xué)生的學(xué)籍信息數(shù)據(jù)和學(xué)生日常表現(xiàn)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,分析學(xué)生的學(xué)籍信息中的屬性、學(xué)生日常表現(xiàn)對(duì)于學(xué)生預(yù)警的影響,并以數(shù)據(jù)挖掘結(jié)果建立學(xué)生學(xué)業(yè)預(yù)警的決策樹,為教學(xué)管理、學(xué)生管理提供數(shù)據(jù)支持。

【關(guān)鍵詞】決策樹 學(xué)業(yè)預(yù)警 數(shù)據(jù)挖掘 ID3

“學(xué)業(yè)預(yù)警”作為一種預(yù)防學(xué)生學(xué)業(yè)成績下滑的管理制度源自于江西理工大學(xué)2006年在校內(nèi)實(shí)施的“學(xué)業(yè)預(yù)警”制度。當(dāng)今許多高校在校內(nèi)實(shí)施“學(xué)業(yè)預(yù)警”制,并建有符合各自高校的學(xué)業(yè)預(yù)警標(biāo)準(zhǔn)。但在實(shí)際實(shí)施過程中由于都是在學(xué)年結(jié)束后人工統(tǒng)計(jì)學(xué)生的學(xué)分獲得情況或通過計(jì)算機(jī)匯總統(tǒng)計(jì)學(xué)生的學(xué)分情況,所以一般情況下,學(xué)生都是在學(xué)業(yè)問題比較嚴(yán)重的時(shí)候才被發(fā)現(xiàn),才被預(yù)警。

造成學(xué)生“學(xué)業(yè)預(yù)警”滯后的主要原因是高校沒有有效利用學(xué)校在教學(xué)與管理過程中積累的大量原始數(shù)據(jù)。這些沉睡的數(shù)據(jù)背后可能隱藏著不為我們所知的但又對(duì)我們的各種管理工作十分有用的規(guī)律或知識(shí)。數(shù)據(jù)挖掘技術(shù)可以通過科學(xué)的分析、挖掘從數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律或模式。將數(shù)據(jù)挖掘技術(shù)與學(xué)生的學(xué)籍信息和學(xué)生日常表現(xiàn)數(shù)據(jù)結(jié)合,尋找“學(xué)業(yè)預(yù)警”學(xué)生的發(fā)展變化規(guī)律,盡可能體現(xiàn)發(fā)現(xiàn)學(xué)生可能被預(yù)警的苗頭,降低學(xué)生預(yù)警率,提高高校的教育教學(xué)水平和學(xué)生管理水平。

1 決策樹技術(shù)概述

決策樹技術(shù)是數(shù)據(jù)挖掘的一個(gè)重要的研究分支,是采用樹結(jié)構(gòu)算法將數(shù)據(jù)劃分成離散類的方法,其主要作用和目的是揭示大量數(shù)據(jù)中的類別信息。

Quinlan提出的基于信息熵的ID3(Induction Decision-tree 3)算法是決策樹技術(shù)中的經(jīng)典算法。ID3算法以信息論為理論基礎(chǔ),在執(zhí)行過程中要計(jì)算屬性的信息熵與信息增益,然后在每次分類判斷是以信息增益為標(biāo)準(zhǔn),通過選擇信息增益高的屬性進(jìn)行分類。

2 決策樹技術(shù)在學(xué)生學(xué)業(yè)預(yù)警中應(yīng)用

學(xué)生的學(xué)業(yè)成績變化受到各個(gè)方面因素的影響,學(xué)生的主觀努力程度是決定性因素,但也會(huì)受到諸如入學(xué)成績、家庭經(jīng)濟(jì)狀況等客觀因素的影響,同時(shí)學(xué)生的學(xué)業(yè)成績變動(dòng)必然會(huì)在其日常學(xué)習(xí)生活中有所體現(xiàn)。所以,將ID3算法應(yīng)用于學(xué)生的學(xué)籍基本信息和學(xué)生日常表現(xiàn)的歷史數(shù)據(jù)中,可以構(gòu)建一個(gè)預(yù)測(cè)學(xué)生是否被預(yù)警的決策樹。

2.1 數(shù)據(jù)處理

從學(xué)校教務(wù)系統(tǒng)導(dǎo)出學(xué)生的學(xué)籍基本信息,從學(xué)生管理系統(tǒng)中導(dǎo)出學(xué)生的日常表現(xiàn)數(shù)據(jù)信息,根據(jù)數(shù)據(jù)挖掘目的和需要,保留家庭經(jīng)濟(jì)狀況、高考成績、單親或孤兒、作業(yè)情況、出勤情況、是否被預(yù)警共計(jì)6列屬性,通過繪制直方圖分析,將高考成績、作業(yè)情況、出勤情況屬性數(shù)據(jù)離散化,整理出包含160名被預(yù)警學(xué)生在內(nèi)的共計(jì)500條樣本數(shù)據(jù)如表1所示。

2.2 決策樹構(gòu)建

根據(jù)樣本數(shù)據(jù),以“預(yù)警與否”為目標(biāo)類屬性構(gòu)建決策樹。

2.2.1 計(jì)算樣本數(shù)據(jù)“預(yù)警與否”分類的信息熵

2.2.2 計(jì)算各屬性信息熵與信息增益

由樣本數(shù)據(jù)可知決策樹存在5種分裂可能,分別計(jì)算“家庭經(jīng)濟(jì)狀況”、“高考成績”、“單親或孤兒”、“作業(yè)情況”、“出勤情況”的信息熵與信息增益。

根據(jù)信息增益計(jì)算的結(jié)果可知“作業(yè)情況”是最大的增益屬性,應(yīng)按“作業(yè)情況”的屬性進(jìn)行分類并創(chuàng)建3個(gè)分支。

2.2.3 重復(fù)以上計(jì)算過程即可構(gòu)建一個(gè)決策樹

2.2.4 決策樹剪枝

為防止經(jīng)上述運(yùn)算構(gòu)建的決策樹的訓(xùn)練過度,對(duì)決策樹進(jìn)行剪枝,可提高決策樹對(duì)新數(shù)據(jù)運(yùn)用的準(zhǔn)確度。常用先剪枝、后剪枝和兩者結(jié)合三種剪枝方法,本文采用后剪枝法。經(jīng)過多次分析測(cè)試,設(shè)學(xué)生“預(yù)警與否”的比例為35%,剪枝后的決策樹如圖1所示。

2.3 分類規(guī)則及分析

根據(jù)決策樹,可以提取相應(yīng)分類規(guī)則

(1)IF 作業(yè)情況=C AND 出勤情況=C AND 高考成績=C THEN 學(xué)生被預(yù)警的比率=73.3%。

(2)IF 作業(yè)情況=C AND 出勤情況=C AND 高考成績=B AND 家庭經(jīng)濟(jì)狀況=B AND 單親孤兒=T THEN 學(xué)生被預(yù)警的比率=57.14%。

(3)IF 作業(yè)情況=C AND 出勤情況=C AND 高考成績=B 家庭經(jīng)濟(jì)狀況=B THEN 學(xué)生被預(yù)警的比率=36.1%。

分析決策樹得出的規(guī)則,并結(jié)合學(xué)生情況有如下結(jié)論:

(1)學(xué)生的日常表現(xiàn)中作業(yè)情況、出勤情況非常重要和關(guān)鍵,是學(xué)生學(xué)習(xí)態(tài)度、水平變化的明顯標(biāo)志。

(2)學(xué)生的高考成績不是大學(xué)生在校學(xué)業(yè)成績的關(guān)鍵因素,但作為學(xué)生學(xué)習(xí)的基礎(chǔ),對(duì)于學(xué)生的學(xué)習(xí)有一定的影響。結(jié)合學(xué)生具體數(shù)據(jù),并經(jīng)了解學(xué)生情況可知,高考成績低的學(xué)生不僅僅是學(xué)業(yè)基礎(chǔ)差,往往是因?yàn)槿鄙倭己玫膶W(xué)習(xí)方法與學(xué)習(xí)習(xí)慣,造成學(xué)業(yè)成績不良。

(3)學(xué)生家庭經(jīng)濟(jì)狀況、是否是單親或孤兒也是影響學(xué)生學(xué)業(yè)的一個(gè)因素。部分學(xué)生由于承受學(xué)業(yè)與經(jīng)濟(jì)兩個(gè)方面的壓力,必然影響學(xué)生的時(shí)間與精力,容易造成學(xué)業(yè)問題。

根據(jù)挖掘結(jié)果和對(duì)規(guī)則分析,建議在教學(xué)和管理中要注意以下幾個(gè)方面:

(1)學(xué)工部門要加強(qiáng)對(duì)學(xué)生的基礎(chǔ)管理管理,嚴(yán)把學(xué)生請(qǐng)假關(guān),并與任課教師共同做好課堂考勤工作。任課教師要重視學(xué)生的平日作業(yè)完成情況與完成質(zhì)量,特別要重視學(xué)生在作業(yè)、課堂出勤方面的苗頭性傾向。對(duì)于學(xué)生的苗頭性問題早發(fā)現(xiàn)、早了解、早解決。

(2)可以通過大學(xué)生導(dǎo)師制、班主任工作、新生研討等多種方法做好學(xué)生指導(dǎo),增強(qiáng)高考成績較低學(xué)生的信心,做好學(xué)生的學(xué)習(xí)方法、學(xué)習(xí)習(xí)慣的養(yǎng)成工作。同時(shí),任課教師在授課時(shí)要了解學(xué)生學(xué)業(yè)基礎(chǔ),因材施教。

(3)學(xué)校各相關(guān)部門、班主任、輔導(dǎo)員、任課教師要備加關(guān)心和愛護(hù)單親、孤兒學(xué)生和來自貧困家庭的學(xué)生,充分利用高校的各種獎(jiǎng)、助、助等政策,減輕學(xué)生經(jīng)濟(jì)壓力,切實(shí)將學(xué)生的主要精力轉(zhuǎn)到專業(yè)學(xué)習(xí)上來。

(4)專業(yè)教師在授課時(shí)要特別注意學(xué)生學(xué)期基礎(chǔ),查缺補(bǔ)漏,分類施教,因材施教,深入淺出。

(5)教學(xué)管理部門、專業(yè)教師要做好學(xué)生的導(dǎo)師,指導(dǎo)學(xué)生的學(xué)習(xí)與選課,學(xué)生在選擇專業(yè)選修課時(shí)要充分考慮課程的先修課程,結(jié)合自己的學(xué)習(xí)興趣與今后的發(fā)展方向,量力而行,不能跟著別人的選課思路走,避免造成課程不及格。

3 結(jié)束語

將數(shù)據(jù)挖掘技術(shù)應(yīng)用于學(xué)生“學(xué)業(yè)預(yù)警”不僅能提高該項(xiàng)工作的針對(duì)性,也能夠?qū)Ω咝5膶W(xué)生管理、教學(xué)管理決策提供數(shù)據(jù)支持,也是對(duì)高校保存的大量歷史數(shù)據(jù)的科學(xué)使用。同樣地,數(shù)據(jù)挖掘技術(shù)也可以對(duì)高校保存的教師科研數(shù)據(jù)、學(xué)生評(píng)價(jià)數(shù)據(jù)、教師業(yè)績數(shù)據(jù)等深入的挖掘分析,挖掘數(shù)據(jù)背后的有用的規(guī)律來服務(wù)高校的人才培養(yǎng)、教學(xué)管理等工作。

參考文獻(xiàn)

[1]楊士同,馬香麗.高校學(xué)業(yè)預(yù)警機(jī)制運(yùn)作中對(duì)象監(jiān)測(cè)方式研究——以西北農(nóng)林科技大學(xué)X學(xué)院為例[J].中國農(nóng)業(yè)教育,2014(05):47-49.

[2]鄭剛,岑漢彬.數(shù)據(jù)挖掘在電力負(fù)荷預(yù)測(cè)中的應(yīng)用[J].水利電力機(jī)械,2006,(01):44-47.

[3]丁保忠.數(shù)據(jù)挖掘技術(shù)在學(xué)生綜合信息管理系統(tǒng)中的應(yīng)用研究[D].河北:河北科技大學(xué)碩士論文,2013(04).

作者簡介

宮鋒(1975-),男,漢族,山東省萊陽市人?,F(xiàn)為濱州學(xué)院信息工程學(xué)院講師,主要從事數(shù)據(jù)挖掘方面研究。

作者單位

濱州學(xué)院信息工程學(xué)院 山東省濱州市 256600

猜你喜歡
決策樹數(shù)據(jù)挖掘
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
基于改進(jìn)決策樹的故障診斷方法研究
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于決策樹的出租車乘客出行目的識(shí)別
基于決策樹的復(fù)雜電網(wǎng)多諧波源監(jiān)管
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
基于GPGPU的離散數(shù)據(jù)挖掘研究