国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)聯(lián)規(guī)則在中職學(xué)校招生管理系統(tǒng)中的應(yīng)用

2017-10-13 20:07唐堅(jiān)勝張晶晶鄧珍榮
關(guān)鍵詞:項(xiàng)集生源數(shù)據(jù)挖掘

◆何 萌 唐堅(jiān)勝 張晶晶 鄧珍榮

?

關(guān)聯(lián)規(guī)則在中職學(xué)校招生管理系統(tǒng)中的應(yīng)用

◆何 萌1唐堅(jiān)勝2張晶晶1鄧珍榮1

(1.桂林電子科技大學(xué)計(jì)算機(jī)與信息安全學(xué)院 廣西 541004;2.桂林林業(yè)學(xué)校 廣西 541004)

針對(duì)中等職業(yè)學(xué)校招生規(guī)模的不斷擴(kuò)大的現(xiàn)象,提高中職生源質(zhì)量已經(jīng)成為各培養(yǎng)單位的重點(diǎn)工作。傳統(tǒng)的生源質(zhì)量分析主要是計(jì)算考生成績(jī)的均值、方差、區(qū)分度等,僅對(duì)單個(gè)獨(dú)立的數(shù)據(jù)進(jìn)行分析,無(wú)法獲取數(shù)據(jù)間的有價(jià)值信息。本文將數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則應(yīng)用于分析中職學(xué)校學(xué)生入學(xué)成績(jī)、在校生學(xué)習(xí)成績(jī)、就業(yè)狀況和生源質(zhì)量之間的內(nèi)在關(guān)系,找出對(duì)影響招生質(zhì)量有價(jià)值的信息,為招生政策的制定提供參考。

數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;生源質(zhì)量

0 引言

當(dāng)今大數(shù)據(jù)時(shí)代,數(shù)據(jù)處理量越來(lái)越大,僅僅依靠傳統(tǒng)的數(shù)據(jù)處理方式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足人們現(xiàn)實(shí)生活中的需求,數(shù)據(jù)挖掘技術(shù)的發(fā)展引起了各行各業(yè)的高度關(guān)注。近年來(lái),中等職業(yè)教育得到國(guó)家政策大力扶持,職業(yè)學(xué)校規(guī)模逐漸擴(kuò)大、自主招生程度不斷提高,生源數(shù)量已經(jīng)成為政府和社會(huì)評(píng)價(jià)中等職業(yè)學(xué)校辦學(xué)實(shí)力的一個(gè)重要指標(biāo)。如何從學(xué)校豐富的數(shù)據(jù)信息中提取出有價(jià)值的數(shù)據(jù)資料,已經(jīng)成為教學(xué)管理中值得探索的問(wèn)題之一。數(shù)據(jù)挖掘技術(shù)可以為學(xué)校科學(xué)決策助一臂之力。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中等職業(yè)學(xué)校招生信息系統(tǒng),搜集各種數(shù)據(jù)表征的內(nèi)容及其相互關(guān)系,根據(jù)學(xué)生入學(xué)前的信息與在校就讀期間的學(xué)習(xí)成績(jī)等特點(diǎn),分析中職學(xué)校生源質(zhì)量,可為中職學(xué)校制定招生計(jì)劃、提高生源質(zhì)量提供有效的參考信息。有助于及時(shí)發(fā)現(xiàn)教學(xué)與管理中的問(wèn)題,促進(jìn)教育教學(xué)改革,提高教學(xué)管理工作的質(zhì)量和效率。

1 關(guān)聯(lián)規(guī)則

1.1 數(shù)據(jù)挖掘技術(shù)概述

從具有隨機(jī)干擾、噪聲、錯(cuò)誤、缺失和不完整的大量數(shù)據(jù)中,將對(duì)人們有用的、隱含的、潛在的、未知的信息提取出來(lái)的操作,稱為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)在當(dāng)前形勢(shì)下應(yīng)運(yùn)而生。數(shù)據(jù)挖掘是一種深層次的數(shù)據(jù)信息分析方法,是從數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)和決策支持的過(guò)程,主要基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析原有數(shù)據(jù),做出歸納性的推理,從數(shù)據(jù)中挖掘出潛在的模式,預(yù)測(cè)分析對(duì)象的行為趨勢(shì),從而幫助決策或調(diào)整策略。數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類(lèi)分析、分類(lèi)分析、異常分析、特異群組分析和演變分析等,其中最常用的是聚類(lèi)分析和關(guān)聯(lián)規(guī)則分析。數(shù)據(jù)挖掘技術(shù)已成功地應(yīng)用在許多企業(yè)中,對(duì)提高企業(yè)經(jīng)濟(jì)效益和管理效率有顯著的影響。

在中等職業(yè)教育領(lǐng)域,有很多可以挖掘的信息,如學(xué)生入學(xué)成績(jī)管理、學(xué)生在校成績(jī)管理、學(xué)生家庭狀況、入學(xué)率情況和畢業(yè)就業(yè)質(zhì)量等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于對(duì)中職學(xué)校學(xué)生成績(jī)的分析,分析生源質(zhì)量與各種因素之間隱藏的內(nèi)在聯(lián)系,這對(duì)整個(gè)中職院校擴(kuò)大規(guī)模、提高辦學(xué)質(zhì)量具有重要的實(shí)踐意義。

1.2 關(guān)聯(lián)規(guī)則概述

數(shù)據(jù)挖掘中有一類(lèi)問(wèn)題,叫做關(guān)聯(lián)規(guī)則挖掘或頻繁項(xiàng)集挖掘。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘應(yīng)用最廣的一種方法。關(guān)聯(lián)規(guī)則挖掘是在海量的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)各項(xiàng)之間的關(guān)系關(guān)聯(lián)規(guī)則的支持度和置信度。它們分別反映了所發(fā)現(xiàn)規(guī)則的有用性和確定性。通過(guò)設(shè)定最小支持度閾值和最小置信度閾值,選取有趣的關(guān)聯(lián)規(guī)則。當(dāng)挖掘出的關(guān)聯(lián)規(guī)則的支持度和置信度都滿足這兩個(gè)閡值時(shí)就認(rèn)為這個(gè)規(guī)則是有效的,否則就是無(wú)效的,這些閾值一般可由領(lǐng)域?qū)<以O(shè)定。挖掘關(guān)聯(lián)規(guī)則的整個(gè)過(guò)程主要包括兩個(gè)方面,一個(gè)是發(fā)現(xiàn)頻繁項(xiàng)集:找出支持度大于等于用戶設(shè)置的最小支持度的項(xiàng)集;另一方面是生成關(guān)聯(lián)規(guī)則:由步驟一發(fā)現(xiàn)的頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)則,并且這些關(guān)聯(lián)規(guī)則的置信度不小于用戶給定的最小置信度挖掘關(guān)聯(lián)規(guī)則的整個(gè)過(guò)程如圖1所示。

圖1挖掘關(guān)聯(lián)規(guī)則的過(guò)程

數(shù)據(jù)發(fā)掘技術(shù)中的關(guān)聯(lián)規(guī)則挖掘,是利用計(jì)算機(jī)自動(dòng)從大量的數(shù)據(jù)中去分析和發(fā)現(xiàn)有關(guān)聯(lián)的規(guī)則。計(jì)算機(jī)本身需要了解所有發(fā)生的情況,并依次整理,把相關(guān)的事件合并整理在一起,然后對(duì)每件事進(jìn)行掃描分析,以總結(jié)出事物的關(guān)聯(lián)性規(guī)律。數(shù)據(jù)挖掘技術(shù)對(duì)于中職的學(xué)生信息管理工作來(lái)說(shuō),是一種可以化繁瑣為簡(jiǎn)單的技術(shù),對(duì)于工作效率的提高以及工作準(zhǔn)確度的保證都有很重要的意義,因此在很多中職學(xué)校中,數(shù)據(jù)挖掘技術(shù)都被作為了其學(xué)生信息管理的研究工作的重點(diǎn)。

2 Apriori算法

Apriori算法是經(jīng)典的關(guān)聯(lián)規(guī)則的挖掘算法,被廣泛應(yīng)用于各種領(lǐng)域。Apriori算法主要用于發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫(kù)中的布爾型關(guān)聯(lián)規(guī)則,是一種尋找頻繁項(xiàng)集的基本算法,其基本原理是使用一種稱作逐層搜索的迭代方法,即用k項(xiàng)集去探索(k +1)項(xiàng)集針對(duì)大量的事務(wù)數(shù)據(jù)。從單個(gè)項(xiàng)開(kāi)始逐個(gè)遍歷所有事務(wù),并與預(yù)設(shè)的最小支持度閾值相比較,如果支持度小于預(yù)設(shè)的閾值,則這一項(xiàng)將被刪除,進(jìn)而擴(kuò)充到所有事務(wù),頻繁項(xiàng)集就是最終保留下來(lái)的項(xiàng)的集合。關(guān)聯(lián)規(guī)則通過(guò)子集產(chǎn)生法來(lái)生成,與用于預(yù)設(shè)的最小置信度閾值相比,如果置信度低于這一閾值,則將這一關(guān)聯(lián)規(guī)則刪除,最終保留下來(lái)的關(guān)聯(lián)規(guī)則符合用戶需要。Apriori 算法可以描述如下:

(1)產(chǎn)生頻繁一項(xiàng)集;

(2)產(chǎn)生頻繁k(2→end)項(xiàng)集;

(3)產(chǎn)生頻繁候選k項(xiàng)集;

①由頻繁k-1項(xiàng)集連接成為k項(xiàng)集;

②檢測(cè)k項(xiàng)集的所有的k-1子集是否為頻繁項(xiàng)集,若是該k 項(xiàng)集就成為了頻繁候選項(xiàng)集;

(4)掃描事務(wù)數(shù)據(jù)庫(kù)D對(duì)每個(gè)候選k項(xiàng)集計(jì)數(shù)。

(5)達(dá)到最少支持度的頻繁候選k項(xiàng)成為頻繁k項(xiàng)集。

3 關(guān)聯(lián)規(guī)則在中職學(xué)校管理系統(tǒng)中的應(yīng)用

3.1 數(shù)據(jù)分析過(guò)程

實(shí)驗(yàn)使用的數(shù)據(jù)為桂林市衛(wèi)生學(xué)校2013、2014、2015級(jí)學(xué)生的數(shù)據(jù),數(shù)據(jù)分析過(guò)程如下圖2,從原始數(shù)據(jù)到發(fā)現(xiàn)規(guī)則的過(guò)程大致要經(jīng)過(guò)數(shù)據(jù)的準(zhǔn)備、預(yù)處理、數(shù)據(jù)挖掘與結(jié)果分析四個(gè)步驟。

圖2數(shù)據(jù)分析過(guò)程

3.2 關(guān)聯(lián)規(guī)則挖掘算法在中職招生中應(yīng)用

在桂林市衛(wèi)生學(xué)校學(xué)生數(shù)據(jù)集合中,既存在布爾型的數(shù)據(jù)(如學(xué)生的性別、家庭住址),又存在數(shù)值型的數(shù)據(jù)(如學(xué)生的成績(jī))。根據(jù)數(shù)據(jù)的特征,選用Apriori作為數(shù)據(jù)挖掘算法,發(fā)現(xiàn)數(shù)據(jù)集合之間的關(guān)聯(lián)關(guān)系。將桂林市衛(wèi)生學(xué)校學(xué)生的入學(xué)成績(jī)與畢業(yè)信息進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析,得出有利于選拔優(yōu)質(zhì)生源的有用信息。對(duì)2010-2012年學(xué)生的入學(xué)成績(jī)信息、在校成績(jī)信息和畢業(yè)信息進(jìn)行分析,設(shè)定支持度=10%,置信度=30%,挖掘出如表 1 所示的參考規(guī)則。

表1參考規(guī)則

序號(hào)參考規(guī)則 1初高中學(xué)校=重點(diǎn)學(xué)?!厴I(yè)生質(zhì)量=優(yōu) 2初高中學(xué)校=重點(diǎn)學(xué)校→畢業(yè)生質(zhì)量=良 3入學(xué)成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=優(yōu) 4入學(xué)成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=良 5入學(xué)成績(jī)(語(yǔ)文)=A或B→畢業(yè)生質(zhì)量=差 6入學(xué)成績(jī)(語(yǔ)文)=C或D→畢業(yè)生質(zhì)量=差 7在校成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=優(yōu) 8在校成績(jī)(政治)=A或B→畢業(yè)生質(zhì)量=差 9在校成績(jī)(政治)=C或D→畢業(yè)生質(zhì)量=優(yōu) ……

數(shù)據(jù)挖掘的結(jié)果在實(shí)際中不一定存在必然的聯(lián)系,要結(jié)合實(shí)際情況對(duì)得到的關(guān)聯(lián)規(guī)則加以分析,通過(guò)設(shè)置不同的支持度閥值和置信度閥值,可以得到不同的關(guān)聯(lián)規(guī)則。將規(guī)則庫(kù)加以調(diào)整,為招生工作提供輔助支持。例如:表1挖掘的規(guī)則是學(xué)生的生源入學(xué)成績(jī)與畢業(yè)生是否優(yōu)秀之間的關(guān)聯(lián)規(guī)則,先判斷產(chǎn)生的子集是否屬于生源特征資料維的,滿足這個(gè)條件才能挖出規(guī)則來(lái)。這樣可以有效地濾除有意義的關(guān)聯(lián)規(guī)則,減少數(shù)據(jù)的冗余。

參考規(guī)則中的規(guī)則5和6入學(xué)成績(jī)(語(yǔ)文)=A或D→畢業(yè)生質(zhì)量=良,無(wú)論學(xué)生入學(xué)考試語(yǔ)文成績(jī)是高或是低,學(xué)生畢業(yè)的質(zhì)量都不是優(yōu),此條規(guī)則在挑選生源時(shí)沒(méi)有任何實(shí)際意義。而規(guī)則3和4入學(xué)成績(jī)(平均分)=A或D,學(xué)生畢業(yè)的質(zhì)量則是可以直觀看出,可見(jiàn)可以通過(guò)平均分來(lái)判斷生源質(zhì)量是否優(yōu)秀,此信息可以提供給學(xué)校作為是否錄取該生的條件。

4 結(jié)論

通過(guò)將關(guān)聯(lián)規(guī)則應(yīng)用到中職學(xué)校招生管理系統(tǒng),可對(duì)生源的質(zhì)量?jī)?yōu)劣進(jìn)行初步的分析和評(píng)價(jià)。關(guān)聯(lián)規(guī)則挖掘提供了一個(gè)進(jìn)行合理挖掘的模式和挖掘方向,加快了挖掘速度、減少了數(shù)據(jù)的冗余度,為該中職專院校招生管理提供了一個(gè)方向。

招生階段是整個(gè)學(xué)生培養(yǎng)周期的最初階段,高質(zhì)量的生源是學(xué)生培養(yǎng)質(zhì)量的有力保證。數(shù)據(jù)挖掘技術(shù)作為中職專院校管理學(xué)生信息工作的有力工具,不但可以提高信息管理工作的效率,還對(duì)招生工作及相關(guān)政策的制定有一定的指導(dǎo)和幫助。數(shù)據(jù)挖掘技術(shù)在中職學(xué)生信息分析中可以發(fā)揮重要的作用,為制定科學(xué)的教育策略提供依據(jù)。只要選擇合適的分析對(duì)象、進(jìn)行合理的算法選擇,數(shù)據(jù)挖掘技術(shù)將在教育領(lǐng)域的其它方面獲得更多應(yīng)用。

[1]王毅鵬.高職院校招生與就業(yè)管理信息系統(tǒng)的研究與實(shí)現(xiàn)[D].西安電子科技大學(xué),2012.

[2]王暉,王琪,何瓊.數(shù)據(jù)挖掘理論與實(shí)例[M].北京:經(jīng)濟(jì)科學(xué)出版社,2012.

[3]郭濤,張代遠(yuǎn).基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011.

[4]馮璐妹,趙建寧.基于Apriori的高效關(guān)聯(lián)規(guī)則挖掘算法在教育考試系統(tǒng)中的應(yīng)用研究[J].軟件,2013.

[5]Huang Hong-zhi,Cai Yan-rong.Web-based design of the management information system for the chemical laboratory in the university. International Conference on Computer Design and Applications(ICCDA),2010.

桂林市科學(xué)研究與技術(shù)開(kāi)發(fā)計(jì)劃項(xiàng)目(2016010406-4)。

猜你喜歡
項(xiàng)集生源數(shù)據(jù)挖掘
新形勢(shì)下提升傳統(tǒng)本科專業(yè)生源質(zhì)量的思考和認(rèn)識(shí)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
農(nóng)村生源不是“搖錢(qián)樹(shù)”
數(shù)據(jù)挖掘技術(shù)在打擊倒賣(mài)OBU逃費(fèi)中的應(yīng)用淺析
基于矩陣相乘的Apriori改進(jìn)算法
不確定數(shù)據(jù)的約束頻繁閉項(xiàng)集挖掘算法
圖表
陜北紅色學(xué)校與國(guó)民黨在西安的生源爭(zhēng)奪戰(zhàn)
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議
楚雄市| 休宁县| 扶沟县| 什邡市| 重庆市| 化州市| 平阳县| 凤山县| 光泽县| 博客| 上栗县| 高碑店市| 衡阳市| 岐山县| 清原| 定州市| 张家港市| 鱼台县| 潮安县| 五华县| 双峰县| 崇左市| 邵武市| 鄂伦春自治旗| 林甸县| 元氏县| 建始县| 隆尧县| 冷水江市| 连云港市| 梁河县| 长顺县| 洛宁县| 聂荣县| 佛学| 安远县| 措勤县| 东阳市| 浦城县| 睢宁县| 开原市|