国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在高校招生管理信息系統(tǒng)應(yīng)用探究

2014-08-15 00:43
電子測試 2014年7期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)數(shù)據(jù)庫

馬 婷

(陜西學(xué)前師范學(xué)院招生辦公室,710100)

1 數(shù)據(jù)挖掘的簡述

1.1 數(shù)據(jù)挖掘的定義和基本內(nèi)容

數(shù)據(jù)挖掘(英語:Data mining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程,數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。

1.2 數(shù)據(jù)挖掘的特點(diǎn)

數(shù)據(jù)挖掘在人工智能領(lǐng)域,習(xí)慣上又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟,知識發(fā)現(xiàn)過程由以下三個階段組成:(1)數(shù)據(jù)準(zhǔn)備;(2)數(shù)據(jù)挖掘;(3)結(jié)果表達(dá)和解釋。

數(shù)據(jù)挖掘可以與用戶或知識庫交互,數(shù)據(jù)挖掘是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個步驟,數(shù)據(jù)準(zhǔn)備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來;規(guī)律表示是盡可能以用戶可理解的方式(如可視化)將找出的規(guī)律表示出來。

2 數(shù)據(jù)挖掘在高校招生方面的重要作用

2.1 高校招生具體內(nèi)容

高校每年一次的迎新工作是高校展開各項(xiàng)管理工作的一個非常重要的環(huán)節(jié),它是對每一級學(xué)生展開的活動,而且對高校今后的教學(xué)、學(xué)生管理、后勤服務(wù)等方面都起著非常重要的影響作用,這也是每年高校都十分重視的一項(xiàng)環(huán)節(jié),因此,幾乎每個高校都一樣,在新生正式注冊之前,高校的領(lǐng)導(dǎo)都要召集各學(xué)院、系、招生辦、學(xué)生管理、后勤管理等部門來參加這次終于會議,對即將展開的招生工作進(jìn)行詳細(xì)的部署和安排,以便各部門之間能夠相互合作,共同完成這項(xiàng)工作。而且?guī)缀跛械母咝?bào)到方式都一樣:有關(guān)部門在學(xué)校設(shè)置相關(guān)的報(bào)到點(diǎn),然后就是新生按照流程圖一步步辦理各項(xiàng)手續(xù)。

2.2 數(shù)據(jù)挖掘在高校招生方面的重要作用

數(shù)據(jù)挖掘技術(shù)已經(jīng)在很多行業(yè)得到廣泛應(yīng)用,比如商業(yè)、金融業(yè)、保險(xiǎn)業(yè)、通信業(yè)等等,并且在這些行業(yè)中已經(jīng)取得了非常驕人的成績。高校管理者要不斷學(xué)習(xí)先進(jìn)管理知識,不斷創(chuàng)新人才培養(yǎng)模式,對學(xué)校的可持續(xù)發(fā)展做出科學(xué)、合理的決策,而數(shù)據(jù)挖掘技術(shù)在這方面將扮演著非常重要的作用,對高校招生管理信息系統(tǒng)的設(shè)計(jì)起著舉足輕重的作用,這是因?yàn)樵诟咝U猩芾硇畔⑾到y(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)一方面能夠在很大程度上促進(jìn)部門之間的協(xié)調(diào)工作,這樣將會使信息能夠及時(shí)的進(jìn)行傳遞和處理;另一方面,通過對歷年招生錄取數(shù)據(jù)進(jìn)行詳細(xì)分析并挖掘有效信息,將會給學(xué)生提供更加真實(shí)、詳細(xì)的信息,以便學(xué)生能夠合理的填報(bào)志愿。

3 基于數(shù)據(jù)挖掘的招生管理系統(tǒng)

3.1 研究內(nèi)容

數(shù)據(jù)挖掘招生管理系統(tǒng)研究的內(nèi)容主要包括以下四個方面:一是,對高校招生管理工作的業(yè)務(wù)邏輯方面進(jìn)行研究,以便設(shè)計(jì)出來的招生工作業(yè)務(wù)模型能夠適應(yīng)時(shí)代的潮流;二是,在Microsoft.NET 平臺之上研究出一個具有能夠?qū)π律Y格審查、信息采集、轉(zhuǎn)專業(yè)審批、宿舍分配、班級分配、書籍發(fā)放等功能的高校新生注冊管理信息系統(tǒng),另外,還非常有利于幫助高校的招生部門對當(dāng)年該校各院系、專業(yè)的錄取分?jǐn)?shù)線、錄取人數(shù)、錄取考生志愿分布、錄取考生基本情況等方面的信息進(jìn)行科學(xué)有效的統(tǒng)一;三是,大量的應(yīng)用邏輯通過多層c/s 體系結(jié)構(gòu)實(shí)現(xiàn)在業(yè)務(wù)邏輯層中得到運(yùn)行,這樣不僅能夠解決系統(tǒng)“胖”客戶端問題,還能夠解決數(shù)據(jù)庫安全問題,可以說是一舉兩得的好事;四是,對數(shù)據(jù)挖掘的相關(guān)技術(shù)進(jìn)行研究,對于生源數(shù)據(jù)中潛在的有用信息通過數(shù)據(jù)挖掘算法來發(fā)現(xiàn),這樣就能夠使系統(tǒng)的功能更加強(qiáng)大,最后實(shí)現(xiàn)對高校招生工作的部署和決策具有一定的指導(dǎo)作用。

3.2 技術(shù)路線

3.2.1 多層c/s 架構(gòu)的設(shè)計(jì)

雖然.NET 技術(shù)路線在設(shè)計(jì)時(shí)具有多層結(jié)構(gòu)的設(shè)計(jì),但是用戶界面只是對其中基本的界面進(jìn)行相應(yīng)的操作,然后將這些操作過程通過調(diào)用的方式發(fā)給業(yè)務(wù)處理層,最后再經(jīng)過一定的分析和處理,而里面的數(shù)據(jù)操作層在調(diào)用時(shí)要根據(jù)具體需要看是不是進(jìn)行數(shù)據(jù)處理,如果需要進(jìn)行數(shù)據(jù)處理,這時(shí)候數(shù)據(jù)操作層將收到的任務(wù)組織成不同的數(shù)據(jù)操作,最后再跟原先的數(shù)據(jù)進(jìn)行相互交換,最后再把最終的結(jié)果輸送給業(yè)務(wù)處理層,而當(dāng)業(yè)務(wù)處理層將收到結(jié)果時(shí),要將結(jié)果進(jìn)行一定的技術(shù)處理,最后再把處理的結(jié)果輸送到用戶界面層,這樣用戶界面層,就可以把最終的結(jié)果反饋給用戶進(jìn)行查看。

3.2.2 SOL Server 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘得到了很多技術(shù)支持,其中為其提供非常豐富支持的一項(xiàng)技術(shù)就是Microsoft SQL Server 2005 Analysis Services(SSAS,SQL Server 分析服務(wù)),該技術(shù)的功能是比較全面的,其中包含多維數(shù)據(jù)分析、處理引擎、多種數(shù)據(jù)挖掘算法、各種服務(wù)器等,Visual Studio 2005 一方面具備了SQL Server 2005 的最佳開發(fā)環(huán)境,另一方面還在其內(nèi)部設(shè)置了Analysis Services 項(xiàng)目模板,而在對用戶管理Analysis Services 數(shù)據(jù)庫方面也設(shè)計(jì)了各種可視化向?qū)Чぞ邅韥韼椭脩暨M(jìn)行管理,這樣在進(jìn)行挖掘各項(xiàng)任務(wù)時(shí)就顯得非常方便、快捷,將會在很大程度上提高用戶的工作效率。

3.3 利用熵值離散法與關(guān)聯(lián)規(guī)則對數(shù)據(jù)進(jìn)行提取

3.3.1 熵值離散法

熵有好幾種表示含義,因此,在不同狀態(tài)、環(huán)境下所表示的含義是不相同的,其中在信息論中表示對不確定性的一種度量,也就是說信息量越小,不確定性就越大,熵也就越大;相反信息量越大,不確定性就越小,熵也就越小,因此,在高校招生管理信息系統(tǒng)設(shè)計(jì)時(shí),可以根據(jù)熵的這種特征,來判斷某一事件發(fā)生概率的大小,也可以利用熵來了解指標(biāo)的離散程度,即離散程度越小的指標(biāo),對其綜合評價(jià)的影響就越小,相反離散程度越大的指標(biāo),對其綜合評價(jià)的影響就越大。

3.3.2 關(guān)聯(lián)規(guī)則

在描述記錄中的指標(biāo)取離散值的情況時(shí),關(guān)聯(lián)規(guī)則挖掘是非常適合的,比如,在最開始的數(shù)據(jù)庫中的一些指標(biāo)值是不間斷的數(shù)據(jù),這是要在關(guān)聯(lián)規(guī)則挖掘之前對這些數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)離散化,數(shù)據(jù)離散化在數(shù)據(jù)挖掘之前起著非常重要的作用,并且離散化的結(jié)果對關(guān)聯(lián)規(guī)則挖掘的結(jié)果起著決定性的作用。而現(xiàn)在利用熵值離散法與關(guān)聯(lián)規(guī)則相互合作,共同來進(jìn)行數(shù)據(jù)挖掘,把開始的所有數(shù)據(jù)混合,在提取時(shí)要用布爾關(guān)聯(lián)挖掘算法提取。

4 數(shù)據(jù)系統(tǒng)挖掘的結(jié)果分析,便于招生工作展開

一般情況下,幾乎全部的系統(tǒng)數(shù)據(jù)都是經(jīng)過初步處理后保存在數(shù)據(jù)庫里面,因此,我們在查找我們所需要的各種信息時(shí),可以從數(shù)據(jù)庫里面進(jìn)行查找。比如:(1)學(xué)生籍貫。在數(shù)據(jù)庫里面,我們可以非常清楚的知道,什么地方的考生最多,該地方的招生比例是多少等等;(2)考生報(bào)考專業(yè)。管理、國際經(jīng)濟(jì)與貿(mào)易、土木工程等專業(yè)報(bào)考的學(xué)生人數(shù)相對來說比較多,說明這幾個專業(yè)是比較熱門的專業(yè);(3)學(xué)生性別。男生人數(shù)明顯多于女生,說明該高校要在以后的招生過程中加大對女生的招生比例,減小對男生的招生比例,從而實(shí)現(xiàn)男女平衡等等,通過對這些數(shù)據(jù)進(jìn)行相應(yīng)的挖掘,就可以大致判斷出今后的招生情況。

5 結(jié)束語

隨著我國社會經(jīng)濟(jì)的快速發(fā)展,高校招生數(shù)量也在不斷增加,同時(shí)招生工作也變得越來越艱難,數(shù)據(jù)挖掘能夠?qū)⒖忌畔⑦M(jìn)行深入的挖掘和分析,這對高校招生工作來說是非常重要的,將會使其工作變得非常順利。

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)數(shù)據(jù)庫
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
奇趣搭配
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
數(shù)據(jù)庫
智趣
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
松江区| 志丹县| 侯马市| 新沂市| 台东市| 台山市| 弋阳县| 永清县| 贵南县| 金溪县| 教育| 绥宁县| 达日县| 桦甸市| 祁东县| 英山县| 信宜市| 汶川县| 安泽县| 阿鲁科尔沁旗| 泗水县| 潜江市| 泌阳县| 梅河口市| 衡阳市| 长治市| 曲阳县| 太保市| 揭东县| 玉树县| 东港市| 宜阳县| 昭苏县| 莱州市| 乌鲁木齐县| 平原县| 阆中市| 定西市| 富顺县| 龙陵县| 周至县|