摘 要:近些年來(lái)各職業(yè)院校為了改善教學(xué)管理質(zhì)量,擴(kuò)大招生,提高學(xué)生就業(yè)率,開發(fā)了多種管理等系統(tǒng),保存了大量的數(shù)據(jù),但是對(duì)這些數(shù)據(jù)的利用并不高。數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中的應(yīng)用越來(lái)越廣泛,主要應(yīng)用在教育教學(xué)管理與評(píng)估,學(xué)生就業(yè),學(xué)校招生等方面。通過(guò)對(duì)保存的大量數(shù)據(jù)進(jìn)行處理分析,幫助學(xué)校管理層的人員進(jìn)行決策,為學(xué)校的發(fā)展提供幫助。
關(guān)鍵詞:數(shù)據(jù)挖掘 教學(xué)管理 關(guān)聯(lián)規(guī)則 決策樹
中圖分類號(hào):G71 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2012)12(c)-0222-01
近些年來(lái),隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛的應(yīng)用到銀行,保險(xiǎn),電子商務(wù),交通,電信,醫(yī)療等領(lǐng)域,在這些領(lǐng)域,數(shù)據(jù)挖掘技術(shù)取得了令人矚目的成績(jī)。在國(guó)外,數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛的應(yīng)用在高校教學(xué)管理實(shí)踐和研究中,主要表現(xiàn)在教務(wù)教學(xué),招生管理,畢業(yè)生校友管理等幾個(gè)方面。例如,Sanjeev等通過(guò)對(duì)大學(xué)數(shù)據(jù)庫(kù)中學(xué)生登記的數(shù)據(jù),利用知識(shí)發(fā)現(xiàn)方法進(jìn)行數(shù)據(jù)分析,獲得有關(guān)輟學(xué)學(xué)生的信息,并將結(jié)果提交到管理層,以制定相關(guān)戰(zhàn)略決策。在我國(guó),數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校管理也是近幾年才發(fā)展起來(lái)的,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于職業(yè)院校,將起到更廣泛的作用。
1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從上世紀(jì)90年代興起的一門交叉學(xué)科,數(shù)據(jù)挖掘,也可被稱作是基于數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn),是指存放在數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)或其他信息庫(kù)中的、大量的數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可以理解的模式的非平凡過(guò)程。數(shù)據(jù)挖掘技術(shù)包括人工智能、神經(jīng)網(wǎng)絡(luò)、數(shù)理統(tǒng)計(jì)、模式識(shí)別、數(shù)據(jù)庫(kù)、粗糙集等技術(shù)的學(xué)科。數(shù)據(jù)挖掘技術(shù)主要有關(guān)聯(lián)規(guī)則、序列模式、分類/回歸分析、決策樹、聚類、神經(jīng)網(wǎng)絡(luò)、Web挖掘等。以下簡(jiǎn)單介紹幾種常用的技術(shù)。
(1)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是反映的事物與其他事物之間的相互依存性和關(guān)聯(lián)性。如果兩個(gè)或者多個(gè)事物之間存在一定的關(guān)聯(lián)關(guān)系,那么,其中一個(gè)事物就能通過(guò)關(guān)聯(lián)規(guī)則由其他事物推測(cè)得到。
(2)分類。對(duì)大量的數(shù)據(jù)根據(jù)某個(gè)分類器將數(shù)據(jù)對(duì)象劃分到給定的幾個(gè)類別中的某一類。一般有兩個(gè)階段:構(gòu)造分類器和利用分類器對(duì)數(shù)據(jù)進(jìn)行分類。
(3)聚類。聚類是將數(shù)據(jù)按照其自身的某些特點(diǎn)劃分為若干組的過(guò)程,并使得同一組內(nèi)的數(shù)據(jù)對(duì)象具有較高的相似性。
(4)決策樹。決策樹一般都是自上而下的來(lái)生成的。每個(gè)決策或事件(即自然狀態(tài))都可能引出兩個(gè)或多個(gè)事件,導(dǎo)致不同的結(jié)果。決策樹提供了一種展示類似在什么條件下會(huì)得到什么值這類規(guī)則的方法。
2 數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中的應(yīng)用
2.1 數(shù)據(jù)挖掘技術(shù)在職業(yè)院校教學(xué)和管理中的應(yīng)用
目前,各個(gè)學(xué)校都建立了教務(wù)管理信息系統(tǒng),在多年的教學(xué)過(guò)程中,產(chǎn)生了大量的數(shù)據(jù),隨著計(jì)算機(jī)技術(shù)以及信息化得發(fā)展,這些數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器中,相對(duì)于傳統(tǒng)的紙質(zhì)材料進(jìn)行記錄的方式有了很大的提高。但是,保存的這些大量的數(shù)據(jù),例如學(xué)生信息,學(xué)生成績(jī),教師評(píng)價(jià)結(jié)果等,如果得不到合理的利用,則幾乎沒(méi)有任何意義。在這些數(shù)據(jù)中或多或少存在著一定的聯(lián)系,目前,國(guó)內(nèi)外在教育教學(xué)管理領(lǐng)域的研究主要是利用關(guān)聯(lián)規(guī)則。
利用關(guān)聯(lián)規(guī)則在教學(xué)管理方面的分析可以得到一些有效的關(guān)聯(lián)規(guī)則,通過(guò)對(duì)大量的教務(wù)數(shù)據(jù)進(jìn)行分析,可以得出課堂效果與教師學(xué)歷、年齡、性別、教學(xué)手段等一系列的關(guān)系,從而為教學(xué)部門提供決策支持信息。Buldu和Ucgun利用Apriori算法對(duì)伊斯坦布爾一所職業(yè)高中中的學(xué)生數(shù)據(jù)進(jìn)行挖掘,得到了學(xué)生成績(jī)不208fad8257a0105b9bdd98d5a13dac48bd22b4e9d387a9b2203c50336c95600f理想的各門課程之間的關(guān)系,為學(xué)校進(jìn)一步做決策提供有效的數(shù)據(jù)。在職業(yè)院校中,除了理論課程是必修課之外,還有最重要的技能課,利用數(shù)據(jù)挖掘功能,如何處理好理論課與技能課之間的關(guān)系,也是非常重要的。
2.2 數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中招生錄取工作中的應(yīng)用
招生工作是各個(gè)院校的重點(diǎn)工作之一,學(xué)生的錄取工作直接關(guān)系到后續(xù)學(xué)生學(xué)習(xí),畢業(yè)就業(yè)等一系列的工作。職業(yè)院校的招生規(guī)模逐年擴(kuò)大,招生數(shù)量逐年擴(kuò)大,招生方式也在朝著多元化,自主化方向發(fā)展。通過(guò)對(duì)往年招生信息的處理,發(fā)現(xiàn)學(xué)生高考各科成績(jī)與學(xué)生填報(bào)志愿、熱門專業(yè)等要素之間的關(guān)系等等,為學(xué)校招生部門做出招生策略提供了有效的信息。
對(duì)于院校來(lái)說(shuō),通過(guò)對(duì)對(duì)學(xué)生志愿信息利用關(guān)聯(lián)規(guī)則挖掘,可以得出目前相對(duì)支持度較高的專業(yè),針對(duì)這些專業(yè)進(jìn)行宣傳,打造學(xué)校的特色專業(yè),這些結(jié)果同時(shí)為編制招生計(jì)劃提供了參考依據(jù)。對(duì)于學(xué)生來(lái)說(shuō),院??梢酝ㄟ^(guò)對(duì)學(xué)生信息的分析,為學(xué)生推薦適合他的專業(yè),為學(xué)生報(bào)名填志愿提供了很大的幫助。這在職業(yè)院校,尤其是獨(dú)立自主招生的院校有很大的發(fā)展前景。
2.3 數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中就業(yè)方向的應(yīng)用
目前職業(yè)院校招生規(guī)模擴(kuò)大非常迅速,大學(xué)畢業(yè)生就業(yè)問(wèn)題日益突出,已經(jīng)成為社會(huì)普遍關(guān)注的問(wèn)題。對(duì)于職業(yè)院校來(lái)說(shuō),就業(yè)問(wèn)題甚至?xí)P(guān)系到下一屆的招生工作的展開。提高職業(yè)學(xué)校的就業(yè)率,各個(gè)院校都采取了信息化手段,建立就業(yè)信息系統(tǒng)管理,取得了良好的效果,但是隨著畢業(yè)生數(shù)據(jù)的激增,傳統(tǒng)的手段已經(jīng)不能滿足需要,數(shù)據(jù)挖掘技術(shù)就是一個(gè)有效處理分析畢業(yè)生就業(yè)數(shù)據(jù)的有效方法。
目前,數(shù)據(jù)挖掘技術(shù)在職業(yè)院校的就業(yè)指導(dǎo)體系中有了很大的發(fā)展,主要通過(guò)決策樹等分類算法對(duì)學(xué)生的就業(yè)數(shù)據(jù)信息進(jìn)行數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理等一系列操作,建立就業(yè)訓(xùn)練樣本集,通過(guò)決策樹分類算法得到實(shí)際有效的畢業(yè)預(yù)測(cè)分析模型,進(jìn)而得出一系列的預(yù)測(cè)規(guī)則,完善學(xué)校就業(yè)服務(wù)體系。通過(guò)對(duì)學(xué)生信息的分析,為學(xué)生提高就業(yè)率提供幫助。
3 數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中應(yīng)用存在的主要問(wèn)題
雖然目前挖掘技術(shù)在教育領(lǐng)域應(yīng)用比較廣泛,發(fā)展比較迅速,但是畢竟數(shù)據(jù)挖掘技術(shù)還不完善,還處于起步階段,是一個(gè)比較新的研究領(lǐng)域。數(shù)據(jù)挖掘技術(shù)在職業(yè)院校中的應(yīng)用還存在著以下幾個(gè)問(wèn)題。
(1)性能和成本。數(shù)據(jù)挖掘技術(shù)還在起步階段,一些資源及技術(shù)需要陳本較大,不利于數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域普及。
(2)數(shù)據(jù)質(zhì)量。許多數(shù)據(jù)庫(kù)可能不能提供完整的,完全正確的數(shù)據(jù),這就要求進(jìn)行數(shù)據(jù)挖掘時(shí)采用恰當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù),并進(jìn)行噪聲數(shù)據(jù)處理。
(3)技術(shù)水平。要求工作人員具備較高的計(jì)算機(jī)水平,懂得數(shù)據(jù)挖掘方面的知識(shí),并能熟練運(yùn)用各種相關(guān)知識(shí)對(duì)數(shù)據(jù)進(jìn)行分析、實(shí)驗(yàn),能夠提出決策支持方面的需求。
總之,數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的應(yīng)用研究取得了一定的發(fā)展,但相對(duì)于其他領(lǐng)域來(lái)說(shuō),起步較晚,還有很多工作要做。
參考文獻(xiàn)
[1]李雄飛,董元方,李軍,等.數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)[M].2版.北京:高等教育出版社,2010:2-5.
[2]劉美玲,李熹,李永勝.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)與管理中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2010(5):1130-1133.
[3]孫忠祥,彭湘君,楊玉平,等.數(shù)據(jù)挖掘在教育教學(xué)中的應(yīng)用綜述[J].智能計(jì)算機(jī)與應(yīng)用,2012(2).
[4]江敏,徐艷.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[J].電腦知識(shí)與技術(shù),2012(4).
[5]周留軍,王靖.基于數(shù)據(jù)挖掘的高職學(xué)生就業(yè)情況的研究[J].電腦知識(shí)與技術(shù),2012(5).