鄒星
高校教務(wù)管理系統(tǒng)在高校管理中具有舉足輕重的地位。伴隨著高校的擴(kuò)招、學(xué)生數(shù)量的急劇增加以及學(xué)分制的確定,原本復(fù)雜的教務(wù)管理工作變得更加復(fù)雜。教務(wù)管理所使用的教務(wù)管理系統(tǒng)雖然能夠完成日常事務(wù)工作的處理,但卻不能解決信息查找、信息分析等問題,無法為管理人員提供決策支持,滿足不了現(xiàn)代高校管理的新需求。數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)海量數(shù)據(jù)之間隱藏的關(guān)聯(lián)及相互之間的影響作用,為管理人員提供決策幫助。本文研究的重點(diǎn)就是在現(xiàn)有的教務(wù)管理系統(tǒng)之上,利用數(shù)據(jù)挖掘技術(shù)解決目前高校教務(wù)管理中普遍存在的數(shù)據(jù)分析問題,達(dá)到提高高校管理的質(zhì)量和水平的目的。
一、數(shù)據(jù)挖掘的過程
第一,明確業(yè)務(wù)應(yīng)該處理的對象。應(yīng)該對于問題進(jìn)行明確的界定,對于數(shù)據(jù)挖掘的目標(biāo)的確定是保證數(shù)據(jù)挖掘的開端,也是非常重要的一個環(huán)節(jié)。雖然對于數(shù)據(jù)進(jìn)行挖掘最后的結(jié)論是不可預(yù)測的,但是對于問題所進(jìn)行的探索是非常清楚的。如果盲目地對數(shù)據(jù)進(jìn)行挖掘,就會降低數(shù)據(jù)挖掘的準(zhǔn)確性。
第二,數(shù)據(jù)準(zhǔn)備工作。這個過程需要完成的工作主要有數(shù)據(jù)選擇、數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)選擇主要是對和業(yè)務(wù)對象相關(guān)的所有的有用信息進(jìn)行搜索,從而在里面選擇最合適的信息。數(shù)據(jù)處理主要研究數(shù)據(jù)本身的質(zhì)量,其目的是為了更好地完成數(shù)據(jù)分析工作,并且確定進(jìn)行數(shù)據(jù)挖掘的類型。數(shù)據(jù)轉(zhuǎn)換主要是為數(shù)據(jù)轉(zhuǎn)換確定合適的分析模型,這個模型的建立需要充分考慮數(shù)據(jù)的算法,建立真正合適的分析模型。
二、關(guān)聯(lián)規(guī)則算法與決策樹算法在教務(wù)管理中的應(yīng)用
(一)關(guān)聯(lián)規(guī)則算法
關(guān)聯(lián)規(guī)則能夠非常清晰準(zhǔn)確地表達(dá)數(shù)據(jù)庫中每一個子集的基本情況。使用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)分析時,主要工作方式就是通過對數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫和其他儲備信息庫進(jìn)行分析,從而尋找出項(xiàng)集之間存在的關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的重要組成部分。所謂關(guān)聯(lián)規(guī)則,是指能夠達(dá)到預(yù)定目標(biāo)要求的規(guī)則。舉一個簡單的例子,在一個蘊(yùn)含式子中:形如這樣的一種蘊(yùn)含式子:X-Y。其中:X表示規(guī)則前件,Y表示規(guī)則后件。關(guān)聯(lián)規(guī)則的強(qiáng)度值通常用客觀興趣度衡量??陀^興趣度衡量是一種評價關(guān)聯(lián)模式的質(zhì)量的數(shù)據(jù)驅(qū)動的方法。它使用從數(shù)據(jù)推導(dǎo)出的統(tǒng)計(jì)量來確定模式是否是有趣的,可用支持度或置信度來評價。令I(lǐng)=(i1,i2,i3,…,im)是挖掘數(shù)據(jù)庫D中所有項(xiàng)的集合,集合T={t1,t2,t3,…,tn}是所有事務(wù)的集合,包含零個或多個項(xiàng)的集合稱為項(xiàng)集。如果項(xiàng)集X是事務(wù)t1的子集,則稱事務(wù)t1包含項(xiàng)集X。在事務(wù)集T中包含項(xiàng)集X的事務(wù)個數(shù)稱為項(xiàng)集X的支持度計(jì)數(shù)M(X)。
(二)決策樹算法
決策樹算法就是以實(shí)際案例進(jìn)行歸納總結(jié)而得出的一種學(xué)習(xí)算法,主要的運(yùn)算原理即是在無順序、無規(guī)則的元組中找到?jīng)Q策樹表示形式的分類規(guī)則。其遞歸方式采用的是自項(xiàng)而下的方式,在決策樹的內(nèi)部節(jié)點(diǎn)中去完成屬性值的比較,并且根據(jù)不用的屬性值進(jìn)行自上而下的分支,在分類的過程中要學(xué)習(xí)葉節(jié)點(diǎn)自身的特性和規(guī)律,只有把握住其內(nèi)在規(guī)律才能夠在從根到葉節(jié)點(diǎn)的運(yùn)算過程中不出現(xiàn)錯誤。決策樹的構(gòu)造過程中不需要掌握非常高端的計(jì)算機(jī)知識,只需要掌握基本的知識就能夠完成其構(gòu)建過程,因此這種算法在數(shù)據(jù)挖掘過程中受到非常廣泛的關(guān)注。
(三)關(guān)聯(lián)規(guī)則算法與決策樹算法在教務(wù)管理中的應(yīng)用
當(dāng)前研究的高校教務(wù)管理系統(tǒng)中就已經(jīng)應(yīng)用了很多的關(guān)于關(guān)聯(lián)算法和決策樹算法,因?yàn)檫@兩種算法的綜合應(yīng)用性比較強(qiáng),所以依據(jù)其自身的挖掘目的和數(shù)據(jù)分析的特點(diǎn)所設(shè)計(jì)的數(shù)據(jù)挖掘系統(tǒng)就具有非常強(qiáng)大的適用性。通過數(shù)據(jù)挖掘就能夠?qū)⒔處煹哪挲g、工作、學(xué)歷、課時等基本信息很快地搜索關(guān)聯(lián)起來,這樣對提高教學(xué)質(zhì)量和教師的自身素質(zhì)有很大的幫助。因?yàn)橄鄬碚f,高校的教務(wù)管理系統(tǒng)中有很多的教師信息,這樣就會導(dǎo)致學(xué)生和教師的信息非常龐雜,龐大的數(shù)據(jù)系統(tǒng)會使教務(wù)管理系統(tǒng)在運(yùn)作時所需要處理的數(shù)據(jù)變得更多。
決策樹在高校教務(wù)管理信息系統(tǒng)中所發(fā)揮的作用非常大,主要就是用于對相關(guān)數(shù)據(jù)信息的預(yù)處理。在預(yù)處理的過程中,首先應(yīng)該完成的就是相關(guān)的決策樹模型構(gòu)建,在構(gòu)建決策樹模型以后,往往會存在一些不需要處理的分支,這些分支的存在對于正常的教務(wù)管理工作有很大的影響,所以說,在構(gòu)建決策樹以后首先應(yīng)該完成的就是剪枝工作,剪枝工作的質(zhì)量和效率對于決策樹自身存在的合理性有很大的影響。對于分支決策樹進(jìn)行合理的剪枝,就能夠讓決策樹剪枝工作順利完成,這樣也就能夠保證其預(yù)期具有較高的效率。在構(gòu)建決策樹的過程中,一定要注意構(gòu)建合理科學(xué)的決策樹。
三、結(jié)束語
在當(dāng)前的學(xué)校教務(wù)管理系統(tǒng)中,信息量的快速增加會給教務(wù)管理人員帶來很大的挑戰(zhàn)。因此在當(dāng)前的科技環(huán)境下,應(yīng)該將數(shù)據(jù)挖掘技術(shù)的相關(guān)算法廣泛應(yīng)用在學(xué)校的教務(wù)管理系統(tǒng)中,這樣就能夠促進(jìn)教務(wù)管理系統(tǒng)進(jìn)一步改革和完善,為管理人員決策提供重要的依據(jù),從而使教務(wù)管理工作變得更有科學(xué)性和針對性。