張瑋
摘 要:近年來,隨著我國高校招生規(guī)模的不斷擴大以及不斷提高的信息化程度,在各學(xué)校的教務(wù)系統(tǒng)中普遍存儲了大量的資料、數(shù)據(jù)等信息。在這些資料和數(shù)據(jù)等信息中,內(nèi)在隱藏了大量的、有價值的內(nèi)在規(guī)律。數(shù)據(jù)挖掘技術(shù)是從大量的、隨機的數(shù)據(jù)中找出隱藏在其中的、有價值的信息的過程。該文提出了一種基于關(guān)聯(lián)規(guī)則挖掘的成績預(yù)警模型。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則 Apriori算法 成績預(yù)警模型
中圖分類號:TP301 文獻標(biāo)識碼:A 文章編號:1674-098X(2013)03(c)-00-01
數(shù)據(jù)挖掘技術(shù)可以在教學(xué)管理過程中應(yīng)用,會在教學(xué)效果考察、課程設(shè)置安排等方面起到幫助作用。舉一個例子來說,學(xué)校開設(shè)的專業(yè)課之間,如何合理安排課程的先后順序,也就是怎樣安排學(xué)生在學(xué)校中學(xué)習(xí)和知識增長的過程。合理的安排可以有效提高學(xué)校管理的提前預(yù)知、教法的合理選擇以及教學(xué)的科學(xué)指導(dǎo),對高校教育管理、人才創(chuàng)新能力培養(yǎng),具有十分重要的意義。因成績預(yù)警信息針對性很強,簡單利用以關(guān)聯(lián)規(guī)則為基礎(chǔ)的數(shù)據(jù)挖掘技術(shù)很難解決成績預(yù)警問題。該文將關(guān)聯(lián)規(guī)則應(yīng)用于學(xué)生的成績之中,提出有針對性的課程成績預(yù)警模型,為實踐提供理論依據(jù)。
1 核心原理
在研究和利用關(guān)聯(lián)規(guī)則之前,必須先理清相關(guān)概念。關(guān)聯(lián)規(guī)則定義是在交易數(shù)據(jù)以及信息載體中,對存在于項目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)進行查找,通過分析數(shù)據(jù)之間的相關(guān)關(guān)系,找出內(nèi)在的聯(lián)系。說得更具體一些,關(guān)聯(lián)規(guī)則就是類似X→Y的表達式,X、Y分別代表關(guān)聯(lián)規(guī)則的先導(dǎo)、后繼。假設(shè)I是項的集合。一個給定的交易數(shù)據(jù)庫,標(biāo)記為D,每個數(shù)據(jù)t都是集合I的非空子集,也就是每個交易都與唯一的標(biāo)識符相對應(yīng),記為TID。
兩個重要的概念:D中的支持度是D中事務(wù)同時包含X、Y的百分比,也就是概率;包含X的同時又包含Y的百分比,即條件概率叫做置信度。關(guān)聯(lián)規(guī)則的挖掘過程包含兩個重要階段:第一階段,從資料集合中找出所有的高頻項目組;第二階段,由找到的高頻項目組中產(chǎn)生關(guān)聯(lián)規(guī)則。
該文提出的理論模型基于關(guān)聯(lián)規(guī)則的Apriori算法。Apriori算法是一種基于挖掘關(guān)聯(lián)規(guī)則的頻繁項集算法,通過對數(shù)據(jù)關(guān)聯(lián)性進行分析、挖掘,找出數(shù)據(jù)在決策制定過程中重要的參考價值。
Apriori算法目前也被應(yīng)用于高校管理中。例如:學(xué)校的管理部門對于貧困學(xué)生的資助問題,由于貧困生數(shù)量的增多導(dǎo)致工作的難度也逐漸加大。針對這一問題,Apriori算法可以提出解決方法。該文借鑒了Apriori算法在教學(xué)管理中的具體應(yīng)用,建立了成績預(yù)警模型。
2 基于關(guān)聯(lián)規(guī)則的成績預(yù)警模型
在高校的教學(xué)管理中,對學(xué)生進行科學(xué)的學(xué)習(xí)評價是十分重要的工作職責(zé),不但能對學(xué)生起到信息反饋、激發(fā)學(xué)習(xí)動力的作用,又能檢查學(xué)校整體的課程安排計劃是否合理,還能發(fā)現(xiàn)學(xué)生間的個體差異達到因材施教。
在我國目前的教學(xué)管理體系中,成績是評價學(xué)生的最主要指標(biāo)。學(xué)生在學(xué)校學(xué)習(xí)的過程中,各門課程都會產(chǎn)生成績數(shù)據(jù),每門課又會根據(jù)實際情況,產(chǎn)生諸如平時成績、考勤成績、期末成績等多項成績數(shù)據(jù)。面對如此大量的數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù),對學(xué)生的學(xué)習(xí)成績數(shù)據(jù)庫進行科學(xué)的分析處理,可以及時掌握學(xué)生的評價結(jié)果,對學(xué)生成績出現(xiàn)的問題及時預(yù)警、及時解決,更好的開展教學(xué)工作。
該文提出了以下一種基于關(guān)聯(lián)規(guī)則的成績預(yù)警的理論模型,目的是對成績進行系統(tǒng)地預(yù)警分析。本預(yù)警模型試圖通過興趣度約束、預(yù)警項集約束以及項順序關(guān)系約束三種約束關(guān)系,實現(xiàn)對數(shù)據(jù)的定向挖掘,使分析結(jié)果具有更強的針對性。該模型完全可以基于現(xiàn)實數(shù)據(jù)來源來開展實驗研究,具有很強的可操作性。
模型中,預(yù)警工作可以劃分成兩個階段:訓(xùn)練階段、預(yù)警階段。在訓(xùn)練階段,預(yù)警系統(tǒng)接收學(xué)生成績的訓(xùn)練數(shù)據(jù),從接收到的數(shù)據(jù)中自動形成系統(tǒng)所需的成績預(yù)警規(guī)則;在預(yù)警階段,系統(tǒng)依照訓(xùn)練階段生成的預(yù)警規(guī)則,結(jié)合輸入的學(xué)生成績和預(yù)警課程信息,產(chǎn)生預(yù)警信息。
基于關(guān)聯(lián)規(guī)則的成績預(yù)警模型由以下五部分組成:(1)成績輸入(輸出)口;(2)預(yù)處理模塊;(3)預(yù)警規(guī)則挖掘模塊;(4)成績預(yù)警規(guī)則(5)預(yù)警模塊。
預(yù)警規(guī)則的挖掘是成績預(yù)警系統(tǒng)中最為核心的部分。預(yù)警模塊根據(jù)輸入的學(xué)生成績數(shù)據(jù)和預(yù)警課程信息,從成績預(yù)警規(guī)則中提取相應(yīng)的預(yù)警規(guī)則集,根據(jù)所設(shè)計的預(yù)警策略決定是否生成預(yù)警信息。在實際的預(yù)警過程中,具體過程如下:
(1)系統(tǒng)處理一個接收到的學(xué)生成績數(shù)據(jù);
(2)通過預(yù)處理模塊將數(shù)據(jù)轉(zhuǎn)變成系統(tǒng)規(guī)定的標(biāo)準(zhǔn)格式;
(3)預(yù)警模塊中的預(yù)警課程信息從預(yù)警規(guī)則庫中提取預(yù)警規(guī)則集,分析成績數(shù)據(jù),進行匹配分析;
(4)匹配預(yù)警時,首先在成績數(shù)據(jù)中尋找當(dāng)前規(guī)則的前項。如果找不到,則認(rèn)為此條規(guī)則不適用于這條記錄,放棄匹配,轉(zhuǎn)向規(guī)則集中的下一條規(guī)則;如果能夠找到,則認(rèn)為此條規(guī)則適用于這條記錄,通過預(yù)警信息輸出口輸出預(yù)警信息,并退出預(yù)警過程。
通過上述過程,學(xué)生成績數(shù)據(jù)的預(yù)警工作就可以自動完成。通過系統(tǒng)輸出的預(yù)警信息,教師、學(xué)生都可以根據(jù)具體情況,不斷改進自身的教學(xué)或?qū)W習(xí)工作,提高整體的學(xué)習(xí)成績。
3 結(jié)語
該文提出了一種基于關(guān)聯(lián)規(guī)則挖掘的成績預(yù)警的理論模型,以預(yù)警規(guī)則集為基礎(chǔ),根據(jù)預(yù)警算法生成預(yù)警信息。該理論模型的實際可操作性極強,可直接應(yīng)用于目前的教學(xué)管理中。通過實際的實踐過程,還可以不斷充實、完善該模型,達到更好的效果。
參考文獻
[1] 張玉林.數(shù)據(jù)挖掘技術(shù)在教學(xué)過程中的指導(dǎo)作用[J].西安通信學(xué)院學(xué)報,2006,5(2):38-40.
[2] 蔣秀英.關(guān)聯(lián)規(guī)則在課堂教學(xué)評價中的應(yīng)用[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2003,18(3):25-28.
[3] 趙丹群.數(shù)據(jù)挖掘:原理、方法及其應(yīng)用[J].現(xiàn)代圖書情報技術(shù),2000(6):1.
[4] 陶蘭,王保迎,呂建軍.數(shù)據(jù)挖掘技術(shù)在高等學(xué)校決策支持中的應(yīng)用[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2003,8(2):39-41.
[5] 蘆潔,劉志鏡.挖掘關(guān)聯(lián)規(guī)則中對Apriori算法的一個改進[J].微電子學(xué)與計算機,2006,23(2):10-12.
[6] 胡吉明,鮮學(xué)豐.挖掘關(guān)聯(lián)規(guī)則中Apriori算法的研究與改進[J].計算機技術(shù)與發(fā)展,2006,16(4):99-104.
[7] 盧炎生,楊芬,趙棟.帶單調(diào)約束的關(guān)聯(lián)規(guī)則挖掘[J].計算機工程,2004,30(15):78-80.