李思瑤
摘要:在信息化急速發(fā)展的今天,許多工作都在計(jì)算機(jī)系統(tǒng)的輔助下得到了高效率的發(fā)展和進(jìn)步。隨著高校學(xué)生人數(shù)的急劇增長(zhǎng),給高校教學(xué)管理工作增添了許多困難。本文力求將數(shù)據(jù)挖掘應(yīng)用在高校教學(xué)管理中,利用數(shù)據(jù)挖掘技術(shù)有效的挖掘教學(xué)管理資料中隱藏的重要信息,為學(xué)院安排教學(xué)工作提供科學(xué)決策依據(jù),從而提高高校教學(xué)管理系統(tǒng)的使用效率。
關(guān)鍵詞:數(shù)據(jù)挖掘 教學(xué)管理 關(guān)聯(lián)規(guī)則 決策樹
數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中挖掘有趣模式和知識(shí)的過程。數(shù)據(jù)源包括Web、數(shù)據(jù)庫、動(dòng)態(tài)流入系統(tǒng)的數(shù)據(jù)或其他信息存儲(chǔ)庫。雖然是一門新興學(xué)科,但其研究具有廣泛的應(yīng)用前景。本文旨在尋找數(shù)據(jù)挖掘技術(shù)與教學(xué)管理系統(tǒng)這兩者的聯(lián)結(jié)點(diǎn),尋求如何在教學(xué)管理系統(tǒng)中使用數(shù)據(jù)挖掘技術(shù)。本文主要對(duì)學(xué)生成績(jī)數(shù)據(jù)庫、教學(xué)評(píng)價(jià)數(shù)據(jù)庫進(jìn)行挖掘。
一、教務(wù)管理信息化建設(shè)成果及問題
隨著我國(guó)高校信息化的迅猛發(fā)展,信息技術(shù)在高校教學(xué)管理中應(yīng)用的普及。全國(guó)絕大部分高校已經(jīng)建立校園網(wǎng)并使用現(xiàn)代化的教學(xué)管理手段。利用信息技術(shù)更有效的為高校日常教學(xué)管理服務(wù)。已經(jīng)成為當(dāng)代教學(xué)管理人員進(jìn)行日常教學(xué)管理的重要手段之一。
從國(guó)內(nèi)高校使用的教學(xué)管理系統(tǒng)的情況來看,雖然系統(tǒng)中保存著課程、師生信息、成績(jī)等大量的數(shù)據(jù)信息。但絕大部分管理人員只對(duì)這些大量積累的數(shù)據(jù)采取導(dǎo)入、查詢、刪除和備份等操作。雖然該系統(tǒng)在一定程度上大幅度地提高了教務(wù)管理效率,但該系統(tǒng)不具備為管理人員提供能科學(xué)性、理論性的綜合分析學(xué)生、教師情況的信息,且對(duì)于長(zhǎng)時(shí)間積累的大量數(shù)據(jù)中所隱含的信息不能有效的處理。不能充分發(fā)揮信息技術(shù)的潛能。難以為教學(xué)管理決策提供科學(xué)、理論的依據(jù)。
二、數(shù)據(jù)挖掘系統(tǒng)的實(shí)現(xiàn)目標(biāo)
目前高校的教學(xué)管理系統(tǒng)能夠完成高校現(xiàn)階段教務(wù)工作所涉及的教學(xué)管理以及數(shù)據(jù)信息等工作。具有對(duì)數(shù)據(jù)的儲(chǔ)存、修改、查詢、備份等功能。但是該系統(tǒng)的使用,讓教學(xué)管理人員的工作仍處于簡(jiǎn)單的數(shù)據(jù)操作狀態(tài)中。該系統(tǒng)很難做到對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行多角度分析,這些常年積累的數(shù)據(jù)隱藏著未知的規(guī)律或者模式。這些未知的規(guī)律或者模式卻因未經(jīng)發(fā)現(xiàn)而不能使用。
為了解決這一問題。本文通過對(duì)筆者所在單位使用的正方管理系統(tǒng)中已有的數(shù)據(jù)庫進(jìn)行整理、連接,使用數(shù)據(jù)挖掘工具,從而設(shè)計(jì)出能夠挖掘隱藏知識(shí)的新一代教學(xué)管理系統(tǒng)。本文設(shè)計(jì)的教學(xué)管理挖掘系統(tǒng)主要有兩方面的應(yīng)用:
1.教學(xué)評(píng)價(jià)中的應(yīng)用。學(xué)院每學(xué)期均組織學(xué)生、教師進(jìn)行教學(xué)評(píng)價(jià),評(píng)價(jià)后的數(shù)據(jù)除了用于對(duì)教師的教學(xué)質(zhì)量評(píng)級(jí)外不做其他用途。使用決策樹算法,建立教學(xué)評(píng)價(jià)模型,幫助教學(xué)管理人員有效地、正確地使用每學(xué)期積累的教學(xué)評(píng)價(jià)數(shù)據(jù),找出影響教師教學(xué)效果的因素,從而在提高教學(xué)質(zhì)量、加強(qiáng)教學(xué)效果、合理分配教學(xué)資源等方面,提供科學(xué)理論依據(jù)。
2.課程設(shè)置中的應(yīng)用。各個(gè)系部的專業(yè)課程設(shè)置均為循序漸進(jìn)的,即課程與課程間有一定的先后順序關(guān)系。但是有些課程開設(shè)的先后順序并不能從經(jīng)驗(yàn)上判斷。致使相關(guān)課程開課的先后順序不清。故使用關(guān)聯(lián)規(guī)則算法建立課程設(shè)置模型。為人才培養(yǎng)方案的制定提供科學(xué)理論依據(jù)。顯得尤為必要。
三、高校教學(xué)挖掘系統(tǒng)構(gòu)建
(一)數(shù)據(jù)挖掘模型的構(gòu)建過程
1.確定挖掘目標(biāo)。該步驟是進(jìn)行數(shù)據(jù)挖掘的第一步。進(jìn)行挖掘前首要一步就是能夠明確問題,確定挖掘目的,認(rèn)清目標(biāo)是正確建立挖掘的先決條件。本系統(tǒng)所挖掘的信息是教學(xué)評(píng)價(jià)評(píng)分和學(xué)生成績(jī)。目的是通過對(duì)教學(xué)評(píng)價(jià)的評(píng)分和學(xué)生期末成績(jī)進(jìn)行分析,找出影響教師課堂教學(xué)效果的因素以及課程設(shè)置的先后順序。2.數(shù)據(jù)選擇。該步驟是對(duì)所需數(shù)據(jù)進(jìn)行收集、篩選。3.據(jù)預(yù)處理。該步驟是需要對(duì)存儲(chǔ)在數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行清理、去噪、刪去無效數(shù)據(jù)、填補(bǔ)不完整的域等操作。這些操作的目的是為了保證數(shù)據(jù)的正確、完整和一致性。4.數(shù)據(jù)轉(zhuǎn)換。將處理過的數(shù)據(jù)轉(zhuǎn)換成為一個(gè)數(shù)據(jù)模型,根據(jù)數(shù)據(jù)的特點(diǎn)選擇建立相應(yīng)的數(shù)據(jù)挖掘模型。5.數(shù)據(jù)挖掘。按照挖掘模型。選擇適合的算法對(duì)數(shù)據(jù)進(jìn)行挖掘,以期獲取有用的知識(shí)。6.生成分類規(guī)則。對(duì)挖掘得到的信息進(jìn)行解釋、評(píng)價(jià),將得到的結(jié)果生成分類規(guī)則。在評(píng)價(jià)階段,為了便于用戶的理解,系統(tǒng)將篩選出有價(jià)值的信息使用可視化的方法將結(jié)果呈現(xiàn)。7.知識(shí)的應(yīng)用。將挖掘出的知識(shí)應(yīng)用到實(shí)際教學(xué)中,以期待找到提高教師授課水平的關(guān)鍵因素和正確的課程設(shè)置順序,從而提高學(xué)院的整體教學(xué)水平、提高教學(xué)質(zhì)量。
(二)主要功能模塊介紹
登錄模塊:本系統(tǒng)的使用者根據(jù)身份的不同。有著不同的使用權(quán)限。本系統(tǒng)的使用者主要包括管理員和教師。管理員的職責(zé)是對(duì)系統(tǒng)平臺(tái)進(jìn)行日常管理和維護(hù),系統(tǒng)管理員可以實(shí)現(xiàn)擁有最高權(quán)限。教師身份是系統(tǒng)平臺(tái)的使用者,可以對(duì)平臺(tái)的信息進(jìn)行挖掘,并對(duì)挖掘后的知識(shí)進(jìn)行查詢、使用,其使用權(quán)限次于系統(tǒng)管理員。
數(shù)據(jù)預(yù)處理模塊:在數(shù)據(jù)預(yù)處理子功能模塊中,主要是可以依據(jù)挖掘需要,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理操作。主要的操作包括數(shù)據(jù)的選擇、數(shù)據(jù)的缺失值處理、數(shù)據(jù)冗余的處理、數(shù)據(jù)的離散化處理等。基于決策樹算法的教學(xué)評(píng)價(jià)模塊:該模塊是使用lD3算法實(shí)現(xiàn)的。該模塊主要用于對(duì)每學(xué)期學(xué)院組織的教學(xué)評(píng)價(jià)分?jǐn)?shù)進(jìn)行分析。找尋影響教師教學(xué)效果的因素。基于關(guān)聯(lián)規(guī)則的課程設(shè)置模塊:該模塊是使用Apriori算法實(shí)現(xiàn)的。學(xué)生在校學(xué)習(xí)期間,課程之間是有一定相互聯(lián)系的,部分課程是有前后順序關(guān)系的。該模塊主要是對(duì)課程實(shí)行數(shù)據(jù)挖掘,找尋課程與課程間的關(guān)聯(lián)。并分析各個(gè)課程間的相關(guān)性。該模塊主要使用學(xué)生成績(jī)數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘滿足給定條件的支持度和置信度課程問的關(guān)聯(lián),得到有價(jià)值的發(fā)現(xiàn)、規(guī)律,為科學(xué)、合理設(shè)置課程順序。提供有力的數(shù)據(jù)支持。
數(shù)據(jù)挖掘技術(shù)在教學(xué)管理系統(tǒng)中的應(yīng)用,除了本文所涉及的教學(xué)評(píng)價(jià)和課程設(shè)置外,還有許多待開發(fā)、研究的方向。在今后的學(xué)習(xí)、研究中。可以進(jìn)一步開發(fā)新的應(yīng)用系統(tǒng)。例如:學(xué)生選課的興趣研究、學(xué)生高考成績(jī)對(duì)大學(xué)階段考試成績(jī)的影響、課程設(shè)置與學(xué)生就業(yè)方向的關(guān)系、挖掘影響教師科研水平的因素、學(xué)生就業(yè)情況與在校期間成績(jī)的聯(lián)系等課題的研究。