王勤超 顧陸偉 蔡小慶 劉小丹 許俊
摘要:隨著互聯(lián)網(wǎng)的普及,電腦、iPad等移動(dòng)終端被廣泛運(yùn)用在人們生產(chǎn)生活中,極大地提升了工作效率,高校學(xué)生信息管理系統(tǒng)也逐步朝著智能化、自動(dòng)化和信息化的方向發(fā)展。數(shù)據(jù)挖掘作為建設(shè)學(xué)生信息管理系統(tǒng)中重要技術(shù)之一,不僅能夠確保信息管理的有效性,更可輔助高校及時(shí)調(diào)整教學(xué)決策,促進(jìn)學(xué)生的健康全面發(fā)展。高校應(yīng)結(jié)合自身實(shí)際情況,綜合考慮學(xué)生就業(yè)需要、教學(xué)目標(biāo)等方面的內(nèi)容,合理地運(yùn)用數(shù)據(jù)挖掘技術(shù),開發(fā)針對(duì)性學(xué)生信息管理系統(tǒng),確保學(xué)生信息管理的完整性與可靠性。該文簡(jiǎn)要分析數(shù)據(jù)挖掘技術(shù),重點(diǎn)探討該種技術(shù)在學(xué)生信息管理系統(tǒng)的應(yīng)用途徑和注意要點(diǎn)。
關(guān)鍵詞:數(shù)據(jù)挖掘;信息管理;決策樹;應(yīng)用效率
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)29-0020-02
在科學(xué)技術(shù)日新月異的時(shí)代背景下,計(jì)算機(jī)等設(shè)備開始運(yùn)用在高校學(xué)生信息管理系統(tǒng)中,為提升學(xué)生信息管理的有效性,高校應(yīng)重視開發(fā)針對(duì)性信息管理系統(tǒng),收集學(xué)生完整的信息,降低學(xué)生信息管理工作的難度。但受到多種內(nèi)外部因素的限制,當(dāng)前高校學(xué)生信息管理系統(tǒng)多而雜,且不同的系統(tǒng)支持后臺(tái)與軟件都存在差異,增加了信息管理工作的難度,因此,高校須合理運(yùn)用數(shù)據(jù)挖掘技術(shù),將其應(yīng)用在信息管理系統(tǒng)中,通過存儲(chǔ)數(shù)據(jù)、分布數(shù)據(jù)等方式,實(shí)現(xiàn)信息管理工作的高效性、準(zhǔn)確性。
1學(xué)生信息管理系統(tǒng)中應(yīng)用的數(shù)據(jù)挖掘技術(shù)
信息管理系統(tǒng)以辦公設(shè)備、通信傳輸設(shè)備、計(jì)算機(jī)技術(shù)等為基礎(chǔ),將信息的挖掘、收集、傳遞、整理、儲(chǔ)存等過程有機(jī)統(tǒng)一,從而科學(xué)簡(jiǎn)化信息管理系統(tǒng)的操作程序,減少信息管理的工作量,因此,將信息管理系統(tǒng)應(yīng)用在高校日常工作中,不僅能夠提高學(xué)校工作效率,更可為高校決策提供準(zhǔn)確的數(shù)據(jù)參考。
1.1數(shù)據(jù)挖掘技術(shù)方式與功能
數(shù)據(jù)挖掘技術(shù)主要是指在大量不完整、隨機(jī)、模糊的原始數(shù)據(jù)中,通過一定的技術(shù),提取出深層次、具備實(shí)際價(jià)值、無(wú)法提前預(yù)測(cè)信息的整個(gè)過程,該技術(shù)具備應(yīng)用性、潛在性和價(jià)值性三個(gè)特征,其具體的操作程序?yàn)椋菏占紨?shù)據(jù)—選擇恰當(dāng)數(shù)據(jù)一對(duì)數(shù)據(jù)進(jìn)行預(yù)處理一轉(zhuǎn)換數(shù)據(jù)一挖掘數(shù)據(jù)一發(fā)現(xiàn)知識(shí);其中,收集原始數(shù)據(jù)的過程屬于確定信息挖掘?qū)ο螅x擇數(shù)據(jù)等三個(gè)步驟屬于準(zhǔn)備數(shù)據(jù)的過程。
數(shù)據(jù)挖掘技術(shù)常用到的方式包括以下幾種:一是決策樹一,顧名思義,決策樹屬于樹形結(jié)構(gòu)的分類模型,每個(gè)樹形結(jié)構(gòu)都代表著一個(gè)屬性的數(shù)值,整個(gè)結(jié)點(diǎn)就表示一個(gè)數(shù)據(jù)集,其遞歸方式通常采取自上而下的形式,該種決策樹的運(yùn)用范圍較廣,特別是大規(guī)模的數(shù)據(jù)集,其具備容易理解、描述語(yǔ)言簡(jiǎn)單、信息準(zhǔn)確性高等多種優(yōu)點(diǎn);二是神經(jīng)網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)性能的不同,可分為確定式、連續(xù)式、隨機(jī)式等形式的神經(jīng)網(wǎng)絡(luò),該種數(shù)據(jù)挖掘技術(shù)能夠獨(dú)立存儲(chǔ)信息、并行處理數(shù)據(jù),可應(yīng)用在快速搜索中;三是遺傳算法,該種技術(shù)以生物進(jìn)化論為基礎(chǔ),屬于搜索中最優(yōu)解算法,分為優(yōu)化過程與尋優(yōu)過程。將其與決策樹相聯(lián)系,有利于提升數(shù)據(jù)分析的準(zhǔn)確率。
1.2決策樹計(jì)算方式
決策樹(判定樹)屬于數(shù)據(jù)挖掘技術(shù)中應(yīng)用得較為廣泛的方式,分為多叉樹、二叉樹等結(jié)構(gòu),創(chuàng)建完整決策樹通常分為生成與剪枝兩個(gè)過程,主要包括以下幾種算法:
1)ID3計(jì)算方式:該種計(jì)算方式運(yùn)用時(shí)間長(zhǎng),且影響較廣,具體的計(jì)算公式為:
式中pi表示數(shù)據(jù)樣本歸屬于Ci類別中的概率,通過sis公式計(jì)算,log2表示采取二進(jìn)制編碼。
2)C4.5計(jì)算方式,具體計(jì)算公式為:
3)CART計(jì)算方式,具體的計(jì)算公式為:
2學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的途徑
學(xué)生信息管理系統(tǒng)主要包括學(xué)籍管理系統(tǒng)、成績(jī)管理系統(tǒng)等部分,具體如表1所示,將這些管理系統(tǒng)用數(shù)據(jù)挖掘技術(shù)有機(jī)統(tǒng)一,對(duì)于提高學(xué)校信息管理工作的有效性有著重要意義。
2.1應(yīng)用的數(shù)據(jù)挖掘技術(shù)
在學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),其具體包括以下幾種方式,分為ASP.NET、Membership、AJAX,每個(gè)數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍不同,發(fā)揮的作用也發(fā)生了相應(yīng)變化,因此,高校應(yīng)結(jié)合自身實(shí)際情況,充分發(fā)揮不同數(shù)據(jù)挖掘技術(shù)的作用,確保學(xué)生信息管理工作的順利進(jìn)行。
2.2設(shè)計(jì)數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)主要包括學(xué)生基本信息、學(xué)籍信息、獎(jiǎng)懲信息、成績(jī)信息、補(bǔ)考信息和學(xué)生的畢業(yè)信息,本文以學(xué)生基本信息為例,其具體包含學(xué)生序號(hào)、姓名、班級(jí)、學(xué)號(hào)等部分,每個(gè)模塊的字段名與數(shù)據(jù)類型如表2所示:
2.3運(yùn)用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)學(xué)生信息管理系統(tǒng)
設(shè)計(jì)學(xué)生信息管理系統(tǒng)時(shí),應(yīng)設(shè)置針對(duì)性登錄驗(yàn)證方式,選擇恰當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù),確保信息管理系統(tǒng)能夠符合教師與學(xué)生的需求。科學(xué)簡(jiǎn)化信息管理工作程序,不斷引進(jìn)先進(jìn)管理理念,實(shí)現(xiàn)信息管理系統(tǒng)的智能化與自動(dòng)化。
2.3.1數(shù)據(jù)挖掘技術(shù)運(yùn)用于基本信息管理系統(tǒng)中
學(xué)生與教師在登錄信息管理系統(tǒng)時(shí),應(yīng)通過以下途徑:一是找到登錄入口;二是輸入網(wǎng)絡(luò)地址,只有輸入正確的登錄名與密碼并完成驗(yàn)證后,才能夠進(jìn)入到指定頁(yè)面,學(xué)校須對(duì)登錄名、密碼做出規(guī)定,借助對(duì)應(yīng)的人員管理系統(tǒng)生成一一對(duì)應(yīng)的登錄名與密碼,管理系統(tǒng)也可以智能判斷用戶角色,協(xié)助教師或者學(xué)生完成操作。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于學(xué)生基本信息管理系統(tǒng)中,主要包括以下幾個(gè)步驟:一是維護(hù)基本信息,信息管理系統(tǒng)的教師既可以手動(dòng)地輸入學(xué)生基本信息,也可借助EXCEL表格直接導(dǎo)入;二是查詢基本信息,直接在數(shù)字平臺(tái)上選擇對(duì)應(yīng)班級(jí),快速了解學(xué)生情況;三是統(tǒng)計(jì)基本信息;四是導(dǎo)出數(shù)據(jù)并打印。
2.3.2數(shù)據(jù)挖掘技術(shù)運(yùn)用于學(xué)籍管理系統(tǒng)中
將數(shù)據(jù)挖掘技術(shù)運(yùn)用在學(xué)籍管理系統(tǒng)中,首先,應(yīng)科學(xué)地排列學(xué)生學(xué)號(hào),借助學(xué)生人學(xué)時(shí)間、學(xué)院代碼、班級(jí)代碼、專業(yè)代碼等內(nèi)容,依次編排學(xué)號(hào);其次,注冊(cè)或者變動(dòng)學(xué)生的學(xué)籍,按照學(xué)生實(shí)際情況,處理好學(xué)生學(xué)籍工作;最后,管理學(xué)生的獎(jiǎng)懲情況,將學(xué)生在校表現(xiàn)如實(shí)地記錄在管理系統(tǒng)中。
2.3.3數(shù)據(jù)挖掘技術(shù)運(yùn)用于成績(jī)管理系統(tǒng)中
成績(jī)管理系統(tǒng)是學(xué)生信息管理中重要組成部分,其具體的設(shè)計(jì)應(yīng)用步驟有:一是準(zhǔn)確錄入學(xué)生的各科考試成績(jī),教師在系統(tǒng)中選擇需要輸入成績(jī)的班級(jí),結(jié)合學(xué)生實(shí)際情況,錄入其分?jǐn)?shù),對(duì)于沒有成績(jī)的學(xué)生,可點(diǎn)擊缺考、緩考;二是審核學(xué)生的考試成績(jī)并管理好補(bǔ)考計(jì)劃;三是查詢學(xué)生成績(jī)并做出統(tǒng)計(jì)。
2.3.4數(shù)據(jù)挖掘技術(shù)運(yùn)用于畢業(yè)管理系統(tǒng)中
畢業(yè)管理系統(tǒng)運(yùn)行的有效性直接反映著學(xué)校就業(yè)情況,學(xué)校應(yīng)不斷更新畢業(yè)管理系統(tǒng),適時(shí)收錄畢業(yè)生最新消息。同時(shí),畢業(yè)管理系統(tǒng)中還需記錄學(xué)生唯一的畢業(yè)證書編號(hào),做好查詢數(shù)據(jù)與統(tǒng)計(jì)工作,并將其導(dǎo)出打印,促進(jìn)數(shù)據(jù)挖掘技術(shù)的運(yùn)用,提升畢業(yè)生管理的有效性。
3學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)注意要點(diǎn)
學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)時(shí),主要需注意以下兩方面,一是確保管理系統(tǒng)的安全性,通過設(shè)置防火墻、密碼驗(yàn)證、輸入內(nèi)容驗(yàn)證等方式,設(shè)計(jì)系統(tǒng)的安全功能;二是確保數(shù)據(jù)收集的完整性,數(shù)據(jù)挖掘技術(shù)能夠收集較大規(guī)模的模糊型信息,因此,在實(shí)際應(yīng)用過程中,也必須注重?cái)?shù)據(jù)的完整性,使其可以更全面地反映數(shù)據(jù)的真實(shí)性,有機(jī)統(tǒng)一數(shù)字挖掘技術(shù)與信息管理之間的關(guān)系,發(fā)揮出原始數(shù)據(jù)信息的價(jià)值。
4結(jié)束語(yǔ)
綜上所述,在互聯(lián)網(wǎng)飛速發(fā)展的時(shí)代,傳統(tǒng)人工學(xué)生信息管理系統(tǒng)已經(jīng)不能符合學(xué)生需求,高校應(yīng)綜合考慮學(xué)生實(shí)際情況、教學(xué)目標(biāo)等方面的因素,以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),重點(diǎn)開發(fā)研究綜合性學(xué)生信息管理系統(tǒng),將不同信息管理系統(tǒng)有機(jī)統(tǒng)一,充分發(fā)揮信息管理系統(tǒng)的作用,優(yōu)化系統(tǒng)各項(xiàng)操作程序,方便學(xué)校教師學(xué)生使用,提升學(xué)生信息管理的安全性與有效性。在未來(lái)的發(fā)展過程中,高校應(yīng)加大對(duì)數(shù)據(jù)挖掘技術(shù)的重視程度,科學(xué)運(yùn)用決策樹的計(jì)算方式,在保障管理系統(tǒng)安全性、數(shù)據(jù)完整性的同時(shí),更好地為高校決策參考依據(jù),培養(yǎng)綜合型人才。