国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在高職院教學(xué)評(píng)價(jià)中的應(yīng)用研究

2013-12-29 00:00:00董琳
電腦知識(shí)與技術(shù) 2013年10期

摘要:在高職院校教學(xué)管理中,教學(xué)質(zhì)量評(píng)價(jià)是核心內(nèi)容,正確的評(píng)價(jià)能有效地促進(jìn)教學(xué)質(zhì)量的提高。傳統(tǒng)的教學(xué)質(zhì)量評(píng)價(jià)還停留在簡單的統(tǒng)計(jì)、備份和查詢階段,并沒有對這些數(shù)據(jù)進(jìn)行深入的分析,影響理解教學(xué)質(zhì)量的深層次的原因。對教學(xué)評(píng)價(jià)的數(shù)據(jù)進(jìn)行分析,并對教學(xué)評(píng)價(jià)本身的方法進(jìn)行研究,對教學(xué)質(zhì)量有著重要的意義。該文探討了數(shù)據(jù)挖掘相關(guān)技術(shù)與粗糙集的基本理論,同時(shí)介紹了數(shù)據(jù)挖掘的常用工具,得出數(shù)據(jù)挖掘技術(shù)適合用于教學(xué)評(píng)價(jià)研究的結(jié)論。

關(guān)鍵詞:教學(xué)評(píng)價(jià);數(shù)據(jù)挖掘;粗糙集

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)10-2382-02

在我國高等職業(yè)教育迅猛發(fā)展的今天,教育質(zhì)量是學(xué)校的“生命”和“靈魂”,它不僅關(guān)系著學(xué)校的生存和發(fā)展,也直接影響著學(xué)生的前途和命運(yùn),提高教學(xué)質(zhì)量是高等教育永恒的話題。而與教學(xué)質(zhì)量相關(guān)的教學(xué)質(zhì)量評(píng)價(jià)問題也將成為一項(xiàng)非常重要的工作,教學(xué)質(zhì)量評(píng)價(jià)是構(gòu)成高等學(xué)校教學(xué)活動(dòng)的基礎(chǔ),是保證高等學(xué)校人才培養(yǎng)質(zhì)量的基本環(huán)節(jié)[1]。

1 高職院教學(xué)評(píng)價(jià)現(xiàn)狀

目前,高職院校教學(xué)評(píng)教通常由學(xué)校教務(wù)處在期末將教師教學(xué)質(zhì)量評(píng)估表發(fā)給學(xué)生,也有通過網(wǎng)上評(píng)教,學(xué)生根據(jù)評(píng)估表中的項(xiàng)目對教師進(jìn)行打分,綜合專家督導(dǎo)和同行評(píng)價(jià)聽課后的評(píng)價(jià)得分,經(jīng)學(xué)校教務(wù)處統(tǒng)計(jì)后排名或根據(jù)分?jǐn)?shù)確定一個(gè)考核等級(jí)。這些評(píng)教方式對于教學(xué)改革和教學(xué)質(zhì)量的提高起到了一定的作用,但是目前還存在一些亟待解決的問題[2]。綜觀我國高職院校教育教學(xué)評(píng)價(jià)實(shí)踐的現(xiàn)狀,雖然近十幾年來受到各方面人士的重視,并取得了初步的發(fā)展,但總體評(píng)價(jià)工作科學(xué)性尚欠,評(píng)價(jià)研究的水平亦很低,這主要表現(xiàn)在以下幾個(gè)方面:

1)對教育教學(xué)評(píng)價(jià)的意義,教育教學(xué)評(píng)價(jià)在教育過程、教育管理中的作用還缺乏應(yīng)有的認(rèn)識(shí),許多評(píng)價(jià)活動(dòng)尚處于初級(jí)水平,對教師教學(xué)水平的評(píng)價(jià)無論在理論研究還是在實(shí)際工作中都還不多,且所定項(xiàng)目和指標(biāo)缺乏理論依據(jù)和科學(xué)性;

2)在評(píng)價(jià)理論方面,教學(xué)科研力量較強(qiáng)的師范院校與研究機(jī)構(gòu)缺乏必要的理論儲(chǔ)備,在評(píng)價(jià)理論研究方面發(fā)揮的作用有失期望,而從事實(shí)際教育評(píng)價(jià)的人員許多未受到測量與評(píng)價(jià)方面的系統(tǒng)訓(xùn)練,故評(píng)價(jià)研究難以深入持久;

3)在評(píng)價(jià)技術(shù)手段的開發(fā)和應(yīng)用上比較落后。盡管在運(yùn)用模糊數(shù)學(xué)方法進(jìn)行教育教學(xué)評(píng)價(jià)方面取得了一些進(jìn)展,但大多數(shù)評(píng)價(jià)工作還是借鑒國外現(xiàn)成的技術(shù)手段,在技術(shù)手段的開發(fā)上尚無創(chuàng)造性的成果;

4)在評(píng)價(jià)工作的組織上缺乏統(tǒng)籌規(guī)劃,沒有一支有效地組織力量,來開展教學(xué)評(píng)價(jià)[3]。

2 數(shù)據(jù)挖掘技術(shù)的相關(guān)研究與常用工具

數(shù)據(jù)挖掘(Data Mining,DM),從知識(shí)科學(xué)的角度上可以看成是知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),還可以理解成就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但是可以潛在地存在非常重要的知識(shí)或用途[4]。目前數(shù)據(jù)挖掘廣泛用于人類各方面的應(yīng)用研究中。

2.1 數(shù)據(jù)挖掘技術(shù)的相關(guān)研究

2.1.1 分類方法

數(shù)據(jù)挖掘方法有多種分類方法,可根據(jù)挖掘的任務(wù)、挖掘的對象、挖掘的方法來分類[5]。

根據(jù)數(shù)據(jù)挖掘的任務(wù)分,有如下幾種:分類或預(yù)測模型數(shù)據(jù)挖掘、數(shù)據(jù)總結(jié)、數(shù)據(jù)聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢發(fā)現(xiàn)等等[5]。

根據(jù)數(shù)據(jù)挖掘的對象分,有如下若干種數(shù)據(jù)源:關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時(shí)態(tài)數(shù)據(jù)庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)、異質(zhì)數(shù)據(jù)庫、遺產(chǎn)(legacy)數(shù)據(jù)庫,以及Web數(shù)據(jù)源。

根據(jù)數(shù)據(jù)挖掘的方法分,可粗分為:統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。統(tǒng)計(jì)方法中,可細(xì)分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等)、聚類分析(系統(tǒng)聚類、動(dòng)態(tài)聚類等)、探索性分析(主元分析法、相關(guān)分析法等)、以及模糊集、粗糙集、支持向量機(jī)等。機(jī)器學(xué)習(xí)中,可細(xì)分為:歸納學(xué)習(xí)方法(決策樹、規(guī)則歸納等)、基于范例的推理CBR、遺傳算法、貝葉斯信念網(wǎng)絡(luò)等。神經(jīng)網(wǎng)絡(luò)方法,可細(xì)分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等)、自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競爭學(xué)習(xí)等)等。數(shù)據(jù)庫方法主要是基于可視化的多維數(shù)據(jù)分析或OLAP方法。

2.1.2 分類技術(shù)

利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等,它們分別從不同的角度對數(shù)據(jù)進(jìn)行挖掘。

分類(Classification)在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的任務(wù),目前在商業(yè)上的應(yīng)用非常廣泛。分類是指通過分析已知的數(shù)據(jù),構(gòu)造模型,該模型可以用來對未知的數(shù)據(jù)做預(yù)測,判定其目標(biāo)值(離散或連續(xù)值)[6]。分類和回歸統(tǒng)稱為預(yù)報(bào):描述某類數(shù)據(jù)集約模型或預(yù)測數(shù)據(jù)在變化趨勢。只是分類預(yù)測的是分類標(biāo)號(hào)(離散的,有限的數(shù)值),而回歸預(yù)測的是連續(xù)值。

分類是一個(gè)兩步的過程,第一步,建立一個(gè)分類模型,通常分類模型以分類規(guī)則、判定樹或數(shù)學(xué)公式的形式提供。而本文研究的決策樹算法就是建立一個(gè)決策樹的分類模型。第二步,使用模型進(jìn)行分類。將分類模型應(yīng)用到測試數(shù)據(jù)集上,評(píng)估模型的預(yù)測準(zhǔn)確率。如果認(rèn)為分類模型的準(zhǔn)確率可以接受,就可以用它對類標(biāo)號(hào)未知的數(shù)據(jù)集進(jìn)行分類。

2.1.3 分類算法

分類算法是數(shù)據(jù)挖掘算法中很重要的一種,主要分類算法有決策樹算法、關(guān)聯(lián)規(guī)則分類算法、K近鄰分類算法、貝葉斯分類算法和基于模糊邏輯、遺傳算法、粗糙集和神經(jīng)網(wǎng)絡(luò)的分類算法。

1)決策樹分類算法。決策樹歸納是經(jīng)典的分類算法,也是在數(shù)據(jù)挖掘技術(shù)中常用到的算法,大多數(shù)決策樹算法都采用自頂向下遞歸的分治方式構(gòu)造決策樹。決策樹的每一個(gè)結(jié)點(diǎn)上使用信息增益度量選擇測試屬性。算法的原理是從生成的決策樹中得到分類規(guī)則。具有分類速度快、效率高、理解性好等特點(diǎn),可以用于分析數(shù)據(jù),也可以用來做預(yù)測,因此,它在人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等領(lǐng)域被廣泛地應(yīng)用。

2)最近距離算法。KNN(K-Nearest Neighbor)法即K最近鄰法[7],該算法的理論十分嚴(yán)密可靠,而且KNN方法的分類思路也非常容易理解,可以理解成如果一個(gè)樣本在特征空間中的K個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類別,那么該樣本可以看成屬于這個(gè)類別。由于KNN分類算法十分簡單,可以應(yīng)用十分廣泛。KNN方法雖然從原理上也依賴于極限定理,但在類別決策時(shí),只與極少量的相鄰樣本有關(guān)。因此,采用這種方法可以較好地避免樣本的不平衡問題。另外,由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。

3)支撐向量機(jī)算法。支持向量機(jī)(Support Vector Machine)也稱SVM法[8],該算法由Vapnik等人于1995年提出,該方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法。具有廣泛用處,支持向量機(jī)的基本思想是,對于一個(gè)給定的具有有限數(shù)理訓(xùn)練樣本的學(xué)習(xí)任務(wù),如何在準(zhǔn)確性(對于給定訓(xùn)練集)和機(jī)器容量(機(jī)器可無錯(cuò)誤地學(xué)習(xí)任意訓(xùn)練集的能力)之間進(jìn)行折衷,以得到最佳的推廣能力[9]。

2.2 常用的數(shù)據(jù)挖掘工具

數(shù)據(jù)挖掘工具根據(jù)其適用的范圍可分為專用挖掘工具和通用挖掘工具。專業(yè)挖掘工具,如IBM公司的AdvancedScout系統(tǒng)針對美國職業(yè)籃球聯(lián)賽的數(shù)據(jù)進(jìn)行挖掘的工具。通用數(shù)據(jù)挖掘工具不區(qū)分具體的數(shù)據(jù)含義,采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。下面介紹幾款優(yōu)秀的通用數(shù)據(jù)挖掘工具軟件。

1) QUEST。QUEST是IBM公司中的一個(gè)項(xiàng)目中心為實(shí)現(xiàn)OS而開發(fā)的一個(gè)多任務(wù)數(shù)據(jù)挖掘系統(tǒng),一般用于決策系統(tǒng)的支持。

2) SAS Enterprise Miner。SAS Enterprise Miner在資料探勘工具市場是非常杰出的工具,它運(yùn)用了SAS統(tǒng)計(jì)模塊的力量和影響力,且它增加了一系列的資料探勘算法,SAS使用它的取樣、探測、修改、模式、評(píng)價(jià)(SEMMA)方法提供可以支持廣泛的模式,包含合并、叢集、決策樹、類神精網(wǎng)絡(luò)、和統(tǒng)計(jì)回歸 SAS Enterprise Miner適用于初學(xué)者及專業(yè)使用者,它的GUI接口是以資料流為導(dǎo)向,且它容易了解及使用,它允許分析師采用由使用連結(jié)連接資料節(jié)點(diǎn)及程序節(jié)點(diǎn)的方式建構(gòu)視覺數(shù)據(jù)流程圖,除此之外,接口還允許程序碼直接嵌入資料流因?yàn)橹С侄嘀啬J健?/p>

3)決策樹算法平臺(tái)Clementine(SPSS)。Clementine是SPSS所發(fā)行的一種資料探勘工具,它結(jié)合了多種圖形使用者接口的分析技術(shù),包含neural networks、association rules、及rule-induction techniques,這些工具提供容易使用的可視化程序環(huán)境來執(zhí)行這些分析功能。Clementine使用圖形象征的方法,就是透過托拉鼠標(biāo)和連接屏幕上的功能節(jié)點(diǎn),這些節(jié)點(diǎn)提供了data access、data manipulation、data visualization、machine learning以及model analysis,模式的組成是從一個(gè)pallet中選取合適之節(jié)點(diǎn),并放置在屏幕上再連接各節(jié)點(diǎn)Clementine有強(qiáng)大的資料存取能力包含flat file及關(guān)系型數(shù)據(jù)庫(經(jīng)由ODBC),Clementine也可讓modeling的結(jié)果持續(xù)的寫回到ODBC的DBMS輸入資料的操作包含配對合并及衍生新字段的能力,Clementine的可視化能力包含散布圖、平面圖及Web分析。

3 數(shù)據(jù)挖掘技術(shù)在教學(xué)評(píng)價(jià)中的應(yīng)用研究

教學(xué)評(píng)價(jià)首先的任務(wù)是有科學(xué)合理的分析手段,建立數(shù)據(jù)挖掘模型,并將其應(yīng)用到高職院校教學(xué)評(píng)價(jià)中,同時(shí)應(yīng)盡量減少人為因素的干擾,該文提出基于粗糙集理論的方法,對教學(xué)評(píng)價(jià)中的屬性進(jìn)行權(quán)重的重新調(diào)整,對后面的教學(xué)評(píng)價(jià)決策樹算法的正確性具有互補(bǔ)的效果。雖然基于決策樹的數(shù)據(jù)挖掘方法在商業(yè)領(lǐng)域的應(yīng)用已經(jīng)取得了一定成效[11],但是在教育領(lǐng)域的應(yīng)用仍然不多。建立基于決策樹的數(shù)據(jù)挖掘模型,并將其應(yīng)用到高職院校教學(xué)評(píng)價(jià)中,可以從大量的評(píng)教數(shù)據(jù)中發(fā)現(xiàn)影響學(xué)生、專家、同行評(píng)教結(jié)果的關(guān)鍵因素,分析教師教學(xué)行為和教學(xué)效果之間的關(guān)系,從而發(fā)現(xiàn)規(guī)律,為教學(xué)管理服務(wù),本課題具體有如下三個(gè)方面的現(xiàn)實(shí)意義:

3.1 有利于正確評(píng)價(jià)教師的教學(xué)業(yè)績

多年來,在高職院校教師教學(xué)水平的評(píng)定,沒有一個(gè)科學(xué)合理的測評(píng)方法,測評(píng)結(jié)果不盡合理,達(dá)不到預(yù)期的效果。通過數(shù)據(jù)挖掘方法,建立科學(xué)可行的教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)體系,通過專門負(fù)責(zé)部門測評(píng),就可以對教師教學(xué)質(zhì)量有個(gè)準(zhǔn)確的價(jià)值判斷,從而教學(xué)等級(jí)也可以作為硬指標(biāo),使得對教師的獎(jiǎng)勵(lì)晉升都有憑可依。

3.2 診斷教學(xué)問題,推動(dòng)教學(xué)改革

通過教學(xué)評(píng)價(jià),教師可以了解自己的教學(xué)目標(biāo)確定得是否合理,教學(xué)方法、手段運(yùn)用是否得當(dāng),教學(xué)的重點(diǎn)、難點(diǎn)是否講清,從而調(diào)整教學(xué)策略,改進(jìn)教學(xué)措施,有針對性地解決教學(xué)中存在的各種問題。評(píng)價(jià)不僅是對教師教學(xué)工作狀況做出價(jià)值判斷,而且對教學(xué)改革提出明確要求,引導(dǎo)廣大教師樹立正確的教學(xué)觀、質(zhì)量觀和人才觀,明確對自己的要求和努力方向,促使教師盡快轉(zhuǎn)變教育教學(xué)思想,改革優(yōu)化教學(xué)過程,發(fā)揮主動(dòng)性、創(chuàng)造性,推動(dòng)教改向正確的方向前進(jìn)。

3.3 指導(dǎo)教學(xué)管理,提高教學(xué)質(zhì)量

教學(xué)主管部門對教師的教學(xué)質(zhì)量進(jìn)行科學(xué)地評(píng)價(jià),以及用科學(xué)的手段收集、分析處理所獲得的資料,找出教學(xué)質(zhì)量好的教師所具備的幾種特征,反饋到學(xué)校教學(xué)的管理層,管理者就能夠及時(shí)正確地采取主動(dòng)有力措施進(jìn)行指導(dǎo)、發(fā)揮管理功能,進(jìn)而對其他老師的教學(xué)起借鑒作用,使教學(xué)工作質(zhì)量得到提高。

參考文獻(xiàn):

[1] 連衛(wèi)民.基于數(shù)據(jù)挖掘的高職高專教學(xué)評(píng)估應(yīng)用研究[D]. 鄭州:鄭州大學(xué),2007.

[2] 劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].實(shí)踐與經(jīng)驗(yàn),2008,6(2):43-45.

[3] 范明,孟小峰.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.

[4] 翁宇.數(shù)據(jù)挖掘技術(shù)在高職教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用[D].廣州:華南理工大學(xué)碩士論文,2010.

长泰县| 抚顺市| 谢通门县| 肇东市| 肃北| 北碚区| 娄烦县| 富民县| 绥棱县| 百色市| 兴隆县| 大田县| 封开县| 石嘴山市| 翁牛特旗| 唐河县| 合山市| 南宁市| 封开县| 桂平市| 林州市| 文登市| 通许县| 林甸县| 临漳县| 资阳市| 日照市| 饶阳县| 陆良县| 邹平县| 长武县| 西丰县| 绵竹市| 沙田区| 信宜市| 博白县| 武功县| 抚宁县| 朝阳区| 翁牛特旗| 宝清县|