姚蓓蓓
摘要:高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。將處理模糊和不精確問(wèn)題的粗糙集理論融入到數(shù)據(jù)挖掘,并運(yùn)用到學(xué)生綜合素質(zhì)測(cè)評(píng)中去,找出影響測(cè)評(píng)成績(jī)的關(guān)鍵因素和各個(gè)因素之間的關(guān)聯(lián),為管理者提供有效地科學(xué)決策依據(jù),最終提高高校管理質(zhì)量與效率,培養(yǎng)出更多的德智體全面發(fā)展的大學(xué)生。
關(guān)鍵詞:數(shù)據(jù)挖掘;粗糙集;屬性約簡(jiǎn);關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP271 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)24-5588-05
隨著教育教學(xué)改革的不斷推進(jìn),各所高校越來(lái)越重視學(xué)生的綜合素質(zhì)教育。高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。數(shù)據(jù)挖掘作為一門新興的數(shù)據(jù)分析技術(shù),它正因其強(qiáng)大的實(shí)用功能,吸引了很多研究者的關(guān)注和探索,被許多領(lǐng)域所認(rèn)可,其潛力無(wú)限,粗糙集理論重要用來(lái)處理模糊的和不確定性的信息?;诖植诩臄?shù)據(jù)挖掘技術(shù)能在這些繁雜的學(xué)生信息和數(shù)據(jù)中挖掘出有用的信息為管理者提供重要的決策信息,提高管理和教育水平。
1 數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),目的是從復(fù)雜的數(shù)據(jù)中,找出潛在的、用戶感興趣的有用信息。它是一種多學(xué)科綜合的產(chǎn)物,主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)理論、數(shù)據(jù)可視化技術(shù)、數(shù)據(jù)庫(kù)技術(shù)等應(yīng)用于復(fù)雜的現(xiàn)實(shí)數(shù)據(jù)[1]。
1.2數(shù)據(jù)挖掘的過(guò)程
海量數(shù)據(jù)搜集、強(qiáng)大的多處理器計(jì)算機(jī)和有效的數(shù)據(jù)挖掘算法為數(shù)據(jù)挖掘技術(shù)提供了必要的保障。數(shù)據(jù)挖掘的過(guò)程有很多種劃分,一般主要分為三個(gè)階段,即: 數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)和解釋。其中,數(shù)據(jù)準(zhǔn)備階段主要涉及到數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)變化等大量的準(zhǔn)備工作,大約花費(fèi)整個(gè)過(guò)程的60%左右的時(shí)間和精力;數(shù)據(jù)挖掘階段是非常重要的階段,需要選擇合適的方法和算法建立挖掘模型,也是研究者嗎,們的研究重點(diǎn);最后通過(guò)表達(dá)和解釋,得出結(jié)果,根據(jù)最終用戶的興趣度度量,對(duì)提取的信息分析,識(shí)別有趣的信息,刪除不滿足要求的模型重新挖掘,如圖1所示。
由以上結(jié)果,我們可以這出這樣的結(jié)論:在影響學(xué)生綜合素質(zhì)成績(jī)的所有因素中,其中參加社會(huì)實(shí)踐的多少、體育成績(jī)、文化課成績(jī)以及是否擔(dān)任學(xué)生干部體現(xiàn)較為關(guān)鍵,幾者之間存在著相互制約和影響的關(guān)系。同時(shí)也能看出,決大部分在校擔(dān)任學(xué)生干部的同學(xué),不僅參加了很多社會(huì)實(shí)踐活動(dòng),得到的鍛煉的機(jī)會(huì)多,而且在體育和文化課成績(jī)方面都不落后于其他同學(xué),體現(xiàn)了擔(dān)任學(xué)生干部可以促進(jìn)自身綜合素質(zhì)的發(fā)展,所以說(shuō)在校大學(xué)生如果能夠合理安排學(xué)業(yè)、體育鍛煉和各項(xiàng)活動(dòng),不僅不會(huì)影響學(xué)業(yè),甚至可以促進(jìn)全面素質(zhì)的發(fā)展,而學(xué)習(xí)成績(jī)不好的學(xué)生往往是學(xué)習(xí)、活動(dòng)等安排不合理或?qū)W(xué)習(xí)本身就缺乏端正態(tài)度的,德智體的關(guān)系。
4 結(jié)束語(yǔ)
基于粗糙集理論的數(shù)據(jù)挖掘模型也正得到大批研究者的關(guān)注,粗糙集不僅可以獨(dú)立進(jìn)行知識(shí)挖掘,因其知識(shí)的定義、屬性約簡(jiǎn)和規(guī)則提取等方面的優(yōu)點(diǎn),它還可以和其他數(shù)據(jù)挖掘算法結(jié)合起來(lái),形成混合數(shù)據(jù)挖掘算法,極大地發(fā)展了數(shù)據(jù)挖掘的算法和技術(shù),豐富了數(shù)據(jù)挖掘的工具。
參考文獻(xiàn):
[1] 姜云蘋,葛世倫,蔣家尚,等.基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在教師成長(zhǎng)中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),2008(8).
[2] 姚晟,李龍澍.學(xué)生成績(jī)分析專家系統(tǒng)的研究與應(yīng)用[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2007(1).
[3] Deja R.Conflict Analysis[J].Intermational Joumal of Intelligent Systems,2002:235-253.
[4] Pawlak Z.Rough Sets[J].Intermation Joumal of Computer and Information Sciences,1982:341-356.endprint
摘要:高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。將處理模糊和不精確問(wèn)題的粗糙集理論融入到數(shù)據(jù)挖掘,并運(yùn)用到學(xué)生綜合素質(zhì)測(cè)評(píng)中去,找出影響測(cè)評(píng)成績(jī)的關(guān)鍵因素和各個(gè)因素之間的關(guān)聯(lián),為管理者提供有效地科學(xué)決策依據(jù),最終提高高校管理質(zhì)量與效率,培養(yǎng)出更多的德智體全面發(fā)展的大學(xué)生。
關(guān)鍵詞:數(shù)據(jù)挖掘;粗糙集;屬性約簡(jiǎn);關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP271 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)24-5588-05
隨著教育教學(xué)改革的不斷推進(jìn),各所高校越來(lái)越重視學(xué)生的綜合素質(zhì)教育。高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。數(shù)據(jù)挖掘作為一門新興的數(shù)據(jù)分析技術(shù),它正因其強(qiáng)大的實(shí)用功能,吸引了很多研究者的關(guān)注和探索,被許多領(lǐng)域所認(rèn)可,其潛力無(wú)限,粗糙集理論重要用來(lái)處理模糊的和不確定性的信息?;诖植诩臄?shù)據(jù)挖掘技術(shù)能在這些繁雜的學(xué)生信息和數(shù)據(jù)中挖掘出有用的信息為管理者提供重要的決策信息,提高管理和教育水平。
1 數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),目的是從復(fù)雜的數(shù)據(jù)中,找出潛在的、用戶感興趣的有用信息。它是一種多學(xué)科綜合的產(chǎn)物,主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)理論、數(shù)據(jù)可視化技術(shù)、數(shù)據(jù)庫(kù)技術(shù)等應(yīng)用于復(fù)雜的現(xiàn)實(shí)數(shù)據(jù)[1]。
1.2數(shù)據(jù)挖掘的過(guò)程
海量數(shù)據(jù)搜集、強(qiáng)大的多處理器計(jì)算機(jī)和有效的數(shù)據(jù)挖掘算法為數(shù)據(jù)挖掘技術(shù)提供了必要的保障。數(shù)據(jù)挖掘的過(guò)程有很多種劃分,一般主要分為三個(gè)階段,即: 數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)和解釋。其中,數(shù)據(jù)準(zhǔn)備階段主要涉及到數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)變化等大量的準(zhǔn)備工作,大約花費(fèi)整個(gè)過(guò)程的60%左右的時(shí)間和精力;數(shù)據(jù)挖掘階段是非常重要的階段,需要選擇合適的方法和算法建立挖掘模型,也是研究者嗎,們的研究重點(diǎn);最后通過(guò)表達(dá)和解釋,得出結(jié)果,根據(jù)最終用戶的興趣度度量,對(duì)提取的信息分析,識(shí)別有趣的信息,刪除不滿足要求的模型重新挖掘,如圖1所示。
由以上結(jié)果,我們可以這出這樣的結(jié)論:在影響學(xué)生綜合素質(zhì)成績(jī)的所有因素中,其中參加社會(huì)實(shí)踐的多少、體育成績(jī)、文化課成績(jī)以及是否擔(dān)任學(xué)生干部體現(xiàn)較為關(guān)鍵,幾者之間存在著相互制約和影響的關(guān)系。同時(shí)也能看出,決大部分在校擔(dān)任學(xué)生干部的同學(xué),不僅參加了很多社會(huì)實(shí)踐活動(dòng),得到的鍛煉的機(jī)會(huì)多,而且在體育和文化課成績(jī)方面都不落后于其他同學(xué),體現(xiàn)了擔(dān)任學(xué)生干部可以促進(jìn)自身綜合素質(zhì)的發(fā)展,所以說(shuō)在校大學(xué)生如果能夠合理安排學(xué)業(yè)、體育鍛煉和各項(xiàng)活動(dòng),不僅不會(huì)影響學(xué)業(yè),甚至可以促進(jìn)全面素質(zhì)的發(fā)展,而學(xué)習(xí)成績(jī)不好的學(xué)生往往是學(xué)習(xí)、活動(dòng)等安排不合理或?qū)W(xué)習(xí)本身就缺乏端正態(tài)度的,德智體的關(guān)系。
4 結(jié)束語(yǔ)
基于粗糙集理論的數(shù)據(jù)挖掘模型也正得到大批研究者的關(guān)注,粗糙集不僅可以獨(dú)立進(jìn)行知識(shí)挖掘,因其知識(shí)的定義、屬性約簡(jiǎn)和規(guī)則提取等方面的優(yōu)點(diǎn),它還可以和其他數(shù)據(jù)挖掘算法結(jié)合起來(lái),形成混合數(shù)據(jù)挖掘算法,極大地發(fā)展了數(shù)據(jù)挖掘的算法和技術(shù),豐富了數(shù)據(jù)挖掘的工具。
參考文獻(xiàn):
[1] 姜云蘋,葛世倫,蔣家尚,等.基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在教師成長(zhǎng)中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),2008(8).
[2] 姚晟,李龍澍.學(xué)生成績(jī)分析專家系統(tǒng)的研究與應(yīng)用[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2007(1).
[3] Deja R.Conflict Analysis[J].Intermational Joumal of Intelligent Systems,2002:235-253.
[4] Pawlak Z.Rough Sets[J].Intermation Joumal of Computer and Information Sciences,1982:341-356.endprint
摘要:高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。將處理模糊和不精確問(wèn)題的粗糙集理論融入到數(shù)據(jù)挖掘,并運(yùn)用到學(xué)生綜合素質(zhì)測(cè)評(píng)中去,找出影響測(cè)評(píng)成績(jī)的關(guān)鍵因素和各個(gè)因素之間的關(guān)聯(lián),為管理者提供有效地科學(xué)決策依據(jù),最終提高高校管理質(zhì)量與效率,培養(yǎng)出更多的德智體全面發(fā)展的大學(xué)生。
關(guān)鍵詞:數(shù)據(jù)挖掘;粗糙集;屬性約簡(jiǎn);關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP271 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)24-5588-05
隨著教育教學(xué)改革的不斷推進(jìn),各所高校越來(lái)越重視學(xué)生的綜合素質(zhì)教育。高校信息化的進(jìn)程在信息技術(shù)的高速發(fā)展和高等教育制度改革,特別是在素質(zhì)教育的大背景下不斷地推進(jìn)。數(shù)據(jù)挖掘作為一門新興的數(shù)據(jù)分析技術(shù),它正因其強(qiáng)大的實(shí)用功能,吸引了很多研究者的關(guān)注和探索,被許多領(lǐng)域所認(rèn)可,其潛力無(wú)限,粗糙集理論重要用來(lái)處理模糊的和不確定性的信息?;诖植诩臄?shù)據(jù)挖掘技術(shù)能在這些繁雜的學(xué)生信息和數(shù)據(jù)中挖掘出有用的信息為管理者提供重要的決策信息,提高管理和教育水平。
1 數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),目的是從復(fù)雜的數(shù)據(jù)中,找出潛在的、用戶感興趣的有用信息。它是一種多學(xué)科綜合的產(chǎn)物,主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)理論、數(shù)據(jù)可視化技術(shù)、數(shù)據(jù)庫(kù)技術(shù)等應(yīng)用于復(fù)雜的現(xiàn)實(shí)數(shù)據(jù)[1]。
1.2數(shù)據(jù)挖掘的過(guò)程
海量數(shù)據(jù)搜集、強(qiáng)大的多處理器計(jì)算機(jī)和有效的數(shù)據(jù)挖掘算法為數(shù)據(jù)挖掘技術(shù)提供了必要的保障。數(shù)據(jù)挖掘的過(guò)程有很多種劃分,一般主要分為三個(gè)階段,即: 數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)和解釋。其中,數(shù)據(jù)準(zhǔn)備階段主要涉及到數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)變化等大量的準(zhǔn)備工作,大約花費(fèi)整個(gè)過(guò)程的60%左右的時(shí)間和精力;數(shù)據(jù)挖掘階段是非常重要的階段,需要選擇合適的方法和算法建立挖掘模型,也是研究者嗎,們的研究重點(diǎn);最后通過(guò)表達(dá)和解釋,得出結(jié)果,根據(jù)最終用戶的興趣度度量,對(duì)提取的信息分析,識(shí)別有趣的信息,刪除不滿足要求的模型重新挖掘,如圖1所示。
由以上結(jié)果,我們可以這出這樣的結(jié)論:在影響學(xué)生綜合素質(zhì)成績(jī)的所有因素中,其中參加社會(huì)實(shí)踐的多少、體育成績(jī)、文化課成績(jī)以及是否擔(dān)任學(xué)生干部體現(xiàn)較為關(guān)鍵,幾者之間存在著相互制約和影響的關(guān)系。同時(shí)也能看出,決大部分在校擔(dān)任學(xué)生干部的同學(xué),不僅參加了很多社會(huì)實(shí)踐活動(dòng),得到的鍛煉的機(jī)會(huì)多,而且在體育和文化課成績(jī)方面都不落后于其他同學(xué),體現(xiàn)了擔(dān)任學(xué)生干部可以促進(jìn)自身綜合素質(zhì)的發(fā)展,所以說(shuō)在校大學(xué)生如果能夠合理安排學(xué)業(yè)、體育鍛煉和各項(xiàng)活動(dòng),不僅不會(huì)影響學(xué)業(yè),甚至可以促進(jìn)全面素質(zhì)的發(fā)展,而學(xué)習(xí)成績(jī)不好的學(xué)生往往是學(xué)習(xí)、活動(dòng)等安排不合理或?qū)W(xué)習(xí)本身就缺乏端正態(tài)度的,德智體的關(guān)系。
4 結(jié)束語(yǔ)
基于粗糙集理論的數(shù)據(jù)挖掘模型也正得到大批研究者的關(guān)注,粗糙集不僅可以獨(dú)立進(jìn)行知識(shí)挖掘,因其知識(shí)的定義、屬性約簡(jiǎn)和規(guī)則提取等方面的優(yōu)點(diǎn),它還可以和其他數(shù)據(jù)挖掘算法結(jié)合起來(lái),形成混合數(shù)據(jù)挖掘算法,極大地發(fā)展了數(shù)據(jù)挖掘的算法和技術(shù),豐富了數(shù)據(jù)挖掘的工具。
參考文獻(xiàn):
[1] 姜云蘋,葛世倫,蔣家尚,等.基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在教師成長(zhǎng)中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),2008(8).
[2] 姚晟,李龍澍.學(xué)生成績(jī)分析專家系統(tǒng)的研究與應(yīng)用[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2007(1).
[3] Deja R.Conflict Analysis[J].Intermational Joumal of Intelligent Systems,2002:235-253.
[4] Pawlak Z.Rough Sets[J].Intermation Joumal of Computer and Information Sciences,1982:341-356.endprint