国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在藝術(shù)院校計(jì)算機(jī)能力考核成績(jī)分析中的應(yīng)用研究

2017-06-05 17:09張晶
電腦知識(shí)與技術(shù) 2017年7期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

張晶

摘要:數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中挖掘出潛在有用的信息,并智能找出內(nèi)在關(guān)聯(lián)且客觀有效地提取有價(jià)值信息。在藝術(shù)類(lèi)院校計(jì)算機(jī)能力考核成績(jī)分析中運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)考核成績(jī)進(jìn)行數(shù)據(jù)優(yōu)化處理,研究表明,利用該技術(shù)可得到計(jì)算機(jī)能力考核成績(jī)的好壞與哪些因素有關(guān),為提升計(jì)算機(jī)教學(xué)質(zhì)量有一定的指導(dǎo)意義。

關(guān)鍵詞:數(shù)據(jù)挖掘;計(jì)算機(jī)能力考核;成績(jī)分析;關(guān)聯(lián)規(guī)則

中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)07-0197-03

1前沿

數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)研究、開(kāi)發(fā)和應(yīng)用最活躍的技術(shù)之一。數(shù)據(jù)挖掘是采用人工智能的方法對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析、獲取知識(shí)的過(guò)程。它們的結(jié)合能更好地為企業(yè)或有關(guān)部門(mén)不同范圍的決策分析提供有力的依據(jù)。

當(dāng)前,計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)應(yīng)用在大多數(shù)高校,所有高校都在進(jìn)行校園數(shù)字化建設(shè)。所以,勢(shì)必有大量的原始數(shù)據(jù),并且要建立龐大的數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)數(shù)據(jù),其主要用途是基于簡(jiǎn)單的查詢(xún)和統(tǒng)計(jì)報(bào)表,沒(méi)有對(duì)這些數(shù)據(jù)進(jìn)行深層次的挖掘和規(guī)律查找,所以這樣的數(shù)據(jù)信息沒(méi)有充分利用起來(lái)。我們應(yīng)該思考利用目前最前端最科學(xué)的技術(shù)來(lái)發(fā)現(xiàn)高校各類(lèi)數(shù)據(jù)中的重要信息,并為管理部門(mén)決策提供重要依據(jù)。這就是數(shù)據(jù)挖掘技術(shù)。

大學(xué)計(jì)算機(jī)基礎(chǔ)課是藝術(shù)院校大一學(xué)生的必須課,以中國(guó)美術(shù)學(xué)院的入學(xué)新生為例,大約有1200人,龐大的學(xué)生數(shù)量如何有效的開(kāi)展計(jì)算機(jī)教學(xué)值得思考,就需要充分掌握學(xué)生的學(xué)習(xí)興趣、學(xué)生的能力所在及對(duì)教師的期望等相關(guān)參數(shù)進(jìn)行正確分析。由于大學(xué)計(jì)算機(jī)基礎(chǔ)課程是機(jī)考,成績(jī)存儲(chǔ)在服務(wù)器上,其中每個(gè)模塊的成績(jī)也獨(dú)立保存,如基礎(chǔ)單選題、word操作題、Excel操作題、PPT操作題等。在《大學(xué)計(jì)算機(jī)基礎(chǔ)》課程的成績(jī)管理工作中,會(huì)有大量的學(xué)生成績(jī)?cè)紨?shù)據(jù),但對(duì)這些數(shù)據(jù)的處理還停留在簡(jiǎn)單的數(shù)據(jù)備份、查詢(xún)和簡(jiǎn)單統(tǒng)計(jì)階段,沒(méi)有對(duì)這些成績(jī)數(shù)據(jù)進(jìn)行深入的分析,找到有利于提高計(jì)算機(jī)能力的信息,這是對(duì)教學(xué)信息資源的浪費(fèi)。所以,將這些成績(jī)數(shù)據(jù)分離出來(lái)進(jìn)行數(shù)據(jù)挖掘是可行的。

通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的研究,抽取中國(guó)美術(shù)學(xué)院《大學(xué)計(jì)算機(jī)基礎(chǔ)》課程的成績(jī)信息數(shù)據(jù),利用決策樹(shù)算法生成決策樹(shù)分析學(xué)生成績(jī)優(yōu)良與哪些因素有關(guān),并對(duì)決策樹(shù)進(jìn)行修剪,產(chǎn)生分類(lèi)規(guī)則,完成成績(jī)分析決策樹(shù)模型的建立。

2數(shù)據(jù)挖掘

2.1基本概念

數(shù)據(jù)挖掘是指從大型數(shù)據(jù)庫(kù)中提取隱含的、未知的、非平凡的極有潛在應(yīng)用價(jià)值的信息或模式,是數(shù)據(jù)庫(kù)中一個(gè)很有應(yīng)用價(jià)值的新領(lǐng)域。融合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域的理論和技術(shù)。數(shù)據(jù)挖掘要經(jīng)過(guò)數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析、結(jié)果表示等一系列過(guò)程。數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)通常是以概念、規(guī)則、模式、約束、可視化等形式表現(xiàn)。

2.2數(shù)據(jù)挖掘方法

數(shù)據(jù)挖據(jù)通過(guò)預(yù)測(cè)未來(lái)趨勢(shì)及行為,做出前瞻性的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的、有價(jià)值的知識(shí)。主要有以下三類(lèi)功能:

(1)關(guān)聯(lián)分析

數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。如計(jì)算機(jī)能力考核成績(jī)階段,教師可以根據(jù)學(xué)生的學(xué)習(xí)情況做進(jìn)一步關(guān)聯(lián)性分析,弄清影響學(xué)生學(xué)習(xí)成績(jī)的具體因素,從而為教師的教學(xué)改革提供科學(xué)指導(dǎo)意見(jiàn)。

(2)聚類(lèi)分析

數(shù)據(jù)庫(kù)中的記錄可被劃分為一系列有意義的子集,即聚類(lèi)。聚類(lèi)技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類(lèi)學(xué)。如對(duì)不同層次學(xué)生的考核可采用層次發(fā)進(jìn)行分析。

(3)概念描述

概念描述就是對(duì)某類(lèi)對(duì)象的內(nèi)涵進(jìn)行描述,并概況這類(lèi)對(duì)象的有關(guān)特征。分為特征性描述和區(qū)別性描述。如進(jìn)行計(jì)算機(jī)能力考核成績(jī)分析時(shí),可以對(duì)學(xué)生的姓名、性別、年級(jí)等基本信息進(jìn)行詳細(xì)描述,讓老師在最短時(shí)間內(nèi)了解被考核學(xué)生的具體情況。

(4)檢測(cè)功能

數(shù)據(jù)挖掘技術(shù)得到進(jìn)一步優(yōu)化,其中偏差檢測(cè)是數(shù)據(jù)挖掘功能中的一種新的應(yīng)用形式。當(dāng)所有數(shù)據(jù)挖掘結(jié)束后,用戶(hù)可以通過(guò)偏差檢測(cè)對(duì)挖掘結(jié)果加以檢查發(fā)現(xiàn)數(shù)據(jù)結(jié)果中存在的不足。如計(jì)算機(jī)能力考核成績(jī)分析遇到不同的考試分?jǐn)?shù)偏差、學(xué)生信息偏差,不及時(shí)糾正就會(huì)導(dǎo)致考核成績(jī)?cè)u(píng)定結(jié)果誤差。

3計(jì)算機(jī)能力考核成績(jī)分析數(shù)據(jù)的采集

基于本文的研究,基本數(shù)據(jù)的獲?。和ㄟ^(guò)Excel設(shè)計(jì)問(wèn)卷調(diào)查形式,調(diào)查表的學(xué)生信息包括:學(xué)號(hào)、姓名、性別、系別、專(zhuān)業(yè)、考試成績(jī);調(diào)查表的課程信息包括:興趣愛(ài)好、課堂講解、課堂作業(yè)、上機(jī)時(shí)數(shù);調(diào)查表的學(xué)生考試相關(guān)信息包括:?jiǎn)芜x題、文字錄入、word操作、Excel操作、PPT操作、網(wǎng)絡(luò)應(yīng)用操作。

通過(guò)數(shù)據(jù)收集,進(jìn)行整體匯總,存于數(shù)據(jù)庫(kù)SOL數(shù)據(jù)庫(kù)中,以數(shù)據(jù)庫(kù)表的形式進(jìn)行存儲(chǔ),將學(xué)生調(diào)查信息數(shù)據(jù)表與本學(xué)期計(jì)算機(jī)能力考核成績(jī)生產(chǎn)學(xué)生成績(jī)分析表。

4計(jì)算機(jī)能力考核成績(jī)的數(shù)據(jù)處理

學(xué)生參加考試過(guò)程中遇到的機(jī)器故障、電腦系統(tǒng)問(wèn)題等都會(huì)間接造成學(xué)生考試成績(jī)數(shù)據(jù)重復(fù)或不完整性,因此需要對(duì)成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理。

1)數(shù)據(jù)清洗;處理空缺數(shù)據(jù):忽略或用默認(rèn)值代替。一是學(xué)生缺考,需要將這些記錄刪除;二是某題沒(méi)做,默認(rèn)為0,這些記錄不可刪除。

2)數(shù)據(jù)集成:刪除重復(fù)記錄來(lái)解決數(shù)據(jù)冗余問(wèn)題。因機(jī)器故障,學(xué)生會(huì)在不同考場(chǎng)參加多次考試,導(dǎo)致一個(gè)學(xué)生成績(jī)數(shù)據(jù)多條,便要將成績(jī)最高保留,刪除其他。因?qū)W生不及格參加補(bǔ)考或重修,也可能造成冗余的成績(jī)記錄,也要?jiǎng)h除重復(fù)數(shù)據(jù)。

3)數(shù)據(jù)轉(zhuǎn)換

構(gòu)造屬性;將考核模塊六個(gè)方面添加到數(shù)據(jù)集中,用原有的數(shù)據(jù)屬性構(gòu)造新屬性。具體方法是按照?qǐng)D的分類(lèi)將每個(gè)考察部分的成績(jī)累加得到分?jǐn)?shù),并計(jì)算獲得各個(gè)考察的總分。如分為理論基礎(chǔ)類(lèi)、office操作類(lèi)、網(wǎng)絡(luò)運(yùn)用類(lèi)使用三個(gè)屬性值:20、70、10

數(shù)據(jù)規(guī)范化:我們需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以便更好進(jìn)行分析。將各考察方面的得分與該考察的總分相除,總成績(jī)與試卷總分相除,得到一個(gè)[0,1]范圍數(shù)據(jù)。具體處理為:理論基礎(chǔ)類(lèi):實(shí)際分?jǐn)?shù)/20;office操作類(lèi):實(shí)際分?jǐn)?shù)/70;網(wǎng)絡(luò)運(yùn)用類(lèi):實(shí)際分?jǐn)?shù)/10。例如原始數(shù)據(jù)格式:學(xué)號(hào)3160200018,理論基礎(chǔ)類(lèi)15,office操作類(lèi)65,網(wǎng)絡(luò)運(yùn)用類(lèi)9;其標(biāo)準(zhǔn)化后的數(shù)據(jù)格式為:學(xué)號(hào)316020018,理論基礎(chǔ)類(lèi)0.60,office操作類(lèi)0.85,網(wǎng)絡(luò)運(yùn)用類(lèi)1.00。

4)數(shù)據(jù)規(guī)約

數(shù)據(jù)離散化:考慮到關(guān)聯(lián)規(guī)則算法對(duì)數(shù)據(jù)形式的要求,將學(xué)生的總成績(jī)離散化。把學(xué)生成績(jī)分類(lèi)等級(jí),即優(yōu)秀、良好、合格、不合格四種。并且也將各個(gè)題型的成績(jī)也進(jìn)行離散化處理,三個(gè)考察方面的成績(jī)也離散化三類(lèi),即優(yōu)秀、良好、不合格。例如各題型的離散化處理為:標(biāo)準(zhǔn)化0.8-1.0為優(yōu)秀表示A,0.6-0.8為良好表示B,0.6以下為合格表示C。成績(jī)離散化處理為:實(shí)際成績(jī)90-100,等級(jí)為優(yōu)秀表示A,80-90等級(jí)為良好表示B,60-80等級(jí)為合格表示C,60以下等級(jí)為不合格表示D。

5計(jì)算機(jī)能力考核成績(jī)分析的關(guān)聯(lián)數(shù)據(jù)挖掘

Apriori算法是研究關(guān)聯(lián)規(guī)則的最具代表性的方法。主要是兩步:得到所有的頻繁項(xiàng)集;由頻繁項(xiàng)集得到強(qiáng)關(guān)聯(lián)規(guī)則。參與關(guān)聯(lián)規(guī)則挖掘的學(xué)生成績(jī)數(shù)據(jù)屬性有10個(gè),根據(jù)文獻(xiàn),現(xiàn)在以2014、2015和2016年大一新生的《大學(xué)計(jì)算機(jī)基礎(chǔ)》的考試成績(jī)?yōu)闃颖荆瑢?shí)現(xiàn)設(shè)計(jì)的Apriori算法并應(yīng)用在考試成績(jī)上。經(jīng)過(guò)多次試驗(yàn),在保證既不會(huì)產(chǎn)生大量的無(wú)用規(guī)則也不會(huì)漏掉重要規(guī)則的前提下,最終設(shè)定最小支持度minsup=15%,最小置信度minconf=50%,部分關(guān)聯(lián)規(guī)則如表1:

學(xué)生還有一個(gè)屬性是專(zhuān)業(yè)屬性,對(duì)專(zhuān)業(yè)屬性和總成績(jī)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,設(shè)置信度和支持度的設(shè)置為minsup=15%和minconf=30%,最終產(chǎn)生的關(guān)聯(lián)規(guī)則如表2:

挖掘?qū)I(yè)、各題型成績(jī)與學(xué)生總成績(jī)之間的關(guān)聯(lián)規(guī)則,支持度=10%,置信度=60%,如表3所示;

實(shí)驗(yàn)結(jié)果分析:

由表1得到的關(guān)聯(lián)規(guī)則發(fā)現(xiàn);單選優(yōu),Word優(yōu),學(xué)生成績(jī)56%可以達(dá)到80到90之間,但Excel優(yōu),學(xué)生成績(jī)58%可以達(dá)到90-100之間;如果單選優(yōu),網(wǎng)絡(luò)運(yùn)用優(yōu),54%的學(xué)生成績(jī)可以達(dá)到80-90之間;如果單選差,網(wǎng)絡(luò)運(yùn)用合格,則60%的學(xué)生成績(jī)可以達(dá)到60-80之間。

由表2可知,如果學(xué)生專(zhuān)業(yè)是設(shè)計(jì)藝術(shù)類(lèi),45%以上學(xué)生成績(jī)的概率達(dá)到優(yōu)秀水平,如果學(xué)生專(zhuān)業(yè)是造型類(lèi),40%以上的學(xué)生成績(jī)達(dá)到80-90之間。

由表3得到的關(guān)聯(lián)規(guī)則發(fā)現(xiàn):專(zhuān)業(yè)是書(shū)法的學(xué)生在Word操作方面表現(xiàn)良的概率達(dá)到了56%,造型類(lèi)的學(xué)生在Word操作方面表現(xiàn)優(yōu)秀的概率達(dá)到了70%。

通過(guò)對(duì)關(guān)聯(lián)規(guī)則的解釋分析,得到以下結(jié)論:

(1)總體加強(qiáng)學(xué)生計(jì)算機(jī)理論知識(shí),強(qiáng)化實(shí)踐操作能力的應(yīng)用。

(2)對(duì)于傳統(tǒng)藝術(shù)類(lèi)和設(shè)計(jì)藝術(shù)類(lèi)的學(xué)生,當(dāng)學(xué)生是設(shè)計(jì)藝術(shù)類(lèi),office操作模塊成績(jī)表現(xiàn)為優(yōu)秀的要比傳統(tǒng)藝術(shù)類(lèi)高很多,原因是他們平時(shí)經(jīng)常接觸電腦,在大一就開(kāi)設(shè)相關(guān)設(shè)計(jì)軟件課程,電腦使用頻率較高;而學(xué)生是傳統(tǒng)藝術(shù)類(lèi),他們的理論知識(shí)成績(jī)卻優(yōu)于設(shè)計(jì)類(lèi)學(xué)生,所以要加強(qiáng)對(duì)傳統(tǒng)藝術(shù)類(lèi)學(xué)生的實(shí)踐操作能力,多開(kāi)設(shè)課時(shí)數(shù)量,對(duì)于設(shè)計(jì)類(lèi)學(xué)生要加強(qiáng)基礎(chǔ)知識(shí)的理解和掌握。

(3)網(wǎng)絡(luò)運(yùn)用這個(gè)模塊,學(xué)生整體的考核成績(jī)都趨于優(yōu)秀,這說(shuō)明互聯(lián)網(wǎng)時(shí)代下學(xué)生頻繁接觸網(wǎng)絡(luò),能夠熟練駕馭基本的網(wǎng)絡(luò)運(yùn)用,如電子郵件收發(fā),網(wǎng)頁(yè)文件保存等。

(4)PPT操作題,學(xué)生整體的考核成績(jī)都趨于良好以上,這說(shuō)明學(xué)生對(duì)圖文并茂的課件制作在課堂教學(xué)的效果不錯(cuò),通過(guò)查閱學(xué)生的獨(dú)立的ppt課后作業(yè),也反映出對(duì)這個(gè)軟件有了較強(qiáng)的掌握。所以總體這個(gè)模塊的成績(jī)80分以上。

(5)Excel操作題,35%的學(xué)生考核成績(jī)?cè)诤细瘢?0分-80分),學(xué)生對(duì)于excel中的公式的運(yùn)用、圖表制作等理解較弱,對(duì)數(shù)理邏輯這塊思維訓(xùn)練較不理想,一方面和他們的專(zhuān)業(yè)有關(guān),因?yàn)槭撬囆g(shù)生,所以對(duì)數(shù)學(xué)這塊的知識(shí)就欠缺。另一方面要加強(qiáng)對(duì)軟件的使用課時(shí),學(xué)會(huì)舉一反三,靈活應(yīng)用。

6總結(jié)

—般的問(wèn)卷調(diào)查只是片面的看到一個(gè)統(tǒng)計(jì)結(jié)果,并沒(méi)有解釋這份問(wèn)卷出現(xiàn)的問(wèn)題,分析的對(duì)象只是單個(gè)屬性,忽視了不同屬性之間的相關(guān)性,其結(jié)果往往只是比例分布、平均差或方差等表面情況。希望借助數(shù)據(jù)挖掘技術(shù),尋找“計(jì)算機(jī)文化基礎(chǔ)”課程考試成績(jī)數(shù)據(jù)背后隱含的有價(jià)值的信息,提高學(xué)生的計(jì)算機(jī)能力,更好地為教師和教學(xué)管理部門(mén)提供決策支持,全面提升我院“計(jì)算機(jī)文化基礎(chǔ)”的教學(xué)質(zhì)量。為藝術(shù)院校計(jì)算機(jī)基礎(chǔ)課能高效、有重點(diǎn)、有針對(duì)性地開(kāi)展教學(xué)帶來(lái)科學(xué)的數(shù)據(jù),對(duì)計(jì)算機(jī)課堂教學(xué)提供了相關(guān)的依據(jù)和指引。

猜你喜歡
關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘的分析與探索
基于GPGPU的離散數(shù)據(jù)挖掘研究
乐至县| 鸡西市| 彝良县| 台东县| 拉孜县| 滕州市| 六安市| 澎湖县| 寻乌县| 得荣县| 木兰县| 靖州| 阜新市| 西林县| 聂拉木县| 鄂尔多斯市| 西吉县| 横峰县| 丁青县| 云林县| 永和县| 平邑县| 新蔡县| 定安县| 工布江达县| 榆中县| 连州市| 庆元县| 稷山县| 鹿泉市| 民和| 安宁市| 原阳县| 庄河市| 望谟县| 苏尼特左旗| 石渠县| 马龙县| 边坝县| 阿克苏市| 高阳县|