国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用型本科院校IT專(zhuān)業(yè)數(shù)據(jù)挖掘課程建設(shè)

2014-04-29 04:41李忠李?yuàn)檴?/span>
計(jì)算機(jī)時(shí)代 2014年11期
關(guān)鍵詞:數(shù)據(jù)挖掘教學(xué)效果

李忠 李?yuàn)檴?/p>

摘 要: 針對(duì)國(guó)內(nèi)應(yīng)用型本科院校數(shù)據(jù)挖掘課程內(nèi)容差異問(wèn)題,分析了不同專(zhuān)業(yè)的培養(yǎng)目標(biāo),從數(shù)據(jù)挖掘三大功能出發(fā),給出了IT類(lèi)專(zhuān)業(yè)數(shù)據(jù)挖掘課程的內(nèi)容體系和學(xué)時(shí)安排;分析了防災(zāi)科技學(xué)院最近兩屆學(xué)生數(shù)據(jù)挖掘課程的教學(xué)效果,結(jié)論為:合理的理論內(nèi)容設(shè)置和實(shí)驗(yàn)訓(xùn)練,配合恰當(dāng)?shù)慕虒W(xué)方法,可以提高學(xué)生的學(xué)習(xí)興趣,激發(fā)學(xué)習(xí)熱情,提高實(shí)際動(dòng)手能力,從而達(dá)到人才培養(yǎng)目標(biāo)。

關(guān)鍵詞: 數(shù)據(jù)挖掘; 課程內(nèi)容體系; IT專(zhuān)業(yè); 教學(xué)效果

中圖分類(lèi)號(hào):G642 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2014)11-65-02

Course construction of data mining course for IT specialty in application-oriented university

Li Zhong, Li Shanshan

(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)

Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.

Key words: data mining; course content system; IT specialty; teaching effectiveness

0 引言

毋庸置疑,我們正處在信息時(shí)代。根據(jù)國(guó)際互聯(lián)網(wǎng)管理機(jī)構(gòu)2012年發(fā)布的數(shù)據(jù),每天全球互聯(lián)網(wǎng)流量累計(jì)達(dá)1EB(即10億GB),這意味著每天產(chǎn)生的信息量可以刻滿(mǎn)1.88億張DVD光盤(pán)[1]。要想在如此浩瀚的數(shù)字海洋里尋找有用的信息,簡(jiǎn)直是大海撈針!因此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。大概十幾年前,微軟創(chuàng)始人比爾·蓋茨就預(yù)言,數(shù)據(jù)挖掘技術(shù)將是未來(lái)計(jì)算機(jī)發(fā)展的重要方向之一,事實(shí)也的確如此。

數(shù)據(jù)挖掘技術(shù)誕生于20世紀(jì)80年代末,是統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科,涉及數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、知識(shí)發(fā)現(xiàn)、專(zhuān)家系統(tǒng)、信息檢索、高性能計(jì)算、可視化以及面向?qū)ο蟪绦蛟O(shè)計(jì)等若干學(xué)科知識(shí),在商業(yè)、金融、保險(xiǎn)、體育、勘探、生物技術(shù)等領(lǐng)域獲得廣泛應(yīng)用。也正因?yàn)樵撜n程涉及的內(nèi)容寬泛,要求知識(shí)面寬廣、數(shù)學(xué)基礎(chǔ)扎實(shí)等,前幾年主要在研究生階段開(kāi)設(shè)。但是隨著信息技術(shù)的快速發(fā)展,本科生能力要求提高,知識(shí)傳授的重心下移,很多高校已在本科階段開(kāi)設(shè)數(shù)據(jù)挖掘課程,以提高大學(xué)生解決實(shí)際問(wèn)題的能力,進(jìn)而為課程設(shè)計(jì)和畢業(yè)設(shè)計(jì)打下必要的基礎(chǔ)[2]。

1 國(guó)內(nèi)高校本科數(shù)據(jù)挖掘課程開(kāi)設(shè)現(xiàn)狀

通過(guò)院校實(shí)地交流,結(jié)合網(wǎng)絡(luò)搜索,我們已經(jīng)收集了十幾所高校的數(shù)據(jù)挖掘課程教學(xué)大綱,開(kāi)設(shè)專(zhuān)業(yè)包含有計(jì)算機(jī)類(lèi)專(zhuān)業(yè)、經(jīng)濟(jì)統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)、電氣自動(dòng)化類(lèi)專(zhuān)業(yè)、生物技術(shù)專(zhuān)業(yè)等,各專(zhuān)業(yè)根據(jù)自己的人才培養(yǎng)目標(biāo)制訂教學(xué)大綱、教學(xué)計(jì)劃、考試大綱等,其內(nèi)容存在很大差異。其中985、211高校主要以英語(yǔ)授課,采用國(guó)外原版教材,課程內(nèi)容涉及算法、編程較多;而一般院校多采用中文教材,根據(jù)專(zhuān)業(yè)不同,內(nèi)容也有很大差異。

經(jīng)濟(jì)統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)開(kāi)設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解什么是數(shù)據(jù)挖掘,以及如何用數(shù)據(jù)挖掘來(lái)解決實(shí)際問(wèn)題,了解如何通過(guò)幾種數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,了解主流數(shù)據(jù)挖掘系統(tǒng)的特點(diǎn),能夠安裝、使用,要求能夠熟練使用典型的挖掘工具對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析,具備從數(shù)據(jù)資源提取信息與知識(shí)并進(jìn)行輔助決策的基本能力。

自動(dòng)化專(zhuān)業(yè)開(kāi)設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解數(shù)據(jù)挖掘概念、原理、過(guò)程,學(xué)會(huì)利用數(shù)據(jù)挖掘技術(shù)處理問(wèn)題,了解有關(guān)數(shù)據(jù)挖掘算法原理,熟練運(yùn)用數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,要求能夠熟練使用數(shù)據(jù)挖掘軟件解決問(wèn)題。

計(jì)算機(jī)專(zhuān)業(yè)開(kāi)設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解數(shù)據(jù)挖掘概念、原理、信息處理過(guò)程,了解不同數(shù)據(jù)挖掘算法的原理并編程實(shí)現(xiàn),學(xué)會(huì)利用數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型以解決實(shí)際問(wèn)題,熟悉數(shù)據(jù)挖掘成果的表達(dá),要求熟悉幾種典型的數(shù)據(jù)挖掘軟件功能特點(diǎn)、使用方法、安裝等,了解不同軟件的優(yōu)缺點(diǎn)和適用面向,具備從大量數(shù)據(jù)中獲取有價(jià)值的信息的能力。

可以看出,統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)主要要求學(xué)生具備數(shù)據(jù)挖掘軟件的使用能力,并根據(jù)挖掘結(jié)果進(jìn)行輔助決策;IT類(lèi)專(zhuān)業(yè)要求學(xué)生掌握數(shù)據(jù)挖掘有關(guān)算法的原理、處理過(guò)程,并要求編程實(shí)現(xiàn)算法,這無(wú)疑增加了很大難度。按照ACM SIGKDD課程委員會(huì)對(duì)數(shù)據(jù)挖據(jù)課程的建議,數(shù)據(jù)挖掘課程應(yīng)重視長(zhǎng)久的科學(xué)原理和領(lǐng)域概念。顯然,IT類(lèi)專(zhuān)業(yè)的數(shù)據(jù)挖掘課程教學(xué)大綱更符合ACM SIGKDD課程委員會(huì)的建議。

2 IT專(zhuān)業(yè)數(shù)據(jù)挖掘課程內(nèi)容設(shè)計(jì)

一般情況下,數(shù)據(jù)挖掘課程在本科的高年級(jí)段開(kāi)設(shè),大部分放在第七學(xué)期,也有少數(shù)高校放在第六學(xué)期。這個(gè)時(shí)候,IT類(lèi)專(zhuān)業(yè)的大學(xué)生已經(jīng)修完數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫(kù)原理、程序設(shè)計(jì)語(yǔ)言、面向?qū)ο蟪绦蛟O(shè)計(jì)等多門(mén)專(zhuān)業(yè)基礎(chǔ)課程,對(duì)于程序設(shè)計(jì)、數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)發(fā)等具有足夠的認(rèn)識(shí)和使用能力,具備了開(kāi)設(shè)數(shù)據(jù)挖掘課程所需要的前導(dǎo)知識(shí)。國(guó)內(nèi)普通本科的數(shù)據(jù)挖掘課程學(xué)時(shí)設(shè)計(jì)存在很大差異,如南京工程學(xué)院設(shè)置32課時(shí),其中課堂授課22學(xué)時(shí),實(shí)驗(yàn)設(shè)計(jì)10學(xué)時(shí)[3];鄭州航空管理學(xué)院僅設(shè)置16學(xué)時(shí),其中授課10課時(shí),實(shí)驗(yàn)教學(xué)6課時(shí)[2]。在內(nèi)容安排方面,也存在很大差異。南京工程學(xué)院計(jì)算機(jī)專(zhuān)業(yè)開(kāi)設(shè)的數(shù)據(jù)挖掘課程包括概述、數(shù)據(jù)挖掘過(guò)程與挖掘軟件、關(guān)聯(lián)規(guī)則挖掘與序列模式挖掘、分類(lèi)、聚類(lèi)分析、Web挖掘等六部分內(nèi)容;煙臺(tái)大學(xué)計(jì)算機(jī)專(zhuān)業(yè)開(kāi)設(shè)的數(shù)據(jù)挖掘技術(shù)課程內(nèi)容涵蓋概述、數(shù)據(jù)倉(cāng)庫(kù)與聯(lián)機(jī)分析、關(guān)聯(lián)分析、分類(lèi)技術(shù)、聚類(lèi)分析、時(shí)間序列模式挖掘、Web挖掘技術(shù)等[4];鄭州航空管理學(xué)院的數(shù)據(jù)挖掘課程包括概述、決策樹(shù)、聚類(lèi)分析、關(guān)聯(lián)分析、數(shù)據(jù)篩選等內(nèi)容[2];漳州師范學(xué)院計(jì)算機(jī)科學(xué)系開(kāi)設(shè)的數(shù)據(jù)挖掘課程內(nèi)容涉及數(shù)據(jù)挖掘基礎(chǔ)知識(shí)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉(cāng)庫(kù)與OLAP技術(shù)、關(guān)聯(lián)和頻繁模式分析、分類(lèi)與回歸、聚類(lèi)和孤立點(diǎn)分析、時(shí)序數(shù)據(jù)和序列數(shù)據(jù)的挖掘、文本與Web數(shù)據(jù)挖掘、數(shù)據(jù)挖掘可視化、典型數(shù)據(jù)挖掘系統(tǒng)、數(shù)據(jù)挖掘的社會(huì)影響等內(nèi)容[5]。

數(shù)據(jù)挖掘技術(shù)主要應(yīng)用在三大領(lǐng)域,也就是三大功能:分類(lèi)(預(yù)測(cè))、聚類(lèi)分析和關(guān)聯(lián)分析,因此在課程內(nèi)容設(shè)置時(shí),應(yīng)考慮實(shí)用性,在三大功能基礎(chǔ)上布局各章節(jié)。筆者在近三年的數(shù)據(jù)挖掘課程教學(xué)實(shí)踐中,分別采用了西南財(cái)經(jīng)大學(xué)的《數(shù)據(jù)挖掘教程》、中國(guó)科技大學(xué)的《數(shù)據(jù)挖掘?qū)д摗纷鳛橹髦v教材,參考了范明等人翻譯的《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫?、Jiawei Han and Micheline Kamber著《Data mining Concept and Techniques》、范承工等著《大數(shù)據(jù):戰(zhàn)略·技術(shù)·實(shí)踐》等,對(duì)課程內(nèi)容進(jìn)行了總結(jié),提出了針對(duì)于應(yīng)用型本科IT類(lèi)專(zhuān)業(yè)48課時(shí)的數(shù)據(jù)挖掘課程內(nèi)容體系,如表1。

從表1可以看出,數(shù)據(jù)挖掘課程理論授課32學(xué)時(shí),實(shí)驗(yàn)安排16課時(shí),在充分進(jìn)行數(shù)據(jù)挖掘算法原理、實(shí)例介紹基礎(chǔ)上,讓學(xué)生在實(shí)驗(yàn)室里對(duì)數(shù)據(jù)挖掘的三大功能進(jìn)行模擬訓(xùn)練,提高學(xué)生的實(shí)際動(dòng)手能力和分析問(wèn)題解決問(wèn)題能力,這也完全符合應(yīng)用型本科人才培養(yǎng)目標(biāo)要求。另外,考慮到數(shù)據(jù)倉(cāng)庫(kù)與聯(lián)機(jī)分析部分內(nèi)容已經(jīng)在數(shù)據(jù)庫(kù)原理與應(yīng)用課程中學(xué)習(xí)過(guò),因此我們?cè)趦?nèi)容設(shè)置時(shí)不再考慮。

表1 數(shù)據(jù)挖掘課程內(nèi)容體系

[章節(jié)題目\&主要內(nèi)容\&理論課時(shí)\&實(shí)踐課時(shí)\&第一章 數(shù)據(jù)挖掘概述\&介紹有關(guān)概念、應(yīng)用領(lǐng)域、挖掘過(guò)程、SEMMA模型等\&2\&0\&第二章 數(shù)據(jù)預(yù)處理\&介紹數(shù)據(jù)采集與存儲(chǔ)、數(shù)據(jù)質(zhì)量評(píng)價(jià)、數(shù)據(jù)整理、數(shù)據(jù)計(jì)劃分等;\&4\&2\&第三章 數(shù)據(jù)分類(lèi)與預(yù)測(cè)\&介紹決策樹(shù)原理與應(yīng)用、貝葉斯分類(lèi)方法、人工神經(jīng)網(wǎng)絡(luò)方法、K-近鄰方法、遺傳算法、支持向量機(jī)方法,等\&8\&4\&第四章 關(guān)聯(lián)分析\&介紹相關(guān)概念、先驗(yàn)算法、Apriori算法等\&6\&4\&第五章 聚類(lèi)分析\&聚類(lèi)分析概述、K-均值算法、層次聚類(lèi)方法等\&6\&4\&第六章 異類(lèi)挖掘\&異類(lèi)挖掘概述、基于統(tǒng)計(jì)的異類(lèi)挖掘、基于時(shí)序的異類(lèi)挖掘、基于空間的異類(lèi)挖掘,等\&4\&2\&第七章 大數(shù)據(jù)挖掘\&大數(shù)據(jù)概述、大數(shù)據(jù)挖掘算法、大數(shù)據(jù)挖掘過(guò)程,等\&2\&\&]

3 教學(xué)效果分析

理論授課以工程項(xiàng)目驅(qū)動(dòng)方式,在闡述基本概念、算法原理基礎(chǔ)上,采用實(shí)際的工程項(xiàng)目介紹數(shù)據(jù)挖掘課程相關(guān)算法的應(yīng)用和過(guò)程,很好地吸引了學(xué)生的注意力,教學(xué)效果良好。以最近兩屆學(xué)生為例,采用調(diào)查問(wèn)卷方式,從基本算法掌握、編程能力提高情況、考試成績(jī)、就業(yè)意向等四個(gè)方面進(jìn)行考查,匯總結(jié)果如表2。

表2 教學(xué)效果調(diào)查匯總表

[調(diào)查

欄目\&基本算法

掌握情況\&編程能力

是否提高\&考試成績(jī)檔次\&是否愿意從事數(shù)據(jù)挖掘相關(guān)工作\&項(xiàng)目\&較好\&一般\&有\&無(wú)\&80以上\&60-80\&60以下\&是\&否\&2012屆

情況\&32\&44\&54\&22\&22\&36\&18\&24\&52\&42.1%\&57.9%\&71.1%\&28.9%\&28.9%\&47.4%\&23.7%\&31.6%\&68.4%\&2013屆

情況\&72\&48\&94\&26\&78\&39\&3\&44\&76\&60%\&40%\&78.3%\&21.7%\&65%\&32.5%\&2.5%\&36.7%\&63.3%\&]

說(shuō)明:每屆學(xué)生的第一行為人數(shù),第二行為所占百分比。

從表2可以看出,2013屆學(xué)生無(wú)論從考試成績(jī),還是編程能力提高、基本算法的掌握情況等方面,都較2012屆學(xué)生好,尤其是不及格率大幅下降,優(yōu)秀率大幅提升,對(duì)學(xué)生提高學(xué)習(xí)興趣、激發(fā)學(xué)習(xí)積極性大有好處。從就業(yè)意向看,愿意從事數(shù)據(jù)挖掘方面工作的學(xué)生也有提高,說(shuō)明學(xué)生通過(guò)數(shù)據(jù)挖掘課程的學(xué)習(xí),逐漸對(duì)該技術(shù)產(chǎn)生興趣。

4 結(jié)束語(yǔ)

就數(shù)據(jù)挖掘技術(shù)課程而言,對(duì)于IT類(lèi)專(zhuān)業(yè)學(xué)生的要求應(yīng)不同于經(jīng)濟(jì)統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)學(xué)生,前者更應(yīng)注重算法理解、設(shè)計(jì),以及程序?qū)崿F(xiàn)、成果表達(dá)等,后者則偏重于模型建立、軟件應(yīng)用等。因此在課程內(nèi)容設(shè)置、學(xué)時(shí)安排等方面應(yīng)有所不同。IT類(lèi)專(zhuān)業(yè)學(xué)生將來(lái)的工作主要以程序設(shè)計(jì)、軟件開(kāi)發(fā)為主,因此數(shù)據(jù)挖掘課程內(nèi)容更廣更深,學(xué)時(shí)也相應(yīng)較多,培養(yǎng)目標(biāo)要求也更高。合理的課堂內(nèi)容設(shè)置和實(shí)驗(yàn)訓(xùn)練,配合適當(dāng)?shù)慕虒W(xué)方法,可以很好地提高學(xué)生的學(xué)習(xí)興趣,激發(fā)學(xué)習(xí)熱情,增強(qiáng)分析問(wèn)題解決問(wèn)題的能力,讓學(xué)生產(chǎn)生從事數(shù)據(jù)挖掘工作的意向,達(dá)到人才培養(yǎng)目標(biāo)要求。

參考文獻(xiàn):

[1] 張艷.大數(shù)據(jù)背景下的數(shù)據(jù)挖掘課程教學(xué)新思考[J].計(jì)算機(jī)時(shí)代,

2014.4:59-61

[2] 李志勇,王翔,喻軍.信息管理專(zhuān)業(yè)數(shù)據(jù)挖掘課程教學(xué)探討[J].管理工

程師,2012.8:66-68

[3] 徐金寶.對(duì)應(yīng)用型本科生開(kāi)設(shè)數(shù)據(jù)挖掘課程的嘗試[J].計(jì)算機(jī)教育,

2007.7:27-30

[4] 譚征,孫紅霞,王立宏.普通院校本科生開(kāi)設(shè)數(shù)據(jù)挖掘課程的教學(xué)研

究[J].福建電腦,2011.10:38-40

[5] 周忠眉.數(shù)據(jù)挖掘課程大綱的建設(shè)[J].漳州師范學(xué)院學(xué)報(bào)(自然科學(xué)

版),2005.1:88-90

猜你喜歡
數(shù)據(jù)挖掘教學(xué)效果
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
用信息技術(shù)增強(qiáng)初中籃球教學(xué)效果
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
關(guān)于提高開(kāi)放電大“統(tǒng)計(jì)學(xué)原理”教學(xué)效果的探討
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
如何提高高中聲樂(lè)教學(xué)效果
提高病理學(xué)教學(xué)效果的幾點(diǎn)體會(huì)
加強(qiáng)焊接教學(xué)質(zhì)量提高焊接教學(xué)效果的探討
數(shù)據(jù)挖掘的分析與探索