胡 敏
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
本科信息管理專業(yè)數(shù)據(jù)挖掘課程建設(shè)研究
胡 敏
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
數(shù)據(jù)挖掘類課程引入國(guó)內(nèi)的時(shí)間不長(zhǎng),如何在本科教育階段,針對(duì)信息管理專業(yè)學(xué)生進(jìn)行課程建設(shè)是非常重要的。參考國(guó)內(nèi)外院校、研究組織對(duì)數(shù)據(jù)挖掘課程的教學(xué)內(nèi)容和方法的分析,根據(jù)數(shù)據(jù)挖掘課程的核心內(nèi)容和主要應(yīng)用,對(duì)課程建設(shè)進(jìn)行系統(tǒng)的分析,明確教學(xué)目標(biāo)、內(nèi)容、相應(yīng)的教學(xué)方式和方法,重點(diǎn)運(yùn)用模塊化教學(xué)理論對(duì)內(nèi)容和教學(xué)方式進(jìn)行分析。
課程建設(shè);模塊化教學(xué);數(shù)據(jù)挖掘
隨著數(shù)據(jù)挖掘、商務(wù)智能技術(shù)的快速發(fā)展與廣泛應(yīng)用,亟需對(duì)信息管理專業(yè)的本科生加強(qiáng)對(duì)相關(guān)知識(shí)的介紹,此時(shí)進(jìn)行課程改革,調(diào)整、增加授課學(xué)時(shí)和實(shí)踐環(huán)節(jié)有重要意義。數(shù)據(jù)挖掘是一門與多學(xué)科交叉的新興計(jì)算機(jī)專業(yè)課程,其課程內(nèi)容豐富、應(yīng)用范圍廣、實(shí)踐工具類型繁多。在有限授課時(shí)間內(nèi),如何選擇適合于信息管理專業(yè)的本科生的課程內(nèi)容、案例與軟件工具,選用何種有針對(duì)性的教學(xué)方法,是進(jìn)行數(shù)據(jù)挖掘課程設(shè)計(jì)需要解決的主要問題。
近年來,數(shù)據(jù)挖掘與商務(wù)智能技術(shù)發(fā)展迅速,充分借鑒國(guó)外相關(guān)研究,尤其是ACM SIGKDD課程委員會(huì)對(duì)數(shù)據(jù)挖據(jù)課程建設(shè)建議,對(duì)進(jìn)行數(shù)據(jù)挖掘類課程的教學(xué)建設(shè)研究有重要意義。ACM(美國(guó)計(jì)算機(jī)協(xié)會(huì))于1998年成立了SIGKDD(知識(shí)發(fā)現(xiàn)興趣小組),致力于知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘的相關(guān)研究,ACM SIGKDD課程委員會(huì)連續(xù)多年多次更新其主要課程——數(shù)據(jù)挖據(jù)課程的建議,其中委員會(huì)將數(shù)據(jù)挖掘課程分為基礎(chǔ)部分與高級(jí)主題,基礎(chǔ)部分覆蓋了數(shù)據(jù)挖掘的基本方法,高級(jí)主題既有數(shù)據(jù)挖掘基本方法的深入研究,又有更高級(jí)算法的介紹。國(guó)外很多大學(xué)的計(jì)算機(jī)科學(xué)學(xué)院、商學(xué)院都開設(shè)了數(shù)據(jù)挖掘類課程并同時(shí)進(jìn)行相關(guān)研究。波士頓大學(xué)開設(shè)了“數(shù)據(jù)管理與商務(wù)智能”課程,課程主要包括基礎(chǔ)、核心技術(shù)、應(yīng)用三部分。許多國(guó)外著名大學(xué)建立了教學(xué)管理系統(tǒng),提供大量的案例、在線討論和在線輔導(dǎo)功能。國(guó)內(nèi)很多學(xué)校都開設(shè)了數(shù)據(jù)挖掘的相關(guān)課程,我國(guó)大多數(shù)高校的課程大綱內(nèi)容與國(guó)外大致相同,只是在實(shí)踐部分選用了不同的商務(wù)案例。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域廣泛,因此可以根據(jù)開課學(xué)院和專業(yè)選擇合適的實(shí)例。
數(shù)據(jù)挖掘課程是一門綜合性很強(qiáng)的前沿學(xué)科,對(duì)計(jì)算機(jī)軟硬件、數(shù)據(jù)庫、人工智能技術(shù)、統(tǒng)計(jì)學(xué)算法、優(yōu)化算法等基礎(chǔ)知識(shí)都有較高的要求。因此該門課程開設(shè)在學(xué)生大三下學(xué)期,既有相關(guān)知識(shí)的基礎(chǔ),又為大四做畢業(yè)設(shè)計(jì)提供了一種思路。信息管理專業(yè)是計(jì)算機(jī)與管理相結(jié)合的專業(yè),旨在培養(yǎng)具備信息系統(tǒng)開發(fā)能力與信息資源分析與處理能力的綜合應(yīng)用型人才。對(duì)信息管理專業(yè)的學(xué)生而言,本課程主要的目標(biāo)是數(shù)據(jù)挖掘算法原理理解、數(shù)據(jù)挖掘算法在商務(wù)管理問題中的應(yīng)用以及常用數(shù)據(jù)倉庫與數(shù)據(jù)挖掘軟件的熟練應(yīng)用和二次開發(fā)。
模塊化教學(xué)模式是按照程序模塊化的構(gòu)想和原則來設(shè)計(jì)教學(xué)內(nèi)容的一整套教學(xué)體系,它是在既定的培養(yǎng)目標(biāo)指導(dǎo)下,將全部教學(xué)內(nèi)容按照一定標(biāo)準(zhǔn)或規(guī)則進(jìn)行分解,使其成為多個(gè)相對(duì)獨(dú)立的教學(xué)模塊,且各教學(xué)模塊之間可以按照一定的規(guī)則有選擇性的重新組合。學(xué)生可以根據(jù)個(gè)人興趣和職業(yè)取向在不同模塊之間進(jìn)行選擇和搭配,從而實(shí)現(xiàn)不同的教學(xué)目標(biāo)和人才培養(yǎng)要求[1,2]。模塊化教學(xué)本質(zhì)上是以知識(shí)點(diǎn)與實(shí)踐的細(xì)化為出發(fā)點(diǎn)研究的。商務(wù)智能方法本身非常豐富,實(shí)踐應(yīng)用也是課程的主要特點(diǎn)之一,因此十分適合使用模塊化的知識(shí)分解方式。本課程的知識(shí)點(diǎn)模塊管理分為兩個(gè)層次,一是從宏觀角度設(shè)計(jì)課程的基礎(chǔ)內(nèi)容模塊和高級(jí)主題模塊;二是從微觀角度針對(duì)較為復(fù)雜的教學(xué)內(nèi)容進(jìn)行的知識(shí)點(diǎn)劃分。
1.課程主要內(nèi)容模塊化分析。目前該課程包括十章理論內(nèi)容,分別為數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本知識(shí)、數(shù)據(jù)倉庫的OLAP技術(shù)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)、概念描述:特征化與比較、挖掘大型數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則、分類與預(yù)測(cè)、聚類分析、復(fù)雜類型數(shù)據(jù)挖掘和序列模式挖掘。根據(jù)模塊化管理的宏觀角度分類,課程內(nèi)容的第一至五章屬于基礎(chǔ)理論部分和簡(jiǎn)單數(shù)據(jù)挖掘技術(shù)的介紹,可以作為基礎(chǔ)內(nèi)容模塊;第六至八章為數(shù)據(jù)挖掘的核心算法,其中既有基礎(chǔ)理論與技術(shù)方法,又可深入到較難的方法和復(fù)雜的應(yīng)用,因此介于基礎(chǔ)內(nèi)容與高級(jí)主題之間;第九、十章可以算做課程的高級(jí)主題模塊;另外,課程的實(shí)踐模塊既包含數(shù)據(jù)倉庫的建設(shè)又包含數(shù)據(jù)挖掘算法的應(yīng)用,難度也介于基礎(chǔ)內(nèi)容與高級(jí)主題之間。
2.復(fù)雜知識(shí)點(diǎn)的模塊化管理。從微觀角度對(duì)知識(shí)點(diǎn)進(jìn)行設(shè)計(jì)主要針對(duì)的是上述的高級(jí)主題、以及難度介于基礎(chǔ)內(nèi)容與高級(jí)主題之間的章節(jié),由于這些章節(jié)知識(shí)點(diǎn)在難度上有一定層次,講授內(nèi)容彈性比較大,因此需要在課程設(shè)計(jì)中明確一定課時(shí)量所要達(dá)到的難度。以商務(wù)智能技術(shù)中的分類算法為例:首先一般的入門課程都會(huì)介紹分類算法的概念和基本原理;接著開始介紹分類算法的基礎(chǔ)算法——決策樹,而決策樹算法中又包含ID3等多種算法,并且除了決策樹外,還有其他更高級(jí)的分類算法;在真正使用分類法進(jìn)行預(yù)測(cè)時(shí),還要分析預(yù)測(cè)準(zhǔn)確度;最終要將所學(xué)知識(shí)加以應(yīng)用。這樣就形成了一個(gè)結(jié)構(gòu)清晰、難度循序漸進(jìn)的知識(shí)點(diǎn)模塊的層次關(guān)系。在宏觀角度、微觀角度對(duì)教學(xué)內(nèi)容進(jìn)行分類的前提下進(jìn)行相應(yīng)的授課方法與考查方法的研究,才能真正有助于學(xué)生的學(xué)習(xí)。
對(duì)不同層次學(xué)生要求不同,這種不同既體現(xiàn)在知識(shí)點(diǎn)的要求上,又直接體現(xiàn)在任務(wù)的難易性程度上,這都需要教師在課程設(shè)計(jì)時(shí)充分考慮不同要求情況下的不同的授課方式,并使學(xué)生清楚自己需要掌握的程度。對(duì)于高級(jí)算法和實(shí)現(xiàn)部分,通??梢赃x擇一到兩章內(nèi)容采用專題探討式的教學(xué)方法。這種方法是指在教師啟發(fā)和引導(dǎo)下,以學(xué)生為主體,選擇某個(gè)基本教學(xué)單元為專題,學(xué)生自主研究作為知識(shí)傳遞的基本形式,將多種靈活的教學(xué)方式綜合運(yùn)用到教學(xué)環(huán)節(jié)的教學(xué)方法[3]。根據(jù)信管專業(yè)培養(yǎng)方案的培養(yǎng)目標(biāo)、以及對(duì)學(xué)生調(diào)研的情況,實(shí)踐環(huán)節(jié)比較適合選擇成熟的商務(wù)智能工具進(jìn)行數(shù)據(jù)的整合和多維數(shù)據(jù)建模,也就是直接使用現(xiàn)成的;或者使用數(shù)據(jù)挖掘軟件進(jìn)行數(shù)據(jù)建模,完善數(shù)據(jù)挖掘算法??梢葬槍?duì)學(xué)生管理基礎(chǔ)課與IT基礎(chǔ)課知識(shí)的掌握情況,選擇合適的工具為學(xué)生設(shè)計(jì)綜合性實(shí)驗(yàn)。實(shí)驗(yàn)中給出部分操作步驟,并在實(shí)驗(yàn)后期僅給出數(shù)據(jù)與工具,讓學(xué)生自己設(shè)計(jì)數(shù)據(jù)倉庫、進(jìn)行數(shù)據(jù)挖掘、并對(duì)挖掘結(jié)果進(jìn)行多種形式的展示。
本文通過國(guó)內(nèi)外數(shù)據(jù)挖掘課程內(nèi)容、分類、教學(xué)方法的分析,針對(duì)信管專業(yè)本科生的培養(yǎng)要求,研究了數(shù)據(jù)挖掘課程建設(shè)的主要內(nèi)容,并針對(duì)知識(shí)點(diǎn)的不同模塊,實(shí)行不同的授課方式,使學(xué)生更加明確重點(diǎn)、難點(diǎn)和擴(kuò)展內(nèi)容,提高了學(xué)生的聽課效率,對(duì)教學(xué)內(nèi)容的模塊化分類、以及相應(yīng)的授課方式的研究成果仍可繼續(xù)發(fā)揮作用,并進(jìn)行更深入的研究和實(shí)踐。
[1]韋艷艷,張超群.模塊化教學(xué)與學(xué)習(xí)遷移[J].當(dāng)代教育論壇,2018,(5).
[2]鄭浩,陶虎,王曉輝.高校模塊化教學(xué)模式及其效果評(píng)價(jià)方法[J].科技信息,2012,(25).
[3]陳帆,和紅杰.啟發(fā)式教學(xué)在Java語言教學(xué)中的應(yīng)用[J].計(jì)算機(jī)教育,2010,(16).
G642.0
A
1674-9324(2014)30-0240-03
項(xiàng)目名稱:“商務(wù)智能類課程模塊化管理與分層教學(xué)模式研究”,項(xiàng)目號(hào)2012JGYB42。
胡敏(1982-),女,山東煙臺(tái)市人,博士,講師,研究方向:管理科學(xué)、數(shù)據(jù)挖掘、應(yīng)急管理。