向陽 郭鑫 陳千 黃震華
摘要:本文在數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的特色和內(nèi)容的研究基礎(chǔ)上,討論了該課程實(shí)驗(yàn)教學(xué)的重要性和意義,開發(fā)了教學(xué)實(shí)驗(yàn)平臺(tái)。實(shí)踐表明該平臺(tái)能提供在線交互式教學(xué),有效管理教學(xué),激發(fā)學(xué)生積極性。
關(guān)鍵詞:實(shí)驗(yàn)平臺(tái);教學(xué)管理;數(shù)據(jù)倉庫;數(shù)據(jù)挖掘
中圖分類號:G642 文獻(xiàn)標(biāo)志碼:B 文章編號:1674-9324(2013)09-0253-03
一、引言
21世紀(jì)是國家全面推進(jìn)學(xué)生素質(zhì)培養(yǎng)的時(shí)期,計(jì)算機(jī)專業(yè)課既具有較強(qiáng)的理論性,又具有較深的實(shí)踐性。目前,計(jì)算機(jī)專業(yè)的教學(xué)過程中往往理論教育與實(shí)際脫節(jié),很多學(xué)生通過了專業(yè)理論課的考試,卻不能將理論付諸于實(shí)踐,學(xué)生對課程知識(shí)并沒有深刻的理解和消化,對課程理論的實(shí)際應(yīng)用沒有感觀上的體驗(yàn)。經(jīng)調(diào)查顯示,60%以上的學(xué)生認(rèn)為在校期間的計(jì)算機(jī)理論課的學(xué)習(xí)對就業(yè)和實(shí)際工作幫助不大,這給學(xué)生學(xué)習(xí)計(jì)算機(jī)理論的積極性帶來了消極的影響,更有很多學(xué)生熱衷于參加社會(huì)上的計(jì)算機(jī)培訓(xùn)機(jī)構(gòu),放棄在高校的課程學(xué)習(xí)。因此,在培養(yǎng)學(xué)生的理論創(chuàng)新能力的同時(shí),提高學(xué)生的動(dòng)手操作能力,加強(qiáng)學(xué)生理論聯(lián)系實(shí)際的能力是計(jì)算機(jī)教學(xué)十分緊迫和必要的任務(wù)。
隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,在短短幾年內(nèi)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘就已經(jīng)成為IT信息領(lǐng)域廣泛應(yīng)用和熱點(diǎn)研究的領(lǐng)域。該領(lǐng)域主要是研究如何從浩如煙海的海量數(shù)據(jù)中有效地提取并挖掘知識(shí),對其進(jìn)行自動(dòng)分析和匯總,是計(jì)算機(jī)行業(yè)中最熱門、最有前景的領(lǐng)域之一[1]。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程也順應(yīng)計(jì)算機(jī)發(fā)展的需要,進(jìn)入到高校計(jì)算機(jī)教育的專業(yè)課課程列表中。
本論文在深入研究了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的內(nèi)容和特點(diǎn)的基礎(chǔ)上,采用B/S(Browser/Server)架構(gòu),即瀏覽器/服務(wù)器架構(gòu),開發(fā)了web課程教學(xué)實(shí)驗(yàn)平臺(tái)。
二、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)W科教學(xué)現(xiàn)狀
隨著數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程在各大高校成功試教后,近年來各大高校都為計(jì)算機(jī)專業(yè)都設(shè)立了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程,時(shí)至今日,其課堂理論教學(xué)已經(jīng)比較成熟。然而,絕大多數(shù)學(xué)生在經(jīng)過該課程的學(xué)習(xí)后,普遍反映雖然基本了解了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘相關(guān)理論知識(shí),卻缺乏感性認(rèn)識(shí)和實(shí)踐應(yīng)用能力。這主要是因?yàn)樵撜n程的實(shí)驗(yàn)教學(xué)較難開展,缺乏一個(gè)符合以下特點(diǎn)的教學(xué)實(shí)驗(yàn)平臺(tái)。
市場中通用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘軟件昂貴且難以使用,大量的專業(yè)術(shù)語、專業(yè)業(yè)務(wù)理論、數(shù)學(xué)知識(shí)和挖掘模型讓人無從下手。因此我們需要的僅僅是一個(gè)實(shí)驗(yàn)平臺(tái),并非大型企業(yè)應(yīng)用軟件,只要學(xué)生能通過它更簡易地完成該課程的實(shí)驗(yàn)環(huán)節(jié)即可。
1.可視化、易操作??梢暬鸵撞僮骺梢蕴岣邔W(xué)生的學(xué)習(xí)興趣,讓學(xué)生更直觀的參與到教學(xué)活動(dòng)中來,而不是苦惱于如何使用該平臺(tái)完成實(shí)驗(yàn)。
2.交互性。一個(gè)好的教學(xué)平臺(tái)不僅是一個(gè)可以提供給學(xué)生傳授知識(shí)的平臺(tái),還應(yīng)該是一個(gè)可以和學(xué)生及老師有交互性的平臺(tái),并且使學(xué)生和學(xué)生有交互性,老師和學(xué)生有交互性[2]。
3.教學(xué)與實(shí)驗(yàn)相結(jié)合。我們需要不僅僅是一個(gè)數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)軟件,而是綜合課程教學(xué)和課程實(shí)驗(yàn)的平臺(tái)。教學(xué)與實(shí)驗(yàn)相結(jié)合、理論與實(shí)踐并重,這才是計(jì)算機(jī)專業(yè)教育的核心。
4.擁有合理和充足的實(shí)驗(yàn)數(shù)據(jù)。對于一個(gè)實(shí)驗(yàn)平臺(tái)來說,數(shù)據(jù)的缺乏將使得實(shí)驗(yàn)無法進(jìn)行。尤其是對于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘這個(gè)特殊的領(lǐng)域,數(shù)據(jù)不僅要足夠的多而且要合理,否則會(huì)嚴(yán)重影響實(shí)驗(yàn)結(jié)果和教學(xué)效果。
三、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)W科教學(xué)實(shí)驗(yàn)平臺(tái)的構(gòu)建
為適應(yīng)教育發(fā)展需要,秉承深化教學(xué)改革的方針,改革數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程原有的普通教學(xué)模式,啟動(dòng)了“數(shù)據(jù)挖掘課程設(shè)計(jì)平臺(tái)建設(shè)”教學(xué)改革項(xiàng)目。該平臺(tái)依托我校電信學(xué)院985平臺(tái)的優(yōu)良硬件環(huán)境,由遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)服務(wù)器和終端PC機(jī)組成,其成本低廉、維護(hù)方便、部署容易。該實(shí)驗(yàn)平臺(tái)服務(wù)器直接部署于本校的學(xué)院985實(shí)驗(yàn)基地,具有操作穩(wěn)定性、魯棒性和容錯(cuò)性。通過該實(shí)驗(yàn)教學(xué)平臺(tái),學(xué)生對該課程的學(xué)習(xí)過程將不受場地限制,只要通過網(wǎng)絡(luò)就可以登錄該平臺(tái)。該平臺(tái)主要框架如圖1所示。
1.用戶管理模塊實(shí)現(xiàn)了對不同用戶的權(quán)限設(shè)置、登錄和注冊等功能,超級管理員可以為普通學(xué)生用戶分配權(quán)限。
2.實(shí)驗(yàn)平臺(tái)模塊給學(xué)生提供了算法模擬和試驗(yàn)的平臺(tái),主要分為以下兩個(gè)部分。
(1)數(shù)據(jù)倉庫的維度建模設(shè)計(jì)模塊。雪花模型設(shè)計(jì)案例;星型模型設(shè)計(jì)案例;ETL抽取操作平臺(tái)。
(2)數(shù)據(jù)挖掘算法實(shí)驗(yàn)?zāi)K。數(shù)據(jù)預(yù)處理程序?qū)崿F(xiàn)算法平臺(tái);Apriori算法實(shí)驗(yàn)平臺(tái);ID3算法實(shí)驗(yàn)平臺(tái);BP算法實(shí)驗(yàn)平臺(tái);K-Mean和K-Medoid算法實(shí)驗(yàn)平臺(tái);C4.5算法和決策樹算法實(shí)驗(yàn)平臺(tái);KNN算法實(shí)驗(yàn)平臺(tái);貝葉斯算法實(shí)驗(yàn)平臺(tái)。
維度建模設(shè)計(jì)平臺(tái)和數(shù)據(jù)挖掘算法實(shí)驗(yàn)平臺(tái)模塊是該平臺(tái)的核心模塊。
3.實(shí)驗(yàn)課程模塊主要向?qū)W生介紹該實(shí)驗(yàn)課程的相關(guān)內(nèi)容、教學(xué)大綱和教學(xué)任務(wù),也包含數(shù)據(jù)倉庫環(huán)境的具體安裝和配置視頻演示。
4.作業(yè)提交模塊更是改變了傳統(tǒng)的提交紙質(zhì)作業(yè)的模式,讓學(xué)生將動(dòng)手完成的實(shí)驗(yàn)和相關(guān)作業(yè)通過該平臺(tái)提交,一個(gè)學(xué)生一個(gè)賬戶,避免了作業(yè)抄襲和拷貝。學(xué)生提交的作業(yè)只要運(yùn)行正確,按題目要求編程,不論采用何種語言或者何種算法都是可以的,并沒有唯一性的標(biāo)準(zhǔn)答案。當(dāng)實(shí)驗(yàn)課程考核的時(shí)候,學(xué)生能夠通過作業(yè)提交系統(tǒng)向服務(wù)器提交指定課程內(nèi)容的作業(yè),供教師在線評閱和打分。
5.教學(xué)資源下載提供給學(xué)生自學(xué)的資料,給感興趣的學(xué)生提供了進(jìn)一步學(xué)習(xí)的捷徑。
6.當(dāng)有學(xué)生對實(shí)驗(yàn)環(huán)節(jié)和該課程有任何疑問,都可以登錄在線答疑系統(tǒng),給授課老師留言,這些信息都會(huì)以郵件的形式發(fā)送到授課老師的收件箱,從而實(shí)現(xiàn)即時(shí)的答復(fù),讓學(xué)生在第一時(shí)間接受老師的指導(dǎo)。當(dāng)有問題重復(fù)出現(xiàn)三次以上,系統(tǒng)就會(huì)自動(dòng)識(shí)別,將問題和答復(fù)展示在FAQ中,提供給更多的學(xué)生共享該問題和該問題的解答,避免重復(fù)提問,也給還未遇到該問題的學(xué)生共享和學(xué)習(xí)。在線答疑給學(xué)生和教師提供了交互、交流和學(xué)習(xí)的平臺(tái)。
7.數(shù)據(jù)挖掘?qū)嶒?yàn)平臺(tái)的在線代碼編譯環(huán)境主要采用gcc編譯器,能夠?qū)W(xué)生提交的各種代碼進(jìn)行實(shí)時(shí)編譯,給用戶的感覺就像是在本地執(zhí)行一樣。它能夠支持的在線運(yùn)行編程語言包括java、C和C++等,給學(xué)生提供多樣化的語言實(shí)現(xiàn)方式,體現(xiàn)了非機(jī)械化的計(jì)算機(jī)應(yīng)試?yán)砟睢?/p>
四、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)W科教學(xué)實(shí)驗(yàn)平臺(tái)的教學(xué)效果
在數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程中使用該教學(xué)實(shí)驗(yàn)平臺(tái),具有教育的先進(jìn)性和優(yōu)越性。
(一)建設(shè)了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的實(shí)驗(yàn)教學(xué)體系
1.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘模型。本平臺(tái)可以培養(yǎng)學(xué)生自己動(dòng)手創(chuàng)建多維星型模型、多維雪花模型、緩慢變化維、ETL模型、數(shù)據(jù)立方體模型及其實(shí)例等,還可以增加學(xué)生對各類重要挖掘算法的特點(diǎn)和應(yīng)用場景的理解,讓學(xué)生在實(shí)驗(yàn)平臺(tái)上體驗(yàn)基于數(shù)據(jù)倉庫的主要數(shù)據(jù)挖掘算法。
2.模型評估。當(dāng)學(xué)生創(chuàng)建完畢自己的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘模型后,可以通過調(diào)整不同的參數(shù)值和更改數(shù)據(jù)集來檢驗(yàn)算法的輸出結(jié)果,并通過記錄在不同的應(yīng)用場景下的參數(shù)值和結(jié)果值得到最優(yōu)值。
3.優(yōu)化創(chuàng)建模型和算法的性能。學(xué)生通過使用計(jì)算機(jī)領(lǐng)域中的一些經(jīng)典優(yōu)化技術(shù),如創(chuàng)建位圖索引、哈希索引、S-tree索引等來優(yōu)化模型和算法的性能,并記錄和比較不同優(yōu)化技術(shù)對模型和算法的效率和響應(yīng)時(shí)間的影響。
4.定期對學(xué)生所學(xué)實(shí)驗(yàn)內(nèi)容進(jìn)行測試,根據(jù)學(xué)生的實(shí)驗(yàn)測試結(jié)果對平臺(tái)的遠(yuǎn)程實(shí)驗(yàn)操作功能進(jìn)行改進(jìn)和完善。
(二)部署和實(shí)施了基于網(wǎng)絡(luò)的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程遠(yuǎn)程實(shí)驗(yàn)教學(xué)環(huán)境
本項(xiàng)目通過構(gòu)建基于網(wǎng)絡(luò)技術(shù)的遠(yuǎn)程實(shí)驗(yàn)教學(xué)平臺(tái),不僅給學(xué)生和教師提供這樣一個(gè)教學(xué)實(shí)驗(yàn)平臺(tái),而且還實(shí)現(xiàn)了實(shí)驗(yàn)教學(xué)的網(wǎng)上開放式管理,改革原有相對封閉的實(shí)驗(yàn)教學(xué)模式為開放的實(shí)驗(yàn)教學(xué)模式,構(gòu)建了一個(gè)符合實(shí)踐教學(xué)環(huán)節(jié)需求、虛擬和真實(shí)環(huán)境相結(jié)合、基于Web的多應(yīng)用場景的遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)。
(三)基于采樣評估證明了遠(yuǎn)程網(wǎng)絡(luò)實(shí)驗(yàn)教學(xué)的可行性和優(yōu)越性
根據(jù)采樣評估結(jié)果,該系統(tǒng)體現(xiàn)了遠(yuǎn)程網(wǎng)絡(luò)實(shí)驗(yàn)的可行性和優(yōu)越性。在該平臺(tái)真正投入使用之前,我們將一批學(xué)生分為兩個(gè)組進(jìn)行數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的學(xué)習(xí),A組學(xué)生使用現(xiàn)有的課程教學(xué)方法,而B組學(xué)生使用該平臺(tái)的遠(yuǎn)程實(shí)驗(yàn)教學(xué)環(huán)境。具體教學(xué)內(nèi)容為多維數(shù)據(jù)模型和數(shù)據(jù)立方體的概念以及k-means聚類和Apriori關(guān)聯(lián)分析算法。兩組學(xué)生通過不同的教學(xué)方式學(xué)習(xí)后,對他們進(jìn)行了問卷調(diào)查和統(tǒng)計(jì),結(jié)果如圖2所示。
從圖2的數(shù)據(jù)結(jié)果可以看到,無論是從學(xué)生興趣程度、作業(yè)完成度還是考試成績的角度對兩組學(xué)生的學(xué)習(xí)效果進(jìn)行評估,使用該數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教學(xué)實(shí)驗(yàn)平臺(tái)的教學(xué)方式都具有明顯的優(yōu)勢。在實(shí)驗(yàn)過程中學(xué)生是主體,用所學(xué)知識(shí)發(fā)揮創(chuàng)造性思維進(jìn)行實(shí)踐。當(dāng)實(shí)驗(yàn)取得結(jié)果時(shí),不論結(jié)果成功與否,都能帶給學(xué)生一定的鼓勵(lì),從而在某種程度上激發(fā)學(xué)生的創(chuàng)造力和積極性,真正加速問題解決和理論創(chuàng)新。因此,我們有理由相信該平臺(tái)的使用可以極大地提高學(xué)生的學(xué)習(xí)興趣,促進(jìn)教學(xué)目標(biāo)的實(shí)現(xiàn)。
五、結(jié)論
在計(jì)算機(jī)專業(yè)的教學(xué)中,如何提高學(xué)生的實(shí)踐能力和獨(dú)立解決問題的能力是當(dāng)前高等教育發(fā)展的新形勢下所面臨的主要問題。本文首先介紹了基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的實(shí)驗(yàn)平臺(tái)的整體架構(gòu),展示了該平臺(tái)的優(yōu)點(diǎn),證明了該平臺(tái)可以將課堂學(xué)習(xí)和課后練習(xí)、理論教育與工程實(shí)踐有機(jī)結(jié)合,為實(shí)施更加行之有效的教學(xué)組織和教學(xué)管理模式提供了可能。只有教育者和學(xué)生充分認(rèn)識(shí)到計(jì)算機(jī)課程中實(shí)驗(yàn)環(huán)節(jié)的重要性,更有效地利用現(xiàn)有的社會(huì)資源和計(jì)算機(jī)技術(shù)為我們的教育服務(wù),專業(yè)學(xué)科教學(xué)模式和方法才能不斷推陳出新,不斷進(jìn)步和發(fā)展。
參考文獻(xiàn):
[1]Jiawei Han,Micheline Kamber.Data Mining Concept and Technology[M].Beijing:China Machine Press,2007:10-12
[2]李旭晴.學(xué)科教學(xué)網(wǎng)站設(shè)計(jì)的應(yīng)用探討[J].計(jì)算機(jī)教育,2009,(02):1-2.
基金項(xiàng)目:同濟(jì)大學(xué)實(shí)驗(yàn)教學(xué)改革項(xiàng)目專項(xiàng)基金支持(基于校園網(wǎng)的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程課外實(shí)驗(yàn)平臺(tái)建設(shè)與應(yīng)用)
作者簡介:向陽(1962-),男,重慶人,博士,教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)闆Q策支持系統(tǒng)、人工智能。