馮俐
摘 要 闡述數(shù)據(jù)挖掘在教學(xué)設(shè)計的學(xué)習(xí)者分析過程、教學(xué)評價過程中結(jié)果評價和學(xué)生評教、在線學(xué)習(xí)環(huán)境分析和設(shè)計等多個環(huán)節(jié)中的具體應(yīng)用及其實現(xiàn)方式,為教育工作者提供借鑒,最后提出數(shù)據(jù)挖掘在教學(xué)設(shè)計中的應(yīng)用前景是開發(fā)和應(yīng)用教學(xué)專用的數(shù)據(jù)挖掘工具。
關(guān)鍵詞 數(shù)據(jù)挖掘技術(shù);學(xué)習(xí)者分析;在線學(xué)習(xí)環(huán)境
中圖分類號:G642.0 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2016)06-0035-02
1 數(shù)據(jù)挖掘及其教育用途
數(shù)據(jù)挖掘是一個多學(xué)科的交叉領(lǐng)域,從教學(xué)設(shè)計的角度來說,數(shù)據(jù)挖掘更像是一種技術(shù),幫助人們從大量的數(shù)據(jù)中發(fā)掘有用的知識。數(shù)據(jù)挖掘?qū)虒W(xué)設(shè)計有哪些用途?首先要介紹數(shù)據(jù)挖掘本身具有哪些用途。數(shù)據(jù)挖掘的用途一般可以分為兩大類:描述性和預(yù)測性。描述性挖掘包括數(shù)據(jù)特征化、數(shù)據(jù)區(qū)分、關(guān)聯(lián)分析和聚類分析等,主要用于描述數(shù)據(jù)的特征、區(qū)分類別等;預(yù)測性挖掘包括分類、回歸等,主要用于預(yù)測數(shù)據(jù)將來的發(fā)展態(tài)勢等。
教育數(shù)據(jù)挖掘是將來自各種教育系統(tǒng)的原始數(shù)據(jù)轉(zhuǎn)換為有用信息的過程,這些有用信息可為教師、學(xué)生及家長、教育研究人員以及教育軟件系統(tǒng)開發(fā)人員所利用。如果有一些或大量的學(xué)習(xí)者數(shù)據(jù),如個人的基礎(chǔ)信息數(shù)據(jù)和學(xué)習(xí)情況,就可以從中分析學(xué)習(xí)者的某些特征和預(yù)測規(guī)則等。
2 數(shù)據(jù)挖掘在學(xué)習(xí)者分析中的應(yīng)用
學(xué)習(xí)者分析是教學(xué)設(shè)計過程最前的環(huán)節(jié),也是很重要的一個環(huán)節(jié)。數(shù)據(jù)挖掘在描述學(xué)習(xí)者的知識結(jié)構(gòu)和認(rèn)知習(xí)慣上有突出優(yōu)勢。從教務(wù)部門獲得學(xué)習(xí)者的基本信息(如年齡、性別、年級、專業(yè)等)和學(xué)習(xí)情況(學(xué)習(xí)者以往各門功課的成績、選修情況、圖書借閱記錄、自學(xué)時間等),對數(shù)據(jù)進(jìn)行清理,處理缺失和噪音值,采用一定的編碼方案,將數(shù)據(jù)簡化壓縮(如各門功課的成績分成五個區(qū)間:0~40為很差,40~60為較差,60~80為中等,80~90為較好,90~100很好),再對數(shù)據(jù)進(jìn)行規(guī)約(如離散化或概念分層等),如圖1所示。
將某學(xué)生考試成績數(shù)據(jù)清理,剔除并修改噪聲值,通過對數(shù)據(jù)進(jìn)行編碼和規(guī)約,可把學(xué)生出生年份、性別、入學(xué)年份、成績等信息處理成簡單的二元或多元值(編碼和規(guī)約的程度根據(jù)挖掘目的來確定,圖中只是舉例說明)。經(jīng)過這一些數(shù)據(jù)預(yù)處理操作,形成可挖掘的學(xué)習(xí)者數(shù)據(jù)。這是數(shù)據(jù)挖掘過程最耗時的工作,也是所有數(shù)據(jù)挖掘工作之前的基礎(chǔ)。
經(jīng)過上一步工作,就可以用數(shù)據(jù)挖掘的相關(guān)技術(shù)處理數(shù)據(jù)了。通過對學(xué)習(xí)者以往各門功課成績的特征化分析,可以了解到學(xué)習(xí)者的前期知識結(jié)構(gòu)情況;通過對多門課程偏重的認(rèn)知能力分類,可以得到學(xué)習(xí)者認(rèn)知能力的大致情況;通過對學(xué)習(xí)者選課記錄和圖書借閱記錄的預(yù)測分析,可以了解學(xué)習(xí)者的興趣方向。
3 數(shù)據(jù)挖掘在教學(xué)評價中的應(yīng)用
數(shù)據(jù)挖掘中有個觀念是“強關(guān)聯(lián)規(guī)則不一定是有趣的”,這是說規(guī)則AB的置信度有一定的欺騙性,即使該規(guī)則的置信度很高,也可能兩者之間不相關(guān)或負(fù)相關(guān)。在教學(xué)評價中,可以用來幫助判斷兩個事項間的相關(guān)性。如某工科院校某年級共1000名學(xué)生,期末考試中某門程序設(shè)計課程中得分大于80分的人數(shù)有600人。平時,該年級喜好打網(wǎng)絡(luò)游戲的人數(shù)是700人,這些人里本門課程的期末成績大于80分的有400人,成績大于80分與喜愛網(wǎng)絡(luò)游戲的相依表如表1所示??捎嬎愠鱿埠么蚓W(wǎng)絡(luò)游戲的人中有57%的比例得到80分以上,這個比例在統(tǒng)計學(xué)中來說算是很高的置信度了。從這個年級學(xué)生成績數(shù)據(jù)來說,打游戲會得高分的規(guī)則是否成立?答案是否定的。因為打游戲得高分的比例比起總?cè)藬?shù)中得高分的比例60%少,所以打游戲與得高分呈一定的負(fù)相關(guān)。
學(xué)生評教產(chǎn)生大量的數(shù)據(jù)內(nèi)容,采用數(shù)據(jù)挖掘技術(shù)對評教數(shù)據(jù)進(jìn)行分析,彌補傳統(tǒng)思辨方法的不足。通過評教數(shù)據(jù)的相關(guān)性分析可以檢測學(xué)生評教的有效性水平,利用聚類和主成分分析的方法,分析影響評教成績的主要原因[1]等。馬秀麟等學(xué)者通過對兩所院校的評教數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),雖然有些客觀因素會影響到評估分,學(xué)生的評價結(jié)果是可信的和穩(wěn)定的,學(xué)生對教師的評分和他們的學(xué)習(xí)成績是相關(guān)的,而且這種評價甚至比同行評價更少受到其他因素的干擾,部分教師獲得差評的主要原因是對教學(xué)的投入不足和實踐性知識的欠缺。
4 數(shù)據(jù)挖掘在在線學(xué)習(xí)環(huán)境中的應(yīng)用
數(shù)據(jù)挖掘有一個重要的分支內(nèi)容就是Web數(shù)據(jù)挖掘,Web挖掘就是在Web上實現(xiàn)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,具體講就是從和WWW有關(guān)聯(lián)的資源或者是行為中進(jìn)行數(shù)據(jù)挖掘以獲得感興趣的、有用的模式,找出其中的隱含信息[2]。
通過對在線學(xué)習(xí)環(huán)境的Web記錄挖掘,可以發(fā)現(xiàn)潛在使用者、訪問習(xí)慣等興趣信息;可以對在線學(xué)習(xí)環(huán)境中的內(nèi)容進(jìn)行挖掘,具體有圖像、音視頻、文本或者多種媒體融合;在線學(xué)習(xí)環(huán)境中各種自定義的鏈接結(jié)構(gòu)實現(xiàn)了結(jié)構(gòu)信息、質(zhì)量信息和內(nèi)容信息等的存儲,Web結(jié)構(gòu)挖掘也是可以利用的重要內(nèi)容之一。根據(jù)對記錄、內(nèi)容和結(jié)構(gòu)的挖掘結(jié)果,實現(xiàn)對學(xué)習(xí)者的內(nèi)容智能推送等功能。總的說來,數(shù)據(jù)挖掘為在線學(xué)習(xí)環(huán)境中個性化學(xué)習(xí)提供了技術(shù)支持,為自動化的分類、學(xué)習(xí)和推送提供了技術(shù)支持。高美的研究中設(shè)計完成了一個在線個性化學(xué)習(xí)系統(tǒng),通過數(shù)據(jù)挖掘技術(shù)實現(xiàn)個性化學(xué)習(xí)在線管理、自動化學(xué)習(xí)能力評估和個性化課件資源推薦等功能。
5 數(shù)據(jù)挖掘在教學(xué)設(shè)計中的應(yīng)用前景
數(shù)據(jù)挖掘在教學(xué)設(shè)計的主要應(yīng)用前景在于教學(xué)專用工具的發(fā)開與應(yīng)用。目前,國內(nèi)外已有許多商業(yè)或免費數(shù)據(jù)挖掘應(yīng)用工具,主要有SPSS Clementine、SAS Enterprise Miner等,Excel和SQL Server等軟件也提供了數(shù)據(jù)挖掘模塊工具。國內(nèi)外逐漸出現(xiàn)專用教育數(shù)據(jù)挖掘工具,如為課件作者提供反饋的發(fā)現(xiàn)預(yù)測規(guī)則工具EPRules,遠(yuǎn)程學(xué)習(xí)數(shù)據(jù)可視化工具GISMO,幫助教師識別學(xué)生在線練習(xí)相關(guān)模式工具TADA-ED,能檢索和解釋學(xué)習(xí)者序列導(dǎo)航模式工具03R,能為學(xué)習(xí)者推薦下次訪問最佳鏈接的挖掘工具AHA,等等;國內(nèi)如陳超美博士開發(fā)的可視化文獻(xiàn)分析工具citespace,劉啟元開發(fā)的文獻(xiàn)題錄信息挖掘工具Sati,等等[3]。
對教育工作者來說,為使用專業(yè)的數(shù)據(jù)挖掘工具還得專門學(xué)習(xí)數(shù)據(jù)挖掘的一些基礎(chǔ)概念和方法,這提高了數(shù)據(jù)挖掘這門技術(shù)在教學(xué)設(shè)計中應(yīng)用的門檻。因此,數(shù)據(jù)挖掘在教學(xué)設(shè)計中的應(yīng)用前景是需要開發(fā)教學(xué)專用的工具,如專門的學(xué)習(xí)者認(rèn)知結(jié)構(gòu)分析軟件、評教系統(tǒng)信息挖掘和在線學(xué)習(xí)內(nèi)容推送等,同時依據(jù)教學(xué)設(shè)計的流程,采用教學(xué)術(shù)語,為具體的教學(xué)設(shè)計目的服務(wù)。
參考文獻(xiàn)
[1]馬秀麟,衷克定,劉立超.從大數(shù)據(jù)挖掘的視角分析學(xué)生評教的有效性[J].中國電化教育,2014(10):78-84.
[2]韓家煒.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,譯.北京:機械工業(yè)出版社,2012:172-173.
[3]劉冰.國內(nèi)E-learning數(shù)據(jù)挖掘研究現(xiàn)狀與應(yīng)用綜述[J].淮南師范學(xué)院學(xué)報,2015(2):87-92.
[4]烏美娜,劉美鳳,張祖忻,等.教學(xué)設(shè)計[M].北京:高等教育出版社,1994.
[5]高美.遠(yuǎn)程教育個性化學(xué)習(xí)系統(tǒng)中Web挖掘的應(yīng)用與研究[D].成都:電子科技大學(xué),2013:11-13.