彭浩
【摘要】 計(jì)算機(jī)技術(shù)與通信技術(shù)的發(fā)展,互聯(lián)網(wǎng)的普及,人們可以足不出戶,在家即可進(jìn)行遠(yuǎn)程學(xué)習(xí)。數(shù)據(jù)挖掘技術(shù)的運(yùn)用,使得遠(yuǎn)程教育更加智能化和個(gè)性化。本文從數(shù)據(jù)挖掘的概念出發(fā),分析了如何將Web技術(shù)運(yùn)用于遠(yuǎn)程教育。
【關(guān)鍵詞】 Web數(shù)據(jù)挖掘 遠(yuǎn)程教育 決策樹算法
隨著計(jì)算機(jī)技術(shù)與通信技術(shù)的發(fā)展,遠(yuǎn)程教育以迅猛的態(tài)勢(shì)發(fā)展起來(lái),英特網(wǎng)上出現(xiàn)大量的教學(xué)資源,這些教育信息十分繁多和龐大,如何在這些龐大的數(shù)據(jù)中了解學(xué)生特性,從而根據(jù)不同學(xué)生采取不同的教育方法,數(shù)據(jù)挖掘技術(shù)的出現(xiàn)很好的解決了上述問題。
一、數(shù)據(jù)挖掘技術(shù)
我們知道信息是無(wú)處不在的,數(shù)據(jù)挖掘就是對(duì)這些信息進(jìn)行探索性分析,一種對(duì)數(shù)據(jù)分析的方法論。數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)挖掘中的一個(gè)步驟,涉及集人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域,實(shí)際數(shù)據(jù)具有大量,不完整的,模糊和隨機(jī)不可確定的特點(diǎn),而作為一種新的數(shù)據(jù)處理技術(shù),數(shù)據(jù)挖掘就是從這龐大的數(shù)據(jù)庫(kù)中挖掘出人們未知、潛在有用的最終可理解的信息。
二、數(shù)據(jù)挖掘常用技術(shù)方法
(1)粗糙集方法。其主要思想在于通過(guò)信息系統(tǒng)來(lái)表示知識(shí),通過(guò)信息系統(tǒng)進(jìn)行知識(shí)簡(jiǎn)約,導(dǎo)出問題決策和分類規(guī)則,歸納后可以從知識(shí)庫(kù)中抽取更有價(jià)值的隱含知識(shí)和潛在規(guī)律。所以,粗糙集方法其實(shí)質(zhì)就是在大量信息系統(tǒng)中進(jìn)行信息系統(tǒng)屬性約簡(jiǎn),得到一種屬性約簡(jiǎn)集的過(guò)程,最終得到抽取的規(guī)則和方法。(2)遺傳算法。它的基本思想是模擬生物生存進(jìn)化過(guò)程中最優(yōu)解的算法,其借鑒的生物學(xué)基礎(chǔ)就是遺傳和進(jìn)化。通過(guò)遺傳算法我們可以在數(shù)據(jù)庫(kù)中進(jìn)行搜索,并對(duì)其中隨機(jī)產(chǎn)生的規(guī)則進(jìn)行優(yōu)化。遺傳算法優(yōu)點(diǎn)有以下兩點(diǎn):①在適應(yīng)值函數(shù)有噪聲下,遺傳算法可以以極大的概率找到整體最優(yōu)解而不容易陷入局部最優(yōu);②大規(guī)模并行計(jì)算機(jī)很適用于遺傳算法。(3)決策樹算法。其主要方法是先對(duì)數(shù)據(jù)進(jìn)行處理,然后用歸納算法產(chǎn)生可讀的規(guī)則和決策樹,最后對(duì)新數(shù)據(jù)進(jìn)行決策分析。決策樹算法有以下幾個(gè)特點(diǎn):①?zèng)Q策樹算法描述結(jié)構(gòu)較簡(jiǎn)單,容易為人所理解;②效率高,適用于大規(guī)模數(shù)據(jù)的處理;③擁有較高的分辨進(jìn)度。
三、Web數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教育中的應(yīng)用
(1)遠(yuǎn)程教育介紹。遠(yuǎn)程教育作為一種重要的教育方法,被廣泛的用在高等教育,職業(yè)教育和成人教育中。在現(xiàn)代遠(yuǎn)程教育中,學(xué)習(xí)者是通過(guò)點(diǎn)擊鼠標(biāo)和瀏覽網(wǎng)頁(yè)來(lái)完成他們的學(xué)習(xí)過(guò)程,因而他們的學(xué)習(xí)習(xí)慣可以完全被系統(tǒng)日志記錄。我們只需要分析和挖掘系統(tǒng)日志,就可以很好的對(duì)學(xué)習(xí)者的學(xué)習(xí)習(xí)慣進(jìn)行分析,同時(shí)也可以了解到遠(yuǎn)程教育系統(tǒng)是否能很好的服務(wù)于學(xué)習(xí)者。(2)Web數(shù)據(jù)挖掘。Web數(shù)據(jù)挖掘是數(shù)據(jù)挖掘技術(shù)與計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的融合,網(wǎng)站上有三種類型數(shù)據(jù),分別是:內(nèi)容數(shù)據(jù),結(jié)構(gòu)數(shù)據(jù)以及使用數(shù)據(jù)。Web數(shù)據(jù)挖掘一般包括數(shù)據(jù)獲得,數(shù)據(jù)預(yù)處理,模式發(fā)現(xiàn),模式分析四部分。①數(shù)據(jù)獲得:按照數(shù)據(jù)挖掘的目的獲取不同學(xué)習(xí)者的數(shù)據(jù)。Web內(nèi)容挖掘收集的信息來(lái)自于我們的網(wǎng)站資源。Web結(jié)構(gòu)挖掘收集的數(shù)據(jù)來(lái)自于HTML內(nèi)部痕跡和網(wǎng)頁(yè)之間的超鏈接。Web使用數(shù)據(jù)從客戶端收集,數(shù)據(jù)包括IP地址,URL等。②數(shù)據(jù)預(yù)處理:數(shù)據(jù)預(yù)處理是Web數(shù)據(jù)挖掘的關(guān)鍵一步,因?yàn)樵紨?shù)據(jù)會(huì)受到不同程度的干擾,Web數(shù)據(jù)挖掘可能變得低質(zhì)量而價(jià)值不高,因而數(shù)據(jù)預(yù)處理顯得尤為重要。數(shù)據(jù)預(yù)處理處理的好壞直接關(guān)系著模型發(fā)現(xiàn)和模型分析。常用數(shù)據(jù)清理進(jìn)行處理。③模式發(fā)現(xiàn):在數(shù)據(jù)預(yù)處理之后,這些數(shù)據(jù)消除了擾亂,我們就可以對(duì)這些數(shù)據(jù)用常用的算法進(jìn)行處理,如決策樹算法。④模式分析:通過(guò)模式發(fā)現(xiàn)后,會(huì)產(chǎn)生一些規(guī)則和模型。怎樣讓學(xué)習(xí)者充分運(yùn)用這些規(guī)則和模型,面對(duì)如此大量的晦澀的概念,我們通過(guò)模型分析,可以將這些規(guī)則和模型通過(guò)圖形界面程序傳遞給學(xué)習(xí)者,方便他們學(xué)習(xí)。(3)決策樹算法應(yīng)用。決策樹算法是一種廣泛應(yīng)用的分類算法,具有描述簡(jiǎn)單,容易理解的特點(diǎn)。我們要將學(xué)習(xí)者的學(xué)習(xí)成績(jī)與哪些因素有關(guān)分析出來(lái),如課前預(yù)習(xí),課后作業(yè)復(fù)習(xí)等。同時(shí)生成相應(yīng)的決策樹,可以得到做筆記認(rèn)真完成作業(yè)的學(xué)習(xí)者,他們的學(xué)習(xí)成績(jī)好,可以評(píng)定成為優(yōu)秀。沒有完成則評(píng)定為不優(yōu)秀,循環(huán)往復(fù)。決策樹算法可以很詳細(xì)的記錄學(xué)習(xí)者的學(xué)習(xí)情況,及時(shí)給予評(píng)價(jià),督促學(xué)習(xí)者不斷努力學(xué)習(xí)。
四、結(jié)語(yǔ)
綜上所述,互聯(lián)網(wǎng)技術(shù)與教育結(jié)合是未來(lái)教育發(fā)展方向,數(shù)據(jù)挖掘技術(shù)應(yīng)用于遠(yuǎn)程教育,使得教育平臺(tái)更加智能化和個(gè)性化。雖然數(shù)據(jù)挖掘技術(shù)處于剛剛起步階段,相信隨著更多的數(shù)據(jù)挖掘方法出現(xiàn),數(shù)據(jù)挖掘?qū)⒂懈鼜V泛的應(yīng)用空間。
參 考 文 獻(xiàn)
[1] 陳勇飛,王羨欠. Web日志數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J]. 硅谷. 2009(04)
[2] 董彩云,劉培華. 數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教育教學(xué)中的應(yīng)用[J]. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(02)