国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在網(wǎng)絡(luò)教學(xué)資源整合中的應(yīng)用

2018-09-10 07:22向俊
關(guān)鍵詞:遠(yuǎn)程開放教育網(wǎng)絡(luò)教學(xué)資源數(shù)據(jù)挖掘

[摘 要]文章以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),分析了當(dāng)前流行的數(shù)據(jù)挖掘技術(shù)的方法及應(yīng)用,提出構(gòu)建以教學(xué)資源質(zhì)和量、教學(xué)資源高效利用和教學(xué)資源科學(xué)管理三個(gè)方面支撐的教學(xué)資源整合理論框架,為教學(xué)資源的整合提供基本的決策知識,使教學(xué)資源的開發(fā)和設(shè)計(jì)與遠(yuǎn)程網(wǎng)絡(luò)教學(xué)相適應(yīng),為教學(xué)資源的建設(shè)、高效利用以及教學(xué)資源的科學(xué)管理提供了理論參考依據(jù),并通過實(shí)驗(yàn)對部分模塊進(jìn)行了驗(yàn)證。

[關(guān)鍵詞]數(shù)據(jù)挖掘;遠(yuǎn)程開放教育;網(wǎng)絡(luò)教學(xué)資源

[中圖分類號]G434 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-7656(2018)05-0009-07

引言

廣播電視大學(xué)的遠(yuǎn)程開放教育是在不同的時(shí)間和空間條件下,將現(xiàn)代網(wǎng)絡(luò)通訊技術(shù)和多媒體技術(shù)有效地結(jié)合,實(shí)現(xiàn)了實(shí)時(shí)和非實(shí)時(shí)的交互式教學(xué)模式,學(xué)習(xí)者利用有效的信息技術(shù)手段隨時(shí)隨地進(jìn)行個(gè)別化自主學(xué)習(xí)。遠(yuǎn)程開放教育近些年得到了長足的發(fā)展。其中語義網(wǎng)、本體構(gòu)建和數(shù)據(jù)挖掘等智能信息處理技術(shù)應(yīng)用于現(xiàn)代遠(yuǎn)程教育,不少學(xué)者都做了廣泛的研究。徐林針對遠(yuǎn)程教育資源整合的難題,提出了面向服務(wù)架構(gòu)(SOA)的遠(yuǎn)程教育資源整合的系統(tǒng)框架[1]。穆肅針對當(dāng)前遠(yuǎn)程開放教育機(jī)構(gòu)知識管理的實(shí)際情況,利用語義網(wǎng)、本體工程和知識加工處理研究了遠(yuǎn)程開放教育知識管理系統(tǒng)概念模型的構(gòu)建[2]。陳登科等從教學(xué)流程探索了數(shù)據(jù)挖掘技術(shù)在現(xiàn)代遠(yuǎn)程教育的應(yīng)用,分別從選擇教學(xué)對象和授課老師、遠(yuǎn)程教育資源庫建設(shè)、實(shí)時(shí)教學(xué)、實(shí)時(shí)考試幾個(gè)部分使用不同的方法給出了具體的應(yīng)用實(shí)例,最后使用XML語言進(jìn)行了實(shí)現(xiàn)[3]。陳立建針對當(dāng)前遠(yuǎn)程教育系統(tǒng)的不足,探討了基于Web數(shù)據(jù)挖掘技術(shù)的遠(yuǎn)程教育系統(tǒng)框架:個(gè)性化教育平臺、教育網(wǎng)站的設(shè)計(jì)、在線答疑及考試系統(tǒng)等,充分發(fā)揮網(wǎng)絡(luò)教育中的優(yōu)勢,提高網(wǎng)絡(luò)教育的質(zhì)量[4]。在當(dāng)前大力發(fā)展遠(yuǎn)程教育的背景下,文章介紹了主流的數(shù)據(jù)挖掘技術(shù),提出了將進(jìn)化神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)應(yīng)用于遠(yuǎn)程教育教學(xué)資源整合中,并構(gòu)建了資源整合理論框架。

一、基本概念

遠(yuǎn)程教育(Distance Education):通常指師生通過通訊媒體進(jìn)行的非面對面的教育,本質(zhì)特征是教與學(xué)的行為在時(shí)空上是分離的,它具有以下特征:準(zhǔn)永久性分離、媒體與技術(shù)的作用、雙向通信、教育組織通過規(guī)劃和準(zhǔn)備學(xué)習(xí)材料以及提供學(xué)生支助服務(wù)對學(xué)生學(xué)習(xí)產(chǎn)生影響,以區(qū)別個(gè)人學(xué)習(xí)和自我教育。

數(shù)據(jù)挖掘(Data Mining):從大量無序的數(shù)據(jù)中發(fā)現(xiàn)隱含的、有效的、有價(jià)值的、可理解的模式,具有為用戶提供問題求解的決策支持能力[5]。

教學(xué)資源:指各種各樣的媒體與所有可用于教育教學(xué)的物質(zhì)條件、自然條件以及社會條件的總和,包括網(wǎng)絡(luò)資源、計(jì)算機(jī)軟件和硬件、教學(xué)內(nèi)容和教學(xué)信息的各類媒體資源、信息技術(shù)服務(wù)等。

二、數(shù)據(jù)挖掘的過程、方法及應(yīng)用

(一)數(shù)據(jù)挖掘的基本過程

數(shù)據(jù)挖掘是一個(gè)完整的過程,是通過與用戶不斷的交互,對不同階段的挖掘結(jié)果進(jìn)行不斷反饋完成的,整個(gè)過程如圖1。

問題定義:一是明確實(shí)際工作對數(shù)據(jù)挖掘的要求;二是確定可用的學(xué)習(xí)算法。

數(shù)據(jù)預(yù)處理:一般包括消除噪聲、推導(dǎo)計(jì)算缺值數(shù)據(jù)、消除重復(fù)記錄和完成數(shù)據(jù)類型轉(zhuǎn)換。

挖掘算法執(zhí)行:一是要確定挖掘任務(wù);二是要決定使用哪種算法。

解釋和評價(jià):剔除冗余或無關(guān)的模式;對不滿足用戶要求的模式,則需要退回到前一階段。采用的數(shù)據(jù)挖掘技術(shù)的有效性和用于挖掘的數(shù)據(jù)的質(zhì)量和數(shù)量,是影響數(shù)據(jù)挖掘質(zhì)量的好壞兩個(gè)主要因素。

(二)數(shù)據(jù)挖掘的方法及應(yīng)用

數(shù)據(jù)挖掘的方法有模糊數(shù)學(xué)類方法、可視化技術(shù)方法、知識發(fā)現(xiàn)類方法、統(tǒng)計(jì)分類學(xué)方法、仿生物技術(shù)類方法。目前這些方法在遠(yuǎn)程教育方面的應(yīng)用還處于研究階段。

1.知識發(fā)現(xiàn)類方法及應(yīng)用

主要包括:決策樹方法、粗糙集方法和關(guān)聯(lián)規(guī)則分析。關(guān)聯(lián)規(guī)則分析方法基本原理是假設(shè)I是項(xiàng)的集合,對一個(gè)交易數(shù)據(jù)庫D,每個(gè)事務(wù)t是I的非空子集,每個(gè)交易都與一個(gè)唯一的標(biāo)識符TID對應(yīng)。關(guān)聯(lián)規(guī)則在D中的支持度是D中事務(wù)同時(shí)包含X,Y的百分比;置信度是包含X的事務(wù)中同時(shí)又包含Y的百分比。關(guān)聯(lián)規(guī)則方法在遠(yuǎn)程教育應(yīng)用中,董彩云[6]等給了完整的數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)過程,并改進(jìn)Apriori算法[7]以提高挖掘的效率。在實(shí)際應(yīng)用中通過挖掘結(jié)果指導(dǎo)學(xué)員選課,幫助學(xué)員更好完成各門功課。學(xué)生可以了解在選某一門課時(shí),要先選哪幾門課作為基礎(chǔ)課,有利于學(xué)生進(jìn)行科學(xué)地選課和學(xué)習(xí)。鄭春香[8]等在考試系統(tǒng)中應(yīng)用Apriori算法對學(xué)生的答題結(jié)果進(jìn)行挖掘。因此,關(guān)聯(lián)規(guī)則方法關(guān)注的是算法本身,而較少考慮這些算法是否適合遠(yuǎn)程教育資源的挖掘。

2.統(tǒng)計(jì)分類學(xué)方法及應(yīng)用

統(tǒng)計(jì)學(xué)的原理在數(shù)據(jù)挖掘中的應(yīng)用實(shí)例是比較廣泛的,已形成一門獨(dú)立的學(xué)科。主要包括統(tǒng)計(jì)、回歸分析、差異分析和聚類方法。聚類方法又分為劃分聚類方法、網(wǎng)格聚類方法、密度聚類方法和網(wǎng)格密度相結(jié)合的聚類方法。王新穎等提出基于關(guān)聯(lián)規(guī)則和超圖分割聚類方法,對遠(yuǎn)程教育網(wǎng)站的Web網(wǎng)頁及用戶進(jìn)行聚類[9]。在遠(yuǎn)程教育應(yīng)用中,也有部分學(xué)者研究了遠(yuǎn)程教育學(xué)習(xí)者需要從聽課、作業(yè)、討論到考試一整套學(xué)習(xí)過程進(jìn)行考核,使用K-means聚類算法[10]對記錄的多項(xiàng)考核指標(biāo)聚類分析,并將考核指標(biāo)與學(xué)習(xí)者的總結(jié)性評價(jià)聯(lián)系起來,克服了過程考核評價(jià)體系的參數(shù)指標(biāo)通常是根據(jù)經(jīng)驗(yàn)來設(shè)定的缺陷。同時(shí)在遠(yuǎn)程教育個(gè)性化學(xué)習(xí)中,為了減少學(xué)習(xí)者特征數(shù)據(jù)的冗余信息,也可以將粗糙集理論[11]與聚類算法相結(jié)合,主要是解決K均值聚類算法對學(xué)習(xí)者特征數(shù)據(jù)的屬性冗余的敏感性問題,能較好的處理噪聲數(shù)據(jù),可以提高聚類算法的效率并適合于遠(yuǎn)程教育個(gè)性化教學(xué)的應(yīng)用。

3.仿生物技術(shù)類方法及應(yīng)用

該類方法的核心思想是模仿生物某些行為活動(dòng),將這些活動(dòng)通過計(jì)算機(jī)程序來模擬實(shí)現(xiàn),主要有神經(jīng)網(wǎng)絡(luò)方法類和遺傳算法。

部分研究者針對遠(yuǎn)程網(wǎng)絡(luò)教學(xué)資源共享應(yīng)用中難以滿足用戶需要,通過遺傳算法優(yōu)化搜索引擎和資源調(diào)度,提高網(wǎng)絡(luò)教學(xué)資源搜索和共享的效果,使廣大師生在教學(xué)過程中獲得優(yōu)質(zhì)的教學(xué)資源。在電大試點(diǎn)總結(jié)性評估系統(tǒng)的應(yīng)用中,使用模糊BP神經(jīng)網(wǎng)絡(luò)方法,開發(fā)FBPNN學(xué)習(xí)、知識庫和FBPNN推理機(jī)等子模塊。模糊神經(jīng)網(wǎng)絡(luò)模塊負(fù)責(zé)知識獲取、存儲和求解。知識表達(dá)的規(guī)范化和表達(dá)式轉(zhuǎn)換由輸入/輸出模式轉(zhuǎn)換負(fù)責(zé)。在評估應(yīng)用中,可較好的實(shí)現(xiàn)電大總結(jié)性評估,減少人為不確定性因素干擾,增強(qiáng)科學(xué)性和標(biāo)準(zhǔn)性。針對神經(jīng)網(wǎng)絡(luò)所表現(xiàn)出來的優(yōu)勢,在現(xiàn)代遠(yuǎn)程教育教學(xué)質(zhì)量評價(jià)系統(tǒng)中使用BP神經(jīng)算法,構(gòu)建數(shù)學(xué)模型,輸入不同的評價(jià)指標(biāo),輸出教學(xué)效果,科學(xué)、準(zhǔn)確地評價(jià)現(xiàn)代遠(yuǎn)程網(wǎng)絡(luò)教育教學(xué)質(zhì)量和教學(xué)效果。

為了更好地解決現(xiàn)實(shí)中的問題,突出各自的優(yōu)勢,將遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合形成了一種新穎的進(jìn)化神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域[12],得到許多有價(jià)值的結(jié)論和成果。

三、數(shù)據(jù)挖掘在遠(yuǎn)程教育應(yīng)用中存在的問題

為了讓電大遠(yuǎn)程開放教育更好的適應(yīng)我國國情和社會發(fā)展的需要,1994年4月,“中央電大人才培養(yǎng)模式改革和開放教育試點(diǎn)”項(xiàng)目在全國省市電大啟動(dòng),但隨著社會的發(fā)展和科學(xué)技術(shù)的進(jìn)步,傳統(tǒng)的教學(xué)模式已經(jīng)不再適應(yīng)電大遠(yuǎn)程教學(xué)需求,而數(shù)據(jù)挖掘逐漸地被應(yīng)用于遠(yuǎn)程教育中,但也存在如下問題。

(1)消極的學(xué)習(xí)態(tài)度和被動(dòng)的學(xué)習(xí)行為,知識創(chuàng)新不夠。在遠(yuǎn)程教育中,主要群體是成人學(xué)生,而且大多數(shù)學(xué)生是業(yè)余學(xué)習(xí),學(xué)習(xí)時(shí)間少、任務(wù)重,不少學(xué)生對這種開放教育學(xué)習(xí)模式存在偏見和消極態(tài)度。被動(dòng)的或帶著情緒去學(xué)習(xí),沒有任何學(xué)習(xí)興趣,不是主動(dòng)參與到學(xué)習(xí)中來,很少有探索式的學(xué)習(xí)方式,學(xué)生的學(xué)習(xí)行為數(shù)據(jù)就很難收集。

(2)獲取的數(shù)據(jù)質(zhì)量不高。在遠(yuǎn)程教育中,主要群體是成人學(xué)生,而且大多數(shù)學(xué)生是業(yè)余學(xué)習(xí),學(xué)習(xí)時(shí)間少、任務(wù)重,被動(dòng)的或帶著情緒去學(xué)習(xí),在數(shù)據(jù)挖掘中,對所需要獲取的數(shù)據(jù)的真實(shí)性難以保證。

(3)挖掘目標(biāo)不明確。在遠(yuǎn)程教育中,學(xué)習(xí)資源是海量的,不同的學(xué)生學(xué)習(xí)目的和學(xué)習(xí)方法都不相同,在實(shí)際應(yīng)用中,要挖掘有意義的知識和規(guī)則就比較困難。

(4)較難獲取個(gè)性化特征的數(shù)據(jù)[13]。由于學(xué)生的基礎(chǔ)知識水平不同,學(xué)習(xí)條件和學(xué)習(xí)環(huán)境的限制,因此存在某些學(xué)生學(xué)習(xí)效率很低,很難在遠(yuǎn)程教育學(xué)習(xí)過程中獲取有個(gè)性特征的數(shù)據(jù)。

(5)數(shù)據(jù)量大,噪聲數(shù)據(jù)多。在中西部部分地區(qū),遠(yuǎn)程教育設(shè)施落后,無論教學(xué)硬件和教學(xué)軟件都比較落后。而遠(yuǎn)程教育中電子學(xué)習(xí)資料及各種資源數(shù)據(jù)量特別龐大,也沒有系統(tǒng)地對這些資源進(jìn)行分類和預(yù)處理,文字錯(cuò)誤較多,教育技術(shù)和教學(xué)條件還不能滿足遠(yuǎn)程開放教育的需求。在挖掘的目標(biāo)數(shù)據(jù)中,產(chǎn)生了大量噪聲數(shù)據(jù)和沒有意義的數(shù)據(jù),這對挖掘結(jié)果產(chǎn)生很大的影響。

四、基于數(shù)據(jù)挖掘技術(shù)的教學(xué)資源整合理論框架

在國外發(fā)達(dá)國家中,美國的遠(yuǎn)程教學(xué)資源豐富,英國在教學(xué)資源的質(zhì)量方面成果顯著,日本則充分利用豐富的媒體手段,保證教學(xué)資源的有效利用以及教和學(xué)的互動(dòng)。我國當(dāng)前的遠(yuǎn)程教學(xué)資源的數(shù)量豐富而實(shí)用性不強(qiáng),存在資源冗余性、共享性差、利用率低的缺點(diǎn)。針對這些不足,文章從教學(xué)資源的質(zhì)和量、教學(xué)資源的高效利用、教學(xué)資源的科學(xué)管理三個(gè)方面進(jìn)行了分析并進(jìn)行優(yōu)化,建立了一個(gè)基于數(shù)據(jù)挖掘技術(shù)的遠(yuǎn)程開放教育教學(xué)資源整合的理論框架,見圖2。

該理論框架是基于數(shù)據(jù)挖掘技術(shù),以整合遠(yuǎn)程教學(xué)資源質(zhì)與量的為核心,教學(xué)資源的高效利用為目的,教學(xué)資源的科學(xué)管理為保障,不斷優(yōu)化教學(xué)資源,滿足社會整體的需求而構(gòu)建的。

該框架的理論分析:第一,遠(yuǎn)程開放教育的宗旨是為滿足社會的整體需求和人的全面發(fā)展和素質(zhì)提高提供公平的教育機(jī)會。因此,遠(yuǎn)程教學(xué)資源應(yīng)以滿足社會發(fā)展和人的素質(zhì)提高為目標(biāo),教學(xué)資源的質(zhì)和量、高效利用和科學(xué)管理都要圍繞這個(gè)目標(biāo)而發(fā)展,并形成三者之間的交互反饋優(yōu)化和耦合協(xié)同作用;第二,結(jié)合電大教學(xué)與當(dāng)?shù)亟?jīng)濟(jì)發(fā)展?fàn)顩r,以教學(xué)資源質(zhì)和量的建設(shè)為基礎(chǔ),利用數(shù)據(jù)挖掘技術(shù)不斷優(yōu)化教學(xué)資源,結(jié)合電大自身的教學(xué)特色,面向市場需求和社會需求,在財(cái)力、人力和物力許可的情況下,不斷優(yōu)化現(xiàn)有的遠(yuǎn)程教學(xué)資源是至關(guān)重要的。第三,在教學(xué)資源量和質(zhì)得到優(yōu)化的同時(shí),如何高效的利用這些資源為遠(yuǎn)程教學(xué)服務(wù)是必須的。開發(fā)資源快速檢索系統(tǒng)和實(shí)時(shí)資源利用評估系統(tǒng)可以提高教學(xué)資源的利用率。資源快速檢索系統(tǒng)可為學(xué)習(xí)者以最快的速度獲取所需要的資源和在第一時(shí)間掌握最新的成果和前沿技術(shù)研究動(dòng)態(tài),教學(xué)資源檢索系統(tǒng)邏輯架構(gòu)圖如圖3所示。

實(shí)時(shí)資源利用評估系統(tǒng)可為廣大師生利用教學(xué)資源提供指導(dǎo),有利于教師對教學(xué)資源的整體把握和重新認(rèn)識,學(xué)生對教學(xué)資源的認(rèn)識和興趣度的提升。最后,教學(xué)資源的科學(xué)管理是提高資源利用率的關(guān)鍵,通過對現(xiàn)有的管理模式的挖掘,管理者將作出最適合于當(dāng)前遠(yuǎn)程教學(xué)資源管理的決策,師生參與和意見反饋,不斷發(fā)現(xiàn)和改進(jìn)現(xiàn)有管理模式的缺點(diǎn),以加強(qiáng)教學(xué)資源的管理;網(wǎng)絡(luò)化和交互學(xué)習(xí)是遠(yuǎn)程開放教育的基本特征,也有利于師生參與和意見反饋,實(shí)現(xiàn)三者之間的良性互動(dòng)與可持續(xù)發(fā)展。

該理論框架與社會需求和人的素質(zhì)提高存在互動(dòng)關(guān)系。三者之間不是相互孤立的,而是互為聯(lián)系,相互影響。教學(xué)資源的量和質(zhì)是資源高效利用和科學(xué)管理的物質(zhì)基礎(chǔ);教學(xué)資源的高效利用是資源的量和質(zhì)、科學(xué)管理的重要體現(xiàn);教學(xué)資源的科學(xué)管理也是資源質(zhì)量的重要保障,三者之間缺一不可是整個(gè)理論框架的重要保證。

五、挖掘試驗(yàn)結(jié)果及分析

根據(jù)以上的原理和方法,本文對廣西電大網(wǎng)絡(luò)學(xué)習(xí)平臺及關(guān)聯(lián)平臺的網(wǎng)絡(luò)教學(xué)資源進(jìn)行統(tǒng)計(jì)分析和知識挖掘處理。收集和統(tǒng)計(jì)的實(shí)驗(yàn)數(shù)據(jù)是該系統(tǒng)從2015年6月到2018年7月的各種教學(xué)資源,如圖3所示。

根據(jù)圖4所統(tǒng)計(jì)的數(shù)據(jù),學(xué)習(xí)平臺的教學(xué)資源主要是以視、音頻等多媒體資源為主,其中視、音頻媒體文件比重較大。約占教學(xué)資源總量的70%,而圖片資源和網(wǎng)絡(luò)課件的總量所占比例小,是相對薄弱的環(huán)節(jié)。從各種資源的訪問量來看,視、音頻媒體資源訪問總量大,由于電大的教學(xué)模式主要是基于計(jì)算機(jī)網(wǎng)絡(luò)的遠(yuǎn)程開放教育模式,因此,制作更多的流媒體資源,可以在一定程度上緩解了偏遠(yuǎn)地區(qū)對遠(yuǎn)程教育所帶來的壓力。

從以上結(jié)果分析出,隨著電大教學(xué)模式不斷改革和創(chuàng)新,流媒體教學(xué)資源需求量穩(wěn)定的增長,而文本資源的增量相對緩慢一些。教學(xué)資源的開發(fā)和設(shè)計(jì)與電大的網(wǎng)絡(luò)教學(xué)模式相適應(yīng)。

本文在教學(xué)資源挖掘?qū)嶒?yàn)中,目的是挖掘訪問者對哪些類型、哪些領(lǐng)域的教學(xué)資源感興趣,以此驗(yàn)證理論框架中由形式豐富的知識挖掘?qū)W習(xí)者感興趣的教學(xué)資源模塊。本文以2015年至2018年網(wǎng)絡(luò)學(xué)習(xí)平臺數(shù)據(jù)庫中資源表、欄目表、專業(yè)表、課程表中的數(shù)據(jù)為試驗(yàn)對象,進(jìn)行挖掘分析。

實(shí)驗(yàn)硬件環(huán)境:CPU:AMD Athlon Ⅱ Dual-Core M320,主頻2.1G;內(nèi)存:2G,硬盤250G。

實(shí)驗(yàn)軟件環(huán)境:操作系統(tǒng):Windows XP Professional,在Visual C# 2005.net平臺上實(shí)現(xiàn)Apriori關(guān)聯(lián)規(guī)則挖掘算法;數(shù)據(jù)庫Microsoft SQL Server2005,Microsoft Access 2003。初始組合字段數(shù)據(jù)表的總數(shù)據(jù)量有23180條記錄。

實(shí)驗(yàn)步驟:

Step1,使用平均值和同類屬性值填充空缺數(shù)據(jù),使數(shù)據(jù)表保持完整性。

Step2,將不同數(shù)據(jù)庫中的數(shù)據(jù)表進(jìn)行集成,并同時(shí)完成文件的格式轉(zhuǎn)換。

Step3,對文本數(shù)據(jù)進(jìn)行規(guī)范化處理,并同時(shí)對數(shù)字?jǐn)?shù)據(jù)和類別數(shù)據(jù)進(jìn)行編碼。

Step4,在不同數(shù)據(jù)表中,選擇與挖掘相關(guān)的數(shù)據(jù)字段,本文初步選擇了文章標(biāo)題、專業(yè)名稱、欄目名稱、學(xué)科名稱、訪問次數(shù)、IP地址、資源類型和時(shí)間等八個(gè)數(shù)據(jù)字段,隨機(jī)選擇不同字段進(jìn)行組合,同時(shí)多次隨機(jī)抽取表中一半的數(shù)據(jù),通過神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)數(shù)據(jù)值之間的強(qiáng)關(guān)聯(lián)性,找出最優(yōu)的字段組合,將隨機(jī)組合的字段進(jìn)行優(yōu)化組合。

Step5,最后得到優(yōu)化后的數(shù)據(jù)字段組合,分別建立新的數(shù)據(jù)表。

由于挖掘目標(biāo)是與不同類型的訪問者相關(guān),每個(gè)組合中都需要保留訪問次數(shù)字段,經(jīng)過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)后,得到如下的字段組合,如下頁表1。

根據(jù)組合體1初始查詢到的數(shù)據(jù)有25062條,經(jīng)過消除冗余處理后得到6347條數(shù)據(jù);對組合體2經(jīng)過消除冗余處理后得到804條數(shù)據(jù);對組合體3經(jīng)過消除冗余處理后得到878條數(shù)據(jù);組合體4初始查詢到32237條數(shù)據(jù),經(jīng)過消除冗余處理后得到4857條數(shù)據(jù)。教學(xué)資源關(guān)聯(lián)規(guī)則知識挖掘及實(shí)現(xiàn)界面,如圖6所示。

在字段組合體1中,關(guān)聯(lián)規(guī)則支持度為0.01,最小可信度為0.3;在字段組合體2中,關(guān)聯(lián)規(guī)則支持度為0.01,可信度為0.6;在字段組合體3中,關(guān)聯(lián)規(guī)則支持度為0.01,可信度為0.6。挖掘得到的規(guī)則如表2所示。

對表2中的規(guī)則進(jìn)行分析和取極小可信度進(jìn)行合并處理后,得到如下的關(guān)聯(lián)規(guī)則知識。

在組合體1規(guī)則中,管理學(xué)中行政管理專業(yè)的學(xué)生經(jīng)常訪問的是超鏈接媒體的教學(xué)資源,可能性至少有36%。

在組合體2規(guī)則中,外網(wǎng)用戶經(jīng)常訪問的教學(xué)資源是視頻課件的內(nèi)容講解、導(dǎo)學(xué)和考試輔導(dǎo),可能性至少有62%;不論內(nèi)網(wǎng)和外網(wǎng)的用戶經(jīng)常訪問的是教學(xué)資源的教學(xué)輔導(dǎo)這一欄目,可能性至少是63%。

在組合體3規(guī)則中,經(jīng)常訪問的教學(xué)資源是視頻課件的超鏈接媒體資源,該超鏈接可直接打開視頻或下載附件,可能性至少有64%;經(jīng)常訪問教學(xué)資源的是教學(xué)輔導(dǎo)這一欄目中的文本資源,可能性至少有62%。

通過以上挖掘得到的知識,對學(xué)校的遠(yuǎn)程教育教學(xué)資源建設(shè)和指導(dǎo)管課的責(zé)任教師在教學(xué)方式改革和收集、整理教學(xué)資源素材方面有較大的意義,可以較好地發(fā)掘不同類型的學(xué)生對不同類型的教學(xué)資源關(guān)注,更好地指導(dǎo)學(xué)生開展遠(yuǎn)程教育自主學(xué)習(xí)。

六、結(jié)束語

文章介紹了智能信息處理技術(shù)應(yīng)用于遠(yuǎn)程開放教育中的研究現(xiàn)狀,并重點(diǎn)分析數(shù)據(jù)挖掘技術(shù)的方法及在遠(yuǎn)程教育中的應(yīng)用,提出將進(jìn)化神經(jīng)網(wǎng)絡(luò)應(yīng)用于遠(yuǎn)程教育教學(xué)資源整合過程,分析了數(shù)據(jù)挖掘在遠(yuǎn)程教育教學(xué)過程中出現(xiàn)的問題,在對比國內(nèi)外在遠(yuǎn)程教育教學(xué)的各自優(yōu)勢的基礎(chǔ)上,建立了基于數(shù)據(jù)挖掘技術(shù)以遠(yuǎn)程教育教學(xué)資源的質(zhì)和量、資源的高效利用和資源的科學(xué)管理三個(gè)方面為支撐的教學(xué)資源整合理論框架。該理論框架為我國遠(yuǎn)程教育教學(xué)資源整合提供最優(yōu)的決策建議,對我國教育教學(xué)資源整合與共享、促進(jìn)高校信息化建設(shè)有著重要現(xiàn)實(shí)意義。

[參考文獻(xiàn)]

[1]徐林.基于SOA的遠(yuǎn)程教育資源整合系統(tǒng)研究[J].微電子學(xué)與計(jì)算機(jī),2007(6).

[2]穆肅.語義網(wǎng)技術(shù)支持的遠(yuǎn)程教育機(jī)構(gòu)知識管理系統(tǒng)概念建模的研究[D].廣州:華南師范大學(xué),2007.

[3]陳登科,胡翠華.數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教育中的應(yīng)用[J].情報(bào)科學(xué),2003(4).

[4]陳立建. 基于Web數(shù)據(jù)挖掘技術(shù)的遠(yuǎn)程教育系統(tǒng)構(gòu)建[J].中國成人教,2010(6).

[5]董彩云,劉培華.數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教育教學(xué)中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009(2).

[6]Agrawal R,Srikant R. Fast Algorithms for Mining Association Rules. In:Proc of the 20th VLDB Conference Santiago,1994:1-4.

[7]鄭春香,韓承雙.關(guān)聯(lián)規(guī)則研究及在遠(yuǎn)程教育考試系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009(8).

[8]王新穎,張文華.基于關(guān)聯(lián)規(guī)則的聚類挖掘在遠(yuǎn)程教育中的應(yīng)用[J].現(xiàn)代遠(yuǎn)距離教育,2008(4).

[9]Specht D F, Romsdahl H. Experience with adaptive probabilistic neural networks and adaptive general regression neural networks[C]. Proceedings of the IEEE World Congress on Computational Intelligence. USA: Ortando, 1994:1203-1208.

[作者簡介]向俊(1982-),男,湖北恩施人,廣西廣播電視大學(xué)教育技術(shù)中心工程師,研究方向:數(shù)據(jù)挖掘、多媒體技術(shù)。

[責(zé)任編輯 吾 言]

猜你喜歡
遠(yuǎn)程開放教育網(wǎng)絡(luò)教學(xué)資源數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘探討慢性腎衰竭處方規(guī)律
數(shù)據(jù)挖掘綜述
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
基于云平臺的高校網(wǎng)絡(luò)教學(xué)資源建設(shè)方案初探
xMOOC與遠(yuǎn)程開放教育融合模式研究
基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
實(shí)踐與創(chuàng)新
遠(yuǎn)程開放教育的網(wǎng)上課程論壇交互的現(xiàn)狀與對策研究
基層電大遠(yuǎn)程開放教育工商管理專業(yè)案例教學(xué)法淺探
財(cái)經(jīng)類院校網(wǎng)絡(luò)教學(xué)資源平臺建設(shè)與應(yīng)用研究
九江市| 江口县| 甘孜| 平塘县| 鄄城县| 清镇市| 响水县| 郴州市| 吴旗县| 武邑县| 浦东新区| 惠来县| 娄底市| 郴州市| 江孜县| 察雅县| 湘乡市| 东安县| 龙海市| 沾化县| 中阳县| 稻城县| 南京市| 大邑县| 龙海市| 和静县| 苏州市| 确山县| 丹巴县| 安国市| 江源县| 莱西市| 那坡县| 琼结县| 名山县| 商洛市| 铜川市| 平舆县| 朔州市| 玉门市| 大荔县|