宋 莉 曹良林
(九江學(xué)院信息技術(shù)與科技學(xué)院 江西九江 332005)
網(wǎng)絡(luò)教學(xué)是伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的發(fā)展,產(chǎn)生的一種新興的教學(xué)手段。它是一種不同空間模式下的教學(xué)行為,是指在教師和學(xué)習(xí)者、學(xué)習(xí)者和教育機(jī)構(gòu)之間采用多種多媒體手段進(jìn)行系統(tǒng)化教學(xué)和網(wǎng)絡(luò)通信互動(dòng)的教育形式。和傳統(tǒng)的教育模式相比,遠(yuǎn)程教育的特征更為顯著:在整個(gè)學(xué)習(xí)期間,師生可以在不同地域?qū)嵤┙虒W(xué),學(xué)習(xí)者通過(guò)教育機(jī)構(gòu)或組織提供的學(xué)習(xí)材料和支持服務(wù)兩方面進(jìn)行學(xué)習(xí);教育機(jī)構(gòu)或組織則可利用各種技術(shù)媒體聯(lián)系師生并承載課程內(nèi)容;提供雙向通信交流。
個(gè)性化學(xué)習(xí)理論指出,學(xué)習(xí)過(guò)程既是學(xué)習(xí)者個(gè)性的展現(xiàn)過(guò)程,更是追求自我和滿足自我的過(guò)程。在個(gè)性化學(xué)習(xí)中強(qiáng)調(diào)[1],學(xué)習(xí)過(guò)程應(yīng)是針對(duì)學(xué)習(xí)者個(gè)人興趣愛(ài)好和發(fā)展?jié)撃芏C合采取恰當(dāng)?shù)姆椒?、?nèi)容、手段、進(jìn)程、起點(diǎn)、評(píng)價(jià)方式等,讓學(xué)生各方面獲得充分自由發(fā)展空間的過(guò)程,從而達(dá)到因材施教的最終目的。因此,個(gè)性化的現(xiàn)代遠(yuǎn)程教育可以針對(duì)學(xué)習(xí)者的學(xué)習(xí)基礎(chǔ)、興趣、學(xué)習(xí)能力等差異,為每個(gè)學(xué)習(xí)者制定適合他們的教學(xué)內(nèi)容、教學(xué)策略。個(gè)性化的現(xiàn)代遠(yuǎn)程教育能夠?yàn)閷W(xué)習(xí)者提供多方面的個(gè)性化服務(wù):可根據(jù)不同學(xué)習(xí)者的不同學(xué)習(xí)層次為其推薦難度適合的學(xué)習(xí)內(nèi)容;也可根據(jù)學(xué)習(xí)者的測(cè)試成績(jī)給出適合的學(xué)習(xí)建議,同時(shí)為學(xué)習(xí)者提供沒(méi)有掌握好的知識(shí)點(diǎn)的相關(guān)學(xué)習(xí)資源作參考;施教者可以根據(jù)各學(xué)習(xí)者的個(gè)性、興趣、學(xué)習(xí)行為及反饋,及時(shí)調(diào)整對(duì)應(yīng)的教學(xué)策略,定制出合適的教學(xué)內(nèi)容和活動(dòng)等。因此,個(gè)性化網(wǎng)絡(luò)教學(xué)平臺(tái)為每個(gè)學(xué)習(xí)者提供了適合其學(xué)習(xí)的資源,并根據(jù)其學(xué)習(xí)行為自動(dòng)地調(diào)整學(xué)習(xí)資源以迎合學(xué)習(xí)者的興趣,使學(xué)習(xí)者感到其擁有整個(gè)教學(xué)系統(tǒng)的所有資源,充分發(fā)揮其學(xué)習(xí)潛能。
網(wǎng)絡(luò)教學(xué)的特點(diǎn)是利用網(wǎng)絡(luò),可以進(jìn)行在線視頻教學(xué)、在線輔導(dǎo)、在線實(shí)驗(yàn)、在線測(cè)試,提供豐富的教學(xué)資源及相關(guān)材料的下載,同時(shí)為所有用戶提供了交流互動(dòng)的平臺(tái)。Web數(shù)據(jù)挖掘指從Web文檔和訪問(wèn)數(shù)據(jù)中尋找有用的規(guī)律知識(shí)。因此,將Web挖掘應(yīng)用在網(wǎng)絡(luò)教學(xué)中,可以從海量的Web訪問(wèn)數(shù)據(jù)日志中發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)信息,根據(jù)學(xué)習(xí)者的訪問(wèn)規(guī)律調(diào)整對(duì)應(yīng)的教學(xué)策略,即時(shí)為學(xué)習(xí)者制定個(gè)性化的學(xué)習(xí)內(nèi)容;發(fā)現(xiàn)學(xué)習(xí)者的相關(guān)學(xué)習(xí)興趣,并據(jù)此給學(xué)習(xí)者提供相關(guān)的學(xué)習(xí)內(nèi)容和學(xué)習(xí)建議,根據(jù)在線測(cè)試成績(jī)指出學(xué)習(xí)者所有知識(shí)點(diǎn)的掌握情況并給出學(xué)習(xí)建議,同時(shí)系統(tǒng)也將學(xué)習(xí)者相關(guān)信息反饋給施教者,使施教者能及時(shí)調(diào)整教學(xué)重點(diǎn)、教學(xué)內(nèi)容和教學(xué)方法,以更適合學(xué)習(xí)者自身學(xué)習(xí)需求。數(shù)據(jù)挖掘的應(yīng)用為現(xiàn)代遠(yuǎn)程教育系統(tǒng)的個(gè)性化、智能化提供了非常重要的技術(shù)手段[2,3]。
個(gè)性化導(dǎo)航模型如圖1所示,由2個(gè)基礎(chǔ)數(shù)據(jù)庫(kù)和3個(gè)模塊構(gòu)成。
圖1 個(gè)性化導(dǎo)航模型示意圖
其主要功能是對(duì)用戶的初始記錄進(jìn)行預(yù)處理,處理后的數(shù)據(jù)才可被用來(lái)數(shù)據(jù)挖掘研究。源數(shù)據(jù)通常呈半結(jié)構(gòu)化或非結(jié)構(gòu)化特征,不能被直接使用,必須經(jīng)過(guò)數(shù)據(jù)的清洗、用戶的識(shí)別、會(huì)話的識(shí)別、路徑的修補(bǔ)、事務(wù)集的識(shí)別、路徑的完善等步驟[4]。
其主要功能是對(duì)用戶數(shù)據(jù)庫(kù)進(jìn)行挖掘研究。研究主要從兩方面進(jìn)行:一方面是對(duì)所有用戶的訪問(wèn)記錄進(jìn)行挖掘研究,得到共同的學(xué)習(xí)模式;另一方面是對(duì)學(xué)習(xí)者測(cè)試結(jié)果進(jìn)行挖掘研究,得到個(gè)性化模式。
其主要具備兩個(gè)方面的功能:①根據(jù)用戶基本信息記錄數(shù)據(jù)庫(kù)完成個(gè)性化定制;②是通過(guò)對(duì)用戶數(shù)據(jù)庫(kù)的知識(shí)挖掘,得到的模式應(yīng)用在個(gè)性化推薦,從而自動(dòng)為用戶提供學(xué)習(xí)內(nèi)容。
其存儲(chǔ)了用戶基本信息,學(xué)習(xí)信息等。
其儲(chǔ)存了所有的教學(xué)資源,為個(gè)性化推薦模塊準(zhǔn)備了龐大而豐富的教學(xué)資源。
向?qū)W習(xí)者推薦學(xué)習(xí)頁(yè)面,首先得了解其學(xué)習(xí)能力,為更好的實(shí)現(xiàn)個(gè)性化服務(wù),應(yīng)對(duì)學(xué)習(xí)者按照不同類別進(jìn)行分類,主要是根據(jù)每次對(duì)學(xué)習(xí)者的測(cè)試情況分類。在進(jìn)行數(shù)據(jù)挖掘研究的同時(shí),也需要對(duì)所有的數(shù)據(jù)進(jìn)行分類,使得推薦的學(xué)習(xí)內(nèi)容與學(xué)習(xí)者相匹配,從而達(dá)到個(gè)性化教學(xué)的最佳效果。
用戶使用遠(yuǎn)程教學(xué)系統(tǒng)進(jìn)行學(xué)習(xí)的時(shí)候,他所訪問(wèn)的所有頁(yè)面之間一定存在著某種關(guān)聯(lián),而這是由頁(yè)面存儲(chǔ)的知識(shí)點(diǎn)之間的邏輯關(guān)系決定的,如某用戶在瀏覽某知識(shí)點(diǎn)時(shí),該用戶很可能需要訪問(wèn)該頁(yè)面涉及到的其它知識(shí)點(diǎn)頁(yè)面[5]。頁(yè)面間的關(guān)聯(lián)可以通過(guò)兩方面來(lái)建立:一方面根據(jù)大多數(shù)用戶的訪問(wèn)記錄自動(dòng)調(diào)整;另一方面根據(jù)施教者的教學(xué)經(jīng)驗(yàn)和知識(shí)點(diǎn)間的聯(lián)系事先制定[5]。
在用戶訪問(wèn)關(guān)聯(lián)規(guī)則中出現(xiàn)的“事務(wù)集”是指?jìng)€(gè)性化教學(xué)系統(tǒng)中存儲(chǔ)的知識(shí)點(diǎn)頁(yè)面集合,而采用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的頻繁事務(wù)集是頻繁被訪問(wèn)過(guò)的知識(shí)點(diǎn)頁(yè)面集合,頻繁訪問(wèn)事務(wù)集所形成的有序訪問(wèn)路徑稱之為頻繁訪問(wèn)路徑[5]。運(yùn)用關(guān)聯(lián)規(guī)則對(duì)這些事務(wù)集與頻繁事務(wù)集進(jìn)行挖掘,得到的模式能為用戶推薦相對(duì)匹配的教學(xué)資源。
個(gè)性化推薦的過(guò)程就是將該用戶會(huì)話片段與己產(chǎn)生的頻繁事務(wù)集進(jìn)行匹配的過(guò)程,該過(guò)程會(huì)產(chǎn)生滿足一定支持度和置信度的關(guān)聯(lián)規(guī)則,而所有這些關(guān)聯(lián)規(guī)則的后所生成的頁(yè)面集合就是推薦用戶訪問(wèn)頁(yè)面集合。
本文采用一種特殊的數(shù)據(jù)結(jié)構(gòu)-頻繁項(xiàng)集圖,可存儲(chǔ)相應(yīng)的頻繁項(xiàng)集。該圖設(shè)計(jì)為有向圖,分為k個(gè)層次,每個(gè)節(jié)點(diǎn)表示一個(gè)頻繁項(xiàng)集,零層代表空集,即根節(jié)點(diǎn);將頻繁1項(xiàng)集存儲(chǔ)第一層,頻繁j項(xiàng)集組成第一層節(jié)點(diǎn),依次類推。
Web訪問(wèn)事務(wù)子集如表1 ,事務(wù)編號(hào)用Tid代表,t. p分別代表該事務(wù)的具體內(nèi)容。表1中的事務(wù)集可構(gòu)造如下表2的頻繁項(xiàng)集。
表1 Web訪問(wèn)事務(wù)子集
表2 頻繁項(xiàng)集
表2中的頻繁項(xiàng)集可構(gòu)造頻繁項(xiàng)集圖,如圖2所示。這種數(shù)據(jù)結(jié)構(gòu)的優(yōu)勢(shì)在于算法在產(chǎn)生推薦頁(yè)面的過(guò)程中產(chǎn)生部分關(guān)聯(lián)規(guī)則,從而可提高推薦的效率。
圖2 頻繁項(xiàng)集圖
在這里引用以往經(jīng)典算法,一般而言,用戶瀏覽個(gè)性化系統(tǒng)的操作可分為兩種形式:一種是根據(jù)知識(shí)點(diǎn)自身之間的關(guān)聯(lián)進(jìn)行頁(yè)面相鏈接;另一種是通過(guò)訪問(wèn)過(guò)的頁(yè)面日志記錄進(jìn)行回退操作。本文將要對(duì)絕大多數(shù)用戶第一種方式操作行為進(jìn)行信息處理關(guān)聯(lián)。從用戶訪問(wèn)第一個(gè)知識(shí)點(diǎn)頁(yè)面開(kāi)始依次記錄,直到用戶進(jìn)行訪問(wèn)以訪問(wèn)過(guò)的頁(yè)面操作為止,所記錄下來(lái)的有序頁(yè)面集合稱為最大向前路徑。假設(shè)存在用戶訪問(wèn)事務(wù)集合P={ P1, P2,…,Pn}。Y表示用戶訪問(wèn)最大向前引用事務(wù)集合, D表示用戶訪問(wèn)事務(wù)存儲(chǔ)數(shù)據(jù)庫(kù)[4]。
則用戶訪問(wèn)最大向前引用事務(wù)算法如下所述:
輸入:學(xué)生會(huì)話事務(wù){(diào)P}
①初始化Yi ,令Y1= P1,則D1 = (P1 )。
②循環(huán)讀入P,使序列Yi 增加,即D=(P1,P2, …,Pj-1) 。查看Yi?, 若Yi Di,則繼續(xù)執(zhí)行本步驟。
③如果 Y j ∈ Ti,則已經(jīng)找到最大路徑,保存Di,將P后退一個(gè),直到找到下一個(gè)前向路徑
輸出: 最大向前事務(wù)的數(shù)據(jù)庫(kù)D
假設(shè)某用戶的訪問(wèn)事務(wù)集合為{A,B ,C ,D ,C E,G ,H ,B ,W ,A ,0 ,U ,0 ,V }, 運(yùn)用該算法將用戶訪問(wèn)事務(wù)集合進(jìn)行分割,可得到的最大向前事務(wù)集合為{ABCD, ABCEGH, ABW, AOU,AOV}[5]。
因每個(gè)用戶的接受能力都不一樣,學(xué)習(xí)效果也不一樣,對(duì)數(shù)據(jù)來(lái)源應(yīng)當(dāng)進(jìn)行分類,根據(jù)用戶的在線學(xué)習(xí)時(shí)間和學(xué)習(xí)成績(jī)進(jìn)行分類,生成不同類別頻繁模式。
學(xué)生頻繁訪問(wèn)路徑的模式發(fā)現(xiàn)可以分解為3個(gè)子問(wèn)題:①根據(jù)用戶學(xué)習(xí)效果和平均學(xué)習(xí)時(shí)間對(duì)數(shù)據(jù)源進(jìn)行分類。②求出所有滿足最小支持度的頻繁路徑。③找出滿足最小置信度的頻繁路徑。
該算法核心就是第2個(gè)子問(wèn)題,其基本思想是:分多個(gè)步驟和層次來(lái)處理事務(wù)集數(shù)據(jù)庫(kù)。首先找出用戶訪問(wèn)事務(wù)集合中滿足最小支持度的頁(yè)面項(xiàng)目集合,即最大項(xiàng)目集;接著循環(huán)處理直到再?zèng)]有新的最大頁(yè)面項(xiàng)目集生成,最后在第k次循環(huán)中,找出滿足最小支持度的k維最大項(xiàng)目集[5]。求滿足最小支持度的所有頻繁路徑的算法如下所示:
符號(hào)說(shuō)明:
K-itemset:k維頁(yè)面項(xiàng)目集
L[k ]:滿足最小支持度的最大K-itemset,該集合中任一對(duì)象有兩項(xiàng)屬性(itemset和support)[5]
C[ k]:備選的K-itemset,該集合中任一對(duì)象有兩項(xiàng)屬性(itemset和support)
INPUT:用戶訪問(wèn)事務(wù)集數(shù)據(jù)庫(kù)D
OUTPUT:最大向前事務(wù)的數(shù)據(jù)庫(kù)D
{輸入數(shù)據(jù)庫(kù)D
計(jì)算各頁(yè)面的支持度,生成頻繁1項(xiàng)集;
生成含k個(gè)頁(yè)面的侯選頁(yè)面集;
調(diào)用can_gen函數(shù)
統(tǒng)計(jì)c的支持度;
輸出:長(zhǎng)度為k的高頻頁(yè)面集L
}
算法描述如下:
①統(tǒng)計(jì)各頁(yè)面的支持度,生成頻繁1項(xiàng)集。
②生成含k個(gè)頁(yè)面的侯選頁(yè)面集,其中所有頻繁項(xiàng)集必須滿足最小支持度,不滿足條件的將直接被過(guò)濾掉,不會(huì)對(duì)其進(jìn)行多余的計(jì)算。達(dá)到提高運(yùn)算效率目的。
算法說(shuō)明:
can_gen函數(shù)中,最大項(xiàng)目集的子集一定為最大項(xiàng)目集,從而減少候選中子集的數(shù)目,提高運(yùn)算效率,避免重復(fù)計(jì)算。
用改進(jìn)的算法對(duì)用戶訪問(wèn)事務(wù)集{A,B ,C ,D ,C E,G ,H ,B ,W ,A ,0 ,U ,0 ,V }進(jìn)行運(yùn)算,得到用戶訪問(wèn)最大事務(wù)集合為{ABCD, ABCEGH, ABW, AOU,AOV}[5]。結(jié)果一致,但是需要計(jì)算的次數(shù)大大減少了。
本文針對(duì)現(xiàn)有遠(yuǎn)程教學(xué)系統(tǒng)存在的教學(xué)模式單一、個(gè)性化欠缺等問(wèn)題,在系統(tǒng)中引入個(gè)性化導(dǎo)航。個(gè)性化導(dǎo)航主要通過(guò)數(shù)據(jù)預(yù)處理技術(shù)和數(shù)據(jù)挖掘技術(shù)的研究[5],實(shí)現(xiàn)智能化導(dǎo)航。本文引用了改進(jìn)的關(guān)聯(lián)規(guī)則算法,生成最大事務(wù)集,為其他用戶推薦學(xué)習(xí)頁(yè)面提供科學(xué)的依據(jù)。對(duì)學(xué)習(xí)者進(jìn)行因材施教,為學(xué)習(xí)者提供個(gè)性化教學(xué),推薦學(xué)習(xí)內(nèi)容。
參考文獻(xiàn):
[1]李廣,姜英杰.個(gè)性化學(xué)習(xí)的理論建構(gòu)與特征分析[J].東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)),2005,55(3):152.
[2]張震.基于Web的智能網(wǎng)絡(luò)教學(xué)框架模型的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代教育技術(shù), 2004, 14(3):64.
[3]何典,宋中山.基于Web 挖掘的個(gè)性化網(wǎng)絡(luò)教育研究[J].計(jì)算機(jī)與現(xiàn)代化, 2005,21(5):100.
[4]蘇林萍.基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)模式研究[D].北京:華北電力大學(xué),2003.16.
[5]于倩.基于Web挖掘的個(gè)性化學(xué)習(xí)學(xué)院[D].北京:中國(guó)石油大學(xué),2006.6.
九江學(xué)院學(xué)報(bào)(自然科學(xué)版)2013年4期