摘 要 本文在學(xué)習(xí)用戶興趣模型的基礎(chǔ)上,利用遺傳算法在學(xué)習(xí)資源模型中推薦比較適合學(xué)習(xí)用戶的個(gè)性化學(xué)習(xí)資源,是基于遺傳算法的個(gè)性化學(xué)習(xí)資源的生成。在線學(xué)習(xí)系統(tǒng)和移動(dòng)互聯(lián)網(wǎng)學(xué)習(xí)APP應(yīng)運(yùn)而生的“互聯(lián)網(wǎng)+”時(shí)代中,對(duì)個(gè)性化在線學(xué)習(xí)系統(tǒng)進(jìn)行了基于開源軟件Sakai平臺(tái)開發(fā)的解決方案探究,給出了該系統(tǒng)的初步結(jié)構(gòu)設(shè)計(jì)。
關(guān)鍵詞 Sakai平臺(tái) 個(gè)性化在線學(xué)習(xí)系統(tǒng)設(shè)計(jì) 個(gè)性化學(xué)習(xí)資源生成
中圖分類號(hào):G642文獻(xiàn)標(biāo)識(shí)碼:A
0引言
Sakai是由美國印地安那大學(xué)、密西根大學(xué)、斯坦福大學(xué)和麻省理工學(xué)院于2004年共同發(fā)起的一項(xiàng)開源CMS(課程管理系統(tǒng))計(jì)劃。目前Sakai的用戶主要是一些大學(xué)的遠(yuǎn)程教育機(jī)構(gòu),中小學(xué)應(yīng)用的還幾乎沒有。全球范圍內(nèi)超過160個(gè)教育機(jī)構(gòu)在使用Sakai平臺(tái),在我國的高校中,華東師范大學(xué)、華中師范大學(xué)、北京郵電大學(xué)、西南大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)密西根學(xué)院在Sakai基礎(chǔ)上開發(fā)滿足不同需求的產(chǎn)品并投入使用。與Blackboard、Moodle等課程管理系統(tǒng)相比,Sakai采用先進(jìn)的技術(shù)架構(gòu)(JaveEE)、企業(yè)級(jí)的應(yīng)用能力(支持Orcale數(shù)據(jù)庫)、更加注重學(xué)生之間的協(xié)作學(xué)習(xí)和小組學(xué)習(xí)以及免費(fèi)開源、更加適合教學(xué)和科研,Sakai在我國的網(wǎng)絡(luò)教學(xué)將會(huì)越來越受到青睞。
1 Sakai運(yùn)行環(huán)境
Sakai的協(xié)作和學(xué)習(xí)環(huán)境是一個(gè)免費(fèi)、共享源代碼的教育軟件平臺(tái),它提供一組軟件工具來幫助需要開發(fā)一個(gè)共同用于協(xié)作或?qū)W習(xí)環(huán)境的研究院校、商業(yè)組織和自主群體創(chuàng)建一個(gè)用于協(xié)作的網(wǎng)站。Sakai是基于Java的系統(tǒng)平臺(tái),利用Sakai進(jìn)行二次開發(fā),其運(yùn)行環(huán)境如表1。
2分析設(shè)計(jì)
2.1基于Sakai開發(fā)的個(gè)性化在線學(xué)習(xí)系統(tǒng)整體架構(gòu)
(1)Sakai與圖書館資源的集合,實(shí)現(xiàn)Sakai課程管理系統(tǒng)與圖書館資源的有效整合。
(2)Sakai與教務(wù)系統(tǒng)集成,把教務(wù)系統(tǒng)的選課關(guān)系映射到Sakai中的選課。
(3)Sakai與在線錄播系統(tǒng)的整合。
(4)數(shù)字校園門戶集成,統(tǒng)一身份認(rèn)證。
(5)課程管理系統(tǒng)。
(6)學(xué)習(xí)活動(dòng)管理系統(tǒng)。
(7)與自行開發(fā)的個(gè)性化在線學(xué)習(xí)系統(tǒng)集成。
(8)校際合作。
Sakai提供了一些核心工具,包括有課程大綱(Syllabus)、課程通知(Announcements)、日程表(Schedule)、資源(Resources)、術(shù)語表(Glossary)等,利用Sakai平臺(tái)進(jìn)行二次開發(fā),其功能設(shè)計(jì)主要包括:
(1)教學(xué)信息發(fā)布:包括發(fā)布教學(xué)通知、課表等, 所有內(nèi)容均以題目列表的形式給出,用戶可點(diǎn)擊相應(yīng)標(biāo)題查看具體內(nèi)容。
(2)教學(xué)資源共享:包括課件、視頻、參考書目的上傳、下載。
(3)教學(xué)討論區(qū):提供一個(gè)公共的課程討論空間,所有人可以對(duì)當(dāng)前所關(guān)心的問題進(jìn)行自由發(fā)言,每個(gè)人均可看到其他人的發(fā)言。
(4)Wiki( 創(chuàng)新功能):設(shè)置問題解答區(qū)或書籍編輯區(qū);所有與課程相關(guān)的人都可以將自己的問題發(fā)布在此處,并且可以對(duì)此區(qū)域中的所有問題進(jìn)行解答或修改、補(bǔ)充已有的解答, 以達(dá)到認(rèn)知協(xié)作、共同提高學(xué)習(xí)水平的目的。
(5)Sakai平臺(tái)里還有一個(gè)工具叫做練習(xí)與測(cè)驗(yàn),在此工具下面有一個(gè)題庫工具,教師可以建立一門課的題庫。
(6)資源推薦:利用前面所研究的開發(fā)具備個(gè)性化資源推薦的功能模塊,整合到Sakai平臺(tái)。
(7)交互功能設(shè)計(jì):內(nèi)容交互與社會(huì)性交互。內(nèi)容交互主要是指學(xué)習(xí)者與課程內(nèi)容之間的交互。社會(huì)性交互使得學(xué)習(xí)者可以向教師或同伴學(xué)習(xí),在一定程度上消除網(wǎng)絡(luò)課程環(huán)境下學(xué)習(xí)者個(gè)體的孤獨(dú)感。
2.2學(xué)習(xí)資源建模
個(gè)性化的在線學(xué)習(xí)系統(tǒng)模型,主要包括學(xué)習(xí)用戶興趣建模模塊和學(xué)習(xí)資源建模模塊。以下主要介紹學(xué)習(xí)資源模塊。
2.2.1學(xué)習(xí)資源的組織結(jié)構(gòu)模式
傳統(tǒng)的學(xué)習(xí)資源組織的結(jié)構(gòu)模式是按樹狀結(jié)構(gòu)和課程的章節(jié)去劃分的,每個(gè)學(xué)生的學(xué)習(xí)路徑?jīng)]有什么區(qū)別,如圖4,學(xué)習(xí)者要學(xué)習(xí)一門學(xué)科的時(shí)候,從樹結(jié)構(gòu)的左邊到右邊遍歷各個(gè)子節(jié)點(diǎn)。
這種結(jié)構(gòu)雖然不會(huì)讓學(xué)習(xí)者遺漏章節(jié)知識(shí)點(diǎn)的學(xué)習(xí),但是對(duì)于學(xué)習(xí)過程中的難點(diǎn)和重點(diǎn)是沒有很大的幫助的,考慮本文個(gè)性化學(xué)習(xí)資源的在線推薦問題,這里考慮另一種結(jié)構(gòu)模式,這種模式是基于知識(shí)點(diǎn)和概念之間的關(guān)聯(lián)度,如圖5,例如學(xué)習(xí)者要學(xué)習(xí)Dn這個(gè)知識(shí)點(diǎn),那么就要具備C1這個(gè)知識(shí)點(diǎn)的相關(guān)知識(shí),而具備C1的相關(guān)知識(shí)基礎(chǔ)則是要具備A1到An的基礎(chǔ)知識(shí),否則,就會(huì)產(chǎn)生重新學(xué)習(xí)這些知識(shí)點(diǎn)的個(gè)性化學(xué)習(xí)序列。
2.2.2學(xué)習(xí)資源難度系數(shù)確定
給學(xué)習(xí)者推薦的資源,要考慮到資源的難易程度有沒有和學(xué)習(xí)者的水平相適應(yīng),因此學(xué)習(xí)資源模型的因素要把學(xué)習(xí)資源的難度系數(shù)考慮在內(nèi)。computerized adaptive testing(CAT)理論有一種基于統(tǒng)計(jì)的方法,根據(jù)此方法,學(xué)習(xí)資源的難度參數(shù)通過細(xì)致的測(cè)試過程來決定。
學(xué)習(xí)資源模型里包括有測(cè)試項(xiàng)目數(shù)據(jù)庫和資源數(shù)據(jù)庫,測(cè)試項(xiàng)目數(shù)據(jù)庫里包括有前測(cè)項(xiàng)目和學(xué)習(xí)資源測(cè)試項(xiàng)目以及后測(cè)項(xiàng)目,前測(cè)項(xiàng)目是用來提供給學(xué)習(xí)者在使用該資源前衡量學(xué)習(xí)者的水平,后測(cè)項(xiàng)目是給予學(xué)習(xí)者鞏固學(xué)習(xí)以及衡量學(xué)習(xí)者在使用該資源以后的效果。測(cè)試項(xiàng)目是由多位經(jīng)驗(yàn)豐富的專家組根據(jù)相應(yīng)的學(xué)習(xí)概念進(jìn)行設(shè)計(jì)。學(xué)習(xí)資源的測(cè)試項(xiàng)目里,每個(gè)測(cè)試項(xiàng)目與學(xué)習(xí)資源相對(duì)應(yīng)。
學(xué)習(xí)者在進(jìn)行前測(cè)項(xiàng)目后,測(cè)試項(xiàng)目里面的錯(cuò)誤集合成相應(yīng)的學(xué)習(xí)概念,通過數(shù)據(jù)采樣來測(cè)試包含這些學(xué)習(xí)概念的測(cè)試項(xiàng)目,根據(jù)IRT,測(cè)試數(shù)據(jù)會(huì)有統(tǒng)計(jì)的編程BILOG進(jìn)行分析,以確定測(cè)試項(xiàng)目的相應(yīng)難度系數(shù),此難度系數(shù)也就是測(cè)試項(xiàng)目相對(duì)應(yīng)的學(xué)習(xí)資源的難度系數(shù),本文中難度系數(shù)用Di表示。
2.2.3學(xué)習(xí)資源模型表示
資源數(shù)據(jù)庫的資源遵循元數(shù)據(jù)模式的標(biāo)準(zhǔn),元數(shù)據(jù)建模的過程就是用ECS逐個(gè)掃描,句子分離成詞,過濾掉數(shù)字符號(hào)等非文本詞和一個(gè)字術(shù)語,表示該資源特征詞語的元數(shù)據(jù)記錄在XML文件,相應(yīng)的XML文件與相應(yīng)的資源進(jìn)行綁定。用TF-IDF統(tǒng)計(jì)方法,計(jì)算該資源元數(shù)據(jù)里的特征詞在該資源的權(quán)重。
TF:Term Frequency,關(guān)鍵詞頻,特征詞語在該資源出現(xiàn)的頻率,例如在一個(gè)M個(gè)詞的學(xué)習(xí)資源里含有N個(gè)特征詞,則
TF=N/M
IDF:Inverse Document Frequency,逆向文本頻率,以此來衡量特征詞權(quán)重權(quán)重的指數(shù)。D為資源總數(shù),DW為特征詞出現(xiàn)過的資源數(shù)。
IDF=log(D/DW)
特征詞k在資源i的權(quán)重Wik通過TF-IDF獲得。
Wik=TF*IDF
采用向量空間模型來代表每一個(gè)學(xué)習(xí)資源模型。
Xi={(Ti1,Wi1)},{(Ti2,Wi2)},…,{(Tik,Wik)}
其中,Xi表示第i個(gè)學(xué)習(xí)資源,Tik為第i個(gè)學(xué)習(xí)資源里的第k個(gè)特征詞,Wik為該特征詞在該學(xué)習(xí)資源里的重要程度。
2.3個(gè)性化在線學(xué)習(xí)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
整個(gè)模型分為Online部分和Offline部分。模型結(jié)構(gòu)圖如圖6。
Offline管理:數(shù)據(jù)準(zhǔn)備將Web服務(wù)器用戶信息的log文件以及用戶訪問操作路徑信息等生成的相應(yīng)文件,進(jìn)行個(gè)性化特征提取,獲取學(xué)習(xí)者興趣模型,并借鑒其他用戶的信息選擇經(jīng)驗(yàn),利用遺傳算法進(jìn)行用戶模型的動(dòng)態(tài)更新。
Online管理:通過課程資源庫初始化種群,進(jìn)行遺傳算法操作,進(jìn)化后的種群與學(xué)習(xí)者興趣模型中的個(gè)體進(jìn)行適應(yīng)度值計(jì)算,即利用向量夾角余弦距離公式計(jì)算個(gè)體間的相似度,按適應(yīng)度值大小排序,適應(yīng)度值大的前N個(gè)個(gè)體構(gòu)成課程資源推薦模塊,給學(xué)習(xí)者動(dòng)態(tài)推薦相應(yīng)的學(xué)習(xí)內(nèi)容。
其中,資源推薦模塊的資源序列生成過程如圖7。
3基于遺傳算法的個(gè)性化在線學(xué)習(xí)資源生成的遺傳算子
學(xué)習(xí)用戶模型和學(xué)習(xí)資源模型的匹配機(jī)制,實(shí)現(xiàn)個(gè)性化推薦。推薦系統(tǒng)推薦給學(xué)習(xí)者的資源,不能與學(xué)習(xí)者剛剛看過的課程資源不太相類似,或者完全不相關(guān),也不能與學(xué)習(xí)者看過的資源完全重復(fù),這就是模型過擬合問題或者是可擴(kuò)展性問題。數(shù)據(jù)的不完全性是此問題的原因,主要方法是使用遺傳算法引入的隨機(jī)性,因此,該算法收斂到全局最優(yōu)解或全局最優(yōu),從而向?qū)W習(xí)者提供一個(gè)令人滿意的學(xué)習(xí)內(nèi)容。
3.1個(gè)體串定義
學(xué)習(xí)資源庫里的項(xiàng)目和資源用1到n定義序號(hào),序號(hào)的整數(shù)代碼用以代表一個(gè)個(gè)性化串,也就是一個(gè)遺傳算法的潛在解。一個(gè)序號(hào)代表一個(gè)染色體的一個(gè)基因。染色體表示如圖8。
3.2適應(yīng)度函數(shù)
為了給學(xué)習(xí)用戶生成一個(gè)高質(zhì)量的學(xué)習(xí)資源序列,適應(yīng)度函數(shù)作為一個(gè)性能評(píng)判指標(biāo),因此適應(yīng)度函數(shù)要包括用戶興趣模型里的個(gè)性化特征項(xiàng)和資源的擬合程度,同時(shí)還要考慮資源的難度系數(shù)Di。
用戶興趣模型:
學(xué)習(xí)資源模型:
根據(jù)前面章節(jié)的用戶興趣模型和學(xué)習(xí)資源模型的表示,用戶興趣模型和學(xué)習(xí)資源模型擬合程度表達(dá)式:
由此,適應(yīng)度函數(shù)的表達(dá)式:
3.3交叉操作
如果一個(gè)學(xué)習(xí)資源推薦序列里含有重復(fù)的資源序號(hào)或者是資源序號(hào)超過了資源的總數(shù),則這個(gè)序列為非法路徑,為了避免非法路徑的產(chǎn)生,采用兩個(gè)父節(jié)點(diǎn)生成子節(jié)點(diǎn)的交叉操作方式。交叉幾率設(shè)置為0.9(如圖9)。
3.4變異操作
此處的變異操作和用戶興趣模型進(jìn)化的變異操作是同樣的。在染色體上, 根據(jù)u* W+v* G (W 為特征項(xiàng)權(quán)重,G 表示基因效能, u和v 表示調(diào)節(jié)的參數(shù)) 形成的比例信息,通過輪盤賭的方式隨機(jī)獲取某個(gè)基因后, 刪除該基因, 由此獲得一個(gè)新的原始后代。通過一定的變異率Pm,變異算子在染色體上選擇基因,把該基因的特征改變,種群的差異性得到了保持,適當(dāng)?shù)靥岣吡薌A的搜索效率。
每迭代一次得到一個(gè)最優(yōu)個(gè)體,把進(jìn)化代數(shù)范圍內(nèi)的所有最優(yōu)個(gè)體進(jìn)行排序,將評(píng)價(jià)函數(shù)值排在前十位的所對(duì)應(yīng)的學(xué)習(xí)資源作為一組結(jié)果指定為遺傳算法的最終結(jié)果,作為推薦。
4本章小結(jié)
本文是基于遺傳算法的個(gè)性化學(xué)習(xí)資源的生成。在學(xué)習(xí)用戶興趣模型的基礎(chǔ)上,利用遺傳算法在學(xué)習(xí)資源模型中尋找比較適合學(xué)習(xí)用戶的個(gè)性化學(xué)習(xí)資源,給出了該系統(tǒng)的初步結(jié)構(gòu)設(shè)計(jì),并給出了基于開源軟件Sakai平臺(tái)開發(fā)的個(gè)性化在線學(xué)習(xí)系統(tǒng)解決方案。
作者簡介:傅偉司(1987—),女,廣東羅定人,碩士,研究方向?yàn)橄到y(tǒng)理論信息系統(tǒng)工程。
參考文獻(xiàn)
[1] Gershon.Computer Adaptive Testing[J].Journal of Applied Measurement,2005,6(01):72-77.
[2] 呂琳,韓永國.多Agent的個(gè)性化學(xué)習(xí)路徑推薦系統(tǒng)設(shè)計(jì)[J].電腦知識(shí)與技術(shù),2013,9(26):5981-5984.
[3] Bohl,O.The sharable content object reference model (SCORM) - a critical review[J].ompter in Education,2002(02):67-75.