牟智佳 李雨婷 商俊超
摘 ? 要:在線學(xué)習(xí)環(huán)境下,探索符合學(xué)習(xí)習(xí)慣和偏好的學(xué)習(xí)活動(dòng)路徑能夠降低學(xué)習(xí)者學(xué)習(xí)盲目性、提升學(xué)習(xí)者的課程體驗(yàn)。研究以教育大數(shù)據(jù)為背景,以MOOC為研究案例,以個(gè)性化學(xué)習(xí)路徑為研究?jī)?nèi)容,通過(guò)對(duì)學(xué)習(xí)結(jié)果分類(lèi)理論、教育目標(biāo)分類(lèi)法以及三維目標(biāo)分類(lèi)理論的分析、對(duì)比、歸納、借鑒,對(duì)MOOC平臺(tái)學(xué)習(xí)者行為數(shù)據(jù)進(jìn)行了維度劃分,并從態(tài)度和認(rèn)知兩方面入手構(gòu)建了包含學(xué)習(xí)興趣、知識(shí)水平、綜合能力三個(gè)維度的學(xué)習(xí)者學(xué)習(xí)畫(huà)像特征模型。在此基礎(chǔ)上,通過(guò)交叉使用Apriori All算法和貝葉斯網(wǎng)絡(luò)對(duì)平臺(tái)行為數(shù)據(jù)進(jìn)行差異處理,使其轉(zhuǎn)化為具有信息價(jià)值的具體數(shù)值,設(shè)計(jì)出了學(xué)習(xí)畫(huà)像與個(gè)性化學(xué)習(xí)路徑擬合系統(tǒng)。在此基礎(chǔ)上,運(yùn)用蟻群算法實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑的生成與推薦,為學(xué)習(xí)者提供精準(zhǔn)的學(xué)習(xí)路徑指導(dǎo),降低學(xué)生迷航率。研究結(jié)果表明:基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑推薦具有精準(zhǔn)性;學(xué)習(xí)畫(huà)像可以實(shí)現(xiàn)MOOC環(huán)境下平臺(tái)數(shù)據(jù)和學(xué)習(xí)者之間的耦合;交叉使用多種算法實(shí)現(xiàn)不同維度數(shù)據(jù)的差異性處理,使數(shù)據(jù)分析、處理、應(yīng)用具有合理性,是實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑生成推薦的良好基礎(chǔ)。
關(guān)鍵詞:大數(shù)據(jù);MOOC;學(xué)習(xí)畫(huà)像;個(gè)性化學(xué)習(xí);學(xué)習(xí)路徑
中圖分類(lèi)號(hào):G434 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2019)11-0055-06
近年來(lái),大規(guī)模開(kāi)放在線課程因其免費(fèi)性、開(kāi)放性和學(xué)習(xí)資源的高質(zhì)量性吸引了大量學(xué)習(xí)者的注冊(cè)使用。然而,平臺(tái)在給予學(xué)習(xí)者較高自由度的同時(shí)也降低了對(duì)學(xué)習(xí)者的學(xué)習(xí)引導(dǎo),從而導(dǎo)致學(xué)習(xí)者沒(méi)有合理的學(xué)習(xí)路徑指導(dǎo),對(duì)學(xué)習(xí)資源進(jìn)行盲目的學(xué)習(xí)與瀏覽,課程體系缺乏邏輯性,學(xué)習(xí)失敗風(fēng)險(xiǎn)提高。學(xué)習(xí)者在課程進(jìn)行中逐漸凸現(xiàn)出來(lái)的盲目性學(xué)習(xí)、學(xué)習(xí)質(zhì)量下降、參與積極性降低等問(wèn)題引起了廣大師生和研究者的反思。因此,如何將基于學(xué)習(xí)者的基本信息和在線學(xué)習(xí)數(shù)據(jù)進(jìn)行耦合,刻畫(huà)學(xué)習(xí)者學(xué)習(xí)畫(huà)像,并以此為基礎(chǔ)歸納總結(jié)出個(gè)性化學(xué)習(xí)路徑,提高對(duì)學(xué)習(xí)者的精準(zhǔn)指導(dǎo)是當(dāng)前MOOC環(huán)境下降低學(xué)習(xí)者盲目性、提高學(xué)習(xí)效率亟待解決的現(xiàn)實(shí)問(wèn)題。
教育大數(shù)據(jù)背景下,本研究旨在將MOOC案例中的學(xué)習(xí)者行為數(shù)據(jù)與學(xué)習(xí)者特征進(jìn)行耦合,構(gòu)建學(xué)習(xí)者學(xué)習(xí)畫(huà)像特征模型,并在此基礎(chǔ)上交叉使用多種算法完成學(xué)習(xí)畫(huà)像與個(gè)性化學(xué)習(xí)路徑擬合系統(tǒng),實(shí)現(xiàn)學(xué)習(xí)路徑的生成及推薦,以期為學(xué)習(xí)者的學(xué)習(xí)過(guò)程提供更精準(zhǔn)的路徑導(dǎo)航服務(wù),助力更多的學(xué)習(xí)者順利并高質(zhì)量地完成課程目標(biāo)。
經(jīng)文獻(xiàn)梳理發(fā)現(xiàn),已有很多專(zhuān)家學(xué)者對(duì)學(xué)習(xí)路徑進(jìn)行了一系列概念界定,其中較具有代表性的是:姜強(qiáng)等學(xué)者認(rèn)為個(gè)性化學(xué)習(xí)路徑是基于以學(xué)習(xí)者為中心的教學(xué)設(shè)計(jì)思想,通過(guò)對(duì)學(xué)習(xí)者的個(gè)性化學(xué)習(xí)特征分析,將教學(xué)過(guò)程模塊進(jìn)行重組,形成更適合該學(xué)習(xí)者的學(xué)習(xí)活動(dòng)序列,并進(jìn)行學(xué)習(xí)過(guò)程的評(píng)價(jià)和指導(dǎo),協(xié)助學(xué)習(xí)者進(jìn)行知識(shí)的構(gòu)建;[1]彭紹東則表示學(xué)習(xí)路徑是學(xué)習(xí)者在一定的學(xué)習(xí)策略指導(dǎo)下根據(jù)學(xué)習(xí)的目標(biāo)、內(nèi)容、基礎(chǔ)與環(huán)境條件,對(duì)所需完成的系列學(xué)習(xí)活動(dòng)進(jìn)行排序,是學(xué)習(xí)步驟的呈現(xiàn)或指引。[2][3]盡管對(duì)個(gè)性化學(xué)習(xí)路徑的內(nèi)涵界定存在差異,但從不同定義中可以看出,學(xué)習(xí)路徑存在以下共同特征:提供明晰的學(xué)習(xí)路線,進(jìn)行學(xué)習(xí)流程結(jié)構(gòu)化處理、個(gè)性化推薦?;诖?,我們根據(jù)學(xué)習(xí)者的學(xué)習(xí)特征及平臺(tái)學(xué)習(xí)行為數(shù)據(jù)為其制定學(xué)習(xí)畫(huà)像,在此基礎(chǔ)上推送個(gè)性化學(xué)習(xí)路徑,優(yōu)化學(xué)習(xí)路徑指導(dǎo)信息,并在學(xué)習(xí)過(guò)程中根據(jù)學(xué)習(xí)者的學(xué)習(xí)活動(dòng)數(shù)據(jù)分析結(jié)果進(jìn)行個(gè)性化學(xué)習(xí)路徑的動(dòng)態(tài)調(diào)整,以期幫助學(xué)習(xí)者完成學(xué)習(xí)目標(biāo)。
目前,國(guó)內(nèi)外已有許多關(guān)于個(gè)性化學(xué)習(xí)路徑的研究,在理論基礎(chǔ)方面,奧地利格拉茨大學(xué)的Nussbaume創(chuàng)建了適應(yīng)性學(xué)習(xí)路徑,以知識(shí)空間理論和布魯姆目標(biāo)分類(lèi)法為指導(dǎo),根據(jù)學(xué)習(xí)者的知識(shí)水平評(píng)價(jià)選擇學(xué)習(xí)路徑;[4]加拿大國(guó)家研究委員會(huì)Guillaume Durand則在圖式理論的基礎(chǔ)上根據(jù)學(xué)習(xí)風(fēng)格、學(xué)習(xí)興趣、知識(shí)水平和學(xué)習(xí)目標(biāo)等特性,采用教育數(shù)據(jù)挖掘技術(shù)分析學(xué)習(xí)者特征,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑推送。[5]在算法支撐方面較多的是遺傳算法、模糊神經(jīng)網(wǎng)絡(luò)方法、文化基因算法、粒子群算法、蟻群算法等。其中具有代表性的是:李浩君等人采用遺傳算法,對(duì)移動(dòng)學(xué)習(xí)環(huán)境中個(gè)性化路徑優(yōu)化進(jìn)行了研究;[6]檀曉紅提出了基于遺傳算法的個(gè)性化課程進(jìn)化算法(PCE-GA),實(shí)現(xiàn)整個(gè)學(xué)習(xí)過(guò)程中課程的動(dòng)態(tài)更新過(guò)程。[7]
前人已做了許多關(guān)于個(gè)性化學(xué)習(xí)路徑或者個(gè)性化學(xué)習(xí)者模型的研究。美國(guó)匹茲堡大學(xué)Peter Brusilovsky列出了學(xué)習(xí)者行為模式評(píng)價(jià)指標(biāo),將其分為知識(shí)水平、動(dòng)機(jī)、態(tài)度、興趣偏好等,利用模糊神經(jīng)網(wǎng)絡(luò)算法整合并重新架構(gòu)學(xué)習(xí)過(guò)程模塊使之不斷逼近評(píng)價(jià)體系數(shù)據(jù),進(jìn)而實(shí)現(xiàn)了基于有意義的學(xué)習(xí)理論的模糊神經(jīng)網(wǎng)絡(luò)方法制定學(xué)習(xí)路徑。[8]姜強(qiáng)等學(xué)者基于Apriori All算法,對(duì)擁有相同或相近學(xué)習(xí)偏好、知識(shí)水平的學(xué)習(xí)者進(jìn)行分類(lèi),根據(jù)一類(lèi)學(xué)習(xí)者的學(xué)習(xí)行為軌跡搭建學(xué)習(xí)路徑模型,通過(guò)學(xué)習(xí)者特征與學(xué)習(xí)對(duì)象媒體類(lèi)型、理解等級(jí)、難度級(jí)別的匹配計(jì)算優(yōu)化調(diào)整模型,最終能夠生成精準(zhǔn)個(gè)性化學(xué)習(xí)路徑,可為差異化教學(xué)提供新思路。[9]
目前,國(guó)內(nèi)外研究者從不同視角對(duì)學(xué)習(xí)路徑進(jìn)行了探索,并且開(kāi)始關(guān)注學(xué)習(xí)路徑的個(gè)性化和全面性,實(shí)現(xiàn)算法及理論支撐呈現(xiàn)多樣化趨勢(shì),但已有研究主要集中在學(xué)習(xí)路徑的制定、路徑挖掘模型構(gòu)建以及技術(shù)實(shí)現(xiàn)部分,側(cè)重于通過(guò)相應(yīng)算法構(gòu)建學(xué)習(xí)路徑模型及學(xué)習(xí)路徑推薦系統(tǒng)的技術(shù)實(shí)現(xiàn),但對(duì)MOOC環(huán)境下數(shù)據(jù)采集的粒度、數(shù)據(jù)源的整體分析歸納等方面依然存在數(shù)據(jù)源維度劃分模糊、平臺(tái)數(shù)據(jù)和學(xué)習(xí)者之間的耦合關(guān)系欠缺等問(wèn)題。這是由于現(xiàn)有研究中的數(shù)據(jù)源多為平臺(tái)上的行為數(shù)據(jù),在數(shù)據(jù)整體分析及維度劃分、數(shù)據(jù)與學(xué)習(xí)者之間的耦合等方面相對(duì)薄弱。針對(duì)上述問(wèn)題,本研究將在數(shù)據(jù)整合及維度劃分、數(shù)據(jù)與學(xué)習(xí)者進(jìn)行耦合形成學(xué)習(xí)畫(huà)像、基于學(xué)習(xí)畫(huà)像實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑的設(shè)計(jì)等方面進(jìn)行突破,形成一套個(gè)性化學(xué)習(xí)路徑的推薦系統(tǒng)。
(1)數(shù)據(jù)源的準(zhǔn)備分析
數(shù)據(jù)源主要有靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)兩種。靜態(tài)數(shù)據(jù)即隨著時(shí)間的推移相對(duì)穩(wěn)定的數(shù)據(jù),主要為用戶的基本信息。該類(lèi)數(shù)據(jù)的主要來(lái)源為:①學(xué)習(xí)者基本屬性數(shù)據(jù),包括學(xué)習(xí)者的性別、年齡、年級(jí)等;②學(xué)習(xí)者學(xué)習(xí)風(fēng)格數(shù)據(jù)。由于學(xué)習(xí)者的學(xué)習(xí)風(fēng)格本身具有穩(wěn)定性,本研究將學(xué)習(xí)者的學(xué)習(xí)風(fēng)格數(shù)據(jù)歸類(lèi)到靜態(tài)數(shù)據(jù)的范疇中。
動(dòng)態(tài)數(shù)據(jù)是指在系統(tǒng)應(yīng)用中隨著時(shí)間變化而改變的數(shù)據(jù),通常能直接反映事物的進(jìn)程,包括用戶的學(xué)習(xí)行為、瀏覽行為、訪問(wèn)網(wǎng)站、點(diǎn)擊操作等,主要分為以下兩類(lèi):①學(xué)習(xí)者網(wǎng)絡(luò)行為數(shù)據(jù),即學(xué)習(xí)者在網(wǎng)絡(luò)環(huán)境中集中活躍時(shí)間段學(xué)習(xí)者頻繁使用的社交軟件,學(xué)習(xí)者在網(wǎng)絡(luò)環(huán)境中在線或離線學(xué)習(xí)的表現(xiàn)、連續(xù)持續(xù)學(xué)習(xí)時(shí)長(zhǎng)等,學(xué)習(xí)者搜索高頻詞、學(xué)習(xí)者瀏覽路徑、學(xué)習(xí)深度、學(xué)習(xí)完成度、學(xué)習(xí)者熱門(mén)收藏網(wǎng)站、評(píng)論內(nèi)容、互動(dòng)內(nèi)容等;②系統(tǒng)反饋數(shù)據(jù),即MOOC系統(tǒng)或任課教師單獨(dú)提供給學(xué)習(xí)者關(guān)于學(xué)習(xí)情況的信息數(shù)據(jù)。
(2)學(xué)習(xí)者基礎(chǔ)屬性的歸類(lèi)劃分
我們以學(xué)習(xí)模式偏好和學(xué)習(xí)內(nèi)容偏好兩個(gè)維度對(duì)學(xué)習(xí)者學(xué)習(xí)風(fēng)格作交叉分類(lèi),并最終把學(xué)習(xí)者學(xué)習(xí)風(fēng)格確立為傳遞接受式、自主探究式和合作學(xué)習(xí)式三類(lèi)。傳遞接受式的學(xué)習(xí)者缺乏自主學(xué)習(xí)能力、學(xué)習(xí)方法和網(wǎng)絡(luò)學(xué)習(xí)知識(shí),學(xué)習(xí)較為被動(dòng),學(xué)習(xí)時(shí)間不規(guī)律且容易中斷,需要MOOC平臺(tái)教師進(jìn)行監(jiān)督引導(dǎo),知識(shí)由教師直接傳遞給學(xué)習(xí)者,學(xué)習(xí)者在規(guī)定的時(shí)間內(nèi)完成學(xué)習(xí)任務(wù)并將知識(shí)內(nèi)化。自主探究式和合作學(xué)習(xí)式的學(xué)習(xí)者都有較強(qiáng)的自主學(xué)習(xí)能力,學(xué)習(xí)意愿強(qiáng),認(rèn)知結(jié)構(gòu)水平較高,但自主探究式的學(xué)習(xí)者更傾向于在規(guī)定時(shí)間內(nèi)獨(dú)立完成知識(shí)學(xué)習(xí)和內(nèi)化,而合作學(xué)習(xí)式學(xué)習(xí)者合作能力較強(qiáng),目標(biāo)性較差,存在較高的學(xué)習(xí)路徑指導(dǎo)需求,這類(lèi)學(xué)習(xí)者更傾向于通過(guò)明確責(zé)任分工的合作交流完成知識(shí)學(xué)習(xí)和內(nèi)化。通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)風(fēng)格分類(lèi)明確學(xué)習(xí)者認(rèn)知方式差異性后,我們進(jìn)一步把學(xué)習(xí)模式分為場(chǎng)依存型和場(chǎng)獨(dú)立型。場(chǎng)依存型學(xué)習(xí)者易受外界環(huán)境因素影響,在做出判斷時(shí)往往參照他人,需要教師為他們提供明確的學(xué)習(xí)目標(biāo)和更多的監(jiān)督。場(chǎng)獨(dú)立型學(xué)習(xí)者自主學(xué)習(xí)能力強(qiáng),在學(xué)習(xí)過(guò)程中能夠獨(dú)立對(duì)事物做出判斷,但是他們的學(xué)習(xí)過(guò)程帶有強(qiáng)烈的主觀意愿,教師需要給予這類(lèi)學(xué)習(xí)者積極的引導(dǎo),以免偏離教學(xué)主線。
個(gè)性化的學(xué)習(xí)內(nèi)容是個(gè)性化學(xué)習(xí)路徑支持的學(xué)習(xí)系統(tǒng)中,學(xué)習(xí)者自定義的學(xué)習(xí)內(nèi)容和系統(tǒng)根據(jù)學(xué)習(xí)畫(huà)像組織的不同層次的學(xué)習(xí)內(nèi)容的總和。學(xué)習(xí)內(nèi)容的選擇依據(jù)學(xué)習(xí)者畫(huà)像中的學(xué)習(xí)特征畫(huà)像,需要考慮知識(shí)結(jié)構(gòu)、媒體形式和評(píng)價(jià)反饋三方面因素。知識(shí)結(jié)構(gòu)即學(xué)習(xí)者對(duì)知識(shí)點(diǎn)的掌握程度和認(rèn)知水平。媒體形式又分為視覺(jué)型、聽(tīng)覺(jué)型和動(dòng)覺(jué)型,視覺(jué)型學(xué)習(xí)風(fēng)格的學(xué)習(xí)者更傾向于圖片、圖表、視頻的演示,喜歡在閱讀和觀察中學(xué)習(xí);聽(tīng)覺(jué)型學(xué)習(xí)者對(duì)聲音信息更為敏感,能在教師口頭語(yǔ)言教授和同學(xué)討論的過(guò)程中更好地學(xué)習(xí);動(dòng)覺(jué)型學(xué)習(xí)者喜歡通過(guò)身體的動(dòng)作來(lái)幫助學(xué)習(xí),如在課本上畫(huà)線、做筆記,或者自己親自動(dòng)手實(shí)驗(yàn),通過(guò)肢體的運(yùn)動(dòng)來(lái)強(qiáng)化記憶。評(píng)價(jià)反饋包含在學(xué)習(xí)過(guò)程中MOOC系統(tǒng)不斷產(chǎn)生的形成性評(píng)價(jià)和最終測(cè)驗(yàn)中根據(jù)等級(jí)評(píng)定個(gè)性化學(xué)習(xí)路徑工具判定的學(xué)習(xí)者所處學(xué)習(xí)階段決定的評(píng)價(jià)內(nèi)容。
(3)學(xué)習(xí)畫(huà)像框架搭建
在前期學(xué)習(xí)者基礎(chǔ)屬性判定與數(shù)據(jù)收集處理的基礎(chǔ)上,我們進(jìn)一步分析了加涅的學(xué)習(xí)結(jié)果分類(lèi)理論、布魯姆的教育目標(biāo)分類(lèi)法以及適應(yīng)我國(guó)教育實(shí)際的三維目標(biāo)分類(lèi)理論,以上理論經(jīng)過(guò)橫向相似性對(duì)比、縱向維度劃分歸納,結(jié)合理論與數(shù)據(jù)做出如下學(xué)習(xí)者畫(huà)像評(píng)價(jià)指標(biāo),其中參與度、興趣度、專(zhuān)注性、學(xué)習(xí)深度、抽象能力、協(xié)作能力、基礎(chǔ)知識(shí)、目標(biāo)達(dá)成度等8個(gè)為分析目標(biāo),知識(shí)水平、學(xué)習(xí)興趣和綜合能力為三個(gè)維度。學(xué)習(xí)者學(xué)習(xí)畫(huà)像特征模型如圖1所示。
本研究在結(jié)合國(guó)內(nèi)外相關(guān)研究的基礎(chǔ)上,以教育大數(shù)據(jù)為背景,以MOOC為研究案例,從學(xué)習(xí)者自身的學(xué)習(xí)模式和知識(shí)結(jié)構(gòu)出發(fā),結(jié)合學(xué)習(xí)者在MOOC平臺(tái)的前期行為數(shù)據(jù),并將其數(shù)據(jù)與我們的評(píng)價(jià)指標(biāo)進(jìn)行耦合,計(jì)算出學(xué)習(xí)者的學(xué)習(xí)畫(huà)像。根據(jù)學(xué)習(xí)者的學(xué)習(xí)畫(huà)像和相應(yīng)的公式及算法,我們將兩者進(jìn)行擬合匹配,以期為學(xué)習(xí)者提供最優(yōu)學(xué)習(xí)路徑。該部分的核心步驟主要分為兩步:首先通過(guò)AprioriALL算法、貝葉斯網(wǎng)絡(luò)分別量化學(xué)習(xí)畫(huà)像中的學(xué)習(xí)興趣、知識(shí)水平和綜合能力,進(jìn)行學(xué)習(xí)質(zhì)量評(píng)估實(shí)現(xiàn)標(biāo)簽數(shù)據(jù)量化,完成學(xué)習(xí)畫(huà)像與學(xué)習(xí)路徑的擬合系統(tǒng);其次就是通過(guò)螞蟻算法實(shí)現(xiàn)學(xué)習(xí)路徑的動(dòng)態(tài)更新、實(shí)時(shí)推薦,實(shí)現(xiàn)基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑的生成及推薦。
(1)學(xué)習(xí)畫(huà)像與個(gè)性化路徑擬合系統(tǒng)
本研究擬采用Apriori All算法,通過(guò)挖掘?qū)W習(xí)者選擇的學(xué)習(xí)資源類(lèi)型及其學(xué)習(xí)頻率,得出學(xué)習(xí)者偏愛(ài)的資源類(lèi)型與學(xué)習(xí)興趣點(diǎn),從而量化學(xué)習(xí)者的學(xué)習(xí)興趣。Apriori All算法是關(guān)聯(lián)規(guī)則中的經(jīng)典算法,[10]主要原理是通過(guò)使用逐層搜索的迭代方法和關(guān)聯(lián)規(guī)則,從大量數(shù)據(jù)中找出數(shù)據(jù)值中頻繁出現(xiàn)的數(shù)據(jù)集合即頻繁項(xiàng)集,[11]常用的頻繁項(xiàng)集的評(píng)估標(biāo)準(zhǔn)有支持度和置信度兩個(gè)。支持度就是幾個(gè)關(guān)聯(lián)的數(shù)據(jù)在數(shù)據(jù)集中出現(xiàn)的次數(shù)占總數(shù)據(jù)集的比重,或者說(shuō)幾個(gè)數(shù)據(jù)關(guān)聯(lián)出現(xiàn)的概率。置信度體現(xiàn)了一個(gè)數(shù)據(jù)出現(xiàn)后,另一個(gè)數(shù)據(jù)出現(xiàn)的概率,或者說(shuō)數(shù)據(jù)的條件概率。[12]因在不同系統(tǒng)中需要設(shè)置不同的參數(shù)值,所以我們將不在這里做過(guò)多贅述。
在本研究中采用Apriori All量化學(xué)習(xí)者的學(xué)習(xí)興趣主要分為五個(gè)步驟。①排序:掃描整個(gè)數(shù)據(jù)集,得到學(xué)習(xí)者學(xué)習(xí)態(tài)度序列,即學(xué)習(xí)者的學(xué)習(xí)興趣序列。在此基礎(chǔ)上對(duì)數(shù)據(jù)庫(kù)進(jìn)行排序整理,將原始數(shù)據(jù)庫(kù)轉(zhuǎn)換成序列數(shù)據(jù)庫(kù)。②大項(xiàng)目集:利用關(guān)聯(lián)規(guī)則挖掘算法,根據(jù)興趣度和專(zhuān)注度的數(shù)據(jù)源,找出所有滿足最小支持度閾值的頻繁項(xiàng)集。③轉(zhuǎn)換:實(shí)際上屬于序列的輔助階段,在序列階段中,需要檢查給定的學(xué)習(xí)興趣大序列是否包含在學(xué)習(xí)者基本屬性信息序列中,為了加速這一過(guò)程,就需要對(duì)復(fù)雜學(xué)習(xí)者屬性信息數(shù)據(jù)進(jìn)行轉(zhuǎn)化。④序列:多次掃描數(shù)據(jù)源,在本研究中可將所有資源類(lèi)型的學(xué)習(xí)興趣進(jìn)行排序,總共有15種類(lèi)型,作為候選頻繁項(xiàng)集,詳情見(jiàn)表1。⑤最大序列:為了減少可能出現(xiàn)的多條冗余學(xué)習(xí)活動(dòng)序列,可通過(guò)多輪掃描、排序、刪減的方法在大序列集中找出極大序列。
通過(guò)對(duì)學(xué)習(xí)分析領(lǐng)域主要的學(xué)習(xí)結(jié)果分類(lèi)、計(jì)算及預(yù)測(cè)的算法進(jìn)行橫縱對(duì)比,我們擬選用貝葉斯網(wǎng)絡(luò)算法,實(shí)現(xiàn)學(xué)習(xí)者知識(shí)水平、綜合技能的量化計(jì)算。目前學(xué)習(xí)結(jié)果分類(lèi)、計(jì)算及預(yù)測(cè)的算法主要有線性回歸、邏輯回歸、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、貝葉斯網(wǎng)絡(luò)等。線性回歸和邏輯回歸存在容錯(cuò)率低、不具有自學(xué)習(xí)能力和預(yù)測(cè)結(jié)果滯后等缺點(diǎn),無(wú)法滿足學(xué)習(xí)路徑的動(dòng)態(tài)計(jì)算與推薦。神經(jīng)網(wǎng)絡(luò)只能得到結(jié)果,沒(méi)有計(jì)算過(guò)程及依據(jù),而且神經(jīng)網(wǎng)絡(luò)對(duì)后臺(tái)計(jì)算設(shè)備要求很高,技術(shù)實(shí)現(xiàn)部分存在困難點(diǎn)。決策樹(shù)算法在分類(lèi)時(shí)不夠穩(wěn)定,當(dāng)擾亂或改動(dòng)其中某些數(shù)據(jù)值時(shí)就會(huì)導(dǎo)致決策樹(shù)重構(gòu)。貝葉斯網(wǎng)絡(luò)能夠用條件概率把各種相關(guān)的信息納入到一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中,具有自學(xué)習(xí)、處理不確定信息和動(dòng)態(tài)適應(yīng)等能力。[13]通過(guò)條件概率變化可以反映出網(wǎng)絡(luò)中不同要素之間的因果關(guān)系和條件相關(guān)關(guān)系,最終對(duì)學(xué)生知識(shí)點(diǎn)掌握程度進(jìn)行合理的計(jì)算、預(yù)測(cè)、量化,因此我們將貝葉斯網(wǎng)絡(luò)作為量化的核心算法。
在本研究中采用貝葉斯網(wǎng)絡(luò)量化計(jì)算學(xué)習(xí)者的知識(shí)水平主要分為四個(gè)步驟:①知識(shí)水平拓?fù)浣Y(jié)構(gòu)分析階段。通過(guò)分析知識(shí)水平掌握情況的數(shù)據(jù)源確定貝葉斯網(wǎng)絡(luò)的節(jié)點(diǎn),通過(guò)專(zhuān)家審定確定貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),最終完成貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。②數(shù)據(jù)預(yù)處理階段。首先對(duì)數(shù)據(jù)進(jìn)行篩選,剔除重復(fù)、無(wú)效、異構(gòu)的原始數(shù)據(jù),然后根據(jù)數(shù)據(jù)離散化標(biāo)準(zhǔn)確定原始數(shù)據(jù)的離散,以此保證系統(tǒng)對(duì)數(shù)據(jù)的可識(shí)別性,最后進(jìn)行不斷調(diào)整完成拓?fù)浣Y(jié)構(gòu)的構(gòu)建。③知識(shí)水平計(jì)算模型建立階段。在貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)基礎(chǔ)上,用離散化后的數(shù)據(jù)進(jìn)行參數(shù)學(xué)習(xí),在此基礎(chǔ)上不斷進(jìn)行迭代優(yōu)化,最終形成知識(shí)水平計(jì)算模型。④數(shù)據(jù)分析及知識(shí)水平計(jì)算結(jié)果呈現(xiàn)階段。學(xué)習(xí)者數(shù)據(jù)填入知識(shí)水平計(jì)算模型后,各節(jié)點(diǎn)概率發(fā)生變化,以此進(jìn)行推理分析學(xué)習(xí)者的知識(shí)水平,并用數(shù)據(jù)的形式可視化顯示學(xué)習(xí)者的知識(shí)水平。
(2)基于學(xué)習(xí)畫(huà)像個(gè)性化學(xué)習(xí)路徑的生成與推薦
算法是實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑推薦的關(guān)鍵,綜合現(xiàn)有研究已經(jīng)實(shí)現(xiàn)的學(xué)習(xí)路徑推薦系統(tǒng),本研究對(duì)常用的四種學(xué)習(xí)路徑推薦算法進(jìn)行比較,包括神經(jīng)網(wǎng)絡(luò)、蟻群優(yōu)化方法[14]、遺傳算法[15]以及粒子群算法[16]。其中,常見(jiàn)的神經(jīng)網(wǎng)絡(luò)包括模糊神經(jīng)網(wǎng)絡(luò)[17]、人工神經(jīng)網(wǎng)絡(luò)[18]兩種。我們從參數(shù)設(shè)置、復(fù)雜程度、求解效率、算法優(yōu)勢(shì)、不足等五個(gè)維度進(jìn)行比較,如表2所示。經(jīng)過(guò)橫縱對(duì)比不難發(fā)現(xiàn)蟻群算法是一種基于種群尋找最短路徑的啟發(fā)式搜索算法,用來(lái)尋找優(yōu)化路徑的概率,具有通用性強(qiáng)、操作簡(jiǎn)便、求解效率較快等優(yōu)點(diǎn)。基于此我們擬采用蟻群算法來(lái)實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑的生成與推薦。
蟻群算法是根據(jù)概率轉(zhuǎn)移公式逐步完成求解過(guò)程的,其中概率由動(dòng)態(tài)更新的信息素和相對(duì)穩(wěn)定啟發(fā)信息決定。在本研究中我們把學(xué)習(xí)者學(xué)習(xí)畫(huà)像中的特征數(shù)據(jù)源作為信息素,態(tài)度和認(rèn)知兩方面作為啟發(fā)信息,通過(guò)蟻群算法中固定的公式和操作過(guò)程,即可完成基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑的生成、動(dòng)態(tài)變化、實(shí)時(shí)分析、個(gè)性化推薦,詳情如圖3所示。實(shí)現(xiàn)過(guò)程中主要步驟為:①根據(jù)學(xué)習(xí)目標(biāo)實(shí)現(xiàn)參數(shù)初始化設(shè)置。本研究中將學(xué)習(xí)者的學(xué)習(xí)畫(huà)像特征數(shù)據(jù)源作為信息素,將學(xué)習(xí)者的態(tài)度和認(rèn)知這兩方面所涉及的學(xué)習(xí)興趣、認(rèn)知水平和綜合能力三個(gè)維度作為啟發(fā)信息,根據(jù)學(xué)習(xí)者前期平臺(tái)數(shù)據(jù),結(jié)合實(shí)際數(shù)值完成信息素和啟發(fā)信息的初始化設(shè)置。②啟發(fā)信息計(jì)算。根據(jù)學(xué)習(xí)者前測(cè)數(shù)據(jù)確定學(xué)習(xí)路徑的開(kāi)端,在此基礎(chǔ)上根據(jù)蟻群節(jié)點(diǎn)概率計(jì)算公式計(jì)算啟發(fā)信息。③路徑下一節(jié)點(diǎn)信息的動(dòng)態(tài)更新計(jì)算。前期Apriori All算法及貝葉斯網(wǎng)絡(luò)處理的數(shù)據(jù)信息成為學(xué)習(xí)畫(huà)像的數(shù)據(jù)源,確保了信息素的實(shí)時(shí)動(dòng)態(tài)更新。④根據(jù)路徑最優(yōu)原理完成降序排列形成學(xué)習(xí)路徑,用數(shù)據(jù)形式展現(xiàn)下一節(jié)點(diǎn)的推薦指數(shù),完成個(gè)性化學(xué)習(xí)路徑推薦。
(1)基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑推薦更具有精準(zhǔn)性
現(xiàn)有研究中,多是先找尋幾條典型的成功路徑,然后進(jìn)行推薦,這種學(xué)習(xí)路徑推薦本身很難實(shí)現(xiàn)個(gè)性化。學(xué)習(xí)路徑直接對(duì)接學(xué)習(xí)者本身,才是實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑推薦的前提。將學(xué)習(xí)者特征與平臺(tái)數(shù)據(jù)進(jìn)行耦合形成學(xué)習(xí)畫(huà)像,在此基礎(chǔ)上形成的個(gè)性化學(xué)習(xí)路徑推薦更具有精準(zhǔn)性。
(2)學(xué)習(xí)畫(huà)像可以實(shí)現(xiàn)教育大數(shù)據(jù)環(huán)境下MOOC平臺(tái)數(shù)據(jù)和學(xué)習(xí)者之間的耦合
當(dāng)前,MOOC平臺(tái)存在輟學(xué)率較高、學(xué)習(xí)者學(xué)習(xí)態(tài)度不積極等問(wèn)題,造成了平臺(tái)的部分行為數(shù)據(jù)并不適合進(jìn)行直接分析應(yīng)用。不結(jié)合學(xué)習(xí)者學(xué)習(xí)特征,單純地分析學(xué)習(xí)者在平臺(tái)上的行為數(shù)據(jù),容易造成路徑偏差甚至路徑錯(cuò)誤等問(wèn)題。針對(duì)上述問(wèn)題,我們認(rèn)為在做研究之前應(yīng)該對(duì)平臺(tái)上的行為數(shù)據(jù)進(jìn)行維度劃分及篩選處理,而學(xué)習(xí)者的學(xué)習(xí)畫(huà)像可以實(shí)現(xiàn)MOOC環(huán)境下平臺(tái)數(shù)據(jù)和學(xué)習(xí)者之間的耦合。
(3)交叉使用多種算法實(shí)現(xiàn)不同維度數(shù)據(jù)的差異性處理使數(shù)據(jù)分析、處理、應(yīng)用具有合理性
目前,國(guó)內(nèi)外研究者從不同視角對(duì)學(xué)習(xí)路徑進(jìn)行了探索,并且開(kāi)始關(guān)注學(xué)習(xí)路徑的個(gè)性化和全面性,這就使數(shù)據(jù)源的分析角度、劃分維度不斷變化、增加?,F(xiàn)有研究中,針對(duì)不同維度的數(shù)據(jù)仍然采用單一算法進(jìn)行計(jì)算,難以實(shí)現(xiàn)不同維度數(shù)據(jù)的差異性處理。在本研究的學(xué)習(xí)畫(huà)像與個(gè)性化路徑擬合系統(tǒng)實(shí)現(xiàn)階段,我們交叉使用了Apriori All算法、貝葉斯網(wǎng)絡(luò)、蟻群算法來(lái)處理不同維度數(shù)據(jù)。
盡管本研究對(duì)基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑進(jìn)行了理論設(shè)計(jì),但在個(gè)性化學(xué)習(xí)路徑實(shí)踐檢驗(yàn)以及參數(shù)設(shè)置細(xì)節(jié)兩個(gè)方面仍然存在不足:①個(gè)性化學(xué)習(xí)路徑的可實(shí)施性仍需進(jìn)一步實(shí)踐檢驗(yàn)。本研究基于學(xué)習(xí)畫(huà)像的個(gè)性化學(xué)習(xí)路徑進(jìn)行了理論構(gòu)想,因現(xiàn)實(shí)因素限制未進(jìn)行技術(shù)實(shí)現(xiàn)以及實(shí)踐檢驗(yàn)。下一步我們將對(duì)該系統(tǒng)進(jìn)行技術(shù)實(shí)現(xiàn)并在MOOC課程中進(jìn)行實(shí)踐檢驗(yàn)及迭代優(yōu)化,形成學(xué)習(xí)指導(dǎo)精準(zhǔn)、導(dǎo)航清晰的個(gè)性化學(xué)習(xí)路徑。②權(quán)重、置信度和支持度等參數(shù)設(shè)置需要進(jìn)一步計(jì)算。在交叉使用多種算法實(shí)現(xiàn)不同維度數(shù)據(jù)的差異性處理時(shí),因沒(méi)有實(shí)際研究支撐所以只是進(jìn)行了簡(jiǎn)單概述并沒(méi)對(duì)各個(gè)參數(shù)進(jìn)行具體的設(shè)置計(jì)算。
個(gè)性化學(xué)習(xí)路徑作為網(wǎng)絡(luò)學(xué)習(xí)導(dǎo)航的重要參考,為學(xué)習(xí)指導(dǎo)提供了科學(xué)依據(jù)。當(dāng)前由于MOOC平臺(tái)高度自由導(dǎo)致的學(xué)生迷航現(xiàn)象,急切需要教師與相關(guān)研究人員將學(xué)習(xí)者的學(xué)習(xí)特征與平臺(tái)行為數(shù)據(jù)進(jìn)行耦合,以設(shè)計(jì)出符合學(xué)習(xí)者個(gè)性化的學(xué)習(xí)路徑。本研究通過(guò)對(duì)學(xué)習(xí)結(jié)果分類(lèi)理論、教育目標(biāo)分類(lèi)法以及三維目標(biāo)分類(lèi)理論的分析、對(duì)比、歸納、借鑒,對(duì)教育大數(shù)據(jù)背景下MOOC平臺(tái)中學(xué)習(xí)者行為數(shù)據(jù)進(jìn)行了維度劃分,并構(gòu)建了學(xué)習(xí)者學(xué)習(xí)畫(huà)像特征模型。在此基礎(chǔ)上通過(guò)交叉使用Apriori All算法和貝葉斯網(wǎng)絡(luò)對(duì)平臺(tái)行為數(shù)據(jù)進(jìn)行差異處理,使其轉(zhuǎn)化為具有信息價(jià)值的具體數(shù)值,設(shè)計(jì)出了學(xué)習(xí)畫(huà)像與個(gè)性化學(xué)習(xí)路徑擬合系統(tǒng)。在此基礎(chǔ)上,運(yùn)用蟻群算法,實(shí)現(xiàn)了個(gè)性化學(xué)習(xí)路徑的生成與推薦,為學(xué)習(xí)者提供了精準(zhǔn)的學(xué)習(xí)路徑指導(dǎo),降低了學(xué)生迷航率,為學(xué)習(xí)者提供了具體參考。
[1]姜強(qiáng),趙蔚,劉紅霞等.能力導(dǎo)向的個(gè)性化學(xué)習(xí)路徑生成及評(píng)測(cè)[J].現(xiàn)代遠(yuǎn)程教育研究,2015(6):104-111.
[2]彭紹東.基于SCORM標(biāo)準(zhǔn)的“學(xué)習(xí)路徑”設(shè)計(jì)[J].現(xiàn)代教育技術(shù),2010(8).
[3]Smet C D, Schellens T, et al.The Design and Implementation of Learning Paths in a Learning Management System[J].Interactive Learning Environments,2016,24(6): 1076-1096.
[4]ALEXANDER N. A methodology for adaptive competence assessment and learning path creation ISAC[C].Proceedings of the International Conference on Interactive Computer-aided Learning(ICL 2010).Diepenbeek:University of Hasselt Press,2010:15-17.
[5]DUAND G.Graph theory based model for learning path recommendation[J].Information sciences,2013(4):10-21.
[6]李浩君,徐佳程,房邵敏等.個(gè)性化移動(dòng)學(xué)習(xí)路徑優(yōu)化策略應(yīng)用研究[J].電化教育研究,2016(1):39-44.
[7]檀曉紅.基于推薦及遺傳算法的個(gè)性化課程生成與進(jìn)化研究[D].上海:上海交通大學(xué),2013.
[8]P BRUSILOVSKY.Investigating automated student modeling in a Java MOOC [C].Proceedings of the 7th International Conference on Educational Data Mining. London:University of London Press,2014:261-264.
[9]姜強(qiáng),趙蔚,李松等.大數(shù)據(jù)背景下的精準(zhǔn)個(gè)性化學(xué)習(xí)路徑挖掘研究——基于AprioriAll的群體行為分析[J].電化教育研究,2018(2):45-52.
[10]戴紅,常子冠,于寧.數(shù)據(jù)挖掘?qū)д揫M].北京:清華大學(xué)出版社,2015.1.
[11]AGRAWAL R, SRIKANT R.Mining sequential pattern[C].Proceedings of the Eleventh International Conference on DataEngineering. Washington D.C:IEEE Computer Society Press,1995:3-14.
[12]吳海燕,朱靖君,高國(guó)柱等.基于改進(jìn)的AprioriAll算法的Web序列模式挖掘研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2010(5).
[13]Dabrowski J J,Beyers C, Villiers J P D.Systemic banking crisis early warning systems using dynamic Bayesian networks[M].Pergamon Press,Inc.2016.
[14]EUGENIJUS K. Recommending suitable learning paths according to learners' preferences: experimental research results[J].Computers in human behavior,2015(51): 945-951.
[15]李浩君,崔晨萍,徐佳程等.基于遺傳算法的移動(dòng)學(xué)習(xí)路徑生成機(jī)制研究——以博物館參觀學(xué)習(xí)為例[J].現(xiàn)代教育技術(shù),2015,25(8):100-106.
[16]楊超.基于粒子群優(yōu)化算法的學(xué)習(xí)資源推薦方法[J].計(jì)算機(jī)應(yīng)用,2014, 34(5):1350-1353.
[17]BRUSILOVSKY P.Investigating automated student modeling in a Java MOOC [C].Proceedings of the 7th International Conference onEducational Data Mining. London:University of London Press,2014:261-264.
[18]IDRIS N. Adaptive course sequencing for personalization of learning path using neural network [J].International journal of advancesin soft computing and its applications,2009,1(1):49-61.
(編輯:王天鵬)