林愿
摘要 在大數(shù)據(jù)背景下,海量的網(wǎng)絡(luò)資源的出現(xiàn),使得用戶在挑選學(xué)習(xí)資源時(shí)無(wú)從下手。為了幫助用戶找到自己真正需要的而且是適合自身的學(xué)習(xí)資源,有必要?jiǎng)?chuàng)建有效的學(xué)習(xí)資源在線推送平臺(tái),這是當(dāng)前教育技術(shù)的研究熱點(diǎn)。當(dāng)前,學(xué)習(xí)資源在線推送算法主要有基于內(nèi)容的推送方法和基于協(xié)同過(guò)濾的推送方法,這兩種方法都存在不足之處。本文在綜合了協(xié)同過(guò)濾推送算法和基于內(nèi)容的推送算法的基礎(chǔ)上,結(jié)合學(xué)習(xí)過(guò)程中學(xué)習(xí)者的動(dòng)態(tài)行為數(shù)據(jù),提出一種混合協(xié)同過(guò)濾的、能自適應(yīng)更新的智能化推送服務(wù)模型,將其應(yīng)用到在線學(xué)習(xí)資源系統(tǒng)中,以進(jìn)一步提高學(xué)習(xí)資源推送的預(yù)測(cè)精度和覆蓋率,期望能對(duì)當(dāng)前的數(shù)字化學(xué)習(xí)資源建設(shè)提供借鑒和參考。
關(guān)鍵詞 大數(shù)據(jù) 學(xué)習(xí)資源 智能化 推送
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdkz.2018.02.034
0引言
當(dāng)前已進(jìn)入大數(shù)據(jù)時(shí)代,在線學(xué)習(xí)成為趨勢(shì)。一方面,網(wǎng)絡(luò)上形形色色的學(xué)習(xí)資源信息量很大、更新速度也很快、共享性也很高。另一方面,網(wǎng)絡(luò)上的這些學(xué)習(xí)資源同時(shí)也存在過(guò)于分散、沒有組織性、梳理起來(lái)困難等問題,使得在線學(xué)習(xí)用戶在選擇網(wǎng)絡(luò)上的學(xué)習(xí)資源時(shí),不知從何下手,迫切需要為用戶創(chuàng)建學(xué)習(xí)資源推薦平臺(tái),以幫助用戶快速有效地找到合適的學(xué)習(xí)資源。因此,資源建設(shè)中學(xué)習(xí)資源的智能化推送服務(wù)成為大數(shù)據(jù)時(shí)代實(shí)現(xiàn)智能型在線學(xué)習(xí)的關(guān)鍵。
1學(xué)習(xí)資源智能化推送機(jī)制研究現(xiàn)狀
隨著全球網(wǎng)絡(luò)化的迅速發(fā)展,以及智能手機(jī)的普及,全球網(wǎng)絡(luò)數(shù)據(jù)量出現(xiàn)爆炸式增長(zhǎng),即所謂的“大數(shù)據(jù)”,簡(jiǎn)單地說(shuō)就是“巨量的資料”,“大數(shù)據(jù)”帶來(lái)的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn),必須要有新的處理模式、處理方法和處理能力才有可能與之適應(yīng)。所謂學(xué)習(xí)資源,通俗的來(lái)講,就是各種支持學(xué)習(xí)的資源,可以包括教學(xué)材料、相對(duì)應(yīng)的支持系統(tǒng)、相對(duì)應(yīng)的學(xué)習(xí)環(huán)境,甚至還包括能幫助個(gè)人有效學(xué)習(xí)和操作的任何因素。在人工智能與數(shù)據(jù)庫(kù)技術(shù)相結(jié)合的基礎(chǔ)上應(yīng)用人工智能、機(jī)器學(xué)習(xí)方法,可以識(shí)別和預(yù)測(cè)各種用戶的興趣或偏好,做到有針對(duì)性地、及時(shí)地、主動(dòng)地推送用戶所需的信息,以滿足針對(duì)各種用戶的個(gè)性化需求。
目前國(guó)內(nèi)外較流行的學(xué)習(xí)資源推送服務(wù)模型主要有兩種:基于內(nèi)容的推送服務(wù)模型和基于協(xié)同過(guò)濾的推送服務(wù)模型。
具體來(lái)說(shuō),基于內(nèi)容的推送服務(wù)模型,以高校課程的推送算法為例,首先是收集用戶所學(xué)的專業(yè)、所從事的職業(yè)甚至是用戶的個(gè)人意愿等方面的個(gè)人信息,建立起與個(gè)人信息相對(duì)應(yīng)的特征模型。在完成這一步之后,再提取出所要選擇的課程的關(guān)鍵詞等特征信息,來(lái)確定這門課程所對(duì)應(yīng)的學(xué)習(xí)目的。最后,系統(tǒng)從用戶的歷史訪問數(shù)據(jù)合并當(dāng)前的操作日志,抽取出特征向量,通過(guò)運(yùn)算建立起初始推送模型,最后將當(dāng)前的訪問序列與初始向量間的相似程度進(jìn)行閾值比較,當(dāng)兩者相當(dāng)時(shí),說(shuō)明該用戶匹配到了與其興趣相似的課程,就可以進(jìn)行相關(guān)在線學(xué)習(xí)課程的推送了。這種推送服務(wù)模型完全依賴于在線學(xué)習(xí)課程的關(guān)鍵詞、課程簡(jiǎn)介等,因而存在以下問題:首先因?yàn)榫W(wǎng)絡(luò)課程的特征有限,其模型過(guò)度依賴于用戶瀏覽過(guò)的在線學(xué)習(xí)課程,所以很難提取到真正有效的特征項(xiàng),系統(tǒng)很難得到最符合的用戶喜好課程信息,造成推送資源局限。
基于協(xié)同過(guò)濾的推送算法則與基于內(nèi)容的推送服務(wù)模型從原理到過(guò)程都不同,它主要是應(yīng)用人的興趣不是孤立的這一特點(diǎn),首先根據(jù)用戶間的共同興趣而不是根據(jù)課程內(nèi)容來(lái)推送。根據(jù)用戶對(duì)該課程推薦項(xiàng)的評(píng)分值而不是課程內(nèi)容提出特征值進(jìn)行數(shù)據(jù)處理,通過(guò)計(jì)算當(dāng)前用戶與其它用戶的相似度來(lái)預(yù)測(cè)并推薦用戶集。這種推送算法存在以下三個(gè)方面的問題:由于該算法是依賴于用戶的興趣評(píng)估數(shù)據(jù),會(huì)在課程評(píng)價(jià)方面存在稀疏問題;特別是一門新的課程首次在線出現(xiàn)時(shí),還沒有任何用戶的評(píng)價(jià),協(xié)同過(guò)濾沒有辦法對(duì)它進(jìn)行預(yù)測(cè)和評(píng)價(jià),因而不可能準(zhǔn)確地推送;如果用戶不了解課程的內(nèi)容,可能被推薦到已學(xué)過(guò)的內(nèi)容,影響推送的效果。
本文在綜合了協(xié)同過(guò)濾推送算法和基于內(nèi)容的推送算法的基礎(chǔ)上,結(jié)合學(xué)習(xí)過(guò)程中學(xué)習(xí)者的動(dòng)態(tài)行為數(shù)據(jù),提出一種混合協(xié)同過(guò)濾的、并且能自適應(yīng)更新的智能化推送服務(wù)模型,將其應(yīng)用到在線學(xué)習(xí)資源系統(tǒng)中,以進(jìn)一步提高學(xué)習(xí)資源推送的預(yù)測(cè)精度和覆蓋率。
2采取的方案
針對(duì)大數(shù)據(jù)背景下海量網(wǎng)絡(luò)學(xué)習(xí)資源需要組織、管理,以方便用戶選擇真正適合自己的資源,目前主要有基于內(nèi)容的推送算法和基于協(xié)同過(guò)濾的推送算法?;趦?nèi)容的推送算法依據(jù)的是課程關(guān)鍵詞、課程簡(jiǎn)介等提取課程特征值,與學(xué)習(xí)主體完全脫離,存在推送不準(zhǔn)確的問題?;趨f(xié)同過(guò)濾的推送算法則完全不從內(nèi)容提取特征值,僅僅根據(jù)用戶對(duì)課程推薦項(xiàng)的評(píng)分值進(jìn)行處理,也存在一些問題。如果能有機(jī)地將兩種推送算法結(jié)合起來(lái),并把學(xué)習(xí)者在學(xué)習(xí)過(guò)程中產(chǎn)生的動(dòng)態(tài)行為數(shù)據(jù)考慮進(jìn)來(lái),從而構(gòu)成一種能自適應(yīng)更新的混合協(xié)同過(guò)濾的智能化推送服務(wù)模型,提高學(xué)習(xí)資源推送服務(wù)的預(yù)測(cè)精度和覆蓋率。
本文依據(jù)社會(huì)需求,以教育信息化理論為理論依據(jù),對(duì)大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)機(jī)制進(jìn)行研究和改進(jìn),課題研究主要采用文獻(xiàn)研究,實(shí)踐研究等方法,從理論研究入手,首先利用數(shù)據(jù)挖掘、語(yǔ)義分析等技術(shù)進(jìn)行基于內(nèi)容的推送算法的研究;然后根據(jù)用戶對(duì)課程推薦項(xiàng)的評(píng)分值的高低,提取特征值進(jìn)行數(shù)據(jù)處理,并計(jì)算當(dāng)前用戶與其它用戶的相似度,產(chǎn)生預(yù)測(cè)與推薦用戶集,進(jìn)行基于協(xié)同過(guò)濾推送算法的研究。再將兩者與學(xué)習(xí)過(guò)程中學(xué)習(xí)者的動(dòng)態(tài)行為數(shù)據(jù)有機(jī)結(jié)合,構(gòu)成一種能自適應(yīng)更新的混合協(xié)同過(guò)濾的智能化推送服務(wù)模型,以提高資源推送的預(yù)測(cè)精度和覆蓋率。具體方案實(shí)施首先采用探索性實(shí)驗(yàn),之后進(jìn)行改進(jìn)實(shí)驗(yàn);在本校的網(wǎng)絡(luò)教學(xué)平臺(tái)上進(jìn)行新模型的實(shí)證研究,首先選擇“集成電路設(shè)計(jì)”這門課程試點(diǎn),摸索經(jīng)驗(yàn),修訂模型,再在整個(gè)網(wǎng)絡(luò)教學(xué)平臺(tái)上推廣運(yùn)行,并進(jìn)一步總結(jié)經(jīng)驗(yàn)完善推送服務(wù)模型,通過(guò)多次的師生實(shí)踐不斷總結(jié)和分析改正大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)模型的不足和缺陷。
(1)組織課題組成員廣泛鉆研國(guó)內(nèi)外與本課題有關(guān)的文獻(xiàn)資料,研究其新動(dòng)向、新成果、新理論,準(zhǔn)備開題論證,修改課題數(shù)據(jù),擬立課題研究實(shí)施計(jì)劃。
(2)在本校將提出的混合協(xié)同過(guò)濾算法應(yīng)用于教學(xué)資料庫(kù)、網(wǎng)絡(luò)教學(xué)平臺(tái)等,按照課題研究實(shí)施計(jì)劃,在學(xué)生及任課老師等多個(gè)方面進(jìn)行試驗(yàn)和探索。
(3)在繼續(xù)前面試驗(yàn)的同時(shí),及時(shí)掌握反饋信息,做好總結(jié)、提高工作。
(4)組織課題組成員會(huì)議,進(jìn)一步修改完善智能化推薦算
80
2018年/第5期/2月r中J法,通過(guò)反復(fù)的實(shí)踐不斷完善算法。
3研究?jī)?nèi)容
(1)大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)的社會(huì)需求調(diào)查研究。
(2)大數(shù)據(jù)環(huán)境下基于混合協(xié)同過(guò)濾的學(xué)習(xí)資源推送服務(wù)的研究。
(3)隨學(xué)習(xí)者的動(dòng)態(tài)行為數(shù)據(jù)自適應(yīng)更新的學(xué)習(xí)資源推送服務(wù)的研究。
(4)大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)模型構(gòu)建的研究。
(5)在本校網(wǎng)絡(luò)教學(xué)平臺(tái)上進(jìn)行學(xué)習(xí)資源資源智能化推送服務(wù)模型的實(shí)證研究,首先選擇“集成電路設(shè)計(jì)”這門課程試點(diǎn),摸索經(jīng)驗(yàn),修訂模型,再在整個(gè)網(wǎng)絡(luò)教學(xué)網(wǎng)絡(luò)平臺(tái)上推廣運(yùn)行,進(jìn)一步總結(jié)經(jīng)驗(yàn),完善推送服務(wù)模型。
4結(jié)束語(yǔ)
本論文通過(guò)調(diào)查大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)的社會(huì)需求,將目前存在的兩種主要的推送算法結(jié)合起來(lái),揚(yáng)長(zhǎng)避短,并且與學(xué)習(xí)過(guò)程中學(xué)習(xí)者的動(dòng)態(tài)行為數(shù)據(jù)有機(jī)結(jié)合,使其自適應(yīng)更新,構(gòu)成一種新的混合協(xié)同過(guò)濾的智能化推送服務(wù)模型,預(yù)計(jì)能顯著提高學(xué)習(xí)資源推送服務(wù)的預(yù)測(cè)精度和覆蓋率,能對(duì)當(dāng)前的數(shù)字化學(xué)習(xí)資源建設(shè)提供借鑒和參考,從而促進(jìn)智能型在線學(xué)習(xí)的發(fā)展,完善教育信息化理論和產(chǎn)生一定的社會(huì)效益。