范月祺
(山西職業(yè)技術(shù)學(xué)院,山西 太原 030006)
隨著移動(dòng)網(wǎng)絡(luò)技術(shù)的發(fā)展與在線教育理念的普及,國內(nèi)各高校近年來都開展了在線課程資源庫建設(shè)工作,隨著課程建設(shè)項(xiàng)目的推進(jìn),大量的在線學(xué)習(xí)資源被部署在云平臺(tái)上。這些學(xué)習(xí)資源類型繁多、內(nèi)容全面,基本實(shí)現(xiàn)了對(duì)高校當(dāng)前開設(shè)的所有學(xué)科專業(yè)的全覆蓋,為學(xué)生的在線自主學(xué)習(xí)提供了豐富的教學(xué)資源[1]。但隨之而來的問題就是現(xiàn)階段大部分在線課程資源庫中的課程僅僅完成了堆砌式部署,并未根據(jù)不同學(xué)生的學(xué)習(xí)需求提供準(zhǔn)確的信息推送服務(wù)。學(xué)生需要從云平臺(tái)中的海量資源中自行篩選與甄別適用于自己的內(nèi)容,不僅造成時(shí)間上的浪費(fèi),也影響了云平臺(tái)中學(xué)習(xí)資源的有效利用率。
協(xié)同過濾算法的基本原理是基于用戶行為數(shù)據(jù)的相似度來推測(cè)用戶的潛在需求,首先構(gòu)建用戶行為偏好采集模型并獲取目標(biāo)用戶行為特征權(quán)值數(shù)據(jù),然后在用戶行為特征庫中進(jìn)行比對(duì),獲取到目標(biāo)用戶與相似度較高的用戶群體,最終以用戶群為參考將關(guān)注度高的信息推送給目標(biāo)用戶[2]。在學(xué)習(xí)資源智能推薦的應(yīng)用場景中,協(xié)同過濾算法的應(yīng)用主要基于以下兩種評(píng)估模型展開。
該模型的工作原理是對(duì)用戶的行為特征向量進(jìn)行評(píng)估,以獲得符合目標(biāo)用戶偏好的個(gè)性化數(shù)據(jù)集。具體過程為,首先將全體用戶的行為特征數(shù)據(jù)進(jìn)行向量化處理,在此基礎(chǔ)上采用相似度算法進(jìn)行用戶比對(duì),在已有的用戶特征庫中為目標(biāo)用戶匹配到相似度最高的用戶群體,并將該群體關(guān)注度較高的項(xiàng)目內(nèi)容進(jìn)行歸集與權(quán)值排序,最終根據(jù)排序結(jié)果將項(xiàng)目序列推送給目標(biāo)用戶。
該評(píng)估模型基于對(duì)項(xiàng)目的相似度計(jì)算來運(yùn)行,首先需要建立項(xiàng)目特征向量庫,在向用戶推送信息時(shí),先根據(jù)用戶評(píng)分?jǐn)?shù)據(jù)甄別出目標(biāo)用戶當(dāng)前所重點(diǎn)關(guān)注的項(xiàng)目信息,并將該項(xiàng)目的屬性特征向量與其他項(xiàng)目進(jìn)行相似度比對(duì)[3]。匹配到高相似度的項(xiàng)目并形成用戶可能感興趣的項(xiàng)目集合,最終按照相似度由高到低的順序?qū)㈨?xiàng)目集合推送給目標(biāo)用戶。
學(xué)生用戶在參與線上學(xué)習(xí)過程中的行為特征與在線消費(fèi)時(shí)的行為有明顯的區(qū)別,其線上學(xué)習(xí)所關(guān)注的領(lǐng)域具有良好的穩(wěn)定性,具體行為主要包括給出星級(jí)評(píng)分、課程討論、收藏記錄、資源下載等幾個(gè)方面。因此在建模中,以用戶行為統(tǒng)計(jì)的數(shù)量作為建模依據(jù),并以一周的正常學(xué)習(xí)時(shí)間即5天為統(tǒng)計(jì)周期,提出用戶的行為特征向量以公式(1)表示。
(1)
(2)
其中,Si為用戶對(duì)課程i給出的星級(jí)評(píng)分;Supper與Slower是從已有的評(píng)分?jǐn)?shù)據(jù)中所統(tǒng)計(jì)出的頭部與底部數(shù)據(jù)的平均值,其統(tǒng)計(jì)規(guī)則是將評(píng)分由高到低排列后,獲取前10%的評(píng)分?jǐn)?shù)據(jù)的均值與后10%的評(píng)分?jǐn)?shù)據(jù)的均值,用于控制由用戶個(gè)體差異造成的評(píng)分?jǐn)?shù)據(jù)偏差。若用戶參與了課程內(nèi)容討論或課程資源下載的行為,表示用戶對(duì)該課程的關(guān)注度高,給予最高權(quán)重。若用戶僅執(zhí)行了收藏課程的操作,則認(rèn)為用戶的關(guān)注度一般,基于Supper與Slower的均值來給予其平均權(quán)重。此外,考慮到用戶在線學(xué)習(xí)的時(shí)效性,在對(duì)用戶行為進(jìn)行分析時(shí)必須考慮時(shí)間因素,公式(1)中的Tki用于表示行為的時(shí)間權(quán)重,以公式(3)表示。
(3)
其中,last(i)代表用戶最后一次瀏覽課程i的時(shí)間;T代表當(dāng)前系統(tǒng)時(shí)間;first(i)則代表用戶第一次瀏覽課程i的時(shí)間。
在線學(xué)習(xí)資源的特點(diǎn)是其內(nèi)涵被深度融入到以教學(xué)視頻、學(xué)習(xí)資源為表現(xiàn)的課程內(nèi)容中,其內(nèi)容難以進(jìn)行全面直觀的描述。在本文中,以課程名稱、關(guān)鍵詞、課程概述作為權(quán)重來描述課程的特征,以公式(4)表示。
(4)
智能推送的過程是在分析用戶行為數(shù)據(jù)的基礎(chǔ)上建立了用戶偏好模型,并基于用戶偏好模型分析用戶行為類別與課程類別之間的相關(guān)性。首先根據(jù)用戶給出的課程綜合評(píng)分值建立用戶偏好集合,在智能推薦服務(wù)中,推薦課程資源與用戶偏好的相關(guān)性主要通過對(duì)課程的相似度計(jì)算得到。
假設(shè)課程資源K對(duì)應(yīng)的用戶偏好集參數(shù)估計(jì)為Ik=(Ik1,Ik2,…Ikj…,Ikn),那么所有課程資源的偏好集參數(shù)估計(jì)為S=(I1,I2,…,Im,…IM),然后計(jì)算偏好集和課程的相似性。本文采用的方法是余弦相似度計(jì)算方法。設(shè)置向量Im和In,然后計(jì)算兩者之間的相似度以公式(5)表示。
(5)
根據(jù)偏好集和課程的相似度計(jì)算,可以對(duì)偏好集和課程的相似度進(jìn)行排序,最后由在線課程資源平臺(tái)按照排序順序向用戶推薦顯示相似度高的課程資源。
本文通過協(xié)同過濾算法對(duì)云平臺(tái)中的用戶相似度與課程相似度進(jìn)行分析并基于計(jì)算結(jié)果構(gòu)建了雙維度的學(xué)習(xí)資源智能推送模型,根據(jù)不同學(xué)生用戶前期積累的學(xué)習(xí)行為數(shù)據(jù)在云平臺(tái)上的海量學(xué)習(xí)資源中自動(dòng)發(fā)掘有效的信息并準(zhǔn)確推送給相關(guān)的用戶,充分滿足學(xué)生的個(gè)性化在線學(xué)習(xí)需求,在提升自主學(xué)習(xí)效率的同時(shí),也提高了對(duì)云平臺(tái)中學(xué)習(xí)資源的有效利用率。