国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

個性化推薦技術(shù)在微課系統(tǒng)中的應(yīng)用

2019-12-24 01:13:28趙旭呂鶴軒
軟件工程 2019年12期
關(guān)鍵詞:推薦系統(tǒng)

趙旭 呂鶴軒

摘? 要:隨著我國教育信息化、數(shù)字化概念的提出,教育信息化資源以極快的速度大量涌現(xiàn),導(dǎo)致信息呈現(xiàn)爆炸式增長,用戶在面臨海量信息時,需要花費大量的時間和精力去篩選所需的資源。本文針對此現(xiàn)狀提出基于個性化推薦技術(shù)實現(xiàn)微課程視頻的篩選方案。通過本系統(tǒng)可以為用戶提供有針對性的、符合用戶興趣的相關(guān)資源,從而使用戶獲取信息的方式發(fā)生翻轉(zhuǎn),從以往的主動獲取變?yōu)楸粍拥慕邮?,并保證用戶接收的資源對其而言價值最高。

關(guān)鍵詞:推薦系統(tǒng);協(xié)同過濾算法;用戶興趣模型;資源評價機(jī)制

中圖分類號:TP391? ? ?文獻(xiàn)標(biāo)識碼:A

Application of Personalized Recommendation Technology in Micro-Course System

ZHAO Xu,LV Hexuan

(Dalian Neusoft University of Information,Dalian 116023,China)

Abstract:With the development of educational informatization and digitization in China,the reform of education informatization has made positive progress,but it has also led to explosive growth of information.Users need to spend a lot of time and energy to screen out the resources they need in the massive information.In view of this situation,this paper proposes a corresponding solution to realize video filtering of micro-course based on personalized recommendation technology.Through this system,users can be provided with targeted and relevant resources in line with their interest,so as to change the way users obtain information from the previous active acquisition to passive reception,and ensure that the resources received by users are of the highest value for them.

Keywords:recommendation system;cooperative filtering algorithm;user interest model;resource evaluation mechanism

1? ?引言(Introduction)

互聯(lián)網(wǎng)的發(fā)展帶動了教育的信息化發(fā)展,但是我們一方面享受這海量資源帶來的便利,另一方面也承受著信息爆炸帶來的搜索迷霧問題。那么如何在眾多資源中快速、準(zhǔn)確地找到自身所需的信息,進(jìn)而發(fā)揮出網(wǎng)絡(luò)資源的效用,從而最終服務(wù)于用戶、便利人們的生活是當(dāng)下互聯(lián)網(wǎng)領(lǐng)域的重點關(guān)注與研究課題,由此越來越多的個性化推薦技術(shù),以及推薦系統(tǒng)應(yīng)運而生。

本文針對教育領(lǐng)域的微課系統(tǒng)[1],利用個性化推薦技術(shù)可以實現(xiàn)為學(xué)生、教師提供有針對性的、符合用戶興趣的相關(guān)資源,使用戶獲取信息的方式發(fā)生變革,從以往的主動獲取變?yōu)楸粍拥慕邮?,并且接收的信息對其最為有用。本文研究的核心主要包括三方面?nèi)容[2]:創(chuàng)建用戶興趣模型:挖掘、表示以及更新用戶興趣項;創(chuàng)建視頻資源評價體系;結(jié)合個性化推薦算法將用戶興趣與資源特征進(jìn)行合理匹配,從而完成推薦。

2? ?用戶興趣模型(User interest model)

用戶興趣模型[3]是整個系統(tǒng)的數(shù)據(jù)基礎(chǔ),為后續(xù)的推薦功能提供依據(jù)和支撐,因此在收集用戶數(shù)據(jù)時,要盡量保證能夠較為全方位、無差錯的數(shù)據(jù)收集,良好的用戶興趣收集機(jī)制將直接影響到系統(tǒng)的推薦質(zhì)量,進(jìn)而直接決定用戶在使用系統(tǒng)時的直觀感受。

2.1? ?用戶興趣收集

在本文的研究中,主要通過顯式收集和隱式收集兩種方式來收集用戶數(shù)據(jù)[4]。

(1)顯式收集

顯式收集方式主要包括收集用戶自然屬性數(shù)據(jù)以及用戶評價反饋數(shù)據(jù)。其中,用戶自然屬性數(shù)據(jù)包括用戶所屬年級、課程等,這部分?jǐn)?shù)據(jù)的主要功能是用戶首次使用本系統(tǒng)時,在系統(tǒng)中無任何用戶的個人信息記錄,系統(tǒng)可以根據(jù)用戶自然屬性作為用戶初始興趣加入用戶興趣模型中,從而一定程度上避免“冷啟動”[5]問題;用戶評價反饋數(shù)據(jù)是用戶在使用系統(tǒng)時,主動向系統(tǒng)提交他們對資源的評價。

(2)隱式收集

隱式收集的行為主體為系統(tǒng)本身,系統(tǒng)通過技術(shù)手段記錄用戶的操作記錄,從本系統(tǒng)自身特點出發(fā),本文中采集用戶的搜索、瀏覽、下載、觀看等行為記錄作為隱式收集的主要收集數(shù)據(jù)。采用這種方式的好處是收集過程中,不要用戶刻意配合參與,所有的收集行為均發(fā)生在服務(wù)器端,不會給用戶帶來任何的使用負(fù)擔(dān)。

通過上述分析,需要尋找一種表達(dá)機(jī)制,不但能夠準(zhǔn)確的記錄、表達(dá)用戶行為,同時還要方便系統(tǒng)對行為數(shù)據(jù)進(jìn)行分析、計算及統(tǒng)計,通過調(diào)研,本文采用日志文件的方式記錄表達(dá)用戶行為。

2.2? ?用戶興趣表示

針對系統(tǒng)記錄的日志文件,我們需要過濾掉噪音信息:即本系統(tǒng)不關(guān)注的、對生成用戶興趣沒有任何作用的信息,同時盡最大可能提取出對采集用戶興趣發(fā)揮作用的數(shù)據(jù),最終生成用戶的興趣數(shù)據(jù)。關(guān)于采集的用戶興趣數(shù)據(jù),我們更多關(guān)注的是用戶對哪一類數(shù)據(jù)感興趣以及對該類數(shù)據(jù)的興趣程度,結(jié)合該特點,本文中采用向量空間模型(VSM)[6]表示法建立和表達(dá)用戶興趣。并將用戶興趣模型方法的表示可以表示為以下形式:{(tag1,w1),(tag2,w2),…,(tagi,wi),…,

(tagn,wn)}。其中,tagi(i∈{1,2,3,…,n})是系統(tǒng)根據(jù)收集到的用戶行為記錄進(jìn)行清洗、過濾后得到的用戶興趣項,wi(i∈{1,2,3,…,n})則代表用戶對tagi的感興趣程度。

同時,需要特殊強(qiáng)調(diào)的是冷啟動的問題,本文針對第一次使用系統(tǒng)的用戶,會將注冊用戶的自然屬性作為其默認(rèn)的初始興趣項,并為其賦予初始興趣權(quán)重值,進(jìn)而解決了系統(tǒng)冷啟動時用戶興趣模型數(shù)據(jù)為空的問題。

模型中的興趣項權(quán)重的計算,本文采用TF-IDF方法[7]進(jìn)行計算。TF-IDF的原始計算公式如下:

(1)

其中,wij表示特征項ti在文本Dj中的權(quán)重,tfij為特征項ti在當(dāng)前文檔中出現(xiàn)的頻次,N為是訓(xùn)練項目集合中包含的文檔數(shù)目,ni是訓(xùn)練項目集合中包含特征項ti的文檔總數(shù)。

通過對公式進(jìn)行分析,我們可以發(fā)現(xiàn)用戶興趣的權(quán)重值的取值區(qū)間為[0,1],權(quán)重值的大小與用戶對該興趣項的關(guān)注程度高低成正比關(guān)系,因此更加證實該方法對于本文切實可行。

2.3? ?用戶興趣更新

心理學(xué)的相關(guān)研究發(fā)現(xiàn)[8],人類大腦中對于某段記憶的深刻程度與該段記憶生成的時間、該段記憶被調(diào)取的頻率都有著不可分割的關(guān)系,間隔時間越長、記憶被調(diào)取的頻率越低,該段記憶越容易被遺忘,與此同時,新的記憶也不斷地生成并存儲與我們的大腦之中,因此,在創(chuàng)建用戶興趣模型時,也要考慮人類的這種記憶的逐漸遺忘、不斷生成的特點,對用戶的興趣模型數(shù)據(jù)進(jìn)行更新。

在本文中,我們側(cè)重的是對于調(diào)用記憶的間隔時間這一記憶影響因素對興趣項權(quán)重值的影響,利用的是用戶對該興趣項的最后一次訪問時間與當(dāng)前時間的時間間隔這一數(shù)據(jù),將用戶原有興趣項的權(quán)重值按如下公式進(jìn)行衰減處理:

(2)

其中,oldWeight、newWeight分別是記憶衰退前、后的興趣項權(quán)重值,Dvalue是針對該興趣的訪問時間差,Date為時間調(diào)節(jié)因子。通過公式可以發(fā)現(xiàn),當(dāng)訪問時間差Dvalue逐漸接近Date時,用戶對該興趣項的權(quán)重值逐漸降低。

3? 微課資源評價機(jī)制(Evaluation mechanism for micro-course resources)

本文的目標(biāo)是系統(tǒng)不但能夠為用戶生成較為準(zhǔn)確的推薦,并且推薦的微課質(zhì)量為同類型中質(zhì)量較高、普遍好評的資源,因此本文需要有一套合理的機(jī)制能夠?qū)ξ⒄n質(zhì)量的高低進(jìn)行評價,而質(zhì)量的高低最有發(fā)言權(quán)的則是系統(tǒng)的使用用戶,因此本文根據(jù)用戶的反饋來對資源質(zhì)量做出評價,用戶的反饋行為仍然可以分為顯式反饋和隱式反饋兩種形式,分別對應(yīng)著用戶評分的兩種形式。

用戶顯式評分:用戶主動、直接對視頻資源進(jìn)行的打分行為對應(yīng)的評分值。本文選用5分制評分機(jī)制,定義為r1。

用戶隱式評分:隱式評分仍然不需要用戶的主觀參與,一方面這種收集方式對用戶的使用不產(chǎn)生任何負(fù)面影響,另一方面這種采集方式采集到的數(shù)據(jù)相對客觀,系統(tǒng)會自動地對用戶的觀看視頻時長進(jìn)行記錄,最終通過用戶觀看視頻時長與視頻總時長的比值p來反映其對視頻的滿意程度,計算公式為:

(3)

其中,t為觀眾觀看微課視頻的實際時長,Ttotal代表所看微課視頻的總時長。隱式評分同樣采用五分制的評分制度,則將觀眾對某視頻的隱式評分r2定義為:

(4)

綜上,在獲取到顯式評分和隱式評分后,我們采用兩種評分的平均值作為視頻的最終總體評分,計算公式如下:

(5)

4 基于用戶的協(xié)同過濾算法(User-based collaborative filtering algorithm)

4.1? ?算法思想

基于用戶的協(xié)同過濾算法(User-CF)[9]就是以相似用戶為切入點作為推薦依據(jù),將相似用戶感興趣的資源推薦給目標(biāo)用戶。因此,根據(jù)算法的思想,其實現(xiàn)主要分為尋找相似用戶、用戶興趣度計算、生成推薦三個核心步驟。

4.2? ?用戶相似度計算

如何與目標(biāo)用戶需求接近的用戶是本算法需要解決的第一個問題。本文中,因為用戶興趣模型我們采用了向量的表示方式,因此可以計算向量間的夾角余弦值[10],計算公式分別如下:

(6)

其中,a、b分別為用戶u1和用戶u2的評分向量,r1i和r2i分別表示用戶u1和用戶u2對視頻i的評分值。本文研究的研究是利用向量空間模型為計算依據(jù),同時結(jié)合基于用戶的協(xié)同過濾算法,利用上文提到的余弦相似度的計算方法對用戶間的相似度進(jìn)行計算,針對用戶u和用戶v,計算二者的相似度,那么相似公式表達(dá)為:

(7)

其中,tag(u)和tag(v)表示用戶u和用戶v的興趣集合。通過該方法,系統(tǒng)可以得到與目標(biāo)用戶相似度最大的前k個用戶集合,設(shè)為S(u,K)={u1,u2,…,uk}。

4.3? ?用戶興趣度計算

目標(biāo)用戶最近鄰居集合S(u,K),然后利用集合中每個用戶與目標(biāo)用戶的相似度,預(yù)測目標(biāo)用戶對沒有過有效行為視頻的興趣大小,預(yù)測公式如下:

(8)

其中,S(u,K)表示和用戶u的K個最近鄰居集合,U(j)表示對tagj有興趣的用戶集合,用戶v是在用戶u的最近鄰居中對tagj感興趣的用戶。simuv是用戶u和用戶v的興趣相似度,bvj表示用戶v對tagj的興趣權(quán)重。

最終選取用戶興趣集合中興趣值最大的M個興趣,我們將其定義為Im={I1,I2,…,Im}。

4.4? ?生成推薦

通過上文中得到的用戶興趣項結(jié)合,進(jìn)而可以在系統(tǒng)中查找到與興趣項想匹配的相關(guān)微課集合作為待推薦資源,不過在待推薦結(jié)果最終呈現(xiàn)給用戶之前,根據(jù)用戶的常規(guī)使用習(xí)慣,我們將用戶最有可能關(guān)注的視頻資源放置在排位靠前的位置進(jìn)行顯示,因此需要對帶推薦微課資源的排序進(jìn)行設(shè)計,我們主要考慮兩方面因素:用戶興趣值和視頻評價,微課資源排序權(quán)重計算公式如下:

wv=p(u,j)×α+R×β,其中α+β=1? ? ? ? (9)

式(9)中,p(u,j)是表示用戶對該類微課的關(guān)注程度,R是該微課的評分值,α和β則分別表示用戶關(guān)注程度以及視頻評價對排序的影響因子。通過計算待推薦微課的wv數(shù)值,對所有帶推薦微課資源按照wv的值進(jìn)行降序排序形成最終推薦微課資源,因此最終呈現(xiàn)給用戶的將是用戶感興趣且評價較高的視頻資源。

5? ?實驗結(jié)果(Experiment results)

5.1? ?實驗數(shù)據(jù)收集

實驗時,邀請100位人員進(jìn)行模擬真實用戶測試,實驗通過收集測試人員的操作行為數(shù)據(jù)形成log日志,截取2M的用戶行為操作數(shù)據(jù)對其進(jìn)行分析提取,并分別收集用戶對系統(tǒng)推薦的前三個視頻、前五個視頻以及前十個視頻的滿意程度,并形成調(diào)查問卷,進(jìn)而得出實驗結(jié)果數(shù)據(jù)。

5.2? ?實驗結(jié)果

通過對調(diào)查問卷進(jìn)行統(tǒng)計,得出測試用戶對推薦視頻資源的滿意度統(tǒng)計數(shù)據(jù)如表1所示。

通過上述實驗結(jié)果數(shù)據(jù),發(fā)現(xiàn)推薦結(jié)果能夠滿足大部分用戶的期望和使用需要。在前十個微課視頻推薦中,因為互聯(lián)網(wǎng)用戶的使用習(xí)慣,大部分用戶在使用時,主要停留在前五條數(shù)據(jù)中,而不會花費過多精力逐個瀏覽全部結(jié)果,導(dǎo)致不予評論人數(shù)增多,進(jìn)而拉低了用戶的滿意程度。

6? ?結(jié)論(Conclusion)

本文將推薦技術(shù)應(yīng)用到教育領(lǐng)域的微課系統(tǒng)中,通過采集用戶興趣、生成資源評分,最終將基于用戶的推薦算法作橋梁將用戶興趣與微課視頻資源鏈接起來,將用戶主動搜索變?yōu)楸粍咏邮招畔?,進(jìn)而完成了個性化的推薦過程。

參考文獻(xiàn)(References)

[1] Yiu-Kai Ng,Jane Linn.CrsRecs:A Personalized Course Recommendation System for College Students[A].Proceedings of 2017 8th International Conference Information,Intelligence,System&Applications[C].Larnaca:IEEE,2017:1-6.

[2] 冷亞軍,黎忠雪.個性化推薦及其相關(guān)技術(shù)分析[J].內(nèi)蒙古科技與經(jīng)濟(jì),2019(5):58-60.

[3] Gong Yuyun,Zhang Qi.Hashtag Recommendation Using Attention-BasedConvolutional Neural Network[A].Proceeding of the 25th International Joint Conference on Artificial Intelligence[C].Palo Alto:AAAI Press,2016:2782-2788.

[4] 項亮.推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012.

[5] Rashid A M,Albert I,Cosley D,et al.Getting to know you:learning new user preferences inrecommender systems[C].Proceedings of the 7th international conference on Intelligent user interfaces.ACM,2002:127-134.

[6] 鄧娟,陳西曲.基于用戶興趣變化的協(xié)同過濾推薦算法[J].武漢工業(yè)學(xué)院學(xué)報,2013,32(4):48-51.

[7] 郭俊霞,徐文生,盧罡.基于用戶瀏覽軌跡的商品推薦[J].計算機(jī)科學(xué),2016,43(12):223-228.

[8] DING Y,LI X.Time weight collaborative filtering[C].Proceedings of the 14th ACM International Conference on Information and Knowledge Management.ACM,2005:485-492.

[9] Resnick P,Iacovou N,Suchak M,et al.GroupLens:an open architecture for collaborative filtering of netnews[J].Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work:Chapel Hill,1994:175-186.

[10]? Breese J S,Heckerman D,Kadie C.Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C].Fourteenth Conference on Uncertainty in Artificial Intelligence,1998:43-52.

作者簡介:

趙? 旭(1989-),女,碩士,講師.研究領(lǐng)域:數(shù)據(jù)挖掘,算法.

呂鶴軒(1996-),男,本科生.研究領(lǐng)域:數(shù)據(jù)挖掘,算法.

猜你喜歡
推薦系統(tǒng)
數(shù)據(jù)挖掘在選課推薦中的研究
軟件(2016年4期)2017-01-20 10:09:33
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
基于個性化的協(xié)同過濾圖書推薦算法研究
個性化推薦系統(tǒng)關(guān)鍵算法探討
淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
商(2016年29期)2016-10-29 15:22:08
一種基于自適應(yīng)近鄰選擇的協(xié)同過濾推薦算法
UGC標(biāo)簽推薦系統(tǒng)的一種新的標(biāo)簽清理方法
商(2016年15期)2016-06-17 17:39:50
網(wǎng)上商品推薦系統(tǒng)設(shè)計研究
基于消費者視角的在線推薦系統(tǒng)研究綜述
中國市場(2016年2期)2016-01-16 10:16:10
突泉县| 合阳县| 乌兰察布市| 新竹县| 连南| 靖西县| 商河县| 科技| 柳州市| 安徽省| 吐鲁番市| 东明县| 田林县| 朝阳区| 台前县| 石泉县| 吐鲁番市| 长治县| 宝山区| 连平县| 什邡市| 花垣县| 隆安县| 武功县| 鄯善县| 龙陵县| 东安县| 鲁山县| 鄂伦春自治旗| 东宁县| 娄烦县| 巫山县| 秀山| 靖边县| 兴和县| 宜宾市| 阜平县| 枣庄市| 渑池县| 平果县| 河源市|