国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于上下文信息的協(xié)同過濾推薦

2015-12-17 01:53李濤黎路符丁
電腦知識與技術(shù) 2015年28期
關(guān)鍵詞:協(xié)同過濾

李濤 黎路 符丁

摘要:由于大規(guī)模動態(tài)數(shù)據(jù)集在推薦時難以兼顧推薦準確度的問題,該文在充分考慮用戶所處上下文情景因素,提出一種基于上下文的協(xié)同過濾推薦技術(shù),以提高用戶偏好的預(yù)測準確度。實驗表明,該技術(shù)能有效提高推薦質(zhì)量和效率。

關(guān)鍵詞:協(xié)同過濾;推薦準確度;時間上下文

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2015)27-0174-02

Abstract: Due to large scale dynamic data set between recommendation accuracy problem when recommended, in this paper, give full consideration to the user in a context situational factors, proposes a collaborative filtering recommendation technology based on the context, in order to improve the prediction accuracy of user preference. Experiments show that the technology can effectively improve the recommendation quality and efficiency.

Key words: Collaborative Filtering(CF); recommendation accuracy; time context

隨著電子商務(wù)網(wǎng)站的發(fā)展,讓用戶從紛繁復(fù)雜的物品(產(chǎn)品和服務(wù))中做出最恰當?shù)倪x擇顯得非常困難,于是推薦系統(tǒng)應(yīng)運而生。推薦系統(tǒng)根據(jù)用戶的興趣、行為、情景等信息,建立用戶的興趣模型為用戶提供個性化的服務(wù),其核心技術(shù)是推薦算法。但大多數(shù)已有的推薦算法只是關(guān)注把最相關(guān)的物品推薦給用戶,卻忽略了用戶所處的上下文情景信息,如用戶訪問系統(tǒng)的時間、地理位置、用戶的狀態(tài)和職業(yè)等。這些信息對于提高推薦系統(tǒng)的推薦準確度是非常必要的。本文在協(xié)同過濾推薦的基礎(chǔ)上,提出了基于時間上下文推薦算法。

1 協(xié)同過濾推薦

協(xié)同過濾被認為是推薦系統(tǒng)所采用的最為成功的技術(shù)之一[1]。其基本思想是利用已有用戶群過去的行為或意見預(yù)測當前用戶最可能喜歡哪些物品或?qū)δ男┪锲犯信d趣。協(xié)同過濾主要分為基于物品的協(xié)同過濾和基于用戶的協(xié)同過濾 [2]兩種。

基于用戶的協(xié)同過濾算法是找到與目標用戶興趣相似的用戶群,找到這個群中用戶喜歡的、并且目標用戶沒有聽說過的物品推薦給目標用戶?;谖锲返膮f(xié)同過濾算法是利用用戶之前有過行為記錄,然后根據(jù)物品的相似度和用戶的歷史行為,給目標用戶推薦和之前物品類似的物品。協(xié)同過濾推薦主要是借鑒和目標用戶相關(guān)人群的觀點來進行推薦。

2基于上下文信息的推薦

由于傳統(tǒng)的協(xié)同過濾推薦算法,只考慮了用戶和物品這兩種信息,并沒有將它們放入某種情境中考慮,而情境信息對用戶偏好有一定的影響。因此,在某些特殊的場景下給用戶推薦信息,把上下文信息整合到推薦流程也是至關(guān)重要的。比如,工作日時,用戶上午訪問網(wǎng)站時可能會傾向于瀏覽時事新聞,晚上會瀏覽娛樂新聞和購物信息。

本文在基于用戶協(xié)同過濾推薦算法的基礎(chǔ)上加入了時間上下文信息。通過將時間上下文信息作為附加的數(shù)據(jù)整合到推薦流程里,來處理對用戶的興趣和偏好的建模和預(yù)測問題。對于計算用戶偏好的評分函數(shù)R中不僅有用戶和和物品這二維信息還加入了第三維信息——時間,評分函數(shù)R定義為:

R : User×Item ×Time—> Rating

其中,User和Item分別是用戶和物品的取值域,Rating是一個評分的取值域,Time代表時間上下文信息。將時間上下文信息建模到推薦算法中,讓推薦系統(tǒng)能夠預(yù)測用戶在某個特定時刻的興趣。

在傳統(tǒng)的協(xié)同過濾推薦算法中首先進行相似度的計算。利用余弦相似度公式計算用戶間或者物品間的相似度。公式如2-13]。

[wuv=i∈N(u)?N(v)1|N(u)||N(v)|] (2-1)

如考慮時間這一上下文因素,對此公式作一點相應(yīng)的改動,在公式中引入了和時間有關(guān)的衰減項[11+αtui-tvi],其中[tui]是用戶u對物品i產(chǎn)生行為時間,[tvi]是用戶v對物品i產(chǎn)生行為時間,[α]是時間衰減參數(shù)。該衰減項表示,如果用戶u和用戶v對物品i產(chǎn)生行為的時間越遠,那么這兩個用戶的興趣相似度就會越小[4]。公式如2-2。

[wuv=i∈N(u)?N(v)11+αtui-tvi|N(u)||N(v)|] (2-2)

在得到用戶相似度之后要進行用戶對物品的興趣的預(yù)測,推薦公式如2-3。

3算法實現(xiàn)

算法實現(xiàn)主要有以下兩步驟[5]:

1) 計算用戶相似度矩陣

2) 預(yù)測用戶u對i的興趣,得到用戶最感興趣的信息推薦列表

與傳統(tǒng)的基于用戶的協(xié)同過濾算法不同之處,在計算用戶相似度的時候加入了時間這個情景因素。

改進后相似度可以通過如下代碼實現(xiàn)[6]:

def UserSimilarity(train):

item_users=dict()

for u, items in train.items():

for i, tui in items.items():

if i not in item_users:

item_users[i]=dict()

item_users[i][u]=tui

C=dict()

N=dict()

for i, users in item_users.items():

for u,tui in users.items():

N[u]+=1

for v,tvi in users.items():

if u==v:

continue

C[u][v]+=1/(1+alpha*abs(tui-tvi))

W=dict()

for u,related_users in C.items():

for v,cuv in related_users.items():

W[u][v]=cuv/math.sqrt(N(u)*N(v)

return W

預(yù)測用戶u對i的興趣,得到用戶最感興趣的信息推薦列表,算法可以通過如下代碼實現(xiàn) :

def Recommend(user,train,W):

rank=dict()

interacted_items=train[user]

for v,wuv in sorted(W[u].items,key=itemgetteer(1),reverse=True)[0:K]:

for i,tvi in train[v].items:

if i in interacted_items:

continue

rank[i]+=wuv

return rank

4 實驗結(jié)果

為了驗證改進后算法的性能進行了相關(guān)實驗。實驗使用的是Last.fm公開數(shù)據(jù)集,利用數(shù)據(jù)集中對1000多個用戶的大約兩千多萬條聽歌記錄數(shù)據(jù),對用戶協(xié)同過濾算法和改進后基于上下文的算法,通過準確度、覆蓋率、召回率三種指標進行評測。

經(jīng)實驗結(jié)果可以得出,相似用戶數(shù)K和進行推薦的物品數(shù)量,對推薦的準確度和召回率是有很大影響的。通過K選取不同值,所計算的召回率、準確度、覆蓋率由表1和表2所示。

兩種算法的準確度對比如圖1所示 。

由圖1所示,基于時間上下文推薦算法在預(yù)測準確度方面有明顯提高。

5 結(jié)束語

實驗表明,基于上下文的算法在推薦精度和用戶滿意度明顯優(yōu)于傳統(tǒng)的非情景感知的算法。因此,在推薦系統(tǒng)里,上下文情景信息整合到推薦算法中的廣度和深度,毫無疑問會影響消費者偏好的預(yù)測的準確度。

參考文獻:

[1] Anand S,Mobasher B.Contextual recommendation. WebMine,LANI,4737,2007,142-160.

[2] 曾春,邢春曉,周立柱. 個性化服務(wù)技術(shù)綜述[J].軟件學(xué)報, 2002,13(10):1952-1961.

[3] 陳婷. 基于上下文感知的個性化信息服務(wù)系統(tǒng)的研究與設(shè)計[D].北京:北京郵電大學(xué).2013

[4] 趙亮湖,乃靜,張守志.個性化推薦算法設(shè)計[J].計算機研究與發(fā)展,2002,39(8):986-991.

[5] 吳湖,王永吉,王哲,等.兩階段聯(lián)合聚類協(xié)同過濾算法[J].軟件學(xué)報,2010,21(5):1042-1054.

[6] 項亮.推薦系統(tǒng)實踐 [M].人民郵電出版社,2012,6:132-133.

猜你喜歡
協(xié)同過濾
基于用戶評分和項目類偏好的協(xié)同過濾推薦算法
基于用戶相似度加權(quán)的Slope One算法
圖書推薦算法綜述
改進的協(xié)同過濾推薦算法
基于鏈式存儲結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
關(guān)于協(xié)同過濾推薦算法的研究文獻綜述
基于混合信任模型的協(xié)同過濾推薦算法