国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法*

2016-01-26 06:48:51龔安,高云,高洪福
關(guān)鍵詞:協(xié)同過(guò)濾

?

一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法*

通信地址:266580 山東省青島市中國(guó)石油大學(xué)(華東)計(jì)算機(jī)與通信工程學(xué)院Address:School of Computer & Communication Engineering,China University of Petroleum,Qingdao 266580,Shandong,P.R.China

龔安,高云,高洪福

(中國(guó)石油大學(xué)(華東)計(jì)算機(jī)與通信工程學(xué)院,山東 青島 266580)

摘要:協(xié)同過(guò)濾是電子商務(wù)推薦系統(tǒng)中應(yīng)用最成功的推薦技術(shù)之一,但面臨著嚴(yán)峻的用戶評(píng)分?jǐn)?shù)據(jù)稀疏性和推薦精度低等問(wèn)題。針對(duì)數(shù)據(jù)稀疏性高和單一評(píng)分導(dǎo)致的推薦精度低等問(wèn)題,提出一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法。首先通過(guò)均值法或縮放法構(gòu)造用戶-項(xiàng)目屬性評(píng)分矩陣將單一評(píng)分轉(zhuǎn)化為多評(píng)分;其次基于每個(gè)屬性評(píng)分矩陣,計(jì)算用戶間的偏好相似度,得到目標(biāo)用戶的偏好最近鄰居集;然后針對(duì)每個(gè)最近鄰居集,在用戶-項(xiàng)目評(píng)分矩陣上完成對(duì)目標(biāo)用戶的初步評(píng)分預(yù)測(cè);最后,將多個(gè)初步預(yù)測(cè)評(píng)分加權(quán)求和作為綜合評(píng)分,完成推薦。在Movie Lens擴(kuò)展數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該算法能有效提高推薦精度。

關(guān)鍵詞:屬性評(píng)分;均值法;縮放法;協(xié)同過(guò)濾;推薦

1引言

隨著Internet和電子商務(wù)的迅猛發(fā)展,“信息爆炸”和“信息過(guò)載”問(wèn)題越來(lái)越嚴(yán)重,用戶很難從海量的信息中找到自己真正需要的信息。推薦系統(tǒng)可以在用戶目的不明確的情況下幫助用戶找到可能感興趣的信息并推薦給用戶。協(xié)同過(guò)濾是現(xiàn)行推薦系統(tǒng)中應(yīng)用最廣泛最成功的技術(shù)之一,但其需要維護(hù)一個(gè)存儲(chǔ)用戶偏好的數(shù)據(jù)庫(kù)。因此,隨著系統(tǒng)中用戶和項(xiàng)目數(shù)量的不斷增加,協(xié)同過(guò)濾面臨嚴(yán)峻的用戶評(píng)分?jǐn)?shù)據(jù)稀疏性、推薦實(shí)時(shí)性、可擴(kuò)展性挑戰(zhàn),推薦質(zhì)量迅速下降。

對(duì)此,很多國(guó)內(nèi)外學(xué)者提出了一些改進(jìn)算法。Luo H等人[1]提出了局部用戶相似性和全局用戶相似性的概念及LU&GU架構(gòu),可發(fā)現(xiàn)高質(zhì)量的鄰居用戶,提高推薦精度。黃創(chuàng)光等人[2]提出了一種不確定近鄰的協(xié)同過(guò)濾算法,通過(guò)不確定近鄰因子及調(diào)和參數(shù)計(jì)算基于用戶和項(xiàng)目的預(yù)測(cè)評(píng)分從而產(chǎn)生推薦。Lemire D教授[3]提出了Slope One算法,該算法具有易實(shí)現(xiàn)、查詢效率高等優(yōu)點(diǎn)。Mi Z等人[4]將聚類和Slope One相結(jié)合應(yīng)用在推薦算法中。Melville P等人[5]使用基于內(nèi)容的方法填補(bǔ)用戶評(píng)分向量中的空值,緩解評(píng)分?jǐn)?shù)據(jù)的稀疏性,從而提高協(xié)同過(guò)濾的推薦質(zhì)量。楊興耀等人[6]通過(guò)協(xié)調(diào)優(yōu)化的用戶評(píng)分相似性和基于項(xiàng)目屬性的用戶相似性改進(jìn)相似性度量的精度。Huang M等人[7]結(jié)合屬性論提出了基于項(xiàng)目屬性的協(xié)同過(guò)濾推薦算法,緩解了數(shù)據(jù)稀疏問(wèn)題,提高了推薦質(zhì)量。上述研究雖然提高了推薦質(zhì)量,但都沒(méi)有考慮用戶的屬性偏好。徐紅艷等人[8]提出了一種基于多屬性評(píng)分的協(xié)同過(guò)濾算法,該算法在一定程度上解決了數(shù)據(jù)稀疏問(wèn)題,提高推薦準(zhǔn)確度。范波等人[9]提出了一種基于用戶間多相似度的協(xié)同過(guò)濾推薦算法,即通過(guò)計(jì)算用戶間對(duì)不同項(xiàng)目類型多個(gè)獨(dú)立的評(píng)分相似度來(lái)分別描述用戶間對(duì)不同類型項(xiàng)目喜好的相似程度。上述研究均利用了項(xiàng)目的屬性信息,但文獻(xiàn)[8]中主要是針對(duì)多評(píng)分?jǐn)?shù)據(jù)集的,對(duì)單一評(píng)分?jǐn)?shù)據(jù)集并不適用;文獻(xiàn)[9]雖然計(jì)算了用戶之間的多個(gè)相似度,但其仍是利用用戶的直接評(píng)分,并未考慮用戶對(duì)項(xiàng)目某一屬性的偏好。

本文針對(duì)單一評(píng)分?jǐn)?shù)據(jù)集上推薦精度低的問(wèn)題,采用均值法和縮放法將單一評(píng)分轉(zhuǎn)換為多評(píng)分,計(jì)算用戶對(duì)項(xiàng)目的各個(gè)屬性的偏好評(píng)分得到多個(gè)用戶-項(xiàng)目屬性評(píng)分矩陣;然后,在各屬性矩陣上計(jì)算用戶相似度得到用戶的多個(gè)相似鄰居集;接下來(lái),針對(duì)每組最近鄰,分別在用戶-項(xiàng)目評(píng)分矩陣進(jìn)行評(píng)分預(yù)測(cè);最后,將同一用戶對(duì)同一項(xiàng)目的多個(gè)預(yù)測(cè)評(píng)分加權(quán)求和后作為綜合評(píng)分,依據(jù)綜合評(píng)分的大小進(jìn)行項(xiàng)目推薦。

2問(wèn)題定義及基本方法

定義推薦系統(tǒng)中的數(shù)據(jù)源D={U,I,R};其中U={u1,u2,…,um}表示基本用戶,I={i1,i2,…,in}表示基本項(xiàng)目,R代表一個(gè)m×n階的矩陣,用戶u對(duì)項(xiàng)目j的評(píng)分,記作 Ru,j。由于系統(tǒng)中大部分用戶對(duì)大部分項(xiàng)目沒(méi)有評(píng)分,所以矩陣中存在大量的空值。

傳統(tǒng)的基于用戶的協(xié)同過(guò)濾推薦算法首先計(jì)算用戶之間的相似度。相似度計(jì)算方法主要有以下三種:

(1)余弦相似性:用戶被看作n維項(xiàng)目空間的向量。設(shè)向量u、v分別代表用戶u和用戶v的評(píng)分,則用戶u和用戶v之間的相似度sim(u,v)定義如下:

(1)

(2)修正的余弦相似性:余弦相似性未考慮不同用戶之間的評(píng)分尺度偏差的問(wèn)題,修正的余弦相似性通過(guò)減去用戶的平均評(píng)分來(lái)改善這一缺陷,其定義如下:

sim(u,v)=

(2)

(3)相關(guān)相似性:選取用戶u和用戶v的共同打分的項(xiàng)目集,記作Iu,v,則sim(u,v)如下:

sim(u,v)=

(3)

然后,推薦系統(tǒng)選取與目標(biāo)用戶u相似度較高的用戶作為其最近鄰居集,記作N(u),并預(yù)測(cè)用戶u對(duì)其未評(píng)分項(xiàng)目i的評(píng)分Pu,i:

(4)

最后,推薦系統(tǒng)將預(yù)測(cè)評(píng)分最高的前K個(gè)項(xiàng)目推薦給用戶,完成推薦過(guò)程。

3基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法

本文認(rèn)為用戶使用(購(gòu)買或者觀看)了項(xiàng)目,可能是因?yàn)閷?duì)項(xiàng)目的某種屬性有所偏好,例如有些用戶喜歡喜劇片,有些用戶喜歡動(dòng)作片,還有的用戶購(gòu)買了大量的電子產(chǎn)品等,因此本文擬通過(guò)尋找在屬性上有類似偏好的用戶作為相似用戶,然后基于他們的歷史評(píng)分產(chǎn)生推薦。

3.1 算法思路

定義項(xiàng)目的屬性集為A={A1,A2,…,Ak,…,Al},Ak={a1,a2,…,as,…,at},其中,Ak為屬性,as為屬性的取值。需要注意的是,對(duì)于某一項(xiàng)目ij的屬性Ak,其可能有多個(gè)取值。例如,一部電影既是動(dòng)作片又是科幻片,一件商品既是女裝又是戶外等。

圖1給出了算法的流程。首先,構(gòu)建用戶-項(xiàng)目評(píng)分矩陣、用戶-項(xiàng)目屬性評(píng)分矩陣并選取屬性;然后,在每個(gè)屬性評(píng)分矩陣上計(jì)算用戶之間的相關(guān)相似性,并選取相似度最高的K個(gè)用戶作為相似鄰居;接著,根據(jù)K個(gè)鄰居的歷史評(píng)分預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分;當(dāng)所有屬性評(píng)分矩陣的預(yù)測(cè)完成時(shí),會(huì)得到目標(biāo)用戶對(duì)于每個(gè)目標(biāo)項(xiàng)目的一組預(yù)測(cè)評(píng)分,將這些評(píng)分加權(quán)求和作為綜合評(píng)分;最后,選取綜合評(píng)分最高的前T個(gè)項(xiàng)目推薦給用戶。

Figure 1 Algorithm flowchat圖1 算法流程

3.2 算法描述

本文分三方面探討基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法,即用戶-項(xiàng)目屬性評(píng)分矩陣的構(gòu)造、項(xiàng)目屬性的確定和推薦的生成。

3.2.1 用戶-項(xiàng)目屬性評(píng)分矩陣的構(gòu)造

設(shè)用戶對(duì)項(xiàng)目的第k個(gè)屬性Ak的評(píng)分矩陣為G,表示如下:

(5)

其中,m為用戶數(shù)量,t是屬性Ak值的數(shù)量。

要構(gòu)造用戶-項(xiàng)目屬性評(píng)分矩陣,首先要確定用戶對(duì)各屬性值的評(píng)分,即gij,文獻(xiàn)[8]采用的是用戶對(duì)屬性的直接評(píng)分,但是日常生活中數(shù)據(jù)集大多都是單一評(píng)分的。因此,本文采用以下兩種方法來(lái)構(gòu)造屬性評(píng)分:

(1)均值法:即以用戶對(duì)具有某一屬性值的項(xiàng)目的評(píng)分的均值作為其評(píng)分,定義如下:

(6)

其中,N代表用戶i評(píng)價(jià)過(guò)的Ak=aj的項(xiàng)目的數(shù)量,rh代表用戶對(duì)Ak=aj的項(xiàng)目的評(píng)分。由定義可知,每個(gè)用戶對(duì)每個(gè)屬性值的評(píng)分至多只有一個(gè),例如,用戶A對(duì)喜劇電影的評(píng)分為4;如果A沒(méi)有看過(guò)喜劇電影,則其沒(méi)有該項(xiàng)評(píng)分。

(2)縮放法:如果用戶對(duì)具有某一屬性值的項(xiàng)目的評(píng)分的差距都比較小但評(píng)分又不完全相同,則可認(rèn)為用戶比較偏愛(ài)此類項(xiàng)目,需要對(duì)其評(píng)分進(jìn)行放大,反之,其評(píng)分需進(jìn)行適當(dāng)?shù)目s減;如果用戶對(duì)具有某一屬性值的項(xiàng)目只有一次評(píng)分,則可認(rèn)為用戶不喜歡此類項(xiàng)目,令其評(píng)分為零;如果用戶對(duì)具有某一屬性值的項(xiàng)目的評(píng)分完全相同,則忽略其評(píng)分。本文采用方差對(duì)評(píng)分進(jìn)行縮放,并將閾值定為1,即如果方差大于1,就將評(píng)分縮減,反之,將評(píng)分放大。因此,縮放法定義為用戶對(duì)具有某一屬性值的項(xiàng)目的評(píng)分的均值和方差的比值,公式如下:

(7)

下面通過(guò)一個(gè)例子進(jìn)行闡述,假設(shè)用戶A、B、C、D觀看過(guò)的喜劇電影為1、2、3、4,其歷史評(píng)分、均值評(píng)分和縮放評(píng)分如表1所示??梢园l(fā)現(xiàn),當(dāng)用戶評(píng)分比較穩(wěn)定時(shí),例如用戶A的評(píng)分,其縮放評(píng)分被放大;而當(dāng)評(píng)分波動(dòng)比較大時(shí),例如用戶B的評(píng)分,其評(píng)分被縮小。另外,注意到縮放法中的評(píng)分范圍不是從1到5,而是根據(jù)用戶的歷史評(píng)分動(dòng)態(tài)調(diào)整。

Table 1 Examples of user-rating

3.2.2 項(xiàng)目屬性的確定

推薦系統(tǒng)中,項(xiàng)目的屬性繁多,若在所有屬性上進(jìn)行推薦,勢(shì)必增加系統(tǒng)負(fù)荷,降低系統(tǒng)效率。因此,本文選取部分屬性,選取依據(jù)為數(shù)據(jù)稀疏度和數(shù)據(jù)減少率:

(1)數(shù)據(jù)稀疏度:用戶評(píng)分?jǐn)?shù)據(jù)矩陣中未評(píng)分條目所占的百分比,其公式如下:

(8)

其中Nr為評(píng)分?jǐn)?shù)量,m為矩陣行數(shù)(用戶的數(shù)量),n為矩陣列數(shù)(項(xiàng)目或者項(xiàng)目屬性值的數(shù)量)。

(2)數(shù)據(jù)減少率:用戶-項(xiàng)目屬性評(píng)分相比用戶-項(xiàng)目評(píng)分所減少的數(shù)據(jù)量的比率,定義如下:

(9)

其中,Na為用戶-項(xiàng)目屬性評(píng)分的數(shù)據(jù)量,No為用戶-項(xiàng)目評(píng)分的數(shù)據(jù)量。

在屬性選取時(shí),應(yīng)選擇數(shù)據(jù)稀疏度低的屬性以保證相似度計(jì)算的準(zhǔn)確性,提高推薦精度;選擇數(shù)據(jù)減少率高的屬性以降低系統(tǒng)數(shù)據(jù)量,提高系統(tǒng)效率。

3.2.3 推薦的生成

由于在多個(gè)屬性評(píng)分矩陣上進(jìn)行了鄰居搜索并針對(duì)每個(gè)鄰居集分別進(jìn)行了評(píng)分預(yù)測(cè),因此得到了用戶對(duì)同一項(xiàng)目的多個(gè)預(yù)測(cè)評(píng)分(初步評(píng)分)。此時(shí),系統(tǒng)不應(yīng)將每個(gè)屬性的推薦直接推送給用戶,而應(yīng)該根據(jù)用戶對(duì)不同屬性的偏好程度,對(duì)各屬性上的預(yù)測(cè)評(píng)分加權(quán)后再產(chǎn)生推薦。但是,在推薦系統(tǒng)中,每個(gè)用戶的偏好不同且不易度量,所以,本文對(duì)各屬性評(píng)分取相同權(quán)重求和后作為綜合評(píng)分,并將綜合評(píng)分由大到小排序后選取TopT項(xiàng)目推薦給用戶。

4實(shí)驗(yàn)結(jié)果及分析

4.1 實(shí)驗(yàn)數(shù)據(jù)集

本文采用MovieLens10M的擴(kuò)展數(shù)據(jù)集,包括2 113個(gè)用戶對(duì)10 197部電影的855 598條評(píng)分。其評(píng)分?jǐn)?shù)據(jù)從1到5,評(píng)分越高,表示用戶對(duì)電影越喜歡。為了分析稀疏度和系統(tǒng)規(guī)模對(duì)算法性能的影響,本文從數(shù)據(jù)集中隨機(jī)抽取三個(gè)訓(xùn)練數(shù)據(jù)集(250位用戶對(duì)431部電影的10 000條評(píng)分,250位用戶對(duì)247部電影的10 000條評(píng)分及1 000位用戶對(duì)1 101部電影的50 000條評(píng)分),對(duì)應(yīng)每個(gè)訓(xùn)練集抽取部分?jǐn)?shù)據(jù)作為測(cè)試集。訓(xùn)練集的用戶-項(xiàng)目評(píng)分矩陣和采用均值法構(gòu)造的用戶-項(xiàng)目屬性評(píng)分矩陣描述如表2所示。由于縮放法中對(duì)部分評(píng)分填充了空值,所以其構(gòu)造的評(píng)分矩陣的數(shù)據(jù)稀疏度和數(shù)據(jù)減少率都在一定程度上有所提高。需要注意的是,對(duì)于一部電影,其導(dǎo)演、國(guó)家、時(shí)間只有一個(gè),但是演員、類型、拍攝地、用戶所打標(biāo)簽并不唯一。對(duì)于前者,將屬性的每個(gè)值都作為評(píng)分矩陣的一列;針對(duì)后者,本文分兩種情況進(jìn)行處理:

(1)屬性有排序行為,則取前兩個(gè)值;

(2)屬性無(wú)排序行為,則考慮所有值。

本實(shí)驗(yàn)數(shù)據(jù)集中,演員、標(biāo)簽屬于(1),類型和拍攝地屬于(2)。

4.2 評(píng)價(jià)指標(biāo)

本文采用平均絕對(duì)偏差MAE(Mean Absolute Error)來(lái)評(píng)價(jià)算法的推薦精度。MAE的計(jì)算公式如下所示:

(10)

其中,pi為目標(biāo)用戶對(duì)項(xiàng)目(或項(xiàng)目屬性值)的預(yù)測(cè)評(píng)分,qi目標(biāo)用戶對(duì)項(xiàng)目(或項(xiàng)目屬性值)的實(shí)際評(píng)分,N為預(yù)測(cè)評(píng)分的數(shù)量。

4.3 實(shí)驗(yàn)方案

首先進(jìn)行屬性選取,本文選擇的屬性為:國(guó)家、類型、拍攝地1和時(shí)間;然后,將兩種構(gòu)造方法在各屬性上產(chǎn)生的推薦分別和直接評(píng)分的預(yù)測(cè)結(jié)果進(jìn)行比較;第三,將由兩種方法確定綜合評(píng)分與直接評(píng)分的預(yù)測(cè)結(jié)果進(jìn)行比較;最后,對(duì)比本文方法與直接評(píng)分的效率。

Table 2 Descriptions of datasets

4.4 實(shí)驗(yàn)結(jié)果及分析

4.4.1 不同構(gòu)造方法與直接評(píng)分推薦精度的對(duì)比

圖2為均值法和縮放法在數(shù)據(jù)集1上產(chǎn)生的各屬性的推薦結(jié)果對(duì)比,其他數(shù)據(jù)集的結(jié)果與此相似。由圖2可見(jiàn),均值法在單個(gè)屬性上的推薦精度基本都低于直接評(píng)分;縮放法的推薦精度在屬性國(guó)家、類型上有所改善但并不穩(wěn)定。

Figure 2 Recommendation comparison of each attribute on dataset 1圖2 數(shù)據(jù)集1上各屬性的推薦結(jié)果對(duì)比

4.4.2 組合評(píng)分與直接評(píng)分推薦精度的對(duì)比

在該部分,將兩種構(gòu)造方法得到的初步預(yù)測(cè)評(píng)分進(jìn)行組合,即加權(quán)求和后與直接評(píng)分進(jìn)行對(duì)比,在數(shù)據(jù)集1、數(shù)據(jù)集2、數(shù)據(jù)集3上的實(shí)驗(yàn)結(jié)果如圖3所示。將圖3和表2結(jié)合對(duì)比可見(jiàn),當(dāng)系統(tǒng)數(shù)據(jù)量相同、數(shù)據(jù)稀疏性比較低的時(shí)候,縮放法的推薦精度明顯高于均值法和直接評(píng)分;當(dāng)數(shù)據(jù)稀疏性相似、系統(tǒng)數(shù)據(jù)量不同時(shí),縮放法和均值法的推薦精度均高于直接評(píng)分,但前者略優(yōu)于后者。綜上,本文認(rèn)為,當(dāng)數(shù)據(jù)稀疏度較高時(shí),應(yīng)采用縮放法以取得較高的推薦精度,反之,則可任選其一。

Figure 3 Precision comparison on each data set圖3 各數(shù)據(jù)集上的推薦精度對(duì)比

4.4.3 組合評(píng)分與直接評(píng)分效率的對(duì)比

該部分以均值法在數(shù)據(jù)集1上30個(gè)鄰居用戶的推薦為例,對(duì)比組合評(píng)分與直接評(píng)分的時(shí)間復(fù)雜性問(wèn)題,各屬性上的推薦與直接評(píng)分所需時(shí)間如圖4所示??梢园l(fā)現(xiàn),單個(gè)屬性推薦所需時(shí)間均明顯低于直接評(píng)分,分析原因如下:在相似度計(jì)算階段,由于每個(gè)屬性矩陣的列的數(shù)目和數(shù)據(jù)量相對(duì)較少,所以每個(gè)屬性矩陣在該階段花費(fèi)的時(shí)間比直接評(píng)分少;在計(jì)算預(yù)測(cè)評(píng)分階段,兩種方法均是基于原始用戶-項(xiàng)目評(píng)分矩陣的,所以當(dāng)鄰居用戶數(shù)目相同時(shí),本文方法與直接評(píng)分的方法在該階段花費(fèi)時(shí)間相同。綜上,本文方法在單個(gè)屬性矩陣上的推薦所需時(shí)間少于直接評(píng)分。如前所述,本文需要計(jì)算多個(gè)評(píng)分的組合值,如果依次計(jì)算每個(gè)初步評(píng)分,本文算法的效率勢(shì)必低于直接評(píng)分。但實(shí)際上,各屬性上的推薦是相互獨(dú)立的,可以并行計(jì)算,這樣本文算法所需時(shí)間即為各個(gè)屬性推薦中所需的最長(zhǎng)時(shí)間,在圖4中即為時(shí)間屬性推薦所需的時(shí)間(30 s)。當(dāng)然,直接評(píng)分也可以并行推薦,此處不再比較。

Figure 4 Efficiency comparison between the mean value method and the directed ratings圖4 均值法在各屬性上的推薦與直接評(píng)分效率的對(duì)比

5結(jié)束語(yǔ)

本文提出了一種基于項(xiàng)目屬性評(píng)分的協(xié)同過(guò)濾推薦算法,并詳細(xì)闡述了項(xiàng)目屬性的選取原則和用戶-項(xiàng)目屬性評(píng)分矩陣的兩種構(gòu)造方法:均值法和縮放法。該算法首先計(jì)算用戶在不同屬性上的相關(guān)相似度,從而得到多個(gè)相似鄰居集;然后,針對(duì)各個(gè)鄰居集,在用戶-項(xiàng)目評(píng)分矩陣上產(chǎn)生目標(biāo)用戶對(duì)同一項(xiàng)目的多個(gè)初步預(yù)測(cè)評(píng)分;最后將評(píng)分進(jìn)行組合作為綜合評(píng)分,進(jìn)而對(duì)目標(biāo)用戶給出推薦結(jié)果。實(shí)驗(yàn)結(jié)果表明該算法能有效提高推薦精度。

參考文獻(xiàn):附中文

[1]Luo H,Niu C Y,Shen R M,et al.A collaborative filtering framework based on both local user similarity and global user similarity[J].Machine Learning,2008,72(3):231-245.

[2]Huang Chuang-guang,Yin Jian,Wang Jing,et al.Uncertain neighbors’ collaborative filtering recommendation algorithm[J].Chinese Journal of Computers,2010,33(8):1369-1377.(in Chinese)

[3]Lemire D,Maclachlan A.Slope one predictors for online rating-based collaborative filtering[C]∥Proc of SDM,2005:1-5.

[4]Mi Z,Xu C.A recommendation algorithm combining clustering method and slope one scheme[C]∥Proc of ICIC’11,2011:160-167.

[5]Melville P,Mooney R J,Nagarajan R.Content-boosted collaborative filtering for improved recommendations[C]∥Proc of the 18th International Conference on Artificial Intelligence,2002:187-192.

[6]Yang Xing-yao,Yu Jiong,Ibrahim Turgun,et al.Collaborative filtering recommendation models considering item attributes[J].Journal of Computer Applications,2013,33(11):3062-3066.(in Chinese)

[7]Huang M,Sun L,Du W.Collaborative filtering recommendation algorithm based on item attributes[C]∥Proc of the 15th IEEE/ACIS International Conference on Software Engineering,Artificial Intelligence,Networking and Parallel/Distributed Computing(SNPD),2014:1-6.

[8]Xu Hong-yan,Du Wen-gang,Feng Yong,et al.A collaborative filtering algorithm based on multi-attribute rating[J].Journal of Liaoning University(Natural Sciences Edition),2015,42(2):136-142.(in Chinese)

[9]Fan B,Cheng J J.Collaborative filtering algorithm based on users’ multi-similarity[J].Computer Science,2012,39(1):23-26.(in Chinese)

[2]黃創(chuàng)光,印鑒,汪靜,等.不確定近鄰的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(8):1369-1377.

[6]楊興耀,于炯,吐?tīng)柛ひ啦祭?,?考慮項(xiàng)目屬性的協(xié)同過(guò)濾推薦模型[J].計(jì)算機(jī)應(yīng)用,2013,33(11):3062-3066.

[8]徐紅艷,杜文剛,馮勇,等.一種基于多屬性評(píng)分的協(xié)同過(guò)濾算法[J].遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,42(2):136-142.

[9]范波,程久軍.用戶間多相似度協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)科學(xué),2012,39(1):23-26.

龔安(1971-),男,四川巴中人,博士生,副教授,研究方向?yàn)閿?shù)據(jù)庫(kù)及信息系統(tǒng)。E-mail:gongan0328@sina.com

GONG An,born in 1971,PhD candidate,associate professor,his research interests include database, and information system.

A collaborative filtering recommendation algorithm based on ratings of item attributes

GONG An,GAO Yun,GAO Hong-fu

(School of Computer & Communication Engineering,China University of Petroleum,Qingdao 266580,China)

Abstract:Collaborative filtering is one of the most successful techniques in E-commerce recommender system. However, it faces severe problems of sparse user ratings and low recommendation accuracy. To solve the problems of lower recommendation quality caused by rating data sparseness and single rating, we propose a collaborative filtering recommendation algorithm based on ratings of item attributes. Firstly, we construct user-item attribute rating matrices using the mean value method or scaling method to transform single rating to multi-rating. Based on each rating matrix of attributes, we then calculate the similarity among users to obtain the preference set of the nearest-neighbors, and accomplish a primary prediction for each set of the nearest-neighbors based on user-item rating matrices. Finally, we calculate the weighted sum of multiple primary predictions as the final scores, and then complete the recommendation. The experimental results on the extended datasets of Movie Lens show that the proposed algorithm can get higher recommendation accuracy than traditional algorithms.

Key words:attribute rating;mean value method;scaling method;collaborative filtering;recommendation

作者簡(jiǎn)介:

doi:10.3969/j.issn.1007-130X.2015.12.026

中圖分類號(hào):TP311

文獻(xiàn)標(biāo)志碼:A

基金項(xiàng)目:中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助(14CX06150A)

收稿日期:修回日期:2015-10-21

文章編號(hào):1007-130X(2015)12-2366-06

猜你喜歡
協(xié)同過(guò)濾
基于用戶評(píng)分和項(xiàng)目類偏好的協(xié)同過(guò)濾推薦算法
基于用戶相似度加權(quán)的Slope One算法
軟件(2016年4期)2017-01-20 09:44:28
圖書(shū)推薦算法綜述
改進(jìn)的協(xié)同過(guò)濾推薦算法
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過(guò)濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
基于協(xié)同過(guò)濾算法的個(gè)性化圖書(shū)推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評(píng)述
關(guān)于協(xié)同過(guò)濾推薦算法的研究文獻(xiàn)綜述
商(2016年29期)2016-10-29 15:22:08
基于混合信任模型的協(xié)同過(guò)濾推薦算法
略阳县| 邳州市| 化州市| 黎川县| 桂东县| 梁山县| 新平| 江川县| 胶州市| 唐山市| 吉首市| 农安县| 阳信县| 西昌市| 顺义区| 将乐县| 新干县| 四会市| 寻乌县| 松桃| 泸溪县| 苏尼特左旗| 依兰县| 玛曲县| 无棣县| 河北区| 博罗县| 柳河县| 古浪县| 吴川市| 怀来县| 宣汉县| 六枝特区| 东台市| 岑巩县| 海林市| 文昌市| 凌云县| 上杭县| 大英县| 天等县|