国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合用戶動(dòng)態(tài)標(biāo)簽和信任關(guān)系的協(xié)同過(guò)濾算法

2018-10-16 05:49吳鴻玲程耕國(guó)
關(guān)鍵詞:信任標(biāo)簽矩陣

吳鴻玲,程耕國(guó)

1.武漢科技大學(xué) 信息科學(xué)與工程學(xué)院,武漢 430081

2.武漢科技大學(xué) 冶金自動(dòng)化與檢測(cè)技術(shù)教育部工程研究中心,武漢 430081

1 引言

隨著電子商務(wù)的快速發(fā)展,可提供的商品信息資源也日漸豐富,傳統(tǒng)的推薦算法[1]通過(guò)分析用戶購(gòu)買(mǎi)和評(píng)分的歷史記錄來(lái)進(jìn)行預(yù)測(cè)和推薦。然而協(xié)同過(guò)濾推薦算法面臨著一些挑戰(zhàn)[2],如數(shù)據(jù)稀疏、評(píng)分?jǐn)?shù)據(jù)不均衡、冷啟動(dòng)等問(wèn)題,使得系統(tǒng)難以向新用戶準(zhǔn)確地推薦商品。

為了有效地獲取用戶和商品的相關(guān)信息,并快速準(zhǔn)確地為用戶推薦感興趣的商品,近年來(lái),基于社會(huì)化屬性的推薦算法得到了廣泛關(guān)注,有研究將信任關(guān)系引入到推薦系統(tǒng)的算法中,提出基于用戶信任關(guān)系的過(guò)濾推薦模型。例如,文獻(xiàn)[3]描述了一種基于用戶信任關(guān)系的協(xié)同過(guò)濾算法原理,它依據(jù)可靠性測(cè)試來(lái)建立鄰居用戶,進(jìn)而根據(jù)鄰居用戶進(jìn)行推薦。與“基于相似度評(píng)價(jià)的協(xié)同過(guò)濾算法”模型相比,“信任關(guān)系”模型[4]在參考用戶選取方面有所不同,它主要基于核心信任用戶的信息來(lái)向用戶推薦商品。文獻(xiàn)[5]中提出朋友關(guān)系為推薦系統(tǒng)中的重要信息之一,通過(guò)計(jì)算朋友間相似度,修正張量分解以建立推薦模型。文獻(xiàn)[6]提出一種基于共同用戶和相似標(biāo)簽的協(xié)同過(guò)濾算法,它通過(guò)把用戶個(gè)人標(biāo)簽信息加入到最近鄰協(xié)同過(guò)濾方法中以改善熱門(mén)用戶對(duì)推薦的影響。文獻(xiàn)[7]提出FTCF算法,它通過(guò)關(guān)系傳播機(jī)制尋找關(guān)系網(wǎng)絡(luò)中與目標(biāo)用戶興趣愛(ài)好相似的用戶,并找到符合目標(biāo)用戶需要的商品,利用TF-IDF思想,從用戶歷史標(biāo)簽記錄中挖掘該用戶的興趣愛(ài)好,最后將兩者進(jìn)行結(jié)合來(lái)解決數(shù)據(jù)稀疏問(wèn)題。文獻(xiàn)[8]提出一種IBCF算法,它通過(guò)在項(xiàng)目間引入信任關(guān)系來(lái)計(jì)算項(xiàng)目相似度,在一定程度上提高了推薦精準(zhǔn)度和覆蓋率。文獻(xiàn)[9]提出SemPMF算法,它使用非監(jiān)督方式生成語(yǔ)義項(xiàng)特征,并將其與用戶項(xiàng)目偏好矩陣結(jié)合起來(lái)進(jìn)行推薦,提高了推薦質(zhì)量。

然而,這些推薦系統(tǒng)存在以下不足:(1)覆蓋率指標(biāo)與推薦精度存在互斥問(wèn)題,采用的社會(huì)網(wǎng)絡(luò)信任取值為二進(jìn)制形式,即0-1表示方式,導(dǎo)致推薦精度下降;(2)二進(jìn)制0-1的表示方式會(huì)使用戶間的信息不對(duì)稱,因此信任值的合理計(jì)算對(duì)于提高算法性能至關(guān)重要;(3)以朋友關(guān)系式用戶或共同關(guān)注式用戶來(lái)計(jì)算信任值,使得信任關(guān)系中的用戶變窄,不具有普適性;(4)雖然在一定程度上提高了推薦的準(zhǔn)確度,然而其推薦歷時(shí)較長(zhǎng)。

為解決上述問(wèn)題,提出一種融合用戶動(dòng)態(tài)標(biāo)簽和用戶信任關(guān)系的矩陣概率分解模型(Probability Matrix Factorization Model based on user dynamic Tags and user Trust relationships,TTPMFM)。

2 用戶與物品間的偏好標(biāo)簽矩陣

2.1 用戶與物品間的動(dòng)態(tài)標(biāo)簽關(guān)系

用戶通過(guò)對(duì)項(xiàng)目添加注解來(lái)設(shè)置標(biāo)簽,且所設(shè)置的標(biāo)簽具有一定的社會(huì)屬性[10],能引導(dǎo)和幫助用戶瀏覽和組織資源。本文采用三元組的形式在標(biāo)簽集、用戶集和項(xiàng)目集之間建立動(dòng)態(tài)聯(lián)系,具體如圖1所示。

其中,用戶集涵蓋了系統(tǒng)中的所有用戶。標(biāo)簽集包括了系統(tǒng)使用的所有標(biāo)簽,每個(gè)標(biāo)簽可用詞語(yǔ)來(lái)表示,如“數(shù)據(jù)挖掘”。項(xiàng)目集囊括了模型中的所有項(xiàng)目資源,并且每個(gè)項(xiàng)目資源有唯一編號(hào)。

2.2 用戶動(dòng)態(tài)標(biāo)簽偏好評(píng)分矩陣

圖1 用戶標(biāo)簽動(dòng)態(tài)關(guān)系圖

用戶在訪問(wèn)項(xiàng)目資源時(shí),通常表現(xiàn)出兩類(lèi)行為:(1)對(duì)標(biāo)簽進(jìn)行查找、新增和關(guān)注;(2)與資源進(jìn)行交互,例如瀏覽、點(diǎn)擊和收藏等。這兩類(lèi)行為可以充分表現(xiàn)出用戶實(shí)時(shí)的偏好行為。通過(guò)計(jì)算這兩類(lèi)行為的相關(guān)特征,并將其作為算法預(yù)測(cè)的權(quán)重,可以更好地向用戶推薦資源。

標(biāo)簽的質(zhì)量可用Sigmoid函數(shù)[11]進(jìn)行計(jì)算,從而獲得相關(guān)特征的權(quán)重。假定項(xiàng)目i與對(duì)應(yīng)標(biāo)簽t之間的權(quán)重值為w(i,t),則可通過(guò)式(1)來(lái)計(jì)算w(i,t)。

其中,m是推薦標(biāo)簽的質(zhì)量,且滿足關(guān)系m=TF×IDF,其中TF為詞頻參數(shù),指的是文檔d中詞條t的出現(xiàn)次數(shù),IDF為文檔的逆頻文件頻率,指的是文檔頻率與詞條t頻率之間存在的反比關(guān)系。

為了對(duì)系統(tǒng)用戶與資源的交互過(guò)程進(jìn)行用戶偏好標(biāo)簽的預(yù)測(cè)推導(dǎo),將用戶的偏好用評(píng)分來(lái)表達(dá)。這種方法也稱項(xiàng)目資源評(píng)級(jí)(Item-Rating,IR)。該方法充分考慮了相關(guān)特征權(quán)重對(duì)標(biāo)簽偏好預(yù)測(cè)推導(dǎo)過(guò)程的影響。

式中,變量ru,i表示用戶u對(duì)項(xiàng)目資源i的評(píng)價(jià)分?jǐn)?shù),變量ω(i ,t)是項(xiàng)目資源i與標(biāo)簽t之間的權(quán)重,變量Mt是包含顯式標(biāo)簽t的所有項(xiàng)目資源集。

然而式(2)未考慮用戶未評(píng)價(jià)過(guò)的項(xiàng)目資源,例如,當(dāng)用戶對(duì)某個(gè)項(xiàng)目資源執(zhí)行收藏、關(guān)注等操作時(shí),表明此類(lèi)項(xiàng)目資源是用戶偏好的。為了展示隱式標(biāo)簽對(duì)項(xiàng)目資源預(yù)測(cè)推導(dǎo)的作用,采用公式(3)對(duì)用戶偏好進(jìn)一步預(yù)測(cè):

綜合考慮顯隱式標(biāo)簽,即將式(2)和式(3)結(jié)合,則用戶與物品間的偏好標(biāo)簽矩陣為:

式中,TGut為融合顯式標(biāo)簽與隱式標(biāo)簽后的用戶偏好標(biāo)簽矩陣,且使用α(0≤α≤1)調(diào)節(jié)因子來(lái)為物品顯式標(biāo)簽與物品隱式標(biāo)簽設(shè)置權(quán)重。

3 用戶信任關(guān)系矩陣

基于圖的概念引出用戶信任關(guān)系圖,并分析用戶信任關(guān)系的建立過(guò)程。同時(shí),在用戶信任關(guān)系的基礎(chǔ)上,建立基于用戶信任關(guān)系圖的反饋機(jī)制。

3.1 用戶信任關(guān)系分析

從人類(lèi)社會(huì)關(guān)系的推薦角度來(lái)看,人們通常傾向于信任來(lái)自其熟人所推薦的信息。在電子商務(wù)推薦系統(tǒng)中,所有用戶都可以通過(guò)圖來(lái)建立用戶間的信任關(guān)系,如圖2的A所示,實(shí)線代表用戶間的直接信任關(guān)系(N1信任N2,N2信任N3)。通過(guò)N2與N3之間的信任關(guān)系,用戶N1間接地信任N3。如果N2與N3之間沒(méi)有信任關(guān)系,那么不可能在N1和N3之間建立信任關(guān)系,如圖2的B所示。下面給出與信任相關(guān)的一些定義。

定義1(直接信任)通過(guò)定義一個(gè)三元組<i,j,DTi,j>來(lái)表示直接信任,其中三元組代表從節(jié)點(diǎn)i指向節(jié)點(diǎn) j的有向邊,DTi,j代表節(jié)點(diǎn)i到節(jié)點(diǎn) j的直接信任值。

定義2(間接信任)通過(guò)定義一個(gè)三元組<i,j,IDTi,j>來(lái)表示間接信任,其中節(jié)點(diǎn)i通過(guò)有限跳H(H>1,H∈N)到達(dá)節(jié)點(diǎn) j,IDTi,j代表節(jié)點(diǎn)i到節(jié)點(diǎn) j的間接信任值。

定義3(直接信任偏好準(zhǔn)則)對(duì)于信任圖中的任何一個(gè)節(jié)點(diǎn)i,它的直接信任節(jié)點(diǎn)比間接信任節(jié)點(diǎn)更加可信。例如圖2的A中DTN1N2比IDTN1N3可信度更高,即DTN1N2>IDTN1N3。

圖2 人類(lèi)社會(huì)中的信任過(guò)程

3.2 用戶信任關(guān)系的建立過(guò)程

用戶信任關(guān)系的主要因素是用戶偏好相似性和用戶的影響力。為了在用戶間建立信任值,需設(shè)置閾值θ來(lái)獲取用戶之間的相似度,如式(5):

用戶間的信任關(guān)系具有轉(zhuǎn)移性和方向性等非對(duì)稱特性,通過(guò)使用這些非對(duì)稱的信任關(guān)系信息,可以有效緩解用戶評(píng)分矩陣的數(shù)據(jù)稀疏問(wèn)題。為了測(cè)量用戶間的影響力,使用Jaccard距離[12]來(lái)衡量用戶的非對(duì)稱關(guān)系。的計(jì)算公式如式(6):

用戶間的信任值TRu,v主要由用戶間相似度和用戶間影響力組成,通過(guò)分配不同的權(quán)值計(jì)算TRu,v,如式(7):

3.3 基于用戶關(guān)系圖的信任反饋機(jī)制

定義4(信任查詢機(jī)制)根據(jù)輸入的查詢深度Level,查詢與活躍用戶節(jié)點(diǎn)Ni有關(guān)聯(lián)的直接信任值和間接信任值,直到查詢深度大于Level為止。將所有查詢到的直接信任用戶與間接信任用戶存放到信任用戶TNLl列表中。

定義5(反饋機(jī)制)基于信任值TRu,v(包括直接信任值和間接信任值)和項(xiàng)目評(píng)分值Rvi,根據(jù)公式(8)計(jì)算項(xiàng)目i的預(yù)測(cè)評(píng)分PRV(i)。如果PRV(i)與用戶的實(shí)際評(píng)分Rui相差不大,即滿足式(9),則將信任用戶列表TNLl中的top-N反饋給用戶u;如果相差太大,則更改閾值θ,直到項(xiàng)目i的預(yù)測(cè)評(píng)分PRV(i)與用戶的實(shí)際評(píng)分Rui相差不大為止。其中,Rvi為信任用戶對(duì)項(xiàng)目的評(píng)分值,Rui為活躍用戶對(duì)項(xiàng)目i的評(píng)分值。

式中,Level代表距離節(jié)點(diǎn)Ni的距離;W(l,α)代表信任值的加權(quán)因子函數(shù),如式(10)所示;TNLl代表活躍用戶U直接信任和間接信任的用戶列表。

式中,α代表信任值初始衰減因子。

基于前文所述的用戶信任關(guān)系,提出一種基于用戶信任關(guān)系圖的反饋機(jī)制,如圖3所示。

圖3 基于信任的用戶反饋模型

圖3 中,邊緣代表不同節(jié)點(diǎn)之間的信任關(guān)系。當(dāng)請(qǐng)求用戶U0的推薦信息時(shí),首先,該節(jié)點(diǎn)根據(jù)信任查詢機(jī)制向其直接信任節(jié)點(diǎn)(U1和U4)發(fā)送信任查詢信息,這些節(jié)點(diǎn)也同樣向其受信任的節(jié)點(diǎn)發(fā)送信任查詢信息,直到信任查詢過(guò)程結(jié)束;然后,基于反饋機(jī)制選擇信任值高的前N個(gè)用戶,并反饋其所有產(chǎn)品的信任值。通過(guò)此信任反饋模型,可以得到用戶U0的受信任節(jié)點(diǎn)(包括直接信任節(jié)點(diǎn)和間接信任節(jié)點(diǎn))所推薦項(xiàng)目的綜合評(píng)分。

4 融合用戶動(dòng)態(tài)標(biāo)簽與信任關(guān)系的概率矩陣分解模型

在矩陣概率分解過(guò)程中,主要基于潛在用戶特征與信任間存在的內(nèi)部關(guān)聯(lián)來(lái)實(shí)現(xiàn)信任矩陣的預(yù)測(cè)和計(jì)算。

文獻(xiàn)[13]中所使用的矩陣概率分解模型(Probability Matrix Factorization Model,PMFM)如圖4所示,該矩陣分解模型具有線性概率特征,它將用戶對(duì)項(xiàng)目的評(píng)價(jià)問(wèn)題轉(zhuǎn)換為概率問(wèn)題,其中σν和σμ為用戶和物品的隱式特征向量,σR為用戶評(píng)分?jǐn)?shù)據(jù)。然而,該模型未考慮到參與評(píng)分用戶的信任級(jí)別以及用戶與物品標(biāo)簽間的動(dòng)態(tài)聯(lián)系。實(shí)際評(píng)分過(guò)程中不同用戶具有不同的定位和角色,過(guò)于均值化的評(píng)分概率預(yù)測(cè)不利于體現(xiàn)重點(diǎn)用戶的評(píng)分意見(jiàn),不能獲得較為合理的決策結(jié)果。同時(shí),用戶對(duì)物品標(biāo)簽的偏好是動(dòng)態(tài)的,在實(shí)際推薦系統(tǒng)中,需要獲取用戶與物品標(biāo)簽的偏好交互行為,這樣才能更好地向用戶推薦商品。

圖4 PMFM模型

為解決上述問(wèn)題,融合信任關(guān)系和動(dòng)態(tài)標(biāo)簽,設(shè)計(jì)如圖5所示TTPMFM模型。在TTPMFM模型中,評(píng)分矩陣為n行m列,其中,第 j行對(duì)應(yīng)的潛在特征為uj,第i列對(duì)應(yīng)的潛在特征為vi。,Nui為具有相似偏好標(biāo)簽的用戶集合,Nvi為用戶u所信任的用戶集合,tg(u1,t)為用戶u1與物品標(biāo)簽t之間的關(guān)聯(lián)程度,tr(v1,u)為用戶v1與用戶u之間的信任程度,且tg(u1,t)與tr(v1,u)分別來(lái)源于用戶偏好標(biāo)簽矩陣和用戶信任關(guān)系矩陣。

圖5 TTPMFM模型

在進(jìn)行模型求解過(guò)程中,uj和vi兩個(gè)潛在特征均服從高斯特征分布,以來(lái)表示,融合用戶動(dòng)態(tài)偏好標(biāo)簽矩陣和用戶信任關(guān)系矩陣后,用戶動(dòng)態(tài)偏好矩陣與物品潛在特征的聯(lián)合概率分布為:

同理,用戶信任關(guān)系矩陣與用戶潛在特征的聯(lián)合概率分布為:

并且在TTPMFM模型中,U和V相互獨(dú)立,評(píng)分矩陣R的條件概率為:

結(jié)合公式(11)、(12)和(13),通過(guò)貝葉斯推理可以得到用戶和物品潛在特征的后驗(yàn)概率分布為:

利用梯度下降法來(lái)對(duì)目標(biāo)函數(shù)進(jìn)行求解,對(duì)每個(gè)用戶Uj和每件物品Vi分別求偏導(dǎo),如式(16)和式(17):

綜上所述,TTPMFM模型的求解過(guò)程描述如下。

輸入:用戶與物品之間的動(dòng)態(tài)偏好標(biāo)簽矩陣TGut,用戶信任關(guān)系矩陣TRu,v,用戶項(xiàng)目的評(píng)分矩陣R,近鄰參數(shù)k。

輸出:預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分值。

求解步驟:

(1)根據(jù)數(shù)據(jù)集計(jì)算用戶-項(xiàng)目評(píng)分矩陣。

(2)根據(jù)公式(4)計(jì)算用戶-項(xiàng)目的動(dòng)態(tài)偏好標(biāo)簽矩陣。

(3)根據(jù)公式(5)計(jì)算目標(biāo)用戶與其他用戶之間的信任關(guān)系。

(4)根據(jù)步驟(2)和(3)得到的矩陣,利用K-NN算法[14]獲得目標(biāo)用戶u的K個(gè)用戶-項(xiàng)目偏好標(biāo)簽集合,以及K個(gè)與目標(biāo)用戶信任值極高的近鄰用戶集合。

(5)設(shè)置迭代初始步數(shù)i=1,將步驟(4)得到的集合帶入公式(15)。

(6)根據(jù)梯度下降法原理,計(jì)算目標(biāo)函數(shù)的下降可行方向d(i),并依據(jù)公式(15)中的約束條件來(lái)計(jì)算下降方向的步長(zhǎng)[0,λmax]。

(7)根據(jù)步驟(6)所獲得的下降方向以及步長(zhǎng)范圍,利用0.618法[15]計(jì)算最優(yōu)步長(zhǎng)λi。

(8)遍歷步驟(4)所得到集合的每個(gè)數(shù)據(jù)。

(9)獲得公式(16)、(17)的最優(yōu)解,最終得到目標(biāo)用戶u所有參數(shù)。

(10)對(duì)步驟(9)得到的目標(biāo)用戶參數(shù)進(jìn)行矢量相乘,即獲得目標(biāo)用戶對(duì)待評(píng)物品的預(yù)測(cè)值。

5 實(shí)驗(yàn)結(jié)果及分析

為了進(jìn)一步提高計(jì)算速度,實(shí)驗(yàn)平臺(tái)使用VMware Workstation9.0虛擬軟件將1臺(tái)TS250聯(lián)想塔式服務(wù)器(Intel至強(qiáng)E3-1200 v6處理器,8 GB內(nèi)存)虛擬成8臺(tái)虛擬主機(jī),1臺(tái)惠普PAVILION 14-AL125TX作為Master,在Ubuntu 12.0.4系統(tǒng)上部署計(jì)算機(jī)集群,集群中包括8個(gè)DataNode和1個(gè)TaskTracker。

5.1 實(shí)驗(yàn)數(shù)據(jù)

在MovieLens數(shù)據(jù)集以及Jester-Data數(shù)據(jù)集上對(duì)所提模型進(jìn)行驗(yàn)證。在基于包含用戶對(duì)電影的評(píng)分信息、用戶間的評(píng)價(jià)信息、用戶的人口特征統(tǒng)計(jì)等類(lèi)型信息的數(shù)據(jù)集上預(yù)測(cè)模型做出的用戶評(píng)分。使用Python爬蟲(chóng)技術(shù)隨機(jī)從淘票票站點(diǎn)抓取了943個(gè)用戶對(duì)1 682部電影的評(píng)分?jǐn)?shù)據(jù),共計(jì)100 000條評(píng)分信息,其中每組用戶至少對(duì)10組標(biāo)簽進(jìn)行了評(píng)分,原評(píng)分區(qū)間為1~10之間的整數(shù),為了便于計(jì)算,將其歸一化為0~1之間的區(qū)間。評(píng)分值越高,則表明用戶對(duì)電影的喜好程度越高。即在MovieLens測(cè)試集中,共有943組用戶,1 682組電影,100 000條標(biāo)簽評(píng)分信息,其中每組用戶至少對(duì)10組標(biāo)簽進(jìn)行了評(píng)分??紤]到Jester-Data數(shù)據(jù)集過(guò)于稠密,因此該數(shù)據(jù)集(用Python技術(shù)隨機(jī)在百度新聞?wù)军c(diǎn)上抓取數(shù)據(jù))選取1 743組用戶,這些用戶對(duì)121組新聞進(jìn)行了評(píng)價(jià),包含18 924組用戶標(biāo)簽評(píng)分信息,且每組用戶至少包含一組用戶標(biāo)簽評(píng)分信息。這兩個(gè)數(shù)據(jù)集的相關(guān)屬性如表1所示。

為了使實(shí)驗(yàn)結(jié)果不失一般性,采用5-fold交叉驗(yàn)證方法,將數(shù)據(jù)集分為測(cè)試集和訓(xùn)練集,比例為1∶4,且這兩個(gè)集合互補(bǔ),能涵蓋整個(gè)數(shù)據(jù)集。

表1 數(shù)據(jù)集相關(guān)屬性

5.2 評(píng)價(jià)指標(biāo)

(1)平均絕對(duì)誤差指標(biāo)MAE:

其中,pi表示用戶的預(yù)測(cè)評(píng)分,ri表示用戶的實(shí)際評(píng)分,N表示評(píng)分條數(shù)。平均絕對(duì)誤差值越小,推薦系統(tǒng)的推薦精度越高。

(2)平均準(zhǔn)確率指標(biāo)Precision和平均召回率指標(biāo)Recall:

其中,Ru為模型根據(jù)訓(xùn)練集用戶的行為給用戶做出的Top-N推薦集,Tu為用戶對(duì)測(cè)試集所做出的正面評(píng)分集,N為測(cè)試用戶的數(shù)目。平均準(zhǔn)確率和平均召回率的值越大,所預(yù)測(cè)出的項(xiàng)目越接近目標(biāo)用戶,表現(xiàn)出的推薦效果越好。

5.3 實(shí)驗(yàn)結(jié)果分析

(1)閾值對(duì)數(shù)據(jù)集的影響

在Jester-Data測(cè)試集和MovieLens測(cè)試集上設(shè)置不同的閾值,并設(shè)定用戶近鄰參數(shù)值為8,測(cè)試這兩個(gè)數(shù)據(jù)集的平均絕對(duì)誤差。實(shí)驗(yàn)結(jié)果如圖6所示。

圖6 不同閾值下的平均絕對(duì)誤差

從圖6可以看出,隨著閾值θ不斷增大,MovieLens測(cè)試集的平均絕對(duì)誤差呈下降趨勢(shì)(先迅速下降,后趨于平穩(wěn))。而對(duì)于Jester-data測(cè)試集,其平均絕對(duì)誤差先緩慢下降,再逐漸增加,最后趨于平穩(wěn)。這是由于Jesterdata測(cè)試集的規(guī)模要小于MovieLens測(cè)試集的規(guī)模。當(dāng)閾值θ較小時(shí),由于MovieLens測(cè)試集的規(guī)模大,當(dāng)前用戶的信任關(guān)系用戶較多,計(jì)算用戶相似性的時(shí)間復(fù)雜度和空間復(fù)雜度較大,因此無(wú)法快速準(zhǔn)確地為當(dāng)前用戶生成推薦;而Jester-data測(cè)試集的規(guī)模小,通過(guò)公式(5)、(6)、(7)可以計(jì)算出較高信任值的用戶,因此可以為當(dāng)前用戶準(zhǔn)確地生成推薦信息。當(dāng)閾值θ較大時(shí),由于Jester-data測(cè)試集的規(guī)模小,當(dāng)前用戶的信任關(guān)系用戶較少,導(dǎo)致相似性用戶較少,無(wú)法計(jì)算出較高信任值的用戶,因此缺少足夠的評(píng)分?jǐn)?shù)據(jù)來(lái)進(jìn)行預(yù)測(cè)推薦;而MovieLens測(cè)試集的規(guī)模大,可以計(jì)算出較高信任值用戶,因此可以得到足夠的評(píng)分?jǐn)?shù)據(jù)來(lái)進(jìn)行預(yù)測(cè)推薦。

由圖6可知,對(duì)于Jester-data數(shù)據(jù)集,閾值θ設(shè)定為0.1時(shí),推薦性能最佳;對(duì)于MovieLens數(shù)據(jù)集,閾值θ設(shè)定為1時(shí),推薦性能最佳。因此,針對(duì)不同的數(shù)據(jù)集,需要選取合適的閾值θ才能獲取準(zhǔn)確的推薦信息。

(2)與其他算法性能的比較

為了驗(yàn)證所提算法的性能,以MAE、Precision以及Recall為評(píng)估指標(biāo),選取FTCF[16]、IBCF[17]以及SemPMF[18]3種經(jīng)典的協(xié)同過(guò)濾算法,在不同近鄰參數(shù)K下進(jìn)行訓(xùn)練和測(cè)試。如圖7為4種算法在不同近鄰參數(shù)K下的平均絕對(duì)誤差、準(zhǔn)確率及召回率的對(duì)比。

圖7 不同近鄰參數(shù)K的實(shí)驗(yàn)結(jié)果

從圖7的實(shí)驗(yàn)結(jié)果可以看出,與FTCF、IBCF以及SemPMF算法相比,本文算法在不同近鄰參數(shù)K的環(huán)境下,均可獲得良好的性能。這是由于本算法在推薦過(guò)程中融合了用戶的動(dòng)態(tài)偏好標(biāo)簽和信任關(guān)系,使得推薦模型能迅速感知用戶的喜好并基于用戶的社會(huì)化屬性選擇近鄰用戶,從而向當(dāng)前用戶準(zhǔn)確地推薦商品。

6 結(jié)束語(yǔ)

針對(duì)社交網(wǎng)絡(luò)的推薦因信任值存在互斥導(dǎo)致的推薦精度下降的問(wèn)題,提出了一種融合用戶動(dòng)態(tài)標(biāo)簽和用戶信任關(guān)系的矩陣概率分解模型。它在一定程度上緩解了傳統(tǒng)的協(xié)同過(guò)濾算法存在的數(shù)據(jù)稀疏、用戶評(píng)分不均等問(wèn)題,提高了協(xié)同過(guò)濾推薦算法的性能。實(shí)驗(yàn)結(jié)果表明,該算法模型在絕對(duì)誤差均值、準(zhǔn)確率與召回率方面獲得了不錯(cuò)的效果。目前,有關(guān)推薦系統(tǒng)中信任關(guān)系的研究主要體現(xiàn)在強(qiáng)關(guān)系和弱關(guān)系上,而關(guān)于非信任關(guān)系的研究很少,本文接下來(lái)可以針對(duì)非信任關(guān)系做進(jìn)一步的研究。

猜你喜歡
信任標(biāo)簽矩陣
無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
嚶嚶嚶,人與人的信任在哪里……
初等行變換與初等列變換并用求逆矩陣
讓衣柜擺脫“雜亂無(wú)章”的標(biāo)簽
矩陣
矩陣
矩陣
科學(xué)家的標(biāo)簽
信任
绵竹市| 灵武市| 太谷县| 长沙县| 汤阴县| 泽普县| 湛江市| 曲周县| 镇雄县| 五大连池市| 叶城县| 临汾市| 芦溪县| 小金县| 安塞县| 大同市| 缙云县| 如皋市| 阿拉善左旗| 牙克石市| 迁安市| 定西市| 湄潭县| 登封市| 泰兴市| 乌鲁木齐县| 营山县| 潮安县| 常州市| 桂平市| 门源| 鲁山县| 镇康县| 浮山县| 长沙县| 吉木乃县| 高青县| 达尔| 城固县| 拉孜县| 太白县|