国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隱性社交圈的推薦算法?

2021-08-08 10:57:18生佳根
關(guān)鍵詞:社交圈正則隱性

李 君 生佳根 陳 瀛

(江蘇科技大學(xué)計(jì)算機(jī)學(xué)院 鎮(zhèn)江212000)

1 引言

隨著在線商店的急劇增長,推薦系統(tǒng)等信息過濾技術(shù)被廣泛應(yīng)用于亞馬遜等網(wǎng)站。為了避免大量信息和相關(guān)產(chǎn)品的描述阻止用戶快速到達(dá)他們感興趣的產(chǎn)品,推薦系統(tǒng)利用特定的排名標(biāo)準(zhǔn),該標(biāo)準(zhǔn)將向用戶建議潛在產(chǎn)品的列表,以便用戶可以快速選擇他們感興趣的產(chǎn)品。通過這種方式,推薦系統(tǒng)在實(shí)踐中顯示出很大的力量來促進(jìn)在線商店的銷售。

雖然在線網(wǎng)站的商業(yè)成功已經(jīng)說明了推薦系統(tǒng)的重要作用,但傳統(tǒng)的推薦系統(tǒng)卻存在幾個(gè)缺點(diǎn)。首先,數(shù)據(jù)稀疏性是大量產(chǎn)品大量信息的固有挑戰(zhàn)。根據(jù)最近的調(diào)查報(bào)告,用戶的可用評(píng)價(jià)通常不到所有產(chǎn)品的1%。因此,如何向僅評(píng)價(jià)少數(shù)產(chǎn)品或不評(píng)價(jià)產(chǎn)品的用戶推薦相關(guān)產(chǎn)品是一項(xiàng)巨大的挑戰(zhàn)。其次,傳統(tǒng)的推薦系統(tǒng)往往忽略了共同感興趣的用戶之間的社交信息。這與實(shí)際情況相矛盾。在現(xiàn)實(shí)生活中,我們很容易受到朋友和一些擁有共同感興趣的專家的影響。當(dāng)我們想要購買某種產(chǎn)品時(shí),我們傾向于向曾經(jīng)購買過這些產(chǎn)品的朋友或與擁有共同品味的人詢問這些產(chǎn)品。此外,即使對(duì)于一些不知名的人,如果他們與我們分享幾乎相同的興趣,我們可能會(huì)與他們交朋友。由于這種直覺,許多社會(huì)推薦系統(tǒng)[1~3]被提出并且優(yōu)于沒有社會(huì)信息的傳統(tǒng)推薦系統(tǒng)。然而,一些在線系統(tǒng),如亞馬遜、eBay等,并沒有形成圍繞某些領(lǐng)域的朋友或?qū)<业拿鞔_社區(qū),因此很難將社交信息用于此類網(wǎng)站中的推薦。這是否意味著社交推薦方法不再適用于此類網(wǎng)站?如何通過用戶的可用信息構(gòu)建隱性社交圈來提高非社交性網(wǎng)站的推薦性能一直激勵(lì)科研者的工作。

本文旨在分析用戶之間的相似性并預(yù)測(cè)它們之間潛在的加權(quán)連接。在我們的框架中,根據(jù)朋友的實(shí)際建議做出以下假設(shè)。

1)高度共享具有特定共同興趣的用戶傾向于形成社區(qū)。

2)用戶可能很容易受到同一社區(qū)中的朋友的影響,并傾向于關(guān)注他們朋友的推薦。

3)用戶可能同時(shí)擁有多個(gè)與他們的朋友不同的興趣。因此,來自一個(gè)用戶的朋友的影響將被不均衡地加權(quán)。

基于上述假設(shè),提出了一種策略來分析用戶之間的相似性,并使用亞馬遜的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。至于亞馬遜數(shù)據(jù)集,由于我們?cè)谟脩糁g幾乎沒有明確的社會(huì)關(guān)系,因此對(duì)我們框架的貢獻(xiàn)在于如何從各種數(shù)據(jù)中挖掘?qū)ν扑]有用的社會(huì)信息,例如對(duì)某些特定產(chǎn)品的評(píng)論、對(duì)屬于特定主題的產(chǎn)品的評(píng)分等。

我們工作的主要貢獻(xiàn)可歸納如下:

1)提出一種基于PCC[4]方法來挖掘用戶之間的相似性,并構(gòu)建出一個(gè)隱式社交圈圖。

2)將社交推薦方法應(yīng)用于非社交性商品網(wǎng)站。

2 相關(guān)工作

在本節(jié)中,回顧了文獻(xiàn)中幾種流行的推薦系統(tǒng)方法,包括傳統(tǒng)的推薦系統(tǒng),特別是基于矩陣分解的方法,以及社會(huì)推薦方法。

2.1 傳統(tǒng)的推薦系統(tǒng)

傳統(tǒng)的推薦系統(tǒng)通常僅利用用戶項(xiàng)評(píng)級(jí)信息進(jìn)行推薦。推薦系統(tǒng)中最流行的技術(shù)之一是協(xié)同過濾。

通常,協(xié)同過濾方法包括兩種類型的方法:基于記憶的方法以及基于模型的方法?;谟洃浀姆椒▽W⒂谑褂妙A(yù)定義的相似度計(jì)算函數(shù)來找到用于生成預(yù)測(cè)的類似用戶或項(xiàng)目?;谟洃浀姆椒梢赃M(jìn)一步分類為基于用戶[4~6]和基于項(xiàng)目[7~9]的方法,基于是否使用類似用戶或類似項(xiàng)目。

推薦系統(tǒng)中的矩陣分解方法通常尋求將用戶項(xiàng)目評(píng)級(jí)矩陣分解為兩個(gè)低級(jí)別用戶特定和項(xiàng)目特定矩陣,然后利用分解矩陣進(jìn)行進(jìn)一步預(yù)測(cè)。使用奇異值分解(SVD)可以很容易地解決基于最小化和平方誤差的低秩矩陣近似,并且Srebro[24]在中提出了用于求解加權(quán)低壓近似的簡單且高效的期望最大化(EM)算法。Srebro[10]等提出了一種矩陣分解方法來約束U和V的范數(shù)而不是它們的維數(shù)。Salakhutdinov[11]等中提出了具有高斯觀測(cè)噪聲的概率線性模型,可以通過最大化所提出的概率可能性函數(shù)來學(xué)習(xí)用戶和項(xiàng)目潛在因素。所提出的方法非常有效且高效,并且該方法基本上等同于正則化SVD方法。在中提出的后續(xù)工作中,Sal?akhutdinov[25]等將GaussianWishart先驗(yàn)放置在用戶和項(xiàng)目超參數(shù)上,這可以進(jìn)一步提高預(yù)測(cè)準(zhǔn)確性。最近,Koren[12~14]等提出了幾種增強(qiáng)的矩陣分解方法,它們通過結(jié)合異構(gòu)信息來說明有希望的結(jié)果。

2.2 顯性社交推薦系統(tǒng)

上述傳統(tǒng)推薦技術(shù)都是基于用戶項(xiàng)目評(píng)分矩陣,并忽略用戶之間豐富的關(guān)系。最近,由于Web 2.0社交網(wǎng)站的普及,許多研究人員開始研究社交推薦系統(tǒng)[15~20]。

由于每種方法的性質(zhì),社會(huì)推薦技術(shù)也可以分為兩類:基于記憶的[15~17]和基于模型的[18~20]。基于記憶的方法通常直接或間接地使用社交信任程度來表示兩個(gè)用戶之間的相似性。Ma[21]提出了一種用于推薦系統(tǒng)的信任感知方法。在這項(xiàng)工作中,協(xié)同過濾過程被用戶的聲譽(yù)所取代,這是通過傳播信任來計(jì)算的。計(jì)算信任度以替換兩個(gè)用戶之間的相似度值。對(duì)大型社會(huì)推薦數(shù)據(jù)集-Epinions的實(shí)驗(yàn)表明,這項(xiàng)工作增加了覆蓋范圍(可預(yù)測(cè)的評(píng)分?jǐn)?shù)),同時(shí)不降低準(zhǔn)確性(預(yù)測(cè)誤差)。Smyth[17]等提出了兩種信任感知方法來改進(jìn)標(biāo)準(zhǔn)協(xié)同過濾方法。實(shí)驗(yàn)結(jié)果表明,用戶信任信息有助于提高推薦質(zhì)量。

最近,通過利用矩陣分解框架的有效性和效率,已經(jīng)提出了幾種基于模型的新方法,通過結(jié)合用戶社交信息來增強(qiáng)傳統(tǒng)的矩陣分解方法。Ma[20]等提出通過將矩陣分解目標(biāo)函數(shù)與用戶社會(huì)正則化條件約束,提出了兩種社會(huì)正則化方法。與先前的方法不同,所提出的方法非常通用,它們不僅與用戶信任關(guān)系一起工作,而且與用戶社交朋友關(guān)系也很好地工作。實(shí)驗(yàn)分析表明,所提出的框架優(yōu)于其他最先進(jìn)的方法。

盡管上述基于矩陣分解的社交推薦方法在推薦系統(tǒng)的研究中向前邁出了一小步,但是它們的效用受到限制,因?yàn)檫@些方法需要使用明確的用戶社交信息,這在大多數(shù)推薦系統(tǒng)中并不總是可用的。Ma[21]等簡要介紹了使用隱式信息的想法,然而,許多有趣的問題都是無人看管的。在本文中,我們提出了一個(gè)關(guān)于隱性社交推薦的實(shí)驗(yàn)研究,它為當(dāng)前的社會(huì)推薦技術(shù)提供了有用的見解。

3 基于融合隱性社交圈信息的推薦方法

在本節(jié)中,我們首先介紹了文獻(xiàn)中提出的基于矩陣分解的社會(huì)推薦方法。然后,我們將說明如何在顯式用戶社交信息不可用的情況下利用隱式用戶社交信息來進(jìn)一步改進(jìn)推薦方法。

3.1 社會(huì)正則化

在文獻(xiàn)[20]中,為了更準(zhǔn)確地模擬社會(huì)推薦問題,提出了一種社會(huì)推薦方法——社會(huì)正則化。該方法的目標(biāo)函數(shù)為其中用戶ui和項(xiàng)目vj是具有d維的列向量;Ii,j是如果用戶i對(duì)項(xiàng)目j進(jìn)行評(píng)分則等于1,否則等于0;α是正則化參數(shù),si,f表示用戶i和用戶f之間的相似性,而F+(i)是從顯性社交信息中提取出的用戶i的朋友;λ1、λ2表示正則化參數(shù)。

在該方法中,社交網(wǎng)絡(luò)信息被用于設(shè)計(jì)社會(huì)正則化項(xiàng)以約束并優(yōu)化矩陣分解目標(biāo)函數(shù)。社會(huì)正則也間接地模擬了品味的傳播,從而達(dá)到通過朋友的興趣愛好來模擬預(yù)測(cè)目標(biāo)用戶可能的喜好,并以此為依據(jù)推薦給用戶。

3.2 隱性社交圈定義

如第二、三節(jié)兩部分所述,所有社交推薦方法都需要利用額外的顯式用戶社交信息,這可能會(huì)限制這些方法的影響和利用。在本節(jié)中,我們尋求一種替代方法來在顯式用戶社交關(guān)系不可用時(shí)計(jì)算隱式用戶社交信息。

社交推薦方法的本質(zhì)在于每個(gè)用戶所擁有的明確的社交信息。然后可以利用這些社交朋友的信息來幫助更準(zhǔn)確地模擬用戶的品味。在缺少明確的社交信息的情況下,我們總是可以計(jì)算出一組擁有前N個(gè)類似用戶,然后將這些類似用戶插入上述社交推薦矩陣分解框架。

我們可以在文獻(xiàn)中借用幾種方法來比較兩個(gè)用戶之間的相似性。在本文中,我們采用最流行的方法Pearson Correlation Coefficient(PCC)[4],其定義如下:

其中I(i)是由用戶i評(píng)定的一組項(xiàng)目,rˉi表示用戶i的對(duì)商品評(píng)分的平均值。根據(jù)這個(gè)定義,用戶相似度si,f的范圍是[-1,1],值越大意味著用戶i和f越相似。我們使用映射函數(shù)f(x)=(x+1)/2將PCC相似度的范圍限制為[0,1]?;赑CC相似性,然后可以注入計(jì)算的Top-N類似用戶

基于PCC相似性,然后可以將計(jì)算出的Top-N相似用戶注入到式(1)中詳述的目標(biāo)函數(shù)中。類似用戶取出之后,我們假設(shè)這些用戶之間存在一些高度隱含的社交關(guān)系并且將PCC值si,f指定為它們之間鏈接的權(quán)重。通過這種方式,我們可以建立一個(gè)非常密集的隱性社交圖,圖中的用戶都是目標(biāo)用戶的隱性朋友。

3.3 隱性社交推薦算法(ISRMF)

3.1與3.2兩節(jié),分別講解了基于矩陣分解的社交推薦方法和隱性社交圈的構(gòu)建。本節(jié)講解如何將這兩種方法融合,建立模型,使之適用于非社交性電商網(wǎng)站中,從而提高推薦的性能,改善用戶的體驗(yàn)。該算法的目標(biāo)函數(shù)為

其中用戶ui和項(xiàng)目vj是具有d維的列向量;Ii,j是如果用戶i對(duì)項(xiàng)目j進(jìn)行評(píng)分則等于1,否則等于0;β是正則化參數(shù);si,f表示用戶i和用戶f之間的隱性連接權(quán)重,而F-(i)是隱性社交圈中用戶i的隱性朋友集;λ1,λ2表示正則化參數(shù);g(·)表示邏輯函數(shù);<·,·>表示內(nèi)積。

根據(jù)目標(biāo)函數(shù)對(duì)于每個(gè)觀察到的評(píng)分rij,通過以下隨機(jī)梯度下降更新規(guī)則來學(xué)習(xí)潛在參數(shù),從而得到用戶潛在的興趣特征,系統(tǒng)再根據(jù)此特征進(jìn)行準(zhǔn)確的商品推薦。

其中γ1,γ2是學(xué)習(xí)速率模型受隱性朋友用戶信息約束,更好地學(xué)習(xí)用戶的潛在特征向量,從而生成更準(zhǔn)確的推薦結(jié)果。

4 實(shí)驗(yàn)及結(jié)果分析

4.1 實(shí)驗(yàn)數(shù)據(jù)

我們使用的數(shù)據(jù)集包含亞馬遜的電影評(píng)論。這些數(shù)據(jù)涵蓋了超過10年的時(shí)間,包括截至2012年10月的所有800萬條評(píng)論。評(píng)論包括產(chǎn)品和用戶信息,評(píng)分以及純文本評(píng)論。

表1 數(shù)據(jù)統(tǒng)計(jì)

4.2 實(shí)驗(yàn)結(jié)果分析及評(píng)價(jià)標(biāo)準(zhǔn)

采用以下經(jīng)典推薦方法通過對(duì)比來幫助證明隱性社交圈的有用性。

1)UserCF:基于用戶內(nèi)容進(jìn)行推薦,適合用戶較小的場景;

2)ItemCF:基于物品內(nèi)容進(jìn)行推薦,適合物品數(shù)目小于用戶數(shù)目的場景;

3)PMF:這種方法由Salakhutdinov和Minh[22]提出。它僅使用用戶項(xiàng)矩陣進(jìn)行推薦;

4)RPMF:這種方法由Erheng Zhong[23]提出。它使用決策樹結(jié)構(gòu)通過合并上下文信息來構(gòu)建用于推薦的分層矩陣分解框架。

表2 顯示了上述方法的RMSE和MAE值,即Sorec,SoReg,SocialMF和ISRMF。均 方 根 誤 差(RMSE)和絕對(duì)誤差均值(MAE)通常用作推薦系統(tǒng)的評(píng)估標(biāo)準(zhǔn)。

表2 關(guān)于亞馬遜數(shù)據(jù)的不同方法的RMSE與MAE

其中rij表示用戶i對(duì)項(xiàng)目j的評(píng)分,r?ij表示相關(guān)的預(yù)測(cè)評(píng)分,N表示測(cè)試評(píng)分的總數(shù)量。

圖1 和圖2表現(xiàn)出了在PCC策略生成的基于隱性社交網(wǎng)絡(luò)圈的不同推薦方法的實(shí)驗(yàn)結(jié)果。可以看到,本文中的推薦算法通過從評(píng)論中提取評(píng)分相似度來建立隱含的社交圈,能有效地提高系統(tǒng)的推薦性能和改善用戶的體驗(yàn)。

圖1 使用不同推薦方法的RMSE性能

圖2 使用不同推薦方法的MAE性能

此外,我們進(jìn)行了大量實(shí)驗(yàn)來觀察參數(shù)對(duì)論文方法的影響。為了確定哪個(gè)β值在模型中為我們提供了最佳性能,我們?cè)诓煌摩拢é?0.1,β=0.01,β=0.001和β=0.0001)下進(jìn)行實(shí)驗(yàn)。圖3和圖4分別表示出了論文中模型在不同β下的RMSE以及MAE。從上面提到的兩個(gè)圖中,可以很容易地發(fā)現(xiàn)當(dāng)β=0.01時(shí),我們的方法表現(xiàn)最好。

圖3 根據(jù)參數(shù)β∈{0.1,0.01,0.001,0.0001}的RMSE性能

圖4 根據(jù)參數(shù)β∈{0.1,0.01,0.001,0.0001}的MAE表現(xiàn)

5 結(jié)語

本文研究了如何利用隱含社會(huì)信息改進(jìn)推薦系統(tǒng)的研究問題。采用非常通用的矩陣分解社交推薦框架來結(jié)合提取出的隱含社會(huì)信息。實(shí)驗(yàn)分析表明,隱性朋友用戶(相似用戶)信息可以有效地用于改進(jìn)推薦系統(tǒng)。我們的工作不僅為社會(huì)推薦技術(shù)提供了深入的見解,還對(duì)為了非社交性網(wǎng)站的推薦起到了啟發(fā)的作用。這就需要科研者們的共同努力了。

猜你喜歡
社交圈正則隱性
新語
數(shù)字社交圈里的白酒“新消費(fèi)”
隱性就業(yè)歧視的司法認(rèn)定
剩余有限Minimax可解群的4階正則自同構(gòu)
類似于VNL環(huán)的環(huán)
基于社交圈的信息分享策略研究*
幫害羞寶貝打開社交圈
芻議隱性采訪
新聞傳播(2015年14期)2015-07-18 11:14:05
新聞報(bào)道隱性失實(shí)的四種表現(xiàn)
新聞傳播(2015年8期)2015-07-18 11:08:25
有限秩的可解群的正則自同構(gòu)
西宁市| 东明县| 循化| 泗水县| 英山县| 兴城市| 遂昌县| 阜平县| 合阳县| 扬州市| 曲松县| 泰顺县| 宜宾市| 邯郸市| 栖霞市| 正安县| 时尚| 邵阳县| 陕西省| 兴安盟| 手机| 任丘市| 呼图壁县| 南皮县| 梅河口市| 正镶白旗| 抚顺县| 宁安市| 浙江省| 行唐县| 隆德县| 郁南县| 商河县| 克山县| 祥云县| 太湖县| 东乌| 兖州市| 普格县| 澄城县| 图木舒克市|