吳永慶 孫鵬 金堯 丁治辰
摘 要:為了解決推薦系統(tǒng)中新用戶評(píng)級(jí)預(yù)測(cè)冷啟動(dòng)和數(shù)據(jù)稀疏等問題,提出了一種融合一致性社交關(guān)系的協(xié)同相似嵌入推薦模型(collaborative similarity embedding recommendation model incorporating consistent social relationships,CSECSR)。首先,模型通過預(yù)熱層對(duì)圖形嵌入進(jìn)行等權(quán)重傳播和聚合;其次,采樣具有一致性的社交關(guān)系鄰居,并利用關(guān)系注意力機(jī)制對(duì)這些關(guān)系進(jìn)行聚合;最后,利用用戶和項(xiàng)目最終嵌入值的內(nèi)積進(jìn)行評(píng)分預(yù)測(cè),設(shè)計(jì)具有自適應(yīng)裕度的BPR損失和相似性損失的損失函數(shù)對(duì)模型進(jìn)行優(yōu)化。在Ciao、Epinions和FilmTrust數(shù)據(jù)集上與其他代表性的推薦模型進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果表明所提推薦模型預(yù)測(cè)誤差明顯優(yōu)于其他模型,證明了所提推薦模型的有效性。
關(guān)鍵詞:推薦系統(tǒng); 圖神經(jīng)網(wǎng)絡(luò); 社交關(guān)系; 協(xié)同嵌入
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2023)10-011-2951-06
doi:10.19734/j.issn.1001-3695.2023.03.0094
Collaborative similarity embedding recommendation model incorporating consistent social relationships
Wu Yongqing, Sun Peng, Jin Yao, Ding Zhichen
(School of Software, Liaoning Technical University, Huludao Liaoning 125105, China)
Abstract:To address the challenges of cold-start prediction and data sparsity for new users in recommendation systems, this paper proposed a collaborative similarity embedding recommendation model incorporating consistent social relationships(CSECSR). Firstly, the model propagated and aggregated graph embeddings with equal weights through a warming-up layer. Secondly, it sampled social relationship neighbors with consistency and aggregated these relationships using attention mechanisms. Finally, the model predicted the rating by computing the inner product of the final embedded values of the user and the item, and optimized the model using a loss function that combined BPR loss with adaptive margin and similarity loss. Compared with other representative recommendation models on Ciao, Epinions and FilmTrust datasets, the experimental results show that the proposed recommendation model outperforms other models significantly in terms of prediction error, which confirms the effectiveness of the proposed recommendation model.
Key words:recommendation system; graph neutral network; social relationship; collaborative embedding
0 引言
隨著電子商務(wù)和社交媒體平臺(tái)的快速發(fā)展,推薦系統(tǒng)已經(jīng)廣泛應(yīng)用于各行各業(yè),如在線電子商務(wù)網(wǎng)站(亞馬遜和淘寶)上的產(chǎn)品推薦或視頻和音樂服務(wù)的播放列表生成器(如YouTube和抖音)。在信息爆炸的時(shí)代,推薦系統(tǒng)在緩解信息過載方面同時(shí)發(fā)揮著關(guān)鍵作用,它可以從用戶的歷史交互行為(如點(diǎn)擊、觀看、閱讀和購(gòu)買等)中準(zhǔn)確建模預(yù)測(cè)用戶的偏好[1],滿足了用戶日益增長(zhǎng)的個(gè)性化信息獲取的需求。然而,由于收集數(shù)據(jù)的成本太高,大多數(shù)推薦系統(tǒng)都存在新用戶冷啟動(dòng)、數(shù)據(jù)稀疏性等問題[2]。用戶冷啟動(dòng)問題存在一個(gè)關(guān)鍵挑戰(zhàn),即新用戶只有有限的交互行為,其中新用戶的正反饋量更為稀缺。例如,在電子商務(wù)平臺(tái)上,冷啟動(dòng)用戶的點(diǎn)擊項(xiàng)目數(shù)量可能很少,因此不能很好地表征用戶上下文信息。為了緩解此類問題,傳統(tǒng)的協(xié)同過濾算法利用用戶—項(xiàng)目評(píng)價(jià)矩陣進(jìn)行推薦,但僅僅依靠用戶—項(xiàng)目評(píng)價(jià)矩陣將無法從圖中采樣輔助信息,導(dǎo)致表示學(xué)習(xí)數(shù)據(jù)不足,從而使推薦性能下降。當(dāng)前主流的方法是引入用戶之間的社交關(guān)系,將其與用戶項(xiàng)目交互進(jìn)行合并學(xué)習(xí)。研究表明,用戶的購(gòu)買行為很大程度上受到其社交網(wǎng)絡(luò)的影響[3]。因此,將社交關(guān)系與用戶項(xiàng)目交互融合學(xué)習(xí)有利于提高推薦性能。
圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)通過同時(shí)聚合來自社交圖和用戶—項(xiàng)目圖的信息來幫助處理社交推薦任務(wù)[4~7]。然而,大多數(shù)現(xiàn)有的基于GNN的社交推薦模型都忽略了社交不一致問題[4]。社交不一致性表明社交聯(lián)系不一定與評(píng)價(jià)預(yù)測(cè)過程一致,聚合不一致的社交鄰居信息會(huì)破壞GNN描述推薦有益信息的能力,造成對(duì)大多數(shù)冷啟動(dòng)用戶推薦失真[8]。本文認(rèn)為社交不一致性表現(xiàn)在兩個(gè)層面上:a)興趣層面,在社交圖中具有連接的兩個(gè)用戶可能會(huì)具有不一致的項(xiàng)目興趣。也就是說,同為社交鄰居但關(guān)注的項(xiàng)目或物品不同,如圖1所示,u2就是u3的不一致鄰居,因?yàn)閡2關(guān)注的項(xiàng)目都是關(guān)于運(yùn)動(dòng),而u3關(guān)注的項(xiàng)目卻都是關(guān)于書籍,雖然同為社交鄰居但興趣不同造成了其興趣層面的不一致;b)關(guān)系層面,不同用戶對(duì)關(guān)注的相同項(xiàng)目可能會(huì)有不同的評(píng)價(jià),且同時(shí)建模社交圖和用戶—項(xiàng)目圖時(shí)應(yīng)存在多種關(guān)系。例如,除了社交關(guān)系之外,還可以通過用戶—項(xiàng)目關(guān)系的評(píng)分值來區(qū)分用戶—項(xiàng)目關(guān)系。在圖1中可以看出,u1和u2是社交鄰居且都對(duì)項(xiàng)目v1進(jìn)行過評(píng)價(jià),然而u1對(duì)v1評(píng)價(jià)為5分,而u2對(duì)v1評(píng)價(jià)卻為1分,雖然社交關(guān)系密切而且同時(shí)對(duì)一個(gè)項(xiàng)目進(jìn)行評(píng)價(jià),但他們對(duì)項(xiàng)目的偏好程度不一致,從而導(dǎo)致關(guān)系層面的不一致。
為了解決上述存在的問題,本文提出一種融合一致性社交關(guān)系的協(xié)同相似嵌入推薦模型CSECSR。首先融合了用戶間一致性社交網(wǎng)絡(luò)信息和用戶—項(xiàng)目評(píng)價(jià)信息[8];其次對(duì)傳統(tǒng)的協(xié)同嵌入模型進(jìn)行優(yōu)化,增加了其他類型的協(xié)作信息,包括用戶—用戶相似性和項(xiàng)目—項(xiàng)目相似性[9]。本文主要方法包括如下幾個(gè)步驟:
a)為了解決新用戶冷啟動(dòng)、社交不一致等問題,將用戶—項(xiàng)目協(xié)作信息、社交信息和間接相似性信息合并到嵌入函數(shù)中,通過預(yù)熱層進(jìn)行嵌入傳播聚合并利用一階連通性信息抵消新用特征分布的差異,再利用鄰居采樣和關(guān)系注意力等方法區(qū)分社交不一致性。
b)為了緩解數(shù)據(jù)稀疏性問題,增加了其他類型的協(xié)作信息用于嵌入學(xué)習(xí),將具有自適應(yīng)裕度的貝葉斯損失BPR[10]和相似性損失結(jié)合起來用于相似性嵌入學(xué)習(xí)。
c)與其他五個(gè)基線模型進(jìn)行了對(duì)比研究,并利用對(duì)三個(gè)基準(zhǔn)數(shù)據(jù)集的定量分析驗(yàn)證了模型的有效性。
1 相關(guān)工作
圖神經(jīng)網(wǎng)絡(luò)從圖的角度考慮推薦系統(tǒng)中的信息[11],它為推薦系統(tǒng)中豐富的異構(gòu)數(shù)據(jù)建模提供了一個(gè)統(tǒng)一的視角。在整合結(jié)構(gòu)化外部信息時(shí),將推薦作為一項(xiàng)圖形任務(wù),其好處尤其明顯,所以圖神經(jīng)網(wǎng)絡(luò)在過去幾年的推薦系統(tǒng)中取得了顯著的成功。由于社交關(guān)系在推薦系統(tǒng)中的潛在價(jià)值,社交推薦受到了越來越多的關(guān)注[12]。最常見的推薦方法有基于協(xié)同嵌入[13]的方法和基于矩陣分解[14]的方法。其中基于協(xié)同嵌入的方法根據(jù)用戶的行為歷史生成用戶—項(xiàng)目共現(xiàn)矩陣,利用用戶和項(xiàng)目相似性進(jìn)行推薦,其特點(diǎn)是原理簡(jiǎn)單、應(yīng)用廣泛,但處理稀疏向量的能力較弱。基于矩陣分解的方法將協(xié)同過濾算法中的共現(xiàn)矩陣分解為用戶矩陣和項(xiàng)目矩陣,利用用戶隱向量和物品隱向量的內(nèi)積進(jìn)行排序并推薦,其特點(diǎn)是泛化能力強(qiáng)、擁有更好的擴(kuò)展性和靈活性,但除了用戶歷史行為數(shù)據(jù)外,難以利用其他用戶、物品特征及上下文特征[15]。在此基礎(chǔ)上,文獻(xiàn)[14]等提出概率矩陣分解模型PMF,它僅使用用戶與項(xiàng)目評(píng)分信息通過高斯分布的方法對(duì)用戶和項(xiàng)目的潛在因素進(jìn)行建模,但該模型未考慮融合社交網(wǎng)絡(luò)數(shù)據(jù),未能解決數(shù)據(jù)稀疏性問題。為了提高推薦性能,基于信任傳播的社交網(wǎng)絡(luò)推薦矩陣分解算法SocialMF將信任傳播機(jī)制引入到模型中,強(qiáng)制將用戶特征向量接近其鄰居的特征向量,從而解決新用戶冷啟動(dòng)問題,但這種方法不具備從社交關(guān)系中捕獲龐雜的非線性特征的能力,無法對(duì)非線性社會(huì)特征進(jìn)行建模[16]。Fan等人[17]提出了基于社會(huì)關(guān)系深度建模的推薦模型DeepSoR,它從每個(gè)用戶的社交關(guān)系中學(xué)習(xí)非線性特征,并將其整合到概率矩陣分解中進(jìn)行評(píng)分預(yù)測(cè),但是它忽略了節(jié)點(diǎn)之間的高階信息,對(duì)解決冷啟動(dòng)問題沒有實(shí)質(zhì)貢獻(xiàn)。基于圖神經(jīng)網(wǎng)絡(luò)的社交推薦模型GraphRec利用用戶—項(xiàng)目圖和社交圖進(jìn)行建模,提出了一種基于圖注意力的社交推薦模型,但它僅考慮用戶—項(xiàng)目間顯式協(xié)作信息,忽略了用戶—項(xiàng)目間的隱式協(xié)作信息,如用戶—用戶相似性、項(xiàng)目—項(xiàng)目相似性[18]。圖注意力協(xié)同相似性嵌入推薦系統(tǒng)GACSE 通過嵌入傳播和注意機(jī)制來學(xué)習(xí)顯式圖形協(xié)作過濾信息,通過輔助損失來學(xué)習(xí)隱式圖形協(xié)作信息,此方法可以有效減少數(shù)據(jù)稀疏等問題,但是過多的特征轉(zhuǎn)換和非線性激活對(duì)協(xié)同過濾的性能貢獻(xiàn)不大,而且可能會(huì)增加訓(xùn)練難度,導(dǎo)致推薦性能下降[9]。
需要指出的是,以往的推薦模型在不同程度上提高了推薦性能,但是在解決用戶冷啟動(dòng)、數(shù)據(jù)稀疏以及一致性社交關(guān)系等方面尚有不足。本文提出的模型通過鄰居采樣和關(guān)系注意力等方法來解決社交不一致性,利用預(yù)熱層解決用戶冷啟動(dòng)問題,通過協(xié)同相似性嵌入和設(shè)計(jì)具有自適應(yīng)裕度的BPR損失、相似性損失等方法學(xué)習(xí)隱式協(xié)作信息,從圖中抽取輔助信息,增加表示學(xué)習(xí)數(shù)據(jù),從而緩解數(shù)據(jù)稀疏性問題。
2 CSECSR模型
2.1 符號(hào)及定義
定義1 用戶與項(xiàng)目集合。典型的推薦問題中通常由用戶和項(xiàng)目?jī)蓚€(gè)實(shí)體組成,設(shè)用戶集U={u1,u2,…,um}、項(xiàng)目集V={v1,v2,…,vn},其中m和n分別表示用戶和項(xiàng)目的數(shù)量。
定義2 用戶社交圖。設(shè)用戶社交圖Gs={u,εs},其中社交圖中的邊(ua,ub)∈εs表示用戶a與用戶b之間有社交聯(lián)系。
定義3 評(píng)價(jià)矩陣。設(shè)R∈Euclid Math TwoRApm×n為用戶—項(xiàng)目評(píng)價(jià)矩陣,其中Ru,v表示用戶u給項(xiàng)目v的評(píng)分,評(píng)價(jià)分?jǐn)?shù)越高表示用戶對(duì)項(xiàng)目越喜歡。
定義4 用戶項(xiàng)目圖。推薦問題的目標(biāo)是通過融合評(píng)價(jià)矩陣和社交圖來完成推薦,因此,本文通過構(gòu)造異構(gòu)圖G={T,εr|Rr=1}來解決推薦問題。其中T表示用戶和項(xiàng)目節(jié)點(diǎn);εr表示關(guān)系r上的邊。除了用戶—用戶、項(xiàng)目—項(xiàng)目的鏈接外,本文還根據(jù)評(píng)分值區(qū)別用戶—項(xiàng)目鏈接。評(píng)分的集合由數(shù)據(jù)集的不同而異,例如,數(shù)據(jù)集Ciao有6個(gè)額定值,即{0,1,2,3,4,5}。因此,數(shù)據(jù)集Ciao上的邊有八種類型,即R=8,其中一個(gè)是社交關(guān)系,一個(gè)是項(xiàng)目—項(xiàng)目關(guān)系,其他的是不同評(píng)分值的用戶—項(xiàng)目關(guān)系。
2.2 CSECSR模型框架
CSECSR模型由嵌入層、預(yù)熱層、查詢層、鄰居采樣、關(guān)系注意、評(píng)級(jí)預(yù)測(cè)和優(yōu)化等模塊組成,具體框架如圖2所示。
2.2.1 嵌入層
根據(jù)當(dāng)前主流的推薦模型NGCF[19],本文使用嵌入向量
2.2.5 關(guān)系注意
在對(duì)鄰居進(jìn)行采樣后,需要聚合它們的嵌入。然而,關(guān)系層面的社交不一致性表明,應(yīng)該區(qū)分不同的關(guān)系。為此,CSECSR設(shè)計(jì)了一個(gè)關(guān)系注意力模塊來處理關(guān)系層面社交不一致的采樣鄰居。如圖4所示,關(guān)系注意力模塊通過考慮關(guān)聯(lián)關(guān)系來學(xué)習(xí)這類采樣節(jié)點(diǎn)的重要性。
關(guān)系注意力模塊為每個(gè)采樣節(jié)點(diǎn)i分配了一個(gè)重要參數(shù)αi,可以將式(6)中的AGG函數(shù)重寫為
3 實(shí)驗(yàn)和分析
3.1 數(shù)據(jù)集
為了評(píng)估了本文模型的推薦性能,實(shí)驗(yàn)采用三個(gè)真實(shí)世界中具有代表性的數(shù)據(jù)集。其中Ciao和Epinions[26~30]數(shù)據(jù)集均來自于流行的社交網(wǎng)站,其中用戶可以為項(xiàng)目進(jìn)行評(píng)分,評(píng)分的范圍是1~5,同時(shí)用戶可以與其他用戶建立社交關(guān)系。FilmTrust[31]是從FilmTrust網(wǎng)站上抓取的一個(gè)小型數(shù)據(jù)集,包含用戶對(duì)電影的評(píng)分信息,評(píng)分范圍是0~4分,同時(shí)也可以與其他用戶建立社交關(guān)系。因此三個(gè)數(shù)據(jù)集中包含了大量評(píng)分信息和社交信息。根據(jù)Ma等人[32]提出的 SoRec對(duì)冷啟動(dòng)用戶的定義方法,本文也假設(shè)用戶對(duì)項(xiàng)目評(píng)價(jià)數(shù)量小于等于5的用戶,則被認(rèn)為是冷啟動(dòng)用戶。經(jīng)過對(duì)數(shù)據(jù)集的統(tǒng)計(jì)分析得出,Ciao中存在此類用戶數(shù)量為3 573、Epinions中存在此類用戶數(shù)量為26 037。表1總結(jié)了數(shù)據(jù)集中的統(tǒng)計(jì)信息。
為了驗(yàn)證本文模型的有效性和真實(shí)性,實(shí)驗(yàn)方法采用K折交叉驗(yàn)證,其中取K值為5,即將數(shù)據(jù)集平均分為5份,每次隨機(jī)挑選1份用于模型測(cè)試,剩余4份用于模型訓(xùn)練,每個(gè)實(shí)驗(yàn)重復(fù)進(jìn)行5次,使每個(gè)子集都有1次機(jī)會(huì)作為測(cè)試集,最后計(jì)算5組測(cè)試結(jié)果的平均值。本文采用負(fù)采樣的策略來產(chǎn)生一個(gè)用戶之前沒有交互過的項(xiàng)目,并且將觀察到的用戶—項(xiàng)目交互作為一個(gè)正反饋,無交互視為負(fù)反饋。
3.2 評(píng)價(jià)指標(biāo)
在CSECSR預(yù)測(cè)實(shí)驗(yàn)中,使用平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo)來評(píng)估預(yù)測(cè)精度和推薦性能。
其中:N表示測(cè)試集中評(píng)分?jǐn)?shù)據(jù)的數(shù)量;ri,j表示用戶ui對(duì)物品vj的真實(shí)評(píng)分;r′i,j表示用戶ui對(duì)物品vj的預(yù)測(cè)評(píng)分。
3.3 基線模型
為了驗(yàn)證CSECSR模型的推薦性能,本文將提出的CSECSR模型與其他新近的推薦模型進(jìn)行對(duì)比驗(yàn)證。
a)PMF[14]:為了解決協(xié)同過濾方法處理大數(shù)據(jù)集的能力差和評(píng)價(jià)矩陣稀疏等問題,提出了一種概率矩陣分解模型,該模型僅使用用戶與項(xiàng)目評(píng)分信息通過高斯分布的方法對(duì)用戶和項(xiàng)目的潛在因素進(jìn)行建模。
b)SocialMF[16]:一種基于信任傳遞機(jī)制的社交推薦算法。
c)DeepSoR[17]:該模型采用深層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)表示每個(gè)用戶的社會(huì)關(guān)系,解決了推薦模型無法捕獲非線性特征的問題。
d)GraphRec[18]:為了解決圖神經(jīng)網(wǎng)絡(luò)無法聯(lián)合捕獲用戶—項(xiàng)目圖中交互信息和觀點(diǎn)信息,提出基于圖注意力網(wǎng)絡(luò)的社交推薦模型,它采用了一種原則性方法內(nèi)在地結(jié)合用戶—項(xiàng)目圖和社交圖。
e)ConsistRec[8]:該模型利用將采樣概率與鄰居之間一致性得分聯(lián)系起來的方法對(duì)鄰居進(jìn)行采樣,并利用注意力機(jī)制對(duì)社交關(guān)系進(jìn)行聚合。
3.4 參數(shù)設(shè)置
模型的超參數(shù)選取如表2所示。為了優(yōu)化函數(shù),本文對(duì)比模型均采用Adam作為優(yōu)化器。為了詳細(xì)驗(yàn)證聚集不一致鄰居對(duì)于CSECSR的影響,本文選擇鄰居百分比從低到高間隔0.2。學(xué)習(xí)率是優(yōu)化算法中的調(diào)諧參數(shù),模型的學(xué)習(xí)率將直接影響神經(jīng)網(wǎng)絡(luò)的收斂狀態(tài),進(jìn)而影響模型的推薦性能,所以選擇合適的學(xué)習(xí)率對(duì)模型有較大影響。嵌入向量維度將影響用戶項(xiàng)目特征從高維空間映射到低維空間中,進(jìn)而影響模型的推薦性能表現(xiàn)。批量大小對(duì)于神經(jīng)網(wǎng)絡(luò)的優(yōu)化至關(guān)重要,合適的批量大小將影響模型的收斂速度和泛化能力。在損失函數(shù)中,本文將λ1設(shè)為1×10-4,λ2設(shè)為1×10-5,設(shè)置采樣鄰居數(shù)量為64,相似性損失的陽性和陰性樣本數(shù)設(shè)置為5。為了解決過擬合問題,在所有實(shí)驗(yàn)都設(shè)置提前停止法策略,即如果驗(yàn)證集上的RMSE連續(xù)5個(gè)輪次未下降,就停止模型的訓(xùn)練。
3.5 實(shí)驗(yàn)結(jié)果分析
3.5.1 對(duì)比實(shí)驗(yàn)
表3、4分別展示了所有用戶和冷啟動(dòng)用戶在兩個(gè)數(shù)據(jù)集上本文模型與其他推薦模型的推薦性能,通過對(duì)比實(shí)驗(yàn)可以得出以下結(jié)論:
a)從PMF和SocialMF的實(shí)驗(yàn)結(jié)果比較可以看出,僅使用用戶—項(xiàng)目評(píng)分矩陣的模型PMF推薦性能明顯不如使用社交矩陣和用戶—項(xiàng)目評(píng)分矩陣的模型SocialMF,這說明在推薦系統(tǒng)中充分利用社交網(wǎng)絡(luò)數(shù)據(jù)可以有效提升預(yù)測(cè)精度。
b)從DeepSoR和SocialMF的結(jié)果比較中發(fā)現(xiàn),雖然這兩種算法都是使用社交矩陣和用戶—項(xiàng)目評(píng)分矩陣進(jìn)行推薦,但DeepSoR的推薦性能優(yōu)于SocialMF,這是因?yàn)镈eepSoR采用了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),說明在推薦系統(tǒng)中運(yùn)用神經(jīng)網(wǎng)絡(luò)技術(shù)可以提升推薦性能。
c)從GraphRec和DeepSoR的實(shí)驗(yàn)結(jié)果對(duì)比可以看出,基于圖神經(jīng)網(wǎng)絡(luò)(GNN)的GraphReC模型推薦性能優(yōu)于基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的DeepSoR模型,這說明圖神經(jīng)網(wǎng)絡(luò)(GNN)在推薦系統(tǒng)中具有一定的優(yōu)勢(shì),在圖形數(shù)據(jù)表示等方面具有強(qiáng)大的能力。
d)通過對(duì)圖5和表3、4的綜合分析可以發(fā)現(xiàn),隨著epoch數(shù)的增加,CSECSR和其他基線模型的RMSE不斷下降并趨于收斂,CSECSR與其他基線模型相比,收斂速度較快。在所有用戶的場(chǎng)景下,CSECSR性能均優(yōu)于其他基線模型,推薦效果最佳,在數(shù)據(jù)集Ciao、Epinions和FilmTrust上,CSECSR對(duì)比模型中最好的ConsisRec在平均絕對(duì)誤差(MAE)上分別降低了2.18%、2.21%和1.59%;在均方根誤差(RMSE)上分別降低了1.83%、1.32%和1.17%。在冷啟動(dòng)場(chǎng)景下,所有模型的推薦性能均出現(xiàn)明顯下滑,但CSECSR仍為表現(xiàn)最佳的模型,在數(shù)據(jù)集Ciao和Epinions上,CSECSR對(duì)比模型中最好的ConsisRec在平均絕對(duì)誤差(MAE)上分別降低了2.45%和2.36%;在均方根誤差(RMSE)上分別降低了2.01%和1.86%。實(shí)驗(yàn)證明CSECSR在用戶冷啟動(dòng)場(chǎng)景下提升的推薦性能更高,對(duì)于緩解推薦系統(tǒng)中用戶冷啟動(dòng)、社交不一致和數(shù)據(jù)稀疏性等問題有一定幫助,并且對(duì)于不同的數(shù)據(jù)集,CSECSR模型均優(yōu)于其他模型,進(jìn)而驗(yàn)證了CSECSR具有較好的魯棒性,對(duì)特定的數(shù)據(jù)集沒有明顯的偏向性。
3.5.2 消融實(shí)驗(yàn)
為評(píng)估各個(gè)模塊對(duì)于模型的影響進(jìn)行了消融實(shí)驗(yàn),其中變體模型CSECSR-Ns為刪除鄰居采樣模塊構(gòu)建、CSECSR-Si為刪除具有自適應(yīng)裕度的BPR損失和相似度損失構(gòu)建、CSESCR-Wr為刪除預(yù)熱層構(gòu)建。
從圖6中可以觀察到,與其他變體相比,CSECSR始終保持最佳推薦性能,這表明所有組件都是產(chǎn)生最佳結(jié)果所必需的。此外,可以觀察到CSESCR-Ns與CSECSR相比推薦性能大幅下降,這證實(shí)了選擇一致性鄰居的重要性,選擇一致鄰居可以幫助緩解新用戶冷啟動(dòng)問題。CSECSR-Si比CSECSR推薦性能差,說明了具有自適應(yīng)裕度的BPR損失和相似性損失可以提高模型對(duì)具有相似嵌入的正樣本和負(fù)樣本的區(qū)分能力,它通過增加表示學(xué)習(xí)數(shù)據(jù)來減少稀疏性問題,對(duì)于嵌入學(xué)習(xí)有著較大影響。與CSECSR相比,CSECSR-Wr性能也下滑了,這說明預(yù)熱層利用一階連通性信息抵消新用戶特征分布的差異對(duì)于緩解冷啟動(dòng)問題有一定效果。
3.6 參數(shù)敏感性分析
在Ciao和Epinions數(shù)據(jù)集上分析CSECSR模型對(duì)于嵌入維度、學(xué)習(xí)率、鄰居百分比的敏感性,結(jié)果如圖7~9所示。
從圖7可以觀察出,模型的最佳嵌入維度均為16。將嵌入維度設(shè)置得過小,模型將不足以表示節(jié)點(diǎn)信息;將嵌入維度設(shè)置得過大,將會(huì)導(dǎo)致模型過擬合。
從圖8可以觀察出,學(xué)習(xí)率對(duì)于優(yōu)化模型的性能有重要影響,當(dāng)學(xué)習(xí)率為0.000 1時(shí),模型的MAE和RMSE均為最小。
從圖9可以觀察出,不同鄰居百分比對(duì)模型有較大影響。當(dāng)鄰居百分比從0.8上升到1.0時(shí),可以觀察到模型有一個(gè)明顯的錯(cuò)誤增量,這是由于聚集了不一致鄰居所造成的,所以聚集一致性鄰居對(duì)于解決新用戶冷啟動(dòng)問題有較大幫助。
4 結(jié)束語
本文提出了一種融合一致性社交關(guān)系的協(xié)同相似嵌入推薦模型CSECSR。首先,模型通過預(yù)熱層對(duì)圖形嵌入進(jìn)行等權(quán)重傳播和聚合,利用一階連通性信息抵消新用戶特征分布的差異,對(duì)于緩解冷啟動(dòng)問題有一定幫助。其次,模型利用鄰居采樣和關(guān)系注意力等方法解決社交不一致問題,其中鄰居采樣模塊將采樣概率與鄰居之間的一致性得分聯(lián)系起來,對(duì)一致的鄰居進(jìn)行采樣,解決了興趣層面的社交不一致性問題;在采樣后,利用關(guān)系注意力機(jī)制解決關(guān)系層面的社交不一致問題,進(jìn)一步解決了用戶冷啟動(dòng)問題。然后,模型將用戶—項(xiàng)目協(xié)作信號(hào)和間接相似性合并到嵌入函數(shù)中進(jìn)行學(xué)習(xí),其中直接嵌入是用從戶—項(xiàng)目交互中學(xué)習(xí)的,間接嵌入是從損失函數(shù)中用戶—用戶相似度和項(xiàng)目—項(xiàng)目相似度學(xué)習(xí)的,通過增加表征學(xué)習(xí)數(shù)據(jù),緩解了數(shù)據(jù)稀疏性問題。最后,模型在損失函數(shù)中結(jié)合了具有自適應(yīng)裕度的BPR損失和相似性損失進(jìn)行優(yōu)化。在數(shù)據(jù)集Ciao、Epinions和FilmTrust上進(jìn)行了不同用戶場(chǎng)景的實(shí)驗(yàn),結(jié)果表明CSECSR在不同場(chǎng)景推薦性能均優(yōu)于其他基準(zhǔn)模型,且在冷啟動(dòng)用戶場(chǎng)景下提升性能更高,能有效緩解社交不一致、用戶冷啟動(dòng)和數(shù)據(jù)稀疏性問題,證明了本文模型的有效性和普適性。用戶冷啟動(dòng)問題的緩解可以在很大程度上提高用戶體驗(yàn)和對(duì)推薦系統(tǒng)的信任度??梢詫SECSR算法應(yīng)用于在線購(gòu)物和社交網(wǎng)絡(luò)推薦系統(tǒng)中。在今后的研究中,將考慮項(xiàng)目冷啟動(dòng)問題對(duì)于模型推薦性能的影響,并進(jìn)一步研究如何在保證不傷害用戶長(zhǎng)期興趣的前提下充分滿足用戶的短期興趣等問題。
參考文獻(xiàn):
[1]Gao Chongming, Lei Wenqiang, He Xiangna, et al. Advances and challenges in conversational recommender systems:a survey[J].AI Open,2021,2:100-126.
[2]Liu Zhiwei, Fan Ziwei, Wang Yu, et al. Augmenting sequential re-commendation with pseudo-prior items via reversely pre-training transformer[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:1608-1612.
[3]Bizzi L, Labban A. The double-edged impact of social media on online trading: opportunities, threats, and recommendations for organizations[J].Business Horizons,2019,62(4):509-519.
[4]Liu Zhiwei, Dou Yingtong, Yu P S, et al. Alleviating the inconsis-tency problem of applying graph neural network to fraud detection[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:1569-1572.
[5]Liu Zhiwei, Li Xiaohan, Fan Ziwei, et al. Basket recommendation with multi-intent translation graph neural network[C]//Proc of IEEE International Conference on Big Data.Piscataway,NJ:IEEE Press,2020:728-737.
[6]Guo Zhiwei, Wang Heng. A deep graph neural network-based mechanism for social recommendations[J].IEEE Trans on Industrial Informatics,2020,17(4):2776-2783.
[7]Mu Nan, Zha Daren, He Yuanye, et al. Graph attention networks for neural social recommendation[C]//Proc of IEEE International Conference on Tools with Artificial Intelligence.Piscataway,NJ:IEEE Press,2019:1320-1327.
[8]Yang Liangwei, Liu Zhiwei, Dou Yingtong, et al. ConsisRec:enhancing GNN for social recommendation via consistent neighbor aggregation[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:2141-2145.
[9]Song Jinbo, Chang Chao, Sun Fei, et al. Graph attention collaborative similarity embedding for recommender system[C]//Proc of the 26th International Conference on Database Systems for Advanced App-lications.Berlin:Springer,2021:165-178.
[10]Rendle S, Freudenthaler C, Gantner Z, et al. BPR: Bayesian personalized ranking from implicit feedback[C]//Proc of the 25th Conference on Uncertainty in Artificial Intelligence.Arlington:AUAI Press,2009:452-461.
[11]馮興杰,生曉宇.基于圖神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的商品推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2021,38(12):3617-3622.(Feng Xingjie, Sheng Xiaoyu. Item recommendation algorithm based on GNN and deep learning[J].Application Research of Computers,2021,38(12):3617-3622.)
[12]郭寧寧,王寶亮,侯永宏,等.融合社交網(wǎng)絡(luò)特征的協(xié)同過濾推薦算法[J].計(jì)算機(jī)科學(xué)與探索,2018,12(2):208-217.(Guo Ning-ning, Wang Baoliang, Hou Yonghong, et al. Collaborative filtering recommendation algorithm based on characteristics of social network[J].Journal of Frontiers of Computer Science and Technology,2018,12(2):208-217.)
[13]Su Xiaoyuan, Khoshgoftaar T M. A survey of collaborative filtering techniques[J].Advances in Artificial Intelligence,2009,2009:article ID 421425.
[14]Salakhutdinov R, Mnih A. Probabilistic matrix factorization[J].Advances in Neural Information Processing Systems,2007,20:1257-1264.
[15]杜雨晅,王巍,張闖,等.基于自適應(yīng)圖卷積注意力神經(jīng)協(xié)同推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2022,39(6):1760-1766.(Du Yu-xuan, Wang Wei, Zhang Chuang, et al. Collaborative filtering recommendation algorithm based on adaptive neural graph convolution attention neural network[J].Application Research of Computers,2022,39(6):1760-1766.)
[16]Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks[C]//Proc of the 4th ACM Conference on Recommender Systems.New York:ACM Press,2010:135-142.
[17]Fan Wenqi, Li Qing, Cheng Min. Deep modeling of social relations for recommendation[C]//Proc of the 32nd AAAI Conference on Artificial Intelligence, the 30th Innovative Applications of Artificial Intelligence Conference, the 8th AAAI Symposium on Educational Advances in Artificial Intelligence.Palo Alto,CA:AAAI Press,2018:8075-8076.
[18]Fan Wenqi, Ma Yao, Li Qing, et al. Graph neural networks for social recommendation[C]//Proc of the World Wide Web Conference.New York:ACM Press,2019:417-426.
[19]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph colla-borative filtering[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2019:165-174.
[20]Kipf T N, Welling M. Semi-supervised classification with graph convo-lutional networks[EB/OL].(2017).https://arxiv.org/abs/1609.02907.
[21]Hamilton W L, Ying R, Leskovec J. Inductive representation lear-ning on large graphs[C]//Proc of the 31st International Conference on Neural Information Processing Systems.New York:Curran Associa-tes Press,2017:1025-1035.
[22]Chang Weilin, Liu Xuanqing, Si Si, et al. Cluster-GCN:an efficient algorithm for training deep and large graph convolutional networks[C]//Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2019:257-266.
[23]Cong Weilin, Forsati R, Kandemir M, et al. Minimal variance sampling with provable guarantees for fast training of graph neural networks[C]//Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.New York:ACM Press,2020:1393-1403.
[24]Zeng Hanqing, Zhou Hongkuan, Srivastava A, et al. GraphSAINT: graph sampling based inductive learning method[EB/OL].(2020).https://arxiv.org/abs/1907.04931.
[25]Najork M, Gollapudi S, Panigrahy R. Less is more: sampling the neighborhood graph makes salsa better and faster[C]//Proc of the 2nd ACM International Conference on Web Search and Data Mining.New York:ACM Press,2009:242-251.
[26]Kingma D, Ba J. Adam: a method for stochastic optimization[EB/OL].(2015).https://arxiv.org/abs/1412.6980.
[27]Tang Jiliang, Gao Huiji, Hu Xia, et al. Exploiting homophily effect for trust prediction[C]//Proc of the 6th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2013:53-62.
[28]Tang Jiliang, Gao Huiji, Liu Huan. mTrust: discerning multi-faceted trust in a connected world[C]//Proc of the 4th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2012:93-102.
[29]Tang Jiliang, Gao Huiji, Liu Huan, et al. eTrust: understanding trust evolution in an online world[C]//Proc of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2012:253-261.
[30]Tang Jiliang, Hu Xia, Gao Huiji, et al. Exploiting local and global social context for recommendation[C]//Proc of the 23rd International Joint Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2013:2712-2718.
[31]Guo Guibing, Zhang Jie, Yorke-Smith N. A novel Bayesian similarity measure for recommender systems[C]//Proc of the 23rd International Joint Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2013:2619-2625.
[32]Ma Hao, Yang Haixuan, Lyu M R, et al. SoRec: social recommendation using probabilistic matrix factorization[C]//Proc of the 17th ACM Conference on Information and Knowledge Management.New York:ACM Press,2008:931-940.
收稿日期:2023-03-12;修回日期:2023-05-08
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(52174184)
作者簡(jiǎn)介:吳永慶(1983-),男(通信作者),浙江衢州人,副教授,碩導(dǎo),博士,CCF會(huì)員,主要研究方向?yàn)橥扑]系統(tǒng)、復(fù)雜系統(tǒng)與復(fù)雜網(wǎng)絡(luò)(yqwuyywu@163.com);孫鵬(1998-),男,遼寧阜新人,碩士研究生,主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、推薦系統(tǒng);金堯(1999-),男(滿族),遼寧撫順人,碩士研究生,主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、推薦系統(tǒng);丁治辰(1997-),男,遼寧丹東人,碩士研究生,主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、推薦系統(tǒng).