劉 宇 吳 斌 曾雪琳 張?jiān)评?王 柏
?
一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
劉 宇*吳 斌 曾雪琳 張?jiān)评?王 柏
(北京郵電大學(xué)智能通信軟件與多媒體北京市重點(diǎn)實(shí)驗(yàn)室 北京 100876)
面向用戶群組的推薦主要面臨如何有意義地對(duì)群組進(jìn)行定義并識(shí)別,以及向群組內(nèi)用戶進(jìn)行有效推薦兩大問題。該文針對(duì)已有研究在用戶群組定義解釋性不強(qiáng)等存在的問題,提出一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架。該框架利用社交網(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)重疊網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)作為用戶群組,具有較強(qiáng)的可解釋性,并根據(jù)用戶與群組間的隸屬度制定了考慮用戶對(duì)群組貢獻(xiàn)與用戶從群組獲利的4種聚合與分配策略,以完成組推薦任務(wù)。通過在公開數(shù)據(jù)集上與已有方法的對(duì)比實(shí)驗(yàn),驗(yàn)證了該框架在組推薦方面的有效性和準(zhǔn)確性。
社交網(wǎng)絡(luò);組推薦;重疊網(wǎng)絡(luò)社區(qū);非負(fù)矩陣分解
1 引言
隨著Web 2.0技術(shù)的快速發(fā)展,用戶接入互聯(lián)網(wǎng)后更傾向于在諸如Epinions, Ciao,豆瓣,大眾點(diǎn)評(píng)等針對(duì)商品、服務(wù)的在線評(píng)價(jià)網(wǎng)站尋求購(gòu)買意見和建議,以幫助他們選擇適合的商品、服務(wù)等項(xiàng)目(如電影、音樂、餐廳等,下文的“項(xiàng)目”均指商品或服務(wù))。根據(jù)用戶以往對(duì)項(xiàng)目的評(píng)分和評(píng)價(jià)信息,針對(duì)個(gè)人的個(gè)性化推薦系統(tǒng)能夠?yàn)橛脩籼峁┧麄兯信d趣的項(xiàng)目。在現(xiàn)實(shí)世界中,個(gè)人因不同原因聚集而形成群組。盡管有大量面向個(gè)人的個(gè)性化推薦研究,但針對(duì)群體進(jìn)行推薦的研究還較少。此外,針對(duì)用戶群組的組推薦也有其實(shí)際意義[1]。根據(jù)研究[2,3],組推薦主要面臨兩大問題:(1)如何定義“群組”的概念并確定群組;(2)如何根據(jù)每個(gè)用戶的個(gè)人偏好進(jìn)行適當(dāng)?shù)木酆隙瓿上蛴脩羧航M推薦。
第1個(gè)問題可理解為對(duì)用戶的“分組策略”,現(xiàn)有方案大致可分為3種:(1)根據(jù)用戶的角色身份,形成固定用戶群組[2,4,5],如朋友、家人等,或組成臨時(shí)用戶群組[6,7],如在同一固定時(shí)間正在健身房運(yùn)動(dòng)的顧客等。(2)隨機(jī)形成的用戶群組[8,9],如收聽音樂直播的人,成員可隨意加入或退出群組。(3)根據(jù)一定規(guī)則確立的群組[10,11],如根據(jù)用戶對(duì)項(xiàng)目喜好形成的興趣群組。確定群組方法的不同,影響著對(duì)用戶組進(jìn)行推薦的有效程度。當(dāng)前研究中的大多數(shù)分組策略,都或多或少存在著可解釋性差的問題。
第2個(gè)問題可理解為對(duì)群組內(nèi)用戶進(jìn)行“推薦決策”?;谟脩羝?,即用戶對(duì)項(xiàng)目的評(píng)分,針對(duì)個(gè)人的個(gè)性化推薦方法有基于內(nèi)容的[12],基于協(xié)同過濾的[13,14],以及利用社交信息改進(jìn)推薦效果的[15,16]等。而在組推薦中,同一群組中不同用戶對(duì)同一項(xiàng)目可能有不同的偏好[2]。因此,需要通過一種映射方法,將多個(gè)用戶的偏好信息映射為用戶群組偏好,即制定對(duì)群組內(nèi)用戶偏好的“聚合策略”。常用的聚合策略有平均策略、隨機(jī)策略、最小痛苦策略等[11]。此外,如前所述,不同的分組策略也會(huì)導(dǎo)致不同的聚合策略。
針對(duì)群組推薦中這兩個(gè)問題,本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架??蚣軐⒗蒙缃痪W(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)的重疊網(wǎng)絡(luò)社區(qū)確認(rèn)為用戶群組,并根據(jù)每個(gè)用戶在不同社區(qū)中的貢獻(xiàn)與獲利程度提出4種策略,最后由聚合策略和分配策略給出面向群組的推薦結(jié)果。
當(dāng)前,互聯(lián)網(wǎng)中很多在線評(píng)價(jià)網(wǎng)站都允許用戶間建立關(guān)系,如“關(guān)注”或“信任”?;谟脩絷P(guān)系,一些針對(duì)個(gè)人的個(gè)性化推薦系統(tǒng)利用社交信息達(dá)到較好的推薦效果[15,16]。根據(jù)用戶關(guān)系網(wǎng)絡(luò),連接緊密的用戶自然而然地聚集在一起形成用戶組,不同用戶組間連接稀疏,從而形成社區(qū)結(jié)構(gòu)[17]。這種由社交網(wǎng)絡(luò)關(guān)系形成的社區(qū)結(jié)構(gòu),是一種天然的分組方式,具有很好的可解釋性。因此,本文提出的采用社交網(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)的重疊網(wǎng)絡(luò)社區(qū)確認(rèn)為用戶群組的方法,具備較好的可解釋性;結(jié)合重疊分組的特性,可以為組推薦提供多種具有合理解釋的聚合及分配策略。實(shí)驗(yàn)表明,本文提出的框架在用戶關(guān)系信息稠密的情況下,能達(dá)到更好的組推薦效果。本文第2節(jié)對(duì)組推薦問題進(jìn)行定義;第3節(jié)提出一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架;第4節(jié)利用公開數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析和討論;第5節(jié)進(jìn)行總結(jié)和工作展望。
2 組推薦問題定義
在組推薦中,推薦系統(tǒng)需要完成兩方面的任務(wù),即有意義地完成用戶分組并向不同用戶群組有效地推薦項(xiàng)目。以往的組推薦研究?jī)H利用了用戶對(duì)項(xiàng)目的評(píng)分去完成這兩個(gè)任務(wù)。值得注意的是,眾多在線評(píng)價(jià)網(wǎng)站引入了社交網(wǎng)絡(luò)模塊,允許用戶間建立關(guān)系。根據(jù)網(wǎng)絡(luò)社區(qū)理論[17],網(wǎng)絡(luò)社區(qū)是用戶在社交網(wǎng)絡(luò)中天然形成的群組,其中也蘊(yùn)含著用戶與用戶間、用戶與社區(qū)間、社區(qū)與社區(qū)間的深層次互聯(lián)關(guān)系。
因此,在基于社交網(wǎng)絡(luò)的組推薦中,可利用的信息有用戶對(duì)項(xiàng)目的評(píng)分和用戶社交關(guān)系網(wǎng)絡(luò)。以和表示用戶數(shù)和項(xiàng)目數(shù)。用戶對(duì)項(xiàng)目的評(píng)分通常以評(píng)分矩陣表示,其中是用戶對(duì)項(xiàng)目的評(píng)分,表示缺失數(shù)據(jù)。用戶間關(guān)系網(wǎng)絡(luò)通常以鄰接矩陣表示,其中代表用戶和的關(guān)系。若用戶和是朋友關(guān)系,定義,否則。為簡(jiǎn)化問題,本文僅考慮了對(duì)稱的用戶關(guān)系網(wǎng)絡(luò)。圖1展示了一個(gè)本文所研究的基于社交網(wǎng)絡(luò)的組推薦示例的用戶關(guān)系網(wǎng)絡(luò),其具有5個(gè)用戶;表1是其關(guān)系網(wǎng)絡(luò)的鄰接矩陣,表2是他們對(duì)5個(gè)項(xiàng)目的評(píng)分。這5個(gè)用戶形成2個(gè)重疊分組,分別是{用戶1,用戶2,用戶3}和{用戶2,用戶4,用戶5},用戶2同時(shí)歸屬于兩個(gè)社區(qū)分組。
圖1 基于社交網(wǎng)絡(luò)的組推薦示例的用戶關(guān)系網(wǎng)絡(luò)
表1圖1中用戶關(guān)系網(wǎng)絡(luò)的鄰接矩陣
表2圖1中用戶對(duì)項(xiàng)目的評(píng)分矩陣(采用了5分制)
3 基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
針對(duì)上一節(jié)提出的組推薦問題,本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架,包含以下3個(gè)部分:基于對(duì)評(píng)分矩陣分解的用戶偏好獲取,基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組,以及基于社區(qū)結(jié)構(gòu)的聚合和分配策略。其中前兩個(gè)部分均采用了非負(fù)矩陣分解作為基本方法,以將兩部分進(jìn)行整合。
3.1基于對(duì)評(píng)分矩陣分解的用戶偏好獲取
用戶偏好直接體現(xiàn)在用戶對(duì)項(xiàng)目的評(píng)分上。但在真實(shí)數(shù)據(jù)中,評(píng)分矩陣存在大量的“零值”,即缺失了大量的評(píng)分?jǐn)?shù)據(jù),具有很高的稀疏性[18]。因此,采用評(píng)分矩陣作為用戶偏好的推薦結(jié)果效果并不好[10]。流行的推薦系統(tǒng)通常采用低秩矩陣分解(low- rank matrix factorization)將評(píng)分矩陣分解為兩個(gè)低秩矩陣和,通過這兩個(gè)矩陣的乘積作為評(píng)分矩陣的近似,以對(duì)缺失值進(jìn)行估計(jì)[19]。
(2)
表3基于對(duì)評(píng)分矩陣分解的用戶偏好獲取算法
3.2 基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組
在可通用化的用戶定義分組研究中,文獻(xiàn)[10]采用-means將用戶偏好進(jìn)行聚類而得到用戶分組;雖然這種分組可解釋為基于用戶興趣的社團(tuán),但具有一定的模糊性。文獻(xiàn)[21]采用由用戶相似性生成的網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)興趣群組;但這種方法未考慮社交網(wǎng)絡(luò)中真實(shí)存在的用戶關(guān)系網(wǎng)絡(luò),因此其得到的分組意義仍不明確。如前所述,用戶在社交網(wǎng)絡(luò)中通過用戶關(guān)系天然聚集形成社區(qū),即分組。這種社區(qū)結(jié)構(gòu)可以認(rèn)為是一種具有良好解釋意義的分組。因此,本文所研究的基于社交網(wǎng)絡(luò)的組推薦,將社交網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)作為分組策略。
與基于對(duì)評(píng)分矩陣分解的用戶偏好獲取目的相似,本文采用了非負(fù)矩陣分解來發(fā)現(xiàn)重疊社區(qū)結(jié)構(gòu),這樣,非負(fù)矩陣分解技術(shù)有機(jī)地將本文提出的組推薦框架整合起來。這種方法發(fā)現(xiàn)的分組具有重疊結(jié)構(gòu)。即某個(gè)用戶可以同時(shí)歸屬于多個(gè)分組,這也與現(xiàn)實(shí)情況相同,即某個(gè)用戶擁有多種興趣或?qū)儆诙鄠€(gè)真實(shí)群體。
研究表明,非負(fù)矩陣分解在重疊社區(qū)發(fā)現(xiàn)任務(wù)上具有很好的準(zhǔn)確性[22]和良好的解釋性[23]。給定用戶關(guān)系鄰接矩陣,通過最小化以下目標(biāo)函數(shù)進(jìn)行矩陣分解,可以得到一個(gè)網(wǎng)絡(luò)劃分(分組)結(jié)果。
(5)
表4基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組算法
3.3基于社區(qū)結(jié)構(gòu)的聚合和分配策略
已有研究中通常僅對(duì)用戶偏好進(jìn)行聚合生成群組推薦結(jié)果,如采用平均策略、隨機(jī)策略等[11],如文獻(xiàn)[10]驗(yàn)證了平均策略在組推薦中的效果?;谄涔ぷ?,本文提出了一些用于組推薦的聚合策略。
一般來說,社交網(wǎng)絡(luò)用戶在群組決策中具有不同的影響力。不僅不同用戶在同一群組中的影響力不同,同一用戶在不同群組中的影響程度也是不同的。并且,在考慮對(duì)用戶偏好進(jìn)行聚合的同時(shí),同樣應(yīng)考慮聚合結(jié)果對(duì)用戶選擇的最終影響。例如,一組基于朋友關(guān)系的用戶,經(jīng)討論決定選擇一部電影。其中,有的用戶是大多數(shù)人的朋友,對(duì)選擇結(jié)果影響很大,而有的用戶僅是少部分人的朋友,對(duì)最終選擇的影響很小。因此,本文提出采用分配策略,對(duì)聚合結(jié)果進(jìn)行再分配,從而達(dá)到更好的組推薦效果。本文所提出的聚合及分配策略,均結(jié)合了重疊網(wǎng)絡(luò)社區(qū)分組信息中每個(gè)用戶與社區(qū)分組間的隸屬度。
采用非負(fù)矩陣分解作為用戶分組方法的一個(gè)重要原因是,如式(4)所示,矩陣可以表示用戶在重疊分組上的隸屬度:其列向量表示每個(gè)用戶對(duì)某分組貢獻(xiàn)的程度,行向量表示某個(gè)用戶從重疊分組獲利的程度。這種隸屬度可衡量一個(gè)用戶在其所屬群組中的“參與強(qiáng)度”(文獻(xiàn)[23]中稱為“participation strength”),可視作用戶對(duì)分組的貢獻(xiàn)和從分組的獲利。從重疊分組隸屬度的角度,本文給出了一組聚合與分配策略:
分組平均策略 在聚合時(shí),對(duì)分組內(nèi)每個(gè)用戶的偏好進(jìn)行平均;在分配時(shí),將某用戶所屬的重疊群組偏好平均分配給該用戶。這種策略,平均看待每個(gè)分組內(nèi)的用戶對(duì)群組偏好的貢獻(xiàn),并將每個(gè)用戶所屬的重疊分組的偏好平均地分配給該用戶。
分組貢獻(xiàn)策略 在聚合時(shí),考慮分組內(nèi)每個(gè)用戶不同的貢獻(xiàn)程度;在分配時(shí),將某用戶所屬的重疊群組偏好平均分配給該用戶。由于每個(gè)用戶屬于每個(gè)分組的隸屬度不同,“分組貢獻(xiàn)策略”以其作為權(quán)重,將每個(gè)分組內(nèi)的用戶偏好進(jìn)行加權(quán)平均后作為該分組的群組偏好。
分組獲利策略 在聚合時(shí),對(duì)分組內(nèi)每個(gè)用戶的偏好進(jìn)行平均;在分配時(shí),考慮用戶從一個(gè)或多個(gè)不同分組的獲利程度。與“分組貢獻(xiàn)策略”類似,“分組獲利策略”將每個(gè)用戶所屬的重疊分組的偏好進(jìn)行加權(quán)平均后分配給該用戶。
分組權(quán)重策略 在聚合時(shí),考慮分組內(nèi)每個(gè)用戶不同的貢獻(xiàn)程度;在分配時(shí),考慮用戶從一個(gè)或多個(gè)不同分組的獲利程度。
3.4基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
基于前述3個(gè)部分,即基于對(duì)評(píng)分矩陣分解的用戶偏好獲取,基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組,以及基于社區(qū)結(jié)構(gòu)的聚合和分配策略,本文提出的基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架可通過表5所示的算法表示,下文以SocoGrec表示該框架。此外,本文所提出的框架也可以整合更多的聚合和分配策略。
表5基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
4 實(shí)驗(yàn)與結(jié)論
4.1數(shù)據(jù)集
本文選取了可公開獲取的數(shù)據(jù)集FilmTrust和CiaoDVD[24],均含有用戶關(guān)系網(wǎng)絡(luò)和用戶評(píng)分?jǐn)?shù)據(jù):
FilmTrust是一個(gè)允許用戶對(duì)電影進(jìn)行評(píng)分,并可以與其他用戶建立信任關(guān)系的在線網(wǎng)站數(shù)據(jù)。用戶間的信任關(guān)系形成了社會(huì)信任網(wǎng)絡(luò),表示了用戶與用戶的關(guān)系。
CiaoDVD。Ciao是一個(gè)在線商品評(píng)價(jià)網(wǎng)站,也引入了社會(huì)信任關(guān)系網(wǎng)絡(luò)。其中,CiaoDVD是包含在“DVD”分類下的用戶評(píng)分,數(shù)據(jù)集中包含了用戶信任關(guān)系。
為了較為準(zhǔn)確地發(fā)現(xiàn)社區(qū)分組,實(shí)驗(yàn)選取了公開數(shù)據(jù)集的子集。即所用數(shù)據(jù)集的用戶既擁有評(píng)分信息,也擁有社交網(wǎng)絡(luò)關(guān)系;沒有任何評(píng)分或沒有任何社交關(guān)系的用戶則被排除。數(shù)據(jù)集特征如表6所示。
表6數(shù)據(jù)集特征
4.2對(duì)比方法及實(shí)驗(yàn)設(shè)置
LGM方法[10]通過對(duì)用戶隱式偏好采用-means方法進(jìn)行聚類得到隱式分組,并將群組內(nèi)所有用戶偏好進(jìn)行平均作為群組偏好。其應(yīng)用場(chǎng)景與本文類似,且都利用了用戶對(duì)項(xiàng)目的評(píng)分矩陣來提取信息,如用戶偏好。因此,實(shí)驗(yàn)中將LGM方法與本文所提框架中的4種策略方法進(jìn)行比較。
對(duì)比實(shí)驗(yàn)采用了5-折交叉驗(yàn)證方法,被隨機(jī)平均分為5份的數(shù)據(jù)中,4份作為訓(xùn)練集,1份作為測(cè)試集。由于隱因子數(shù)量一般不會(huì)對(duì)推薦效果產(chǎn)生較大影響,因此在實(shí)驗(yàn)中,設(shè)置隱因子的數(shù)量為。以最小取1,最大取數(shù)據(jù)集內(nèi)用戶個(gè)數(shù),F(xiàn)ilmTrust數(shù)據(jù)集的分組數(shù)量分別設(shè)定為{1, 5, 10, 20, 100, 200, 427}, CiaoDVD數(shù)據(jù)集的分組數(shù)量設(shè)定為{1, 10, 20, 100, 200, 500, 733}。對(duì)于SocoGrec,設(shè)定,以保證分組發(fā)現(xiàn)結(jié)果是以最大程度重疊的。簡(jiǎn)單起見,防止過擬合的規(guī)則化項(xiàng)參數(shù)和均設(shè)置為0.01。在實(shí)驗(yàn)中,將本文提出的4種策略分別表示為SocoGrec-M, SocoGrec-C, SocoGrec-B和SocoGrec-W。
4.3評(píng)價(jià)指標(biāo)
本文選取了絕對(duì)平均誤差(Mean Absolute Error, MAE)作為評(píng)價(jià)指標(biāo),其定義如下:
4.4實(shí)驗(yàn)結(jié)果與討論
4.4.1在數(shù)據(jù)集FilmTrust上的對(duì)比結(jié)果
在數(shù)據(jù)集FilmTrust上的對(duì)比結(jié)果如表7所示。從結(jié)果可以看出SocoGrec所提出的4種策略方法的評(píng)價(jià)指標(biāo)MAE隨著分組數(shù)量的增加而降低。SocoGrec-B和SocoGrec-W的效果總是比SocoGrec-M和SocoGrec-C要好。SocoGrec-B總是比SocoGrec-C效果好,在一些分組數(shù)量時(shí)比SocoGrec-W效果好。也就是說,在采用平均的聚合策略情況下,考慮用戶從一個(gè)或多個(gè)分組中的獲利程度更能提高推薦預(yù)測(cè)的效果;與SocoGrec-B相比,同時(shí)考慮了用戶對(duì)分組貢獻(xiàn)和從分組獲利的SocoGrec-W效果與其相近,也說明了在數(shù)據(jù)集FilmTrust上,與帶權(quán)重的聚合策略相比,采用帶權(quán)重的分配策略使推薦預(yù)測(cè)效果提升更多。對(duì)比方法LGM的評(píng)價(jià)指標(biāo)MAE則隨著分組數(shù)量的增加而上升,直到其效果變得比SocoGrec更差。值得注意的是,當(dāng)分組數(shù)量為1時(shí),LGM僅對(duì)數(shù)據(jù)集中所有用戶的偏好進(jìn)行平均,而SocoGrec仍然考慮了用戶與群組間的貢獻(xiàn)與獲利程度,具有較好的解釋性;盡管此時(shí)SocoGrec的評(píng)價(jià)指標(biāo)并不比LGM好。
表7在數(shù)據(jù)集FilmTrust上組推薦算法的MAE對(duì)比
4.4.2在數(shù)據(jù)集CiaoDVD上的對(duì)比結(jié)果
在數(shù)據(jù)集CiaoDVD上的對(duì)比結(jié)果如表8所示。與在FilmTrust數(shù)據(jù)集上的結(jié)果類似,隨著分組數(shù)量的增加,SocoGrec的預(yù)測(cè)效果變好,而LGM的預(yù)測(cè)效果則變差。然而與之不同的是,在CiaoDVD數(shù)據(jù)集上,SocoGrec提出的4種策略的MAE指標(biāo)總是優(yōu)于LGM方法;隨著分組數(shù)量的增加,策略SocoGrec-M和SocoGrec-B改善較大,而SocoGrec-C改善較小,SocoGrec-W的效果幾乎不變,而且SocoGrec-C總是優(yōu)于SocoGrec-B。即在CiaoDVD數(shù)據(jù)集上,與帶權(quán)重的分配策略相比,采用帶權(quán)重的聚合策略使推薦預(yù)測(cè)效果提升更多。在兩種數(shù)據(jù)集上產(chǎn)生不同效果的原因可能在于,盡管兩個(gè)數(shù)據(jù)集的評(píng)價(jià)稀疏度相近,但用戶關(guān)系網(wǎng)絡(luò)稠密程度相差了一個(gè)數(shù)量級(jí)(參考表6)。這也說明了用戶關(guān)系網(wǎng)絡(luò)的稠密程度對(duì)幾種SocoGrec策略的影響是不同的,關(guān)系網(wǎng)絡(luò)更稠密,本文所提出的組推薦框架能夠獲得更好的效果。
表8在數(shù)據(jù)集CiaoDVD上組推薦算法的MAE對(duì)比
4.4.3在數(shù)據(jù)集FilmTrust上重疊分組的影響
值得注意的是,由于分組可以重疊,本文所提出的框架允許分組數(shù)量多于用戶數(shù)量。從圖2中可以看出,在數(shù)據(jù)集FilmTrust上,重疊分組對(duì)組推薦影響是較大的。首先,一旦分組數(shù)量增加,對(duì)比方法LGM的效果迅速變差;SocoGrec策略則逐漸變好,分組數(shù)量升至約170至190后,其效果比LGM方法好。其次,SocoGrec-M與SocoGrec-C的效果相近,SocoGrec-B與SocoGrec-W效果相近,再次印證了前述對(duì)幾種策略效果的討論。最后,基于非負(fù)矩陣分解,本文所提出的框架可以發(fā)現(xiàn)重疊分組,具有一定的現(xiàn)實(shí)意義。
圖2 不同社區(qū)分組數(shù)量在數(shù)據(jù)集FilmTrust上的算法的MAE對(duì)比
5 結(jié)束語(yǔ)
本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架??蚣懿捎梅秦?fù)矩陣分解方法將用戶偏好獲取與用戶分組有機(jī)地整合起來,并利用用戶-分組隸屬度制定了相應(yīng)的偏好聚合與分配策略。與現(xiàn)有方法的對(duì)比實(shí)驗(yàn)展示了該框架的優(yōu)越性和有效性。此外,該框架在獲取用戶偏好、確定分組以及聚合與分配策略方面具有良好的解釋性。并且,該框架可以發(fā)現(xiàn)重疊分組,對(duì)分組定義和組推薦都有一定的現(xiàn)實(shí)意義。
基于本文的研究,未來可以針對(duì)以下幾點(diǎn)進(jìn)行擴(kuò)展工作??蓪⒖蚣苓m配到有向網(wǎng)絡(luò)、雙向網(wǎng)絡(luò),使分組策略、聚合與分配策略可利用更豐富的用戶關(guān)系信息,進(jìn)一步改善組推薦效果。其次,可引入其他聚合與分配策略。另外,本文使用乘法更新來進(jìn)行非負(fù)矩陣分解,實(shí)際實(shí)現(xiàn)中包含大量耗時(shí)的矩陣乘法運(yùn)算,因此可以采用其他算法時(shí)間復(fù)雜性較低的非負(fù)矩陣分解方法或?qū)⑺惴ú⑿谢蕴岣呖蚣芩惴ㄟ\(yùn)行效率。
[1] MASTHOFF J. Recommender Systems Handbook[M]. Boston, MA: Springer US, ch. Group Recommender Systems: Combining Individual Models, 2011: 677-702.
[2] JAMESON A and SMYTH B. The Adaptive Web: Methods and Strategies of Web Personalization[M]. Berlin, Heidelberg: Springer Berlin Heidelberg, ch. Recommendation to Groups, 2007: 596-627.
[3] AMER-YAHIA S, ROY S, CHAWLAT A,. Group recommendation: Semantics and efficiency[J]., 2009, 2(1): 754-765. doi: 10.14778/ 1687627.1687713.
[4] O’CONNOR M, COSLEY D, KONSTAN J,. ECSCW 2001: Proceedings of the Seventh European Conference on Computer Supported Cooperative Work 16–20 September 2001[M]. Bonn, Germany. Dordrecht: Springer Netherlands, ch. PolyLens: A Recommender System for Groups of Users, 2001: 199-218.
[5] DE CAMPOS L M, FERNANDEZ-LUNA J M, HUETE J F,. Group recommending: a methodological approach based on bayesian networks[C]. IEEE 23rd International Conference on Data Engineering Workshop, Istanbul, Turkey, 2007: 835-844.
[6] O’HARA K, LIPSON M, JANSEN M,. Jukola: democratic music choice in a public space[C]. Proceedings of the 5th Conference on Designing Interactive Systems: Processes, Practices, Methods, and Techniques, New York, USA, 2004: 145-154.
[7] SPRAGUE D, WU F, and TORY M. Music selection using the partyvote democratic jukebox[C]. Proceedings of the Working Conference on Advanced Visual Interfaces, New York, USA, 2008: 433-436.
[8] CHAO D L, BALTHROP J, and FORREST S. Adaptive radio: achieving consensus using negative preferences[C]. Proceedings of the 2005 International ACM SIGGROUP Conference on Supporting Group Work, New York, USA, 2005: 120-123.
[9] MCCARTHY J F and ANAGNOST T D. Musicfx: An arbiter of group preferences for computer supported collaborative workouts[C]. Proceedings of the 1998 ACM Conference on Computer Supported Cooperative Work, New York, USA, 1998: 363-372.
[10] SHI J, WU B, and LIN X. A latent group model for group recommendation[C]. 2015 IEEE International Conference on Mobile Services, New York, USA, 2015: 233-238.
[11] BALTRUNAS L, MAKCINSKAS T, and RICCI F. Group recommendations with rank aggregation and collaborative filtering[C]. Proceedings of the Fourth ACM Conference on Recommender Systems, New York, USA, 2010: 119-126.
[12] PAZZANI M J and BILLSUS D. The Adaptive Web: Methods and Strategies of Web Personalization[M]. Berlin, Heidelberg: Springer Berlin Heidelberg, ch. Content-Based Recommendation Systems, 2007: 325-341.
[13] SHI Y, LARSON M, and HANJALIC A. Collaborative filtering beyond the user-item matrix: a survey of the state of the art and future challenges[J]., 2014, 47(1): 1-45. doi: 10.1145/2556270.
[14] 王玉斌, 孟祥武, 胡勛. 一種基于信息老化的協(xié)同過濾推薦算法[J]. 電子與信息學(xué)報(bào), 2013, 35(10): 2391-2396. doi: 10.3724 /SP.J.1146.2012.01743.
WANG Y, MENG X, and HU X. Information aging-based collaborative filtering recommendation algorithm[J].&, 2013, 35(10): 2391-2396. doi: 10.3724/SP.J.1146.2012.01743.
[15] 邢星. 社交網(wǎng)絡(luò)個(gè)性化推薦方法研究[D]. [博士論文], 大連海事大學(xué), 2013.
XING X. Research on recommendation methods in social networks[D]. [Ph.D. dissertation], Dalian Maritime University, 2013.
[16] 涂丹丹, 舒承椿, 余海燕. 基于聯(lián)合概率矩陣分解的上下文廣告推薦算法[J]. 軟件學(xué)報(bào), 2013, 24(3): 454-464. doi: 10.3724/ SP.J.1001.2013.04238.
TU D, SHU C, and YU H. Using unified probabilistic matrix factorization for contextual advertisement recommendation [J]., 2013, 24(3): 454-464. doi: 10.3724/ SP.J.1001.2013.04238.
[17] GIRVAN M and NEWMAN M E. Community structure in social and biological networks[J]., 2002, 99(12): 7821-7826. doi: 10.1073/ pnas.122653799.
[18] BORATTO L and CARTA S. Using collaborative filtering to overcome the curse of dimensionality when clustering users in a group recommender system[C]. Proceedings of 16th International Conference on Enterprise Information Systems, Lisbon, Portugal, 2014: 564-572.
[19] 方耀寧, 郭云飛, 丁雪濤, 等. 一種基于局部結(jié)構(gòu)的改進(jìn)奇異值分解推薦算法[J]. 電子與信息學(xué)報(bào), 2013, 35(6): 1284-1289. doi: 10.3724/SP.J.1146.2012.01299.
FANG Y, GUO Y, DING X,An improved singular value decomposition recommender algorithm based on local structures[J].&, 2013, 35(6): 1284-1289. doi: 10.3724/SP.J.1146. 2012.01299.
[20] DING C, LI T, and PENG W,. Orthogonal nonnegative matrix t-factorizations for clustering[C]. Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, NY, USA, 2006: 126-135.
[21] CANTADOR I, and CASTELLS P. Extracting multilayered communities of interest from semantic user profiles: application to group modeling and hybrid recommendations [J]., 2011, 27(4): 1321-1336. doi: 10.1016/j.chb.2010.07.027.
[22] SHI X, LU H, HE Y,Community detection in social network with pairwisely constrained symmetric non-negative matrix factorization[C]. Proceedings of the 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, Paris, France, 2015: 541-546.
[23] PSORAKIS I, ROBERTS S, EDBEN M,. Overlapping community detection using Bayesian non-negative matrix factorization[J]., 2011, 83(6): 066114. doi: 10.1103/PhysRevE.83.066114.
[24] LibRec. Datasets[OL]. http://www.librec.net/datasets.html, 2016.
A Group Recommendation Framework Based on Social Network Community
LIU Yu WU Bin ZENG Xuelin ZHANG Yunlei WANG Bai
(Beijing Key Laboratory of Intelligence Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Group recommendation confronts two major problems,.., unambiguous definition and identification of groups and efficient recommendation to users in groups. To tackle the two problems, a group recommendation framework based on social network community is proposed. The framework takes into account social network structural information to identify overlapping groups, which is well interpreted; and fulfills the task of recommending to groups by performing aggregation and allocation strategies using the membership of users related to groups, which considers how much users contribute to groups and benefit from groups. Experimental results on publicly open datasets demonstrate its efficiency and accuracy on the task of group recommendation.
Social network; Group recommendation; Overlapping network community; Non-negative matrix factorization
TP391; TP393
A
1009-5896(2016)09-2150-08
10.11999/JEIT160544
2016-05-27;
2016-07-18;
2016-08-09
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(2013CB329606),北京市共建項(xiàng)目專項(xiàng)
The National Key Basic Research and Department Program of China (2013CB329606), Special Fund for Beijing Common Construction Project
劉宇 liuyu@bupt.edu.cn
劉 宇: 男,1986年生,博士生,研究方向?yàn)閿?shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析.
吳 斌: 男,1969年生,教授,博士生導(dǎo)師,研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘和智能信息處理、大數(shù)據(jù)分析.
曾雪琳: 女,1991年生,碩士生,研究方向?yàn)閿?shù)據(jù)挖掘、社交網(wǎng)絡(luò)分析、推薦系統(tǒng).
張?jiān)评祝?男,1983年生,博士生,研究方向?yàn)閿?shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析.
王 柏: 女,1962年生,教授,博士生導(dǎo)師,研究方向?yàn)殡娦畔到y(tǒng)軟件、分布式計(jì)算技術(shù)、數(shù)據(jù)挖掘和智能信息處理.