国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

社交關(guān)系在基于模型社會(huì)化推薦系統(tǒng)中的影響*

2018-01-16 01:54:15房倩琦文俊浩
計(jì)算機(jī)與生活 2018年1期
關(guān)鍵詞:社會(huì)化準(zhǔn)確率社交

房倩琦,柳 玲,文俊浩,曾 駿,高 旻

重慶大學(xué) 軟件學(xué)院,重慶 401331

1 引言

推薦系統(tǒng)常用于解決互聯(lián)網(wǎng)上的信息過(guò)載問(wèn)題,傳統(tǒng)推薦系統(tǒng)基于協(xié)同過(guò)濾的方法[1-2]進(jìn)行推薦。然而在真實(shí)場(chǎng)景中,大多數(shù)用戶只對(duì)很少的項(xiàng)目進(jìn)行了評(píng)分,缺乏共同的歷史評(píng)分?jǐn)?shù)據(jù)將造成協(xié)同過(guò)濾方法的推薦質(zhì)量明顯下降?,F(xiàn)今,由于社交平臺(tái)的流行,社交關(guān)系信息獲取更為便捷,而社交信息的融入能夠明顯緩解傳統(tǒng)推薦系統(tǒng)中的評(píng)分?jǐn)?shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題[3],因此社會(huì)化推薦系統(tǒng)[4-5]應(yīng)運(yùn)而生。

與傳統(tǒng)的推薦系統(tǒng)有所不同,社會(huì)化推薦系統(tǒng)在進(jìn)行推薦時(shí),不僅考慮用戶的歷史評(píng)分信息,同時(shí)也考慮了用戶的社交關(guān)系信息,因而在一些場(chǎng)景中取得了更好的推薦結(jié)果。根據(jù)系統(tǒng)算法的不同原理,社會(huì)化推薦系統(tǒng)中采用的推薦算法可以分為基于內(nèi)存的推薦算法和基于模型的推薦算法。由于后者通常能夠方便地融合先驗(yàn)知識(shí),目前社會(huì)化推薦系統(tǒng)方面的研究者將主要的研究方向集中于構(gòu)建性能更優(yōu)的基于模型的推薦算法[4]?,F(xiàn)有的基于模型的方法的一般思路為從完整的已有評(píng)分矩陣(關(guān)系矩陣)上提取用戶與項(xiàng)目的潛在特征,然后通過(guò)將兩個(gè)低維特征矩陣相乘來(lái)對(duì)缺失評(píng)分進(jìn)行預(yù)測(cè)。由此思路衍生出的一系列模型算法在實(shí)驗(yàn)數(shù)據(jù)集上取得了較高的推薦性能,并被廣泛應(yīng)用于實(shí)際系統(tǒng)[6]。然而,由于分解得到的低維隱式特征通常難以解釋?zhuān)⑶疑缃魂P(guān)系作為算法輸入的一個(gè)重要部分,其密度信息與結(jié)構(gòu)信息的改變可能會(huì)使推薦性能產(chǎn)生較大差異,故社交關(guān)系在基于模型的推薦系統(tǒng)中的影響仍待探索。

本文著力于研究基于模型的社會(huì)化推薦系統(tǒng)中社交關(guān)系變化對(duì)推薦結(jié)果的影響,并主要從以下方面進(jìn)行了實(shí)驗(yàn)探究:(1)社會(huì)化推薦系統(tǒng)中關(guān)系數(shù)量的變化對(duì)推薦結(jié)果的影響;(2)關(guān)系數(shù)量的變化對(duì)不同用戶組的影響;(3)社交網(wǎng)絡(luò)中心節(jié)點(diǎn)與邊的變化對(duì)推薦結(jié)果的影響。實(shí)驗(yàn)結(jié)果表明,社交關(guān)系的數(shù)量增多將對(duì)推薦質(zhì)量帶來(lái)明顯提升,對(duì)獲取新用戶偏好的幫助尤為明顯,同時(shí)中心節(jié)點(diǎn)對(duì)推薦質(zhì)量的影響具有決定性作用。

2 相關(guān)工作

社會(huì)化推薦系統(tǒng)的輸入信息由兩部分信息構(gòu)成:用戶評(píng)分信息與社交關(guān)系信息?,F(xiàn)有的大部分社會(huì)化推薦系統(tǒng)選用協(xié)同過(guò)濾模型作為基礎(chǔ)模型構(gòu)建系統(tǒng),并將社交信息作為社會(huì)化推薦系統(tǒng)輸入信息的一部分。因此,基于協(xié)同過(guò)濾的社會(huì)化推薦系統(tǒng)的框架[7]包含兩部分:基礎(chǔ)協(xié)同過(guò)濾模型和社會(huì)化信息模型。

根據(jù)協(xié)同過(guò)濾基礎(chǔ)模型的不同,可將社會(huì)化推薦系統(tǒng)分為兩類(lèi),基于內(nèi)存的推薦系統(tǒng)和基于模型的推薦系統(tǒng)。前者使用經(jīng)典的協(xié)同過(guò)濾模型作為基礎(chǔ)模型,考慮了用戶的社會(huì)關(guān)系。通常,該類(lèi)社會(huì)化推薦系統(tǒng)首先找出當(dāng)前用戶的關(guān)聯(lián)用戶集合,然后再?gòu)闹蝎@取評(píng)分來(lái)對(duì)當(dāng)前用戶的缺失評(píng)分進(jìn)行預(yù)測(cè),不同的系統(tǒng)采取了不同的獲取N+i的方式。Social based Weight Mean算法[8]中,對(duì)于給定用戶ui,將與給定用戶有直接關(guān)系的用戶作為給定用戶的關(guān)系數(shù)據(jù)集N+(i)。Golbeck[9]提出的 TidalTrust算法中為了得到更多的關(guān)聯(lián)用戶,考慮了用戶間的信任傳播,且認(rèn)為:(1)傳播路徑越短,信任值越大;(2)信任值高的路徑產(chǎn)生的預(yù)測(cè)結(jié)果越準(zhǔn)確。Jamali等人[10]提出的TrustWalker與TidalTrust類(lèi)似,但采用了隨機(jī)游走的思路來(lái)尋找更多關(guān)聯(lián)用戶,并加入了相似項(xiàng)目的概念,使得預(yù)測(cè)結(jié)果更為精確。

不同于傳統(tǒng)的推薦系統(tǒng)中使用的矩陣分解算法,基于模型的社會(huì)化推薦系統(tǒng)將社交關(guān)系信息引入到算法輸入中。矩陣分解[11]是一種最為主流的基于模型的基礎(chǔ)算法,該算法通過(guò)已有的評(píng)分信息對(duì)高維評(píng)分矩陣進(jìn)行低秩逼近,分解得到兩個(gè)低維特征矩陣,并利用分解后的矩陣乘積來(lái)對(duì)缺失評(píng)分進(jìn)行預(yù)測(cè)。它的通用最優(yōu)化目標(biāo)函數(shù)[12]可以表示為:

其中,R∈Rm×n為用戶對(duì)商品的評(píng)分矩陣;T∈Rm×m為用戶與用戶之間的社交關(guān)系矩陣;U∈Rk×m為用戶潛在特征矩陣;V∈Rk×n為項(xiàng)目潛在特征矩陣;Social(T,S,Ω)是對(duì)社交網(wǎng)絡(luò)分析所得的社會(huì)化信息;Ω是從社會(huì)化信息中學(xué)習(xí)得到的參數(shù);系數(shù)α用于控制Social(T,S,Ω)的影響。根據(jù)對(duì)Social(T,S,Ω)定義的不同,基于模型的社會(huì)推薦系統(tǒng)被進(jìn)一步劃分為3個(gè)類(lèi)別:協(xié)同分解方法(co-factorization methods)、集成方法(ensemble methods)以及正則化方法(regularization methods)。

2.1 協(xié)同分解方法

協(xié)同分解方法的原理為社交信息和評(píng)分信息可以通過(guò)共享用戶潛在特征空間來(lái)進(jìn)行連接。即是說(shuō),社交信息中的用戶潛在特征空間與評(píng)分矩陣中用戶潛在特征空間重合。由此可以導(dǎo)出公式R=UTV,T=UTZ,其中Z∈Rk×m是信任隱式特征。SoRec(social recommendation)[13]是這類(lèi)算法中最具代表性的一個(gè)。

SoRec算法的最優(yōu)化目標(biāo)函數(shù)可以表示為:

其中,Social(T,S,Ω)定義為

2.2 集成方法

集成方法假設(shè)用戶的偏好是由用戶個(gè)人的口味和其好友的口味共同決定。評(píng)分矩陣中的缺失評(píng)分可以通過(guò)將用戶的評(píng)分和其好友的評(píng)分做線性組合預(yù)測(cè)而產(chǎn)生。這類(lèi)算法中最具代表性的算法就是RSTE(recommend with social trust ensemble)[14]算法。

RSTE中預(yù)測(cè)評(píng)分的線性表達(dá)式Ri,j表示為:

其中,Ni是用戶所有朋友的集合;Si,k是用戶i所有朋友評(píng)分之和的正則化項(xiàng);β用來(lái)控制用戶朋友評(píng)分在結(jié)果中所占的比例,其最優(yōu)化目標(biāo)函數(shù)可以表示為:

其中,Social(T,S,Ω)定義為βSUTV),tr()表示矩陣的跡。

2.3 正則化方法

正則化方法假定用戶的偏好會(huì)近似于其好友,因此在模型訓(xùn)練過(guò)程中,正則化方法會(huì)使用戶的潛在特征向量接近其好友的潛在特征向量。SocialMF(matrix factorization based model for recommendation in social rating networks)[15]是這類(lèi)方法中最典型的一種。

在 SocialMF 算法中,Social(T,S,Ω)被定義為用戶i的偏好應(yīng)接近于用戶i所有好友的平均偏好。

SocialMF旨在優(yōu)化以下問(wèn)題:

3 社交關(guān)系對(duì)基于模型的社會(huì)化推薦系統(tǒng)影響的實(shí)驗(yàn)設(shè)計(jì)

本章通過(guò)實(shí)驗(yàn)探究了基于模型的社會(huì)化推薦系統(tǒng)中關(guān)系的變化對(duì)推薦性能的影響,主要實(shí)驗(yàn)內(nèi)容如下:(1)關(guān)系數(shù)量的變化對(duì)用戶推薦性能的影響;(2)關(guān)系數(shù)量的變化對(duì)不同用戶組推薦性能的影響;(3)中心節(jié)點(diǎn)與邊的變化對(duì)推薦性能的影響。

3.1 實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)中使用的數(shù)據(jù)集為從Epinions網(wǎng)站爬取的包含評(píng)分信息和社交信息的真實(shí)數(shù)據(jù)集[6]。從中隨機(jī)抽取了1 500名用戶和其信任用戶,并保留了這些用戶之間所有的信任關(guān)系與商品評(píng)分。采樣數(shù)據(jù)包含8 183個(gè)用戶,104 000個(gè)項(xiàng)目和339 000個(gè)評(píng)分。用戶信任關(guān)系數(shù)為20 000。評(píng)分尺度為1至5,喜好程度依次遞進(jìn)。信任關(guān)系為二元信任:存在信任關(guān)系,值為1;不存在信任關(guān)系,值為0。圖1給出了數(shù)據(jù)集的相關(guān)信息統(tǒng)計(jì)。

Fig.1 Rating distribution and trust distribution圖1 數(shù)據(jù)集的評(píng)分分布與信任關(guān)系分布

3.2 評(píng)價(jià)指標(biāo)

本文基于評(píng)分角度選取均方根誤差(root mean squared error,RMSE)作為評(píng)價(jià)指標(biāo),基于項(xiàng)目排序角度選取準(zhǔn)確率、召回率、F1值作為評(píng)價(jià)指標(biāo)。這幾個(gè)指標(biāo)均為最常用的推薦質(zhì)量度量方法。

RMSE值越小,表明預(yù)測(cè)精度越高。計(jì)算公式如下:

其中,ri,j是真實(shí)評(píng)分;r?i,j是預(yù)測(cè)評(píng)分;N為數(shù)據(jù)數(shù)量。

準(zhǔn)確率和召回率取值在0和1之間,數(shù)值越接近1,推薦精度越高。準(zhǔn)確率的定義為:

F1值是準(zhǔn)確率與召回率的調(diào)和平均值,其值越大,推薦精度越高。F1值可表示為:

其中,P為準(zhǔn)確率;R為召回率。

3.3 實(shí)驗(yàn)設(shè)計(jì)

實(shí)驗(yàn)探索了社交關(guān)系對(duì)基于2.1節(jié)提到的3種模型算法的社會(huì)化推薦系統(tǒng)的影響。3種算法的參數(shù)都被設(shè)置為通過(guò)實(shí)驗(yàn)尋找到的最佳值,算法實(shí)現(xiàn)平臺(tái)為開(kāi)源的推薦系統(tǒng)項(xiàng)目LibRec[16]。實(shí)驗(yàn)采用了十折交叉驗(yàn)證,實(shí)驗(yàn)設(shè)備為配備i7 4790k Intel處理器,8 GB內(nèi)存的PC機(jī)。實(shí)驗(yàn)分為以下三部分進(jìn)行。

3.3.1 關(guān)系數(shù)量的變化對(duì)推薦性能的影響

此部分實(shí)驗(yàn)采用按比例隨機(jī)移除用戶關(guān)系的方法,依次刪減用戶信任關(guān)系數(shù)據(jù)集中所有關(guān)系數(shù)量的10%、30%、50%、70%、90%,查看關(guān)系稀疏程度對(duì)推薦精度的影響。

3.3.2 關(guān)系數(shù)量變化對(duì)不同用戶推薦性能的影響

此部分探究關(guān)系數(shù)量的變化對(duì)不同用戶的影響,在進(jìn)行實(shí)驗(yàn)之前,首先需要按照一定的標(biāo)準(zhǔn)對(duì)用戶類(lèi)別進(jìn)行劃分。將評(píng)分?jǐn)?shù)量大于等于50的用戶劃為活躍用戶組(active),評(píng)分?jǐn)?shù)量大于等于10小于50的用戶劃為普通用戶組(general),評(píng)分?jǐn)?shù)量小于10的用戶劃為不活躍用戶(inactive)。此部分的實(shí)驗(yàn)仍然采用第一部分實(shí)驗(yàn)對(duì)用戶數(shù)量的處理方法,查看不同關(guān)系數(shù)量下不同用戶推薦性能的變化。

3.3.3 中心節(jié)點(diǎn)與邊的變化對(duì)推薦性能的影響

此部分選擇了社交網(wǎng)絡(luò)的3個(gè)中心特性來(lái)探究其變化對(duì)推薦性能的影響。3個(gè)中心特性為度中心性、點(diǎn)介數(shù)中心性、邊介數(shù)中心性[17]。

度中心性是在社交網(wǎng)絡(luò)分析中刻畫(huà)節(jié)點(diǎn)中心性(centrality)的最直接度量指標(biāo)。一個(gè)節(jié)點(diǎn)的度(degree)(在圖論中,某節(jié)點(diǎn)的鄰接節(jié)點(diǎn)的數(shù)量成為該節(jié)點(diǎn)的度)越大,該節(jié)點(diǎn)在網(wǎng)絡(luò)中就越重要。節(jié)點(diǎn)的度

中心性可以用公式表示:

其中,n表示節(jié)點(diǎn)vi所屬網(wǎng)絡(luò)中節(jié)點(diǎn)的總數(shù)量。度中心性的值與節(jié)點(diǎn)vi的度成比例。

介數(shù)表示一個(gè)網(wǎng)絡(luò)中經(jīng)過(guò)該節(jié)點(diǎn)(邊)的最短路徑的數(shù)量。在一個(gè)網(wǎng)絡(luò)中,節(jié)點(diǎn)(邊)的介數(shù)越大,它在節(jié)點(diǎn)的通信中起到的作用越大。介數(shù)中心性又可分為點(diǎn)介數(shù)中心性和邊介數(shù)中心性,其直接定義式為:

其中,σst(vi)表示經(jīng)過(guò)節(jié)點(diǎn)vi(邊)的s→t的最短路徑條數(shù)。直觀上來(lái)說(shuō),介數(shù)反映了節(jié)點(diǎn)vi(邊)作為“橋梁”的重要程度。

度中心性代表點(diǎn)的關(guān)系重要程度,按照度中心性由高到低對(duì)用戶信任關(guān)系數(shù)據(jù)進(jìn)行排序后,分別按照5%、10%、15%、20%、25%刪減數(shù)據(jù)后得到5次實(shí)驗(yàn)的用戶信任關(guān)系數(shù)據(jù)集。點(diǎn)介數(shù)中心性代表點(diǎn)在社交網(wǎng)絡(luò)通信中點(diǎn)的重要程度,按照點(diǎn)介數(shù)中心性由高到低對(duì)用戶信任關(guān)系數(shù)據(jù)進(jìn)行排序后,分別按照1%、2%、3%、4%、5%刪減數(shù)據(jù)后得到此部分5次實(shí)驗(yàn)的用戶信任關(guān)系數(shù)據(jù)集。邊介數(shù)中心性代表邊在通信中的重要程度,將邊介數(shù)排序后按照10%、30%、50%、70%、90%的比例刪減數(shù)據(jù)得到實(shí)驗(yàn)所用數(shù)據(jù)集。

4 實(shí)驗(yàn)結(jié)果與分析

4.1 關(guān)系數(shù)量的變化對(duì)推薦性能的影響

按照3.3.1小節(jié)實(shí)驗(yàn)設(shè)計(jì)進(jìn)行實(shí)驗(yàn)后得出結(jié)果中RMSE值如表1所示,準(zhǔn)確率、召回率、F1值如圖2所示。

分析實(shí)驗(yàn)結(jié)果可知,隨著關(guān)系數(shù)量的減少,推薦結(jié)果的準(zhǔn)確率、召回率和F1值整體呈現(xiàn)下降的趨勢(shì)。RMSE值呈現(xiàn)波動(dòng)微小或不規(guī)律的趨勢(shì)。但考慮到實(shí)際情況中,用戶只關(guān)注推薦列表中的結(jié)果,故認(rèn)為準(zhǔn)確率、召回率和F1值的變化較RMSE更具價(jià)值和參考性。從項(xiàng)目排序的指標(biāo)看,3種模型算法中RSTE算法的推薦性能下降幅度尤為明顯。推測(cè)原因?yàn)镽STE算法的評(píng)分結(jié)果是由用戶本身評(píng)分與其好友評(píng)分線性組合而得,故其受關(guān)系影響最為直接與明顯,且在隨機(jī)移除10%與30%的關(guān)系后,RSTE的推薦質(zhì)量并無(wú)明顯下降,認(rèn)為這是由于刪減的關(guān)系中存在部分噪聲,刪減后對(duì)結(jié)果影響不大。SoRec算法受關(guān)系變化影響相對(duì)較弱,但整體的推薦性能也細(xì)微地呈現(xiàn)出下降趨勢(shì)。推測(cè)這是由于在SoRec算法中,關(guān)系矩陣采用了協(xié)同分解的方式,語(yǔ)義上更難以解釋?zhuān)逝笥训挠绊懴鄬?duì)RSTE較間接與隱式。而SocialMF盡管有較低的RMSE,其準(zhǔn)確率和召回率卻很低,且?guī)缀鯖](méi)有波動(dòng),故認(rèn)為其整體上基本不受關(guān)系數(shù)量變化的影響。

4.2 關(guān)系數(shù)量變化對(duì)不同用戶推薦性能的影響

按照3.3.2小節(jié)實(shí)驗(yàn)設(shè)計(jì)進(jìn)行實(shí)驗(yàn)后得出結(jié)果中RMSE值如表2所示,準(zhǔn)確率、召回率、F1值如圖3所示。

分析實(shí)驗(yàn)結(jié)果可知,在SoRec與RSTE算法中,隨著關(guān)系的減少,3種用戶的準(zhǔn)確率、召回率和F1值都呈下降趨勢(shì),但通過(guò)對(duì)比可知,活躍用戶的準(zhǔn)確率和F1值受關(guān)系影響最大,下降趨勢(shì)最明顯,普通用戶次之,不活躍用戶的準(zhǔn)確率和F1值下降的趨勢(shì)最微弱,受關(guān)系影響最小,但其召回率下降最劇烈,受關(guān)系影響最大。推測(cè)活躍用戶之所以對(duì)更多項(xiàng)目進(jìn)行了評(píng)分,原因之一可能為活躍用戶更多地關(guān)注了其朋友喜好的項(xiàng)目,瀏覽并評(píng)分了該項(xiàng)目。故當(dāng)關(guān)系數(shù)量減少時(shí),該用戶組的準(zhǔn)確率下降最為明顯。而不活躍用戶由于評(píng)分?jǐn)?shù)量較少,推薦列表中較小的變動(dòng),也會(huì)造成召回率的較大變化,故其召回率變化最為明顯。普通用戶則介于兩者之間。

4.3 中心節(jié)點(diǎn)與邊的變化對(duì)推薦性能的影響

按照3.3.3小節(jié)實(shí)驗(yàn)設(shè)計(jì)進(jìn)行實(shí)驗(yàn)后得出結(jié)果中RMSE值如表3所示,準(zhǔn)確率、召回率、F1值如圖4所示。

Table 2 RMSE of 3 algorithms on different user groups with different relation density表2 社交網(wǎng)絡(luò)中用戶數(shù)量的變化時(shí),不同用戶組推薦結(jié)果的RMSE值

Table 3 RMSE of 3 algorithms on condition that central nodes are removed proportionally表3 按中心性進(jìn)行節(jié)點(diǎn)關(guān)系刪減之后3種算法的RMSE值

Fig.3 Precision,recall and F1 of 3 algorithms on different user groups with different relation density圖3 不同用戶組在3種算法下的準(zhǔn)確率、召回率和F1值

從表3中可看出,3種算法的RMSE值在度中心性與點(diǎn)介數(shù)實(shí)驗(yàn)中均產(chǎn)生了一定變化,其中RSTE算法隨著中心節(jié)點(diǎn)/邊的移除,RMSE值減小,而SoRec算法的RMSE值表現(xiàn)為增大,SocialMF的RMSE值也有微小增大。另外3個(gè)指標(biāo)的變化如圖4所示,RSTE算法在度中心性與點(diǎn)介數(shù)中心性實(shí)驗(yàn)部分,推薦結(jié)果的準(zhǔn)確率、召回率與F1值呈陡峭下降后趨于平緩的態(tài)勢(shì),因關(guān)鍵點(diǎn)在所有數(shù)據(jù)中所占比重較小,在第一次刪減時(shí),關(guān)鍵點(diǎn)的減少對(duì)算法的影響較大。而在關(guān)鍵邊實(shí)驗(yàn)中,推薦結(jié)果的準(zhǔn)確率、召回率與F1值呈現(xiàn)明顯的逐步下降的趨勢(shì),且從度中心性和介數(shù)中心性實(shí)驗(yàn)的圖像可以看出,在刪減中心性排序靠前的10%的節(jié)點(diǎn)后,曲線呈現(xiàn)小幅度上升趨勢(shì),推測(cè)這是由于所刪數(shù)據(jù)中包含一定噪聲而造成的。而其他兩個(gè)算法中,SoRec算法受其影響較弱,而SocialMF依然幾乎不受影響。

4.4 中心節(jié)點(diǎn)的重要性驗(yàn)證

由4.3節(jié)發(fā)現(xiàn),中心節(jié)點(diǎn)在推薦算法中發(fā)揮著尤為重要的作用。因此在本節(jié)中將節(jié)點(diǎn)的度中心性信息融入到社會(huì)化推薦模型中,對(duì)以上實(shí)驗(yàn)結(jié)論進(jìn)行進(jìn)一步驗(yàn)證。

Fig.4 Precision,recall and F1 of 3 algorithms on conditions that nodes are removed proportionally by different ways圖4 按不同方式刪減數(shù)據(jù)后3種算法的準(zhǔn)確率、召回率和F1值

融入節(jié)點(diǎn)度中心性的RSTE+算法的優(yōu)化函數(shù)為:

融入節(jié)點(diǎn)度中心性的SocialMF+算法的優(yōu)化函數(shù)為:

融入節(jié)點(diǎn)度中心性的SoRec+算法的優(yōu)化函數(shù)為:

其中,Wi為Ui所代表的節(jié)點(diǎn)的中心性權(quán)重,滿足公式:

Wi∈(1,2),centrality∈[1,n],n為該網(wǎng)絡(luò)中最大中心性值。若Ui為孤立節(jié)點(diǎn),則Wi=1。

在對(duì)相同的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)后,得出結(jié)果如表4所示。從表4中可以看出,將中心性信息融入算法后,3種推薦算法的推薦質(zhì)量均有不同程度的提升。

Table 4 MAE and RMSE of algorithms after adding importance information of nodes表4 增加節(jié)點(diǎn)重要性信息后算法的MAE值與RMSE值

通過(guò)以上實(shí)驗(yàn)可以發(fā)現(xiàn),盡管在不同算法中社交信息的結(jié)合方式不同,但社交關(guān)系的加入明顯改善了推薦質(zhì)量。同時(shí),更多的關(guān)系信息將使得推薦結(jié)果更為精確,對(duì)于新用戶的推薦,關(guān)系的增多帶來(lái)的性能提升尤為顯著。此外,社交關(guān)系的結(jié)構(gòu)也左右著推薦質(zhì)量,中心節(jié)點(diǎn)在推薦算法中發(fā)揮著尤為重要的作用。

5 結(jié)束語(yǔ)

社交網(wǎng)絡(luò)平臺(tái)的興起帶來(lái)了豐富的社會(huì)信息,若將這些社會(huì)信息合理利用,社會(huì)化推薦系統(tǒng)的推薦質(zhì)量將得到極大改善。

本文著力于研究基于模型的社會(huì)化推薦系統(tǒng)中社交關(guān)系變化對(duì)推薦結(jié)果的影響,并主要從以下方面進(jìn)行了實(shí)驗(yàn)探究。首先,對(duì)社交網(wǎng)絡(luò)中關(guān)系數(shù)量的變化對(duì)推薦性能的影響進(jìn)行了分析;其次,通過(guò)對(duì)用戶進(jìn)行分類(lèi),分別研究關(guān)系數(shù)量的變化對(duì)不同用戶推薦性能的影響;最后,探究了在按照不同社交網(wǎng)絡(luò)特性使關(guān)系數(shù)量發(fā)生變化時(shí)對(duì)推薦性能的影響,并對(duì)結(jié)果進(jìn)行了驗(yàn)證。實(shí)驗(yàn)發(fā)現(xiàn)高密度的關(guān)系信息的融入將使得推薦結(jié)果更為精確,對(duì)于新用戶的推薦性能提升尤為明顯,社交信息數(shù)據(jù)中的噪聲會(huì)對(duì)推薦精度產(chǎn)生負(fù)面影響。此外,中心節(jié)點(diǎn)在推薦算法中發(fā)揮著尤為重要的作用。

在之后的工作中,將繼續(xù)在社交網(wǎng)絡(luò)對(duì)推薦質(zhì)量的影響方面開(kāi)展研究工作。根據(jù)本次的實(shí)驗(yàn)結(jié)果,尋找有效去除社交信息數(shù)據(jù)噪聲的新方法,探索能提高推薦質(zhì)量的最佳的社交信息結(jié)合方式,并使用更多具有代表性的算法與數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。

[1]Schafer J B,Frankowski D,Herlocker J,et al.Collaborative filtering recommender systems[M]//LNCS 4321:The Adaptive Web.Berlin,Heidelberg:Springer,2007:291-324.

[2]Su Xiaoyuan,Khoshgoftaar T M.A survey of collaborative filtering techniques[J].Advances in Artificial Intelligence,2009(12):4.

[3]Gao Huiji,Tang Jiliang,Liu Huan.gSCorr:modeling geosocial correlations for new check-ins on location-based social networks[C]//Proceedings of the 21st International Conference on Information and Knowledge Management,Maui,Oct 29-Nov 2,2012.New York:ACM,2012:1582-1586.

[4]Meng Xiangwu,Liu Shudong,Zhang Yujie,et al.Research on social recommender systems[J].Journal of Software,2015,26(6):1356-1372.

[5]Zhu Yangyong,Sun Jing.Recommender system:up to now[J].Journal of Frontiers of Computer Science and Technology,2015,9(5):513-525.

[6]Chen B C,Guo Jian,Tseng B L,et al.User reputation in a comment rating environment[C]//Proceedings of the 17th International Conference on Knowledge Discovery and Data Mining,San Diego,Aug 21-24,2011.New York:ACM,2011:159-167.

[7]Guy I.Social recommender systems[M]//Ricci F,Rokach L,Shapira B,ed.Recommender Systems Handbook.Boston:Springer US,2015:511-543.

[8]Victor P,Cornelis C,Cock M D,et al.A comparative analysis of trust-enhanced recommenders for controversial items[C]//Proceedings of the 3rd International Conference on Weblogs and Social Media,San Jose,May 17-20,2009.Menlo Park:AAAI,2009:342-345.

[9]Golbeck J.Generating predictive movie recommendations from trust in social networks[C]//LNCS 3986:Proceedings of the 4th International Conference on Trust Management,Pisa,May 16-19,2006.Berlin,Heidelberg:Springer,2006:93-104.

[10]Jamali M,Ester M.TrustWalker:a random walk model for combining trust-based and item-based recommendation[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Paris,Jun 28-Jul 1,2009.New York:ACM,2009:397-406.

[11]Symeonidis P.Matrix and tensor factorization with recommender system applications[J].Graph-Based Social Media Analysis,2016,39:187.

[12]Tang Jiliang,Hu Xia,Liu Huan.Social recommendation:a review[J].Social Network Analysis and Mining,2013,3(4):1113-1133.

[13]Ma Hao,Yang Haixuan,Lyu M R,et al.SoRec:social recom-mendation using probabilistic matrix factorization[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management,Napa Valley,Oct 26-30,2008.New York:ACM,2008:931-940.

[14]Ma Hao,King I,Lyu M R.Learning to recommend with social trust ensemble[C]//Proceedings of the 32ndAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval,Boston,Jul19-23,2009.New York:ACM,2009:203-210.

[15]Jamali M,Ester M.A matrix factorization technique with trust propagation for recommender in social networks[C]//Proceedings of the 4th ACM Conference on Recommender Systems,Barcelona,Sep 26-30,2010.New York:ACM,2010:135-142.

[16]Guo Guibing,Zhang Jie,Sun Zhu,et al.LibRec:a Java library for recommender systems[C]//CEUR Workshop Proceedings 1388:Proceedings of the 23rd Conference on User Modeling,Adaptation,and Personalization,Dublin,Jun 29-Jul 3,2015.

[17]Wang Haoxiang,Zeng Shan,Liu Huiyang.An importance analytical approach for online social network[J].Journal of Shanghai Jiaotong University,2013,47(7):1055-1059.

附中文參考文獻(xiàn):

[4]孟祥武,劉樹(shù)棟,張玉潔,等.社會(huì)化推薦系統(tǒng)研究[J].軟件學(xué)報(bào),2015,26(6):1356-1372.

[5]朱揚(yáng)勇,孫婧.推薦系統(tǒng)研究進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2015,9(5):513-525.

[17]王昊翔,曾珊,劉揮揚(yáng).虛擬社交網(wǎng)絡(luò)中節(jié)點(diǎn)重要度分析[J].上海交通大學(xué)學(xué)報(bào),2013,47(7):1055-1059.

猜你喜歡
社會(huì)化準(zhǔn)確率社交
社交之城
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
牽手校外,堅(jiān)持少先隊(duì)社會(huì)化
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
社交距離
行政權(quán)社會(huì)化之生成動(dòng)因闡釋
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
陕西省| 商城县| 托里县| 平凉市| 高碑店市| 金坛市| 浦城县| 剑河县| 莆田市| 普洱| 黄浦区| 汕尾市| 石棉县| 晋中市| 义马市| 曲周县| 方山县| 彭泽县| 开化县| 柳江县| 亚东县| 巴中市| 博白县| 灵川县| 济宁市| 铁岭县| 平湖市| 静海县| 易门县| 平阳县| 林周县| 长岭县| 南雄市| 大化| 枣阳市| 东乡族自治县| 阿拉尔市| 郓城县| 文昌市| 寻乌县| 响水县|