国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于社交影響力的推薦算法

2016-02-27 03:41:09陳升波孫知信
關(guān)鍵詞:影響力社交協(xié)同

房 旋,陳升波,宮 婧,,孫知信

(1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院、軟件學(xué)院,江蘇 南京 210003;2.南京郵電大學(xué) 理學(xué)院,江蘇 南京 210023;3.南京郵電大學(xué) 寬帶無線通信與傳感網(wǎng)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003)

基于社交影響力的推薦算法

房 旋1,陳升波2,宮 婧2,3,孫知信3

(1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院、軟件學(xué)院,江蘇 南京 210003;2.南京郵電大學(xué) 理學(xué)院,江蘇 南京 210023;3.南京郵電大學(xué) 寬帶無線通信與傳感網(wǎng)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003)

社交網(wǎng)站的興起促使社交推薦成為了推薦系統(tǒng)領(lǐng)域的熱門研究方向。微博是一類具有代表性的社交網(wǎng)站,其用戶之間以一對(duì)多的不對(duì)等關(guān)系為主,如何為微博用戶推薦潛在的關(guān)注對(duì)象是社交推薦中的一個(gè)重要研究點(diǎn)。文中針對(duì)微博類社交網(wǎng)站中用戶間關(guān)系不對(duì)等的特點(diǎn),結(jié)合用戶間的交互行為信息,提出了一種社交影響力的計(jì)算方法,并在此基礎(chǔ)上提出基于社交影響力的推薦算法(SIB)。該算法通過計(jì)算用戶社交影響力矩陣,然后使用K個(gè)最近鄰(K-NearestNeighbor,KNN)算法找出目標(biāo)用戶的鄰居集合,借助鄰居集合幫助推薦。該算法綜合考慮了微博社交網(wǎng)站中的兩種社交關(guān)系,能有效地對(duì)微博類社交網(wǎng)站進(jìn)行個(gè)性化推薦。通過在真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),證明該算法在微博類社交網(wǎng)站中的推薦效果比單純的基于用戶協(xié)同過濾(User-basedCollaborativeFiltering,UCF)算法有一定程度的提升。

社交網(wǎng)絡(luò);微博;社交影響力;協(xié)同過濾;推薦算法

1 概 述

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,為用戶提供個(gè)性化推薦成為了目前互聯(lián)網(wǎng)服務(wù)的一個(gè)重要內(nèi)容。推薦系統(tǒng)[1]的概念最早是在1997年提出的,一開始主要被用在電商網(wǎng)站中,向用戶推薦感興趣的商品[2]。

推薦系統(tǒng)的核心是推薦算法。早期的推薦算法主要分為基于內(nèi)容的推薦算法和協(xié)同過濾算法。

基于內(nèi)容的推薦算法的核心就是提取物品的特征,然后用TF-IDF方法計(jì)算各個(gè)特征的權(quán)重[3],并根據(jù)這些特征與用戶的喜好進(jìn)行匹配,從而向用戶進(jìn)行推薦。相比于多媒體信息(視頻、音頻、圖片等),文本類項(xiàng)目(新聞、網(wǎng)頁、博客)的特征相對(duì)容易提取,因而基于內(nèi)容的推薦方法在文本類推薦領(lǐng)域得到了廣泛應(yīng)用。

協(xié)同過濾算法主要分為兩大類:基于記憶(memory-based)和基于模型(model-based)[4]。基于記憶的方法又可以分為基于用戶(user-based)[5]和基于項(xiàng)目(item-based)[6]的方法?;谟脩舻膮f(xié)同過濾算法思想是找到和目標(biāo)用戶相似的鄰居用戶,利用鄰居用戶的評(píng)分來估計(jì)目標(biāo)用戶的評(píng)分?;陧?xiàng)目的協(xié)同過濾算法認(rèn)為,不同項(xiàng)目之間存在相似性,當(dāng)需要估計(jì)目標(biāo)用戶對(duì)某個(gè)項(xiàng)目的評(píng)分時(shí),可以根據(jù)該目標(biāo)用戶對(duì)相似項(xiàng)目的評(píng)分進(jìn)行估計(jì)。

基于模型的推薦算法主要是利用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和概率統(tǒng)計(jì)等方法,對(duì)用戶的歷史行為數(shù)據(jù)進(jìn)行分析,建立用戶模型,從而進(jìn)行推薦[7]。

雖然協(xié)同過濾算法的商業(yè)應(yīng)用非常成功,但是其存在的問題也不容忽視。冷啟動(dòng)和數(shù)據(jù)稀疏性是協(xié)同過濾算法最突出的兩個(gè)問題。

近年來,隨著Facebook、騰訊微博等社交網(wǎng)站的興起,如何利用用戶與用戶之間的社交關(guān)系進(jìn)行個(gè)性化推薦成為了研究的熱點(diǎn)。社交關(guān)系中包含了大量信息,如果能充分挖掘并利用好這些信息,可以在一定程度上緩解傳統(tǒng)協(xié)同過濾算法存在的問題,對(duì)后者是一個(gè)有效的補(bǔ)充,可以改善推薦的效果。文獻(xiàn)[8]利用Social Networks Analysis (SNA)理論分析微博內(nèi)容,從中提取出關(guān)鍵詞作為特征圖譜,并以此來構(gòu)建用戶與用戶以及用戶與商品之間的關(guān)系,從而進(jìn)行商品推薦。文獻(xiàn)[9]認(rèn)為在社會(huì)語境中存在兩個(gè)有效的語境因素—個(gè)體偏好和人際影響,可以將用戶-項(xiàng)目矩陣分解成用戶-項(xiàng)目偏好矩陣和用戶-項(xiàng)目影響力矩陣,并據(jù)此提出了一種基于社會(huì)語境的推薦框架。文獻(xiàn)[10]重新定義了社交網(wǎng)絡(luò)中的相似度屬性、相似度構(gòu)成及其計(jì)算方法,提出了一種改進(jìn)的協(xié)同過濾推薦算法。文獻(xiàn)[11]則從待推薦對(duì)象間的關(guān)系出發(fā),提出了一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法。Nirmal Jonnalagedda等在文獻(xiàn)[12]中提出了利用Twitter來提取用戶的興趣愛好和新聞的流行程度,進(jìn)而向用戶提供個(gè)性化的新聞推薦。文獻(xiàn)[13]提出利用目標(biāo)用戶的歷史數(shù)據(jù)構(gòu)建一個(gè)個(gè)性化的候選項(xiàng)排序模型,同時(shí)提出一種具備多種推薦策略的推薦系統(tǒng),可以向Twitter用戶推薦一些值得關(guān)注的對(duì)象。

上述研究表明,大多數(shù)算法把重心放在對(duì)用戶歷史評(píng)分信息或者文本內(nèi)容的挖掘上,對(duì)于社交關(guān)系中包含的互動(dòng)信息仍未能進(jìn)行充分挖掘,推薦的準(zhǔn)確度仍有提高的空間。針對(duì)這一問題,文中引入社交影響力的概念,在基于用戶的協(xié)同過濾算法的基礎(chǔ)上,提出一種基于社交影響力的SIB(Social Influence-Based)推薦算法,并對(duì)其推薦效果進(jìn)行驗(yàn)證。

2 SIB推薦算法

傳統(tǒng)的基于用戶的協(xié)同過濾算法通過計(jì)算用戶相似度矩陣,來尋找用戶的最近鄰居。這里的相似度矩陣是一個(gè)對(duì)稱矩陣,即認(rèn)為用戶與用戶之間的關(guān)系是對(duì)等的。

然而在社交關(guān)系中,用戶與用戶之間不一定是對(duì)等關(guān)系?,F(xiàn)實(shí)生活中也是這樣,兩人即使是好友,對(duì)方在自己心目中的地位和自己在對(duì)方心目中的地位也不一定完全對(duì)等,只能說好友之間的關(guān)系的對(duì)等程度普遍要大于陌生人。因此,文中采用社交影響力來描述用戶與用戶之間的社交關(guān)系。社交影響力表示的是單向的社會(huì)關(guān)系,這比傳統(tǒng)的相似度更加適用于社交場景。

2.1 算法介紹

SIB推薦算法通過挖掘用戶之間的社交關(guān)系數(shù)據(jù),建立用戶之間的社交影響力矩陣,從而為用戶提供推薦。該算法流程見圖1。

圖1 融合社交網(wǎng)絡(luò)信息的協(xié)同過濾算法流程

首先根據(jù)用戶評(píng)分信息計(jì)算出用戶之間的相似度,然后根據(jù)用戶的社交信息計(jì)算出用戶的基礎(chǔ)影響力,通過線性融合的方式將二者結(jié)合起來,形成影響力矩陣。接著對(duì)用戶的影響力進(jìn)行排序,找到對(duì)目標(biāo)用戶影響力最大的K個(gè)鄰居用戶,利用這些鄰居用戶對(duì)待預(yù)測項(xiàng)目的評(píng)分估計(jì)目標(biāo)用戶對(duì)待預(yù)測項(xiàng)目的評(píng)分,挑選出預(yù)測評(píng)分最高的L個(gè)項(xiàng)目作為推薦列表。

2.2 相關(guān)定義

在微博系統(tǒng)中,用戶的社交關(guān)系主要有兩種(如圖2所示):一種是關(guān)注/被關(guān)注的靜態(tài)關(guān)系;另一種是提及(mention)/轉(zhuǎn)發(fā)(re-post)/評(píng)論(comment)的動(dòng)態(tài)的互動(dòng)關(guān)系。同一個(gè)用戶的關(guān)注用戶集合和互動(dòng)用戶集合并不一定完全重合。關(guān)注/被關(guān)注的關(guān)系用關(guān)注影響力來衡量,用follow表示;互動(dòng)關(guān)系用互動(dòng)影響力來衡量,用interact表示。文中利用關(guān)注影響力和互動(dòng)影響力來計(jì)算用戶之間的社交影響力。

圖2 微博系統(tǒng)中的兩種社交關(guān)系

定義1:關(guān)注影響力follow(u,v)。

(1)

其中,outDegree(u)指用戶u關(guān)注的人數(shù),在社交圖中用頂點(diǎn)的出度表示。

關(guān)注影響力的含義如下:

(1)如果用戶u和用戶v互相關(guān)注了對(duì)方,那么u和v很可能互相認(rèn)識(shí),甚至是現(xiàn)實(shí)中的朋友。在這種情況下,他們之間有相似愛好的可能性很大,同時(shí)他們推薦給對(duì)方的東西更容易被接受,即他們對(duì)對(duì)方都有較大的影響力。

(2)如果用戶u關(guān)注了v,而v未關(guān)注u。這種情況可能是因?yàn)関的某些方面是u所喜歡的,u是v的“粉絲”。那么可以認(rèn)為v對(duì)于u是有一定影響力的,而u對(duì)于v則沒有什么影響力。在這種情況下,考慮到有些用戶傾向于關(guān)注很多對(duì)象,其關(guān)注行為的價(jià)值就會(huì)變低,而有些用戶傾向于關(guān)注少量對(duì)象,其關(guān)注行為的價(jià)值就會(huì)比較高,因此將用戶u關(guān)注的人數(shù)納入計(jì)算。用戶u關(guān)注的人越多,其中某個(gè)被關(guān)注對(duì)象v對(duì)他的影響力就會(huì)降低。

(3)如果用戶u和用戶v都沒有關(guān)注對(duì)方,那么他們之間的關(guān)注影響力為0。

定義2:社交行為action(u,v)。

社交行為指提及(mention)、轉(zhuǎn)發(fā)(re-post)和評(píng)論(comment)。action(u,v)表示用戶u對(duì)用戶v發(fā)起的社交行為的次數(shù),具體來說就是u提及v的次數(shù)(at(u,v))、u轉(zhuǎn)發(fā)v的微博次數(shù)(re(u,v))以及u評(píng)論v的微博次數(shù)(com(u,v))三者之和。

定義3:互動(dòng)影響力interact(u,v)。

interact(u,v)=

(2)

其中,action(u,v)表示用戶u對(duì)用戶v發(fā)起的社交行為次數(shù);actionSum(u,v)表示u,v之間的互動(dòng)總次數(shù);MIN_ACTION_SUM是一個(gè)閾值,當(dāng)u,v之間的互動(dòng)總次數(shù)小于這個(gè)閾值時(shí),互動(dòng)影響力設(shè)為0,以減少噪音。

互動(dòng)總次數(shù)的公式如下:

actionSum(u,v)=action(u,v)+action(v,u)

(3)

f1是一個(gè)系數(shù),其計(jì)算公式為:

(4)

函數(shù)f(x)定義如下:

(5)

(6)

其中,R表示的是用戶u對(duì)用戶v發(fā)起的社交行為次數(shù)占u,v之間互動(dòng)總次數(shù)的比重,該值越大說明u越關(guān)注v。

當(dāng)R=0時(shí),說明u根本不關(guān)注v,則v對(duì)u的影響力為0;

當(dāng)R大于0小于0.5時(shí),說明u不是很關(guān)注v,但v對(duì)u的影響力會(huì)隨著R的增大而增大;

當(dāng)R=0.5時(shí),說明u,v之間的互動(dòng)關(guān)系是比較平衡的,基本上是“有來有往”,那么u和v是好友的可能性很大,可以認(rèn)為此時(shí)v對(duì)u的影響力最大;

當(dāng)R大于0.5小于1時(shí),說明u很關(guān)注v,但v不是很關(guān)注u,可以認(rèn)為u是v的“粉絲”,此時(shí)v對(duì)u的影響力比較大,但會(huì)隨著R的增大而減??;

當(dāng)R=1時(shí),說明v根本不關(guān)注u,u單方面關(guān)注v,此時(shí)v對(duì)u還是有一定影響力的,但不如好友對(duì)其的影響力大,將影響力的值定義為最大值的0.8倍。

定義4:基礎(chǔ)影響力BaseInfluence(u,v)。

BaseInfluence(u,v)表示用戶v對(duì)用戶u的基礎(chǔ)影響力。基礎(chǔ)影響力越大,用戶v推薦給用戶u的東西被接受的可能性越大。

BaseInfluence(u,v)=

(7)

定義5:用戶相似度[14]similarity(u,v)。

用戶相似度是根據(jù)用戶的歷史評(píng)分信息計(jì)算出來的用戶之間的相似程度。在基于用戶的協(xié)同過濾算法中,常用的計(jì)算用戶相似度的方法有余弦相似度、皮爾森相關(guān)系數(shù)、杰卡德相關(guān)系數(shù)等。

杰卡德相關(guān)系數(shù)衡量的是兩個(gè)集合之間的相似程度,它更加適合于描述離散值集合的相似度。微博系統(tǒng)中的評(píng)分正好是離散的:接受推薦用1標(biāo)注,拒絕推薦用-1標(biāo)注,未表態(tài)用0標(biāo)注。因此文中采用杰卡德相關(guān)系數(shù)來計(jì)算用戶之間的相似度是合適的。

用戶u和用戶v之間的相似度用杰卡德相關(guān)系數(shù)表示如下:

其中,l{x}是一個(gè)指示函數(shù),如果x值為真,則l{x}值為1;如果x值為假,則l{x}值為0。rui和rvi分別表示用戶u和用戶v對(duì)項(xiàng)目i的評(píng)分。I(u)和I(v)分別表示用戶u和用戶v有評(píng)分的項(xiàng)目集合。

定義6:社交影響力SocialInfluence(u,v)。

SocialInfluence(u,v)=(1-δ)?similarity(u,v)+ δ?BaseInfluence(u,v)

(9)

其中,similarity(u,v)是用戶u和用戶v的相似度;BaseInfluence(u,v)是用戶v對(duì)用戶u的基礎(chǔ)影響力;δ是系數(shù)。

通過上述公式得到任意用戶v對(duì)任意用戶u的社交影響力,N個(gè)用戶的社交影響力就構(gòu)成一個(gè)N×N維的社交影響力矩陣。

有了社交影響力矩陣以后,就可以采用KNN算法[15]尋找目標(biāo)用戶影響力最大的K個(gè)用戶,因?yàn)樯缃粩?shù)據(jù)的稀疏性,為了避免鄰居用戶和目標(biāo)用戶之間影響力過小造成計(jì)算不準(zhǔn)確,因此采用基于閾值的KNN算法。首先設(shè)定一個(gè)影響力閾值MIN_INFLUENCE,只有影響力大于這個(gè)閾值的用戶才會(huì)被加入鄰居集合,雖然這樣得到的鄰居數(shù)可能少于K個(gè),但可以提高推薦準(zhǔn)確度。

2.3 算法設(shè)計(jì)

算法1:尋找用戶u的最大影響力鄰居集合。

輸入:社交影響力矩陣I,目標(biāo)用戶u,鄰居數(shù)K,影響力閾值MIN_INFLUENCE;

輸出:鄰居集合N(u)。

S1:找出所有對(duì)u的影響力不為0的用戶,加入鄰居集合,并按照影響力倒序排列;

S2:取鄰居集合最后一個(gè)用戶,判斷影響力是否大于閾值,如果是,轉(zhuǎn)S3,否則轉(zhuǎn)S4;

S3:判斷當(dāng)前鄰居數(shù)是否大于K,如果是,轉(zhuǎn)S4,否則轉(zhuǎn)S5;

S4:將該用戶從鄰居集合中刪除,轉(zhuǎn)S2;

S5:返回鄰居集合。

有了最大影響力鄰居集合以后就可以根據(jù)鄰居用戶的評(píng)分信息來預(yù)測目標(biāo)用戶對(duì)未知項(xiàng)目的評(píng)分。預(yù)測用戶u對(duì)未知項(xiàng)目i的評(píng)分采用如下公式:

(10)

有了目標(biāo)用戶對(duì)未知項(xiàng)目的評(píng)分,就可以從未知項(xiàng)目中找出預(yù)測評(píng)分最高的L個(gè)項(xiàng)目,組成推薦集合推薦給目標(biāo)用戶。

算法2:SIB推薦算法。

輸入:用戶列表,用戶評(píng)分?jǐn)?shù)據(jù),用戶社交數(shù)據(jù),目標(biāo)用戶u,鄰居數(shù)K,推薦列表長度N,閾值MIN_ACTION_SUM、MIN_INFLUENCE;

輸出:為目標(biāo)用戶u生成的推薦結(jié)果列表R。

S1:根據(jù)用戶評(píng)分?jǐn)?shù)據(jù)計(jì)算用戶之間的相似度,得到用戶相似度矩陣S;

S2:根據(jù)用戶社交數(shù)據(jù)和閾值MIN_ACTION_SUM計(jì)算用戶之間基礎(chǔ)影響力,得到基礎(chǔ)影響力矩陣B;

S3:根據(jù)社交影響力生成公式計(jì)算社交影響力,得到社交影響力矩陣I;

S4:根據(jù)算法1計(jì)算得到目標(biāo)用戶u的最大影響力鄰居集合N(u);

S5:根據(jù)評(píng)分預(yù)測公式預(yù)測目標(biāo)用戶u對(duì)所有未知項(xiàng)目的評(píng)分,并將評(píng)分按照從高到低排序,取預(yù)測評(píng)分最高的前L個(gè)項(xiàng)目組成推薦列表R,推薦給目標(biāo)用戶u;

S6:算法結(jié)束。

3 實(shí)驗(yàn)設(shè)計(jì)及分析

3.1 實(shí)驗(yàn)數(shù)據(jù)及評(píng)價(jià)標(biāo)準(zhǔn)

為了驗(yàn)證文中提出算法的有效性,用KDD CUP 2012 Track1數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。下面簡要介紹一下所采用的數(shù)據(jù)集的基本情況。

KDD CUP 2012 Track1數(shù)據(jù)集中的數(shù)據(jù)來源于騰訊微博的真實(shí)數(shù)據(jù),其中包含了1 000萬用戶和5萬個(gè)項(xiàng)目,以及3億條推薦記錄和大約300萬個(gè)社會(huì)網(wǎng)絡(luò)的“關(guān)注(following)”行為。其中,用戶對(duì)項(xiàng)目關(guān)注情況采用-1、0、1三個(gè)數(shù)值表示:接受關(guān)注用1表示,拒絕關(guān)注用-1表示,未表態(tài)用0表示。除此之外,該數(shù)據(jù)集中還包含用戶屬性、用戶社交關(guān)系等信息。

由于原數(shù)據(jù)集比較龐大,為了提高實(shí)驗(yàn)效率,從原數(shù)據(jù)集中隨機(jī)抽取一部分作為實(shí)驗(yàn)數(shù)據(jù)。在該實(shí)驗(yàn)中,隨機(jī)抽取了3 000個(gè)用戶對(duì)2 740個(gè)項(xiàng)目的關(guān)注信息,以及這3 000個(gè)用戶的社交關(guān)系數(shù)據(jù)作為訓(xùn)練集。同時(shí)還隨機(jī)抽取了500個(gè)用戶作為測試集。

3.2 實(shí)驗(yàn)評(píng)估指標(biāo)

實(shí)驗(yàn)采用的評(píng)價(jià)指標(biāo)是MAE。MAE指標(biāo)衡量的是推薦算法的準(zhǔn)確率,值越小越好。

MAE計(jì)算的是預(yù)測評(píng)分和實(shí)際評(píng)分之間的平均誤差,其定義為:

(11)

3.3 實(shí)驗(yàn)結(jié)果及分析

設(shè)定推薦列表長度L=5,BaseInfluence所占比重δ={0.2,0.4,0.6}。對(duì)于每個(gè)δ,都考察不同鄰居數(shù)K情況下的實(shí)驗(yàn)結(jié)果,K={2,4,6,8,10,12,14,16,18,20},并且和傳統(tǒng)UCF算法進(jìn)行比較,見圖3~5。

圖3 δ取0.2時(shí)算法MAE指標(biāo)隨著鄰居數(shù)K的變化曲線

從實(shí)驗(yàn)結(jié)果可以看出,文中提出的基于用戶社交影響力的SIB推薦算法較傳統(tǒng)UCF算法在推薦準(zhǔn)確率上有所提升。因?yàn)樯缃粩?shù)據(jù)相對(duì)于用戶評(píng)分?jǐn)?shù)據(jù)更為稀疏,隨著δ值的變大,或多或少會(huì)引入噪聲,影響SIB算法的推薦效果。但總體上可以看出,挖掘用戶的社交數(shù)據(jù)對(duì)于提升推薦算法的推薦效果有著積極意義,尤其是針對(duì)微博類社交網(wǎng)站中用戶關(guān)系不對(duì)等的特點(diǎn),SIB算法中建立的影響力模型能夠較好地描述這一特點(diǎn)。

圖4 δ取0.4時(shí)算法MAE指標(biāo)隨著鄰居數(shù)K的變化曲線

圖5 δ取0.6時(shí)算法MAE指標(biāo)隨著鄰居數(shù)K的變化曲線

4 結(jié)束語

在社交網(wǎng)站中,豐富的社交關(guān)系數(shù)據(jù)具有非常大的利用價(jià)值。利用用戶的社交關(guān)系數(shù)據(jù)輔助推薦是目前社交類推薦系統(tǒng)研究的熱點(diǎn)。微博系統(tǒng)作為目前非常流行的社交系統(tǒng),有其自身的特點(diǎn)。好友關(guān)系在微博系統(tǒng)中并不是主要的社交關(guān)系,更多的是關(guān)注與被關(guān)注的關(guān)系。如何能更好地描述用戶與用戶之間這種不對(duì)等的社交關(guān)系,對(duì)于提升微博類社交網(wǎng)站的推薦效果有很大的意義。基于這方面的考慮,文中提出的SIB推薦算法充分利用了用戶關(guān)注數(shù)據(jù)和互動(dòng)數(shù)據(jù),不僅在一定程度上可以緩解冷啟動(dòng)問題,而且對(duì)于傳統(tǒng)UCF算法是一個(gè)很好的補(bǔ)充,提高了推薦算法的準(zhǔn)確率。

后續(xù)研究需要繼續(xù)考慮微博系統(tǒng)的特點(diǎn),繼續(xù)對(duì)其中的社交數(shù)據(jù)或者文本數(shù)據(jù)進(jìn)行分析挖掘。例如,可以考慮微博內(nèi)容的“話題性”、微博名人的領(lǐng)域權(quán)威性、被推薦對(duì)象之間的關(guān)聯(lián)關(guān)系以及被推薦對(duì)象對(duì)普通用戶的影響力等等。社交系統(tǒng)中的信息非常豐富,數(shù)據(jù)量非常大,也可以考慮對(duì)數(shù)據(jù)進(jìn)行分布式處理,這樣可以對(duì)更多的數(shù)據(jù)進(jìn)行挖掘,提高處理的效率。

[1]ResinickP,VarianHR.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]LindenG,SmithB,YorkJ.Amazon.comrecommendationsitem-to-itemcollaborativefiltering[J].IEEEInternetComputing,2003,7(1):76-80.

[3] 王嫣然,陳 梅,王翰虎,等.一種基于內(nèi)容過濾的科技文獻(xiàn)推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(2):66-69.

[4]BreeseJS,HeckermanD,KadieC.Empiricalanalysisofpredictivealgorithmsforcollaborativefiltering[C]//Proceedingsofthe14thconferenceonuncertaintyinartificialintelligence.[s.l.]:[s.n.],1998:43-52.

[5]ResnickP,IakovouN,SushakM,etal.GroupLens:anopenarchitectureforcollaborativefilteringofnetnews[C]//Proceedingsofthe1994computersupportedcooperativeworkconference.[s.l.]:[s.n.],1994:175-186.

[6]SarwarB,KarypisG,KonstanJ.Item-basedcollaborativefilteringrecommendationalgorithms[C]//Proceedingsofthe10thinternationalconferenceonworldwideweb.[s.l.]:[s.n.],2001:285-295.

[7] 陳克寒,韓盼盼,吳 健.基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2013,36(2):349-359.

[8]ChangPei-Shan,TingI-Hsien,WangShyue-Liang.Towardssocialrecommendationsystembasedonthedatafrommicroblogs[C]//Procofinternationalconferenceonadvancesinsocialnetworksanalysisandmining.[s.l.]:IEEE,2011:672-677.

[9]JiangMeng,CuiPeng,WangFei,etal.Scalablerecommendationwithsocialcontextualinformation[J].IEEETransactionsonKnowledgeandDataEngineering,2014,26(11):2789-2802.

[10] 榮輝桂,火生旭,胡春華,等.基于用戶相似度的協(xié)同過濾推薦算法[J].通信學(xué)報(bào),2014,35(2):16-24.

[11] 郭 磊,馬 軍,陳竹敏,等.一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):219-228.

[12]JonnalageddaN,GauchS.Personalizednewsrecommendationusingtwitter[C]//ProcofIEEE/WIC/ACMInternationalconferencesonwebintelligenceandintelligentagenttechnology.[s.l.]:IEEE,2013:21-25.

[13]IslamM,DingChen,ChiChi-Hung.Personalizedrecommendersystemonwhomtofollowintwitter[C]//ProceedingsofIEEEfourthinternationalconferenceonbigdataandcloudcomputing.[s.l.]:IEEE,2014:326-333.

[14]DengYingying,LuTun,XiaHuanhuan,etal.AOPUT:arecommendationframeworkbasedonsocialactivitiesandcontentinterests[C]//ProceedingsofIEEE17thinternationalconferenceoncomputersupportedcooperativeworkindesign.[s.l.]:IEEE,2013:545-550.

[15] 黃創(chuàng)光,印 鑒,汪 靜,等.不確定近鄰的協(xié)同過濾推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(8):1369-1377.

A Recommendation Algorithm Based on Social Influence

FANG Xuan1,CHEN Sheng-bo2,GONG Jing2,3,SUN Zhi-xin3

(1.School of Computer Science,School of Software,Nanjing University of Posts and Telecommunications,class="content_center">Nanjing 210003,China;2.College of Mathematics & Physics,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;3.Key Laboratory of Broadband Wireless Communication and Sensor Network Technology,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

The rise of social networking sites promotes social recommendation becoming the research hotspot in the field of recommender systems.As a representative social network,Weibo has unequal one-to-many relationship between users.How to recommend potential Weibo users concerned is an important research direction in the social recommendation.Aiming at the characteristics of unequal relationship between users in social network of Weibo,combined with the mutual behavior information between users,a computing method of social influence is proposed and on the basis,a SIB algorithm is also presented.By calculating the social influence matrix of user,this algorithm uses the KNN algorithm to find the target user set of neighbors,and helps to recommend with the aid of neighbors set.The algorithm considers the two kinds of social relations for social network in Weibo,which can effectively conduct personalized recommendation for social networking sites in Weibo.The experiment shows that the SIB algorithm can effectively improve the accuracy of recommendation system in social networks compared with UCF algorithm.

social network;Weibo;social influence;collaborative filtering;recommendation algorithm

2015-09-12

2015-12-16

時(shí)間:2016-05-25

國家自然科學(xué)基金資助項(xiàng)目(60973140,61170276,61373135);江蘇省產(chǎn)學(xué)研項(xiàng)目(BY2013011);江蘇省科技型企業(yè)創(chuàng)新基金(BC2013027);江蘇省高校自然科學(xué)研究重大項(xiàng)目(12KJA520003);江蘇省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201410293023Z)

房 旋(1990-),男,碩士生,研究方向?yàn)橐苿?dòng)開發(fā)、推薦系統(tǒng);宮 婧,副教授,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù);孫知信,教授,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)。

http://www.cnki.net/kcms/detail/61.1450.TP.20160525.1706.036.html

TP

A

1673-629X(2016)06-0031-06

10.3969/j.issn.1673-629X.2016.06.007

猜你喜歡
影響力社交協(xié)同
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
蜀道難:車與路的協(xié)同進(jìn)化
社交距離
“四化”協(xié)同才有出路
汽車觀察(2019年2期)2019-03-15 06:00:50
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
天才影響力
NBA特刊(2018年14期)2018-08-13 08:51:40
黃艷:最深遠(yuǎn)的影響力
三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
3.15消協(xié)三十年十大影響力事件
沾化县| 石林| 甘洛县| 平果县| 高陵县| 芒康县| 天津市| 来凤县| 兰西县| 甘谷县| 平武县| 北票市| 盈江县| 和龙市| 囊谦县| 汉川市| 兴安县| 张家口市| 萨迦县| 海淀区| 涟水县| 年辖:市辖区| 泰顺县| 宁陵县| 遵义市| 黑河市| 乌审旗| 乡宁县| 阿拉善盟| 巨鹿县| 张掖市| 湄潭县| 登封市| 江陵县| 交口县| 化州市| 东宁县| 湄潭县| 梧州市| 乐山市| 清河县|