崔 琳,宋啟祥,李玉林,戚溪溪
宿州學院信息工程學院,宿州,234000
基于潛在地理—社會關(guān)系感知的興趣點推薦研究
崔 琳,宋啟祥,李玉林,戚溪溪
宿州學院信息工程學院,宿州,234000
針對已有的興趣點推薦模型大都采用無地理空間限制的顯式社會關(guān)系和隱式社會關(guān)系進行興趣點推薦,而基于地理空間限制的顯式社會關(guān)系和隱式社會關(guān)系對興趣點推薦結(jié)果有著極為重要的影響。為此,提出了一種新型的基于潛在地理—社會關(guān)系挖掘的興趣點推薦模型。使用核密度估計方法對用戶簽到行為可達的地理影響區(qū)域進行個性化分析,然后使用所提出的兩跳隨機游走算法挖掘用戶之間的顯式社會關(guān)系和隱式社會關(guān)系,把用戶可達地理區(qū)域內(nèi)的顯式社會關(guān)系和隱式社會關(guān)系作為一個正則項融合到傳統(tǒng)的矩陣分解模型中。兩個真實數(shù)據(jù)集上的實驗結(jié)果顯示所提出的潛在地理—社會關(guān)系挖掘的興趣點推薦模型優(yōu)于文中所選擇的其他4個興趣點推薦對比方法。
基于位置的社會網(wǎng)絡(luò);興趣點推薦;地理-社會關(guān)系;顯式社會關(guān)系;隱式社會關(guān)系
隨著移動設(shè)備、無線通訊和位置獲取技術(shù)的迅速發(fā)展,基于位置的社會網(wǎng)絡(luò)(Location-based social networks,LBSN)Foursquare、Gowalla、Facebook places和豆瓣網(wǎng)等已吸引了成千上萬用戶的注意[1-3]。在這些基于位置的社會網(wǎng)絡(luò)下,用戶可以分享他們訪問某一具體位置的經(jīng)驗,并把自己認為不錯的場所,如飯店、商店和博物館等推薦給其他用戶,這就是興趣點推薦。當前,有許多關(guān)于興趣點推薦研究的工作。其中,一些研究顯示人們總是探索他們之前訪問過興趣點附近的位置[4-5],因此被用戶訪問過的興趣點常常呈現(xiàn)出空間聚類的特征。一些研究工作聚焦于使用LBSN中的用戶關(guān)系來改善推薦性能,此工作把所有存在社會鏈接關(guān)系的相似度作為正則項融合到推薦系統(tǒng)中來約束矩陣分解;然而,在推薦任務(wù)中,只依賴于用戶之間直接存在的顯式鏈接社會關(guān)系是不太有效的[6]。
在基于位置的社會網(wǎng)絡(luò)下,挖掘某一特定的地理區(qū)域下用戶之間的顯式—隱式社會關(guān)系非常重要。例如,對于用戶Linda,假設(shè)存在兩種類型的用戶和Linda有地理—社會相關(guān)性,一種類型的用戶是在Linda可達的地理空間下和Linda有直接聯(lián)系的用戶,被定義為與Linda存在顯式社會關(guān)系的用戶;另一種類型的用戶是在Linda可達的地理空間下,Linda朋友的朋友,與Linda之間通過Linda的朋友間接和Linda存在關(guān)系,這種關(guān)系在本文中被定義為用戶之間的隱式社會關(guān)系。在Linda可以到達的區(qū)域,借助于顯式—隱式用戶關(guān)系,能夠為Linda推薦Linda未簽到的,但又是Linda有可能感興趣的興趣點。
受上邊例子所啟發(fā),本文提出一種基于潛在地理—社會關(guān)系感知的興趣點推薦模型(Potential Geo-Social Relationship Awareness for Point of Interest Recommendation,PGSR-PR)。在地理—社會關(guān)系挖掘階段,用戶間的顯式—隱式地理-社會關(guān)系使用核密度估計方法和兩跳隨機游走算法被識別出來。然后,把識別出的顯式—隱式地理—社會關(guān)系作為一個正則項融合到矩陣分解中。最后,使用改進的矩陣分解模型實現(xiàn)把前N個興趣點的推薦列表(top-N)推薦給用戶。這是第一個聚焦于某一地理區(qū)域下的顯式—隱式用戶關(guān)系的興趣點推薦模型。為了驗證PGSR-PR模型的有效性,與其他4種基線方法在Foursquare和Gowalla數(shù)據(jù)集上作了實驗結(jié)果比較與分析,結(jié)果顯示所提出的PGSR-PR模型在精確率(P@N)、召回率(R@N)和歸一化折扣累計增益(NDCG)指標上優(yōu)于其他4種基線方法。
以下介紹與本研究相關(guān)的三項研究工作,即傳統(tǒng)推薦方法、矩陣分解技術(shù)、基于地理空間關(guān)系和社會關(guān)系的興趣點推薦方法。
1.1 傳統(tǒng)推薦方法
傳統(tǒng)推薦方法分為基于內(nèi)容的方法和協(xié)同過濾方法兩類[7]?;趦?nèi)容的推薦方法主要依據(jù)推薦項目和用戶畫像內(nèi)容信息的相關(guān)性,為用戶推薦相關(guān)的項目[8],但是不能靈活地結(jié)合與用戶相關(guān)的各種各樣的信息,故很少被用于興趣點推薦。協(xié)同過濾率方法主要分為基于記憶的方法和基于模型的方法兩類[9]。例如,Ye等人采用基于記憶的方法執(zhí)行興趣點推薦,然而,基于記憶的推薦方法通常面臨冷啟動和數(shù)據(jù)稀疏性等問題[10]。基于模型的推薦方法已被廣泛應(yīng)用于興趣點推薦[11],這種方法把原始的評分矩陣擬合為一個模型,通過概率分布或者低維矩陣減少模型的維度和稀疏性,然后被應(yīng)用于預測未評價項目的分數(shù)。在基于不同模型的方法中,矩陣分解是一種最被常用的方法,由于其可擴展性和更為精確的優(yōu)勢,已引起許多關(guān)注。
1.2 矩陣分解技術(shù)
矩陣分解已被成功地用于各種各樣的推薦系統(tǒng),它假設(shè)用戶和項目(興趣點、電影和產(chǎn)品等)能夠被建模成潛在表示集合,在一起確定未評分項目的愛好[12]。許多矩陣分解模型已被用于興趣點推薦領(lǐng)域,例如,Zhao等人通過使用用戶、地點和時間的異構(gòu)關(guān)系,提出一種貝葉斯概率張量分解模型去抽取推薦的社會維度[13];Hu等人通過考慮項目的內(nèi)在特征和它的地理鄰居的外在特征,開發(fā)了一種基于矩陣分解的潛在因子模型用于地理評分預測,與其他方法相比較,此模型能獲得更低的預測誤差[14]。
1.3 基于地理空間關(guān)系和社會關(guān)系的興趣點推薦方法
在基于位置的社會網(wǎng)絡(luò)下,用戶的朋友比非朋友能分享更多的用戶自身感興趣的信息,一些興趣點推薦方法通過考慮社會關(guān)系來改善推薦的質(zhì)量。Berjani等人在基于位置的社會網(wǎng)絡(luò)下提出基于正則矩陣分解的興趣點推薦方法[15]。Ye等人基于朋友共同訪問的簽到數(shù),提出了基于朋友的協(xié)同過濾方法用于興趣點推薦,基于朋友間的社會鏈接關(guān)系和他們簽到活動的相似度,推導了兩個朋友間的社會影響權(quán)重[16]。Li等人開發(fā)了一個新的社會朋友概率矩陣分解模型,在社會朋友空間,用戶愛好被假設(shè)通過社會網(wǎng)絡(luò)傳播,重復訪問他的朋友訪問過的歷史興趣點[1]。
最新研究顯示位置的地理臨近性大大影響用戶的簽到行為。Liu等人觀察發(fā)現(xiàn)用戶總是訪問離家或者辦公室近的位置,也比較感興趣探索他們訪問過的位置就近的地方。他們假設(shè)被同一個用戶訪問的兩個位置之間的地理距離遵循冪律分布[17]。Cheng等人論述用戶總是訪問中心周圍(即最經(jīng)常訪問的興趣點)的位置,并假設(shè)簽到位置在每個中心周圍遵循高斯分布[18]。Lian等人提出一個包含地理因素的加權(quán)正則化矩陣分解模型來提升興趣點的推薦性能[5]。
觀察以上研究工作,發(fā)現(xiàn)用戶的簽到行為明顯受用戶的愛好、用戶間的社會關(guān)系和所處的地理空間影響。已有許多興趣點推薦研究考慮用戶的愛好、他們的社會關(guān)系和地理空間。然而,仍然沒有同時考慮在用戶可達的某一區(qū)域內(nèi),有關(guān)用戶之間顯式—隱式地理—社會關(guān)系對興趣點推薦的影響研究。因此,本文聚焦已有研究工作所忽略的在用戶可達的某一區(qū)域內(nèi)相關(guān)用戶之間顯式—隱式地理—社會關(guān)系對興趣點推薦的影響,提出PGSR-PR模型。
基于位置的社會網(wǎng)絡(luò)包含豐富的信息,假設(shè)u={u1,u2,…,um}?U,p={p1,p2,…,pn}?P分別是用戶的子集和興趣點的子集。所謂興趣點(Point of Interest),就是指在基于位置的社會網(wǎng)絡(luò)下,可以被識別出的具體事件和地點。如果用戶ui已在興趣點pj簽到,則規(guī)定rij≠0,否則rij=0。給定來自基于位置社會網(wǎng)絡(luò)下的社會鏈接,構(gòu)建一個社會鏈接關(guān)系矩陣SU×U,如果在不同的用戶ui∈U與uk∈U之間存在鏈接,Sui,uk=1,否則Sui,uk=0。興趣點推薦問題轉(zhuǎn)化為在興趣點P中根據(jù)用戶的簽到行為為用戶u推薦新的未訪問過的興趣點。為便于閱讀,表1描述了本文所用到的一些概念。
表1 相關(guān)概念列表
以下詳細介紹所提出的基于核密度估計和兩跳隨機游走算法的潛在地理—社會關(guān)系感知興趣點推薦方法,把基于核密度估計和兩跳隨機游走算法的潛在地理—社會關(guān)系作為正則項融合到矩陣分解推薦方法中,使用隨機梯度下降算法(Stochastic Gradient Descent,SGD)學習相應(yīng)的模型參數(shù)。
3.1 挖掘潛在地理—社會關(guān)系感知信息
地理位置的個性化影響在個性化用戶簽到行為中扮演著重要的角色,本文使用核密度估計方法建模被用戶訪問的兩個位置之間的距離的個性化分布。分析用戶簽到的地理位置,發(fā)現(xiàn)用戶在連續(xù)時間內(nèi)總是訪問上次簽到興趣點就近的地方,并且訪問一個位置的意愿隨著離當前位置距離的增加而減少。使用核密度估計方法,首先計算位置Li和位置lo之間的距離,計算方法如下:
dio=distance(Li,lo), ?li∈Li
(1)
在距離d∈D上的核密度估計f,計算如下:
(2)
其中,D是一個特定用戶的距離樣本,來自于未知密度f的分布,K(·)是核函數(shù),h是路徑距離衰減閾值,叫作帶寬。n是興趣點的個數(shù),興趣點和其他位置s的距離小于或者等于h。使用正則化核,表示如下:
(3)
最優(yōu)化帶寬表示如下:
(4)
基于核密度的距離度量后,基于公式(5)來推斷用戶ui訪問新位置lo的概率,給定訪問位置Li={l1,l2,…,ln}的集合。最后,用戶ui訪問新位置lo的概率,采用公式(5)表述的概率平均值獲得:
(5)
另外,本文采用所提出的兩跳隨機游走算法來計算用戶之間顯式—隱式鏈接關(guān)系相似度。兩跳隨機游走模型是指從一個給定的用戶節(jié)點游走到一個任何他的鄰居節(jié)點的過程。用戶ui和用戶uj之間的顯式—隱式關(guān)系被定義為從用戶ui到用戶uj之間隨機游走的平均步數(shù):
(6)
其中,score(e)表示存在用戶節(jié)點ui和用戶uj之間的未知鏈接e的評分,這個值也被看作是用戶節(jié)點ui和用戶uj之間的相關(guān)度。paths(i,j)表示節(jié)點ui和用戶uj之間的所有路徑的集合,edges(p)是包含在路徑p中的所有邊的集合,p(e′)是在隨機游走時選擇邊e′的概率。p(e′)值的中心思想是,邊e′的權(quán)重越大,p(e′)的值也越大。邊e′起始節(jié)點的鄰接邊集合的權(quán)重之和越大,p(e′)的值就越小,公式定義如下:
(7)
其中,w(e′)表示邊e′的權(quán)重,x′表示邊e′的初始邊,〈x′〉表示邊x′的鄰接邊集合。
在由用戶集合構(gòu)成的無向圖中,因為用戶集合的規(guī)模非常大,圖也很復雜,計算兩個用戶節(jié)點之間所有路徑集合的計算成本也非常高。因此,在執(zhí)行隨機游走操作時,每次游走只在邊數(shù)小于或者等于3的路徑內(nèi)進行,也就是本文定義的兩跳(Two-hop)。
通過推斷目標用戶的顯式—隱式朋友在興趣點上的愛好和他們的個性化移動模式(使用核密度估計計算),融合這兩個因素來推斷目標用戶ui在一個興趣點o簽到的概率。在用戶ui可達區(qū)域內(nèi),用戶ui和其潛在朋友集合的相似度采用公式(8)進行計算:
wik=p(loLi)·p(e′)
(8)
公式(8)融合了用戶愛好、社會影響和兩個用戶居住距離的地理影響到基于位置的興趣點推薦過程中。
3.2 傳統(tǒng)的矩陣分解模型
傳統(tǒng)的矩陣分解推薦模型假設(shè)存在潛在因子影響用戶的簽到行為或者評分行為,在用戶—項目評分矩陣中執(zhí)行低秩矩陣分解。讓Ui∈Rm×k表示用戶ui的用戶愛好矩陣,Pj∈Rn×k表示興趣點pj的興趣點特征矩陣,其中,K是潛在因子個數(shù),并假設(shè)K?(m,n)。傳統(tǒng)的基于矩陣分解的推薦模型的主要思想可以通過如下公式表示:
(9)
(10)
3.3 基于潛在地理—社會關(guān)系感知的興趣點推薦模型
使用傳統(tǒng)的矩陣分解模型作為基礎(chǔ),嵌入潛在地理—社會關(guān)系感知因素,引入本文所提出的PGSR-PR模型捕獲潛在地理—社會關(guān)系感知的興趣點推薦。在傳統(tǒng)低秩矩陣分解模型基礎(chǔ)上,PGSR-PR模型定義的目標函數(shù)如下:
(13)
其中,參數(shù)β旨在平衡潛在地理—社會關(guān)系對興趣點推薦影響的效果,把它作為一個正則化項來約束矩陣分解,以獲得更高的推薦準確率。
3.4 基于潛在地理—社會關(guān)系感知的興趣點推薦模型的優(yōu)化
本文使用隨機梯度下降算法(Stochastic Gradient Descent,SGD)來優(yōu)化目標函數(shù)。隨機梯度下降算法隨機掃描所有的訓練數(shù)據(jù)并針對每一個用戶—興趣點元素,沿著目標函數(shù)梯度下降的方向更新參數(shù)。模型優(yōu)化更新采用如下公式執(zhí)行:
(14)
其中,ξ是學習率,Λ表示所有被包含的參數(shù),?F(·)對應(yīng)公式(13)中的目標函數(shù)。為了獲得公式(14)中Ui和Pj的梯度,目標函數(shù)的最小化可以通過執(zhí)行隨機梯度算法來進行計算,分別對參數(shù)Ui和Pj引入梯度計算和更新。
與用戶Ui有關(guān)的梯度采用公式(15)進行計算:
(15)
因此,Ui被更新為:
(16)
與Pj有關(guān)的梯度采用公式(17)進行計算:
(17)
Pj被更新為:
(18)
表2 基于潛在地理—社會關(guān)系感知的興趣點推薦模型算法
4.1 實驗數(shù)據(jù)集
采用從Foursquare和Gowalla網(wǎng)站抓取的數(shù)據(jù)集。第一個Foursquare數(shù)據(jù)集來自Gao等人所挖掘的數(shù)據(jù)集[2],第二個實驗數(shù)據(jù)集來自Zhao等人所挖掘的數(shù)據(jù)集[19]。這兩個數(shù)據(jù)集中的每一條簽到記錄包含用戶ID、位置ID以及用戶在某一位置的簽到頻率、用戶畫像、用戶友誼關(guān)系、位置畫像和用戶的簽到歷史。在本實驗中,前期數(shù)據(jù)預處理時,過濾掉了簽到次數(shù)小于、等于10的用戶和少于10個用戶簽到的興趣點個數(shù)。
4.2 實驗設(shè)置與實驗比較方法
在實驗設(shè)置中,設(shè)定學習率ξ=0.001,潛在因子K從{10,20,30,40,50,60,70,80}中多次進行選擇,參數(shù)λ和β從{0,0.01,0.05,0.1,0.5,1}中進行選擇驗證,觀察發(fā)現(xiàn)當K=40,λ=β=0.05時所提出的模型性能最優(yōu)。為了體現(xiàn)實驗比較的公正性,同樣的參數(shù)設(shè)置用于其他4個比較方法中。另外,每個數(shù)據(jù)集被劃分為訓練集和測試集,簽到數(shù)據(jù)的80%用作訓練集,剩余的20%當作測試集。
為了評價所提出PGSR-PR模型的性能好壞,把PGSR-PR模型與BasicMF模型[12]、Biased MF模型[14]、PMF模型[20]和GeoCF模型[21]進行了實驗結(jié)果比較與分析,有關(guān)這4個基線比較方法的介紹,詳見相關(guān)參考文獻。
4.3 評價指標
本研究的主要任務(wù)就是為目標用戶預測一個精確的興趣點推薦列表,為了評價在真實情景中興趣點推薦的有效性,采用如下三個評價指標來衡量PGSR-PR模型的有效性,即準確率P@N、召回率R@N和排序度量指標(Normalized discounted cumulative gain)NDCG@N。三種指標的具體定義如下:
(19)
(20)
其中,#TestSetHits是用戶在測試集上已簽到的興趣點集合,P@N主要用來檢查興趣點推薦排序的準確率問題,R@N主要用來檢查興趣點推薦排序的召回率問題。使用NDCG@N來衡量基于推薦實體評分相關(guān)性的推薦系統(tǒng)性能,NDCG@N值的范圍從0.0到1.0變動,值為1.0表示排序列表中實體的最理想排序。NDCG被定義如下:
(21)
N是能被推薦的實體的最大數(shù),如果在位置j的項是一個被推薦的項時,rj是1,否則rj=0。
4.4 在評價指標P@N和R@N上的實驗結(jié)果比較與分析
在Foursquare數(shù)據(jù)集和Gowalla數(shù)據(jù)集上,把PGSR-PR模型與已有的4種方法在評價指標P@N和R@N上進行比較分析。首先分析每種方法的P@N和R@N隨著推薦列表長度Top-N如何變化,N的值分別設(shè)為5、10、15和20。在Foursquare數(shù)據(jù)集上,P@N和R@N比較結(jié)果如圖1所示。從圖1可以看出,PGSR-PR模型在不同的N取值上一直優(yōu)于其他4種基線方法。由于PMF方法優(yōu)于BasicMF方法和Biased MF方法,GeoCF方法又優(yōu)于PMF方法。所以本文提出的PGSR-PR模型在3個評價指標上與GeoCF模型相比較,性能又有進一步改善。在Gowalla數(shù)據(jù)集上,P@N和R@N的比較結(jié)果如圖2所示,實驗比較結(jié)果與在Foursquare數(shù)據(jù)集對應(yīng)的比較結(jié)果類似,PGSR-PR模型在P@N和R@N指標比較上,依然顯示出最優(yōu)性能。
圖1 在Foursquare數(shù)據(jù)集上5模型的Top-N推薦性能比較
圖2 在Gowalla數(shù)據(jù)集上5種模型的Top-N推薦性能比較
4.5 在評價指標P@10、R@10和NDCG@10上的實驗結(jié)果比較與分析
為了更好地驗證實驗效果,表3呈現(xiàn)了在Foursquare數(shù)據(jù)集上,當N=10時,PGSR-PR模型與其他4種方法中效果最好的Geo-CF模型相比,各評價指標的相對改善效果。從實驗結(jié)果可以觀察到,PGSR-PR模型相對于Geo-CF模型有明顯的改善,P@10的值有18.03%的改善,R@10的值有29.17%的改善,NDCG@N值有13.04%的改善。表4呈現(xiàn)了在Gowalla數(shù)據(jù)集上當N=10時,PGSR-PR模型和Geo-CF模型相比,各評價指標的相對改善效果。從實驗結(jié)果可以觀察到,PGSR-PR模型相對于Geo-CF模型有明顯的改善,P@10的值有14.04%的改善,R@10的值有29.79%的改善,NDCG@N值有12.70%的改善??傊?,本文所提出的方法優(yōu)于其他基線方法,顯示了所提出的PGSR-PR模型的優(yōu)越性。
表3PGSR-PR模型與GeoCF在Foursquare數(shù)據(jù)集上的比較結(jié)果(N=10)
評價指標GeoCF模型PGSR-PR模型相對改善P@100.0610.07218.03%↑R@100.048%0.06229.17%↑NDCG@100.0690.07813.04%↑
表4PGSR-PR模型與GeoCFO模型在Gowalla數(shù)據(jù)集上的比較結(jié)果(N=10)
評價指標GeoCF模型PGSR-PR模型相對改善P@100.0570.06514.04%↑R@100.0470.06129.79%↑NDCG@100.0630.07112.70%↑
本文提出一種基于核密度估計和兩跳隨機游走算法的潛在地理—社會關(guān)系感知的興趣點推薦模型。所提出的興趣點推薦模型考慮了在用戶可達區(qū)域內(nèi),用戶的興趣相似度和用戶的顯式—隱式鏈接關(guān)系對興趣點推薦的影響。實驗結(jié)果驗證了所提出的PGSR-PR模型優(yōu)于其他4種被廣泛使用的興趣點推薦方法。這是因為所提出的PGSR-PR模型考慮了在用戶可達范圍內(nèi)用戶之間的顯式—隱式地理—社會關(guān)系相似度。在下一步的研究工作中,有幾個感興趣的方向可以值得探索。首先,在基于位置的社會網(wǎng)絡(luò)下,除了考慮某一特定區(qū)域用戶之間的隱式鏈接關(guān)系外,用戶之間的簽到行為會隨時間而發(fā)生變化,因此,下一步計劃探索興趣點推薦中的時間影響因素。其次,用戶針對興趣點的評論信息大大有利于深入挖掘用戶之間的關(guān)系,分析用戶在興趣點推薦的評論將更值得研究。
[1]Li H,Hong R,Zhu S,et al.Point-of-interest recommender systems: A separate-space perspective[C]//2015 IEEE International Conference on Data Mining.Atlantic City,2015: 231-240
[2]Gao H,Tang J,Liu H.gscorr:modeling geo-social correlations for new check-ins on location-based social networks[C]//Proceedings of the 21st ACM International conference on Information and knowledge management.Maui,2012:1582-1586
[3]Tang J,Hu X,Gao H,et al.Exploiting local and global social context for recommendation[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence.Beijing,2013:264-269
[4]Liu Y,Wei W,Sun A,et al.Exploiting geographical neighborhood characteristics for location recommendation[C]//Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management.Shanghai,2014:739-748
[5]Lian D,Zhao C,Xie X,et al.Geomf: joint geographical modeling and matrix factorization for point-of-interest recommendation[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining.New York,2014:831-840
[6]Zhang Q,Wu J,Yang H,et al.Global and local influence-based social recommendation[C]//Proceedings of the 25th ACM International on Conference on Information and Knowledge Management.Indianapolis,2016:1917-1920
[7]Melville P,Mooney R J,Nagarajan R.Content-boosted collaborative filtering for improved recommendations[C]//The Eighteenth National Conference on Artificial Intelligence.Edmonton,2002:187-192
[8]Cantador I,Bellogin A,Vallet D.Content-based recommendation in social tagging systems[C]//Proceedings of the fourth ACM conference on Recommender systems.Barcelona,2010:237-240
[9]Koren Y.Collaborative filtering with temporal dynamics[J].Communications of the ACM,2010,53(4): 89-97
[10]Ye M,Yin P,Lee W C.Location recommendation for location-based social networks[C]//Proceedings of the 18th ACM SIGSPATIAL International conference on advances in geographic information systems.San Jose California,2010:458-461
[11]Jiang S,Qian X,Shen J,et al.Author topic model-based collaborative filtering for personalized poi recommendations[J].IEEE Transactions on Multimedia,2015,17(6):907-918
[12]Koren Y,Bell R,Volinsky C.Matrix factorization techniques for recommender systems[J].Computer,2009,42(8):30-37
[13]Zhao Y,Nie L,Wang X,et al.Personalized recommendations of locally interesting venues to tourists via cross-region community matching[J].ACM Transactions on Intelligent Systems and Technology,2014,5(3):50
[14]Hu L,Sun A,Liu Y.Your neighbors affect your ratings:on geographical neighborhood influence to rating prediction[C]//Proceedings of the 37th International ACM SIGIR conference on Research & development in information retrieval.Gold Coast,2014:345-354
[15]Berjani B,Strufe T.A recommendation system for spots in location-based online social networks[C]//Proceedings of the 4th Workshop on Social Network Systems.New York,2011:4-5
[16]Ye M,Yin P,Lee W.Location recommendation for location-based social networks[C]//Proceedings of the 18th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.California,2010:458-461
[17]Liu X,Liu Y,Aberer K,et al.Personalized point-of-interest recommendation by mining users’ preference transition[C]//Proceedings of the 22nd ACM International Conference on Information & Knowledge Management.San Francisco,2013:733-738
[18]Cheng C,Yang H,King I,et al.Fused matrix factorization with geographical and social influence in location-based social networks[C]//AAAI Conference on Artificial Intelligence.Ontario,2012:1-2
[19]Zhao S,King I,Lyu M R.Capturing geographical influence in poi recommendations[C]//International Conference on Neural Information Processing.Springer,2013:530-537
[20]Salakhutdinov R,Mnih A.Probabilistic matrix factorization[C]//International Conference on Neural Information Processing Systems.Kitakyushu,2007:1257-1264
[21]Ye M,Yin P,Lee W,et al.Exploiting geographical influence for collaborative point-of-interest recommendation[C]//Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval.Beijing,2011:325-334
Point-of-interestRecommendationbasedonPotentialGeo-SocialRelationshipAwareness
CUI Lin,SONG Qixiang,LI Yulin,QI Xixi
School of Information Engineering,Suzhou University,Suzhou,234000
Under the location based social networks,the existing POI recommendation models mostly adopt the explicit social relations and implicit social relations without the limitations of geographic space.However,the explicit and implicit social relations within a limited geographical space are rarely considered for points of interest (POI) recommendation.Therefore,a new potential Geo-social POI recommendation model under a certain geographical areas is put forward.The proposed model utilizes the kernel density estimation method to analyze the geographical influence on the users behavior,the two-hop random walk algorithm is proposed to mine the explicit and implicit social influence on users,then in a reachable geographical region,the explicit and implicit social relations are regarded as a regularization term for the matrix factorization.The goal of the proposed model is to recommend new POIs for users in areas where a user can reach.Experiments on two real world datasets show that the proposed POI recommendation model outperforms other state-of-the-art four recommendation methods.
Location-based Social Network,Point of interest Recommendation,Geo-Social Relationship,Explicit Social Relationship,Implicit Social Relationship
TP301.6
A
1673-2006(2017)09-0096-07
(責任編輯劉小陽)
10.3969/j.issn.1673-2006.2017.09.023
2017-04-08
國家自然科學青年基金項目(61702355);安徽高校自然科學研究重點項目(KJ2016A768);安徽省軟科學研究計劃項目(1607a0202071);教育部科技發(fā)展中心“云數(shù)融合科教創(chuàng)新”項目(2017A10014)。
崔琳(1979-),女,安徽碭山人,碩士,副教授,研究方向:興趣點推薦、數(shù)據(jù)挖掘與分析。