国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于位置社交網(wǎng)絡(luò)的興趣點(diǎn)推薦系統(tǒng)研究綜述

2022-07-21 03:23:14陳江美張文德
計(jì)算機(jī)與生活 2022年7期
關(guān)鍵詞:社交矩陣算法

陳江美,張文德

1.福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州350108

2.福州大學(xué) 信息管理研究所,福州350108

繼在線社交網(wǎng)絡(luò)發(fā)展和應(yīng)用之后,移動社交網(wǎng)絡(luò)成為新的發(fā)展方向,尤其是多樣化的移動位置簽到與共享等功能的不斷普及。在此背景下,社交網(wǎng)絡(luò)與位置服務(wù)不斷融合,助推了基于位置社交網(wǎng)絡(luò)(locationbased social network,LBSN)的興起,如Foursquare和Yelp。LBSN利用用戶的簽到功能,有機(jī)地將線上和線下世界結(jié)合起來,提供用戶位置定位功能的同時,還實(shí)現(xiàn)了位置信息在社交網(wǎng)絡(luò)平臺的共享,進(jìn)而衍生出多樣化的位置服務(wù)。推薦系統(tǒng)作為有效處理“信息過載”問題的重要工具,旨在依據(jù)用戶的個性化需求為用戶推薦可能感興趣的商品,其在位置服務(wù)領(lǐng)域的應(yīng)用受到廣泛關(guān)注。

近年來,將推薦系統(tǒng)應(yīng)用到位置社交網(wǎng)絡(luò)中,出現(xiàn)了諸多基于位置的推薦服務(wù)。其中,興趣點(diǎn)(point of interest,POI)推薦受到了眾多學(xué)者的關(guān)注。興趣點(diǎn)是指用戶簽到的地點(diǎn),如商場、學(xué)校等。興趣點(diǎn)推薦能有效緩解位置信息過載問題,進(jìn)而提升用戶的個性化體驗(yàn),同時有助于商家挖掘潛在的客戶,提高商家的商業(yè)效益。為此,興趣點(diǎn)推薦成為基于位置社交網(wǎng)絡(luò)中的一項(xiàng)重要服務(wù),是位置社交網(wǎng)絡(luò)和推薦系統(tǒng)領(lǐng)域核心的研究方向之一。

LBSN中蘊(yùn)含著海量信息,興趣點(diǎn)推薦主要利用用戶歷史簽到記錄及輔助信息從大量地點(diǎn)中為用戶推薦心儀的地點(diǎn)。然而,興趣點(diǎn)推薦是一項(xiàng)頗有挑戰(zhàn)性的內(nèi)容,用戶的偏好受到多種因素的影響,這些影響推薦的因素類型繁多且復(fù)雜,傳統(tǒng)的推薦方法難以有效構(gòu)建用戶的偏好模型,因此有必要充分發(fā)掘新的推薦方法,以適應(yīng)興趣點(diǎn)推薦服務(wù)的發(fā)展。同時,為了評估推薦算法的有效性,對推薦效果的評估與跟蹤也是興趣點(diǎn)推薦的重要研究內(nèi)容。

根據(jù)以上的目標(biāo),本文在了解興趣點(diǎn)推薦的基本概念與框架的基礎(chǔ)上,從興趣點(diǎn)推薦系統(tǒng)的研究中總結(jié)了三個核心問題:首先是分析影響興趣點(diǎn)推薦的因素,即明確影響用戶對興趣點(diǎn)偏好的因素有哪些。本文歸納為用戶自身的偏好、地理位置、社交關(guān)系、時間信息、內(nèi)容信息與流行度。其次是探索現(xiàn)有的興趣點(diǎn)推薦算法,即興趣點(diǎn)推薦采用何種方法來建模用戶對興趣點(diǎn)的偏好,以構(gòu)建合理高效的推薦模型。本文總結(jié)分析了基于矩陣分解算法的推薦、基于圖嵌入的推薦與基于深度學(xué)習(xí)的推薦這三種方法的應(yīng)用與發(fā)展。最后是算法的評價模塊,即評估算法的性能與有效性。本文歸納了目前流行的幾種預(yù)測指標(biāo)及排序指標(biāo),并分析其應(yīng)用情況。

為了更系統(tǒng)地了解興趣點(diǎn)推薦的研究理論、現(xiàn)狀、挑戰(zhàn)和發(fā)展趨勢,本文基于上述三個核心問題對國內(nèi)外近年來相關(guān)的研究成果進(jìn)行了梳理與解讀。首先對興趣點(diǎn)推薦系統(tǒng)的概念、與傳統(tǒng)推薦的區(qū)別及基本框架進(jìn)行了概述;其次在了解理論背景的基礎(chǔ)上,總結(jié)歸納了影響興趣點(diǎn)推薦的常見因素,從各個影響因素的角度分析興趣點(diǎn)推薦的現(xiàn)狀;然后闡述對比了現(xiàn)有的興趣點(diǎn)推薦算法,并對代表性的工作進(jìn)行了深入分析;根據(jù)興趣點(diǎn)推薦的現(xiàn)狀,重點(diǎn)對面臨的問題和潛在的方向進(jìn)行了概述;最后進(jìn)行總結(jié)與展望,為興趣點(diǎn)推薦系統(tǒng)后續(xù)的相關(guān)研究提供借鑒與參考,從而推動我國個性化推薦服務(wù)行業(yè)的進(jìn)一步發(fā)展。

1 興趣點(diǎn)推薦系統(tǒng)概述

移動社交網(wǎng)絡(luò)的廣泛普及,涌現(xiàn)了大量的位置服務(wù)功能,將推薦系統(tǒng)應(yīng)用到位置服務(wù),促進(jìn)了基于位置社交網(wǎng)絡(luò)的興趣點(diǎn)推薦系統(tǒng)的發(fā)展。興趣點(diǎn)推薦系統(tǒng)一般包含了用戶集合={,,…,u}和興趣點(diǎn)集合={,,…,l},和分別表示用戶和興趣點(diǎn)的個數(shù)。其中,每個興趣點(diǎn)附帶坐標(biāo)屬性,可用<經(jīng)度,緯度>表示興趣點(diǎn)的坐標(biāo)位置。用戶對興趣點(diǎn)的簽到記錄表示為L,將用戶的簽到記錄轉(zhuǎn)換為用戶-興趣點(diǎn)交互矩陣,中的每個元素R表示了用戶對興趣點(diǎn)的簽到次數(shù),簽到次數(shù)反映了用戶的偏好。據(jù)此,基于位置的社交網(wǎng)絡(luò)圖可描繪如圖1所示。

圖1 基于位置的社交網(wǎng)絡(luò)圖Fig. 1 Location-based social network

興趣點(diǎn)推薦作為傳統(tǒng)在線推薦(如電影、圖書和新聞推薦系統(tǒng)等)在社交網(wǎng)絡(luò)領(lǐng)域的延伸,不僅能幫助用戶維系現(xiàn)實(shí)世界中的社交關(guān)系,還能為用戶提供個性化的服務(wù)。為了進(jìn)一步理解興趣點(diǎn)推薦系統(tǒng),以下將對其與傳統(tǒng)推薦系統(tǒng)的區(qū)別及基本框架進(jìn)行分析與總結(jié)。

1.1 傳統(tǒng)推薦系統(tǒng)

傳統(tǒng)推薦系統(tǒng)主要通過分析用戶與項(xiàng)目間的二元關(guān)系,利用評分信息構(gòu)建用戶對項(xiàng)目的偏好模型,以挖掘用戶感興趣的項(xiàng)目。通常利用={,,…,u}表示用戶集,表示用戶的個數(shù),利用={,,…,i}表示項(xiàng)目集,表示項(xiàng)目的個數(shù)。用戶與項(xiàng)目的關(guān)系如圖2(a)所示,若用戶對項(xiàng)目進(jìn)行評分,則以連線的方式表示它們之間的交互。同時,將圖2(a)的交互關(guān)系轉(zhuǎn)化為圖2(b)的用戶-項(xiàng)目評分矩陣,矩陣中的元素為用戶對項(xiàng)目的評分,空值表示用戶未對此項(xiàng)目進(jìn)行評分。在現(xiàn)實(shí)生活中,實(shí)際存在著海量的用戶和項(xiàng)目數(shù),而用戶評分的項(xiàng)目個數(shù)較有限,因此用戶-項(xiàng)目評分矩陣極其稀疏,面臨嚴(yán)重的數(shù)據(jù)稀疏問題,如何緩解稀疏問題以提高推薦性能是傳統(tǒng)推薦系統(tǒng)的挑戰(zhàn)之一。

圖2 用戶交互數(shù)據(jù)Fig. 2 Users interaction data

在推薦系統(tǒng)中,推薦算法作為核心的技術(shù),其性能的高低決定了推薦的效果。傳統(tǒng)的推薦方法主要分為協(xié)同過濾推薦(collaborative filtering,CF)、基于內(nèi)容的推薦(content-based)和混合推薦(hybrid),具體分類如圖3 所示。以下對三種推薦方法的內(nèi)容及應(yīng)用進(jìn)行介紹。

圖3 推薦算法分類Fig. 3 Category of recommendation algorithms

(1)協(xié)同過濾推薦

協(xié)同過濾算法作為推薦系統(tǒng)領(lǐng)域中最基礎(chǔ)的方法,主要利用用戶-項(xiàng)目的歷史評分?jǐn)?shù)據(jù)來找出相似用戶或項(xiàng)目。該算法主要分為基于內(nèi)存的方法和基于模型的方法。基于內(nèi)存的方法可進(jìn)一步分為基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾,如圖3所示。其中,基于用戶的協(xié)同過濾認(rèn)為具有相似偏好的用戶具有相同的興趣,基于項(xiàng)目的協(xié)同過濾則認(rèn)為用戶傾向于喜歡其之前感興趣項(xiàng)目的相似項(xiàng)目,兩者都是基于評分?jǐn)?shù)據(jù)的推薦。另外,基于模型的方法主要采用機(jī)器學(xué)習(xí)(如矩陣分解算法、深度學(xué)習(xí)技術(shù)等)和數(shù)據(jù)挖掘技術(shù)(如聚類及分類算法等),通過評分矩陣數(shù)據(jù)不斷訓(xùn)練得到模型參數(shù),并建立相關(guān)的推薦模型,以預(yù)測用戶的興趣偏好。

在最早的推薦工作中,協(xié)同過濾算法常用來做評分預(yù)測。在興趣點(diǎn)推薦領(lǐng)域,已有的研究主要將情景信息融入?yún)f(xié)同過濾算法中。文獻(xiàn)[7]將地理和社會信息嵌入基于用戶的協(xié)同過濾框架中,預(yù)測用戶的潛在偏好。文獻(xiàn)[8]考慮實(shí)時推薦問題,將時間納入?yún)f(xié)同過濾算法中,描述用戶的時間偏好。因此,協(xié)同過濾算法由于模型的構(gòu)建相對簡單且易實(shí)現(xiàn)而得到了廣泛應(yīng)用。但算法本身極易遭受數(shù)據(jù)稀疏的影響,同時還存在冷啟動問題,若單純采用協(xié)同過濾算法,可能導(dǎo)致較低的推薦準(zhǔn)確率。

(2)基于內(nèi)容的推薦

基于內(nèi)容的推薦方法的基本思想主要是推薦用戶與之前喜歡項(xiàng)目的類似項(xiàng)目。首先分析用戶的顯隱性特征及相關(guān)文本信息,挖掘出與用戶偏好有關(guān)的標(biāo)簽及項(xiàng)目的屬性,接著度量項(xiàng)目間的相似性,將用戶偏好的項(xiàng)目與其他項(xiàng)目的相似性排序,向用戶推薦其潛在感興趣的項(xiàng)目。該方法不需要評分記錄,可有效解決協(xié)同過濾算法的冷啟動問題,但推薦系統(tǒng)中可用的屬性信息極為有限,具有一定的局限性。

(3)混合推薦

為了克服上述兩種方法的不足,出現(xiàn)了混合推薦策略。該方法主要將多種推薦算法融合,通過引入輔助信息來緩解數(shù)據(jù)稀疏和冷啟動問題,進(jìn)而改善推薦的準(zhǔn)確率。文獻(xiàn)[10-11]融合了基于協(xié)同過濾和基于內(nèi)容的方法進(jìn)行推薦。Guo 等人將協(xié)同過濾方法結(jié)合其他技術(shù)實(shí)現(xiàn)位置的推薦。Yuan 等人將時間分別融入?yún)f(xié)同過濾和矩陣分解框架中,采用混合推薦的方式實(shí)現(xiàn)興趣點(diǎn)的動態(tài)推薦。因此,混合推薦方法被廣泛應(yīng)用,但算法的復(fù)雜性較高,且運(yùn)行時間較長,目前還需探索新的方法與技術(shù)應(yīng)用到興趣點(diǎn)推薦工作中。

1.2 興趣點(diǎn)推薦與傳統(tǒng)推薦的區(qū)別

興趣點(diǎn)推薦指在傳統(tǒng)的社交網(wǎng)絡(luò)中增加位置信息,以便社交網(wǎng)絡(luò)中的用戶能直接共享興趣點(diǎn)信息。與傳統(tǒng)的推薦系統(tǒng)相比,由于LBSN中用戶與興趣點(diǎn)存在的相依性及興趣點(diǎn)本身的獨(dú)有屬性(如時序性、粒度屬性等),使得興趣點(diǎn)推薦系統(tǒng)存在諸多異于傳統(tǒng)推薦系統(tǒng)的特點(diǎn)。本文從影響推薦的因素、推薦方法及推薦存在的問題三方面進(jìn)行分析比較。

(1)從影響推薦的因素考慮,傳統(tǒng)的推薦系統(tǒng)主要利用評分?jǐn)?shù)據(jù)進(jìn)行預(yù)測和推薦。興趣點(diǎn)推薦系統(tǒng)的影響因素主要包含用戶簽到數(shù)據(jù)和多類型的情景信息,如地理、時間、社交和興趣點(diǎn)流行度等,并采用有效的算法構(gòu)建模型以模擬用戶的決策行為。另外,LBSN中多層級的網(wǎng)絡(luò)結(jié)構(gòu)使得用戶的社交關(guān)系相較于傳統(tǒng)推薦系統(tǒng)更為復(fù)雜,從而影響推薦因素的多樣性。

(2)從推薦方法來看,傳統(tǒng)的推薦只需根據(jù)用戶的歷史記錄構(gòu)建偏好模型,由2.1 節(jié)可知,其主要采用協(xié)同過濾算法、基于內(nèi)容的算法和混合推薦算法進(jìn)行項(xiàng)目的推薦。由于興趣點(diǎn)推薦相較于傳統(tǒng)的推薦新增了位置信息及其附帶的標(biāo)簽信息,采用傳統(tǒng)的推薦算法可能無法滿足復(fù)雜的推薦任務(wù)與精準(zhǔn)推薦的需求,需要運(yùn)用新技術(shù)解決更復(fù)雜的任務(wù)。例如,考慮興趣點(diǎn)的標(biāo)簽信息,需采用深度學(xué)習(xí)等相關(guān)技術(shù)來挖掘興趣點(diǎn)更深層次的隱特征,從而為用戶推薦適合其偏好特征的興趣點(diǎn)。因此,興趣點(diǎn)推薦相較于傳統(tǒng)的推薦需要更多技術(shù)支撐,才能更有效地完成推薦任務(wù)。

(3)從推薦工作存在問題的角度考慮,傳統(tǒng)的推薦主要存在數(shù)據(jù)稀疏和冷啟動兩大問題。數(shù)據(jù)稀疏是指用戶-項(xiàng)目評分矩陣多數(shù)為空值;冷啟動是指系統(tǒng)如何給新用戶進(jìn)行推薦的問題。在興趣點(diǎn)推薦工作中,還面臨著序列推薦、動態(tài)推薦、個性化推薦和異地推薦等問題。序列推薦的任務(wù)是根據(jù)當(dāng)前所在的位置,為用戶推薦下一個可能簽到的地點(diǎn)。在動態(tài)推薦問題上,Gao等人最早將時間納入興趣點(diǎn)推薦,利用時間間隙劃分用戶-興趣點(diǎn)簽到矩陣。為了實(shí)現(xiàn)個性化推薦,文獻(xiàn)[15-16]采用核密度估計(jì)方法描述用戶的地理偏好,進(jìn)而捕捉用戶的移動行為。在異地推薦上,任星怡等人采用了多種上下文信息建模用戶偏好,從而實(shí)現(xiàn)異地推薦。因此,興趣點(diǎn)推薦面臨更多樣化的決策問題。

具體地,本文將傳統(tǒng)推薦系統(tǒng)與興趣點(diǎn)推薦系統(tǒng)的區(qū)別進(jìn)行總結(jié),如表1所示。

表1 傳統(tǒng)推薦與興趣點(diǎn)推薦的區(qū)別Table 1 Difference between traditional recommendation and POI recommendation

1.3 基本框架

近年來,學(xué)者們主要利用LBSN中用戶的簽到記錄及情景信息模擬用戶的決策行為,從而為用戶推薦其可能感興趣的地點(diǎn)。為了進(jìn)一步了解興趣點(diǎn)推薦的工作流程,總結(jié)得到一個通用的推薦框架如圖4所示。該框架由三部分構(gòu)成,即數(shù)據(jù)來源、推薦算法和算法評價。數(shù)據(jù)來源主要包括LBSN 中用戶和興趣點(diǎn)的基本屬性數(shù)據(jù)及相關(guān)的情景信息(即影響推薦的因素)。為此,本文將主要對影響興趣點(diǎn)推薦的因素進(jìn)行總結(jié)與闡述;推薦算法是推薦工作的核心,算法的性能決定了最終推薦的效果。本文將當(dāng)前主流的興趣點(diǎn)推薦算法分為矩陣分解算法、基于圖嵌入的方法及基于深度學(xué)習(xí)的方法;算法評價是推薦的最后一步,利用相關(guān)的評價指標(biāo)可有效評估算法的性能和效率,從而完成推薦任務(wù)。

圖4 興趣點(diǎn)推薦系統(tǒng)的基本框架Fig. 4 Framework of POI recommendation system

為此,圍繞興趣點(diǎn)推薦系統(tǒng)的基本框架,本文接下來將對影響興趣點(diǎn)推薦的因素、推薦算法及算法評價指標(biāo)這三方面的內(nèi)容展開介紹,并對其代表性工作進(jìn)行概述與對比。

2 影響興趣點(diǎn)推薦的因素

興趣點(diǎn)推薦通常受到多種因素的影響,其中用戶對興趣點(diǎn)的簽到信息反映了用戶的行為偏好,對于研究興趣點(diǎn)推薦任務(wù)具有重大的應(yīng)用價值。此外,位置社交網(wǎng)絡(luò)中的情景信息影響著用戶的決策和推薦的準(zhǔn)確率。為此,本文將影響興趣點(diǎn)工作的因素歸納為以下六方面:用戶偏好、地理信息、社交關(guān)系、時間信息、內(nèi)容信息和流行度。在此基礎(chǔ)上,對探究各影響因素的相關(guān)工作進(jìn)行分析與歸納。

2.1 用戶偏好

用戶的決策行為受自身偏好的影響極為顯著,在興趣點(diǎn)推薦工作中,用戶的偏好可表現(xiàn)為用戶簽到興趣點(diǎn)的次數(shù)與評論等。通常將用戶的簽到次數(shù)量化為偏好程度,若用戶經(jīng)常訪問此地點(diǎn),表明用戶對興趣點(diǎn)的偏好程度越高。Song等人提取用戶的簽到數(shù)據(jù)并融合地理信息,采用基于用戶的協(xié)同過濾算法為用戶推薦興趣點(diǎn)。Zhou等人利用協(xié)同過濾算法對用戶偏好進(jìn)行個性化建模,并綜合考慮了好友重要性與簽到相關(guān)性的影響。但上述算法遭受數(shù)據(jù)稀疏的影響,性能有待進(jìn)一步地改進(jìn)。在此基礎(chǔ)上,文獻(xiàn)[20-21]利用矩陣分解算法學(xué)習(xí)用戶偏好,通過用戶的簽到信息推測出用戶和興趣點(diǎn)的隱特征向量。另外,用戶的評論內(nèi)容反映了用戶的偏好,若用戶的評論內(nèi)容為積極態(tài)度,如附帶“喜歡”或“滿意”等詞,體現(xiàn)了用戶對此興趣點(diǎn)感興趣。文獻(xiàn)[20]利用聚合LDA(latent Dirichlet allocation)算法學(xué)習(xí)用戶的評論信息,并將提取到的偏好與興趣點(diǎn)的特征進(jìn)行匹配。Xiong等人提出概率生成模型實(shí)現(xiàn)用戶特征偏好的提取。Xing 等人利用深度學(xué)習(xí)技術(shù)挖掘用戶的評論信息,以學(xué)習(xí)用戶的偏好。因此,充分利用用戶的簽到次數(shù)及評論信息可有效構(gòu)建偏好模型,但由于用戶決策的復(fù)雜性,需要進(jìn)一步考慮情景信息對用戶行為的影響,以更精準(zhǔn)地推薦。

2.2 地理位置

地理位置是興趣點(diǎn)推薦區(qū)別于傳統(tǒng)推薦的根本特征??紤]用戶傾向于簽到距離較近的地點(diǎn),Ye 等人提出冪律分布模型描述用戶簽到特征。Cheng等人考慮用戶偏向在多個中心點(diǎn)范圍內(nèi)簽到,提出多中心的高斯分布模型。上述的模型采用相同的分布函數(shù)捕捉用戶的地理偏好,但每個用戶應(yīng)當(dāng)具有獨(dú)一無二的簽到分布。據(jù)此,Zhang等人采用核密度估計(jì)方法為每個用戶分配唯一的概率密度函數(shù)。文獻(xiàn)[16]對核密度估計(jì)方法進(jìn)一步擴(kuò)展,采用二維的坐標(biāo)改進(jìn)一維的距離來建模地理偏好,度量用戶對未簽到興趣點(diǎn)的概率:

其中,表示用戶簽到興趣點(diǎn)的總次數(shù);K(-l)表示兩個固定帶寬(,)的標(biāo)準(zhǔn)核函數(shù)。

為了實(shí)現(xiàn)用戶個性化推薦,文獻(xiàn)[20]對文獻(xiàn)[16]的固定帶寬加以改進(jìn),提出自適應(yīng)帶寬h

其中,是敏感參數(shù)。最終,利用文獻(xiàn)[20]的自適應(yīng)核密度估計(jì)模擬用戶的行為,獲取用戶的預(yù)測偏好:

上述研究主要對用戶的地理行為建立統(tǒng)一的模型。近年來,將地理信息與其他影響推薦的因素融合成為趨勢。文獻(xiàn)[21,25-26]將地理與社交信息融合,利用矩陣分解算法求解用戶與興趣點(diǎn)的偏好特征。文獻(xiàn)[27]提出地理-時間交互網(wǎng)絡(luò)模型,探索興趣點(diǎn)對之間的聯(lián)系,實(shí)現(xiàn)下一個興趣點(diǎn)的推薦。因此,探索地理信息的模型已較為成熟,如何進(jìn)一步融合LBSN中的異構(gòu)信息是下一步研究的重點(diǎn)。

2.3 社交關(guān)系

在位置推薦中,最初是利用協(xié)同過濾算法建模社交關(guān)系來實(shí)現(xiàn)用戶偏好的預(yù)測,但利用協(xié)同過濾方法時,用戶相似度的度量易受局部異常點(diǎn)影響,且算法極易遭受稀疏問題,為此,矩陣分解方法受到關(guān)注。Qian 等人利用概率矩陣分解模型建模三種社交關(guān)系。Zhang等人將用戶的標(biāo)簽、社交和地理信息融入矩陣分解框架中,改善推薦性能。上述算法實(shí)質(zhì)是利用LBSN 中的好友關(guān)系預(yù)測用戶對興趣點(diǎn)的偏好分?jǐn)?shù)。近年來,信任理論不斷應(yīng)用于推薦領(lǐng)域,基于信任的推薦已拓展到興趣點(diǎn)推薦中。Zhu等人提出一種信任預(yù)測方法,綜合考慮用戶間的信任度與相似度向目標(biāo)用戶推薦好友,并融合用戶偏好與地理影響。Xu 等人將用戶偏好、社交關(guān)系與時空信息融入矩陣分解算法中,通過挖掘用戶的直接信任和間接信任關(guān)系捕捉用戶的社交影響。文獻(xiàn)[34-36]利用圖模型來表示用戶的社交關(guān)系,圖中相關(guān)節(jié)點(diǎn)的關(guān)系反映了用戶間的交互,該方法取得了較顯著的效果。由此可見,目前的研究主要是利用好友間的相似度和信任度來度量用戶的社交影響,根據(jù)好友的喜好預(yù)測目標(biāo)用戶的偏好,未來的工作將需要探索更多高效的方法來捕獲用戶間的社交關(guān)系。

2.4 時間信息

用戶對興趣點(diǎn)的簽到時間反映了用戶的時間偏好,考慮用戶的簽到行為受時間信息的影響,會根據(jù)時間的變化呈現(xiàn)出周期性和序列性的行為。為了描述用戶的周期性行為,Gao等人考慮時間的差異性和連續(xù)性特征,并將此屬性融入矩陣分解框架中,以刻畫用戶的時間特征。文獻(xiàn)[8]將時間信息融入?yún)f(xié)同過濾算法中,并結(jié)合興趣點(diǎn)的時間流行度進(jìn)行推薦。上述算法主要采用時間間隙將用戶-興趣點(diǎn)簽到矩陣劃分為若干個簽到矩陣,加劇了數(shù)據(jù)稀疏問題?;诖?,Ying等人提出非對稱投影的時間感知嵌入方法刻畫時間特征。文獻(xiàn)[38]利用神經(jīng)網(wǎng)絡(luò)方法提取時間特征向量,能較好應(yīng)對數(shù)據(jù)稀疏問題,進(jìn)而改善推薦性能。在最新的一項(xiàng)研究中,Yin 等人考慮用戶的時空偏好行為,將協(xié)同過濾算法與模糊聚類算法結(jié)合,有效地實(shí)現(xiàn)了興趣點(diǎn)的動態(tài)推薦。

序列性簽到行為在興趣點(diǎn)推薦中主要表現(xiàn)為用戶在當(dāng)前時間簽到對下一個時間簽到地點(diǎn)產(chǎn)生的影響,即衍生出序列推薦問題。序列推薦側(cè)重于為目標(biāo)用戶在一段時間內(nèi)(如幾個小時)推薦某些地點(diǎn),是一項(xiàng)重要的推薦任務(wù)。文獻(xiàn)[40]整合了時間和地理特征,構(gòu)建了一個基于圖的潛在表示模型,并結(jié)合LSTM(long short-term memory)神經(jīng)網(wǎng)絡(luò)來模擬用戶復(fù)雜的移動行為,實(shí)現(xiàn)興趣點(diǎn)的動態(tài)序列推薦。文獻(xiàn)[41]提出將時空上下文信息輸入到LSTM框架中,融合基于注意力機(jī)制模型來提取簽到序列中的簽到記錄,以實(shí)現(xiàn)下一個興趣點(diǎn)推薦。為了實(shí)現(xiàn)實(shí)時推薦,Wang 等人考慮了興趣點(diǎn)的類型與簽到時間,利用基于注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)上下文信息,更好地預(yù)測用戶下一個簽到的興趣點(diǎn)?;诖耍琖u等人豐富了上下文信息,采用線性組合的方式對用戶的長短期偏好建模。該模型融合了類別信息和簽到時間,利用注意力機(jī)制捕捉用戶的長期偏好,并基于興趣點(diǎn)序列和類別序列建立兩個LSTM 模型來模擬用戶的短期偏好。為此,現(xiàn)有的序列推薦工作主要融合時空信息,并應(yīng)用神經(jīng)網(wǎng)絡(luò)及其拓展技術(shù)來實(shí)現(xiàn)。

綜上,用戶在時間信息上展現(xiàn)出的周期性與序列性的簽到行為影響著用戶的行為偏好,時間因素對興趣點(diǎn)推薦的研究具有重要作用。

2.5 內(nèi)容信息

興趣點(diǎn)的內(nèi)容信息影響著用戶的決策,相關(guān)學(xué)者逐漸利用興趣點(diǎn)的內(nèi)容信息來挖掘其附帶的屬性特征,從而更有效率地實(shí)現(xiàn)用戶的個性化推薦。Chen等人將興趣點(diǎn)的文本內(nèi)容嵌入深度學(xué)習(xí)模型,更深層次地捕捉興趣點(diǎn)的標(biāo)簽信息。Zhao等人融合了興趣點(diǎn)的情感屬性和地理屬性,利用概率矩陣分解技術(shù)挖掘用戶與興趣點(diǎn)的潛在特征。為了充分利用上下文信息,Zhang等人運(yùn)用社交網(wǎng)絡(luò)中的圖像內(nèi)容和地理信息捕捉用戶的偏好,采用加權(quán)矩陣分解算法學(xué)習(xí)用戶及興趣點(diǎn)的深層特征。上述的工作主要利用矩陣分解和深度學(xué)習(xí)來提取相關(guān)特征,以預(yù)測用戶偏好。然而,LBSN 中存在的多是異構(gòu)數(shù)據(jù),這些數(shù)據(jù)復(fù)雜且難以建模,探索更多的特征提取技術(shù)來處理異構(gòu)數(shù)據(jù)是未來研究的重點(diǎn)。

2.6 流行度

流行度是指興趣點(diǎn)受用戶歡迎的程度,體現(xiàn)了興趣點(diǎn)推薦系統(tǒng)提供的服務(wù)與質(zhì)量。目前相關(guān)的研究普遍將興趣點(diǎn)的流行度作為用戶的先驗(yàn)知識。Yang等人利用用戶生成的文本和圖像內(nèi)容預(yù)測興趣點(diǎn)的流行度,以緩解興趣點(diǎn)信息的稀疏影響。興趣點(diǎn)流行度具備時間屬性,即實(shí)時性問題。Yao等人考慮興趣點(diǎn)的流行度受時間影響,提出將用戶與興趣點(diǎn)間的時間匹配度融入推薦框架中。Yuan 等人采用流行度信息衡量興趣點(diǎn)被簽到的先驗(yàn)概率,并將其與地理、時間信息融合,實(shí)現(xiàn)動態(tài)推薦。另外,Si等人深入探索了流行度的影響,將連續(xù)簽到時間段的流行度結(jié)合地理影響來完成推薦。該模型提出了兩種推薦策略,對待活躍用戶運(yùn)用二維核密度估計(jì)建模地理偏好,對待非活躍用戶運(yùn)用一維冪律分布模擬地理影響,再分別融合時間流行度特征實(shí)現(xiàn)興趣點(diǎn)推薦。上述研究主要將流行度和其他情景信息相結(jié)合,說明了流行度信息在推薦工作中的重要地位。

上述對影響興趣點(diǎn)推薦的因素進(jìn)行了闡述,并總結(jié)了相關(guān)代表性工作。表2 分析了幾種重要模型考慮的影響因素,并歸納了算法的優(yōu)點(diǎn)與局限性。文獻(xiàn)[14,28]只考慮了單一信息的影響,因此推薦準(zhǔn)確率較低。文獻(xiàn)[17]融合了多種信息到矩陣分解算法中,可有效緩解數(shù)據(jù)稀疏性,但該算法未能充分挖掘興趣點(diǎn)的特征。同時,為了探究不同因素的影響,文獻(xiàn)[7]通過消融實(shí)驗(yàn)獲得地理信息在推薦中的影響高于其他因素。文獻(xiàn)[17]提出了本地和異地推薦兩種情景,實(shí)驗(yàn)得出在異地場景中內(nèi)容信息影響最大,在本地推薦場景中時間信息影響最大。以上說明了各影響因素在推薦工作中發(fā)揮的不同作用。此外,從表2可知,除了常見的幾種情景信息外,文獻(xiàn)[48]考慮了社交網(wǎng)絡(luò)中的圖像內(nèi)容,利用矩陣分解和深度學(xué)習(xí)技術(shù)挖掘用戶與興趣點(diǎn)的特征,從而改善推薦性能。因此,現(xiàn)有研究還存在一定的局限性,仍有一些影響用戶決策的因素未加以考慮,如天氣、交通等,如何建模這些因素對推薦工作的影響是未來研究的重點(diǎn)。

表2 興趣點(diǎn)推薦的影響因素中各代表算法對比Table 2 Comparison of typical algorithms in influencing factors of POI recommendation

3 興趣點(diǎn)推薦算法

興趣點(diǎn)推薦的影響因素類型多且復(fù)雜,利用傳統(tǒng)的推薦方法(如協(xié)同過濾推薦方法等)無法進(jìn)一步建模,因此衍生出不同類型的推薦算法與技術(shù)。目前的興趣點(diǎn)推薦方法主要朝著矩陣分解算法、基于圖的方法與基于深度學(xué)習(xí)的方向發(fā)展。以下將重點(diǎn)對興趣點(diǎn)推薦的核心算法及其相關(guān)代表工作進(jìn)行詳細(xì)闡述與對比總結(jié)。

3.1 矩陣分解算法

矩陣分解算法(matrix factorization,MF)能有效緩解數(shù)據(jù)稀疏問題,且能夠挖掘用戶和興趣點(diǎn)的特征,因此被廣泛應(yīng)用到推薦工作中。該方法采用降維的方式將用戶-興趣點(diǎn)矩陣分解為低維空間上的用戶隱特征矩陣={,,…,U}∈R和興趣點(diǎn)隱特征矩陣={,,…,V}∈R,為隱特征個數(shù),并通過訓(xùn)練使兩者乘積^盡可能接近,其對應(yīng)的優(yōu)化問題如式(6)所示:

與傳統(tǒng)推薦工作相比,興趣點(diǎn)推薦不僅采用矩陣分解算法求解用戶及項(xiàng)目的隱特征,還能進(jìn)一步地將情景信息嵌入矩陣分解框架中,以預(yù)測用戶的偏好。文獻(xiàn)[33]將社交關(guān)系融入矩陣分解算法,采用添加正則項(xiàng)的方式求解用戶偏好矩陣,通過優(yōu)化式(7)模型來實(shí)現(xiàn)。其次,將用戶關(guān)系興趣矩陣分解為用戶關(guān)系隱特征矩陣和興趣點(diǎn)隱特征矩陣,求解的優(yōu)化函數(shù)如式(8)所示。最后,將式(7)與(8)聯(lián)合求解,并采用隨機(jī)梯度下降法優(yōu)化式(9)的目標(biāo)函數(shù)。

其中,λ、λλ為正則化參數(shù);矩陣元素H為用戶與好友對興趣點(diǎn)的偏好度;與為調(diào)整因子。

在最新的推薦工作中,為了深度挖掘用戶的潛在偏好,文獻(xiàn)[52]將用戶偏好、信任關(guān)系和時空信息融入到一個改進(jìn)后的SVD矩陣分解框架中。該方法在原有模型的基礎(chǔ)上提高了準(zhǔn)確率,同時考慮了信任關(guān)系。對應(yīng)的優(yōu)化函數(shù)如下:

在式(10)的目標(biāo)函數(shù)中,第一項(xiàng)表示基本的用戶偏好。此方法的創(chuàng)新之處在于第二項(xiàng),(,)表示用戶相似度,結(jié)合了信任與時空信息,具體如式(11)所示:

另外,Davtalab等人融合了地理信息、射箭關(guān)系和時間信息到概率矩陣分解框架中。文獻(xiàn)[54-55]采用聯(lián)合矩陣分解的方法捕獲用戶的偏好,從而解決隱式反饋問題。上述算法利用不同類型的矩陣分解方法求解用戶的偏好矩陣,適用于預(yù)測稀疏數(shù)據(jù)集的用戶偏好,但缺點(diǎn)是這類方法往往訓(xùn)練時間較長。

3.2 基于圖嵌入方法

基于圖嵌入方法(graph embedding,GE)能夠形象地將數(shù)據(jù)及其對應(yīng)的關(guān)系刻畫到圖上,其興起為社交網(wǎng)絡(luò)的研究拓寬了新的思路。在LBSN中,興趣點(diǎn)推薦往往包含著用戶對興趣點(diǎn)的偏好關(guān)系與用戶社交關(guān)系。為此,可利用圖模型將這兩種關(guān)系描繪成圖5所示的二分圖網(wǎng)絡(luò)。在二分圖網(wǎng)絡(luò)中,用戶若簽到過興趣點(diǎn),則將兩節(jié)點(diǎn)相連,若兩個用戶是好友關(guān)系,則利用邊連接兩個用戶。近年來,圖嵌入的方法得到了廣泛的應(yīng)用,接下來將對基于圖的興趣點(diǎn)推薦方法進(jìn)行概括。

圖5 二分圖網(wǎng)絡(luò)Fig. 5 Bipartite graph network

Zhu 等人提出了一種融合社交與地理信息的圖嵌入表示方法。該方法將用戶嵌入與社交圖嵌入結(jié)合獲得用戶的特征表示,將興趣點(diǎn)嵌入與地理圖嵌入結(jié)合獲得興趣點(diǎn)的特征表示。最終,在神經(jīng)網(wǎng)絡(luò)框架下捕獲用戶與興趣點(diǎn)的潛在交互,從而得到用戶的偏好。此模型可有效緩解協(xié)同過濾推薦算法無法解決的數(shù)據(jù)稀疏問題,并提高推薦質(zhì)量。

Lu等人將圖模型的方法應(yīng)用到下一個興趣點(diǎn)推薦的場景中,建立了一個改進(jìn)的基于圖的潛在表示模型,利用歷史簽到記錄捕獲時間序列影響與用戶的時間偏好。在此基礎(chǔ)上,使用LSTM神經(jīng)網(wǎng)絡(luò)模型擴(kuò)展原有框架,以模擬用戶復(fù)雜的移動行為。最終,利用學(xué)習(xí)到的潛在表示完成推薦任務(wù),獲得了較好的準(zhǔn)確率。但此方法對社交網(wǎng)絡(luò)中情景信息的挖掘不夠充分,仍有待改善。

為了豐富情景信息,Qiao等人提出了一種健壯的基于圖嵌入的算法,能夠有效解決社交網(wǎng)絡(luò)中的異構(gòu)性問題。該方法利用異構(gòu)圖融合了用戶社交關(guān)系、地理和時間信息,生成了一個聯(lián)合的表示學(xué)習(xí)框架。具體地,通過綜合考慮情景信息的影響,得到異構(gòu)圖中節(jié)點(diǎn)間的轉(zhuǎn)移概率,并利用異構(gòu)圖中的拓?fù)浣Y(jié)構(gòu)來學(xué)習(xí)用戶與興趣點(diǎn)的潛在表示。實(shí)驗(yàn)結(jié)果表明,該方法提升了推薦的性能,且能夠處理興趣點(diǎn)推薦中的冷啟動問題。

Chen等人提出了一種多任務(wù)嵌入的個性化推薦方法,分別采用了序列嵌入和圖嵌入的方式對用戶的簽到行為建模。該模型融合了序列數(shù)據(jù)、社交關(guān)系、語義信息和時空信息,利用序列嵌入方法捕獲簽到數(shù)據(jù)中的序列信息,再利用圖嵌入的方式在用戶-用戶、用戶-興趣點(diǎn)和用戶-時間等關(guān)系圖中捕獲情景信息的影響。該研究通過不同的嵌入方式探究各類信息的影響,有效地提高了推薦的性能。

在最新的一項(xiàng)研究中,Hu 等人建立了一種模擬用戶動態(tài)偏好的方法,目的在于有效地捕捉用戶的細(xì)粒度偏好。該方法嵌入了地理和時間信息,旨在探究其對興趣點(diǎn)級與項(xiàng)目級的影響,并融入到基于圖嵌入的模型中,從而解決數(shù)據(jù)稀疏和冷啟動問題,但不足之處在于可解釋性較低。

上述對圖嵌入方法在興趣點(diǎn)推薦中的相關(guān)應(yīng)用進(jìn)行了介紹,借助圖嵌入方法,能夠利用圖對LBSN中存在的用戶、興趣點(diǎn)和用戶社交等節(jié)點(diǎn)關(guān)系進(jìn)行建模,從而深層地挖掘社交網(wǎng)絡(luò)間的關(guān)系,有效地將推薦問題轉(zhuǎn)化為圖中相關(guān)節(jié)點(diǎn)的交互問題,緩解了數(shù)據(jù)稀疏和冷啟動問題。雖然基于圖的方法為興趣點(diǎn)推薦工作提供了新的方向,但其可解釋性較低。隨著深度學(xué)習(xí)的興起,學(xué)者們逐漸將深度學(xué)習(xí)遷移到圖上來,形成了圖神經(jīng)網(wǎng)絡(luò)等重要的方法,來進(jìn)一步彌補(bǔ)上述方法的不足。

3.3 基于深度學(xué)習(xí)方法

鑒于傳統(tǒng)的推薦方法在構(gòu)建復(fù)雜模型時訓(xùn)練效果不佳,且利用矩陣分解算法易出現(xiàn)過擬合問題,深度學(xué)習(xí)技術(shù)受到了學(xué)者們的關(guān)注與青睞。深度學(xué)習(xí)(deep learning,DL)通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),對原始數(shù)據(jù)中的簡單特征進(jìn)行組合,從而能夠獲取更加抽象的語義特征表示。近年來,深度學(xué)習(xí)借由其強(qiáng)大的學(xué)習(xí)能力,以及能夠深層次地表征用戶與項(xiàng)目的潛在特征的特點(diǎn),已被廣泛地應(yīng)用到推薦系統(tǒng)中。以下將對深度學(xué)習(xí)中各種神經(jīng)網(wǎng)絡(luò)在興趣點(diǎn)推薦中的工作現(xiàn)狀進(jìn)行總結(jié),主要包括針對卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)技術(shù)的推薦方法。

卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的基本結(jié)構(gòu)如圖6 所示,包括輸入層、卷積層、池化層、連接層與輸出層。Xing 等人考慮了地理位置、社交關(guān)系和評論信息,并將這些因素融合到一個基于卷積神經(jīng)網(wǎng)絡(luò)和概率矩陣分解模型的框架中,從而挖掘用戶與興趣點(diǎn)的特征。隨著研究的深入,該團(tuán)隊(duì)將興趣點(diǎn)的屬性、用戶偏好和情感信息融入卷積神經(jīng)網(wǎng)絡(luò)框架,利用神經(jīng)網(wǎng)絡(luò)捕捉評論內(nèi)容中的語義信息,從而解決用戶偏好的不可解釋性問題和數(shù)據(jù)稀疏問題,生成了效果更優(yōu)的潛在模型。馮浩等人利用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶評論信息的特征,最終通過學(xué)習(xí)到的特征表示進(jìn)行位置推薦,以改善算法的性能。

圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 6 Structure of convolutional neural network

循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)主要用于處理時間序列數(shù)據(jù),大多數(shù)興趣點(diǎn)推薦的研究主要應(yīng)用該技術(shù)來完成序列推薦任務(wù)。Xia等人提出了一種基于注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò),能根據(jù)相應(yīng)用戶的序列簽到數(shù)據(jù)來模擬用戶的生活模式。相較于傳統(tǒng)的推薦方法,利用神經(jīng)網(wǎng)絡(luò)模型提高了算法的可解釋性。Chen等人提出了一個有監(jiān)督的循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)預(yù)測模型,該模型考慮了用戶的興趣、地理位置和時間信息,最終形成了用戶興趣和上下文信息的綜合特征表示。然而,上述的研究在對用戶的短期偏好建模時忽略了用戶的長期偏好,導(dǎo)致推薦結(jié)果不可靠。為此,Sun 等人提出了一種新的適用于下一個興趣點(diǎn)推薦的方法,該方法分別對用戶的長短期偏好建模,并融合地理信息與用戶的短期偏好到循環(huán)神經(jīng)網(wǎng)絡(luò)中。Huang 等人考慮了相似用戶的歷史數(shù)據(jù),利用循環(huán)神經(jīng)網(wǎng)絡(luò)與基于協(xié)同過濾算法建模用戶的行為,從而捕捉用戶的偏好。該模型克服了當(dāng)前多層感知機(jī)與LSTM 推薦方法的不足,在興趣點(diǎn)推薦場景下得到了有效的應(yīng)用。

基于圖推薦方法的興起為社交網(wǎng)絡(luò)的研究拓寬了思路,學(xué)者們開始關(guān)注將深度學(xué)習(xí)模型運(yùn)用到圖數(shù)據(jù)上,而圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)成為其中最活躍的方法。Zhong 等人提出混合圖卷積網(wǎng)絡(luò)模型,利用興趣點(diǎn)對之間的地理距離構(gòu)建空間圖,采用圖卷積網(wǎng)絡(luò)表示興趣點(diǎn)間的連通性,該模型為緩解數(shù)據(jù)稀疏問題提供了有效途徑。為了建立更強(qiáng)大的推薦模型,Zhang等人利用圖神經(jīng)網(wǎng)絡(luò)構(gòu)建出一個包含用戶節(jié)點(diǎn)和興趣點(diǎn)節(jié)點(diǎn)的社交網(wǎng)絡(luò)圖,分別從節(jié)點(diǎn)信息和拓?fù)浣Y(jié)構(gòu)中學(xué)習(xí)節(jié)點(diǎn)的特征表示。用戶節(jié)點(diǎn)利用了相鄰社交節(jié)點(diǎn)和具有簽到行為的興趣點(diǎn)的表示來學(xué)習(xí),并采用注意力機(jī)制來學(xué)習(xí)社交網(wǎng)絡(luò)關(guān)系的異質(zhì)結(jié)構(gòu)。興趣點(diǎn)節(jié)點(diǎn)融合了地理和時間信息特征,利用雙向的長短期記憶模型來模擬用戶的序列簽到行為。該模型有效提高了推薦的效果,能普遍運(yùn)用到各類推薦任務(wù)中。在實(shí)際應(yīng)用中,Kang等人將監(jiān)測站的位置制定為包含時間空間的圖節(jié)點(diǎn)推薦問題,設(shè)計(jì)了一個有效的基于空氣質(zhì)量推斷的高階圖卷積模型,進(jìn)而捕捉空氣質(zhì)量分布的時空特征。該模型利用節(jié)點(diǎn)增量學(xué)習(xí)方法來判斷節(jié)點(diǎn)的優(yōu)先級順序,最終依據(jù)優(yōu)先級順序完成推薦任務(wù)。

上述將深度學(xué)習(xí)中的CNN、RNN與GNN方法在興趣點(diǎn)推薦中的應(yīng)用進(jìn)行了對比與歸納,介紹了CNN技術(shù)在表征潛在特征方面的優(yōu)勢,總結(jié)了RNN 在序列推薦上的應(yīng)用以及GNN結(jié)合各情景信息來解決異構(gòu)性問題,說明了深度學(xué)習(xí)是該領(lǐng)域應(yīng)用的重要技術(shù)。為此,相關(guān)領(lǐng)域的學(xué)者應(yīng)準(zhǔn)確把握深度學(xué)習(xí)的最新發(fā)展趨勢,為興趣點(diǎn)推薦的發(fā)展尋求新的突破點(diǎn)。

綜上,本文在傳統(tǒng)推薦方法的基礎(chǔ)上不斷延伸,概括了基于矩陣分解的算法、基于圖嵌入的方法和基于深度學(xué)習(xí)的方法的應(yīng)用,分析了不同推薦方法目前已解決的問題。為了系統(tǒng)地了解各推薦方法的應(yīng)用,表3 對比歸納了各方法中代表性工作的特點(diǎn)、優(yōu)缺點(diǎn)及相應(yīng)的代碼鏈接。

由表3可知,矩陣分解算法主要通過融合各情景信息,采用降維的方式求解用戶與興趣點(diǎn)的隱特征,進(jìn)而預(yù)測用戶偏好。該算法能夠緩解數(shù)據(jù)稀疏問題,但訓(xùn)練時間較長,且會出現(xiàn)過擬合問題?;趫D嵌入的方法通過構(gòu)建關(guān)系圖來反映用戶與興趣點(diǎn)的關(guān)系,并將各情景信息描述到圖上,能緩解數(shù)據(jù)稀疏性,但存在可解釋性較低等問題。深度學(xué)習(xí)技術(shù)與矩陣分解方法都具備挖掘用戶與興趣點(diǎn)特征的能力,相較于矩陣分解方法,深度學(xué)習(xí)技術(shù)能夠更深層次地挖掘潛在特征,且具有強(qiáng)大的學(xué)習(xí)能力,主要缺點(diǎn)是模型的復(fù)雜度較高。為此,系統(tǒng)地了解各種方法的優(yōu)劣勢與適用場景,將有利于興趣點(diǎn)推薦工作的開展。

表3 興趣點(diǎn)推薦方法中各代表算法對比Table 3 Comparison of typical algorithms in POI recommendation methods

以上對影響興趣點(diǎn)推薦的因素進(jìn)行了分析,對各推薦算法的應(yīng)用進(jìn)行了描述,并詳細(xì)介紹了相關(guān)代表性的工作,有利于理解現(xiàn)有興趣點(diǎn)推薦的成果及其優(yōu)缺點(diǎn)。接下來,為了更綜合、更全面地了解興趣點(diǎn)推薦的發(fā)展現(xiàn)狀,本文依據(jù)研究成果提出的時間順序,以影響推薦的因素、解決的推薦問題及對應(yīng)的推薦算法三方面為核心,探討與總結(jié)各相關(guān)工作的推薦策略,進(jìn)而充分地了解興趣點(diǎn)推薦的研究現(xiàn)狀。相關(guān)總結(jié)如表4所示。

由表4可知,興趣點(diǎn)推薦已融合了各種影響因素來構(gòu)建模型,且取得了顯著的成效。在解決推薦問題方面,對數(shù)據(jù)稀疏、冷啟動、個性化、序列與動態(tài)推薦問題的研究頗為豐富,未來研究應(yīng)將重點(diǎn)放在異地推薦問題上。在推薦算法上,可看出早年主要以協(xié)同過濾算法為基礎(chǔ),接著逐漸利用矩陣分解算法來融合各情景信息,以緩解數(shù)據(jù)稀疏性。近年來,為了更深層次地挖掘用戶偏好,相關(guān)工作主要利用圖嵌入方法與深度學(xué)習(xí)來構(gòu)建模型,從而提高推薦性能。以上的研究總結(jié)可為相關(guān)領(lǐng)域的研究者提供更好的借鑒,同時將前沿的技術(shù)應(yīng)用到興趣點(diǎn)推薦工作中值得探索。

表4 興趣點(diǎn)推薦的研究現(xiàn)狀分析Table 4 Analysis of research status in POI recommendation

4 算法評價指標(biāo)

興趣點(diǎn)推薦系統(tǒng)利用各種推薦算法為用戶生成最終的推薦列表,系統(tǒng)通過度量相關(guān)的評價指標(biāo)來對構(gòu)建的算法進(jìn)行評價,評價的結(jié)果反映了算法的有效性。與傳統(tǒng)推薦使用的指標(biāo)相似,在興趣點(diǎn)推薦中,目前常用的預(yù)測指標(biāo)包括準(zhǔn)確率(precision)、召回率(recall)、1 值、平均絕對誤差(mean absolute error,MAE)。定義分別如下:

另外,每個用戶推薦生成列表具有有序性,理想狀態(tài)是準(zhǔn)確率越高的興趣點(diǎn)排序越靠前越好。因此,針對排序的結(jié)果,需通過度量其排序指標(biāo)來評估算法的性能,常用的指標(biāo)包括平均精度均值(mean average precision,MAP)和歸一化折損累計(jì)增益(normalized discounted cumulative gain,NDCG)。兩者的區(qū)別主要在于MAP 考慮對象是二元相關(guān)性,即對象要么喜歡要么不喜歡,而NDCG 主要通過實(shí)數(shù)的形式進(jìn)行相關(guān)性比較。定義分別如下:

其中,表示排名;()表示推薦生成列表中截止到的準(zhǔn)確率;()的值取決于用戶是否有簽到排名的興趣點(diǎn),若有簽到則值為1,否則為0。

推薦的效果取決于評價指標(biāo)值的高低,對算法進(jìn)行評估測量是推薦工作的最后流程。為了了解興趣點(diǎn)推薦工作中各指標(biāo)的應(yīng)用情況,本文列舉了幾種重要算法采用的指標(biāo)。同時為了綜合了解算法的整體性能,將其對應(yīng)文獻(xiàn)所涉及的時間與空間復(fù)雜度進(jìn)行了歸納,如表5所示。

由表5 可知,precision 和recall 是應(yīng)用最廣的預(yù)測指標(biāo),因?yàn)樗鼈兡軌蜃钪苯臃从吵鲱A(yù)測的推薦列表是否符合用戶的喜好,所以獲得廣泛的應(yīng)用。1作為precision 和recall 的調(diào)和平均值,通常用于評估算法的整體性能。MAE能夠反映預(yù)測評分與真實(shí)評分的差距,在文獻(xiàn)[48,52]中,該指標(biāo)主要用于對推薦結(jié)果進(jìn)行誤差評估,以更有效地評價推薦的準(zhǔn)確性。MAP與NDCG是經(jīng)典的排序指標(biāo),在文獻(xiàn)[74-75]中,為了綜合評估排序的性能,結(jié)合了兩種指標(biāo)進(jìn)一步說明算法的有效性。因此,在算法評價流程中,采用越多的預(yù)測和排序指標(biāo),以及結(jié)合適當(dāng)?shù)膹?fù)雜度分析會增加算法的說服力。同時,進(jìn)一步發(fā)掘更多的評估指標(biāo)來驗(yàn)證算法的性能,是未來研究的重點(diǎn)內(nèi)容。

表5 幾種代表算法的評價指標(biāo)總結(jié)Table 5 Summary of evaluation metrics of several algorithms

5 面臨的挑戰(zhàn)及研究趨勢

興趣點(diǎn)推薦系統(tǒng)作為一個新興的研究領(lǐng)域,近年來取得了較為豐碩的成果,但由于不同場景下推薦的差異性與多樣性,導(dǎo)致推薦的難度增加,仍存在一些挑戰(zhàn)和難點(diǎn)亟待解決。本文總結(jié)了未來可進(jìn)一步探究的內(nèi)容,概括來講包括以下這些潛在的方向。

(1)數(shù)據(jù)來源問題

在基于位置社會網(wǎng)絡(luò)的興趣點(diǎn)推薦系統(tǒng)中,用戶采用“簽到”的方式與社交網(wǎng)絡(luò)中的好友共享位置,從而產(chǎn)生簽到數(shù)據(jù)。作為推薦工作的基礎(chǔ),對數(shù)據(jù)的挖掘與認(rèn)知至關(guān)重要,然而用戶的簽到數(shù)據(jù)往往采用隱式的方式表達(dá)。比如用戶對地點(diǎn)的簽到次數(shù)越高,可理解為用戶偏好此地點(diǎn),但用戶簽到的頻率無固定的數(shù)據(jù)范圍,增加了量化偏好值的難度,這與傳統(tǒng)推薦系統(tǒng)顯式打分的方法有所區(qū)別。另外,興趣點(diǎn)推薦工作的數(shù)據(jù)集主要來源于一些公開網(wǎng)站,但用戶可能僅在海量的位置中留下稀疏的簽到記錄,增加了數(shù)據(jù)獲取的難度,這是推薦工作面臨的首要問題。

(2)融合多種影響因素的推薦

目前的興趣點(diǎn)推薦工作主要針對用戶及興趣點(diǎn)兩個維度的屬性進(jìn)行研究,如用戶的社交關(guān)系、簽到時間、興趣點(diǎn)的內(nèi)容及流行度等。如何進(jìn)一步拓展影響用戶決策的其他行為信息,從而輔助用戶決策至關(guān)重要。比如,興趣點(diǎn)推薦還可能受到用戶自身的情感以及外界因素(如天氣、交通)的影響,探究用戶的情感行為及引入外界因素構(gòu)建模型成為一項(xiàng)富有挑戰(zhàn)的研究內(nèi)容。

(3)跨領(lǐng)域推薦

跨領(lǐng)域推薦可融合來自不同領(lǐng)域的用戶偏好特征,進(jìn)而根據(jù)每個用戶自身特征進(jìn)行個性化推薦,提高目標(biāo)領(lǐng)域推薦的多樣性與準(zhǔn)確性。在興趣點(diǎn)推薦工作中,存在數(shù)據(jù)稀疏問題與冷啟動問題,若融合多個輔助領(lǐng)域的數(shù)據(jù)來為目標(biāo)領(lǐng)域進(jìn)行推薦,可有效解決興趣點(diǎn)推薦中的冷啟動問題。例如,已有工作在對圖神經(jīng)網(wǎng)絡(luò)的應(yīng)用中,對用戶與興趣點(diǎn)關(guān)系圖的構(gòu)建主要停留在單一的層面上,考慮如何從一個關(guān)系圖過渡到其他的關(guān)系圖,進(jìn)而實(shí)現(xiàn)不同圖神經(jīng)網(wǎng)絡(luò)框架間的數(shù)據(jù)遷移,是一個值得關(guān)注的問題。

(4)推薦結(jié)果的可解釋性

推薦的可解釋性指的是向推薦對象提供解釋,使其理解推薦該項(xiàng)目的原因,為了使興趣點(diǎn)推薦系統(tǒng)成為一個用戶參與的交互系統(tǒng),必須提高推薦結(jié)果的可解釋性,從而提高推薦系統(tǒng)的有效性及用戶的滿意度。在對興趣點(diǎn)推薦結(jié)果的解釋過程中,不僅要考慮興趣點(diǎn)的屬性,還要關(guān)注屬性可能隨時間動態(tài)變化的特征。深度學(xué)習(xí)依靠其強(qiáng)大的表征能力被廣泛應(yīng)用到推薦系統(tǒng),然而其深層神經(jīng)網(wǎng)絡(luò)被普遍認(rèn)為是不可解釋的。近年來備受關(guān)注的知識圖譜方法為該問題帶來了契機(jī),它通過建立<實(shí)體,關(guān)系,屬性>三元組來提高可解釋性,然而知識圖譜的大數(shù)據(jù)規(guī)模無法依據(jù)用戶反饋進(jìn)行實(shí)時更新,只能略微改善推薦的可解釋性。目前對興趣點(diǎn)推薦中可解釋性問題的研究還比較少,探索一類能夠?qū)崟r交互更新的可解釋性推薦方法值得研究。

(5)用戶的隱私保護(hù)

為了提高推薦的性能,當(dāng)前的興趣點(diǎn)推薦工作需要從用戶簽到的歷史記錄與交互行為中充分挖掘用戶的潛在偏好信息,包括對用戶信息的收集、處理、存儲和挖掘等,這在一定程度上威脅到用戶的隱私信息。為此,現(xiàn)有的興趣點(diǎn)推薦系統(tǒng)面臨著較高的隱私風(fēng)險(xiǎn),提高興趣點(diǎn)推薦的性能與保護(hù)用戶的隱私問題可能相悖。目前用來解決隱私保護(hù)問題的一類方法是向原始數(shù)據(jù)中添加噪音,該方法簡單高效且易實(shí)現(xiàn),然而過多的噪音會影響算法的有效性;另一類方法是采用加密技術(shù),但效率較低且實(shí)用性不強(qiáng);最近出現(xiàn)的聯(lián)合學(xué)習(xí)是一種新的隱私保護(hù)學(xué)習(xí)方法,它不需要用戶共享實(shí)時的簽到信息,可通過離線的方式訓(xùn)練模型,適用性較強(qiáng),但需要有足夠的數(shù)據(jù)量。因此,如何應(yīng)用相關(guān)技術(shù)在推薦的高精度要求與隱私保護(hù)間找到適當(dāng)?shù)钠胶恻c(diǎn),成為了興趣點(diǎn)推薦系統(tǒng)研究的難點(diǎn)。

6 結(jié)束語

移動社交網(wǎng)絡(luò)與推薦系統(tǒng)的融合,助推了基于位置社交網(wǎng)絡(luò)的興趣點(diǎn)推薦系統(tǒng)的發(fā)展。興趣點(diǎn)推薦利用用戶的簽到數(shù)據(jù)及相關(guān)的情景信息模擬用戶的決策行為,以挖掘用戶潛在感興趣的地點(diǎn),成為當(dāng)前推薦系統(tǒng)領(lǐng)域較為活躍的方向之一。本文首先對現(xiàn)有的興趣點(diǎn)推薦的研究現(xiàn)狀進(jìn)行了梳理、分類與歸納,介紹了興趣點(diǎn)推薦系統(tǒng)的相關(guān)理論與基本框架。接著圍繞基本框架對影響興趣點(diǎn)推薦的因素、推薦算法和算法評價三大核心內(nèi)容進(jìn)行概述,并詳細(xì)分析對比了各種代表性工作的研究內(nèi)容和優(yōu)缺點(diǎn)。最后對該領(lǐng)域難點(diǎn)問題和研究方向進(jìn)行總結(jié)和展望,提出一些潛在的發(fā)展方向與趨勢,希望能為興趣點(diǎn)推薦領(lǐng)域的學(xué)者提供借鑒與幫助。

猜你喜歡
社交矩陣算法
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
社交距離
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
初等行變換與初等列變換并用求逆矩陣
一種改進(jìn)的整周模糊度去相關(guān)算法
矩陣
南都周刊(2015年4期)2015-09-10 07:22:44
武冈市| 南江县| 新龙县| 景泰县| 华坪县| 资溪县| 兰西县| 灵武市| 锦州市| 武城县| 佛山市| 海淀区| 城步| 玉田县| 曲周县| 伊吾县| 定西市| 犍为县| 清新县| 炎陵县| 莱西市| 天长市| 法库县| 永昌县| 延津县| 广灵县| 中方县| 历史| 溧阳市| 五华县| 台南市| 南城县| 咸阳市| 湖口县| 甘孜县| 唐山市| 海林市| 章丘市| 仙居县| 保德县| 黄大仙区|