基于雙用戶視角與知識(shí)圖譜注意力網(wǎng)絡(luò)的推薦模型

2020-06-15 12:04:32張素琪許馨勻佘士耀任珂可

現(xiàn)代計(jì)算機(jī) 2020年13期

張素琪，許馨勻，佘士耀，任珂可

（1.天津商業(yè)大學(xué)信息工程學(xué)院，天津300134；2.河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院，天津300401）

0 引言

互聯(lián)網(wǎng)為我們帶來了更為便捷和娛樂的生活，但隨著信息量的快速增長(zhǎng)，用戶在線瀏覽信息時(shí)會(huì)出現(xiàn)難以抉擇閱讀項(xiàng)目的情況，這時(shí)推薦模型應(yīng)運(yùn)而生。推薦模型可為用戶推薦潛在的興趣項(xiàng)目，帶給用戶更好的體驗(yàn)，同時(shí)可為運(yùn)營(yíng)商帶來巨大的商業(yè)效益，應(yīng)用甚廣。

傳統(tǒng)的推薦模型主要基于協(xié)同過濾[1]的方法，但該類方法會(huì)面臨數(shù)據(jù)稀疏以及冷啟動(dòng)的問題。為緩解上述問題，研究者們引入了各種附加信息，如社交網(wǎng)絡(luò)[2,3]、知識(shí)圖譜（KG）[4,5]、用戶評(píng)論[6,7]等。其中，知識(shí)圖譜是一種異構(gòu)信息網(wǎng)絡(luò)，其節(jié)點(diǎn)表示實(shí)體，邊表示實(shí)體間的關(guān)系。這種結(jié)構(gòu)化知識(shí)為提高推薦模型的準(zhǔn)確性和可解釋性提供了一個(gè)有價(jià)值的解決方案。

基于知識(shí)圖譜的推薦方法大致分為三種：基于路徑的方法[8-10]、基于嵌入的方法[11-13]和兩者混合的方法[14-16]。石川等[7]將知識(shí)圖譜視為一種加權(quán)的異構(gòu)信息網(wǎng)絡(luò)，設(shè)計(jì)了多條meta-path 并在PathSim 的基礎(chǔ)上融入邊信息，獲得基于元路徑的用戶相似度。趙歡等人[8]改進(jìn)了傳統(tǒng)的meta-path，引入元圖（meta-graph）的概念?；诼窂降姆椒▽⒅R(shí)圖譜以meta-path 等方式融入推薦中，體現(xiàn)了推薦的可解釋性，但meta-path 的設(shè)計(jì)依賴于人工設(shè)定?；谇度氲姆椒▌t需要利用KGE 等算法[17,18]得到知識(shí)圖譜表示向量。DKN[11]提取新聞標(biāo)題的背景知識(shí)來構(gòu)建知識(shí)圖譜，采用TranR[17]方法實(shí)現(xiàn)知識(shí)圖譜的嵌入，然后將詞表示向量與知識(shí)圖譜的實(shí)體向量作為卷積網(wǎng)絡(luò)的輸入以提取新聞特征。該方法隱式地指引用戶和項(xiàng)目的表示學(xué)習(xí)，缺乏推理能力。近來，利用圖神經(jīng)網(wǎng)絡(luò)[19-21]表示知識(shí)圖譜的方法得到了學(xué)界的關(guān)注。該方法對(duì)網(wǎng)絡(luò)中的各個(gè)實(shí)體進(jìn)行向量表示，再通過注意力機(jī)制等方法自動(dòng)挖掘用戶興趣路徑，因此可看為基于路徑和嵌入的方法的混合。RippleNet[14]以已交互的項(xiàng)目為中心構(gòu)建知識(shí)圖譜，興趣在知識(shí)圖譜上逐層向外擴(kuò)散且逐層衰減。KGCN[15]利用了圖注意力網(wǎng)絡(luò)（GAT）自動(dòng)捕獲高階結(jié)構(gòu)和語(yǔ)義信息。該方法使得推薦具有較好的可解釋性，并且不依賴人工設(shè)計(jì)的特征。目前，該類方法仍處于發(fā)展階段，如何將知識(shí)圖譜融入推薦模型中以更好地實(shí)現(xiàn)用戶和項(xiàng)目的表示還有待解決。

本文提出了基于雙用戶視角與知識(shí)圖譜注意力網(wǎng)絡(luò)（Dual-User Perspective and Knowledge Graph Atten?tion Network，DKGAT）的推薦模型。為了更好地挖掘用戶特征，DKGAT 從雙視角分析用戶行為，并分別進(jìn)行用戶表示。首先，用戶興趣為用戶本身特性的傳達(dá)，是靜態(tài)且不輕易受外界影響的，因此從該角度分析用戶行為是靜態(tài)用戶視角。其次，用戶若對(duì)某個(gè)項(xiàng)目感興趣則會(huì)產(chǎn)生交互行為，即用戶交互的歷史項(xiàng)目體現(xiàn)了個(gè)人興趣，是興趣的外在展現(xiàn)，因此可稱之為動(dòng)態(tài)用戶視角。在項(xiàng)目特征的表示方面，為準(zhǔn)確的捕獲特定用戶興趣，需要在知識(shí)圖譜中同時(shí)捕獲低階與高階項(xiàng)目屬性，并自動(dòng)挖掘用戶興趣路徑。為此，DKGAT 基于用戶的本質(zhì)喜好即靜態(tài)用戶表示，利用注意力機(jī)制在知識(shí)圖譜中關(guān)注用戶感興趣的項(xiàng)目屬性，并通過鄰域聚合的方法得到項(xiàng)目表示。最后，通過注意力機(jī)制計(jì)算用戶的歷史交互項(xiàng)目和待推薦項(xiàng)目之間的相似性，即可獲取基于待推薦項(xiàng)目的動(dòng)態(tài)用戶表示。兩種用戶表示不僅可反應(yīng)用戶的本質(zhì)特性，還可挖掘出用戶與待推薦項(xiàng)目相關(guān)的興趣。

1 建立模型

1.1 任務(wù)定義

推薦模型中存在M 個(gè)用戶和N 個(gè)項(xiàng)目，分別記為U={u1,u2,…,uM}和V={v1,v2,…,vN}。依據(jù)用戶對(duì)項(xiàng)目的隱式反饋定義用戶-項(xiàng)目交互矩陣Y∈RM×N，其中yuv=1 表示用戶u 瀏覽過項(xiàng)目v，否則yuv= 0。知識(shí)圖譜G可用三元組(h,r,t)表示，其中h∈E、r∈R、t∈E分別表示頭、關(guān)系、尾，E和R分別為知識(shí)圖譜中的實(shí)體集合和關(guān)系集合。例如，三元組(A Song of Ice and Fire, book.author, George Martin)表示“A Song of Ice and Fire”的作者是George Martin。在推薦模型中，可以將項(xiàng)目v∈V看為一個(gè)實(shí)體，如在上面的例子中，“A Song of Ice and Fire”既可以看為實(shí)體也可以看為項(xiàng)目。

給定用戶-項(xiàng)目交互矩陣Y、各個(gè)項(xiàng)目的知識(shí)圖譜G，推薦任務(wù)旨在預(yù)測(cè)用戶u 是否對(duì)項(xiàng)目v 有興趣。最終期望得到預(yù)測(cè)函數(shù)y?uv=F(u,v|Θ,Y,G)，其中y?uv表示用戶u 對(duì)項(xiàng)目v 的交互概率，Θ 則表示模型參數(shù)。

1.2 模型概述

模型以用戶u 和項(xiàng)目v 為輸入，通過知識(shí)圖譜獲取用戶和項(xiàng)目表示，最終輸出u 與v 的交互概率。

圖1 為模型結(jié)構(gòu)。項(xiàng)目表示反應(yīng)項(xiàng)目特征，首先需要構(gòu)建以項(xiàng)目為中心的知識(shí)圖譜，再利用知識(shí)圖譜注意力網(wǎng)絡(luò)（KGAT）對(duì)知識(shí)圖譜進(jìn)行表示，即可得到項(xiàng)目表示向量v。用戶表示則由兩部分組成，分別來自于靜態(tài)用戶視角和動(dòng)態(tài)用戶視角。用戶的靜態(tài)視角反應(yīng)用戶自身的固有喜好，是用戶本質(zhì)的表達(dá)；動(dòng)態(tài)視角則從用戶交互的歷史項(xiàng)目中挖掘的喜好信息。靜態(tài)用戶表示us用在KGAT 中，挖掘用戶關(guān)注的重要項(xiàng)目特征，以獲取基于特定用戶的項(xiàng)目表示。動(dòng)態(tài)用戶表示ud則反應(yīng)了用戶的交互歷史，若待推薦項(xiàng)目與已交互項(xiàng)目之間有較高的相似度，則推薦的概率也會(huì)較高。為獲取動(dòng)態(tài)用戶表示ud，可分別對(duì)每個(gè)已交互項(xiàng)目構(gòu)建知識(shí)圖譜，通過KGAT 獲取每個(gè)項(xiàng)目的表示向量，然后利用注意力機(jī)制獲取各已交互項(xiàng)目與待推薦項(xiàng)目的相似性權(quán)重，基于此權(quán)重對(duì)已交互項(xiàng)目加權(quán)求和，即可獲得ud。這樣的動(dòng)態(tài)用戶向量不僅反映了用戶的交互歷史，也反映了用戶的歷史興趣與待推薦項(xiàng)目的相似度。將ud和us做聚合，以獲得最終的用戶表示u。最后通過內(nèi)積等方法計(jì)算用戶表示和項(xiàng)目表示的相關(guān)性，即可獲取推薦評(píng)分。

圖1 DKGAT模型結(jié)構(gòu)

圖中以用戶有四個(gè)交互項(xiàng)目為例，左側(cè)省略號(hào)表示省略的交互項(xiàng)目的知識(shí)圖譜。

1.3 知識(shí)圖譜注意力網(wǎng)絡(luò)

知識(shí)圖譜注意力網(wǎng)絡(luò)（KGAT）為應(yīng)用在知識(shí)圖譜上的圖注意力網(wǎng)絡(luò)，可用來捕獲知識(shí)圖譜中的拓?fù)浣Y(jié)構(gòu)信息以及實(shí)體信息。圖2 為KGAT 模型。每一個(gè)項(xiàng)目都可構(gòu)成一個(gè)知識(shí)圖譜G，然后通過KGAT 模型，獲取圖譜特征并表示為向量。該模型是多層結(jié)構(gòu)，低層時(shí)可獲取低階實(shí)體特征，高層時(shí)又可挖掘高階實(shí)體信息。下面主要介紹一層KGAT 模型，最后再對(duì)多層結(jié)構(gòu)做推廣。

其中，us∈Rd和ri,j∈Rd分別為用戶的靜態(tài)表示和關(guān)系表示，d 為向量維度。事實(shí)上，表示關(guān)系r對(duì)用戶喜好的影響程度。例如某些用戶會(huì)喜歡同類型的項(xiàng)目，因此當(dāng)關(guān)系r 為項(xiàng)目類型時(shí)需要給予較高的關(guān)注。

為了獲取項(xiàng)目v 的近鄰特征，可計(jì)算與項(xiàng)目v 直接連接的節(jié)點(diǎn)又稱鄰域的線性組合：

其中，e0∈Rd為初始的實(shí)體表示。當(dāng)計(jì)算項(xiàng)目鄰域的表示時(shí)，歸一化的用戶-關(guān)系評(píng)分可作為用戶喜好權(quán)重，以基于用戶喜好權(quán)重對(duì)項(xiàng)目的鄰域加權(quán)求和。

在真實(shí)的知識(shí)圖譜中，對(duì)不同的實(shí)體e，其鄰域N(e)的數(shù)量可能存在顯著差異。為了保持每個(gè)批處理的計(jì)算模式固定且有效，需要為每個(gè)實(shí)體抽取一個(gè)固定數(shù)量的鄰域集作為樣本。抽取后實(shí)體v 的鄰域表示可記為其中為約束數(shù)量。

其中，Wagg∈Rd×2d和bagg∈Rd為權(quán)重和偏置；σ為非線性函數(shù)。

通過一層的KGCN，實(shí)體的表示則僅依賴于自身及其鄰域，可稱vagg為項(xiàng)目v 的1 階表示，又記為v1。若將KGCN 從一層擴(kuò)展到多層，則間接相連的實(shí)體也會(huì)影響到項(xiàng)目的最終表示。為更深入以及合理地探索用戶的潛在興趣，挖掘?qū)嶓w的高階特征是很有必要的。將每個(gè)實(shí)體的初始表示即0 階表示與其鄰域?qū)嶓w的0 階表示聚合，則可獲得1 階實(shí)體表示，然后可以重復(fù)上述過程，即進(jìn)一步聚合1 階表示，以獲得2 階表示。一般來說，一個(gè)實(shí)體的L 階表示是它自己與其L跳范圍內(nèi)的實(shí)體的聚合?？蓪⒃擁?xiàng)目的L 階表示vL看為最終的項(xiàng)目表示v。

圖2 KGAT模型

首幅圖為以項(xiàng)目為中心構(gòu)建的知識(shí)圖譜，省略號(hào)表示剩余的圖譜結(jié)構(gòu)。對(duì)首幅圖中實(shí)體實(shí)現(xiàn)個(gè)數(shù)為2的采樣，并計(jì)算用戶-關(guān)系評(píng)分即可獲得第二幅圖，圖中表示用戶-關(guān)系評(píng)分，表示初始的實(shí)體表示。通過公式(2)，即可獲得第三幅圖中的實(shí)體一階表示將上述操作重復(fù)L 層，即可獲得實(shí)體的L 階表示，也為最終的實(shí)體表示。

1.4 動(dòng)態(tài)用戶表示

考慮到若用戶的交互歷史中，存在較多與待推薦項(xiàng)目相似的項(xiàng)目，則可認(rèn)為該用戶對(duì)待推薦項(xiàng)目感興趣的可能性大。為此，在模型中引入注意力機(jī)制，以更多的關(guān)注相似項(xiàng)目。

通過KGAT 模型，可得項(xiàng)目的表示向量。通過注意力機(jī)制，計(jì)算各個(gè)已交互項(xiàng)目與待推薦項(xiàng)目之間的相似性權(quán)重，按此權(quán)重對(duì)各個(gè)交互歷史表示進(jìn)行加權(quán)求和，即可獲得用戶的動(dòng)態(tài)喜好表示。具體為，以待推薦項(xiàng)目表示v∈Rd為基準(zhǔn)，為用戶u 交互歷史中的各個(gè)項(xiàng)目向量分配權(quán)重并加權(quán)平均，獲取一個(gè)相對(duì)于基準(zhǔn)的用戶動(dòng)態(tài)喜好表示：

其中αi為注意力系數(shù)，其計(jì)算方法為：

其中，Watt∈R1×2d，batt∈R1×1為注意力機(jī)制的權(quán)重和偏置。

1.5 輸出層與模型訓(xùn)練

將用戶的靜態(tài)喜好表示us∈Rd與動(dòng)態(tài)喜好表示ud∈Rd進(jìn)行拼接，再通過一個(gè)線性變換，即可完整地全面地獲得用戶喜好，記為u∈Rd：

其中，Wu∈Rd×2d和bu∈Rd為權(quán)重和偏置。

最后，將用戶表示u和項(xiàng)目表示v通過向量的內(nèi)積獲得用戶u 選擇交互項(xiàng)目v 的概率：

2 實(shí)驗(yàn)

將提出的KGAT 模型應(yīng)用到三個(gè)不同領(lǐng)域的數(shù)據(jù)集上，并通過實(shí)驗(yàn)結(jié)果分析，驗(yàn)證模型的有效性。

2.1 數(shù)據(jù)集

本文分別選用來自于電影領(lǐng)域、圖書領(lǐng)域以及音樂領(lǐng)域的三個(gè)基準(zhǔn)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，且三者的數(shù)據(jù)量相差較大。MovieLens①https：//grouplens.org/datasets/movielens/的數(shù)據(jù)來自于MovieLens 網(wǎng)站，評(píng)分范圍為1 到5；Book②http：//www2.informatik.uni-freiburg.de/～cziegler/BX/的數(shù)據(jù)來自Book-Crossings 社區(qū)，評(píng)分范圍為0 到10；Music③https：//searchengineland.com/library/bing/bing-satori的數(shù)據(jù)來自于Last.FM 在線音樂系統(tǒng)。數(shù)據(jù)集的具體統(tǒng)計(jì)結(jié)果見表1。

表1 數(shù)據(jù)集統(tǒng)計(jì)

實(shí)驗(yàn)中將每一個(gè)數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集，三者的比例為6：2：2。本實(shí)驗(yàn)為點(diǎn)擊率預(yù)測(cè)，即判斷用戶是否會(huì)對(duì)待推薦項(xiàng)目感興趣，實(shí)驗(yàn)采用AUC 和準(zhǔn)確率（ACC）作為評(píng)價(jià)指標(biāo)。

為實(shí)現(xiàn)點(diǎn)擊率預(yù)測(cè)，需將數(shù)據(jù)集中的顯示評(píng)分轉(zhuǎn)換為隱式評(píng)分，即用戶對(duì)該項(xiàng)目感興趣則隱式評(píng)分為1，用戶對(duì)該項(xiàng)目不感興趣則為0。在上述三個(gè)數(shù)據(jù)集中，可通過為用戶評(píng)分設(shè)定閾值的方法將其轉(zhuǎn)換為隱式評(píng)分。具體為，在MovieLens 中對(duì)大于等于4 的用戶評(píng)分設(shè)定其隱式評(píng)分為1，其他為0；由于其他兩個(gè)數(shù)據(jù)集的數(shù)據(jù)較為稀疏，因此不為其設(shè)定閾值，只要存在用戶評(píng)分就隱式評(píng)分為1，否則為0。最后，本文使用了文獻(xiàn)[15]構(gòu)建的知識(shí)圖譜。

2.2 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)中參數(shù)的設(shè)置可見表2。其中H 表示知識(shí)圖譜中鄰居節(jié)點(diǎn)的采樣個(gè)數(shù)，d 表示向量維度，L 代表知識(shí)圖譜的迭代層數(shù)，K 為交互項(xiàng)目采樣個(gè)數(shù)，λ為正則化權(quán)重，lr 為學(xué)習(xí)率，batch 為批處理大小。

表2 實(shí)驗(yàn)參數(shù)設(shè)置

2.3 對(duì)比實(shí)驗(yàn)

將本文提出的推薦模型與下面的六種方法在相同的三組數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)結(jié)果比較：

（1）PER[10]將知識(shí)圖譜視為異構(gòu)信息網(wǎng)絡(luò)，基于元路徑表示用戶興趣路徑，然后在全局和個(gè)性化級(jí)別定義推薦模型。

（2）CKE[12]利用 TransE[18]表示知識(shí)圖譜，并將該類信息與文本以及圖像信息融入到模型中以共同學(xué)習(xí)用戶和項(xiàng)目表示。

（3）LibFM[22]將基于特征的因子分解機(jī)的方法應(yīng)用在點(diǎn)擊率預(yù)測(cè)任務(wù)上。

（4）Wide&Deep[23]是將傳統(tǒng)的線性模型和深度模型相結(jié)合的通用深度推薦模型。

（5）RippleNet[14]采用了一種類似于內(nèi)存網(wǎng)絡(luò)的方法，該模型在知識(shí)圖譜中傳播用戶的喜好以供推薦。

（6）KGCN[15]通過圖卷積網(wǎng)絡(luò)挖掘項(xiàng)目在知識(shí)圖譜上的重要屬性以有效地捕獲項(xiàng)目間的相關(guān)性。

表3 實(shí)驗(yàn)結(jié)果

2.4 實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)的具體結(jié)果顯示在表3 中，可以看到，本文的實(shí)驗(yàn)結(jié)果普遍優(yōu)于基準(zhǔn)實(shí)驗(yàn)。相較于最好的對(duì)比實(shí)驗(yàn)結(jié)果，DKGAT 的AUC 性能在三個(gè)數(shù)據(jù)集上分別有0.5%、6%、1%的提升，ACC 指標(biāo)在三個(gè)數(shù)據(jù)集上分別有0.8%、5.7%、1.8%的提升。

RER 的實(shí)驗(yàn)結(jié)果不理想，是因?yàn)樵摲椒ㄐ枰趍eat-path 的基礎(chǔ)上尋找用戶和項(xiàng)目的關(guān)系，但meatpath 的設(shè)計(jì)依賴于專家知識(shí)，很難找到最佳方案。CKE 的實(shí)驗(yàn)結(jié)果較差，一方面是因?yàn)閷?shí)驗(yàn)沒有利用圖像和文本信息，另一方面說明利用TransE 等方法預(yù)訓(xùn)練得實(shí)體表示的方法不能很好地利用知識(shí)圖譜的信息。LibFM 和Wide&Deep 較上面的兩個(gè)實(shí)驗(yàn)而言結(jié)果較好，說明相較與上述兩類結(jié)合知識(shí)圖譜的方法，該類方法可更有效的利用知識(shí)信息。

相較于上述四種方法，RippleNet 和KGCN 表現(xiàn)除了較為強(qiáng)悍的性能。RippleNet 利用用戶的交互歷史構(gòu)建可表示用戶的知識(shí)圖譜，然后計(jì)算圖譜中的實(shí)體與待推薦項(xiàng)目之間的相關(guān)性，并在知識(shí)圖譜中逐層的向外擴(kuò)展，挖掘圖中的重要特征。相較于DKGAT，兩者都利用了用戶的交互歷史以獲取用戶表示，但是RippleNet 沒有考慮待推薦項(xiàng)目的圖譜信息，導(dǎo)致特征缺失。而DKGAT 實(shí)驗(yàn)結(jié)果較好，說明對(duì)待推薦項(xiàng)目構(gòu)建知識(shí)圖譜，可更為精確的挖掘項(xiàng)目特征，實(shí)現(xiàn)項(xiàng)目表示。KGCN 則考慮到構(gòu)建項(xiàng)目知識(shí)圖譜，利用圖神經(jīng)網(wǎng)絡(luò)的方法表示項(xiàng)目。但是KGCN 沒有有效的利用用戶的交互歷史信息，只是將用戶向量用在GCN 中挖掘項(xiàng)目中的重要特征。DKGAT 相較于KGCN 可有效利用用戶的歷史信息，計(jì)算已交互項(xiàng)目與待預(yù)測(cè)項(xiàng)目之間的相似度，因此可基于待預(yù)測(cè)項(xiàng)目實(shí)現(xiàn)動(dòng)態(tài)的用戶表示。實(shí)驗(yàn)結(jié)果則證明了相較于KGCN，DKGAT 可有效利用用戶信息。

2.5 參數(shù)的敏感性

為了探究實(shí)驗(yàn)參數(shù)的結(jié)果的影響，在DKGAT 上分別進(jìn)行了如下三組實(shí)驗(yàn)。

（1）迭代層數(shù)的影響

知識(shí)圖譜以中心節(jié)點(diǎn)為基準(zhǔn)向外擴(kuò)展，因此可探索迭代層數(shù)對(duì)實(shí)驗(yàn)性能的影響。實(shí)驗(yàn)結(jié)果如圖4所示。

可觀察到，當(dāng)模型迭代3 層時(shí)可獲得最佳性能。實(shí)驗(yàn)結(jié)果表明，當(dāng)擴(kuò)展層數(shù)較小時(shí)性能較差，說明層數(shù)較少時(shí)利用的特征不夠，不能有效地挖掘長(zhǎng)距離的用戶興趣路徑。同時(shí)擴(kuò)展層數(shù)較高并不能提高性能，這是因?yàn)槟Ｐ蛥?shù)增加使得模型不容易泛化，并且隨著知識(shí)圖譜的擴(kuò)張，更多無關(guān)項(xiàng)目特征被考慮進(jìn)來，對(duì)興趣的挖掘有阻礙作用。

表4 不同迭代層數(shù)時(shí)DKGAT 的AUC 值

（2）鄰居節(jié)點(diǎn)采樣個(gè)數(shù)的影響

KGAT 通過鄰居節(jié)點(diǎn)的聚合實(shí)現(xiàn)了知識(shí)圖譜的向量表示，鄰居節(jié)點(diǎn)的采樣數(shù)則反映了同一迭代層中選取的特征量。因此，可改變?nèi)硬蓸拥泥従庸?jié)點(diǎn)數(shù)量H 的大小來探究其對(duì)實(shí)驗(yàn)結(jié)果的影響。

從表5 中可以看出，當(dāng)H=4 時(shí)性能最好。這是因?yàn)樘〉腍沒有容納足夠的鄰域信息，不能充分地體現(xiàn)項(xiàng)目特征。而太大的H 則會(huì)引入更多的無關(guān)特征。

表5 不同鄰居節(jié)點(diǎn)采樣個(gè)數(shù)時(shí)DKGAT 的AUC 值

（3）交互項(xiàng)目采樣個(gè)數(shù)的影響

在計(jì)算動(dòng)態(tài)用戶向量中需對(duì)用戶的交互歷史進(jìn)行采樣，這是因?yàn)橛脩艚换サ臍v史項(xiàng)目較多，全部利用則會(huì)造成計(jì)算量過大等問題。

從表6 中可以看出，當(dāng)K 較小時(shí)性能較差。用戶的交互項(xiàng)目是用戶喜好的外在反應(yīng)，若這部分信息利用不充分，則不能很好的挖掘用戶喜好，這也反映了從動(dòng)態(tài)視角看待用戶的必要性。實(shí)驗(yàn)結(jié)果同時(shí)表明，隨著K 的增加，性能會(huì)有所下降，這可能是因?yàn)榘l(fā)生了過擬合。

表6 不同交互項(xiàng)目采樣個(gè)數(shù)時(shí)DKGAT 的AUC 值

3 結(jié)語(yǔ)

本文提出了基于雙用戶視角與知識(shí)圖譜注意力網(wǎng)絡(luò)的推薦模型。為挖掘用戶特征，該模型從雙視角分析用戶行為。首先，用戶興趣為用戶本身特性的傳達(dá)，此為靜態(tài)用戶視角。其次，用戶交互的歷史項(xiàng)目是興趣的外在展現(xiàn)，此為動(dòng)態(tài)用戶視角。為挖掘項(xiàng)目特征，在知識(shí)圖譜中利用注意力機(jī)制捕獲低階與高階項(xiàng)目屬性，并自動(dòng)挖掘用戶興趣路徑，最終通過鄰域聚合的方法得到項(xiàng)目表示?？紤]到現(xiàn)實(shí)中存在很多與知識(shí)圖譜相似的結(jié)構(gòu)化信息，如社交網(wǎng)絡(luò)，因此在未來的工作中可嘗試將注意力網(wǎng)絡(luò)等應(yīng)用于其他的結(jié)構(gòu)化信息中。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡