知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)展

2023-02-28 09:19吳國棟王雪妮劉玉良

計算機(jī)工程與應(yīng)用 2023年4期

吳國棟，王雪妮，劉玉良

安徽農(nóng)業(yè)大學(xué) 信息與計算機(jī)學(xué)院，合肥 230036

隨著信息時代的到來，人們從網(wǎng)絡(luò)上獲取信息變得越來越便利。然而信息的爆炸式增長也帶來了信息過載[1]，用戶難以從海量信息中快速找到感興趣的內(nèi)容。推薦系統(tǒng)通過從用戶的歷史行為中挖掘偏好特征，并推薦可能感興趣的項目，以提升用戶消費體驗，使信息過載問題得到了有效緩解。傳統(tǒng)的推薦算法可分為協(xié)同過濾推薦[2]、基于內(nèi)容的推薦[3]和混合推薦[4]。相較于傳統(tǒng)的推薦技術(shù)，基于深度學(xué)習(xí)的推薦方法[5]主要是通過為用戶和項目學(xué)習(xí)其嵌入表示，并基于這種嵌入表示，來預(yù)測用戶與項目的交互概率。

作為深度學(xué)習(xí)技術(shù)在圖領(lǐng)域的擴(kuò)展，近年來圖神經(jīng)網(wǎng)絡(luò)（graph neural network，GNN）[6]被運用于推薦系統(tǒng)的研究中。GNN核心思想是通過傳播鄰居信息來學(xué)習(xí)目標(biāo)節(jié)點的嵌入表示，對處理圖結(jié)構(gòu)數(shù)據(jù)有著天然優(yōu)勢。然而，單一的用戶-項目交互信息已不足以發(fā)揮圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力，很多算法仍然面臨交互數(shù)據(jù)稀疏以及冷啟動等問題，這就需要除用戶歷史行為外的輔助信息，來幫助推薦模型緩解這些問題。

知識圖譜（knowledge graph，KG）[7]是一種反映多種關(guān)系的有向異質(zhì)圖結(jié)構(gòu)，其中節(jié)點對應(yīng)實體，邊對應(yīng)關(guān)系，以一種三元組[8]的形式表示。知識圖譜中蘊(yùn)含了豐富的屬性信息，通過不同類型的關(guān)系將這些信息與實體相聯(lián)系，將知識圖譜引入圖神經(jīng)網(wǎng)絡(luò)推薦研究，借助知識圖譜中物品間豐富的語義關(guān)聯(lián)，以便更好進(jìn)行物品的特征表示，在有效提升推薦準(zhǔn)確性的同時，還有助于推薦結(jié)果的可解釋性。

按照是否有用戶節(jié)點加入，可以將知識圖譜分為項目知識圖譜和協(xié)同知識圖譜[9]，與已有知識圖譜推薦[10]或圖神經(jīng)網(wǎng)絡(luò)推薦[11]等綜述不同，本文以知識圖譜的不同類型為視角，探討知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究。其中，基于項目知識圖譜增強(qiáng)的模型將用戶-項目交互圖與項目知識圖譜分離開，知識圖譜中的實體不直接參與用戶嵌入表示的學(xué)習(xí)；而協(xié)同知識圖譜則是將兩圖融合，用戶嵌入表示的學(xué)習(xí)也依賴于知識圖譜中的實體。本文是探討兩者融合的推薦模型及其相關(guān)研究，既考慮到圖神經(jīng)網(wǎng)絡(luò)在圖結(jié)構(gòu)數(shù)據(jù)處理上的優(yōu)勢，又豐富了知識圖譜的語義表示。這類模型輸入上可以利用的信息更豐富，在處理過程中對圖結(jié)構(gòu)數(shù)據(jù)信息的挖掘也更加全面細(xì)致，提供更精細(xì)的節(jié)點特征表示。

1 圖神經(jīng)網(wǎng)絡(luò)推薦與知識圖譜推薦

1.1 圖神經(jīng)網(wǎng)絡(luò)推薦

圖神經(jīng)網(wǎng)絡(luò)（GNN）作為一種處理圖結(jié)構(gòu)的深度學(xué)習(xí)模型，在推薦系統(tǒng)研究中有著一定的優(yōu)勢[12]?，F(xiàn)有GNN推薦的研究，大多基于圖卷積網(wǎng)絡(luò)（graph convolutional network，GCN）[13]范疇。文獻(xiàn)[14]利用圖卷積網(wǎng)絡(luò)作為編碼器，并結(jié)合雙線性解碼來構(gòu)建圖自編碼器，以進(jìn)行用戶-項目評分矩陣的補(bǔ)全。文獻(xiàn)[15]對圖卷積網(wǎng)絡(luò)進(jìn)行簡化，去除了特征變換和非線性變換，構(gòu)建一種輕量級的圖卷積方式來傳播用戶和項目的嵌入，并堆疊多層圖卷積網(wǎng)絡(luò)以捕獲高階鄰居的特征信息。文獻(xiàn)[16]提出了一種線性殘差網(wǎng)絡(luò)，在對圖卷積網(wǎng)絡(luò)去除非線性變換后，構(gòu)建殘差網(wǎng)絡(luò)結(jié)構(gòu)，以解決多層圖卷積容易導(dǎo)致的過平滑問題[17]。文獻(xiàn)[18]提出了一種考慮高階特征交互的圖卷積網(wǎng)絡(luò)模型，并將GCN 的排序信息提取為二值化協(xié)同過濾，提高了在線推薦效果。文獻(xiàn)[19]不但在用戶-項目交互圖上執(zhí)行圖卷積，還將引入注意力機(jī)制的GCN用在用戶-用戶社交圖上，豐富了用戶的嵌入表示，從而進(jìn)行更準(zhǔn)確的評分預(yù)測。文獻(xiàn)[20]著重解決堆疊多層GCN 帶來的過平滑問題，通過一個無監(jiān)督子圖生成模塊，將興趣相似的用戶及與其交互的項目，構(gòu)建成子圖，并在子圖內(nèi)部執(zhí)行高階圖卷積，以避免從高階鄰居傳播負(fù)面信息到節(jié)點，緩解過平滑問題。文獻(xiàn)[21]也采用了圖卷積網(wǎng)絡(luò)作為編碼器，通過重建掩碼輸入節(jié)點，生成新節(jié)點的嵌入，以緩解推薦過程中的冷啟動問題。

盡管圖神經(jīng)網(wǎng)絡(luò)對挖掘推薦系統(tǒng)中用戶偏好與項目特征具有一定優(yōu)勢，然而單一的用戶-項目歷史交互信息存在一定的局限性，且交互數(shù)據(jù)較稀疏時容易導(dǎo)致冷啟動等問題。

1.2 知識圖譜推薦

傳統(tǒng)的推薦方法大多只使用了用戶與項目的交互信息，容易面臨數(shù)據(jù)的稀疏性和冷啟動等問題。知識圖譜的引入可以為推薦系統(tǒng)提供項目間豐富的語義相關(guān)性，有助于挖掘它們之間的潛在聯(lián)系，且不同類型的關(guān)系有助于擴(kuò)展用戶興趣，增加推薦項目的多樣性，使用這些信息可以進(jìn)行更加合理的個性化推薦。知識圖譜通常用G={(h,r,t)|h,t∈E,r∈R}的形式表示，其中三元組(h,r,t)表示頭實體h與尾實體t由關(guān)系r連接，E 和R分別表示實體集合和關(guān)系集合，在此之上進(jìn)行知識圖譜表示學(xué)習(xí)[22]。

已有知識圖譜推薦研究，大多是為項目建立知識圖譜，如文獻(xiàn)[23]提出了一種協(xié)同知識庫嵌入（collaborative knowledge base embedding，CKE）模型，模型基于正則化的方法，利用嵌入和深度學(xué)習(xí)技術(shù)從項目知識圖譜中提取語義表示。文獻(xiàn)[24]提出了一種面向知識圖譜增強(qiáng)推薦的多任務(wù)特征學(xué)習(xí)方法（multi-task learning for KG enhanced recommendation，MKR），模型將知識圖譜嵌入任務(wù)和推薦任務(wù)通過交叉壓縮單元相關(guān)聯(lián)，使得推薦系統(tǒng)中的項目表示與知識圖譜中的實體表示可以相互補(bǔ)充。文獻(xiàn)[25]提出了一種基于異構(gòu)網(wǎng)絡(luò)嵌入的推薦方法（HIN embedding based recommendation，HERec），模型使用基于元路徑的隨機(jī)游走策略，從異質(zhì)信息網(wǎng)絡(luò)中采樣節(jié)點序列，用于網(wǎng)絡(luò)嵌入表示學(xué)習(xí)。學(xué)習(xí)節(jié)點嵌入時，首先通過一組融合函數(shù)進(jìn)行轉(zhuǎn)換，然后集成到擴(kuò)展矩陣分解（matrix factorization，MF）[26]模型中，對擴(kuò)展矩陣分解模型和融合函數(shù)進(jìn)行聯(lián)合優(yōu)化，以完成評分預(yù)測任務(wù)。文獻(xiàn)[27]提出了一個將知識圖譜融合到推薦系統(tǒng)中、端到端的框架（RippleNet）。該方法沿著知識圖譜中的關(guān)系，自動、迭代地擴(kuò)展用戶潛在興趣，以刺激用戶偏好在知識實體集合上的傳播。

知識圖譜的引入，為推薦模型提供了更多的信息來源，這些信息可以輔助學(xué)習(xí)用戶或項目的特征，以緩解數(shù)據(jù)稀疏、冷啟動等問題。作為一種圖結(jié)構(gòu)數(shù)據(jù)，圖神經(jīng)網(wǎng)絡(luò)也可學(xué)習(xí)知識圖譜的圖嵌入，圖神經(jīng)網(wǎng)絡(luò)以傳播鄰居信息來學(xué)習(xí)節(jié)點特征，使得知識圖譜的處理不再依賴手工特征工程，同時為挖掘知識圖譜的高階結(jié)構(gòu)信息和語義信息提供一種端到端的訓(xùn)練方式。因此，圖神經(jīng)網(wǎng)絡(luò)技術(shù)與知識圖譜相結(jié)合，可以有效提升推薦系統(tǒng)的性能。

本文將從基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦和基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦兩個角度，探討已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究，如圖1所示。

圖1 已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究Fig.1 Research on recommenders based on graph nerual network enhanced with knowledge graph

2 基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究

項目知識圖譜是指依據(jù)項目屬性構(gòu)建的知識圖譜，圖譜中包含項目實體、關(guān)系和屬性，不包括用戶實體?；陧椖恐R圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦模型將項目知識圖譜與用戶-項目交互圖相分離，且重點研究在其上運用圖神經(jīng)網(wǎng)絡(luò)傳播屬性信息，以學(xué)習(xí)項目的嵌入表示。已有基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究主要包括引入關(guān)系感知的推薦、引入標(biāo)簽優(yōu)化的推薦、引入知識圖譜上下文的推薦等幾個方面。

2.1 引入關(guān)系感知的推薦

知識圖譜通過關(guān)系將實體與實體聯(lián)系起來，不同的關(guān)系代表著不同的信息，可通過頭實體和關(guān)系推導(dǎo)出尾實體。用戶喜歡一個項目可能是因為該項目包含了某種重要的關(guān)系，所以對項目知識圖譜中關(guān)系的處理至關(guān)重要。文獻(xiàn)[28-30]著重關(guān)注實體與實體間關(guān)系信息的處理，通過充分運用關(guān)系信息，來發(fā)揮知識圖譜在推薦系統(tǒng)中的作用。

為了緩解協(xié)同過濾推薦中數(shù)據(jù)稀疏性和冷啟動等問題，利用用戶和項目屬性構(gòu)建知識圖。根據(jù)知識圖中連接關(guān)系所包含的豐富語義信息，增加推薦多樣性和精確度。Wang 等人在文獻(xiàn)[28]提出了一種知識圖譜卷積網(wǎng)絡(luò)（knowledge graph convolutional networks，KGCN）以挖掘項目間的關(guān)聯(lián)屬性，捕獲項目與項目之間的關(guān)系，進(jìn)而得到KG 的高階結(jié)構(gòu)信息和語義信息。KGCN模型首先為用戶、項目和關(guān)系初始化嵌入表示，針對目標(biāo)用戶為其歷史交互過的項目實體抽取固定大小的鄰域，并在其上執(zhí)行圖卷積操作，將鄰域?qū)嶓w信息傳播到當(dāng)前實體。傳播過程中，鄰居實體根據(jù)連接關(guān)系對目標(biāo)用戶的影響因子進(jìn)行加權(quán)，見式（1）：

式中，N(v)表示實體v的鄰居實體集合，rv,e表示實體v與e的關(guān)系，表示歸一化后的關(guān)系rv,e對目標(biāo)用戶u的影響因子。計算方式見式（2）、式（3）：

之后，得到用戶的初始嵌入表示和項目傳播更新后的嵌入表示，預(yù)測用戶u是否對他之前未交互的項目v有潛在的興趣。模型在MovieLens-20M、Book-Crossing和Last.FM三個包含知識圖譜的數(shù)據(jù)集上，將GNN應(yīng)用在知識圖譜嵌入學(xué)習(xí)上進(jìn)行推薦，取得了很好的效果。

KGCN是較早將項目知識圖譜與圖神經(jīng)網(wǎng)絡(luò)結(jié)合，并用于推薦任務(wù)中的模型。該模型重點在于對知識圖譜中實體間關(guān)系的編碼，考慮關(guān)系對用戶的影響，在圖卷積網(wǎng)絡(luò)的處理時，細(xì)化項目的特征表示，捕獲了知識圖中的高階結(jié)構(gòu)和語義信息。KGCN 也從異質(zhì)知識圖譜方面提供了一個新的視角，幫助提升推薦效果。KGCN的提出，對研究關(guān)系感知的知識圖譜增強(qiáng)圖神經(jīng)網(wǎng)絡(luò)推薦起著重要推動作用，后續(xù)相關(guān)研究大多都采用了這種考慮實體間關(guān)系的圖卷積網(wǎng)絡(luò)思想。在考慮關(guān)系感知的同時，還可以加入其他類型的影響因子，實體表示中根據(jù)用戶偏好，影響鄰居節(jié)點聚合的權(quán)重，可在聚合時得到更精準(zhǔn)的表示，以優(yōu)化圖的表示學(xué)習(xí)，提高推薦的準(zhǔn)確率。

利用知識圖譜進(jìn)行推薦的方法之一是知識圖譜嵌入，一些常用的嵌入方法都側(cè)重于對語義關(guān)聯(lián)進(jìn)行建模。在圖嵌入中，當(dāng)有新節(jié)點加入時，需要重新學(xué)習(xí)整個圖的表示，往往缺乏一定的歸納能力。因此，劉歡等人在文獻(xiàn)[29]提出了一種基于知識圖譜驅(qū)動的端到端圖神經(jīng)網(wǎng)絡(luò)模型（knowledge graph driven learning network，KGLN），其核心思想是通過知識圖譜中實體間的鄰近關(guān)系，來驅(qū)動模型進(jìn)行用戶和項目直接的表示學(xué)習(xí)。當(dāng)新節(jié)點加入時，可以共享參數(shù)，直接獲得節(jié)點的特征表示。相較于KGCN，該模型不僅考慮了關(guān)系對于目標(biāo)用戶的影響因子，也考慮了不同實體節(jié)點對當(dāng)前項目的影響因子，來衡量用戶對物品的偏好。在模型中找到與實體相關(guān)的鄰居實體，對實體的鄰居節(jié)點進(jìn)行特征聚合，并加入影響因子形成聚合的結(jié)果。KGLN引用了評分函數(shù)g計算影響因子，計算方式見式（4）：

其中，e為當(dāng)前實體v的鄰居節(jié)點特征，表示所有鄰居實體e對當(dāng)前實體v的影響程度。得到影響因子后進(jìn)行歸一化處理，再通過均勻隨機(jī)采樣鄰居節(jié)點，計算出每個節(jié)點的影響因子，然后對項目v的鄰居節(jié)點進(jìn)行建模，計算方式如式（5）：

其中，rv,e表示實體v與e的關(guān)系，表示歸一化后的關(guān)系rv,e對目標(biāo)用戶u的影響因子。之后，聚合來自鄰居的信息來更新自身，并通過堆疊多層KGLN 的方式，使項目節(jié)點獲得來自其多階鄰居實體的信息。最后，結(jié)合項目嵌入表示與用戶嵌入表示進(jìn)行用戶對項目的偏好預(yù)測。模型基于MovieLens-1M（https：//grouplens.org/datasets/movielens!）和Book-Crossing（http：//www2.informatik.uni-freiburg.de/～cziegler/BX）數(shù)據(jù)集進(jìn)行了實驗，對比其他基準(zhǔn)方法，又考慮到不同聚合器以及不同感受野深度，KGLN模型取得了不錯的效果。

KGLN模型通過引入關(guān)系感知的同時，還考慮了不同鄰居實體對當(dāng)前項目的影響因子，根據(jù)鄰居節(jié)點特征的權(quán)重來聚合，相較于KGCN可以更加細(xì)致地學(xué)習(xí)項目節(jié)點特征，提高了推薦結(jié)果的精確度。KGLN考慮的知識圖譜是靜態(tài)的，然而用戶的個人偏好會隨著時間的改變而改變的。

上述知識圖譜增強(qiáng)的推薦研究中，大多是構(gòu)建項目知識圖譜，對用戶節(jié)點嵌入的學(xué)習(xí)較為簡單。豐富用戶信息的一個方式就是通過引入用戶的社交信息。用戶社交好友的偏好，在一定程度上也能反映當(dāng)前用戶的偏好，這對學(xué)習(xí)用戶節(jié)點的特征很有幫助，通過社交網(wǎng)絡(luò)中的聯(lián)系，還有助于緩解用戶冷啟動問題。Tien等人在文獻(xiàn)[30]提出了一種融入社交關(guān)系來學(xué)習(xí)用戶嵌入的模型。模型首先從用戶空間和知識圖譜空間中學(xué)習(xí)項目嵌入表示，之后利用一個多層感知機(jī)，融合用戶空間和知識圖譜空間中捕獲的信息，并利用一個NeuMF（neural matrix factorization）[31]網(wǎng)絡(luò)層進(jìn)行評分預(yù)測。模型采用RMSprop優(yōu)化算法，在Ciao、MovieLens-1M和Last.FM數(shù)據(jù)集上取得了良好的效果。

2.2 引入標(biāo)簽優(yōu)化的推薦

在推薦相關(guān)的數(shù)據(jù)集中，往往只有用戶交互項目的記錄，稱之為正樣本，而推薦算法的訓(xùn)練還需要負(fù)樣本的參與。常用解決方法是在用戶沒有交互過的項目集中進(jìn)行采樣作為負(fù)樣本數(shù)據(jù)，然而這種方式過于簡單，沒有交互過的項目不代表用戶不喜歡，因此存在一定的不合理性。如果用戶用標(biāo)簽來描述對項目的看法，標(biāo)簽可看作是用戶和項目之間聯(lián)系的紐帶，也是反映用戶興趣的重要數(shù)據(jù)來源。文獻(xiàn)[32-34]重點對樣本的標(biāo)簽進(jìn)行優(yōu)化，采用相關(guān)算法預(yù)測樣本標(biāo)簽來使標(biāo)簽類別達(dá)到平衡，以提升推薦效果。

為了提供更好的歸納偏置，Wang 等人在文獻(xiàn)[32]提出了KGCN-LS（knowledge-aware graph neural networks with label smoothness regularization）模型。通過應(yīng)用一個可訓(xùn)練的模型KGCN，來計算針對目標(biāo)用戶的項目嵌入，以識別知識圖譜中關(guān)系對于給定目標(biāo)用戶的重要性，并將知識圖譜轉(zhuǎn)換為針對目標(biāo)用戶的加權(quán)圖，然后利用圖神經(jīng)網(wǎng)絡(luò)計算個性化的項目嵌入。除此之外，KGCN-LS重點引入標(biāo)簽平滑性假設(shè)，假定知識圖譜中的相鄰項目可能具有相似的用戶相關(guān)性標(biāo)簽，通過引入標(biāo)簽平滑來提供邊權(quán)值的正則化項。KGCN-LS使用標(biāo)簽傳播算法，預(yù)測項目節(jié)點的標(biāo)簽值，并將標(biāo)簽預(yù)測損失也作為模型的優(yōu)化任務(wù)。標(biāo)簽預(yù)測損失定義見式（6）：

其中，J 是交叉熵?fù)p失函數(shù)，yuv是真實相關(guān)標(biāo)簽，是預(yù)測標(biāo)簽。之后在反向傳播的過程中將該損失也加入優(yōu)化任務(wù)，從而起到正則項的作用。模型基于MovieLens-20M、Book-Crossing、Last.FM（https：//grouplens.org/datasets/hetrec-2011/）和Dianping-Food 數(shù)據(jù)集進(jìn)行實驗，驗證了KGCN-LS 引入標(biāo)簽平滑正則項的有效性，以及在召回率指標(biāo)上的效果提升。此外還通過調(diào)整MovieLens-20M 的訓(xùn)練集大小，驗證了KGCN-LS 對緩解數(shù)據(jù)稀疏性和冷啟動問題也有一定的效果。

相較于KGCN模型，KGCN-LS將GNN結(jié)構(gòu)擴(kuò)展到知識圖，同時捕獲項目之間的語義關(guān)系以及個性化的用戶偏好和興趣。此外該模型在KGCN 基礎(chǔ)上加入標(biāo)簽平滑度正則項，通過聚合和優(yōu)化使沒有被發(fā)現(xiàn)的相關(guān)項目具有更多被推薦的概率。

Zhao等人在文獻(xiàn)[33]提出了一種改進(jìn)的、帶標(biāo)簽平滑正則化的知識感知圖神經(jīng)網(wǎng)絡(luò)iKGNN-LS 模型。該模型對KGNN-LS 進(jìn)行了兩個改進(jìn)：一是引入實體對目標(biāo)用戶的影響因子計算函數(shù)，根據(jù)用戶對關(guān)系和實體的個性化偏好共同確定邊的權(quán)重。二是使用最大池化代替求和池化，來進(jìn)行鄰域的聚合。通過在三個真實數(shù)據(jù)集上的Top-N推薦實驗，證明了這兩項改進(jìn)的有效性。

如果直接將用戶未產(chǎn)生交互的項目作為負(fù)樣本，會存在一定的偏差。因此，Togashi 等人提出了一種通過在知識圖譜中使用偽標(biāo)簽的方式，來緩解冷啟動問題的KGPL（KG-aware recommender based on GNNs and pseudo-labelling）[34]模型。KGPL 模型通過半監(jiān)督學(xué)習(xí)預(yù)測未觀測到的樣本標(biāo)簽，以緩解數(shù)據(jù)稀疏性問題。該模型中，作者利用廣度優(yōu)先搜索算法，計算與目標(biāo)用戶有交互的項目到與目標(biāo)用戶無交互項目的路徑個數(shù)。由于冷啟動項目相較于流行項目，更容易被采樣作為負(fù)樣本，此時的偽標(biāo)簽采樣會影響模型的效果。因此對負(fù)樣本的采樣則是基于項目流行度的采樣。此外，該文獻(xiàn)中還引入了co-training 方法[35]，以提升KGPL 優(yōu)化過程的健壯性。

KGPL 通過引入偽標(biāo)簽和改進(jìn)的負(fù)采樣來解決樣本標(biāo)簽不均衡問題，緩解了冷啟動和數(shù)據(jù)稀疏問題。但是，引入標(biāo)簽平滑正則化，為模型帶來了額外的計算成本。

2.3 引入知識圖譜上下文的推薦

在圖結(jié)構(gòu)數(shù)據(jù)中，節(jié)點的鄰居有階數(shù)之分，其中一階鄰居最接近當(dāng)前節(jié)點，所包含的信息也最重要，而高階鄰居雖遠(yuǎn)離當(dāng)前節(jié)點，但包含的信息也不可忽略。圖神經(jīng)網(wǎng)絡(luò)在捕獲高階信息的過程中，往往只是簡單地進(jìn)行信息聚合，容易導(dǎo)致過平滑問題，而在知識圖譜中同樣需要考慮這個問題，文獻(xiàn)[36-37]通過引入知識圖譜上下文的學(xué)習(xí)模塊，來處理高階鄰居信息，在充分利用鄰居信息的同時，避免使用圖卷積網(wǎng)絡(luò)帶來的過平滑問題。

Yang 等人在文獻(xiàn)[36]提出了引入知識圖譜上下文（contextualized graph attention network，CGAT）模型。該模型主要包含局部圖上下文、非局部圖上下文和交互圖上下文三個模塊。根據(jù)用戶特定的圖注意力機(jī)制，獲取實體的局部上下文信息，考慮用戶對實體的個性化偏好，采用隨機(jī)游走的方法提取實體的非局部上下文。E為實體集合，R為關(guān)系集合，D為實體-關(guān)系-實體三元組(h,r,t)，h表示三元組的頭部實體，r表示關(guān)系實體，t表示尾部實體。在學(xué)習(xí)項目的局部圖上下文表示過程中，傳遞來自于項目實體直接相連的非項目實體信息，并引入注意力機(jī)制來區(qū)分這些非項目實體的重要性，計算方式見式（7）、式（8）所示：

在非局部圖上下文表示的學(xué)習(xí)過程中，CGAT采用基于門控循環(huán)單元（gated recurrent unit，GRU）[38]模塊的有偏隨機(jī)游走方法，用于聚合實體的非局部上下文信息。首先在項目知識圖譜上以一定的概率進(jìn)行隨機(jī)游走采樣，得到高階鄰居節(jié)點，再進(jìn)行Top-K排序獲得游走過程中概率最大的幾個節(jié)點。然后利用一個GRU單元對排序后的鄰居序列進(jìn)行處理，得到非局部圖上下文表示，計算方式見式（9）、式（10）所示：

式中，ω是一個可學(xué)習(xí)參數(shù)，σ(*)是sigmoid函數(shù)，⊙是點積。在得到項目的知識圖譜上下文嵌入表示后，模型通過在交互圖傳播項目節(jié)點信息，來學(xué)習(xí)用戶的嵌入表示，并在該部分中引入特定的圖形注意力機(jī)制，以區(qū)分不同歷史交互項目對用戶的重要性，捕獲用戶對實體的個性化偏好。CGAT 通過對知識圖譜中的高階鄰居進(jìn)行隨機(jī)游走采樣，更全面地捕獲了知識圖譜中所含的信息，一定程度上避免了采用圖卷積帶來的過平滑問題，取得了較好的推薦效果。

在MovieLens-1M、Book-Crossing、Last.FM 數(shù)據(jù)集上和其他模型的實驗進(jìn)行了比較，結(jié)果表明CGAT在不同數(shù)據(jù)集上都取得了較好的性能。如在HR@20 方面，CGAT優(yōu)于CFKG、RippleNet、MKP、KGNN-LS和KGAT，分別為26.07%、21.32%、22.29%、21.92%和9.56%。這也說明CGAT在知識圖譜上下文進(jìn)行推薦的效果顯著。

孫偉等人提出一種基于知識圖譜上下文矩陣補(bǔ)全的圖注意力編碼器框架[37]。該框架中，為區(qū)分不同鄰居的重要性，通過一個圖注意力編碼器來學(xué)習(xí)用戶和項目的嵌入表示。之后，在項目知識圖譜上對知識圖譜上下文進(jìn)行建模（同CGAT），并與項目的嵌入表示相融合，得到項目的最終嵌入表示。最后對用戶嵌入表示和項目的最終嵌入表示，利用雙線性解碼器來預(yù)測用戶對項目的交互。此模型在三個數(shù)據(jù)集上與其他基準(zhǔn)進(jìn)行實驗，驗證了該模型的可行性和優(yōu)越性。但模型還可以進(jìn)一步考慮采用不同的聚合方法，聚合用戶相關(guān)歷史項目和目標(biāo)項目之間不同的偏好，結(jié)合上下文信息，并加入注意力機(jī)制，以提高推薦的精確度。

在上述對已有項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究分析基礎(chǔ)上，表1 從主要文獻(xiàn)與內(nèi)容、方法及優(yōu)點等方面，對基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了小結(jié)。

表1 基于項目知識圖譜的推薦研究小結(jié)Table 1 Summary of recommendation research based on project knowledge graph

3 基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究

協(xié)同知識圖譜（collaborative knowledge graph，CKG）[10]是指將用戶-項目交互圖與項目知識圖譜相融合。在這一類模型中，實體不僅包含項目實體，還包含了用戶實體。因此，不僅需要考慮項目嵌入表示的學(xué)習(xí)，也需要關(guān)注對用戶嵌入表示的學(xué)習(xí)。已有基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究主要包括引入注意力機(jī)制的推薦、引入路徑信息的推薦以及引入其他方法（如多視圖網(wǎng)絡(luò)、自適應(yīng)目標(biāo)-行為關(guān)系圖網(wǎng)絡(luò)等）的推薦等幾個方面。

3.1 引入注意力機(jī)制的推薦

在圖結(jié)構(gòu)數(shù)據(jù)中，不同鄰居節(jié)點相對于當(dāng)前節(jié)點的相關(guān)性是不同的，而在圖卷積網(wǎng)絡(luò)的聚合過程中，簡單聚合來自鄰居節(jié)點的信息并不能對不同鄰居節(jié)點加以區(qū)分。將注意力機(jī)制引入到基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦中，可以學(xué)習(xí)不同鄰居節(jié)點的重要性，從而重點聚合來自相關(guān)性更高的鄰居節(jié)點信息。文獻(xiàn)[39-42]使用圖注意力網(wǎng)絡(luò)進(jìn)行聚合更新，以在協(xié)同知識圖譜上區(qū)分各節(jié)點之間的重要程度。

Wang 等人在文獻(xiàn)[39]提出了一種知識圖譜注意力網(wǎng)絡(luò)（knowledge graph attention network，KGAT）。該模型以端到端方式建模了知識圖譜中的高階鄰居，發(fā)掘高階信息，增強(qiáng)用戶與項目的交互來預(yù)測用戶偏好的問題，遞歸地從鄰居節(jié)點更新當(dāng)前節(jié)點的表示，并在信息傳播過程中引入注意力機(jī)制來區(qū)分不同鄰居的權(quán)重。注意力嵌入傳播層由信息傳播、知識感知注意力、信息聚合三部分組成。其中，實體鄰居et對頭實體eh的注意力得分計算見式（12）：

其中，α(h,r,t)為注意力得分，再進(jìn)行歸一化處理。對實體eh的高階鄰域信息定義為式（13）：

對頭實體et進(jìn)行信息聚合更新后，再對多層圖注意力網(wǎng)絡(luò)得到的用戶和項目實體嵌入表示進(jìn)行拼接，作為用戶和項目的最終嵌入表示。此外，KGAT還將各個實體和關(guān)系的嵌入表示進(jìn)行了規(guī)范化，如式（14）：

并將損失加入反向傳播的優(yōu)化任務(wù)中。模型基于Amazonbook、Last.FM 和Yelp2018 三個數(shù)據(jù)集與其他幾個主流模型進(jìn)行了對比實驗，結(jié)果表明KGAT 在Recall 和NDCG指標(biāo)上均優(yōu)于其他模型。模型的整體結(jié)構(gòu)如圖2所示。

圖2 KGAT整體框架圖Fig.2 KGAT overall frame diagram

榮沛等人在文獻(xiàn)[40]提出了基于知識圖譜和圖注意力網(wǎng)絡(luò)的推薦算法（knowledge graph and graph attention network，KG-GAT）。該模型在預(yù)處理層中將用戶、實體和關(guān)系嵌入到統(tǒng)一的低維向量空間中。然后在注意力嵌入層中，利用實體注意力機(jī)制學(xué)習(xí)不同近鄰實體的權(quán)重，并利用語義注意力機(jī)制區(qū)分不同路徑的重要性，避免不相關(guān)實體的信息。最后在預(yù)測層中預(yù)測用戶-項目的交互概率。該模型的優(yōu)點在于考慮運用了知識圖譜中的關(guān)系，探索用戶潛在偏好時存在的不相關(guān)實體問題，提高了推薦的準(zhǔn)確性和可解釋性。

基于GCN 的推薦大多數(shù)關(guān)注同構(gòu)圖或用戶-物品二部圖，未能充分利用異構(gòu)圖中實體間復(fù)雜而豐富的語義。Yang 等人在文獻(xiàn)[41]提出了一種采用層次圖注意力網(wǎng)絡(luò)結(jié)合知識圖譜的可解釋推薦模型（hierarchical attention graph convolutional network incorporating knowledge graph for explainable recommendation，HAGERec）。該模型從高階連接結(jié)構(gòu)中挖掘用戶的潛在偏好信息，設(shè)計了一種雙向?qū)嶓w傳播策略和分層注意力機(jī)制。首先，HAGERec 在消息傳遞過程中采用GCN 建模實體的局部結(jié)構(gòu)，合并實體的鄰居信息。為了充分挖掘多跳連接提高RS，設(shè)計一個扁平化操作，進(jìn)一步使關(guān)系下的連接有序，更好地區(qū)分不同的連接。之后在實體傳播過程，通過雙向?qū)嶓w傳播策略獲得用戶和項目的聚合表示。由于每個實體都有不同關(guān)系的鄰居，為區(qū)分實體與鄰居之間的不同關(guān)系，提出一種層次注意力機(jī)制，自適應(yīng)地挖掘和調(diào)整每個用戶-項目對之間的協(xié)作信號，并將其分為鄰居級注意力和預(yù)測級注意力。再將每個鄰居實體的注意力評分作為與中心實體之間的相似度，并對相似度低的鄰居實體進(jìn)行篩選。同時，對大小固定的相關(guān)鄰居實體進(jìn)行采樣，從而節(jié)省計算和存儲開銷。

相比較以往的知識圖譜推薦方法，HAGERec 利用了KG和GCN的優(yōu)勢緩解了稀疏性的問題，利用分層機(jī)制來采樣鄰居實體，通過高階連通性實現(xiàn)了模型的可解釋性。在4個公共數(shù)據(jù)集進(jìn)行實驗，驗證了該模型的可行性和可解釋性。

Qu 等人在文獻(xiàn)[42]提出了一種知識增強(qiáng)的鄰域交互模型（knowledge-enhanced neighborhood interaction，KNI）。該模型將用戶-項目的交互擴(kuò)展到它們的鄰居，并引入知識圖譜來增加局部聯(lián)通性，提出一個統(tǒng)一的鄰域交互（NI）模型。具體來說，模型使用一個雙注意力網(wǎng)絡(luò)直接對局部結(jié)構(gòu)進(jìn)行預(yù)測，而不是將它們壓縮到用戶-項目嵌入表示中，并利用圖神經(jīng)網(wǎng)絡(luò)整合高階鄰域信息。最后，利用用戶的鄰域信息和項目的鄰域信息進(jìn)行預(yù)測。

該模型在4 個真實數(shù)據(jù)集上進(jìn)行了評估，并與8 個基于特征、基于元路徑和基于圖的模型進(jìn)行了對比實驗。結(jié)果表明，KNI模型在預(yù)測點擊率方面的AUC值，比其他幾個主流模型提高1.1%～8.4%，在Top-N推薦方面也遠(yuǎn)超其他幾個模型。

在推薦系統(tǒng)中加入注意力機(jī)制，可以有效地獲取用戶重點偏好，優(yōu)化推薦模型。現(xiàn)階段研究中融入注意力機(jī)制可以區(qū)分實體和其鄰居實體的不同關(guān)系權(quán)重，更能突出用戶的個性化偏好。注意力得分的引入反映了人類天生的注意力機(jī)制特點，使得推薦系統(tǒng)更加接近用戶真實的思考過程。之后可以深入研究針對不同問題的更為高效的注意力機(jī)制，使用戶-項目之間的關(guān)系權(quán)重更加細(xì)粒度化，以進(jìn)一步提升推薦效果。

3.2 引入路徑信息的推薦

現(xiàn)有處理知識圖譜的方法大多是提取用戶-項目鏈接對，或者在整個知識圖譜上傳播節(jié)點的特征，并沒有考慮不同的路徑信息。文獻(xiàn)[43-44]考慮不同路徑對節(jié)點特征學(xué)習(xí)的影響，以充分挖掘圖結(jié)構(gòu)信息，提升推薦效果。

Wang等人在文獻(xiàn)[43]提出了KGIN（knowledge graphbased intent network）模型。該模型利用輔助的項目知識來探討用戶-項目交互背后的意圖。首先，模型根據(jù)不同的路徑為用戶意圖建模，如式（15）所示：

式中，α(r,p)是關(guān)系r的注意力得分，wrp是可訓(xùn)練的權(quán)重參數(shù)，每個關(guān)系r的嵌入都分配一個注意力得分以量化意圖p中每個路徑的重要性。對用戶意圖建模后，模型引入了獨立性約束，以表達(dá)意圖之間的顯著差異，進(jìn)而獲得更好的可解釋性。再對路徑關(guān)系信息進(jìn)行聚合，得到用戶嵌入表示如式（16）所示：

其中，β(u,p)是意圖p的注意力得分。對于給定的用戶，不同的意圖具有不同的動機(jī)激發(fā)用戶的行為，故引入注意力得分來區(qū)分意圖p的重要性。對項目的嵌入更新可表示如式（17）所示：

在l層之后，獲得用戶和項目不同層的表示，將路徑的意圖感知關(guān)系和知識圖譜關(guān)系匯總為最終表示，再預(yù)測用戶與該項目交互的可能性。文獻(xiàn)在三個基準(zhǔn)數(shù)據(jù)集上的實驗結(jié)果表明，KGIN 取得了顯著的效果。進(jìn)一步的分析表明，KGIN通過識別意圖和關(guān)系路徑，在意圖的粒度上揭示用戶項目關(guān)系，關(guān)系路徑感知聚合中集成了來自多跳路徑的關(guān)系信息以細(xì)化表示，為推薦結(jié)果提供了有效性和可解釋性。

大多數(shù)的KG 用于推薦系統(tǒng)中的主要思路集中于兩種方法：一是集中于用戶和項目之間的線性路徑聯(lián)系，但不能夠有效地挖掘整個KG的語義信息和拓?fù)浣Y(jié)構(gòu)信息。二是通過傳遞用戶的偏好，再得到用戶的嵌入表示，傳播的過程反而容易引入噪音。因此，Sha 等人在文獻(xiàn)[44]提出了AKGE（attentive knowledge graph embedding）模型。該模型特點在于同時關(guān)注知識圖譜對應(yīng)的語義信息和拓?fù)湫畔ⅰＴO(shè)計了一種距離感知路徑采樣策略，對于給定的兩個實體，僅保留最后的K條最短路徑，并進(jìn)行路徑裝配構(gòu)建子圖。隨后，在構(gòu)建的子圖上，將圖中各個實體的嵌入和其對應(yīng)的類型嵌入進(jìn)行拼接，利用關(guān)系感知傳播計算鄰居實體的臨時隱藏狀態(tài)，再通過注意力機(jī)制將上一步得到的鄰居實體進(jìn)行加權(quán)聚合，運用門控機(jī)制更新實體信息。最后，通過一個多層感知機(jī)（multi-layer perceptron，MLP）預(yù)測用戶是否會對項目進(jìn)行交互。模型的優(yōu)點是在構(gòu)造的特定子圖上進(jìn)行傳播，能更有效地構(gòu)建子圖，以及提取有效的、高質(zhì)量的交互信息，緩解了基于整個知識圖譜的傳播而容易引起的噪聲問題。最后通過MovieLens-1M、Last.FM、Yelp三個真實數(shù)據(jù)集上的實驗，評估了AKGE模型的性能，表明AKGE明顯優(yōu)于其他主流模型。

引入路徑信息的推薦，充分運用了知識圖譜中的結(jié)構(gòu)信息，以及用戶和項目之間的多種關(guān)系，增加推薦的可行性。

3.3 引入其他方法的推薦

Tai 等人在文獻(xiàn)[45]提出了一種多視圖網(wǎng)絡(luò)（multiview item network，MVIN）。該模型包含用戶-實體和實體-實體交互模塊。為了豐富用戶-實體交互，模型首先學(xué)習(xí)基于知識圖譜增強(qiáng)的用戶表示，用戶-實體交互模塊對每個實體的關(guān)系和信息的重要性進(jìn)行了描述。為了細(xì)化實體-實體交互，提出了一個混合層來進(jìn)一步改進(jìn)圖卷積網(wǎng)絡(luò)聚合實體嵌入的方式，并允許MVIN從各種層級鄰域特征中捕獲聚合更新后信息。此外，為了保持計算效率和使用整個鄰域的信息，還采用了分階段訓(xùn)練策略[46]和采樣策略[30，47]，以更好地利用知識圖譜中的信息。最后評估了MVIN模型在MovieLens-1M、LFM-1b、Amazon-book三個真實數(shù)據(jù)集上的性能，結(jié)果表明，對于點擊率（click through rate，CTR）預(yù)測和Top-N推薦，MVIN的性能明顯優(yōu)于其他主流模型。

現(xiàn)有與知識圖譜結(jié)合的推薦方法中考慮項目之間的連接性的同時，不能捕獲用戶項目之間顯式的長期語義。因此，Lyu 等人在文獻(xiàn)[48]提出了一種既捕獲用戶和項目之間的顯式長范圍語義信息，又考慮項目之間各種連接性的推薦模型（rule learning and graph neural networks for recommendation，RGRec）。該模型結(jié)合了規(guī)則學(xué)習(xí)和圖神經(jīng)網(wǎng)絡(luò)進(jìn)行推薦，首先將項目映射到知識圖譜中的相應(yīng)實體，并將用戶添加為新實體。然后，自動學(xué)習(xí)規(guī)則，捕獲長范圍語義信息，并通過聚合捕獲實體之間的連通性，更好地編碼各種信息。RGRec提出了利用知識圖譜嵌入進(jìn)行規(guī)則過濾的策略，這是一種更精確的方法計算規(guī)則的置信度，還可以運用規(guī)則學(xué)習(xí)對規(guī)則權(quán)重進(jìn)行預(yù)訓(xùn)練。最后在三個真實的數(shù)據(jù)集上進(jìn)行實驗，RGRec 模型較于KGCN、KGAT、RKGE 模型分別獲得2.8%～11.9%（Last.FM），1.9%～20.1%（MovieLens-1M），3.7%～13.8%（Dianping-Food）的性能提升，驗證了RGRec 的有效性，與只使用其中某一種方法相比，規(guī)則學(xué)習(xí)和GNN的結(jié)合，使推薦性能取得了實質(zhì)性的改進(jìn)。

為充分提取知識圖譜中隱含的結(jié)構(gòu)信息，并考慮目標(biāo)用戶和項目在嵌入傳播過程中的相互影響，F(xiàn)eng等人在文獻(xiàn)[49]提出了一種自適應(yīng)目標(biāo)-行為關(guān)系圖網(wǎng)絡(luò)模型（adaptive target-behavior relational graph network，ATBRG）。該模型為了自適應(yīng)地提取知識圖譜中目標(biāo)用戶-項目對的有效關(guān)系子圖，提出了圖連接和圖剪枝技術(shù)。首先，分別對目標(biāo)項目和用戶歷史交互項目在知識圖譜上的多階鄰居進(jìn)行探索。在這些實體集中，對出現(xiàn)在多個實體集中的實體進(jìn)行連接，對只屬于一個實體集的實體進(jìn)行修剪。然后，構(gòu)建自適應(yīng)的目標(biāo)-行為關(guān)系圖，用來描述用戶行為和目標(biāo)項目之間的結(jié)構(gòu)關(guān)系。模型考慮了知識圖譜的結(jié)構(gòu)關(guān)系，設(shè)計了基于注意力機(jī)制的關(guān)系感知提取層，對每個用戶行為和目標(biāo)項目的關(guān)系圖進(jìn)行結(jié)構(gòu)化知識聚合。在兩個真實世界的數(shù)據(jù)集上進(jìn)行了實驗，證明了ATBRG有效性。

在知識圖譜中，項目的眾多屬性導(dǎo)致具有大量的鄰居實體，若聚合鄰域中的所有實體節(jié)點的信息則不僅帶來信息的過平滑問題，也會使計算成本增加。一種普遍的解決方式是對鄰域中的鄰居進(jìn)行隨機(jī)采樣，只聚合一部分鄰居節(jié)點信息。然而這種隨機(jī)無差別的采樣方式，并不能很好地區(qū)分不同鄰居節(jié)點的重要性，可能會丟失關(guān)鍵鄰居的信息。針對這一問題，梁順攀等人在文獻(xiàn)[50]提出了一種基于關(guān)系緊密度的重要性采樣方法。該方法通過計算目標(biāo)節(jié)點與鄰居節(jié)點的關(guān)系緊密度，來采樣更重要的鄰居，以避免無差別采樣的隨機(jī)性，同時引入池化層訓(xùn)練，得到不同鄰居節(jié)點對目標(biāo)節(jié)點的差異化權(quán)值。該文獻(xiàn)提出的推薦算法在五個真實數(shù)據(jù)集上進(jìn)行評估，對比其他基于知識圖的推薦算法，在AUC和召回率指標(biāo)均有提升。

在對已有協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究進(jìn)行分析的基礎(chǔ)上，表2 從主要文獻(xiàn)與內(nèi)容、方法及優(yōu)點等方面對基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了小結(jié)。

表2 基于協(xié)同知識圖譜推薦研究小結(jié)Table 2 Summary of recommendation based on collaborative knowledge graph

從表2可以看出，基于項目知識圖譜增強(qiáng)分為引入關(guān)系感知、引入標(biāo)簽優(yōu)化和引入知識圖譜上下文的推薦，可以有效緩解數(shù)據(jù)稀疏性和冷啟動問題，利用鄰居信息獲得更加細(xì)致的特征表示，但同時存在模型單一、算法復(fù)雜性高等問題?；趨f(xié)同過濾知識圖譜增強(qiáng)分為引入注意力機(jī)制、引入路徑信息和引入其他方法的推薦，其優(yōu)點在于區(qū)分不同鄰居節(jié)點的重要性，充分挖掘圖結(jié)構(gòu)信息，提升模型性能，但算法的復(fù)雜度高，難以為用戶推薦多樣的興趣項目。

4 知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究存在的主要問題

4.1 大規(guī)模動態(tài)知識圖譜處理問題

現(xiàn)實生活中，知識圖譜會隨著時間的推移不斷變化，圖譜中新的關(guān)系不斷出現(xiàn)，舊的關(guān)系不斷失效。文獻(xiàn)[51]通過設(shè)計不同時間步長的動態(tài)圖，來學(xué)習(xí)節(jié)點的嵌入表示，但其考慮的僅是小規(guī)模知識圖譜。隨著時間及求解問題復(fù)雜性的增加，知識圖譜規(guī)模也會變得很大，現(xiàn)有研究很少考慮到這種大規(guī)模、動態(tài)知識圖譜情形。盡管對大規(guī)模知識圖譜可使用各種采樣策略，但這可能導(dǎo)致模型的適應(yīng)性較差，學(xué)習(xí)效果降低，進(jìn)而影響模型最終的推薦性能。同時，處理動態(tài)、大規(guī)模知識圖譜也使得模型的復(fù)雜度增高，而且多數(shù)模型需要堆疊多層圖卷積運算，即便引入注意力機(jī)制，也為模型帶來了大量的待學(xué)習(xí)參數(shù)，使得訓(xùn)練成本增大。

4.2 用戶對項目屬性偏好挖掘問題

將知識圖譜運用于個性化推薦的相關(guān)研究中，一定程度上提高了推薦結(jié)果的可解釋性，即用戶與某個項目產(chǎn)生交互的原因，可能是用戶喜歡該項目的某個或某些屬性。但已有推薦模型只是簡單地通過關(guān)系，聚合來自屬性節(jié)點的信息，并沒有考慮到用戶對項目屬性的偏好隨著時間而變化，也存在用戶的長短期興趣變化問題。如文獻(xiàn)[52]探討了圖神經(jīng)網(wǎng)絡(luò)推薦中用戶的長短期興趣，但僅局限于在用戶-項目交互圖上用戶對項目的偏好，并沒有考慮到在知識圖譜上用戶對項目屬性的長短期偏好。

4.3 用戶知識圖譜處理問題

推薦模型需要有一定的用戶-項目歷史交互數(shù)據(jù)，對于一個新用戶或項目而言，其交互數(shù)據(jù)較少，很難學(xué)習(xí)其偏好特征，這就使得模型容易面臨冷啟動問題。本文所探討的知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究中一般是對項目構(gòu)建知識圖譜，或是將用戶節(jié)點加入構(gòu)建協(xié)同知識圖譜，主要運用項目的屬性信息來緩解項目冷啟動問題，而較少涉及到對用戶知識圖譜的處理，模型仍然容易面臨用戶冷啟動問題。文獻(xiàn)[33]通過引入社交網(wǎng)絡(luò)對部分新用戶建模，但社交關(guān)系僅為相似用戶間的一種輔助信息，難以從中較好地學(xué)習(xí)用戶對項目或項目屬性的偏好信息，關(guān)鍵還是在于需要引入用戶知識圖譜并對其進(jìn)行處理。

4.4 知識圖譜的圖嵌入學(xué)習(xí)問題

知識圖譜嵌入是將實體和關(guān)系嵌入到低維向量空間，同時保留知識圖譜的結(jié)構(gòu)和語義信息。在知識圖譜嵌入學(xué)習(xí)中，不同的模型從不同的角度把相應(yīng)的語義信息嵌入知識圖譜的向量表示中。在各種嵌入方法中，針對不同實體應(yīng)用不同的向量表示，不同的關(guān)系也應(yīng)擁有不同的語義空間，因此在處理復(fù)雜關(guān)系上存在一定問題。在實體和關(guān)系的交互過程中，可以融入附加信息來進(jìn)一步改進(jìn)任務(wù)，比如關(guān)系路徑。如果使用大量路徑來提高模型的性能，那么對模型的復(fù)雜度也是個嚴(yán)峻的挑戰(zhàn)。在融入附加信息過程中，由于增加了節(jié)點的屬性特征，需要考慮節(jié)點的異質(zhì)性和多模態(tài)性，從而需要用合適的嵌入方法進(jìn)行學(xué)習(xí)。

5 知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦的主要研究方向

5.1 動態(tài)時序知識圖譜增強(qiáng)的GNN推薦

為增加模型的適應(yīng)性，同時也為更好地全面獲取整個演化過程和捕獲所有動態(tài)知識，在引入知識圖譜數(shù)據(jù)的同時加入時間維度信息，利用時序分析技術(shù)和圖深度學(xué)習(xí)技術(shù)，在動態(tài)過程中能準(zhǔn)確地捕捉節(jié)點和邊的所有變化的動態(tài)性，分析知識圖譜結(jié)構(gòu)隨時間的變化和發(fā)展趨勢，從而有效獲取圖譜中的關(guān)鍵信息，對提升知識圖譜增強(qiáng)的GNN推薦性能具有重要意義。但利用動態(tài)時序信息也意味著模型復(fù)雜度的增高，最重要的是時序信息的處理方式。因此，如何處理這種動態(tài)時序知識圖譜來增強(qiáng)圖神經(jīng)網(wǎng)絡(luò)推薦是未來研究的一個重要方向。

5.2 基于元學(xué)習(xí)的知識圖譜增強(qiáng)GNN推薦

元學(xué)習(xí)[53]又被稱為“學(xué)會學(xué)習(xí)”（learn to learn）或“學(xué)習(xí)如何學(xué)習(xí)”。元學(xué)習(xí)主要思想是通過以前任務(wù)中學(xué)習(xí)的先驗知識，來指導(dǎo)新場景任務(wù)的學(xué)習(xí)，以此達(dá)到自主學(xué)習(xí)的目的。文獻(xiàn)[54]提出了一個元關(guān)系學(xué)習(xí)框架（meta relational learning，MetaR），融合了元學(xué)習(xí)和知識圖譜嵌入的方法，通過轉(zhuǎn)移特定元信息，從而解決知識圖譜少樣本連接預(yù)測的問題，元學(xué)習(xí)同樣也是解決深度學(xué)習(xí)系統(tǒng)中樣本缺乏問題的重要框架.如果將元學(xué)習(xí)思想融入知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究中，可以通過新項目的少量示例樣本，實現(xiàn)較為復(fù)雜知識圖譜表示學(xué)習(xí)和有效的知識獲取，進(jìn)而完成高效的GNN 推薦任務(wù)，對提高已有推薦模型學(xué)習(xí)的泛化性、降低模型的訓(xùn)練成本具有一定的現(xiàn)實意義。

5.3 多模態(tài)知識圖譜增強(qiáng)的GNN推薦

現(xiàn)有知識圖譜增強(qiáng)的GNN 推薦模型中，構(gòu)建知識圖譜所用的信息均是項目的一些屬性，并沒有考慮圖像、音頻、視頻等數(shù)據(jù)。多模態(tài)知識圖譜則是在傳統(tǒng)知識圖譜中構(gòu)建了多種模態(tài)，不同模態(tài)包含同一對象不同方面的知識，對于項目可能包含了豐富的圖片信息、結(jié)構(gòu)化的屬性描述和圖譜數(shù)據(jù)以及文本信息描述，可以從中抽取有利的信息補(bǔ)全知識圖譜。同樣，知識圖譜的融入也可以增強(qiáng)多模態(tài)數(shù)據(jù)處理的能力，增強(qiáng)多模態(tài)學(xué)習(xí)模型的可解釋性。如何利用這種不同模態(tài)數(shù)據(jù)，實現(xiàn)多模態(tài)知識圖譜[55]的構(gòu)建，以提升知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦效果，也將是未來本領(lǐng)域一個重要的研究方向。

5.4 知識圖譜增強(qiáng)的GNN跨領(lǐng)域推薦

已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究，大多集中在單個領(lǐng)域內(nèi)，常常面臨數(shù)據(jù)稀疏性和冷啟動等問題，并且僅限于向目標(biāo)用戶推薦單個領(lǐng)域內(nèi)的項目，并不能實現(xiàn)真正意義上的個性化。研究基于知識圖譜增強(qiáng)的GNN跨領(lǐng)域推薦，通過分析各領(lǐng)域的關(guān)系數(shù)據(jù)，探索關(guān)系對用戶自身行為的相關(guān)性，找到相關(guān)的關(guān)系數(shù)據(jù)來表征自身。解決不同領(lǐng)域的異構(gòu)性和數(shù)據(jù)不平衡性，將不同領(lǐng)域的知識、信息融合到一起的問題，來實現(xiàn)多個領(lǐng)域內(nèi)信息共享，互為補(bǔ)充，使得知識圖譜內(nèi)容更加豐富，可以在一定程度上緩解推薦過程中的數(shù)據(jù)稀疏性和冷啟動問題。

6 結(jié)束語

隨著人工智能和推薦技術(shù)的發(fā)展，越來越多的學(xué)者開始關(guān)注知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦。知識圖譜擁有豐富的輔助信息，圖神經(jīng)網(wǎng)絡(luò)在處理圖結(jié)構(gòu)數(shù)據(jù)方面具有天然的優(yōu)勢，基于知識圖譜的圖神經(jīng)網(wǎng)絡(luò)推薦，不僅有助于提升推薦模型的性能，還有助于緩解數(shù)據(jù)稀疏性和冷啟動等問題。本文從項目知識圖譜增強(qiáng)和協(xié)同知識圖譜增強(qiáng)兩個視角，對知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了深入探討，分析了不同研究模型的特點，指出了現(xiàn)有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究在大規(guī)模動態(tài)知識圖譜處理、用戶對項目屬性偏好挖掘等方面存在的問題。最后，對知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦未來主要研究方向，如動態(tài)時序知識圖譜增強(qiáng)的GNN推薦、基于元學(xué)習(xí)的知識圖譜增強(qiáng)GNN推薦等進(jìn)行了展望。希望本文能對基于知識圖譜及其圖神經(jīng)網(wǎng)絡(luò)的個性化推薦系統(tǒng)研究提供一定的借鑒作用。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡