吳國棟,王雪妮,劉玉良
安徽農(nóng)業(yè)大學(xué) 信息與計算機(jī)學(xué)院,合肥 230036
隨著信息時代的到來,人們從網(wǎng)絡(luò)上獲取信息變得越來越便利。然而信息的爆炸式增長也帶來了信息過載[1],用戶難以從海量信息中快速找到感興趣的內(nèi)容。推薦系統(tǒng)通過從用戶的歷史行為中挖掘偏好特征,并推薦可能感興趣的項目,以提升用戶消費體驗,使信息過載問題得到了有效緩解。傳統(tǒng)的推薦算法可分為協(xié)同過濾推薦[2]、基于內(nèi)容的推薦[3]和混合推薦[4]。相較于傳統(tǒng)的推薦技術(shù),基于深度學(xué)習(xí)的推薦方法[5]主要是通過為用戶和項目學(xué)習(xí)其嵌入表示,并基于這種嵌入表示,來預(yù)測用戶與項目的交互概率。
作為深度學(xué)習(xí)技術(shù)在圖領(lǐng)域的擴(kuò)展,近年來圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[6]被運用于推薦系統(tǒng)的研究中。GNN核心思想是通過傳播鄰居信息來學(xué)習(xí)目標(biāo)節(jié)點的嵌入表示,對處理圖結(jié)構(gòu)數(shù)據(jù)有著天然優(yōu)勢。然而,單一的用戶-項目交互信息已不足以發(fā)揮圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,很多算法仍然面臨交互數(shù)據(jù)稀疏以及冷啟動等問題,這就需要除用戶歷史行為外的輔助信息,來幫助推薦模型緩解這些問題。
知識圖譜(knowledge graph,KG)[7]是一種反映多種關(guān)系的有向異質(zhì)圖結(jié)構(gòu),其中節(jié)點對應(yīng)實體,邊對應(yīng)關(guān)系,以一種三元組[8]的形式表示。知識圖譜中蘊(yùn)含了豐富的屬性信息,通過不同類型的關(guān)系將這些信息與實體相聯(lián)系,將知識圖譜引入圖神經(jīng)網(wǎng)絡(luò)推薦研究,借助知識圖譜中物品間豐富的語義關(guān)聯(lián),以便更好進(jìn)行物品的特征表示,在有效提升推薦準(zhǔn)確性的同時,還有助于推薦結(jié)果的可解釋性。
按照是否有用戶節(jié)點加入,可以將知識圖譜分為項目知識圖譜和協(xié)同知識圖譜[9],與已有知識圖譜推薦[10]或圖神經(jīng)網(wǎng)絡(luò)推薦[11]等綜述不同,本文以知識圖譜的不同類型為視角,探討知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究。其中,基于項目知識圖譜增強(qiáng)的模型將用戶-項目交互圖與項目知識圖譜分離開,知識圖譜中的實體不直接參與用戶嵌入表示的學(xué)習(xí);而協(xié)同知識圖譜則是將兩圖融合,用戶嵌入表示的學(xué)習(xí)也依賴于知識圖譜中的實體。本文是探討兩者融合的推薦模型及其相關(guān)研究,既考慮到圖神經(jīng)網(wǎng)絡(luò)在圖結(jié)構(gòu)數(shù)據(jù)處理上的優(yōu)勢,又豐富了知識圖譜的語義表示。這類模型輸入上可以利用的信息更豐富,在處理過程中對圖結(jié)構(gòu)數(shù)據(jù)信息的挖掘也更加全面細(xì)致,提供更精細(xì)的節(jié)點特征表示。
圖神經(jīng)網(wǎng)絡(luò)(GNN)作為一種處理圖結(jié)構(gòu)的深度學(xué)習(xí)模型,在推薦系統(tǒng)研究中有著一定的優(yōu)勢[12]?,F(xiàn)有GNN推薦的研究,大多基于圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)[13]范疇。文獻(xiàn)[14]利用圖卷積網(wǎng)絡(luò)作為編碼器,并結(jié)合雙線性解碼來構(gòu)建圖自編碼器,以進(jìn)行用戶-項目評分矩陣的補(bǔ)全。文獻(xiàn)[15]對圖卷積網(wǎng)絡(luò)進(jìn)行簡化,去除了特征變換和非線性變換,構(gòu)建一種輕量級的圖卷積方式來傳播用戶和項目的嵌入,并堆疊多層圖卷積網(wǎng)絡(luò)以捕獲高階鄰居的特征信息。文獻(xiàn)[16]提出了一種線性殘差網(wǎng)絡(luò),在對圖卷積網(wǎng)絡(luò)去除非線性變換后,構(gòu)建殘差網(wǎng)絡(luò)結(jié)構(gòu),以解決多層圖卷積容易導(dǎo)致的過平滑問題[17]。文獻(xiàn)[18]提出了一種考慮高階特征交互的圖卷積網(wǎng)絡(luò)模型,并將GCN 的排序信息提取為二值化協(xié)同過濾,提高了在線推薦效果。文獻(xiàn)[19]不但在用戶-項目交互圖上執(zhí)行圖卷積,還將引入注意力機(jī)制的GCN用在用戶-用戶社交圖上,豐富了用戶的嵌入表示,從而進(jìn)行更準(zhǔn)確的評分預(yù)測。文獻(xiàn)[20]著重解決堆疊多層GCN 帶來的過平滑問題,通過一個無監(jiān)督子圖生成模塊,將興趣相似的用戶及與其交互的項目,構(gòu)建成子圖,并在子圖內(nèi)部執(zhí)行高階圖卷積,以避免從高階鄰居傳播負(fù)面信息到節(jié)點,緩解過平滑問題。文獻(xiàn)[21]也采用了圖卷積網(wǎng)絡(luò)作為編碼器,通過重建掩碼輸入節(jié)點,生成新節(jié)點的嵌入,以緩解推薦過程中的冷啟動問題。
盡管圖神經(jīng)網(wǎng)絡(luò)對挖掘推薦系統(tǒng)中用戶偏好與項目特征具有一定優(yōu)勢,然而單一的用戶-項目歷史交互信息存在一定的局限性,且交互數(shù)據(jù)較稀疏時容易導(dǎo)致冷啟動等問題。
傳統(tǒng)的推薦方法大多只使用了用戶與項目的交互信息,容易面臨數(shù)據(jù)的稀疏性和冷啟動等問題。知識圖譜的引入可以為推薦系統(tǒng)提供項目間豐富的語義相關(guān)性,有助于挖掘它們之間的潛在聯(lián)系,且不同類型的關(guān)系有助于擴(kuò)展用戶興趣,增加推薦項目的多樣性,使用這些信息可以進(jìn)行更加合理的個性化推薦。知識圖譜通常用G={(h,r,t)|h,t∈E,r∈R}的形式表示,其中三元組(h,r,t)表示頭實體h與尾實體t由關(guān)系r連接,E 和R分別表示實體集合和關(guān)系集合,在此之上進(jìn)行知識圖譜表示學(xué)習(xí)[22]。
已有知識圖譜推薦研究,大多是為項目建立知識圖譜,如文獻(xiàn)[23]提出了一種協(xié)同知識庫嵌入(collaborative knowledge base embedding,CKE)模型,模型基于正則化的方法,利用嵌入和深度學(xué)習(xí)技術(shù)從項目知識圖譜中提取語義表示。文獻(xiàn)[24]提出了一種面向知識圖譜增強(qiáng)推薦的多任務(wù)特征學(xué)習(xí)方法(multi-task learning for KG enhanced recommendation,MKR),模型將知識圖譜嵌入任務(wù)和推薦任務(wù)通過交叉壓縮單元相關(guān)聯(lián),使得推薦系統(tǒng)中的項目表示與知識圖譜中的實體表示可以相互補(bǔ)充。文獻(xiàn)[25]提出了一種基于異構(gòu)網(wǎng)絡(luò)嵌入的推薦方法(HIN embedding based recommendation,HERec),模型使用基于元路徑的隨機(jī)游走策略,從異質(zhì)信息網(wǎng)絡(luò)中采樣節(jié)點序列,用于網(wǎng)絡(luò)嵌入表示學(xué)習(xí)。學(xué)習(xí)節(jié)點嵌入時,首先通過一組融合函數(shù)進(jìn)行轉(zhuǎn)換,然后集成到擴(kuò)展矩陣分解(matrix factorization,MF)[26]模型中,對擴(kuò)展矩陣分解模型和融合函數(shù)進(jìn)行聯(lián)合優(yōu)化,以完成評分預(yù)測任務(wù)。文獻(xiàn)[27]提出了一個將知識圖譜融合到推薦系統(tǒng)中、端到端的框架(RippleNet)。該方法沿著知識圖譜中的關(guān)系,自動、迭代地擴(kuò)展用戶潛在興趣,以刺激用戶偏好在知識實體集合上的傳播。
知識圖譜的引入,為推薦模型提供了更多的信息來源,這些信息可以輔助學(xué)習(xí)用戶或項目的特征,以緩解數(shù)據(jù)稀疏、冷啟動等問題。作為一種圖結(jié)構(gòu)數(shù)據(jù),圖神經(jīng)網(wǎng)絡(luò)也可學(xué)習(xí)知識圖譜的圖嵌入,圖神經(jīng)網(wǎng)絡(luò)以傳播鄰居信息來學(xué)習(xí)節(jié)點特征,使得知識圖譜的處理不再依賴手工特征工程,同時為挖掘知識圖譜的高階結(jié)構(gòu)信息和語義信息提供一種端到端的訓(xùn)練方式。因此,圖神經(jīng)網(wǎng)絡(luò)技術(shù)與知識圖譜相結(jié)合,可以有效提升推薦系統(tǒng)的性能。
本文將從基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦和基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦兩個角度,探討已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究,如圖1所示。
圖1 已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究Fig.1 Research on recommenders based on graph nerual network enhanced with knowledge graph
項目知識圖譜是指依據(jù)項目屬性構(gòu)建的知識圖譜,圖譜中包含項目實體、關(guān)系和屬性,不包括用戶實體?;陧椖恐R圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦模型將項目知識圖譜與用戶-項目交互圖相分離,且重點研究在其上運用圖神經(jīng)網(wǎng)絡(luò)傳播屬性信息,以學(xué)習(xí)項目的嵌入表示。已有基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究主要包括引入關(guān)系感知的推薦、引入標(biāo)簽優(yōu)化的推薦、引入知識圖譜上下文的推薦等幾個方面。
知識圖譜通過關(guān)系將實體與實體聯(lián)系起來,不同的關(guān)系代表著不同的信息,可通過頭實體和關(guān)系推導(dǎo)出尾實體。用戶喜歡一個項目可能是因為該項目包含了某種重要的關(guān)系,所以對項目知識圖譜中關(guān)系的處理至關(guān)重要。文獻(xiàn)[28-30]著重關(guān)注實體與實體間關(guān)系信息的處理,通過充分運用關(guān)系信息,來發(fā)揮知識圖譜在推薦系統(tǒng)中的作用。
為了緩解協(xié)同過濾推薦中數(shù)據(jù)稀疏性和冷啟動等問題,利用用戶和項目屬性構(gòu)建知識圖。根據(jù)知識圖中連接關(guān)系所包含的豐富語義信息,增加推薦多樣性和精確度。Wang 等人在文獻(xiàn)[28]提出了一種知識圖譜卷積網(wǎng)絡(luò)(knowledge graph convolutional networks,KGCN)以挖掘項目間的關(guān)聯(lián)屬性,捕獲項目與項目之間的關(guān)系,進(jìn)而得到KG 的高階結(jié)構(gòu)信息和語義信息。KGCN模型首先為用戶、項目和關(guān)系初始化嵌入表示,針對目標(biāo)用戶為其歷史交互過的項目實體抽取固定大小的鄰域,并在其上執(zhí)行圖卷積操作,將鄰域?qū)嶓w信息傳播到當(dāng)前實體。傳播過程中,鄰居實體根據(jù)連接關(guān)系對目標(biāo)用戶的影響因子進(jìn)行加權(quán),見式(1):
式中,N(v)表示實體v的鄰居實體集合,rv,e表示實體v與e的關(guān)系,表示歸一化后的關(guān)系rv,e對目標(biāo)用戶u的影響因子。計算方式見式(2)、式(3):
之后,得到用戶的初始嵌入表示和項目傳播更新后的嵌入表示,預(yù)測用戶u是否對他之前未交互的項目v有潛在的興趣。模型在MovieLens-20M、Book-Crossing和Last.FM三個包含知識圖譜的數(shù)據(jù)集上,將GNN應(yīng)用在知識圖譜嵌入學(xué)習(xí)上進(jìn)行推薦,取得了很好的效果。
KGCN是較早將項目知識圖譜與圖神經(jīng)網(wǎng)絡(luò)結(jié)合,并用于推薦任務(wù)中的模型。該模型重點在于對知識圖譜中實體間關(guān)系的編碼,考慮關(guān)系對用戶的影響,在圖卷積網(wǎng)絡(luò)的處理時,細(xì)化項目的特征表示,捕獲了知識圖中的高階結(jié)構(gòu)和語義信息。KGCN 也從異質(zhì)知識圖譜方面提供了一個新的視角,幫助提升推薦效果。KGCN的提出,對研究關(guān)系感知的知識圖譜增強(qiáng)圖神經(jīng)網(wǎng)絡(luò)推薦起著重要推動作用,后續(xù)相關(guān)研究大多都采用了這種考慮實體間關(guān)系的圖卷積網(wǎng)絡(luò)思想。在考慮關(guān)系感知的同時,還可以加入其他類型的影響因子,實體表示中根據(jù)用戶偏好,影響鄰居節(jié)點聚合的權(quán)重,可在聚合時得到更精準(zhǔn)的表示,以優(yōu)化圖的表示學(xué)習(xí),提高推薦的準(zhǔn)確率。
利用知識圖譜進(jìn)行推薦的方法之一是知識圖譜嵌入,一些常用的嵌入方法都側(cè)重于對語義關(guān)聯(lián)進(jìn)行建模。在圖嵌入中,當(dāng)有新節(jié)點加入時,需要重新學(xué)習(xí)整個圖的表示,往往缺乏一定的歸納能力。因此,劉歡等人在文獻(xiàn)[29]提出了一種基于知識圖譜驅(qū)動的端到端圖神經(jīng)網(wǎng)絡(luò)模型(knowledge graph driven learning network,KGLN),其核心思想是通過知識圖譜中實體間的鄰近關(guān)系,來驅(qū)動模型進(jìn)行用戶和項目直接的表示學(xué)習(xí)。當(dāng)新節(jié)點加入時,可以共享參數(shù),直接獲得節(jié)點的特征表示。相較于KGCN,該模型不僅考慮了關(guān)系對于目標(biāo)用戶的影響因子,也考慮了不同實體節(jié)點對當(dāng)前項目的影響因子,來衡量用戶對物品的偏好。在模型中找到與實體相關(guān)的鄰居實體,對實體的鄰居節(jié)點進(jìn)行特征聚合,并加入影響因子形成聚合的結(jié)果。KGLN引用了評分函數(shù)g計算影響因子,計算方式見式(4):
其中,e為當(dāng)前實體v的鄰居節(jié)點特征,表示所有鄰居實體e對當(dāng)前實體v的影響程度。得到影響因子后進(jìn)行歸一化處理,再通過均勻隨機(jī)采樣鄰居節(jié)點,計算出每個節(jié)點的影響因子,然后對項目v的鄰居節(jié)點進(jìn)行建模,計算方式如式(5):
其中,rv,e表示實體v與e的關(guān)系,表示歸一化后的關(guān)系rv,e對目標(biāo)用戶u的影響因子。之后,聚合來自鄰居的信息來更新自身,并通過堆疊多層KGLN 的方式,使項目節(jié)點獲得來自其多階鄰居實體的信息。最后,結(jié)合項目嵌入表示與用戶嵌入表示進(jìn)行用戶對項目的偏好預(yù)測。模型基于MovieLens-1M(https://grouplens.org/datasets/movielens!)和Book-Crossing(http://www2.informatik.uni-freiburg.de/~cziegler/BX)數(shù)據(jù)集進(jìn)行了實驗,對比其他基準(zhǔn)方法,又考慮到不同聚合器以及不同感受野深度,KGLN模型取得了不錯的效果。
KGLN模型通過引入關(guān)系感知的同時,還考慮了不同鄰居實體對當(dāng)前項目的影響因子,根據(jù)鄰居節(jié)點特征的權(quán)重來聚合,相較于KGCN可以更加細(xì)致地學(xué)習(xí)項目節(jié)點特征,提高了推薦結(jié)果的精確度。KGLN考慮的知識圖譜是靜態(tài)的,然而用戶的個人偏好會隨著時間的改變而改變的。
上述知識圖譜增強(qiáng)的推薦研究中,大多是構(gòu)建項目知識圖譜,對用戶節(jié)點嵌入的學(xué)習(xí)較為簡單。豐富用戶信息的一個方式就是通過引入用戶的社交信息。用戶社交好友的偏好,在一定程度上也能反映當(dāng)前用戶的偏好,這對學(xué)習(xí)用戶節(jié)點的特征很有幫助,通過社交網(wǎng)絡(luò)中的聯(lián)系,還有助于緩解用戶冷啟動問題。Tien等人在文獻(xiàn)[30]提出了一種融入社交關(guān)系來學(xué)習(xí)用戶嵌入的模型。模型首先從用戶空間和知識圖譜空間中學(xué)習(xí)項目嵌入表示,之后利用一個多層感知機(jī),融合用戶空間和知識圖譜空間中捕獲的信息,并利用一個NeuMF(neural matrix factorization)[31]網(wǎng)絡(luò)層進(jìn)行評分預(yù)測。模型采用RMSprop優(yōu)化算法,在Ciao、MovieLens-1M和Last.FM數(shù)據(jù)集上取得了良好的效果。
在推薦相關(guān)的數(shù)據(jù)集中,往往只有用戶交互項目的記錄,稱之為正樣本,而推薦算法的訓(xùn)練還需要負(fù)樣本的參與。常用解決方法是在用戶沒有交互過的項目集中進(jìn)行采樣作為負(fù)樣本數(shù)據(jù),然而這種方式過于簡單,沒有交互過的項目不代表用戶不喜歡,因此存在一定的不合理性。如果用戶用標(biāo)簽來描述對項目的看法,標(biāo)簽可看作是用戶和項目之間聯(lián)系的紐帶,也是反映用戶興趣的重要數(shù)據(jù)來源。文獻(xiàn)[32-34]重點對樣本的標(biāo)簽進(jìn)行優(yōu)化,采用相關(guān)算法預(yù)測樣本標(biāo)簽來使標(biāo)簽類別達(dá)到平衡,以提升推薦效果。
為了提供更好的歸納偏置,Wang 等人在文獻(xiàn)[32]提出了KGCN-LS(knowledge-aware graph neural networks with label smoothness regularization)模型。通過應(yīng)用一個可訓(xùn)練的模型KGCN,來計算針對目標(biāo)用戶的項目嵌入,以識別知識圖譜中關(guān)系對于給定目標(biāo)用戶的重要性,并將知識圖譜轉(zhuǎn)換為針對目標(biāo)用戶的加權(quán)圖,然后利用圖神經(jīng)網(wǎng)絡(luò)計算個性化的項目嵌入。除此之外,KGCN-LS重點引入標(biāo)簽平滑性假設(shè),假定知識圖譜中的相鄰項目可能具有相似的用戶相關(guān)性標(biāo)簽,通過引入標(biāo)簽平滑來提供邊權(quán)值的正則化項。KGCN-LS使用標(biāo)簽傳播算法,預(yù)測項目節(jié)點的標(biāo)簽值,并將標(biāo)簽預(yù)測損失也作為模型的優(yōu)化任務(wù)。標(biāo)簽預(yù)測損失定義見式(6):
其中,J 是交叉熵?fù)p失函數(shù),yuv是真實相關(guān)標(biāo)簽,是預(yù)測標(biāo)簽。之后在反向傳播的過程中將該損失也加入優(yōu)化任務(wù),從而起到正則項的作用。模型基于MovieLens-20M、Book-Crossing、Last.FM(https://grouplens.org/datasets/hetrec-2011/)和Dianping-Food 數(shù)據(jù)集進(jìn)行實驗,驗證了KGCN-LS 引入標(biāo)簽平滑正則項的有效性,以及在召回率指標(biāo)上的效果提升。此外還通過調(diào)整MovieLens-20M 的訓(xùn)練集大小,驗證了KGCN-LS 對緩解數(shù)據(jù)稀疏性和冷啟動問題也有一定的效果。
相較于KGCN模型,KGCN-LS將GNN結(jié)構(gòu)擴(kuò)展到知識圖,同時捕獲項目之間的語義關(guān)系以及個性化的用戶偏好和興趣。此外該模型在KGCN 基礎(chǔ)上加入標(biāo)簽平滑度正則項,通過聚合和優(yōu)化使沒有被發(fā)現(xiàn)的相關(guān)項目具有更多被推薦的概率。
Zhao等人在文獻(xiàn)[33]提出了一種改進(jìn)的、帶標(biāo)簽平滑正則化的知識感知圖神經(jīng)網(wǎng)絡(luò)iKGNN-LS 模型。該模型對KGNN-LS 進(jìn)行了兩個改進(jìn):一是引入實體對目標(biāo)用戶的影響因子計算函數(shù),根據(jù)用戶對關(guān)系和實體的個性化偏好共同確定邊的權(quán)重。二是使用最大池化代替求和池化,來進(jìn)行鄰域的聚合。通過在三個真實數(shù)據(jù)集上的Top-N推薦實驗,證明了這兩項改進(jìn)的有效性。
如果直接將用戶未產(chǎn)生交互的項目作為負(fù)樣本,會存在一定的偏差。因此,Togashi 等人提出了一種通過在知識圖譜中使用偽標(biāo)簽的方式,來緩解冷啟動問題的KGPL(KG-aware recommender based on GNNs and pseudo-labelling)[34]模型。KGPL 模型通過半監(jiān)督學(xué)習(xí)預(yù)測未觀測到的樣本標(biāo)簽,以緩解數(shù)據(jù)稀疏性問題。該模型中,作者利用廣度優(yōu)先搜索算法,計算與目標(biāo)用戶有交互的項目到與目標(biāo)用戶無交互項目的路徑個數(shù)。由于冷啟動項目相較于流行項目,更容易被采樣作為負(fù)樣本,此時的偽標(biāo)簽采樣會影響模型的效果。因此對負(fù)樣本的采樣則是基于項目流行度的采樣。此外,該文獻(xiàn)中還引入了co-training 方法[35],以提升KGPL 優(yōu)化過程的健壯性。
KGPL 通過引入偽標(biāo)簽和改進(jìn)的負(fù)采樣來解決樣本標(biāo)簽不均衡問題,緩解了冷啟動和數(shù)據(jù)稀疏問題。但是,引入標(biāo)簽平滑正則化,為模型帶來了額外的計算成本。
在圖結(jié)構(gòu)數(shù)據(jù)中,節(jié)點的鄰居有階數(shù)之分,其中一階鄰居最接近當(dāng)前節(jié)點,所包含的信息也最重要,而高階鄰居雖遠(yuǎn)離當(dāng)前節(jié)點,但包含的信息也不可忽略。圖神經(jīng)網(wǎng)絡(luò)在捕獲高階信息的過程中,往往只是簡單地進(jìn)行信息聚合,容易導(dǎo)致過平滑問題,而在知識圖譜中同樣需要考慮這個問題,文獻(xiàn)[36-37]通過引入知識圖譜上下文的學(xué)習(xí)模塊,來處理高階鄰居信息,在充分利用鄰居信息的同時,避免使用圖卷積網(wǎng)絡(luò)帶來的過平滑問題。
Yang 等人在文獻(xiàn)[36]提出了引入知識圖譜上下文(contextualized graph attention network,CGAT)模型。該模型主要包含局部圖上下文、非局部圖上下文和交互圖上下文三個模塊。根據(jù)用戶特定的圖注意力機(jī)制,獲取實體的局部上下文信息,考慮用戶對實體的個性化偏好,采用隨機(jī)游走的方法提取實體的非局部上下文。E為實體集合,R為關(guān)系集合,D為實體-關(guān)系-實體三元組(h,r,t),h表示三元組的頭部實體,r表示關(guān)系實體,t表示尾部實體。在學(xué)習(xí)項目的局部圖上下文表示過程中,傳遞來自于項目實體直接相連的非項目實體信息,并引入注意力機(jī)制來區(qū)分這些非項目實體的重要性,計算方式見式(7)、式(8)所示:
在非局部圖上下文表示的學(xué)習(xí)過程中,CGAT采用基于門控循環(huán)單元(gated recurrent unit,GRU)[38]模塊的有偏隨機(jī)游走方法,用于聚合實體的非局部上下文信息。首先在項目知識圖譜上以一定的概率進(jìn)行隨機(jī)游走采樣,得到高階鄰居節(jié)點,再進(jìn)行Top-K排序獲得游走過程中概率最大的幾個節(jié)點。然后利用一個GRU單元對排序后的鄰居序列進(jìn)行處理,得到非局部圖上下文表示,計算方式見式(9)、式(10)所示:
式中,ω是一個可學(xué)習(xí)參數(shù),σ(*)是sigmoid函數(shù),⊙是點積。在得到項目的知識圖譜上下文嵌入表示后,模型通過在交互圖傳播項目節(jié)點信息,來學(xué)習(xí)用戶的嵌入表示,并在該部分中引入特定的圖形注意力機(jī)制,以區(qū)分不同歷史交互項目對用戶的重要性,捕獲用戶對實體的個性化偏好。CGAT 通過對知識圖譜中的高階鄰居進(jìn)行隨機(jī)游走采樣,更全面地捕獲了知識圖譜中所含的信息,一定程度上避免了采用圖卷積帶來的過平滑問題,取得了較好的推薦效果。
在MovieLens-1M、Book-Crossing、Last.FM 數(shù)據(jù)集上和其他模型的實驗進(jìn)行了比較,結(jié)果表明CGAT在不同數(shù)據(jù)集上都取得了較好的性能。如在HR@20 方面,CGAT優(yōu)于CFKG、RippleNet、MKP、KGNN-LS和KGAT,分別為26.07%、21.32%、22.29%、21.92%和9.56%。這也說明CGAT在知識圖譜上下文進(jìn)行推薦的效果顯著。
孫偉等人提出一種基于知識圖譜上下文矩陣補(bǔ)全的圖注意力編碼器框架[37]。該框架中,為區(qū)分不同鄰居的重要性,通過一個圖注意力編碼器來學(xué)習(xí)用戶和項目的嵌入表示。之后,在項目知識圖譜上對知識圖譜上下文進(jìn)行建模(同CGAT),并與項目的嵌入表示相融合,得到項目的最終嵌入表示。最后對用戶嵌入表示和項目的最終嵌入表示,利用雙線性解碼器來預(yù)測用戶對項目的交互。此模型在三個數(shù)據(jù)集上與其他基準(zhǔn)進(jìn)行實驗,驗證了該模型的可行性和優(yōu)越性。但模型還可以進(jìn)一步考慮采用不同的聚合方法,聚合用戶相關(guān)歷史項目和目標(biāo)項目之間不同的偏好,結(jié)合上下文信息,并加入注意力機(jī)制,以提高推薦的精確度。
在上述對已有項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究分析基礎(chǔ)上,表1 從主要文獻(xiàn)與內(nèi)容、方法及優(yōu)點等方面,對基于項目知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了小結(jié)。
表1 基于項目知識圖譜的推薦研究小結(jié)Table 1 Summary of recommendation research based on project knowledge graph
協(xié)同知識圖譜(collaborative knowledge graph,CKG)[10]是指將用戶-項目交互圖與項目知識圖譜相融合。在這一類模型中,實體不僅包含項目實體,還包含了用戶實體。因此,不僅需要考慮項目嵌入表示的學(xué)習(xí),也需要關(guān)注對用戶嵌入表示的學(xué)習(xí)。已有基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究主要包括引入注意力機(jī)制的推薦、引入路徑信息的推薦以及引入其他方法(如多視圖網(wǎng)絡(luò)、自適應(yīng)目標(biāo)-行為關(guān)系圖網(wǎng)絡(luò)等)的推薦等幾個方面。
在圖結(jié)構(gòu)數(shù)據(jù)中,不同鄰居節(jié)點相對于當(dāng)前節(jié)點的相關(guān)性是不同的,而在圖卷積網(wǎng)絡(luò)的聚合過程中,簡單聚合來自鄰居節(jié)點的信息并不能對不同鄰居節(jié)點加以區(qū)分。將注意力機(jī)制引入到基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦中,可以學(xué)習(xí)不同鄰居節(jié)點的重要性,從而重點聚合來自相關(guān)性更高的鄰居節(jié)點信息。文獻(xiàn)[39-42]使用圖注意力網(wǎng)絡(luò)進(jìn)行聚合更新,以在協(xié)同知識圖譜上區(qū)分各節(jié)點之間的重要程度。
Wang 等人在文獻(xiàn)[39]提出了一種知識圖譜注意力網(wǎng)絡(luò)(knowledge graph attention network,KGAT)。該模型以端到端方式建模了知識圖譜中的高階鄰居,發(fā)掘高階信息,增強(qiáng)用戶與項目的交互來預(yù)測用戶偏好的問題,遞歸地從鄰居節(jié)點更新當(dāng)前節(jié)點的表示,并在信息傳播過程中引入注意力機(jī)制來區(qū)分不同鄰居的權(quán)重。注意力嵌入傳播層由信息傳播、知識感知注意力、信息聚合三部分組成。其中,實體鄰居et對頭實體eh的注意力得分計算見式(12):
其中,α(h,r,t)為注意力得分,再進(jìn)行歸一化處理。對實體eh的高階鄰域信息定義為式(13):
對頭實體et進(jìn)行信息聚合更新后,再對多層圖注意力網(wǎng)絡(luò)得到的用戶和項目實體嵌入表示進(jìn)行拼接,作為用戶和項目的最終嵌入表示。此外,KGAT還將各個實體和關(guān)系的嵌入表示進(jìn)行了規(guī)范化,如式(14):
并將損失加入反向傳播的優(yōu)化任務(wù)中。模型基于Amazonbook、Last.FM 和Yelp2018 三個數(shù)據(jù)集與其他幾個主流模型進(jìn)行了對比實驗,結(jié)果表明KGAT 在Recall 和NDCG指標(biāo)上均優(yōu)于其他模型。模型的整體結(jié)構(gòu)如圖2所示。
圖2 KGAT整體框架圖Fig.2 KGAT overall frame diagram
榮沛等人在文獻(xiàn)[40]提出了基于知識圖譜和圖注意力網(wǎng)絡(luò)的推薦算法(knowledge graph and graph attention network,KG-GAT)。該模型在預(yù)處理層中將用戶、實體和關(guān)系嵌入到統(tǒng)一的低維向量空間中。然后在注意力嵌入層中,利用實體注意力機(jī)制學(xué)習(xí)不同近鄰實體的權(quán)重,并利用語義注意力機(jī)制區(qū)分不同路徑的重要性,避免不相關(guān)實體的信息。最后在預(yù)測層中預(yù)測用戶-項目的交互概率。該模型的優(yōu)點在于考慮運用了知識圖譜中的關(guān)系,探索用戶潛在偏好時存在的不相關(guān)實體問題,提高了推薦的準(zhǔn)確性和可解釋性。
基于GCN 的推薦大多數(shù)關(guān)注同構(gòu)圖或用戶-物品二部圖,未能充分利用異構(gòu)圖中實體間復(fù)雜而豐富的語義。Yang 等人在文獻(xiàn)[41]提出了一種采用層次圖注意力網(wǎng)絡(luò)結(jié)合知識圖譜的可解釋推薦模型(hierarchical attention graph convolutional network incorporating knowledge graph for explainable recommendation,HAGERec)。該模型從高階連接結(jié)構(gòu)中挖掘用戶的潛在偏好信息,設(shè)計了一種雙向?qū)嶓w傳播策略和分層注意力機(jī)制。首先,HAGERec 在消息傳遞過程中采用GCN 建模實體的局部結(jié)構(gòu),合并實體的鄰居信息。為了充分挖掘多跳連接提高RS,設(shè)計一個扁平化操作,進(jìn)一步使關(guān)系下的連接有序,更好地區(qū)分不同的連接。之后在實體傳播過程,通過雙向?qū)嶓w傳播策略獲得用戶和項目的聚合表示。由于每個實體都有不同關(guān)系的鄰居,為區(qū)分實體與鄰居之間的不同關(guān)系,提出一種層次注意力機(jī)制,自適應(yīng)地挖掘和調(diào)整每個用戶-項目對之間的協(xié)作信號,并將其分為鄰居級注意力和預(yù)測級注意力。再將每個鄰居實體的注意力評分作為與中心實體之間的相似度,并對相似度低的鄰居實體進(jìn)行篩選。同時,對大小固定的相關(guān)鄰居實體進(jìn)行采樣,從而節(jié)省計算和存儲開銷。
相比較以往的知識圖譜推薦方法,HAGERec 利用了KG和GCN的優(yōu)勢緩解了稀疏性的問題,利用分層機(jī)制來采樣鄰居實體,通過高階連通性實現(xiàn)了模型的可解釋性。在4個公共數(shù)據(jù)集進(jìn)行實驗,驗證了該模型的可行性和可解釋性。
Qu 等人在文獻(xiàn)[42]提出了一種知識增強(qiáng)的鄰域交互模型(knowledge-enhanced neighborhood interaction,KNI)。該模型將用戶-項目的交互擴(kuò)展到它們的鄰居,并引入知識圖譜來增加局部聯(lián)通性,提出一個統(tǒng)一的鄰域交互(NI)模型。具體來說,模型使用一個雙注意力網(wǎng)絡(luò)直接對局部結(jié)構(gòu)進(jìn)行預(yù)測,而不是將它們壓縮到用戶-項目嵌入表示中,并利用圖神經(jīng)網(wǎng)絡(luò)整合高階鄰域信息。最后,利用用戶的鄰域信息和項目的鄰域信息進(jìn)行預(yù)測。
該模型在4 個真實數(shù)據(jù)集上進(jìn)行了評估,并與8 個基于特征、基于元路徑和基于圖的模型進(jìn)行了對比實驗。結(jié)果表明,KNI模型在預(yù)測點擊率方面的AUC值,比其他幾個主流模型提高1.1%~8.4%,在Top-N推薦方面也遠(yuǎn)超其他幾個模型。
在推薦系統(tǒng)中加入注意力機(jī)制,可以有效地獲取用戶重點偏好,優(yōu)化推薦模型。現(xiàn)階段研究中融入注意力機(jī)制可以區(qū)分實體和其鄰居實體的不同關(guān)系權(quán)重,更能突出用戶的個性化偏好。注意力得分的引入反映了人類天生的注意力機(jī)制特點,使得推薦系統(tǒng)更加接近用戶真實的思考過程。之后可以深入研究針對不同問題的更為高效的注意力機(jī)制,使用戶-項目之間的關(guān)系權(quán)重更加細(xì)粒度化,以進(jìn)一步提升推薦效果。
現(xiàn)有處理知識圖譜的方法大多是提取用戶-項目鏈接對,或者在整個知識圖譜上傳播節(jié)點的特征,并沒有考慮不同的路徑信息。文獻(xiàn)[43-44]考慮不同路徑對節(jié)點特征學(xué)習(xí)的影響,以充分挖掘圖結(jié)構(gòu)信息,提升推薦效果。
Wang等人在文獻(xiàn)[43]提出了KGIN(knowledge graphbased intent network)模型。該模型利用輔助的項目知識來探討用戶-項目交互背后的意圖。首先,模型根據(jù)不同的路徑為用戶意圖建模,如式(15)所示:
式中,α(r,p)是關(guān)系r的注意力得分,wrp是可訓(xùn)練的權(quán)重參數(shù),每個關(guān)系r的嵌入都分配一個注意力得分以量化意圖p中每個路徑的重要性。對用戶意圖建模后,模型引入了獨立性約束,以表達(dá)意圖之間的顯著差異,進(jìn)而獲得更好的可解釋性。再對路徑關(guān)系信息進(jìn)行聚合,得到用戶嵌入表示如式(16)所示:
其中,β(u,p)是意圖p的注意力得分。對于給定的用戶,不同的意圖具有不同的動機(jī)激發(fā)用戶的行為,故引入注意力得分來區(qū)分意圖p的重要性。對項目的嵌入更新可表示如式(17)所示:
在l層之后,獲得用戶和項目不同層的表示,將路徑的意圖感知關(guān)系和知識圖譜關(guān)系匯總為最終表示,再預(yù)測用戶與該項目交互的可能性。文獻(xiàn)在三個基準(zhǔn)數(shù)據(jù)集上的實驗結(jié)果表明,KGIN 取得了顯著的效果。進(jìn)一步的分析表明,KGIN通過識別意圖和關(guān)系路徑,在意圖的粒度上揭示用戶項目關(guān)系,關(guān)系路徑感知聚合中集成了來自多跳路徑的關(guān)系信息以細(xì)化表示,為推薦結(jié)果提供了有效性和可解釋性。
大多數(shù)的KG 用于推薦系統(tǒng)中的主要思路集中于兩種方法:一是集中于用戶和項目之間的線性路徑聯(lián)系,但不能夠有效地挖掘整個KG的語義信息和拓?fù)浣Y(jié)構(gòu)信息。二是通過傳遞用戶的偏好,再得到用戶的嵌入表示,傳播的過程反而容易引入噪音。因此,Sha 等人在文獻(xiàn)[44]提出了AKGE(attentive knowledge graph embedding)模型。該模型特點在于同時關(guān)注知識圖譜對應(yīng)的語義信息和拓?fù)湫畔ⅰTO(shè)計了一種距離感知路徑采樣策略,對于給定的兩個實體,僅保留最后的K條最短路徑,并進(jìn)行路徑裝配構(gòu)建子圖。隨后,在構(gòu)建的子圖上,將圖中各個實體的嵌入和其對應(yīng)的類型嵌入進(jìn)行拼接,利用關(guān)系感知傳播計算鄰居實體的臨時隱藏狀態(tài),再通過注意力機(jī)制將上一步得到的鄰居實體進(jìn)行加權(quán)聚合,運用門控機(jī)制更新實體信息。最后,通過一個多層感知機(jī)(multi-layer perceptron,MLP)預(yù)測用戶是否會對項目進(jìn)行交互。模型的優(yōu)點是在構(gòu)造的特定子圖上進(jìn)行傳播,能更有效地構(gòu)建子圖,以及提取有效的、高質(zhì)量的交互信息,緩解了基于整個知識圖譜的傳播而容易引起的噪聲問題。最后通過MovieLens-1M、Last.FM、Yelp三個真實數(shù)據(jù)集上的實驗,評估了AKGE模型的性能,表明AKGE明顯優(yōu)于其他主流模型。
引入路徑信息的推薦,充分運用了知識圖譜中的結(jié)構(gòu)信息,以及用戶和項目之間的多種關(guān)系,增加推薦的可行性。
Tai 等人在文獻(xiàn)[45]提出了一種多視圖網(wǎng)絡(luò)(multiview item network,MVIN)。該模型包含用戶-實體和實體-實體交互模塊。為了豐富用戶-實體交互,模型首先學(xué)習(xí)基于知識圖譜增強(qiáng)的用戶表示,用戶-實體交互模塊對每個實體的關(guān)系和信息的重要性進(jìn)行了描述。為了細(xì)化實體-實體交互,提出了一個混合層來進(jìn)一步改進(jìn)圖卷積網(wǎng)絡(luò)聚合實體嵌入的方式,并允許MVIN從各種層級鄰域特征中捕獲聚合更新后信息。此外,為了保持計算效率和使用整個鄰域的信息,還采用了分階段訓(xùn)練策略[46]和采樣策略[30,47],以更好地利用知識圖譜中的信息。最后評估了MVIN模型在MovieLens-1M、LFM-1b、Amazon-book三個真實數(shù)據(jù)集上的性能,結(jié)果表明,對于點擊率(click through rate,CTR)預(yù)測和Top-N推薦,MVIN的性能明顯優(yōu)于其他主流模型。
現(xiàn)有與知識圖譜結(jié)合的推薦方法中考慮項目之間的連接性的同時,不能捕獲用戶項目之間顯式的長期語義。因此,Lyu 等人在文獻(xiàn)[48]提出了一種既捕獲用戶和項目之間的顯式長范圍語義信息,又考慮項目之間各種連接性的推薦模型(rule learning and graph neural networks for recommendation,RGRec)。該模型結(jié)合了規(guī)則學(xué)習(xí)和圖神經(jīng)網(wǎng)絡(luò)進(jìn)行推薦,首先將項目映射到知識圖譜中的相應(yīng)實體,并將用戶添加為新實體。然后,自動學(xué)習(xí)規(guī)則,捕獲長范圍語義信息,并通過聚合捕獲實體之間的連通性,更好地編碼各種信息。RGRec提出了利用知識圖譜嵌入進(jìn)行規(guī)則過濾的策略,這是一種更精確的方法計算規(guī)則的置信度,還可以運用規(guī)則學(xué)習(xí)對規(guī)則權(quán)重進(jìn)行預(yù)訓(xùn)練。最后在三個真實的數(shù)據(jù)集上進(jìn)行實驗,RGRec 模型較于KGCN、KGAT、RKGE 模型分別獲得2.8%~11.9%(Last.FM),1.9%~20.1%(MovieLens-1M),3.7%~13.8%(Dianping-Food)的性能提升,驗證了RGRec 的有效性,與只使用其中某一種方法相比,規(guī)則學(xué)習(xí)和GNN的結(jié)合,使推薦性能取得了實質(zhì)性的改進(jìn)。
為充分提取知識圖譜中隱含的結(jié)構(gòu)信息,并考慮目標(biāo)用戶和項目在嵌入傳播過程中的相互影響,F(xiàn)eng等人在文獻(xiàn)[49]提出了一種自適應(yīng)目標(biāo)-行為關(guān)系圖網(wǎng)絡(luò)模型(adaptive target-behavior relational graph network,ATBRG)。該模型為了自適應(yīng)地提取知識圖譜中目標(biāo)用戶-項目對的有效關(guān)系子圖,提出了圖連接和圖剪枝技術(shù)。首先,分別對目標(biāo)項目和用戶歷史交互項目在知識圖譜上的多階鄰居進(jìn)行探索。在這些實體集中,對出現(xiàn)在多個實體集中的實體進(jìn)行連接,對只屬于一個實體集的實體進(jìn)行修剪。然后,構(gòu)建自適應(yīng)的目標(biāo)-行為關(guān)系圖,用來描述用戶行為和目標(biāo)項目之間的結(jié)構(gòu)關(guān)系。模型考慮了知識圖譜的結(jié)構(gòu)關(guān)系,設(shè)計了基于注意力機(jī)制的關(guān)系感知提取層,對每個用戶行為和目標(biāo)項目的關(guān)系圖進(jìn)行結(jié)構(gòu)化知識聚合。在兩個真實世界的數(shù)據(jù)集上進(jìn)行了實驗,證明了ATBRG有效性。
在知識圖譜中,項目的眾多屬性導(dǎo)致具有大量的鄰居實體,若聚合鄰域中的所有實體節(jié)點的信息則不僅帶來信息的過平滑問題,也會使計算成本增加。一種普遍的解決方式是對鄰域中的鄰居進(jìn)行隨機(jī)采樣,只聚合一部分鄰居節(jié)點信息。然而這種隨機(jī)無差別的采樣方式,并不能很好地區(qū)分不同鄰居節(jié)點的重要性,可能會丟失關(guān)鍵鄰居的信息。針對這一問題,梁順攀等人在文獻(xiàn)[50]提出了一種基于關(guān)系緊密度的重要性采樣方法。該方法通過計算目標(biāo)節(jié)點與鄰居節(jié)點的關(guān)系緊密度,來采樣更重要的鄰居,以避免無差別采樣的隨機(jī)性,同時引入池化層訓(xùn)練,得到不同鄰居節(jié)點對目標(biāo)節(jié)點的差異化權(quán)值。該文獻(xiàn)提出的推薦算法在五個真實數(shù)據(jù)集上進(jìn)行評估,對比其他基于知識圖的推薦算法,在AUC和召回率指標(biāo)均有提升。
在對已有協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦相關(guān)研究進(jìn)行分析的基礎(chǔ)上,表2 從主要文獻(xiàn)與內(nèi)容、方法及優(yōu)點等方面對基于協(xié)同知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了小結(jié)。
表2 基于協(xié)同知識圖譜推薦研究小結(jié)Table 2 Summary of recommendation based on collaborative knowledge graph
從表2可以看出,基于項目知識圖譜增強(qiáng)分為引入關(guān)系感知、引入標(biāo)簽優(yōu)化和引入知識圖譜上下文的推薦,可以有效緩解數(shù)據(jù)稀疏性和冷啟動問題,利用鄰居信息獲得更加細(xì)致的特征表示,但同時存在模型單一、算法復(fù)雜性高等問題?;趨f(xié)同過濾知識圖譜增強(qiáng)分為引入注意力機(jī)制、引入路徑信息和引入其他方法的推薦,其優(yōu)點在于區(qū)分不同鄰居節(jié)點的重要性,充分挖掘圖結(jié)構(gòu)信息,提升模型性能,但算法的復(fù)雜度高,難以為用戶推薦多樣的興趣項目。
現(xiàn)實生活中,知識圖譜會隨著時間的推移不斷變化,圖譜中新的關(guān)系不斷出現(xiàn),舊的關(guān)系不斷失效。文獻(xiàn)[51]通過設(shè)計不同時間步長的動態(tài)圖,來學(xué)習(xí)節(jié)點的嵌入表示,但其考慮的僅是小規(guī)模知識圖譜。隨著時間及求解問題復(fù)雜性的增加,知識圖譜規(guī)模也會變得很大,現(xiàn)有研究很少考慮到這種大規(guī)模、動態(tài)知識圖譜情形。盡管對大規(guī)模知識圖譜可使用各種采樣策略,但這可能導(dǎo)致模型的適應(yīng)性較差,學(xué)習(xí)效果降低,進(jìn)而影響模型最終的推薦性能。同時,處理動態(tài)、大規(guī)模知識圖譜也使得模型的復(fù)雜度增高,而且多數(shù)模型需要堆疊多層圖卷積運算,即便引入注意力機(jī)制,也為模型帶來了大量的待學(xué)習(xí)參數(shù),使得訓(xùn)練成本增大。
將知識圖譜運用于個性化推薦的相關(guān)研究中,一定程度上提高了推薦結(jié)果的可解釋性,即用戶與某個項目產(chǎn)生交互的原因,可能是用戶喜歡該項目的某個或某些屬性。但已有推薦模型只是簡單地通過關(guān)系,聚合來自屬性節(jié)點的信息,并沒有考慮到用戶對項目屬性的偏好隨著時間而變化,也存在用戶的長短期興趣變化問題。如文獻(xiàn)[52]探討了圖神經(jīng)網(wǎng)絡(luò)推薦中用戶的長短期興趣,但僅局限于在用戶-項目交互圖上用戶對項目的偏好,并沒有考慮到在知識圖譜上用戶對項目屬性的長短期偏好。
推薦模型需要有一定的用戶-項目歷史交互數(shù)據(jù),對于一個新用戶或項目而言,其交互數(shù)據(jù)較少,很難學(xué)習(xí)其偏好特征,這就使得模型容易面臨冷啟動問題。本文所探討的知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究中一般是對項目構(gòu)建知識圖譜,或是將用戶節(jié)點加入構(gòu)建協(xié)同知識圖譜,主要運用項目的屬性信息來緩解項目冷啟動問題,而較少涉及到對用戶知識圖譜的處理,模型仍然容易面臨用戶冷啟動問題。文獻(xiàn)[33]通過引入社交網(wǎng)絡(luò)對部分新用戶建模,但社交關(guān)系僅為相似用戶間的一種輔助信息,難以從中較好地學(xué)習(xí)用戶對項目或項目屬性的偏好信息,關(guān)鍵還是在于需要引入用戶知識圖譜并對其進(jìn)行處理。
知識圖譜嵌入是將實體和關(guān)系嵌入到低維向量空間,同時保留知識圖譜的結(jié)構(gòu)和語義信息。在知識圖譜嵌入學(xué)習(xí)中,不同的模型從不同的角度把相應(yīng)的語義信息嵌入知識圖譜的向量表示中。在各種嵌入方法中,針對不同實體應(yīng)用不同的向量表示,不同的關(guān)系也應(yīng)擁有不同的語義空間,因此在處理復(fù)雜關(guān)系上存在一定問題。在實體和關(guān)系的交互過程中,可以融入附加信息來進(jìn)一步改進(jìn)任務(wù),比如關(guān)系路徑。如果使用大量路徑來提高模型的性能,那么對模型的復(fù)雜度也是個嚴(yán)峻的挑戰(zhàn)。在融入附加信息過程中,由于增加了節(jié)點的屬性特征,需要考慮節(jié)點的異質(zhì)性和多模態(tài)性,從而需要用合適的嵌入方法進(jìn)行學(xué)習(xí)。
為增加模型的適應(yīng)性,同時也為更好地全面獲取整個演化過程和捕獲所有動態(tài)知識,在引入知識圖譜數(shù)據(jù)的同時加入時間維度信息,利用時序分析技術(shù)和圖深度學(xué)習(xí)技術(shù),在動態(tài)過程中能準(zhǔn)確地捕捉節(jié)點和邊的所有變化的動態(tài)性,分析知識圖譜結(jié)構(gòu)隨時間的變化和發(fā)展趨勢,從而有效獲取圖譜中的關(guān)鍵信息,對提升知識圖譜增強(qiáng)的GNN推薦性能具有重要意義。但利用動態(tài)時序信息也意味著模型復(fù)雜度的增高,最重要的是時序信息的處理方式。因此,如何處理這種動態(tài)時序知識圖譜來增強(qiáng)圖神經(jīng)網(wǎng)絡(luò)推薦是未來研究的一個重要方向。
元學(xué)習(xí)[53]又被稱為“學(xué)會學(xué)習(xí)”(learn to learn)或“學(xué)習(xí)如何學(xué)習(xí)”。元學(xué)習(xí)主要思想是通過以前任務(wù)中學(xué)習(xí)的先驗知識,來指導(dǎo)新場景任務(wù)的學(xué)習(xí),以此達(dá)到自主學(xué)習(xí)的目的。文獻(xiàn)[54]提出了一個元關(guān)系學(xué)習(xí)框架(meta relational learning,MetaR),融合了元學(xué)習(xí)和知識圖譜嵌入的方法,通過轉(zhuǎn)移特定元信息,從而解決知識圖譜少樣本連接預(yù)測的問題,元學(xué)習(xí)同樣也是解決深度學(xué)習(xí)系統(tǒng)中樣本缺乏問題的重要框架.如果將元學(xué)習(xí)思想融入知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究中,可以通過新項目的少量示例樣本,實現(xiàn)較為復(fù)雜知識圖譜表示學(xué)習(xí)和有效的知識獲取,進(jìn)而完成高效的GNN 推薦任務(wù),對提高已有推薦模型學(xué)習(xí)的泛化性、降低模型的訓(xùn)練成本具有一定的現(xiàn)實意義。
現(xiàn)有知識圖譜增強(qiáng)的GNN 推薦模型中,構(gòu)建知識圖譜所用的信息均是項目的一些屬性,并沒有考慮圖像、音頻、視頻等數(shù)據(jù)。多模態(tài)知識圖譜則是在傳統(tǒng)知識圖譜中構(gòu)建了多種模態(tài),不同模態(tài)包含同一對象不同方面的知識,對于項目可能包含了豐富的圖片信息、結(jié)構(gòu)化的屬性描述和圖譜數(shù)據(jù)以及文本信息描述,可以從中抽取有利的信息補(bǔ)全知識圖譜。同樣,知識圖譜的融入也可以增強(qiáng)多模態(tài)數(shù)據(jù)處理的能力,增強(qiáng)多模態(tài)學(xué)習(xí)模型的可解釋性。如何利用這種不同模態(tài)數(shù)據(jù),實現(xiàn)多模態(tài)知識圖譜[55]的構(gòu)建,以提升知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦效果,也將是未來本領(lǐng)域一個重要的研究方向。
已有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究,大多集中在單個領(lǐng)域內(nèi),常常面臨數(shù)據(jù)稀疏性和冷啟動等問題,并且僅限于向目標(biāo)用戶推薦單個領(lǐng)域內(nèi)的項目,并不能實現(xiàn)真正意義上的個性化。研究基于知識圖譜增強(qiáng)的GNN跨領(lǐng)域推薦,通過分析各領(lǐng)域的關(guān)系數(shù)據(jù),探索關(guān)系對用戶自身行為的相關(guān)性,找到相關(guān)的關(guān)系數(shù)據(jù)來表征自身。解決不同領(lǐng)域的異構(gòu)性和數(shù)據(jù)不平衡性,將不同領(lǐng)域的知識、信息融合到一起的問題,來實現(xiàn)多個領(lǐng)域內(nèi)信息共享,互為補(bǔ)充,使得知識圖譜內(nèi)容更加豐富,可以在一定程度上緩解推薦過程中的數(shù)據(jù)稀疏性和冷啟動問題。
隨著人工智能和推薦技術(shù)的發(fā)展,越來越多的學(xué)者開始關(guān)注知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦。知識圖譜擁有豐富的輔助信息,圖神經(jīng)網(wǎng)絡(luò)在處理圖結(jié)構(gòu)數(shù)據(jù)方面具有天然的優(yōu)勢,基于知識圖譜的圖神經(jīng)網(wǎng)絡(luò)推薦,不僅有助于提升推薦模型的性能,還有助于緩解數(shù)據(jù)稀疏性和冷啟動等問題。本文從項目知識圖譜增強(qiáng)和協(xié)同知識圖譜增強(qiáng)兩個視角,對知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究進(jìn)行了深入探討,分析了不同研究模型的特點,指出了現(xiàn)有知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦研究在大規(guī)模動態(tài)知識圖譜處理、用戶對項目屬性偏好挖掘等方面存在的問題。最后,對知識圖譜增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)推薦未來主要研究方向,如動態(tài)時序知識圖譜增強(qiáng)的GNN推薦、基于元學(xué)習(xí)的知識圖譜增強(qiáng)GNN推薦等進(jìn)行了展望。希望本文能對基于知識圖譜及其圖神經(jīng)網(wǎng)絡(luò)的個性化推薦系統(tǒng)研究提供一定的借鑒作用。