国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合知識圖譜和評論文本的個性化推薦模型*

2023-02-08 02:39:46鄒程輝李衛(wèi)疆
計算機工程與科學(xué) 2023年1期
關(guān)鍵詞:三元組畫像圖譜

鄒程輝,李衛(wèi)疆

(1.昆明理工大學(xué)信息工程與自動化學(xué)院,云南 昆明 650500;2.昆明理工大學(xué)云南省人工智能重點實驗室,云南 昆明 650500)

1 引言

隨著信息化技術(shù)的飛速發(fā)展,世界正在經(jīng)歷新的“網(wǎng)絡(luò)化革命”,人們可以通過多種方式對互聯(lián)網(wǎng)進行訪問,搜索和獲取自己所需要的信息。同時,網(wǎng)絡(luò)信息呈“爆炸性”增長,用戶雖然能夠獲取到更為豐富的信息內(nèi)容,卻很難從信息的海洋中準(zhǔn)確及時地獲得符合自身需求的信息。因此,“信息過載”成為了急需解決的難題。

目前推薦模型使用輔助信息進行個性化推薦,輔助信息包括社交網(wǎng)絡(luò)、評論文本和知識圖譜等。評論文本能夠為用戶和項目提供更豐富的信息。融合評論文本的推薦模型利用CNN(Convolutional Neural Network)[1,2]和注意力機制[3 - 5]提取文本中的特征并計算其權(quán)重。知識圖譜在多個領(lǐng)域的應(yīng)用都取得了良好的效果,如問答系統(tǒng)、詞嵌入和文本分類等。目前專業(yè)的知識圖譜數(shù)據(jù)庫有NELL、Microsoft Concept Graph[6]和Microsoft Satori 。

本文提出了基于知識圖譜對用戶形象和用戶興趣建模的個性化推薦模型MKG-User,本文的貢獻總結(jié)為以下3點:

(1)使用不同類型知識圖譜作為輔助信息,不同類型的知識圖譜能夠從不同角度結(jié)合推薦模型中的數(shù)據(jù)信息進行建模。

(2)基于三元組知識圖譜和用戶的歷史興趣提出了權(quán)重異構(gòu)圖WHG(Weighted Heterogeneous Graph)。WHG是考慮到現(xiàn)實中關(guān)系的影響因子構(gòu)建的一種包含用戶興趣信息的網(wǎng)絡(luò)結(jié)構(gòu)圖。

(3)聯(lián)合概念知識圖譜和評論文本,利用神經(jīng)網(wǎng)絡(luò)同時從概念詞和實體詞中提取用戶畫像特征和用戶的情感傾向特征,利用用戶評論文本構(gòu)建用戶的形象和情感。

2 相關(guān)工作

2.1 融合知識圖譜的推薦模型

本節(jié)總結(jié)了幾種主要的融合知識圖譜推薦模型。基于嵌入式的模型的關(guān)鍵技術(shù)是KGE(Knowledge Graph Embedding)[7],將知識圖譜的實體和關(guān)系映射到低維的向量空間學(xué)習(xí)知識圖譜中的信息。微軟[8]提出了CKE(Collaborative Knowledge base Embedding),在協(xié)同過濾CF(Collaborative Filtering)的基礎(chǔ)上融合了3種輔助信息。Ai等人[9]提出了CFKG(Collaborative Filtering based on user-item Knowledge Graph)模型,該模型預(yù)定義了User-Item重新計算用戶和項目之間的距離。Wang等人[10]提出了MKR(Multi-task feature learning for Knowledge graph enhanced Recommendation)模型,利用推薦系統(tǒng)中的物品和知識圖譜中的實體存在重合的情況,提出了交叉式的推薦系統(tǒng)模型?;诼?lián)合式的模型兼具了嵌入式和路徑2種方式。Wang等人[11]提出了RippleNet模型,將用戶的歷史興趣作為種子在知識圖譜中擴展用戶的興趣集合。Wang等人[12]提出了KGCN(Knowledge Graph Convolutional Networks for recommender systems)模型,利用圖卷積處理知識圖譜。

2.2 融合評論文本的推薦模型

評論文本作為輔助信息是推薦系統(tǒng)研究中的熱點。Kim等人[1]提出了ConvMF(Convolution Matrix Factorization)模型,將商品信息聚合為長文本用于提取用戶特征,但是ConvMF僅考慮到了商品的評論文本,沒有考慮到用戶評論內(nèi)容。Zheng等人[2]提出了DeepCoNN(Deep Cooperative Neural Network)模型,該模型使用2個并行的CNN網(wǎng)絡(luò)分別從用戶評論和商品信息中提取隱含特征。DeepCoNN給后來的研究提供了很多啟示,其中Chin等人[4]提出了ANR(Aspect-based Neural Recommender)模型,從文本內(nèi)容的角度進行建模?;陂L文本的建模方法對于用戶特定領(lǐng)域的興趣效果不佳,因此提出了基于單評論的建模方法。Chen等人[5]提出了NARRE(Neural Attention rating Regression with Review-level Explanations)模型,針對不同的評論根據(jù)其重要性定義了review-level層,通過自注意力機制聚合用戶和商品在review-level層得到的結(jié)果進行預(yù)測。Zhang等人[13]提出了EFM(Explicit Factor Model)模型,根據(jù)用戶對物品的評論,采用情感分析的方法,構(gòu)建了3個矩陣進行預(yù)測。

3 問題定義

本節(jié)主要介紹模型中用到的定義和數(shù)學(xué)符號。

定義1y為預(yù)測1個用戶對1個項目的點擊概率值。

定義3(用戶畫像特征) 利用概念知識圖譜中的概念詞和實體詞提取到用戶畫像特征。

本文使用的數(shù)學(xué)符號如表1所示。

Table 1 Symbol definition

4 模型

4.1 模型框架

如圖1所示,融合知識圖譜和評論文本的個性化推薦模型由輸入層、嵌入層、特征提取網(wǎng)絡(luò)和決策層組成。輸入層是對用戶興趣和用戶畫像建模的基礎(chǔ),在輸入層輸入樣本數(shù)據(jù)和多類型的知識圖譜;在嵌入層中,將輸入的數(shù)據(jù)轉(zhuǎn)化為向量表示,并將其作為特征提取網(wǎng)絡(luò)的輸入;特征提取網(wǎng)絡(luò)是模型的關(guān)鍵,在該層構(gòu)造興趣網(wǎng)絡(luò)和畫像網(wǎng)絡(luò),分別提取用戶興趣特征和帶有情感傾向的用戶畫像特征;決策層對用戶興趣特征和用戶畫像特征進行處理得到用戶的表示,使用Sigmoid函數(shù)計算用戶點擊概率的預(yù)測值y。

Figure 1 Framework of MKG-User model圖1 MKG-User模型框架

4.2 輸入層和嵌入層

4.2.1 WHG構(gòu)建

如圖2所示,以電影“Forrest Gump”為起點,在三元組知識圖譜上以多跳的方式擴展用戶興趣項目,構(gòu)造了關(guān)于 “Forrest Gump”的權(quán)重異構(gòu)圖。

Figure 2 WHG圖2 權(quán)重異構(gòu)圖

受到Wang等人[12]和Cao等人[14]融合知識圖譜擴展用戶興趣的啟發(fā),本文使用三元組知識圖譜構(gòu)造WHG,不僅考慮關(guān)系作為節(jié)點的連接,還考慮關(guān)系的連接性和每一條關(guān)系的權(quán)重。三元組知識圖譜由h,r和t構(gòu)成,根據(jù)h和r擴展t。設(shè)Nl為δ中關(guān)系rl的數(shù)量,N為關(guān)系的種類,w_rl為關(guān)系rl的權(quán)重,其計算如式(1)所示:

(1)

通過知識圖譜和用戶的輸入樣本構(gòu)造WHG,具體過程如算法1所示

算法1構(gòu)造WHG。

輸入:用戶歷史興趣Vu、三元組知識圖譜δ(h,r,t)和計算的關(guān)系的權(quán)w_rl。

輸出:權(quán)重異構(gòu)信息圖WHG,WHG由多跳的集合(?1,?2,?3,…,?k)構(gòu)成,其中k代表多跳的次數(shù)。

Step1將用戶歷史興趣Vu送進δ(h0,r0,t0),生成在知識圖譜中擴展的種子h0,其中h0=Vu。

Step2對h0,在知識圖譜中根據(jù)關(guān)系r0得到擴展的節(jié)點t0。

Step3得到h0在第1跳中所有的節(jié)點t0構(gòu)成第1跳的集合?1(h0,r0,t0)。

Step4將第1跳擴展的t0,作為下一跳的頭實體h1進行第2跳擴展t1,得到第2跳的集合?2。

Step5重復(fù)操作Step 4,得到下一跳的集合?k。

Step6經(jīng)過多次擴展得到擴展集合(?1,?2,?3,…,?k),根據(jù)在知識圖譜中得到的關(guān)系的權(quán)重w_rl對每一跳集合中的關(guān)系賦值 ,得到新的集合(?1,?2,?3,…,?k),其中?k的組成為(hk,w_rl_rk,tk)。

Step7得到賦值后的異構(gòu)網(wǎng)絡(luò)圖WHG。

Step8Return WHG。

4.2.2 概念知識圖譜

從用戶評論文本中提取實體詞的過程如式(2)所示:

(2)

其中,Ej代表1個用戶對1個項目的評論文本中實體詞集合,n為實體詞數(shù)量,Traverse(·)代表映射方法。

根據(jù)實體詞得到與用戶有關(guān)概念的公式如式(3)所示:

(3)

4.2.3 嵌入層

在輸入層得到WHG、評論文本以及概念詞和實體詞,其中評論文本和概念作為語句序列,為了保留句子的上下文關(guān)系,采用word2vec[15]技術(shù)預(yù)訓(xùn)練得到文本的詞向量字典。對輸入的文本內(nèi)容(Rev,En,Gn),根據(jù)詞向量字典得到向量表示,Rev由詞向量集合O={O1,O2,O3,…,On}構(gòu)成,Gn的所有概念詞向量表示集合為g={g1,g2,g3,…,gd},En的所有實體詞向量表示集合為e={e1,e2,e3,…,ed}。d為向量維度。同時,為了體現(xiàn)出句子中實體詞的影響程度,對句向量中的實體詞利用自注意力機制來更新其權(quán)重,如式(4)所示:

(4)

評論文本由于句子長度不同,為了保存句子的完整信息,以及方便模型處理文本,根據(jù)更新權(quán)重后的詞向量集合計算評論文本的句向量,如式(5)所示:

(5)

其中,senvec={sen1,sen2,…,send}為句向量表示,n為評論文本中詞的數(shù)量,對不屬于實體詞的單詞Att(Ej,O)=1。

由于每條評論文本中的實體詞數(shù)量也不同,為了方便模型處理,同時不丟失概念詞和實體詞,本文分別取g和e的均值向量表示作為概念詞和實體記號的向量表示,如式(6)所示:

(6)

對輸入WHG中的三元組{hk,rk,tk}和輸入用戶初始感興趣的項目v,經(jīng)過embedding層轉(zhuǎn)換為詞向量表示,其中hk={h1,h2,h3,…,hd},rk={r1,r2,r3,…,rd},tk={t1,t2,t3,…,td},v={v1,v2,v3,…,vd}。

4.3 特征提取網(wǎng)絡(luò)

4.3.1 興趣網(wǎng)絡(luò)

如圖3所示,興趣網(wǎng)絡(luò)由興趣注意力機制和全連接層組成。

Figure 3 Interest network圖3 興趣網(wǎng)絡(luò)

本文提出用于模擬用戶興趣偏好的興趣注意力機制。如圖4所示,根據(jù)構(gòu)造的WHG中的實體與關(guān)系,使用Softmax函數(shù)計算用戶的興趣偏好值。

Figure 4 Interest attention mechanism圖4 興趣注意力機制

根據(jù)WHG得到用戶過去的興趣Rh和擴展的興趣Vt,如式(7)所示。根據(jù)Rh和Vt計算用戶的興趣偏好值,計算過程如式(8)所示:

(7)

Interestw=Sofmax{Deep[σ(Rh⊕Vt)]}

(8)

其中,Interestw為用戶興趣值,Deep[σ(Rh⊕Vt)]用于得到用戶的共享興趣特征,σ(·)為ReLU激活函數(shù)。

通過興趣注意力機制對用戶在WHG中每一跳擴展的實體添加了興趣偏好值Interestw,然后利用全連接層提取用戶的興趣特征{I1,I2,I3,…,Ik},Deep(hk,w_rl_rk,tk)代表利用全連接層提取1組三元組興趣特征。InterestI代表用戶興趣特征表示,k代表興趣特征的數(shù)量,用戶興趣特征的提取過程如式(9)所示:

0

(9)

4.3.2 畫像網(wǎng)絡(luò)

畫像網(wǎng)絡(luò)從評論文本、概念和實體詞中提取帶有情感傾向的畫像特征,在輸入層關(guān)聯(lián)概念知識圖譜得到評論文本中的實體詞向量e、概念向量g以及句向量{sen1,sen2,sen3,…,send}。如圖5所示,畫像網(wǎng)絡(luò)由畫像模塊和情感模塊組成,畫像模塊采用雙通道的深度ResNet(Deep Residual Network)[16]并行處理概念集合和實體詞集合,從中抽取用戶形象特征;情感模塊采用Bi-LSTM[17]計算評論文本中的情感傾向。

Figure 5 Portrait network圖5 畫像網(wǎng)絡(luò)

將概念向量經(jīng)過卷積操作壓縮特征,將概念向量g與卷積核ke進行卷積運算。壓縮過程為如式(10):

xi=σ(g*ke+b)

(10)

其中,ke為卷積核,大小為7,步長為2;*為卷積操作;b為偏置值。池化操作得到的向量輸入到ResNet,池化操作如式(11)所示:

x=max(x1,x2,…,xi)

(11)

殘差單元的計算過程分為2步:卷積過程和恒等映射Im(Identity mapping),計算過程分別如式(12)和式(13)所示:

(12)

Im=σ[conv(x*ke+b)]

(13)

其中卷積核ke的大小分別為1,3和1,步長為1,c為卷積過程的向量。

殘差單元的最終輸出如式(14)所示:

fg(c,Im)=add(c,Im)

(14)

(15)

(16)

如圖6所示,情感模塊由雙向長短期記憶Bi-LSTM網(wǎng)絡(luò)和隱含層構(gòu)成,輸入為句向量senvec。LSTM單元有遺忘門、更新門和輸出門3種門控機制。

Figure 6 Emotion module圖6 情感模塊

(17)

Saw=softmax{σ[deep(Sd)]}

(18)

將Saw與畫像特征相乘,得到帶有情感傾向的用戶畫像特征,計算公式如式(19)所示:

(19)

4.4 決策層

通過特征提取網(wǎng)絡(luò)得到用戶的興趣特征和帶有情感傾向的用戶畫像特征,對2種特征進行融合得到用戶的表示user·Pi,融合的過程見式(20)。通過全連接層來計算用戶表示和用戶初始感興趣的項目v之間的相似度,使用sigmoid函數(shù)計算預(yù)測概率y,如式(21)所示。

user·Pi=InterestI·Userp

(20)

y=sigmoid{sum[user·Pi×deep(v)}

(21)

5 實驗

5.1 數(shù)據(jù)集

本文選用Amazon數(shù)據(jù)集[18]進行實驗評估。該數(shù)據(jù)集包含了用戶對網(wǎng)站商品的評價信息和商品的元數(shù)據(jù),評分在1~5,數(shù)據(jù)的時間跨度為1995年6月到2013年3月。本文在Amazon數(shù)據(jù)集中選擇了電影、圖書和音樂3個領(lǐng)域的數(shù)據(jù)集。

本文使用2種類型的知識圖譜:(1)概念知識圖譜使用的是2016年微軟研究院發(fā)布的Microsoft Concept Knowledge Graphs,通過人類意識常識概念進行構(gòu)建,包含540萬條概念和相關(guān)實體;(2)三元組知識圖譜,包括從Microsoft Satori抽取到的有關(guān)電影、圖書和音樂領(lǐng)域的實體和關(guān)系,其中電影三元組知識圖譜中有2 444類有關(guān)電影的實體節(jié)點,12種連接關(guān)系;圖書三元組知識圖譜中有14 966類有關(guān)圖書的實體節(jié)點,16種連接關(guān)系;音樂三元組知識圖譜中有3 845類有關(guān)音樂的實體節(jié)點,36種連接關(guān)系。

表2展示了數(shù)據(jù)集關(guān)聯(lián)知識圖譜后的數(shù)據(jù)信息。可以看到,在三元組知識圖譜中經(jīng)過多跳擴展用戶感興趣的項目的數(shù)量和種類在逐漸增加,可用于解決推薦系統(tǒng)的數(shù)據(jù)稀疏問題。

Table 2 Multi-hop expansion on the triple knowledge graph

本文隨機將數(shù)據(jù)集劃分為訓(xùn)練集(60%)、驗證集(20%)和測試集(20%)。在實驗數(shù)據(jù)集中評分為1到5,根據(jù)Amazon數(shù)據(jù)集評分的分布將閾值設(shè)置為4,保證正負樣本的分布均勻,以此將數(shù)據(jù)集劃分為正負樣本后用于構(gòu)建CTR模型。

5.2 評價指標(biāo)

本文選取AUC(Area Under the Curve)作為評價指標(biāo),如式(22)所示:

(22)

其中,M和F為正樣本和負樣本的數(shù)量;rankinsi表示第i條樣本的序號;∑insi∈positiveclassrankinsi表示正樣本的序號加起來。

其它評價指標(biāo)Precision、Recall和F1的計算如式(23)~式(25)所示:

(23)

(24)

(25)

其中,TP表示把正樣本成功預(yù)測為正的次數(shù);TN表示把負樣本成功預(yù)測為負的次數(shù);FP表示把負樣本錯誤預(yù)測為正的次數(shù);FN表示把正樣本錯誤預(yù)測為負的次數(shù)。

5.3 Baseline模型

為了評估MKG-User模型的性能,將其與以下比較優(yōu)秀的模型進行對比:

(1)DeepFM[19]。經(jīng)典的神經(jīng)網(wǎng)絡(luò)推薦模型,使用FM和MLP分別處理用戶的低維和高維特征。

(2)CKE[8]。融合知識圖譜的經(jīng)典模型,通過KGE得到結(jié)構(gòu)類型的知識圖的向量表示后進行預(yù)測。

(3)RippleNet[11]。 借鑒了水波擴散的現(xiàn)象,基于用戶歷史興趣在知識圖譜中擴展用戶的興趣,計算用戶點擊候選項目的概率。

(4)MKR[10]。利用推薦系統(tǒng)中的用戶和項目能夠與三元組知識圖譜中的節(jié)點匹配,設(shè)計交互網(wǎng)絡(luò)將節(jié)點和用戶、項目進行交互,進行點擊率預(yù)測。

(5)KGCN[12]。在知識圖譜中找到相關(guān)的實體節(jié)點,對節(jié)點進行聚合,然后利用圖卷積技術(shù)擴展信息后用于點擊率預(yù)測。

(6)ConvMF[1]。利用CNN從商品評論信息中提取商品的隱含特征,作為評分矩陣的額外信息,基于高斯分布進行評分預(yù)測。

(7)ANR[4]。從方面角度對長文本進行建模,然后用注意力計算方面的權(quán)重。

(8)NARRE[5]。 NARRE考慮到評論文本的重要程度,提出了review-level來刻畫評論的權(quán)重,再利用注意力進行最后的推薦預(yù)測。

5.4 參數(shù)設(shè)置

本文使用word2vec訓(xùn)練詞向量,維度(d)為300,窗口大小為3。損失函數(shù)是均方根誤差損失函數(shù),優(yōu)化器選擇的是Adam,學(xué)習(xí)率為0.01。如表3所示,為了達到最佳性能,對3個數(shù)據(jù)集中的參數(shù)進行了微調(diào)。Hop-size為構(gòu)建權(quán)重異構(gòu)信息圖多跳次數(shù),Kg-size為擴展異構(gòu)知識圖譜的大小,α和β為模型學(xué)習(xí)率,L2為正則化參數(shù)。進行實驗時,選擇K值為10,32,64,100。

Table 3 Parameters setting

5.5 實驗結(jié)果與分析

實驗?zāi)康氖球炞C融合知識圖譜和評論文本對用戶興趣和用戶形象進行建模能夠提升模型的性能,使用AUC、Precision和F1作為評價指標(biāo)。

實驗結(jié)果見表4。在AUC和Precision和F1上,本文提出的模型在數(shù)據(jù)集上都得到了最好結(jié)果。MKG-User模型的AUC分別達到了0.969,0.925和0.887,與Baseline中最好的結(jié)果相比分別提高了4.8%,18.8%和2.1%。本文模型與融合知識圖譜的模型相比,在電影數(shù)據(jù)集上,AUC提高了4.8%,Precision和F1分別提高了6.8%和6.9%;在圖書數(shù)據(jù)集上,AUC提高了19.6%,Precision和F1分別提高了3.8%和19.4%;在音樂數(shù)據(jù)集上,AUC提高6.8%,Precision和F1分別提高了0.1%和12.2%。本文模型與融合評論文本的模型在AUC、Precision和F1上相比,在電影數(shù)據(jù)集上分別提高了6.5%,9.0%和8.9%,在圖書數(shù)據(jù)集上分別提高了18.8%,7.8%和15.5%;在音樂數(shù)據(jù)集上,AUC提高了2.1%,Precision和F1分別提高了1.0%和6.3%。在不同數(shù)據(jù)集上與不同類型模型進行比較,驗證了MKG-User使用評論文本和知識圖譜能夠提升推薦模型的性能,同時還說明對用戶形象和用戶興趣進行建模能夠提升推薦系統(tǒng)的效果。為了驗證模型的穩(wěn)定性,MKG-User-avg是對10次實驗結(jié)果取平均值。

Table 4 Comparison of experimental results

Figure 7 TopK experimental results on movie dataset圖7 電影數(shù)據(jù)集上的TopK實驗結(jié)果

Figure 8 TopK experimental results on book dataset圖8 圖書數(shù)據(jù)集上的TopK實驗結(jié)果

5.6 TopK實驗結(jié)果與分析

本節(jié)在Amazon的電影和圖書2個數(shù)據(jù)集上對模型進行TopK實驗,評價指標(biāo)為Precision@K、Recall@K和F1@K。實驗結(jié)果如圖7和圖8所示。

從圖7和圖8可知,本文提出的模型達到了很好的效果。由于Precision和Recall側(cè)重點不同,評價性能的方面也不同。因此,本節(jié)還選擇F1評價指標(biāo),F(xiàn)1綜合了2種評價指標(biāo)。從3個指標(biāo)驗證了本文模型達到了最好的效果,表明模型在TopK實驗中有很好的性能,能為用戶提供更準(zhǔn)確的推薦。

5.7 參數(shù)敏感性分析

本文選擇Hop-size和Kg-size2個參數(shù)來評估其對模型性能的影響,在Amazon數(shù)據(jù)集上進行實驗驗證。Hop-size是根據(jù)用戶的歷史興趣擴展用戶興趣的跳數(shù),其大小代表擴展用戶興趣的遠近。Kg-size是在WHG中得到的用戶節(jié)點的數(shù)量,用于確定能夠得到多少用戶興趣特征。表5所示為Hop-size在1~4時AUC的實驗結(jié)果。表6所示為Kg-size取8,16,32和64時對模型性能的影響。

Table 5 Impact of Hop-size on the model

Table 6 Impact of KG-size on the model

5.8 興趣網(wǎng)絡(luò)的有效性

本文還在電影數(shù)據(jù)集上驗證了興趣網(wǎng)絡(luò)的有效性,表明在融合知識圖譜的推薦模型中關(guān)系的影響因素和用戶興趣偏好可以提高推薦模型的效果。

實驗結(jié)果如表7所示,MKG-User(knowledge graph)表示興趣網(wǎng)絡(luò)加入了WHG和興趣注意力機制。

從表7可以看出,考慮關(guān)系的影響因素和用戶的興趣偏好后能夠增強推薦系統(tǒng)的性能。為了體現(xiàn)用戶興趣偏好的變化過程,對興趣注意力機制進行可視化,如圖9所示。

Table 7 Impact of WHG

Figure 9 Visualization of attention mechanism 圖9 注意力機制可視化

5.9 畫像網(wǎng)絡(luò)的有效性

MKG-User(Portrait)在MKG-User(knowledge graph)中添加雙通道ResNet,融合評論文本和概念知識圖譜提取畫像特征。在電影數(shù)據(jù)集上與MKG-User(knowledge graph)進行對比驗證,實驗結(jié)果如表8所示。

Table 8 Effectiveness of the portrait network

在畫像網(wǎng)絡(luò)中考慮評論文本中的情感傾向,添加了情感模塊,驗證Bi-LSTM提取的情感傾向值的有效性。實驗結(jié)果如表9所示。

Table 9 Portrait network performance after adding emotional inclinations

從表8和表9可知,利用評論文本和概念知識圖譜構(gòu)造帶有情感傾向的用戶畫像特征,根據(jù)得到的用戶畫像特征可解決推薦系統(tǒng)中的數(shù)據(jù)稀疏問題,提高了推薦效果。

6 結(jié)束語

本文提出了MKG-User模型,利用用戶交互的項目結(jié)合三元組知識圖譜提取用戶的興趣特征,利用評論文本和概念知識圖譜提取用戶畫像特征,有效提升了推薦效果。同時,本文提出了利用興趣注意力機制提取更符合用戶自身興趣的特征;采用雙通道ResNet和Bi-LSTM提取帶有情感傾向的用戶畫像特征。今后將在2個方面繼續(xù)開展研究:(1)本文在構(gòu)建用戶畫像特征時沒有考慮用戶的統(tǒng)計信息,如何將用戶的統(tǒng)計信息融合到用戶畫像特征中是下一步要解決的問題;(2)用戶的興趣是動態(tài)變化的,如何考慮利用用戶興趣的變化來優(yōu)化推薦模型也是下一步工作之一。

猜你喜歡
三元組畫像圖譜
基于帶噪聲數(shù)據(jù)集的強魯棒性隱含三元組質(zhì)檢算法*
威猛的畫像
特征標(biāo)三元組的本原誘導(dǎo)子
繪一張成長圖譜
“00后”畫像
畫像
關(guān)于余撓三元組的periodic-模
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動對接你思維的知識圖譜
潛行與畫像
长顺县| 东乡县| 沿河| 和顺县| 萝北县| 炉霍县| 元江| 石门县| 扎兰屯市| 黄大仙区| 栾川县| 新兴县| 错那县| 高邑县| 抚远县| 灌云县| 永修县| 峡江县| 临朐县| 永丰县| 东乌珠穆沁旗| 洛川县| 库车县| 霍城县| 济阳县| 乐亭县| 大冶市| 云龙县| 上高县| 大荔县| 栖霞市| 合水县| 年辖:市辖区| 邵阳县| 肇州县| 长泰县| 邵东县| 广州市| 松溪县| 商都县| 连云港市|