国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合知識(shí)圖譜與協(xié)同過(guò)濾的圖書(shū)推薦算法

2022-08-25 09:56李靈慧黃樹(shù)成王云沼
軟件導(dǎo)刊 2022年8期
關(guān)鍵詞:相似性圖譜語(yǔ)義

周 倩,王 遜,李靈慧,黃樹(shù)成,王云沼

(1.江蘇科技大學(xué)計(jì)算機(jī)學(xué)院,江蘇鎮(zhèn)江 212003;2.中國(guó)人民解放軍陸軍通信訓(xùn)練基地,北京 100029)

0 引言

隨著互聯(lián)網(wǎng)的發(fā)展,面對(duì)海量數(shù)據(jù)不斷涌現(xiàn),人們很難選擇個(gè)性化的信息。由此,推薦算法應(yīng)運(yùn)而生,它能夠緩解信息過(guò)載問(wèn)題,并且為用戶推薦感興趣的信息[1]。在推薦算法中包括3 種較為流行的推薦:基于內(nèi)容的推薦(Content-based Recommendation)、基于協(xié)同過(guò)濾的推薦(Collaborative Filtering-based Recommendation)以及基于關(guān)聯(lián)規(guī)則的推薦。學(xué)者們也進(jìn)行了大量研究,比如Hernando等[2]提出一種基于貝葉斯概率模型的用戶評(píng)級(jí)協(xié)同過(guò)濾推薦預(yù)測(cè)方法;Zhang 等[3]將學(xué)生的學(xué)習(xí)軌跡、借書(shū)時(shí)間信息以及圖書(shū)流通時(shí)間融入算法,提出一種基于時(shí)間序列的協(xié)同過(guò)濾個(gè)性化書(shū)籍推薦算法;趙杰[4]提出一種改進(jìn)的LDA 用戶興趣模型用于個(gè)性化圖書(shū)推薦,將借書(shū)者特征信息的相似度計(jì)算和借書(shū)者屬性融入相似度計(jì)算方法;鄒海濤等[5]利用局部網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)組合模型,將用戶自身購(gòu)買(mǎi)歷史與社交網(wǎng)絡(luò)特征相結(jié)合,提升推薦結(jié)果準(zhǔn)確度。

然而,上述算法沒(méi)有考慮到圖書(shū)本身的語(yǔ)義信息。知識(shí)圖譜(Knowledge Graph,KG)作為最近新興的輔助數(shù)據(jù)源,引起越來(lái)越多人的關(guān)注。例如,Zhang 等[6]利用網(wǎng)絡(luò)嵌入和自編碼器獲取結(jié)構(gòu)化知識(shí)的向量化表示、文本知識(shí)特征、圖片知識(shí)特征,在將這3 類(lèi)特征融合到協(xié)同集成學(xué)習(xí)框架實(shí)現(xiàn)個(gè)性化推薦;Wang 等[7]提出RippleNet 算法,通過(guò)在推薦算法中利用知識(shí)圖譜并結(jié)合注意力機(jī)制得到用戶的偏好特征表示,有效提高了推薦算法的準(zhǔn)確性;Wang等[8]提出RKGE-CF 算法,將知識(shí)圖譜實(shí)體嵌入與神經(jīng)網(wǎng)絡(luò)相結(jié)合,提高了推薦性能;李浩等[9]將物品的外部附加數(shù)據(jù)和用戶的偏好數(shù)據(jù)加入知識(shí)圖譜,提取實(shí)體與關(guān)系的語(yǔ)義,將結(jié)果與協(xié)同過(guò)濾推薦結(jié)果相融合,準(zhǔn)確率有顯著提升;Wang 等[10]提出KGCN 模型,利用用戶和項(xiàng)目屬性提出一種將知識(shí)圖譜作為輔助信息的圖神經(jīng)網(wǎng)絡(luò)推薦模型,有效緩解稀疏性和冷啟動(dòng)問(wèn)題,提升推薦效果。

綜上所述,為了更好地進(jìn)行圖書(shū)推薦,本文提出融合知識(shí)圖譜與協(xié)同過(guò)濾的圖書(shū)推薦算法。首先,利用TransE算法計(jì)算得到圖書(shū)之間的語(yǔ)義表示,然后利用余弦相似性計(jì)算方法計(jì)算圖書(shū)的語(yǔ)義近鄰;然后,在協(xié)同過(guò)濾算法基礎(chǔ)上利用同現(xiàn)相似度公式計(jì)算相似度,并改進(jìn)相似度公式,加入活躍用戶懲罰因子,減少熱門(mén)書(shū)籍和活躍用戶對(duì)結(jié)果的影響;最后,將兩種結(jié)果通過(guò)創(chuàng)新性的高位替換低位方式融合形成最終推薦結(jié)果。本文算法融入了圖書(shū)的語(yǔ)義信息,尋找圖書(shū)之間的語(yǔ)義相似度,根據(jù)語(yǔ)義相似程度進(jìn)行推薦,對(duì)改進(jìn)推薦算法的物品冷啟動(dòng)問(wèn)題有一定效果。

1 相關(guān)工作

1.1 基于圖書(shū)的協(xié)同過(guò)濾推薦

協(xié)同過(guò)濾推薦算法是應(yīng)用最為廣泛的推薦算法之一,通過(guò)挖掘用戶歷史行為數(shù)據(jù)發(fā)現(xiàn)用戶偏好,基于不同的偏好對(duì)用戶進(jìn)行群組劃分并推薦品味相似的商品[11-12]。協(xié)同過(guò)濾推薦算法包括基于用戶(User-based)和基于物品(Item-based)的協(xié)同過(guò)濾算法[13]?;谟脩舻膮f(xié)同過(guò)濾算法根據(jù)用戶歷史評(píng)分?jǐn)?shù)據(jù)計(jì)算用戶偏好物品,利用用戶偏好物品尋找與用戶偏好一致的用戶,然后將尋找到用戶的其他偏好商品推薦給該用戶。而基于物品的協(xié)同過(guò)濾算法思想與基于用戶的協(xié)同過(guò)濾算法類(lèi)似,只是將用戶變?yōu)槲锲罚缦矚g物品A 的用戶都喜歡物品B,用戶T 喜歡物品A,則給用戶C 推薦物品B。

目前,各網(wǎng)上商城用戶數(shù)量明顯多于圖書(shū)數(shù)量,因此本文采用基于物品的協(xié)同過(guò)濾推薦算法,且利用余弦相似度公式計(jì)算物品相似度。

1.2 基于知識(shí)圖譜的推薦

與其他種類(lèi)的輔助信息相比,知識(shí)圖譜的引入可以讓推薦結(jié)果具有可解釋性且更加精確[14]。將知識(shí)圖譜引入推薦算法,有以LibFM 為代表的基于Embedding 的推薦算法[15]和以PER、MetaGraph 為代表的基于Path 的推薦算法[16]?;贓mbedding 的方法通常直接使用來(lái)自知識(shí)圖譜的信息以豐富Item 或User 表示。該類(lèi)算法可分為兩類(lèi):基于翻譯的模型,如TransE[17]、TransH[18]、TransR、TransD等;語(yǔ)義匹配模型,如DistMult等?;赑ath 的方法通過(guò)構(gòu)建User-item Graph,利用知識(shí)圖譜中實(shí)體的連通性模式進(jìn)行推薦。由于該算法利用的數(shù)據(jù)庫(kù)為Book-Crossing,該圖書(shū)數(shù)據(jù)庫(kù)數(shù)據(jù)量大且較為稀疏,因此本文將采用翻譯方法[19]中效果較好的TransE 方法。

2 本文提出的推薦算法

傳統(tǒng)的圖書(shū)推薦算法未考慮到圖書(shū)語(yǔ)義信息的缺陷,因此本文提出融合知識(shí)圖譜和協(xié)同過(guò)濾的圖書(shū)推薦算法,首先通過(guò)知識(shí)圖譜自學(xué)習(xí)算法,將圖書(shū)語(yǔ)義信息轉(zhuǎn)化為圖書(shū)向量矩陣,然后利用相似性計(jì)算方法計(jì)算圖書(shū)之間的相似性,形成圖書(shū)語(yǔ)義相似性矩陣。利用協(xié)同過(guò)濾表示學(xué)習(xí),根據(jù)用戶—圖書(shū)評(píng)分矩陣,獲取圖書(shū)—圖書(shū)相似性矩陣,根據(jù)相似性計(jì)算結(jié)果獲取協(xié)同過(guò)濾推薦集合,最后將兩個(gè)結(jié)果通過(guò)一定比例的低位換高位算法進(jìn)行融合。

本文算法流程如圖1 所示。算法需要輸入用戶—圖書(shū)評(píng)分矩陣Rm*n、圖書(shū)知識(shí)圖譜和評(píng)分矩陣—知識(shí)圖譜對(duì)照表這3 部分,輸出為融合知識(shí)圖譜和協(xié)同過(guò)濾的圖書(shū)推薦算法的推薦列表。具體流程步驟描述如下:

(1)根據(jù)評(píng)分矩陣—知識(shí)圖譜對(duì)照表,將用戶—圖書(shū)評(píng)分矩陣Rm*n進(jìn)行篩選,獲取與知識(shí)圖譜相關(guān)的評(píng)分矩陣R′m*n。

(2)利用評(píng)分矩陣獲取圖書(shū)集合,再計(jì)算圖書(shū)與圖書(shū)之間的相似性并得到圖書(shū)相似性矩陣。

(3)利用TransE 算法進(jìn)行訓(xùn)練,最后得到實(shí)體向量集E 和關(guān)系向量集R。

(4)獲取知識(shí)圖譜中的圖書(shū)集合,利用上一步得到的實(shí)體向量集E,通過(guò)余弦相似度計(jì)算圖書(shū)與圖書(shū)之間的語(yǔ)義相似性并得到圖書(shū)語(yǔ)義相似性矩陣。

(5)根據(jù)當(dāng)前用戶的歷史評(píng)分?jǐn)?shù)據(jù),獲取歷史交互的圖書(shū)列表,根據(jù)列表中的圖書(shū)分別獲取協(xié)同過(guò)濾推薦集合以及語(yǔ)義推薦集合,最后將兩個(gè)推薦集合排序。

四是順利啟動(dòng)實(shí)施世行貸款節(jié)水灌溉二期項(xiàng)目。配合河北、山西和寧夏三?。ㄗ灾螀^(qū))完成了世行貸款節(jié)水灌溉二期項(xiàng)目轉(zhuǎn)貸協(xié)定的簽訂和項(xiàng)目啟動(dòng)實(shí)施工作,制定了項(xiàng)目和資金管理辦法;組織開(kāi)展了項(xiàng)目設(shè)計(jì)、實(shí)施方案技術(shù)性審核以及管理人員培訓(xùn)。

(6)選擇融合比例,分別計(jì)算出協(xié)同過(guò)濾推薦集占比x及語(yǔ)義近鄰?fù)扑]集占比y,然后取協(xié)同過(guò)濾推薦集中前x個(gè)成員及語(yǔ)義推薦集中的前y個(gè)數(shù)據(jù)。如果在取得過(guò)程中某個(gè)數(shù)據(jù)已經(jīng)存在,則順延取下一位。

2.1 協(xié)同過(guò)濾推薦算法

基于物品的協(xié)同過(guò)濾推薦算法是在用戶—圖書(shū)評(píng)分矩陣上為每本書(shū)找到K 個(gè)與之最相似的最近鄰,根據(jù)相鄰圖書(shū)的相似度權(quán)重以及用戶對(duì)圖書(shū)的偏好計(jì)算相似度矩陣。在相似度方法選擇中,本文使用同現(xiàn)相似度公式計(jì)算圖書(shū)之間的相似度。

其中,分母|N(x)|是喜歡物品x的用戶數(shù),而分子|N(x) ∩N(y)|是同時(shí)喜歡物品x和物品y的用戶數(shù)據(jù)。

由于圖書(shū)會(huì)有暢銷(xiāo)和冷門(mén)的區(qū)別,同現(xiàn)相似度公式容易形成任何圖書(shū)都會(huì)與暢銷(xiāo)書(shū)有較大相似度的現(xiàn)象,于是本文懲罰了暢銷(xiāo)書(shū)的權(quán)重減少暢銷(xiāo)書(shū)與很多圖書(shū)相似的可能性。同時(shí),圖書(shū)推薦不僅有暢銷(xiāo)書(shū)的影響,還會(huì)有活躍用戶的影響。因此,本文還加入了對(duì)活躍用戶的懲罰使推薦結(jié)果更加準(zhǔn)確。

其中,|N(y)|表示喜歡圖書(shū)y的用戶數(shù),喜歡圖書(shū)y的用戶越多,說(shuō)明圖書(shū)y越暢銷(xiāo),同時(shí)結(jié)果也會(huì)越小,兩本書(shū)的相似度就會(huì)越低。u代表同時(shí)給圖書(shū)x和圖書(shū)y評(píng)分的用戶,|N(u)|是用戶u一共評(píng)分過(guò)的圖書(shū)數(shù)量。用戶u評(píng)價(jià)過(guò)的圖書(shū)數(shù)量越少,結(jié)果就會(huì)越高,兩本書(shū)的相似度也就越低,這樣避免了暢銷(xiāo)書(shū)及活躍用戶對(duì)相似度的影響。

2.2 知識(shí)圖譜

知識(shí)圖譜的本質(zhì)是一種揭示實(shí)體之間關(guān)系的語(yǔ)義網(wǎng)絡(luò),能夠利用已存在的關(guān)系數(shù)據(jù)集判斷未標(biāo)注實(shí)體間的關(guān)系,使相似度計(jì)算結(jié)果更加準(zhǔn)確[20]。圖書(shū)知識(shí)圖譜如圖2所示。

Fig.2 Book knowledge graph圖2 圖書(shū)知識(shí)圖譜

本文采用TransE 算法進(jìn)行知識(shí)圖譜訓(xùn)練。以往訓(xùn)練三元組的方法大多存在參數(shù)過(guò)多問(wèn)題,以至于模型過(guò)于復(fù)雜難以理解,而TransE 算法能夠有效學(xué)習(xí)三元組的向量表達(dá)。通過(guò)將每個(gè)三元組實(shí)例(head,relation,tail)中的關(guān)系relation 看作從實(shí)體head 到實(shí)體tail 的翻譯,不斷調(diào)整h、r和t(head、relation 和tail 的向量),從而使(h+r)盡可能與t相等,即h+r=t。TransE 算法訓(xùn)練得到圖書(shū)語(yǔ)義向量矩陣及關(guān)系向量矩陣,再利用相似性公式將圖書(shū)語(yǔ)義向量矩陣轉(zhuǎn)化為圖書(shū)語(yǔ)義相似性矩陣,最后可以得出每本圖書(shū)的語(yǔ)義近鄰。本文在選取相似性計(jì)算方法時(shí),選用的是余弦相似度公式,如式(3)所示。

其中,當(dāng)A、B 兩個(gè)圖書(shū)向量相似度越大,sim(A,B)數(shù)值就越接近1,知識(shí)圖譜中兩者的語(yǔ)義相似性越高,反之,相似性越低。最終計(jì)算出圖書(shū)—圖書(shū)語(yǔ)義相似性矩陣。根據(jù)相似度公式可以得知,矩陣是一個(gè)對(duì)稱陣,即a(i,j)=a(j,i)。通過(guò)矩陣,可以獲得每本圖書(shū)的語(yǔ)義推薦集合。

為更好地實(shí)現(xiàn)新圖書(shū)推薦(此處新圖書(shū)指評(píng)分?jǐn)?shù)據(jù)少于2 條的圖書(shū)),在計(jì)算新圖書(shū)的語(yǔ)義相似性時(shí),加入閾值判斷,即在計(jì)算圖書(shū)A,B 的語(yǔ)義相似性時(shí),判斷圖書(shū)B(niǎo) 是否為新圖書(shū),若B 是新圖書(shū),則會(huì)獲取與圖書(shū)A 相似性最大圖書(shū)X 的相似度maxsim(A,X)以及與圖書(shū)A 相似性最小圖書(shū)N 的相似度minsim(A,N)),若sim(A,B) >(maxsim+minsim),sim(A,B)的相似度計(jì)算如式(4)所示。

這樣既可以增加新圖書(shū)語(yǔ)義推薦概率,也不會(huì)造成新圖書(shū)與任何圖書(shū)都有較大相似性的現(xiàn)象,對(duì)解決物品冷啟動(dòng)有一定意義。

2.3 算法融合

本文創(chuàng)新性地使用高位替換低位的方式進(jìn)行融合,即首先將知識(shí)圖譜推薦結(jié)果集及協(xié)同過(guò)濾推薦結(jié)果集按相似度大小倒序排序,然后將知識(shí)圖譜推薦集合與協(xié)同過(guò)濾推薦集合按適當(dāng)?shù)谋壤x取相似度高的圖書(shū)集成最優(yōu)結(jié)果集。這樣既考慮了外部評(píng)分?jǐn)?shù)據(jù),也考慮了圖書(shū)語(yǔ)義信息,同時(shí)可以緩解新物品因?yàn)樵u(píng)分信息不足而無(wú)法得到推薦的現(xiàn)象。融合過(guò)程如下:

假定要為用戶推薦N 本圖書(shū),ListCF為協(xié)同過(guò)濾算法推薦的集合(已排序),ListKG為語(yǔ)義相似度矩陣推薦的集合(已排序)。ListBook為最終給用戶推薦的結(jié)果集,融合比例為x,其取值范圍為x∈[0,1]。在最終推薦結(jié)果集中,若ListCF集合不為空,則ListCF集合的數(shù)量為其中為向下取整,ListKG的數(shù)量為kglen=N-cflen。融合算法根據(jù)輸入的融合比例分別計(jì)算兩個(gè)近鄰集中數(shù)量占比。算法在取推薦數(shù)據(jù)時(shí)會(huì)判斷結(jié)果集中是否包含本數(shù)據(jù),最終得到結(jié)果集ListBook。

3 實(shí)驗(yàn)及結(jié)果分析

3.1 實(shí)驗(yàn)數(shù)據(jù)集

本文使用Book-Crossing 數(shù)據(jù)集進(jìn)行測(cè)試。將該數(shù)據(jù)集信息轉(zhuǎn)換為隱式反饋數(shù)據(jù),其中每個(gè)條目都標(biāo)有1,表示用戶對(duì)該圖書(shū)給予正面評(píng)價(jià),并為每個(gè)用戶采樣一個(gè)標(biāo)記為0 的未監(jiān)視圖書(shū)。此外,Book-Crossing 數(shù)據(jù)集數(shù)據(jù)較為稀疏,因此未設(shè)置肯定評(píng)分閾值。

知識(shí)圖譜則利用Microsoft Satori 構(gòu)建。首先從整個(gè)KG 中選擇關(guān)系包含“書(shū)”的三元組子集,然后通過(guò)將Book-Crossing 中ID與三元組頭部或尾部匹配以獲取有效數(shù)據(jù),同時(shí)排除沒(méi)有匹配或者多匹配實(shí)體的項(xiàng)目。此時(shí),Book-Crossing 中每一個(gè)ID都可以在三元組中找到對(duì)應(yīng)數(shù)據(jù),但三元組中頭部或尾部在Book-crossing 中不一定有數(shù)據(jù),即模擬現(xiàn)實(shí)中某些圖書(shū)只有語(yǔ)義信息而沒(méi)有評(píng)分信息。

本文將評(píng)分?jǐn)?shù)據(jù)隨機(jī)分為4 份,選取其中1 份作為測(cè)試集合,其他3 份作為訓(xùn)練集,每次實(shí)驗(yàn)結(jié)果運(yùn)行5 次取平均值。數(shù)據(jù)集詳細(xì)信息如表1所示。

Table 1 Book-Crossing data set information表1 Book-Crossing數(shù)據(jù)集信息

3.2 實(shí)驗(yàn)環(huán)境

實(shí)驗(yàn)硬件處理器型號(hào)為Inter(R)Core(TM)i5-1021U,內(nèi)存為12G,軟件環(huán)境為Python 3.7。

3.3 評(píng)價(jià)指標(biāo)

對(duì)于推薦算法結(jié)果,本文使用3 個(gè)評(píng)價(jià)指標(biāo)進(jìn)行分析:精確率(Precision)、召回率(Recall)、F1 分?jǐn)?shù)。3 個(gè)評(píng)價(jià)指標(biāo)都可以根據(jù)混淆矩陣計(jì)算得出。精確率表示預(yù)測(cè)為正樣本的樣本中,正確預(yù)測(cè)為正樣本的概率;召回率表示正確預(yù)測(cè)出正樣本占實(shí)際正樣本的概率;F1 分?jǐn)?shù)折中了召回率和精確率,如式(5)—式(7)所示。

其中,TP代表樣本的真實(shí)類(lèi)別為正,最后預(yù)測(cè)得到的結(jié)果也為正,F(xiàn)P代表樣本的真實(shí)類(lèi)別為負(fù),最后預(yù)測(cè)得到的結(jié)果為負(fù);FN代表樣本的真實(shí)類(lèi)別為正,最后預(yù)測(cè)得到的結(jié)果卻為負(fù)。

3.4 實(shí)驗(yàn)結(jié)果分析

實(shí)驗(yàn)將融合比例作為變量,顯示不同融合比例下的推薦效果。本次實(shí)驗(yàn)選取Top-K 的K 值為10,定義相似圖書(shū)數(shù)量為20。協(xié)同過(guò)濾推薦:對(duì)語(yǔ)義相似性推薦的融合比例從0∶10 到10∶0 分別做實(shí)驗(yàn),每個(gè)融合比例均運(yùn)行10 遍求平均值。精確率、召回率、F1 指標(biāo)曲線如如圖3 所示。橫坐標(biāo)為融合比例,縱坐標(biāo)分別為精確度、召回率、F1值。從圖3 可以看出,精確率、召回率、F1 在融合比例為5∶5 時(shí)效果最好,即進(jìn)行Top-10 推薦時(shí),協(xié)同過(guò)濾推薦與語(yǔ)義相似性推薦各占一半時(shí),效果最好。

Fig.3 Curve of precision rate,recall rate and F1 score圖3 精確率、召回率、F1 score指標(biāo)曲線

本文選取經(jīng)典和新的推薦算法進(jìn)行比較,如KGCN 算法、RippleNet 算法和RKGE-CF 算法與CKCF 算法進(jìn)行比較,驗(yàn)證本文算法的可行性和優(yōu)越性。由于F1 分?jǐn)?shù)折中召回率和精確率,則展示召回率和精確度指標(biāo)上的對(duì)比結(jié)果。本文算法與KGCN,RippleNet 和RKGE-CF 算法在召回率和精確度指標(biāo)上的對(duì)比結(jié)果如圖4、圖5 所示。從圖4可以看出,不管K 值為多少,4 種算法的召回率不相上下,說(shuō)明本文算法雖有優(yōu)勢(shì),但優(yōu)勢(shì)不明顯。

Fig.4 Comparison of recall rates of various algorithm圖4 各算法召回率比較

從圖5 可以看出,本文算法在Top-5、Top-10 優(yōu)勢(shì)明顯,在Top-20 及Top-50 上也有一定提高。CKCF 算法在精確率指標(biāo)上隨TOP-K 的K 值呈遞減趨勢(shì)變化。精確率最高在TOP-5 時(shí)達(dá)0.043 7,與其他算法相比有明顯提高。在TOP-50時(shí)達(dá)0.013 1,但相比其他算法仍有一定提高。

Fig.5 Comparison of precision of various algorithm圖5 各算法精確率比較

綜合考慮,本算法在計(jì)算物品相似度時(shí)不僅懲罰了熱門(mén)圖書(shū)還懲罰了活躍用戶的比重,使得協(xié)同過(guò)濾推薦結(jié)果更加準(zhǔn)確,同時(shí)基于知識(shí)圖譜訓(xùn)練計(jì)算圖書(shū)的語(yǔ)義相似度,然后將評(píng)分近鄰與語(yǔ)義近鄰相結(jié)合,從而提升推薦質(zhì)量。

4 結(jié)語(yǔ)

本文提出一種融合知識(shí)圖譜和協(xié)同過(guò)濾的圖書(shū)推薦算法CKCF,通過(guò)協(xié)同過(guò)濾發(fā)現(xiàn)用戶現(xiàn)有興趣,同時(shí)利用知識(shí)圖譜挖掘用戶潛在興趣,最后將兩者融合以提升推薦效果。CKCF 算法能夠利用TransE 將三元組數(shù)據(jù)轉(zhuǎn)換為低維空間向量矩陣,獲取圖書(shū)實(shí)體向量矩陣。通過(guò)余弦相似度公式計(jì)算出每本圖書(shū)之間的語(yǔ)義相似性,同時(shí)提升新圖書(shū)的語(yǔ)義相似性,生成語(yǔ)義相似性矩陣并獲取圖書(shū)語(yǔ)義近鄰。在獲取協(xié)同過(guò)濾推薦集合時(shí)改進(jìn)相似度計(jì)算方法,加入懲罰因子減少暢銷(xiāo)書(shū)及活躍用戶對(duì)推薦結(jié)果的影響。最后將語(yǔ)義相似性矩陣推薦結(jié)果與協(xié)同過(guò)濾推薦結(jié)果集融合,得到個(gè)性化推薦結(jié)果。本文算法在語(yǔ)義的層面上增強(qiáng)了協(xié)同過(guò)濾算法推薦效果,但算法還有待優(yōu)化之處,如未考慮知識(shí)圖譜關(guān)系向量矩陣,這為今后工作提出了新的思路。

猜你喜歡
相似性圖譜語(yǔ)義
一類(lèi)上三角算子矩陣的相似性與酉相似性
繪一張成長(zhǎng)圖譜
淺析當(dāng)代中西方繪畫(huà)的相似性
語(yǔ)言與語(yǔ)義
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
低滲透黏土中氯離子彌散作用離心模擬相似性
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
V4國(guó)家經(jīng)濟(jì)的相似性與差異性
雜草圖譜
仙居县| 郴州市| 桂阳县| 阳江市| 浦东新区| 崇文区| 桃源县| 隆德县| 嵊泗县| 富宁县| 抚顺市| 孟津县| 连州市| 广水市| 惠州市| 临沂市| 临朐县| 杭州市| 宜春市| 浠水县| 卫辉市| 颍上县| 抚顺市| 江城| 蒲城县| 灌云县| 蒙自县| 闽侯县| 澜沧| 福州市| 昆明市| 周宁县| 格尔木市| 五大连池市| 新竹市| 宁明县| 中宁县| 保定市| 长春市| 井陉县| 石屏县|