国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的跨領(lǐng)域推薦研究

2022-05-19 06:58馮翠翠
情報(bào)學(xué)報(bào) 2022年4期
關(guān)鍵詞:冷啟動(dòng)異質(zhì)向量

易 明,劉 明,馮翠翠

(華中師范大學(xué)信息管理學(xué)院,武漢 430079)

1 引 言

當(dāng)前,個(gè)性化推薦的應(yīng)用主要局限在單一領(lǐng)域,即:根據(jù)某一領(lǐng)域(如圖書領(lǐng)域、音樂領(lǐng)域等)的用戶數(shù)據(jù)獲取其興趣偏好,并據(jù)此開展面向該領(lǐng)域的個(gè)性化推薦。然而,單一領(lǐng)域的個(gè)性化推薦不可避免地受到數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”等問題的影響。事實(shí)上,很多互聯(lián)網(wǎng)平臺(tái)所涉及的領(lǐng)域是多樣化的。以豆瓣網(wǎng)為例,它同時(shí)涉及書籍、電影、音樂等多個(gè)領(lǐng)域,由此會(huì)產(chǎn)生不同領(lǐng)域的用戶數(shù)據(jù)。不同領(lǐng)域的用戶數(shù)據(jù)并不都是隨機(jī)的,可能會(huì)蘊(yùn)含著許多潛在的模式,例如,喜歡推理類圖書的用戶,可能也對(duì)推理類電影非常感興趣。這種在不同領(lǐng)域內(nèi)具有潛在相似的模式使得跨領(lǐng)域推薦成為可能。所謂跨領(lǐng)域推薦就是利用源領(lǐng)域的用戶數(shù)據(jù)實(shí)現(xiàn)目標(biāo)領(lǐng)域的個(gè)性化推薦,其本質(zhì)就是將源領(lǐng)域已有的知識(shí)遷移到目標(biāo)領(lǐng)域,一方面可以緩解目標(biāo)領(lǐng)域數(shù)據(jù)“稀疏性”、用戶“冷啟動(dòng)”等問題,另一方面可以構(gòu)建更為優(yōu)化的推薦模型?,F(xiàn)有的大部分跨領(lǐng)域推薦的工作都只使用了用戶對(duì)物品的評(píng)分信息。在領(lǐng)域評(píng)分?jǐn)?shù)據(jù)高度稀疏的情況下,僅利用評(píng)分信息無法有效識(shí)別用戶的真實(shí)興趣偏好,尤其是在領(lǐng)域內(nèi)用戶完全沒有數(shù)據(jù)的情況下,很可能導(dǎo)致跨領(lǐng)域推薦知識(shí)遷移的偏差以及“負(fù)遷移”的狀況。除了評(píng)分信息以外,現(xiàn)實(shí)世界還存在大量的物品特征信息,利用這些特征信息可以捕捉用戶高階的潛在偏好,進(jìn)而提高跨領(lǐng)域推薦中知識(shí)遷移的效果。然而,這種復(fù)雜的高階特征關(guān)系往往難以建模??紤]到異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)可以將領(lǐng)域內(nèi)的各種實(shí)體映射為低維稠密的向量進(jìn)行輸出,且能夠捕捉到這種高階相似,對(duì)跨領(lǐng)域推薦中知識(shí)遷移具有較好的適用性,因此,本文試圖將異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)與跨領(lǐng)域推薦有機(jī)融合,并開展相應(yīng)的研究探索。本文的主要貢獻(xiàn)如下:

(1)優(yōu)化了聯(lián)合矩陣分解。傳統(tǒng)的聯(lián)合矩陣分解在跨領(lǐng)域推薦場景中共享了用戶的潛在因子,導(dǎo)致提取到的用戶特征沒有體現(xiàn)出充分的領(lǐng)域性,從而出現(xiàn)“負(fù)遷移”,為此本文利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)聯(lián)合矩陣分解,通過“映射函數(shù)”將用戶特征映射到不同領(lǐng)域,體現(xiàn)領(lǐng)域間的差異性。

(2)提出了一種新的跨領(lǐng)域推薦方法。該方法同時(shí)利用評(píng)分信息和特征信息,在神經(jīng)網(wǎng)絡(luò)優(yōu)化聯(lián)合矩陣分解的基礎(chǔ)上,融合了異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的高階特征,從而達(dá)到充分利用領(lǐng)域知識(shí)的目的,有效緩解了單領(lǐng)域推薦中存在的數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”問題。

2 相關(guān)研究

2.1 跨領(lǐng)域推薦

跨領(lǐng)域推薦的實(shí)質(zhì)就是借助源領(lǐng)域用戶數(shù)據(jù)優(yōu)化目標(biāo)領(lǐng)域的推薦性能。從目前的研究現(xiàn)狀來看,具體的優(yōu)化路徑主要包括緩解數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”兩個(gè)方面。

在緩解數(shù)據(jù)“稀疏性”問題方面,Berkovsky等[1-2]將多個(gè)領(lǐng)域的評(píng)分矩陣直接合并,從而在推薦過程中引入了更多的領(lǐng)域信息,進(jìn)而利用協(xié)同過濾完成跨領(lǐng)域推薦;Li 等[3]對(duì)源領(lǐng)域用戶和物品分別進(jìn)行聚類,通過引入“密碼書”形成聚類后的“濃縮矩陣”,由此將源領(lǐng)域的知識(shí)遷移到數(shù)據(jù)稀疏的目標(biāo)領(lǐng)域;Singh 等[4]提出了將相關(guān)聯(lián)的矩陣進(jìn)行聯(lián)合分解的方法,從而使矩陣分解適用于跨領(lǐng)域推薦,通過聯(lián)合矩陣分解獲取不同領(lǐng)域間的潛在特征,有助于解決目標(biāo)領(lǐng)域的數(shù)據(jù)“稀疏性”;陳文珺等[5]利用領(lǐng)域中的用戶-物品評(píng)分矩陣,分別對(duì)多領(lǐng)域用戶和物品進(jìn)行潛在特征提取,并將用戶-物品特征向量分別進(jìn)行特征聚類,同時(shí)對(duì)多領(lǐng)域特征矩陣進(jìn)行領(lǐng)域適應(yīng)融合,得到共享知識(shí)模型并進(jìn)行遷移學(xué)習(xí),提高了目標(biāo)領(lǐng)域推薦性能;Zhu 等[6]提出了一種基于遷移學(xué)習(xí)和深度學(xué)習(xí)的跨領(lǐng)域推薦方法,在評(píng)分矩陣分解的基礎(chǔ)上利用深度學(xué)習(xí)映射不同域的特征,并用域內(nèi)評(píng)分稀疏性指導(dǎo)參數(shù)的學(xué)習(xí);Gao 等[7]將注意力機(jī)制引入跨領(lǐng)域推薦,以項(xiàng)目級(jí)注意力層和域級(jí)注意力層區(qū)分不同項(xiàng)目以及領(lǐng)域的重要性;Hu 等[8]和 He 等[9]提出的 CoNet(cross networks) 利 用 NCF (neural collaborative filtering)組成三個(gè)隱層和兩個(gè)交叉單元,其中NCF 是矩陣分解在神經(jīng)網(wǎng)絡(luò)上的廣義擴(kuò)展,因此,CoNet 充分利用了用戶和物品之間的非線性交互關(guān)系;Vijaiku‐mar 等[10]改進(jìn)了 CMF (collective matrix factorization),并用堆棧自編碼器優(yōu)化領(lǐng)域內(nèi)用戶和物品的特征表示,使模型同時(shí)具有矩陣分解和深度學(xué)習(xí)的優(yōu)點(diǎn)。

在緩解用戶“冷啟動(dòng)”問題方面,Kazama 等[11]通過構(gòu)建用戶對(duì)物品的評(píng)分網(wǎng)絡(luò),利用word2vec 得到不同領(lǐng)域用戶的特征向量,然后學(xué)習(xí)一個(gè)線性映射函數(shù)將源領(lǐng)域用戶特征映射到目標(biāo)領(lǐng)域,從而可以完成目標(biāo)領(lǐng)域“冷啟動(dòng)”用戶的推薦;Man 等[12]提出的 EMCDR (embedding and mapping framework for cross-domain recommendation) 算法通過評(píng)分矩陣進(jìn)行矩陣分解得到特征向量,進(jìn)而利用多層感知機(jī)學(xué)習(xí)了重疊數(shù)據(jù)的非線性映射,取得了比之前線性映射更好的效果。

由上文不難發(fā)現(xiàn),目前大多數(shù)跨領(lǐng)域推薦算法主要利用的是評(píng)分信息,而對(duì)于源領(lǐng)域和目標(biāo)領(lǐng)域所包含的其他特征信息,如電影的導(dǎo)演、圖書的作者等,都沒有充分融入跨領(lǐng)域推薦算法。評(píng)分信息的“稀疏性”是個(gè)性化推薦中無法避免的問題,過于稀疏的信息會(huì)導(dǎo)致用戶興趣識(shí)別的偏差,進(jìn)而降低推薦效果。在跨領(lǐng)域推薦中也是如此,雖然能夠通過知識(shí)遷移獲取其他領(lǐng)域的知識(shí),但領(lǐng)域內(nèi)興趣識(shí)別的不充分性會(huì)增加知識(shí)遷移的誤差。解決此問題的關(guān)鍵是將領(lǐng)域內(nèi)實(shí)體之間的相似性進(jìn)行高階擴(kuò)散,從簡單的一階關(guān)系擴(kuò)展為高階關(guān)系。特征信息可以作為相似性擴(kuò)散的橋梁,從不同的特征角度出發(fā),獲取具有不同語義的相似性度量,能夠有效緩解興趣識(shí)別偏差問題,有利于提高跨領(lǐng)域推薦知識(shí)遷移的準(zhǔn)確性。

2.2 網(wǎng)絡(luò)表示學(xué)習(xí)

網(wǎng)絡(luò)表示學(xué)習(xí)是一種將網(wǎng)絡(luò)中節(jié)點(diǎn)的結(jié)構(gòu)信息和屬性信息用低維稠密向量形式表示的一種技術(shù)。傳統(tǒng)的網(wǎng)絡(luò)表示一般使用高維的稀疏向量,但高維稀疏向量在使用統(tǒng)計(jì)學(xué)習(xí)方法時(shí)存在諸多局限,學(xué)者們轉(zhuǎn)而探索將網(wǎng)絡(luò)中節(jié)點(diǎn)表示為低維稠密的向量表示的方法[13]。Perozzi 等[14]提出的 DeepWalk 算法通過隨機(jī)游走的方式產(chǎn)生訓(xùn)練語料,利用word2vec的思想,學(xué)習(xí)節(jié)點(diǎn)表示。Grover 等[15]在DeepWalk 的基礎(chǔ)上提出了node2vec,并引入了偏置參數(shù),在隨機(jī)游走的過程中運(yùn)用了寬度優(yōu)先搜索和深度優(yōu)先搜索的策略,指導(dǎo)語料的生成。然而,DeepWalk 和node2vec 都只考慮了一階相似性。Tang 等[16]提出的LINE(large-scale information network embedding)算法考慮了二階相似性,認(rèn)為兩個(gè)節(jié)點(diǎn)的共享鄰居越多,則兩個(gè)節(jié)點(diǎn)存在的相似性越高,并利用不同的目標(biāo)函數(shù)保存網(wǎng)絡(luò)的一階相似性和二階相似性;Wang 等[17]提出的SDNE (structural deep network em‐bedding)算法將有監(jiān)督學(xué)習(xí)的拉普拉斯矩陣和無監(jiān)督學(xué)習(xí)的自編碼器進(jìn)行結(jié)合,分別捕捉一階相似性和二階相似性,提出了一種半監(jiān)督學(xué)習(xí)方法來學(xué)習(xí)節(jié)點(diǎn)的表示。然而,這些經(jīng)典的網(wǎng)絡(luò)表示學(xué)習(xí)方法都只針對(duì)同質(zhì)網(wǎng)絡(luò)。

異質(zhì)信息網(wǎng)絡(luò)是一種特殊類型的網(wǎng)絡(luò),由多種類型的節(jié)點(diǎn)、鏈接關(guān)系以及屬性信息組成,具有大規(guī)模、異質(zhì)性等特點(diǎn)[18]。針對(duì)異質(zhì)信息網(wǎng)絡(luò),學(xué)者們提出了相應(yīng)的網(wǎng)絡(luò)表示學(xué)習(xí)方法。Chang 等[19]針對(duì)不同類型的節(jié)點(diǎn)進(jìn)行向量表示,然后將所有的向量映射到相同的空間,從而讓向量有了相同維度的表達(dá)。Dong 等[20]提出了metapath2vec 算法,先通過元路徑指導(dǎo)隨機(jī)游走,再用Skip-Gram 訓(xùn)練節(jié)點(diǎn)序列產(chǎn)生節(jié)點(diǎn)嵌入向量。在元路徑的基礎(chǔ)上,Zhang等[21]提 出 的 MetaGraph2Vec 算法 ,以 及 Zhao 等[22]提出的FMG(factorization machine with group)算法,利用元圖的方法代替元路徑,彌補(bǔ)了元路徑不能獲取部分語義的缺陷。Fu 等[23]提出了HIN2Vec 算法,采用完全的隨機(jī)游走的策略選取訓(xùn)練集,通過神經(jīng)網(wǎng)絡(luò)模型預(yù)測兩個(gè)節(jié)點(diǎn)是否存在特定的關(guān)系,同時(shí)學(xué)習(xí)異構(gòu)網(wǎng)絡(luò)中節(jié)點(diǎn)和元路徑的向量表示。異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的優(yōu)越特性使其在各種場景都得到了廣泛的應(yīng)用。例如,劉云楓等[24]構(gòu)建由作者、論文、出版物等節(jié)點(diǎn)組成的異質(zhì)信息網(wǎng)絡(luò),利用元結(jié)構(gòu)提取語義,有效提高了學(xué)者推薦的準(zhǔn)確性;林原等[25]構(gòu)建了作者-作者、作者-機(jī)構(gòu)、作者-關(guān)鍵詞、機(jī)構(gòu)-關(guān)鍵詞的異質(zhì)信息網(wǎng)絡(luò),利用DeepWalk 得到節(jié)點(diǎn)低維向量,最后通過向量的相似度計(jì)算實(shí)現(xiàn)合作對(duì)象、合作領(lǐng)域挖掘;Zheng 等[26]通過元路徑提取異質(zhì)信息網(wǎng)絡(luò)中的多種相似性,通過將相似性加入損失函數(shù)的正則項(xiàng),提高了推薦算法的準(zhǔn)確性;Shi 等[27]在傳統(tǒng)矩陣分解的基礎(chǔ)上,加入了異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的特征向量,取得了比傳統(tǒng)矩陣分解更好的效果;肖璐等[28]用網(wǎng)絡(luò)表示學(xué)習(xí)的方法將網(wǎng)絡(luò)中的知識(shí)單元表示成低維稠密的向量,其中知識(shí)單元網(wǎng)絡(luò)可以視為一個(gè)異質(zhì)信息網(wǎng)絡(luò),最后以丁香園心血管論壇為例,挖掘了社區(qū)網(wǎng)絡(luò)中多元知識(shí)的聯(lián)系。

針對(duì)當(dāng)前跨領(lǐng)域推薦存在的一些問題,利用異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí),可以得到用戶和物品的嵌入向量,不僅保存了異質(zhì)網(wǎng)絡(luò)的結(jié)構(gòu)特征,而且低維稠密的向量能夠很好地完成推薦任務(wù)。更重要的是,通過異質(zhì)網(wǎng)絡(luò)表示學(xué)習(xí)得到的低維稠密向量包含了領(lǐng)域中豐富的特征信息,將這些特征信息在源領(lǐng)域和目標(biāo)領(lǐng)域加以利用,可以同時(shí)達(dá)到緩解數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”的目的。

3 融合異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的跨領(lǐng)域推薦模型

基于上文的分析,本文提出一種融合異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的跨領(lǐng)域推薦模型。該模型主要由兩個(gè)模塊組成:異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)和評(píng)分預(yù)測。其中,異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)模塊提供一個(gè)異質(zhì)網(wǎng)絡(luò)表示學(xué)習(xí)框架(如圖1 所示),可以針對(duì)源領(lǐng)域異質(zhì)信息網(wǎng)絡(luò)和目標(biāo)領(lǐng)域異質(zhì)信息網(wǎng)絡(luò),通過元路徑、DeepWalk 算法生成網(wǎng)絡(luò)表示學(xué)習(xí)向量,獲取領(lǐng)域內(nèi)的特征信息。評(píng)分預(yù)測是跨領(lǐng)域推薦的核心模塊,此部分由一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)組成,在神經(jīng)網(wǎng)絡(luò)中借用了聯(lián)合矩陣分解(CMF)[4]的思想,以此獲取領(lǐng)域內(nèi)的評(píng)分信息。具體來說,神經(jīng)網(wǎng)絡(luò)共享了源領(lǐng)域和目標(biāo)領(lǐng)域的用戶嵌入,用多層感知機(jī)(multilayer perceptron,MLP) 將共享用戶嵌入映射到不同領(lǐng)域,一方面體現(xiàn)了用戶在不同領(lǐng)域的差異性,另一方面對(duì)于在某一領(lǐng)域有數(shù)據(jù)而在另一領(lǐng)域沒有數(shù)據(jù)的“冷啟動(dòng)”用戶,可以通過映射函數(shù)將其映射在冷啟動(dòng)領(lǐng)域,從而完成面向“冷啟動(dòng)”用戶的推薦。同時(shí),神經(jīng)網(wǎng)絡(luò)融入了源領(lǐng)域和目標(biāo)領(lǐng)域的物品異質(zhì)特征信息,并以損失函數(shù)為依據(jù),采用梯度下降的方法學(xué)習(xí)模型的參數(shù),從而完成最終的評(píng)分預(yù)測。

3.1 異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)

定義異質(zhì)信息網(wǎng)絡(luò)為G=(V,E)。其中,V代表領(lǐng)域內(nèi)節(jié)點(diǎn)集合(如用戶、物品、物品的特征等),E是領(lǐng)域節(jié)點(diǎn)之間邊的集合,每條邊代表各個(gè)節(jié)點(diǎn)之間的關(guān)系。網(wǎng)絡(luò)模式是對(duì)異構(gòu)信息網(wǎng)絡(luò)的元描述,表示為S= (A,R),其中,A為節(jié)點(diǎn)類型,R為鏈接類型[14]??紤]到異質(zhì)信息網(wǎng)絡(luò)包含有大量復(fù)雜的、異質(zhì)的結(jié)構(gòu)關(guān)系信息,其中的冗余信息(如特征節(jié)點(diǎn)與特征節(jié)點(diǎn)之間的關(guān)系)便成為了節(jié)點(diǎn)表示學(xué)習(xí)的“噪音”。由此,需要引入元路徑過濾掉此類冗余信息,并將異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)問題轉(zhuǎn)換為同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)問題,在降低學(xué)習(xí)難度的同時(shí)有效排除“噪音”,進(jìn)而利用經(jīng)典的DeepWalk算法進(jìn)行特征信息的學(xué)習(xí)。

元路徑是在網(wǎng)絡(luò)模式上的一條路徑P=其中,A為節(jié)點(diǎn)類型,R為鏈接類型,R=R1°R2° … °Rl,°表示關(guān)系上的合成算子。給定一條元路徑P,便可計(jì)算節(jié)點(diǎn)的連接矩陣,計(jì)算方法[22]為

其中,WAi,Aj表示節(jié)點(diǎn)類型Ai到Aj的鄰接矩陣。不同的元路徑會(huì)產(chǎn)生不同的連接矩陣,每個(gè)連接矩陣都可以視為一個(gè)同質(zhì)網(wǎng)絡(luò)。針對(duì)每個(gè)同質(zhì)網(wǎng)絡(luò),采用經(jīng)典的DeepWalk 算法進(jìn)行學(xué)習(xí)。DeepWalk 算法在網(wǎng)絡(luò)中隨機(jī)游走產(chǎn)生訓(xùn)練語料,然后用Skip-Gram 進(jìn)行訓(xùn)練,目標(biāo)函數(shù)[14]為

其中,Φ:V→Rd是一個(gè)將每個(gè)節(jié)點(diǎn)映射到d維空間上的函數(shù);Nv?V表示在給定一個(gè)元路徑下節(jié)點(diǎn)v的鄰居。

通過不同元路徑生成的同質(zhì)信息網(wǎng)絡(luò)有著不同的語義信息。這些語義信息是異質(zhì)信息網(wǎng)絡(luò)中所包含信息的子集,是排除了“噪音”信息之后的關(guān)鍵信息。將其輸入DeepWalk 中能夠得到體現(xiàn)各自語義的向量,此時(shí),多個(gè)同質(zhì)信息網(wǎng)絡(luò)之間的關(guān)系就演變成了多個(gè)向量之間的關(guān)系,需要設(shè)置合理的融合向量的函數(shù)。用戶對(duì)不同的語義應(yīng)有不同的偏好,同時(shí),向量之間的融合關(guān)系往往不是簡單的線性關(guān)系,為了更好地?cái)M合這種關(guān)系,個(gè)性化非線性的融合方法是相對(duì)較優(yōu)的選擇。因此,融合后節(jié)點(diǎn)v的異質(zhì)特征信息向量ev[27]為

3.2 評(píng)分預(yù)測

評(píng)分預(yù)測模塊是一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu),借鑒了CMF 的思想。CMF 是傳統(tǒng)矩陣分解的擴(kuò)展,在源領(lǐng)域和目標(biāo)領(lǐng)域含有重疊用戶的情況下,將源領(lǐng)域和目標(biāo)領(lǐng)域的評(píng)分預(yù)測用共享用戶潛在因子cu、源領(lǐng)域物品潛在因子和目標(biāo)領(lǐng)域物品潛在因子之間的點(diǎn)積進(jìn)行計(jì)算。此時(shí),用戶u對(duì)源領(lǐng)域物品i的預(yù)測評(píng)分以及對(duì)目標(biāo)領(lǐng)域物品j的預(yù)測評(píng)分分別為

由式(4)和式(5)不難發(fā)現(xiàn),對(duì)于CMF,共享用戶潛在因子cu同時(shí)參與兩個(gè)領(lǐng)域評(píng)分預(yù)測的運(yùn)算,沒有體現(xiàn)出源領(lǐng)域和目標(biāo)領(lǐng)域的差異性,可能導(dǎo)致“負(fù)遷移”。為此,本文借用CMF 共享用戶特征的思想構(gòu)建神經(jīng)網(wǎng)絡(luò),借用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的靈活性,引入了映射函數(shù)MLP 來體現(xiàn)領(lǐng)域的獨(dú)有特征,同時(shí),為了充分利用領(lǐng)域內(nèi)物品特征信息,還對(duì)物品異質(zhì)特征信息向量進(jìn)行聯(lián)合計(jì)算,最終完成評(píng)分預(yù)測,如圖2 所示。

圖2 融合異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)架構(gòu)

3.2.1 用戶和物品的評(píng)分向量表示

建立評(píng)分向量查詢層,將用戶和物品的0/1 編碼轉(zhuǎn)換為評(píng)分信息向量,即用戶和物品的評(píng)分信息表示。以源領(lǐng)域?yàn)槔o定一個(gè)用戶u和物品i,表 示 它 們 的 0/1 編 碼 , 評(píng) 分向量查詢層以參數(shù)矩陣表 示用戶和物品的評(píng)分信息向量,其中,d表示向量的維度,|U|和|I|分別表示用戶和物品的數(shù)量。向量查詢操作實(shí)現(xiàn)為

其中,cu為共享用戶向量,為源領(lǐng)域物品i的物品評(píng)分信息向量,分別代表了用戶和物品的評(píng)分特征。

3.2.2 共享用戶嵌入的映射

以源領(lǐng)域?yàn)槔?,在查詢到共享用戶向量cu之后,cu并不直接參與和的點(diǎn)積運(yùn)算,而是通過MLP 的映射函數(shù)將cu映射到源領(lǐng)域,得到源領(lǐng)域用戶評(píng)分信息向量以此突出不同領(lǐng)域的差異性。同時(shí),對(duì)于在某一領(lǐng)域完全沒有數(shù)據(jù),而在另一領(lǐng)域有數(shù)據(jù)的用戶,通過映射函數(shù)就可以實(shí)現(xiàn)其在“冷啟動(dòng)”領(lǐng)域的推薦,完成知識(shí)的遷移。除此之外,映射函數(shù)的引入拋棄了CMF 中必須是相同維度的前提,增強(qiáng)了模型的靈活性。

同理,對(duì)于由公式(3)計(jì)算得出的物品i的異質(zhì)特征信息向量ei,MLP 將cu映射到相應(yīng)空間得到與ei進(jìn)行計(jì)算。之所以不在異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)模塊直接學(xué)習(xí)的表示,是因?yàn)閷?duì)于一個(gè)領(lǐng)域內(nèi)完全沒有數(shù)據(jù)的用戶來說,直接學(xué)習(xí)會(huì)導(dǎo)致模型無法進(jìn)行“冷啟動(dòng)”用戶的推薦。綜上,其計(jì)算方法為

3.2.3 評(píng)分預(yù)測

評(píng)分預(yù)測由兩部分組成。第一部分為用戶和物品的評(píng)分特征的點(diǎn)積,借鑒了CMF 的思想,代表了用戶和物品評(píng)分模式的特征;第二部分為用戶和物品異質(zhì)特征信息向量的點(diǎn)積,物品異質(zhì)特征向量由領(lǐng)域內(nèi)的異質(zhì)信息網(wǎng)絡(luò)表示生成,代表了領(lǐng)域內(nèi)豐富的領(lǐng)域物品特征信息。最終的預(yù)測評(píng)分由二者求和計(jì)算得出。據(jù)此,用戶u對(duì)源領(lǐng)域物品i的預(yù)測評(píng)分為

同理,用戶u對(duì)目標(biāo)領(lǐng)域物品j的預(yù)測評(píng)分r?(t)

u,j為

3.2.4 模型訓(xùn)練

4 實(shí)驗(yàn)分析

4.1 數(shù)據(jù)集

實(shí)驗(yàn)數(shù)據(jù)集來自豆瓣網(wǎng)的電影和圖書兩個(gè)領(lǐng)域,主要包括用戶的評(píng)分?jǐn)?shù)據(jù)和物品特征信息。其中,評(píng)分?jǐn)?shù)據(jù)是用戶對(duì)某一物品的評(píng)分,評(píng)分范圍為1~5;物品屬性主要包括圖書的作者、出版商,以及電影的演員、導(dǎo)演、類型、地區(qū)。用Python 的Scrapy 框架編寫爬蟲程序,采用滾雪球的策略,隨機(jī)選取一批種子用戶并抓取其數(shù)據(jù),在此基礎(chǔ)上,從種子用戶的關(guān)注或粉絲列表中獲取更多的用戶,不斷遞增。在獲取數(shù)據(jù)集之后,分別刪除電影和圖書領(lǐng)域評(píng)分?jǐn)?shù)量少于10 的用戶;同時(shí),對(duì)于那些只在單一領(lǐng)域內(nèi)有評(píng)分行為的用戶,無法對(duì)其推薦結(jié)果進(jìn)行驗(yàn)證,因此將這部分用戶刪除。豆瓣網(wǎng)數(shù)據(jù)集最終的基本統(tǒng)計(jì)信息如表1 所示。由于電影領(lǐng)域相比于圖書領(lǐng)域的數(shù)據(jù)稀疏程度較低,因此,將電影領(lǐng)域視為源領(lǐng)域,圖書領(lǐng)域視為目標(biāo)領(lǐng)域。

表1 豆瓣網(wǎng)數(shù)據(jù)集的基本統(tǒng)計(jì)信息

4.2 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)主要分為兩個(gè)部分。第一部分為推薦效果的實(shí)驗(yàn),評(píng)分?jǐn)?shù)據(jù)不包括在某一領(lǐng)域內(nèi)沒有評(píng)分行為的用戶,即全部為“熱啟動(dòng)”用戶。隨機(jī)移除一部分用戶的評(píng)分作為測試集,剩下的作為訓(xùn)練集,訓(xùn)練集的比例分別為80%、60%和40%。第二部分為“冷啟動(dòng)”效果的實(shí)驗(yàn),將圖書領(lǐng)域視為目標(biāo)領(lǐng)域,隨機(jī)選取了一定比例的用戶,保留其電影領(lǐng)域的數(shù)據(jù),移除他們在圖書領(lǐng)域的全部評(píng)分?jǐn)?shù)據(jù),作為圖書領(lǐng)域的完全“冷啟動(dòng)”用戶參與實(shí)驗(yàn),冷啟動(dòng)用戶比例分別為10%、30%和50%,即錨用戶比例分別為90%、70%和50%。實(shí)驗(yàn)環(huán)境CPU 為Inter(R) Core(TM) i7-8750H@2.20GHz, GPU 為 NVIDIA GeForce GTX 1060 6G,RAM 為 16G,并采用 Ten‐sorFlow 編寫算法。以上實(shí)驗(yàn)分別做5 次,最終的數(shù)據(jù)結(jié)果為5 次實(shí)驗(yàn)的平均值。

在參數(shù)設(shè)置方面,經(jīng)過多次實(shí)驗(yàn),最終確認(rèn)參數(shù)為:共享用戶特征向量、源領(lǐng)域和目標(biāo)領(lǐng)域評(píng)分信息向量的維度都為64;根據(jù)文獻(xiàn)[12,27],融合后的異質(zhì)特征信息向量的維度為64,MLP 和非線性融合函數(shù)都為包含一層隱藏層的神經(jīng)網(wǎng)絡(luò),隱藏層神經(jīng)元的個(gè)數(shù)為128,其中MLP 的隱藏層的激活函數(shù)為tanh,非線性融合函數(shù)隱藏層和輸出層激活函數(shù)都為Sigmoid 函數(shù),學(xué)習(xí)速率為0.0001,正則化參數(shù)λ為0.01,由于學(xué)習(xí)速率較低,迭代次數(shù)為3000 次。

在元路徑的選擇方面,先分別構(gòu)造了圖書領(lǐng)域和電影領(lǐng)域的異質(zhì)網(wǎng)絡(luò)。在圖書領(lǐng)域,提取了以圖書開頭和結(jié)尾的元路徑;同理,在電影領(lǐng)域,提取了以電影開頭和結(jié)尾的元路徑。不同的元路徑代表了不同的語義,例如,元路徑“BUB”表示兩本書被同一用戶閱讀,代表了兩本書在用戶層面的相似性。本實(shí)驗(yàn)所使用的元路徑和代表的語義如表2所示。

表2 豆瓣網(wǎng)數(shù)據(jù)集的元路徑及其語義

4.3 對(duì)比模型和評(píng)價(jià)指標(biāo)

為了驗(yàn)證本文方法的有效性,將選擇一系列對(duì)比模型進(jìn)行效果對(duì)比。總體上說,對(duì)比模型分為單領(lǐng)域推薦模型和跨領(lǐng)域推薦模型。單領(lǐng)域推薦模型用來證明本文模型可以有效提升推薦效果;跨領(lǐng)域推薦模型則用來證明本文模型能更有效地遷移源領(lǐng)域數(shù)據(jù),從而緩解目標(biāo)領(lǐng)域的數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”問題。由此,本文選擇了以下6 種模型作為對(duì)比模型。

(1) PMF (probabilistic matrix factorization)[29]:概率矩陣分解,經(jīng)典的單領(lǐng)域矩陣分解算法,將某個(gè)領(lǐng)域的評(píng)分矩陣分解為用戶矩陣和物品矩陣,從而預(yù)測缺失評(píng)分。

(2)CDCF-U(user-based cross-domain collabora‐tive filtering)[30]:基于用戶的跨領(lǐng)域協(xié)同過濾模型,將多個(gè)領(lǐng)域視為同一領(lǐng)域進(jìn)行矩陣合并,使用傳統(tǒng)的基于用戶的協(xié)同過濾進(jìn)行評(píng)分的預(yù)測。

(3) CDCF-I(item-based cross-domain collabora‐tive filtering)[30]:基于物品的跨領(lǐng)域協(xié)同過濾模型,與CDCF-U 類似,將多個(gè)領(lǐng)域視為同一領(lǐng)域進(jìn)行矩陣合并,使用傳統(tǒng)的基于物品的協(xié)同過濾進(jìn)行評(píng)分的預(yù)測。

(4)CMF[4]:聯(lián)合矩陣分解,經(jīng)典的跨領(lǐng)域推薦模型,將源領(lǐng)域和目標(biāo)領(lǐng)域的評(píng)分矩陣進(jìn)行聯(lián)合分解,共享不同領(lǐng)域的用戶矩陣,從而預(yù)測缺失評(píng)分。

(5)EMCDR[12]:解決“冷啟動(dòng)”問題的跨領(lǐng)域推薦模型,對(duì)用戶評(píng)分矩陣進(jìn)行分解,然后使用非線性映射函數(shù)進(jìn)行領(lǐng)域間的知識(shí)遷移。

(6) NeuCDCF (neural cross-domain collabora‐tive filtering)[10]:一種新的跨領(lǐng)域推薦算法,利用用戶對(duì)物品的評(píng)分,通過構(gòu)建矩陣分解和深度神經(jīng)網(wǎng)絡(luò)兩個(gè)模塊進(jìn)行評(píng)分預(yù)測。

其中,PMF 作為經(jīng)典的單領(lǐng)域推薦方法,相關(guān)的研究成果與應(yīng)用實(shí)踐都取得了較好的效果[31],故將其作為對(duì)比模型驗(yàn)證跨領(lǐng)域推薦相比于單領(lǐng)域推薦的優(yōu)越性;CDCF-U 和CDCF-I 將跨領(lǐng)域推薦問題簡單轉(zhuǎn)化為單領(lǐng)域推薦問題,可能導(dǎo)致“負(fù)遷移”,以此作為對(duì)比模型,可以有效驗(yàn)證本文模型的知識(shí)遷移能力;CMF 是一種經(jīng)典的跨領(lǐng)域推薦方法,也是本文模型思想的基點(diǎn),以此作為比對(duì)模型來驗(yàn)證CMF 改進(jìn)后的推薦能力;EMCDR 是專門用于解決“冷啟動(dòng)”問題的跨領(lǐng)域方法,可以有效驗(yàn)證本文模型的用戶“冷啟動(dòng)”的推薦效果;NeuCDCF 是一種新的跨領(lǐng)域推薦模型,可以進(jìn)一步檢驗(yàn)本文模型的跨領(lǐng)域推薦能力。

考慮到本文是對(duì)評(píng)分進(jìn)行預(yù)測,故選擇RMSE(root mean squared error) 和MAE(mean absolute er‐ror)作為評(píng)價(jià)指標(biāo),計(jì)算公式分別為

其中,Test 為測試集;ru,i為用戶u對(duì)物品i的實(shí)際評(píng)分;r?u,i為用戶u對(duì)物品i的預(yù)測評(píng)分。MAE 衡量的是預(yù)測評(píng)分與實(shí)際評(píng)分的絕對(duì)誤差的平均值;RMSE 是預(yù)測評(píng)分與實(shí)際評(píng)分之間平方差異的平均值,然后再取平方根。RMSE 和MAE 越小,代表預(yù)測評(píng)分與實(shí)際評(píng)分的差異越小,推薦準(zhǔn)確性也越高。從總體上來說,RMSE 和MAE 的趨勢一致,但RMSE 受異常值影響更大。

4.4 實(shí)驗(yàn)結(jié)果

1)推薦效果實(shí)驗(yàn)結(jié)果

表3 列出了6 種模型在不同領(lǐng)域和訓(xùn)練集比例下得到的RMSE 和MAE??傮w來看,CDCF-U 模型和CDCF-I 模型取得的推薦效果較差,甚至不如單領(lǐng)域推薦的PMF 模型;CMF 模型雖然能夠在圖書領(lǐng)域超越PMF 模型,但提升幅度并不大,在電影領(lǐng)域還取得了相反的效果;NeuCDCF 是CMF 和堆棧自編碼器的結(jié)合,因此在推薦效果上優(yōu)于CMF,但NeuCDCF 只用了評(píng)分信息,無法充分獲取用戶偏好和領(lǐng)域知識(shí)。本文模型的推薦效果均優(yōu)于以上方法,與5 種對(duì)比模型相比,RMSE 和MAE 降低的百分比如表4 所示。同時(shí),由于本文模型融入了異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)獲得的表示向量,包含豐富的物品特征信息,對(duì)于數(shù)據(jù)量較少的物品或用戶來說,可以通過這部分特征信息補(bǔ)充評(píng)價(jià)數(shù)據(jù)的缺失,使得不同訓(xùn)練集比例下RMSE 和MAE 結(jié)果的變化幅度較小,進(jìn)一步表明本文模型的優(yōu)越性。

表3 6種模型推薦效果實(shí)驗(yàn)結(jié)果的比較

表4 本文模型與5種對(duì)比模型相比推薦效果的RMSE和MAE降低的百分比 %

2)用戶“冷啟動(dòng)”實(shí)驗(yàn)結(jié)果

表5 列出了6 種模型在用戶“冷啟動(dòng)”方面的RMSE 和MAE??傮w來看,CDCF-U 模型和CDCF-I模型表現(xiàn)依然較差;CMF 模型本質(zhì)上是一種線性算法,所以在用戶“冷啟動(dòng)”方面效果不能盡如人意;EMCDR 模型作為非線性映射算法,在兩個(gè)領(lǐng)域之間學(xué)習(xí)了一個(gè)非線性映射函數(shù),針對(duì)“冷啟動(dòng)”用戶具有較好的應(yīng)用價(jià)值;NeuCDCF 在“冷啟動(dòng)”方面表現(xiàn)優(yōu)異,僅次于本文模型。本文模型在用戶“冷啟動(dòng)”方面都優(yōu)于以上模型,與5 種對(duì)比模型相比,RMSE 和MAE 降低的百分比如表6 所示。同時(shí)可以看到,隨著“冷啟動(dòng)”用戶比例的上升,所有模型的RMSE 和MAE 結(jié)果都有明顯的提升,說明錨用戶的數(shù)量在各個(gè)模型中起到了舉足輕重的作用。

表5 6種模型用戶“冷啟動(dòng)”實(shí)驗(yàn)結(jié)果的比較

表6 本文模型與5種對(duì)比模型相比用戶“冷啟動(dòng)”的RMSE和MAE降低的百分比 %

4.5 元路徑分析

不同的元路徑代表了領(lǐng)域內(nèi)不同的語義特征。本節(jié)將從推薦效果和用戶“冷啟動(dòng)”兩個(gè)方面探討元路徑對(duì)模型的影響。

在推薦效果方面,結(jié)果如圖3 所示??傮w來說,在不同訓(xùn)練集比例下,不管是RMSE 還是MAE,加入元路徑的模型都比不加入元路徑的模型要低,這一結(jié)果符合元路徑能有效提高推薦效果的猜想。但電影領(lǐng)域RMSE 和MAE 的下降幅度比圖書領(lǐng)域大,這是因?yàn)殡娪邦I(lǐng)域數(shù)據(jù)較為稠密,在加入更多的特征信息后推薦效果能得到較大幅度提升;而圖書領(lǐng)域數(shù)據(jù)相對(duì)稀疏,雖然能夠在一定程度上提高推薦效果,但幅度不大。

圖3 是否加入元路徑在推薦效果上的對(duì)比

在用戶“冷啟動(dòng)”方面,將圖書領(lǐng)域的部分用戶設(shè)為完全“冷啟動(dòng)”用戶,結(jié)果如圖4 所示。與上文類似,RMSE 和MAE 都有一定程度的下降。對(duì)于一個(gè)在圖書領(lǐng)域完全沒有數(shù)據(jù)的“冷啟動(dòng)”用戶來說,一方面通過MLP 的映射,將電影領(lǐng)域的知識(shí)遷移到圖書領(lǐng)域,可以使用戶在圖書領(lǐng)域也能取得較好的推薦效果;另一方面,元路徑的特征知識(shí)也能為冷啟動(dòng)用戶提供數(shù)據(jù)支持,從而比沒有元路徑的模型效果更好。

圖4 是否加入元路徑在用戶“冷啟動(dòng)”上的對(duì)比

4.6 特征維度分析

本文模型的特征維度主要包括共享用戶特征嵌入cu的維度(CK)、源領(lǐng)域評(píng)分信息向量的維度(SK)、目標(biāo)領(lǐng)域評(píng)分信息向量的維度(TK)、源領(lǐng)域異質(zhì)特征信息向量和ei的維度(SHK)、目標(biāo)領(lǐng)域異質(zhì)特征信息向量和ej的維度(THK)。其中,SHK 和THK 的維度根據(jù)文獻(xiàn)[22]設(shè)為64,本節(jié)主要探討CK、SK 和TK 的最優(yōu)參數(shù)設(shè)置。

CK 的維度特征決定了SK 和TK 的特征表示。先將CK、SK 和TK 設(shè)為相同維度,取值范圍為{8,16,32,64,128,256},試圖找出最優(yōu)的CK 值,其結(jié)果如圖5 所示。當(dāng)CK、SK、TK 的維度都為64 時(shí),圖書領(lǐng)域和電影領(lǐng)域的RMSE、MAE 同時(shí)達(dá)到最小,因此,CK 的最佳維度為64。

圖5 CK、SK、TK取值相同情況下不同領(lǐng)域的RMSE和MAE

在CK 維度為64 的情況下,分別對(duì)SK 和TK 的參數(shù)進(jìn)行調(diào)整,取值范圍為{8,16,32,64,128,256},結(jié)果如圖6、圖7 所示。當(dāng)SK 和TK 同時(shí)取值為64時(shí),圖書領(lǐng)域和電影領(lǐng)域的RMSE 和MAE 達(dá)到最小。從上述結(jié)果可以發(fā)現(xiàn),不管是共享用戶潛在因子還是不同領(lǐng)域內(nèi)特有的用戶潛在因子,RMSE 和MAE 隨著特征維度的增加均呈現(xiàn)出先上升后下降的趨勢;同時(shí),電影領(lǐng)域相對(duì)于圖書領(lǐng)域受到參數(shù)調(diào)整的影響較小,這是由于電影領(lǐng)域評(píng)分?jǐn)?shù)據(jù)量較多,數(shù)據(jù)的“稀疏性”不明顯,而圖書領(lǐng)域評(píng)分?jǐn)?shù)據(jù)量小,受參數(shù)調(diào)整影響大。

圖6 不同SK、TK取值下電影領(lǐng)域的RMSE和MAE(CK=64)

圖7 不同SK、TK取值下圖書領(lǐng)域的RMSE和MAE(CK=64)

4.7 模型普適性分析

以上實(shí)驗(yàn)所使用的電影、圖書領(lǐng)域的數(shù)據(jù)集相關(guān)性較高,且只針對(duì)豆瓣網(wǎng)一個(gè)平臺(tái),不足以突現(xiàn)本文模型的普適性。為此,本節(jié)以Amazon 平臺(tái)的電影和唱片領(lǐng)域?yàn)槔?,將電影領(lǐng)域作為源領(lǐng)域,唱片領(lǐng)域作為目標(biāo)領(lǐng)域,進(jìn)一步驗(yàn)證模型的普適性。Amazon 數(shù)據(jù)集的基本統(tǒng)計(jì)信息如表7 所示。

表7 Amazon數(shù)據(jù)集的基本統(tǒng)計(jì)信息

在元路徑的選擇方面,考慮到Amazon 數(shù)據(jù)集的特征信息較少,可用的特征信息僅包括品牌、價(jià)格、種類,其中價(jià)格和種類所包含的標(biāo)簽較少,無法體現(xiàn)出差異性,所以僅使用品牌作為特征信息。本實(shí)驗(yàn)所使用的元路徑和代表的語義如表8所示。

表8 Amazon數(shù)據(jù)集的元路徑及其語義

與上文相同,本實(shí)驗(yàn)也分為推薦效果實(shí)驗(yàn)和用戶“冷啟動(dòng)”實(shí)驗(yàn)。在推薦效果實(shí)驗(yàn)中,同時(shí)刪除電影領(lǐng)域和唱片領(lǐng)域20%的用戶評(píng)分?jǐn)?shù)據(jù)作為測試集,剩余80%的評(píng)分作為訓(xùn)練集來學(xué)習(xí)模型參數(shù);在用戶“冷啟動(dòng)”實(shí)驗(yàn)中,隨機(jī)挑選20%的用戶,刪除其在唱片領(lǐng)域的所有評(píng)分?jǐn)?shù)據(jù),作為唱片領(lǐng)域的完全“冷啟動(dòng)”用戶參與測試。實(shí)驗(yàn)參數(shù)與第4.2 節(jié)中的設(shè)置相同,最終實(shí)驗(yàn)結(jié)果如圖8、圖9所示。

從圖8、圖9 可以看出,在Amazon 數(shù)據(jù)集上,不管是推薦效果還是用戶“冷啟動(dòng)”效果,本文模型評(píng)分預(yù)測的準(zhǔn)確性都是最高的。對(duì)比豆瓣網(wǎng)的電影領(lǐng)域和圖書領(lǐng)域,Amazon 的電影領(lǐng)域和唱片領(lǐng)域關(guān)聯(lián)性明顯更低,且數(shù)據(jù)稀疏程度更高,容易出現(xiàn)“負(fù)遷移”。在推薦效果方面,CMF 完全共享用戶特征的機(jī)制導(dǎo)致推薦效果不理想,而NeuCDCF和本文模型都設(shè)置了用戶獨(dú)特的領(lǐng)域特征,出現(xiàn)“負(fù)遷移”的可能性更低,因此推薦效果更好;在用戶“冷啟動(dòng)”方面,EMCDR 作為專門處理“冷啟動(dòng)”問題的跨領(lǐng)域推薦方法,其前提是要求兩個(gè)領(lǐng)域之間的用戶存在一種映射關(guān)系,在電影和唱片領(lǐng)域關(guān)聯(lián)性不大的情況下,用戶行為特征差異也較大,因此EMCDR 擬合出的映射關(guān)系誤差大,導(dǎo)致推薦結(jié)果較差??偟膩碚f,Amazon 數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果充分說明了本文模型的普適性。

圖8 Amazon電影領(lǐng)域和唱片領(lǐng)域的推薦效果對(duì)比

圖9 Amazon唱片領(lǐng)域的用戶“冷啟動(dòng)”效果對(duì)比

5 結(jié) 語

針對(duì)當(dāng)前跨領(lǐng)域推薦存在的相關(guān)問題,本文提出了一種融合異質(zhì)網(wǎng)絡(luò)表示學(xué)習(xí)的跨領(lǐng)域推薦模型。該模型同時(shí)利用領(lǐng)域內(nèi)的評(píng)分信息和特征信息,采用神經(jīng)網(wǎng)絡(luò)架構(gòu),優(yōu)化了傳統(tǒng)跨領(lǐng)域矩陣分解,利用非線性映射函數(shù)體現(xiàn)不同領(lǐng)域的差異性,同時(shí)還將物品屬性特征以異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的形式融入跨領(lǐng)域推薦中,達(dá)到了有效利用領(lǐng)域間豐富特征信息的目的,從而進(jìn)一步緩解了數(shù)據(jù)“稀疏性”和用戶“冷啟動(dòng)”的問題。研究結(jié)果表明,本文模型在提高推薦效果和優(yōu)化用戶“冷啟動(dòng)”方面比現(xiàn)有相關(guān)模型更具有優(yōu)越性和穩(wěn)定性。然而,本文模型也存在一些不足,尤其是在算法設(shè)計(jì)過程中,需要學(xué)習(xí)的參數(shù)過多,導(dǎo)致算法時(shí)間成本較高。因此,在今后的研究中,應(yīng)繼續(xù)優(yōu)化適用于個(gè)性化推薦的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法,在保留異質(zhì)網(wǎng)絡(luò)中信息的基礎(chǔ)上,簡化異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)的步驟;還可以進(jìn)一步深入研究多領(lǐng)域推薦方法,將單一的輔助領(lǐng)域擴(kuò)展到多輔助領(lǐng)域,進(jìn)而從不同的領(lǐng)域獲取更多的領(lǐng)域知識(shí),增強(qiáng)模型的表達(dá)能力。

猜你喜歡
冷啟動(dòng)異質(zhì)向量
輕型汽油車實(shí)際行駛排放試驗(yàn)中冷啟動(dòng)排放的評(píng)估
向量的分解
Evaluation of Arctic Sea Ice Drift and its Relationship with Near-surface Wind and Ocean Current in Nine CMIP6 Models from China
基于異質(zhì)分組的信息技術(shù)差異化教學(xué)
基于PEMS試驗(yàn)的重型柴油車?yán)鋯?dòng) 排放特征研究
基于學(xué)習(xí)興趣的冷啟動(dòng)推薦模型
《拉奧孔》中“詩畫異質(zhì)”論折射的西方寫實(shí)主義傳統(tǒng)
“對(duì)賭”語境下異質(zhì)股東間及其與債權(quán)人間的利益平衡
聚焦“向量與三角”創(chuàng)新題
向量垂直在解析幾何中的應(yīng)用
夏津县| 林口县| 屏山县| 宾阳县| 古蔺县| 扎赉特旗| 奉新县| 桦甸市| 仙游县| 荔浦县| 安西县| 望谟县| 北辰区| 通州市| 巴林右旗| 山西省| 库尔勒市| 蚌埠市| 齐河县| 德庆县| 瑞安市| 亚东县| 古蔺县| 明星| 江油市| 江都市| 广南县| 禄劝| 嘉兴市| 清远市| 米泉市| 兴安盟| 于都县| 临湘市| 太康县| 鹤山市| 大英县| 佛山市| 龙南县| 轮台县| 柳州市|