国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)PersonalRank算法進(jìn)行個(gè)性化推薦

2021-03-13 14:38李維
現(xiàn)代信息科技 2021年15期
關(guān)鍵詞:長尾節(jié)點(diǎn)維度

摘? 要:PersonalRank就是一種基于隨機(jī)游走的圖推薦算法。傳統(tǒng)的PersonalRank算法是在PagePank算法的基礎(chǔ)上進(jìn)行了改進(jìn),但依舊存在個(gè)性化推薦召回率和準(zhǔn)確率不高,過度偏重同物品中其他用戶操作的問題,導(dǎo)致覆蓋率不高?,F(xiàn)針對(duì)PersonalRank問題,文章從推薦系統(tǒng)評(píng)測指標(biāo)的覆蓋率、召回率和準(zhǔn)確率三個(gè)維度出發(fā),加強(qiáng)算法發(fā)掘長尾的能力,同時(shí)提高推薦結(jié)果的用戶滿意度。

關(guān)鍵詞:信息資源;圖推薦算法;PersonalRank;長尾

中圖分類號(hào):TP391 ? ?文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2021)15-0025-04

Abstract: PersonalRank is a graph recommendation algorithm based on random walk. The traditional PersonalRank algorithm is based on the changes made by pagepank algorithm, but there are still problems of low recall and accuracy of personalized recommendation and excessive emphasis on the operation of other users in the same item, resulting in low coverage. Aiming at the PersonalRank problems, the paper starts from three dimensions of the evaluation indicators of the recommendation system: coverage, recall and accuracy, strengthens the ability of algorithms to discover long tail and improves the user satisfaction of the recommendation results.

Keywords: information resources; graph recommendation algorithm; PersonalRank; long tail

0? 引? 言

隨著互聯(lián)網(wǎng)與高新技術(shù)的發(fā)展,我們正身處高度信息化的時(shí)代,每天互聯(lián)網(wǎng)上產(chǎn)生的信息數(shù)據(jù)正以驚人的速度增長。但I(xiàn)nternet給用戶帶來豐富信息資源的同時(shí),也阻礙了用戶快速找到自己所需的信息。雖然用戶通過在百度、谷歌等搜索框中輸入關(guān)鍵字能夠展現(xiàn)出其所需的內(nèi)容,但由于缺少用戶的偏好數(shù)據(jù),搜索出來的內(nèi)容不能很有效地過濾出垃圾數(shù)據(jù)。為了響應(yīng)這種用戶對(duì)高質(zhì)量的用戶信息服務(wù)的需求,產(chǎn)生了很多個(gè)性化推薦算法。諸如基于用戶的推薦算法[1],基于物品的推薦算法[2],或者是基于圖模型的推薦算法[3]等。

個(gè)性化推薦就是運(yùn)用推薦算法,從海量數(shù)據(jù)中篩選出用戶所需但不易搜索出來的結(jié)果,也就是獲取所需數(shù)據(jù)的效率。由于現(xiàn)代化的迅猛發(fā)展,體現(xiàn)出用戶個(gè)性化服務(wù)的要求日益增加,在電商領(lǐng)域、在金融以及在醫(yī)療等與人們息息相關(guān)的各個(gè)領(lǐng)域都充斥著個(gè)性化的影子。例如:金融系統(tǒng)根據(jù)個(gè)人的財(cái)富情況所提供的針對(duì)性的理財(cái)服務(wù),醫(yī)療機(jī)構(gòu)針對(duì)不同年齡段的人提供的個(gè)性化養(yǎng)生項(xiàng)目;尤其是在電商領(lǐng)域,淘寶和京東都會(huì)為潛在的用戶推薦符合其歷史購物需求的商品;在流媒體業(yè)務(wù)中,優(yōu)酷和愛奇藝等流媒體平臺(tái)也都會(huì)出現(xiàn)個(gè)性化影視服務(wù),給用戶推薦專屬電影院。

有一種推薦算法是圖推薦算法,以圖這種有流程的直觀的形式來展示復(fù)雜的用戶操作數(shù)據(jù),利用圖論中的算法進(jìn)行個(gè)性化推薦的算法,它是現(xiàn)今較為重要和流行的推薦策略。PersonalRank算法就是基于圖的推薦算法。PersonalRank算法是在PageRank算法的基礎(chǔ)上發(fā)展而來的。但PersonalRank算法存在覆蓋率不高,導(dǎo)致很多質(zhì)量高的,用戶喜歡的物品未能被推薦出來。基于此類問題,本文將對(duì)PersonalRank算法做出改進(jìn),加強(qiáng)算法發(fā)掘長尾的能力,同時(shí)增加物品評(píng)分,以提高推薦物品的質(zhì)量,其在準(zhǔn)確率、召回率和覆蓋率上有較好的提升。

1? PersonalRank算法及其改進(jìn)算法

1.1? PersonalRank算法

PersonalRank算法是一種隨機(jī)游走算法,采用二分圖的方式構(gòu)建圖,包含兩種類型的頂點(diǎn):用戶和物品,二分圖就是在同一邊的各點(diǎn)沒有連線,就像圖1中,用戶這邊:倆倆用戶之間沒有連線;物品這邊:倆倆物品之間沒有連線,都是根據(jù)物品與用戶之間的連線相互關(guān)聯(lián),即這些用戶數(shù)據(jù)由二元組組成(可以表示成(u,i),即用戶u對(duì)物品i產(chǎn)生過行為)。目標(biāo)用戶與推薦結(jié)果物品以二分圖來展示,推薦結(jié)果中越靠前的物品,也就是權(quán)重越重的物品,就是與目標(biāo)用戶關(guān)聯(lián)性最高的物品,這就是圖推薦的直觀性體現(xiàn)。

由于PersonalRank算法是基于PageRank算法[4]發(fā)展來的,那么PersonalRank算法也沿用了PageRank算法的思想,PageRank算法的核心思想是根據(jù)網(wǎng)頁鏈接到其他網(wǎng)頁或者其他網(wǎng)頁鏈接到本網(wǎng)頁的出入度來計(jì)算網(wǎng)頁的得分,并且通過網(wǎng)頁的得分進(jìn)行推薦的排序。但PageRank算法主要是通過網(wǎng)頁或者稱為物品之間的相互聯(lián)系來計(jì)算PR值,這樣就缺少用戶與物品之間的協(xié)同操作,不能為用戶提供個(gè)性化的服務(wù),而PageRank算法所推薦的網(wǎng)頁都是根據(jù)引用的鏈接來計(jì)算的,不能為特定用戶推薦個(gè)性化服務(wù)。那么為了實(shí)現(xiàn)為用戶提供個(gè)性化推薦,就在此基礎(chǔ)上發(fā)展了PersonalRank算法。當(dāng)然PersonalRank也沿用了其思想,另外在其基礎(chǔ)上加上了協(xié)同過濾的個(gè)性化推薦思想,即根據(jù)用戶操作的物品,來計(jì)算其他用戶操作同物品及其他物品的得分情況。

通過迭代計(jì)算,可以得到每個(gè)用戶的推薦結(jié)果,這樣就成了個(gè)性化推薦,可以得到每個(gè)物品節(jié)點(diǎn)的得分排名,并進(jìn)行重要性排名。

度量圖中兩個(gè)頂點(diǎn)之間的關(guān)聯(lián)性很多,但一般取決于下面3個(gè)方面[5]:

(1)兩個(gè)頂點(diǎn)之間的路徑數(shù)。

(2)兩個(gè)頂點(diǎn)之間路徑的長度。

(3)兩個(gè)頂點(diǎn)之間的路徑經(jīng)過的頂點(diǎn)。

相關(guān)性高的一對(duì)頂點(diǎn)一般具有以下特征:

(1)兩個(gè)頂點(diǎn)之間有很多路徑相連。

(2)連接兩個(gè)頂點(diǎn)之間的路徑長度都比較短。

(3)連接兩個(gè)頂點(diǎn)之間的路徑不會(huì)經(jīng)過出度比較大的頂點(diǎn)。

從上面的例子可知:

這里A可以到達(dá)a,b,d,不能到達(dá)c,e,那么是優(yōu)先推薦c,還是優(yōu)先推薦e呢?

第一條:兩個(gè)頂點(diǎn)之間有很多路徑相連:

A→c:A→a→B→c,A→d→D→c

A→e:A→b→C→e

從這一條就可以看出,c優(yōu)先于e。

圖中A、B、C和D表示4個(gè)不同的用戶,a、b、c、d和e表示5個(gè)不同的物品,用戶與物品之間的邊表示用戶和物品的關(guān)聯(lián)性。如果根節(jié)點(diǎn)為A,就是給用戶A推薦物品,大致的游走方向?yàn)椋簭墓?jié)點(diǎn)A出發(fā),由于用戶A與物品a、b和d有關(guān),因此從節(jié)點(diǎn)A到節(jié)點(diǎn)a、b和d。到達(dá)節(jié)點(diǎn)a、b和d后,就從當(dāng)前節(jié)點(diǎn)開始隨機(jī)游走到下一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)游走的概率為α。由于PersonalRank是隨機(jī)游走算法,多次游走后,每個(gè)物品節(jié)點(diǎn)的PR值就會(huì)趨向于一個(gè)穩(wěn)定數(shù)值。在推薦結(jié)果中給物品的權(quán)重就是這個(gè)穩(wěn)定數(shù)值,當(dāng)然從目標(biāo)節(jié)點(diǎn)出發(fā)時(shí),游走后如果下一步是返回到目標(biāo)節(jié)點(diǎn),概率設(shè)定為1-α,算法迭代,直到游走結(jié)束。

每個(gè)節(jié)點(diǎn)的PR值如公式(1)所示:

其中,PR(v)表示節(jié)點(diǎn)v的訪問概率,PR(v’)表示節(jié)點(diǎn)v’的訪問概率,out(v’)表示節(jié)點(diǎn)v’的出度,int(v)表示節(jié)點(diǎn)v的入度。α決定繼續(xù)訪問的概率。一般情況下,α取值為0.8。

1.2? PersonalRank算法的不足

從PersonalRank算法公式來看,該算法存在以下幾點(diǎn)不足:

(1)長尾問題。該算法注重對(duì)同物品有過行為的用戶。也就是說節(jié)點(diǎn)的PR值取決于入度的節(jié)點(diǎn),如果存在某個(gè)節(jié)點(diǎn)沒有用戶訪問就會(huì)被遺棄,不會(huì)被推薦。比如:某個(gè)物品很熱門,很多用戶有過行為,那么該物品的PR值就會(huì)比較高,也會(huì)比較容易受到推薦。

(2)推薦質(zhì)量不高。由于PersonalRank算法注重于用戶和物品的協(xié)同行為,不注重用戶對(duì)物品的反饋,就會(huì)存在差質(zhì)量的物品由于被多個(gè)用戶行為過,也就存在較高的PR值,導(dǎo)致推薦出來的結(jié)果并不是最好的。

2? PersonalRank算法改進(jìn)

PersonalRank的改進(jìn)算法主要從以下兩個(gè)方面著手于對(duì)節(jié)點(diǎn)PR值的計(jì)算公式進(jìn)行改進(jìn):一是除了原有的用戶和物品兩個(gè)節(jié)點(diǎn)外,增加用戶顯示反饋評(píng)分節(jié)點(diǎn),通過評(píng)分節(jié)點(diǎn)可以提高推薦結(jié)果的質(zhì)量,可以將用戶曾給過高評(píng)分的物品,通過其與其他用戶的關(guān)聯(lián)性,然后再通過其他用戶給出的高評(píng)分的物品推薦出來,從而提高推薦結(jié)果的質(zhì)量。二是發(fā)掘算法的長尾能力,通過用戶有過行為的高評(píng)分物品,找到同類型的物品,也就是類似于將該物品打上標(biāo)簽,獲取到用戶偏好信息和反饋信息,找到同類型物品后,將評(píng)分高的物品推薦給用戶,提高覆蓋率。

2.1? 增加用戶反饋維度改進(jìn)PersonalRank算法

針對(duì)PersonalRank算法傳統(tǒng)的僅僅依靠用戶與物品之間的行為關(guān)系來進(jìn)行推薦,在其基礎(chǔ)上增加評(píng)分節(jié)點(diǎn)。評(píng)分節(jié)點(diǎn)表示用戶對(duì)所行為過物品的評(píng)分,此屬于顯示反饋。顯示反饋表示用戶主動(dòng)參與對(duì)物品的認(rèn)同度,一般可以設(shè)置1-5分的評(píng)分維度,1分為最低,表示用戶對(duì)該物品有過行為,但是認(rèn)可度低。5分為最高,表示用戶對(duì)該物品的認(rèn)可度高。這種評(píng)分行為是可以很直觀地表示用戶對(duì)某一類物品的興趣。

一個(gè)好的推薦結(jié)果需要滿足用戶獲得優(yōu)質(zhì)資源的心態(tài)。這就依賴于用戶操作的物品行為,這種顯示反饋是最為有效的。通過將用戶反饋維度加入對(duì)PR值的計(jì)算公式中,就是希望通過用戶這種評(píng)分的顯示反饋進(jìn)而影響推薦結(jié)果的排列順序,也就是通過用戶以往對(duì)物品的行為,調(diào)整對(duì)不同物品的權(quán)重,降低一些低質(zhì)量物品的權(quán)重,提高高質(zhì)量物品的權(quán)重,進(jìn)而改善算法的推薦結(jié)果。

一般情況下,用戶在所推薦的結(jié)果中,對(duì)那些與自己曾經(jīng)給過高評(píng)分類似的物品往往比曾經(jīng)自己給出低評(píng)分的物品更為感興趣,這種推薦結(jié)果會(huì)讓用戶更加滿意。這樣就可以判定建立用戶、物品和評(píng)分反饋三者的關(guān)系,收集其顯示反饋的信息,來調(diào)整PR值的計(jì)算,增加入度中節(jié)點(diǎn)的PR值計(jì)算,就能有效地降低低質(zhì)量對(duì)反饋結(jié)果的影響。例如:如果某個(gè)物品每個(gè)用戶對(duì)其評(píng)分并不高,但僅僅因?yàn)槠湮锲穼儆跓衢T物品,就會(huì)使得其用戶基數(shù)大,那么在計(jì)算物品相似度的時(shí)候,熱門物品往往更具有優(yōu)勢。由于這里是計(jì)算每個(gè)節(jié)點(diǎn)的PR值,而不是計(jì)算用戶之間的相似度,在每個(gè)PR值計(jì)算的時(shí)候加上評(píng)分維度,就能保證推薦結(jié)果的質(zhì)量。

由于物品評(píng)分維度是用戶顯示反饋,故而其值與該節(jié)點(diǎn)所獲得的PR值正相關(guān)。假設(shè)目標(biāo)節(jié)點(diǎn)為v,所有鏈向它的各節(jié)點(diǎn)的評(píng)分集合為G={G1,G2,G3,…,Gn},將評(píng)分維度加入公式中,如公式(2)所示:

其中,G表示目標(biāo)節(jié)點(diǎn)v的所有鏈向它的各節(jié)點(diǎn)的評(píng)分,由于最高分是5,故而分母為5,使用權(quán)重來影響其PR值。這里G值與PR值結(jié)果是正相關(guān)的。

2.2? 發(fā)掘PersonalRank算法的長尾能力

那些平時(shí)看著不起眼的商品,那些微不足道逐漸被遺棄的物品,占據(jù)物品種類很大的比例,甚至超過熱門物品的種類,這些被遺棄的物品隱藏著巨大商機(jī),也是企業(yè)在無力從熱門商品中再獲取利益的情況下,可以榨取的收入來源,即使這些快被市場拋棄的物品所帶來的利潤低,但只要符合用戶需求,也是優(yōu)質(zhì)的推薦結(jié)果,這就是推薦算法需要增強(qiáng)長尾理論的緣由。

現(xiàn)今世界正經(jīng)歷著巨大的變革,互聯(lián)網(wǎng)的極速發(fā)展,使商品的更新?lián)Q代速度極快。而且當(dāng)前的企業(yè)績效不再遵循二八原則,而是有嚴(yán)重的重尾分布。以前20%的產(chǎn)品銷量占收入的80%,或者說20%的商品品種帶來80%的銷量,往往又由于追捧熱門產(chǎn)品,80%的產(chǎn)品都被遺棄。那么為了發(fā)掘算法的長尾能力,就需要從以下兩個(gè)方面入手:一是推薦結(jié)果的多樣性。PersonalRank之前的算法是根據(jù)對(duì)共同物品有過行為的用戶進(jìn)行的推薦,如果存在某些物品由于過于冷門,導(dǎo)致沒有用戶對(duì)其操作過,那么冷門物品將不會(huì)被推薦。推薦結(jié)果應(yīng)該以多樣性為重要目標(biāo),給用戶更多的選擇。二是保證推薦結(jié)果的準(zhǔn)確率。當(dāng)然為了增加算法的長尾能力,增強(qiáng)推薦結(jié)果的多樣性,并不代表給用戶推薦低質(zhì)量的物品,這樣會(huì)使得用戶對(duì)推薦結(jié)果不滿意。既然推薦結(jié)果的用意是給用戶推薦用戶感興趣的物品,使得用戶對(duì)推薦物品產(chǎn)生行為。這樣就需要盡可能地了解用戶對(duì)物品的興趣,譬如用戶的興趣愛好,或者用戶對(duì)某些物品有過多次行為,又或者對(duì)某些物品有過高的顯示反饋也就是評(píng)分。通過用戶對(duì)以往物品給過的高評(píng)分,推薦同類型的并且有高評(píng)分的物品,從而提高用戶對(duì)推薦結(jié)果的滿意度,提高準(zhǔn)確率。

當(dāng)然,推薦物品的多樣性與推薦物品的準(zhǔn)確率是有一定沖突的。為了保證推薦結(jié)果的多樣性可能會(huì)影響推薦物品的準(zhǔn)確率,因?yàn)橥扑]出來的物品可能是用戶之前從未有過行為的物品,可能推薦出來的物品是用戶不喜歡的。既然如此,從對(duì)用戶、物品和用戶顯示反饋三個(gè)維度出發(fā),通過用戶的顯示反饋,推薦出同類型的物品,并且,給出一定的限制措施,這里在同類型的推薦結(jié)果中,限制只有被其他用戶評(píng)分為5分以上的,才會(huì)被推薦,這樣就能保證推薦結(jié)果的多樣性以及準(zhǔn)確率。

加上同類型物品后,其物品的向量表表示為:Citem={C1,C2,C3,…,Cn},將該物品的向量表加入到PR值公式計(jì)算中,如公式3所示:

其中,PRa表示通過用戶與物品的協(xié)同行為產(chǎn)生的推薦結(jié)果;Citem是同類型物品的推薦結(jié)果;a是通過PRa推薦出來的結(jié)果數(shù),a是通過Citem推薦出來的結(jié)果數(shù),N為推薦出來的總數(shù)。

3? 實(shí)驗(yàn)結(jié)果及分析

3.1? 實(shí)驗(yàn)數(shù)據(jù)及評(píng)測指標(biāo)介紹

本文的數(shù)據(jù)集來自MovieLens數(shù)據(jù)集,該數(shù)據(jù)集中有用戶行為數(shù)據(jù)集和物品詳細(xì)數(shù)據(jù)集。由于用戶行為數(shù)據(jù)集龐大,這里采用90位用戶的操作數(shù)據(jù),共11 724條用戶對(duì)物品的行為數(shù)據(jù)。在用戶行為數(shù)據(jù)集中,分別包含了用戶主鍵和物品主鍵,以及用戶對(duì)物品的評(píng)分。每個(gè)用戶平均對(duì)50個(gè)物品有過行為操作。物品詳細(xì)數(shù)據(jù)集共包含3 952條數(shù)據(jù),分別為物品主鍵、物品名稱和物品分類。

為了避免單次實(shí)驗(yàn)導(dǎo)致數(shù)據(jù)結(jié)果的偏差,現(xiàn)將實(shí)驗(yàn)數(shù)據(jù)運(yùn)行30次,取其平均數(shù),以減小數(shù)據(jù)的偏差,同時(shí)每次運(yùn)行結(jié)果都會(huì)推薦30條數(shù)據(jù),以驗(yàn)證精確率、召回率、覆蓋率和新穎度。

其中,F(xiàn)1為精確率;R為某個(gè)用戶的推薦結(jié)果;Ru為推薦結(jié)果與測試數(shù)據(jù)的某個(gè)相同用戶的物品數(shù);F2為召回率;T為某個(gè)用戶的測試數(shù)據(jù);Tu為推薦結(jié)果與測試數(shù)據(jù)某個(gè)相同用戶的物品數(shù);F3為覆蓋率;A為某用戶的訓(xùn)練數(shù)據(jù);Au為某個(gè)用戶的推薦結(jié)果;F4為新穎度;P為推薦結(jié)果與測試數(shù)據(jù)某個(gè)相同用戶的物品數(shù);Pu為某個(gè)用戶推薦結(jié)果與測試數(shù)據(jù)某個(gè)相同用戶的物品數(shù)與相同用戶的訓(xùn)練數(shù)據(jù)物品集的對(duì)數(shù)。

3.2? 實(shí)驗(yàn)對(duì)比

為了驗(yàn)證改進(jìn)的PersonalRank算法,將舊PersonalRank算法與改進(jìn)后的PersonalRank算法進(jìn)行對(duì)比,兩個(gè)算法在數(shù)據(jù)集中所求的精確率、召回率、覆蓋率和新穎度,如表1所示。

由表1中的變化數(shù)據(jù)可以發(fā)現(xiàn):在改進(jìn)后的PersonalRank算法下,推薦結(jié)果的精確率和召回率有了進(jìn)一步提升,說明增加用戶顯示反饋維度后,能夠給用戶提供更加優(yōu)質(zhì)的推薦數(shù)據(jù),同時(shí)滿足了用戶個(gè)性化高品質(zhì)推薦的要求。

由表1還可知,在改進(jìn)后的PersonalRank算法下,覆蓋率有了很大的提升,說明公式對(duì)數(shù)據(jù)有較好的契合度。新穎度稍微有所下降。

本文引入了用戶顯示反饋評(píng)分維度并且以用戶曾經(jīng)有過行為的高質(zhì)量的物品為基礎(chǔ),推薦同類型的高評(píng)分的物品,有效地提升了推薦算法的長尾問題和推薦結(jié)果質(zhì)量不高的問題。

4? 結(jié)? 論

本文主要針對(duì)傳統(tǒng)的personalRank算法存在的長尾問題和推薦質(zhì)量不高的問題進(jìn)行了相應(yīng)的改進(jìn)。該改進(jìn)算法根據(jù)加入用戶顯示反饋評(píng)分維度來解決質(zhì)量不高的問題,通過推薦同類型高評(píng)分物品來解決長尾問題,通過正相關(guān)維度來改善每個(gè)點(diǎn)的PR值。實(shí)驗(yàn)結(jié)果表明:改進(jìn)后的PersonalRank算法對(duì)評(píng)測指標(biāo)的召回率、準(zhǔn)確率和覆蓋率都有所提高。這就意味著推薦出來的結(jié)果更能滿足用戶的需求。

當(dāng)然本文算法也還存在不足的情況:其一,PersonalRank算法是基于隨機(jī)游走的算法,也就是說每個(gè)點(diǎn)都會(huì)進(jìn)行運(yùn)算,這樣對(duì)于時(shí)間運(yùn)算和空間運(yùn)算都是一個(gè)不小的挑戰(zhàn),此時(shí)就需要一種能夠有效緩解時(shí)間,空間復(fù)雜度的算法。其二,該算法需要收集,存儲(chǔ)以及處理與用戶相關(guān)的物品以及物品的類型,所以不適用于冷啟動(dòng)問題。在今后的工作中,尚需不斷優(yōu)化算法,提高推薦結(jié)果的精確率和召回率,并將最符合用戶需求的物品展示在最前列,同時(shí)在時(shí)間復(fù)雜度和空間復(fù)雜度上也要做到均衡,減少算法的時(shí)間復(fù)雜度和空間復(fù)雜度。例如:既然是圖算法,就可以從子圖構(gòu)造等方面入手,以減少時(shí)間復(fù)雜度的運(yùn)算。當(dāng)然,除了評(píng)分維度這個(gè)用戶顯示反饋外,用戶反饋也是可以獲取到直觀的用戶偏好信息,同時(shí)也應(yīng)該注意增強(qiáng)用戶隱示反饋,例如那些沒有用戶明確參與下,通過日志系統(tǒng)分析,或者在線系統(tǒng)分析得到的用戶數(shù)據(jù),也是可以加入公式中進(jìn)行完善的。如何以在評(píng)測指標(biāo)為基礎(chǔ),在此基礎(chǔ)上制定出更符合用戶需求,推薦出用戶所需物品的策略,都是未來工作中需要深度探討的問題。

參考文獻(xiàn):

[1] BREESE J S,HECKERMAN D,KADIE C. Empirical Analysis of Predictive. Algorithms for Collaborative Filtering [J/OL].arXiv:1301.7363 [cs.IR].[2021-05-02].https://arxiv.org/abs/1301.7363.

[2] KARYPIS G. Evaluation of Item-based Top-N Recommendation Algorithms [C]//CIKM ‘01:Proceedings of the tenth international conference on Information and knowledge management.New York:Association for Computing Machinery,2001:247-254.

[3] FOUSS F,ALAIN P,RENDERS J M,et al. Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation [J].IEEE Transactions on Knowledge and Data Engineering,2007,19(3):355-369.

[4] 金迪,馬衍民.PageRank算法的分析及實(shí)現(xiàn) [J].經(jīng)濟(jì)技術(shù)協(xié)作信息期刊,2009,18(1001):118.

[5] 項(xiàng)亮.推薦系統(tǒng)實(shí)戰(zhàn) [M].北京:人民郵電出版社,2012:74.

作者簡介:李維(1993.05—),男,漢族,湖北荊州人,開發(fā)工程師,本科,研究方向:個(gè)性化推薦系統(tǒng)。

3273500338281

猜你喜歡
長尾節(jié)點(diǎn)維度
如何促進(jìn)我國綜合交通運(yùn)輸高質(zhì)量發(fā)展
——基于FSO框架的分析
理解“第三次理論飛躍”的三個(gè)維度
基于移動(dòng)匯聚節(jié)點(diǎn)和分簇的改進(jìn)節(jié)能路由算法
CAE軟件操作小百科(48)
基于點(diǎn)權(quán)的混合K-shell關(guān)鍵節(jié)點(diǎn)識(shí)別方法
多媒體情境下培養(yǎng)學(xué)生閱讀素養(yǎng)的三個(gè)維度
幼兒教師專業(yè)成長的三個(gè)維度
長尾鯊拯救海島旅游
淺談基于P2P的網(wǎng)絡(luò)教學(xué)系統(tǒng)節(jié)點(diǎn)信息收集算法