国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于社交實(shí)值條件的拓?fù)渖窠?jīng)網(wǎng)絡(luò)推薦算法

2018-05-02 03:37洪聯(lián)系
三明學(xué)院學(xué)報(bào) 2018年2期
關(guān)鍵詞:社交神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)

楊 璐,洪聯(lián)系

(集美大學(xué) 誠(chéng)毅學(xué)院,福建 廈門 361021)

隨著信息時(shí)代的到來,信息過載問題越發(fā)突出,個(gè)性化推薦系統(tǒng)在這個(gè)信息化背景下應(yīng)運(yùn)而生,成為廣大學(xué)者和業(yè)界的研究熱點(diǎn)。雖然現(xiàn)階段社交網(wǎng)絡(luò)的數(shù)據(jù)分析結(jié)果能有效地影響商業(yè)機(jī)制,但個(gè)性化推薦技術(shù)在速度和準(zhǔn)確度上仍有進(jìn)一步提高的空間。

推薦系統(tǒng)這個(gè)概念在1990年被提出,它最初的用意是讓數(shù)以萬計(jì)的網(wǎng)絡(luò)用戶擁有更多的選擇,更高效地從信息網(wǎng)絡(luò)中發(fā)現(xiàn)更切合自己興趣的事物。1992年,PARC Tapestry System提出了一種類似集體智慧的算法——協(xié)同過濾算法,并且證明了如何運(yùn)用用戶已知的個(gè)人信息及其他們的瀏覽點(diǎn)擊等習(xí)慣中做出個(gè)性化分析。麻省理工大學(xué)于1995年研發(fā)的Ringo System便是運(yùn)用協(xié)同過濾自動(dòng)從網(wǎng)絡(luò)提取數(shù)據(jù)的音樂推薦系統(tǒng)。隨后,更多推薦算法陸續(xù)被提出,從信息過濾的角度可以概括為:協(xié)同過濾推薦(Collaborative Filtering Recommendation)[1-3],基于內(nèi)容的推薦(Content-based Recommendation)[4],基于知識(shí)的推薦(Knowledge-based Recommendation)[5],混合推薦(Hybrid Recommendation)[6-7],隨著移動(dòng)設(shè)備的普及,又出現(xiàn)了基于地理位置的推薦(Mobile Recommendation)[8-9]。

21世紀(jì)以來,推薦系統(tǒng)的研究與應(yīng)用在各大電子商務(wù)和社交網(wǎng)絡(luò)中得到廣泛應(yīng)用,其中以A-mazon、Facebook、Twitter最為著名,有研究表明,Amazon有35%的營(yíng)業(yè)額來自于自身的推薦系統(tǒng)。當(dāng)前,有越來越多的社交網(wǎng)站開始研究大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)[10-11],而從推薦系統(tǒng)出現(xiàn)至今已過去幾十年,目標(biāo)便是研發(fā)更快,準(zhǔn)確率更高的算法,提高用戶體驗(yàn)度和商業(yè)轉(zhuǎn)化率。

推薦系統(tǒng)發(fā)展到現(xiàn)在,在硬件方面主要面臨的問題是內(nèi)存消耗,但更為嚴(yán)峻的挑戰(zhàn)是針對(duì)不同類型的數(shù)據(jù)結(jié)構(gòu)和需求,研究員們需改進(jìn)出更為適合的算法。過去幾年中,社交網(wǎng)絡(luò)和商業(yè)化網(wǎng)站都存在一個(gè)“冷啟動(dòng)”問題,即新用戶或新商品和網(wǎng)絡(luò)中其他人或物的關(guān)系如何定義。對(duì)于內(nèi)存消耗問題,本文針對(duì)實(shí)驗(yàn)中使用的集群數(shù)據(jù)集給出的解決辦法是只選擇計(jì)算目標(biāo)用戶所在集群里其他所有用戶與之的相似度來推斷其愛好,該思路針對(duì)反向傳播神經(jīng)網(wǎng)絡(luò)算法可大大減小其計(jì)算量,且實(shí)驗(yàn)證明該計(jì)算結(jié)果擁有更高的準(zhǔn)確度。

1 系統(tǒng)框架

如今社交網(wǎng)絡(luò)已經(jīng)成為人們生活中不可或缺的一部分,越來越多的人更傾向于在線交友和購(gòu)物,那么當(dāng)一個(gè)用戶進(jìn)入一個(gè)成熟的社交網(wǎng)絡(luò)并做出一切操作指令后,該系統(tǒng)便會(huì)根據(jù)用戶的選擇和操作習(xí)慣進(jìn)行分析而后給出用戶的傾向性分析結(jié)果,即社交網(wǎng)絡(luò)的推薦系統(tǒng)。一個(gè)完整的社交網(wǎng)絡(luò)系統(tǒng),需要精確實(shí)時(shí)地對(duì)所提出的推薦算法進(jìn)行實(shí)現(xiàn)和評(píng)價(jià)。本文提出的推薦框架,以及該框架如何和預(yù)測(cè)算法結(jié)合,算法及系統(tǒng)框架如圖1所示。

本社交網(wǎng)絡(luò)推薦系統(tǒng)框架主要由三部分構(gòu)成:用戶數(shù)據(jù)預(yù)處理層、推薦生成層和效用評(píng)價(jià)層,整個(gè)實(shí)驗(yàn)過程將真實(shí)地模擬社交網(wǎng)絡(luò)的推薦。

圖1 在線社交網(wǎng)絡(luò)推薦系統(tǒng)的基本框架

用戶數(shù)據(jù)預(yù)處理層:算法分析所用數(shù)據(jù)集采集自Flixter網(wǎng)站,包括用戶信息、用戶行為日志(即用戶在此網(wǎng)站內(nèi)所產(chǎn)生的評(píng)分信息)和用戶之間的友好關(guān)系。海量數(shù)據(jù)下,緩解數(shù)據(jù)的稀疏性是數(shù)據(jù)預(yù)處理主要面對(duì)的問題。數(shù)據(jù)量越大推薦算法的處理速度越慢,而且往往不能得到好的推薦結(jié)果,針對(duì)推薦質(zhì)量問題,該框架設(shè)計(jì)了這一層級(jí)。

推薦生成層:分為線下訓(xùn)練、線上推薦兩個(gè)步驟,線下訓(xùn)練主要用到反向傳播神經(jīng)網(wǎng)絡(luò)和Sim-Rank++拓?fù)淠P?,而線上推薦即推薦生成層。首先隨機(jī)選取采集數(shù)據(jù)的絕大部分用于學(xué)習(xí),即使用反向傳播神經(jīng)網(wǎng)絡(luò)和SimRank++進(jìn)行離線訓(xùn)練,并在原算法上增加權(quán)值進(jìn)行改進(jìn)。SimRank++算法主要針對(duì)的是用戶友好關(guān)系數(shù)據(jù)表,反向傳播神經(jīng)網(wǎng)絡(luò)則主要針對(duì)用戶行為日志表進(jìn)行分析。根據(jù)用戶的個(gè)人信息和評(píng)分時(shí)間,該模型加入了兩個(gè)主要權(quán)值變量,以改進(jìn)推薦效果。在此層作者將會(huì)搭建一個(gè)虛擬的社交網(wǎng)站作為可視化界面顯示預(yù)測(cè)結(jié)果,即用戶登錄進(jìn)作者模擬出來的社交網(wǎng)站中,點(diǎn)擊不同按鈕,根據(jù)已有數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)結(jié)果會(huì)直接在該社交網(wǎng)站上呈現(xiàn)給當(dāng)前用戶。同時(shí)也將在數(shù)據(jù)庫(kù)中導(dǎo)入線下用算法訓(xùn)練后的數(shù)據(jù),簡(jiǎn)單和直觀地看到預(yù)測(cè)評(píng)分。

效用評(píng)價(jià)層:系統(tǒng)推薦結(jié)果將與文中提到的部分傳統(tǒng)算法在精確性上進(jìn)行比較并用平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)對(duì)其進(jìn)行評(píng)價(jià)。

2 算法描述及關(guān)鍵技術(shù)

所有推薦系統(tǒng)都會(huì)遇到“冷啟動(dòng)”問題,即面對(duì)新注冊(cè)的用戶,系統(tǒng)對(duì)新用戶的行為習(xí)慣未知,便不能有效做出推薦。此時(shí)系統(tǒng)便可運(yùn)用僅有的用戶信息進(jìn)行分析,對(duì)此用歐幾里距離算法:

來計(jì)算用戶之間的“距離”。其中,p和q分別代表不同的兩個(gè)用戶,n為用戶個(gè)性化屬性個(gè)數(shù)。從上述距離中便可分析出在用戶個(gè)人信息的基礎(chǔ)上的相似度SED,從而解決冷啟動(dòng)問題,同時(shí)也可將其作為老用戶之間相似度計(jì)算的一項(xiàng)指標(biāo)。

推薦模型將使用反向傳播神經(jīng)網(wǎng)絡(luò)結(jié)合SimRank++算法,不但可以降低神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的個(gè)數(shù)從而加快數(shù)據(jù)處理速度,與此同時(shí)還可提高推薦精度。在這個(gè)大數(shù)據(jù)時(shí)代,社交網(wǎng)絡(luò)數(shù)據(jù)集中70%都是缺失數(shù)據(jù),如果單一依靠評(píng)分或者用戶關(guān)聯(lián)度作為聚類條件,會(huì)由于數(shù)據(jù)的稀疏導(dǎo)致分析結(jié)果的準(zhǔn)確度降低。該算法第一步運(yùn)用SiamRank++尋找目標(biāo)用戶的最近鄰居,再用反向傳播神經(jīng)網(wǎng)絡(luò)分析目標(biāo)用戶與其的相似度,從而做出預(yù)測(cè),最大程度上減少無用的數(shù)據(jù)分析提高預(yù)測(cè)準(zhǔn)確度。與此同時(shí)結(jié)合數(shù)據(jù)集特點(diǎn),運(yùn)用個(gè)人信息和評(píng)價(jià)時(shí)間戳作為權(quán)值擬合算法,解決“冷啟動(dòng)”和用戶動(dòng)態(tài)興趣愛好的變化問題。

2.1 SimRank++算法

SimRank是一種基于隨機(jī)步伐的相似度算法[12],也是一種基于圖的拓?fù)浣Y(jié)構(gòu)信息來衡量任意兩個(gè)對(duì)象間相似程度的模型。核心思想為:如果兩個(gè)對(duì)象和被與其相似的對(duì)象所引用(即它們有相似的入鄰邊結(jié)構(gòu)),那么這兩個(gè)對(duì)象也相似。通過臨近相似規(guī)則,它可以很簡(jiǎn)潔地定義出用戶之間關(guān)系。兩個(gè)用戶之間相似度越高,相應(yīng)的Ssimrank(a,b)值則越低。標(biāo)準(zhǔn)SimRank算法如式(2):

其中C為一個(gè)常數(shù),取值在0到1之間,且具體大小要在實(shí)驗(yàn)過程中通過反復(fù)計(jì)算才能定值。a和b表示兩個(gè)關(guān)聯(lián)用戶,Ii(a)和Ij(b))分別為與用戶a,b為好友的所有用戶集合。若a,b為任意兩個(gè)不相關(guān)用戶,且之間沒有任何關(guān)聯(lián)的其他用戶,則無法定義出a,b兩者間的相似度,即s(a,b)=0。所以式(1)可以得到一個(gè)臨界條件:Ii(a)= ?或 Ij(b)= ? 時(shí),Ssimrank(a,b)=0。

式子(1)的缺陷在于一定的迭代計(jì)算后,所有用戶的相似度結(jié)果將會(huì)得到同一個(gè)值;便有了改進(jìn)算法SimRank++(以下簡(jiǎn)稱SR++),即增加一個(gè)權(quán)重值w。

E(a)∩E(b)為用戶a和b的共同好友數(shù),該值和權(quán)重W為正比關(guān)系。加上權(quán)重W后進(jìn)行迭代以得到最終相似度,多次實(shí)驗(yàn)后表明當(dāng)?shù)螖?shù)在6次之后便可得到一個(gè)穩(wěn)定的結(jié)果。綜上所述,本文所提出的用戶間相似度算法可歸結(jié)為下:

SED是根據(jù)用戶個(gè)人信息用歐幾里距離算法計(jì)算出來的用戶相似度。從最終相似度值找到目標(biāo)用戶的最近鄰居,然后選取相似度最高的前20個(gè)相似用戶和已關(guān)聯(lián)用戶作為反向傳播神經(jīng)網(wǎng)絡(luò)的輸入層來預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)的得分。

2.2 反向傳播神經(jīng)網(wǎng)絡(luò)及其改進(jìn)應(yīng)用

神經(jīng)網(wǎng)絡(luò)[13-14]等機(jī)器學(xué)習(xí)[15]算法應(yīng)用于大數(shù)據(jù)是人工智能領(lǐng)域中一個(gè)成功應(yīng)用,它能夠滿足人們從大量數(shù)據(jù)中挖掘出隱含的、未知的、有潛在價(jià)值的信息和知識(shí)的要求。目前,數(shù)據(jù)挖掘在市場(chǎng)營(yíng)銷、銀行、制造業(yè)、保險(xiǎn)業(yè)、計(jì)算機(jī)安全、醫(yī)藥、交通和電信等領(lǐng)域已經(jīng)有許多成功案例。

反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Algorithm,BP)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),包括輸入、隱藏和輸出共三層,遵循

其中j是隱藏層的個(gè)數(shù),i是輸入層的個(gè)數(shù),k是輸出值,R(10)是0到10之間的任意數(shù)。并且本文所提出的評(píng)分預(yù)測(cè)模型將在傳統(tǒng)BP網(wǎng)絡(luò)中加入時(shí)間戳作為權(quán)值來為評(píng)分的有效性進(jìn)行排序,整個(gè)網(wǎng)絡(luò)訓(xùn)練流程如圖2所示。

圖2 基于時(shí)間戳的BP網(wǎng)絡(luò)模型

在現(xiàn)實(shí)中有一個(gè)值得注意的問題就是人的興趣是會(huì)隨著時(shí)間的推移而發(fā)生改變,所以用戶對(duì)于項(xiàng)目的興趣度便不能單純地依靠評(píng)分來推斷。本文將給每個(gè)評(píng)分一個(gè)取值范圍在0至1之間的權(quán)值w,而這個(gè)權(quán)值的判斷方法就是基于項(xiàng)目的評(píng)價(jià)時(shí)間。通過上述內(nèi)容,用戶對(duì)于項(xiàng)目的評(píng)分將依靠權(quán)值w進(jìn)行預(yù)處理,同時(shí)找到缺失數(shù)據(jù)和剔除離群值。接著根據(jù)圖2所示的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu)后,對(duì)目標(biāo)用戶未評(píng)價(jià)的項(xiàng)目進(jìn)行預(yù)測(cè),預(yù)測(cè)得分高的將作為推薦結(jié)果。BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程如下所示:

以上為輸入層到隱藏層的計(jì)算過程,激活函數(shù)使用Logistic Function。其中p為迭代次數(shù),yj(p)為隱藏層輸出,xi(p)為輸入值,wij(p)為權(quán)值向量,δk(p)為誤差梯度,α為學(xué)習(xí)率,θj為精度控制參數(shù)。而后采用試錯(cuò)法求解得到合適的隱藏層節(jié)點(diǎn)數(shù)量。

式(10~14)為隱藏層到輸出層的計(jì)算公式,其計(jì)算過程類似輸入層到隱藏層,ek(p)為誤差信號(hào),其它符號(hào)含義同式(6~9)。上述整個(gè)SR++_BP模型可大大降低整個(gè)評(píng)分矩陣的稀疏度,訓(xùn)練-預(yù)測(cè)過程如圖3所示。

圖3 SR++_BP模型的訓(xùn)練測(cè)試集/過程

圖3是整個(gè)算法模型的訓(xùn)練測(cè)試過程,u6i6單元格的值即為需要預(yù)測(cè)的項(xiàng),表格上半部分相當(dāng)于訓(xùn)練集,其中IN是輸入向量,OUT部分是真實(shí)輸出。對(duì)圖3的數(shù)據(jù)集進(jìn)行訓(xùn)練得到穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu)后,輸入[u6:1,5,1,2,3],可得到 u6對(duì) i6的評(píng)分。

3 實(shí)驗(yàn)結(jié)果及分析

通過實(shí)驗(yàn)驗(yàn)證文中所提出算法的性能,實(shí)驗(yàn)采用Flixter數(shù)據(jù)集,過程需要用到數(shù)據(jù)集中3個(gè)表,包括用戶對(duì)電影的評(píng)分,用戶好友關(guān)系和用戶個(gè)人信息。要證明算法對(duì)結(jié)果的影響,就要在實(shí)驗(yàn)中建立科學(xué)客觀的推薦效果評(píng)價(jià)體系,不僅可以用來比較衡量各推薦系統(tǒng)的優(yōu)劣,還可以在運(yùn)算過程中指導(dǎo)相關(guān)參數(shù)的選擇,避免大量重復(fù)而無效的計(jì)算。對(duì)數(shù)據(jù)多次隨機(jī)分割交叉學(xué)習(xí),把訓(xùn)練結(jié)果和隨機(jī)選取的樣本數(shù)據(jù)進(jìn)行對(duì)比,以構(gòu)建一套綜合評(píng)價(jià)體系,客觀評(píng)價(jià)算法的推薦效果。

3.1 數(shù)據(jù)集統(tǒng)計(jì)分析

實(shí)驗(yàn)所采用的Flixter數(shù)據(jù)集包含好友關(guān)系和電影評(píng)分,共有147,612個(gè)用戶對(duì)48,794部電影進(jìn)行評(píng)分。首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,剔除沒有好友關(guān)系的數(shù)據(jù),再隨機(jī)分離出數(shù)據(jù)集中3000個(gè)用戶對(duì)5406部電影的評(píng)分(其中包括用戶個(gè)人信息和好友關(guān)系網(wǎng)絡(luò))進(jìn)行實(shí)驗(yàn)。被選中的數(shù)據(jù)中,部分將作為訓(xùn)練數(shù)據(jù),剩下的作為測(cè)試數(shù)據(jù),用來和算法預(yù)測(cè)的結(jié)果進(jìn)行對(duì)比,以考究預(yù)測(cè)結(jié)果和期望之間的重合度從而得到推薦準(zhǔn)確度。推薦模型數(shù)據(jù)結(jié)構(gòu)圖4所示。

圖4 推薦模型數(shù)據(jù)結(jié)構(gòu)

根據(jù)推薦模型數(shù)據(jù)結(jié)構(gòu)可發(fā)現(xiàn)數(shù)據(jù)集主體由3部分構(gòu)成:(1)用戶信息 (User);(2)好友關(guān)系(Friendship);(3)用戶對(duì)電影的評(píng)分(UserMovieRating)。首先根據(jù)用戶信息和用戶好友關(guān)系得到用戶之間的相似度,其次根據(jù)這個(gè)相似度選取要進(jìn)行訓(xùn)練的評(píng)分?jǐn)?shù)據(jù),再次根據(jù)項(xiàng)目的評(píng)分時(shí)間進(jìn)行最后一輪篩選得到最終要納入訓(xùn)練的數(shù)據(jù),訓(xùn)練出穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu)后便可進(jìn)行項(xiàng)目評(píng)分預(yù)測(cè),得到推薦結(jié)果。

3.2 評(píng)分函數(shù)

將使用推薦準(zhǔn)確度作為評(píng)價(jià)指標(biāo),而使用評(píng)分函數(shù)的目的是用函數(shù)的形式來評(píng)價(jià)實(shí)驗(yàn)所搭建的模型對(duì)于數(shù)據(jù)集的挖掘分析及推薦有效程度。目前,絕大多數(shù)的推薦系統(tǒng)都是使用預(yù)測(cè)準(zhǔn)確度來評(píng)價(jià)推薦算法的性能,本質(zhì)是比較推薦結(jié)果和實(shí)際值之間的相似度。常用度量方法有平均絕對(duì)誤差(MAE)和根均方差(RMSE)。

MAE計(jì)算預(yù)測(cè)評(píng)分與用戶實(shí)際評(píng)分之間的平均絕對(duì)誤差值,其計(jì)算公式如式(15)所示;RMSE計(jì)算用戶實(shí)際評(píng)分和預(yù)測(cè)評(píng)分之間的根均方誤差,它的計(jì)算公式如式(16)所示。

其中:n表示測(cè)試集數(shù)據(jù)個(gè)數(shù);pi,u表示用戶i對(duì)電影u的實(shí)際評(píng)分;qi,u表示用戶i對(duì)電影u的預(yù)測(cè)評(píng)分。推薦算法的準(zhǔn)確度是所有用戶預(yù)測(cè)評(píng)分和用戶實(shí)際評(píng)分的差均分和根均方誤差。而后者在求和之前對(duì)誤差值進(jìn)行平方,所以其對(duì)RMSE的影響比MAE更大。

3.3 推薦界面和結(jié)果

為了直觀地看出預(yù)測(cè)結(jié)果,首先搭建了一個(gè)虛擬的社交網(wǎng)絡(luò)系統(tǒng)。它實(shí)現(xiàn)了用戶注冊(cè)、登錄、推薦和預(yù)測(cè)功能,只需點(diǎn)擊不同按鈕即可得到所要結(jié)果。同時(shí)也解決了文中所提出的“冷啟動(dòng)”問題,接下來的好友推薦功能和項(xiàng)目預(yù)測(cè)評(píng)分也都實(shí)現(xiàn)在線計(jì)算,并且不會(huì)耗用過多內(nèi)存和運(yùn)行時(shí)間。

圖5 推薦界面

圖5簡(jiǎn)單地展示了社交推薦界面,證明了文中提出算法實(shí)際應(yīng)用的可行性。當(dāng)用戶登錄入該網(wǎng)站后,界面上會(huì)顯示出七個(gè)按鈕。點(diǎn)擊用戶配置文件(My Profile)按鈕可查看當(dāng)前登錄用戶的個(gè)人信息,同時(shí)可從中找出用戶基于個(gè)人偏好的相似性,也可在用戶未對(duì)任何項(xiàng)目進(jìn)行評(píng)分時(shí)解決系統(tǒng)“冷啟動(dòng)”問題。點(diǎn)擊電影(Movie Recommender)和好友(People You May Interest)推薦按鈕,通過已置入網(wǎng)站的推薦算法(本文所提出的)則可得到預(yù)測(cè)和推薦結(jié)果。其余按鈕實(shí)現(xiàn)的是社交網(wǎng)站基本需求和基于某一條件下對(duì)原始數(shù)據(jù)的排序,僅僅是用來做數(shù)據(jù)展示的功能。

3.4 Flixter數(shù)據(jù)集實(shí)驗(yàn)結(jié)果及分析

使用評(píng)分函數(shù)計(jì)算后的結(jié)果將在基于同一個(gè)數(shù)據(jù)集的基礎(chǔ)上,和傳統(tǒng)推薦算法進(jìn)行比較。本實(shí)驗(yàn)將評(píng)分?jǐn)?shù)據(jù)中的60%、70%、80%、90%作為訓(xùn)練數(shù)據(jù)集,相應(yīng)的剩下部分?jǐn)?shù)據(jù)集作為測(cè)試數(shù)據(jù),實(shí)驗(yàn)結(jié)果如圖6~7所示。

圖6 預(yù)測(cè)精度MAE值

圖7 預(yù)測(cè)精度RMSE值

圖6和圖7中,橫坐標(biāo)表示不同推薦算法;縱坐標(biāo)前者為評(píng)價(jià)指標(biāo)MAE的值,后者為評(píng)價(jià)指標(biāo)RMSE的值。從兩圖中可發(fā)現(xiàn)隨著訓(xùn)練數(shù)據(jù)集比例增加,推薦效果越來越好,并且無論訓(xùn)練集比例占比多少,可發(fā)現(xiàn)本文提出的SR++_BP模型取得了最好的推薦效果,說明了該模型利用用戶社交關(guān)系和其個(gè)性化屬性信息有助于提高推薦精度。反映了好友信任關(guān)系是值得信賴的,可以得出結(jié)論:SR++_BP模型在對(duì)用戶未評(píng)分項(xiàng)目上的預(yù)測(cè)效果高于BP、CF和CF_User算法模型,并且有效地解決了數(shù)據(jù)稀疏性問題。

4 結(jié)束語

當(dāng)前用戶評(píng)分?jǐn)?shù)據(jù)在絕大多數(shù)數(shù)據(jù)集中都存在嚴(yán)重的數(shù)據(jù)稀疏性問題,若只使用單一的BP模型將大大影響訓(xùn)練效果。其次,從數(shù)據(jù)中獲取用戶短時(shí)期內(nèi)的偏好,捕捉用戶偏好的動(dòng)態(tài)變化,是當(dāng)前推薦系統(tǒng)的熱點(diǎn)和難點(diǎn),本文通過調(diào)整評(píng)分?jǐn)?shù)據(jù)在基于評(píng)價(jià)時(shí)間上的權(quán)值以改變輸出,便能很好地追蹤用戶的興趣變化。而在基于BP和SimRank++模型的社交網(wǎng)絡(luò)中,挖掘用戶社交活動(dòng)的特征信息及其與社交關(guān)系的關(guān)聯(lián)性,利用協(xié)同過濾和臨近相似規(guī)則,從大量數(shù)據(jù)中定義人與人之間、人與物之間的關(guān)系,是本文研究的主要目的。文中所提出的算法針對(duì)不同社交網(wǎng)絡(luò)數(shù)據(jù)特點(diǎn),可有效反饋推薦結(jié)果,真正意義上為用戶緩解“信息”問題,同時(shí)也和傳統(tǒng)推薦算法進(jìn)行比較,用評(píng)分函數(shù)來證明其學(xué)術(shù)和商業(yè)價(jià)值,也望未來在訓(xùn)練速度和推薦效率上有更好的改進(jìn)。

參考文獻(xiàn):

[1]CHEN D,XU D.A Collaborative Filtering recommendation based on user profile weight and time weight[C]//International Conference on Computational Intelligence and Software Engineering.IEEE,2009:1-4.

[2]ZHANG Q Q,YE N.Collaborative filtering algorithm adapting to changes over dynamic time[J].International Proceedings of Computer Science & Information Tech,2012:27.

[3]CANNY J.Collaborative filtering with privacy via factor analysis[C]//International ACM SIGIR Conference on Research and Development in Information Retrieval.ACM, 2002:238-245.

[4]RUTH G,XAVIER A.Weighted content based methods for recommending connections in online social networks[C].Proceedings of the 2nd ACM RecSys'10 Workshop on Recommender Systems and the Social Web ,2010:74-77

[5]BOURAGA S,JURETA I,F(xiàn)AULKNER S,et al.Knowledge based recommendation systems:a survey[J].International Journal of Intelligent Information Technologies,2014,10(2):1-19.

[6]GARCIA R.Hybrid methods for recommending connections in online social networks[D].UPF,2010.

[7]JOEL P L,NUNO L,MARIA N M,et al.A hybrid recommendation approach for a tourism system[J].Expert Systems with Applications,2013,40(9):3532-3550.

[8]AUAD T,MENDES L,STROELE V,et al.Improving the user experience on mobile apps through data mining[C]//IEEE, International Conference on Computer Supported Cooperative Work in Design.IEEE,2016:158-163.

[9]TUUKKA R,KRISTER H,et al.SMAETMUSEUM:a mobile recommender system for the web of data web semantics:science[J].Services and Agents on the World Wide Web,2013,20(2):50-67.

[10]JIA W H,MICHELINE K,JIAN P.Data mining:concepts and techniques[M].3rd Edition.Morgan Kaufmann:2012.

[11]DIETMAR J,SIMON F.Recommendation-based modeling support for data mining processes [C]//ACM Conference on Recommender Systems.ACM,2014:337-340.

[12]JEH G,WIDOM J.SimRank:a measure of structural-context similarity[C]//Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2002:538-543.

[13]SCHOLKOPFB,PLATTJ,HOFMANNT.Modelinghumanmotionwsingbinarylatentvariables [C]//InternationalConference onNeuralInformationProcessingSystems.MITPress,2006:1345-1352.

[14]WELLING M,ROSEN Z,HINTON M.Exponential family harmoniums with an application to information retrieval[C]//International Conference on Neural Information Processing Systems.MIT Press, 2004:1481-1488.

[15]CARREIRA P,HINTON M.On Contrastive Divergence Learning[J].Proceedings of Artificial Intelligence & Statistics,2005.

猜你喜歡
社交神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
無可預(yù)測(cè)
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
社交牛人癥該怎么治
聰明人 往往很少社交
社交距離
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
你回避社交,真不是因?yàn)閮?nèi)向
不必預(yù)測(cè)未來,只需把握現(xiàn)在
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立