国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討

2016-12-15 19:46:14張普洋郭劍英
電腦知識(shí)與技術(shù) 2016年27期
關(guān)鍵詞:個(gè)性化推薦推薦系統(tǒng)算法

張普洋+郭劍英

摘要:推薦算法是個(gè)性化推薦系統(tǒng)的核心。目前,研究人員提出了很多推薦算法。本文首先對(duì)個(gè)性化推薦系統(tǒng)進(jìn)行介紹,然后側(cè)重討論了多種經(jīng)典的個(gè)性化推薦算法,對(duì)這些推薦算法的優(yōu)缺點(diǎn)及適用場(chǎng)景進(jìn)行了比較分析,最后在此基礎(chǔ)上提出了未來的研究方向。

關(guān)鍵詞: 個(gè)性化推薦;算法;推薦系統(tǒng)

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)27-0162-02

1個(gè)性化推薦系統(tǒng)

隨著互聯(lián)網(wǎng)的飛速發(fā)展和云計(jì)算的興起,人們已然處于一個(gè)信息爆炸的大數(shù)據(jù)時(shí)代。每天面對(duì)海量的數(shù)據(jù)信息,搜索引擎在一定程度上為人們解決了信息篩選問題,但當(dāng)用戶無法用準(zhǔn)確的關(guān)鍵詞描述自己的需求時(shí),搜索引擎的篩選效率將會(huì)打折扣。用戶如何在一個(gè)網(wǎng)站上快速而有效地找到自己所需要的信息?網(wǎng)站如何將用戶最關(guān)注最感興趣的信息篩選出來實(shí)時(shí)呈現(xiàn)在用戶面前?推薦系統(tǒng)的出現(xiàn)解決了這些問題。

推薦系統(tǒng)是根據(jù)用戶的興趣愛好向用戶推薦符合其需求的對(duì)象,亦稱為個(gè)性化推薦系統(tǒng)。個(gè)性化推薦系統(tǒng)通過一定的方式將用戶和信息聯(lián)系起來,不僅可以幫助用戶找到感興趣的信息,而且能夠?qū)⑿畔⒎诸惓尸F(xiàn)在不同的用戶面前,從而實(shí)現(xiàn)用戶與信息提供商的雙贏。個(gè)性化推薦系統(tǒng)已經(jīng)全面運(yùn)用到各個(gè)互聯(lián)網(wǎng)網(wǎng)站中。在電子商務(wù)領(lǐng)域,網(wǎng)站通過使用個(gè)性化推薦系統(tǒng)向用戶推薦其可能感興趣的商品,提高用戶的購(gòu)買率和用戶的忠誠(chéng)度。Netflix網(wǎng)站使用個(gè)性化推薦系統(tǒng)為用戶推薦喜歡的電影,豆瓣電臺(tái)通過個(gè)性化推薦系統(tǒng)向用戶推薦符合其口味的好音樂,Goodreads網(wǎng)站利用推薦系統(tǒng)為用戶推薦適合其閱讀的書籍。

2個(gè)性化推薦系統(tǒng)中關(guān)鍵算法分析

個(gè)性化推薦系統(tǒng)為用戶提供個(gè)性化體驗(yàn)的同時(shí),也日益受到越來越多的學(xué)者和互聯(lián)網(wǎng)網(wǎng)站的關(guān)注。個(gè)性化推薦系統(tǒng)的工作原理是首先輸入數(shù)據(jù)源(用戶和項(xiàng)目的各種屬性和特征,包括年齡、性別、地域、物品的類別、發(fā)布時(shí)間等),然后選擇合適的推薦算法,最后將產(chǎn)生的推薦結(jié)果(按照用戶喜好程度排序的項(xiàng)目列表)推薦給用戶。不同的個(gè)性化推薦系統(tǒng)使用不同的推薦算法,因此個(gè)性化推薦系統(tǒng)最為核心之處在于根據(jù)不同的數(shù)據(jù)源選擇不同的推薦算法。

目前,個(gè)性化推薦系統(tǒng)中主要使用的推薦算法有:協(xié)同過濾推薦算法、基于內(nèi)容的推薦算法、基于人口統(tǒng)計(jì)學(xué)的推薦算法、組合推薦算法。下面對(duì)主要的推薦算法進(jìn)行比較并分析它們的優(yōu)缺點(diǎn)及適用場(chǎng)景。

2.1協(xié)同過濾推薦算法

協(xié)同過濾推薦是使用最廣泛的個(gè)性化推薦算法之一。協(xié)同過濾有兩種主流算法:基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾。

2.1.1基于用戶的協(xié)同過濾

基于用戶的協(xié)同過濾是根據(jù)不同的用戶對(duì)項(xiàng)目的評(píng)分來測(cè)評(píng)各用戶之間的相似性,基于用戶間的相似性進(jìn)行推薦。即通過用戶的瀏覽記錄、購(gòu)買行為等信息分析各個(gè)用戶對(duì)項(xiàng)目的評(píng)價(jià),發(fā)現(xiàn)與當(dāng)前用戶最相似的“鄰居”用戶群(“K-鄰居”的算法);然后將K個(gè)鄰居評(píng)價(jià)最高并且當(dāng)前用戶又沒有瀏覽過的項(xiàng)目推薦給當(dāng)前用戶?;谟脩舻膮f(xié)同過濾推薦算法是以用戶與用戶之間的關(guān)系為著眼點(diǎn),因?yàn)榕d趣相近的用戶可能會(huì)對(duì)同樣的東西感興趣。如:Facebook網(wǎng)站首先對(duì)用戶個(gè)人資料、周圍朋友感興趣的廣告等相關(guān)信息進(jìn)行分析,計(jì)算出各用戶之間的相似性,進(jìn)而對(duì)用戶提供廣告推銷。所以說,在當(dāng)前流行的社交網(wǎng)站中,基于用戶的協(xié)同過濾推薦是一個(gè)不錯(cuò)的選擇,若將基于用戶的協(xié)同過濾推薦算法與社會(huì)網(wǎng)絡(luò)信息相融合,會(huì)增加用戶對(duì)推薦解釋的信服程度。

2.1.2 基于項(xiàng)目的協(xié)同過濾

基于項(xiàng)目的協(xié)同過濾是通過用戶對(duì)不同項(xiàng)目的評(píng)分來測(cè)評(píng)各個(gè)項(xiàng)目之間的相似性,基于項(xiàng)目之間的相似性做出推薦。即利用所有用戶對(duì)物品或者項(xiàng)目的偏好,計(jì)算不同物品或項(xiàng)目之間的相似度,然后根據(jù)用戶的歷史信息,將類似的物品或項(xiàng)目推薦給用戶?;陧?xiàng)目的協(xié)同過濾是以項(xiàng)目與項(xiàng)目之間的關(guān)系為中心,因?yàn)橛脩艨赡芷珢叟c他已購(gòu)買的商品類似的商品。如在購(gòu)書網(wǎng)站上,當(dāng)用戶看一本書時(shí),網(wǎng)站會(huì)給用戶推薦相關(guān)的書籍。此時(shí),基于項(xiàng)目的協(xié)同過濾推薦成為了引導(dǎo)用戶瀏覽的重要手段。對(duì)于一個(gè)電子商務(wù)網(wǎng)站,用戶的數(shù)量遠(yuǎn)遠(yuǎn)超過商品的數(shù)量,同時(shí)商品的數(shù)據(jù)相對(duì)穩(wěn)定,因此計(jì)算商品的相似度計(jì)算量較小,不必頻繁更新。所以基于項(xiàng)目的協(xié)同過濾推薦適應(yīng)于提供商品的電子商務(wù)網(wǎng)站。

協(xié)同過濾推薦算法優(yōu)勢(shì)在于:不需要各領(lǐng)域的知識(shí);能跨類型推薦(如推薦音樂、藝術(shù)品、電影等);計(jì)算出來的推薦結(jié)果是開放的,可以共享他人的經(jīng)驗(yàn),能很好地發(fā)現(xiàn)用戶潛在的興趣愛好;自適應(yīng)性好;隨著時(shí)間推移預(yù)測(cè)精度會(huì)提高。

協(xié)同過濾的推薦算法不足之處在于對(duì)于歷史信息依賴性較強(qiáng);還有冷啟動(dòng)問題,當(dāng)新用戶或者新物品進(jìn)入系統(tǒng)時(shí),難以進(jìn)行個(gè)性化推薦。同時(shí)在大規(guī)模網(wǎng)絡(luò)中,數(shù)據(jù)極端稀疏,算法效率較低,難以處理大數(shù)據(jù)量下的即時(shí)結(jié)果。

2.2基于內(nèi)容的推薦算法

基于內(nèi)容的推薦算法是根據(jù)歷史信息(如評(píng)價(jià)、分享、收藏過的文檔) 學(xué)習(xí)用戶的興趣,建立用戶偏好文檔,計(jì)算待推薦項(xiàng)目與用戶偏好文檔的匹配程度, 將最相似的項(xiàng)目推薦給用戶。如:在音樂推薦中,基于內(nèi)容的推薦系統(tǒng)首先分析用戶欣賞過的音樂的共性(歌手、曲風(fēng)等),再推薦與用戶感興趣的音樂內(nèi)容相似度高的其他樂曲。

基于內(nèi)容的推薦算法生成推薦的過程主要依靠三個(gè)部件:(1)內(nèi)容分析器:用一種適當(dāng)?shù)姆绞奖硎緩捻?xiàng)目信息中提取的有用信息。(2)文件學(xué)習(xí)器:該模塊收集用戶偏好的數(shù)據(jù),生成用戶概要信息和偏好文檔。(3)過濾部件:通過學(xué)習(xí)用戶偏好文檔,匹配用戶概要信息和項(xiàng)目信息,將生成一個(gè)用戶可能感興趣的潛在項(xiàng)目評(píng)分列表。

基于內(nèi)容的推薦算法生成的推薦結(jié)果直觀明了,容易理解。不需要領(lǐng)域知識(shí),不需要很大的用戶社區(qū),僅需要得到兩類信息:項(xiàng)目特征的描述和用戶過去的喜好信息。

基于內(nèi)容的推薦算法有三個(gè)主要缺陷:(1)過度規(guī)范問題:推薦給用戶的項(xiàng)目與其消費(fèi)過的項(xiàng)目很相似,不能為用戶發(fā)現(xiàn)潛在感興趣的資源。 (2)內(nèi)容分析有限:只能預(yù)處理一些易提取的文本類內(nèi)容(網(wǎng)頁(yè)、博客等),而在提取多媒體數(shù)據(jù)(圖像、音頻、視頻等)時(shí)較困難。(3)冷啟動(dòng)問題:當(dāng)一個(gè)新用戶沒有對(duì)任何項(xiàng)目進(jìn)行評(píng)分或沒有瀏覽過任何商品時(shí),系統(tǒng)無法向該用戶提供準(zhǔn)確的推薦。

2.3 基于人口統(tǒng)計(jì)學(xué)的推薦算法

基于人口統(tǒng)計(jì)學(xué)的推薦算法是根據(jù)人口統(tǒng)計(jì)學(xué)數(shù)據(jù)(即系統(tǒng)用戶的基本信息:年齡、性別、工作、興趣、愛好等),計(jì)算用戶間相關(guān)程度,得到當(dāng)前用戶的最近鄰集,然后將把“鄰居”用戶群喜愛的項(xiàng)目推薦給當(dāng)前用戶。

基于人口統(tǒng)計(jì)學(xué)的推薦算法優(yōu)勢(shì)在于:不需要用戶的歷史喜好信息,可以很好解決冷啟動(dòng)問題;不依賴于項(xiàng)目的屬性,其他領(lǐng)域的問題都可以無縫接入;而且隨著時(shí)間推移,預(yù)測(cè)精度也會(huì)逐漸提高。

但是在一些有較高要求的領(lǐng)域(如:音樂、藝術(shù)品、電影、書籍等)進(jìn)行推薦時(shí),此算法對(duì)用戶基本信息進(jìn)行分類過于粗糙。同時(shí)在收集人口統(tǒng)計(jì)信息時(shí),不易獲取比較敏感的信息,從而導(dǎo)致推薦系統(tǒng)在準(zhǔn)確度方面不如其他算法,無法得到良好的推薦效果。

除了上述比較典型的推薦算法,還有其他一些推薦算法: 基于知識(shí)的推薦算法、基于效用的推薦算法和基于關(guān)聯(lián)規(guī)則的推薦算法?;陉P(guān)聯(lián)規(guī)則的推薦算法是將用戶的購(gòu)買歷史記錄、瀏覽痕跡、打分記錄作為數(shù)據(jù)源,挖掘出的關(guān)聯(lián)規(guī)則就是推薦對(duì)象。關(guān)聯(lián)規(guī)則挖掘是用來發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,而且關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)是算法的關(guān)鍵,也是算法的瓶頸。

2.4 混合推薦算法

任何一個(gè)個(gè)性化推薦算法都有它獨(dú)特的優(yōu)勢(shì)和不可避免的缺陷,因此現(xiàn)實(shí)應(yīng)用中,直接用某種算法來做推薦系統(tǒng)的很少,往往是將各種推薦算法組合起來,這樣可以揚(yáng)長(zhǎng)補(bǔ)短,提高推薦的準(zhǔn)確度和效率。尤其是大數(shù)據(jù)環(huán)境下,各種混合推薦算法的推薦效果要優(yōu)于單一推薦算法?;趦?nèi)容的推薦算法和協(xié)同過濾算法都無法解決冷啟動(dòng)問題,因?yàn)檫@兩種算法都需要?dú)v史信息。若將協(xié)同過濾推薦算法與基于知識(shí)的推薦算法組合起來,則能很好地解決冷啟動(dòng)問題。

文獻(xiàn)[2]以電影為推薦對(duì)象, 通過線性組合的方式將基于內(nèi)容的推薦算法和基于協(xié)同過濾的推薦算法相融合, 得到最終的推薦結(jié)果。兩種算法的組合很好地避免了基于內(nèi)容推薦算法不適合推薦多媒體數(shù)據(jù)的缺陷, 解決了協(xié)同過濾算法中用戶對(duì)電影評(píng)分少的數(shù)據(jù)稀疏的問題。

在一些大型的網(wǎng)站使用的就是融合了多種算法的推薦系統(tǒng)。比如淘寶網(wǎng)為顧客推薦商品時(shí)采用了基于內(nèi)容和基于關(guān)聯(lián)規(guī)則兩種算法的組合。根據(jù)用戶的瀏覽痕跡、收藏記錄、購(gòu)買行為以及反饋信息產(chǎn)生可推薦的關(guān)聯(lián)規(guī)則,根據(jù)商品的相關(guān)屬性(描述,評(píng)價(jià),名稱,收藏人氣,累計(jì)銷量等等)對(duì)優(yōu)質(zhì)商品進(jìn)行評(píng)分,計(jì)算出用戶帶權(quán)重的標(biāo)簽,最后進(jìn)行個(gè)性化推薦。

3 總結(jié)與展望

綜上所述,個(gè)性化推薦系統(tǒng)將用戶和項(xiàng)目有機(jī)地聯(lián)系起來,是一個(gè)高效的信息服務(wù)系統(tǒng)。為增強(qiáng)個(gè)性化推薦系統(tǒng)的功能,未來的個(gè)性化推薦系統(tǒng)應(yīng)該將企業(yè)的銷售系統(tǒng)、客戶關(guān)系管理系統(tǒng)等企業(yè)信息系統(tǒng)集成在一起,共同為企業(yè)發(fā)展提供決策支持。那么個(gè)性化推薦系統(tǒng)如何與這些系統(tǒng)集成,如何與社會(huì)網(wǎng)絡(luò)相結(jié)合,改變用戶購(gòu)物模式,企業(yè)銷售方式,都是未來的研究方向。

設(shè)計(jì)個(gè)性化推薦系統(tǒng)最終目的都是為了提高用戶體驗(yàn)感和滿意度。一個(gè)被用戶接受和認(rèn)可的推薦系統(tǒng),在幫助用戶發(fā)現(xiàn)潛在感興趣的項(xiàng)目的同時(shí)還能夠幫助項(xiàng)目提供商將項(xiàng)目投放給對(duì)它感興趣的用戶。一個(gè)好的推薦系統(tǒng)能夠?qū)净驑I(yè)務(wù)產(chǎn)生增值效應(yīng),會(huì)給用戶帶來更好的體驗(yàn)。但是如何將用戶的體驗(yàn)感進(jìn)行量化是一個(gè)具有挑戰(zhàn)性的課題。

參考文獻(xiàn):

[1] 張亮,趙娜.改進(jìn)的協(xié)同過濾推薦算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(7)

[2] 馬瑞敏,卞藝杰,陳超,吳慧.基于Hadoop 的電子商務(wù)個(gè)性化推薦算法——以電影推薦為例[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2015,24(5).

[3] 喬亞飛,張霞,張文博.智能圖書系統(tǒng)中的個(gè)性化推薦[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(9).

[4] 朱郁筱,呂琳媛.推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J].電子科技大學(xué)學(xué)報(bào),2012,41(2).

[5] 朱揚(yáng)勇,孫婧.推薦系統(tǒng)研究進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2015,9(5).

[6] 劉魯,任曉麗.推薦系統(tǒng)研究進(jìn)展及展望[J].信息系統(tǒng)學(xué)報(bào),2007(1).

[7] 余力,劉魯.電子商務(wù)個(gè)性化推薦研究[J].計(jì)算機(jī)集成制造系統(tǒng),2004(10).

[8] 楊博,趙鵬飛.推薦算法綜述[J].山西大學(xué)學(xué)報(bào),2011,34(3).

猜你喜歡
個(gè)性化推薦推薦系統(tǒng)算法
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
基于遠(yuǎn)程教育的個(gè)性化知識(shí)服務(wù)研究
東方教育(2016年8期)2017-01-17 19:47:27
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于個(gè)性化的協(xié)同過濾圖書推薦算法研究
基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
商(2016年29期)2016-10-29 15:22:08
芦溪县| 洪湖市| 兰坪| 松溪县| 买车| 满洲里市| 柳河县| 黔东| 永平县| 怀来县| 南投市| 利津县| 东乡族自治县| 潞西市| 固安县| 平和县| 景宁| 苏州市| 沙坪坝区| 桑植县| 乐都县| 兴海县| 玛纳斯县| 长汀县| 邢台市| 安图县| 吴堡县| 清镇市| 花垣县| 三亚市| 乐平市| 调兵山市| 明水县| 平昌县| 沁源县| 那坡县| 黄浦区| 林口县| 简阳市| 绵竹市| 彝良县|