国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于智能推薦的電子商城購(gòu)物系統(tǒng)設(shè)計(jì)

2015-05-30 12:14:39付加星孟佳娜沈杭春武星宇
計(jì)算機(jī)時(shí)代 2015年6期
關(guān)鍵詞:相似度協(xié)同過(guò)濾聚類

付加星 孟佳娜 沈杭春 武星宇

摘 要: 為提高網(wǎng)絡(luò)購(gòu)物的個(gè)性化體驗(yàn),設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)基于智能推薦的電子商城購(gòu)物系統(tǒng)。為達(dá)到用戶網(wǎng)頁(yè)瀏覽行為的分析與預(yù)測(cè),推薦算法結(jié)合了基于用戶和基于項(xiàng)的協(xié)同過(guò)濾算法,系統(tǒng)構(gòu)建用戶具有偏序結(jié)構(gòu)的關(guān)鍵瀏覽路徑層次圖。數(shù)據(jù)分析結(jié)果表明,改進(jìn)后的推薦算法有助于提升推薦系統(tǒng)的性能,從而滿足用戶個(gè)性化需求。

關(guān)鍵詞: 智能推薦; 個(gè)性化需求; 協(xié)同過(guò)濾; 相似度; 聚類; 電子商城

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2015)06-39-03

Abstract: In order to improve the personalized experience of shopping online, an electronic shopping system based on the intelligent recommendation is designed and implemented. In respect of the users' web browsing behavior can be analyzed and forecasted, the recommendation algorithm is combined with the user based and the item based collaborative filtering algorithm. A key browser path hierarchy chart with partial order structure of the user is built. Data analysis results show that the improved recommendation algorithm is helpful to enhance the performance of the recommendation system so that satisfy the users, personalized needs.

Key words: intelligent recommendation; personalized needs; collaborative filtering; similarity; clustering; E-commerce

0 引言

智能推薦系統(tǒng)[1-2]是Internet網(wǎng)上購(gòu)物過(guò)程中解決信息過(guò)剩的一種信息過(guò)濾技術(shù),向用戶推薦感興趣的信息和商品(衣物、新聞、書(shū)籍、電影等等)。推薦系統(tǒng)首先從用戶的瀏覽史和社會(huì)環(huán)境等信息得到用戶特征,根據(jù)用戶特征能夠得到一個(gè)用戶概況,推薦系統(tǒng)從用戶概況等信息推算用戶對(duì)未看過(guò)的商品和信息的喜好程度。

在這個(gè)信息大爆炸的時(shí)代,用戶數(shù)量和項(xiàng)目數(shù)量急劇增加,而可用于評(píng)分的項(xiàng)目很少,系統(tǒng)會(huì)消耗大量的時(shí)間完成推薦算法,導(dǎo)致了不能及時(shí)響應(yīng)用戶的請(qǐng)求。本文采用一種項(xiàng)目簇偏好的用戶聚類方法,改變了預(yù)測(cè)評(píng)分過(guò)程中用戶相似性算法,并考慮用戶的興趣隨時(shí)間變化的情況,保證了系統(tǒng)的實(shí)時(shí)性。為了避免用戶在面對(duì)網(wǎng)站大量信息,卻無(wú)法很快從中獲取自己感興趣的信息的情況,本文設(shè)計(jì)了基于Web數(shù)據(jù)挖掘的推薦系統(tǒng),根據(jù)用戶的興趣、特點(diǎn)和購(gòu)買(mǎi)行為,計(jì)算出用戶可能喜歡的內(nèi)容或商品,為不同用戶展示不同內(nèi)容,滿足其個(gè)性化需求。

1 系統(tǒng)關(guān)鍵技術(shù)

1.1 開(kāi)發(fā)環(huán)境

1.1.1 數(shù)據(jù)庫(kù)

本系統(tǒng)使用MySQL數(shù)據(jù)庫(kù)[3],MySQL是一種開(kāi)放源代碼的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),MySQL數(shù)據(jù)庫(kù)系統(tǒng)使用最常用的數(shù)據(jù)庫(kù)管理語(yǔ)言——結(jié)構(gòu)化查詢語(yǔ)言(Structured Query Language)進(jìn)行數(shù)據(jù)庫(kù)管理,具有數(shù)據(jù)庫(kù)的通用性,MySQL支持標(biāo)準(zhǔn)的結(jié)構(gòu)化查詢語(yǔ)言。本系統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)表是基礎(chǔ),決定了該系統(tǒng)的可維護(hù)與可擴(kuò)展性,以用戶信息表(db_user)為例,其字段設(shè)計(jì)為:

用戶信息表db_user:userId(Id號(hào)、主鍵)、userName(姓名)、password(密碼)、userTime(注冊(cè)時(shí)間)、userEmail(郵箱)、userSex(性別)、userAge(年齡)、userImg(頭像)、userPhone(手機(jī))、userCode(郵編)、userAddress(地址)、userWork(職業(yè))、userMoney(工資)、userLike(愛(ài)好)、userRight(用戶權(quán)限、外鍵)。

1.1.2 Java EE三大框架

Struts是開(kāi)源軟件[4],使用Struts的目的是幫助程序員減少運(yùn)用MVC設(shè)計(jì)模型來(lái)開(kāi)發(fā)Web應(yīng)用的時(shí)間。Struts對(duì)Model,View和Controller都提供了對(duì)應(yīng)的組件。Spring是一個(gè)強(qiáng)大的框架,解決了許多在J2EE開(kāi)發(fā)中常見(jiàn)的問(wèn)題。Springle提供了管理業(yè)務(wù)對(duì)象的一致方法。Spring的架構(gòu)基礎(chǔ)是基于使用JavaBean屬性的Inversion of Control 容器。Hibernate是一個(gè)開(kāi)源代碼的對(duì)象關(guān)系映射框架,對(duì)JDBC進(jìn)行了對(duì)象封裝,使得Java程序員可以使用對(duì)象來(lái)操作數(shù)據(jù)庫(kù)。Hibernate可以應(yīng)用在任何使用JDBC的場(chǎng)合,既可以在Java的客戶端程序使用,也可以在Servlet/JSP的Web應(yīng)用中使用。

1.2 推薦算法

1.2.1 協(xié)同過(guò)濾算法

電子商務(wù)推薦系統(tǒng)的應(yīng)用日益廣泛,推薦算法作為推薦系統(tǒng)的核心也得到廣泛的研究,協(xié)同過(guò)濾推薦算法[5]是目前應(yīng)用最成功的推薦算法之一。電子商務(wù)推薦系統(tǒng)可根據(jù)其他用戶的評(píng)論信息,采用協(xié)同過(guò)濾技術(shù)給目標(biāo)用戶推薦商品。協(xié)同過(guò)濾算法主要分為基于用戶的協(xié)同過(guò)濾算法和基于項(xiàng)目的協(xié)同過(guò)濾算法。啟發(fā)式協(xié)同過(guò)濾算法主要包含收集用戶偏好信息、尋找相似商品或用戶和產(chǎn)生推薦三個(gè)步驟。

基于用戶的協(xié)同過(guò)濾推薦算法又叫基于內(nèi)容的推薦[6],其基本思想是用戶選擇某個(gè)推薦對(duì)象,也就是說(shuō)一些用戶對(duì)某些推薦對(duì)象的評(píng)價(jià)比較相似,則說(shuō)明這些用戶的興趣愛(ài)好也是相似的。所以協(xié)同過(guò)濾推薦首先找到與目標(biāo)用戶興趣愛(ài)好相似的最近鄰,根據(jù)最近鄰對(duì)推薦對(duì)象的評(píng)價(jià)為用戶進(jìn)行推薦。常用的計(jì)算兩個(gè)用戶的相似性公式⑴為余弦相似度公式。

除了以上所述的推薦算法改進(jìn)外,本系統(tǒng)還將用戶評(píng)分相似度和用戶特征相似度相結(jié)合選取用戶最近鄰居計(jì)算用戶預(yù)測(cè)評(píng)分,同時(shí)將項(xiàng)目評(píng)分相似度和項(xiàng)目特征相似度相結(jié)合,選取項(xiàng)目最近鄰居計(jì)算項(xiàng)目預(yù)測(cè)評(píng)分,然后將用戶預(yù)測(cè)評(píng)分和項(xiàng)目預(yù)測(cè)評(píng)分相結(jié)合產(chǎn)生最終推薦。

2 系統(tǒng)描述

一個(gè)完整的個(gè)性化智能推薦系統(tǒng)[8]大概主要包括:收集用戶信息的行為記錄模塊、分析用戶喜好的模型分析模塊和推薦算法模塊,其中推薦算法模塊是推薦系統(tǒng)中最為核心的部分。

本系統(tǒng)在對(duì)客戶數(shù)據(jù)透明的情況下,對(duì)客戶的數(shù)據(jù)、行為進(jìn)行分析。當(dāng)用戶登錄到系統(tǒng)時(shí),通過(guò)系統(tǒng)對(duì)身份的驗(yàn)證后,用戶信息模塊開(kāi)始收集信息,跟蹤客戶的行為,收集客戶的交易方式、時(shí)間、內(nèi)容和評(píng)價(jià)的過(guò)程和結(jié)果的主要信息,數(shù)據(jù)庫(kù)進(jìn)行信息的預(yù)處理和歸一化,形成客戶個(gè)性化特征數(shù)據(jù)庫(kù)。個(gè)性化分析處理模塊結(jié)合客戶個(gè)性數(shù)據(jù)庫(kù)進(jìn)行個(gè)性分析,并把結(jié)果送到智能重組模塊。在智能重組模塊,對(duì)用戶興趣的分類轉(zhuǎn)化為對(duì)項(xiàng)目的分類。對(duì)于同一用戶,如預(yù)測(cè)項(xiàng)目所屬類別不同,用來(lái)預(yù)測(cè)的鄰居用戶也不同,也就是鄰居用戶與待預(yù)測(cè)的項(xiàng)目在內(nèi)容上具有一定相似性,從而保證用來(lái)預(yù)測(cè)的鄰居用戶與當(dāng)前用戶在待預(yù)測(cè)項(xiàng)目上具有相似的興趣愛(ài)好。智能重組模塊根據(jù)個(gè)性化信息從商品數(shù)據(jù)庫(kù)中篩選產(chǎn)品,并推薦給用戶。

3 系統(tǒng)實(shí)現(xiàn)

3.1 網(wǎng)站頁(yè)面的設(shè)計(jì)

圖2是網(wǎng)站的主頁(yè)面,上面的功能主要包括:商品的分類查詢、用戶注冊(cè)的最新動(dòng)態(tài)、最活躍的用戶排名和商品的簡(jiǎn)單推薦等。網(wǎng)頁(yè)是用html、css、JavaScript、jQuery,Ajax等語(yǔ)言相結(jié)合進(jìn)行制作的。

3.2 推薦算法的結(jié)果分析

3.2.1 數(shù)據(jù)集

我們采用了系統(tǒng)虛擬數(shù)據(jù)(自己模擬的數(shù)據(jù))對(duì)該算法進(jìn)行測(cè)試,一共提供了232位用戶對(duì)781個(gè)物品的近5000條評(píng)分記錄。把整個(gè)記錄數(shù)據(jù)按照75%和25%的比例劃分為訓(xùn)練集和測(cè)試集。

3.2.2 度量標(biāo)準(zhǔn)

該系統(tǒng)的度量標(biāo)準(zhǔn)采用統(tǒng)計(jì)度量方法中的平均絕對(duì)差MAE(Mean Absolute Error)進(jìn)行度量[9]。MAE通過(guò)計(jì)算預(yù)測(cè)的用戶評(píng)分與實(shí)際的用戶評(píng)分之間的偏差來(lái)度量預(yù)測(cè)的準(zhǔn)確性,MAE越大,推薦質(zhì)量越高。平均絕對(duì)偏差MAE的定義如公式⑷。

3.2.3 實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)中,對(duì)于一個(gè)剛剛注冊(cè)的用戶,系統(tǒng)可以對(duì)該用戶注冊(cè)的信息進(jìn)行分析處理,然后與分類的物品進(jìn)行信息匹配,給該用戶推薦與用戶信息匹配的一類物品的最熱賣(mài)商品,或者在用戶的集合里找到與該用戶A有相同興趣的用戶B,然后推薦B喜愛(ài)的物品。同時(shí),傳統(tǒng)的協(xié)同過(guò)濾算法是從頭計(jì)算到尾,把整個(gè)數(shù)據(jù)矩陣中的數(shù)據(jù)一一地進(jìn)行計(jì)算,最后得出結(jié)果,但是,改進(jìn)的算法會(huì)在中途進(jìn)行判斷,過(guò)濾掉一些數(shù)據(jù)而計(jì)算得出結(jié)果,比如相似度為負(fù)相關(guān)的就不需要求其預(yù)測(cè)評(píng)分了,從而大大的提高算法的效率。在推薦的準(zhǔn)確性方面我們發(fā)現(xiàn),用戶的興趣愛(ài)好是在不斷變化的,如果還使用傳統(tǒng)的協(xié)同過(guò)濾算法去為用戶進(jìn)行推薦,那么推薦的準(zhǔn)確性就很讓人懷疑了。針對(duì)這一問(wèn)題,系統(tǒng)會(huì)根據(jù)數(shù)據(jù)矩陣的數(shù)據(jù)量進(jìn)行數(shù)據(jù)篩選。比如,數(shù)據(jù)矩陣的數(shù)據(jù)量過(guò)大,系統(tǒng)就會(huì)自動(dòng)通過(guò)時(shí)間來(lái)篩選出用戶近期留下的數(shù)據(jù)來(lái)進(jìn)行計(jì)算,時(shí)間比較久遠(yuǎn)的數(shù)據(jù)就會(huì)被篩選掉,從而符合了用戶近期的興趣愛(ài)好,使推薦的結(jié)果更加準(zhǔn)確。

通過(guò)協(xié)同過(guò)濾算法的改進(jìn)和以上實(shí)驗(yàn)的設(shè)計(jì),得到最終的實(shí)驗(yàn)結(jié)果如圖3所示。

實(shí)驗(yàn)中,我們?cè)O(shè)計(jì)了不同的用戶近鄰個(gè)數(shù),得到了不同的MAE值,在不同的近鄰數(shù)下,改進(jìn)之后協(xié)同過(guò)濾推薦算法都得到了更高的MAE值,可見(jiàn)改進(jìn)之后的協(xié)同過(guò)濾推薦算法,其推薦結(jié)果的準(zhǔn)確性得到了很大的提高。同時(shí)當(dāng)近鄰數(shù)逐步增加后,MAE值逐步下降,可見(jiàn)近鄰數(shù)增加會(huì)增大噪聲,對(duì)推薦結(jié)果起到了反作用,而且近鄰數(shù)少會(huì)提高系統(tǒng)的效率。

4 結(jié)束語(yǔ)

本文實(shí)現(xiàn)了一個(gè)基于智能推薦的電子商城購(gòu)物系統(tǒng),該系統(tǒng)為用戶快速推薦可能感興趣的物品,為用戶大大的節(jié)省了時(shí)間,保證了網(wǎng)絡(luò)數(shù)據(jù)的有序性、安全性和完整性。系統(tǒng)實(shí)現(xiàn)了基于Web數(shù)據(jù)挖掘的推薦系統(tǒng),根據(jù)用戶的興趣特點(diǎn)和購(gòu)買(mǎi)行為,計(jì)算用戶最可能喜歡的內(nèi)容或商品,并為不同用戶展示不同內(nèi)容,滿足其內(nèi)容的個(gè)性化需求。未來(lái)在線下推薦和冷啟動(dòng)問(wèn)題處理方面還需要進(jìn)一步研究。

參考文獻(xiàn):

[1] 喬冬春,劉曉燕,付曉東,曹存根.一種基于本體的推薦系統(tǒng)模型[J].計(jì)

算機(jī)工程,2014.40(11):282-287

[2] 王立才,孟祥武,張玉潔.上下文感知推薦系統(tǒng)[J].軟件學(xué)報(bào),2012.23(1):120

[3] 王飛飛,崔洋,賀亞茹.MySQL數(shù)據(jù)庫(kù)應(yīng)用從入門(mén)到精通(第2版)[M].

中國(guó)鐵道出版社,2014.

[4] 李剛.輕量級(jí)Java EE企業(yè)應(yīng)用實(shí)戰(zhàn)[M].電子工業(yè)出版社,2013.

[5] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過(guò)濾推薦算法綜述[J].小型微型計(jì)算機(jī)系

統(tǒng),2009.30(7):1282-1288

[6] 姜書(shū)浩,薛福亮.一種利用協(xié)同過(guò)濾預(yù)測(cè)和模糊相似性改進(jìn)的基于內(nèi)

容的推薦方法[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2014.243(2):41-47

[7] 郭艷紅,鄧貴仕.協(xié)同過(guò)濾系統(tǒng)項(xiàng)目冷啟動(dòng)的混合推薦算法[J].計(jì)算

機(jī)工程,2008.34(23):11-13

[8] 劉鳳霞,孫家蓉.基于商品分類的電子商務(wù)推薦系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)

應(yīng)用與軟件,2014.5:37-41

[9] 劉旭東.B2C網(wǎng)上購(gòu)物推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟

件,2009.26(9):195-197

猜你喜歡
相似度協(xié)同過(guò)濾聚類
基于DBSACN聚類算法的XML文檔聚類
改進(jìn)的協(xié)同過(guò)濾推薦算法
模糊Petri網(wǎng)在油田開(kāi)發(fā)設(shè)計(jì)領(lǐng)域的應(yīng)用研究
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過(guò)濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
基于協(xié)同過(guò)濾算法的個(gè)性化圖書(shū)推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評(píng)述
相似度算法在源程序比較中的應(yīng)用
影響母線負(fù)荷預(yù)測(cè)的因素及改進(jìn)措施
科技視界(2016年10期)2016-04-26 11:40:14
基于改進(jìn)的遺傳算法的模糊聚類算法
东乡族自治县| 福鼎市| 宣武区| 北宁市| 芮城县| 德令哈市| 邵东县| 通化市| 平果县| 唐河县| 香港 | 深泽县| 克拉玛依市| 老河口市| 太谷县| 海安县| 商河县| 织金县| 湟中县| 武山县| SHOW| 阿合奇县| 搜索| 马尔康县| 新化县| 唐河县| 锦州市| 汉中市| 平江县| 尚义县| 永福县| 商都县| 漯河市| 屏东县| 新乡市| 墨玉县| 瑞安市| 义马市| 韶关市| 个旧市| 津南区|