国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的電影智能推薦研究

2019-07-08 03:44:41李偉孫新杰劉志芳
計算機時代 2019年5期
關鍵詞:協(xié)同過濾數(shù)據(jù)挖掘

李偉 孫新杰 劉志芳

摘? 要: 網(wǎng)絡視頻數(shù)據(jù)的快速增多,使得個性化智能推薦變得十分必要。為了便于用戶在視頻網(wǎng)站上發(fā)現(xiàn)自己喜歡的內(nèi)容,提出通過數(shù)據(jù)挖掘來分析用戶對電影的評分行為,采用基于項目的協(xié)同過濾算法,利用評分數(shù)據(jù)構(gòu)造用戶項目評分矩陣,計算電影項目之間的相似度,來預測用戶對電影的評分并且給出結(jié)果推薦。實驗運行結(jié)果表明,該方法對電影的推薦效果較好。該研究構(gòu)建的基于數(shù)據(jù)挖掘的電影智能推薦系統(tǒng)能夠幫助用戶快速發(fā)現(xiàn)所喜歡的電影。

關鍵詞: 數(shù)據(jù)挖掘; 智能推薦; 協(xié)同過濾; 評分矩陣

中圖分類號:TP391.3? ? ? ? ? 文獻標志碼:A 文章編號:1006-8228(2019)05-61-02

Abstract: With the rapid increase of network video data, personalized intelligent recommendation becomes very necessary. To help users find their favorite content on video websites, this paper proposes to analyze users' rating behavior on movies by data mining, using project-based collaborative filtering algorithm, constructs the user item rating matrix by using the rating data, and calculates similarity between movie items to predict users' rating on movies and give the result to recommend. The experimental results show that the method has a good effect on the recommendation of movies. The intelligent film recommendation system with data mining can help users quickly find their favorite movies.

Key words: data mining; intelligent recommendation; collaborative filtering; rating matrix

0 引言

隨著大數(shù)據(jù)時代的到來,網(wǎng)絡上的數(shù)據(jù)量呈爆炸式增長,用戶很難找到自己想看的電影[1]。雖然很多視頻網(wǎng)站提供搜索引擎來讓有明確目標的用戶直接搜索電影,但是對于無明確目標的用戶而言,則需要一種幫助,能讓他們?nèi)グl(fā)現(xiàn)可能喜歡的電影,因而誕生了智能推薦系統(tǒng)。鄭誠等[2]提出基于互信息的推薦研究方法,陳平華等[3]研究融合知識圖譜表示學習進行推薦,但是這些都還存在實踐應用的問題。

本文提出構(gòu)建電影智能推薦系統(tǒng),通過數(shù)據(jù)挖掘的方法來分析用戶的行為,推薦給用戶適合的電影內(nèi)容。

1 關鍵技術(shù)

電影智能推薦的關鍵技術(shù)是推薦算法,目前,推薦算法主要有基于內(nèi)容的推薦、協(xié)同過濾推薦和基于網(wǎng)絡結(jié)構(gòu)推薦等算法,而協(xié)同過濾算法是當前研究最多的推薦算法。協(xié)同過濾推薦分為基于用戶和基于項目[4],由于當采用基于用戶的協(xié)同過濾時,計算復雜度會隨著用戶數(shù)目的增加變得越來越大,因此需要研究采用基于項目的協(xié)同過濾來構(gòu)建電影智能推薦系統(tǒng)。

基于項目的協(xié)同過濾算法的核心思想是利用與項目相似度最高的k個鄰居項目的評分加權(quán)平均計算得到用戶對該項目的預測評分。其原理如圖1所示,喜歡項目1的用戶i還喜歡項目2、項目3、…、項目n,因此項目1到項目n的相似度較高,它們?yōu)橄嗨祈椖浚脩鬸也喜歡項目2到項目n,因此可以將用戶j還沒有發(fā)現(xiàn)的項目1推薦給該用戶。

2 系統(tǒng)架構(gòu)

基于數(shù)據(jù)挖掘的電影智能推薦系統(tǒng)架構(gòu)如圖2所示,主要分為三個模塊。第一個模塊是數(shù)據(jù)抽取,從視頻網(wǎng)站選擇性抽取電影屬性數(shù)據(jù)和用戶對電影評分數(shù)據(jù),其中電影屬性數(shù)據(jù)包括電影ID、電影名稱和類型等信息;第二個模塊是挖掘建模,利用評分數(shù)據(jù)構(gòu)造用戶項目評分矩陣,然后計算電影項目之間的相似度,最后再以用戶項目矩陣和電影項目相似度為基礎來計算用戶對電影項目的預測評分;第三個模塊為電影推薦,把預測評分高的電影項目推薦給用戶。

3 挖掘建模

由電影評分數(shù)據(jù)得到一個N×M的用戶項目評分矩陣R,其公式為:

式中,N為用戶數(shù)目,M為電影數(shù)目,行向量表示一個用戶對電影項目的評分,列向量表示一個電影項目得到用戶的評分,是用戶ui對電影vj的評分。項目相似度計算是智能推薦的核心步驟[5],利用所有用戶對兩個電影項目的評分,計算電影項目vs與vt的相似度公式為:

式中,d(vs,vt)為用戶對電影項目vs與vt評分的歐式距離。

計算完電影項目兩兩間的相似度后,再根據(jù)k近鄰算法,找到與電影項目v相似度最大的k個電影項目作為鄰居,計算得出無明確目標的用戶對于電影項目v的預測評分,最后把電影項目按照預測評分降序排列,選取預測評分最大幾個作為的推薦結(jié)果。

4 實驗分析

實驗抽取的電影評分測試數(shù)據(jù)中,用戶對于電影的評分的取值范圍為1~10分,評分越高說明用戶對電影的評價越好。電影智能推薦結(jié)果輸出如表1所示,表1列出了為用戶推薦的電影和預測評分。

推薦結(jié)果第一個記錄說明給用戶1推薦電影115和203,電影的預測評分分別為8.557和8.561;推薦結(jié)果第二個記錄說明給用戶3推薦電影337,電影預測評分為9.990。

5 結(jié)束語

本文基于數(shù)據(jù)挖掘的思想,采用協(xié)同過濾算法構(gòu)建電影智能推薦系統(tǒng),把預測評分降序排列靠前的電影項目推薦給無明確目標的用戶,方便他們發(fā)現(xiàn)自己感興趣的電影。下一步研究重點是將處理過程并行化,從而加快電影智能推薦系統(tǒng)的處理速度,來應對大數(shù)據(jù)的挑戰(zhàn)。

參考文獻(References):

[1] 海闊,海翔宇.電影大數(shù)據(jù)國際文獻綜述[J].新聞愛好者,2018.5:92-96

[2] 鄭誠,徐啟南,章金平.基于互信息的推薦系統(tǒng)方法研究[J].微電子學與計算機,2018.35(12):76-79

[3] 陳平華,朱禹.融合知識圖譜表示學習和矩陣分解的推薦算法[J].計算機工程與設計,2018.39(10):3137-3142

[4] 李偉,石云,孫新杰.基于Hadoop的協(xié)同過濾算法的并行化研究[J].六盤水師范學院學報,2017.29(3):46-49

[5] Jiawei Han, MIcheline Kamber, Jian Pei.數(shù)據(jù)挖掘:概念與技術(shù)[M].機械工業(yè)出版社,2012.

猜你喜歡
協(xié)同過濾數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
圖書推薦算法綜述
改進的協(xié)同過濾推薦算法
基于鏈式存儲結(jié)構(gòu)的協(xié)同過濾推薦算法設計與實現(xiàn)
軟件導刊(2016年11期)2016-12-22 21:40:40
基于相似傳播和情景聚類的網(wǎng)絡協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應用
混合推薦算法在電影推薦中的研究與評述
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
新竹市| 图们市| 宿州市| 岳池县| 镶黄旗| 东至县| 乡宁县| 宜城市| 林西县| 西盟| 缙云县| 安龙县| 成安县| 巍山| 顺义区| 新疆| 都兰县| 湖南省| 嵊州市| 夏津县| 襄城县| 长岛县| 孝义市| 江达县| 江西省| 察哈| 应城市| 台北县| 枣庄市| 方正县| 高要市| 拜泉县| 弥渡县| 邯郸县| 广昌县| 长寿区| 白水县| 阿瓦提县| 上杭县| 林西县| 阿拉尔市|