国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于個(gè)性化的協(xié)同過(guò)濾圖書推薦算法研究

2016-12-21 11:09:59黃瑛楊維偉
電腦知識(shí)與技術(shù) 2016年28期
關(guān)鍵詞:推薦系統(tǒng)影響因子

黃瑛+楊維偉

摘要:近年來(lái),隨著國(guó)家對(duì)教育的重視,圖書館圖書呈線性增長(zhǎng),借閱者很難從海量的圖書資源中選取有用的信息?;趥€(gè)性化的協(xié)同過(guò)濾推薦算法有效地解決了這個(gè)問(wèn)題,為了提高推薦的準(zhǔn)確度,引入相似度影響因子,充分考慮不同因素對(duì)推薦結(jié)果影響力的大小。

關(guān)鍵詞:推薦系統(tǒng);系統(tǒng)過(guò)濾;用戶相似性;影響因子

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)28-0088-02

1 背景

協(xié)同過(guò)濾算法給我們的生活帶來(lái)了極大的便利,特別是當(dāng)我們?cè)诰W(wǎng)上購(gòu)物時(shí),網(wǎng)站總是能推送我們需要的商品,簡(jiǎn)化了購(gòu)物過(guò)程,方便了我們的生活。協(xié)同過(guò)濾算法可以根據(jù)用戶偏好和其他特征為用戶推薦相似物品,面對(duì)海量的圖書館圖書資源,如果可以將協(xié)同推薦算法用于圖書館圖書推薦,將能極大地方便學(xué)生的學(xué)習(xí)生活。

2 相關(guān)工作

以前圖書館推薦算法直接依據(jù)圖書評(píng)分?jǐn)?shù)據(jù),按評(píng)分高低向用戶進(jìn)行推薦,沒有考慮到用戶的偏好和需求。隨著技術(shù)的發(fā)展,圖書推薦算法也得到了改進(jìn),目前常用的圖書館推薦算法大致分為三種:

1)基于內(nèi)容的推薦算法:該算法的基本思想是根據(jù)用戶的借閱歷史記錄,分析借閱書籍,提取用戶標(biāo)簽數(shù)據(jù),然后將用戶標(biāo)簽和圖書標(biāo)簽進(jìn)行匹配,觀察匹配程度,選取前N本圖書,生成圖書推薦列表。

2)協(xié)同過(guò)濾推薦算法:該算法在基于內(nèi)容的推薦算法上進(jìn)一步改進(jìn),加入相似度概念,考慮有著相似興趣愛好的讀者對(duì)用戶的影響。我們需要計(jì)算用戶相似度,找到與該用戶最相似的top-N用戶,然后分析用戶對(duì)這些相似用戶已借閱讀書的感興趣程度,得到圖書推薦列表。目前有三種常用方法用于計(jì)算用戶之間的關(guān)聯(lián)度。

歐幾里得距離法:將用戶對(duì)讀書的評(píng)分轉(zhuǎn)換成向量的形式,由此我們得到一個(gè)n維的評(píng)分向量,利用歐幾里得公式計(jì)算兩個(gè)向量之間的距離,距離值越小相似度越高,歐氏公式為:

余弦相似性:將用戶評(píng)分看成一個(gè)n維的向量,利用余弦公式計(jì)算兩個(gè)用戶向量夾角余弦值,值越大兩個(gè)用戶就越相似,余弦公式為:

相關(guān)相似性:利用Pearson相關(guān)系數(shù)計(jì)算兩個(gè)讀者之間的相似程度。

3)基于用戶個(gè)性化協(xié)同過(guò)濾推薦算法:根據(jù)高校的實(shí)際情況和需求,應(yīng)運(yùn)而生了一種基于用戶背景的個(gè)性化推薦方法。一般情況下,用戶多會(huì)借閱本專業(yè)的相關(guān)書籍,所以在進(jìn)行推薦的過(guò)程中可以重點(diǎn)考慮相關(guān)專業(yè)同學(xué)的借閱記錄,將他們借閱過(guò)的書籍進(jìn)行重點(diǎn)推薦。

3 基于個(gè)性化的協(xié)同過(guò)濾推薦算法

3.1 圖書初始評(píng)分

每天圖書館會(huì)有大量的新書上線,這些新書由于之前沒有人借閱,需要為這些圖書人為的劃分類別和設(shè)置評(píng)分初值,根據(jù)《中圖法》可以將圖書劃分成不同的22個(gè)大類。

3.2 計(jì)算用戶對(duì)每一類別圖書的偏好

根據(jù)用戶的借閱歷史和歷史評(píng)分,結(jié)合之前的圖書分類數(shù)據(jù),計(jì)算用戶對(duì)一類書籍的總評(píng)分。用戶借閱不同類別書籍的數(shù)量不同,可以反映用戶對(duì)某類書籍的喜愛程度,為此我們?yōu)橛脩粢言u(píng)價(jià)類別賦予不同的權(quán)重值:。為某類別圖書借閱統(tǒng)計(jì)次數(shù),為所有借閱圖書的總次數(shù)。由此我們可以計(jì)算出用戶對(duì)該類圖書的評(píng)分,評(píng)分公式為:

表示讀者a對(duì)類別書籍的評(píng)分,i屬于類別的圖書,是用戶對(duì)類別圖書的總評(píng)分。

3.3 根據(jù)用戶偏好,計(jì)算用戶相似度

上一步我們得到了用戶對(duì)圖書類別的評(píng)分,根據(jù)這個(gè)評(píng)分,使用皮爾遜相關(guān)系數(shù)算法計(jì)算用戶之間的相似度,找出用戶的近鄰集合U。皮爾遜相關(guān)性公式為:

M為用戶a和b的共同評(píng)分項(xiàng),和分別為用戶a和用戶b的平均評(píng)分,利用圖書類別計(jì)算用戶間的相似度可以大大減少計(jì)算量。根據(jù)上式我們得到用戶之間的相似度,依據(jù)相似度大小進(jìn)行排序,選取前N個(gè)用戶作為用戶a的鄰居集合U。

3.4 預(yù)測(cè)用戶對(duì)其他書籍的評(píng)分產(chǎn)生推薦

我們根據(jù)用戶的近鄰集U可以產(chǎn)生圖書推薦列表,為了使推薦列表更準(zhǔn)確,我們引入讀者相似度的影響因子??紤]到實(shí)際情況,影響因子的主要有用戶專業(yè)、職位和以往評(píng)分準(zhǔn)確度這三個(gè)方面。

1)專業(yè):

眾所周知,相同專業(yè)的學(xué)生對(duì)書的需求是相似的,所有相同專業(yè)學(xué)生的借閱書籍對(duì)推薦影響較大(),影響因子表達(dá)式如下:

2)職位

學(xué)校內(nèi)老師、研究生和大學(xué)生是借書的主力軍。不同職位的人對(duì)圖書好壞的判讀力是不同的,因此老師對(duì)圖書推薦的推薦影響力應(yīng)該最大。下表中的,,呈現(xiàn)逐漸遞減關(guān)系:

3)歷史評(píng)分準(zhǔn)確度

不同用戶有不同的評(píng)分習(xí)慣,對(duì)圖書評(píng)分的標(biāo)準(zhǔn)不同,為了確保推薦的準(zhǔn)確度,我們引入第三個(gè)影響因子。如果用戶評(píng)分越接近平均分則用戶評(píng)分越準(zhǔn)確,影響因子也就越大,影響因子計(jì)算公式為:

其中S為用戶評(píng)分圖書集,為用戶對(duì)圖書i的評(píng)分,為圖書的平均評(píng)分,max和min分別為圖書i獲得評(píng)分的最大值和最小值。

綜上所述,用戶的綜合評(píng)分影響因子表達(dá)式為:

用戶對(duì)某本圖書的預(yù)測(cè)評(píng)分公式為:

n為屬于U集合的用戶數(shù)量,和分別為用戶a和用戶b的平均評(píng)分,為用戶b對(duì)j圖書的評(píng)分。

由用戶對(duì)某本圖書的預(yù)測(cè)評(píng)分公式,我們得到用戶對(duì)推薦列表內(nèi)每本圖書的預(yù)測(cè)評(píng)分,根據(jù)實(shí)際情況,我們選擇前N本圖書進(jìn)行推薦。

4 結(jié)束語(yǔ)

隨著科技的發(fā)展,推薦系統(tǒng)在我國(guó)得到廣泛使用,圖書推薦系統(tǒng)也逐漸進(jìn)入學(xué)生的學(xué)習(xí)生活。根據(jù)高校的實(shí)際情況,我們提出了一種改進(jìn)的圖書推薦系統(tǒng),引入影響因子概念,提高推薦準(zhǔn)確度。使學(xué)生在面對(duì)海量的數(shù)據(jù)時(shí)可用更方便地找到符合自己的學(xué)習(xí)資源。

參考文獻(xiàn):

[1] 劉建國(guó), 周濤, 汪秉宏. 個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J]. 自然科學(xué)研究進(jìn)展, 2009, 19(1): 1-15.

[2] 張怡文, 岳麗華, 張義飛. 基于共同用戶和相似標(biāo)簽的好友推薦方法[J]. 計(jì)算機(jī)應(yīng)用, 2013, 33(8); 2273-2275.

[3] 呂果, 李法運(yùn). 基于改進(jìn)協(xié)同過(guò)濾的移動(dòng)個(gè)性化推薦服務(wù)研究[J]. 情報(bào)探索, 2014(20): 101-105.

[4] 楊濤, 曹樹金. 圖書館用戶的個(gè)性化服務(wù)需求實(shí)證研究[J]. 大學(xué)圖書館學(xué)報(bào), 2011(2): 76-85.

[5] 許文青, 林雙平. 融合熱門度因子基于標(biāo)簽的個(gè)性化圖書推薦算法[J]. 圖書情報(bào)研究,2015(3): 82-86.

[6] Koren Y. Factor in the neighbors: scalable and accurate collaborative filtering[J]. ACM Transactions on Knowledge Discovery from Data, 2010, 4(1): 24.

猜你喜歡
推薦系統(tǒng)影響因子
數(shù)據(jù)挖掘在選課推薦中的研究
軟件(2016年4期)2017-01-20 10:09:33
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
農(nóng)作物病蟲害氣象環(huán)境影響因子分析
淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
手機(jī)閱讀平臺(tái)用戶體驗(yàn)影響因子分析
目的論視角下旅游英語(yǔ)的語(yǔ)言特色對(duì)漢譯旅游文本的啟示
科技視界(2016年23期)2016-11-04 13:29:09
關(guān)于協(xié)同過(guò)濾推薦算法的研究文獻(xiàn)綜述
商(2016年29期)2016-10-29 15:22:08
云霧物理生長(zhǎng)過(guò)程及其影響因子的虛擬仿真實(shí)驗(yàn)
考試周刊(2016年50期)2016-07-12 23:09:38
UGC標(biāo)簽推薦系統(tǒng)的一種新的標(biāo)簽清理方法
商(2016年15期)2016-06-17 17:39:50
枣强县| 定日县| 岑巩县| 九寨沟县| 瑞昌市| 花莲市| 泌阳县| 方山县| 崇义县| 昭通市| 镇宁| 枣强县| 集贤县| 都匀市| 辉南县| 穆棱市| 西华县| 江山市| 玉环县| 梅河口市| 油尖旺区| 江北区| 双牌县| 平湖市| 饶阳县| 大关县| 安溪县| 英吉沙县| 德保县| 囊谦县| 上虞市| 福泉市| 河东区| 霞浦县| 安康市| 图木舒克市| 江陵县| 海口市| 崇州市| 滨州市| 博野县|