国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦研究現(xiàn)狀探討

2017-08-09 19:16孫夢婷袁小群
出版科學(xué) 2017年4期
關(guān)鍵詞:協(xié)同過濾

孫夢婷+袁小群

[摘 要] 通過分析2003年至2016年中國知網(wǎng)發(fā)表的“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文獻(xiàn),總結(jié)我國學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦的研究現(xiàn)狀。通過對文獻(xiàn)樣本進(jìn)行分類,發(fā)現(xiàn)目前該領(lǐng)域的研究重點(diǎn)主要集中于對學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦的推廣和對推薦算法本身的完善兩個(gè)方面,且后者主要集中于對數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的解決。通過進(jìn)一步分析,發(fā)現(xiàn)國內(nèi)研究人員主要通過結(jié)合基于內(nèi)容的推薦、空值填補(bǔ)和推薦結(jié)果融合三種方法緩解數(shù)據(jù)稀疏性問題;通過聚類的方法緩解可擴(kuò)展性問題。

[關(guān)鍵詞] 學(xué)術(shù)數(shù)據(jù)庫 協(xié)同過濾 資源推薦

[中圖分類號] G230 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1009-5853 (2017) 04-0011-05

The Literature Review of Collaborative Filtering Recommendation in Chinese Academic Databases

Sun Mengting Yuan Xiaoqun

(School of Information Management, Wuhan University, Wuhan, 430072)

[Abstract] By studying 82 papers published in the CNKI from 2003 to 2016 on collaborative filtering of Information and Digital Library, we investigate the hottest topics of current and history on collaborative filtering of Information and Digital Library. By classifying these papers, we discover that domestic researchers are engaged in either propagating the collaborative filtering technique in academic databases or improving the algorithm, in which the main problems are data sparseness and extensibility. By analyzing the papers further, we discover that researchers prefer to combine the content-based recommend technique, custom data or different recommend results to solve the data sparseness problem, and turn to the clustering technique to solve the problem of extensibility.

[Key words] Academic database Collaborative filtering Information recommendation

1 引 言

近年來,學(xué)術(shù)資源數(shù)據(jù)庫出版的信息數(shù)量呈幾何增長,“信息超載”[1]現(xiàn)象越來越嚴(yán)重,“以用戶為中心”的互聯(lián)網(wǎng)理念要求出版商從不同的角度挖掘用戶的顯性及隱性需求,為用戶提供個(gè)性化信息服務(wù),節(jié)約用戶的信息搜索成本。因此,如何利用互聯(lián)網(wǎng)技術(shù)高效精準(zhǔn)地為用戶提供個(gè)性化信息服務(wù),成為目前學(xué)術(shù)出版領(lǐng)域的研究重點(diǎn)之一。其中,協(xié)同過濾推薦技術(shù)就是解決這一問題的有效方法之一。近10年來,研究人員對如何完善協(xié)同過濾推薦技術(shù)以及如何將其應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫展開了大量工作,但相應(yīng)的文獻(xiàn)總結(jié)較少。因此,本文通過分析2003年至2016中國知網(wǎng)發(fā)表的“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文獻(xiàn),對我國學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦研究進(jìn)行詳細(xì)調(diào)研,旨在總結(jié)目前我國學(xué)術(shù)數(shù)據(jù)庫出版協(xié)同過濾資源推薦的研究情況和研究重點(diǎn),厘清學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾的研究脈絡(luò),為后續(xù)研究提供參考,以促進(jìn)我國學(xué)術(shù)數(shù)據(jù)庫個(gè)性化信息服務(wù)的可持續(xù)發(fā)展。

2 協(xié)同過濾推薦

2.1 協(xié)同過濾概念

協(xié)同過濾推薦是目前最常見的推薦技術(shù)之一,廣泛應(yīng)用于電子商務(wù)、電影網(wǎng)站、音樂社區(qū)等領(lǐng)域?!皡f(xié)同過濾”這一概念首先由戈德堡(Goldberg)等人提出[2],它基于如下假設(shè):如果用戶對某些項(xiàng)目的評分相近,那么他們對其他項(xiàng)目的評分也會(huì)相近[3]。傳統(tǒng)的協(xié)同過濾推薦分為3個(gè)步驟:(1)建立用戶-項(xiàng)目評分矩陣;(2)尋找相似鄰;(3)對用戶未訪問的信息項(xiàng)目進(jìn)行評分預(yù)測并產(chǎn)生推薦,預(yù)測和推薦的主要特征是[4]:(1)推薦的內(nèi)容是相似用戶喜歡的項(xiàng)目,而非與用戶歷史偏好相似的項(xiàng)目;(2)計(jì)算的是用戶的相似度,而非推薦內(nèi)容的相似性;(3)一個(gè)純粹的協(xié)同過濾系統(tǒng)并不分析所推薦項(xiàng)目的內(nèi)容本身。顯然,與其他的個(gè)性化推薦技術(shù)相比,協(xié)同過濾通過抓取用戶之間的社會(huì)化聯(lián)系進(jìn)行推薦,不僅適應(yīng)互聯(lián)網(wǎng)時(shí)代人際聯(lián)系日益增強(qiáng)的趨勢,還回避了對領(lǐng)域知識、非結(jié)構(gòu)化推薦項(xiàng)目等復(fù)雜因素的分析。這使得協(xié)同過濾推薦具有如下優(yōu)勢:(1)可以發(fā)掘用戶的潛在需求;(2)適用范圍廣,無需考慮被推薦項(xiàng)目的內(nèi)容;(3)回避了對復(fù)雜因素的分析,易于實(shí)現(xiàn)。

但由于只考慮人與人之間的相互推薦,協(xié)同過濾也存在如下缺陷:(1)數(shù)據(jù)稀疏性:用戶評分的項(xiàng)目數(shù)量過少導(dǎo)致用戶-項(xiàng)目評分矩陣的極度稀疏,對相似度的計(jì)算造成極大干擾;(2)冷啟動(dòng):新用戶進(jìn)入推薦系統(tǒng)后,由于其尚未與系統(tǒng)產(chǎn)生交互,系統(tǒng)無法獲取偏好數(shù)據(jù)而導(dǎo)致推薦功能失效;(3)數(shù)據(jù)空間的可擴(kuò)展性:系統(tǒng)的原始數(shù)據(jù)中除性別、年齡等數(shù)據(jù)的維度較小,其他如瀏覽、收藏、點(diǎn)擊等系統(tǒng)交互行為數(shù)據(jù)的維度都較大,對算法的運(yùn)行效率和存儲(chǔ)空間提出了挑戰(zhàn)。

2.2 協(xié)同過濾對學(xué)術(shù)出版的意義

根據(jù)2015年10月發(fā)布的《2014年度中國出版業(yè)發(fā)展報(bào)告》,2014年我國數(shù)字出版營業(yè)收入為3387.7億元,同比增長33.4%,占全行業(yè)營業(yè)收入的17.0%,總體經(jīng)濟(jì)規(guī)模超過出版物發(fā)行,位居行業(yè)第二。其中,互聯(lián)網(wǎng)期刊和電子書行業(yè)增長18.2%,增長速度遠(yuǎn)高于新聞出版業(yè)的總體水平[5]。數(shù)字出版的蓬勃發(fā)展為學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域的發(fā)展提供有力支持的同時(shí),也對其資源服務(wù)的質(zhì)量和效率提出了更高要求。因此,將協(xié)同過濾推薦技術(shù)應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫,創(chuàng)建智能化推薦系統(tǒng),對促進(jìn)學(xué)術(shù)數(shù)據(jù)庫個(gè)性化信息服務(wù)有著重要意義。

(1) 挖掘用戶潛在需求。相比于其他的出版類型,學(xué)術(shù)出版領(lǐng)域中用戶群體特征和規(guī)模相對穩(wěn)定的特點(diǎn),有助于提高協(xié)同過濾推薦的性能。協(xié)同過濾推薦通過挖掘用戶的顯性信息(如注冊信息、評分信息等)和隱性信息(如點(diǎn)擊、收藏、頁面停留時(shí)間等系統(tǒng)交互行為信息),刻畫用戶的需求偏好,根據(jù)相似用戶的信息行為挖掘和引導(dǎo)目標(biāo)用戶的信息需求,以此發(fā)掘并適應(yīng)用戶的潛在需求,提高學(xué)術(shù)數(shù)據(jù)庫的信息服務(wù)質(zhì)量。

(2)提高學(xué)術(shù)資源利用率。隨著細(xì)分學(xué)科和跨專業(yè)學(xué)科的增加,學(xué)術(shù)數(shù)據(jù)庫信息資源呈幾何式海量增長,這導(dǎo)致用戶受到過多不相關(guān)信息的干擾,難以抓取真正有用的信息。協(xié)同過濾推薦充分利用用戶-項(xiàng)目的協(xié)同驅(qū)動(dòng),通過相似性分析將用戶與待推薦項(xiàng)目相匹配,高效精準(zhǔn)地進(jìn)行個(gè)性化信息服務(wù),以此提高學(xué)術(shù)數(shù)據(jù)庫信息資源利用效率。

(3)擴(kuò)展學(xué)術(shù)數(shù)據(jù)庫的知識服務(wù)功能。協(xié)同過濾推薦不僅可以為用戶提供需要的信息,推薦其需要但還未獲取的有用資源;還可以通過構(gòu)建用戶偏好模型,結(jié)合相似用戶信息行為的協(xié)同驅(qū)動(dòng),挖掘用戶的潛在需求,擴(kuò)展用戶獲取信息的范圍,使信息服務(wù)功能更加主動(dòng)化和自動(dòng)化,實(shí)現(xiàn)學(xué)術(shù)數(shù)據(jù)庫信息服務(wù)向知識服務(wù)的轉(zhuǎn)變。

2.3 協(xié)同過濾研究現(xiàn)狀

自1992年第一個(gè)推薦系統(tǒng) Tapestry [6]提出以來,協(xié)同過濾推薦技術(shù)受到業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。至今,該技術(shù)已經(jīng)從最初的郵件過濾[7],推廣到新聞、電影[8]、電子商務(wù)、電子政務(wù)等社會(huì)各行各業(yè)。同時(shí),學(xué)界的研究也從最初對協(xié)同過濾算法本身的完善,發(fā)展到當(dāng)前結(jié)合多領(lǐng)域知識解決數(shù)據(jù)稀疏性等問題的研究[9-14]。

近年來,隨著機(jī)器學(xué)習(xí)、大數(shù)據(jù)和社會(huì)網(wǎng)絡(luò)的快速發(fā)展,學(xué)者們還通過結(jié)合機(jī)器學(xué)習(xí)技術(shù)等建立更精準(zhǔn)的用戶偏好模型、協(xié)同過濾系統(tǒng)的性能評價(jià)指標(biāo)研究、推薦結(jié)果解釋性研究等角度對協(xié)同過濾展開研究[15-16]。

3 我國學(xué)術(shù)出版領(lǐng)域協(xié)同過濾研究現(xiàn)狀

雖然目前協(xié)同過濾推薦技術(shù)已經(jīng)較成熟,但在我國學(xué)術(shù)出版領(lǐng)域的運(yùn)用尚處于實(shí)踐探索階段,缺乏系統(tǒng)研究。鑒于此,本文以中國最大的學(xué)術(shù)數(shù)據(jù)庫“中國知網(wǎng)”為對象,收集其中發(fā)表的2003年至2016年“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文章,并以這82篇文章為樣本,詳細(xì)調(diào)研我國學(xué)術(shù)出版關(guān)于協(xié)同過濾資源推薦的研究情況。結(jié)果表明,我國在該領(lǐng)域的研究仍比較薄弱。

3.1 協(xié)同過濾研究重點(diǎn)

在調(diào)研過程中,本文根據(jù)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦領(lǐng)域不同的研究重點(diǎn),將82篇文獻(xiàn)分為以下幾類,如圖1所示:(1)推廣:介紹學(xué)術(shù)數(shù)據(jù)庫(學(xué)術(shù)出版)中協(xié)同過濾技術(shù)類文獻(xiàn)。(2)系統(tǒng)架構(gòu)研究:構(gòu)建以協(xié)同過濾推薦技術(shù)為核心的學(xué)術(shù)數(shù)據(jù)庫推薦系統(tǒng)。這類文獻(xiàn)主要是從系統(tǒng)架構(gòu)角度研究如何將協(xié)同過濾技術(shù)應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫,往往不涉及具體的算法細(xì)節(jié)。(3)數(shù)據(jù)稀疏性問題研究:解決協(xié)同過濾推薦算法中存在的數(shù)據(jù)稀疏性問題。(4)可擴(kuò)展性問題研究:解決協(xié)同過濾推薦算法中存在的可擴(kuò)展性問題。(5)因子研究:為更精準(zhǔn)地描述學(xué)術(shù)出版領(lǐng)域的用戶偏好,對用戶偏好影響因子進(jìn)行研究。(6)其他:包括針對不同類型的協(xié)同過濾推薦技術(shù)進(jìn)行性能比較,協(xié)同過濾推薦方法性能評價(jià)指標(biāo)研究等。

由圖1可知,2003年至2016年協(xié)同過濾推薦在學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域的研究不斷增加,尤其是在2007年至2016年10年間,研究成果增加明顯。由圖1可以看出,除2004年,每年均有推廣性的研究成果,且呈上升趨勢,說明將協(xié)同過濾推薦推廣至學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域是一個(gè)研究熱點(diǎn)。但以推薦系統(tǒng)架構(gòu)為主題的文獻(xiàn)數(shù)目較少且分布稀疏,也表明協(xié)同過濾推薦在學(xué)術(shù)數(shù)據(jù)庫中的實(shí)際應(yīng)用還比較薄弱,推廣工作尚待加強(qiáng)。此外,圖1還表明另一個(gè)研究重點(diǎn)是對協(xié)同過濾推薦算法本身的完善,具體表現(xiàn)在近10年關(guān)于數(shù)據(jù)稀疏性問題、可擴(kuò)展性問題和因子選擇問題的研究有所增加,其中對數(shù)據(jù)稀疏性問題的研究占了較大比重。

總體而言,目前學(xué)界在加強(qiáng)推廣學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦技術(shù)的同時(shí),重點(diǎn)研究算法的完善,且主要集中于數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的研究。因此,下文將對這兩個(gè)研究重點(diǎn)分別進(jìn)行論述。

3.2 數(shù)據(jù)稀疏性問題

數(shù)據(jù)稀疏性問題是指協(xié)同過濾推薦算法中,用戶評分的項(xiàng)目數(shù)量過少造成用戶-項(xiàng)目評分矩陣的極度稀疏,導(dǎo)致相似度計(jì)算不準(zhǔn)確的問題。事實(shí)上,網(wǎng)站運(yùn)行過程中項(xiàng)目數(shù)量龐大且不斷增加,而用戶通常只對少量項(xiàng)目進(jìn)行評分,這導(dǎo)致用戶評分?jǐn)?shù)據(jù)稀疏,進(jìn)而影響協(xié)同過濾的推薦質(zhì)量。

如圖2所示,本文將樣本文獻(xiàn)中解決數(shù)據(jù)稀疏性問題的方法總結(jié)為以下三種:(1)結(jié)合基于內(nèi)容的推薦,占總樣本的67.5%;(2)空值填補(bǔ),占總樣本的15.0%;(3)推薦結(jié)果融合,占總樣本的12.5%。

3.2.1 結(jié)合基于內(nèi)容的推薦

結(jié)合基于內(nèi)容的推薦方法[17]通過結(jié)合基于內(nèi)容的推薦來豐富用戶的偏好信息,在改善協(xié)同過濾推薦對用戶評分信息過度依賴問題的同時(shí),通過結(jié)合基于內(nèi)容的推薦對用戶偏好進(jìn)行更精準(zhǔn)的描述,以此緩解數(shù)據(jù)稀疏性問題。

孔繁超[18]考慮用戶偏好隨時(shí)間變化的特性,在用戶-項(xiàng)目評分矩陣中引入時(shí)間維,并使用自組織映射技術(shù)對用戶信息進(jìn)行聚類處理,根據(jù)用戶的需求行為將其劃分為不同的簇,降低數(shù)據(jù)稀疏性對信息推薦造成的影響。邱均平、張聰[19]同樣考慮時(shí)間因素,使用借閱時(shí)間計(jì)算用戶的偏好值,并輔助使用用戶評分對該值進(jìn)行調(diào)整。周之誠[20]通過運(yùn)用K-means算法,對資源類別意圖特征值相似的用戶進(jìn)行聚類,以此提高推薦的實(shí)時(shí)性,緩解數(shù)據(jù)稀疏性問題。徐偉芬[21]依據(jù)中圖法對用戶興趣進(jìn)行建模,并通過關(guān)聯(lián)規(guī)則算法挖掘信息資源各類別間的關(guān)聯(lián),然后通過基于模糊C均值的聚類算法對用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度后計(jì)算用戶之間的相似度,從而得到目標(biāo)用戶的最近鄰居集。畢強(qiáng)、劉健[22]以關(guān)聯(lián)語義鏈為基礎(chǔ)建立數(shù)字文獻(xiàn)資源的關(guān)聯(lián)語義鏈網(wǎng)絡(luò), 計(jì)算數(shù)字文獻(xiàn)資源之間關(guān)聯(lián)的權(quán)重,然后將其引入皮爾森(Pearson)相關(guān)性公式中計(jì)算用戶相似度,以此預(yù)測評分并進(jìn)行推薦。馬麗等人[23]為了體現(xiàn)用戶的多興趣特點(diǎn),利用模糊聚類技術(shù)對用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度和各聚類的聚類中心后,為目標(biāo)用戶尋找最近鄰居集。張付志等人[24]引入文本聚類技術(shù),結(jié)合圖書資源的特征對同類資源進(jìn)行聚類,使讀者評價(jià)過的資源集中到聚類生成的某一個(gè)或多個(gè)簇類文檔中,并在其中進(jìn)行相似度計(jì)算。

3.2.2 空值填補(bǔ)

空值填補(bǔ)方法利用預(yù)測方法來填補(bǔ)用戶-項(xiàng)目評分矩陣中的缺失項(xiàng),從而提高評分矩陣中的數(shù)據(jù)密度,緩解數(shù)據(jù)稀疏性問題。

李衛(wèi)華等人[25]提出一種計(jì)算群體興趣偏向度的方法來預(yù)測用戶-項(xiàng)目評分矩陣中的空缺值。王代琳等人[26]通過計(jì)算用戶對項(xiàng)目評分之間的平均差異度來預(yù)測用戶對未評分項(xiàng)目的評分:通過計(jì)算兩個(gè)項(xiàng)目評分的平均比值得到兩個(gè)項(xiàng)目之間的平均差異度,并根據(jù)平均差異度來預(yù)測目標(biāo)用戶對目標(biāo)項(xiàng)目的評分。張閃閃等人[27]通過建立自動(dòng)化評分規(guī)則來計(jì)算并填補(bǔ)評分矩陣中的缺失項(xiàng)。

3.2.3 推薦結(jié)果融合

推薦結(jié)果融合方法通過不同的方法計(jì)算用戶對項(xiàng)目的偏好,并將各計(jì)算結(jié)果融合以改善數(shù)據(jù)稀疏性問題。在本文的樣本集中,最常使用的推薦結(jié)果融合方法是將聚類算法和協(xié)同過濾算法相結(jié)合。

劉飛飛[28]提出一種能夠同時(shí)考慮用戶和項(xiàng)目之間相似性的協(xié)同過濾方法,即利用雙聚類技術(shù)對行和列同時(shí)進(jìn)行聚類,同時(shí)完成用戶和項(xiàng)目的相似性分組。劉劍濤[29]通過計(jì)算相對點(diǎn)擊和評分差的海明距離得到每個(gè)用戶的候選鄰居集,結(jié)合多態(tài)相似度對鄰居集二次聚類,由最鄰近用戶預(yù)測當(dāng)前用戶的需求度,選擇前N條生成推薦列表。劉如娟[30]通過統(tǒng)計(jì)每個(gè)用戶最常用的標(biāo)簽,計(jì)算選中的標(biāo)簽與全部資源的相似性,然后以標(biāo)簽聚類作為橋梁,計(jì)算資源和用戶之間的相關(guān)度,并對結(jié)果進(jìn)行線形加權(quán),計(jì)算用戶對資源的興趣值,生成推薦列表。

對比以上三種方法,首先,結(jié)合基于內(nèi)容的推薦方法通過引入內(nèi)容描述信息刻畫用戶偏好,緩解了數(shù)據(jù)稀疏性問題,但由于引入基于內(nèi)容的推薦方法,也存在受領(lǐng)域知識及非結(jié)構(gòu)化的內(nèi)容限制等缺陷。其次,空值填補(bǔ)方法利用用戶已有評分?jǐn)?shù)據(jù)填充評分缺失值,具有直觀、操作簡單等優(yōu)點(diǎn),但空值填補(bǔ)本身是對評分缺失值的一種預(yù)測,預(yù)測偏差會(huì)對最后的推薦精度產(chǎn)生影響。最后,推薦結(jié)果融合方法將不同方法計(jì)算出的用戶偏好進(jìn)行綜合,可以對高維稀疏的數(shù)據(jù)進(jìn)行更加充分的挖掘,產(chǎn)生更高的推薦精度。同時(shí),聚類、神經(jīng)網(wǎng)絡(luò)等離線機(jī)器學(xué)習(xí)方法的引入還能夠改善推薦的運(yùn)行效率和對海量數(shù)據(jù)的處理能力。但該方法也存在操作復(fù)雜、結(jié)果的可解釋性差以及需要考量不同技術(shù)間的融合機(jī)制等缺陷。

3.3 可擴(kuò)展性問題

為了更精準(zhǔn)地描述用戶偏好以提高推薦精度,協(xié)同過濾推薦中往往引入除評分以外的其他因子,加之實(shí)際運(yùn)用過程中用戶和項(xiàng)目的信息數(shù)量通??蛇_(dá)到上百萬,協(xié)同過濾算法的可擴(kuò)展性受到嚴(yán)峻挑戰(zhàn),這也是目前學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦領(lǐng)域的一個(gè)研究重點(diǎn)。在如何解決可擴(kuò)展性這一問題方面,本文分析的82篇文獻(xiàn)樣本中多采用聚類的方法,如圖3所示,聚類方法占總樣本的69.2%。

張付志等人[31]將K-means技術(shù)和分層技術(shù)相結(jié)合對圖書資源進(jìn)行聚類,縮小了近鄰搜索的范圍和需要預(yù)測的圖書資源數(shù)目。周之誠[32]同樣通過運(yùn)用K-means算法對資源類別的意圖特征值相似用戶進(jìn)行聚類,提高推薦的實(shí)時(shí)性。張玉霞[33]利用改進(jìn)的粒子群優(yōu)化算法對文獻(xiàn)進(jìn)行聚類,使目標(biāo)文獻(xiàn)的大部分鄰居實(shí)際上可以在目標(biāo)文獻(xiàn)相似度最高的幾個(gè)聚類中找到。鄭麗姣[34]在進(jìn)行協(xié)同過濾推薦之前,首先使用聚類對數(shù)據(jù)集進(jìn)行降維處理。孫守義等人[35]利用模糊聚類技術(shù)對用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度和各聚類的聚類中心后,為目標(biāo)用戶尋找最近鄰居集進(jìn)行推薦。

除此以外,研究人員用于解決可擴(kuò)展性問題的方法還包括引入神經(jīng)網(wǎng)絡(luò)、矩陣壓縮、分類等。如周樸雄等人[36]采用反向傳播神經(jīng)網(wǎng)絡(luò)對情境屬性向量進(jìn)行處理,生成用戶在該情境下對閱讀項(xiàng)目的偏好程度。劉海鷗[37]使用MapReduce化的蟻群神經(jīng)網(wǎng)絡(luò)權(quán)值訓(xùn)練方法來訓(xùn)練數(shù)據(jù)集。羅琳等人[38]利用稀疏向量的表示方法來表示輸入矩陣中的每個(gè)資源,以壓縮稀疏矩陣存儲(chǔ)。

4 總 結(jié)

作為個(gè)性化服務(wù)的重要手段,協(xié)同過濾推薦技術(shù)在為用戶提供有效信息、節(jié)約搜索成本等方面發(fā)揮著重要作用。本文通過文獻(xiàn)樣本分類,發(fā)現(xiàn)目前該領(lǐng)域的研究重點(diǎn)集中于學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦的推廣和對推薦算法本身的完善上,且后者主要針對數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的研究。通過研究趨勢分析和詳細(xì)論述,本文總結(jié)目前我國學(xué)術(shù)數(shù)據(jù)庫出版協(xié)同過濾資源推薦的研究情況和研究重點(diǎn),旨在厘清該領(lǐng)域的研究脈絡(luò),為后續(xù)研究提供參考。

注 釋

[1]Borchers A,Herlocker J,Konstan J,et al.Ganging up on Information Overload[J]. Computer,1998,31(4):

106-108

[2][6][7]Goldberg D,Nichols D,Oki B M,et al. Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70

[3][9]Breese J, Hecherman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering[C]. In: Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence (UAI98),1998,43-52

[4]毛穎,周源遠(yuǎn),王繼成,等.信息過濾技術(shù)研究[J].計(jì)算機(jī)科學(xué),2003(8):10-12

[5]《中國出版年鑒》雜志社有限公司.中國出版年鑒[M].北京:《中國出版年鑒》雜志社有限公司,2015:449-452

[8]Resnick P, Iacovou N, Suchak M, Bergstrom P, Riedl J.GroupLens: An open architecture for collaborative filtering of netnews [C]. In: Proceedings of the ACM Conference on Computer Supported Cooperative Work.1994:175-186

[10]鄧愛林,朱楊勇,施伯樂.基于項(xiàng)目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003(9):1621-1628

[11]張鋒,常會(huì)友.使用BP神經(jīng)網(wǎng)絡(luò)緩解協(xié)同過濾推薦算法的稀疏性問題[J].計(jì)算機(jī)研究與發(fā)展,2006(4):667-672

[12]吳湖,王永吉,王哲,等.兩階段聯(lián)合聚類協(xié)同過濾算法[J].軟件學(xué)報(bào),2010(5):1042-1054

[13]吳顏,沈潔,顧天竺,等.協(xié)同過濾推薦系統(tǒng)中數(shù)據(jù)稀疏問題的解決[J].計(jì)算機(jī)應(yīng)用研究,2007(6):94-97

[14][15][17]冷亞軍,陸青,梁昌勇.協(xié)同過濾推薦技術(shù)綜述[J].模式識別與人工智能,2014,27(8):720-734

[16]馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2009(7):1282-1288

[18]孔繁超.個(gè)性化信息服務(wù)中用戶偏好的動(dòng)態(tài)挖掘[J].情報(bào)理論與實(shí)踐,2009(6):111-113

[19]邱均平,張聰.高校圖書館館藏資源協(xié)同推薦系統(tǒng)研究[J].圖書情報(bào)工作,2013(22):132-137

[20][32]周之誠.用戶意圖聚類的數(shù)字資源推薦方法[J].情報(bào)理論與實(shí)踐,2011(6):116-119

[21]徐偉芬.基于模糊聚類的數(shù)字圖書館個(gè)性化推薦系統(tǒng)方案設(shè)計(jì)[J].價(jià)值工程,2013(6):174-176

[22]畢強(qiáng),劉健.數(shù)字文獻(xiàn)資源內(nèi)容服務(wù)推薦方法研究[J].現(xiàn)代圖書情報(bào)技術(shù),2015(12):21-27,105

[23]馬麗.基于群體興趣偏向度的數(shù)字圖書館協(xié)同過濾技術(shù)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2007(10):19-22

[24][31]張付志,姜志英.一種基于聚類技術(shù)的數(shù)字圖書館個(gè)性化推薦算法[J].計(jì)算機(jī)應(yīng)用與軟件,2008(7):84-85

[25]李衛(wèi)華,盧雨民,梅紅.淺談數(shù)字圖書館個(gè)性化信息推薦系統(tǒng)[J].科技廣場,2007(9):109-110

[26]王代琳,劉亞秋,王真諦.基于平均差異度的數(shù)字圖書館個(gè)性化推薦算法研究[J].圖書情報(bào)工作,2009(11):119-122

[27]張閃閃,黃鵬.高校圖書館圖書推薦系統(tǒng)中的稀疏性問題實(shí)證探析[J].大學(xué)圖書館學(xué)報(bào),2014(6):47-53

[28]劉飛飛.基于多目標(biāo)優(yōu)化雙聚類的數(shù)字圖書館協(xié)同過濾推薦系統(tǒng)[J].圖書情報(bào)工作,2011(7):111-113

[29]劉劍濤.個(gè)性化推薦系統(tǒng)中用戶多態(tài)聚類研究[J].現(xiàn)代圖書情報(bào)技術(shù),2012(2):18-22

[30]劉如娟.基于標(biāo)簽聚類與用戶模型的個(gè)性化推薦方法研究[J].現(xiàn)代情報(bào),2016(6):74-78

[33]張玉霞.改進(jìn)的個(gè)性化智能文獻(xiàn)推送方法在數(shù)字圖書館中的應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2012(7):92-95

[34]鄭麗姣.基于聚類的個(gè)性化圖書推薦技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2015(4):100-100

[35]孫守義,王蔚.一種基于用戶聚類的協(xié)同過濾個(gè)性化圖書推薦系統(tǒng)[J].現(xiàn)代情報(bào),2007(11):139-142

[36]周樸雄,張兵榮,趙龍文.基于BP神經(jīng)網(wǎng)絡(luò)的情境化信息推薦服務(wù)研究[J].情報(bào)科學(xué),2016(3):71-75

[37]劉海鷗.云環(huán)境用戶情境感知的移動(dòng)服務(wù)QoS混合推薦[J].情報(bào)雜志,2016(4):183-189

[38]羅琳,梁桂生,蔡軍.基于分眾分類法的圖書館書目推薦系統(tǒng)[J].現(xiàn)代圖書情報(bào)技術(shù),2014(4):14-19

(收稿日期:2016-10-23)

猜你喜歡
協(xié)同過濾
基于用戶評分和項(xiàng)目類偏好的協(xié)同過濾推薦算法
基于用戶相似度加權(quán)的Slope One算法
改進(jìn)的協(xié)同過濾推薦算法
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
基于混合信任模型的協(xié)同過濾推薦算法
一種基于協(xié)同過濾技術(shù)的個(gè)性化移動(dòng)學(xué)習(xí)資源推薦策略