劉 偉,劉柏嵩,王洋洋
1.寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211
2.寧波大學(xué) 圖書館與信息中心,浙江 寧波 315211
隨著進(jìn)入大數(shù)據(jù)時(shí)代,海量的學(xué)術(shù)資源(論文、圖書、會(huì)議預(yù)告、學(xué)術(shù)新聞、專利和學(xué)術(shù)博客等)出現(xiàn)在互聯(lián)網(wǎng)上,雖然滿足了用戶對(duì)學(xué)術(shù)資源的基本需求,但是也使得用戶需要花費(fèi)大量的時(shí)間來(lái)獲取對(duì)自己真正有用的學(xué)術(shù)資源,這就是所謂的信息超載問(wèn)題。
目前,大多數(shù)用戶是通過(guò)使用關(guān)鍵字搜索來(lái)解決信息超載問(wèn)題,但由于關(guān)鍵字搜索所固有的局限性導(dǎo)致用戶的多元化和個(gè)性化需求難以得到滿足[1]。人們急需尋找一種更高效的解決方法。
學(xué)術(shù)資源個(gè)性化推薦技術(shù)的發(fā)展為這一問(wèn)題的解決帶來(lái)了突破性進(jìn)展。學(xué)術(shù)資源個(gè)性化推薦是根據(jù)用戶信息描述用戶興趣特征建立用戶興趣模型,根據(jù)學(xué)術(shù)資源描述推薦對(duì)象特征建立推薦對(duì)象模型,然后采用相應(yīng)的推薦算法將用戶興趣模型和推薦對(duì)象模型進(jìn)行匹配,為用戶推薦其感興趣的學(xué)術(shù)資源的一項(xiàng)技術(shù)。學(xué)術(shù)資源推薦流程如圖1所示。
早在20世紀(jì)90年代,人們已經(jīng)開始對(duì)學(xué)術(shù)資源推薦進(jìn)行研究。Giles等人1998年推出第一個(gè)論文推薦系統(tǒng)[2]。亞馬遜推薦系統(tǒng)則是最著名的致力于圖書推薦的系統(tǒng)。而對(duì)于會(huì)議預(yù)告、學(xué)術(shù)新聞、專利和學(xué)術(shù)博客等學(xué)術(shù)資源推薦的研究,目前仍處于空白。
本文以論文和圖書兩類學(xué)術(shù)資源的個(gè)性化推薦相關(guān)研究為研究對(duì)象,根據(jù)學(xué)術(shù)資源個(gè)性化推薦的過(guò)程,對(duì)用戶建模、對(duì)象建模和推薦策略等內(nèi)容進(jìn)行逐步分析,最后對(duì)學(xué)術(shù)資源個(gè)性化推薦未來(lái)研究的重點(diǎn)和發(fā)展方向進(jìn)行大膽的預(yù)測(cè)。
為了能夠更準(zhǔn)確地進(jìn)行個(gè)性化推薦,那么在推薦之前,需要準(zhǔn)確地描述用戶的興趣特征,刻畫理想的用戶畫像。用戶模型的好壞對(duì)推薦來(lái)說(shuō)至關(guān)重要。在進(jìn)行學(xué)術(shù)用戶畫像的過(guò)程中,要格外注意下面三個(gè)方面的問(wèn)題。
只有深入了解用戶,才能建立理想的用戶模型。特別地,在學(xué)術(shù)領(lǐng)域更具特殊性。與商業(yè)領(lǐng)域的推薦不同,在學(xué)術(shù)領(lǐng)域進(jìn)行推薦,用戶的身份對(duì)推薦結(jié)果有極其重要的影響。但是大多數(shù)研究都將用戶的身份等同處理了,這也是目前學(xué)術(shù)推薦領(lǐng)域的一個(gè)缺陷。通過(guò)分析,本文將用戶按照在某一領(lǐng)域或某一研究方向發(fā)表論文數(shù)量分為初級(jí)用戶、中級(jí)用戶和高級(jí)用戶三個(gè)不同科研層次的對(duì)象。
初級(jí)用戶,即將要或剛剛涉足于某一領(lǐng)域或某一研究方向的用戶。對(duì)于初級(jí)用戶而言,理解前沿的文章會(huì)很困難。這一領(lǐng)域的“經(jīng)典文獻(xiàn)”對(duì)他們更加重要,而且能夠給予他們的幫助也更大。
中級(jí)用戶,即在某一領(lǐng)域或某一研究方向初步取得了科研成果的用戶。對(duì)于這些人,不需要刻意為他們推薦“經(jīng)典文獻(xiàn)”,而應(yīng)該根據(jù)他們發(fā)表的論文去判斷他們的興趣和研究方向,為其推薦與他們興趣和研究方向類似的高質(zhì)量的論文或前沿進(jìn)展。
高級(jí)用戶,即在某一領(lǐng)域或某一研究方向已經(jīng)取得巨大的研究成果,已經(jīng)可以說(shuō)是這一領(lǐng)域權(quán)威性專家的用戶。對(duì)于高級(jí)用戶,他們喜歡在不同領(lǐng)域的科研成果的碰撞中觸類旁通,得到新的靈感。為他們推薦的學(xué)術(shù)資源需要更注重該領(lǐng)域的前沿進(jìn)展,或者推薦其他相關(guān)領(lǐng)域的高質(zhì)量的科研成果。
對(duì)于中級(jí)用戶和高級(jí)用戶,還存在一種特殊情況。他們關(guān)注某一感興趣的科研人員,對(duì)這一科研人員發(fā)布的任何信息,他們都想要去獲取。針對(duì)這種情況,需要個(gè)性化推薦策略能夠建立“權(quán)威專家”,這能夠更加凸顯推薦的個(gè)性化。
不僅如此,在這些用戶中,還存在一批特殊的用戶,即企業(yè)的科研人員。這些人注重于專利。這要求推薦策略能夠準(zhǔn)確地定位用戶身份。
首先,用戶興趣特征的獲取分為顯式獲取和隱式獲取兩種。
顯式獲取興趣特征的方法一般就是收集用戶的基本信息,如姓名、年齡、受教育程度、職業(yè)、用戶自己選擇的學(xué)科或領(lǐng)域或者用戶自己輸入代表興趣的關(guān)鍵詞。這種方法簡(jiǎn)單、直接,而且往往比較可靠。但是,這一方法靈活性差,表述存在異質(zhì)性,用戶興趣改變需要手動(dòng)更改,導(dǎo)致這一方法的時(shí)效性和準(zhǔn)確性難以保證。此外,在學(xué)術(shù)領(lǐng)域,用戶往往也是生產(chǎn)者,能夠通過(guò)挖掘用戶發(fā)表過(guò)的文章,對(duì)其進(jìn)行特征描述[3]。
隱式獲取興趣特征的方法就是通過(guò)跟蹤用戶的行為,然后根據(jù)用戶“互動(dòng)”(收藏[4-5]、打標(biāo)簽[6]、下載[7]、閱讀和瀏覽[8]或引用[9]等行為)的對(duì)象推測(cè)用戶的興趣偏好。即,對(duì)用戶“互動(dòng)”的論文提取關(guān)鍵詞進(jìn)行分析,推測(cè)用戶的興趣。這種方法減少了用戶不必要的負(fù)擔(dān)。缺點(diǎn)就是會(huì)產(chǎn)生大量的計(jì)算。
圖1 學(xué)術(shù)資源推薦流程
其次,通過(guò)TF-IDF處理關(guān)鍵詞描述用戶興趣特征是最流行的方案。也有人提出用標(biāo)簽、興趣本體、領(lǐng)域知識(shí)、用戶背景、學(xué)習(xí)目標(biāo)和認(rèn)知模式等[10-13]各方面來(lái)描述用戶的興趣特征。
另外對(duì)于用戶特征描述,不僅要考慮用戶的長(zhǎng)期興趣偏好,還要考慮用戶的短期興趣偏好。目前在學(xué)術(shù)領(lǐng)域,大多數(shù)都是建立的靜態(tài)模型,只關(guān)注了用戶的長(zhǎng)期興趣,對(duì)于短期興趣的關(guān)注還是比較少的。用戶興趣和需求的變化是影響用戶特征描述的重要因素[14]。
學(xué)術(shù)用戶建模方法主要有基于向量的建模、基于主題模型的建模及基于本體的建模。
(1)基于向量的建模
基于向量的建模是指利用一組特征詞的向量表示用戶興趣偏好模型。其中,特征詞可以是用戶的元數(shù)據(jù)信息,也可以是用戶的行為數(shù)據(jù)信息。單純采用特征詞描述的方法無(wú)法準(zhǔn)確描述用戶偏好。為了克服基于向量建模的這一缺陷,基于詞頻-逆文檔頻率(TF-IDF)[15]的向量表示法是一種改進(jìn)的建模法。該方法賦予特征相應(yīng)的權(quán)值,對(duì)出現(xiàn)頻率高的特征賦予較高權(quán)值,出現(xiàn)頻率低的特征賦予較低權(quán)值。此方法法可反映每種特征的重要程度,是目前比較流行的描述用戶興趣方案。
(2)基于主題模型的建模
(3)基于本體的建模
本體[18]是對(duì)客觀世界中抽象出來(lái)的某些概念的明確的形式化描述,它包含了事物的種類、性質(zhì)等信息并且反映出事物間的關(guān)系?;诒倔w的建?;舅枷胧峭ㄟ^(guò)一個(gè)本體概念向量來(lái)描述用戶興趣特征,模型通常是樹形層次結(jié)構(gòu)的組織形式,樹的一個(gè)節(jié)點(diǎn)代表用戶的一個(gè)興趣類。
不同的領(lǐng)域,推薦對(duì)象不同,如何對(duì)推薦對(duì)象進(jìn)行建模也是一個(gè)重要的問(wèn)題。
學(xué)術(shù)資源主要是文本類型的,在描述推薦對(duì)象方面,主要有兩大類方法,基于內(nèi)容的方法和基于分類的方法。
3.1.1 基于內(nèi)容的方法
目前,文本類對(duì)象特征提取技術(shù)相對(duì)比較成熟,在學(xué)術(shù)領(lǐng)域,大多數(shù)都是采用基于內(nèi)容的方法從推薦對(duì)象本身進(jìn)行特征提取,用提取的特征詞來(lái)進(jìn)行對(duì)象建模。
這些建模方法主要分為兩種,一種是使用簡(jiǎn)單的詞語(yǔ)作為特征詞描述對(duì)象特征。這些方法中有些方法直接使用索引詞[6,19]、主題詞[20],以及從通過(guò)潛伏狄里克雷分類[21]或機(jī)器學(xué)習(xí)生成的文獻(xiàn)參考語(yǔ)料庫(kù)(ACL或ARC)中引用的概念詞[21]作為特征詞。另一種是通過(guò)提取特征詞描述對(duì)象特征。這些特征詞主要是從標(biāo)題[22]、摘要[20,23-24]、引言[25]、介紹[26]、前言[26]、作者提供的關(guān)鍵詞[23,26-27]和參考書目[28]以及論文的正文[19,29]等內(nèi)容中提取的。有一些方法也會(huì)從外部來(lái)源如社會(huì)標(biāo)簽[27],ACM分類樹和DMOZ目錄[30-31]和引文上下文[24,29]等內(nèi)容中提取特征詞。
此外,還有一些方法是利用非文本特征進(jìn)行推薦。例如:利用引用特征的CC-IDF方法[25]或者改進(jìn)的CCIDF方法[4,28],以及利用共同作者的數(shù)量的推薦方法[32]。
川酒生態(tài)釀造的產(chǎn)品需要通過(guò)生態(tài)化的方式來(lái)消費(fèi)[18]。生態(tài)消費(fèi)是一種綠化的或生態(tài)化的消費(fèi)模式,它是指既符合物質(zhì)生產(chǎn)的發(fā)展水平,又符合生態(tài)生產(chǎn)的發(fā)展水平,既能滿足人的消費(fèi)需求,又不對(duì)生態(tài)環(huán)境造成危害的一種消費(fèi)行為[19]。目前,相關(guān)研究已發(fā)現(xiàn)白酒中存在大量的健康因子?!斑m量飲酒,有益健康”已是所有白酒行業(yè)的共識(shí)[20]。川酒行業(yè)目前正積極引導(dǎo)消費(fèi)者生態(tài)消費(fèi),提倡一種健康、文明、和諧的飲酒方式,在川酒的消費(fèi)過(guò)程中加入生態(tài)的理念,將飲酒過(guò)程轉(zhuǎn)變?yōu)樯鷳B(tài)消費(fèi)過(guò)程。同時(shí),生態(tài)釀酒產(chǎn)業(yè)的發(fā)展為白酒的生態(tài)消費(fèi)提供了強(qiáng)有力的技術(shù)支撐[21]。
對(duì)于一些特殊的論文,也需要采用一些特殊的方法進(jìn)行描述。比如,“經(jīng)典論文”的推薦。這類論文不會(huì)因?yàn)闀r(shí)間而沉寂。利用下載持久性原則和引用傳遞性原則[33]就能夠很好地區(qū)分出這些論文?!敖?jīng)典論文”的推薦還能夠在一定程度上解決用戶冷啟動(dòng)問(wèn)題[34]。
3.1.2 基于分類的方法
基于分類的方法是通過(guò)利用文本分類的方法將推薦對(duì)象分到不同的類別(如:學(xué)科)中,然后將同類的對(duì)象推薦給對(duì)此類對(duì)象感興趣的用戶。文本分類技術(shù)也比較成熟,此類方法有很多種,例如樸素貝葉斯(Naiva-Bayes),k最近鄰方法(KNN),支持向量機(jī)(SVM)和深度神經(jīng)網(wǎng)絡(luò)(DNN)等。使用基于分類的方法進(jìn)行推薦對(duì)象建模,可以預(yù)先定義推薦對(duì)象的類別,也可以利用聚類技術(shù)自動(dòng)產(chǎn)生[35]。
隨著計(jì)算機(jī)科學(xué)技術(shù)和信息技術(shù)的發(fā)展,學(xué)術(shù)資源除了文本類型之外,還有圖片、圖像、影像、語(yǔ)音等多種形式。利用傳統(tǒng)的推薦算法進(jìn)行資源推薦,主要用到資源對(duì)象的描述信息,這些信息通常是由人工設(shè)計(jì)[36],將顏色、形狀、紋理和結(jié)構(gòu)轉(zhuǎn)化為單一全局表達(dá)來(lái)描述資源內(nèi)容。隨著深度神經(jīng)網(wǎng)絡(luò)取得突破性進(jìn)展,近年來(lái)大部分研究使用主題模型(LDA),或者使用基于深度學(xué)習(xí)模型的方法進(jìn)行推薦[37]。
推薦策略是整個(gè)推薦流程中最關(guān)鍵的模塊,一個(gè)推薦策略的優(yōu)劣直接決定了最后推薦結(jié)果的好壞。截止到目前為止,被提出的推薦策略有很多。經(jīng)過(guò)分析,學(xué)術(shù)資源個(gè)性化推薦策略基本上包括以下幾類:基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦、基于社交網(wǎng)絡(luò)的推薦、基于關(guān)聯(lián)規(guī)則的推薦、混合推薦、基于深度學(xué)習(xí)的推薦。
基于內(nèi)容的推薦(Content-based Recommendation)也叫基于內(nèi)容的過(guò)濾(Content-based Filtering,CBF),是應(yīng)用于學(xué)術(shù)資源推薦領(lǐng)域最主要的推薦策略[38]?;趦?nèi)容的推薦方法最早是應(yīng)用于信息獲取領(lǐng)域[39]。該方法的主要思想是根據(jù)用戶的交互項(xiàng)目,從推薦對(duì)象中選擇與用戶交互項(xiàng)目相似的對(duì)象作為推薦結(jié)果。此方法適用于所有類型學(xué)術(shù)資源的個(gè)性化推薦。
現(xiàn)有基于內(nèi)容的學(xué)術(shù)資源推薦算法更多是注重分析學(xué)術(shù)資源內(nèi)容屬性進(jìn)行推薦的,如Wang等人基于學(xué)術(shù)資源內(nèi)容,結(jié)合權(quán)威性、受歡迎程度和新鮮度等資源特性為用戶推薦學(xué)術(shù)資源[40];Younus等人則是基于資源內(nèi)容將其主題模型用于微博數(shù)據(jù),向初級(jí)研究者推薦其研究領(lǐng)域的最新科技論文[41]。
更深層的學(xué)術(shù)資源推薦算法是結(jié)合學(xué)術(shù)資源屬性特征構(gòu)建用戶模型,Guan等人通過(guò)合并元數(shù)據(jù),如標(biāo)題、關(guān)鍵字、摘要和引用來(lái)加強(qiáng)科學(xué)文獻(xiàn)的語(yǔ)義信息,使用每個(gè)術(shù)語(yǔ)的tf-idf值來(lái)為每個(gè)科學(xué)文獻(xiàn)建模,并使用不同權(quán)重的主題詞向量來(lái)構(gòu)造用戶興趣模型,以提升推薦的準(zhǔn)確性[42]。
基于內(nèi)容的推薦策略存在兩個(gè)關(guān)鍵部分:一個(gè)是用戶互動(dòng)對(duì)象的確定;另一個(gè)是互動(dòng)對(duì)象的內(nèi)容特征描述。
用戶和對(duì)象之間的“互動(dòng)”通常就是用戶行為[43]。
關(guān)于內(nèi)容特征的描述,采用基于內(nèi)容的方法。但是提取特征詞的過(guò)程中會(huì)存在一個(gè)問(wèn)題,從論文不同區(qū)域提取的特征詞權(quán)重是不相同的[44]。例如,標(biāo)題中出現(xiàn)的特征詞通常比正文中出現(xiàn)的特征詞更有意義。
基于內(nèi)容推薦的優(yōu)點(diǎn)如下:
(1)不需要評(píng)分?jǐn)?shù)據(jù),不存在數(shù)據(jù)稀疏性問(wèn)題。
(2)對(duì)于新對(duì)象也不存在冷啟動(dòng)問(wèn)題。
(3)擁有比較成熟的分類學(xué)習(xí)算法為該策略提供技術(shù)支持。
(4)能夠自動(dòng)創(chuàng)建用戶模型,不需要大量的前期分類工作。
該方法也存在不能推薦跨領(lǐng)域跨學(xué)科的學(xué)術(shù)資源[45]、計(jì)算量大等不足。此外,這類方法比較注重資源的推薦,一般采用在某一個(gè)周期以主題、期刊的方式進(jìn)行推送,商業(yè)數(shù)據(jù)庫(kù)之間的資源需要分別推薦,百度學(xué)術(shù)目前雖然做到整合類期刊、圖書資源以主題訂閱的方式進(jìn)行推送,也未能實(shí)現(xiàn)對(duì)用戶進(jìn)行個(gè)性化、實(shí)時(shí)推薦。另外這些研究主要基于關(guān)鍵詞的向量空間模型或者主題模型描述項(xiàng)目和用戶興趣特征,向量空間模型往往并不能準(zhǔn)確地反映有關(guān)用戶興趣和偏好的語(yǔ)義范疇信息。并且,在面向多類型學(xué)術(shù)資源的場(chǎng)景中,不同類型學(xué)術(shù)資源的主題模型有所區(qū)別,傳統(tǒng)基于內(nèi)容的學(xué)術(shù)資源個(gè)性化推薦顯得適應(yīng)性不足。
協(xié)同過(guò)濾推薦(Collaborative Filtering Recommendation,CF)在個(gè)性化推薦領(lǐng)域是最成功的策略?;纠碚撌牵脩粝矚g具有相同興趣的用戶喜歡的東西,當(dāng)兩位用戶評(píng)價(jià)相同項(xiàng)目時(shí),兩位用戶被認(rèn)為是具有有相同興趣的。當(dāng)具有相同興趣的用戶被識(shí)別時(shí),將一個(gè)用戶感興趣的項(xiàng)目推薦給其他用戶,反之亦然[46]。此方法適用于存在大量用戶行為數(shù)據(jù)時(shí)的學(xué)術(shù)資源推薦。
在學(xué)術(shù)推薦領(lǐng)域,協(xié)同過(guò)濾的應(yīng)用要比基于內(nèi)容的推薦少。出現(xiàn)這種情況的主要原因是CF需要用戶的參與,但在學(xué)術(shù)推薦領(lǐng)域用戶參與的動(dòng)力往往不足[8,47]。這種情況造成了“冷啟動(dòng)”問(wèn)題,這種問(wèn)題可能發(fā)生在以下幾種情況中:(1)新用戶,一個(gè)新的用戶打分的項(xiàng)目很少或沒(méi)有,找不到有相同興趣的用戶。(2)新項(xiàng)目,項(xiàng)目是新的,還沒(méi)有被至少一個(gè)用戶打分。(3)新社區(qū)或?qū)W科,一個(gè)新的社區(qū),用戶對(duì)項(xiàng)目打分的動(dòng)力很少,導(dǎo)致的結(jié)果就是沒(méi)有用戶對(duì)項(xiàng)目打分。
在基于協(xié)同過(guò)濾的資源推薦領(lǐng)域中,主要是基于傳統(tǒng)協(xié)同過(guò)濾算法進(jìn)行資源推薦工作,Yu等人基于用戶閱讀文獻(xiàn)的語(yǔ)義分析建立用戶文檔,通過(guò)傳統(tǒng)協(xié)同過(guò)濾方法找到相似的用戶文檔并預(yù)測(cè)用戶興趣,實(shí)現(xiàn)個(gè)性化推薦[48]。這類推薦算法的準(zhǔn)確性容易受到數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題的影響,為此Kai等人通過(guò)融合用戶評(píng)分項(xiàng)目和用戶評(píng)分項(xiàng)目的類型計(jì)算用戶相似度,并設(shè)計(jì)了相應(yīng)的協(xié)同過(guò)濾算法來(lái)提高推薦結(jié)果的準(zhǔn)確性[49];Niu等人利用三種不同類型信息(users,items,user-items)應(yīng)對(duì)數(shù)據(jù)稀疏問(wèn)題,并預(yù)測(cè)項(xiàng)目評(píng)分,產(chǎn)生高質(zhì)量的推薦結(jié)果[50];Seo等人提出融入朋友間親密關(guān)系到推薦模型中,為同興趣主題下的新用戶推薦資源[51]。
協(xié)同過(guò)濾推薦的優(yōu)點(diǎn):
(1)不需要對(duì)推薦對(duì)象進(jìn)行容錯(cuò)處理[52]。
(2)考慮了推薦對(duì)象的質(zhì)量[53]。
(3)能夠發(fā)現(xiàn)用戶新的興趣點(diǎn)[54]。
(4)不需要專業(yè)知識(shí)對(duì)學(xué)術(shù)資源進(jìn)行分類。
(5)用戶越多,性能越好。
協(xié)同過(guò)濾推薦研究在兩個(gè)方面存在明顯不足。一方面,這些研究主要利用用戶的顯式和隱式行為數(shù)據(jù)進(jìn)行用戶興趣建模,容易出現(xiàn)數(shù)據(jù)稀疏問(wèn)題;另一方面,這些研究往往基于靜態(tài)的場(chǎng)景,在用戶數(shù)據(jù)不斷更新、用戶需求不斷變化的情況下,難以應(yīng)對(duì)學(xué)術(shù)資源在線移動(dòng)推薦的真實(shí)需求。
基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦策略不考慮用戶和推薦對(duì)象的內(nèi)容,而是把用戶和推薦對(duì)象抽象為節(jié)點(diǎn),而用戶選擇了某一推薦對(duì)象就會(huì)在用戶和對(duì)象之間存在選擇關(guān)系,此策略認(rèn)為信息就隱藏在這種選擇關(guān)系中。此方法不僅能夠利用單類型數(shù)據(jù)進(jìn)行推薦,而且能夠利用多類型異構(gòu)信息進(jìn)行推薦。
該策略的基本思想:通過(guò)學(xué)術(shù)資源之間存在的固有聯(lián)系,構(gòu)建圖形網(wǎng)絡(luò),展示學(xué)術(shù)資源之間是如何連接的。建立圖形網(wǎng)絡(luò)后,使用網(wǎng)絡(luò)來(lái)查找推薦候選項(xiàng)目。通常,輸入一篇或多篇論文,然后根據(jù)這些輸入的論文構(gòu)建圖形網(wǎng)絡(luò),在圖形網(wǎng)絡(luò)中進(jìn)行隨機(jī)游走找出最受歡迎的項(xiàng)目[23]。
圖形網(wǎng)絡(luò)中包含作者[22,55]、用戶/客戶[26]、場(chǎng)景[22]、關(guān)鍵詞和特征詞[22,55]、論文發(fā)表年份[22]。根據(jù)圖形網(wǎng)絡(luò)中的實(shí)體,實(shí)體之間的聯(lián)系可以是引用[22,56]購(gòu)買[26],“發(fā)表在”關(guān)系[22],共同作者[55],特征詞之間的相關(guān)性[55],或者論文中特征詞的同現(xiàn)關(guān)系[22]。例如,Chakraborty等人在由查詢文獻(xiàn)的引用和內(nèi)容相似屬性構(gòu)成的感應(yīng)子網(wǎng)上建立隨機(jī)游走基礎(chǔ)框架,向用戶推薦某些類別的科技論文[57];Pan等人則是基于引用關(guān)系和學(xué)科內(nèi)容知識(shí)構(gòu)建異構(gòu)圖,采用一種基于圖的相似性學(xué)習(xí)算法實(shí)現(xiàn)學(xué)術(shù)論文推薦[58]。另外,一些作者還根據(jù)非固有關(guān)系進(jìn)行實(shí)體的連接。例如,文本相似性[26,59]。此外,有的連接是基于屬性相似性,書目耦合,共引用強(qiáng)度[26,59]或人口統(tǒng)計(jì)學(xué)相似性[26]。
基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦的優(yōu)點(diǎn):能夠推薦較偏門領(lǐng)域的學(xué)習(xí)資源;能夠部分地解決學(xué)術(shù)資源數(shù)據(jù)稀疏性問(wèn)題。至于該策略的缺點(diǎn):存在重復(fù)屬性,這會(huì)影響推薦的精確度。
基于社交關(guān)系的推薦是把社交網(wǎng)絡(luò)分析理論應(yīng)用于推薦系統(tǒng)的一類方法?;谏缃魂P(guān)系的推薦是一個(gè)特別注重協(xié)同關(guān)系的個(gè)性化推薦策略。在個(gè)性化推薦中,用戶之間的關(guān)系是非常能凸顯用戶興趣特征的因素,但是在傳統(tǒng)的個(gè)性化推薦算法中,將所有的用戶都是等同看待的,這種處理方式忽略了用戶間真實(shí)的社交關(guān)系。對(duì)于學(xué)術(shù)資源的推薦來(lái)說(shuō),其本身就具有一定的特殊性,比如,用戶在學(xué)術(shù)社交網(wǎng)絡(luò)中的朋友,可能是自己的學(xué)生,可能是自己科研團(tuán)隊(duì)中的成員,還有可能是自己關(guān)注領(lǐng)域的權(quán)威人物,這就使得不同人相關(guān)的學(xué)術(shù)資料對(duì)于用戶的價(jià)值是不一樣的。這種真實(shí)的社交關(guān)系對(duì)于學(xué)術(shù)資源的個(gè)性化推薦影響更大。
在學(xué)術(shù)領(lǐng)域,基于社交關(guān)系的推薦是利用用戶的學(xué)術(shù)關(guān)系,屬于基于作者的推薦?;谧髡哌M(jìn)行學(xué)術(shù)資源推薦的對(duì)象主要是科研文獻(xiàn),通過(guò)科研社交網(wǎng)絡(luò)或者論文中的共著關(guān)系、引用關(guān)系等信息,挖掘研究興趣相似的科研人員,并相互推薦研究相關(guān)的科研文獻(xiàn)。劉先紅等利用科研社交網(wǎng)絡(luò)推薦系統(tǒng)向科研人員推送個(gè)性化信息解決信息過(guò)載問(wèn)題[60]。基于作者的推薦方法,一方面基于作者、社交信息和共引關(guān)系等進(jìn)行學(xué)術(shù)資源推薦,例如,Xia等人基于研究人員經(jīng)常搜索同一作者發(fā)表的文章,提出通過(guò)對(duì)文章之間的共同作者關(guān)系信息來(lái)確定推薦的目標(biāo)研究者,提升推薦效果[61];Zhao等人通過(guò)彌合作者背景知識(shí)和研究目標(biāo)之間的知識(shí)差距為研究人員推薦有用的資源[62];Alotaibi等基于隱式科研社交網(wǎng)絡(luò)關(guān)系,共同讀者關(guān)系和標(biāo)簽行為關(guān)系提出三種個(gè)性化論文推薦算法[63]。另一方面,結(jié)合模型和社交關(guān)系進(jìn)行學(xué)術(shù)資源推薦,例如,Guo等提出基于核的協(xié)同主題回歸模型,利用高斯過(guò)程和核函數(shù)捕捉數(shù)據(jù)之間的非線性社交關(guān)系為用戶推薦論文標(biāo)簽[64];Wang等基于經(jīng)典的論文推薦模型CTR(Collaborative Topic Regression)[65],隨后Wang等基于CTR模型又提出一種新的貝葉斯層次模型RCTR(Relational Collaborative Topic Regression)[66],引入論文之間的社交網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系為科研人員推薦論文標(biāo)簽。
基于社交關(guān)系推薦能夠提供更加個(gè)性化的推薦結(jié)果。但是這方面的研究都是通過(guò)社交網(wǎng)絡(luò)個(gè)人信息和科研文獻(xiàn)中信息,構(gòu)建作者的研究興趣模型,并根據(jù)該模型推薦相關(guān)文獻(xiàn),但是如果用戶之前沒(méi)有發(fā)表過(guò)文章,則無(wú)法有效建立該用戶的研究興趣模型。而且用戶的論文發(fā)表主題也具有一定的隨機(jī)性和可變性。此方法適用于基于作者的學(xué)術(shù)資源個(gè)性化推薦。
關(guān)聯(lián)規(guī)則是一種非常有效的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù),是描述兩個(gè)或者多個(gè)對(duì)象之間某種潛在的特征關(guān)系規(guī)則。它的基本思想是從大量的數(shù)據(jù)中挖掘出能夠描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有價(jià)值的知識(shí)。關(guān)聯(lián)規(guī)則的推薦大致分為兩個(gè)步驟,第一步,挖掘及制定一系列的規(guī)則,然后利用規(guī)則來(lái)分析計(jì)算資源間的關(guān)聯(lián)性;第二步,通過(guò)分析用戶的行為及偏好,然后根據(jù)事先制定的規(guī)則向用戶進(jìn)行推薦。此方法能夠通過(guò)關(guān)聯(lián)規(guī)則挖掘用戶和學(xué)術(shù)資源的潛在關(guān)系進(jìn)行個(gè)性化推薦。
學(xué)術(shù)資源的關(guān)聯(lián)挖掘指的是利用用戶的歷史訪問(wèn)記錄來(lái)發(fā)現(xiàn)資源之間的關(guān)系,從而完成信息的推薦服務(wù)[67]。也有直接挖掘用戶資料的關(guān)聯(lián)規(guī)則進(jìn)行推薦[68]。例如,Anh等人利用馬爾可夫鏈模型發(fā)現(xiàn)關(guān)鍵字之間的各類關(guān)聯(lián)關(guān)系,并將關(guān)鍵字作為基本元素向用戶推薦更多該主題下的論文[69]。
關(guān)聯(lián)規(guī)則推薦的優(yōu)點(diǎn):
(1)不需要領(lǐng)域的相關(guān)知識(shí),能夠挖掘用戶潛在的興趣點(diǎn)。
(2)能夠發(fā)現(xiàn)不同領(lǐng)域的學(xué)術(shù)資源之間的關(guān)聯(lián),提供新鮮的資源推薦。
關(guān)聯(lián)規(guī)則推薦的缺點(diǎn):
(1)運(yùn)算性能問(wèn)題。
(2)推薦的個(gè)性化程度比較差。
(3)關(guān)聯(lián)規(guī)則側(cè)重于發(fā)現(xiàn)不同類別的對(duì)象之間的關(guān)聯(lián)。
各種推薦方法都有各自的優(yōu)缺點(diǎn)。在實(shí)際應(yīng)用中可以針對(duì)具體問(wèn)題采用推薦策略的組合進(jìn)行推薦,即所謂的組合推薦。組合推薦的目的是通過(guò)組合不同的推薦策略,達(dá)到揚(yáng)長(zhǎng)避短的目的,從而產(chǎn)生更符合用戶需求的推薦。根據(jù)應(yīng)用場(chǎng)景的不同,這種組合方法也會(huì)不同,目前主要的混合方式可以分成兩種:
(1)推薦結(jié)果進(jìn)行組合:這是一種最簡(jiǎn)單的混合方法,分別用兩種或兩種以上的推薦方法產(chǎn)生推薦結(jié)果,然后采用某種算法把推薦結(jié)果進(jìn)行混合而得到最終推薦[56]。
(2)推薦算法進(jìn)行組合:將兩種或多種推薦策略進(jìn)行組合以實(shí)現(xiàn)個(gè)性化推薦[70-71]。
近幾年來(lái),深度學(xué)習(xí)在語(yǔ)音識(shí)別、圖像分析和自然語(yǔ)言處理等方面取得了革命性的進(jìn)展。同時(shí),最近的研究表明,深度學(xué)習(xí)能夠有效地解決信息檢索和推薦方面的難題。將深度學(xué)習(xí)技術(shù)應(yīng)用到推薦系統(tǒng)中,由于其先進(jìn)的性能和高質(zhì)量的推薦促進(jìn)了推薦系統(tǒng)的發(fā)展。與傳統(tǒng)的推薦模式相比,深度學(xué)習(xí)能夠更深層次的理解用戶需求、項(xiàng)目特性以及用戶與項(xiàng)目之間的隱式關(guān)系。
在個(gè)性化推薦過(guò)程中,利用自編碼器[72]對(duì)用戶或項(xiàng)目相關(guān)的信息(包括行為數(shù)據(jù)和文本、圖像等信息)進(jìn)行重構(gòu)學(xué)習(xí)到用戶或項(xiàng)目的隱式特征,然后基于這些隱式特征預(yù)測(cè)用戶對(duì)項(xiàng)目的偏好,能夠有效提高用戶對(duì)推薦結(jié)果的滿意度。卷積神經(jīng)網(wǎng)絡(luò)[73]能夠從圖像、文本、音頻等內(nèi)容中提取項(xiàng)目的隱式特征,然后利用用戶隱式特征為用戶推薦學(xué)術(shù)資源。循環(huán)神經(jīng)網(wǎng)絡(luò)[74]主要是用來(lái)建模數(shù)據(jù)之間的序列影響,從而幫助獲取更有效的用戶和項(xiàng)目的潛在關(guān)系。例如,CNN用于文本信息中預(yù)測(cè)潛在因素[75],有助于提高對(duì)于隱性特征提取的準(zhǔn)確度。DNNs能夠改進(jìn)協(xié)同過(guò)濾算法中存在的矩陣分解的內(nèi)積可能不足以描述隱含特征的復(fù)雜結(jié)構(gòu)的問(wèn)題[76]。循證神經(jīng)網(wǎng)絡(luò)(RNNs)能夠發(fā)現(xiàn)論文的連續(xù)和潛在的語(yǔ)義特征,提高推薦質(zhì)量[77]。Wei等人則通過(guò)深度神經(jīng)網(wǎng)絡(luò)抽取項(xiàng)目特征來(lái)預(yù)測(cè)冷啟動(dòng)項(xiàng)目評(píng)分,有效地解決了冷啟動(dòng)問(wèn)題[78]。
基于深度學(xué)習(xí)的推薦能夠大大提高系統(tǒng)的自動(dòng)化程度和可擴(kuò)展性,但是只能緩解推薦系統(tǒng)存在的冷啟動(dòng)和數(shù)據(jù)稀疏性問(wèn)題,而不能完全解決冷啟動(dòng)和數(shù)據(jù)稀疏性問(wèn)題。
在商業(yè)領(lǐng)域,個(gè)性化推薦技術(shù)經(jīng)過(guò)多年的發(fā)展,日漸成熟。但是,在學(xué)術(shù)領(lǐng)域,學(xué)術(shù)資源的個(gè)性化推薦可以說(shuō)是才剛剛起步。下面針對(duì)相關(guān)方面的問(wèn)題進(jìn)行大膽的總結(jié)和預(yù)測(cè)。
(1)對(duì)會(huì)議預(yù)告、專利、學(xué)術(shù)博客和學(xué)術(shù)新聞的個(gè)性化推薦
目前學(xué)術(shù)資源個(gè)性化推薦的研究,關(guān)注點(diǎn)只是在論文和圖書兩方面,而對(duì)于會(huì)議預(yù)告、專利、學(xué)術(shù)博客和學(xué)術(shù)新聞等學(xué)術(shù)資源的個(gè)性化推薦的研究還處于空白期。不同的科研人員所需的資源不同,例如,企業(yè)的科研人員需要專利,權(quán)威專家需要學(xué)術(shù)新聞等。
(2)相似度計(jì)算方法評(píng)估
基本的相似度計(jì)算方法:皮爾森相關(guān)性、余弦距離、歐式距離和基于Log似然的相似性等相似度計(jì)算方法;協(xié)同過(guò)濾推薦中最流行的描述隱含特征間相互影響的協(xié)同過(guò)濾技術(shù)——矩陣分解等。使用不同的計(jì)算方法會(huì)產(chǎn)生不同的效果,目前沒(méi)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),無(wú)法定性各種計(jì)算方法的好壞。
(3)數(shù)據(jù)稀疏性問(wèn)題和冷啟動(dòng)問(wèn)題
目前,解決數(shù)據(jù)稀疏性問(wèn)題的方法主要有兩種:一種是人工填補(bǔ)數(shù)據(jù)[47];另一種就是混合推薦[79]??朔鋯?dòng)問(wèn)題,主要有兩種解決方式。一種是通過(guò)用戶和項(xiàng)目之間的互動(dòng)推斷隱含評(píng)分然后進(jìn)行推薦[7-8,80]。另一種就是利用混合推薦的推薦方法[79]。此外,CF方法和神經(jīng)網(wǎng)絡(luò)的緊耦合對(duì)于冷啟動(dòng)項(xiàng)目推薦非常有效[81]。
在學(xué)術(shù)領(lǐng)域的推薦中,數(shù)據(jù)稀疏性和冷啟動(dòng)問(wèn)題比商業(yè)領(lǐng)域更加嚴(yán)重,可以說(shuō)是學(xué)術(shù)資源個(gè)性化推薦的兩個(gè)頭號(hào)難題。包括經(jīng)典協(xié)同過(guò)濾算法和新出現(xiàn)的基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法都存在這樣的問(wèn)題。雖然,很多研究嘗試解決,但這些辦法只是治標(biāo)不治本,無(wú)法徹底根除。
(4)多語(yǔ)種的學(xué)術(shù)資源推薦
現(xiàn)有的學(xué)術(shù)資源推薦都是單語(yǔ)種的推薦(中文學(xué)術(shù)資源推薦或英文學(xué)術(shù)資源推薦),還沒(méi)有出現(xiàn)一種跨語(yǔ)種的學(xué)術(shù)資源推薦方法。
(5)推薦算法評(píng)估方法
在過(guò)去的20多年中,關(guān)于研究學(xué)術(shù)推薦算法的論文發(fā)表了200多篇,但是,沒(méi)有明確的結(jié)果表示哪種算法是最好的[82]。歸根結(jié)底,就是缺乏有標(biāo)準(zhǔn)化的評(píng)估方案。
(1)“學(xué)術(shù)基因”的研究
目前,對(duì)于提高個(gè)性化推薦的準(zhǔn)確率和滿意度,都是在兩個(gè)方面進(jìn)行研究:一方面是改進(jìn)關(guān)鍵字提取技術(shù);另一方面是加入社交關(guān)系。但是對(duì)于如何描述用戶和推薦對(duì)象的特征的研究進(jìn)展不大。在其他領(lǐng)域的推薦方面,提出了“基因”這一概念改進(jìn)推薦對(duì)象的特征描述,進(jìn)而提高推薦的準(zhǔn)確度。例如,“商品基因”[83]、“音樂(lè)基因”[84]、“圖書基因”[85]。學(xué)術(shù)資源也可以引入“學(xué)術(shù)基因”提高推薦性能。所以,“學(xué)術(shù)基因”的研究應(yīng)該得到更多的關(guān)注。
(2)多維度用戶畫像
隨著用戶在多種類型學(xué)術(shù)資源上的行為數(shù)據(jù)規(guī)模不斷增大,類型也越來(lái)越多樣化,其內(nèi)在的特征維度越來(lái)越高、信息內(nèi)容越來(lái)越豐富、關(guān)聯(lián)關(guān)系也越來(lái)越復(fù)雜,這對(duì)于表征和刻畫學(xué)術(shù)用戶的興趣偏好帶來(lái)巨大的挑戰(zhàn)。傳統(tǒng)的學(xué)術(shù)用戶畫像建模通常通過(guò)社交網(wǎng)絡(luò)個(gè)人信息和科研文獻(xiàn)信息等淺層特征建模用戶畫像,而忽略用戶行為數(shù)據(jù)中的顯隱性特征,忽略了學(xué)術(shù)用戶瀏覽學(xué)術(shù)資源對(duì)象中語(yǔ)義豐富的富知識(shí)表征,從而難以對(duì)用戶興趣全面地、準(zhǔn)確地進(jìn)行表征。因此,如何深層挖掘?qū)W術(shù)用戶行為數(shù)據(jù)中顯隱性特征,對(duì)學(xué)術(shù)用戶瀏覽的跨類型學(xué)術(shù)資源進(jìn)行學(xué)習(xí)和建模,發(fā)現(xiàn)其中包含的富知識(shí)表征,并在此基礎(chǔ)上形成多維度的學(xué)術(shù)用戶畫像,是基于學(xué)術(shù)用戶復(fù)雜關(guān)聯(lián)行為數(shù)據(jù)的學(xué)術(shù)用戶畫像建模所面臨的重要科學(xué)問(wèn)題。多維度用戶畫像的研究必將促使個(gè)性化推薦技術(shù)取得飛速發(fā)展,因此這方面的研究將成為研究的熱點(diǎn)。
(3)跨類型學(xué)術(shù)資源的個(gè)性化推薦
由于互聯(lián)網(wǎng)上學(xué)術(shù)資源數(shù)量巨大、類型繁多,每個(gè)學(xué)術(shù)用戶獲取學(xué)術(shù)信息的主要媒介有所不同,有些用戶偏向通過(guò)學(xué)術(shù)數(shù)據(jù)庫(kù)、專利網(wǎng)站等資源獲取興趣領(lǐng)域的學(xué)術(shù)信息,有些則偏向通過(guò)新聞、博客和社交平臺(tái)等渠道獲取最新學(xué)術(shù)信息,導(dǎo)致學(xué)術(shù)用戶對(duì)不同學(xué)術(shù)資源類型的興趣偏好各異,這為跨類型學(xué)術(shù)資源的個(gè)性化推薦帶來(lái)了全新的挑戰(zhàn)。傳統(tǒng)的學(xué)術(shù)資源推薦通常知識(shí)單一類型的資源推薦,無(wú)法同時(shí)為用戶提供不同類型的推薦結(jié)果,忽略不同類型資源在特征表述時(shí)的不同,忽略了用戶對(duì)不同類型學(xué)術(shù)資源的需求,從而難以全面地滿足用戶的學(xué)術(shù)需求。因此,如何為用戶推薦跨類型的學(xué)術(shù)資源是學(xué)術(shù)資源個(gè)性化推薦研究所面臨的重要問(wèn)題,跨類型的學(xué)術(shù)資源個(gè)性化推薦研究在未來(lái)一段時(shí)間必將成為研究的主流。
(4)跨語(yǔ)種學(xué)術(shù)資源的個(gè)性化推薦
隨著互聯(lián)網(wǎng)的發(fā)展,科研人員不僅需要不同類型的學(xué)術(shù)資源而且需要不同語(yǔ)種的學(xué)術(shù)資源。由于不同語(yǔ)種的學(xué)術(shù)資源特征表述不同,阻礙了跨語(yǔ)種的學(xué)術(shù)資源推薦研究的發(fā)展。傳統(tǒng)的學(xué)術(shù)資源推薦只能進(jìn)行單一語(yǔ)種的資源推薦,無(wú)法同時(shí)為用戶推薦不同語(yǔ)種的學(xué)術(shù)資源。因此,如何設(shè)計(jì)跨語(yǔ)種特征表示機(jī)制為用戶推薦跨語(yǔ)種的學(xué)術(shù)資源是推薦研究亟待解決的問(wèn)題,跨語(yǔ)種的推薦研究值得受到更多的關(guān)注。
(5)融合深度學(xué)習(xí)和現(xiàn)有的推薦方法進(jìn)行學(xué)術(shù)資源的個(gè)性化推薦
傳統(tǒng)的推薦方法,采用淺層模型進(jìn)行學(xué)術(shù)資源的個(gè)性化推薦,依賴于人工提取特征詞,難以有效挖掘到深層次的用戶和學(xué)術(shù)資源關(guān)系。深度學(xué)習(xí)模型能夠融合用戶或?qū)W術(shù)資源的元數(shù)據(jù)、用戶的行為數(shù)據(jù),以及用戶的學(xué)術(shù)關(guān)系信息等多類型數(shù)據(jù),從而學(xué)習(xí)到用戶和學(xué)術(shù)資源的深層次關(guān)聯(lián)關(guān)系,提高學(xué)術(shù)資源的推薦效果。融合深度學(xué)習(xí)進(jìn)行學(xué)術(shù)資源個(gè)性化推薦的研究值得更多的科研人員加以關(guān)注。
(6)在線推薦學(xué)習(xí)理論
傳統(tǒng)推薦技術(shù)的研究往往基于靜態(tài)的場(chǎng)景,即給定一組學(xué)術(shù)用戶行為數(shù)據(jù)來(lái)進(jìn)行建模和預(yù)測(cè)。然而,當(dāng)前在線學(xué)術(shù)資源個(gè)性化推薦系統(tǒng)面臨的是動(dòng)態(tài)場(chǎng)景,學(xué)術(shù)用戶行為在不斷地更新,學(xué)術(shù)用戶的需求、偏好在隨時(shí)間不斷變化,學(xué)術(shù)資源也在動(dòng)態(tài)實(shí)時(shí)更新,用戶和推薦系統(tǒng)往往會(huì)有更多的交互行為,這些對(duì)推薦系統(tǒng)的在線學(xué)習(xí)和更新機(jī)制有了更高的要求。研究面向交互推薦模型動(dòng)態(tài)演變理論,是實(shí)現(xiàn)學(xué)術(shù)用戶畫像建模與個(gè)性化推薦模型動(dòng)態(tài)更新亟待解決的重要科學(xué)問(wèn)題,學(xué)術(shù)用戶畫像建模與個(gè)性化推薦模型動(dòng)態(tài)更新機(jī)制將是未來(lái)推薦研究的熱點(diǎn)。
隨著大數(shù)據(jù)的發(fā)展,促使學(xué)術(shù)個(gè)性化推薦成為了一個(gè)熱門的研究方向。學(xué)術(shù)個(gè)性化推薦是解決學(xué)術(shù)領(lǐng)域信息超載問(wèn)題的一個(gè)非常有潛力的方法。本文從推薦過(guò)程的三個(gè)模塊(用戶模塊、對(duì)象模塊和推薦策略)對(duì)學(xué)術(shù)個(gè)性化推薦進(jìn)行了分析,對(duì)學(xué)術(shù)個(gè)性化推薦各個(gè)重點(diǎn)方面進(jìn)行了討論,并且對(duì)學(xué)術(shù)個(gè)性化推薦的研究方向作出了預(yù)測(cè)。可以預(yù)見(jiàn),隨著新技術(shù)的發(fā)展,學(xué)術(shù)個(gè)性化推薦必將產(chǎn)生新的思想、模型和方法,推薦的結(jié)果也將越來(lái)越令人滿意。為了解決信息超載問(wèn)題,此方法將長(zhǎng)期成為學(xué)術(shù)領(lǐng)域的研究?jī)?nèi)容之一。
[1]張娜.電子商務(wù)環(huán)境下的個(gè)性化信息推薦服務(wù)及應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2007.
[2]Bollacker K D,Lawrence S,Giles C L.CiteSeer:An autonomous Web agent for automatic retrieval and identification of interesting publications[C]//Proceedings of the 2nd International Conference on Autonomous Agents,1998:116-123.
[3]Sugiyama K,Kan M Y.Towards higher relevance and serendipity in scholarly paper recommendation by Kazunari Sugiyama and Min-Yen Kan with Martin Vesely as coordinator[J].ACM SIGWEB Newsletter,2015:4.
[4]Beel J,Langer S,Genzmehr M,et al.Introducing docear’s research paper recommender system[C]//Proceedings of the 13th ACM/IEEE-CS Joint Conference on Digital Libraries(JCDL’13),2013:459-460.
[5]Jiang Y,Jia A,F(xiàn)eng Y,et al.Recommending academic papers via users’reading purposes[C]//Proceedings of the 6th ACM Conference on Recommender Systems,2012:241-244.
[6]Ferrara F,Pudota N,Tasso C.A keyphrase-based paper recommender system[C]//Proceedings of the IRCDL’11,2011:14-25.
[7]Pennock D M,Horvitz E,Lawrence S,et al.Collaborative filtering by personality diagnosis:A hybrid memory-and model-based approach[C]//Proceedings of the 16th Conference on Uncertainty in Artificial Intelligence,2000:473-480.
[8]Yang C,Wei B,Wu J,et al.CARES:A ranking-oriented CADAL recommender system[C]//Proceedings of the 9th ACM/IEEE-CS Joint Conference on Digital Libraries,2009:203-212.
[9]M?nnich M,Spiering M.Adding value to the library catalog by implementing a recommendation system[J].D-Lib Mag,2008,14(5):4-11.
[10]肖詩(shī)伯,楊玉梅,蘭鷹,等.基于多標(biāo)簽屬性的學(xué)術(shù)文獻(xiàn)推薦研究[J].情報(bào)探索,2015(4):8-10.
[11]Liang T P,Yang Y F,Chen D N,et al.A semanticexpansion approach to personalized knowledge recommendation[J].Decision Support Systems,2008,45(3):401-412.
[12]de Gemmis M,Lops P,Semeraro G,et al.An investigation on the serendipity problem in recommender systems[J].Information Processing&Management,2015,51(5):695-717.
[13]Zhao W,Wu R,Liu H.Paper recommendation based on the knowledge gap between a researcher’s background knowledge and research target[J].Information Processing&Management,2016,52(5):976-988.
[14]王嫣然,陳梅,王翰虎,等.一種基于內(nèi)容過(guò)濾的科技文獻(xiàn)推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(2):66-69.
[15]Paik J H.A novel TF-IDF weighting scheme for effectiveranking[C]//The 36th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM,2013:343-352.
[16]Sang Jitao,Xu Changsheng,Lu Dongyuan.Learn to personalized image search from the photo sharing websites[J].IEEE Transactions on Multimedia,2011,4(4):963-974.
[17]Zhou Dong,Lawless S,Wade V.Improving search via personalized query expansion using social media[J].Information Retrieval,2012,15(3/4):218-242.
[18]Liu Dong,Hua Xiansheng,Wang Meng,et al.Boost search relevance for tag-based social image retrieval[C]//IEEE International Conference on Multimedia and Expo.New York:IEEE,2009:1636-1639.
[19]Nascimento C,Laender A H,da Silva A S,et al.A source independent framework for research paper recommendation[C]//Proceedings of the 11th Annual International ACM/IEEE Joint Conference on Digital Libraries,2011:297-306.
[20]Jiang Y,Jia A,F(xiàn)eng Y,et al.Recommending academic papers via users’reading purposes[C]//Proceedings of the 6th ACM Conference on Recommender Systems,2012:241-244.
[21]Bethard S,Jurafsky D.Who should I cite:Learning literature search models from citation behavior[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management,2010:609-618.
[22]Lao N,Cohen W W.Relational retrieval using a combination of path-constrained random walks[J].Mach Learn,2010,81(1):53-67.
[23]Ekstrand M D,Kannan P,Stemper J A,et al.Automatically building research reading lists[C]//Proceedings of the 4th ACM Conference on Recommender Systems,2010:159-166.
[24]He Q,Pei J,Kifer D,et al.Context-aware citation recommendation[C]//Proceedings of the 19th International Conference on World Wide Web,2010:421-430.
[25]Giles C L,Bollacker K D,Lawrence S.CiteSeer:An automatic citation indexing system[C]//Proceedings of the 3rd ACM Conference on Digital Libraries,1998:89-98.
[26]Huang Z,Chung W,Ong T H,et al.A graph-based recommender system for digital library[C]//Proceedings of the 2nd ACM/IEEE-CS Joint Conference on Digital Libraries,2002:65-73.
[27]Jack K.Mendeley:recommendation systems for academic literature[D].Technical University of Graz(TUG),2012.
[28]Erosheva E,F(xiàn)ienberg S,Lafferty J.Mixed-membership models of scientific publications[C]//Proc Natl Acad Sci U S Am 101(Suppl 1),2004:5220-5227.
[29]Kataria S,Mitra P,Bhatia S.Utilizing context in generative bayesian models for linked corpus[C]//Proceedings of the 24th AAAI Conference on Artificial Intelligence,2010:1340-1345.
[30]Middleton S E,De Roure D C,Shadbolt N R.Capturing knowledge of user preferences:ontologies in recom-mender systems[C]//Proceedings of the 1st International Conference on Knowledge Capture,2001:100-107.
[31]Middleton S E,Shadbolt N R,De Roure D C.Ontological user profiling in recommender systems[J].ACM Trans on Inf Syst(TOIS),2004,22(1):54-88.
[32]Zarrinkalam F,Kahani M.SemCiR—a citation recommendation system based on a novel semantic distance measure[J]Electron Libr Inf Syst,2013,47(1):92-112.
[33]Zhou Q,Chen X,Chen C.Authoritative scholarly paper recommendation based on paper communities[C]//2014 IEEE 17th International Conference on Computational Science and Engineering(CSE),2014:1536-1540.
[34]Wang Y,Zhai E,Hu J,et al.Claper:Recommend classical papers to beginners[C]//2010 Seventh International Conference on Fuzzy Systems and Knowledge Discovery(FSKD),2010,6:2777-2781.
[35]黃義文.大數(shù)據(jù)環(huán)境下圖書館學(xué)術(shù)資源個(gè)性化推薦服務(wù)研究[J].圖書館學(xué)刊,2016,38(7):78-80.
[36]周文罡,李厚強(qiáng),田奇.圖像檢索技術(shù)研究進(jìn)展[J].南京信息工程大學(xué)學(xué)報(bào):自然科學(xué)版,2017,9(6):613-634.
[37]陳亮,汪景福,王娜,等.基于DNN算法的移動(dòng)視頻推薦策略[J].計(jì)算機(jī)學(xué)報(bào),2016,39(8):1626-1638.
[38]Beel J,Gipp B,Langer S,et al.Paper recommender systems:A literature survey[J].International Journal on Digital Libraries,2016,17(4):305-338.
[39]劉瑋.電子商務(wù)系統(tǒng)中的信息推薦方法研究[J].情報(bào)科學(xué),2006,24(2):300-303.
[40]Wang Z,Liu Y,Yang J,et al.A personalization-oriented academic literature recommendation method[J].Data Science Journal,2015,14:1-9
[41]Younus A,Qureshi M A,Manchanda P,et al.Utilizing microblog data in a topic modelling framework for scientific articles’recommendation[M]//Social Informatics.[S.l.]:Springer International Publishing,2014:384-395.
[42]Guan P,Wang Y.Personalized scientific literature recommendation based on user’s research interest[C]//2016 12th International Conference on Natural Computation,F(xiàn)uzzy Systems and Knowledge Discovery(ICNC-FSKD),2016:1273-1277.
[43]Sugiyama K,Kan M Y.Scholarly paper recommendation via user’s recent research interests[C]//Proceedings of the 10th ACM/IEEE Annual Joint Conference on Digital Libraries(JCDL),2010:29-38.
[44]Manning C D,Raghavan P,Schütze H.An introduction to information retrieval[M].Cambridge:Cambridge University Press,2009.
[45]Ricci F,Rokach L,Shapira B,et al.Recommender systems handbook[M].Berlin:Springer,2011.
[46]Resnick P,Iacovou N,Suchak M,et al.GroupLens:An open architecture for collaborative filtering of netnews[C]//Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work,1994:175-186.
[47]Naak A,Hage H,Aimeur E.A multi-criteria collaborative filtering approach for research paper recommendation in papyres[C]//Proceedings of the 4th International Conference MCETECH,2009:25-39.
[48]Yu J,Xie K,Zhao H,et al.Prediction of user interest based on collaborative filtering for personalized academic recommendation[C]//International Conference on Computer Science and Network Technology,2012:584-588.
[49]Kai Z,Lu P Y.Improved collaborative filtering approach based on user similarity combination[C]//International Conference on Management Science&Engineering,2014:238-243.
[50]Niu J,Wang L,Liu X,et al.FUIR:Fusing user and item information to deal with data sparsity by using side information in recommendation systems[J].Journal of Network and Computer Applications,2016,70:41-50.
[51]Seo Y D,Kim Y G,Lee E,et al.Personalized recommender system based on friendship strength in social network services[J].Expert Systems with Applications,2017,69:135-148.
[52]Torres R,McNee S M,Abel M,et al.Enhancing digital libraries with TechLens+[C]//Proceedings of the 4th ACM/IEEE-CS Joint Conference on Digital Libraries,2004:228-236.
[53]Dong R,Tokarchuk L,Ma A.Digging friendship:Paper recommendation in social network[C]//Proceedings of Networking and Electronic Commerce Research Conference(NAEC 2009),2009:21-28.
[54]McNee S M,Kapoor N,Konstan J A.Don’t look stupid:Avoiding pitfalls when recommending research papers[C]//Proceedings of the 2006 20th Anniversary Conference on Computer Supported Cooperative Work,2006:171-180.
[55]Arnold A,Cohen W W.Information extraction as link prediction:Using curated citation networks to improve gene detection[C]//Proceedings of the 4th International Conference on Wireless Algorithms,Systems,and Applications,2009:541-550.
[56]Lee Y C,Yeom J,Song K,et al.Recommendation of research papers in DBpia:A hybrid approach exploiting content and collaborative data[C]//2016 IEEE International Conference on Systems,Man,and Cybernetics(SMC),2016:2966-2971.
[57]Chakraborty T,Krishna A,Singh M,et al.FeRoSA:A faceted recommendation system for scientific articles[C]//Advances in Knowledge Discovery and Data Mining,2016:528-541.
[58]Pan L,Dai X,Huang S,et al.Academic paper recommendation based on heterogeneous graph[C]//Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data.[S.l.]:Springer International Publishing,2015:381-392.
[59]Woodruff A,Gossweiler R,Pitkow J,et al.Enhancing a digital book with a reading recommender[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems,2000:153-160.
[60]劉先紅,李綱.科研社交網(wǎng)絡(luò)的推薦系統(tǒng)對(duì)比分析[J].圖書情報(bào)工作,2016,60(9):116-122.
[61]Xia F,Liu H,Lee I,et al.Scientific article recommendation:Exploiting common author relations and historical preferences[J].IEEE Transactions on Big Data,2016,2(2):101-112.
[62]Zhao W,Wu R,Liu H.Paper recommendation based on the knowledge gap between a researcher’s background knowledge and research target[J].Information Processing&Management,2016,52(5):976-988.
[63]Alotaibi S,Vassileva J.Effect of different implicit social networks on recommending research papers[C]//Conference on User Modeling Adaptation and Personalization,2016:217-221.
[64]Guo Y,Cheng H,Tang M,et al.Kernel based collaborative topic regression for tag recommendation[C]//International Conference on Education,Sports,Arts and Management Engineering,2016.
[65]Wang H,Chen B,Li W J.Collaborative topic regression with social regularization for tag recommendation[C]//International Joint Conference on Artificial Intelligence.[S.l.]:AAAI Press,2013:2719-2725.
[66]Wang H,Li W J.Relational collaborative topic regression for recommender systems[J].IEEE Transactions on Knowledge&Data Engineering,2015,27(5):1343-1355.
[67]陳祖琴,張惠玲,葛繼科,等.基于加權(quán)關(guān)聯(lián)規(guī)則挖掘的相關(guān)文獻(xiàn)推薦[J].現(xiàn)代圖書情報(bào)技術(shù),2007(10):57-61.
[68]Jomsri P.Book recommendation system for digital library based on user profiles by using association rule[C]//2014 Fourth International Conference on Innovative Computing Technology(INTECH),2014:130-134.
[69]Anh V L,Hai V H,Tran H N,et al.SciRecSys:A recommendation system for scientific publication by discovering keyword relationships[C]//International Conference on Computational Collective Intelligence,2014,8733:72-82.
[70]劉旭東,葛俊杰.基于關(guān)聯(lián)規(guī)則的個(gè)性化推薦在數(shù)字圖書館中的應(yīng)用研究[J].德州學(xué)院學(xué)報(bào),2010,26(2):72-76.
[71]Tewari A S,Priyanka K.Book recommendation system based on collaborative filtering and association rule mining for college students[C]//2014 International Conference on Contemporary Computing and Informatics(IC3I),2014:135-138.
[72]Li X,She J.Collaborative variational autoencoder for recommender systems[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2017:305-314.
[73]Wang S,Wang Y,Tang J,et al.What your images reveal:Exploiting visual contents for point-of-interest recommendation[C]//Proceedings of the 26th International Conference on World Wide Web,International World Wide Web Conferences Steering Committee,2017:391-400.
[74]Wu C,Wang J,Liu J,et al.Recurrent neural network based recommendation for time heterogeneous feedback[J].Knowledge-Based Systems,2016,109:90-103.
[75]Shu J,Shen X,Liu H,et al.A content-based recommendation algorithm for learning resources[J].Multimedia Systems,2017:1-11.
[76]He X,Liao L,Zhang H,et al.Neural collaborative filtering[C]//Proceedings of the 26th International Conference on World Wide Web.International World Wide Web Conferences Steering Committee,2017:173-182.
[77]Hassan H A M.Personalized research paper recommendation using deep learning[C]//Proceedings of the 25th Conference on User Modeling,Adaptation and Personalization,2017:327-330.
[78]Wei J,He J,Chen K,et al.Collaborative filtering and deep learning based recommendation system for cold start items[J].Expert Systems with Applications,2017,69:29-39.
[79]Parvatikar S,Joshi B.Online book recommendation system by using collaborative filtering and association mining[C]//2015 IEEE International Conference on Computational Intelligence and Computing Research(ICCIC),2015:1-4.
[80]McNee S M,Albert I,Cosley D,et al.On the recommending of citations for research papers[C]//Proceedings of the ACM Conference on Computer Supported Cooperative Work,2002:116-125.
[81]Wei J,He J,Chen K,et al.Collaborative filtering and deep learning based recommendation system for cold start items[J].Expert Systems with Applications,2017,69:29-39.
[82]Roy D,Ray K,Mitra M.From a scholarly big dataset to a test collection for bibliographic citation recommendation[C]//AAAI Workshop:Scholarly Big Data,2016.
[83]夏秀峰,吳蘭蘭.一種基于商品基因的個(gè)性化推薦模型[J].遼寧大學(xué)學(xué)報(bào):自然科學(xué)版,2009,36(4):329-334.
[84]李瑞敏,閆俊,林鴻飛.基于音樂(lè)基因組的個(gè)性化移動(dòng)音樂(lè)推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(9):27-30.
[85]唐曉波,周詠.基于圖書基因組的個(gè)性化圖書推薦研究[J].圖書館學(xué)研究,2017(2):76-85.