海量學(xué)術(shù)資源個(gè)性化推薦綜述

2018-02-07 01:47劉柏嵩王洋洋

計(jì)算機(jī)工程與應(yīng)用 2018年3期

劉偉，劉柏嵩，王洋洋

1.寧波大學(xué) 信息科學(xué)與工程學(xué)院，浙江寧波 315211

2.寧波大學(xué) 圖書館與信息中心，浙江寧波 315211

1 引言

隨著進(jìn)入大數(shù)據(jù)時(shí)代，海量的學(xué)術(shù)資源（論文、圖書、會(huì)議預(yù)告、學(xué)術(shù)新聞、專利和學(xué)術(shù)博客等）出現(xiàn)在互聯(lián)網(wǎng)上，雖然滿足了用戶對(duì)學(xué)術(shù)資源的基本需求，但是也使得用戶需要花費(fèi)大量的時(shí)間來(lái)獲取對(duì)自己真正有用的學(xué)術(shù)資源，這就是所謂的信息超載問(wèn)題。

目前，大多數(shù)用戶是通過(guò)使用關(guān)鍵字搜索來(lái)解決信息超載問(wèn)題，但由于關(guān)鍵字搜索所固有的局限性導(dǎo)致用戶的多元化和個(gè)性化需求難以得到滿足[1]。人們急需尋找一種更高效的解決方法。

學(xué)術(shù)資源個(gè)性化推薦技術(shù)的發(fā)展為這一問(wèn)題的解決帶來(lái)了突破性進(jìn)展。學(xué)術(shù)資源個(gè)性化推薦是根據(jù)用戶信息描述用戶興趣特征建立用戶興趣模型，根據(jù)學(xué)術(shù)資源描述推薦對(duì)象特征建立推薦對(duì)象模型，然后采用相應(yīng)的推薦算法將用戶興趣模型和推薦對(duì)象模型進(jìn)行匹配，為用戶推薦其感興趣的學(xué)術(shù)資源的一項(xiàng)技術(shù)。學(xué)術(shù)資源推薦流程如圖1所示。

早在20世紀(jì)90年代，人們已經(jīng)開始對(duì)學(xué)術(shù)資源推薦進(jìn)行研究。Giles等人1998年推出第一個(gè)論文推薦系統(tǒng)[2]。亞馬遜推薦系統(tǒng)則是最著名的致力于圖書推薦的系統(tǒng)。而對(duì)于會(huì)議預(yù)告、學(xué)術(shù)新聞、專利和學(xué)術(shù)博客等學(xué)術(shù)資源推薦的研究，目前仍處于空白。

本文以論文和圖書兩類學(xué)術(shù)資源的個(gè)性化推薦相關(guān)研究為研究對(duì)象，根據(jù)學(xué)術(shù)資源個(gè)性化推薦的過(guò)程，對(duì)用戶建模、對(duì)象建模和推薦策略等內(nèi)容進(jìn)行逐步分析，最后對(duì)學(xué)術(shù)資源個(gè)性化推薦未來(lái)研究的重點(diǎn)和發(fā)展方向進(jìn)行大膽的預(yù)測(cè)。

2 學(xué)術(shù)用戶畫像

為了能夠更準(zhǔn)確地進(jìn)行個(gè)性化推薦，那么在推薦之前，需要準(zhǔn)確地描述用戶的興趣特征，刻畫理想的用戶畫像。用戶模型的好壞對(duì)推薦來(lái)說(shuō)至關(guān)重要。在進(jìn)行學(xué)術(shù)用戶畫像的過(guò)程中，要格外注意下面三個(gè)方面的問(wèn)題。

2.1 學(xué)術(shù)用戶類型

只有深入了解用戶，才能建立理想的用戶模型。特別地，在學(xué)術(shù)領(lǐng)域更具特殊性。與商業(yè)領(lǐng)域的推薦不同，在學(xué)術(shù)領(lǐng)域進(jìn)行推薦，用戶的身份對(duì)推薦結(jié)果有極其重要的影響。但是大多數(shù)研究都將用戶的身份等同處理了，這也是目前學(xué)術(shù)推薦領(lǐng)域的一個(gè)缺陷。通過(guò)分析，本文將用戶按照在某一領(lǐng)域或某一研究方向發(fā)表論文數(shù)量分為初級(jí)用戶、中級(jí)用戶和高級(jí)用戶三個(gè)不同科研層次的對(duì)象。

初級(jí)用戶，即將要或剛剛涉足于某一領(lǐng)域或某一研究方向的用戶。對(duì)于初級(jí)用戶而言，理解前沿的文章會(huì)很困難。這一領(lǐng)域的“經(jīng)典文獻(xiàn)”對(duì)他們更加重要，而且能夠給予他們的幫助也更大。

中級(jí)用戶，即在某一領(lǐng)域或某一研究方向初步取得了科研成果的用戶。對(duì)于這些人，不需要刻意為他們推薦“經(jīng)典文獻(xiàn)”，而應(yīng)該根據(jù)他們發(fā)表的論文去判斷他們的興趣和研究方向，為其推薦與他們興趣和研究方向類似的高質(zhì)量的論文或前沿進(jìn)展。

高級(jí)用戶，即在某一領(lǐng)域或某一研究方向已經(jīng)取得巨大的研究成果，已經(jīng)可以說(shuō)是這一領(lǐng)域權(quán)威性專家的用戶。對(duì)于高級(jí)用戶，他們喜歡在不同領(lǐng)域的科研成果的碰撞中觸類旁通，得到新的靈感。為他們推薦的學(xué)術(shù)資源需要更注重該領(lǐng)域的前沿進(jìn)展，或者推薦其他相關(guān)領(lǐng)域的高質(zhì)量的科研成果。

對(duì)于中級(jí)用戶和高級(jí)用戶，還存在一種特殊情況。他們關(guān)注某一感興趣的科研人員，對(duì)這一科研人員發(fā)布的任何信息，他們都想要去獲取。針對(duì)這種情況，需要個(gè)性化推薦策略能夠建立“權(quán)威專家”，這能夠更加凸顯推薦的個(gè)性化。

不僅如此，在這些用戶中，還存在一批特殊的用戶，即企業(yè)的科研人員。這些人注重于專利。這要求推薦策略能夠準(zhǔn)確地定位用戶身份。

2.2 興趣特征獲取和描述

首先，用戶興趣特征的獲取分為顯式獲取和隱式獲取兩種。

顯式獲取興趣特征的方法一般就是收集用戶的基本信息，如姓名、年齡、受教育程度、職業(yè)、用戶自己選擇的學(xué)科或領(lǐng)域或者用戶自己輸入代表興趣的關(guān)鍵詞。這種方法簡(jiǎn)單、直接，而且往往比較可靠。但是，這一方法靈活性差，表述存在異質(zhì)性，用戶興趣改變需要手動(dòng)更改，導(dǎo)致這一方法的時(shí)效性和準(zhǔn)確性難以保證。此外，在學(xué)術(shù)領(lǐng)域，用戶往往也是生產(chǎn)者，能夠通過(guò)挖掘用戶發(fā)表過(guò)的文章，對(duì)其進(jìn)行特征描述[3]。

隱式獲取興趣特征的方法就是通過(guò)跟蹤用戶的行為，然后根據(jù)用戶“互動(dòng)”（收藏[4-5]、打標(biāo)簽[6]、下載[7]、閱讀和瀏覽[8]或引用[9]等行為）的對(duì)象推測(cè)用戶的興趣偏好。即，對(duì)用戶“互動(dòng)”的論文提取關(guān)鍵詞進(jìn)行分析，推測(cè)用戶的興趣。這種方法減少了用戶不必要的負(fù)擔(dān)。缺點(diǎn)就是會(huì)產(chǎn)生大量的計(jì)算。

圖1 學(xué)術(shù)資源推薦流程

其次，通過(guò)TF-IDF處理關(guān)鍵詞描述用戶興趣特征是最流行的方案。也有人提出用標(biāo)簽、興趣本體、領(lǐng)域知識(shí)、用戶背景、學(xué)習(xí)目標(biāo)和認(rèn)知模式等[10-13]各方面來(lái)描述用戶的興趣特征。

另外對(duì)于用戶特征描述，不僅要考慮用戶的長(zhǎng)期興趣偏好，還要考慮用戶的短期興趣偏好。目前在學(xué)術(shù)領(lǐng)域，大多數(shù)都是建立的靜態(tài)模型，只關(guān)注了用戶的長(zhǎng)期興趣，對(duì)于短期興趣的關(guān)注還是比較少的。用戶興趣和需求的變化是影響用戶特征描述的重要因素[14]。

2.3 學(xué)術(shù)用戶建模

學(xué)術(shù)用戶建模方法主要有基于向量的建模、基于主題模型的建模及基于本體的建模。

（1）基于向量的建模

基于向量的建模是指利用一組特征詞的向量表示用戶興趣偏好模型。其中，特征詞可以是用戶的元數(shù)據(jù)信息，也可以是用戶的行為數(shù)據(jù)信息。單純采用特征詞描述的方法無(wú)法準(zhǔn)確描述用戶偏好。為了克服基于向量建模的這一缺陷，基于詞頻-逆文檔頻率（TF-IDF）[15]的向量表示法是一種改進(jìn)的建模法。該方法賦予特征相應(yīng)的權(quán)值，對(duì)出現(xiàn)頻率高的特征賦予較高權(quán)值，出現(xiàn)頻率低的特征賦予較低權(quán)值。此方法法可反映每種特征的重要程度，是目前比較流行的描述用戶興趣方案。

（2）基于主題模型的建模

（3）基于本體的建模

本體[18]是對(duì)客觀世界中抽象出來(lái)的某些概念的明確的形式化描述，它包含了事物的種類、性質(zhì)等信息并且反映出事物間的關(guān)系?；诒倔w的建?；舅枷胧峭ㄟ^(guò)一個(gè)本體概念向量來(lái)描述用戶興趣特征，模型通常是樹形層次結(jié)構(gòu)的組織形式，樹的一個(gè)節(jié)點(diǎn)代表用戶的一個(gè)興趣類。

3 學(xué)術(shù)資源建模

不同的領(lǐng)域，推薦對(duì)象不同，如何對(duì)推薦對(duì)象進(jìn)行建模也是一個(gè)重要的問(wèn)題。

3.1 文本類型學(xué)術(shù)資源建模

學(xué)術(shù)資源主要是文本類型的，在描述推薦對(duì)象方面，主要有兩大類方法，基于內(nèi)容的方法和基于分類的方法。

3.1.1 基于內(nèi)容的方法

目前，文本類對(duì)象特征提取技術(shù)相對(duì)比較成熟，在學(xué)術(shù)領(lǐng)域，大多數(shù)都是采用基于內(nèi)容的方法從推薦對(duì)象本身進(jìn)行特征提取，用提取的特征詞來(lái)進(jìn)行對(duì)象建模。

這些建模方法主要分為兩種，一種是使用簡(jiǎn)單的詞語(yǔ)作為特征詞描述對(duì)象特征。這些方法中有些方法直接使用索引詞[6，19]、主題詞[20]，以及從通過(guò)潛伏狄里克雷分類[21]或機(jī)器學(xué)習(xí)生成的文獻(xiàn)參考語(yǔ)料庫(kù)（ACL或ARC）中引用的概念詞[21]作為特征詞。另一種是通過(guò)提取特征詞描述對(duì)象特征。這些特征詞主要是從標(biāo)題[22]、摘要[20，23-24]、引言[25]、介紹[26]、前言[26]、作者提供的關(guān)鍵詞[23，26-27]和參考書目[28]以及論文的正文[19，29]等內(nèi)容中提取的。有一些方法也會(huì)從外部來(lái)源如社會(huì)標(biāo)簽[27]，ACM分類樹和DMOZ目錄[30-31]和引文上下文[24，29]等內(nèi)容中提取特征詞。

此外，還有一些方法是利用非文本特征進(jìn)行推薦。例如：利用引用特征的CC-IDF方法[25]或者改進(jìn)的CCIDF方法[4，28]，以及利用共同作者的數(shù)量的推薦方法[32]。

川酒生態(tài)釀造的產(chǎn)品需要通過(guò)生態(tài)化的方式來(lái)消費(fèi)[18]。生態(tài)消費(fèi)是一種綠化的或生態(tài)化的消費(fèi)模式，它是指既符合物質(zhì)生產(chǎn)的發(fā)展水平，又符合生態(tài)生產(chǎn)的發(fā)展水平，既能滿足人的消費(fèi)需求，又不對(duì)生態(tài)環(huán)境造成危害的一種消費(fèi)行為[19]。目前，相關(guān)研究已發(fā)現(xiàn)白酒中存在大量的健康因子?！斑m量飲酒，有益健康”已是所有白酒行業(yè)的共識(shí)[20]。川酒行業(yè)目前正積極引導(dǎo)消費(fèi)者生態(tài)消費(fèi)，提倡一種健康、文明、和諧的飲酒方式，在川酒的消費(fèi)過(guò)程中加入生態(tài)的理念，將飲酒過(guò)程轉(zhuǎn)變?yōu)樯鷳B(tài)消費(fèi)過(guò)程。同時(shí)，生態(tài)釀酒產(chǎn)業(yè)的發(fā)展為白酒的生態(tài)消費(fèi)提供了強(qiáng)有力的技術(shù)支撐[21]。

對(duì)于一些特殊的論文，也需要采用一些特殊的方法進(jìn)行描述。比如，“經(jīng)典論文”的推薦。這類論文不會(huì)因?yàn)闀r(shí)間而沉寂。利用下載持久性原則和引用傳遞性原則[33]就能夠很好地區(qū)分出這些論文?！敖?jīng)典論文”的推薦還能夠在一定程度上解決用戶冷啟動(dòng)問(wèn)題[34]。

3.1.2 基于分類的方法

基于分類的方法是通過(guò)利用文本分類的方法將推薦對(duì)象分到不同的類別（如：學(xué)科）中，然后將同類的對(duì)象推薦給對(duì)此類對(duì)象感興趣的用戶。文本分類技術(shù)也比較成熟，此類方法有很多種，例如樸素貝葉斯（Naiva-Bayes），k最近鄰方法（KNN），支持向量機(jī)（SVM）和深度神經(jīng)網(wǎng)絡(luò)（DNN）等。使用基于分類的方法進(jìn)行推薦對(duì)象建模，可以預(yù)先定義推薦對(duì)象的類別，也可以利用聚類技術(shù)自動(dòng)產(chǎn)生[35]。

3.2 其他類型學(xué)術(shù)資源建模

隨著計(jì)算機(jī)科學(xué)技術(shù)和信息技術(shù)的發(fā)展，學(xué)術(shù)資源除了文本類型之外，還有圖片、圖像、影像、語(yǔ)音等多種形式。利用傳統(tǒng)的推薦算法進(jìn)行資源推薦，主要用到資源對(duì)象的描述信息，這些信息通常是由人工設(shè)計(jì)[36]，將顏色、形狀、紋理和結(jié)構(gòu)轉(zhuǎn)化為單一全局表達(dá)來(lái)描述資源內(nèi)容。隨著深度神經(jīng)網(wǎng)絡(luò)取得突破性進(jìn)展，近年來(lái)大部分研究使用主題模型（LDA），或者使用基于深度學(xué)習(xí)模型的方法進(jìn)行推薦[37]。

4 學(xué)術(shù)資源個(gè)性化推薦的推薦策略

推薦策略是整個(gè)推薦流程中最關(guān)鍵的模塊，一個(gè)推薦策略的優(yōu)劣直接決定了最后推薦結(jié)果的好壞。截止到目前為止，被提出的推薦策略有很多。經(jīng)過(guò)分析，學(xué)術(shù)資源個(gè)性化推薦策略基本上包括以下幾類：基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦、基于社交網(wǎng)絡(luò)的推薦、基于關(guān)聯(lián)規(guī)則的推薦、混合推薦、基于深度學(xué)習(xí)的推薦。

4.1 基于內(nèi)容的推薦

基于內(nèi)容的推薦（Content-based Recommendation）也叫基于內(nèi)容的過(guò)濾（Content-based Filtering，CBF），是應(yīng)用于學(xué)術(shù)資源推薦領(lǐng)域最主要的推薦策略[38]?；趦?nèi)容的推薦方法最早是應(yīng)用于信息獲取領(lǐng)域[39]。該方法的主要思想是根據(jù)用戶的交互項(xiàng)目，從推薦對(duì)象中選擇與用戶交互項(xiàng)目相似的對(duì)象作為推薦結(jié)果。此方法適用于所有類型學(xué)術(shù)資源的個(gè)性化推薦。

現(xiàn)有基于內(nèi)容的學(xué)術(shù)資源推薦算法更多是注重分析學(xué)術(shù)資源內(nèi)容屬性進(jìn)行推薦的，如Wang等人基于學(xué)術(shù)資源內(nèi)容，結(jié)合權(quán)威性、受歡迎程度和新鮮度等資源特性為用戶推薦學(xué)術(shù)資源[40]；Younus等人則是基于資源內(nèi)容將其主題模型用于微博數(shù)據(jù)，向初級(jí)研究者推薦其研究領(lǐng)域的最新科技論文[41]。

更深層的學(xué)術(shù)資源推薦算法是結(jié)合學(xué)術(shù)資源屬性特征構(gòu)建用戶模型，Guan等人通過(guò)合并元數(shù)據(jù)，如標(biāo)題、關(guān)鍵字、摘要和引用來(lái)加強(qiáng)科學(xué)文獻(xiàn)的語(yǔ)義信息，使用每個(gè)術(shù)語(yǔ)的tf-idf值來(lái)為每個(gè)科學(xué)文獻(xiàn)建模，并使用不同權(quán)重的主題詞向量來(lái)構(gòu)造用戶興趣模型，以提升推薦的準(zhǔn)確性[42]。

基于內(nèi)容的推薦策略存在兩個(gè)關(guān)鍵部分：一個(gè)是用戶互動(dòng)對(duì)象的確定；另一個(gè)是互動(dòng)對(duì)象的內(nèi)容特征描述。

用戶和對(duì)象之間的“互動(dòng)”通常就是用戶行為[43]。

關(guān)于內(nèi)容特征的描述，采用基于內(nèi)容的方法。但是提取特征詞的過(guò)程中會(huì)存在一個(gè)問(wèn)題，從論文不同區(qū)域提取的特征詞權(quán)重是不相同的[44]。例如，標(biāo)題中出現(xiàn)的特征詞通常比正文中出現(xiàn)的特征詞更有意義。

基于內(nèi)容推薦的優(yōu)點(diǎn)如下：

（1）不需要評(píng)分?jǐn)?shù)據(jù)，不存在數(shù)據(jù)稀疏性問(wèn)題。

（2）對(duì)于新對(duì)象也不存在冷啟動(dòng)問(wèn)題。

（3）擁有比較成熟的分類學(xué)習(xí)算法為該策略提供技術(shù)支持。

（4）能夠自動(dòng)創(chuàng)建用戶模型，不需要大量的前期分類工作。

該方法也存在不能推薦跨領(lǐng)域跨學(xué)科的學(xué)術(shù)資源[45]、計(jì)算量大等不足。此外，這類方法比較注重資源的推薦，一般采用在某一個(gè)周期以主題、期刊的方式進(jìn)行推送，商業(yè)數(shù)據(jù)庫(kù)之間的資源需要分別推薦，百度學(xué)術(shù)目前雖然做到整合類期刊、圖書資源以主題訂閱的方式進(jìn)行推送，也未能實(shí)現(xiàn)對(duì)用戶進(jìn)行個(gè)性化、實(shí)時(shí)推薦。另外這些研究主要基于關(guān)鍵詞的向量空間模型或者主題模型描述項(xiàng)目和用戶興趣特征，向量空間模型往往并不能準(zhǔn)確地反映有關(guān)用戶興趣和偏好的語(yǔ)義范疇信息。并且，在面向多類型學(xué)術(shù)資源的場(chǎng)景中，不同類型學(xué)術(shù)資源的主題模型有所區(qū)別，傳統(tǒng)基于內(nèi)容的學(xué)術(shù)資源個(gè)性化推薦顯得適應(yīng)性不足。

4.2 協(xié)同過(guò)濾推薦

協(xié)同過(guò)濾推薦（Collaborative Filtering Recommendation，CF）在個(gè)性化推薦領(lǐng)域是最成功的策略?；纠碚撌牵脩粝矚g具有相同興趣的用戶喜歡的東西，當(dāng)兩位用戶評(píng)價(jià)相同項(xiàng)目時(shí)，兩位用戶被認(rèn)為是具有有相同興趣的。當(dāng)具有相同興趣的用戶被識(shí)別時(shí)，將一個(gè)用戶感興趣的項(xiàng)目推薦給其他用戶，反之亦然[46]。此方法適用于存在大量用戶行為數(shù)據(jù)時(shí)的學(xué)術(shù)資源推薦。

在學(xué)術(shù)推薦領(lǐng)域，協(xié)同過(guò)濾的應(yīng)用要比基于內(nèi)容的推薦少。出現(xiàn)這種情況的主要原因是CF需要用戶的參與，但在學(xué)術(shù)推薦領(lǐng)域用戶參與的動(dòng)力往往不足[8，47]。這種情況造成了“冷啟動(dòng)”問(wèn)題，這種問(wèn)題可能發(fā)生在以下幾種情況中：（1）新用戶，一個(gè)新的用戶打分的項(xiàng)目很少或沒(méi)有，找不到有相同興趣的用戶。（2）新項(xiàng)目，項(xiàng)目是新的，還沒(méi)有被至少一個(gè)用戶打分。（3）新社區(qū)或?qū)W科，一個(gè)新的社區(qū)，用戶對(duì)項(xiàng)目打分的動(dòng)力很少，導(dǎo)致的結(jié)果就是沒(méi)有用戶對(duì)項(xiàng)目打分。

在基于協(xié)同過(guò)濾的資源推薦領(lǐng)域中，主要是基于傳統(tǒng)協(xié)同過(guò)濾算法進(jìn)行資源推薦工作，Yu等人基于用戶閱讀文獻(xiàn)的語(yǔ)義分析建立用戶文檔，通過(guò)傳統(tǒng)協(xié)同過(guò)濾方法找到相似的用戶文檔并預(yù)測(cè)用戶興趣，實(shí)現(xiàn)個(gè)性化推薦[48]。這類推薦算法的準(zhǔn)確性容易受到數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題的影響，為此Kai等人通過(guò)融合用戶評(píng)分項(xiàng)目和用戶評(píng)分項(xiàng)目的類型計(jì)算用戶相似度，并設(shè)計(jì)了相應(yīng)的協(xié)同過(guò)濾算法來(lái)提高推薦結(jié)果的準(zhǔn)確性[49]；Niu等人利用三種不同類型信息（users，items，user-items）應(yīng)對(duì)數(shù)據(jù)稀疏問(wèn)題，并預(yù)測(cè)項(xiàng)目評(píng)分，產(chǎn)生高質(zhì)量的推薦結(jié)果[50]；Seo等人提出融入朋友間親密關(guān)系到推薦模型中，為同興趣主題下的新用戶推薦資源[51]。

協(xié)同過(guò)濾推薦的優(yōu)點(diǎn)：

（1）不需要對(duì)推薦對(duì)象進(jìn)行容錯(cuò)處理[52]。

（2）考慮了推薦對(duì)象的質(zhì)量[53]。

（3）能夠發(fā)現(xiàn)用戶新的興趣點(diǎn)[54]。

（4）不需要專業(yè)知識(shí)對(duì)學(xué)術(shù)資源進(jìn)行分類。

（5）用戶越多，性能越好。

協(xié)同過(guò)濾推薦研究在兩個(gè)方面存在明顯不足。一方面，這些研究主要利用用戶的顯式和隱式行為數(shù)據(jù)進(jìn)行用戶興趣建模，容易出現(xiàn)數(shù)據(jù)稀疏問(wèn)題；另一方面，這些研究往往基于靜態(tài)的場(chǎng)景，在用戶數(shù)據(jù)不斷更新、用戶需求不斷變化的情況下，難以應(yīng)對(duì)學(xué)術(shù)資源在線移動(dòng)推薦的真實(shí)需求。

4.3 基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦

基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦策略不考慮用戶和推薦對(duì)象的內(nèi)容，而是把用戶和推薦對(duì)象抽象為節(jié)點(diǎn)，而用戶選擇了某一推薦對(duì)象就會(huì)在用戶和對(duì)象之間存在選擇關(guān)系，此策略認(rèn)為信息就隱藏在這種選擇關(guān)系中。此方法不僅能夠利用單類型數(shù)據(jù)進(jìn)行推薦，而且能夠利用多類型異構(gòu)信息進(jìn)行推薦。

該策略的基本思想：通過(guò)學(xué)術(shù)資源之間存在的固有聯(lián)系，構(gòu)建圖形網(wǎng)絡(luò)，展示學(xué)術(shù)資源之間是如何連接的。建立圖形網(wǎng)絡(luò)后，使用網(wǎng)絡(luò)來(lái)查找推薦候選項(xiàng)目。通常，輸入一篇或多篇論文，然后根據(jù)這些輸入的論文構(gòu)建圖形網(wǎng)絡(luò)，在圖形網(wǎng)絡(luò)中進(jìn)行隨機(jī)游走找出最受歡迎的項(xiàng)目[23]。

圖形網(wǎng)絡(luò)中包含作者[22，55]、用戶/客戶[26]、場(chǎng)景[22]、關(guān)鍵詞和特征詞[22，55]、論文發(fā)表年份[22]。根據(jù)圖形網(wǎng)絡(luò)中的實(shí)體，實(shí)體之間的聯(lián)系可以是引用[22，56]購(gòu)買[26]，“發(fā)表在”關(guān)系[22]，共同作者[55]，特征詞之間的相關(guān)性[55]，或者論文中特征詞的同現(xiàn)關(guān)系[22]。例如，Chakraborty等人在由查詢文獻(xiàn)的引用和內(nèi)容相似屬性構(gòu)成的感應(yīng)子網(wǎng)上建立隨機(jī)游走基礎(chǔ)框架，向用戶推薦某些類別的科技論文[57]；Pan等人則是基于引用關(guān)系和學(xué)科內(nèi)容知識(shí)構(gòu)建異構(gòu)圖，采用一種基于圖的相似性學(xué)習(xí)算法實(shí)現(xiàn)學(xué)術(shù)論文推薦[58]。另外，一些作者還根據(jù)非固有關(guān)系進(jìn)行實(shí)體的連接。例如，文本相似性[26，59]。此外，有的連接是基于屬性相似性，書目耦合，共引用強(qiáng)度[26，59]或人口統(tǒng)計(jì)學(xué)相似性[26]。

基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦的優(yōu)點(diǎn)：能夠推薦較偏門領(lǐng)域的學(xué)習(xí)資源；能夠部分地解決學(xué)術(shù)資源數(shù)據(jù)稀疏性問(wèn)題。至于該策略的缺點(diǎn)：存在重復(fù)屬性，這會(huì)影響推薦的精確度。

4.4 基于社交關(guān)系的推薦

基于社交關(guān)系的推薦是把社交網(wǎng)絡(luò)分析理論應(yīng)用于推薦系統(tǒng)的一類方法?；谏缃魂P(guān)系的推薦是一個(gè)特別注重協(xié)同關(guān)系的個(gè)性化推薦策略。在個(gè)性化推薦中，用戶之間的關(guān)系是非常能凸顯用戶興趣特征的因素，但是在傳統(tǒng)的個(gè)性化推薦算法中，將所有的用戶都是等同看待的，這種處理方式忽略了用戶間真實(shí)的社交關(guān)系。對(duì)于學(xué)術(shù)資源的推薦來(lái)說(shuō)，其本身就具有一定的特殊性，比如，用戶在學(xué)術(shù)社交網(wǎng)絡(luò)中的朋友，可能是自己的學(xué)生，可能是自己科研團(tuán)隊(duì)中的成員，還有可能是自己關(guān)注領(lǐng)域的權(quán)威人物，這就使得不同人相關(guān)的學(xué)術(shù)資料對(duì)于用戶的價(jià)值是不一樣的。這種真實(shí)的社交關(guān)系對(duì)于學(xué)術(shù)資源的個(gè)性化推薦影響更大。

在學(xué)術(shù)領(lǐng)域，基于社交關(guān)系的推薦是利用用戶的學(xué)術(shù)關(guān)系，屬于基于作者的推薦?；谧髡哌M(jìn)行學(xué)術(shù)資源推薦的對(duì)象主要是科研文獻(xiàn)，通過(guò)科研社交網(wǎng)絡(luò)或者論文中的共著關(guān)系、引用關(guān)系等信息，挖掘研究興趣相似的科研人員，并相互推薦研究相關(guān)的科研文獻(xiàn)。劉先紅等利用科研社交網(wǎng)絡(luò)推薦系統(tǒng)向科研人員推送個(gè)性化信息解決信息過(guò)載問(wèn)題[60]。基于作者的推薦方法，一方面基于作者、社交信息和共引關(guān)系等進(jìn)行學(xué)術(shù)資源推薦，例如，Xia等人基于研究人員經(jīng)常搜索同一作者發(fā)表的文章，提出通過(guò)對(duì)文章之間的共同作者關(guān)系信息來(lái)確定推薦的目標(biāo)研究者，提升推薦效果[61]；Zhao等人通過(guò)彌合作者背景知識(shí)和研究目標(biāo)之間的知識(shí)差距為研究人員推薦有用的資源[62]；Alotaibi等基于隱式科研社交網(wǎng)絡(luò)關(guān)系，共同讀者關(guān)系和標(biāo)簽行為關(guān)系提出三種個(gè)性化論文推薦算法[63]。另一方面，結(jié)合模型和社交關(guān)系進(jìn)行學(xué)術(shù)資源推薦，例如，Guo等提出基于核的協(xié)同主題回歸模型，利用高斯過(guò)程和核函數(shù)捕捉數(shù)據(jù)之間的非線性社交關(guān)系為用戶推薦論文標(biāo)簽[64]；Wang等基于經(jīng)典的論文推薦模型CTR（Collaborative Topic Regression）[65]，隨后Wang等基于CTR模型又提出一種新的貝葉斯層次模型RCTR（Relational Collaborative Topic Regression）[66]，引入論文之間的社交網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系為科研人員推薦論文標(biāo)簽。

基于社交關(guān)系推薦能夠提供更加個(gè)性化的推薦結(jié)果。但是這方面的研究都是通過(guò)社交網(wǎng)絡(luò)個(gè)人信息和科研文獻(xiàn)中信息，構(gòu)建作者的研究興趣模型，并根據(jù)該模型推薦相關(guān)文獻(xiàn)，但是如果用戶之前沒(méi)有發(fā)表過(guò)文章，則無(wú)法有效建立該用戶的研究興趣模型。而且用戶的論文發(fā)表主題也具有一定的隨機(jī)性和可變性。此方法適用于基于作者的學(xué)術(shù)資源個(gè)性化推薦。

4.5 基于關(guān)聯(lián)規(guī)則的推薦

關(guān)聯(lián)規(guī)則是一種非常有效的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)，是描述兩個(gè)或者多個(gè)對(duì)象之間某種潛在的特征關(guān)系規(guī)則。它的基本思想是從大量的數(shù)據(jù)中挖掘出能夠描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有價(jià)值的知識(shí)。關(guān)聯(lián)規(guī)則的推薦大致分為兩個(gè)步驟，第一步，挖掘及制定一系列的規(guī)則，然后利用規(guī)則來(lái)分析計(jì)算資源間的關(guān)聯(lián)性；第二步，通過(guò)分析用戶的行為及偏好，然后根據(jù)事先制定的規(guī)則向用戶進(jìn)行推薦。此方法能夠通過(guò)關(guān)聯(lián)規(guī)則挖掘用戶和學(xué)術(shù)資源的潛在關(guān)系進(jìn)行個(gè)性化推薦。

學(xué)術(shù)資源的關(guān)聯(lián)挖掘指的是利用用戶的歷史訪問(wèn)記錄來(lái)發(fā)現(xiàn)資源之間的關(guān)系，從而完成信息的推薦服務(wù)[67]。也有直接挖掘用戶資料的關(guān)聯(lián)規(guī)則進(jìn)行推薦[68]。例如，Anh等人利用馬爾可夫鏈模型發(fā)現(xiàn)關(guān)鍵字之間的各類關(guān)聯(lián)關(guān)系，并將關(guān)鍵字作為基本元素向用戶推薦更多該主題下的論文[69]。

關(guān)聯(lián)規(guī)則推薦的優(yōu)點(diǎn)：

（1）不需要領(lǐng)域的相關(guān)知識(shí)，能夠挖掘用戶潛在的興趣點(diǎn)。

（2）能夠發(fā)現(xiàn)不同領(lǐng)域的學(xué)術(shù)資源之間的關(guān)聯(lián)，提供新鮮的資源推薦。

關(guān)聯(lián)規(guī)則推薦的缺點(diǎn)：

（1）運(yùn)算性能問(wèn)題。

（2）推薦的個(gè)性化程度比較差。

（3）關(guān)聯(lián)規(guī)則側(cè)重于發(fā)現(xiàn)不同類別的對(duì)象之間的關(guān)聯(lián)。

4.6 混合推薦

各種推薦方法都有各自的優(yōu)缺點(diǎn)。在實(shí)際應(yīng)用中可以針對(duì)具體問(wèn)題采用推薦策略的組合進(jìn)行推薦，即所謂的組合推薦。組合推薦的目的是通過(guò)組合不同的推薦策略，達(dá)到揚(yáng)長(zhǎng)避短的目的，從而產(chǎn)生更符合用戶需求的推薦。根據(jù)應(yīng)用場(chǎng)景的不同，這種組合方法也會(huì)不同，目前主要的混合方式可以分成兩種：

（1）推薦結(jié)果進(jìn)行組合：這是一種最簡(jiǎn)單的混合方法，分別用兩種或兩種以上的推薦方法產(chǎn)生推薦結(jié)果，然后采用某種算法把推薦結(jié)果進(jìn)行混合而得到最終推薦[56]。

（2）推薦算法進(jìn)行組合：將兩種或多種推薦策略進(jìn)行組合以實(shí)現(xiàn)個(gè)性化推薦[70-71]。

4.7 基于深度學(xué)習(xí)的推薦

近幾年來(lái)，深度學(xué)習(xí)在語(yǔ)音識(shí)別、圖像分析和自然語(yǔ)言處理等方面取得了革命性的進(jìn)展。同時(shí)，最近的研究表明，深度學(xué)習(xí)能夠有效地解決信息檢索和推薦方面的難題。將深度學(xué)習(xí)技術(shù)應(yīng)用到推薦系統(tǒng)中，由于其先進(jìn)的性能和高質(zhì)量的推薦促進(jìn)了推薦系統(tǒng)的發(fā)展。與傳統(tǒng)的推薦模式相比，深度學(xué)習(xí)能夠更深層次的理解用戶需求、項(xiàng)目特性以及用戶與項(xiàng)目之間的隱式關(guān)系。

在個(gè)性化推薦過(guò)程中，利用自編碼器[72]對(duì)用戶或項(xiàng)目相關(guān)的信息（包括行為數(shù)據(jù)和文本、圖像等信息）進(jìn)行重構(gòu)學(xué)習(xí)到用戶或項(xiàng)目的隱式特征，然后基于這些隱式特征預(yù)測(cè)用戶對(duì)項(xiàng)目的偏好，能夠有效提高用戶對(duì)推薦結(jié)果的滿意度。卷積神經(jīng)網(wǎng)絡(luò)[73]能夠從圖像、文本、音頻等內(nèi)容中提取項(xiàng)目的隱式特征，然后利用用戶隱式特征為用戶推薦學(xué)術(shù)資源。循環(huán)神經(jīng)網(wǎng)絡(luò)[74]主要是用來(lái)建模數(shù)據(jù)之間的序列影響，從而幫助獲取更有效的用戶和項(xiàng)目的潛在關(guān)系。例如，CNN用于文本信息中預(yù)測(cè)潛在因素[75]，有助于提高對(duì)于隱性特征提取的準(zhǔn)確度。DNNs能夠改進(jìn)協(xié)同過(guò)濾算法中存在的矩陣分解的內(nèi)積可能不足以描述隱含特征的復(fù)雜結(jié)構(gòu)的問(wèn)題[76]。循證神經(jīng)網(wǎng)絡(luò)（RNNs）能夠發(fā)現(xiàn)論文的連續(xù)和潛在的語(yǔ)義特征，提高推薦質(zhì)量[77]。Wei等人則通過(guò)深度神經(jīng)網(wǎng)絡(luò)抽取項(xiàng)目特征來(lái)預(yù)測(cè)冷啟動(dòng)項(xiàng)目評(píng)分，有效地解決了冷啟動(dòng)問(wèn)題[78]。

基于深度學(xué)習(xí)的推薦能夠大大提高系統(tǒng)的自動(dòng)化程度和可擴(kuò)展性，但是只能緩解推薦系統(tǒng)存在的冷啟動(dòng)和數(shù)據(jù)稀疏性問(wèn)題，而不能完全解決冷啟動(dòng)和數(shù)據(jù)稀疏性問(wèn)題。

5 學(xué)術(shù)資源個(gè)性化推薦研究的重點(diǎn)總結(jié)和趨勢(shì)預(yù)測(cè)

在商業(yè)領(lǐng)域，個(gè)性化推薦技術(shù)經(jīng)過(guò)多年的發(fā)展，日漸成熟。但是，在學(xué)術(shù)領(lǐng)域，學(xué)術(shù)資源的個(gè)性化推薦可以說(shuō)是才剛剛起步。下面針對(duì)相關(guān)方面的問(wèn)題進(jìn)行大膽的總結(jié)和預(yù)測(cè)。

5.1 學(xué)術(shù)個(gè)性化推薦相關(guān)問(wèn)題總結(jié)

（1）對(duì)會(huì)議預(yù)告、專利、學(xué)術(shù)博客和學(xué)術(shù)新聞的個(gè)性化推薦

目前學(xué)術(shù)資源個(gè)性化推薦的研究，關(guān)注點(diǎn)只是在論文和圖書兩方面，而對(duì)于會(huì)議預(yù)告、專利、學(xué)術(shù)博客和學(xué)術(shù)新聞等學(xué)術(shù)資源的個(gè)性化推薦的研究還處于空白期。不同的科研人員所需的資源不同，例如，企業(yè)的科研人員需要專利，權(quán)威專家需要學(xué)術(shù)新聞等。

（2）相似度計(jì)算方法評(píng)估

基本的相似度計(jì)算方法：皮爾森相關(guān)性、余弦距離、歐式距離和基于Log似然的相似性等相似度計(jì)算方法；協(xié)同過(guò)濾推薦中最流行的描述隱含特征間相互影響的協(xié)同過(guò)濾技術(shù)——矩陣分解等。使用不同的計(jì)算方法會(huì)產(chǎn)生不同的效果，目前沒(méi)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn)，無(wú)法定性各種計(jì)算方法的好壞。

（3）數(shù)據(jù)稀疏性問(wèn)題和冷啟動(dòng)問(wèn)題

目前，解決數(shù)據(jù)稀疏性問(wèn)題的方法主要有兩種：一種是人工填補(bǔ)數(shù)據(jù)[47]；另一種就是混合推薦[79]?？朔鋯?dòng)問(wèn)題，主要有兩種解決方式。一種是通過(guò)用戶和項(xiàng)目之間的互動(dòng)推斷隱含評(píng)分然后進(jìn)行推薦[7-8，80]。另一種就是利用混合推薦的推薦方法[79]。此外，CF方法和神經(jīng)網(wǎng)絡(luò)的緊耦合對(duì)于冷啟動(dòng)項(xiàng)目推薦非常有效[81]。

在學(xué)術(shù)領(lǐng)域的推薦中，數(shù)據(jù)稀疏性和冷啟動(dòng)問(wèn)題比商業(yè)領(lǐng)域更加嚴(yán)重，可以說(shuō)是學(xué)術(shù)資源個(gè)性化推薦的兩個(gè)頭號(hào)難題。包括經(jīng)典協(xié)同過(guò)濾算法和新出現(xiàn)的基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法都存在這樣的問(wèn)題。雖然，很多研究嘗試解決，但這些辦法只是治標(biāo)不治本，無(wú)法徹底根除。

（4）多語(yǔ)種的學(xué)術(shù)資源推薦

現(xiàn)有的學(xué)術(shù)資源推薦都是單語(yǔ)種的推薦（中文學(xué)術(shù)資源推薦或英文學(xué)術(shù)資源推薦），還沒(méi)有出現(xiàn)一種跨語(yǔ)種的學(xué)術(shù)資源推薦方法。

（5）推薦算法評(píng)估方法

在過(guò)去的20多年中，關(guān)于研究學(xué)術(shù)推薦算法的論文發(fā)表了200多篇，但是，沒(méi)有明確的結(jié)果表示哪種算法是最好的[82]。歸根結(jié)底，就是缺乏有標(biāo)準(zhǔn)化的評(píng)估方案。

5.2 學(xué)術(shù)個(gè)性化推薦研究的趨勢(shì)預(yù)測(cè)

（1）“學(xué)術(shù)基因”的研究

目前，對(duì)于提高個(gè)性化推薦的準(zhǔn)確率和滿意度，都是在兩個(gè)方面進(jìn)行研究：一方面是改進(jìn)關(guān)鍵字提取技術(shù)；另一方面是加入社交關(guān)系。但是對(duì)于如何描述用戶和推薦對(duì)象的特征的研究進(jìn)展不大。在其他領(lǐng)域的推薦方面，提出了“基因”這一概念改進(jìn)推薦對(duì)象的特征描述，進(jìn)而提高推薦的準(zhǔn)確度。例如，“商品基因”[83]、“音樂(lè)基因”[84]、“圖書基因”[85]。學(xué)術(shù)資源也可以引入“學(xué)術(shù)基因”提高推薦性能。所以，“學(xué)術(shù)基因”的研究應(yīng)該得到更多的關(guān)注。

（2）多維度用戶畫像

隨著用戶在多種類型學(xué)術(shù)資源上的行為數(shù)據(jù)規(guī)模不斷增大，類型也越來(lái)越多樣化，其內(nèi)在的特征維度越來(lái)越高、信息內(nèi)容越來(lái)越豐富、關(guān)聯(lián)關(guān)系也越來(lái)越復(fù)雜，這對(duì)于表征和刻畫學(xué)術(shù)用戶的興趣偏好帶來(lái)巨大的挑戰(zhàn)。傳統(tǒng)的學(xué)術(shù)用戶畫像建模通常通過(guò)社交網(wǎng)絡(luò)個(gè)人信息和科研文獻(xiàn)信息等淺層特征建模用戶畫像，而忽略用戶行為數(shù)據(jù)中的顯隱性特征，忽略了學(xué)術(shù)用戶瀏覽學(xué)術(shù)資源對(duì)象中語(yǔ)義豐富的富知識(shí)表征，從而難以對(duì)用戶興趣全面地、準(zhǔn)確地進(jìn)行表征。因此，如何深層挖掘?qū)W術(shù)用戶行為數(shù)據(jù)中顯隱性特征，對(duì)學(xué)術(shù)用戶瀏覽的跨類型學(xué)術(shù)資源進(jìn)行學(xué)習(xí)和建模，發(fā)現(xiàn)其中包含的富知識(shí)表征，并在此基礎(chǔ)上形成多維度的學(xué)術(shù)用戶畫像，是基于學(xué)術(shù)用戶復(fù)雜關(guān)聯(lián)行為數(shù)據(jù)的學(xué)術(shù)用戶畫像建模所面臨的重要科學(xué)問(wèn)題。多維度用戶畫像的研究必將促使個(gè)性化推薦技術(shù)取得飛速發(fā)展，因此這方面的研究將成為研究的熱點(diǎn)。

（3）跨類型學(xué)術(shù)資源的個(gè)性化推薦

由于互聯(lián)網(wǎng)上學(xué)術(shù)資源數(shù)量巨大、類型繁多，每個(gè)學(xué)術(shù)用戶獲取學(xué)術(shù)信息的主要媒介有所不同，有些用戶偏向通過(guò)學(xué)術(shù)數(shù)據(jù)庫(kù)、專利網(wǎng)站等資源獲取興趣領(lǐng)域的學(xué)術(shù)信息，有些則偏向通過(guò)新聞、博客和社交平臺(tái)等渠道獲取最新學(xué)術(shù)信息，導(dǎo)致學(xué)術(shù)用戶對(duì)不同學(xué)術(shù)資源類型的興趣偏好各異，這為跨類型學(xué)術(shù)資源的個(gè)性化推薦帶來(lái)了全新的挑戰(zhàn)。傳統(tǒng)的學(xué)術(shù)資源推薦通常知識(shí)單一類型的資源推薦，無(wú)法同時(shí)為用戶提供不同類型的推薦結(jié)果，忽略不同類型資源在特征表述時(shí)的不同，忽略了用戶對(duì)不同類型學(xué)術(shù)資源的需求，從而難以全面地滿足用戶的學(xué)術(shù)需求。因此，如何為用戶推薦跨類型的學(xué)術(shù)資源是學(xué)術(shù)資源個(gè)性化推薦研究所面臨的重要問(wèn)題，跨類型的學(xué)術(shù)資源個(gè)性化推薦研究在未來(lái)一段時(shí)間必將成為研究的主流。

（4）跨語(yǔ)種學(xué)術(shù)資源的個(gè)性化推薦

隨著互聯(lián)網(wǎng)的發(fā)展，科研人員不僅需要不同類型的學(xué)術(shù)資源而且需要不同語(yǔ)種的學(xué)術(shù)資源。由于不同語(yǔ)種的學(xué)術(shù)資源特征表述不同，阻礙了跨語(yǔ)種的學(xué)術(shù)資源推薦研究的發(fā)展。傳統(tǒng)的學(xué)術(shù)資源推薦只能進(jìn)行單一語(yǔ)種的資源推薦，無(wú)法同時(shí)為用戶推薦不同語(yǔ)種的學(xué)術(shù)資源。因此，如何設(shè)計(jì)跨語(yǔ)種特征表示機(jī)制為用戶推薦跨語(yǔ)種的學(xué)術(shù)資源是推薦研究亟待解決的問(wèn)題，跨語(yǔ)種的推薦研究值得受到更多的關(guān)注。

（5）融合深度學(xué)習(xí)和現(xiàn)有的推薦方法進(jìn)行學(xué)術(shù)資源的個(gè)性化推薦

傳統(tǒng)的推薦方法，采用淺層模型進(jìn)行學(xué)術(shù)資源的個(gè)性化推薦，依賴于人工提取特征詞，難以有效挖掘到深層次的用戶和學(xué)術(shù)資源關(guān)系。深度學(xué)習(xí)模型能夠融合用戶或?qū)W術(shù)資源的元數(shù)據(jù)、用戶的行為數(shù)據(jù)，以及用戶的學(xué)術(shù)關(guān)系信息等多類型數(shù)據(jù)，從而學(xué)習(xí)到用戶和學(xué)術(shù)資源的深層次關(guān)聯(lián)關(guān)系，提高學(xué)術(shù)資源的推薦效果。融合深度學(xué)習(xí)進(jìn)行學(xué)術(shù)資源個(gè)性化推薦的研究值得更多的科研人員加以關(guān)注。

（6）在線推薦學(xué)習(xí)理論

傳統(tǒng)推薦技術(shù)的研究往往基于靜態(tài)的場(chǎng)景，即給定一組學(xué)術(shù)用戶行為數(shù)據(jù)來(lái)進(jìn)行建模和預(yù)測(cè)。然而，當(dāng)前在線學(xué)術(shù)資源個(gè)性化推薦系統(tǒng)面臨的是動(dòng)態(tài)場(chǎng)景，學(xué)術(shù)用戶行為在不斷地更新，學(xué)術(shù)用戶的需求、偏好在隨時(shí)間不斷變化，學(xué)術(shù)資源也在動(dòng)態(tài)實(shí)時(shí)更新，用戶和推薦系統(tǒng)往往會(huì)有更多的交互行為，這些對(duì)推薦系統(tǒng)的在線學(xué)習(xí)和更新機(jī)制有了更高的要求。研究面向交互推薦模型動(dòng)態(tài)演變理論，是實(shí)現(xiàn)學(xué)術(shù)用戶畫像建模與個(gè)性化推薦模型動(dòng)態(tài)更新亟待解決的重要科學(xué)問(wèn)題，學(xué)術(shù)用戶畫像建模與個(gè)性化推薦模型動(dòng)態(tài)更新機(jī)制將是未來(lái)推薦研究的熱點(diǎn)。

6 結(jié)束語(yǔ)

隨著大數(shù)據(jù)的發(fā)展，促使學(xué)術(shù)個(gè)性化推薦成為了一個(gè)熱門的研究方向。學(xué)術(shù)個(gè)性化推薦是解決學(xué)術(shù)領(lǐng)域信息超載問(wèn)題的一個(gè)非常有潛力的方法。本文從推薦過(guò)程的三個(gè)模塊（用戶模塊、對(duì)象模塊和推薦策略）對(duì)學(xué)術(shù)個(gè)性化推薦進(jìn)行了分析，對(duì)學(xué)術(shù)個(gè)性化推薦各個(gè)重點(diǎn)方面進(jìn)行了討論，并且對(duì)學(xué)術(shù)個(gè)性化推薦的研究方向作出了預(yù)測(cè)。可以預(yù)見(jiàn)，隨著新技術(shù)的發(fā)展，學(xué)術(shù)個(gè)性化推薦必將產(chǎn)生新的思想、模型和方法，推薦的結(jié)果也將越來(lái)越令人滿意。為了解決信息超載問(wèn)題，此方法將長(zhǎng)期成為學(xué)術(shù)領(lǐng)域的研究?jī)?nèi)容之一。

[1]張娜.電子商務(wù)環(huán)境下的個(gè)性化信息推薦服務(wù)及應(yīng)用研究[D].合肥：合肥工業(yè)大學(xué)，2007.

[2]Bollacker K D，Lawrence S，Giles C L.CiteSeer：An autonomous Web agent for automatic retrieval and identification of interesting publications[C]//Proceedings of the 2nd International Conference on Autonomous Agents，1998：116-123.

[3]Sugiyama K，Kan M Y.Towards higher relevance and serendipity in scholarly paper recommendation by Kazunari Sugiyama and Min-Yen Kan with Martin Vesely as coordinator[J].ACM SIGWEB Newsletter，2015：4.

[4]Beel J，Langer S，Genzmehr M，et al.Introducing docear’s research paper recommender system[C]//Proceedings of the 13th ACM/IEEE-CS Joint Conference on Digital Libraries（JCDL’13），2013：459-460.

[5]Jiang Y，Jia A，F(xiàn)eng Y，et al.Recommending academic papers via users’reading purposes[C]//Proceedings of the 6th ACM Conference on Recommender Systems，2012：241-244.

[6]Ferrara F，Pudota N，Tasso C.A keyphrase-based paper recommender system[C]//Proceedings of the IRCDL’11，2011：14-25.

[7]Pennock D M，Horvitz E，Lawrence S，et al.Collaborative filtering by personality diagnosis：A hybrid memory-and model-based approach[C]//Proceedings of the 16th Conference on Uncertainty in Artificial Intelligence，2000：473-480.

[8]Yang C，Wei B，Wu J，et al.CARES：A ranking-oriented CADAL recommender system[C]//Proceedings of the 9th ACM/IEEE-CS Joint Conference on Digital Libraries，2009：203-212.

[9]M?nnich M，Spiering M.Adding value to the library catalog by implementing a recommendation system[J].D-Lib Mag，2008，14（5）：4-11.

[10]肖詩(shī)伯，楊玉梅，蘭鷹，等.基于多標(biāo)簽屬性的學(xué)術(shù)文獻(xiàn)推薦研究[J].情報(bào)探索，2015（4）：8-10.

[11]Liang T P，Yang Y F，Chen D N，et al.A semanticexpansion approach to personalized knowledge recommendation[J].Decision Support Systems，2008，45（3）：401-412.

[12]de Gemmis M，Lops P，Semeraro G，et al.An investigation on the serendipity problem in recommender systems[J].Information Processing&Management，2015，51（5）：695-717.

[13]Zhao W，Wu R，Liu H.Paper recommendation based on the knowledge gap between a researcher’s background knowledge and research target[J].Information Processing&Management，2016，52（5）：976-988.

[14]王嫣然，陳梅，王翰虎，等.一種基于內(nèi)容過(guò)濾的科技文獻(xiàn)推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展，2011，21（2）：66-69.

[15]Paik J H．A novel TF-IDF weighting scheme for effectiveranking[C]//The 36th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York：ACM，2013：343-352.

[16]Sang Jitao，Xu Changsheng，Lu Dongyuan.Learn to personalized image search from the photo sharing websites[J].IEEE Transactions on Multimedia，2011，4（4）：963-974.

[17]Zhou Dong，Lawless S，Wade V.Improving search via personalized query expansion using social media[J].Information Retrieval，2012，15（3/4）：218-242.

[18]Liu Dong，Hua Xiansheng，Wang Meng，et al.Boost search relevance for tag-based social image retrieval[C]//IEEE International Conference on Multimedia and Expo.New York：IEEE，2009：1636-1639．

[19]Nascimento C，Laender A H，da Silva A S，et al.A source independent framework for research paper recommendation[C]//Proceedings of the 11th Annual International ACM/IEEE Joint Conference on Digital Libraries，2011：297-306.

[20]Jiang Y，Jia A，F(xiàn)eng Y，et al.Recommending academic papers via users’reading purposes[C]//Proceedings of the 6th ACM Conference on Recommender Systems，2012：241-244.

[21]Bethard S，Jurafsky D.Who should I cite：Learning literature search models from citation behavior[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management，2010：609-618.

[22]Lao N，Cohen W W.Relational retrieval using a combination of path-constrained random walks[J].Mach Learn，2010，81（1）：53-67.

[23]Ekstrand M D，Kannan P，Stemper J A，et al.Automatically building research reading lists[C]//Proceedings of the 4th ACM Conference on Recommender Systems，2010：159-166.

[24]He Q，Pei J，Kifer D，et al.Context-aware citation recommendation[C]//Proceedings of the 19th International Conference on World Wide Web，2010：421-430.

[25]Giles C L，Bollacker K D，Lawrence S.CiteSeer：An automatic citation indexing system[C]//Proceedings of the 3rd ACM Conference on Digital Libraries，1998：89-98.

[26]Huang Z，Chung W，Ong T H，et al.A graph-based recommender system for digital library[C]//Proceedings of the 2nd ACM/IEEE-CS Joint Conference on Digital Libraries，2002：65-73.

[27]Jack K.Mendeley：recommendation systems for academic literature[D].Technical University of Graz（TUG），2012.

[28]Erosheva E，F(xiàn)ienberg S，Lafferty J.Mixed-membership models of scientific publications[C]//Proc Natl Acad Sci U S Am 101（Suppl 1），2004：5220-5227.

[29]Kataria S，Mitra P，Bhatia S.Utilizing context in generative bayesian models for linked corpus[C]//Proceedings of the 24th AAAI Conference on Artificial Intelligence，2010：1340-1345.

[30]Middleton S E，De Roure D C，Shadbolt N R.Capturing knowledge of user preferences：ontologies in recom-mender systems[C]//Proceedings of the 1st International Conference on Knowledge Capture，2001：100-107.

[31]Middleton S E，Shadbolt N R，De Roure D C.Ontological user profiling in recommender systems[J].ACM Trans on Inf Syst（TOIS），2004，22（1）：54-88.

[32]Zarrinkalam F，Kahani M.SemCiR—a citation recommendation system based on a novel semantic distance measure[J]Electron Libr Inf Syst，2013，47（1）：92-112.

[33]Zhou Q，Chen X，Chen C.Authoritative scholarly paper recommendation based on paper communities[C]//2014 IEEE 17th International Conference on Computational Science and Engineering（CSE），2014：1536-1540.

[34]Wang Y，Zhai E，Hu J，et al.Claper：Recommend classical papers to beginners[C]//2010 Seventh International Conference on Fuzzy Systems and Knowledge Discovery（FSKD），2010，6：2777-2781.

[35]黃義文.大數(shù)據(jù)環(huán)境下圖書館學(xué)術(shù)資源個(gè)性化推薦服務(wù)研究[J].圖書館學(xué)刊，2016，38（7）：78-80.

[36]周文罡，李厚強(qiáng)，田奇.圖像檢索技術(shù)研究進(jìn)展[J].南京信息工程大學(xué)學(xué)報(bào)：自然科學(xué)版，2017，9（6）：613-634.

[37]陳亮，汪景福，王娜，等.基于DNN算法的移動(dòng)視頻推薦策略[J].計(jì)算機(jī)學(xué)報(bào)，2016，39（8）：1626-1638.

[38]Beel J，Gipp B，Langer S，et al.Paper recommender systems：A literature survey[J].International Journal on Digital Libraries，2016，17（4）：305-338.

[39]劉瑋.電子商務(wù)系統(tǒng)中的信息推薦方法研究[J].情報(bào)科學(xué)，2006，24（2）：300-303.

[40]Wang Z，Liu Y，Yang J，et al.A personalization-oriented academic literature recommendation method[J].Data Science Journal，2015，14：1-9

[41]Younus A，Qureshi M A，Manchanda P，et al.Utilizing microblog data in a topic modelling framework for scientific articles’recommendation[M]//Social Informatics.[S.l.]：Springer International Publishing，2014：384-395.

[42]Guan P，Wang Y.Personalized scientific literature recommendation based on user’s research interest[C]//2016 12th International Conference on Natural Computation，F(xiàn)uzzy Systems and Knowledge Discovery（ICNC-FSKD），2016：1273-1277.

[43]Sugiyama K，Kan M Y.Scholarly paper recommendation via user’s recent research interests[C]//Proceedings of the 10th ACM/IEEE Annual Joint Conference on Digital Libraries（JCDL），2010：29-38.

[44]Manning C D，Raghavan P，Schütze H.An introduction to information retrieval[M].Cambridge：Cambridge University Press，2009.

[45]Ricci F，Rokach L，Shapira B，et al.Recommender systems handbook[M].Berlin：Springer，2011.

[46]Resnick P，Iacovou N，Suchak M，et al.GroupLens：An open architecture for collaborative filtering of netnews[C]//Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work，1994：175-186.

[47]Naak A，Hage H，Aimeur E.A multi-criteria collaborative filtering approach for research paper recommendation in papyres[C]//Proceedings of the 4th International Conference MCETECH，2009：25-39.

[48]Yu J，Xie K，Zhao H，et al.Prediction of user interest based on collaborative filtering for personalized academic recommendation[C]//International Conference on Computer Science and Network Technology，2012：584-588.

[49]Kai Z，Lu P Y.Improved collaborative filtering approach based on user similarity combination[C]//International Conference on Management Science&Engineering，2014：238-243.

[50]Niu J，Wang L，Liu X，et al.FUIR：Fusing user and item information to deal with data sparsity by using side information in recommendation systems[J].Journal of Network and Computer Applications，2016，70：41-50.

[51]Seo Y D，Kim Y G，Lee E，et al.Personalized recommender system based on friendship strength in social network services[J].Expert Systems with Applications，2017，69：135-148.

[52]Torres R，McNee S M，Abel M，et al.Enhancing digital libraries with TechLens+[C]//Proceedings of the 4th ACM/IEEE-CS Joint Conference on Digital Libraries，2004：228-236.

[53]Dong R，Tokarchuk L，Ma A.Digging friendship：Paper recommendation in social network[C]//Proceedings of Networking and Electronic Commerce Research Conference（NAEC 2009），2009：21-28.

[54]McNee S M，Kapoor N，Konstan J A.Don’t look stupid：Avoiding pitfalls when recommending research papers[C]//Proceedings of the 2006 20th Anniversary Conference on Computer Supported Cooperative Work，2006：171-180.

[55]Arnold A，Cohen W W.Information extraction as link prediction：Using curated citation networks to improve gene detection[C]//Proceedings of the 4th International Conference on Wireless Algorithms，Systems，and Applications，2009：541-550.

[56]Lee Y C，Yeom J，Song K，et al.Recommendation of research papers in DBpia：A hybrid approach exploiting content and collaborative data[C]//2016 IEEE International Conference on Systems，Man，and Cybernetics（SMC），2016：2966-2971.

[57]Chakraborty T，Krishna A，Singh M，et al.FeRoSA：A faceted recommendation system for scientific articles[C]//Advances in Knowledge Discovery and Data Mining，2016：528-541.

[58]Pan L，Dai X，Huang S，et al.Academic paper recommendation based on heterogeneous graph[C]//Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data.[S.l.]：Springer International Publishing，2015：381-392.

[59]Woodruff A，Gossweiler R，Pitkow J，et al.Enhancing a digital book with a reading recommender[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems，2000：153-160.

[60]劉先紅，李綱.科研社交網(wǎng)絡(luò)的推薦系統(tǒng)對(duì)比分析[J].圖書情報(bào)工作，2016，60（9）：116-122.

[61]Xia F，Liu H，Lee I，et al.Scientific article recommendation：Exploiting common author relations and historical preferences[J].IEEE Transactions on Big Data，2016，2（2）：101-112.

[62]Zhao W，Wu R，Liu H.Paper recommendation based on the knowledge gap between a researcher’s background knowledge and research target[J].Information Processing&Management，2016，52（5）：976-988.

[63]Alotaibi S，Vassileva J.Effect of different implicit social networks on recommending research papers[C]//Conference on User Modeling Adaptation and Personalization，2016：217-221.

[64]Guo Y，Cheng H，Tang M，et al.Kernel based collaborative topic regression for tag recommendation[C]//International Conference on Education，Sports，Arts and Management Engineering，2016.

[65]Wang H，Chen B，Li W J.Collaborative topic regression with social regularization for tag recommendation[C]//International Joint Conference on Artificial Intelligence.[S.l.]：AAAI Press，2013：2719-2725.

[66]Wang H，Li W J.Relational collaborative topic regression for recommender systems[J].IEEE Transactions on Knowledge&Data Engineering，2015，27（5）：1343-1355.

[67]陳祖琴，張惠玲，葛繼科，等.基于加權(quán)關(guān)聯(lián)規(guī)則挖掘的相關(guān)文獻(xiàn)推薦[J].現(xiàn)代圖書情報(bào)技術(shù)，2007（10）：57-61.

[68]Jomsri P.Book recommendation system for digital library based on user profiles by using association rule[C]//2014 Fourth International Conference on Innovative Computing Technology（INTECH），2014：130-134.

[69]Anh V L，Hai V H，Tran H N，et al.SciRecSys：A recommendation system for scientific publication by discovering keyword relationships[C]//International Conference on Computational Collective Intelligence，2014，8733：72-82.

[70]劉旭東，葛俊杰.基于關(guān)聯(lián)規(guī)則的個(gè)性化推薦在數(shù)字圖書館中的應(yīng)用研究[J].德州學(xué)院學(xué)報(bào)，2010，26（2）：72-76.

[71]Tewari A S，Priyanka K.Book recommendation system based on collaborative filtering and association rule mining for college students[C]//2014 International Conference on Contemporary Computing and Informatics（IC3I），2014：135-138.

[72]Li X，She J.Collaborative variational autoencoder for recommender systems[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining，2017：305-314.

[73]Wang S，Wang Y，Tang J，et al.What your images reveal：Exploiting visual contents for point-of-interest recommendation[C]//Proceedings of the 26th International Conference on World Wide Web，International World Wide Web Conferences Steering Committee，2017：391-400.

[74]Wu C，Wang J，Liu J，et al.Recurrent neural network based recommendation for time heterogeneous feedback[J].Knowledge-Based Systems，2016，109：90-103.

[75]Shu J，Shen X，Liu H，et al.A content-based recommendation algorithm for learning resources[J].Multimedia Systems，2017：1-11.

[76]He X，Liao L，Zhang H，et al.Neural collaborative filtering[C]//Proceedings of the 26th International Conference on World Wide Web.International World Wide Web Conferences Steering Committee，2017：173-182.

[77]Hassan H A M.Personalized research paper recommendation using deep learning[C]//Proceedings of the 25th Conference on User Modeling，Adaptation and Personalization，2017：327-330.

[78]Wei J，He J，Chen K，et al.Collaborative filtering and deep learning based recommendation system for cold start items[J].Expert Systems with Applications，2017，69：29-39.

[79]Parvatikar S，Joshi B.Online book recommendation system by using collaborative filtering and association mining[C]//2015 IEEE International Conference on Computational Intelligence and Computing Research（ICCIC），2015：1-4.

[80]McNee S M，Albert I，Cosley D，et al.On the recommending of citations for research papers[C]//Proceedings of the ACM Conference on Computer Supported Cooperative Work，2002：116-125.

[81]Wei J，He J，Chen K，et al.Collaborative filtering and deep learning based recommendation system for cold start items[J].Expert Systems with Applications，2017，69：29-39.

[82]Roy D，Ray K，Mitra M.From a scholarly big dataset to a test collection for bibliographic citation recommendation[C]//AAAI Workshop：Scholarly Big Data，2016.

[83]夏秀峰，吳蘭蘭.一種基于商品基因的個(gè)性化推薦模型[J].遼寧大學(xué)學(xué)報(bào)：自然科學(xué)版，2009，36（4）：329-334.

[84]李瑞敏，閆俊，林鴻飛.基于音樂(lè)基因組的個(gè)性化移動(dòng)音樂(lè)推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件，2012，29（9）：27-30.

[85]唐曉波，周詠.基于圖書基因組的個(gè)性化圖書推薦研究[J].圖書館學(xué)研究，2017（2）：76-85.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡