国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校圖書館圖書推薦系統(tǒng)研究

2018-08-13 09:50連鍥
關(guān)鍵詞:協(xié)同過濾高校圖書館

連鍥

摘 要:高校圖書館館藏資源日益豐富,傳統(tǒng)的圖書檢索功能已經(jīng)無法滿足讀者的需求,主動(dòng)推送所需資源是提高圖書館服務(wù)質(zhì)量的重要途徑。文章根據(jù)讀者的專業(yè)、年級等特點(diǎn),根據(jù)興趣漂移理論,設(shè)計(jì)了一個(gè)符合高校讀者借閱行為的興趣模型,利用遺忘曲線來動(dòng)態(tài)調(diào)整模型中項(xiàng)目和項(xiàng)目權(quán)重,解決了讀者興趣的更新和存儲。實(shí)驗(yàn)表明,這種建模方法能提供較為精確的讀者興趣描述,將其與協(xié)同過濾算法相結(jié)合可以產(chǎn)生較為準(zhǔn)確的圖書項(xiàng)目推薦。

關(guān)鍵詞: 高校圖書館;個(gè)性化推薦系統(tǒng);協(xié)同過濾;興趣模型

中圖分類號: TP311.13 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2018)10-0087-03

一、高校圖書館推薦系統(tǒng)現(xiàn)狀

個(gè)性化推薦技術(shù)在1990年代一經(jīng)提出,國外就開始嘗試應(yīng)用于數(shù)字圖書館的個(gè)性化推薦服務(wù)。受到亞馬遜、Yahoo等大型電子商務(wù)網(wǎng)站個(gè)性化服務(wù)成功應(yīng)用的啟發(fā),一些國外高校經(jīng)過多年廣泛的研究和實(shí)踐,紛紛建立了Mylibrary。其中比較典型的有美國Cornell University圖書館Mylibrary@ cornell和North Carolina State University圖書館的Mylibrary@NCState[1]。Mylibrary@ cornell系統(tǒng)于1999年正式上線,該系統(tǒng)已經(jīng)發(fā)展成為數(shù)字化圖書館個(gè)性化推薦服務(wù)的原型[2]。近年來,我國高校圖書館加強(qiáng)了對個(gè)性化推薦技術(shù)和服務(wù)的研究。2000年初,國家社科資金項(xiàng)目資助并由北京大學(xué)承擔(dān)了——“基于Web的數(shù)字圖書館定制系統(tǒng)”。中國人民大學(xué)的數(shù)字圖書館Kingbase DL,通過記錄和分析用戶描述信息,構(gòu)建讀者概貌,進(jìn)而產(chǎn)生與之匹配的圖書推薦[3]。國家科學(xué)數(shù)字圖書館對北卡羅萊納州立大學(xué)Mylibrary@NCState進(jìn)行了二次開發(fā)[4]。

二、高校讀者興趣模型

1.高校讀者借閱行為模式

高校圖書館是學(xué)校的文獻(xiàn)信息中心,其目標(biāo)是滿足讀者信息需求。讀者在圖書館的借閱行為直接反映了讀者的閱讀興趣情況,因此,研究當(dāng)代大學(xué)借閱行為模式對圖書館開展推薦服務(wù)有著直接意義。

(1)讀者借閱的動(dòng)機(jī)

首先,輔助學(xué)業(yè)的需要。筆者在本校和兄弟院校調(diào)研中發(fā)現(xiàn)許多大學(xué)生到圖書館借閱目的明確,就是輔助課業(yè)學(xué)習(xí),在讀者借閱中占最大比重;其次,求職的需要。大學(xué)生畢業(yè)后選擇進(jìn)入社會(huì)時(shí)面對一個(gè)直接的課題就是求職。當(dāng)今社會(huì)競爭激烈,他們在大學(xué)內(nèi)對專業(yè)知識和技能方面作為必要的準(zhǔn)備,因此與之相關(guān)的圖書借閱頻次也是蠻高的。最后,滿足興趣愛好和娛樂生活的需要。興趣愛好包括語言文學(xué)、攝影、音樂、繪畫、各種體育項(xiàng)目等,因此這些圖書借閱比例也是比較高。

(2)讀者借閱行為模式研究

筆者分析了上海財(cái)經(jīng)大學(xué)圖書館信息借還系統(tǒng)中2011-2017年每年9月1日到12月30日當(dāng)年入學(xué)新生的借閱歷史記錄和文獻(xiàn)查閱中國部分高校圖書館借閱情況,得出當(dāng)代大學(xué)生借閱行為中的一些共性規(guī)律,發(fā)現(xiàn)了現(xiàn)階段大學(xué)生借閱的一些特點(diǎn)。大學(xué)生的借閱狀況受到年級、學(xué)科、讀者類型等因素影響。

2.高校讀者興趣模型

借此共性特點(diǎn)解決“新用戶”的問題。新生進(jìn)校后,專業(yè)、學(xué)科等信息能夠被直接獲取,用聚類的方法,推薦系統(tǒng)能夠方便的建立用戶描述文件。在讀者使用的初期,系統(tǒng)依據(jù)初始的描述文件中群體讀者興趣信息來提供服務(wù),并且在讀者不斷使用系統(tǒng)的過程中收集和分析用戶行為數(shù)據(jù),主要是讀者對圖書的借閱數(shù)據(jù)。系統(tǒng)根據(jù)這些數(shù)據(jù)不斷地預(yù)測用戶的興趣狀況,包括推斷新的興趣愛好、已有興趣權(quán)重的動(dòng)態(tài)變化等。讀者對系統(tǒng)的使用過程就是讀者興趣模型動(dòng)態(tài)更新的過程,初始時(shí)讀者得到的是一個(gè)群體共同興趣模型,隨著讀者對系統(tǒng)的不斷使用,模型將會(huì)越來越“個(gè)性化”,并最終形成與讀者借閱行為匹配的興趣模式。

(1)讀者初始興趣模型的創(chuàng)建

當(dāng)一個(gè)新生入學(xué)時(shí),系統(tǒng)無法獲得新讀者的興趣狀況,也就不能對其產(chǎn)生有效的推薦。但高校課程教學(xué)計(jì)劃在一段時(shí)間內(nèi)具有連續(xù)性,并且通過前面讀者借閱行為模式分析,知道歷年來高校同一學(xué)院的新生讀者在借閱規(guī)律上有一定的相似性,因此本文創(chuàng)新地提出用歷年新生借閱記錄統(tǒng)計(jì)評價(jià)來表征讀者的初始興趣情況。讀者借閱記錄能較好地反映讀者興趣的變化,當(dāng)讀者借閱某類圖書時(shí),說明該讀者對此相關(guān)的興趣產(chǎn)生聯(lián)系。本文使用向量空間模型來建立用戶的興趣模型,即讀者借閱了f(經(jīng)濟(jì))、t(工業(yè)技術(shù))類圖書,則用戶的初始興趣集合表示為{f、t}。通過對上海財(cái)經(jīng)大學(xué)2011年至2017年新生的借閱記錄分析,結(jié)合學(xué)科分類,利用中圖法22個(gè)基類概念表示讀者的興趣,計(jì)算出各學(xué)院新生的主要借閱類別在借閱總數(shù)中的比重,并以此確定對應(yīng)的興趣權(quán)重值。將初始興趣集合與對應(yīng)的權(quán)重值結(jié)合,最終生成讀者的初始興趣描述文件:F={w1,t1,(w2,t2)…(wn,tn)},其中n為興趣數(shù),ti為興趣圖書分類,wi是對應(yīng)的興趣權(quán)重值。

(2)讀者興趣模型的更新

由于讀者的興趣不是固定不變,一個(gè)好的興趣模式應(yīng)該能夠迅速地捕捉讀者興趣的變化,并及時(shí)調(diào)整。根據(jù)讀者的借閱行為,本文在更新讀者的興趣模型時(shí),采用下面的策略:

① 興趣項(xiàng)的減弱策略

當(dāng)讀者多次借閱中,興趣模型某些類別圖書均沒有被借閱到,則表示讀者對這些項(xiàng)目的興趣度在下降。需要調(diào)整讀者的興趣模型,其相應(yīng)的興趣權(quán)重值應(yīng)減小。

遺忘曲線模擬人的記憶模式和行為習(xí)慣,更貼近讀者興趣的真實(shí)表達(dá),本文采用其函數(shù)來調(diào)整興趣項(xiàng)的權(quán)重:wi=wi0e-0.2(1+2+…j),其中wi0是第i項(xiàng)分類興趣的初始權(quán)重,j∈(1…n),表示在時(shí)間點(diǎn)n時(shí)項(xiàng)i類目圖書距離最近一次出現(xiàn)時(shí)的間隔。根據(jù)趙家輝在《個(gè)性化信息服務(wù)中的用戶興趣遷移研究》中的分析,結(jié)合筆者工作經(jīng)驗(yàn),遺忘速度取0.2(1+2+…+j)值能較好地?cái)M合讀者認(rèn)知的遺忘曲線[5]。

② 興趣項(xiàng)的新增策略

讀者借閱某類圖書時(shí),下次借閱該類圖書可能性較高。因而當(dāng)讀者借閱了某類不在描述文件中的圖書,表示讀者有新的興趣項(xiàng)產(chǎn)生。

新出現(xiàn)項(xiàng)歸屬為短期興趣,本文假設(shè)新項(xiàng)目經(jīng)過兩次遺忘后就會(huì)低于剔除閥值,則新項(xiàng)目權(quán)重值要小于0.1÷e-0.2(1+2)=0.18,本文權(quán)重設(shè)置為0.15,從而將項(xiàng)目從興趣模型中刪除,符合短期興趣快速變化和易遺忘的特征。

③ 興趣項(xiàng)的加強(qiáng)策略

如果讀者在一定時(shí)間段內(nèi)頻繁借閱某類圖書,也就表現(xiàn)出讀者對對應(yīng)項(xiàng)目感興趣程度在提高,該類圖書對應(yīng)的興趣權(quán)重值應(yīng)增加。本文假設(shè)興趣加強(qiáng)是第一次興趣遺忘的逆過程,即加強(qiáng)系數(shù)為1.22(e0.2),也就是說本期的權(quán)重Wj=1.22Wj-1。

④ 興趣項(xiàng)的保持策略

當(dāng)讀者在一段時(shí)間段沒有借閱行為發(fā)生時(shí),則用戶的興趣模型仍然保持不變,無需進(jìn)行更新。

⑤ 興趣項(xiàng)的剔除策略

當(dāng)讀者的興趣模型中某一興趣項(xiàng)在多次借閱行為中都沒發(fā)生,其興趣權(quán)重值根據(jù)減弱策略不斷調(diào)整小于一定閥值時(shí),我們可以認(rèn)為讀者已“遺忘”該興趣項(xiàng),本文取0.1閥值。

三、基于項(xiàng)目(圖書)協(xié)同過濾推薦功能設(shè)計(jì)

1.圖書館圖書推薦功能分析

在圖書館信息管理系統(tǒng)中,有每個(gè)讀者的詳細(xì)借閱記錄。系統(tǒng)后臺將記錄經(jīng)過抽取、轉(zhuǎn)換、加載入數(shù)據(jù)庫,并進(jìn)行分析。前端在線提供給讀者個(gè)性化的推薦功能,主動(dòng)推送符合讀者需求的圖書,借此提高圖書館圖書資源的利用率。

(1)圖書館圖書推薦功能設(shè)計(jì)系統(tǒng)分析

系統(tǒng)服務(wù)對象:由于上海財(cái)經(jīng)大學(xué)在校博士樣本少,在一定時(shí)期借閱統(tǒng)計(jì)沒有體現(xiàn)類別共性規(guī)律。所以本文設(shè)計(jì)推薦服務(wù)對象設(shè)定為在校本科生和碩士生。

系統(tǒng)功能描述:根據(jù)圖書館信息管理系統(tǒng)運(yùn)行的特點(diǎn),可以將推薦功能分為基礎(chǔ)數(shù)據(jù)維護(hù)、圖書評價(jià)數(shù)據(jù)維護(hù)、推薦算法模塊和模型更新四個(gè)部分:

基礎(chǔ)數(shù)據(jù)維護(hù):包括讀者信息、圖書信息管理、圖書評價(jià)數(shù)據(jù)維護(hù)等。

推薦算法模塊:包括讀者推薦信息、推薦策略管理等。

模型更新:包括評分信息收集和更新、讀者初始模型個(gè)性和本人興趣模型更新等。

2.圖書館推薦系統(tǒng)設(shè)計(jì)

學(xué)校圖書館個(gè)性化推薦系統(tǒng)在收集各學(xué)院新生借閱規(guī)律基礎(chǔ)上,構(gòu)建讀者初始興趣模型,并分析讀者對圖書的評價(jià)信息,在推薦算法的幫助下選擇讀者可能感興趣的圖書產(chǎn)生推薦。系統(tǒng)從讀者的借閱記錄中不斷學(xué)習(xí),動(dòng)態(tài)校正讀者的興趣模型,從讀者圖書評價(jià)記錄中不斷學(xué)習(xí),及時(shí)改變推薦類別中圖書排序。從而保證下一次產(chǎn)生的推薦結(jié)果更符合讀者的個(gè)性需求,最終提高推薦的準(zhǔn)確性。

本推薦系統(tǒng)算法功能的具體操作過程如下:①按照中國圖書分類法,將圖書館館藏資源分為22個(gè)類目。②對每個(gè)類目,由讀者對圖書評價(jià)構(gòu)成評分?jǐn)?shù)據(jù)矩陣,評分可以設(shè)定為1-5五個(gè)等級,數(shù)字越高表示讀者對圖書評級越高。讀者的評價(jià)圖書數(shù)量越多,評分矩陣越完整,由此產(chǎn)生的推薦結(jié)果就越準(zhǔn)確。③使用Apache Mahout機(jī)器學(xué)習(xí)工具實(shí)現(xiàn)基于項(xiàng)目的Slope one協(xié)同過濾推薦,其中有些沒有對任何圖書評價(jià)的讀者使用圖書評價(jià)的平均值來表征讀者的評價(jià)。④將針對讀者的推薦結(jié)果以頁面形式在讀者個(gè)人系統(tǒng)中輸出。

3.圖書協(xié)同過濾推薦算法的實(shí)現(xiàn)框架

分析各時(shí)間點(diǎn)內(nèi)讀者借閱記錄,當(dāng)有記錄發(fā)生時(shí),推薦系統(tǒng)根據(jù)借閱圖書種類動(dòng)態(tài)修改興趣模型,調(diào)整模型的項(xiàng)目類和項(xiàng)目權(quán)重值,最終導(dǎo)致對讀者推薦的圖書類別和對應(yīng)推薦數(shù)量產(chǎn)生變化。當(dāng)讀者評價(jià)某本圖書時(shí),系統(tǒng)收集讀者對圖書的評價(jià)矩陣,調(diào)用推薦算法模塊,運(yùn)算完成后調(diào)整該類別圖書的推薦順序。最終結(jié)果將以頁面的形式呈現(xiàn)給讀者。

四、實(shí)驗(yàn)結(jié)果分析

為了驗(yàn)證上述讀者興趣模型以及推薦系統(tǒng)的有效性,論文抽取了12位讀者(涵蓋4個(gè)學(xué)院,本科生和碩士兩種類型)來實(shí)際進(jìn)行評價(jià)。根據(jù)每個(gè)樣本讀者具體的借閱記錄,為每個(gè)讀者推薦20本書,并讓他們評價(jià)是否對推薦圖書有興趣。之后使用最常用查準(zhǔn)率(precision)來驗(yàn)證推薦質(zhì)量。查準(zhǔn)率表達(dá)式precisiona/sum,其中a是推薦成功的圖書數(shù)量,sum是推薦的圖書總數(shù)。反饋結(jié)果表明,12位讀者之間評價(jià)的查準(zhǔn)率差別比較大,平均值為70.4%。發(fā)現(xiàn)不同類型讀者的推薦效果也不同,碩士群體平均值為73.6%,本科群體是66%。原因應(yīng)該是碩士群體關(guān)注面比較集中,推薦效果比較理想;而本科群體閱讀比較分散,推薦成功率不高。

本文對基于興趣漂移和協(xié)同過濾的高校圖書館推薦系統(tǒng)進(jìn)行了詳細(xì)的討論和分析,得出如下結(jié)論:與傳統(tǒng)的推薦系統(tǒng)相比,本文推薦系統(tǒng)可動(dòng)態(tài)跟蹤用戶的興趣改變。用戶興趣的漂移是傳統(tǒng)推薦系統(tǒng)較難解決的問題,本推薦系統(tǒng)基于興趣漂移理論來動(dòng)態(tài)調(diào)整用戶的興趣模型,較好地解決了這個(gè)問題。

參考文獻(xiàn):

[1]李靈芝.數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)中的應(yīng)用研究[D].長春:吉林大學(xué),2014.

[2]蘇明忠.新媒體環(huán)境下圖書館更應(yīng)挖掘特色資源[J].中國教育網(wǎng)絡(luò),2017(8):74-75.

[3]張紅燕.移動(dòng)閱讀的生態(tài)發(fā)展策略[J].圖書情報(bào)研究,2017(4):56-57.

[4]徐紅.個(gè)性化網(wǎng)上圖書館的設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2013.

[5]趙家輝.個(gè)性化信息服務(wù)中的用戶興趣遷移研究[D].成都:電子科技大學(xué),2009.

(編輯:魯利瑞)

猜你喜歡
協(xié)同過濾高校圖書館
圖書推薦算法綜述
改進(jìn)的協(xié)同過濾推薦算法
基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
高校圖書館閱讀推廣案例分析
微信公眾平臺在高校圖書館信息服務(wù)中的應(yīng)用研究
高校圖書館閱讀推廣活動(dòng)研究
試論高校圖書館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)