歐瓊妍
(南寧師范大學(xué)圖書館,廣西 南寧530001)
隨著時(shí)代的發(fā)展,我國(guó)高等院校信息化建設(shè)逐步加快,智慧校園建設(shè)漸成趨勢(shì)。智慧校園是通過運(yùn)用信息技術(shù),進(jìn)行大數(shù)據(jù)分析,得出更加科學(xué)的決策,以便開展更加合理的項(xiàng)目,進(jìn)而實(shí)現(xiàn)科研技術(shù)的發(fā)展和人才的培養(yǎng)與社會(huì)需求的協(xié)調(diào)統(tǒng)一。在智慧校園的背景下,很多高校圖書館以此為契機(jī)開始進(jìn)行創(chuàng)新改造,增添了多種信息服務(wù)設(shè)備和資源,將圖書館服務(wù)體系建設(shè)納入智慧校園建設(shè)之中,既能夠增強(qiáng)圖書館的服務(wù)水平,也能發(fā)揮圖書館的效能與作用。筆者擬就智慧校園背景下圖書館的個(gè)性化推薦服務(wù)系統(tǒng)進(jìn)行設(shè)計(jì)和研究。
高校圖書館個(gè)性化推薦系統(tǒng)是通過分析借閱數(shù)據(jù),發(fā)現(xiàn)不同用戶的個(gè)性化需求,有針對(duì)性地為用戶推薦圖書的自動(dòng)化、智能化讀者服務(wù)系統(tǒng)。該系統(tǒng)采用個(gè)性化推薦技術(shù),其服務(wù)不同于以往用戶自行檢索查詢的被動(dòng)方式,而是以用戶需求為中心,根據(jù)用戶的信息需求特征,主動(dòng)地為其推送匹配的圖書信息。這種服務(wù)方式不但有助于圖書館的人性化發(fā)展,有利于提升用戶的滿意度,也能夠有效提高圖書借閱率和利用率。
個(gè)性化推薦服務(wù)作為一種智慧圖書館服務(wù),是智慧校園建設(shè)過程中一個(gè)重要的組成部分。個(gè)性化推薦系統(tǒng)能夠?qū)Σ煌x者的個(gè)性化需求進(jìn)行區(qū)分,給讀者以自主化、人性化的圖書館服務(wù)體驗(yàn)。
智慧圖書館應(yīng)當(dāng)注重用戶個(gè)體需求和借閱習(xí)慣的發(fā)掘分析,這是實(shí)現(xiàn)個(gè)性化推薦服務(wù)的前提條件。圖書館用戶在這一系統(tǒng)運(yùn)行的過程中,具有至關(guān)重要的地位,推薦服務(wù)系統(tǒng)應(yīng)當(dāng)以用戶為本,發(fā)揮用戶需求在系統(tǒng)中的主導(dǎo)作用,這樣系統(tǒng)推薦的圖書才更容易被用戶喜歡。目前,我國(guó)許多高校圖書館都開始采用集個(gè)性化需求挖掘與分析服務(wù)、個(gè)性化信息智能定制服務(wù)以及個(gè)性化信息推送服務(wù)于一體的個(gè)性化推薦服務(wù)。
個(gè)性化推薦系統(tǒng)最初應(yīng)用于人們?nèi)粘I?,是作為?gòu)物網(wǎng)站等商業(yè)領(lǐng)域的商品智能化展示功能。這一系統(tǒng)的研究融合了多種學(xué)科知識(shí),其研制過程中需要使用到心理學(xué)、人類學(xué)、信息學(xué)、社會(huì)學(xué)、管理學(xué)等多個(gè)學(xué)科領(lǐng)域的理論和技術(shù)。圖書館個(gè)性化推薦服務(wù)系統(tǒng)正是在傳統(tǒng)個(gè)性化推薦系統(tǒng)的基礎(chǔ)上發(fā)展而來的,它面向高校圖書館借閱讀者群體,根據(jù)用戶的個(gè)性化需求推薦符合讀者趣味和習(xí)慣的圖書。個(gè)性化推薦系統(tǒng)包括讀者建模、推薦讀者建模、推薦算法建模3 個(gè)部分。其中推薦讀者建模是核心部分。
圖1 個(gè)性化推薦系統(tǒng)的基本模塊組成
個(gè)性化推薦服務(wù)體系可以搜集用戶的偏好圖書數(shù)據(jù),并在此基礎(chǔ)上進(jìn)行數(shù)據(jù)分析和整合。該體系能為智慧圖書館建設(shè)提供重要的支撐,也能提高讀者借閱圖書的便捷性,讓讀者享受到更加高質(zhì)量的服務(wù)。智慧圖書館可借助館內(nèi)的信息設(shè)備,根據(jù)讀者借閱習(xí)慣、偏好等有用信息,為讀者提供個(gè)性化、智能化的圖書推薦服務(wù)。個(gè)性化推薦服務(wù)體系主要包括以下內(nèi)容:(1)圖書館搜集并分析用戶數(shù)據(jù)信息。通過讀者信息監(jiān)測(cè)系統(tǒng)、讀者信息傳輸系統(tǒng)等信息技術(shù)和手段,搜集讀者存儲(chǔ)在設(shè)備上的圖書借閱數(shù)據(jù)和信息,并從圖書館規(guī)定和讀者需求出發(fā),利用信息化系統(tǒng)分析和處理這些數(shù)據(jù)。(2)圖書館分類處理讀者的個(gè)性化信息。將這些信息按照相關(guān)性、特殊性和重要程度進(jìn)行分類,并為讀者數(shù)據(jù)信息的整合打下基礎(chǔ)。(3)圖書館從整體上集中整合讀者的信息數(shù)據(jù)。把信息的隱藏價(jià)值分析出來,不斷探尋讀者借閱數(shù)據(jù)與需求的內(nèi)在聯(lián)系,在整合各種信息的前提下,審查系統(tǒng)的科學(xué)性和合理性,不斷完善個(gè)性化圖書推薦服務(wù)體系,從而為讀者提供更高質(zhì)量的圖書推薦服務(wù)。
圖書館個(gè)性化推薦系統(tǒng)應(yīng)具備針對(duì)用戶需求量身定制圖書信息的功能。在系統(tǒng)提供個(gè)性化服務(wù)的過程中,要保證讀者所獲取的圖書館服務(wù)信息是有價(jià)值的,不能是無效或者失效的信息。不同權(quán)限級(jí)別的用戶在行使其權(quán)限登錄個(gè)性化服務(wù)系統(tǒng)后,能夠獲取的個(gè)性化推薦信息也不同,讀者可根據(jù)自己的需求自行選擇圖書。在個(gè)性化服務(wù)系統(tǒng)中,權(quán)限是一種身份和專業(yè)的區(qū)分,如果學(xué)生來自不同的專業(yè),甚至來自不同的學(xué)校,那么系統(tǒng)就會(huì)針對(duì)個(gè)性化需求和專業(yè)特點(diǎn)來提供相應(yīng)的信息服務(wù)。
在智慧校園建設(shè)過程中,圖書館信息系統(tǒng)除了提供圖書信息查詢服務(wù)之外,還要提供預(yù)訂圖書、文獻(xiàn)互助、傳遞文件、參考咨詢等服務(wù)。在系統(tǒng)運(yùn)行時(shí),應(yīng)當(dāng)確保服務(wù)信息的準(zhǔn)確性、及時(shí)性和有效性,從而讓用戶享受更高質(zhì)量的個(gè)性化信息服務(wù)。
圖書館在推薦圖書時(shí),可同時(shí)提供專業(yè)的個(gè)性化服務(wù),從讀者的借閱歷史中發(fā)現(xiàn)其偏好的書籍類型,并向讀者主動(dòng)推送與其喜歡書籍相近的圖書目錄,這是個(gè)性化服務(wù)中的關(guān)鍵內(nèi)容。憑借這種方式,可有效幫助讀者在浩如煙海的書籍信息中快速獲取有用信息,大大節(jié)省了讀者查閱和搜集資料花費(fèi)的時(shí)間,增強(qiáng)讀者選擇圖書資源的針對(duì)性,提高讀者利用圖書館服務(wù)的效率。
筆者設(shè)計(jì)的個(gè)性化推薦系統(tǒng)具有數(shù)據(jù)信息的挖掘、采集和推薦3 個(gè)主要的功能,該系統(tǒng)的功能模塊結(jié)構(gòu)如圖2所示。
圖2 圖書館個(gè)性化推薦系統(tǒng)模塊
(1)信息采集功能模塊。建立這一功能模塊的目的是為了對(duì)用戶的閱讀數(shù)據(jù)進(jìn)行篩選和處理,清除有缺失的、無意義的甚至是有害的信息,從而為發(fā)掘更有價(jià)值的數(shù)據(jù)信息打下基礎(chǔ)。該模塊運(yùn)行時(shí),系統(tǒng)能夠以特別的手段來處理用戶個(gè)體的閱讀數(shù)據(jù)信息,將不同格式的信息轉(zhuǎn)化成更容易分析比較的格式,將不同種類的信息分類處理,將相同種類的信息合并處理。
(2)信息挖掘功能模塊。該功能模塊是建立在信息分類、聚類和關(guān)聯(lián)的基礎(chǔ)之上的。在利用信息采集功能模塊收集到用戶的有用信息后,可依據(jù)用戶的需求和偏好,對(duì)這些信息進(jìn)行深入的挖掘,并將挖掘出的關(guān)鍵信息納入圖書館的數(shù)據(jù)庫,可在數(shù)據(jù)庫中對(duì)這些信息進(jìn)行特別的定義,以標(biāo)注信息的獨(dú)特性。
(3)信息個(gè)性化推薦功能模塊。在圖書館數(shù)據(jù)信息處理的方法中,聚類分析技術(shù)是最為常見的一種方法,該技術(shù)通過信息整合和轉(zhuǎn)化,能在很大程度上提高系統(tǒng)的運(yùn)行效率。而在這一過程中往往還會(huì)用到特別的數(shù)據(jù)分析技術(shù),分析之后要將分析結(jié)果導(dǎo)入特定的數(shù)據(jù)庫,進(jìn)而為圖書的個(gè)性化推薦奠定基礎(chǔ),并在用戶進(jìn)行信息檢索時(shí)為其提供幫助。
在智慧校園背景下,圖書館個(gè)性化推薦服務(wù)系統(tǒng)所采用的設(shè)計(jì)框架是當(dāng)前廣泛使用的SSH框架。這一框架在系統(tǒng)開發(fā)設(shè)計(jì)過程中很容易操作,能夠顯著提高系統(tǒng)的研發(fā)效率,在不同結(jié)構(gòu)之下都可以為系統(tǒng)設(shè)計(jì)提供幫助。另外,在SSH 框架下進(jìn)行二次開發(fā)也很方便,應(yīng)用SSH 框架有利于日后的系統(tǒng)維護(hù)。運(yùn)用SSH框架建立的系統(tǒng)架構(gòu)如圖3所示。
圖3 SSH框架系統(tǒng)架構(gòu)
(1)用戶層。用戶層通過對(duì)組件化開發(fā)模式的運(yùn)用,建立良好的窗口交互系統(tǒng),并利用JSP 技術(shù),構(gòu)建人性化的交互界面,這一界面相當(dāng)于一座橋梁,在讀者和系統(tǒng)之間形成了有效的聯(lián)系,大大增強(qiáng)了系統(tǒng)的交互性。
(2)業(yè)務(wù)層。為了更大程度地保障用戶界面的交互需求,該系統(tǒng)構(gòu)架采用了目前普遍使用的“Struts+Spring+Hibernate”技術(shù),能夠保障系統(tǒng)的各項(xiàng)功能得到最大化利用。
(3)挖掘?qū)?。通過應(yīng)用專業(yè)的系統(tǒng)分析工具,堅(jiān)持聚類和分類的思想,深入挖掘用戶數(shù)據(jù)背后隱性的個(gè)性化需求和愛好,并將挖掘分析結(jié)果導(dǎo)入特定數(shù)據(jù)庫中存儲(chǔ)。
(4)數(shù)據(jù)層。數(shù)據(jù)層由系統(tǒng)相關(guān)數(shù)據(jù)庫構(gòu)成,可在此以結(jié)構(gòu)圖的形式表示數(shù)據(jù)庫之間的關(guān)聯(lián)性。
在對(duì)個(gè)性化推薦系統(tǒng)進(jìn)行設(shè)計(jì)之前,應(yīng)當(dāng)分別從圖書館的圖書文獻(xiàn)信息、歷史搜索信息、用戶借閱信息、系統(tǒng)推薦信息和人機(jī)交互信息等幾個(gè)方面,對(duì)信息管理平臺(tái)的數(shù)據(jù)進(jìn)行分類處理,從而為個(gè)性化推薦服務(wù)系統(tǒng)的實(shí)現(xiàn)提供必要的數(shù)據(jù)信息。
建立符合用戶需求的信息模型,在系統(tǒng)建設(shè)過程中至關(guān)重要。這一模型可以對(duì)讀者感興趣的圖書數(shù)據(jù)進(jìn)行分析,以更好地為讀者提供圖書推薦服務(wù)。用戶的信息需求模型包括興趣模型和數(shù)據(jù)挖掘模型?;谂d趣模型,可以建立多條有效的信息需求途徑,具體的途徑關(guān)系如圖4所示。圖書館服務(wù)系統(tǒng)利用個(gè)性化推薦算法,可形成讀者的興趣模型,該算法能夠全面監(jiān)測(cè)并篩選讀者的歷史借閱信息和用戶偏好,并在此基礎(chǔ)上匯總成興趣檢索目錄,以保證興趣需求模型的有效運(yùn)行。建立興趣模型,是為了有的放矢地提供服務(wù),進(jìn)一步滿足用戶的需求,用戶興趣模型的建立是以圖書館對(duì)用戶信息的挖掘分析為基礎(chǔ)的,為準(zhǔn)確客觀把握用戶的興趣愛好和信息需求傾向,圖書館必須采用大數(shù)據(jù)分析等多種技術(shù)手段,建立數(shù)據(jù)挖掘模型。
圖4 用戶信息需求模型
存儲(chǔ)在個(gè)性化推薦系統(tǒng)中的用戶檢索信息數(shù)量非常龐大,為在滿足讀者需求的同時(shí)達(dá)到圖書利用效率的最大化,應(yīng)當(dāng)利用相關(guān)算法協(xié)助處理數(shù)據(jù)。
(1)皮爾森相似度關(guān)聯(lián)。皮爾森相似度被用來表示兩個(gè)變量間的線性關(guān)系。皮爾森系數(shù)值在[-1,1]間發(fā)生變化。當(dāng)皮爾森系數(shù)等于0時(shí)變量之間不具有線性關(guān)系;當(dāng)皮爾森系數(shù)大于0 時(shí),兩個(gè)變量之間呈正相關(guān)關(guān)系,一個(gè)變量隨著另一變量的增加而增加;相反的,當(dāng)皮爾森系數(shù)小于0時(shí),兩個(gè)變量之間呈負(fù)相關(guān)關(guān)系,
(2)歐幾理德距離相似度。歐幾里得相似度是一種計(jì)算距離相似度的算法,也是一種很容易理解的算法,這種算法把數(shù)據(jù)作為坐標(biāo),觀測(cè)者通過繪制坐標(biāo)軸并計(jì)算直線距離,即可表示數(shù)據(jù)之間的關(guān)系。
(3)余弦相似度。為了比較數(shù)據(jù)空間中個(gè)體差異情況,需要用到余弦相似度,即向量空間中兩個(gè)向量夾角的余弦值。與距離相似度相比,余弦相似度強(qiáng)調(diào)的是個(gè)體在方向上的差異性。
(4)調(diào)整余弦的相似度。對(duì)向量夾角求余弦值即可獲得余弦相似度。隨著向量維度的不同,計(jì)算得到的余弦值可能也有所不同。在評(píng)分計(jì)算時(shí),A和B用戶的評(píng)分分別取自在(1,2)和(4,5)之間時(shí),計(jì)算余弦值為0.98,A 和B 用戶得出的結(jié)果相近,但其實(shí)B卻在內(nèi)容上與A完全相反。這時(shí)可對(duì)余弦計(jì)算進(jìn)行調(diào)整,將評(píng)分期望都設(shè)為3,那么A 和B 用戶的評(píng)分就可以分別在(-2,-1)和(1,2)中進(jìn)行選擇,之后再進(jìn)行余弦值計(jì)算,結(jié)果為負(fù)數(shù)時(shí)表示A和B的差異性很小。
(5)Pearson 相關(guān)度。Pearson 相關(guān)度可以用來表示用戶的偏好。首先對(duì)用戶的興趣程度賦值,設(shè)分值為1時(shí)用戶不感興趣,設(shè)分值為2時(shí)用戶感興趣,之后再將Pearson相關(guān)系數(shù)進(jìn)行變換處理。
(6)谷本系數(shù)相似度度量。與以上幾種算法相比,谷本系數(shù)算法對(duì)于評(píng)分沒有要求,這一點(diǎn)非常獨(dú)特,谷本系數(shù)算法更注重?cái)?shù)據(jù)與用戶之間的邏輯相關(guān)性,可以用布爾邏輯體系來構(gòu)建用戶和數(shù)據(jù)的聯(lián)系。
在設(shè)計(jì)個(gè)性化推薦服務(wù)系統(tǒng)時(shí),要對(duì)系統(tǒng)的穩(wěn)定性、兼容性和拓展性進(jìn)行提前考慮。筆者研究開發(fā)該系統(tǒng),應(yīng)用的是目前常用的操作系統(tǒng),使用Windows7 系統(tǒng)作為系統(tǒng)客戶端,用Windows Server2008 作為服務(wù)器,用MySQL 作為數(shù)據(jù)庫,使用360安全瀏覽器來訪問系統(tǒng),足以保障系統(tǒng)的安全性。
在智慧校園建設(shè)中很多圖書館都結(jié)合學(xué)科特點(diǎn)和用戶的自身需求,設(shè)計(jì)出了各種具有針對(duì)性的個(gè)性化推薦服務(wù)系統(tǒng)。然而這些在不同框架體系下運(yùn)行的個(gè)性化推薦系統(tǒng)也面臨著諸多問題。在個(gè)性化推薦服務(wù)系統(tǒng)中,有很多地方都需要進(jìn)一步發(fā)展和完善,尤其是系統(tǒng)的功能模塊,更應(yīng)當(dāng)注重用戶數(shù)據(jù)的搜集和挖掘。只有這樣,才能讓讀者普遍享受高質(zhì)量的圖書信息服務(wù)。因此,發(fā)展個(gè)性化推薦服務(wù)系統(tǒng)是大勢(shì)所趨,其根本目的是為了提升圖書館信息服務(wù)的質(zhì)量和效率。