国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SOM神經(jīng)網(wǎng)絡的高校圖書館個性化推薦服務系統(tǒng)構(gòu)建*

2018-05-04 08:40:05劉愛琴李永清
圖書館論壇 2018年4期
關鍵詞:鄰域權(quán)值神經(jīng)元

劉愛琴,李永清

0 引言

圖書館個性化服務在高校圖書館建設中意義重大[1]。針對個性化需求,朱曉云認為應當研究用戶群需求,進而從數(shù)據(jù)龐大的資源中提取真正滿足用戶需求的部分[2];張莉萍則強調(diào)知識整合,認為應當著眼用戶需要,積極為其提供完善的知識信息服務[3]。不同學者對高校圖書館中如何進行個性化服務的觀點趨于多元化。

資源分類不合理、資源檢索機制不完善是當前高校圖書館數(shù)字化建設面臨的一個重要問題。原有機械式的文獻分類方法已難以滿足現(xiàn)代高校讀者的圖書使用需求,面對用戶的個性化需求,也難以提供一個良好的處理機制和規(guī)范。

通過獲取用戶We b訪問數(shù)據(jù),對用戶行為進行聚類,根據(jù)用戶需求實現(xiàn)資源的個性化推薦,將有效地提升高校圖書館的服務質(zhì)量。山西大學圖書館記錄了大量學生和老師的訪問數(shù)據(jù),其中包含用戶的I P地址、上網(wǎng)時間、訪問時長以及訪問資源內(nèi)容等信息[4]。本文以山西大學圖書館為例,首先借助SOM神經(jīng)網(wǎng)絡對讀者We b訪問行為進行聚類和優(yōu)化分析,其中,聚類優(yōu)化算法分為粗調(diào)整和微調(diào)整兩個優(yōu)化階段,以保證聚類效果和聚類速率的提升;其次,基于用戶分析輸出結(jié)果,篩選整合相關數(shù)據(jù)資源,形成可靠性和可用性更高的關聯(lián)數(shù)據(jù)集,并結(jié)合語義檢索和屬性值匹配等技術(shù),構(gòu)建高校圖書館用戶個性化推薦服務系統(tǒng);最后,驗證系統(tǒng)有效性,實現(xiàn)圖書館內(nèi)部主題推薦、圖書推薦和專家推薦三個子系統(tǒng)的協(xié)同,并通過用戶與文獻資源特征的深層次挖掘,識別用戶的興趣點和所在聚類集。

1 神經(jīng)網(wǎng)絡聚類體系構(gòu)建

1.1 SOM神經(jīng)網(wǎng)絡聚類

在現(xiàn)代智慧圖書館的構(gòu)建中,用戶的個性化資源推薦服務越來越受到重視,數(shù)據(jù)深層次挖掘在圖書館工作中的比重不斷增加,這就要求個性化推薦算法具備及時處理大規(guī)模數(shù)據(jù)、有效處理高維數(shù)據(jù)、對異常數(shù)據(jù)值不敏感等特征。同時,相較于其他類型圖書館,高校圖書館用戶類型較為單一、訪問數(shù)據(jù)針對性較強,數(shù)據(jù)集中性和可用性更高。因此,當前在圖書館個性化推薦服務中,研究人員可從不同的方面予以嘗試,有針對性地響應用戶個性化需求。各類方法的著眼點均在于挖掘數(shù)據(jù)之間的關聯(lián),并將這種關聯(lián)應用于服務工作。從類型上看,主要分為文獻資源關聯(lián)、用戶行為關聯(lián)、檢索詞關聯(lián)三大類。其中,文獻資源關聯(lián)主要是通過關聯(lián)借閱訪問信息來對文獻資源屬性進行二次挖掘,找出其中深層的關聯(lián)價值[5];用戶行為關聯(lián)主要是根據(jù)讀者借閱訪問信息來將讀者劃分集群,根據(jù)不同集群進行相似性愛好預測推薦[6];檢索詞關聯(lián)主要將現(xiàn)有文獻和標題進行深層次解讀,根據(jù)文獻主題[7]、關鍵詞語義相似度匹配度和文獻關鍵詞復現(xiàn)率等規(guī)則進行推薦[8]。

在現(xiàn)有個性化資源推薦算法中,聚類算法應用最為普遍。聚類是指將對象基于一定特征的相似程度進行分組,實現(xiàn)組內(nèi)相似度最大,組間相似度最小效果的過程[9]。在數(shù)據(jù)深層次挖掘中,減少錯誤率,提高精準度非常重要。本文選取SOM神經(jīng)網(wǎng)絡聚類算法來進行分析。SOM網(wǎng)絡[10]基于人工智能神經(jīng)系統(tǒng)實施聚類,具有無導師自組織學習,無參數(shù)、精準化和穩(wěn)定性強的特點,能夠?qū)⒏呔S數(shù)據(jù)映射為一維或者二維數(shù)據(jù),在聚類時間和聚類效果上都具有顯著優(yōu)點,主要應用于智慧神經(jīng)網(wǎng)絡構(gòu)建分析、大數(shù)據(jù)分析處理和用戶個性化服務等領域。該方法的無參數(shù)特征能有效規(guī)避參數(shù)選擇導致的聚類結(jié)果不客觀問題;自組織學習特征能很好地將需要聚類的用戶信息進行關系整合,避免人為操作工作量大、分類困難的問題;高校圖書館的數(shù)據(jù)可用性較高這一特征也有效促進了SOM神經(jīng)網(wǎng)絡聚類效果,可靠性的實現(xiàn),對研究者和學習者進行學科綜合和方法借鑒均有很大意義。本文將用戶個人特征信息、用戶行為數(shù)據(jù)、文獻數(shù)據(jù)庫數(shù)據(jù)進行整合,搭建用戶的個性化推薦服務系統(tǒng)。

徐涌等[11]在進行Web用戶聚類時采用了標準的Kohonen神經(jīng)網(wǎng)絡方法,但該方法聚類速度慢,難以應用于規(guī)模較大的數(shù)據(jù)分析;段隆振等[12]基于標準的Kohonen神經(jīng)網(wǎng)絡算法,將數(shù)據(jù)調(diào)整分為粗調(diào)整和微調(diào)整并采用不同的函數(shù)形式來實現(xiàn)整體模型的優(yōu)化訓練。本文借助分階段聚類思想,選取了2016年10月-2017年1月的用戶Web訪問相關數(shù)據(jù)進行模型優(yōu)化,將聚類分為粗調(diào)整優(yōu)化和微調(diào)整優(yōu)化兩個階段,以提升聚類速率和聚類效果。在解決用戶多興趣度問題上,本文通過構(gòu)建多個聚類中心,選取從2016年10月-2017年1月的用戶訪問數(shù)據(jù)進行仿真,仿真結(jié)果顯示,該模型能夠很好地選擇向用戶推薦多樣化資源的比率,提升用戶個性化推薦服務的精準度和體驗效果。

1.2 數(shù)據(jù)選取和預處理

實現(xiàn)個性化推薦服務與用戶興趣需求相結(jié)合,需要對大量有價值的數(shù)據(jù)信息進行篩選和挖掘,構(gòu)建評價指標體系。本文分別選取山西大學經(jīng)濟與管理學院、文學院、物理電子工程學院和環(huán)境與資源學院相關研究人員和學生的We b訪問數(shù)據(jù),分別代表交叉學科、文科、工科和理科4門學科,進行指標篩選分析和推薦預測。聚類指標選取上,主要選取以下指標進行分析。

(1)用戶訪問時長和專注度。用戶訪問時長和專注度可以間接反映用戶對所選資源的滿意度和采納程度;專注度是衡量用戶對推薦結(jié)果滿意度的一項重要指標。

(2)關鍵詞所屬類別。用戶檢索的關鍵詞存在不規(guī)范性,人機交互時需要對關鍵詞進行相應分類處理,根據(jù)關鍵詞所屬類別進行初步分析,這對聚類效果以及后續(xù)個性化推薦意義重大。

(3)資源訪問偏好。山西大學圖書館現(xiàn)有資源根據(jù)資源形態(tài),可以分為紙質(zhì)和電子資源兩類;根據(jù)資源類別,主要可以分為圖書、期刊、報紙、新聞、視頻、課件、論文。

(4)資源篩選偏好。主要包括年代、出版社、作者、研究領域等。

(5)閱讀方式。主要包括下載、借閱、在線閱讀。由于部分用戶檢索后僅在圖書館直接查閱紙質(zhì)資料,無法進行跟蹤,因此暫時不考慮這類指標。

本文采用原始SOM神經(jīng)網(wǎng)絡框架,將網(wǎng)絡劃分為輸入和輸出兩個層次。輸入層輸入從用戶We b訪問數(shù)據(jù)中提取的指標,每一指標對應一個輸入層神經(jīng)元;輸出層為競爭層,根據(jù)用戶輸入數(shù)據(jù)進行競爭輸出,為輸入數(shù)據(jù)選擇其所屬類別。模型中,一維輸入層和二維輸出層的所有神經(jīng)元間存在縱向全權(quán)連接,輸入層中各個神經(jīng)元相互獨立,不存在權(quán)連接;在輸出層中,為更好地進行模型訓練,部分神經(jīng)元間通過橫向權(quán)連接來實現(xiàn)反饋調(diào)整,以提升模型訓練的精準度和速度。

1.2.1 算法模型

模型優(yōu)化過程中,通過自組織特征神經(jīng)網(wǎng)絡算法并結(jié)合模糊數(shù)學中隸屬度相關概念,將這個算法學習過程分為三步。第一步,粗調(diào)整學習運算,通過計算來確定輸出層中對應的獲勝神經(jīng)元坐標,實現(xiàn)初步聚類;第二步,提升聚類速度,在鄰域縮小的過程中本文首先采用指數(shù)函數(shù)作為鄰域函數(shù);第三步,微調(diào)整學習運算,將獲勝神經(jīng)元進行進一步的集中優(yōu)化,以獲取更為精準的聚類關鍵點。在這一過程中,需要對較為集中的連接神經(jīng)元間的權(quán)值進行優(yōu)化調(diào)整,以解決聚類精準度低、學習速率相對較慢的問題。在鄰域函數(shù)權(quán)值優(yōu)化調(diào)整中,不斷采用線性遞減函數(shù),直至最終模型訓練優(yōu)化完成。

x1,x2,…,xm表示輸入層的m維輸入向量,記為為模型縱向全連接時的權(quán)值向量,記做其中,j=1,2,…,n,為n個輸出層向量對應的神經(jīng)元。

1.2.2 獲勝神經(jīng)元的選取

模型的競爭優(yōu)化過程,實質(zhì)是通過計算輸入向量和全連接權(quán)值向量間的相似性來進行篩選優(yōu)化。常見可用性較高的度量輸入向量和權(quán)值向量之間相似程度的計算方法為歐式距離法和余弦法[13]。一般選擇輸入向量和權(quán)值向量相似度最高即歐式距離值最小的輸出層神經(jīng)元作為獲勝神經(jīng)元,獲勝神經(jīng)元比其他輸出層神經(jīng)元享有更高程度的優(yōu)化,并依據(jù)相應規(guī)則進行權(quán)值處理。本文具體選取步驟如下:

第一,計算網(wǎng)絡模型中輸入向量和對應輸出層全連接權(quán)值向量間距離,采用公式:

其中j=1,2,…,n;dj表示輸入向量x和第j個輸出層神經(jīng)元對應的權(quán)值向量wj之間的距離。

第二,在選擇獲勝神經(jīng)元時,首先需要將X、Wj(j=1,2,…,n),全部進行歸一化,得到

接下來計算并對比輸入向量和權(quán)值向量之間的相近程度,即計算并選取間距離最小值對應的輸出層神經(jīng)元,設獲勝神經(jīng)元權(quán)值向量為

1.2.3 學習率和鄰域調(diào)整

權(quán)值調(diào)整階段,激活鄰域所屬范圍內(nèi)的全部神經(jīng)元,學習率調(diào)整函數(shù)采用線性遞減函數(shù),聚類難以達到預期效果。本文在粗調(diào)整優(yōu)化階段采用指數(shù)函數(shù)進行初始學習率調(diào)整,迅速實現(xiàn)神經(jīng)元的初步聚類;在微調(diào)整優(yōu)化階段采用線性遞減函數(shù)對學習率進一步調(diào)整,能夠很好地保證聚類效果的準確性。在學習率調(diào)整時,初始階段設置較大的鄰域能夠保證初始輸入神經(jīng)元有更大的影響效果,提升收斂速度;隨著學習率調(diào)整的進行,鄰域需要逐步保證聚類的穩(wěn)定性,故需要縮減鄰域尺寸。學習率調(diào)整采用如下公式:

其中,β0是初始學習率;βt為經(jīng)過t次迭代后的學習率;T為常數(shù),作用為使得經(jīng)過t次迭代后學習率縮減到0。

常用指數(shù)衰減法來迭代調(diào)整鄰域尺寸:

其中,σt是經(jīng)過t次迭代后的鄰域?qū)挾?,?為初始鄰域?qū)挾?;T為常數(shù),作用為使得經(jīng)過t次迭代后指數(shù)函數(shù)縮減到0。

根據(jù)鄰域函數(shù)進行權(quán)值向量調(diào)整時,借助墨西哥草帽模型,利用各個輸出層神經(jīng)元c和獲勝神經(jīng)元j間的歐式距離來鎖定范圍并調(diào)整對應強度:

1.2.4 模型優(yōu)化

第一,輸入獲取到的、經(jīng)過預處理的優(yōu)化學習樣本并輸出優(yōu)化學習中經(jīng)調(diào)整的權(quán)值向量矩陣,該權(quán)值向量矩陣能夠準確地對輸入的測試樣本進行聚類。

第二,權(quán)值向量初始化。模型優(yōu)化時,必須進行全連接權(quán)值向量初始化,即為權(quán)值向量wij賦予初值,wij的值線性無關。在優(yōu)化學習過程中,通過MATLAB軟件為權(quán)值向量賦予初始隨機值。

第三,優(yōu)化學習向量輸入。輸入新向量X=[x1(t),x2(t),…,xm(t)]T。其中,t表示優(yōu)化學習次數(shù),初始值為0,定義學習優(yōu)化總次數(shù)為T。

第四,借助公式(1)計算第t次的X和輸出層各神經(jīng)元之間對應權(quán)值向量的歐式距離,并計算及選取獲勝神經(jīng)元j*。

第五,選擇優(yōu)勝鄰域。以獲勝神經(jīng)元j*作為中心,根據(jù)優(yōu)化次數(shù)t來確定優(yōu)化鄰域半徑。初始鄰域范圍Sj*(0)最大,隨著優(yōu)化次數(shù)的增加,鄰域范圍Sj*(t)逐步收縮。本文采用指數(shù)衰減法來縮減鄰域范圍。

第六,權(quán)值優(yōu)化學習調(diào)整。權(quán)值優(yōu)化調(diào)整采用權(quán)值調(diào)整函數(shù):

其中,βt表示第t次優(yōu)化的學習率,當為粗調(diào)整時采用公式(4),微調(diào)整時采用公式(5);hij(t)為第t次優(yōu)化學習時競爭層神經(jīng)元i所應當調(diào)整的鄰域程度。對應地,調(diào)整后的權(quán)向量為:

不斷重復以上步驟,當達到MATLAB設置的初始優(yōu)化學習次數(shù)后,學習結(jié)束。存儲并導出全部全連接權(quán)系數(shù),模型優(yōu)化結(jié)束。

1.2.5 模型應用

針對模型優(yōu)化結(jié)果,在試驗應用時,需要遵循以下的步驟:第一,向量歸一化,即將輸入向量和權(quán)連接向量進行歸一化調(diào)整,見公式11和公式12,以保證向量之間歐式距離計算比較時的科學性和可用性;第二,選取一個輸入向量并計算該向量與所有連接權(quán)值向量之間所對應的歐式距離;第三,計算比較得出輸出層獲勝神經(jīng)元,即該輸入向量所屬的聚類類別點。

1.3 實驗結(jié)果

本實驗模型優(yōu)化結(jié)合標準Kohonen算法優(yōu)勢,在此基礎上進行改進,在粗調(diào)整階段采用指數(shù)函數(shù),微調(diào)整階段采用線性函數(shù),借助墨西哥草帽函數(shù)思想來調(diào)整鄰域強度,提升收斂效果和可靠性。通過對前期搜集數(shù)據(jù)進行分析優(yōu)化,形成可進行用戶行為聚類的代表性神經(jīng)網(wǎng)絡系統(tǒng)。本文算法在Intel(R)Core(TM)i5/4G RAM/windows 10/MATLAB R2016a機器上進行12000次粗調(diào)整優(yōu)化和5000次微調(diào)整優(yōu)化,并進行了樣本仿真。從2016年10月-2017年1月的用戶訪問數(shù)據(jù)中隨機抽取800條數(shù)據(jù)進行聚類仿真。由于維度限制和神經(jīng)元權(quán)值向量分散度高,最終聚類結(jié)果以示意圖形式給出,對應的用戶行為聚類點在輸出層的體現(xiàn)如圖1所示。圖1中4個紅色虛線框分別表示4個不同學科的聚類集合,根據(jù)實際用戶訪問量和訪問記錄,可知圖1中①-④分別代表物理電子工程學院、文學院、環(huán)境與資源學院和經(jīng)濟與管理學院。聚類結(jié)果顯示不同學科聚類范圍存在明顯差異,部分存在交叉現(xiàn)象,即不同學科之間存在較為明顯的研究興趣界限,又存在學科交叉關系。

圖1 不同學院輸入向量神經(jīng)元聚類

2 個性化推薦服務系統(tǒng)構(gòu)建與分析

2.1 系統(tǒng)構(gòu)建

基于SOM神經(jīng)網(wǎng)絡的模型優(yōu)化訓練結(jié)果,構(gòu)建基于高校圖書館的個性化推薦服務系統(tǒng),見圖2。聚類結(jié)果揭示用戶多種We b訪問數(shù)據(jù)的隱含規(guī)律,個性化推薦中需進一步將這一結(jié)果與用戶和圖書館現(xiàn)有資源實現(xiàn)整合連接。系統(tǒng)架構(gòu)包括3個部分:數(shù)據(jù)層、網(wǎng)絡層、應用層。其中,數(shù)據(jù)層主要完成各類數(shù)據(jù)的整合操作,并將相應算法進行封裝,為網(wǎng)絡層數(shù)據(jù)調(diào)用和計算提供支持[14]。Web訪問數(shù)據(jù)便于用戶查看歷史訪問記錄;用戶特征信息庫將用戶相關信息整合,進而對用戶進行身份識別;聚類結(jié)果數(shù)據(jù)描述將SOM神經(jīng)網(wǎng)絡聚類算法結(jié)果進行計算機語言表述,和資源庫一起為實現(xiàn)資源檢索和個性化推薦提供支持,提升實體信息服務的匹配效率和準確性[15]。網(wǎng)絡層是連接數(shù)據(jù)層和應用層的橋梁,將用戶檢索數(shù)據(jù)進行匹配,借助相應算法從數(shù)據(jù)層讀取篩選結(jié)果。同時數(shù)據(jù)層還進行相關算法和數(shù)據(jù)庫修正操作,以滿足用戶需求。應用層實現(xiàn)相關資源推薦的可視化交互服務:將用戶輸入數(shù)據(jù)傳輸?shù)骄W(wǎng)絡層進行相應計算,并將計算結(jié)果以可視化語言輸出,為用戶提供個性化資源推薦服務;同時搜集用戶訪問Web相關數(shù)據(jù),后續(xù)向下層傳輸,便于網(wǎng)絡層進行數(shù)據(jù)調(diào)整,保證系統(tǒng)可靠性。整個個性化推薦服務過程由數(shù)據(jù)層、網(wǎng)絡層和應用層協(xié)調(diào)配合完成,具體流程如圖3所示。

2.2 服務實現(xiàn)

基于現(xiàn)有系統(tǒng),個性化推薦服務需要數(shù)據(jù)層、網(wǎng)絡層和應用層的有效配合。用戶個性化需求提出后,系統(tǒng)需要根據(jù)用戶需求及時作出響應。通過前期數(shù)據(jù)挖掘,揭示用戶興趣點、閱讀愛好和研究方向三大個性特征,以及學科關聯(lián)、知識關聯(lián)和資源關聯(lián)三大主要群體特征。針對讀者提供的個性化推薦服務中,系統(tǒng)主要進行以下操作:(1)已有信息檢索。用戶登錄系統(tǒng)時,系統(tǒng)自動讀取用戶歷史記錄和過去We b訪問聚類數(shù)據(jù)。向用戶推薦相關資源,同時讀取用戶搜索關鍵詞,與現(xiàn)有用戶特征信息進行匹配,對文獻資源庫進行檢索并輸出結(jié)果,推薦結(jié)果根據(jù)用戶個性化需求進行排序。(2)知識關聯(lián)展示。根據(jù)集群內(nèi)不同用戶訪問情況,根據(jù)知識關聯(lián)程度向用戶展示關聯(lián)資源,方便用戶獲取。(3)用戶信息更新。根據(jù)用戶使用推薦吻合度和用戶滿意度,設定閾值,對用戶興趣點和聚類集群進行改進和重塑,提升用戶體驗。

圖2 高校圖書館個性化推薦服務系統(tǒng)架構(gòu)

圖3 個性化推薦服務實現(xiàn)流程圖

個性化推薦服務系統(tǒng)建設中,SOM神經(jīng)網(wǎng)絡聚類算法起著決定性作用。此外,系統(tǒng)應用中需要結(jié)合現(xiàn)有最新計算機相關技術(shù),以達到系統(tǒng)最優(yōu)利用效果。比如,采用SILK語言進行語義搜索中的屬性值匹配計算,通過RDF來鏈接和描述實體之間的相互關系,并將檢索結(jié)果進行輸出。

本系統(tǒng)在應用中,將不同的學科進行弱分類,在區(qū)別各個學科之間邊界的同時也重視各個學科之間的關聯(lián)關系,降低跨學科知識借鑒和交流壁壘,突出用戶興趣點和研究方向。系統(tǒng)弱化檢索閾值,對用戶多興趣點問題進行自動協(xié)調(diào),提高系統(tǒng)查準率的同時,避免資源推薦冗余現(xiàn)象,提升了總體服務質(zhì)量。

2.3 有效性驗證

原有系統(tǒng)中,圖書館根據(jù)資源分類進行推薦服務時,由于研究熱點中存在學科交叉現(xiàn)象,分類明確但實施困難。在基于SOM神經(jīng)網(wǎng)絡聚類算法的個性化推薦服務中,將推薦方案細分為主題推薦、專家推薦和圖書推薦3個子系統(tǒng)。這3種推薦依托于用戶興趣點,分別提供熱點資源和專題文獻等一系列服務,基于讀者不同類型的需要提供有差異的精準推薦。

選取2016年10月初至2017年1月中旬109天的用戶訪問數(shù)據(jù)進行分析。在基于SOM神經(jīng)網(wǎng)絡聚類算法的個性化推薦服務中,為減少人為因素影響,系統(tǒng)基于原始管理類研究熱點數(shù)據(jù),進行數(shù)據(jù)整合,并按照SOM神經(jīng)網(wǎng)絡聚類算法進行自動聚類,向用戶推薦輸出結(jié)果。用戶輸入檢索關鍵詞后,系統(tǒng)自動識別并使用新的推薦算法進行計算。原有系統(tǒng)推薦算法僅考慮用戶輸入關鍵詞的詞義匹配,精確度較低。在新系統(tǒng)個性化推薦算法中,系統(tǒng)會首先識別用戶身份,從用戶原始We b訪問數(shù)據(jù)聚類集群中進行對比分析。如果分析結(jié)果符合用戶所屬聚類集群,則根據(jù)用戶集群中相似性語義關鍵詞和用戶過去興趣點進行雙重匹配,為用戶輸出推薦結(jié)果;如果分析結(jié)果不符合用戶所屬聚類集群,則直接借助現(xiàn)有關鍵詞進行語義分析和聚類,并根據(jù)用戶需求所屬類別進行推薦,同時存儲用戶訪問效果數(shù)據(jù),以備后續(xù)調(diào)整修正。在山西大學圖書館用戶Web訪問數(shù)據(jù)研究中,將用戶數(shù)據(jù)按照關聯(lián)數(shù)據(jù)集進行集群化存儲,以便在用戶檢索時能夠及時找到對應所屬集群進行推薦,也能夠根據(jù)集群用戶訪問效果及時對整體系統(tǒng)的推薦效果進行修正。通過系統(tǒng)前期運營分析,得出這段時期內(nèi)的系統(tǒng)運作情形,如圖4所示。

圖4 個性化推薦服務系統(tǒng)之間的協(xié)同

在推薦吻合度計算時,根據(jù)用戶檢索訪問時長、方式(下載、在線瀏覽)計算有效訪問數(shù)值,之后計算推薦吻合效果。在初始階段,3種推薦數(shù)據(jù)都會有較大的波動,不同的系統(tǒng)發(fā)展情況有較大的差異。隨著系統(tǒng)數(shù)據(jù)的完善和計算結(jié)果的更新,整體系統(tǒng)的穩(wěn)定性逐漸提升,推薦吻合度也整體呈現(xiàn)上升趨勢。由于不同學院不同時間段參與的用戶人數(shù)不均衡和用戶專業(yè)性不同,使得各學院用戶采納的波動情況和效果有較大差別。從整體上看,整個系統(tǒng)在后期均出現(xiàn)圖書推薦、主題推薦和專家推薦3個子系統(tǒng)之間的協(xié)同趨勢。

2.4 系統(tǒng)應用

本系統(tǒng)對用戶興趣行為采用開放式運行機制,以有效避免學科交叉和學科綜合導致的推薦不準確的問題出現(xiàn);同時,通過設定閾值和定期進行數(shù)據(jù)更新的方式,對SOM神經(jīng)網(wǎng)絡聚類結(jié)果進行調(diào)整,有效規(guī)避了由于用戶興趣轉(zhuǎn)移而導致的信息迷航問題。

圖5 學科團隊建設挖掘示意圖

[1]劉恩濤,李國俊,邱小花,等.MOOCs對高校圖書館的影響研究[J].圖書館雜志,2014(2):67-71.

[2]朱曉云.Web數(shù)據(jù)挖掘與個性化信息服務中用戶研究[J].情報雜志,2004(2):34-35.

[3]張莉萍.論圖書館個性化服務中用戶信息的Web數(shù)據(jù)挖掘[J].情報資料工作,2007(2):101-103,93.

[4]歐陽烽.Web數(shù)據(jù)挖掘與高校數(shù)字圖書館個性化服務[J].現(xiàn)代情報,2008(1):103-104,107.

[5]張文華,胡春,胡光林,等.基于圖書館流通數(shù)據(jù)的聚類分析研究[J].農(nóng)業(yè)圖書情報學刊,2010(10):109-111,130.

[6]楊昌順.聚類分析在圖書館讀者群體細分中的研究和應用[J].貴州師范學院學報,2012(6):11-17.

[7]章成志,張慶國,師慶輝.基于主題聚類的主題數(shù)字圖書館構(gòu)建[J].中國圖書館學報,2008(6):64-69.

[8]劉敏,馬秀峰.基于共詞聚類分析的數(shù)字圖書館熱點研究[J].農(nóng)業(yè)圖書情報學刊,2017(4):67-71.

[9]Thamaraiselvi,G,Kaliammal,A.Data Mining:Concepts and Techniques[J].SRELS Journal of Information Management,2004,41 (4):339-348.

[10]張德豐.MATLAB神經(jīng)網(wǎng)絡應用技術(shù)[M].北京:機械工業(yè)出版社,2012:50.

[11]徐涌,陳恩紅,王煦法.基于神經(jīng)網(wǎng)絡的Web用戶行為聚類分析[J].小型微型計算機系統(tǒng),2001(6):699-702.

[12]段隆振,朱敏,王靚明.基于雙Kohonen神經(jīng)網(wǎng)絡的Web用戶訪問模式挖掘算法[J].計算機工程與科學,2009 (9):95-98.

[13]柳勝國.數(shù)字圖書館個性化服務與Web日志挖掘數(shù)據(jù)預處理技術(shù)[J].現(xiàn)代情報,2007(7):65-67.

[14]D Hienert,BZapilko,P Schaer,et al.Vizgr: Linking Datain Visualizations[M]//Web Information Systemsand Technologies.Berlin:Springer,2017:177-191.

[15]高勁松,周習曼,梁艷琪.面向關聯(lián)數(shù)據(jù)的實體鏈接發(fā)現(xiàn)方法研究[J].中國圖書館學報,2016(6):85-101.

猜你喜歡
鄰域權(quán)值神經(jīng)元
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
《從光子到神經(jīng)元》書評
自然雜志(2021年6期)2021-12-23 08:24:46
CONTENTS
稀疏圖平方圖的染色數(shù)上界
基于鄰域競賽的多目標優(yōu)化算法
自動化學報(2018年7期)2018-08-20 02:59:04
躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
基于權(quán)值動量的RBM加速學習算法研究
自動化學報(2017年7期)2017-04-18 13:41:02
關于-型鄰域空間
基于二次型單神經(jīng)元PID的MPPT控制
毫米波導引頭預定回路改進單神經(jīng)元控制
当涂县| 博兴县| 万盛区| 阳春市| 枝江市| 古交市| 灵山县| 乌鲁木齐市| 衡水市| 孟州市| 布拖县| 绥芬河市| 甘谷县| 锦州市| 盐山县| 龙江县| 阿巴嘎旗| 五常市| 佛学| 澳门| 买车| 肇源县| 静乐县| 达孜县| 苗栗市| 江永县| 新沂市| 正定县| 临沧市| 大庆市| 大足县| 台安县| 金川县| 梨树县| 虞城县| 邛崃市| 长武县| 台南市| 安新县| 称多县| 普安县|