国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于云計(jì)算的數(shù)字圖書(shū)館研究

2015-09-14 10:04:15
中國(guó)管理信息化 2015年2期
關(guān)鍵詞:關(guān)聯(lián)檢索聚類(lèi)

宋 翠

(河南水利與環(huán)境職業(yè)學(xué)院,鄭州 450000)

基于云計(jì)算的數(shù)字圖書(shū)館研究

宋 翠

(河南水利與環(huán)境職業(yè)學(xué)院,鄭州 450000)

為提高數(shù)字圖書(shū)館智能化與個(gè)性化服務(wù),借助云計(jì)算強(qiáng)大的計(jì)算及后臺(tái)處理能力,實(shí)現(xiàn)數(shù)字圖書(shū)館的智能化服務(wù)。首先,對(duì)云環(huán)境下數(shù)字圖書(shū)館的自適應(yīng)系統(tǒng)內(nèi)容及形式做詳細(xì)介紹;其次,對(duì)關(guān)鍵模塊進(jìn)行了詳細(xì)闡述;最后,運(yùn)用實(shí)例仿真,驗(yàn)證本文方法在數(shù)字圖書(shū)館智能化及個(gè)性化服務(wù)的性能表現(xiàn)。

云計(jì)算;數(shù)字圖書(shū)館;自適應(yīng)系統(tǒng);FCM聚類(lèi);Apriori關(guān)聯(lián)規(guī)則

1 云計(jì)算環(huán)境下的數(shù)字圖書(shū)館

1.1自適應(yīng)系統(tǒng)作用

數(shù)字圖書(shū)館的自適應(yīng)系統(tǒng)在傳統(tǒng)數(shù)字圖書(shū)館的基礎(chǔ)上增加了智能反饋,負(fù)責(zé)適應(yīng)性推送和更新閱讀內(nèi)容、智能檢索以及個(gè)性化首頁(yè)呈現(xiàn)。這種自適應(yīng)系統(tǒng),能夠更好地增強(qiáng)數(shù)字圖書(shū)館的智能化、個(gè)性化和交互性。

自適應(yīng)的其他作用還有個(gè)人首頁(yè)的定制,界面風(fēng)格的個(gè)性化等。用戶首頁(yè)提示用戶的登陸次數(shù),用戶關(guān)注領(lǐng)域的信息更新動(dòng)態(tài),如新書(shū)預(yù)告,資源預(yù)覽等。

1.2自適應(yīng)主要表現(xiàn)形式

1.2.1自適應(yīng)信息檢索

信息檢索是用戶查找資源的主要方法,現(xiàn)有的數(shù)字圖書(shū)館大部分沒(méi)有考慮用戶的差異,對(duì)于所有用戶,輸入相同,反饋搜索結(jié)構(gòu)就相同,用戶要找到自己的需求,還需要在大量的搜索結(jié)果中逐一尋找,搜索效率低。這種方法沒(méi)有考慮用戶的知識(shí)背景、興趣愛(ài)好,自適應(yīng)檢索根據(jù)不同用戶的只是背景及興趣愛(ài)好返回不同的結(jié)果,最接近用戶專(zhuān)業(yè)的結(jié)果將返回在最前頁(yè)。

自適應(yīng)檢索將用戶檢索條件列為關(guān)鍵字列表,將用關(guān)鍵字列表搜索得到的結(jié)果與用戶個(gè)性化信息相結(jié)合,最后返回搜索結(jié)果至頁(yè)面,可以運(yùn)用向量空間和矢量模型將用戶信息進(jìn)行節(jié)點(diǎn)歸類(lèi),并與關(guān)鍵字搜索結(jié)果匹配后進(jìn)行結(jié)果輸出。

1.2.2自適應(yīng)推薦

自適應(yīng)推薦是根據(jù)用戶信息將滿足用戶習(xí)慣的資源進(jìn)行線上線下的個(gè)性化推薦,用戶登錄圖書(shū)館系統(tǒng)后,進(jìn)行在線推送符合用戶習(xí)慣的信息,比如新書(shū)推薦、用戶感興趣領(lǐng)域新文獻(xiàn)等,不再呈現(xiàn)統(tǒng)一的登陸首頁(yè);同時(shí)在線下推薦,當(dāng)有了滿足用戶需求的文獻(xiàn)資料后,及時(shí)通過(guò)郵件和短信方式通知用戶。

2 數(shù)字圖書(shū)館自適應(yīng)系統(tǒng)的關(guān)鍵模塊實(shí)現(xiàn)

2.1用戶數(shù)據(jù)標(biāo)準(zhǔn)化

可以得到原始數(shù)據(jù)矩陣為

獲得原始數(shù)據(jù)之后,便可以對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差變換:

變換之后,所有變量單位量綱都去除,且均值為0,標(biāo)準(zhǔn)差為1,下面進(jìn)行極差變換:

變換之后,所有變量取值均為[0,1]之間。

已經(jīng)建立了原始矩陣后,根據(jù)原始矩陣,建立模糊相似矩陣,模糊相似矩陣表示的是各對(duì)象之間的相似程度,計(jì)算ijr的方法主要有如下6種:

夾角余弦法求解相似系數(shù)

相關(guān)系數(shù)法求解相似系數(shù)

最大最小值法

算術(shù)平均與最小值法

幾何平均與最小值法:

計(jì)算出rij后便可以得到模糊相似矩陣,得到的是不同元素之間的相似度,比如現(xiàn)在可以確定某一用戶的專(zhuān)業(yè)為工科專(zhuān)業(yè),且計(jì)算機(jī)專(zhuān)業(yè)還是通信專(zhuān)業(yè)這兩者之間的相似程度較高,至于用戶具體是什么專(zhuān)業(yè)還需要通過(guò)聚類(lèi)來(lái)完成。

2.2FCM聚類(lèi)

數(shù)字圖書(shū)館的聚類(lèi)主要實(shí)現(xiàn)三方面內(nèi)容:圖書(shū)館資源項(xiàng)聚類(lèi)、用戶檢索項(xiàng)聚類(lèi)、用戶推薦項(xiàng)聚類(lèi)。

根據(jù)圖書(shū)資源項(xiàng)聚類(lèi),可以根據(jù)所有用戶的搜索情況,及用戶的專(zhuān)業(yè)及學(xué)歷,聚類(lèi)分析得到不同圖書(shū)類(lèi)別的需求情況,從而及時(shí)補(bǔ)充供給相應(yīng)圖書(shū);用戶檢索項(xiàng)聚類(lèi)主要是根據(jù)用戶的檢索情況,記錄用戶的搜索偏好,以便為用戶提供個(gè)性化服務(wù),聚類(lèi)分析根據(jù)用戶多次的搜索情況及模糊矩陣結(jié)果,進(jìn)行歸類(lèi),判斷該用戶檢索分類(lèi)屬于哪個(gè)類(lèi)別;用戶推薦類(lèi)是根據(jù)用戶的訪問(wèn)數(shù)據(jù)進(jìn)行聚類(lèi),決定給用戶推薦相關(guān)類(lèi)型的文獻(xiàn)資料。

本文采用模糊聚類(lèi)C算法(FCM)進(jìn)行用戶數(shù)據(jù)聚類(lèi)。首先需要明確4個(gè)基本定義:

定義二:數(shù)據(jù)樣本XA的完整率η:

定義三:數(shù)據(jù)樣本kx對(duì)聚類(lèi)分析的影響因子kα

定義四:數(shù)據(jù)樣本xi與xj之間的相似度βij:

樣本kx與子集的隸屬關(guān)系用來(lái)表示,為了記錄多個(gè)子集的隸屬函數(shù),采用矩陣的方式來(lái)完成,記作

X的模糊C劃分空間fcM:

FCM算法的計(jì)算過(guò)程是在保證目標(biāo)函數(shù)mJ最小的同時(shí),求解劃分矩陣與聚類(lèi)原型的過(guò)程。mJ的計(jì)算表達(dá)式為:

迭代規(guī)則公式如下:

2.3Apriori關(guān)聯(lián)規(guī)則應(yīng)用

關(guān)聯(lián)規(guī)則為自適應(yīng)檢索和自適應(yīng)推薦提供過(guò)濾標(biāo)準(zhǔn)的,當(dāng)用戶輸入關(guān)鍵字進(jìn)行信息檢索時(shí),系統(tǒng)首先會(huì)返回所有關(guān)于該關(guān)鍵字的搜索結(jié)果,然后將這些結(jié)果通過(guò)關(guān)聯(lián)規(guī)則過(guò)濾,優(yōu)先顯示與用戶訪問(wèn)習(xí)慣相關(guān)的內(nèi)容,與用戶搜索習(xí)慣不一致的內(nèi)容放在后續(xù)頁(yè)面顯示,以便最大程度地保證客戶在首頁(yè)就能找到用戶需要的內(nèi)容。

關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,可以根據(jù)用戶檢索資源的某一項(xiàng)因素來(lái)多用戶資源需求的整個(gè)行為模式進(jìn)行判別。

定義1:關(guān)聯(lián)規(guī)則的關(guān)聯(lián)度:即同時(shí)包含X和Y的事務(wù)集與所有事務(wù)集之間的比例,記為support(X?Y)。即:

定義2:關(guān)聯(lián)規(guī)則的可信度:即同時(shí)包含X和Y的事務(wù)集與僅包含X的事務(wù)集之間的比例,記為confidence(X?Y),即:

定義3:當(dāng)項(xiàng)目集關(guān)聯(lián)度support(X)大于閾值minsup,稱(chēng)該項(xiàng)目集是頻繁項(xiàng)目集。

3 結(jié) 語(yǔ)

云計(jì)算為數(shù)字圖書(shū)館建設(shè)提供了便捷,本文從數(shù)字圖書(shū)館的智能化與個(gè)性化服務(wù)角度出發(fā),分析云計(jì)算在數(shù)字圖書(shū)館建設(shè)中所起作用,借助云計(jì)算的強(qiáng)大計(jì)算能力的優(yōu)勢(shì),建立數(shù)字圖書(shū)館的自適應(yīng)系統(tǒng),為用戶提供個(gè)性化服務(wù),這對(duì)數(shù)字圖書(shū)館建設(shè)具有深遠(yuǎn)意義,擁有廣闊的市場(chǎng)應(yīng)用前景。

主要參考文獻(xiàn)

[1]邱瑾,吳丹.協(xié)同信息檢索用戶行為研究方法綜述[J].信息資源管理學(xué)報(bào),2012(1).

[2]王偉.基于數(shù)據(jù)挖掘的圖書(shū)館用戶行為分析與偏好研究[J].情報(bào)科學(xué),2012(3).

10.3969/j.issn.1673-0194.2015.02.125

G250.76

A

1673-0194(2015)02-0170-02

2014-12-26

猜你喜歡
關(guān)聯(lián)檢索聚類(lèi)
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
2019年第4-6期便捷檢索目錄
奇趣搭配
基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
智趣
讀者(2017年5期)2017-02-15 18:04:18
專(zhuān)利檢索中“語(yǔ)義”的表現(xiàn)
基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
芮城县| 广安市| 辽宁省| 巢湖市| 云龙县| 淳化县| 闽侯县| 武威市| 南雄市| 老河口市| 亳州市| 来宾市| 正宁县| 罗定市| 庆城县| 玉屏| 乌恰县| 北票市| 台中县| 平阴县| 分宜县| 天台县| 镇赉县| 威宁| 赫章县| 莱芜市| 河津市| 昭平县| 宜兴市| 澄江县| 平江县| 土默特左旗| 南木林县| 嵊州市| 邵阳县| 陇川县| 大宁县| 兰溪市| 吉林市| 黎城县| 咸阳市|