国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OLAP技術(shù)的數(shù)字圖書館數(shù)字資源利用分析

2009-10-19 09:07譚春曦
新媒體研究 2009年17期
關(guān)鍵詞:數(shù)字資源

[摘要]詮釋OLAP聯(lián)機分析技術(shù)在數(shù)字圖書館“數(shù)字資源利用分析”多維數(shù)據(jù)庫中的應(yīng)用;簡述數(shù)字圖書館“數(shù)字資源利用分析”多維數(shù)據(jù)庫MDDB模型的設(shè)計。

[關(guān)鍵詞]OLAP 數(shù)字資源 多維數(shù)據(jù)庫 聯(lián)機分析

中圖分類號:TP-9文獻標識碼:A文章編號:1671-7597(2009)0910130-01

OLAP(On-Line Analytical Processing)在線聯(lián)機分析處理技術(shù),是對特定主題進行聯(lián)機查詢、分析處理,從多角度對數(shù)據(jù)深入了解,將復雜的多維數(shù)據(jù)以靈活、直觀的查詢結(jié)果提供給決策人員、管理人員以供決策分析的軟件技術(shù)。目前,高校圖書館投入大量經(jīng)費購買國內(nèi)外學術(shù)數(shù)據(jù)庫數(shù)字資源,但對需求利用、資源選擇、投入效應(yīng)缺乏具體分析措施,存在盲目投資;數(shù)字資源膨脹、重疊現(xiàn)象。OLAP聯(lián)機分析技術(shù)用于數(shù)字圖書館數(shù)字資源利用分析,將數(shù)字圖書館購買的各學術(shù)數(shù)據(jù)庫在一定時期內(nèi)用戶以各種方式訪問的利用情況以表格的形式加以描述,建立“數(shù)字資源利用分析”多維數(shù)據(jù)庫MDDB(multi dimensional database),對數(shù)字資源利用狀況進行量化,分析數(shù)字資源利用效益,優(yōu)化數(shù)字資源利用。

一、基于OLAP技術(shù)的數(shù)字資源利用分析模型

(一)確定維表與事數(shù)表

“數(shù)字資源利用分析”的多維數(shù)據(jù)庫應(yīng)先確定四個維表、一個事實表。描述數(shù)字圖書館購進學術(shù)數(shù)據(jù)庫在本年內(nèi)用戶以各種方式訪問的次數(shù)。

四個維表:1.時間ID:月份;2.數(shù)據(jù)庫ID:CNKI數(shù)據(jù)庫、RSC英國皇家化學會電子刊、維普科技期刊、萬方數(shù)據(jù)庫(筆者所在圖書館購進24個國內(nèi)外學術(shù)數(shù)據(jù)庫,由于篇幅有限只列舉以上幾個);3.訪問方式ID:瀏覽、檢索、登錄、下載、引用;4.用戶ID:化工學院、高分子科學工程學院、機電學院、信息科學技術(shù)學院等。

事實表描述多維模型維度的交叉點:時間、購買數(shù)據(jù)庫、訪問方式、利用值。

(二)建立“數(shù)字資源利用分析”的多維數(shù)據(jù)庫MDDB的立方體模型

“數(shù)字資源利用分析”的三維立方體模型如(圖1)所示,實為一個四維數(shù)組(維1,維2,維3,數(shù)值變量),創(chuàng)建本模型目的不在觀察其結(jié)構(gòu),而是描述三維交點表達的變量,如(圖1)本模型描述的是數(shù)字資源的利用值,如利用值A(chǔ)(萬方數(shù)據(jù)庫,4月,檢索,1250次)即萬方數(shù)據(jù)庫在4月份被檢索1250次。需要說明的是數(shù)據(jù)資源利用總值不能簡單地將各利用方式次數(shù)相加,瀏覽、檢索、登錄、下載、引用依次反映的利用價值權(quán)數(shù)(利用值/次數(shù))是逐漸上升的,應(yīng)分別給予逐漸上升的權(quán)數(shù):W1、W2、W3、W4、W5,如萬方數(shù)據(jù)庫換算出的利用值U=瀏覽次數(shù)*W1+檢索次數(shù)*W2+登錄次數(shù)*W3+下載次數(shù)*W4+引用次數(shù)*W5。

二、基于0LAP技術(shù)的數(shù)字資源利用模型聯(lián)機分析技術(shù)

目前數(shù)據(jù)庫供應(yīng)商以捆綁式整體銷售,數(shù)字資源利用分析模型維度鎖定各大數(shù)據(jù)庫中,而圖書館非常關(guān)注按分庫、篇、刊購買方式,可預見未來數(shù)字資源購買將打破整盤預定方式,如CNKI數(shù)據(jù)庫有十個分數(shù)據(jù)庫,萬方數(shù)據(jù)庫有五大分數(shù)據(jù)庫;用戶維學院可細分為系,系又可細分為專業(yè);時間維可細分為季度、月、日。這樣在原維表上出現(xiàn)分支,原ROLAP(Rela

tional OLAP)星型模型中的數(shù)據(jù)庫資源、用戶、時間、維表變成了事實表,而它們的分支出現(xiàn)了新的維表,形成MOLAP(Multidimensional OLAP)雪花模型構(gòu)架的多層維表組成的結(jié)構(gòu)。

在以MOLAP雪花型架構(gòu)創(chuàng)建了“數(shù)據(jù)資源利用分析”MDDB模型后,為深入了解立方體數(shù)據(jù)中的信息,OLAP聯(lián)機分析引擎從多個角度可利用切片、切塊、鉆取、旋轉(zhuǎn)技術(shù)剖析數(shù)據(jù),從更深、更細的層次對數(shù)據(jù)模型進行分析。

(一)數(shù)字資源利用分析模型的切片、切塊分析

模型切片(slice)分析是針對某一維成員進行分析操作的,如在(圖1)維普維上橫切片可研究維普數(shù)據(jù)庫的利用情況,得(圖2)橫切片,分析維普數(shù)據(jù)庫每月以各種方式訪問的次數(shù)及利用值;豎切片可分析某月份所有數(shù)據(jù)資源數(shù)據(jù)庫訪問情況或以某種利用方式訪問數(shù)資源數(shù)據(jù)庫情況。

模型切塊(dice)從“數(shù)字資源利用分析”立方體模型中抽出一個子立方體進行分析,可以看成多次切片疊合而成,提供不同數(shù)據(jù)資源、月份、訪問方式之間進行比較。

(二)數(shù)字資源利用模型的鉆取分析

在MOLAP雪花模型結(jié)構(gòu)中,維成員是有層次的,OLAP的鉆取分析提供了在各不同維層次中的聚合與細分,上鉆取(drill-up)、下鉆取(drill-down)。

上鉆取亦稱聚合,它是在維層次中將低層次維的數(shù)據(jù)匯總到高層次維的數(shù)據(jù),如在時間維一、二、三月份中上鉆取可得一季度的數(shù)字資源利用值。

下鉆取是上鉆取的反運算,它是從匯總的維層次數(shù)據(jù)深入到細節(jié)層次數(shù)據(jù)或在最底維層次上增加新的維分支,詳細了解立方體中的具體利用情況。

筆者所在學校數(shù)學圖書館已購買24個國內(nèi)外著名的數(shù)據(jù)庫數(shù)字資源,現(xiàn)已研制出“數(shù)字資源利用分析”的基本模型,下一步將研制開發(fā)利用SQL server語言創(chuàng)建“數(shù)字資源利用分析數(shù)據(jù)庫”,利用數(shù)據(jù)庫結(jié)構(gòu)查詢語言

SQL Server的Analysis Manager控制臺中的“共享維度”、“多維數(shù)據(jù)集”創(chuàng)建存儲時間維、數(shù)據(jù)庫資源維、訪問方式維及數(shù)據(jù)集事實表。利用OLAP工具具體分析各大數(shù)據(jù)庫利用情況(待續(xù))。重組數(shù)字資源,實現(xiàn)數(shù)字資源最佳配置。

參考文獻:

[1]王麗珍、周麗華等,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用[M].北京:科學出版社,2005.

[2]張云濤、龔玲,數(shù)據(jù)挖掘原理與技術(shù)[M].北京:電子工業(yè)出版社,2004.

[3]http://library.qust.edu.cn/old/ziyuan.asp.

作者簡介:

譚春曦(1962-),女,館員,從事電子信息資源研究。

猜你喜歡
數(shù)字資源
發(fā)現(xiàn)系統(tǒng)對圖書館數(shù)字資源構(gòu)建的影響
山東省新建本科院校圖書館數(shù)字資源建設(shè)研究
淺談數(shù)字資源在小學數(shù)學課堂的有效提高運用
圖書館數(shù)字資源評價指標權(quán)重賦值方法概述
美術(shù)教科書使用應(yīng)把握的幾個視角
圖書館員新角色
高校數(shù)字資源云服務(wù)平臺的建設(shè)研究
新媒體時代的多元化閱讀推廣實踐
利用數(shù)字資源優(yōu)化語文童話教學研究
圖書館與出版企業(yè)數(shù)字資源共享的環(huán)境因素分析