国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BI的圖書館信息實時分析系統(tǒng)

2009-11-19 09:16康曉丹季穎斐高海峰
現(xiàn)代情報 2009年9期
關鍵詞:商業(yè)智能

康曉丹 季穎斐 高海峰

〔摘 要〕本文介紹了商業(yè)智能(BI)的基本概念,邏輯組成和主要工具,其中著重介紹了聯(lián)機分析處理(OLAP)技術。探討了將BI技術用于圖書館用戶行為分析的可行性,提出了搭建用戶行為實時分析系統(tǒng)的方案和步驟。最后介紹了使用Cognos BI工具搭建上海大學圖書館用戶行為實時分析系統(tǒng)的實踐。

〔關鍵詞〕商業(yè)智能(BI);實時分析;Cognos

〔中圖分類號〕C931.9 〔文獻標識碼〕B 〔文章編號〕1008-0821(2009)09-0079-04

The Real-time Analysis of Library Information System Based on BI

——Build a Library User Behavior Analysis System with CognosKang Xiaodan Ji Yingfei Gao Haifeng

(Library,Shanghai University,Shanghai 200444,China)

〔Abstract〕The article introduced the base concept and main components of Business Intelligence.Then it focused on introducing the important technical of BI-OLAP.The article discussed the feasibility of the user behavior analysis in library by using BI technical.It made a proposal of how to build a system for the real-time analysis of the user behavior in library.At last the article introduced the practice of building the system for the real-time analysis of the user behavior in Shanghai university library.

〔Key words〕Business Intelligence(BI);real-time analysis;Cognos

在最近十年中,各高校圖書館紛紛建立了本館的圖書館信息管理系統(tǒng)。這些系統(tǒng)記錄本館的書籍采購信息,藏書信息,書籍借閱信息,甚至有些館還將門禁系統(tǒng)與圖書館信息管理系統(tǒng)整合起來,真正達到了信息系統(tǒng)的統(tǒng)一。這些系統(tǒng)記錄了大量的讀者行為信息,但缺乏一種有效的利用方法和手段。如何有效的利用這些信息,以達到為讀者服務的目的,成為目前圖書館工作者需要關注的問題。

圖書館信息系統(tǒng)記錄大量的讀者行為信息,比如借書的次數(shù),借書的類型,借書的平均時間。通過分析這些信息,可以獲得大量對提高服務質量有幫助的信息。在分析用戶行為信息方面,商業(yè)領域通過BI技術的應用,領先了一步。

1 BI概念介紹

BI是Business Intelligence的縮寫。商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,幫助企業(yè)做出明智的業(yè)務經營決策的工具。這里所談的數(shù)據(jù)包括來自企業(yè)業(yè)務系統(tǒng)的訂單、庫存、交易賬目、客戶和供應商等來自企業(yè)所處行業(yè)和競爭對手的數(shù)據(jù)以及來自企業(yè)所處的其他外部環(huán)境中的各種數(shù)據(jù)。而商業(yè)智能能夠輔助的業(yè)務經營決策,既可以是操作層的,也可以是戰(zhàn)術層和戰(zhàn)略層的決策。為了將數(shù)據(jù)轉化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術。因此,從技術層面上講,商業(yè)智能不是什么新技術,它只是數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術的綜合運用。

商業(yè)智能的概念最早在1996年提出。當時將商業(yè)智能定義為一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復等部分組成的、以幫助企業(yè)決策為目的技術及其應用。目前,商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,幫助企業(yè)做出明智的業(yè)務經營決策的工具。這里所談的數(shù)據(jù)包括來自企業(yè)業(yè)務系統(tǒng)的訂單、庫存、交易賬目、客戶和供應商資料及來自企業(yè)所處行業(yè)和競爭對手的數(shù)據(jù),以及來自企業(yè)所處的其他外部環(huán)境中的各種數(shù)據(jù)。而商業(yè)智能能夠輔助的業(yè)務經營決策既可以是操作層的,也可以是戰(zhàn)術層和戰(zhàn)略層的決策。為了將數(shù)據(jù)轉化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術。因此,從技術層面上講,商業(yè)智能不是什么新技術,它只是數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術的綜合運用。

因此把商業(yè)智能看成是一種解決方案應該比較恰當。商業(yè)智能的關鍵是從許多來自不同的企業(yè)運作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進行清理,以保證數(shù)據(jù)的正確性,然后經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合并到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)數(shù)據(jù)的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進行分析和處理(這時信息變?yōu)檩o助決策的知識),最后將知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。

2 BI功能模塊的介紹

2.1 BI的功能模塊

BI由數(shù)據(jù)展現(xiàn)層,數(shù)據(jù)分析層,數(shù)據(jù)挖掘層,數(shù)據(jù)存儲層構成,包括以下功能模塊:

終端用戶查詢和報告工具。專門用來支持初級用戶的原始數(shù)據(jù)訪問,不包括適應于專業(yè)人士的成品報告生成工具。

聯(lián)機分析處理(OLAP)工具。提供多維數(shù)據(jù)管理環(huán)境,其典型的應用是對商業(yè)問題的建模與商業(yè)數(shù)據(jù)分析。OLAP也被稱為多維分析。

數(shù)據(jù)挖掘(Data Mining)軟件。使用諸如神經網(wǎng)絡、規(guī)則歸納等技術,用來發(fā)現(xiàn)數(shù)據(jù)之間的關系,做出基于數(shù)據(jù)的推斷。

數(shù)據(jù)倉庫(Data Warehouse)和數(shù)據(jù)集市(Data Mart)產品。包括數(shù)據(jù)轉換、管理和存取等方面的預配置軟件,通常還包括一些業(yè)務模型,如財務分析模型。

2.2 OLAP技術簡介

OLAP技術是BI的核心技術,它從觀念提出到實用也經歷了漫長的過程。聯(lián)機分析處理(OLAP)的概念最早是由關系數(shù)據(jù)庫之父E.F.Codd于1993年提出的,他同時提出了關于OLAP的12條準則。OLAP的提出引起了很大的反響,OLAP作為一類產品同聯(lián)機事務處理(OLTP)明顯區(qū)分開來。

當今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務處理OLTP(On-Line Transaction Processing)、聯(lián)機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統(tǒng)的關系型數(shù)據(jù)庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易,圖書館管理系統(tǒng)數(shù)據(jù)錄入。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果。

OLAP是使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術。OLAP的目標是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求,它的技術核心是“維”這個概念。

“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分?!熬S”一般包含著層次關系,這種層次關系有時會相當復雜。通過把一個實體的多項重要的屬性定義為多個維(dimension),使用戶能對不同維上的數(shù)據(jù)進行比較。因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。

OLAP的基本多維分析操作有鉆取、切片和切塊、以及旋轉等。

鉆取是改變維的層次,變換分析的粒度。它包括向上鉆取(roll up)和向下鉆取(drill down)。roll up是在某一維上將低層次的細節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而drill down則相反,它從匯總數(shù)據(jù)深入到細節(jié)數(shù)據(jù)進行觀察或增加新維。

切片和切塊是在一部分維上選定值后,關心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有2個,則是切片;如果有3個,則是切塊。

旋轉是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。

2.3 主流BI工具

由于BI正逐漸成為IT系統(tǒng)中不可缺少的一環(huán),所以許多公司開發(fā)出了BI的專用工具。主要有Cognos,水晶報表(Crystal),微軟的Micro Strategy,Oracle Data Warehouse工具,BO(Business Object),BRIO等。

3 基于BI的圖書館用戶行為分析

從上世紀90年代起,幾乎所有圖書館都部署了如圖書館管理信息系統(tǒng),圖書信息聯(lián)機查詢系統(tǒng),門禁系統(tǒng)等多樣的IT系統(tǒng)。這些系統(tǒng)一方面有效的提高了圖書館的工作效率,為廣大用戶提供了方便,另一方面也產生了大量用戶行為數(shù)據(jù)。如何利用這些數(shù)據(jù)為圖書館的管理提供決策支持分析,就顯得極為重要。

將BI系統(tǒng)引入圖書館,圖書館管理人員首先通過數(shù)據(jù)建模,建立圖書館用戶行為分析模型,使用BI系統(tǒng)根據(jù)數(shù)據(jù)模型的需要,獲取數(shù)據(jù),清洗數(shù)據(jù),轉化數(shù)據(jù),展現(xiàn)數(shù)據(jù)。從而達到動態(tài)分析的目的。

3.1 數(shù)據(jù)建模

數(shù)據(jù)建模是BI系統(tǒng)搭建的一個重要過程,也是決定一個BI系統(tǒng)成功與否的重要過程,在建模之前,應該從業(yè)務部門和決策部門獲取相關有效信息,包括:能提供的數(shù)據(jù)源以及決策部門所希望獲得的動態(tài)分析結果。建模的整個過程如圖1所示。

3.2 數(shù)據(jù)獲取

在完成數(shù)據(jù)建模后,可以通過抽取工具,從現(xiàn)有的圖書館管理系統(tǒng),門禁系統(tǒng)等IT系統(tǒng)中獲取用戶行為信息的原始信息。將這些IT系統(tǒng)的數(shù)據(jù)庫作為數(shù)據(jù)源,抽取有效信息的表。例如可以將管理系統(tǒng)中借書信息,門禁系統(tǒng)中用戶進入信息等數(shù)據(jù)從其原始數(shù)據(jù)源中抽取出來。

3.3 數(shù)據(jù)清洗

在獲得原始數(shù)據(jù)后,由于原始數(shù)據(jù)包含了很多沒有價值的,與客戶需求無關的數(shù)據(jù),我們定義其為“臟數(shù)據(jù)”,必須對這些原始數(shù)據(jù)進行清洗后才能被分析系統(tǒng)所使用。數(shù)據(jù)清洗將去除原始數(shù)據(jù)表中多余的字段。

3.4 數(shù)據(jù)轉化

經過數(shù)據(jù)清洗后,我們獲得了干凈的數(shù)據(jù),但這些數(shù)據(jù)仍不能直接使用,需要根據(jù)前端數(shù)據(jù)展現(xiàn)需求將其轉化為前端展現(xiàn)可以直接讀取的數(shù)據(jù)。數(shù)據(jù)轉化包括數(shù)據(jù)合并,數(shù)據(jù)鏈接等多種手段。

3.5 數(shù)據(jù)展現(xiàn)

數(shù)據(jù)展現(xiàn)是BI系統(tǒng)的重要環(huán)節(jié)之一,它需要將前面各階段獲得的數(shù)據(jù)有組織的展現(xiàn)給業(yè)務的決策者。并允許使用者自主的使用鉆取,切片,切塊以及旋轉等手段去使用這些數(shù)據(jù)來進行決策支持。

4 基于Cognos的圖書館實時信息分析系統(tǒng)實踐

Cognos是一家專業(yè)提供BI支持工具的公司,目前屬于IBM旗下。Cognos的Power Play是業(yè)界比較流行BI系統(tǒng)解決方案。擁有以下特點:

(1)輕量級BI工具,快速部署;

(2)友好的用戶界面;

(3)簡便直觀的顯示方式和趨勢分析;

(4)多種手段的展現(xiàn)方式;

(5)簡單易用的建模工具。

基于Cognos以上優(yōu)點,將它作為圖書館實時分析系統(tǒng)的解決方案平臺的首選。

4.1 系統(tǒng)建模

數(shù)據(jù)源定義:數(shù)據(jù)主要來源于館內使用的Horizon管理系統(tǒng)和門禁系統(tǒng)。

決策分析需求:館內圖書某一時間段內的借閱量,某一類書籍借閱用戶的分布;某專業(yè)學生借閱書籍類型分布;某專業(yè)學生使用閱覽室類型分布等。

建模:根據(jù)業(yè)務部門提供的數(shù)據(jù)源以及決策分析需求,對數(shù)據(jù)表進行分析,并找出關聯(lián)字段,建立鏈接,進而通過Cognos的建模工作Framework進行Cube立方體數(shù)據(jù)模型。如圖2所示。

4.2 數(shù)據(jù)獲取,清洗和轉化

根據(jù)數(shù)據(jù)模型,設置BI系統(tǒng)的數(shù)據(jù)源,將HORIZON系統(tǒng)和門禁系統(tǒng)數(shù)據(jù)庫設置為數(shù)據(jù)源定時抽取數(shù)據(jù)。

將抽取的數(shù)據(jù)根據(jù)模型需求進行清洗,只保留與決策業(yè)務分析有關的數(shù)據(jù)字段。

將清洗后的數(shù)據(jù),根據(jù)字段關聯(lián),進行數(shù)據(jù)合并,整理出書籍情況基本表,學生情況基本表,借閱情況基本表,分析基本表等多個基本表,然后通過學生ID,書籍ID,等關鍵字段進行數(shù)據(jù)表關聯(lián)。

4.3 數(shù)據(jù)展現(xiàn)

根據(jù)決策需求,將組織化的數(shù)據(jù),以多維的形式展現(xiàn)給業(yè)務數(shù)據(jù)決策使用者??梢酝ㄟ^學生分布,書籍分布,館藏資源使用分布,借閱時間分布等多個維度進行數(shù)據(jù)的鉆取,切片,切塊以及旋轉。以最大程度的滿足決策者的需求。其中查詢界面如圖3所示。

5 結 語

目前在圖書館使用BI技術搭建用戶行為分析和決策支持系統(tǒng)還處于起步階段,各種理論和解決方案也都在探討過程中,希望通過上海大學圖書館在這方面的實踐工作為這一領域的研究和發(fā)展提供借鑒。

參考文獻

[1]熊繼佑.淺談商業(yè)智能[J].計算機與現(xiàn)代化,2003,(8):23-24.

[2]王冬梅,等.智能企業(yè)門戶的關鍵技術研究[J].情報科學,2008,(7):1085-1090.

[3]劉業(yè)政,胡劍.商業(yè)智能的核心技術及體系結構研究[J].合肥工業(yè)大學學報:自然科學版,2004,(8):882-885.

[4]范方.數(shù)據(jù)挖掘技術在CRM中的分析應用[J].大眾科技,2008,(7):32,31.

[5]王晉.數(shù)據(jù)挖掘技術在電信企業(yè)客戶關系管理中的應用研究[D].蘭州理工大學,2007.[6]鄭永彪,肖榮閣,等.商業(yè)智能在企業(yè)中的運用及發(fā)展趨勢初探[J].現(xiàn)代管理科學,2008,(8):63-64,101.

猜你喜歡
商業(yè)智能
什么是商業(yè)智能?它的定義和解決方案
關于實時商業(yè)智能的文獻綜述
商業(yè)智能在當下出版社中的運用
廣東省高速公路聯(lián)網(wǎng)綜合信息商業(yè)智能系統(tǒng)