夏傳鯤 劉思青 王穎峰
在“SG186”工程體系的框架下,河南省電力公司已經(jīng)統(tǒng)一建設(shè)了省公司數(shù)據(jù)倉(cāng)庫(kù),但目前使用者的主體對(duì)象是省公司的用戶,如何此基礎(chǔ)上構(gòu)建地市數(shù)據(jù)倉(cāng)庫(kù),從體系結(jié)構(gòu)和數(shù)據(jù)冗余度等方面來(lái)看,我們可以有以下三種形式
第一,集中式。在省公司的機(jī)房中再建一套地市綜合數(shù)據(jù)庫(kù)系統(tǒng),以實(shí)現(xiàn)地市的決策分析需要,采用單個(gè)物理數(shù)據(jù)庫(kù)中存貯用來(lái)查詢和分析的綜合數(shù)據(jù),所有業(yè)務(wù)系統(tǒng)網(wǎng)省層次部署,地市不部署任何系統(tǒng)。采用此方式可以降低數(shù)據(jù)抽取的網(wǎng)絡(luò)負(fù)擔(dān),但數(shù)據(jù)訪問(wèn)時(shí)需要較好的網(wǎng)絡(luò)支持,但價(jià)格昂貴,開(kāi)發(fā)周期長(zhǎng),需要解決數(shù)據(jù)抽取、實(shí)體化視圖維護(hù)等問(wèn)題。
第二,分布式數(shù)據(jù)倉(cāng)庫(kù)。各數(shù)據(jù)成分分散在多個(gè)不同的物理數(shù)據(jù)庫(kù)中。即在每個(gè)地市建立綜合數(shù)據(jù)庫(kù),每個(gè)站點(diǎn)是一個(gè)自治的本地?cái)?shù)據(jù)倉(cāng)庫(kù),決策在本站點(diǎn)內(nèi)部完成。省公司的中心站點(diǎn)上設(shè)有全局?jǐn)?shù)據(jù)倉(cāng)庫(kù),可進(jìn)行全局決策。這種實(shí)現(xiàn)方式包含有大量的數(shù)據(jù)冗余,對(duì)數(shù)據(jù)的裝載和更新等處理極其復(fù)雜。
第三,虛擬數(shù)據(jù)倉(cāng)庫(kù)。類似于分布式數(shù)據(jù)倉(cāng)庫(kù),其在中心站點(diǎn)上存放的不是各地市供電公司的具體數(shù)據(jù),而是描述這些數(shù)據(jù)的指針。終端用戶通過(guò)指針的方式,利用適當(dāng)?shù)墓ぞ咧苯釉谔摂M的數(shù)據(jù)倉(cāng)庫(kù)中獲取數(shù)據(jù)。它不需要對(duì)數(shù)據(jù)進(jìn)行預(yù)先抽取、綜合,也沒(méi)有數(shù)據(jù)維護(hù)等問(wèn)題,且建造周期短、投資小。
一、虛擬數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)理論基礎(chǔ)
(一)%l選擇
%l選擇也稱為限制,即從大的數(shù)據(jù)倉(cāng)庫(kù)集合中進(jìn)行過(guò)濾和篩選。
%lF(R) = {t | t∈R∧F(t) = TRUE}
選擇關(guān)系具體的語(yǔ)句的形式如下:
SELECTR.a1,…,R.an
FROMR
WHERER.name =鶴壁(或者R.code =100000033)
(二)%i投影
%i投影是從大的數(shù)據(jù)倉(cāng)庫(kù)集中的關(guān)系R中選擇若干屬性組成新的關(guān)系。記作如下:
%in(R) = {T[A] | t∈R}
其中A為R中的屬性列。在我們建設(shè)地市鶴壁的虛擬數(shù)據(jù)倉(cāng)庫(kù)中,投影關(guān)系主要用于以下場(chǎng)合,即是在省公司數(shù)據(jù)倉(cāng)庫(kù)中有一些地市不用關(guān)心的屬性,通過(guò)投影關(guān)系的限定,作為地市的只關(guān)注自己范圍內(nèi)的信息和屬性,極大地保證了省公司數(shù)據(jù)的安全性。
二、虛擬數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
虛擬數(shù)據(jù)倉(cāng)庫(kù)通常采用三層結(jié)構(gòu):
(一)展現(xiàn)層
實(shí)現(xiàn)如何把數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)和分析結(jié)果提供給最終用戶。按照用戶的分析需求,使用報(bào)表、即席查詢、多維分析和數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)展現(xiàn)。展現(xiàn)層是采用IBMCognos8.1作為前端的展現(xiàn)分析工具。虛擬數(shù)據(jù)倉(cāng)庫(kù)透明地支持各種不同需求的終端用戶,通過(guò)語(yǔ)義層在展現(xiàn)層可以實(shí)現(xiàn)整個(gè)組織的統(tǒng)一視圖。
(二)映射層
1.應(yīng)用程序接口:采WebService的方式向數(shù)據(jù)的需求者提供基于XML文件接口,實(shí)現(xiàn)虛擬數(shù)據(jù)倉(cāng)庫(kù)的跨應(yīng)用數(shù)據(jù)共享。
2.數(shù)據(jù)庫(kù)接口:采用數(shù)據(jù)庫(kù)物理視圖實(shí)現(xiàn)數(shù)據(jù)映射,通過(guò)視圖可方便地對(duì)數(shù)據(jù)進(jìn)行重組。另外,將這些數(shù)據(jù)同業(yè)務(wù)規(guī)則捆綁在一起,可滿足機(jī)構(gòu)中某一方面特定應(yīng)用的查詢。
(三)數(shù)據(jù)層
表示實(shí)際的數(shù)據(jù)來(lái)源。它們既可以是各種類型的數(shù)據(jù)庫(kù),也可以是文檔、記錄、聲音、圖象數(shù)據(jù)。它們當(dāng)中既有實(shí)時(shí)數(shù)據(jù),也有歷史數(shù)據(jù);既有專門(mén)的業(yè)務(wù)數(shù)據(jù),也有局部綜合數(shù)據(jù);在地市數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)中,數(shù)據(jù)源包括省公司數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)、地市特有數(shù)據(jù)應(yīng)用。
三、虛擬數(shù)據(jù)倉(cāng)庫(kù)的作用
第一,有利于降低地市數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)成本,虛擬數(shù)據(jù)倉(cāng)庫(kù)節(jié)省了服務(wù)器、存儲(chǔ)設(shè)備和軟件平臺(tái)的投資。
第二,虛擬數(shù)據(jù)倉(cāng)庫(kù)有利于省公司數(shù)據(jù)倉(cāng)庫(kù)的實(shí)用化建設(shè)。
第三,虛擬數(shù)據(jù)倉(cāng)庫(kù)充分利用了省公司的實(shí)體數(shù)據(jù)倉(cāng)庫(kù)資源,建設(shè)速度快,縮短了建設(shè)周期。
第四,維護(hù)方便,虛擬數(shù)據(jù)倉(cāng)庫(kù)通過(guò)映射和指針技術(shù),保證了與省公司數(shù)據(jù)倉(cāng)庫(kù)的一致性,加強(qiáng)了數(shù)據(jù)集中的管理、保證了數(shù)據(jù)的單一出口和數(shù)據(jù)的正確性,增強(qiáng)了數(shù)據(jù)共享的能力,從而獲得完整的業(yè)務(wù)數(shù)據(jù)視圖;
第五,通過(guò)跟蹤分析這些業(yè)務(wù)數(shù)據(jù)信息,管理層可以預(yù)定企業(yè)盈利、生產(chǎn)、安全等方面的計(jì)劃,增強(qiáng)企業(yè)領(lǐng)導(dǎo)決策能力。
四、虛擬數(shù)據(jù)庫(kù)的應(yīng)用
自從虛擬數(shù)據(jù)倉(cāng)庫(kù)概念提出以來(lái),它已經(jīng)在金融、保險(xiǎn)、軍事等部門(mén)得到了廣泛的應(yīng)用。通過(guò)在河南省電力公司鶴壁地市建設(shè)虛擬數(shù)據(jù)中心,很好地實(shí)現(xiàn)了地市的領(lǐng)導(dǎo)輔助決策支持系統(tǒng),不僅建設(shè)周期短,而且建設(shè)成本低,維護(hù)方便。可見(jiàn),電力企業(yè)領(lǐng)域特別是在“SG186”工程的推動(dòng)下,在網(wǎng)省兩級(jí)數(shù)據(jù)中心已經(jīng)全面的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)的唯一性與共享性,建立統(tǒng)一的安全體系,保證數(shù)據(jù)及業(yè)務(wù)系統(tǒng)的訪問(wèn)安全,完善數(shù)據(jù)交換體系,實(shí)現(xiàn)數(shù)據(jù)中心間的級(jí)聯(lián),提升經(jīng)營(yíng)決策的管理能力等領(lǐng)域,虛擬數(shù)據(jù)倉(cāng)庫(kù)也有廣泛的應(yīng)用前景。