王春杰, 朱保鋒
(1.鄭州大學(xué)第一附屬醫(yī)院 病案管理科,河南 鄭州 450002;
2.河南教育學(xué)院 信息技術(shù)系,河南 鄭州 450046)
?
校園信息化中數(shù)據(jù)共享問(wèn)題的研究及解決方案
王春杰1, 朱保鋒2
(1.鄭州大學(xué)第一附屬醫(yī)院 病案管理科,河南 鄭州 450002;
2.河南教育學(xué)院 信息技術(shù)系,河南 鄭州 450046)
摘要:通過(guò)分析目前校園網(wǎng)存在的問(wèn)題,提出了一個(gè)新的校園網(wǎng)信息化設(shè)計(jì)方案,即利用共享數(shù)據(jù)庫(kù)實(shí)現(xiàn)各個(gè)業(yè)務(wù)管理部門(mén)數(shù)據(jù)的共享.共享數(shù)據(jù)庫(kù)實(shí)現(xiàn)的重點(diǎn)是共享數(shù)據(jù)的整合和訂閱,利用Oracle提供的工具,使數(shù)據(jù)在共享庫(kù)和業(yè)務(wù)庫(kù)中傳遞.校園網(wǎng)在引入共享庫(kù)后,能夠把全校的公共信息集中起來(lái),通過(guò)各種標(biāo)準(zhǔn)的引入,能夠?qū)崿F(xiàn)全校數(shù)據(jù)的統(tǒng)一管理,為各個(gè)業(yè)務(wù)部門(mén)提供數(shù)據(jù)支持,為今后進(jìn)行數(shù)據(jù)挖掘打好基礎(chǔ).
關(guān)鍵詞:信息化;共享數(shù)據(jù)庫(kù);數(shù)據(jù)整合;數(shù)據(jù)訂閱;數(shù)據(jù)傳遞
0引言
在信息化建設(shè)過(guò)程中,很多學(xué)校沒(méi)有意識(shí)到整體規(guī)劃的重要性和必要性,沒(méi)有基于整個(gè)學(xué)校考慮的統(tǒng)一的信息系統(tǒng).各個(gè)業(yè)務(wù)部門(mén)根據(jù)自己的需要進(jìn)行部門(mén)級(jí)的信息系統(tǒng)開(kāi)發(fā),由于各個(gè)部門(mén)信息化程度不同,所使用的數(shù)據(jù)庫(kù)系統(tǒng)也不同,這就造成了資源的浪費(fèi)和共享的困難.具體來(lái)講,主要有以下幾個(gè)問(wèn)題:(1)學(xué)校的業(yè)務(wù)管理信息系統(tǒng)平臺(tái)不同,數(shù)據(jù)類(lèi)型各異,導(dǎo)致大多數(shù)應(yīng)該共享的數(shù)據(jù)重復(fù)錄入,無(wú)法統(tǒng)一使用和共享;(2)學(xué)校對(duì)信息的規(guī)范沒(méi)有統(tǒng)一,缺少統(tǒng)一規(guī)劃,導(dǎo)致信息標(biāo)準(zhǔn)混亂,信息不能交流和共享;(3)業(yè)務(wù)系統(tǒng)只注重其自身業(yè)務(wù)方面的信息,不能提供教師或?qū)W生所涉及的全面信息的查詢服務(wù)[1].
由此,筆者引入了共享數(shù)據(jù)庫(kù),將各個(gè)業(yè)務(wù)部門(mén)的基本數(shù)據(jù)進(jìn)行集中整理,實(shí)現(xiàn)統(tǒng)一管理,保證數(shù)據(jù)的權(quán)威和準(zhǔn)確,為各個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)、服務(wù)系統(tǒng)和電子校務(wù)系統(tǒng)提供數(shù)據(jù)支持.
1共享數(shù)據(jù)庫(kù)平臺(tái)
共享數(shù)據(jù)庫(kù)平臺(tái)是校園信息化各應(yīng)用系統(tǒng)之間信息共享的平臺(tái),為整個(gè)學(xué)校的信息查詢和決策分析提供全面的數(shù)據(jù).按照共享數(shù)據(jù)庫(kù)平臺(tái)各個(gè)模塊的功能,系統(tǒng)可以分成以下3個(gè)組成部分:共享數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)存儲(chǔ)模塊,即共享數(shù)據(jù)庫(kù);共享數(shù)據(jù)庫(kù)功能設(shè)計(jì)開(kāi)發(fā)模塊;共享數(shù)據(jù)庫(kù)客戶展示模塊.
2共享數(shù)據(jù)庫(kù)
共享數(shù)據(jù)庫(kù)在整個(gè)共享數(shù)據(jù)庫(kù)平臺(tái)中是核心,建立在學(xué)校業(yè)務(wù)系統(tǒng)或業(yè)務(wù)數(shù)據(jù)之上.它向下從業(yè)務(wù)庫(kù)集成數(shù)據(jù)并保持同步更新,成為各個(gè)業(yè)務(wù)系統(tǒng)之間的共享數(shù)據(jù)通道;向上作為統(tǒng)計(jì)分析服務(wù)的數(shù)據(jù)源,向統(tǒng)計(jì)分析服務(wù)提供從各個(gè)業(yè)務(wù)系統(tǒng)集成過(guò)來(lái)的共享數(shù)據(jù)[2].
在整個(gè)校園網(wǎng)中,共享庫(kù)是唯一的,而業(yè)務(wù)庫(kù)則有多個(gè),共享庫(kù)通過(guò)各個(gè)業(yè)務(wù)系統(tǒng)與各個(gè)業(yè)務(wù)庫(kù)相聯(lián)系.共享庫(kù)集中存儲(chǔ)了公共字典和共享數(shù)據(jù),其中公共字典存儲(chǔ)了參照標(biāo)準(zhǔn)(國(guó)家標(biāo)準(zhǔn)、教育部標(biāo)準(zhǔn)及其他標(biāo)準(zhǔn))和執(zhí)行標(biāo)準(zhǔn)(學(xué)校當(dāng)前實(shí)際執(zhí)行的標(biāo)準(zhǔn)),為數(shù)據(jù)的標(biāo)準(zhǔn)提供了依據(jù).
共享庫(kù)與業(yè)務(wù)庫(kù)之間的關(guān)系如圖1所示.共享庫(kù)管理員利用數(shù)據(jù)建模工具對(duì)公共字典和共享數(shù)據(jù)結(jié)構(gòu)進(jìn)行定義,利用公共字典管理工具對(duì)公共字典進(jìn)行管理或維護(hù);共享庫(kù)DBA(Database Administrator)向業(yè)務(wù)系統(tǒng)提出共享數(shù)據(jù)輸出要求,業(yè)務(wù)系統(tǒng)管理員按照共享庫(kù)要求組織數(shù)據(jù)(模式和共享庫(kù)提供的模式一致);業(yè)務(wù)系統(tǒng)管理員向共享庫(kù)提出數(shù)據(jù)訂閱申請(qǐng),共享庫(kù)DBA對(duì)訂閱申請(qǐng)進(jìn)行確認(rèn),并提供訂閱輸出.
3共享數(shù)據(jù)庫(kù)功能設(shè)計(jì)開(kāi)發(fā)
圖1 共享數(shù)據(jù)庫(kù)與業(yè)務(wù)數(shù)據(jù)庫(kù)關(guān)系Fig.1 The relationship between shared database and services database
共享數(shù)據(jù)庫(kù)功能設(shè)計(jì)開(kāi)發(fā)模塊是共享數(shù)據(jù)庫(kù)與各業(yè)務(wù)庫(kù)連接的橋梁,它的主要操作方式是通過(guò)ETL(Extract、Transform、Load)將預(yù)先定義好的數(shù)據(jù)加載到共享數(shù)據(jù)庫(kù)中,抽取主要內(nèi)容對(duì)共享數(shù)據(jù)進(jìn)行整合和訂閱.
綜合考慮原始決策表的離散化過(guò)程與最終得到的極小決策算法,得到的按路徑2離散化后故障分級(jí)的決策規(guī)則用自然語(yǔ)言可解釋為:當(dāng)評(píng)價(jià)指標(biāo)a2的量化值處于86~93之間時(shí),決策對(duì)象應(yīng)劃分為關(guān)鍵故障灰類(lèi);當(dāng)評(píng)價(jià)指標(biāo)a2的量化值處于70~85之間,且評(píng)價(jià)指標(biāo)a3的量化值不低于72時(shí),決策對(duì)象應(yīng)劃分為主要故障灰類(lèi);當(dāng)評(píng)價(jià)指標(biāo)a2的量化值低于86,且評(píng)價(jià)指標(biāo)a3的量化值低于72時(shí),決策對(duì)象應(yīng)劃分為次要故障灰類(lèi)。
3.1共享數(shù)據(jù)的整合
共享庫(kù)要獲得業(yè)務(wù)庫(kù)中的數(shù)據(jù),就要使用數(shù)據(jù)整合工具(Oracle公司提供的Oracle WareHouse Builder,OWB),將業(yè)務(wù)庫(kù)中可以提供的共享數(shù)據(jù),按照共享庫(kù)中的數(shù)據(jù)模式,抽到共享庫(kù)中,從而形成可供業(yè)務(wù)系統(tǒng)訂閱的共享數(shù)據(jù).通過(guò)OWB能很容易地把各個(gè)業(yè)務(wù)庫(kù)中的數(shù)據(jù)整合到共享庫(kù)中.比如,整合教務(wù)數(shù)據(jù)庫(kù)中的學(xué)生信息表,其詳細(xì)內(nèi)容如表1所示.
表1 學(xué)生信息表T_XSXXB
學(xué)生信息表的內(nèi)容要想進(jìn)入到共享庫(kù)中,就必須被拆分、整理為兩張表:學(xué)生基本信息表和學(xué)生詳細(xì)信息表(表2、表3).對(duì)學(xué)生信息表中的部分字段進(jìn)行select查詢,將結(jié)果生成學(xué)生基本信息表(圖2);同樣,可以生成學(xué)生詳細(xì)信息表.
表2 學(xué)生基本信息表T_XSJBXXB
表3 學(xué)生詳細(xì)信息表T_XSXXXXB
在拆分的過(guò)程中,如遇到以下情況,需要單獨(dú)處理.
(1)出現(xiàn)空缺值.錄入人員在進(jìn)行數(shù)據(jù)錄入時(shí),可能認(rèn)為某些屬性不重要而將之忽略了,但在數(shù)據(jù)提取和決策分析中可能要用到這些數(shù)據(jù),因而需要為屬性填上空缺的值.一般的做法是使用一個(gè)全局常量填寫(xiě)空缺值.
圖2 學(xué)生基本信息表的生成Fig.2 The generation of student’s detailed information table
(2)數(shù)據(jù)類(lèi)型的不一致.如果出現(xiàn)學(xué)生基本信息表中 “學(xué)號(hào)”在有些數(shù)據(jù)庫(kù)中用的是變長(zhǎng)字符型,而在另外的數(shù)據(jù)源中用的是整型,在共享庫(kù)中用的則是定長(zhǎng)字符類(lèi)型,這時(shí)一般采用數(shù)據(jù)庫(kù)本身提供的轉(zhuǎn)換函數(shù)就能夠解決,如DB2中的CHAR(INTERGER)函數(shù)可以將整型轉(zhuǎn)換成字符串類(lèi)型[3].
(3)屬性值的表示方法不同.對(duì)于同一屬性值在不同的數(shù)據(jù)庫(kù)中有不同的表示方法.例如性別的表示,有些數(shù)據(jù)源采用的是“男”和“女”,而另外一些數(shù)據(jù)源則采用的是“m”和“f”,此時(shí)可以用標(biāo)準(zhǔn)SQL語(yǔ)句case…when實(shí)現(xiàn)轉(zhuǎn)換:
when xb=‘女’ then ‘f’
end xb from student.
3.2共享數(shù)據(jù)的訂閱
共享數(shù)據(jù)訂閱是指業(yè)務(wù)系統(tǒng)通過(guò)數(shù)據(jù)訂閱服務(wù)對(duì)共享庫(kù)中的共享數(shù)據(jù)進(jìn)行訂閱,從而獲得共享庫(kù)中可供共享的數(shù)據(jù).共享數(shù)據(jù)庫(kù)是借用數(shù)據(jù)建模中權(quán)限設(shè)置的功能,按照權(quán)限組對(duì)共享數(shù)據(jù)進(jìn)行訪問(wèn).共享數(shù)據(jù)庫(kù)提供了一套訪問(wèn)共享數(shù)據(jù)的訪問(wèn)接口,包括Java程序接口和XML(Extensible Markup Language)數(shù)據(jù)包接口,用戶通過(guò)數(shù)據(jù)訪問(wèn)服務(wù)訪問(wèn)共享數(shù)據(jù)庫(kù).
在各個(gè)業(yè)務(wù)系統(tǒng)中,業(yè)務(wù)系統(tǒng)通過(guò)數(shù)據(jù)訂閱的方式,在自己的權(quán)限內(nèi)獲得共享庫(kù)中的數(shù)據(jù).根據(jù)共享庫(kù)與業(yè)務(wù)庫(kù)之間數(shù)據(jù)庫(kù)的不同,數(shù)據(jù)訂閱可分為同構(gòu)方式和異構(gòu)方式.同構(gòu)方式是共享庫(kù)與業(yè)務(wù)庫(kù)采用相同的數(shù)據(jù)庫(kù),異構(gòu)方式是系統(tǒng)庫(kù)與業(yè)務(wù)庫(kù)采用不同的數(shù)據(jù)庫(kù).同構(gòu)環(huán)境下數(shù)據(jù)的訂閱線路圖如圖3所示.
圖3 同構(gòu)環(huán)境下數(shù)據(jù)訂閱線路圖Fig.3 Date subscriber line graph isomorphism environment
教務(wù)庫(kù)(數(shù)據(jù)庫(kù)采用Oracle 9)要訂閱共享庫(kù)中的國(guó)家地區(qū)字典,具體步驟如下:
(1)教務(wù)系統(tǒng)提出訂閱要求并進(jìn)行數(shù)據(jù)訂閱.教務(wù)系統(tǒng)通過(guò)管理員向共享庫(kù)提出訂閱的要求:訂閱共享庫(kù)中的國(guó)家地區(qū)字典信息.
(2)共享庫(kù)進(jìn)行訂閱審核.共享庫(kù)通過(guò)DBA對(duì)教務(wù)系統(tǒng)訂閱的國(guó)家地區(qū)字典信息進(jìn)行審核.
(3)共享庫(kù)為教務(wù)系統(tǒng)提供表結(jié)構(gòu)和訪問(wèn)賬號(hào).在共享庫(kù)中首先為教務(wù)系統(tǒng)建立一個(gè)訪問(wèn)用戶并為該用戶授權(quán).授權(quán)包括對(duì)象權(quán)限——國(guó)家地區(qū)信息表T_BZGB_GJDQ的讀權(quán)限和系統(tǒng)權(quán)限(CREATE SESSION),其中前者確保業(yè)務(wù)系統(tǒng)可以從表中讀出內(nèi)容,后者確保業(yè)務(wù)系統(tǒng)可以該用戶的身份創(chuàng)建dblink連接到共享庫(kù).共享庫(kù)管理員為教務(wù)系統(tǒng)建立好用戶并授權(quán)以后,將用戶名和密碼、國(guó)家地區(qū)信息表T_BZGB_GJDQ的表結(jié)構(gòu)提交給教務(wù)系統(tǒng).
(4)教務(wù)系統(tǒng)庫(kù)通過(guò)訪問(wèn)賬號(hào)將信息訂閱到本地教務(wù)系統(tǒng),收到共享庫(kù)管理員提供的信息后,開(kāi)始實(shí)現(xiàn)對(duì)公共字典——國(guó)家地區(qū)信息表的訂閱.先由教務(wù)系統(tǒng)管理員創(chuàng)建連接到共享庫(kù)的dblink,然后通過(guò)dblink取出源表中的信息創(chuàng)建實(shí)體化視圖.至此,業(yè)務(wù)庫(kù)就擁有了從共享庫(kù)訂閱的國(guó)家地區(qū)代碼信息,其中創(chuàng)建實(shí)體化視圖DDL(Data Definition Language)中的“USR_SYS.T_BZGB_GJDQ”,是教務(wù)系統(tǒng)中所建的實(shí)體化視圖的方案(USR_SYS)和名稱(chēng)(T_BZGB_GJDQ),可以替換成應(yīng)用中所需要的方案和名稱(chēng).
4共享數(shù)據(jù)庫(kù)客戶展示模塊
此模塊的主要功能是展現(xiàn)數(shù)據(jù)庫(kù)中的數(shù)據(jù)及其結(jié)構(gòu),并可進(jìn)行數(shù)據(jù)分析,對(duì)數(shù)據(jù)和結(jié)構(gòu)進(jìn)行修改,主要內(nèi)容是OLAP(On-Line Analytical Processing)庫(kù),同時(shí)還提供了一些數(shù)據(jù)工具.
在共享庫(kù)中存儲(chǔ)了大量的共享信息,某些情況下數(shù)據(jù)有可能成為歷史數(shù)據(jù),如學(xué)生畢業(yè)離?;蚪搪毠ふ{(diào)出本單位時(shí),這些不再需要的共享數(shù)據(jù)就要放入歷史數(shù)據(jù)庫(kù).歷史數(shù)據(jù)庫(kù)在整個(gè)共享數(shù)據(jù)中心有兩個(gè)作用,一是對(duì)歷史數(shù)據(jù)進(jìn)行備份,二是作為共享數(shù)據(jù)庫(kù)和OLAP庫(kù)的中間數(shù)據(jù)集成地.
OLAP庫(kù)是此模塊的基礎(chǔ),它對(duì)歷史數(shù)據(jù)進(jìn)行再次抽取提成,獲得查詢、統(tǒng)計(jì)、分析的基礎(chǔ)數(shù)據(jù),形成整個(gè)數(shù)字化校園的核心數(shù)據(jù)集.聯(lián)機(jī)分析處理是針對(duì)特定的分析主題,設(shè)計(jì)多種可能的觀察形式,設(shè)計(jì)相應(yīng)的分析主題結(jié)構(gòu)(即進(jìn)行事實(shí)表和維護(hù)表的設(shè)計(jì)),使管理決策人員在多維數(shù)據(jù)模型的基礎(chǔ)上進(jìn)行快速、穩(wěn)定的交互訪問(wèn),并進(jìn)行各種復(fù)雜的分析和預(yù)測(cè)工作.
5結(jié)論
本文闡述了共享數(shù)據(jù)庫(kù)的概念及實(shí)現(xiàn)方法,為校園網(wǎng)中信息系統(tǒng)數(shù)據(jù)共享提供了解決方案.在校園網(wǎng)中引入共享數(shù)據(jù)庫(kù)后,通過(guò)引入各種標(biāo)準(zhǔn),保證數(shù)據(jù)的一致性.各業(yè)務(wù)系統(tǒng)可以從開(kāi)發(fā)平臺(tái)獲得所需的共享數(shù)據(jù)[4],實(shí)現(xiàn)統(tǒng)一管理,極大地方便了數(shù)據(jù)的使用.
參考文獻(xiàn)
[1]郭永生.基于共享數(shù)據(jù)庫(kù)的多數(shù)據(jù)源集成[J]. 微機(jī)發(fā)展, 2004,14(2): 49-51.
[2]李兆廷.高校教育共享數(shù)據(jù)庫(kù)的構(gòu)建[J].技術(shù)與市場(chǎng),2010,17(12):142-143.
[3]李衛(wèi)玲.多維分析的OLAP模塊設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)字工程,2011,39(5):164-166.
[4]程凱,董雪.校園網(wǎng)流量監(jiān)測(cè)及控制策略研究[J].河南教育學(xué)院學(xué)報(bào):自然科學(xué)版,2014,23(2):41-44.
Research on Date Sharing Problem and
Solution in Campus Information
WANG Chun-jie1, ZHU Bao-feng2
(1.DepartmentofMedicalArchives,TheFirstAffiliatedHospitalofZhengzhouUniversity,Zhengzhou450002,China;
2.DepartmentofInformationTechnology,HenanInstituteofEducation,Zhengzhou450046,China)
Abstract:Based on the analysis of existing problems in campus networks, a scheme, which can implement the aim of data sharing among the departments by shared-database, is put forward. The points in such a shared database are the subscription and the integrity of the shared data. In order to achieve the aim of both integrity and subscription of the data, tools offered by Oracle are used to transmit data among the shared-database and business-databases. When the shared-database is introduced into campus, all the public data in the campus can be concentrated. And the unified management of the data of the whole school as well as the support to every department can be achieved by the introduction of different kinds of criterion. Meanwhile, it can also be a base for data mining in the future.
Key words:informatization; shared-database; data integrity; data subscription; data transfer
中圖分類(lèi)號(hào):TP392
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1007-0834(2015)02-0042-04
doi:10.3969/j.issn.1007-0834.2015.02.012
作者簡(jiǎn)介:王春杰(1979—),男,河南滎陽(yáng)人,鄭州大學(xué)第一附屬醫(yī)院病案管理科工程師.
基金項(xiàng)目:河南省基礎(chǔ)與前沿計(jì)劃項(xiàng)目(132300410033)
收稿日期:2014-10-28