周筠
摘要:美國管理信息系統(tǒng)專家諾蘭提出的信息系統(tǒng)進化的階段模型(即“諾蘭模型”),正在我國的信息化建設(shè)過程中上演。信息集成的解決方案層出不窮,其中,信息交換的底層技術(shù)已經(jīng)相對成熟,在此基礎(chǔ)上形成的共享數(shù)據(jù)中心解決方案是目前正在迅速發(fā)展和實踐的整體性解決方案。該文以南京財經(jīng)大學數(shù)據(jù)中心建設(shè)方案為例,介紹了高校信息化平臺的組建。
關(guān)鍵詞:高校信息化;數(shù)據(jù)中心
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2012)32-7652-03
信息化校園是推動高校實現(xiàn)戰(zhàn)略目標的重要支撐環(huán)節(jié),我校信息化校園建設(shè)以消除排除信息孤島、創(chuàng)建信息規(guī)范、提供個性化服務為三大實踐目標。為了早日完成這些目標,迫切需要解決目前校內(nèi)各業(yè)務系統(tǒng)數(shù)據(jù)不能共享、應用系統(tǒng)無法集成、界面不統(tǒng)一等問題。共享數(shù)據(jù)中心是我校各部門所有數(shù)據(jù)的基礎(chǔ)承載平臺,對各部門的基礎(chǔ)數(shù)據(jù)實現(xiàn)統(tǒng)一、集中的管理,確保數(shù)據(jù)的正確性與來源的唯一性,為各服務系統(tǒng)及應用系統(tǒng)提供正確和唯一的數(shù)據(jù)支撐,承載了我校信息化建設(shè)的數(shù)據(jù)存儲、數(shù)據(jù)處理及數(shù)據(jù)交換工作。因此可以認為,共享數(shù)據(jù)中心的建設(shè)是解決多個應用系統(tǒng)之間數(shù)據(jù)交換和數(shù)據(jù)共享問題的核心。
1建設(shè)目標
1)數(shù)據(jù)的收集與更新:數(shù)據(jù)中心的全部數(shù)據(jù)均從各業(yè)務系統(tǒng)收集,通過統(tǒng)一的數(shù)據(jù)同步方法將數(shù)據(jù)采集到共享數(shù)據(jù)中心,同時提供數(shù)據(jù)更新報告。
2)數(shù)據(jù)的組織與清理:依照校方制定的信息標準對各業(yè)務部門的更新數(shù)據(jù)進行整理,如遇數(shù)據(jù)異常情況則及時報告,確保數(shù)據(jù)的正確性與來源的唯一性,同時保留歷史數(shù)據(jù)。
3)數(shù)據(jù)的共享與使用:共享數(shù)據(jù)中心的資源可以通過分級授權(quán)的模式實現(xiàn)數(shù)據(jù)的共享與使用,共享數(shù)據(jù)中心能夠做出實時的數(shù)據(jù)使用報表。
4)數(shù)據(jù)的挖掘與分析:能夠?qū)蚕頂?shù)據(jù)中心及歷史庫中的數(shù)據(jù)進行OLAP分析,自動生成各類報表或按需展示分析結(jié)果,輔助領(lǐng)導決策。
2體系架構(gòu)
共享數(shù)據(jù)中心架構(gòu)的架構(gòu)如圖1所示。
1)元數(shù)據(jù)管理:主要負責所有與數(shù)據(jù)結(jié)構(gòu)及數(shù)據(jù)邏輯相關(guān)的定義。
2)數(shù)據(jù)集成工具:主要負責數(shù)據(jù)的轉(zhuǎn)換,即把源數(shù)據(jù)轉(zhuǎn)化成標準的、權(quán)威的數(shù)據(jù),把更新后的數(shù)據(jù)分發(fā)到源數(shù)據(jù),以及定期的數(shù)據(jù)更新。
3)共享數(shù)據(jù)庫:按照業(yè)務領(lǐng)域的數(shù)據(jù)規(guī)劃,將共享數(shù)據(jù)庫中的數(shù)據(jù)抽取出來,存儲標準化后的數(shù)據(jù)和元數(shù)據(jù),以及待處理數(shù)據(jù)表、分發(fā)數(shù)據(jù)表、操作日志等數(shù)據(jù)。
4)領(lǐng)域主題庫:按照查詢、分析等方面的需求,形成某個領(lǐng)域、某個維度的專門的數(shù)據(jù)集。
5)歷史數(shù)據(jù)庫:主要存儲數(shù)據(jù)主題庫的所有變化歷程,并可以恢復某個歷史時間點上的數(shù)據(jù)。
6)統(tǒng)一的數(shù)據(jù)訪問:數(shù)據(jù)中心能夠?qū)ν獠刻峁藴实?、一致的訪問中心數(shù)據(jù)庫的表及視圖的訪問接口,如數(shù)據(jù)分析、報表等的接口。
7)系統(tǒng)運維管理:監(jiān)控數(shù)據(jù)轉(zhuǎn)換的過程,記錄數(shù)據(jù)轉(zhuǎn)換的結(jié)果,當發(fā)生數(shù)據(jù)邏輯錯誤或違反規(guī)則的情況,系統(tǒng)立即向相關(guān)數(shù)據(jù)庫管理員發(fā)生間斷性警報。包括數(shù)據(jù)操作日志(被拒絕的數(shù)據(jù)、數(shù)據(jù)處理記錄、錯誤記錄)、數(shù)據(jù)管理、監(jiān)控系統(tǒng)運行狀態(tài)等。
8)安全控制:采用多級安全控制體系,分別在應用層、服務層以及數(shù)據(jù)庫控制層進行權(quán)限設(shè)置,以保障整個系統(tǒng)的訪問安全。
3系統(tǒng)功能
3.1基礎(chǔ)功能
1)數(shù)據(jù)同步
通過數(shù)據(jù)復制和發(fā)送功能,實現(xiàn)各應用系統(tǒng)數(shù)據(jù)庫至共享數(shù)據(jù)中心間的數(shù)據(jù)雙向同步更新機制,實現(xiàn)了各業(yè)務系統(tǒng)及時將更新的業(yè)務信息同步到共享數(shù)據(jù)庫系統(tǒng);同時,共享數(shù)據(jù)庫系統(tǒng)也可以將更新的業(yè)務信息及時同步給其它業(yè)務系統(tǒng),從而實現(xiàn)數(shù)據(jù)雙向同步互動。
2)支持數(shù)據(jù)訪問下載
共享數(shù)據(jù)中心可以為學校各部門業(yè)務應用系統(tǒng)提供訪問和下載信息資源的支撐服務。學校終端用戶通過用戶身份認證和目錄系統(tǒng)授權(quán)驗證,將數(shù)據(jù)查詢條件及查詢要求提交到共享數(shù)據(jù)中心,共享數(shù)據(jù)中心分析查詢條件及查詢要求,對信息資源進行查找、定位、獲取、打包返回給服務調(diào)用方。
3)數(shù)據(jù)檢查比對
共享數(shù)據(jù)中心提供了信息化校園各業(yè)務應用系統(tǒng)的數(shù)據(jù)檢查比對支撐服務。學校用戶通過用戶身份認證和目錄系統(tǒng)授權(quán)驗證,將需要比對的數(shù)據(jù)提交到共享數(shù)據(jù)庫系統(tǒng),共享數(shù)據(jù)庫系統(tǒng)將用戶提交的數(shù)據(jù)和共享數(shù)據(jù)庫中數(shù)據(jù)進行一致比對。檢查比對的結(jié)果將予以標記并返回用戶。
4)數(shù)據(jù)規(guī)則約束檢查
共享數(shù)據(jù)中心的數(shù)據(jù)保持一致性、完整性、正確性,提供數(shù)據(jù)規(guī)則約束檢查手段,對入庫數(shù)據(jù)按照業(yè)務邏輯規(guī)則進行完整性、一致性、正確性的數(shù)據(jù)清洗整理,保證共享數(shù)據(jù)庫數(shù)據(jù)準確、可靠與及時性。
5)目錄服務
按照信息資源管理體系框架結(jié)構(gòu),建立信息資源目錄標準服務及元數(shù)據(jù)描述服務。
3.2元數(shù)據(jù)管理
元數(shù)據(jù)管理實現(xiàn)了共享數(shù)據(jù)中心中數(shù)據(jù)庫結(jié)構(gòu)的管理及維護工作,主要內(nèi)容包括如下:
1)表單的注冊:共享數(shù)據(jù)中心中表單數(shù)目龐大,且涉及到學校的方方面面,表單注冊為數(shù)據(jù)中心設(shè)立檔案,方便訪問者查閱,包括對表單進行詳細描述及中文注釋。
2)字段的注冊:字段注冊指為共享數(shù)據(jù)中心中的數(shù)據(jù)結(jié)構(gòu)設(shè)立檔案,提供訪問者查閱功能。
3)數(shù)據(jù)庫結(jié)構(gòu)的更新:高校信息化的發(fā)展可能會引起數(shù)據(jù)標準的變化,因此需要更新數(shù)據(jù)庫結(jié)構(gòu)。但由于更新時涉及面過大,不到萬不得已的情況最好不要調(diào)整數(shù)據(jù)庫結(jié)構(gòu),更改原則是已使用的表只能做新增操作;未使用的表可新增、刪除、更新字段信息。
4)建立元數(shù)據(jù)管理系統(tǒng):通過此系統(tǒng),完成表的注冊、字段注冊和數(shù)據(jù)結(jié)構(gòu)的更新等操作。3.3主題庫管理
為了實現(xiàn)統(tǒng)一的數(shù)據(jù)規(guī)劃,對需求進行系統(tǒng)化的分析是必不可少的,同時,還需優(yōu)先制定一套切實可行的數(shù)據(jù)模型構(gòu)建標準,才能從眾多的系統(tǒng)中將功能交叉的部分歸納出來,最終形成共享數(shù)據(jù)模型。
當在基于多個舊有系統(tǒng)進行共享數(shù)據(jù)中心構(gòu)建的情形下,共享數(shù)據(jù)中心與這些舊有系統(tǒng)的數(shù)據(jù)庫還會有信息的交互,因此,接下來的任務則是對舊有系統(tǒng)的改造過程,這包括用共享數(shù)據(jù)模型替換舊有系統(tǒng)模型、構(gòu)建新的業(yè)務關(guān)系及業(yè)務規(guī)則、對舊有系統(tǒng)進行重構(gòu)等。經(jīng)過這樣的模型重組,使得多個系統(tǒng)在集成以后更趨于全方位的解決方案,從而為下一步實現(xiàn)信息一體化奠定基礎(chǔ)。
在標準庫建立完成后,依據(jù)我校實際情況,針對各業(yè)務部門建立分項主題庫:
學生信息庫(包括本科生、研究生、繼續(xù)教育學生的基本信息表);
教職信息工庫(包括在職及離退休教職工基本信息);
財務信息庫(包括學生繳費貸款、教職工工資、科研經(jīng)費信息);
成績信息庫(包括學生必修課成績、輔修課成績、第二專業(yè)成績);
課表信息庫(包括本學期開課計劃、專業(yè)教學計劃、本學期排課列表);
教學資源信息庫(包括教室、課件、精品課程講義等信息);
設(shè)備信息庫(包括大型儀器設(shè)備的基本信息及使用情況);
學籍變動信息庫(包括學生所有獎懲信息、學籍變動);
科研成果信息庫(包括論文、獲獎、專利、專著、鑒定成果等信息);
科研項目信息庫(包括申請、在研、完成項目的信息);
主題對象的管理包括:
1)主題對象的生成:依照各級訪問授權(quán),對能訪問的表的操作進行封裝,其中對數(shù)據(jù)庫的訪問都通過對象完成。
2)對象的權(quán)限管理:劃分用戶對主題對象的訪問權(quán)限。
3)主題的對象查看:依照各級訪問授權(quán),查詢接口共享目錄調(diào)用相應的接口,完成圖形化的展示。
3.4數(shù)據(jù)的抽取與同步
共享數(shù)據(jù)中心的數(shù)據(jù)抽取與同步功能具體應包括:
1)實現(xiàn)從各個業(yè)務數(shù)據(jù)庫中實時和定期地抽取數(shù)據(jù)到共享數(shù)據(jù)庫中。
2)實現(xiàn)各個業(yè)務數(shù)據(jù)庫與共享數(shù)據(jù)庫數(shù)據(jù)的實時和定期同步。
3)可以支持從各種異構(gòu)的數(shù)據(jù)庫系統(tǒng)和文件系統(tǒng)中抽取數(shù)據(jù)
4)支持數(shù)據(jù)轉(zhuǎn)換與清洗,把不規(guī)范的數(shù)據(jù)轉(zhuǎn)換為規(guī)范化的數(shù)據(jù):
此外,主要功能還應包括數(shù)據(jù)的抽取與同步,數(shù)據(jù)管理工具等應用。
4結(jié)束語
文章以南京財經(jīng)大學數(shù)據(jù)中心建設(shè)方案為例,介紹了高校信息化平臺的組建。其中,我校以元數(shù)據(jù)為基礎(chǔ)提供全局統(tǒng)一的數(shù)據(jù)模式;在主題庫中存儲需要共享的數(shù)據(jù),作為數(shù)據(jù)清洗的終點和權(quán)威數(shù)據(jù)分發(fā)的起點;將所有的數(shù)據(jù)處理操作包裝成Web服務,以面向服務架構(gòu)(SOA)的形式注冊到ESB總線;以工作流技術(shù)構(gòu)造數(shù)據(jù)交換的業(yè)務邏輯,工作流把對數(shù)據(jù)的操作編排起來,自動完成數(shù)據(jù)交換的工作。