張海波 林培發(fā) 張穎 張曉萌 張澤堃
摘要: 隨著高校信息化的發(fā)展,多種不同功能的信息系統(tǒng)建設(shè)帶來(lái)了“數(shù)據(jù)孤島”的問(wèn)題。為了杜絕或減少系統(tǒng)之間的“數(shù)據(jù)孤島”,信息系統(tǒng)之間的數(shù)據(jù)交換和共享是一個(gè)行之有效的方法。該文以圖書信息系統(tǒng)為例,利用先進(jìn)的數(shù)據(jù)共享中心和數(shù)據(jù)清洗與整合系統(tǒng)平臺(tái),結(jié)合高校的實(shí)際需求,實(shí)現(xiàn)了圖書信息系統(tǒng)和共享數(shù)據(jù)中心之間的數(shù)據(jù)交換,以及數(shù)據(jù)共享,在實(shí)際應(yīng)用中獲得了較好的應(yīng)用效果。
關(guān)鍵詞:高校信息化;圖書信息系統(tǒng);共享數(shù)據(jù)中心;數(shù)據(jù)交換
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)26-0001-04
Abstract: With the rapid development of informationization in colleges and universities, colleges and universities establish a lot of information systems, these different information systems with many various functions bring the problem of "data island". Data exchange and sharing between information systems is an effective method to eliminate or reduce the "data island". This paper takes the library information system as an example, and uses advanced data cleaning and integration platform to realize the exchange between the system and the shared data center according to the actual needs of the colleges and universities. In practice, good results have been achieved.
Key words:University information; Library information system; Shared data center; Data exchange
大數(shù)據(jù)時(shí)代的到來(lái),使得高校對(duì)數(shù)據(jù)整合和共享的需求十分強(qiáng)烈[1]。這是因?yàn)?,高校不但有種類繁多的業(yè)務(wù)信息系統(tǒng),而且這些業(yè)務(wù)信息系統(tǒng)經(jīng)過(guò)多年運(yùn)行后,積累了大量的數(shù)據(jù)。一方面,這些數(shù)據(jù)由于分散在不同的業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)的一致性、完整性、準(zhǔn)確性得不到保證[2],造成的結(jié)果就是信息系統(tǒng)的可靠性受到懷疑;二是隨著信息系統(tǒng)應(yīng)用的不斷深入,大量的數(shù)據(jù)采集和數(shù)據(jù)交換工作成為常態(tài),原有的應(yīng)用系統(tǒng)卻沒(méi)有提供這樣的功能,學(xué)校不得不采用手工方式或定制開(kāi)發(fā)的方式應(yīng)付不斷出現(xiàn)的數(shù)據(jù)采集和交換的需求,成本高并且效率低下[3];三是這些數(shù)據(jù)本來(lái)是學(xué)校寶貴的財(cái)富,但由于沒(méi)有合適的數(shù)據(jù)整合和共享的平臺(tái)以及工具,數(shù)據(jù)得不到有效的利用,反而因日益膨脹的存儲(chǔ)需求而變成了負(fù)擔(dān)。
針對(duì)高校圖書信息系統(tǒng)來(lái)說(shuō),它本身是一個(gè)獨(dú)立的信息系統(tǒng),擁有自己獨(dú)立的數(shù)據(jù)庫(kù)系統(tǒng),和高校的其他信息系統(tǒng)不存在數(shù)據(jù)交換和共享的關(guān)系,成為了名副其實(shí)的“數(shù)據(jù)孤島”。比如教師和學(xué)生的信息需要圖書信息系統(tǒng)的管理員經(jīng)常性的手動(dòng)添加、刪除、導(dǎo)入;師生登錄圖書信息系統(tǒng)需要單獨(dú)的賬號(hào)和密碼;圖書信息系統(tǒng)管理員對(duì)師生登錄賬號(hào)單獨(dú)進(jìn)行管理和維護(hù);師生的借閱信息在高校的其他信息系統(tǒng)里不能瀏覽或查詢,等等。
為解決以上的問(wèn)題,從學(xué)校的層面上,應(yīng)該建設(shè)數(shù)據(jù)共享中心[4],各個(gè)業(yè)務(wù)信息系統(tǒng)(包括圖書信息系統(tǒng))可以按數(shù)據(jù)標(biāo)準(zhǔn)給數(shù)據(jù)共享中心提供所需的數(shù)據(jù),這個(gè)數(shù)據(jù)流程可以稱之為“上行數(shù)據(jù)”;從業(yè)務(wù)層面上,比如圖書信息系統(tǒng),也可以從共享數(shù)據(jù)中心獲得所需的數(shù)據(jù),比如教師、學(xué)生的信息,這個(gè)數(shù)據(jù)流程可以稱之為“下行數(shù)據(jù)”。所有的上行和下行的數(shù)據(jù)流程構(gòu)成了高校信息系統(tǒng)之間的數(shù)據(jù)交換和共享。
1 背景分析
共享數(shù)據(jù)中心是高校信息化的核心支撐平臺(tái)之一,設(shè)計(jì)科學(xué)合理的數(shù)據(jù)架構(gòu)對(duì)產(chǎn)品性能及應(yīng)用格局具有導(dǎo)向性作用[5]。共享數(shù)據(jù)中心為各業(yè)務(wù)系統(tǒng)提供一個(gè)集成的數(shù)據(jù)中心,它把重要的、通用的業(yè)務(wù)數(shù)據(jù)集成到中心數(shù)據(jù)庫(kù)中,為其它所有的業(yè)務(wù)信息系統(tǒng)提供準(zhǔn)確的、一致的數(shù)據(jù);從而便于數(shù)據(jù)在高校各個(gè)部門之間有效的流通、共享與利用,解決“數(shù)據(jù)孤島”問(wèn)題;還可以減少重復(fù)的數(shù)據(jù)收集整理工作,從而減輕工作量和減少費(fèi)用的支出;還便于進(jìn)行數(shù)據(jù)分析,為各項(xiàng)決策提供強(qiáng)有力的支持,最終為實(shí)現(xiàn)信息集成提供一個(gè)可靠的、統(tǒng)一的數(shù)據(jù)支撐平臺(tái)。
共享數(shù)據(jù)中心可以對(duì)外提供統(tǒng)一的標(biāo)準(zhǔn)接口,不依賴于具體的應(yīng)用系統(tǒng),在不對(duì)現(xiàn)有系統(tǒng)進(jìn)行大的改變的基礎(chǔ)上完成分布式異構(gòu)系統(tǒng)之問(wèn)的信息交換,實(shí)現(xiàn)一個(gè)具有可擴(kuò)展性、可定制性及與平臺(tái)無(wú)關(guān)性的異構(gòu)數(shù)據(jù)交換系統(tǒng),能很好地消除數(shù)據(jù)在結(jié)構(gòu)和語(yǔ)義上的差異,為數(shù)據(jù)集成、共享和交換提供支持。
我校圖書信息系統(tǒng)采用的是北京創(chuàng)訊未來(lái)軟件技術(shù)有限公司的圖書信息系統(tǒng)——現(xiàn)代電子化圖書館信息網(wǎng)絡(luò)系統(tǒng)(Modem Electronic Library Information and Nets System,MELINETS),整個(gè)系統(tǒng)包括三大部分:1)圖書館業(yè)務(wù)應(yīng)用部分:① 采訪子系統(tǒng);② 典藏流通子系統(tǒng);③ 連續(xù)出版物子系統(tǒng);④ 公共檢索子系統(tǒng);2)區(qū)域資源合作共享應(yīng)用系統(tǒng):① Z39.50公共檢索子系統(tǒng);② 館際互借子系統(tǒng);③ 編目中心子系統(tǒng);3)行政業(yè)務(wù)管理系統(tǒng):① 人事管理子系統(tǒng);② 設(shè)備管理子系統(tǒng)[6]。
MELINETS采用C/S或B/S應(yīng)用服務(wù)器/數(shù)據(jù)庫(kù)服務(wù)器體系結(jié)構(gòu),數(shù)據(jù)庫(kù)平臺(tái)采用大型關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng),可支持SYBASE、ORACLE等數(shù)據(jù)庫(kù),采用POWERBUILDER、JAVA、C等多種語(yǔ)言開(kāi)發(fā),增強(qiáng)系統(tǒng)的持續(xù)性和穩(wěn)定性。服務(wù)器端的設(shè)備可選用高檔微機(jī)、專用服務(wù)器以及中、小型計(jì)算機(jī),操作系統(tǒng)可選用UNIX、PCUNIX、LINUX、WIN2000/2008/2012等,適用于大、中、小各種類型的圖書館[6]。
在共享數(shù)據(jù)中心建設(shè)和數(shù)據(jù)交換方面,采用的是成都康賽信息技術(shù)有限公司(下稱康賽公司)的企業(yè)級(jí)數(shù)據(jù)清洗與整合系統(tǒng)(Comsys Data Cleaning and Integration Software,簡(jiǎn)稱DCI)。DCI是以數(shù)據(jù)為核心,高效、穩(wěn)定、安全的中間件,可以結(jié)合應(yīng)用系統(tǒng)中的實(shí)際場(chǎng)景,完成整個(gè)數(shù)據(jù)清洗與整合的全過(guò)程,將分散的、孤立的、異構(gòu)的數(shù)據(jù)集中化、標(biāo)準(zhǔn)化和結(jié)構(gòu)化??梢哉蠈W(xué)校各部門的業(yè)務(wù)系統(tǒng)對(duì)外共享數(shù)據(jù),形成共享數(shù)據(jù)中心的基礎(chǔ)數(shù)據(jù)庫(kù);系統(tǒng)可對(duì)基礎(chǔ)數(shù)據(jù)庫(kù)進(jìn)行綜合加工處理,形成公共共享交換數(shù)據(jù)庫(kù);系統(tǒng)可根據(jù)需要自動(dòng)從主題數(shù)據(jù)庫(kù)分別計(jì)算生成各種綜合報(bào)表數(shù)據(jù),形成統(tǒng)計(jì)報(bào)表數(shù)據(jù)庫(kù)等等。
2 系統(tǒng)設(shè)計(jì)
圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間實(shí)現(xiàn)數(shù)據(jù)交換和共享,是圖書信息系統(tǒng)與信息門戶之間實(shí)現(xiàn)單點(diǎn)登錄的基礎(chǔ)。另外,在信息門戶中,師生用戶可以查看個(gè)人的圖書借閱信息以及圖書館的圖書資料信息。本文主要討論圖書信息系統(tǒng)的數(shù)據(jù)交換與共享。在圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間主要解決以下問(wèn)題:
1) 解決圖書信息系統(tǒng)的“數(shù)據(jù)孤島”問(wèn)題,把圖書信息系統(tǒng)需要的數(shù)據(jù)交換過(guò)來(lái)。
2) 把圖書信息系統(tǒng)的數(shù)據(jù)交換到共享數(shù)據(jù)中心,以實(shí)現(xiàn)與其他信息系統(tǒng)的共享。
3) 實(shí)現(xiàn)信息系統(tǒng)間的數(shù)據(jù)同步交換,保證不同系統(tǒng)關(guān)聯(lián)數(shù)據(jù)的自動(dòng)同步,準(zhǔn)確一致。
4) 實(shí)現(xiàn)高??绮块T、跨業(yè)務(wù)、跨應(yīng)用的管理流程集成和全校數(shù)據(jù)信息共享,解決高校管理漏洞,減少重復(fù)工作等問(wèn)題。
5) 實(shí)現(xiàn)所有數(shù)據(jù)的全面集成和智能分析。
6) 實(shí)現(xiàn)快速、準(zhǔn)確的獲取高校中人、財(cái)、物和學(xué)、研、管業(yè)務(wù)過(guò)程中的信息。
針對(duì)圖書信息系統(tǒng)的數(shù)據(jù)交換和共享,具體功能主要體現(xiàn)在:
整合圖書館管理系統(tǒng)的借閱數(shù)據(jù),能夠獲取學(xué)生的圖書借閱情況,為學(xué)校的管理工作開(kāi)展提供支持。整合后的圖書館管理系統(tǒng)能夠從共享數(shù)據(jù)中心直接獲取學(xué)生和教職工信息的基礎(chǔ)數(shù)據(jù),利于辦理圖書館相關(guān)業(yè)務(wù)。實(shí)時(shí)獲取學(xué)生圖書借閱情況,學(xué)生管理人員在辦理離校手續(xù)時(shí),能夠直觀的查看相關(guān)學(xué)生的圖書館手續(xù)辦理狀態(tài)。學(xué)生欠書提示將通過(guò)系統(tǒng)直接同步到學(xué)生或?qū)W生管理人員的個(gè)人門戶界面?;跀?shù)據(jù)共享業(yè)務(wù),無(wú)需單獨(dú)辦理借書證,學(xué)生和教職工僅攜帶自己的一卡通即可借閱圖書。
數(shù)據(jù)交換主要包含共享數(shù)據(jù)中心從圖書信息系統(tǒng)抽取數(shù)據(jù)(上行數(shù)據(jù))和圖書信息系統(tǒng)從共享數(shù)據(jù)中心訂閱數(shù)據(jù)兩個(gè)方面(下行數(shù)據(jù))。
下行的數(shù)據(jù)流程圖可見(jiàn)圖1所示。
從圖1中可知,圖書信息系統(tǒng)所需共享數(shù)據(jù)中心的數(shù)據(jù)通過(guò)DCI的數(shù)據(jù)抽取、清洗和轉(zhuǎn)換等流程到達(dá)中間庫(kù),然后圖書信息系統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)從中間庫(kù)取走所需的數(shù)據(jù)。在上行數(shù)據(jù)時(shí),圖書信息系統(tǒng)把共享數(shù)據(jù)中心所需的數(shù)據(jù)放在中間庫(kù)后,通過(guò)DCI的數(shù)據(jù)抽取、清洗和轉(zhuǎn)換可以提交給中心庫(kù),供共享數(shù)據(jù)中心及其他業(yè)務(wù)信息系統(tǒng)使用。從而實(shí)現(xiàn)圖書信息系統(tǒng)與共享數(shù)據(jù)中心之間需要同步的數(shù)據(jù)全部通過(guò)數(shù)據(jù)交換平臺(tái)DCI中間件實(shí)現(xiàn)數(shù)據(jù)同步。
3 數(shù)據(jù)交換和共享方案
3.1 上行數(shù)據(jù)方案
根據(jù)學(xué)校的實(shí)際情況,進(jìn)行了需求分析,最終確定12張表作為上行數(shù)據(jù)。其中圖書基本數(shù)據(jù)(V_TSG_ TSJBSJZLB)表的結(jié)構(gòu)見(jiàn)表1。
讀者當(dāng)前借閱數(shù)據(jù)(V_TSG_ TSJYSJZLB)表結(jié)構(gòu)見(jiàn)表2。
讀者基本數(shù)據(jù)(V_TSG_ DZSJZLB)表結(jié)構(gòu)見(jiàn)表3。
除了以上3張表以外,還有借閱歷史數(shù)據(jù)(V_TSG_ JYLSSJZLB)、預(yù)約通知數(shù)據(jù)(V_TSG_ YYTZSJ)、購(gòu)書推薦數(shù)據(jù)(V_TSG_ GSTJSJ)、已回復(fù)的留言數(shù)據(jù)(V_TSG_ YHFLYSJ)、新書通報(bào)數(shù)據(jù)(V_TSG_ XSTBSJ)、借閱排行(V_TSG_ JYSJPH)、收藏排行(V_TSG_ SCPH)、查看排行(V_TSG_ CKPH)、書評(píng)排行(V_TSG_ SPPH)等表,由于篇幅所限,不再一一贅述。
這12張表所需的數(shù)據(jù)由圖書信息系統(tǒng)提供,其字段為參考字段,在實(shí)際編寫數(shù)據(jù)接口時(shí)可以以圖書信息系統(tǒng)實(shí)際字段為準(zhǔn),并盡可能提供全部相關(guān)字段。
圖書信息系統(tǒng)管理方參照本節(jié)的表編寫數(shù)據(jù)接口,并將數(shù)據(jù)接口相關(guān)參數(shù)提供給數(shù)據(jù)集成方,數(shù)據(jù)集成方按照學(xué)校需求對(duì)數(shù)據(jù)進(jìn)行采集,數(shù)據(jù)抽取具體時(shí)間及頻率等由學(xué)校共享數(shù)據(jù)中心管理員自行控制,圖書信息系統(tǒng)管理方需提供的數(shù)據(jù)接口內(nèi)容:數(shù)據(jù)庫(kù)類型、數(shù)據(jù)庫(kù)版本、IP地址、數(shù)據(jù)庫(kù)名稱、端口號(hào)、用戶名、密碼。當(dāng)然上行數(shù)據(jù)僅需數(shù)據(jù)庫(kù)用戶讀權(quán)限。
3.2 下行數(shù)據(jù)方案
圖書信息系統(tǒng)需要共享數(shù)據(jù)中心推送教師和學(xué)生的信息,用于結(jié)合學(xué)校的一卡通系統(tǒng),辦理圖書借閱、逾期扣款等業(yè)務(wù)。所以需要教師的基礎(chǔ)數(shù)據(jù)、學(xué)生的基礎(chǔ)數(shù)據(jù)以及學(xué)籍?dāng)?shù)據(jù)等。表4是教師的基礎(chǔ)數(shù)據(jù)(JZGJCSJZLB)表結(jié)構(gòu),其他的表不再一一贅述。
同樣道理,數(shù)據(jù)集成方參照本節(jié)的表編寫數(shù)據(jù)接口,并將數(shù)據(jù)接口相關(guān)參數(shù)提供給圖書信息系統(tǒng)管理方,圖書信息管理方按照?qǐng)D書館的需求對(duì)數(shù)據(jù)進(jìn)行采集,數(shù)據(jù)抽取具體時(shí)間及頻率等由學(xué)校共享數(shù)據(jù)中心管理員自行控制,數(shù)據(jù)集成方需提供的數(shù)據(jù)接口內(nèi)容:數(shù)據(jù)庫(kù)類型、數(shù)據(jù)庫(kù)版本、IP地址、數(shù)據(jù)庫(kù)名稱、端口號(hào)、用戶名、密碼。
4 功能實(shí)現(xiàn)
在實(shí)際工作中,我校采用了康賽公司的共享數(shù)據(jù)中心系統(tǒng)與DCI系統(tǒng)。
共享數(shù)據(jù)中心包括信息標(biāo)準(zhǔn)管理工具、共享中心庫(kù)管理工具、數(shù)據(jù)服務(wù)管理工具,它與數(shù)據(jù)清洗轉(zhuǎn)換中間件DCI一起協(xié)作實(shí)現(xiàn)各類應(yīng)用管理系統(tǒng)間數(shù)據(jù)共享,形成全校權(quán)威數(shù)據(jù)中心庫(kù),是為學(xué)校提供全面權(quán)威信息查詢統(tǒng)計(jì)和數(shù)據(jù)挖掘分析的重要基礎(chǔ)。
高校建立統(tǒng)一共享數(shù)據(jù)中心作為校內(nèi)基本數(shù)據(jù)的唯一共享平臺(tái),集中整理各個(gè)業(yè)務(wù)部門的基本數(shù)據(jù),實(shí)現(xiàn)統(tǒng)一管理,保證數(shù)據(jù)的權(quán)威和準(zhǔn)確,為各個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)和各類服務(wù)系統(tǒng)提供數(shù)據(jù)支持。
圖2是共享數(shù)據(jù)中心的一個(gè)頁(yè)面的功能截圖,該頁(yè)面主要可以完成圖書資料方面的信息標(biāo)準(zhǔn)化。
DCI產(chǎn)品實(shí)現(xiàn)了針對(duì)于數(shù)據(jù)的清洗與整合處理。它分別由數(shù)據(jù)整合管理系統(tǒng)(DCI-MS)、數(shù)據(jù)整合客戶端作業(yè)設(shè)計(jì)器(DCI-Studio)和數(shù)據(jù)整合執(zhí)行引擎(DCI-Engine)三個(gè)子系統(tǒng)組成,三個(gè)子系統(tǒng)在DCI產(chǎn)品中各司其職,扮演著不同的角色,完成各自的業(yè)務(wù)功能。圖3是數(shù)據(jù)交換的一個(gè)頁(yè)面的功能截圖,該頁(yè)面主要可以實(shí)現(xiàn)圖書信息中的讀者信息的數(shù)據(jù)交換。
5 結(jié)束語(yǔ)
本文基于康賽公司的共享數(shù)據(jù)中心和數(shù)據(jù)清洗與整合系統(tǒng)(DCI)產(chǎn)品,以高校圖書信息系統(tǒng)為例,論述了如何實(shí)現(xiàn)高校信息系統(tǒng)與高校共享數(shù)據(jù)中心之間的數(shù)據(jù)交換,同時(shí),通過(guò)數(shù)據(jù)共享中心也可以把數(shù)據(jù)分享到相應(yīng)的信息系統(tǒng)中去,實(shí)現(xiàn)了高校信息系統(tǒng)數(shù)據(jù)的共享和交換。在保障數(shù)據(jù)交換的前提下實(shí)現(xiàn)高校信息數(shù)據(jù)的共享,從技術(shù)層面不僅可以杜絕或加減少高校信息系統(tǒng)之間的“數(shù)據(jù)孤島”問(wèn)題,而且還可以為以后的智慧校園建設(shè)提供有力的支撐;從管理的層面不僅可以減少信息管理的工作,而且還可以提高全校信息化、自動(dòng)化的管理水平。
參考文獻(xiàn):
[1] 張燕南. 大數(shù)據(jù)的教育領(lǐng)域應(yīng)用之研究[D]. 華東師范大學(xué),2016.
[2] 周宏廣. 異構(gòu)數(shù)據(jù)源集成中清洗策略的研究及應(yīng)用[D]. 中南大學(xué),2004.
[3] 林祿水. 高校數(shù)字化校園的數(shù)據(jù)集成設(shè)計(jì)與實(shí)現(xiàn)[D]. 湖南大學(xué),2015.
[4] 楊永濤; 佟連剛. 高校信息化建設(shè)中的數(shù)據(jù)共享研究[J].電子技術(shù),2014,1(43 ):20-22.
[5] 冉照海. 數(shù)字化校園規(guī)劃與實(shí)踐[D].長(zhǎng)安大學(xué),2013.
[6] 龔紀(jì)文. MELINETS使用技巧[EB/OL].[2017-9-6].http://www.paper.edu.cn/releasepaper/content/200606-487.
[通聯(lián)編輯:唐一東]