張亦 馮麗
摘要:數(shù)據(jù)遷移的順利完成是信息系統(tǒng)改造升級(jí)中相當(dāng)重要的一環(huán)。本文以一個(gè)實(shí)際應(yīng)用中的信息系統(tǒng)為例,從分析設(shè)計(jì)階段到實(shí)施階段,詳細(xì)闡述了數(shù)據(jù)從一個(gè)既有成熟的系統(tǒng)向新建設(shè)的系統(tǒng)中遷移的實(shí)現(xiàn)過(guò)程和注意要點(diǎn)。
關(guān)鍵字:信息系統(tǒng) 數(shù)據(jù)遷移
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2012)10(b)-0014-01
在項(xiàng)目開發(fā)過(guò)程中經(jīng)常會(huì)遇到老系統(tǒng)的歷史數(shù)據(jù)向新系統(tǒng)遷移的問(wèn)題,很多歷史數(shù)據(jù)對(duì)新系統(tǒng)來(lái)說(shuō)相當(dāng)重要,有些甚至是新系統(tǒng)啟用時(shí)所必須的,可以說(shuō)一次成功的歷史數(shù)據(jù)遷移是新系統(tǒng)成功上線運(yùn)行的基礎(chǔ)。數(shù)據(jù)遷移的質(zhì)量不光決定了新系統(tǒng)的上線成功與否,也對(duì)新系統(tǒng)上線后的穩(wěn)定運(yùn)行有著巨大的影響。
1 系統(tǒng)概述
根據(jù)用戶需求,為了貫徹政府文件要求,開展對(duì)持有獨(dú)生子女父母光榮證的企業(yè)退休職工發(fā)放一次性獎(jiǎng)勵(lì)的工作,開發(fā)了計(jì)劃生育一次性待遇發(fā)放系統(tǒng)。它以企業(yè)退休職工為服務(wù)人群,實(shí)現(xiàn)了計(jì)劃生育一次性待遇發(fā)放相關(guān)的一系列流程控制和數(shù)據(jù)管理,包括了單位管理、單位發(fā)放管理、個(gè)人申請(qǐng)管理、個(gè)人公示管理、個(gè)人發(fā)放管理、綜合查詢等功能。
2 數(shù)據(jù)遷移設(shè)計(jì)
本系統(tǒng)雖然是個(gè)功能相對(duì)獨(dú)立的系統(tǒng),但企業(yè)退休職工數(shù)據(jù)作為所有業(yè)務(wù)的起點(diǎn)卻非系統(tǒng)自身產(chǎn)生的數(shù)據(jù),而是源自社會(huì)保障管理信息系統(tǒng),因此社保系統(tǒng)必須向本系統(tǒng)提供系統(tǒng)運(yùn)行所需的數(shù)據(jù)。只有這些數(shù)據(jù)的遷移成功后,一次性待遇發(fā)放的具體業(yè)務(wù)操作才能正常開展起來(lái)。然而社保系統(tǒng)由于歷史原因,其數(shù)據(jù)并非統(tǒng)一存放,而是分散在各統(tǒng)籌區(qū)不同的社保系統(tǒng)中,客觀上就存在著較大的差異。為了保證各統(tǒng)籌區(qū)的數(shù)據(jù)都能在本系統(tǒng)中運(yùn)行,數(shù)據(jù)遷移的設(shè)計(jì)必須以實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)格式,統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)為原則。
2.1數(shù)據(jù)字典設(shè)計(jì)
首先,根據(jù)用戶的具體需求,確定能保障新系統(tǒng)運(yùn)行的基礎(chǔ)數(shù)據(jù),而這些數(shù)據(jù)就是數(shù)據(jù)遷移所需要的數(shù)據(jù)內(nèi)容。通過(guò)與用戶的交流和分析,最終確定了各統(tǒng)籌區(qū)需向本系統(tǒng)提供的數(shù)據(jù)主要為單位基本信息和退休人員基本信息等,具體如下。
退休人員基本信息:個(gè)人ID、姓名、身份證號(hào)、性別、退休時(shí)間、單位ID、常住地、戶口地、生存狀態(tài)、死亡時(shí)間、聯(lián)系電話。
單位基本信息:?jiǎn)挝籌D、單位名稱、主管部門、注冊(cè)地址、經(jīng)營(yíng)地址、聯(lián)系人、聯(lián)系電話。
轄區(qū)基本信息:轄區(qū)ID、轄區(qū)名稱。
其次,根據(jù)需要遷移的信息,設(shè)計(jì)統(tǒng)一的數(shù)據(jù)字典,制定遷移的目標(biāo)。各統(tǒng)籌區(qū)的數(shù)據(jù)最終將轉(zhuǎn)換成統(tǒng)一格式的接口表,便于將來(lái)新系統(tǒng)對(duì)數(shù)據(jù)的使用。
2.2數(shù)據(jù)抽取轉(zhuǎn)換設(shè)計(jì)
數(shù)據(jù)字典設(shè)計(jì)完成后,就可以進(jìn)入各統(tǒng)籌區(qū)系統(tǒng)中,進(jìn)一步研究如何因地制宜提取數(shù)據(jù)的方法。需要分析的內(nèi)容包括原系統(tǒng)數(shù)據(jù)字典整理、原系統(tǒng)數(shù)據(jù)質(zhì)量分析、新系統(tǒng)數(shù)據(jù)字典整理、新舊系統(tǒng)數(shù)據(jù)差異分析、建立新舊系統(tǒng)數(shù)據(jù)之間的映射關(guān)系等。
首先,要通過(guò)分析和整理原有系統(tǒng)的數(shù)據(jù),從中找出與本次數(shù)據(jù)遷移所需要的數(shù)據(jù)和遷移范圍。必須在系統(tǒng)中明確找到個(gè)人ID、姓名、身份證號(hào)等信息的數(shù)據(jù)來(lái)源。然而另外一些不需要遷移的數(shù)據(jù)也很重要。例如,本次遷移人員的要求是養(yǎng)老金需沒(méi)有享受過(guò)獨(dú)生子女5%上浮的企業(yè)退休人員,因此相關(guān)待遇計(jì)算信息也是需要明確的非遷移信息。如果分析過(guò)程中發(fā)現(xiàn)數(shù)據(jù)存在質(zhì)量問(wèn)題,需及時(shí)與用戶和其相關(guān)技術(shù)人員進(jìn)行溝通。
其次,根據(jù)整理好的原系統(tǒng)和新系統(tǒng)的數(shù)據(jù)字典,分析系統(tǒng)間的差異,建立新老系統(tǒng)數(shù)據(jù)字典的映射關(guān)系,將非標(biāo)準(zhǔn)的數(shù)據(jù)轉(zhuǎn)化為在一定程度上的標(biāo)準(zhǔn)化的數(shù)據(jù),使映射后的數(shù)據(jù)能夠適應(yīng)新系統(tǒng)的要求。大部分的遷移字段都可以通過(guò)直接映射的方法進(jìn)行遷移(如個(gè)人ID、單位ID、姓名、身份證號(hào)等),還有一部分編碼數(shù)據(jù)(如性別、單位的主管部門、各轄區(qū)編碼等)由于各統(tǒng)籌區(qū)的差異性,不能直接使用,這就需要采用中間編碼映射的方式,將不統(tǒng)一的編碼映射成統(tǒng)一標(biāo)準(zhǔn)的編碼。為了數(shù)據(jù)抽取方便,可以設(shè)計(jì)必要的視圖;如果涉及到較為復(fù)雜的中間計(jì)算過(guò)程,也可以通過(guò)使用創(chuàng)建中間表的方法,將中間過(guò)程數(shù)據(jù)暫存到中間表中輔助建立映射關(guān)系。而通過(guò)各種方法通過(guò)映射關(guān)系轉(zhuǎn)換后的數(shù)據(jù)放在與數(shù)據(jù)字典同名的表中備查。
最后,為了保證數(shù)據(jù)遷移的正確性,及時(shí)發(fā)現(xiàn)遷移中可能遇到的問(wèn)題,需對(duì)遷移條件以及遷移字段的正確性進(jìn)行校驗(yàn)。如果數(shù)據(jù)中含有不規(guī)范的數(shù)據(jù),將對(duì)新系統(tǒng)的運(yùn)行造成很多問(wèn)題和麻煩。校驗(yàn)通常包括檢查二義性、重復(fù)數(shù)據(jù)、不完整、違反業(yè)務(wù)或邏輯規(guī)則等問(wèn)題的數(shù)據(jù)進(jìn)行相應(yīng)的檢查操作,如人員是否滿足條件、單位和退休人員是否一致、標(biāo)準(zhǔn)化后的編碼的正確性等。
3 數(shù)據(jù)遷移的實(shí)施
根據(jù)上述的設(shè)計(jì)思路,可以開發(fā)出一套數(shù)據(jù)遷移實(shí)施腳本和數(shù)據(jù)遷移結(jié)果校驗(yàn)?zāi)_本。在遷移腳本執(zhí)行完成后,可通過(guò)校驗(yàn)?zāi)_本檢查數(shù)據(jù),也可以通過(guò)篩選特殊測(cè)試用例進(jìn)行抽查測(cè)試,及時(shí)對(duì)錯(cuò)誤數(shù)據(jù)進(jìn)行修正,或者調(diào)整抽取腳本,重新抽取。
數(shù)據(jù)抽取完成后,需要將數(shù)據(jù)傳遞到新系統(tǒng)中。由于各統(tǒng)籌區(qū)社保系統(tǒng)各自獨(dú)立,而且新系統(tǒng)與各統(tǒng)籌區(qū)系統(tǒng)也沒(méi)有實(shí)際的連接,因此本次數(shù)據(jù)遷移采用了通過(guò)中介文件的方式來(lái)實(shí)現(xiàn)??紤]到相關(guān)系統(tǒng)都使用ORACLE數(shù)據(jù)庫(kù)管理數(shù)據(jù),故可通過(guò)使用ORACLE的工具生成和導(dǎo)入DUMP文件的方法來(lái)實(shí)施數(shù)據(jù)傳遞,將數(shù)據(jù)遷入到新系統(tǒng)中去。導(dǎo)入后,可在系統(tǒng)中對(duì)遷移的數(shù)據(jù)進(jìn)行進(jìn)一步的測(cè)試,確保遷移的數(shù)據(jù)可在系統(tǒng)中正常使用。
4 結(jié)語(yǔ)
通過(guò)上述步驟的實(shí)施,計(jì)劃生育一次性待遇發(fā)放系統(tǒng)的數(shù)據(jù)遷移已經(jīng)基本完成了。本次實(shí)施過(guò)程中,主要難點(diǎn)是不同統(tǒng)籌區(qū)業(yè)務(wù)數(shù)據(jù)怎樣進(jìn)行統(tǒng)一,因此必須對(duì)各統(tǒng)籌區(qū)的相關(guān)業(yè)務(wù)數(shù)據(jù)都有了解,也需要同相關(guān)用戶和技術(shù)人員反復(fù)溝通。遷移完成后要進(jìn)行多次測(cè)試以檢驗(yàn)遷移數(shù)據(jù)的完整性和正確性。目前本系統(tǒng)已經(jīng)正式上線使用,本次數(shù)據(jù)遷移為企業(yè)退休職工一次性待遇發(fā)放的順利開展提供了數(shù)據(jù)保障。
參考文獻(xiàn)
[1] 池太崴.數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)設(shè)計(jì)與實(shí)施-建造信息系統(tǒng)的金字塔[M].2版.電子工業(yè)出版社,2009.
[2] 袁磊,劉宏生,王淮龍.醫(yī)院信息系統(tǒng)數(shù)據(jù)遷移的實(shí)現(xiàn)[J].中國(guó)醫(yī)療前沿(下半月),2009,4(11):123-124.
[3] 趙欽,周丹.政府辦公自動(dòng)化信息系統(tǒng)數(shù)據(jù)遷移解決方案[J].廣西科學(xué)院學(xué)報(bào),2008,24(4):354-355,359.