国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

變“異構(gòu)”為“共享”

2012-04-29 00:44余兆力王華飛趙二紅
信息化建設(shè) 2012年11期
關(guān)鍵詞:總庫(kù)法人異構(gòu)

余兆力 王華飛 趙二紅

由于歷史進(jìn)程或各方面原因,各

部門(mén)、行業(yè)、領(lǐng)域等都分別保存著不同歷史時(shí)期各種各樣的數(shù)據(jù)資料。這些數(shù)據(jù)因?yàn)轶w系結(jié)構(gòu)、操作系統(tǒng)、數(shù)據(jù)庫(kù)、數(shù)據(jù)結(jié)構(gòu)等方面的異構(gòu),導(dǎo)致信息不能自動(dòng)地實(shí)現(xiàn)共享或無(wú)法直接用于共享。如何完成不同部門(mén)之間的數(shù)據(jù)比對(duì)和整合,實(shí)現(xiàn)部門(mén)之間數(shù)據(jù)資源共享和重復(fù)利用,已經(jīng)成為迫切需要解決的問(wèn)題。結(jié)合“寧波市法人基礎(chǔ)信息建設(shè)”項(xiàng)目中的數(shù)據(jù)處理案例,深入研究如何對(duì)大量異構(gòu)數(shù)據(jù)進(jìn)行復(fù)雜關(guān)聯(lián)比對(duì),找出盡量多的相同、相似信息,將同源信息整合到一起,打破信息孤島現(xiàn)象,使現(xiàn)有的數(shù)據(jù)信息可以得到更有效的共享、交換、集成和再利用。

異構(gòu)數(shù)據(jù)處理過(guò)程

異構(gòu)數(shù)據(jù)處理應(yīng)用于數(shù)據(jù)交換系統(tǒng)和服務(wù)系統(tǒng)、應(yīng)用系統(tǒng)之間,負(fù)責(zé)將采集到的數(shù)據(jù)進(jìn)行處理,并返回處理結(jié)果。

由于各種原因,部門(mén)數(shù)據(jù)各自符合自身業(yè)務(wù)需求,要將這些數(shù)據(jù)進(jìn)行共享和重復(fù)利用,需要首先將數(shù)據(jù)進(jìn)行集中,集中后進(jìn)行數(shù)據(jù)清洗,將一些不完整或不符合數(shù)據(jù)基礎(chǔ)要求的數(shù)據(jù)進(jìn)行清洗,從而保證最終形成的數(shù)據(jù)是完整的數(shù)據(jù);然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將不同業(yè)務(wù)環(huán)境、輸入語(yǔ)言等情況下形成的數(shù)據(jù)進(jìn)行統(tǒng)一后,進(jìn)入數(shù)據(jù)比對(duì),最終形成完整、準(zhǔn)確的中心信息庫(kù)。

數(shù)據(jù)預(yù)處理

要將部門(mén)數(shù)據(jù)進(jìn)行比對(duì),需要首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,即數(shù)據(jù)初始化,數(shù)據(jù)預(yù)處理主要工作是清理及創(chuàng)建比對(duì)過(guò)程中所需要的數(shù)據(jù)表并將各部門(mén)單位的原始數(shù)據(jù)復(fù)制到臨時(shí)表,為數(shù)據(jù)過(guò)濾和比對(duì)做基礎(chǔ)。

數(shù)據(jù)加工人員選擇要進(jìn)行處理的原始數(shù)據(jù),處理前需要將數(shù)據(jù)內(nèi)容記入原始數(shù)據(jù)庫(kù)。載入所選數(shù)據(jù)后,根據(jù)數(shù)據(jù)唯一標(biāo)識(shí)判斷是否已經(jīng)經(jīng)過(guò)處理。數(shù)據(jù)唯一標(biāo)識(shí)可以是一個(gè)批次號(hào),由數(shù)據(jù)交換子系統(tǒng)生成,如果發(fā)現(xiàn)此數(shù)據(jù)重復(fù),則轉(zhuǎn)到非法數(shù)據(jù)處理。

數(shù)據(jù)規(guī)范化處理,數(shù)據(jù)規(guī)范化主要針對(duì)現(xiàn)有數(shù)據(jù)中存在的大量不規(guī)范現(xiàn)象進(jìn)行處理,包括去空處理(包括去除前空格、后空格、中間空格)、雙字節(jié)統(tǒng)一轉(zhuǎn)化為單字節(jié)、全角符號(hào),如@、&、%等統(tǒng)一轉(zhuǎn)化為半角符號(hào)等。

最后根據(jù)事先約定的數(shù)據(jù)提供格式校驗(yàn)數(shù)據(jù)格式是否合法。如果發(fā)現(xiàn)此數(shù)據(jù)格式非法,則轉(zhuǎn)到非法數(shù)據(jù)處理,經(jīng)過(guò)以上數(shù)據(jù)處理之后,數(shù)據(jù)預(yù)處理完成。

數(shù)據(jù)過(guò)濾

目前一些單位提供的法人數(shù)據(jù)存在著一定的質(zhì)量問(wèn)題,以企業(yè)舉例,主要體現(xiàn)在以下幾個(gè)方面。

企業(yè)代碼不一致:每個(gè)部門(mén)的業(yè)務(wù)系統(tǒng)采用了不同的編碼來(lái)表示一個(gè)企業(yè),如工商局業(yè)務(wù)系統(tǒng)中的企業(yè)注冊(cè)登記號(hào),稅務(wù)系統(tǒng)中的納稅人識(shí)別號(hào),質(zhì)監(jiān)系統(tǒng)中的企業(yè)組織機(jī)構(gòu)代碼等,這些系統(tǒng)根據(jù)自己的業(yè)務(wù)特征以各自的編碼規(guī)則組織、管理企業(yè)信息,編號(hào)僅在本系統(tǒng)中有明確的含義,到了別的系統(tǒng)中則可能沒(méi)有意義。

數(shù)據(jù)量不一致:由于目前各個(gè)業(yè)務(wù)系統(tǒng)之間尚未實(shí)現(xiàn)實(shí)時(shí)的數(shù)據(jù)交換,存在著企業(yè)注冊(cè)后,沒(méi)有辦理組織機(jī)構(gòu)代碼、稅務(wù)登記等業(yè)務(wù),造成了各系統(tǒng)之間數(shù)據(jù)的差別。

數(shù)據(jù)項(xiàng)數(shù)據(jù)不合法:比如企業(yè)名稱(chēng)、注冊(cè)日期等。

數(shù)據(jù)項(xiàng)數(shù)據(jù)不一致:各個(gè)業(yè)務(wù)部門(mén)記錄的同一數(shù)據(jù)項(xiàng)的內(nèi)容不同,主要體現(xiàn)在企業(yè)名稱(chēng)、注冊(cè)登記號(hào)、注冊(cè)地等數(shù)據(jù)項(xiàng)。

代碼標(biāo)準(zhǔn)不一致:比如民族、性別等,在不同的系統(tǒng)中采用不同的代碼。

原始數(shù)據(jù)不真實(shí):比如錄入錯(cuò)誤、惡意謊報(bào)等。

此外,還存在多詞同義、惡意注冊(cè)等現(xiàn)象,這些都給信息的數(shù)據(jù)比對(duì)工作造成很大困難,使得在將分布的數(shù)據(jù)集中到統(tǒng)一的數(shù)據(jù)平臺(tái)后,難以取得數(shù)據(jù)交換的應(yīng)有效果,這就失去了數(shù)據(jù)共享的意義。

通過(guò)數(shù)據(jù)過(guò)濾可以捕獲有用數(shù)據(jù), 去掉重復(fù)數(shù)據(jù),并將這些異常數(shù)據(jù)放入至異常數(shù)據(jù)表中,可以更有效地進(jìn)行數(shù)據(jù)的采集和分析,以確保后續(xù)數(shù)據(jù)的有效性和準(zhǔn)確性,進(jìn)一步提高工作效率。

數(shù)據(jù)比對(duì)

數(shù)據(jù)比對(duì)分為兩種情況,一種是工商的企業(yè)基礎(chǔ)信息的比對(duì),另一種是其他部門(mén)企業(yè)基礎(chǔ)信息和總庫(kù)的法人基礎(chǔ)信息以組織機(jī)構(gòu)代碼、工商注冊(cè)碼和法人單位名稱(chēng)為比對(duì)依據(jù)。

第一種情況:工商企業(yè)基礎(chǔ)信息和總庫(kù)的企業(yè)基礎(chǔ)信息以工商局企業(yè)注冊(cè)號(hào)為比對(duì)依據(jù)。新接收到的工商企業(yè)基礎(chǔ)信息,與總庫(kù)的企業(yè)基礎(chǔ)信息的企業(yè)注冊(cè)號(hào)進(jìn)行比對(duì),比對(duì)一致,則更新總庫(kù)中企業(yè)基礎(chǔ)信息,否則在總庫(kù)中增加一條數(shù)據(jù)。

第二種情況:其他部門(mén)企業(yè)基礎(chǔ)信息和總庫(kù)的企業(yè)基礎(chǔ)信息以組織機(jī)構(gòu)代碼、工商注冊(cè)碼和企業(yè)名稱(chēng)為比對(duì)依據(jù),分多次比對(duì)。

根據(jù)比對(duì)規(guī)則,對(duì)不同部門(mén)的法人數(shù)據(jù)來(lái)源進(jìn)行比對(duì),以形成標(biāo)準(zhǔn)、規(guī)范、準(zhǔn)確的法人信息,保證法人數(shù)據(jù)的唯一性和企業(yè)數(shù)據(jù)的唯一性。根據(jù)定制好的比對(duì)規(guī)則,對(duì)已經(jīng)預(yù)處理完的數(shù)據(jù)進(jìn)行比對(duì),將比對(duì)成功的數(shù)據(jù)插入至中心數(shù)據(jù)庫(kù),并將比對(duì)狀態(tài)標(biāo)識(shí)進(jìn)行更新,比對(duì)不成功的繼續(xù)放在預(yù)處理數(shù)據(jù)庫(kù),等待下一次比對(duì)。這樣處理的優(yōu)勢(shì)如下:一是保證數(shù)據(jù)的準(zhǔn)確性、完整性。二是為了增加中心數(shù)據(jù)庫(kù)的數(shù)據(jù)量。

數(shù)據(jù)審核

首先,羅列所有無(wú)法自動(dòng)比對(duì)的差異數(shù)據(jù),數(shù)據(jù)加工人員選擇要進(jìn)行處理的差異數(shù)據(jù)。然后載入所選數(shù)據(jù),同時(shí)提示差異原因,例如,某企業(yè)在工商的注冊(cè)名與在國(guó)稅的名稱(chēng)不同。工作人員進(jìn)行比對(duì)后,如果數(shù)據(jù)為一致信息,系統(tǒng)將數(shù)據(jù)保存到集成數(shù)據(jù)庫(kù)中,同時(shí)更新差異數(shù)據(jù)之間的映射關(guān)系表;如果數(shù)據(jù)不一致,系統(tǒng)將數(shù)據(jù)保存到差錯(cuò)數(shù)據(jù)庫(kù)中,系統(tǒng)生成一條差錯(cuò)信息,由數(shù)據(jù)處理人員通知信源單位。

異常處理

將數(shù)據(jù)分析結(jié)果反饋給業(yè)務(wù)部門(mén),業(yè)務(wù)部門(mén)對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的處理后,重新進(jìn)行比對(duì)分析,以逐步提高數(shù)據(jù)比對(duì)的成功率,降低異常數(shù)據(jù)的錯(cuò)誤率。

數(shù)據(jù)交換

在數(shù)據(jù)處理過(guò)程中,有些需要將信息做轉(zhuǎn)換,如以本項(xiàng)目中工商的地址信息轉(zhuǎn)化為統(tǒng)計(jì)局的行政區(qū)劃編碼。將各部門(mén)提供的不規(guī)范地址轉(zhuǎn)換為規(guī)范地址的工作,可轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換率為100%。

如工商提供的地址信息(xzjd)字段轉(zhuǎn)化為統(tǒng)一的行政區(qū)劃(xzqh)字段,工商的地址信息為地方標(biāo)準(zhǔn),統(tǒng)計(jì)的地理信息為國(guó)家標(biāo)準(zhǔn)編碼。

寧波市法人基礎(chǔ)信息庫(kù)項(xiàng)目運(yùn)用上述數(shù)據(jù)處理過(guò)程,可以實(shí)現(xiàn)法人信息共享,建成全市統(tǒng)一的法人基礎(chǔ)信息庫(kù)??梢越⒖绲貐^(qū)、跨部門(mén)的法人信息數(shù)據(jù)交換平臺(tái),建立立體開(kāi)放的聯(lián)合征信服務(wù)體制,收集、整合、查詢(xún)、發(fā)布各種政府機(jī)構(gòu)、企業(yè)和個(gè)人的信用信息,可以初步形成電子政務(wù)信息資源共享平臺(tái)。通過(guò)交換平臺(tái)實(shí)時(shí)處理各接入單位的數(shù)據(jù),提高了信息的唯一性和時(shí)效性,并且基于形成的法人庫(kù),試點(diǎn)了法人庫(kù)的在線服務(wù)模式,達(dá)到了部門(mén)之間數(shù)據(jù)資源共享和重復(fù)利用的目的。實(shí)現(xiàn)了法人信用數(shù)據(jù)的交換與共享,為各級(jí)政府及其部門(mén)和社會(huì)公眾提供信用信息服務(wù)??傊?,法人在線服務(wù)模式是政府相關(guān)部門(mén)決策系統(tǒng)的堅(jiān)實(shí)基礎(chǔ),對(duì)提升政府信息化應(yīng)用水平、優(yōu)化環(huán)境、促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展有著重大的意義。

(作者單位:寧波市質(zhì)監(jiān)技術(shù)監(jiān)督局信息中心)

猜你喜歡
總庫(kù)法人異構(gòu)
法人征訂(新)
法人形象廣告
試論同課異構(gòu)之“同”與“異”
完善法人治理結(jié)構(gòu) 增強(qiáng)打造世界領(lǐng)先內(nèi)生動(dòng)力——中國(guó)石化完善法人治理結(jié)構(gòu)的實(shí)踐與思考
非營(yíng)利法人破產(chǎn)特殊制度安排研究
“中國(guó)知網(wǎng)”《現(xiàn)代電生理學(xué)雜志》發(fā)行與傳播統(tǒng)計(jì)報(bào)告
關(guān)于我刊實(shí)行《中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)》“刪除學(xué)術(shù)不端文獻(xiàn)的暫行辦法”的通知
異構(gòu)醇醚在超濃縮洗衣液中的應(yīng)用探索
overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究