康君
摘 要
2012年吉林省啟動(dòng)社會(huì)保障一卡通建設(shè)工作,為使這項(xiàng)便民、利民和惠民的工程能夠盡快地實(shí)施,省人社廳決定采取數(shù)據(jù)采集和系統(tǒng)建設(shè)齊頭并進(jìn)的方案來開展工作。由此社會(huì)保障卡持有人數(shù)據(jù)采集工作提到了重要日程,卡是社會(huì)保障一卡通的載體,采集持卡人的個(gè)人信息是社會(huì)保障一卡通建設(shè)最基礎(chǔ)的工作,由于全民納入社會(huì)保障的惠民政策,采集工作量非常巨大,又由于新的社會(huì)保障卡加載了金融功能,涉及到持卡人需要選擇相應(yīng)的服務(wù)銀行,因此,必須由持卡人填表簽字確認(rèn)。本文對(duì)社會(huì)保障一卡通數(shù)據(jù)的采集和整理技巧做出了相應(yīng)的研究。
【關(guān)鍵詞】一卡通 持卡人 數(shù)據(jù)采集
1 前言
為了提高持卡人個(gè)人信息數(shù)據(jù)采集的效率,我們采取了利用已有個(gè)人基本信息數(shù)據(jù)先打印好《社會(huì)保障卡申領(lǐng)登記確認(rèn)表》,然后再由持卡人確認(rèn)簽字的方案,這樣可以省去填表的過程,極大地提高采集效率。由于采取了這樣的方案,那么,首先要做的工作就是利用相關(guān)部門的個(gè)人基本信息數(shù)據(jù),制作規(guī)范化的excel數(shù)據(jù)表。
從相關(guān)部門獲得的個(gè)人基本信息數(shù)據(jù),并不完全符合要求,需要對(duì)數(shù)據(jù)進(jìn)行整理。應(yīng)注意的問題包括列表結(jié)構(gòu)順序、字段屬性等。
按照個(gè)人基本信息數(shù)據(jù)采集規(guī)范,必須對(duì)持卡人采集包括居民身份證號(hào)、身份證有效截止日期、姓名、性別、民族、出生年月、單位名稱、通訊地址、聯(lián)系電話和相片等信息。
從相關(guān)部門獲得的數(shù)據(jù),其個(gè)人記錄信息一般都是正確的,但也有少數(shù)記錄信息存在錯(cuò)誤,在姓名中存在同音不同字,如:姓名記錄為“張山”,而實(shí)際為“張珊”;性別記錄為“男”,而實(shí)際為“女”等。為了保證數(shù)據(jù)準(zhǔn)確導(dǎo)入數(shù)據(jù)庫,就需要進(jìn)行認(rèn)真、仔細(xì)和準(zhǔn)確的采集數(shù)據(jù)。為此,我們采用從不同部門獲得的個(gè)人基本信息數(shù)據(jù)進(jìn)行比對(duì)、篩選,主要采信居民身份證信息,“性別”和“出生年月”按照居民身份證號(hào)規(guī)范進(jìn)行提取生成,相片也要按照“358×441”像素的規(guī)格進(jìn)行處理。
針對(duì)從相關(guān)部門獲得的個(gè)人基本信息數(shù)據(jù)要對(duì)各個(gè)字段進(jìn)行字段屬性轉(zhuǎn)換,我們的經(jīng)驗(yàn)是除序號(hào)字段外,其他字段屬性一律設(shè)置成“文本屬性”,這樣做的好處是在以后的數(shù)據(jù)處理中不會(huì)出現(xiàn)意想不到的問題。
從相關(guān)部門獲得的個(gè)人基本信息數(shù)據(jù)通常與我們的要求并不相符,為了使數(shù)據(jù)符合《社會(huì)保障卡相關(guān)技術(shù)規(guī)范》,我們需要針對(duì)數(shù)據(jù)進(jìn)行整理,這個(gè)數(shù)據(jù)整理工作不僅僅是為了打印《社會(huì)保障卡申領(lǐng)登記確認(rèn)表》,也要為日后批量申請社會(huì)保障卡做好準(zhǔn)備。
《社會(huì)保障卡相關(guān)技術(shù)規(guī)范》中規(guī)定社會(huì)保障卡數(shù)據(jù)格式為:
序號(hào),居民身份證號(hào),姓名,性別,民族,出生年月,單位名稱,聯(lián)系電話,服務(wù)銀行……
2 數(shù)據(jù)整理步驟
下面將具體數(shù)據(jù)整理步驟進(jìn)行詳細(xì)說明:
2.1 準(zhǔn)備數(shù)據(jù)
整理數(shù)據(jù)比較方便的應(yīng)用軟件是MS_OFFICE組件中的EXCEL,相關(guān)部門獲得的數(shù)據(jù)與我們要求的數(shù)據(jù)字段名稱以及數(shù)據(jù)結(jié)構(gòu)不盡相同,需要將相關(guān)部門的數(shù)據(jù)進(jìn)行整理,整理過程中一定要按照《社會(huì)保障卡相關(guān)技術(shù)規(guī)范》的要求進(jìn)行,也為將來數(shù)據(jù)上傳卡管系統(tǒng)做好準(zhǔn)備。
2.2 數(shù)據(jù)整理過程中需要注意的問題
因?yàn)閺南嚓P(guān)單位獲得的數(shù)據(jù)與我們所要求的標(biāo)準(zhǔn)數(shù)據(jù)存在差異,如有些數(shù)據(jù)存在空格,有些數(shù)據(jù)存在字母大小寫不一致,有些數(shù)據(jù)存在重復(fù)數(shù)據(jù),有些數(shù)據(jù)需要重新命名等,下面就常見的3個(gè)問題進(jìn)行說明。
2.2.1 空格處理
數(shù)據(jù)中存在空格共有3種情況,一是字段的字符串前面有空格,二是字段的字符串后面有空格,三是字段的字符串中間部分有空格。在處理數(shù)據(jù)之前應(yīng)該在相鄰處復(fù)制一列,防止處理數(shù)據(jù)時(shí)出現(xiàn)錯(cuò)誤無法挽回,造成不必要的損失。復(fù)制的方法是,先在相鄰格間插入一列,然后,選中目標(biāo)列,再按住CTRL健,同時(shí)將鼠標(biāo)放置到選中列的邊框處,此時(shí)鼠標(biāo)出現(xiàn)一個(gè)“+”號(hào),按住鼠標(biāo)左鍵向先前插入的空列拖動(dòng),拖動(dòng)到空列后,空列被填充為要復(fù)制列的內(nèi)容,松開鼠標(biāo)左鍵,復(fù)制完成。
無論空格位置處在哪一種情況下,一般用函數(shù)substitute(text,old_text,new_text)將字符串中的部分字符串以新字符串替換。
例如:C2=substitute(B2," ",""),見圖1。
空格去除后,見圖2。
然后把C列復(fù)制,假如復(fù)制到B列,在B列選擇性粘帖為數(shù)值,這樣可以解除函數(shù)關(guān)聯(lián),再將列標(biāo)名(字段名)由“TEST”重新更名為“姓名”。
2.2.2 處理身份證中末位的字母
有的是大寫“X”,有的是小寫“x”,由于規(guī)定身份證號(hào)中字母要大寫,因此,對(duì)于小寫的字母要改成大寫,一般用函數(shù)upper(text)將小寫字符改寫成大寫字母。
2.2.3 對(duì)于“性別”的篩選整理
最好通過身份證號(hào)來獲得,對(duì)于18位的第二代身份證號(hào)碼格式,從左側(cè)數(shù)第17位是性別標(biāo)識(shí)位,奇數(shù)是“男”,偶數(shù)是“女”。我們可以通過MID函數(shù)提取出該位,然后再用Excel的另一個(gè)函數(shù)MOD進(jìn)行求余數(shù),通過將該位與2進(jìn)行求余,為0就是女性,為1就是男性,以18位第二代身份證為例:
=If(mod(mid(A2,17,1),2)=1,”男”,”女”)
需要說明的是在使用函數(shù)時(shí)要注意單元格的屬性,新的目標(biāo)單元格屬性一般要設(shè)置成“常規(guī)”屬性,否則,函數(shù)失敗,不能進(jìn)行改寫操作。
3 結(jié)語
關(guān)于數(shù)據(jù)采集和整理技巧就說到這里,實(shí)踐中還會(huì)遇到很多問題,希望大家摸索和挖掘更好的方法,以便解決相應(yīng)的問題。
作者單位
四平市人力資源和社會(huì)保障信息中心 吉林省四平市 136000