国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

銀行信息系統(tǒng)生僻字問題探究

2021-04-12 16:33馬征
金融發(fā)展研究 2021年2期
關鍵詞:字庫生僻字字符

馬征

一、信息系統(tǒng)字符集情況介紹

(一)字符集概述

字符是各種文字和符號的總稱,包括各國文字、標點符號、圖形符號、數(shù)字等。字符集(Character set)是多個字符的集合,字符集種類較多,每個字符集包含的字符個數(shù)不同,目前漢字字符集主要有:《信息交換用漢字編碼字符集 基本集》(GB2312-1980),《漢字內碼擴展規(guī)范》(GBK),《信息技術 信息交換用漢字編碼字符集 基本集的擴充》(GB18030-2000),《信息技術 中文編碼字符集》(GB18030-2005),《信息技術 通用多八位編碼字符集(UCS)》(GB13000-2010)。國外軟件系統(tǒng)考慮跨語言、跨平臺處理需求,常用的字符集為Unicode,在操作系統(tǒng)、應用程序中廣泛應用。從執(zhí)行效力看,Unicode與GBK為行業(yè)性規(guī)范,GB2312-1980、GB13000-2010為國家推薦性標準,GB18030-2000和GB18030-2005為國家強制性標準。GB18030-2005現(xiàn)已代替GB18030-2000,其與GB18030-2000相同部分為強制性。從兼容、支持角度看,GB18030-2005能夠與GB2312-1980完全兼容,與GBK基本兼容,支持Unicode 4.0的全部統(tǒng)一漢字。GB13000-2010等同于國際標準化組織(ISO)發(fā)布的通用多八位編碼字符集(ISO/IEC 10646:2003)和多語言軟件制造商聯(lián)盟發(fā)布的統(tǒng)一碼(Unicode 4.0)。詳細信息見表1。

(二)銀行字符集采用情況

以某省城市商業(yè)銀行和農聯(lián)社的487個信息系統(tǒng)為樣本,統(tǒng)計其所涉操作系統(tǒng)、數(shù)據(jù)庫、對外接口及應用(包括中間件、報文傳輸、源代碼)字符集情況。從統(tǒng)計結果看,操作系統(tǒng)、數(shù)據(jù)庫、對外接口及應用采用的字符集主要是Unicode、GBK,少數(shù)為GB2312、GB18030,且支持GB18030的全部為Linux平臺,行業(yè)性規(guī)范成為應用主流,國家標準反而應用較少,詳細情況見表2。造成這一現(xiàn)象的主要原因是:國際上,Unicode由大的軟件制造商組成的聯(lián)盟制定,具有跨語言、跨平臺優(yōu)勢,使其成為應用主流。國內來講,作為基礎軟件的Windows操作系統(tǒng)自帶字符集還是GBK,對于GB18030-2005,Windows雖然提供了擴展支持包,卻沒有實現(xiàn)全面的支持。加之GB18030-2005的宣傳、推廣不足,多年下來,形成了GBK的市場應用存量與慣性,一定程度上限制了對GB18030-2005的應用。

二、生僻字原因分析

金融行業(yè)生僻字是信息系統(tǒng)在存儲、傳輸、顯示等過程中無法正常處理的字符,按照產(chǎn)生原因可劃分為三種情況:一是采用不同字符集的系統(tǒng)交互導致部分字符無法處理。比如當采用GB18030字符集的應用與采用GBK字符集的應用交互時,由于GBK字符只有21003個,在這范圍之外的字符就會無法處理。二是部分字符“一字多碼”導致無法處理?!耙蛔侄啻a”的出現(xiàn)主要是因為Unicode的編碼空間內存在用戶自定義區(qū)(PUA),允許自定義編碼來處理一些生僻字,這些生僻字后期又被Unicode正式收錄,造成一個漢字既有PUA編碼又有Unicode正式碼的“一字多碼”問題。例如“?”字,其在Unicode自定義區(qū)編碼為“E863”,而其正式編碼為“4DAE”。由于GB18030-2005與Unicode編碼的一一對應關系,“一字多碼”問題同樣存在于GB18030-2005編碼空間。這部分字大約有3000多個,包括GBK在1995年制定時收錄的52個漢字和公安部人口信息系統(tǒng)中收錄的方正自定義字中的大部分。三是終端設備字庫和常用輸入法不支持生僻字。一方面,很多終端設備字庫和輸入法支持的規(guī)范、標準內的字符不全,有的僅支持GBK的21003個字,有的雖然支持GB18030的4字節(jié)字符,但不全面,導致終端無法輸入、顯示和打印。另一方面,公安部人口信息系統(tǒng)中存在大約4700個生僻字,屬于方正公司自定義字,需要購買方正字庫獲得,否則這4700個生僻字終端無法輸入、顯示和打印。

三、生僻字應對方法

(一)技術層面處理方法

一是按照“存量升級、增量符合”“先輔助后核心”的原則升級改造。原先使用GBK、GB2312字符集的存量系統(tǒng)升級為GB18030-2005字符集,擴大支持的字符集范圍;原先使用UTF-8、UTF-16編碼方式但僅支持Unicode基本多語言平面(BMP)的存量系統(tǒng),升級為支持Unicode全部平面。新增信息系統(tǒng)則強制支持GB18030-2005字符集。二是針對特殊情況個案處理。對于采用GBK字符集的DB2數(shù)據(jù)庫,目前升級字符集難度較大,需要DB2廠商的開發(fā)支持,金融機構可采用傳輸、存儲時不進行GBK轉碼,直接按照GB18030編碼格式進行二進制存儲作為過渡解決方案。對于“一字多碼”問題,則是在存儲環(huán)節(jié)統(tǒng)一轉化為其Unicode正式碼或其Unicode正式碼對應的GB18030編碼,從而實現(xiàn)字符編碼的統(tǒng)一。三是升級終端字庫和輸入法,擴大終端支持的字符數(shù)量,解決終端生僻字的輸入、顯示和打印問題。

(二)業(yè)務層面處理方法

業(yè)務層面的生僻字處理主要有兩個環(huán)節(jié):一是客戶信息錄入環(huán)節(jié)。在征得客戶同意后,商業(yè)銀行業(yè)務人員通常采用拆字、拼音、繁體字代替等方法變通處理。例如通過拆字方法將客戶姓名“王陹”錄入為“王(耳升日)”;使用拼音將“張?”錄入為“張YAN”,并在備注欄輸入“張(上龍下天)”;使用繁體字將“讠永”錄入為“詠”。二是客戶信息校驗環(huán)節(jié)。各商業(yè)銀行生僻字處理方法、規(guī)則不一,導致跨行轉賬、綁卡等業(yè)務環(huán)節(jié)客戶信息自動校驗無法通過,商業(yè)銀行業(yè)務人員通常采取人工干預方式處理。例如跨行來賬業(yè)務因生僻字問題出現(xiàn)戶名不符時,通過電話聯(lián)系客戶或向付款行發(fā)出查詢,確認相同后再進行入賬處理;或者要求客戶臨柜進行業(yè)務辦理,增加社???、機動車駕駛證、戶口簿等作為輔助核驗手段。

四、生僻字應對建議

(一)加快金融業(yè)生僻字處理指南的制定

標準化、規(guī)范化的生僻字業(yè)務處理流程有助于克服各銀行處理標準不一導致的識別、處理問題,也是當前條件下金融業(yè)應對生僻字問題、提升金融服務體驗最直接、有效的方法。建議進一步加快金融業(yè)生僻字處理指南的制定,統(tǒng)一規(guī)定拆字、拼音、繁體字代替等方法的具體使用情形。整理全行業(yè)遇到的生僻字,建立生僻字替代查找?guī)?,方便一線業(yè)務人員使用,從而發(fā)揮金融行業(yè)標準的標桿和促進作用,不斷提升金融服務水平與效率。

(二)循序推進金融行業(yè)字符集升級

金融行業(yè)信息系統(tǒng)眾多,對所有信息系統(tǒng)進行字符集升級,涉及核心系統(tǒng)、柜面系統(tǒng)、支付平臺、網(wǎng)銀互聯(lián)平臺、網(wǎng)銀及手機銀行等系統(tǒng),需對數(shù)以萬計的代碼源文件進行改動,其中的開發(fā)和測試投入成本較大,也面臨一定的時間與風險考驗,因此,推動金融行業(yè)信息系統(tǒng)字符集升級將是一個長期過程,必須堅持循序漸進原則,區(qū)分“存量系統(tǒng)”與“新增系統(tǒng)”“輔助系統(tǒng)”與“核心系統(tǒng)”,綜合考量各項影響因素,合理制定推進計劃,逐步完成字符集升級改造。

(三)加大國家強制標準宣傳實施力度

面向開發(fā)商、行業(yè)用戶開展針對性宣傳,增強標準貫徹意識,落實標準為民利企的發(fā)展理念。對不符合GB18030-2005強制要求的基礎軟件產(chǎn)品,如操作系統(tǒng)、數(shù)據(jù)庫等,應禁止核發(fā)銷售許可;對已經(jīng)納入標準、擁有正式編碼的字符,不得使用自定義編碼,杜絕“一字多碼”現(xiàn)象;對尚未納入正式編碼且在公民身份信息系統(tǒng)中已經(jīng)廣泛使用的自定義字符,由標準管理部門統(tǒng)一管理,公開自定義字符、編碼對應關系,建立專門字庫,供各方免費獲取使用。

(四)強化部門協(xié)同一體推進

生僻字問題涉及多個部門和環(huán)節(jié):在管理層面,生僻字問題涉及稅務、電信、社保、金融、公安、工信等諸多部門;在技術層面,生僻字問題涉及操作系統(tǒng)、數(shù)據(jù)庫、對外接口、中間件、源文件等諸多環(huán)節(jié)。單個部門、單個環(huán)節(jié)努力無法根本解決問題。建議由標準主管部門牽頭組織,各行業(yè)部門根據(jù)業(yè)務場景配合協(xié)同,由點到面、由縱向到橫向一體推進,才能從根本上解決生僻字問題。

(責任編輯? ? 劉? ?陽;校對? ?WY,LY)

猜你喜歡
字庫生僻字字符
生僻字里識青銅
Python實現(xiàn)圖片轉字符畫
學習生僻字
正則表達式快速入門
圖片輕松變身ASCⅡ藝術畫
多一些《生僻字》這樣的網(wǎng)紅歌曲
挑戰(zhàn)動物生僻字
對蒙古文字研究與信息發(fā)布互動平臺網(wǎng)站建設的探討
字庫在設計中的局限性——以食品包裝為例
字庫字體侵權系列案例分析研究
水城县| 无为县| 桐梓县| 阿坝县| 永康市| 永善县| 土默特左旗| 云林县| 韶关市| 台江县| 阿合奇县| 班戈县| 芷江| 米脂县| 竹北市| 兴安县| 绥江县| 永兴县| 靖江市| 秀山| 册亨县| 诸城市| 阳东县| 颍上县| 隆子县| 章丘市| 两当县| 绥阳县| 方山县| 灵川县| 双江| 阜城县| 鄱阳县| 天柱县| 平顺县| 镇江市| 溧水县| 密山市| 崇礼县| 达尔| 五指山市|