扎西
一、背景
1997年,我國的藏文小字符集(基本字符集,簡稱基本集)被收入了國際標準ISO/IE 10646 《信息技術 通用多八位編碼字符集》(對應的我國國家標準編號為GB 13000)。同年,我國發(fā)布了國家標準GB/T 16959-1997《信息技術信息交換用藏文編碼字符集基本集》。
由于藏文本身的書寫特點和現(xiàn)階段我國技術水平的限制,僅靠藏文基本集,難以徹底解決 藏文信息處理和交換問題。為此,我國專家于2002年向國際標準化組織提交了藏文編碼字符集擴充集提案(“大丁”字符集,本標準草案的前身和技術基礎),由于非技術原因,該提案未被采納。但我國的藏文信息化建設卻不能因此而停頓,因此,國家標準化管理委員會于2002年底下達了制定藏文編碼字符集擴充集的任務。
二、藏文編碼國家標準制定的原則
以2004年04月13日藏文編碼標準編制工作組第一次會議(北京,電子工業(yè)標準化研究所)和2004年6月藏文編碼工作組第二次會議(拉薩,拉薩飯店)紀要的內(nèi)容為準,結合2003年12月成都會議的決議,確定了藏文編碼國家標準制定的指導綱要,即“在國際標準框架下制定藏文大字符集編碼國家標準,定義垂直預組合的藏文字符,應作為我國藏文信息處理發(fā)展的策略;同時,不排斥小字符集的技術方案,并積極跟蹤研究動態(tài)組合技術”。
三、藏文大中小字符集及字匯定義
基本藏文字符集(Basic set):已經(jīng)在0F00-0FCF編碼的全部藏文字符(又稱小字符集,共有195個編碼字符和15個未用的編碼位置)。所收集的字符及各種用符號分別 由“非組合字符”和“組合字符”組成。
擴充字符集A (Extension set A) :由基本字符縱向疊加而成的結構穩(wěn)定的藏文字符和最常用梵音轉(zhuǎn)寫字符的集合。
四、擴充字符集A的字符確定依據(jù)
1.擴充字符集A共有1536個垂直預組合字符。
2.現(xiàn)代藏文(三次規(guī)范后的藏文書寫形式)、古藏文(規(guī)范之前藏文書寫形式)和已成 為藏文部分的梵音轉(zhuǎn)寫藏文字符,共 962個字符。
3.最常用梵音轉(zhuǎn)寫藏文字符574個。以西藏收集的大字符集、藏學中心提供的出現(xiàn)頻率 高的梵音轉(zhuǎn)寫藏文字符和其它佛教經(jīng)典中出現(xiàn)的常用梵音轉(zhuǎn)寫藏文字符為主要依據(jù), 同時參考了青海師大、西北民大提供的字頻統(tǒng)計,確定了574個最常用梵音轉(zhuǎn)寫藏文字符。
五、與我國有關的現(xiàn)行法律、法規(guī)和相關強制性標準的關系
1.藏文擴充集A與GB/T 16959-1997(藏文基本集)的關系
擴充集A是基本集的擴充集;
擴充集A和基本集能表示和交換以現(xiàn)代藏文為載體的所有信息,滿足現(xiàn)代藏文信息處理的需要。
2.藏文擴充集A與GB 13000的關系
GB 13000規(guī)定了通用多八位編碼字符集(UCS)。它可用于世界上各種語言(文字)的書面形式 以及附加符號進行表示、傳輸、交換、處理、存儲、輸入及顯現(xiàn)。
本標準的編碼字符集與 GB 13000的多八位基本多文種平面的形式一致。適用于藏文的書面形式 的表示、傳輸、交換、處理、存儲、輸入及顯現(xiàn)。