国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新華社少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范研制綜述

2015-01-30 16:13:28刁毅剛趙東巖賈愛霞
中國傳媒科技 2015年1期
關(guān)鍵詞:維吾爾文標(biāo)準(zhǔn)規(guī)范藏文

文|刁毅剛 趙東巖 賈愛霞

新華社少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范研制綜述

文|刁毅剛 趙東巖 賈愛霞

1 研制背景

《少數(shù)民族語言新媒體工程》(一期)依托分社維文、蒙文、藏文、朝鮮文和中英文新媒體產(chǎn)品加工與發(fā)布中心的建設(shè)工作,以進(jìn)一步繁榮和發(fā)展少數(shù)民族文化事業(yè),推動(dòng)社會(huì)主義文化大發(fā)展大繁榮,促進(jìn)各民族團(tuán)結(jié)與融合為目標(biāo),依托713實(shí)驗(yàn)室新媒體創(chuàng)新工作,研發(fā)面向少數(shù)民族地區(qū)民文語言處理、新媒體創(chuàng)新、社會(huì)維穩(wěn)等應(yīng)用環(huán)節(jié)的創(chuàng)新產(chǎn)品和共性技術(shù)模塊,增強(qiáng)少數(shù)民族地區(qū)、周邊中亞、東南亞和東亞鄰國地區(qū)的新聞信息集成服務(wù)能力,配合新疆、西藏、內(nèi)蒙古、吉林等地方政府做好地區(qū)維穩(wěn)工作。

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范研制》是《少數(shù)民族語言新媒體工程》(一期)的一個(gè)子項(xiàng),它是基于我國少數(shù)民族語言應(yīng)用越來越廣泛、相關(guān)應(yīng)用研發(fā)缺少統(tǒng)一規(guī)范的現(xiàn)狀,按照“需求主導(dǎo)、標(biāo)準(zhǔn)先行”的指導(dǎo)思想而提出的。本子項(xiàng)主要研制《少數(shù)民族語言新媒體工程》的標(biāo)準(zhǔn)體系和重要技術(shù)標(biāo)準(zhǔn)規(guī)范,開展民文新媒體標(biāo)準(zhǔn)體系和重要標(biāo)準(zhǔn)的編制工作,為研發(fā)面向少數(shù)民族地區(qū)民文語言處理、新媒體創(chuàng)新、社會(huì)維穩(wěn)等應(yīng)用環(huán)節(jié)的創(chuàng)新產(chǎn)品提供堅(jiān)實(shí)基礎(chǔ),形成數(shù)據(jù)共享、應(yīng)用復(fù)用的良好環(huán)境,提高相關(guān)產(chǎn)品的研發(fā)和應(yīng)用成本。

根據(jù)《少數(shù)民族語言新媒體工程》(一期)的規(guī)劃和新華社新媒體應(yīng)用的具體情況,本子項(xiàng)的主要目標(biāo)是,建立《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》的標(biāo)準(zhǔn)體系表,并選擇維吾爾文、藏文、蒙文和朝文四種影響力較大、應(yīng)用較廣的少數(shù)民族文,研制需求較為緊迫的四種規(guī)范,并對少數(shù)民族語言的語音合成研究狀況進(jìn)行調(diào)研。

2 研制內(nèi)容

基于以上背景,《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范研制》子項(xiàng)的具體研制內(nèi)容如下:基于維吾爾文、藏文、蒙文和朝文,編制《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系表》、制定《少數(shù)民族文字的新媒體終端顯示拼字符規(guī)范》《少數(shù)民族文字新媒體跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》《少數(shù)民族文字新媒體系統(tǒng)界面術(shù)語規(guī)范》和《少數(shù)民族文字新媒體終端文字顯示規(guī)范》四項(xiàng)技術(shù)標(biāo)準(zhǔn),并對《少數(shù)民族文字語音合成技術(shù)》形成調(diào)研報(bào)告。

3 研制原則

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》的研制原則為采納國內(nèi)外最新的相關(guān)研究成果,結(jié)合少數(shù)民族語言在國內(nèi)外信息系統(tǒng)中的應(yīng)用情況,與現(xiàn)行的國內(nèi)外技術(shù)標(biāo)準(zhǔn)盡量接軌,方便國內(nèi)少數(shù)民族語言信息系統(tǒng)、特別是新華社少數(shù)民族語言新媒體工程的應(yīng)用。

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》的研制根據(jù)工程建設(shè)總體框架及相關(guān)技術(shù),結(jié)合國內(nèi)外相關(guān)研究成果,提出我國少數(shù)民族語言新媒體工程建設(shè)的標(biāo)準(zhǔn)體系表,歸納總結(jié)工程建設(shè)中需要引用,制定和剪裁使用的標(biāo)準(zhǔn)規(guī)范,以保證今后在工程的建設(shè)和運(yùn)維過程中正確配置和使用少數(shù)民族語言標(biāo)準(zhǔn)。

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系表》根據(jù)少數(shù)民族語言新媒體工程建設(shè)總體框架及相關(guān)技術(shù),結(jié)合國內(nèi)外相關(guān)研究成果,研制維、藏、蒙、朝四種少數(shù)民族語言在新華社新媒體應(yīng)用環(huán)境下的相關(guān)軟件規(guī)范,歸納總結(jié)工程建設(shè)中需要引用、制定和剪裁使用的標(biāo)準(zhǔn)規(guī)范,并根據(jù)標(biāo)準(zhǔn)規(guī)范之間的內(nèi)在聯(lián)系,形成科學(xué)的有機(jī)整體,對新華社少數(shù)民族語言新媒體工程的相關(guān)應(yīng)用起到規(guī)范、統(tǒng)一的作用,以期使相關(guān)少數(shù)民族語言的應(yīng)用研發(fā)有章可循。本標(biāo)準(zhǔn)體系適用于新華社少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)和規(guī)范的規(guī)劃、編制和修訂。

《少數(shù)民族文字的新媒體終端顯示拼字符規(guī)范》《少數(shù)民族文字新媒體跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》《少數(shù)民族文字新媒體系統(tǒng)界面術(shù)語規(guī)范》和《少數(shù)民族文字新媒體終端文字顯示規(guī)范》四項(xiàng)技術(shù)規(guī)范,主要關(guān)注少數(shù)民族語言新媒體工程中最為基礎(chǔ)的文字編碼、系統(tǒng)界面術(shù)語、文字顯現(xiàn)等問題,研制相關(guān)規(guī)范。

隨著少數(shù)民族語言應(yīng)用的深入,語音合成也逐漸引起人們的關(guān)注。鑒于該項(xiàng)技術(shù)尚不夠成熟,本課題在進(jìn)行技術(shù)調(diào)研的基礎(chǔ)之上,形成《少數(shù)民族文字語音合成技術(shù)》調(diào)研報(bào)告。

4 主要規(guī)范內(nèi)容

4.1 《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系表》

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系表》將新華社少數(shù)民族語言新媒體工程中特有的、目前和未來可能涉及到的軟件規(guī)范,如《少數(shù)民族語言新媒體工程終端顯示拼字符規(guī)范》《少數(shù)民族語言新媒體工程跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》《少數(shù)民族語言新媒體工程界面術(shù)語規(guī)范》《少數(shù)民族語言新媒體工程終端文字顯示規(guī)范》《少數(shù)民族語言新媒體工程語音合成規(guī)范》等按照一定形式排列起來的圖表。該圖表目前涉及維吾爾文、藏文、蒙文和朝鮮文等四種語言的相關(guān)規(guī)范,具有一定的邏輯結(jié)構(gòu),反映各規(guī)范之間的關(guān)聯(lián)關(guān)系。該圖表還具有一定的擴(kuò)展性,未來可包括更多少數(shù)民族語言、更多其他相關(guān)軟件規(guī)范,并形成有機(jī)邏輯整體。

《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系表》具體規(guī)范了體系表的范圍、參考模型、結(jié)構(gòu)與層次、標(biāo)準(zhǔn)體系框架及框架明細(xì)表。

4.2 《少數(shù)民族文字新媒體跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》

《少數(shù)民族文字新媒體跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》規(guī)定了維吾爾文、藏文、蒙古文和朝鮮文的跨平臺(tái)編碼轉(zhuǎn)換方法和規(guī)定,適用于新華社少數(shù)民族語言新媒體系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文的信息處理。

維吾爾文跨平臺(tái)編碼規(guī)則:“新華社少數(shù)民族語言新媒體工程”中維吾爾文字符采用《信息技術(shù) 維吾爾文、哈薩克文、柯爾克孜文編碼字符集》(GB 21669-2008)中規(guī)定的編碼。采用其他編碼的內(nèi)容進(jìn)行交換時(shí)轉(zhuǎn)換為上述規(guī)定的編碼。

藏文跨平臺(tái)編碼規(guī)則:“新華社少數(shù)民族語言新媒體工程”中的藏文字符采用《信息技術(shù) 信息交換用藏文編碼字符集 基本集》(GB 16959-1997)、《信息技術(shù) 藏文編碼字符集 擴(kuò)充集A》(GB/T 20542-2006)、《信息技術(shù) 藏文編碼字符集 擴(kuò)充集B》(GB/T 22238-2008)中規(guī)定的編碼。其他藏文編碼的內(nèi)容進(jìn)行交換時(shí)應(yīng)轉(zhuǎn)換為上述規(guī)定的編碼。信息檢索等系統(tǒng)應(yīng)能夠處理信息交換用藏文編碼字符集基本集與擴(kuò)充集A、B中不同編碼表示的字符。

蒙古文跨平臺(tái)編碼規(guī)則:“新華社少數(shù)民族語言新媒體工程”中蒙古文字符采用《信息技術(shù) 通用多八位編碼字符集(UCS)》(GB13000-2010)中規(guī)定的編碼,變形顯現(xiàn)表示應(yīng)符合《信息技術(shù) 蒙古文變形顯現(xiàn)字符集和控制字符使用規(guī)則》(GB/T 26226-2010)中的規(guī)定。其他蒙古文編碼的內(nèi)容進(jìn)行交換時(shí)應(yīng)轉(zhuǎn)換為上述規(guī)定的編碼。

朝鮮文跨平臺(tái)編碼規(guī)則:“新華社少數(shù)民族語言新媒體工程”中朝鮮文字符采用《信息技術(shù) 通用多八位編碼字符集(UCS)》(GB 13000)中規(guī)定的編碼。采用《信息交換用朝鮮文字編碼字符集》(GB 12052-1989)編碼和其他編碼的內(nèi)容,進(jìn)行交換時(shí)應(yīng)轉(zhuǎn)換為上述中規(guī)定的編碼。

4.3 《少數(shù)民族語言新媒體工程界面術(shù)語規(guī)范》

本規(guī)范規(guī)定了新華社少數(shù)民族語言新媒體工程系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文應(yīng)用軟件應(yīng)使用的界面術(shù)語。

本規(guī)范依據(jù)軟件操作的類別,從邏輯上將常用系統(tǒng)界面術(shù)語分為9個(gè)類別,即操作系統(tǒng)類、通用類、文檔編輯類、WEB類、郵件類、電商類、音視頻類、閱讀類以及社交網(wǎng)絡(luò)類。每個(gè)類別還包含多個(gè)子類別,形成一個(gè)多層次的邏輯結(jié)構(gòu)。本規(guī)范依次說明每個(gè)類別所包含的系統(tǒng)界面術(shù)語。對于每一個(gè)術(shù)語,給出其中、英文名稱和含義,然后以維、藏、蒙、朝次序依次給出對應(yīng)文種的規(guī)范術(shù)語。

4.4 《少數(shù)民族語言新媒體工程終端文字顯示規(guī)范》

本規(guī)范規(guī)定了新華社少數(shù)民族語言新媒體工程系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文的字符終端顯示字形的要求。本規(guī)范適用于新華社少數(shù)民族語言新媒體工程系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文的信息處理。

終端顯示字形的基本要求:本規(guī)范規(guī)定了對顯示字庫、終端顯示字型質(zhì)量和點(diǎn)陣尺寸的要求。

不同文種的混排:本規(guī)范規(guī)定了不同文種混排時(shí)對字符大小和字符相對位置的要求。

字體修飾效果:本規(guī)范規(guī)定了對維、藏、蒙、朝文字進(jìn)行修飾處理(如空心字、溝邊字等)時(shí)的要求。

4.5 《少數(shù)民族語言新媒體工程終端顯示拼字符規(guī)范》

本規(guī)范規(guī)定了新華社少數(shù)民族語言新媒體工程系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文的組合字符的字形拼字方法和規(guī)定。本規(guī)范適用于新華社少數(shù)民族語言新媒體工程系統(tǒng)中維吾爾文、藏文、蒙古文和朝鮮文的信息處理。

維吾爾文拼字規(guī)則定義了維吾爾文字母各種顯現(xiàn)形式連接的方法:按照GB 21669-2008《信息技術(shù) 維吾爾文、哈薩克文、柯爾克孜文編碼字符集》中的規(guī)定,使用詞首、詞中、詞末等顯現(xiàn)形式顯示字符。字母變形顯現(xiàn)形式的字形應(yīng)符合GB13000、GB 21669-2008以及相應(yīng)的維吾爾文字型國家標(biāo)準(zhǔn)。并對組成詞時(shí)的拼接質(zhì)量提出了要求。

藏文組合字符拼字規(guī)則:定義了藏文字母縱向組合的方法,規(guī)定了前導(dǎo)符與組合字符的縱向組合字的規(guī)則、組合字的基線位置、多字母組合的質(zhì)量要求,以及與組合字符的要求。

蒙古文組合字符拼字規(guī)則:按照GB 25914-2010《信息技術(shù) 傳統(tǒng)蒙古文名義字符、變形顯現(xiàn)字符和控制字符使用規(guī)則》中的規(guī)定,使用詞首、詞中、詞末的顯現(xiàn)形式顯示字符,字母變形顯現(xiàn)形式的字形應(yīng)符合GB13000、GB 25914-2010以及相應(yīng)的蒙古文字型國家標(biāo)準(zhǔn);并對組成詞時(shí)的拼接質(zhì)量提出了要求。

朝鮮文字符拼字規(guī)則:一般不需要拼字。

4.6 《少數(shù)民族語言新媒體工程語音合成技術(shù)調(diào)研報(bào)告》

少數(shù)民族語音合成技術(shù)在文本分析、韻律分析、語音合成、語料庫建立等方面進(jìn)行了廣泛的探索和研究,取得了可喜的成績,但是由于缺乏少數(shù)民族語言語音合成的通用技術(shù)規(guī)范,業(yè)界缺乏比較通用的針對藏語、蒙語、維語、朝鮮語等少數(shù)民族語言的語音合成軟件和技術(shù),語音合成效果難以量化。本次少數(shù)民族語言新媒體工程項(xiàng)目對維、藏、蒙、朝等少數(shù)民族語言的語音合成形成了調(diào)研報(bào)告,如何研制針對少數(shù)民族語言的語音合成規(guī)范、如何對語音合成效果進(jìn)行量化表示、如何開發(fā)業(yè)界通用的語音合成軟件這也是少數(shù)民族語言語音處理領(lǐng)域未來的重要研究方向之一。

5 結(jié)語

本次研制的新華社《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》搭建了少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)體系的框架,為今后的相關(guān)標(biāo)準(zhǔn)研制提供了頂層設(shè)計(jì)依據(jù)。

本次研制的多項(xiàng)標(biāo)準(zhǔn)規(guī)范,可應(yīng)用于新華社少數(shù)民族類應(yīng)用平臺(tái)的相關(guān)軟件設(shè)計(jì)和研發(fā)過程中。《少數(shù)民族語言新媒體工程跨平臺(tái)編碼轉(zhuǎn)換規(guī)范》可用于規(guī)范基礎(chǔ)數(shù)據(jù)的編碼,防止舊編碼數(shù)據(jù)進(jìn)入新系統(tǒng),帶來數(shù)據(jù)的不一致性和數(shù)據(jù)處理的復(fù)雜性,影響系統(tǒng)性能,加大系統(tǒng)研發(fā)成本?!渡贁?shù)民族語言新媒體工程界面術(shù)語規(guī)范》可用于規(guī)范相關(guān)少數(shù)民族類應(yīng)用平臺(tái)的界面術(shù)語,使之具有更好的辨識(shí)性,降低用戶學(xué)習(xí)成本,提高生產(chǎn)效率。《少數(shù)民族語言新媒體工程終端文字顯示規(guī)范》和《少數(shù)民族語言新媒體工程終端顯示拼字符規(guī)范》可用于規(guī)范少數(shù)民族類應(yīng)用的終端顯示和顯現(xiàn)效果,使之遵循專業(yè)和經(jīng)典的呈現(xiàn)效果,有利于少數(shù)民族語言的有效傳承,也同時(shí)提高相關(guān)信息應(yīng)用的專業(yè)化程度和品牌影響力。

需要指出的是,此次研制的《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》只是研制了較為基礎(chǔ)、應(yīng)用急迫的幾個(gè)規(guī)范。隨著少數(shù)民族語言應(yīng)用和信息技術(shù)的逐步發(fā)展,其他規(guī)范的研制可能會(huì)逐漸凸顯(如《少數(shù)民族語言信息搜索技術(shù)標(biāo)準(zhǔn)規(guī)范》等),有些規(guī)范還需要進(jìn)行技術(shù)更新。

為了使此次研制的相關(guān)規(guī)范能夠適應(yīng)并促進(jìn)新華社的相關(guān)應(yīng)用的研發(fā),我們初步建議以下的推廣計(jì)劃:

(1)調(diào)研新華社提供的相關(guān)少數(shù)民族語言應(yīng)用和平臺(tái),列出類別和數(shù)量。

(2)從上述應(yīng)用和平臺(tái)中選擇一定比例,初步判定其中符合《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》的情況,總結(jié)出實(shí)施《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》的難度級別。

(3)選擇一些新的少數(shù)民族語言類應(yīng)用,使之遵循《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》,并跟蹤應(yīng)用新標(biāo)準(zhǔn)的具體情況,如難度、對研發(fā)進(jìn)程的影響,并進(jìn)行綜合應(yīng)用效果評審。

(4)根據(jù)試點(diǎn)應(yīng)用情況,確定《少數(shù)民族語言新媒體工程標(biāo)準(zhǔn)規(guī)范》改進(jìn)計(jì)劃和全面應(yīng)用計(jì)劃。(作者單位:新華社通信技術(shù)局 北京大學(xué)計(jì)算機(jī)技術(shù)研究所)

(作者單位:新華社通信技術(shù)局北京大學(xué)計(jì)算機(jī)技術(shù)研究所)

猜你喜歡
維吾爾文標(biāo)準(zhǔn)規(guī)范藏文
西藏大批珍貴藏文古籍實(shí)現(xiàn)“云閱讀”
布達(dá)拉(2020年3期)2020-04-13 10:00:07
工業(yè)鍋爐標(biāo)準(zhǔn)規(guī)范數(shù)據(jù)庫管理系統(tǒng)實(shí)現(xiàn)
黑水城和額濟(jì)納出土藏文文獻(xiàn)簡介
西夏學(xué)(2019年1期)2019-02-10 06:22:34
西部少數(shù)民族語言對阿拉伯文獻(xiàn)的譯介及其特點(diǎn)
藏文音節(jié)字的頻次統(tǒng)計(jì)
現(xiàn)代語境下的藏文報(bào)刊
新聞傳播(2016年17期)2016-07-19 10:12:05
韓國擬修訂食品容器和包裝標(biāo)準(zhǔn)規(guī)范
維吾爾文研究與Android維文閱讀器的實(shí)現(xiàn)?
察合臺(tái)維吾爾文古籍的主要特點(diǎn)
央行發(fā)布兩項(xiàng)征信行業(yè)標(biāo)準(zhǔn)規(guī)范征信機(jī)構(gòu)信息安全
浪卡子县| 宣恩县| 新民市| 常山县| 财经| 凌海市| 会宁县| 南充市| 额尔古纳市| 五常市| 东安县| 高陵县| 丰镇市| 瑞金市| 从化市| 屏边| 密云县| 松桃| 松阳县| 遂川县| 雷波县| 湘潭市| 铁力市| 兴城市| 尖扎县| 通城县| 惠安县| 玛曲县| 柳州市| 延吉市| 个旧市| 宁化县| 丹棱县| 墨玉县| 温州市| 舞阳县| 西昌市| 定兴县| 长治县| 钟祥市| 蓬莱市|