国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于移動智能設(shè)備的漢語學(xué)習(xí)軟件的研究與實(shí)現(xiàn)

2017-04-27 11:34熱合曼·吾拉音吾守爾·斯拉木熱依曼·
電腦知識與技術(shù) 2016年29期
關(guān)鍵詞:漢語學(xué)習(xí)維吾爾語

熱合曼·吾拉音 吾守爾·斯拉木 熱依曼·吐爾遜 努爾麥麥提·尤魯瓦斯

摘要:為了有效地滿足新疆地區(qū)少數(shù)民族對學(xué)習(xí)漢語的需求,針對基于移動智能設(shè)備的漢語教學(xué)軟件進(jìn)行了分析和研究。根據(jù)維吾爾語的特點(diǎn),提出了自動選形算法的維吾爾文顯示和輸入處理技術(shù),利用語音合成技術(shù)實(shí)現(xiàn)了漢語學(xué)習(xí)軟件的正確發(fā)音和朗讀功能。在存儲及處理大量的相關(guān)文件時,利用了SDF Viewer工具來創(chuàng)建,查看,編輯或?qū)С鰯?shù)據(jù)。該軟件為新疆地區(qū)少數(shù)民族提供了隨時隨地都能夠方便的學(xué)習(xí)漢語的環(huán)境,彌補(bǔ)了少數(shù)民族在Windows Phone平臺上沒有漢語學(xué)習(xí)軟件的空缺。

關(guān)鍵詞:漢語學(xué)習(xí);維吾爾語;移動智能設(shè)備;語音合成

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)29-0183-04

1背景

隨著信息技術(shù)的迅速發(fā)展和各族人們交流的進(jìn)一步加深,學(xué)習(xí)漢語已成為少數(shù)民族人們的重要任務(wù)。不管是在學(xué)習(xí)還是生活方面,都需要加強(qiáng)漢語能力。各個少數(shù)民族只要學(xué)好漢語才能可以跟漢族同志們進(jìn)行正常的交流,因而可以避免不懂語言所帶來的誤解,可以實(shí)現(xiàn)和諧發(fā)展。因此給少數(shù)民族提供方便的學(xué)習(xí)漢語環(huán)境是發(fā)展少數(shù)民族地區(qū)的重要策略。維吾爾族作為新疆地區(qū)人口最多的少數(shù)民族,對學(xué)習(xí)漢語的需求日益增多,但是維吾爾語是屬于阿勒泰語系突厥語族葛邏祿語支,跟漢語和其他語言之間的差別比較大,維吾爾語的書寫格式從右到左,詞與詞之間用空格分隔,詞是不等長的,這些特點(diǎn)給維吾爾語信息處理帶來一定的困難,尤其是在移動智能設(shè)備上處理維吾爾語是比較困難的。最近幾年隨著國家對少數(shù)民族語言文字發(fā)展的大力支持,維吾爾語信息處理技術(shù)也得到了快速的發(fā)展。在個人電腦上已經(jīng)實(shí)現(xiàn)了維吾爾語信息處理,但是在移動智能設(shè)備上,尤其是在Windows Phone平臺上處理維吾爾語還需要進(jìn)一步研究。本文研究與實(shí)現(xiàn)基于移動智能設(shè)備的漢語學(xué)習(xí)軟件,用自動選形算法處理維吾爾文的顯示和輸入,用語音合成技術(shù)實(shí)現(xiàn)靈活而方便的學(xué)習(xí)環(huán)境。由于該軟件基于Windows Phone上實(shí)現(xiàn)的,用戶可以隨時隨地學(xué)習(xí)漢語,考慮到邊遠(yuǎn)地區(qū)網(wǎng)絡(luò)信號不是很好,該軟件是不需要聯(lián)網(wǎng)的。突厥語族中哈薩克語,柯爾克孜語,塔吉克語等語言跟維吾爾語的相似性比較高,本文研究的技術(shù)對這些語言的信息處理有很高的參考價值。本文的結(jié)構(gòu)如下:第二節(jié)主要介紹開發(fā)環(huán)境的搭建和配置,第三節(jié)主要介紹軟件的總體架構(gòu),第四節(jié)主要介紹各個功能模塊的實(shí)現(xiàn)關(guān)鍵技術(shù),第五節(jié)是本文的總結(jié)部分。

2系統(tǒng)研發(fā)

2.1平臺的選擇

Windows Phone(下面簡稱WP)操作系統(tǒng)是微軟公司在建立于Microsoft Win32 API基礎(chǔ)上研發(fā)出的一款移動智能設(shè)備操作系統(tǒng)。到目前為止系統(tǒng)版本更新到了WP10版本。經(jīng)歷幾代版本更新之后WP依然成為微軟的唯一獨(dú)特的移動智能設(shè)備操作系統(tǒng)。其獨(dú)特的Metro風(fēng)格更是受到廣大用戶的青睞。本文針對移動智能設(shè)備操作系統(tǒng)進(jìn)行了一系列分析和研究,最后決定利用WP這個平臺,之所以選擇要使用WP這個平臺是因?yàn)橹饕腥缦聝煞N原因,一是WP作為三大移動平臺之一,以其獨(dú)特的性能和很好的兼容性,受到了廣大用戶的青睞,用戶的數(shù)量在不斷的增多,因?yàn)閮r格比較合適,在新疆使用WP的用戶也比較多,在此平臺上開發(fā)軟件具有一定的實(shí)用價值。第二個原因是在WP平臺上維吾爾語的軟件比較少,這方面的研究也不是很多,本文研究可以填補(bǔ)此方面的空缺,進(jìn)一步提高維吾爾語基于移動設(shè)備上信息處理技術(shù)的發(fā)展。

2.1平臺搭建以及配置

開發(fā)WP需要兩個工具:Windows Phone SDK和MicrosoftVisual Studio集成開發(fā)工具。Microsoft Visual Studio Ultimate2012是收費(fèi)軟件,而且里面不包括Windows Phone SDK,需要另行安裝。如果廣大開發(fā)者沒有授權(quán),也可以使用Microsoft Visu-al Studio Express 2012 for Windows Phone(簡稱MVS2012)。MVS2012開發(fā)工具中包含了Windows Phone SDK8.0。如果開發(fā)者需要其他版本的SDK的話根據(jù)自己的需求和開發(fā)對象,從微軟官方網(wǎng)站中進(jìn)行下載。MVS2012的安裝過程除了安裝Windows Phone SDK 8.0,還會安裝測試WP模擬器(或稱為仿真器),Windows Phone Developer Registration和Application De-ployment等工具。所以它是開發(fā)WP的最好工具。因此,本設(shè)計選用MVS2012工具作為應(yīng)用程序開發(fā)工具。此外,.NETCompact Framework2.0運(yùn)行庫相比前版本來說,在界面設(shè)計、數(shù)據(jù)庫訪問以及安全性等方面做了突出的改進(jìn)。本文選擇.NETCompact Framework 2.0作為開發(fā)框架。開發(fā)語言方面,本文通過XAML語言與C#的結(jié)合開發(fā)WP應(yīng)用程序前端。在MVS2012開發(fā)環(huán)境中,XAML界面設(shè)計擁有豐富的控件支持和可視化的工作界面。代碼的邏輯部分用C#語言實(shí)現(xiàn),而UI界面部分用XAML設(shè)計,這樣開發(fā)變得快速而高效。

3系統(tǒng)功能劃分

本系統(tǒng)是一個基于移動智能設(shè)備的漢語學(xué)習(xí)系統(tǒng),在進(jìn)行系統(tǒng)設(shè)計時,按照維吾爾語和漢語的特點(diǎn),結(jié)合維漢詞典的結(jié)構(gòu),使用模塊化的設(shè)計思想,設(shè)計出具有簡單而優(yōu)美界面的方便,高效的學(xué)習(xí)平臺。通過調(diào)研分析,確定了少數(shù)民族對漢語學(xué)習(xí)軟件的基本需求,從而確定了漢語學(xué)習(xí)軟件中需要實(shí)現(xiàn)的功能和總目標(biāo)。本文研究軟件的最重要特點(diǎn)就是簡單,由于使用該軟件的用戶的文化水平不是很高,對電子產(chǎn)品也不是很理解,因此太復(fù)雜的軟件,他們是沒辦法有效的利用。為了提高該軟件的實(shí)用價值,本文設(shè)計的理念是盡可能降低用戶的操作難度。根據(jù)學(xué)習(xí)語言的基本步驟和特點(diǎn)使該軟件分為課程學(xué)習(xí),綜合學(xué)習(xí)和高級學(xué)習(xí)三部分,學(xué)習(xí)的難度會越來越提升但不是很高級,課程的設(shè)置是深入淺出的,從而提高學(xué)習(xí)者的學(xué)習(xí)效率。每一部分又可以進(jìn)一步細(xì)分,軟件的功能劃分如圖1所示,主界面如圖2所示。

課程學(xué)習(xí)這個模塊是由字母學(xué)習(xí),詞匯學(xué)習(xí)和句子學(xué)習(xí)構(gòu)成的。字母學(xué)習(xí)是初步學(xué)習(xí)的漢語字母表組成,它里面有每一個字的按拼音寫法,按拼音讀法和按漢字寫法。詞匯學(xué)習(xí)功能是由簡單,日常生活中常用的詞和詞匯組成的。句子學(xué)習(xí)是生活中使用的常用句子和句型組成的。詞匯學(xué)習(xí)和句子學(xué)習(xí)也基本上相同的功能,不一樣的功能是有給用戶提供每個詞匯和句子翻譯成維吾爾語,為用戶提供對比學(xué)習(xí)的環(huán)境。

綜合學(xué)習(xí)模塊主要包括語法要點(diǎn),課文學(xué)習(xí)和課程練習(xí)。語法要點(diǎn)就是漢語語法基礎(chǔ)知識。里有漢語里的常用詞,根據(jù)它們的詞匯意義和語法特點(diǎn)進(jìn)行分類?,F(xiàn)代漢語教學(xué)系統(tǒng)把詞分為十二類。還有語素和語素分類,短語和短語的類型等等的說明。課文學(xué)習(xí)里有個較短的課文和它的維吾爾語翻譯,語音合成出來的正確男女發(fā)音。課程練習(xí)里有選擇題,填空題,連成句子題等等。有返回,保存,修改和清空功能。用戶使用課程聯(lián)系模塊是可以根據(jù)已學(xué)習(xí)的知識來練習(xí)因而提高水平。

高級學(xué)習(xí)模塊主要包括造句,維漢互翻和寫作文。造句就是用給定的詞或詞組來造成句子。有返回,保存,清空和修改功能。維漢互翻里面有很多維吾爾文句子和漢文句子,每個句子下面設(shè)定了適當(dāng)?shù)目瞻滋帲脩舭唇o定句子的意思來翻譯成另一種語言并填寫對應(yīng)句子下面的空白處。有返回,修改,保存和清空功能。寫作文是根據(jù)給定的題目要求寫出作文,軟件的寫作文功能里面預(yù)存了很多各種要求的寫作題。有返回,修改,保存和清空功能。這個模塊是為了用戶測試自己的學(xué)習(xí)能力而設(shè)計的。但要求并不高,因?yàn)檫@個軟件使用對象是維吾爾文農(nóng)民為主而設(shè)計的。

除此之外,系統(tǒng)里面還加入了很好的詞典模塊。詞典模塊是由維漢詞典和漢維詞典組成的。維漢詞典就是把用戶輸入的維吾爾與單詞翻譯成漢語。漢維詞典就是把用戶輸入的漢語單詞翻譯成維吾爾語。用戶可以根據(jù)自己的需要進(jìn)行查詞典。詞典模塊已包含了我們在日常生活中常用的詞匯的讀法,寫法和它的翻譯。

4軟件功能實(shí)現(xiàn)

4.1關(guān)鍵功能的實(shí)現(xiàn)

設(shè)計軟件的界面時,用XAML語言來設(shè)計頁面控件和顯示模塊。通過讀取設(shè)計好的數(shù)據(jù)庫文件加載到DataContext里面的自定義對象中,每個模塊的自定義對象不一樣。此自定義對象已綁定到各自的數(shù)據(jù)列表ListBoxDataTemplate中。每行內(nèi)容選中的時候被選的內(nèi)容從數(shù)據(jù)庫里面查找其詳細(xì)解釋加載到新布局頁面。因?yàn)?,詞匯學(xué)習(xí),句子學(xué)習(xí)和課文學(xué)習(xí)模塊中有漢文和維吾爾文混合顯示,這給WP屏幕中每個漢字和所對應(yīng)的維文對齊顯示帶來一定的麻煩。通過.NET框架中Control基類提供的界面控件RightToLeft屬性來派生出來的。在.NET框架中Control基類提供了界面控件的RightToLeft屬性。RightToLeft屬性:獲取或設(shè)置一個值,該值指示是否將控件的元素對齊以支持使用從右向左的字體的區(qū)域設(shè)置。RightToLeft屬性用于語言是從右向左書寫的國際應(yīng)用程序。當(dāng)將該屬性設(shè)置為RightToLeft Yes時,包括文字的控件元素從右向左顯示。RightToLeft屬性接受RightToLeft枚舉,包括以下成員:

1)No是文本從左至右讀取。默認(rèn)選項。

2)Yes是文本從右到左讀取。

3)Inherit是文本的讀取方向從父控件繼承。

一般情況下,如果設(shè)置了窗體的RightToLeft屬性,窗體的控件會繼承這個屬性。但還是可以為大部分控件單獨(dú)設(shè)置RightToLeft屬性。

其次,每個模塊里的漢語發(fā)音和朗讀功能是由MVS2012工具自帶的語音合成tSlSpeech svnthesizer類來實(shí)現(xiàn)的。引用Speech svnthesizer類時將使用默認(rèn)系統(tǒng)語音。若要配置Speech Synthesizer以使用其中已安裝的語音合成(文本到語音),可以使用SelectVoice或SelectVoiceByHints方法。語音獲取安裝,可以使用GetInstalledVoices和Voicehffo類方法的信息。

在存儲和讀取相關(guān)的數(shù)據(jù)文件時,用了SDF Viewer工具來處理。由于SDF Viewer是一個全面和方便的工具,可以最簡單的方法來創(chuàng)建,查看,編輯或?qū)С瞿腤indows Mobile PocketPC設(shè)備SQLCE數(shù)據(jù)庫中的數(shù)據(jù)。SQLCE數(shù)據(jù)庫上運(yùn)行SQL命令,并可以立即查看結(jié)果,因而在WP平臺下具有更優(yōu)越的條件。微軟的SQL Server Compact(SQLCE)是微軟在移動設(shè)備和臺式機(jī)上運(yùn)行的應(yīng)用程序產(chǎn)生一個小型關(guān)系數(shù)據(jù)庫。根據(jù)對該軟件進(jìn)行的需求分析,確定了系統(tǒng)的數(shù)據(jù)需求,并進(jìn)行設(shè)計軟件的數(shù)據(jù)庫。

4.2維吾爾與的輸入和顯示處理

在處理及顯示維文時,由于WP10以前版本的移動設(shè)備不支持從右向左的文字輸入和標(biāo)準(zhǔn)顯示維吾爾文。這個是本論文主要研究的難題。維吾爾語的書寫規(guī)則與其他語言的書寫規(guī)則不一樣,比如,漢語和英語的書寫方向是從左到右,而維吾爾語的書寫方向是從右到左;維吾爾語的詞是詞干和詞綴組成的,這點(diǎn)類似于英語,但是跟英語的不同點(diǎn)是維吾爾語中字母的變化比較多,在詞中不同位置的出現(xiàn)形式是不一樣的,有些字母在單詞中的出現(xiàn)形式有四種,而且且字母的寬度是不一樣的,這造成字母的不等寬,給維吾爾語的顯示帶了一定的困難,因此在處理維吾爾語信息時需要使用特殊的方法。在文字輸入時的形式是字母在文字中實(shí)際的位置來決定的。因此,輸入及正常顯示的時候需要進(jìn)行前后判斷。完成了文字的前后連續(xù)性判斷以后,我們再可以將文字的順序進(jìn)行反序調(diào)整就完成了正常顯示文字過程。

維吾爾文在WP設(shè)備中利用自動選形算法規(guī)則和字母序列轉(zhuǎn)換函數(shù)來實(shí)現(xiàn)正常顯示和輸入處理,如圖3所示,設(shè)i為當(dāng)前需要選形的字母,i-1為當(dāng)前字母的前字符,i+l為當(dāng)前字母的后字符,賦值i-1、i、i+1為0或l,當(dāng)i-1、i、i+l的值不同時,i字符的形狀也不同。主要實(shí)現(xiàn)代碼:

4.3維吾爾文自動選形規(guī)則

如上幾節(jié)敘述,維吾爾語跟其他語言有以下幾個方面的區(qū)別和獨(dú)特性。第一,與上下文內(nèi)容相關(guān)的顯現(xiàn)形式。維吾爾文字符在單詞的不同位置具有不同的顯現(xiàn)形式,一般可分為四種顯現(xiàn)形式:獨(dú)立形、詞首形、詞中形、詞尾形。第二,雙向性質(zhì)。維吾爾文書寫的方向既有從右到左,也有從左到右的形式。一般,維吾爾文字符都是從右到左方向?qū)懀c維吾爾文字混合來的數(shù)字和特殊符號及特殊的英文字母是從左到右方向?qū)?。第三,連接字符形式。維吾爾文字有時候用一個字形來顯示出幾個字形。所以維吾爾文是一個屬于復(fù)雜的文本(Com-D1ex Text Layout)。在寫維吾爾文的時候一個字符選形取決于此字符兩邊的字符的字形。因此,在正常顯示維吾爾文的時候需要不斷地替換一個字符的各種形狀。此過程就稱為自動選形。本文經(jīng)過大量的分析,總結(jié)出了維吾爾文字母選形算法規(guī)則如表1所示。自動選形規(guī)則接收到某一維吾爾文字符時,根據(jù)當(dāng)前字母的形狀對該字母進(jìn)行選形,按照字符在單詞中的位置選擇維吾爾文字符對應(yīng)的首、中、尾和獨(dú)立形狀等不同形狀的內(nèi)碼,從而得到正確的前后字母字形的相連。

5結(jié)束語

本文研究了漢語學(xué)習(xí)軟件在WP平臺上的實(shí)現(xiàn)。通過分析維吾爾文的語言特征,采用自動選形算法規(guī)則來實(shí)現(xiàn)在WP平臺上維吾爾文的輸入和正常顯示等處理技術(shù)。這個方法可以直接應(yīng)用到其他少數(shù)民族語言處理或其他復(fù)雜文本處理。另外,本文利用語音合成技術(shù)來實(shí)現(xiàn)此學(xué)習(xí)平臺的朗讀和發(fā)音功能,從而更好的展現(xiàn)了該漢語學(xué)習(xí)軟件的功能優(yōu)勢。本文設(shè)計的軟件已發(fā)布,并且使用的用戶數(shù)目也比較多,用戶反映該軟件為他們學(xué)習(xí)漢語提供了很多便利,提高了他們的學(xué)習(xí)效率,降低了學(xué)習(xí)漢語的成本。為了提高該軟件的性能,可以增加聯(lián)網(wǎng)的功能,學(xué)習(xí)者可以聯(lián)網(wǎng)及時獲取最新的知識,創(chuàng)建一個論壇,在此論壇上學(xué)習(xí)者可以互相學(xué)習(xí),這樣可以提高軟件的交互性能,給學(xué)習(xí)者帶來更好的學(xué)習(xí)環(huán)境。

猜你喜歡
漢語學(xué)習(xí)維吾爾語
統(tǒng)計與規(guī)則相結(jié)合的維吾爾語人名識別方法
漢語作為第二語言學(xué)習(xí)的過程與體驗(yàn)
信息時代漢語學(xué)習(xí)現(xiàn)狀調(diào)查
維吾爾語指示詞的語用研究
渤海大學(xué)留學(xué)生漢語綜合課堂存在的主要問題及解決辦法
如何培養(yǎng)少數(shù)民族地區(qū)學(xué)生學(xué)習(xí)漢語的興趣
維吾爾語話題的韻律表現(xiàn)
指稱在維吾爾語語篇中的銜接方式及其功能
維吾爾語詞重音的形式判斷
現(xiàn)代維吾爾語中“-0wat-”的進(jìn)行體特征
商南县| 余庆县| 原平市| 北宁市| 博乐市| 望城县| 墨竹工卡县| 三穗县| 建昌县| 山东省| 图片| 辽中县| 舟山市| 诏安县| 文昌市| 牟定县| 新龙县| 临高县| 名山县| 桂平市| 瑞昌市| 天门市| 枞阳县| 长子县| 黄龙县| 九寨沟县| 十堰市| 时尚| 渝北区| 河东区| 会同县| 都兰县| 永济市| 鹿邑县| 棋牌| 诸城市| 靖远县| 高平市| 石嘴山市| 谢通门县| 连州市|