賽買提·艾力+玉素甫·艾白都拉
摘要:眾所周知,維吾爾族是一個勤勞勇敢的民族,在我國的發(fā)展建設中做出了突出貢獻。研究維吾爾族人名對于了解維吾爾族,維護祖國統(tǒng)一和民族團結具有重要意義。本文就維吾爾族人名識別系統(tǒng)的設計和實現(xiàn)展開了一系列研究,首先從對維吾爾語黏著性特點的分析入手,研究總結了維吾爾族人名的構成特點,實現(xiàn)了以詞性,詞干,后綴等特征來找出維吾爾族人名識別方法,并設計了選最佳特征模板算法。實驗結果表明,該方法可行而且更有效,達到了預期的目標。
關鍵詞:維吾爾 人名識別 人名詞綴 名詞詞綴
1 概述
近年來,隨著計算機軟硬件技術的迅速發(fā)展,計算機已經(jīng)進入到了人們生活中的每一個角落。而語言文字是人們生活中不可缺少的交流工具。維吾爾文信息處理技術的發(fā)展和維吾爾語研究的成果為開展維吾爾語人名識別研究。隨著我國信息化水平的不斷提高,互聯(lián)網(wǎng)技術的不斷發(fā)展完善,人們越來越渴望使用本民族的語言與計算機進行實時交流。同時,自然語言作為人與機器交流的主要符號載體,在語言處理與組合中承擔著重要責任。
隨著社會經(jīng)濟,計算機技術和互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡成為了人們?nèi)粘I钪械谋匾獌?nèi)容,網(wǎng)絡的規(guī)模也開始漸漸擴大,大量的數(shù)據(jù)以電子形式加速膨脹,出現(xiàn)在廣大人們的前面,根據(jù)有關資料的統(tǒng)計,80%以上信息是以語言文字為載體傳播的,而且這些數(shù)據(jù)的規(guī)模開始越來越變大了,這給人們帶來了一些不必要的麻煩并對信息的有效獲取也帶來了挑戰(zhàn)。在這種時代,為了幫助人們從大量的數(shù)據(jù)源中快速找到自己所需要的資料和數(shù)據(jù),采用自動化技術來幫助信息的處理是至關重要的。
目前,少數(shù)民族自然語言處理越來越成為中文信息處理的重要組成之一,受到了眾多學者的廣泛關注。而維吾爾族人名識別則是維吾爾自然語言處理的重要領域,目前尚未建立起系統(tǒng)完善的識別系統(tǒng)。本文就維吾爾族人名識別系統(tǒng)的設計與實現(xiàn)進行了研究和分析,為今后的研究工作提供了良好借鑒。
2 研究現(xiàn)狀
通過研究國內(nèi)外相關的人名識別研究,再結合維吾爾語自身的特點對基于規(guī)則的維吾爾語人名分析方法進行討論,由于維吾爾語作為一種自然語言,具有自然語言所共有的一些規(guī)則,發(fā)現(xiàn)國外經(jīng)典的人名識別方法同樣適合于維吾爾語的人名識別研究。這些工作將為維吾爾語人名處理提供有效的方法和新的思路。
目前,雖然我國已有很多學者研究維吾爾族人名識別,并取得了階段性成果,但研究出來的人名識別方法和手段無法滿足當前維吾爾族人名識別工作的需要。與中文名字相比,維吾爾族人名具有其獨特性,因此其識別和處理難度較大。針對這一問題,有關學者設計了研究問卷,并采用統(tǒng)計與規(guī)則有機結合的方式,初步實現(xiàn)了人名的自動識別,符合語言規(guī)則和要求。
目前有關國外英語人名識別已取得了顯著成果,并確定了較為系統(tǒng)的研究和分析方法,其準確度較高。該方法利用建立統(tǒng)計模型的方式對語料庫進行統(tǒng)計分析,最終實現(xiàn)識別目的。但有關維吾爾族人名識別工作尚未展開階段性研究。
3 維吾爾族人名識別系統(tǒng)的設計
維吾爾語簡稱維語,是一種廣泛使用于我國西北地區(qū)的少數(shù)民族語言,它屬于阿爾泰語系突厥語族西匈語支,在結構語法上屬于黏著語類型,現(xiàn)行的維吾爾文字是阿拉伯文字基礎的拼音文字。
要想設計出一整套完善的維吾爾族人名識別系統(tǒng),首先就要分析和研究維吾爾族人名的構成特點。本文在充分了解和掌握維吾爾族人名構成結構和特點的基礎上,提出了維吾爾族人名識別系統(tǒng)的設計構想。
3.1 系統(tǒng)分析 系統(tǒng)開發(fā)的總體任務是實現(xiàn)對維吾爾文本中的人名識別提高準確率??墒蔷S吾爾人名識別是比較復雜的一個過程,在識別過程中不能保證百分之百的識別出來,這是因為:
①粘著性導致太多的派生詞:一個維吾爾單詞通過鏈接詞綴可產(chǎn)生新的單詞和派生詞。如一個人名“ ”(阿力木)有以下幾種形成:
②維吾爾人名在句子中位置自由:單詞順序沒有太大的限制,人名可以出現(xiàn)在句子中的任何位置。比如以下包含維吾爾人名 (阿力木)的句子:
(阿力木沒來)
(他是阿里木的哥哥)
(他叫阿力木)
③可用資源缺少:目前維吾爾語中尚缺少大型人名標注語料,人名詞典等可利用資源。
④維吾爾人名結構類型也比較復雜。
對這種復雜性高的維吾爾人名來說,本系統(tǒng)遇到粘著性導致太多的派生詞情況時,首先本系統(tǒng)取掉名詞構型詞尾。遇到維吾爾人名在句子中位置自由情況時從人名詞典里查找,進行識別,識別出來的維吾爾人名保存到數(shù)據(jù)。
3.2 系統(tǒng)模塊介紹及功能流程圖
本系統(tǒng)主要是由文本處理模塊和人名識別模塊兩部分組成的。維吾爾人名識別系統(tǒng)的大致流程圖如圖1所示。
3.2.1 文本處理模塊。此模塊的主要任務是調整文本和分詞,分詞原理是文本文檔中的空格和標點符號來分詞。
3.2.2 人名識別模塊。識別模塊是維吾爾族人名識別系統(tǒng)最核心的一個模塊。他的任務就是本系統(tǒng)的任務。分好的詞首先通過名詞詞綴進行取掉構型詞詞綴,然后通過人名詞典,如果存在是人名,不存在進入非人名詞典,非人名詞典內(nèi)存在,進行排除,不存在進入人名詞綴進行識別并保存。
維吾爾人名單詞由詞干和詞綴組成,其結構為:
維吾爾語單詞=前綴+詞干+后綴1+后綴2+…。
如人名“ ”(阿里木的)由詞干“ ”和后綴“ ”組成。在文本中和句子按從右到左的方式書寫。所以本系統(tǒng)利用了4個詞典:
①人名詞典。本詞典內(nèi)有純維吾爾族人名。
如:
②名詞詞綴。
如:
③非人名詞典。
如:
④人名詞綴。
如:
人名識別模塊功能流程圖如圖2所示。
4 總結
維吾爾族人名識別是維吾爾語自然語言處理、機器翻譯中的一項重要工作,是自然語言處理中具有挑戰(zhàn)性的任務之一。本文介紹了一種維吾爾族人名識別系統(tǒng)的設計方法,從實驗結果表明,該系統(tǒng)對維吾爾族人名的識別成功率跟數(shù)據(jù)庫里的資源成正比,數(shù)據(jù)庫語料越多識別率就越高,通過豐富語料庫,可以實現(xiàn)維吾爾族人名識別的100%的效果。
維吾爾語/漢語機器翻譯中,首先識別句中的人名、機構名等對機器翻譯的正確性有一定的幫助,本文介紹的維吾爾族人名的識別系統(tǒng)的設計與實現(xiàn)對維吾爾語機器翻譯奠定基礎。
參考文獻:
[1]高士杰.維吾爾語語法[M].中央民族大學出版社,1998.2.
[2]程適良.現(xiàn)代維吾爾語語法[M].新疆人民出版社,1996.9.
[3]玉素甫,阿不都熱依木,阿依木古麗.論現(xiàn)代維吾爾語詞性標注系統(tǒng)[D].新疆師范大學.
[4]玉素甫,潘偉民,熱孜萬.筆式維吾爾文識別中的文字切分研究[A].民族語言文字信息技術研究[C].2007.
基金項目:本文承新疆師范大學優(yōu)秀青年教師科研啟動基金項目(項目編號:XJNU1216)和新疆師范大學“計算機應用技術”重點學科招標課題(課題編號:12XSXZ0607)的資助。endprint
摘要:眾所周知,維吾爾族是一個勤勞勇敢的民族,在我國的發(fā)展建設中做出了突出貢獻。研究維吾爾族人名對于了解維吾爾族,維護祖國統(tǒng)一和民族團結具有重要意義。本文就維吾爾族人名識別系統(tǒng)的設計和實現(xiàn)展開了一系列研究,首先從對維吾爾語黏著性特點的分析入手,研究總結了維吾爾族人名的構成特點,實現(xiàn)了以詞性,詞干,后綴等特征來找出維吾爾族人名識別方法,并設計了選最佳特征模板算法。實驗結果表明,該方法可行而且更有效,達到了預期的目標。
關鍵詞:維吾爾 人名識別 人名詞綴 名詞詞綴
1 概述
近年來,隨著計算機軟硬件技術的迅速發(fā)展,計算機已經(jīng)進入到了人們生活中的每一個角落。而語言文字是人們生活中不可缺少的交流工具。維吾爾文信息處理技術的發(fā)展和維吾爾語研究的成果為開展維吾爾語人名識別研究。隨著我國信息化水平的不斷提高,互聯(lián)網(wǎng)技術的不斷發(fā)展完善,人們越來越渴望使用本民族的語言與計算機進行實時交流。同時,自然語言作為人與機器交流的主要符號載體,在語言處理與組合中承擔著重要責任。
隨著社會經(jīng)濟,計算機技術和互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡成為了人們?nèi)粘I钪械谋匾獌?nèi)容,網(wǎng)絡的規(guī)模也開始漸漸擴大,大量的數(shù)據(jù)以電子形式加速膨脹,出現(xiàn)在廣大人們的前面,根據(jù)有關資料的統(tǒng)計,80%以上信息是以語言文字為載體傳播的,而且這些數(shù)據(jù)的規(guī)模開始越來越變大了,這給人們帶來了一些不必要的麻煩并對信息的有效獲取也帶來了挑戰(zhàn)。在這種時代,為了幫助人們從大量的數(shù)據(jù)源中快速找到自己所需要的資料和數(shù)據(jù),采用自動化技術來幫助信息的處理是至關重要的。
目前,少數(shù)民族自然語言處理越來越成為中文信息處理的重要組成之一,受到了眾多學者的廣泛關注。而維吾爾族人名識別則是維吾爾自然語言處理的重要領域,目前尚未建立起系統(tǒng)完善的識別系統(tǒng)。本文就維吾爾族人名識別系統(tǒng)的設計與實現(xiàn)進行了研究和分析,為今后的研究工作提供了良好借鑒。
2 研究現(xiàn)狀
通過研究國內(nèi)外相關的人名識別研究,再結合維吾爾語自身的特點對基于規(guī)則的維吾爾語人名分析方法進行討論,由于維吾爾語作為一種自然語言,具有自然語言所共有的一些規(guī)則,發(fā)現(xiàn)國外經(jīng)典的人名識別方法同樣適合于維吾爾語的人名識別研究。這些工作將為維吾爾語人名處理提供有效的方法和新的思路。
目前,雖然我國已有很多學者研究維吾爾族人名識別,并取得了階段性成果,但研究出來的人名識別方法和手段無法滿足當前維吾爾族人名識別工作的需要。與中文名字相比,維吾爾族人名具有其獨特性,因此其識別和處理難度較大。針對這一問題,有關學者設計了研究問卷,并采用統(tǒng)計與規(guī)則有機結合的方式,初步實現(xiàn)了人名的自動識別,符合語言規(guī)則和要求。
目前有關國外英語人名識別已取得了顯著成果,并確定了較為系統(tǒng)的研究和分析方法,其準確度較高。該方法利用建立統(tǒng)計模型的方式對語料庫進行統(tǒng)計分析,最終實現(xiàn)識別目的。但有關維吾爾族人名識別工作尚未展開階段性研究。
3 維吾爾族人名識別系統(tǒng)的設計
維吾爾語簡稱維語,是一種廣泛使用于我國西北地區(qū)的少數(shù)民族語言,它屬于阿爾泰語系突厥語族西匈語支,在結構語法上屬于黏著語類型,現(xiàn)行的維吾爾文字是阿拉伯文字基礎的拼音文字。
要想設計出一整套完善的維吾爾族人名識別系統(tǒng),首先就要分析和研究維吾爾族人名的構成特點。本文在充分了解和掌握維吾爾族人名構成結構和特點的基礎上,提出了維吾爾族人名識別系統(tǒng)的設計構想。
3.1 系統(tǒng)分析 系統(tǒng)開發(fā)的總體任務是實現(xiàn)對維吾爾文本中的人名識別提高準確率??墒蔷S吾爾人名識別是比較復雜的一個過程,在識別過程中不能保證百分之百的識別出來,這是因為:
①粘著性導致太多的派生詞:一個維吾爾單詞通過鏈接詞綴可產(chǎn)生新的單詞和派生詞。如一個人名“ ”(阿力木)有以下幾種形成:
②維吾爾人名在句子中位置自由:單詞順序沒有太大的限制,人名可以出現(xiàn)在句子中的任何位置。比如以下包含維吾爾人名 (阿力木)的句子:
(阿力木沒來)
(他是阿里木的哥哥)
(他叫阿力木)
③可用資源缺少:目前維吾爾語中尚缺少大型人名標注語料,人名詞典等可利用資源。
④維吾爾人名結構類型也比較復雜。
對這種復雜性高的維吾爾人名來說,本系統(tǒng)遇到粘著性導致太多的派生詞情況時,首先本系統(tǒng)取掉名詞構型詞尾。遇到維吾爾人名在句子中位置自由情況時從人名詞典里查找,進行識別,識別出來的維吾爾人名保存到數(shù)據(jù)。
3.2 系統(tǒng)模塊介紹及功能流程圖
本系統(tǒng)主要是由文本處理模塊和人名識別模塊兩部分組成的。維吾爾人名識別系統(tǒng)的大致流程圖如圖1所示。
3.2.1 文本處理模塊。此模塊的主要任務是調整文本和分詞,分詞原理是文本文檔中的空格和標點符號來分詞。
3.2.2 人名識別模塊。識別模塊是維吾爾族人名識別系統(tǒng)最核心的一個模塊。他的任務就是本系統(tǒng)的任務。分好的詞首先通過名詞詞綴進行取掉構型詞詞綴,然后通過人名詞典,如果存在是人名,不存在進入非人名詞典,非人名詞典內(nèi)存在,進行排除,不存在進入人名詞綴進行識別并保存。
維吾爾人名單詞由詞干和詞綴組成,其結構為:
維吾爾語單詞=前綴+詞干+后綴1+后綴2+…。
如人名“ ”(阿里木的)由詞干“ ”和后綴“ ”組成。在文本中和句子按從右到左的方式書寫。所以本系統(tǒng)利用了4個詞典:
①人名詞典。本詞典內(nèi)有純維吾爾族人名。
如:
②名詞詞綴。
如:
③非人名詞典。
如:
④人名詞綴。
如:
人名識別模塊功能流程圖如圖2所示。
4 總結
維吾爾族人名識別是維吾爾語自然語言處理、機器翻譯中的一項重要工作,是自然語言處理中具有挑戰(zhàn)性的任務之一。本文介紹了一種維吾爾族人名識別系統(tǒng)的設計方法,從實驗結果表明,該系統(tǒng)對維吾爾族人名的識別成功率跟數(shù)據(jù)庫里的資源成正比,數(shù)據(jù)庫語料越多識別率就越高,通過豐富語料庫,可以實現(xiàn)維吾爾族人名識別的100%的效果。
維吾爾語/漢語機器翻譯中,首先識別句中的人名、機構名等對機器翻譯的正確性有一定的幫助,本文介紹的維吾爾族人名的識別系統(tǒng)的設計與實現(xiàn)對維吾爾語機器翻譯奠定基礎。
參考文獻:
[1]高士杰.維吾爾語語法[M].中央民族大學出版社,1998.2.
[2]程適良.現(xiàn)代維吾爾語語法[M].新疆人民出版社,1996.9.
[3]玉素甫,阿不都熱依木,阿依木古麗.論現(xiàn)代維吾爾語詞性標注系統(tǒng)[D].新疆師范大學.
[4]玉素甫,潘偉民,熱孜萬.筆式維吾爾文識別中的文字切分研究[A].民族語言文字信息技術研究[C].2007.
基金項目:本文承新疆師范大學優(yōu)秀青年教師科研啟動基金項目(項目編號:XJNU1216)和新疆師范大學“計算機應用技術”重點學科招標課題(課題編號:12XSXZ0607)的資助。endprint
摘要:眾所周知,維吾爾族是一個勤勞勇敢的民族,在我國的發(fā)展建設中做出了突出貢獻。研究維吾爾族人名對于了解維吾爾族,維護祖國統(tǒng)一和民族團結具有重要意義。本文就維吾爾族人名識別系統(tǒng)的設計和實現(xiàn)展開了一系列研究,首先從對維吾爾語黏著性特點的分析入手,研究總結了維吾爾族人名的構成特點,實現(xiàn)了以詞性,詞干,后綴等特征來找出維吾爾族人名識別方法,并設計了選最佳特征模板算法。實驗結果表明,該方法可行而且更有效,達到了預期的目標。
關鍵詞:維吾爾 人名識別 人名詞綴 名詞詞綴
1 概述
近年來,隨著計算機軟硬件技術的迅速發(fā)展,計算機已經(jīng)進入到了人們生活中的每一個角落。而語言文字是人們生活中不可缺少的交流工具。維吾爾文信息處理技術的發(fā)展和維吾爾語研究的成果為開展維吾爾語人名識別研究。隨著我國信息化水平的不斷提高,互聯(lián)網(wǎng)技術的不斷發(fā)展完善,人們越來越渴望使用本民族的語言與計算機進行實時交流。同時,自然語言作為人與機器交流的主要符號載體,在語言處理與組合中承擔著重要責任。
隨著社會經(jīng)濟,計算機技術和互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡成為了人們?nèi)粘I钪械谋匾獌?nèi)容,網(wǎng)絡的規(guī)模也開始漸漸擴大,大量的數(shù)據(jù)以電子形式加速膨脹,出現(xiàn)在廣大人們的前面,根據(jù)有關資料的統(tǒng)計,80%以上信息是以語言文字為載體傳播的,而且這些數(shù)據(jù)的規(guī)模開始越來越變大了,這給人們帶來了一些不必要的麻煩并對信息的有效獲取也帶來了挑戰(zhàn)。在這種時代,為了幫助人們從大量的數(shù)據(jù)源中快速找到自己所需要的資料和數(shù)據(jù),采用自動化技術來幫助信息的處理是至關重要的。
目前,少數(shù)民族自然語言處理越來越成為中文信息處理的重要組成之一,受到了眾多學者的廣泛關注。而維吾爾族人名識別則是維吾爾自然語言處理的重要領域,目前尚未建立起系統(tǒng)完善的識別系統(tǒng)。本文就維吾爾族人名識別系統(tǒng)的設計與實現(xiàn)進行了研究和分析,為今后的研究工作提供了良好借鑒。
2 研究現(xiàn)狀
通過研究國內(nèi)外相關的人名識別研究,再結合維吾爾語自身的特點對基于規(guī)則的維吾爾語人名分析方法進行討論,由于維吾爾語作為一種自然語言,具有自然語言所共有的一些規(guī)則,發(fā)現(xiàn)國外經(jīng)典的人名識別方法同樣適合于維吾爾語的人名識別研究。這些工作將為維吾爾語人名處理提供有效的方法和新的思路。
目前,雖然我國已有很多學者研究維吾爾族人名識別,并取得了階段性成果,但研究出來的人名識別方法和手段無法滿足當前維吾爾族人名識別工作的需要。與中文名字相比,維吾爾族人名具有其獨特性,因此其識別和處理難度較大。針對這一問題,有關學者設計了研究問卷,并采用統(tǒng)計與規(guī)則有機結合的方式,初步實現(xiàn)了人名的自動識別,符合語言規(guī)則和要求。
目前有關國外英語人名識別已取得了顯著成果,并確定了較為系統(tǒng)的研究和分析方法,其準確度較高。該方法利用建立統(tǒng)計模型的方式對語料庫進行統(tǒng)計分析,最終實現(xiàn)識別目的。但有關維吾爾族人名識別工作尚未展開階段性研究。
3 維吾爾族人名識別系統(tǒng)的設計
維吾爾語簡稱維語,是一種廣泛使用于我國西北地區(qū)的少數(shù)民族語言,它屬于阿爾泰語系突厥語族西匈語支,在結構語法上屬于黏著語類型,現(xiàn)行的維吾爾文字是阿拉伯文字基礎的拼音文字。
要想設計出一整套完善的維吾爾族人名識別系統(tǒng),首先就要分析和研究維吾爾族人名的構成特點。本文在充分了解和掌握維吾爾族人名構成結構和特點的基礎上,提出了維吾爾族人名識別系統(tǒng)的設計構想。
3.1 系統(tǒng)分析 系統(tǒng)開發(fā)的總體任務是實現(xiàn)對維吾爾文本中的人名識別提高準確率。可是維吾爾人名識別是比較復雜的一個過程,在識別過程中不能保證百分之百的識別出來,這是因為:
①粘著性導致太多的派生詞:一個維吾爾單詞通過鏈接詞綴可產(chǎn)生新的單詞和派生詞。如一個人名“ ”(阿力木)有以下幾種形成:
②維吾爾人名在句子中位置自由:單詞順序沒有太大的限制,人名可以出現(xiàn)在句子中的任何位置。比如以下包含維吾爾人名 (阿力木)的句子:
(阿力木沒來)
(他是阿里木的哥哥)
(他叫阿力木)
③可用資源缺少:目前維吾爾語中尚缺少大型人名標注語料,人名詞典等可利用資源。
④維吾爾人名結構類型也比較復雜。
對這種復雜性高的維吾爾人名來說,本系統(tǒng)遇到粘著性導致太多的派生詞情況時,首先本系統(tǒng)取掉名詞構型詞尾。遇到維吾爾人名在句子中位置自由情況時從人名詞典里查找,進行識別,識別出來的維吾爾人名保存到數(shù)據(jù)。
3.2 系統(tǒng)模塊介紹及功能流程圖
本系統(tǒng)主要是由文本處理模塊和人名識別模塊兩部分組成的。維吾爾人名識別系統(tǒng)的大致流程圖如圖1所示。
3.2.1 文本處理模塊。此模塊的主要任務是調整文本和分詞,分詞原理是文本文檔中的空格和標點符號來分詞。
3.2.2 人名識別模塊。識別模塊是維吾爾族人名識別系統(tǒng)最核心的一個模塊。他的任務就是本系統(tǒng)的任務。分好的詞首先通過名詞詞綴進行取掉構型詞詞綴,然后通過人名詞典,如果存在是人名,不存在進入非人名詞典,非人名詞典內(nèi)存在,進行排除,不存在進入人名詞綴進行識別并保存。
維吾爾人名單詞由詞干和詞綴組成,其結構為:
維吾爾語單詞=前綴+詞干+后綴1+后綴2+…。
如人名“ ”(阿里木的)由詞干“ ”和后綴“ ”組成。在文本中和句子按從右到左的方式書寫。所以本系統(tǒng)利用了4個詞典:
①人名詞典。本詞典內(nèi)有純維吾爾族人名。
如:
②名詞詞綴。
如:
③非人名詞典。
如:
④人名詞綴。
如:
人名識別模塊功能流程圖如圖2所示。
4 總結
維吾爾族人名識別是維吾爾語自然語言處理、機器翻譯中的一項重要工作,是自然語言處理中具有挑戰(zhàn)性的任務之一。本文介紹了一種維吾爾族人名識別系統(tǒng)的設計方法,從實驗結果表明,該系統(tǒng)對維吾爾族人名的識別成功率跟數(shù)據(jù)庫里的資源成正比,數(shù)據(jù)庫語料越多識別率就越高,通過豐富語料庫,可以實現(xiàn)維吾爾族人名識別的100%的效果。
維吾爾語/漢語機器翻譯中,首先識別句中的人名、機構名等對機器翻譯的正確性有一定的幫助,本文介紹的維吾爾族人名的識別系統(tǒng)的設計與實現(xiàn)對維吾爾語機器翻譯奠定基礎。
參考文獻:
[1]高士杰.維吾爾語語法[M].中央民族大學出版社,1998.2.
[2]程適良.現(xiàn)代維吾爾語語法[M].新疆人民出版社,1996.9.
[3]玉素甫,阿不都熱依木,阿依木古麗.論現(xiàn)代維吾爾語詞性標注系統(tǒng)[D].新疆師范大學.
[4]玉素甫,潘偉民,熱孜萬.筆式維吾爾文識別中的文字切分研究[A].民族語言文字信息技術研究[C].2007.
基金項目:本文承新疆師范大學優(yōu)秀青年教師科研啟動基金項目(項目編號:XJNU1216)和新疆師范大學“計算機應用技術”重點學科招標課題(課題編號:12XSXZ0607)的資助。endprint