扎西加 多拉
(①西藏大學(xué)藏文信息技術(shù)研究中心 西藏拉薩850000②西北民族大學(xué)中國(guó)藏文典籍全文數(shù)字化研究所 甘肅蘭州730030)
藏語依存樹庫(kù)構(gòu)建的理論與方法探析
扎西加①多拉②
(①西藏大學(xué)藏文信息技術(shù)研究中心 西藏拉薩850000②西北民族大學(xué)中國(guó)藏文典籍全文數(shù)字化研究所 甘肅蘭州730030)
依存語法又稱“從屬關(guān)系語法”,研究句子各構(gòu)成成分之間的支配和從屬關(guān)系。依存結(jié)構(gòu)是指句子中詞與詞之間的句法結(jié)構(gòu)關(guān)系,該結(jié)構(gòu)以樹狀結(jié)構(gòu)進(jìn)行描述,被稱之為依存結(jié)構(gòu)樹庫(kù)。文章以依存語法的理論框架作為藏語樹庫(kù)構(gòu)建的理論指導(dǎo),充分借鑒依存語法的思想精髓,結(jié)合藏語語法體系,設(shè)立出符合藏語語法體系的句法和語義標(biāo)注關(guān)系體系,設(shè)計(jì)了判別式的句法分析算法,從而構(gòu)建了多維視窗的藏語依存樹庫(kù)。具體分析時(shí),首先,對(duì)依存語法的由來、定義、依存關(guān)系的適用性等背景知識(shí)做了簡(jiǎn)要的闡釋;其次,在藏語句子的篩選、藏語依存結(jié)構(gòu)的形式化模型、藏語依存的骨架結(jié)構(gòu)以及藏語依存樹的多維關(guān)系等方面進(jìn)行了研究和分析。
依存語法;藏語樹庫(kù);藏語句法分析;藏語語義分析
依存語法又稱“從屬關(guān)系語法”,研究句子各構(gòu)成成分之間的支配和從屬關(guān)系。依存結(jié)構(gòu)是指句子中詞語與詞語之間的句法結(jié)構(gòu)關(guān)系,該結(jié)構(gòu)以樹狀形式進(jìn)行描述,被稱之為依存結(jié)構(gòu)樹。賦有句法和語義結(jié)構(gòu)信息的知識(shí)庫(kù)是自然語言處理的重要資源,同時(shí),計(jì)算機(jī)要模擬人腦,理解自然語言具有很大的價(jià)值。依存樹庫(kù)的構(gòu)建在近期機(jī)器翻譯研究領(lǐng)域倍受青睞,原因是其具有結(jié)構(gòu)清晰明了、形式簡(jiǎn)單了然、句法語義兼顧等優(yōu)勢(shì),逐漸引起學(xué)界的重視。
在自然語言理解中,形式模型扮演的角色很重要。形式模型即形式化體系由一系列符號(hào)以及一套如何操作這些符號(hào)的指令組成。Maxwel l為依存句法分析的智能處理需求,設(shè)立了依存關(guān)系模型應(yīng)遵循的
各種依存關(guān)系種類,比如,德語設(shè)立26種關(guān)系,丹麥語設(shè)立15種關(guān)系,波蘭語設(shè)立18種關(guān)系,孟加拉語設(shè)立20種關(guān)系,芬蘭語設(shè)立21種關(guān)系,匈牙利語設(shè)立21種關(guān)系,日語設(shè)立20種關(guān)系,法語設(shè)立21種關(guān)系,漢語設(shè)立36種關(guān)系。為了降低計(jì)算機(jī)處理自然語言的代價(jià),周明、黃昌寧等人[1]曾將漢語的依存關(guān)系數(shù)從106種關(guān)系減少為44種關(guān)系。本文根據(jù)藏語語言的結(jié)構(gòu)特點(diǎn)設(shè)立了24種句法依存關(guān)系和18種語義依存關(guān)系。
當(dāng)前藏文信息處理在詞法、句法的研究處于起步階段,構(gòu)建藏語依存樹庫(kù)是藏語句法和語義研究必不可少的數(shù)據(jù)支撐。但目前尚未見到利用依存和配價(jià)理論對(duì)藏語句法進(jìn)行研究的相關(guān)成果。本文在充分利用現(xiàn)有研究成果基礎(chǔ)上,嘗試用依存理論開展藏語句法樹庫(kù)的研究,這項(xiàng)工作的開展將在藏語自然語言處理領(lǐng)域發(fā)揮重要作用。
1.1 依存語法的由來
在學(xué)界有人認(rèn)為“依存語法的概念可以追溯到公元前4世紀(jì),由印度語言學(xué)家Panini創(chuàng)始”[2],但一般視為依存語法理論的創(chuàng)始人是著名的法國(guó)語言學(xué)家特斯尼耶爾,他的《結(jié)構(gòu)句法基礎(chǔ)》中體現(xiàn)了依存語法的理論核心,其著作中首次提出了“結(jié)構(gòu)句法”的一般理論,“結(jié)構(gòu)句法”后來被稱之為“依存語法”或“從屬關(guān)系語法”。為了提出一種通用的語法理論,特斯尼耶爾對(duì)古希臘語和古羅馬語、羅滿族語、斯拉夫語等10幾種語言做了大量的對(duì)比研究后提出了“結(jié)構(gòu)句法”理論,該語法理論對(duì)人類語言進(jìn)行了深層對(duì)比研究,探尋出了不同語言之間的共性,側(cè)重建立跨語言的適用體系,客觀地揭示了人類語言中深層普遍的內(nèi)在句法規(guī)律。該理論的提出對(duì)語言學(xué)的發(fā)展做出了重要貢獻(xiàn),意義重大。
1.2 依存語法的定義
句子結(jié)構(gòu)中詞與詞之間勾勒出層層遞進(jìn)的從屬關(guān)系,貌似金字塔結(jié)構(gòu),塔尖是所有從屬關(guān)系的支配節(jié),被稱之為“中心結(jié)”。中心結(jié)是整個(gè)句子的核心、重心和中心,一般情況下大多數(shù)中心結(jié)為動(dòng)詞,這種用詞與詞之間的依存關(guān)系來描述語言結(jié)構(gòu)的框架稱之為依存語法(dependence grammar),也稱為從屬關(guān)系語法(Dependency grammar)。語言學(xué)家特斯尼耶爾在《結(jié)構(gòu)句法基礎(chǔ)》中雖未對(duì)依存語法提出明確的定義,但他在理論與實(shí)踐驗(yàn)證的過程中循序漸進(jìn)地提出了依存語法的核心精髓。歷來研究依存語法的諸多學(xué)者鑒于其理論,提出了各自對(duì)依存語法的理解和闡釋。周國(guó)光對(duì)依存語法定義為:“一種結(jié)構(gòu)語法,它主要研究以謂詞為中心而構(gòu)句時(shí)由深層語義結(jié)構(gòu)映現(xiàn)為表層句法結(jié)構(gòu)的狀況及條件,謂詞與體詞之間的同現(xiàn)關(guān)系,并據(jù)此劃分謂詞的詞類?!盵3]此定義直觀地反映了依存語法的本質(zhì)內(nèi)涵。
1.3 依存關(guān)系的適用性
依存語法的最小單位是詞語,它所關(guān)注的對(duì)象是詞與詞之間的從屬關(guān)系,該關(guān)系用來描述句子的深層和表層結(jié)構(gòu)。特斯尼耶爾認(rèn)為:“關(guān)聯(lián)(eonnexion)、組合(jonetion)和轉(zhuǎn)位(translation)是概括一切結(jié)構(gòu)句法現(xiàn)象的三大核心?!盵4]其中,關(guān)聯(lián)指建立詞與詞之間的依存關(guān)系,它是由支配項(xiàng)與從屬項(xiàng)聯(lián)結(jié)形成;組合是指詞與詞之間的并列關(guān)系,粗略地說并列關(guān)系是一個(gè)支配項(xiàng)擁有多個(gè)從屬項(xiàng);轉(zhuǎn)位則指一個(gè)實(shí)詞成分在句法上轉(zhuǎn)移成另一個(gè)實(shí)詞成分,或者能夠改變?cè)~匯元素的句法范疇中所支持其他元素關(guān)系的功能詞,確切地講“結(jié)構(gòu)聯(lián)系建立起詞與詞之間的依存關(guān)系,每一項(xiàng)聯(lián)系原則上將一個(gè)上項(xiàng)和一個(gè)下項(xiàng)聯(lián)結(jié)起
來,上項(xiàng)叫支配詞,下項(xiàng)叫從屬詞。一個(gè)詞可以同時(shí)是某個(gè)上項(xiàng)詞的從屬詞和另一個(gè)下項(xiàng)詞的支配詞?!盵5]句子里的所有詞便構(gòu)成一個(gè)真正的分層次的體系。動(dòng)詞是一個(gè)句子的中心,支配句中的其他成分。
20世紀(jì)70年代,美國(guó)語言學(xué)家羅賓松(Robinson)首次提出了依存語法的4條公理,“一個(gè)句子中只有一個(gè)成分是獨(dú)立的;其他成分直接依存于某一成分;任何一個(gè)成分都不能依存于兩個(gè)或兩個(gè)以上的成分;如果A成分直接依存于B成分,而C成分在句中位于A和B之間,那么C或者直接依存于A,或者直接依存于B,或者直接依存于A和B之間的某一成分。”[6]
這四條公理保證了依存句法分析時(shí)遵循的原則是單一父結(jié)點(diǎn)(single headed)、連通(connective)、無環(huán)(acycl icity)、可投影(Projective)。對(duì)依存語法的形式化描述提供了形式上的約束,為計(jì)算語言學(xué)中的應(yīng)用奠定了良好的基礎(chǔ)。20世紀(jì)80年代,舒貝爾特(K.Schuber t)在多語言機(jī)器翻譯系統(tǒng)DLT研發(fā)中,提出了面向自然語言處理的12條依存語法原則,其中含有上述4條公理,并且拓寬了依存語法的研究領(lǐng)域。20世紀(jì)90年代,我國(guó)著名學(xué)者馮志偉先生將依存語法的理論引進(jìn)國(guó)內(nèi)自然語言處理研究領(lǐng)域,馮先生根據(jù)機(jī)器翻譯的實(shí)踐經(jīng)驗(yàn),提出了滿足依存結(jié)構(gòu)樹的5種條件。在藏語自然語之外領(lǐng)域通過描述藏語依存樹結(jié)構(gòu)發(fā)現(xiàn),藏語的依存樹契合以上所有的條件,并且在句法樹和語義樹的對(duì)應(yīng)關(guān)系方面一致性更強(qiáng)。
2.1 藏語句子的篩選原則
在選擇研究句子時(shí),綜合考慮句型、體裁、時(shí)代、語體等,使選擇的句子具有代表性和針對(duì)性。藏語傳統(tǒng)語法理論將藏語句型分為他動(dòng)句、自動(dòng)句、依存句、主謂句及述謂句等5種類型,在選擇句子時(shí)可以以這些基本句型作為依據(jù),對(duì)句子分類進(jìn)行深入研究,使其涵蓋藏語的所有句型。
在內(nèi)容方面,根據(jù)藏語實(shí)際應(yīng)用范圍,選擇典型句子的語料中應(yīng)包含文學(xué)、學(xué)術(shù)、新聞、歷史、傳記、宗教等藏語應(yīng)用領(lǐng)域中的主要體裁。鑒于藏語各種方言的不同和書面文字的差別,擬選擇統(tǒng)一的書面表達(dá)的句子。同時(shí),在選擇句子時(shí)還充分考慮時(shí)代等特點(diǎn),使選擇的句子具有代表性。按照以上原則從大規(guī)模藏文文本中篩選10000個(gè)句子,以此形成包括單句、復(fù)句、句群等在內(nèi)的藏語典型句型庫(kù)。
2.2 樹庫(kù)構(gòu)建的基本流程
第一步,大規(guī)模藏文原始文本作為處理對(duì)象,通過藏語句子末端的規(guī)則進(jìn)行篩選句子;對(duì)整理完成的文本進(jìn)行機(jī)器自動(dòng)分詞和詞性標(biāo)注,再用人工方法對(duì)分詞和詞性標(biāo)注的結(jié)果進(jìn)行校對(duì),校對(duì)分為一校和二校兩步,首先由4名藏語語法學(xué)專業(yè)的碩士生進(jìn)行一校,完成一校后,為了保證藏文分詞及詞性標(biāo)注的一致性,負(fù)責(zé)人完成第二校的工作。在分詞、詞性標(biāo)注方面主要采用西藏大學(xué)制定的“信息處理用現(xiàn)代藏語分詞規(guī)范”和“信息處理用現(xiàn)代藏語詞類標(biāo)記集規(guī)范”,以上兩種規(guī)范已提交國(guó)家信標(biāo)委藏文信息技術(shù)標(biāo)準(zhǔn)工作組。
第二步,分詞和詞性標(biāo)注的基礎(chǔ)上建立藏語依存樹庫(kù)的標(biāo)注體系,包括藏語依存關(guān)系的層次體系和語義次級(jí)體系。根據(jù)藏語句子的成分進(jìn)行分類研究,對(duì)精加工過的句子成分進(jìn)行結(jié)構(gòu)和關(guān)聯(lián)標(biāo)注,形成較大規(guī)模的語法單位句法成分標(biāo)注庫(kù),從而找出其依存關(guān)系,形成完整的依存句法樹庫(kù)。最后,依據(jù)藏語依存句法的形式化模型,建立藏語依存分析的概率模型,設(shè)計(jì)分析藏語依存的算法。樹庫(kù)構(gòu)建的基本流
程見圖1。
圖1 樹庫(kù)構(gòu)建的基本流程
語法是剖析語言現(xiàn)象的一種理論,通過自然語言來描述所涉及對(duì)象的特性,從而達(dá)到理論的精確表達(dá)。另外一種有關(guān)對(duì)象的描述是建立模型,模型是將對(duì)象的某些特征提取出來形成的一種人造結(jié)構(gòu)。在語言中,廣為使用的一種形式模型是圖,圖的主要元素是頂點(diǎn)和邊,“樹”就是一種特殊的圖。這樣可以更清楚地認(rèn)識(shí)到所謂語言或語法研究的形式化實(shí)際上就是用一套標(biāo)注符號(hào)體系來對(duì)研究對(duì)象進(jìn)行抽象的方法。換言之,“語句的理解和生成是一個(gè)在線性次序(一維)和結(jié)構(gòu)(二維)之間的轉(zhuǎn)換過程。在這個(gè)過程中,圖式的作用不可忽略,因?yàn)樗梢猿橄蟮?、潛在的概念,形象地表示出來?!盵7]為了能夠讓計(jì)算機(jī)模仿一維線性串轉(zhuǎn)換為二維樹形結(jié)構(gòu)的過程,采用模型及形式化的方法研究語言結(jié)構(gòu)有助于在計(jì)算機(jī)上實(shí)現(xiàn)。也可以說形式化是程序化的基礎(chǔ)。
3.1 藏語依存結(jié)構(gòu)分析
依存語法的4公理和5條件均為形式化描述,用來制定藏語依存句法結(jié)構(gòu)的形式約束或其合乎性,其實(shí)依存關(guān)系指的是詞與詞之間的支配與從屬關(guān)系,而藏語中的這種關(guān)系是一種具有方向的不對(duì)等關(guān)系。簡(jiǎn)單地講,置于支配及控制地位的成分項(xiàng)被稱為支配者,處于被支配及被控制地位的成分項(xiàng)稱之為從屬者,換句話說,“句子的結(jié)構(gòu)是一種自上而下的,有層級(jí),有等級(jí)關(guān)系?!盵8]一般支配和從屬關(guān)系被描述為父子結(jié)點(diǎn)的關(guān)系類型。支配和被支配的關(guān)系以帶有方向性的有向弧線圖來表示;帶多標(biāo)記立體結(jié)構(gòu)的支配和被支配的關(guān)系以依存樹的圖式來表示;格標(biāo)記和中心詞的從屬關(guān)系以詞格標(biāo)記樹形圖來表示;在依存投影樹中,如從屬關(guān)系包含著潛在的依存關(guān)系時(shí),可以用虛線來表示。
在藏語依存句法分析的過程中,由以圖式和符號(hào)表示的依存句法結(jié)構(gòu)形式為聯(lián)接依存語法和依存分析算法的中介。將以形式化的文法規(guī)則或形式約束來描述邊結(jié)點(diǎn)所附帶的各種信息。常用藏語依存結(jié)構(gòu)的圖式有有向圖(見圖2)、藏語依存樹(見圖3)、格標(biāo)記樹形圖(見圖4)及藏語依存投影樹(見圖5)4種。
如圖2所示的有向關(guān)系圖中不同標(biāo)記代表不同的詞類,比如:nr代表人名,bo代表施事格標(biāo)記,nn代表一般名詞,ba代表工具格標(biāo)記,nn代表一般名詞,ls代表業(yè)格標(biāo)記,nn代表一般名詞,vt代表及物動(dòng)詞,
依存弧線用來表示各詞類之間的關(guān)系,箭頭端為從屬詞,無箭頭端為支配詞,這樣能夠更形象地了解詞間依存關(guān)系的層次體系。
圖2 有向圖
參照依存骨架分析的結(jié)果,形成攜帶多標(biāo)記立體結(jié)構(gòu)的依存樹的圖形表示見圖3。
在藏語中,N(名詞)和Det(格標(biāo)記)與之間的依存關(guān)系是:N是中心詞,Det是從屬詞,Det處于名詞的右側(cè),該從屬關(guān)系如圖4所示。
圖3 依存樹
圖4 藏語格標(biāo)記的樹形圖
圖5 依存投影樹
另外,在依存投影樹中,從屬詞與支配詞之間的依存關(guān)系可以用虛線來表示,這種從屬關(guān)系還包含著潛在的依存關(guān)系(見圖5)。
藏語依存樹庫(kù)的建設(shè)屬于句法分析和語義分析的重要數(shù)據(jù)支撐。句法分析和語義分析的主要任務(wù)是自動(dòng)剖析句子的表層和深層的結(jié)構(gòu)關(guān)系,換言之,將一個(gè)線性呈現(xiàn)的句子轉(zhuǎn)換成一個(gè)結(jié)構(gòu)化的一顆語法樹。本文根據(jù)藏語依存關(guān)系的形式化體系,確定了藏語句子中詞與詞之間的依存關(guān)系,并且采用4種圖式對(duì)藏語句法、語義依存骨架結(jié)構(gòu)進(jìn)行細(xì)致入微的分析,并直觀地刻畫出形式多樣的藏語依存關(guān)系圖式。
3.2 藏語依存樹的多維分析
藏語依存樹的多維分析采用了判別式的句法分析,以詞性判斷句法、以句法推到語義的多維遞進(jìn)、互為映照的分析模式,這種分析模式符合藏語句法語義的的推理機(jī)制。依存語法本身并未對(duì)依存關(guān)系進(jìn)行詳細(xì)分類,但是為了更加豐富依存結(jié)構(gòu)映射的句法和語義信息,在應(yīng)用分析時(shí),一般會(huì)對(duì)依存樹的各個(gè)邊結(jié)點(diǎn)賦上不同的標(biāo)記。邊結(jié)點(diǎn)可以附帶的信息有:藏語詞匯本身(Tibetan words),藏文分詞標(biāo)記(Tibetan Segmentation),pos藏語詞性標(biāo)記(Tibetan par t of speechtags),藏語句法(語法)功能(Tibetan syntactic funetions),藏語語義角色(Tibetan semantieroles)等多種信息。具體如圖6和圖7。
第一層(最底層)表示詞性及其序列號(hào),第二層為藏文詞匯本身或字符串及其分詞標(biāo)記,第三層為依存句法標(biāo)記。在依存句法標(biāo)記中,ADV為狀中關(guān)系,RAD為后附加,ls為業(yè)格,SBV為主謂關(guān)系,RAD為后附加,QUN為數(shù)量定中關(guān)系,VOB為涉事賓語,ic為小句核心,cn為銜接連詞,ADV為狀中關(guān)系,ld為同體格,HED為整句核心。
第一層(最底層)表示詞性及其序列號(hào),第二層為藏文詞匯本省或字符串及其分詞標(biāo)記,第三層為依存語義標(biāo)記。在依存語義標(biāo)記中,LNF為與事對(duì),RLD為范圍,ls為業(yè)格,ATV為施事,RLD為范圍,RLD為范圍,PVT涉事對(duì)象,ic為小句核心,cn為銜接連詞,RLD為謂語同體,ld為同體格,HED為整句核心。
圖6 藏語依存句法樹
圖7 藏語依存語義樹
3.3 數(shù)據(jù)庫(kù)表示藏語依存關(guān)系
對(duì)形式化的藏語依存關(guān)系,根據(jù)樹結(jié)構(gòu)的信息可以確定樹庫(kù)的格式,樹庫(kù)采用的格式見表1,此格式便于標(biāo)注者采用Excel、Access等常用辦公軟件進(jìn)行標(biāo)注。
表1 藏語依存句法樹庫(kù)的格式
上述藏語依存句法形式化模型中,可以獲取賦有標(biāo)注的藏語依存關(guān)系樹,此樹庫(kù)含有豐富的句法和詞匯信息。通過對(duì)藏語依存樹庫(kù)的深度學(xué)習(xí)和統(tǒng)計(jì)分析,獲取該樹庫(kù)中的詞匯依存關(guān)系的各種信息,從而構(gòu)建詞匯化概率分析模型,然后引入詞匯支配度的概念,再充分利用句子中的結(jié)構(gòu)信息,設(shè)計(jì)一個(gè)分析句子依存關(guān)系的算法。用該算法不僅驗(yàn)證提出的形式化的藏文依存關(guān)系,同時(shí)找出更多的依存關(guān)系。
表1中的每一行對(duì)應(yīng)的是藏語句子結(jié)構(gòu)中的一種依存關(guān)系,在一個(gè)句子中含有n個(gè)詞時(shí),應(yīng)有n-1的依存關(guān)系。我們利用這種方式逐步分析句子時(shí),如果某種語言中含有m個(gè)句子,則可以形成(m×n)-m個(gè)依存關(guān)系。而這些句子的依存關(guān)系集合,可以稱之為藏語依存樹庫(kù)。
藏語樹庫(kù)是藏語自然語言處理研究中的一項(xiàng)關(guān)鍵環(huán)節(jié),也是藏語句法與語義分析銜接的重要橋梁。經(jīng)過藏語自身的語法特點(diǎn)出發(fā),以依存語法理論與方法為導(dǎo)向,研究和構(gòu)建適合藏語語言本體的依存樹庫(kù),重點(diǎn)解決了藏語句法和語義同步分析的策略問題,具體分析中力求從句法形式得到語義的邏輯驗(yàn)證,從語義映射句法形式的結(jié)構(gòu)驗(yàn)證,為藏語句法和語義分析提供了較為理想的形式化描寫策略。這種研究對(duì)推動(dòng)藏文信息處理技術(shù)的發(fā)展有著重要意義,藏語依存樹庫(kù)的構(gòu)建正是這方面的努力和嘗試。
[1]周明,黃昌寧.面向語料庫(kù)標(biāo)注的漢語依存體系探討[J].中文信息學(xué)報(bào),1994(3):35-50.
[2]宗成慶.統(tǒng)計(jì)自然語言處理[M].北京:清華大學(xué)出版社,2008:181.
[3]周國(guó)光.漢語配價(jià)語法論略[J].南京師范大學(xué)學(xué)報(bào),1994(4):103-106.
[4]劉海濤.依存語法和機(jī)器翻譯[J].語言文字應(yīng)用,1997(3):89.
[5]袁毓林.漢語配價(jià)語法研究[M].北京:商務(wù)印書館,2010:314.
[6]劉海濤.依存語法和機(jī)器翻譯[J].語言文字應(yīng)用,1997,23(3):89.
[7]劉海濤.依存語法的理論與實(shí)踐[M].北京:科學(xué)出版社,2009:120.
[8]明揚(yáng).西方語言學(xué)名著選讀[M].北京:中國(guó)人民大學(xué)出版社,2011:229.
Theory and M ethod of Tibetan dependency Treebank construction
Tashi-Gyal①Duo-La②
(①Research Centerof Tibetan Information Technology,TibetUniversity,Lhasa 850000,China;②NorthwestUniversity forNationalities,Lanzhou 730030,China)
Dependency grammar also called"subordinate relationship grammar",and it research on the relation?ship between the dominantand subordinate constituentsofa sentence.Dependency structure refers to the syntac?tic relations between thewords in the sentence and the structure described in a tree structure,called for depen?dency treebank.The theoretical framework of dependency grammar as the theoretical guidance for the Tibetan treebank construction,fully drawing ideological essence of dependency grammar and combining with Tibetan grammar system,a syntactic and semantic tagging system in line with the Tibetan grammar system was set up and the discrimination of the syntax analysis algorithm was designed in order to building a Tibetan dependency treebank ofmultidimensionalwindows.In the specific analysis,firstofall,the background knowledgewasbriefly explained in terms of the dependency grammar origin,definition and the applicability of dependency relation?ship,secondly,the selection of Tibetan sentences,formalmodelof dependency structure,dependency framework structure andmultidimensional relationship of Tibetan dependency treewere analyzed aswell.
dependency grammar;Tibetan treebank;Tibetan syntactic analysis;Tibetan semantic analysis
10.16249/j.cnki.54-1034/c.2015.02.013
TP391.1
A
1005-5738(2015)02-076-08
2015-05-25
2012年度國(guó)家自然科學(xué)基金項(xiàng)目“藏語依存樹庫(kù)的構(gòu)建”(項(xiàng)目號(hào):61163043);2014年度國(guó)家哲學(xué)社會(huì)科學(xué)基金重大項(xiàng)目“基于地理信息平臺(tái)的藏語方言數(shù)據(jù)庫(kù)建設(shè)”(項(xiàng)目號(hào):14ZDB101);2015年度西藏自治區(qū)高校青年教師創(chuàng)新支持計(jì)劃項(xiàng)目“經(jīng)典藏文文獻(xiàn)標(biāo)注語料庫(kù)建設(shè)與詞匯計(jì)量研究”(項(xiàng)目號(hào):QC2015-19);2015年度西藏大學(xué)珠峰學(xué)者人才發(fā)展支持計(jì)劃主體計(jì)劃“杰出青年學(xué)者”項(xiàng)目階段性成果。
扎西加,男,藏族,青海海南人,西藏大學(xué)藏文信息技術(shù)研究中心副教授,主要研究方向?yàn)橛?jì)算語言學(xué)、藏文信息處理。
[責(zé)任編輯:索郎桑姆]
西藏大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年2期