祁曼婷
(南京師范大學(xué)文學(xué)院,江蘇南京210097)
俄語名詞的屈折并類研究
祁曼婷
(南京師范大學(xué)文學(xué)院,江蘇南京210097)
本篇文章主要描述一個新穎問題:以文本頻率分布差異的層級體系作為參考,研究語法中名詞的屈折變化的并類。借用俄語名詞進行研究,這種語言中有大量語法規(guī)則的特性及出現(xiàn)在不同形態(tài)范疇中的語法并類。針對俄語中名詞之間的關(guān)系展開,研究表明文本使用頻率與屈折并類之間有很復(fù)雜的關(guān)系。我們的結(jié)論指出,層級體系中位于不同節(jié)點的特殊功能間的使用頻率的分布都是不同的,低文本頻率是屈折并類的一個必要條件。并類與頻率之間,存在著復(fù)雜的關(guān)系。
屈折并類頻率
比較語法中名詞的屈折變化的并類,以一個文本頻率分布差異的層級體系作為代表是缺乏繼承性的。為了更好地研究這個問題,考慮借用俄語,這種語言中有大量語法規(guī)則的特性及出現(xiàn)在不同形態(tài)范疇中的語法并類。
俄語有豐富的形態(tài)變化,有嚴格的語法接格關(guān)系,它也是驗證這一關(guān)系的最好候選者。本文選取俄語中的名詞作為研究對象,它包括性、數(shù)、格的形態(tài)變化,針對俄語中名詞之間的關(guān)系展開,研究結(jié)果表明文本使用頻率與屈折并類之間有很復(fù)雜的關(guān)系。
對于屈折并類,是指一個相同詞形可作為多個功能使,理論中的一個巨大挑戰(zhàn)是詞形變化。通過不同途徑來分析屈折并類:一種途徑是描述不足,屈折變化的形式?jīng)]有被作為功能的合并;另一種途徑是參照(Zwick 1985;Stump 2001:212-41),詞形與一個基礎(chǔ)功能聯(lián)合,詞元的其他詞形變化參考了詞元與基礎(chǔ)功能的聯(lián)合,所以,涉及到的是它們性質(zhì)中的非對稱性,而不是描述不足。因此,我們不可避免必須要全面分析。
考慮到名詞合并類的文本頻率分布與俄語中詞形變化形式模型其他用途之間的關(guān)系。特別是,非對稱性參考是否反映在頻率分布中。俄語是驗證這一關(guān)系的最好候選者,因為這一語言有大量的詞形變化和不同類型的屈折并類。
我將用手動編譯資料的方式,將從Л.В.Климова《現(xiàn)代俄語中高頻名詞、形容詞和數(shù)詞研究》文章中,抽取50現(xiàn)代俄語中使用頻率最高的名詞,包括50個名詞詞位,共計600個詞形變化。在這一資料的基礎(chǔ)上,設(shè)立了一系列假設(shè),并且建立一個用于描述俄語中名詞的詞形變化結(jié)構(gòu)和文本使用頻率之間關(guān)系的模型。
以俄語國家語料庫(НКРЯС А.Шаров;В.Б.Касевич,2003)中的經(jīng)過元語言標注和詞法標注,且經(jīng)過手工詞法消歧和自動詞法分析程序進一步改正的1300萬詞次的語料庫為測試模型的方式來交叉—驗證結(jié)論,且這一測試語料庫對屈折變化進行分類和標記。由于這一語料庫數(shù)據(jù)龐大,只以2015年錄入的一部分語料為基礎(chǔ),其中包括3939份文章,9236個句子,57926個詞,從而對假設(shè)進行檢驗。
本文接下來的結(jié)構(gòu)是,第二節(jié)論述形態(tài)變化理論與頻率分布;第三節(jié)提出假設(shè)并檢驗;第四節(jié)文章總結(jié)。
2.1屈折并類
語法中的詞形變化規(guī)定了功能與形式之間的關(guān)系。一個合理的假設(shè)就是功能與形式之間一一對應(yīng)。但事實相反,一種語言總是與這一理想期望相違背,總會出現(xiàn)一種詞形對應(yīng)兩種及兩種以上的功能。典型的就是俄語中的名詞,如下圖所示:
圖1:功能多于詞形
俄語名詞有2個數(shù)類(單數(shù)和復(fù)數(shù))和6種格類(主格、賓格、屬格、與格、工具格、處所格),總共構(gòu)成12種組合變化情況。盡管俄語中一個名詞有12中變化,但一個典型的名詞的形式不會超過10種(如圖1),所以名詞種類問題就決定了功能之間區(qū)別問題。例如,詞形комнате“房間”同屬于單數(shù)與格和處所格,所以單獨寫出這類詞形是會造成歧義的;而詞形кости“骨頭”有3種歧義,它的這一個詞形分別用以表達單數(shù)與格、處所、屬格功能。
相似地,英語中的動詞有現(xiàn)在時、過去時和被動分詞形式。舉出一個有歧義的形式,例如:詞“hit”(在“Mary hit thenail with a hammer瑪麗用鐵錘錘釘子”,與其對立的是“Mary was hit by a meteorite”),假定這里有兩個或兩個以上不同的功能共用同一詞形。其他動詞也存在不同的功能對應(yīng)不同的詞形。
形式上的合并可以被視作是描述不足,即多個功能共用一個詞形表達,且每個功能具有同等地位,或者這可以被視作參考依據(jù)(Zwicky 1985;Stump2001:212-41),一個詞形與一個基礎(chǔ)功能相聯(lián)系,詞形變化中的其他項則參考了這一基礎(chǔ)功能項。描述不足意味著功能的地位是平等的,而基礎(chǔ)參考方法的屬性是一個功能較其他功能更重要。
語法功能在文本上重要的一個衡量就是文本頻率的統(tǒng)計。我們將作出不同的假設(shè),關(guān)于描述不足與依據(jù)參考之間形式上的區(qū)別,被映射在文本頻率分布上的差異。本文中,將對這些假設(shè)(借助俄語名詞)進行試驗。作為假設(shè)的基礎(chǔ),將從俄語形態(tài)變化的形式理論模型出發(fā),在形態(tài)結(jié)構(gòu)網(wǎng)絡(luò)內(nèi)研究
2.2層級繼承
在這一模型中,俄語中的典型四類名詞及其形態(tài)變化被列在表1中:
表1:俄語中主要名詞類的形態(tài)變化
我們看到類Ⅳ中名詞單數(shù)кость“骨頭”的歧義最多,3種詞形被用作6種語法功能(一種作為主格和賓格,一種作為屬格、與格、處所格,一種作為工具格)。類Ⅲ中的名詞комната“房間”也有在單數(shù)與格和處所格形式的合并。俄語中的詞形合并與性也有關(guān)系。俄語中的單數(shù)陽性名詞的變化屬于類Ⅰ,這類詞中賓格詞形變化是以屬格形式為基礎(chǔ)的。對于類Ⅱ、Ⅳ,分別是中性和陰性詞類,它們中的主格-賓格形式是合并的。類Ⅲ主、賓格形式則明顯是分開的。在復(fù)數(shù)形式中,情況要簡單得多:一些動物名詞形式的賓格是以屬格形式為基礎(chǔ),一些非動物名詞的形式的賓格則是以主格形式為基礎(chǔ)。在上面的表格中只給出了非動物名詞的變化形式。
以俄語50個高頻名詞的詞形變化表明:俄語中,大約38%單數(shù)形式的詞形變化標記共用同一詞形的歧義形式,即我們計算的是合并類詞形變化的標記占出現(xiàn)的詞形變化標記總量的比例:1)所有類Ⅲ中的單數(shù)與格和處所格出現(xiàn)的標記數(shù)量;2)類Ⅰ非動物名詞、類Ⅱ及類Ⅳ中單數(shù)主格與賓格出現(xiàn)的標記數(shù)量;3)類Ⅰ中動物名詞單數(shù)主格與屬格出現(xiàn)的數(shù)量;4)類Ⅳ中單數(shù)屬格、與格、處所格出現(xiàn)的標記數(shù)量。俄語中一個詞形變化的并類形式在上下文中可以很容易消除歧義,但是我們的假設(shè)檢測是為了檢驗俄語中詞形變化并類與頻率分布的關(guān)系。詞形變化體系之所以可以很好地服務(wù)于一種語言(如,俄語、德語等屈折語),在很大程度上依賴于上下文的語法規(guī)則。
我們?nèi)狈Χ碚Z詞形變化并類的繼承性分析,而是將其視作非對稱性,因為一個特殊的詞形被認為以一個功能作為基礎(chǔ)。作為詞形變化中的并類,我們也需要將各類屈折變化的分層結(jié)構(gòu)納入考慮之中。下面圖2就表現(xiàn)了俄語名詞詞形變化的分層結(jié)構(gòu)模型使用了屈折變化結(jié)構(gòu)網(wǎng)絡(luò)(Corbett和Fraser),在分層的底部是詞元事例。
圖2:俄語名詞繼承結(jié)構(gòu)
需要注意兩點:第一,最初的分析是以屈折變化理論為目標;第二,證明俄語中存在大量重要的特殊性,這也包括了語言中所有詞匯的不規(guī)則使用的事例。
形態(tài)變化被構(gòu)造為一個層級體系,這一體系中的信息使層級還未達到囊括全部情況的程度。因此,在圖2層級頂部,我們可以發(fā)現(xiàn)一個聯(lián)系所有名詞的信息(例如,復(fù)數(shù)與格、工具格和處所格的詞形變化)并且這一信息通過繼承發(fā)展到其他項中,在層級的底部我們發(fā)現(xiàn)的是每一個詞實際變化的情況。節(jié)點N_Ⅰ(代表類Ⅰ)和N_Ⅱ(代表類Ⅱ),這兩個節(jié)點繼承自節(jié)點N_O(代表了類O),詞形變化中的單數(shù)屬格、與格、工具格和處所格是相同的。這意味著,如名詞節(jié)點下的單數(shù)處所格具有3-4種屈折類,那么符合這一特點肯定就是類Ⅳ中的詞如кост-и所具有的。
我們將會運用這一模型,并將頻率分布信息與名詞層級的不同構(gòu)成部分相聯(lián)系,即模型頂部的名詞,不同名詞類和屬于這一名詞類的詞元位于模型底部。
以下是一系列的假設(shè),通過俄語國家語料庫來進行進行交叉檢驗。
3.1分層體系中的詞形變化
我們列出的俄語詞形變化繼承模型包含了一個建立在傳統(tǒng)詞類水平上的層級結(jié)構(gòu)系統(tǒng)。一個主要的問題就是這一詞形變化的層級結(jié)構(gòu)系統(tǒng)是否被映射了使用頻率的不同。因此,我們將研究圖2中層級系統(tǒng)各個點上語法功能的使用頻率,特別是層級系統(tǒng)中各個點存在的功能合并類的使用頻率。這一問題的研究將通過以下假設(shè)的檢驗實現(xiàn):
假設(shè)一:位于層級系統(tǒng)同一位點上的各節(jié)點詞形變化元素的頻率分布是無差別的。
對于這一假設(shè),Corbett已指出位于層級系統(tǒng)同一位點上的各節(jié)點詞形變化元素的頻率分布是有差別的。例如,名詞性詞包括名詞和形容詞。名詞中,在N_O(包括了N_Ⅰ和N_Ⅱ)和N_Ⅲ、N_Ⅳ之間的使用頻率分布是有區(qū)別的。
表2 層級體系同一位點的頻率分布
很明顯假設(shè)一是錯誤的, 層級體系中處于同一水平上的名詞類之間單數(shù)和復(fù)數(shù)的頻率分布是不同的。(表2)類Ⅳ中復(fù)數(shù)的文本頻率最低,相對頻率也最低。與之相對,類O具有最高的使用頻率,相對頻率也最高。
假設(shè)二:如果兩個或兩個以上的功能共用一個詞形,那么聯(lián)合的詞形的使用頻率將會高于不共用同一詞形的類。
表3 屈折變化頻率分布
為驗證這一假設(shè),我們觀察了單數(shù)屬格、與格、處所格不同屈折變化類頻率分布, 并計算了語料庫中單數(shù)詞形變化所占比例(表3)。類Ⅳ中有這3個功能的合并,類Ⅲ中有2個功能的合并(單數(shù)與格和處所格),類O中有三個功能各不相同,如果這一假設(shè)是正確的,那么類O中的這些功能的相對頻率應(yīng)該最高,從而,我們計算了單數(shù)詞形變化所占比例。但是很顯然這一假設(shè)是錯誤的, 因為語料庫并類的使用的相對頻率是不同的。語料庫中,類O出現(xiàn)最高的相對頻率,類Ⅲ第二,類Ⅳ最低。
3.2并類的使用和不對稱性
出現(xiàn)合并類中一個功能是否比另一個(或其他)功能重要,但是使用頻率分布是否是平等的? 這里我們做出了以下的假設(shè):
假設(shè)三:兩個或多于兩個的功能共用同一個詞形,這些功能之間的頻率是無差別的
表4 主、賓格并類在語料庫中各自使用頻率
我們觀察到單數(shù)屬格、與格和處所格的頻率分布。在表1中,我們看到屬于類N_Ⅰ和類N_Ⅱ的詞元有相同的詞形,但是其中的3類是可以清晰分辨。類N_Ⅲ中單數(shù)與格和處所格之間是模糊的,類N_Ⅳ中3個功能共用一個詞形是完全有歧義的。俄語中,缺乏繼承性的表現(xiàn)是名詞性詞的詞形變化,描述不足的表現(xiàn)是單數(shù)處所格的NOUN節(jié)點上,這一點使用貫穿在3個詞形變化中。在類Ⅲ、Ⅳ中,單數(shù)與格與處所格有相同的詞尾,單數(shù)與格將接替處所格的詞尾,在類Ⅳ中,單數(shù)處所格與屬格的詞尾有相同的詞尾,單數(shù)處所格接替了屬格的詞尾。
因此,一個合并類中,我們可以聲明與特有的功能聯(lián)結(jié)的詞形,也可能被用作另一個功能。在類Ⅳ中,參考構(gòu)成了單數(shù)與格接替了處所格,接著是接替了屬格,應(yīng)用于3個功能的同一詞形都帶有-и。類Ⅳ有三個功能的合并的事實,但是,這對于所有名詞(包括類O)都有對于不同功能都有不同的詞形。事實上,我們從統(tǒng)計的數(shù)據(jù)中知道單數(shù)屬格到處所格再到與格的使用頻率是遞減的。
因此,如果并類和頻率之間是有聯(lián)系的,這一非對稱性可能是必要的,但是沒有足夠的證據(jù)。這一假設(shè)也是錯誤的。
3.3合并的環(huán)境
使用頻率較高的種類,如單數(shù),合并類少于使用頻率低的種類。這一問題將通過以下假設(shè)檢驗:
假設(shè)四:一個類別的頻率對這一類別中的并類沒有影響。
這些合并事例被發(fā)現(xiàn)出現(xiàn)在俄語單數(shù)和復(fù)數(shù)詞中,并且最重要影響合并因素是,合并中出現(xiàn)的詞形變化數(shù)目的相對頻率分布情況,而不是合并詞元相對頻率分布情況。例如,類Ⅳ中單數(shù)詞形變化有最大的歧義,也是最低絕對頻率。要注意這一假設(shè)與假設(shè)二的相互影響,但是這里的證據(jù)證明假設(shè)四是錯誤的,這也證明詞形變化的數(shù)量是最重要的因素。
我們期望看到屈折變化的合并與模型中基于一個缺乏繼承性的分層系統(tǒng)之間的關(guān)系。我們將這一關(guān)系的研究放于俄語的名詞中,結(jié)論指出,層級體系中位于不同節(jié)點的特殊功能間的使用頻率的分布都是不同的。事實上,分層體系中相同節(jié)點上的并類之間確實存在聯(lián)系。類Ⅳ與類Ⅲ和類O比較,它的單復(fù)數(shù)文本頻率是最低的,但是它的單數(shù)屈折變化合并是最多的。這就告訴我們,低文本頻率是屈折并類的一個必要條件。我們也找到證據(jù)證明了,特殊功能的文本使用頻率能夠直接反應(yīng)在形式化的模型中,因此,一個功能與它的形式相聯(lián)系具有較高的文本使用頻率這可能是一個必要條件,但這不是一個充分條件。本文結(jié)論顯示,并類與頻率之間存在復(fù)雜的關(guān)系,這一問題有待繼續(xù)研究。
[1]Климова.Лариса.Владимировна《Выскочастоные имена существительные,прилагательные и числительные в современые русском языке現(xiàn)代俄語中高頻名詞、形容詞和數(shù)詞研究》Екатеринбург,2004.
[2]Arnold Zwicky.How to describe inflection.In M.Niepokuj,M.Van Clay,V.Nikifordou and D.Feder,editors,Proceedings of the eleventh annual meeting of the Berkeley Linguistics Society,pages,1985:372-386.
[3]Gregory T.Stump.Inflectional Morphology.Cambridge:Cambridge University Press,2001.
[4]Nicholas Evans,Dunstan Brown and Greville G.Corbett.Dalabon prononminal prefixes and the typology of syncretism:a Network Morphology analysis,2001.
[5]Greville G.Corbett and Norman M.Fraseer.Network morphology:ADATR account of Russian nominal inflection. JOURNAL of Linguistics,1993:29:113-42.
[6]Martin Haspelmath.Understanding Morphology.Edward Arnold,London,2001.
[7]張余亮.俄語現(xiàn)代標注語料庫的理論與實踐.解放軍外國語學(xué)院碩士學(xué)位論文,2006.
[8]http://proling.iitp.ru/etap(ЭТАП-3機器翻譯系統(tǒng)網(wǎng)址鏈接)
[9]http://www.ruscorpora.ru/(俄語國家語料庫在線)