王巧林,李雯雯
(北方民族大學(xué) 外國語學(xué)院,銀川 750021)
美國自建國以來,總統(tǒng)就職演說成為歷史沿襲的重要標(biāo)志之一。歷屆總統(tǒng)的就職演說,可謂是“綺麗以艷說,藻飾以辯雕”,具有較高的文學(xué)和藝術(shù)審美價值[1]。歷屆總統(tǒng)借助就職演說這把利劍分析事實、評價歷史,并用精湛的言辭技巧向民眾傳達未來的施政綱領(lǐng),以獲得更多的民眾支持。目前,我國學(xué)者對美國總統(tǒng)就職演說的研究在數(shù)量、層次和深度等方面較為有限。在CNKI中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫中以“美國總統(tǒng)就職演說”為關(guān)鍵詞進行檢索,發(fā)現(xiàn)較多的研究是對個別總統(tǒng)演說詞的修辭隱喻、主題詞、文體風(fēng)格[2-6]等方面的研究與分析,從依存句法角度對美國總統(tǒng)就職演說的語言特征進行量化對比分析的尚有不足。
因此,本文基于語料庫研究方法,以依存語法為理論框架,從依存距離分布和主、賓、定、狀語的詞類構(gòu)成角度,對美國首任總統(tǒng)喬治·華盛頓和現(xiàn)任總統(tǒng)唐納德·特朗普的就職演說進行量化對比分析,旨在探索依存距離的長短能否反映文本復(fù)雜度,哪些詞類可以充當(dāng)主語、賓語、定語和狀語,哪些詞類在充當(dāng)主語、賓語、定語和狀語時有助于對文本內(nèi)容的理解。
語料庫是自然語言處理必不可少的工具,樹庫是經(jīng)過句法標(biāo)注的語料庫。基于依存樹庫研究方法可以在大規(guī)模真實語料的基礎(chǔ)上,通過實證研究方法幫助我們更好地研究語言的結(jié)構(gòu)特征,發(fā)現(xiàn)人類語言的普遍規(guī)律。因此,本文運用定量與定性相結(jié)合的研究方法,基于依存樹庫對美國首任總統(tǒng)喬治·華盛頓和現(xiàn)任總統(tǒng)唐納德·特朗普就職演說的語言特征進行了量化的對比分析。
本文所選語料為:1.1789年4月30日美國首任總統(tǒng)喬治·華盛頓就職演說的英語版本(http://www.presidency.ucsb.edu/inaugurals_words.php.);2.2017年1月21日美國新任總統(tǒng)唐納·特朗普就職演說的英語版本(http://www.presidency.ucsb.edu/inaugurals_words.php.),分別以純文本形式建立語料庫1和語料庫2,其語料信息如表1所示:
表1 喬治·華盛頓和唐納德·特朗普就職演說詞描述
工作記憶是限制人腦理解和語言處理的關(guān)鍵因素,Yngve用深度假說來闡釋句法復(fù)雜性即句子理解難度與人類認(rèn)知機制之間的關(guān)系[7]。依存關(guān)系中依存距離是衡量語言復(fù)雜性的一個指標(biāo)。依存距離是指一個依存關(guān)系中的兩個詞之間的序號之差,在一定程度上可以反映出句子的理解難度。人類在分析和理解句子時,句中的詞被不斷地儲存進工作記憶中,只有當(dāng)一個詞的支配詞出現(xiàn)時,這個詞才能被從工作記憶中刪除[8]。這就表明,依存距離越小,人類在處理信息時認(rèn)知負荷越小,句法復(fù)雜性越低;而依存距離越大,人們在處理信息時的認(rèn)知成本或認(rèn)知消耗越大,當(dāng)認(rèn)知負荷超過人類短期工作記憶容量(7±2)時,就會造成句子理解困難。因此,本文通過計算語料庫1與語料庫2中每種關(guān)系的依存距離并畫出時序圖,以便我們更清楚的了解樹庫中整體依存距離分布狀況:
圖1 語料庫1和語料庫2的依存距離分布
語料庫1和2的依存距離時序圖呈現(xiàn)了整個樹庫的依存距離分布,可以清楚地看到語料庫1波動幅度較大,一部分?jǐn)?shù)值在0軸上下波動, 一部分?jǐn)?shù)值在50-100之間波動,分布相對分散,依存距離正值最大值為147,負值最大值為-105;而語料庫2波動幅度相對較小,絕大部分?jǐn)?shù)值圍繞0軸上下波動,大致在0-20之間密集分布,只有少部分?jǐn)?shù)值起伏較大,依存距離正值最大值為70,負值最大值為-57。由此,可以得出語料庫1的文本難度要高于語料庫2。這是因為依存距離在0軸上下分布越密集,支配詞與從屬詞之間的線性距離越小,它們更傾向于相鄰地在句子中依次出現(xiàn),此時,句子更容易加工;而波動幅度越大,分布越分散,就表明支配詞與從屬詞在句子中的線性距離越大,即從屬詞與支配詞之間有更多的詞存在。隨著句長增大,依存關(guān)系之間的組配關(guān)系變得逐漸復(fù)雜,進而造成句子理解難度增大。這與Gibson的依存定位理論(Dependency Locality Theory, DLT)相契合,即:從屬詞和支配詞線性距離越大,整合難度就越高,對工作記憶容量的消耗越大[9]。在此基礎(chǔ)上本文也計算了語料庫1與語料庫2的平均依存距離,分別為4.25和3.24,表明喬治·華盛頓的就職演說詞比唐納德·特朗普就職演說詞的平均依存距離更大,理解難度更高。
除了對語料庫1和語料庫2的依存距離和平均依存距離統(tǒng)計之外,本文也對其絕對依存距離分布模式進行統(tǒng)計,發(fā)現(xiàn)語料庫1的絕對依存距離值為1的數(shù)量為755個,占整個樹庫的54.08%,略占優(yōu)勢,當(dāng)絕對依存距離值≦12時,數(shù)量為1 330個,達到整個樹庫的95.27%,占絕對優(yōu)勢;語料庫2的絕對依存距離值為1的數(shù)量為757個,占整個樹庫的55.87%,略占優(yōu)勢,當(dāng)絕對依存距離值≦8時,數(shù)量為1 297,達到整個樹庫的95.72%,占絕對優(yōu)勢。因此,通過計算語料庫1和語料庫2的絕對依存距離分布模式,本文得出唐納德·特朗普就職演說詞比喬治·華盛頓的就職演說詞具有更小的依存距離,理解難度更容易。近年來的一些研究揭示了人類句法機制偏愛依存距離傾向于最小化的線性語序[10]。齊普夫于1949年在《人類行為與省力原則—人類生態(tài)學(xué)引論》中提出“省力原則”,這一原則是人類進行言語行為和一切社會活動的根本準(zhǔn)則。人們在進行言語表達時越來越傾向于使用較小的依存距離,這種依存距離最小化的傾向是基于“省力原則”的。依存距離最小化是人類語言的普遍規(guī)律,已在幾十種語言中被證實[11]??梢?,喬治·華盛頓和唐納德·特朗普的就職演說詞都遵循了依存距離最小化的規(guī)律。但是,當(dāng)絕對依存距離超過30時,語料庫1比語料庫2所占的百分比大大增加,語料庫1所占比例為1.43%,而語料庫2僅占0.15%,說明語料庫1中的平均依存距離要遠遠大于語料庫2,提升了句子結(jié)構(gòu)的復(fù)雜性和加工難度。
句子的平均依存距離和句長有關(guān)[12],句子的平均依存距離能夠預(yù)測句法難度[8,13]。通過整個樹庫依存距離的分布,可以得出句子越短,依存距離越小,句子信息更容易處理;反之,句子越長,依存距離越大,尤其當(dāng)依存距離超過100時,會造成嚴(yán)重的理解困難。喬治·華盛頓的演講詞中句式復(fù)雜,大量運用排比和復(fù)雜句式,使得依存距離長,理解難度大;唐納德·特朗普的演講詞中句式靈活多變,依存距離短,理解難度小,表明唐納德·特朗普的就職演說詞的難度比華盛頓的難度低,更傾向于使用簡化的語言??偨y(tǒng)就職演說的聽眾涉及社會各個階層,語言過于復(fù)雜或口語化,都會影響其演講效果。因此,本文認(rèn)為在政治演講語篇中,適當(dāng)減小依存距離符合省力原則和依存距離最小化規(guī)律,易引起聽眾的共鳴,能達到讓聽眾刻骨銘心的效果。
除此之外,本文還對主語、賓語、定語和狀語的詞類構(gòu)成進行統(tǒng)計與分析,如下表所示:
表2 句法成分的詞類構(gòu)成(主語)
表3 句法成分的詞類構(gòu)成(賓語)
表4 句法成分的詞類構(gòu)成(定語)
表5 句法成分的詞類構(gòu)成(狀語)
從表2可知,語料庫1與語料庫2中構(gòu)成主語的詞類大體一致,但其詞類的分布頻率卻相差較大。語料庫1中構(gòu)成主語的名詞和代詞出現(xiàn)的次數(shù)相同,為30次,占比均為34.48%。并且構(gòu)成主語的詞類,除了名詞和代詞所占比重較大之外,Wh-詞的地位也不容小覷,占22.99%的比重。而在語料庫2中,代詞出現(xiàn)70次,名詞出現(xiàn)52次。Wh-詞僅出現(xiàn)了3次,所占百分比分別為37.41%、50.36%和2.16%。在兩個語料庫中,Wh-詞出現(xiàn)的頻率相差較大,這是因為Wh-詞(which, that, what, who)越多,代表長難句越多,句式結(jié)構(gòu)越復(fù)雜。因此,Wh-詞所占的比例在一定程度上可以反映出文本的難易程度。
表3顯示,語料庫1與語料庫2中,賓語的主要詞類構(gòu)成是名詞,其次是代詞。但是通過表2可以發(fā)現(xiàn)語料庫1中Wh-詞(which, that)有較強的充當(dāng)賓語的能力,比重為25%;而語料庫2中,Wh-詞僅出現(xiàn)了一次,占比1.02%,可忽略不計。從Wh-詞構(gòu)成賓語所占比重,同樣可以得出語料庫1長難句多,人們在處理信息時的認(rèn)知負荷大;語料庫2句式相對簡單,易于理解。
表4表明,語料庫1和語料庫2中,作定語的詞類構(gòu)成,包括形容詞、代詞和介詞短語(of結(jié)構(gòu)),三種詞類的比重都較大。但語料庫1中,形容詞作定語比語料庫2高出近10個百分點,語料庫2中形容詞性物主代詞的使用比語料庫1高出近16個百分點,而介詞短語在語料庫1中比語料庫2高出5個百分點,可見,喬治·華盛頓演講詞的限定語十分豐富,用詞嚴(yán)謹(jǐn),理解難度相對較大;而唐納德·特朗普的演說詞,用詞相對簡單,通俗易懂。鄧耀臣與馮志偉]曾指出人類的惰性和大腦信息處理能力的有限性使說話者在言語交際過程中傾向于選用短小、簡單的詞匯表達特定意義以節(jié)省力量消耗,這種行為直接導(dǎo)致這些短小詞匯在語篇中的使用頻數(shù)增高[14]。
從表5狀語的詞類構(gòu)成來看,語料庫1與語料庫2介詞短語作狀語和副詞作狀語都有著舉足輕重的地位。語料庫1中,介詞短語作狀語的比重為56.05%,略占優(yōu)勢;副詞作狀語所占比重為27.39%,動詞僅占3.18%。而語料庫2中,副詞作狀語占51.37%,介詞短語作狀語的比重為40.41%,動詞占2.05%。從狀語的統(tǒng)計數(shù)據(jù)可以看出副詞在充當(dāng)狀語這一功能上并不完全占有優(yōu)勢,這一點在喬治·華盛頓和唐納德·特朗普的總統(tǒng)就職演說詞中存在較大的差異。在語料庫2總統(tǒng)就職演說中,副詞和介詞短語作狀語成分幾乎可以平分天下,而在語料庫1中,介詞短語作狀語比副詞作狀語出現(xiàn)的次數(shù)更為頻繁。副詞常限制修飾動詞、形容詞性詞語,表示程度、范圍、時間等意義;漢語介詞與英語介詞都是一種表達關(guān)系意義的虛詞,它們的作用都在于引出與動詞或形容詞、名詞、代詞等相關(guān)的對象(施事、受事、與事、工具)以及處所、時間等[15]。副詞和介詞短語都起到修飾限定和解釋說明的作用,但是副詞的概念相對模糊、籠統(tǒng)而介詞短語能較清楚的引出較具體的內(nèi)容。從這一點上,可以推斷出喬治·華盛頓的就職演說詞更為清晰明了,對演講的具體內(nèi)容交待地較為具體詳實。
因此,通過對構(gòu)成主語、賓語、定語和狀語的詞類統(tǒng)計與分析,就主語和賓語詞類構(gòu)成統(tǒng)計而言,可以推斷出喬治·華盛頓的就職演說詞難度高于唐納德·特朗普的就職演說詞;在定語的詞類構(gòu)成上,喬治·華盛頓的就職演說用詞嚴(yán)謹(jǐn),唐納德·特朗普的就職演說用詞相對簡單、容易;在狀語的詞類構(gòu)成上,喬治·華盛頓的就職演說詞更為清晰明了,對演講的具體內(nèi)容交待地較為具體詳實。
本文基于依存樹庫對美國首任總統(tǒng)喬治·華盛頓和現(xiàn)任總統(tǒng)唐納德·特朗普的就職演說從依存距離分布和主語、賓語、定語和狀語的詞類構(gòu)成上進行計量對比分析。得出以下結(jié)論:1.句子越短,依存距離越小,文本信息更容易處理;反之,句子越長,依存距離越大,文本信息處理難度越大。喬治.華盛頓的演講詞句子復(fù)雜,使得平均依存距離長,理解難度較大;唐納德.特朗普演講詞中句式靈活多變,平均依存距離短,理解難度較小。2.在構(gòu)成主語和賓語的詞類中,Wh-詞在一定程度上可以反映出語篇的難易程度,Wh-詞出現(xiàn)的頻率越低,語篇句式越簡單,信息越易加工;Wh-詞出現(xiàn)的頻率越高,語篇句式越復(fù)雜,信息越難加工。形容詞、代詞、介詞短語在作定語時所占比重都較大,但喬治.華盛頓的演講詞中形容詞作定語使用頻率高,而唐納德.特朗普的演講詞中形容詞性物主代詞使用頻率較高。從狀語的統(tǒng)計數(shù)據(jù),可以看出副詞在充當(dāng)狀語這一功能上并不完全占有優(yōu)勢。通過計量特征的對比分析,本文得出語言的計量特征對比分析有助于對文本內(nèi)容的理解以及對文本復(fù)雜度的判斷。