楊 波 卞 京 張 輝
1東南大學外國語學院 江蘇 南京 2111892南京師范大學外國語學院 江蘇 南京 210097
提要 日常會話中包含大量的反語,對于字面義和反語義的理解和加工,心理語言學家Gibbs在上世紀90年代大膽提出,人類認知從根本上講包含比喻性的加工過程,理解反語并非一定需要理解字面話語所需的認知加工之外的特別加工。Gibbs的這一觀點被稱為直接通達觀,其在神經語用學領域,特別是關于比喻義與字面義的加工問題上頗受爭議。包括反語在內的比喻語言理解加工的時間進程的模式或假說除了Gibbs的直接通達觀,主要還有標準語用模式和分級突顯假說,且相關的實證研究結果存在分歧。我們把問題和爭議概括為:1)反語的理解和加工機制是什么樣的?是不同于字面語言加工的特殊過程嗎?2)就反語而言,上述三大加工模式或假說中哪種更具適用性?本研究以較熟悉的漢語反語為例,在神經語用學的框架下使用事件相關電位技術(ERP)來記錄和分析所得到的N400和P600成分。實驗發(fā)現(xiàn):1)較熟悉的反語義較之對應的字面義誘發(fā)了更大的N400和P600波幅,提示反語義的加工過程經歷了不符預期(或語境)的語義整合以及后期語用整合推理,因此是不同于字面語言加工的特殊過程;2)實驗結果說明,漢語反語的加工最可能采取的是標準語用模式,而非直接通達觀的加工模式。
我們的日常生活中不乏“想得美”“你真壞”和“看看你干的好事”這樣看似尋常而實際上“似是而非”的語言。說話人真正要表達的意思跟字面意思相反,而聽話人往往能理解其傳遞的真正含意,這就是“反話”或者“反語”(verbal irony)。本研究將反語定義為:用肯定的語言形式來表達否定的意思、態(tài)度或評價,或者相反。直到20世紀70年代,反語的研究隨著語用學、心理語言學和認知語言學的興起逐漸開辟了修辭之外的新視角(Garmendia 2018)。特別是心理語言學家Gibbs(1994)指出,人類認知從根本上講包含比喻性的加工過程,反語跟隱喻、轉喻以及其他比喻性語言一樣,并不是異常的或修飾性的,而是普遍存在于日常語言中。這就是說,“理解反語并非一定需要理解字面話語所需的認知加工之外的特別加工”(同上:437)。Gibbs對于比喻語言理解加工的觀點引發(fā)了學界的廣泛爭議,特別是在神經語用學的研究中,比喻義是其主要研究對象之一,而且從理論到實證都存在分歧。首先,反語的字面義和比喻義的區(qū)分:反語義的理解和加工是一個不同于其字面義的特殊過程嗎?反語義能否直接通達?其次,反語加工的時間進程:在比喻語言的三種加工模式或假說(詳見下文)中,反語加工更可能采取何種加工模式?
關于反語加工的時間進程問題,主要存在三大加工模式或假說,即標準語用模式(Standard Pragmatic Model,SPM)、直接通達觀(Direct Access View,DAV)和分級突顯假說(Graded Salience Hypothesis,GSH)。(1)根據(jù)楊波和龐超偉(2015)的介紹,SPM認為加工比喻性語言較之字面語言需要更大的認知努力,必須首先計算話語的字面義;DAV提出理解比喻性語言可以毫不費力,不需要有意識的思考;GSH假定模塊的、詞匯的通達機制是有順序的:較為突顯的意義因為規(guī)約性(conventionality)、頻率(frequency)、熟悉度(familiarity)或原型性(prototypicality)更高,是處于大腦的首要位置的編碼義,要比不突顯的意義的通達更快。GSH在某種程度上說是前兩種模式或假說的融合,基于語言意義的突顯程度而假定相應的加工模式。SPM(Grice 1975;Searle 1978)提出,理解反語需要首先構建字面的、獨立于語境的解讀,當發(fā)現(xiàn)字面解讀明顯跟語境不一致時,字面解讀就會被壓制,反語解讀隨即被計算,因此假定反語較之字面語言需要額外的加工努力。DAV(Gibbs 1989)對SPM提出了挑戰(zhàn),認為如果語境支持反語解讀,那么反語義被直接激活,無需首先通達字面義,因此假定反語解讀較之字面解讀不需要更多的努力。GSH(Giora 1997,2003)在某種程度上融合了前兩種模式,提出突顯義和基于突顯義的解讀首先被激活,而熟悉反語的字面義和反語義都是突顯的,二者被平行加工,反語義也應該被直接通達而無需重新分析;不熟悉反語通常是其字面義先被加工,然后發(fā)現(xiàn)其跟語境的不一致,需要重新加工將其分析為反語。
我們重點關注與本研究相關的ERP研究。Ivanko和Pexman(2003)考察了語境在反語理解中的作用以及在字面和反語陳述中的影響模式。為此,研究者控制了情境的否定性程度(使用強否定、弱否定和中性語境),并通過直接改變目標句中的關鍵詞(通常是成對的反義詞,詳見Ivank和Pexman 2003:276-279)來生成反語義和字面義,結果發(fā)現(xiàn)在強否定情景中,反語陳述的閱讀時較之字面陳述更長,而在弱否定情景中,反語陳述的閱讀時較之字面陳述更短或者等同。因此,恰當?shù)恼Z境條件有助于反語義的加工,支持比喻語言加工的直接通達模式,即DAV。此外,DAV對適當語境下反語義被直接加工的預期也得到了Gibbs(1986)研究的證據(jù)支持,即在一定的語境下反語句的閱讀時間短于或者等同于字面句的閱讀時間。
Cornejol等(2007)發(fā)現(xiàn)了關于反語解讀策略的腦電成分。整體策略(關注整個交際情景)中的反語誘發(fā)了類似N400的成分和明顯的晚期正波(根據(jù)波形圖判斷應為P600,參見Cornejol等 2007:420),而解析策略(關注句子各個成分)主要誘發(fā)了較之整體策略明顯減少的N400相關成分,并認為這跟解讀策略和語境信息提示量以及對更高級的認知資源的要求有關。這樣的結果顯然支持SPM而不支持DAV。
Regel等(2011)考察了反語和字面句理解中包含的認知過程的類型及其時間進程,該實驗的ERPs結果一致顯示,不管呈現(xiàn)通道如何,反語相比對應的字面句子而言出現(xiàn)較大的晚期正波(即P600成分)而沒有N400成分。反語N400的缺失,暗示在支持性的語境下反語義的加工不涉及語義整合困難。因此,在反語的理解過程中,語義不一致的識別對于整合字面句義和前面的語境信息來說不是必要的。相反,觀察到的反語誘發(fā)的P600為晚期加工中包含推理過程提供了一些支持,這跟SPM和GSH一致;同時也提供了不支持DAV的證據(jù),因為結果顯示了字面語言和反語理解中的明顯差異。該文還提出,觀察到的左前負波(Left Anterior Negativity,LAN)效應,以及未觀察到N400效應,要求對SPM和GSH進行修正,因為它們都認為,適合語境的字面義首先被激活(至少對于不熟悉的反語而言是這樣)。
Filik等(2014)針對GSH關于熟悉和不熟悉反語加工之間不同的預期進行了實驗研究。N400時間窗結果顯示,不熟悉反語較之非反語控制語料表現(xiàn)出更大的負走向的波形,而熟悉反語及其控制語料無差異。加工熟悉反語(較之非反語控制語料)則沒有經歷這樣的加工困難。在600-1000ms時程中,反語較之控制語料出現(xiàn)更正走向的波形,該文認為這反映了類似P600的效應。這一語境效應跟熟悉度無關,暗示在此晚期時程內,熟悉和不熟悉反語較之相應的非反語控制語料進行著相似的認知加工。文章認為這樣的結果跟SPM不一致,因為該觀點預期所有反語語料較之非反語控制語料存在加工困難;與DAV也不太一致,因為該觀點認為只要有充足的語境支持,反語和字面語的加工方式相同。所以,其實驗結果跟GSH最為一致,較符合該假說對熟悉和不熟悉反語加工差異的預期。
從上述梳理中我們發(fā)現(xiàn),首先,已有實驗結果對反語加工時間進程的三大模式或假說的驗證存在分歧:Ivanko和Pexman(2003)的研究顯然支持DAV;Cornejol等(2007)的結果支持SPM而不支持DAV;Regel等(2011)的結果跟SPM和GSH一致,同時也提供了不支持DAV的證據(jù);Filik等(2014)的結果跟SPM和DAV不完全一致,總的說來跟GSH最為一致。其次,就關鍵成分N400和P600而言,目前的ERP研究一致地報告了P600或者類似P600的晚期正成分,但Regel等(2011)的研究和Spotorno等(2013)考察反語理解中信息整合的關鍵階段的研究都報告未發(fā)現(xiàn)N400成分。這一成分的缺失值得繼續(xù)驗證和探究。最后,上述各實驗雖都涉及對反語加工的考察,但在語料設計編排和實驗范式上卻因為各自的視角和目的而存在差異。下文將說明本實驗的語料設計編排方案和實驗范式。
本研究以較熟悉的漢語反語(2)漢語反語有多種分類,可根據(jù)熟悉度、“正/反”(褒詞貶用和貶詞褒用反語)、推理反語義主要依賴的知識類型(基于詞匯語義知識和世界知識的反語)等。本研究挑選的反語實際上是依賴詞匯語義知識來理解的、較熟悉的、褒詞貶用類反語,是大多數(shù)研究認為更具典型性的一類反語。為例,針對上述分歧和問題有針對性地設計ERP實驗方案,以考察這類反語加工的神經機制,探究反語義的通達是否是特殊的加工過程,并借此探討上述關于反語加工時間進程的模式或假說。
首先,創(chuàng)造盡量自然的實驗語料和條件,排除Ivanko和Pexman(2003)控制的語料的強否定和弱否定語境,以及Cornejol等(2007)對被試進行解讀策略訓練等因素對實驗結果的影響,因此我們的實驗記錄的是被試自然地在線閱讀同類型語料的ERPs。
其次,采用視覺通道呈現(xiàn)語料,排除聽覺通道呈現(xiàn)語料時人為控制的韻律特征等跟聲音有關的因素可能給被試的加工帶來的影響。控制語料目標句的音長、音高和音調等韻律特征極可能造成被試對目標句的韻律期待及相應的加工偏向,從而干擾目標句的語境因素本身對加工的影響。如何控制聽覺通道呈現(xiàn)語料的韻律特征以及韻律特征會對反語的加工產生怎樣的影響(參見 Regel 等 2011;Filik 等 2014),我們將另做研究。
再次,通過評分(ratings)的方式控制語料的熟悉度,排除熟悉度差異對反語加工造成的影響。專門控制熟悉度是因為熟悉度跟分級突顯假說的核心概念“突顯”密切相關,因為熟悉度在很大程度上可以作為突顯度的指標。本研究實驗語料的目標句大致為“評價對象+副詞+關鍵詞”結構,并非不需結合語境就可以解讀的詞匯化的反語。因此,我們首先需要對反語語料的熟悉度進行區(qū)分。盡管目前只有Giora(2003)、Pexman等(2010)和Filik等(2014)等少量研究控制了熟悉度,卻無法提出嚴格統(tǒng)一的區(qū)分標準,但確實存在非常熟悉甚至詞匯化的反語(如本文開篇列舉的“想得美”和“你真壞”)和非常不熟悉的新穎反語(Regel等 2011),因此其加工勢必受到熟悉度的影響。本研究對語料目標句的熟悉度的區(qū)分采用評分的方法,一方面是因為評分更易操作和量化,另一方面是因為這是大多數(shù)關于包括反語在內的比喻語言的實驗中區(qū)分熟悉度的常用方法,可使本研究的實驗跟其他研究的實驗在此方面具有更高的可比性。因此,我們選取較熟悉的這樣一類更具代表性的反語作為考察對象,旨在為反語的認知加工得出初步結論,并成為下一步深入研究的參考和比較基礎。
最后,控制語境提示信息的豐富程度,保持語境部分人物和事件框架基本一致,只改動個別關鍵信息,使得原本相同的目標句產生偏向字面或者反語的解讀。這是幾個主要參考研究和本研究編制和篩選語料的共同標準。事實上,這同時也是實驗語料的設計編排問題。反語理解加工的語料主要有“語境(不同)+目標句(相同)”(如Giora等 1998;Regel等 2011;奉先武 2011;Spotorno等 2013;Filik等 2014)和“語境(相同)+ 目標句(不同)”(如Gibbs 1986;Ivanko和Pexman 2003;Pexman等 2010)兩種設計編排。本研究采用的是第一種,這是因為相同目標句的不同解讀誘發(fā)的ERPs的差異就更加單純地被看作是不同類型的解讀造成的,而不是目標句關鍵詞本身的不同造成的。而且,這樣的實驗語料設計編排也是為了和其他研究有更高的可比性。
此外,設計實驗時還控制了實驗語料的可接受度、填充概率(cloze probability,參見 Taylor 1953)、反語性(即某句話被判斷為反語的可能性)(Pexman等 2010;Filik等 2014)等因素,在最大程度上保證實驗結果的可靠性。
本實驗關于較熟悉反語加工時間進程的基本預期如下。首先,根據(jù)Gibbs(1994)關于比喻語言理解加工的觀點,我們預期較熟悉反語這類相對典型和易理解的反語義的加工應該跟普通字面語言的理解一樣,而不是特殊的加工過程。其次,根據(jù)SPM,反語的字面義應先被通達,這會給目標句句尾關鍵詞與前面的語境信息之間的語義整合帶來困難,預期反映語義整合困難的N400成分出現(xiàn);同時,該模式假定的字面義在后期被重新分析為反語則預期作為持續(xù)分析或者解決沖突指標的類似P600的晚期正波的出現(xiàn)。DAV假定當反語被置于信息足夠豐富的語境中時,反語義被直接通達,因此預期不會出現(xiàn)任何ERP效應(N400和P600)。GSH假定突顯度高(在本研究中對應熟悉度較高)的語義先被加工,因此預期只有不熟悉的反語存在語義整合或者提取的困難以及之后的重新分析,從而誘發(fā)N400和P600效應。而本實驗語料熟悉度是“較熟悉”,字面義和反語義平行加工,因此預期可能誘發(fā)的N400和P600波幅無顯著差異??偟膩碚f,因為語料是較熟悉的反語,但又沒達到“想得美”和“你真壞”這樣非常熟悉甚至是詞匯化的程度,所以預期上本實驗中的反語加工采取SPM,以及GSH關于不熟悉反語加工的部分,而不采取DAV。
本實驗選擇不同專業(yè)的23名母語為漢語的在校大學生(含本科生和碩士研究生)被試,男11名,女12名,平均年齡23.6歲(SD=1.45)。被試經愛丁堡利手量表(Oldfield 1971)測試均為右利手。被試視力或矯正視力正常,家族中無神經或精神疾病史。被試自愿參與本實驗,且實驗前簽署知情同意書,實驗后獲得適當報酬。
本實驗采用ERP技術,通過比較被試對反語和字面目標句關鍵詞的加工,考察較熟悉漢語反語的在線認知加工機制。首先,本實驗中的語料都經過預選,在可接受度、填充概率、反語性和熟悉度上均有所控制,(3)根據(jù)反語加工ERP實驗的既定程序和規(guī)范,我們結合相關參考文獻對語料進行了必要的預先篩選,篩選的標準包括可接受度、填充概率、反語性和熟悉度。實驗語料的可接受度和熟悉度經5點量表測試,結果經t檢驗分析顯示,字面、反語目標句可接受度(3.68±0.7)和熟悉度(3.90±0.7)對比均無顯著性差異(ps>0.43);反語目標句的反語性平均得分高于4.76,字面目標句的反語性平均得分低于1.32;兩種目標句填充詞的填充概率均高于87.6%。以保證獲取的ERPs成分最大程度的有效性。最終的語料為30條反語句(對應30條字面句),形式為“語境(偏向字面和偏向反語)+目標句(相同)”。目標句的結構和字數(shù)基本一致:評論對象+副詞+關鍵詞。關鍵詞應作字面還是反語解讀取決于前面的語境(如表1所示)。(4)作為語境的語篇長度大致相當,語境內容相似。此外,為了避免標點符號可能給被試帶來的不必要干擾,語料在呈現(xiàn)時均省去了標點符號。語料逐詞或詞組分屏呈現(xiàn),而且正式實驗前還有練習實驗,避免被試在閱讀語料時出現(xiàn)斷句方面的問題。另外,為了避免被試對語料出現(xiàn)形式的猜測和預期,制作了30條填充語料(fillers)。因此,實驗語料共計90條試次(trial),被偽隨機后分成三個實驗組塊(block),每個組塊中兩類目標語料和填充語料在種類和數(shù)量上平衡。最后,為了讓被試集中注意力閱讀和理解語料,在約1/3的語料(包括填充語料)后面加一個是/非型理解問題,要求被試按鍵進行判斷。(5)問題分兩類,一類只涉及語境部分的某個細節(jié),另一類涉及對整個語篇的理解,正確答案為是/非各一半。兩類問題經過偽隨機均勻地嵌入語料中,目的是讓被試集中注意力閱讀和理解語篇,而且對語境和目標句都同樣關注。這也是數(shù)據(jù)是否被統(tǒng)計的依據(jù)(回答正確率低于80%的被試的腦電將被剔除)。被試在實驗中的按鍵反應還進行了左右手平衡。
表1 實驗語料示例
本實驗采用視覺通道呈現(xiàn)語料。實驗在暗光的屏蔽室內進行,被試雙眼水平注視顯示器中央,視距為80cm,水平視角為4°。刺激系統(tǒng)STIM2(Neurosoft,Inc. Sterling,USA)控制刺激在屏幕上的呈現(xiàn),所有語料都被隨機排序。每個試次首先呈現(xiàn)一個提示符“+”,呈現(xiàn)時間為300ms,提醒被試刺激語料即將出現(xiàn),提示符消失后500ms語料開始呈現(xiàn)。所有語料(除了理解問題句)逐詞(組)呈現(xiàn)。漢字為48號宋體、白色,顯示器背景為深灰色。語料文字每屏刺激的呈現(xiàn)時間為600ms,屏與屏時間間隔為800ms,目標句關鍵詞呈現(xiàn)3000ms后再繼續(xù)呈現(xiàn)下一屏。在約1/3的語料后還跟隨一個理解問題,以屏幕中央“####”符號300ms的呈現(xiàn)作為提示,整句呈現(xiàn)2000ms。問題句呈現(xiàn)后被試需在第一時間通過按鍵做出“是/非”判斷。如未及時按鍵,3000ms后下一條語料自動呈現(xiàn)。刺激語料呈現(xiàn)流程如圖1所示。實驗分3個組塊進行,實驗時組塊呈現(xiàn)順序亦隨機。每個組塊大約耗時8~9分鐘,組塊間讓被試短暫休息和調整2~3分鐘。被試加工的所有語料,包括填充語料,均為同一種形式呈現(xiàn)。
圖1 實驗刺激流程示意圖
使用NeuroScan 64導電極帽(10/20系統(tǒng)),通過Neuroscan Synamps 2同步記錄腦電。左側乳突(M1)記錄值為參考,離線分析時重新轉換成雙側乳突連線為參考。前額接地,使皮膚與電極間的阻抗保持在5kΩ以下。同時在雙眼外側安置電極記錄水平眼電(HEOG),在左眼上下眶安置電極記錄垂直眼電(VEOG)。腦電信號由放大器放大,對各類刺激總平均的ERP波形進行40Hz的低通濾波,采樣頻率為1000Hz,離線分析處理ERP數(shù)據(jù)。
本研究主要參考了Regel等(2011:283)的興趣區(qū)(Region of Interest,ROI)劃分。(6)Regel等(2011)的興趣區(qū)劃分不僅兼顧左右半球和中線,還區(qū)分了前部和后部腦區(qū),有利于我們對反語加工腦區(qū)分布的考察以及對實驗結果的分析討論。我們的電極帽沒有AF7和AF8這兩個點,因此就近換成了FP1和FP2,而且這樣跟P2和P6興趣區(qū)中的O1和O2兩個點在分布上更對稱。
圖2 統(tǒng)計興趣區(qū)劃分示意圖(改自Regel等 2011:283)
如圖2所示,大腦被分成了前(Anterior,A)、后(Posterior,P)部腦區(qū),再分別劃分了前、后部腦區(qū)的興趣區(qū)A1-A7和P1-P7。
我們使用Neuroscan 4.3離線處理ERP數(shù)據(jù)。使用DC矯正去除腦電采集中慢電位漂移造成的偽跡,利用回歸的方法去除眼電偽跡。每個興趣區(qū)上字面和反語解讀的關鍵詞誘發(fā)的ERPs被分別疊加,疊加的時間區(qū)段為1100ms,自刺激呈現(xiàn)前100ms至刺激呈現(xiàn)后1000ms,取刺激呈現(xiàn)前100ms作基線。在這些分析時段里,波幅大于±80μV的偽跡信號被剔除。
數(shù)據(jù)統(tǒng)計時,本實驗關注反語解讀的關鍵詞可能誘發(fā)的N400和P600成分,因此在可能出現(xiàn)N400成分的300-350ms、350-400ms和400-450ms三個時窗,以及可能出現(xiàn)P600成分的700-750ms、750-800ms和800-850ms三個時窗對字面和反語解讀的關鍵詞誘發(fā)的ERP平均幅值進行統(tǒng)計分析。統(tǒng)計采用SPSS11.5軟件進行3因素28水平,即類型(2)× 前/后部(2)× 興趣區(qū)(7)的重復測量方差分析。(7)類型因素2水平,即字面和反語解讀兩類目標句關鍵詞;前/后部腦區(qū)因素2水平;興趣區(qū)因素7水平,包括了前、后部腦區(qū)對應的7個興趣區(qū)(A1-A7和P1-P7)。在進行方差分析之前,首先計算每個興趣區(qū)內3個電極點波幅的平均值。對統(tǒng)計結果采用Greenhouse-Geisser算法對得到的p值進行校正,統(tǒng)計檢驗采用0.05的α水平,同時關注邊緣顯著差異。(8)本研究對邊緣顯著差異的認定主要參考了Regel等(2011)和Spotorno等(2013)等對數(shù)據(jù)處理結果的相關分析,認定如果0.05< p < 0.10,則存在邊緣顯著差異。
在23名被試中,有7名被試的腦電被剔除:有5名被試(4男1女)因為某段腦電嚴重污染無法讀取而被剔除,另有2名被試(男)的數(shù)據(jù)在處理步驟的“取平均值”后可接受度低于80%而被剔除。最后,有16名被試的腦電數(shù)據(jù)用于統(tǒng)計分析。下面報告這16名被試的ERP數(shù)據(jù)結果。(9)本研究關注的行為數(shù)據(jù)是被試對實驗中出現(xiàn)的所有理解問題的反應的統(tǒng)計,結果表明被試都對問題作出了按鍵反應,且正確率都在80%以上。
從總平均波形圖(圖3)(10)本研究關注的是反語加工的時間進程而非腦區(qū)分布問題,且限于篇幅,故略去了N400和P600成分的腦電地形圖。上觀察,目標句關鍵詞誘發(fā)的ERPs出現(xiàn)了在300-400ms時窗中的負波,漢語反語解讀的關鍵詞較之字面解讀誘發(fā)了更大的負成分N400?,F(xiàn)以350-400ms時窗為例作簡要報告。該時窗內,3因素28水平的重復測量統(tǒng)計分析發(fā)現(xiàn):類型主效應非常顯著,F(xiàn) (1, 15)=9.15,p=0.009,說明反語解讀誘發(fā)的成分非常顯著地大于字面解讀誘發(fā)的成分;類型和前/后部交互效應不顯著,F(xiàn) (1, 15)=0.65,p=0.434,說明前后部腦區(qū)反語和字面解讀的腦區(qū)激活無顯著差異;類型和興趣區(qū)交互效應非常顯著,F(xiàn) (6, 90)=6.93,p=0.002,說明在不同的興趣區(qū)反語和字面解讀的腦區(qū)激活存在顯著差異。類型、前/后部和興趣區(qū)交互效應不顯著,F(xiàn) (6, 90)=0.87,p=0.449。因為類型和興趣區(qū)交互效應顯著,我們重新對每一個興趣區(qū)(A1+P1,A2+P2,……,A7+P7)的類型主效應進行單因素方差分析,發(fā)現(xiàn)興趣區(qū)A5+P5類型效應邊緣顯著,F(xiàn) (1,62)=3.148,p=0.081;興趣區(qū)A6+P6和A7+P7類型效應顯著[A6+P6: F (1,62)=4.028 ,p=0.049; A7+P7: F (1,62)=4.624 ,p=0.035],說明反語加工主要在右側腦區(qū)的激活差異明顯。
從總平均波形圖(圖3)上觀察,目標句關鍵詞誘發(fā)的ERPs出現(xiàn)約始于700ms直至900ms時窗內類似P600的晚期正波,而且漢語反語解讀的關鍵詞較之字面誘發(fā)較為明顯的更大的正成分,我們將其認定為P600。以750-800ms時窗為例,該時窗內3因素28水平的重復測量統(tǒng)計分析發(fā)現(xiàn):類型主效應邊緣顯著,F(xiàn) (1, 15)=3.703,p=0.074,說明反語解讀誘發(fā)的成分較顯著地大于字面解讀誘發(fā)的成分;類型和前/后部交互效應邊緣顯著,F(xiàn) (1, 15)=4.070,p=0.062,說明反語和字面解讀的腦區(qū)激活存在前后部的較顯著的差異;類型和興趣區(qū)交互效應不顯著,F(xiàn) (6, 90)=1.085,p=0.377;類型、前/后部和興趣區(qū)交互效應不顯著,F(xiàn) (6, 90)=0.815,p=0.561。因為類型和前/后部存在邊緣顯著的交互效應,我們對這一交互效應進行事后檢驗,發(fā)現(xiàn)類型主效應在前部腦區(qū)無顯著差異,F(xiàn) (1, 15)=0.354,p=0.561;類型主效應在后部腦區(qū)差異顯著,F(xiàn) (1, 15)=8.325,p=0.011,說明反語加工在后部腦區(qū)有明顯的激活。
圖3 反語和字面關鍵詞的N400和P600的ERP波形圖
本實驗考察較熟悉的漢語反語理解加工的神經機制,通過對比分析反語和字面關鍵詞誘發(fā)的N400和P600,探究反語義的通達是否為不同于字面語言加工的特殊過程,探討反語加工的時間進程與三大加工模式或假說預期之間的關系。下面我們結合觀察和統(tǒng)計得出的N400和P600成分進行分析和討論。
就N400而言,其波幅在300-400ms時間窗內差異最為顯著,而且分布廣泛,漢語反語解讀相比于字面解讀誘發(fā)了更大的腦電負波,提示反語義的理解需要額外的認知加工。這樣的結果跟Cornejo等(2007)、奉先武(2011)和Filik等(2014)等的相關ERP研究結果一致,而跟Regel等(2011)和Spotorno等(2013)的實驗結果相反,因為這兩個研究也關注了N400成分可能的潛伏期時窗,但并沒有觀察到預期的N400效應。
對此,Spotorno等(2013)只是提到了N400可能對語用推理高度敏感,或者反映了基于語義記憶系統(tǒng),新輸入詞的詞匯信息和已經存儲在語義記憶中的信息的比較。Cornejo等(2007:423)的實驗發(fā)現(xiàn)了N400,在討論N400的誘發(fā)因素時提到N400與語境提示多少的關系,認為其實驗語料的語境描寫較少,而當語境提示信息較少時,反語誘發(fā)了N400成分,是預期被打破的典型特征。Regel等(2011)就其研究沒有發(fā)現(xiàn)N400專門進行解釋,認為反語N400效應的缺失暗示在支持性的語境下比喻義的加工不涉及語義整合困難。因此,在反語的理解過程中,語義不一致的識別對于整合字面義和前面的語境信息來說不是必要的,如果語用上可行(即通達比喻意義)便不會誘發(fā)N400。Regel等(2011:280)的實驗語料的語境信息比較豐富,因而沒有觀察到N400,這跟上述Cornejo等(2007)的解釋是一致的。后來,F(xiàn)ilik等(2014:817)在其研究的討論部分也提出,未發(fā)現(xiàn)N400的Regel等(2011)的研究值得深究,一種可能的解釋是,如果跟經典的N400有相似的腦區(qū)分布的P600在N400的時窗內已經出現(xiàn)了,那么它可能使任何N400效應都不明顯。
回到我們的實驗結果,上述可能的解釋都不適用。首先,關于語境提示信息豐富與否,我們的語料(見本文2.2節(jié))跟Regel等(2011)在編排形式和語境提示信息的豐富程度上大致相同,有著支持性的豐富的語境信息,但我們觀察到了N400效應。其次,關于Cornejo等(2007)提到的預期打破與否的說法,我們的實驗經過預測試與篩選,排除語料本身的語境提示信息不夠豐富的可能性后,預期打破與否還跟反語解讀語料的出現(xiàn)頻次有關。但是,我們的語料中偏向字面解讀和偏向反語解讀的數(shù)量是相同的,而且跟Regel等(2011)的實驗二一樣還加入了填充語料,目的就是要消除被試對反語出現(xiàn)的預期。因此,我們的實驗中反語義的加工誘發(fā)的N400就不是預期被打破造成的,而應該是反映了反語的語義整合加工。最后,關于P600可能出現(xiàn)在N400的時窗進而使N400效應不明顯的說法,我們的實驗不僅觀察到了N400效應,也觀察到了類似P600的效應(見圖3和下一小節(jié)的專門討論),二者的波形總體上是清晰可辨的,因此這種說法也不成立。
因此,如果上述導致N400缺失的可能原因和解釋成立,我們的實驗也將無法觀察到N400。那么,本實驗中觀察到的N400效應怎么解釋呢? N400作為語言加工指標的功能意義大致是反映語義、語用或世界知識出現(xiàn)異常,語義的不可預期性,語言編碼與語境之間的不一致,或者是將新出現(xiàn)的詞整合到句子語境中的加工等,而且其波幅大小反映語義記憶提取的難易程度(參見Kutas和Hillyard 1980;Niewland和Van Berkum 2006;Kutas和Federmeier 2011;Filik等 2014)。結合其功能意義,我們認為本實驗的N400波幅反映反語義的加工更費力,是漢語反語的字面形式的語言編碼跟語境不一致,或者超出被試預期,從而造成了將不合理的字面義整合到反語語境之中的語義整合困難。
本實驗觀察到具有邊緣顯著差異的P600效應,這與之前的相關ERP實驗發(fā)現(xiàn)(如Cornejo等 2007;Regel等 2011;Spotorno等 2013;Filik等 2014;奉先武 2011)基本一致,反語和字面解讀的關鍵詞誘發(fā)的腦電在P600成分潛伏期內的750-850ms時窗內存在邊緣顯著的類型主效應差異以及類型與前/后部腦區(qū)的交互效應。反語解讀誘發(fā)了更大的晚期正成分,說明其加工有更大程度的激活,提示反語義的晚期加工推理更費力。P600作為語言加工指標的功能意義大致是反映詞語出現(xiàn)語法異常,與結構的重新分析、修補相關聯(lián)的句法加工和整合過程,各類信息的晚期整合加工,比喻語言加工過程中的隱含義的語用解讀等(參見Coulson和Lovett 2010;Regel等 2011;Spotorno等 2013;Filik等 2014),結合其功能意義,我們認為這一P600效應反映了反語義的后期各類信息整合加工更費力,其中包含了語用推理過程:將不符合預期的字面義和非語言信息(語境、語用)重新整合,解決字面義和傳遞真實語用意圖的非字面義之間的沖突,最終得到符合語境的語用含意,即反語義。
需要注意的是,關于N400和P600作為語言加工指標的功能意義并非那么涇渭分明,甚至可能存在重合之處。比如,Kutas和Federmeier(2000)的研究發(fā)現(xiàn)N400是語義-語用異常引發(fā)的,無獨有偶,Ericsson等(2008)的研究發(fā)現(xiàn)P600也受語義-語用異常的影響。因此,如果N400和P600都是反映語義-語用異常的指標,那么Regel等(2011)和Spotorno等(2013)的實驗未發(fā)現(xiàn)N400的原因可能是其語料加工的語義-語用異常的整合集中反映在了P600指標上;或者如Filik等(2014)指出的,跟N400有相似腦區(qū)分布的P600出現(xiàn)在N400的時窗內,導致N400效應不明顯。這或許能解釋為什么我們梳理的所有相關研究都一致地報告了P600效應,而N400效應的報告卻存在不一致。當然,這還需要更多的實驗研究來進一步驗證。
現(xiàn)在我們就本文一開始提出的研究問題,結合本實驗的預期和結果進行分析討論。首先,漢語反語的加工是一個不同于字面語言加工的特殊過程嗎?我們對較熟悉的漢語反語的ERP研究發(fā)現(xiàn),反語義較之對應的字面義誘發(fā)的N400存在顯著差異,前者的負波幅明顯大于后者,說明反語義的加工存在語義整合的困難,需要額外的加工努力。同樣,反語義較之對應的字面義誘發(fā)的P600存在邊緣顯著差異,前者的正波幅大于后者,說明反語義的加工還需要后期語用推理等整合加工努力。這說明漢語反語的加工是一個不同于字面語言加工的特殊過程,經歷了早期的語義整合(N400效應)和后期的語用推理(P600效應)。同時,這樣的結果也就否定了“理解反語并非一定需要理解字面話語所需要的認知加工之外的特別加工”(Gibbs 1994:437)的觀點。
其次,本研究中漢語反語的加工時間進程跟三大模式或假說的預期是什么關系呢?或者說哪種模式或假說更具適用性?1)根據(jù)SPM,反語的字面義應先被加工,預期反映早期語義整合困難的N400成分的出現(xiàn);同時,該模式假定字面義在后期被重新分析為反語則預期作為語用整合推理指標的類似P600的晚期成分的出現(xiàn)。反語義的N400效應和P600效應這樣的實驗結果反映漢語反語加工體現(xiàn)出難于一般語言加工,經歷了早期語義整合和后期語用推理的特點,其加工可能采取了類似SPM的方式。2)根據(jù)DAV,當反語被置于信息足夠豐富的語境中時,反語義被直接通達而不會出現(xiàn)任何ERP效應。本實驗發(fā)現(xiàn)的N400效應和P600效應說明漢語反語加工不可能采取這樣的加工方式。3)根據(jù)GSH,突顯度高(在本研究中對應熟悉度高)的語義先被加工,因此只有不熟悉的反語存在語義整合困難以及之后的重新分析,從而誘發(fā)N400和P600效應;熟悉反語的字面義和反語義則被平行加工,二者誘發(fā)的N400或P600波幅無顯著差異。本實驗發(fā)現(xiàn)的N400和P600效應似乎說明漢語反語加工可能采取了GSH關于不熟悉反語的加工方式。這是否說明我們的實驗結果符合GSH的部分預期呢?
這個問題值得進一步探討。首先,對熟悉度的區(qū)分源自GSH的核心概念“突顯”,因為該假說正是基于不同的突顯度而做出了區(qū)別性的比喻義加工預期。其次,突顯性被定義為跟規(guī)約性、頻率、熟悉度或原型性密切相關(Giora 1997,1999),而Giora(2003)進一步提出在語用學實驗中,往往采用主觀的熟悉度評分(ratings)作為突顯的代理指標,因為這似乎是相關文獻中最為常用的考量。接下來的問題就是熟悉度的區(qū)分標準和具體考量方法。比如Filik等(2014)的研究讓被試對目標語料的熟悉度進行8點評分測量的方法(1表示語料很少或者沒有聽說被用作反語,8表示非常熟悉的反語),最終入選的“熟悉反語”平均得分6.50,“不熟悉反語”平均得分2.69(Filik等 2014:815),而且實驗結果跟GSH的預期最為一致。我們的實驗雖然沒有進行不同熟悉度反語加工的比較,不能全面地驗證GSH,但較之沒有控制語料熟悉度的Cornejo等(2007)、Regel等(2011)和Spotorno等(2013)的研究,我們的研究跟Filik等(2014)有可比之處:本實驗語料經過篩選,熟悉度控制在“較熟悉”(在5點測量中均值約為3.90),較之我們在開篇提到的“想得美”和“你真壞”這種“非常熟悉的反語”,大致相當于Filik等(2014)實驗中的“熟悉反語”(在8點評分測量中均值約為6.52)。我們的實驗發(fā)現(xiàn)了“較熟悉反語”加工的N400和P600效應,跟Filik等(2014)關于“不熟悉反語”實驗的結果類似,因此也符合GSH關于突顯度較低的反語加工的預期。同時我們發(fā)現(xiàn),需要進行更多不同熟悉度的反語加工實驗來進一步全面驗證GSH的預期以及突顯度的細分:比如三種甚至更多的熟悉度(非常熟悉、較熟悉、較不熟悉、不熟悉)的語料的實驗結果會怎樣,跟GSH的兩種預期會是什么關系,區(qū)分幾種熟悉度才能兼顧GSH理論的經濟性和有效性,在實操中如何把控熟悉度,等等。這些問題為我們今后的研究提供了方向。
本實驗使用ERP技術考察了較熟悉的漢語反語和對應字面控制語料的認知加工過程。根據(jù)我們對實驗結果的分析和討論,結論如下:
1)反語義較之字面義誘發(fā)了更大的N400和P600波幅,提示反語義的加工過程經歷了不符預期(或語境)的語義整合以及后期語用整合推理,其理解是不同于字面語言、需要額外的加工努力的特殊過程;這樣的結果否定了Gibbs(1994)關于字面義和比喻義的加工不存在原則上的區(qū)分的觀點。
2)本實驗結果反映漢語反語加工體現(xiàn)出區(qū)別于字面語言加工、需要語義整合和語用推理過程的特點,說明其加工最可能采取了標準語用模式,而非直接通達觀的加工模式。
最后,本研究的改進之處和下一步研究方向可考慮:
1)實驗技術手段的加強和多樣化,比如實驗語料的圖片加文字呈現(xiàn)方式(Wakusawa等 2007),采用跟ERP技術互補的高空間分辨率的fMRI(功能性磁共振成像)技術,以及TFA(時頻分析)技術(Spotorno等 2013)等。
2)關于分級突顯理論和熟悉度問題,在理論上需要進一步探究突顯的定義及突顯度跟熟悉度的關系,在實踐中需要使突顯度和熟悉度的考量和區(qū)分方法更客觀和可操作,比如參考使用詞頻詞典(劉源等 1990)。
3)對其他類別反語的考察,比如考察并比較分析褒詞貶用和貶詞褒用反語,以及依賴語義知識理解和依賴世界知識理解的反語等。