劉洪超,F(xiàn)rancesca Striklievers,黃居仁
(香港理工大學(xué)中文及雙語(yǔ)學(xué)系,香港)
通感(Synaesthesia),又稱連覺,是一種生理現(xiàn)象,主要是指“一種非自覺的跨感覺領(lǐng)域的聯(lián)系體驗(yàn)”[1]。同時(shí),在語(yǔ)言學(xué)上,它又是一種特殊的隱喻,是指用一種感覺詞去描述另外一種感覺,如“噪音污濁的空氣”(本文所使用的語(yǔ)料庫(kù)為臺(tái)灣中央研究院現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù),以下簡(jiǎn)稱sinica,因此所抽取的句子為繁體中文,為了保持句子的真實(shí)可靠,未進(jìn)行繁簡(jiǎn)轉(zhuǎn)換),“噪音”是屬于聽覺的感覺詞,但是“污濁”一般只用來(lái)形容視覺現(xiàn)象,該句用視覺詞“污濁”來(lái)描述聽覺“噪音”就是一種通感,從隱喻上來(lái)說(shuō),這里的視覺是源域(Source Domain),聽覺是目標(biāo)域(Target Domain)。之所以稱之為特殊的隱喻,是因?yàn)槠湓从蚝湍繕?biāo)域都屬于同一個(gè)范疇,因此也有人稱之為準(zhǔn)隱喻[2]。本文主要關(guān)注的是語(yǔ)言中的通感句子,而不是認(rèn)知上的通感疾病或通感體驗(yàn)。
國(guó)外對(duì)通感的研究一直是一個(gè)比較熱門的話題,通感所體現(xiàn)出來(lái)的映射方向性被當(dāng)做一個(gè)通用的假設(shè)而在各個(gè)語(yǔ)言中進(jìn)行檢驗(yàn),研究領(lǐng)域跨越了神經(jīng)科學(xué)、認(rèn)知科學(xué)和語(yǔ)言學(xué)等學(xué)科;研究方法也包括了神經(jīng)科學(xué)實(shí)驗(yàn)、認(rèn)知實(shí)驗(yàn)和語(yǔ)言學(xué)觀察及統(tǒng)計(jì)等,如文獻(xiàn)[1,3,4]。但是,國(guó)內(nèi)對(duì)于通感的研究大部分仍然僅限于文學(xué)賞析上。
另一方面,對(duì)于漢語(yǔ)通感的研究不論是國(guó)內(nèi)還是國(guó)際都比較缺乏,只有文獻(xiàn)[5,6]等有限的幾篇。漢語(yǔ)通感映射方向性研究的一個(gè)前提就是要有大量的實(shí)際數(shù)據(jù)作為統(tǒng)計(jì)上的支撐,但是文獻(xiàn)[5,6]等文章中分析的漢語(yǔ)例子都非常有限。由于通感句子在語(yǔ)料庫(kù)中的分布比較稀疏,因此采用人工尋找的方法不可取。最好是采用自動(dòng)抽取的方法。關(guān)于通感自動(dòng)抽取,本文只找到了文獻(xiàn)[7],而關(guān)于漢語(yǔ)通感自動(dòng)抽取的研究,目前還未發(fā)現(xiàn)。因而,本文力圖基于文獻(xiàn)[7]的方法實(shí)現(xiàn)語(yǔ)料庫(kù)中漢語(yǔ)通感句子的自動(dòng)抽取。同時(shí)分別構(gòu)建觸覺(Touch)、味覺(Taste)、嗅覺(Smell)、聽覺(Hearing)和視覺(Vision)的詞庫(kù),幫助進(jìn)行通感句子的抽取和語(yǔ)言學(xué)研究。
本文第1節(jié)是引言,介紹本文的研究背景和意義;第2節(jié)是相關(guān)研究的簡(jiǎn)介,對(duì)相關(guān)文獻(xiàn)進(jìn)行簡(jiǎn)單的綜述;第3~4節(jié)介紹本文的研究方法和結(jié)果,其中第3節(jié)介紹感覺詞的選擇標(biāo)準(zhǔn)和感覺詞表的呈現(xiàn),第4節(jié)介紹抽取方法和抽取結(jié)果,對(duì)抽取句子進(jìn)行統(tǒng)計(jì),尋找映射規(guī)律;最后對(duì)全文進(jìn)行總結(jié),指出本文的思路、不足和未來(lái)的研究工作重點(diǎn)。
由于通感是將一個(gè)感覺域的詞映射到另外一個(gè)感覺域,因而就涉及到對(duì)感覺域的定義。根據(jù)是否將“情感(Emotion)”考慮為一個(gè)感覺域,基本上可以分為兩派。
大部分的研究,包括文獻(xiàn)[2],未將“情感”考慮為一個(gè)感覺域,只考慮同時(shí)分別構(gòu)建觸覺(Touch)、味覺(Taste)、嗅覺(Smell)、聽覺(Hearing)和視覺(Vision)這五種感覺,認(rèn)為“這是通用的英美文化標(biāo)準(zhǔn)”[8]。有的研究,進(jìn)一步將這五類進(jìn)行了細(xì)化,如文獻(xiàn)[4]把視覺細(xì)化為“顏色(Color)”和“維度(Dimension)”。
另外一派,包括文獻(xiàn)[6],將“情感”考慮進(jìn)了研究對(duì)象。
本文在構(gòu)建感覺詞表時(shí)并未設(shè)立“情感”類,主要是由于對(duì)于“情感”的定義比較抽象,難以劃定一個(gè)非常明確的標(biāo)準(zhǔn)。但是,在抽取的例子中,本文發(fā)現(xiàn)了大量的其他五類感覺詞和情感域之間的映射例子,如:
還是這個(gè)心情[target]感受是讓我很低沉[source]的……
“低沉”中“低”屬于視覺,“沉”屬于觸覺,而“心情”則是典型的情感,因此這里是用視覺和觸覺來(lái)描述心情。這樣的例子很多,情感這個(gè)抽象類在借助相比之下較為具體的其他五類感覺詞來(lái)表達(dá)具有很強(qiáng)的傾向性,因此本文也將之列入考察范圍。
文獻(xiàn)[2]通過(guò)對(duì)英語(yǔ)、法語(yǔ)和匈牙利語(yǔ)通感句子的考察發(fā)現(xiàn),這些句子的通感映射通常遵循下面的幾條規(guī)律:
(1)感覺詞從源域到目標(biāo)域的映射一般都按照下面的方向進(jìn)行:
觸覺→味覺→嗅覺→聽覺→視覺
(2)處于映射等級(jí)最低端的觸覺詞被用來(lái)表示其他感覺的頻次最高;
(3)處于映射等級(jí)第二高位的聽覺是借助其他感覺詞來(lái)表達(dá)的最高頻次的感覺域。
后來(lái)的研究,如文獻(xiàn)[3,7]等又相繼考察了希伯來(lái)語(yǔ)、漢語(yǔ)等語(yǔ)言中的情況,用不同的方法力圖證明在這些語(yǔ)言中也存在同樣的規(guī)律。
對(duì)該規(guī)律做了更好證明的是文獻(xiàn)[4],通過(guò)考察英語(yǔ)中65 個(gè)感覺形容詞的185 例詞義演變情況,發(fā)現(xiàn)83%以上的詞都按照上面的規(guī)律進(jìn)行映射,而其他例外也都做了合理的解釋。其繪制的感覺域之間的映射次序如圖1所示。
Figure 1 Mapping drectionality of sense-related words in reference[4]圖1 文獻(xiàn)[4]感覺詞映射路線
由于沒有大量的數(shù)據(jù)進(jìn)行支撐,因此得出的結(jié)論都不是很可靠。如文獻(xiàn)[7],其對(duì)漢語(yǔ)的考察只通過(guò)15個(gè)句子就得出漢語(yǔ)通感也是按照?qǐng)D1的路線進(jìn)行映射轉(zhuǎn)換就不是很有說(shuō)服力。
本文構(gòu)建了總量為1 759個(gè)的感覺詞的詞表,抽取了1 452個(gè)句子,去除重復(fù)后為940個(gè)例句,力圖找出漢語(yǔ)映射的規(guī)律。
本文關(guān)于通感的抽取主要就是基于感覺詞,因此本文的中心就是要為觸覺、味覺等五個(gè)感覺域創(chuàng)建盡量完整的詞表或詞典。在確定收詞標(biāo)準(zhǔn)時(shí),本文兼顧了語(yǔ)言學(xué)定義和語(yǔ)言工程應(yīng)用兩方面。而本文在收詞時(shí)主要借助了《現(xiàn)代漢語(yǔ)語(yǔ)義信息詞典》和從sinica語(yǔ)料庫(kù)抽取的詞表,兩者合計(jì)共約20余萬(wàn)詞條,通過(guò)半自動(dòng)的方式,按照我們制定的收詞標(biāo)準(zhǔn)從中收集了1 700余個(gè)感覺詞,分別歸入了五個(gè)感覺詞表。
首先是需要對(duì)感覺域進(jìn)行定義,本文參照了文獻(xiàn)[8]對(duì)幾個(gè)感覺域的定義標(biāo)準(zhǔn),即:
(1)觸覺|聽覺:通過(guò)物理性途徑刺激形成的感覺,一般說(shuō)來(lái),觸覺的生成都是對(duì)皮膚感受器的物理刺激引起的,如“冰涼”是對(duì)皮膚溫度感受的刺激;而聽覺一般是聲波對(duì)耳膜的震動(dòng)形成的,這也是一種物理刺激。
(2)味覺|嗅覺:通過(guò)化學(xué)途徑刺激形成的感覺,一般說(shuō)來(lái),味覺和嗅覺都是鼻腔粘膜或口腔粘膜的感覺細(xì)胞對(duì)相應(yīng)的化學(xué)分子的刺激反應(yīng)所產(chǎn)生的感覺。
(3)視覺:通過(guò)光線刺激形成的感覺。一般說(shuō)來(lái),視覺的形成都是光線從物體反射進(jìn)入眼睛后刺激視神經(jīng)所產(chǎn)生的感覺。
按照以上的標(biāo)準(zhǔn),本文利用《現(xiàn)代漢語(yǔ)語(yǔ)義信息詞典》中的語(yǔ)義類信息對(duì)詞典中的詞進(jìn)行了篩選,初步將相關(guān)的感覺詞篩選出來(lái),本文按照表1中的映射關(guān)系進(jìn)行篩選。
Table 1 Mapping between sense domain and the SKCC’s semantic domain表1 感覺域與抽取的《現(xiàn)代漢語(yǔ)語(yǔ)義信息詞典》語(yǔ)義類的對(duì)應(yīng)關(guān)系
然后根據(jù)表1所抽出的候選感覺詞制作關(guān)鍵詞(及語(yǔ)素)表,通過(guò)關(guān)鍵詞和關(guān)鍵語(yǔ)素在sinica語(yǔ)料庫(kù)中抽取出的詞表中進(jìn)行查找,最終兩者取合集,去除重復(fù)詞項(xiàng)之后進(jìn)行人工校對(duì)。
由于《現(xiàn)代漢語(yǔ)語(yǔ)義信息詞典》與感覺域不是一一對(duì)應(yīng)的關(guān)系,因此,也需要對(duì)各個(gè)領(lǐng)域的候選感覺詞通過(guò)手工方法一一歸類。
在針對(duì)具體的詞進(jìn)行人工校對(duì)時(shí),我們也采取了以下的語(yǔ)言學(xué)標(biāo)準(zhǔn):
(1)按照詞義進(jìn)行類別劃分,如“滾燙”,其中“滾”是屬于視覺的語(yǔ)素,“燙”是屬于觸覺的語(yǔ)素,但是整個(gè)詞義是表示“非常熱”,跟視覺并沒有關(guān)系。由于該詞本身是通感詞,即在構(gòu)詞層面上看,其詞義形成過(guò)程中有通感參與,這種通感詞進(jìn)行了特別標(biāo)注,抽取時(shí)含有該詞的句子應(yīng)該直接抽出,因?yàn)楹型ǜ性~的句子都是通感句。
(2)單純?cè)~的詞義主要參照本義,本義無(wú)法確定時(shí)參照常用義,如“聞”,本義屬于聽覺,在現(xiàn)代漢語(yǔ)中發(fā)展出嗅覺的意義,但是本文將之歸入聽覺。
(3)復(fù)合詞詞義也主要是參照本義,如果詞義跨多個(gè)感覺域,如“平滑”,表示“既平又滑”,前者屬于視覺,后者屬于觸覺,則主要參照其搭配對(duì)象,一般“平滑”是用于修飾視覺現(xiàn)象,因此,將之歸入視覺。
其中數(shù)量最多、最難處理的就是第(3)種情況,但是由于本文采取的方法主要是根據(jù)句子中是否同時(shí)含有多個(gè)不同感覺域的感覺詞,所以事實(shí)上無(wú)論將“平滑”這樣的詞放入哪一類,最終都不會(huì)影響抽取的句子總數(shù),只是抽取的具體例句屬于哪一類映射上會(huì)存在差錯(cuò)。
總體原則就是除了本身就是通感詞,如“粗話”“冷笑”“滾燙”等,需要打上標(biāo)記(事實(shí)上就是兼類標(biāo)記)之外,其它所有的詞都要保持排他性,不處理為兼類,否則就會(huì)大大影響句子抽取的準(zhǔn)確率。表2是對(duì)建立的感覺詞庫(kù)的示例(由于采用的語(yǔ)料庫(kù)為繁體中文,因此本文構(gòu)建的詞庫(kù)也都是繁體中文版)。
Table 2 A sample of sense-related word database表2 感覺詞庫(kù)示例
表3是本文對(duì)感覺詞庫(kù)中各感覺域感覺詞分布的統(tǒng)計(jì)結(jié)果。
Table 3 Distribution of sense-related words表3 感覺詞分布情況
從表3可以看出,視覺詞占了絕大多數(shù),聽覺詞次之,最少的是嗅覺詞。本文在收集的過(guò)程中發(fā)現(xiàn)與嗅覺相關(guān)的大部分都是形容詞,名詞和動(dòng)詞都比較少,而且收集難度比較高。嗅覺和味覺有很多詞都是詞義共通的,即可以同時(shí)用于兩個(gè)領(lǐng)域,只是本文按照本義劃定了歸屬,比如“味道”既可以用于嗅覺,又可以用于味覺,但是其本義是味覺。而且,《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典》中的形容詞語(yǔ)義類對(duì)嗅覺和味覺根本就沒有做區(qū)分,兩者合在“味道”這個(gè)語(yǔ)義類下,可見兩者關(guān)系比較緊密。
在構(gòu)建了感覺詞庫(kù)的基礎(chǔ)上進(jìn)行通感句子的抽取,本文采用了兩種方法,兩種方法的基本思路都是基于一個(gè)通感句子至少應(yīng)當(dāng)含有兩個(gè)以上感覺域的感覺詞這個(gè)基本原則進(jìn)行的。
第一種方法的基本步驟如下:
(1)首先對(duì)語(yǔ)料庫(kù)中所有句子進(jìn)行一遍掃描,將至少含有一種感覺域的感覺詞的句子抽?。?/p>
(2)然后對(duì)這個(gè)句子列表進(jìn)行第二次掃描,如果含有另外一種或多種感覺域的感覺詞就將整個(gè)句子作為候選句子輸出。
表4是第一種方法的抽取結(jié)果。
Table 4 Result of method 1表4 第一種方法實(shí)驗(yàn)結(jié)果
這種方法的準(zhǔn)確率比較低,本文對(duì)抽出的句子進(jìn)行分析,發(fā)現(xiàn)以下一些原因?qū)е聹?zhǔn)確率比較低:
(1)未檢查詞性問題。有的詞有不同的詞性,不同詞性的詞有不同的分布規(guī)律,但是單純的關(guān)鍵詞匹配不會(huì)考慮這一點(diǎn),如:
例1 北風(fēng)正凜冽。
“正”在詞表中屬于視覺,但是詞表中的“正”是分布在謂語(yǔ)位置上的形容詞,表示“純、不雜”,如“模樣很正”等。而例1中的“正”是處于狀語(yǔ)位置上的副詞“正”,表示正在進(jìn)行。對(duì)于這一類問題的解決辦法就是考察每一個(gè)詞的詞性分布情況,在抽取時(shí)進(jìn)行檢查,如果符合其分布規(guī)律就將句子抽出,如果不符合就淘汰。
(2)聯(lián)合結(jié)構(gòu)問題。有的句子中確實(shí)含有兩種以上的感覺域的感覺詞,但是分別處在聯(lián)合結(jié)構(gòu)的前項(xiàng)和后項(xiàng)上,兩者之間不形成通感,只是單純的并列,如:
例2 這種又甜又冷的冰淇淋作風(fēng)全行不通
“甜”和“冷”分別屬于味覺和觸覺,但是兩者并列,并沒有形成通感映射關(guān)系。對(duì)于這一類問題的解決方法是加入聯(lián)合結(jié)構(gòu)標(biāo)志詞,如“又…又…”“和”“并且”等詞的檢查,但是這樣一來(lái)又可能去掉一些通感的句子,如:
例3 周治平依然以清亮[source]而感性的[source]溫柔[source]歌聲[target]……。
“清亮”和“感性”是并列關(guān)系,但是兩者都與“歌聲”構(gòu)成了通感關(guān)系。
同時(shí),很多沒有明顯的標(biāo)志詞的并列結(jié)構(gòu)無(wú)法用這種方式排除,如:
例4 炒出來(lái)的青菜會(huì)軟爛而不好吃。
這里的“軟爛”是并列結(jié)構(gòu),兩者之間并不形成通感,應(yīng)該被排除,但是僅僅加顯性并列結(jié)構(gòu)標(biāo)志詞判斷并不能解決這個(gè)問題,本文未來(lái)將要引入其他句法分析或語(yǔ)義特征的方法將之排除。
在對(duì)抽出例子分析的基礎(chǔ)上,本文著重解決了第一個(gè)問題,逐個(gè)考察了每個(gè)感覺詞的詞類分布情況,將明顯不可能出現(xiàn)在通感句子中的詞性從感覺詞庫(kù)中剔除。表5是觸覺類感覺詞的詞性分布情況。
Table 5 Touch-related words’distribution in different POS categories表5 觸覺類感覺詞詞性分布情況
限于篇幅問題,本文不再列出其他感覺域的詞性分布情況,可以看出,大部分的觸覺詞是VH(狀態(tài)不及物動(dòng)詞)(每個(gè)符號(hào)具體的意義可以訪問sinica語(yǔ)料庫(kù),網(wǎng)址:http://app.sinica.edu.tw/cgi-bin/kiwi/mkiwi/kiwi.sh),加入了詞性檢查之后,本文將兩次結(jié)果一并展示如表6所示。
Table 6 Results comparison of method 1and method 2表6 兩種方法實(shí)驗(yàn)結(jié)果對(duì)比
由于本文無(wú)法得知sinica語(yǔ)料庫(kù)中通感句子總數(shù)的多少,因而無(wú)法直接計(jì)算召回率等值,但是從表6中的具體抽取結(jié)果對(duì)比可以看出,方法二的效果獲得了明顯的提升:抽取的句子數(shù)在Type值上幾乎是原來(lái)的兩倍,準(zhǔn)確率是方法一的兩倍多。即便是TTR(Type/Token)值也獲得了提升(0.53 vs 0.65),說(shuō)明提取出的句子的類型豐富度,方法二也大大地高于方法一。
在抽取的大規(guī)模通感例句的基礎(chǔ)上,本文可以對(duì)第二部分提出的映射等級(jí)進(jìn)行檢驗(yàn),檢查漢語(yǔ)通感句子是否也遵循了文獻(xiàn)[2]提出的映射規(guī)律,表7是本文對(duì)940個(gè)通感句子的映射情況的統(tǒng)計(jì)。
Table 7 Mappings distribution between different sense domains表7 各感覺域映射分布
需要注意的是,很多句子含有多種通感,因而在計(jì)算的時(shí)候這些句子都是要分別計(jì)算的,如:
例 5 似 有 似 無(wú) 的 (幽[vision/source]香[smell/target])[smell/target](飄曳如絲)[vision/source]。
例6 兩 種 (口 味)[taste/source](間 雜 交錯(cuò))[vision/source]、(甜[taste/target]香[smell/source])[taste/target]有味。
在例5中,“幽香”在詞匯層面形成通感,通感的方向是用屬于視覺的“幽”修飾“香”這種嗅覺,源域是視覺,目標(biāo)域是嗅覺;同時(shí)整個(gè)“幽香”屬于嗅覺,再用屬于視覺的“飄曳如絲”描述“幽香”,這又構(gòu)成了另外一種通感,源域是視覺,目標(biāo)域是嗅覺。例6情況也類似。
因此,最終的通感總數(shù)與抽取的句子總數(shù)并不是一一對(duì)應(yīng)的。
從表7可以觀察到以下幾個(gè)映射的傾向性:
(1)映射幾乎可以在任意兩個(gè)感覺域之間進(jìn)行,即通感幾乎可以在任意兩個(gè)感覺域之間產(chǎn)生。
(2)聽覺域感覺詞只能向嗅覺和情感感覺詞進(jìn)行映射。
(3)聽覺域接受的通感映射最多,視覺域提供的通感映射最多。換句話說(shuō),用其他感覺詞來(lái)表示聽覺的頻次最高;視覺詞表示其他感覺的頻次最高。
這個(gè)結(jié)論除了第二點(diǎn)與文獻(xiàn)[2]得出的結(jié)論3有相似之處外,其他都不相同。
從語(yǔ)言學(xué)上說(shuō),本文要研究的問題是漢語(yǔ)通感句子是否存在一定的映射方向性?映射規(guī)律是什么?對(duì)于這個(gè)問題,目前的漢語(yǔ)研究很少,即便有,結(jié)論也是建立在少量的例句之上,因此要回答這個(gè)問題就要獲得大量的通感句子,手工辦法不可取,本文采取自動(dòng)抽取的方法。
為了解決句子的抽取問題,本文采用了兩種方法,兩種方法都是基于感覺詞匹配,因此本文首先構(gòu)建了感覺詞庫(kù),這個(gè)工作產(chǎn)生兩個(gè)結(jié)果:一方面明確了六種感覺(包括“情感”)的定義,另一方面構(gòu)建了一個(gè)較為全面的感覺詞庫(kù),方便語(yǔ)言學(xué)研究。
從抽取實(shí)驗(yàn)結(jié)果來(lái)看,引入了詞性檢查的抽取效果明顯好于沒有詞性檢查的效果,但是準(zhǔn)確率仍然不高,還可以通過(guò)引入句法語(yǔ)義分析的方式進(jìn)一步提高,這是本文下一步要進(jìn)行的工作。
通過(guò)對(duì)抽取的大量句子的統(tǒng)計(jì)結(jié)果來(lái)看,漢語(yǔ)通感的映射方向性并不是很明顯,但是映射也存在一定的規(guī)律,在這里不再重復(fù),下一步本研究要進(jìn)行的工作是解釋這些規(guī)律和找到這些規(guī)律形成的原因。
[1] Cytowic R E.Synesthesia:A union of the senses[M].New York:Springer Verlag,2002.
[2] Ullmann S.The principles of semantics[M].Oxford:Basil Blcakwell,1957.
[3] Shen Y,Eisenamn R.“Heard melodies are sweet,but those unheard are sweeter”:Synaesthesia and cognition[J].Language and Literature,2008,17(2):101-121.
[4] William J.Synaesthetic adjectives:A possible law of semantic change[J].Language,1976,52(2):461-478.
[5] Sean D.Synaesthesia and synaesthetic metaphors[J].PSYCHE,1996,32(2):1-16.
[6] Yen-Han Lin,Shelley Ching-Yu Hsieh.Synaesthetic metaphors of television food commercial ads in mandarin Chinese[J].TMUE Journal of Language and Literature,2011(1.6):1-16.
[7] Strik Lievers F.Synaesthesia:A corpus-based study of crossmodal directionality[J].Functions of Language,2015,22(27):69-95.
[8] Yu Ning.Synaesthetic metaphor:A cognitive perspective[J].Journal of Literary Semantics,2003,32(1):19-34.