[摘 要] 本文以全句為窗口,參照《同義詞詞林》對現(xiàn)代漢語和中介語語料庫中動詞“喜歡”的共現(xiàn)詞的語義范疇進行了對比分析,并抽樣考察了漢語二語學(xué)習(xí)者語義范疇構(gòu)建的發(fā)展過程。結(jié)果顯示:(1)和目的語者相比,二語者構(gòu)建語義范疇表現(xiàn)為語義類的窄化和選用詞語的集中化;(2)語義范疇的構(gòu)建隨漢語水平的提升而呈現(xiàn)鮮明的發(fā)展特點,具體表現(xiàn)為:語義范疇的多樣性、豐富度、匹配度和符號化都隨著漢語水平的提升而提高,但發(fā)展到某個階段會出現(xiàn)“化石化現(xiàn)象”;不同水平側(cè)重于不同位語義范疇的構(gòu)建,初中級以高位語義范疇的構(gòu)建為主,中高級則主要表現(xiàn)為具體詞類的擴展;(3)二語者構(gòu)建語義范疇的豐富度和匹配度并非正相關(guān),在語義概念一致性相對較高的中類范疇上,匹配度和豐富度表現(xiàn)一致,在差異較大的低位范疇詞群上,匹配度明顯低于豐富度,即語義符號化是二語者習(xí)得漢語地道性的主要影響因素,也是詞匯習(xí)得的難點。
[中圖分類號] H195.3 " [文獻標識碼] A " [文章編號] 1674-8174(2025)01-0080-12
1. 引言
語義范疇包括兩類,一類是從詞類次范疇小類歸納出來的具有范疇性的語義特征;一類是從詞語組合關(guān)系中概括出的范疇化的語義關(guān)系,其語義基礎(chǔ)是縱向聚合的語義特征(邵敬敏、趙春利,2006)。也就是說同目標詞組合的語義相關(guān)詞縱向聚合形成的語義范疇,構(gòu)成了該目標詞的使用環(huán)境,其語義能從共現(xiàn)的語義相關(guān)詞得到凸顯(楊惠中,2002;Durrant,2008;徐婷婷,2020)。
二語者在習(xí)得目的語過程中會出現(xiàn)語義偏差,即使用不正確的語義范疇來解釋詞語或進行表達。例如:以下來自漢語中介語語料庫系統(tǒng)(儲誠志、陳小荷,1993)中高水平二語者的產(chǎn)出語料(劃線詞為原語料用詞,括號內(nèi)為該位置上的正確用詞)。
(1)我們在廣州沒有過(待)很長時間,馬上(就)去了香港。
(2)一五一七年葡萄牙第一次軍隊來澳門一五五七年中國皇帝贊同(同意)葡萄牙人能在澳門和廣州做外貿(mào)……
以上語料中,傳統(tǒng)的詞匯偏誤類型“遺漏、誤加、誤代、錯序”(魯健驥,1987)不足以解釋二語產(chǎn)出不地道性的問題。對照《同義詞詞林》進行語義編碼分類可以驗證,例(1)“過”(度過)和“待”(停留)屬于不同的語義范疇,而“馬上-就”和例(2)“贊同-同意”為相同語義范疇下不同的符號表示。所謂詞匯使用不地道性的原因?qū)嵸|(zhì)上就是語義范疇選擇和特定范疇與符號不匹配的問題??梢?,在二語學(xué)習(xí)中,僅掌握詞匯的意義是不夠的。邢紅兵(2009、2012)認為學(xué)習(xí)者習(xí)得第二語言詞匯的關(guān)鍵在于以目標詞在目標語言中的運用為核心的動態(tài)詞匯知識體系的構(gòu)建,即學(xué)習(xí)者需要理解詞匯在不同語境中的用法,用詞的過程同時也是語義范疇的構(gòu)建與調(diào)整的過程。不同于母語者從用法到意義的獲取方式,二語知識的獲取是從意義到用法的過程,即其在已獲取母語詞匯語義范疇的基礎(chǔ)上選擇合適的目的語符號進行表達(邢紅兵,2020)。
目前我們對二語者語義范疇構(gòu)建的探討還比較有限。相關(guān)研究主要集中在詞匯知識的變化(張江麗,2018)、詞匯豐富性研究(孫曉明,2009;吳繼峰,2016)、心理詞匯的發(fā)展(張淑靜,2005;王志軍、郝瑜鑫,2014)、搭配知識的習(xí)得(侯曉明等,2022)、詞匯句法框架知識的獲?。ㄚw奕,2013;石高峰、楊彩影,2021)等方面。其中心理詞匯研究涉及到語義范疇,但主要為第一類語義范疇,即具有相同語義特征的詞語的縱向聚類,未充分考慮詞語間組合關(guān)系;搭配知識的習(xí)得研究考慮到了詞語的組合關(guān)系,但其考察窗口有限,無法獲取目標詞的使用環(huán)境。曲學(xué)智(2012)以動詞“看”為例,提取了全句共現(xiàn)詞并進行語義聚類,獲取了“看”的使用環(huán)境,并對比了中介語各水平與現(xiàn)代漢語的語義分布差異,可惜曲文集中于范疇層面的靜態(tài)對比未深入至特定符號層面,而二語詞匯動態(tài)知識習(xí)得的關(guān)鍵就在于能否實現(xiàn)由范疇到符號的正確轉(zhuǎn)化。
基于此,本文將借鑒前人的研究成果,以全句為窗口,動詞“喜歡”為目標詞,擬從語料庫中抽取其語義相關(guān)共現(xiàn)詞,構(gòu)建該動詞的共現(xiàn)語義范疇庫,并與目的語進行對比,考察二語學(xué)習(xí)者在動詞使用過程中語義范疇的構(gòu)建過程及范疇到符號的轉(zhuǎn)化情況,探究影響二語者習(xí)得漢語詞匯地道性的深層原因及其在語義方面的具體表現(xiàn)。
2. 語義范疇庫的構(gòu)建
2.1 構(gòu)建方法
共現(xiàn)詞語義范疇庫的構(gòu)建方法分為語義相關(guān)共現(xiàn)詞的提取及語義類標注兩部分。搭配關(guān)系是共現(xiàn)關(guān)系的充分不必要條件,因此適用于搭配的抽取方法同樣適用于語義相關(guān)共現(xiàn)詞的抽取。詞語搭配的自動獲取方法可分為統(tǒng)計的方法、規(guī)則的方法以及規(guī)則與統(tǒng)計相結(jié)合的方法三類。其中統(tǒng)計方法主要包括:詞頻統(tǒng)計、平均值和方差、互信息、三次互信息及假設(shè)檢驗等(全昌勤等,2005)。本文綜合分析各統(tǒng)計方法,取長補短,使用互信息、t檢驗、卡方檢驗(王大亮等,2008)以及相對詞序比(RRWR)(曲維光等,2004)來確定和目標詞語義相關(guān)的共現(xiàn)詞,具體的淘汰指標及流程如圖1所示。
共現(xiàn)詞語義類標注選用《同義詞詞林》。該書是一部由概念到詞匯的漢語義類詞典,最早由梅家駒等人于1983年編纂,對漢語同義詞和同類詞進行劃分和歸類,經(jīng)哈爾濱工業(yè)大學(xué)信息檢索研究室的擴展后,現(xiàn)有詞7萬余條,這些詞被分為12個大類,94個中類,1428個小類,小類下進一步劃分為詞群和原子詞群兩級。大類依據(jù)詞的邏輯意義劃分,以語義為主,兼顧詞類,大類下依據(jù)詞匯意義并參照題材進一步劃分中類,中類下以語義關(guān)系密切的標題詞命名為小類,小類下以基本義細分為同義詞群,再根據(jù)詞群內(nèi)部詞義顯示程度和搭配范圍劃分為原子詞群,每一個詞使用一條8位編碼來表示其語義類別??傮w來說《同義詞詞林》根據(jù)語義形成“范疇-概念-符號”的五層樹狀結(jié)構(gòu)(見圖2)。
語義范疇由高位到低位分別是大類、中類、小類、詞群和原子詞群。以“牡丹Bh02A02=”為例,其編碼結(jié)構(gòu)見表1。
本文對語料庫中含有“喜歡”的全句進行了窮盡式提取,基于統(tǒng)計學(xué)模型和《同義詞詞林》進行了語義相關(guān)共現(xiàn)詞的提取和語義范疇標注,構(gòu)建了以全句為窗口的共現(xiàn)詞語義范疇庫,并利用MySQL儲存以便于后續(xù)的統(tǒng)計與計算。語義范疇庫的構(gòu)建基礎(chǔ)、創(chuàng)新點、效果評價及具體操作流程另文詳述。
2.2 構(gòu)建統(tǒng)計
現(xiàn)代漢語語料選用“國家語委現(xiàn)代漢語通用平衡語料庫”(簡稱“語委語料庫”②),在線檢索語料約2000萬字,17萬詞種數(shù),1300萬詞頻數(shù),語料選材類別廣泛,收錄了人文與社會科學(xué)、自然科學(xué)及綜合三大類約40個小類的語料。我們提取含“喜歡“的語料1497條,共現(xiàn)詞種數(shù)(type)7905個,共現(xiàn)總頻次(token)53819次,經(jīng)過統(tǒng)計計算和語義匹配,最終確定心理動詞“喜歡”共有3760個語義相關(guān)共現(xiàn)詞,3998個語義代碼,分屬于12個大類,94個中類,955個小類,1544個詞群,2445個原子詞群。
中介語語料來自“漢語中介語語料庫系統(tǒng)”。該語料庫選取從學(xué)習(xí)漢語零起點開始不同社會屬性、母語背景、學(xué)習(xí)環(huán)境和個人特征的學(xué)生在學(xué)習(xí)和習(xí)得漢語過程中各個階段的書面語料,其中二語者的漢語水平以學(xué)習(xí)漢語時長進行劃分。語料庫一百萬字以上,總詞數(shù)(去除標點)16852,總頻次429922。從語料庫中共提取含“喜歡”語料905條,共現(xiàn)詞種數(shù)(type) 2137個, 共現(xiàn)總頻次 (token)13921次,經(jīng)過統(tǒng)計計算和語義匹配,最終確定心理動詞“喜歡”共有1347個語義相關(guān)共現(xiàn)詞,1533個語義代碼,分屬于12個大類,89個中類,606個小類,843個詞群,1163個原子詞群。
3. 語義范疇構(gòu)建及發(fā)展研究
3.1 研究指標
邢紅兵、辛鑫(2013)將詞匯知識的語料庫對比分析研究中的關(guān)鍵因素概括為“四率三度”。其中豐富度可以全面觀察詞語的使用情況,匹配度用來衡量中介語的地道性,匹配度越高,與目的語越接近,并提出二語者是在已有概念系統(tǒng)外學(xué)習(xí)一種新的語言符號來表達某一概念,其產(chǎn)出能力的高低主要取決于在表達過程中采用的語言形式與目的語間的匹配程度(邢紅兵,2020)。周琳(2020)在Read(2000:200)提出詞匯多樣性的基礎(chǔ)上提出詞義多樣性可用來測量學(xué)習(xí)者對同一個詞不同義項的掌握程度,并證實用于計算詞匯多樣性的Uber index①公式同樣適用于計算詞義多樣性。
參考以上概念,本文使用豐富度來考察二語學(xué)習(xí)者語義范疇的構(gòu)建情況,使用匹配度來衡量二語者構(gòu)建語義范疇的地道性,使用多樣性來評測學(xué)習(xí)者對不同語義范疇的選擇能力,同時,為了進一步考察二語者從概念到詞的轉(zhuǎn)換情況,我們引入語義符號化的概念來具體表征從語義范疇到具體詞項的選擇,將和目的語的共現(xiàn)詞及語義代碼完全匹配作為語義符號化標準,對二語者語義范疇體系的轉(zhuǎn)換程度進行測量。計算公式分別如下:
(1)語義多樣性=(log所有語義類數(shù))2/(log所有語義類數(shù)-log不同語義個數(shù))
(2)語義豐富度=中介語語義范疇類數(shù)/現(xiàn)代漢語語義范疇類數(shù)
(3)語義匹配度=中介語和現(xiàn)代漢語共有語義范疇類數(shù)/現(xiàn)代漢語語義范疇類數(shù)
(4)語義符號化=中介語和現(xiàn)代漢語共有共現(xiàn)詞②數(shù)/現(xiàn)代漢語共現(xiàn)詞數(shù)
3.2 語義范疇對比分析
通過對現(xiàn)代漢語和中介語“喜歡”共現(xiàn)詞語義范疇庫的簡單對比,發(fā)現(xiàn)兩個語料庫在最高位的語義范疇上是一致的,都涵蓋了12個大類,也證實了使用不同語言的人的思維對客觀事物的反映基本一致(梅家駒、高蘊琦,1990),二語學(xué)習(xí)者在學(xué)習(xí)新語言之前已經(jīng)形成了完整的范疇概念系統(tǒng)。
3.2.1 語義多樣性
本文首先使用Uber Index對現(xiàn)代漢語和中介語共現(xiàn)詞語料庫的詞匯多樣性及不同位語義范疇上的語義多樣性進行了測量。詞匯多樣性結(jié)果分別為26.29和21.29。語義多樣性統(tǒng)計結(jié)果見圖3。
統(tǒng)計結(jié)果可見,中介語在詞匯多樣性、語義多樣性和現(xiàn)代漢語相比都存在一定的差距。無論是高位語義范疇還是低位語義范疇,差距隨著語義范疇的細化逐漸增大,我們認為二語者習(xí)得詞匯不僅在于詞匯本身的音形義,還包括詞匯所在的環(huán)境是否能獲取到,由結(jié)果可見,語義分類越細,和目的語的差距越大,表明二語學(xué)習(xí)者在詞匯使用過程中語義范疇構(gòu)建的難點主要集中在低位語義范疇上。
為了考察在相似語義多樣性的高位語義范疇下的共現(xiàn)詞使用情況,我們分別對兩個語料庫中大類范疇下的共現(xiàn)詞數(shù)及其共現(xiàn)頻次進行了統(tǒng)計,其中共現(xiàn)詞出現(xiàn)一詞多義分別計算詞數(shù),對比結(jié)果見圖4及圖5。
從圖4和圖5可見,中介語語料庫中“喜歡”共現(xiàn)詞的大類語義范疇詞數(shù)和頻次都少于現(xiàn)代漢語語料庫,但表現(xiàn)出相似的模式。從各語義大類詞數(shù)和頻次所占比例來看,兩個語料庫中各語義大類的比例分布基本一致,共現(xiàn)詞數(shù)前5位語義類依次為:抽象事物(D)、物(B)、活動(H)、特征(E)和助語(K),共現(xiàn)頻次前5位語義類分別為:助語(K)、人(A)、抽象事物(D)、活動(H)、物(B)。依據(jù)《同義詞詞林》的編排原則,人、物、抽象事物多屬名詞,特征多屬形容詞,活動多屬動詞,助語多屬虛詞,排名前5的語義類的共現(xiàn)詞主要為實詞所占比例分別為現(xiàn)代漢語57.05%、中介語61.32%,虛詞所占比例分別為現(xiàn)代漢語10.06%、中介語8.94%。各語義類共現(xiàn)詞的動態(tài)使用情況表現(xiàn)為現(xiàn)代漢語實詞分布比例(47.43%)少于中介語實詞分布比例(49.35%),而中介語虛詞分布比例(32.43%)高于現(xiàn)代漢語虛詞分布比例(28.91%),明顯可看出二語者使用虛詞時存在集中化趨勢。
3.2.2 語義豐富度
由最初簡單對比可知,中介語和現(xiàn)代漢語在最高位的大類語義范疇的覆蓋上并無差異,因此我們對大類下的中類語義范疇的分布情況進行了對比統(tǒng)計,如表2所示。
從表2可見,中介語基本覆蓋了現(xiàn)代漢語的語義范疇,差異主要表現(xiàn)在人(A)、物(B)、抽象事物(D)和活動(H)四類,依據(jù)《同義詞詞林》對詞性的說明,即主要是名詞的差異,具體表現(xiàn)如下(括號內(nèi)為出現(xiàn)頻次)。
Ac 體態(tài):美人(3)、 胖子(1)
An 丑類:反動派(1)
Bj 微生物:菌(8)、病毒(4)、桿菌(1)
DI 疾?。簜冢?)、 肺炎(1)
Ha 政治活動:階級斗爭(3)、當家作主(1)
對照《漢語水平等級詞匯大綱》,我們發(fā)現(xiàn)除“胖子、菌、病毒、肺炎”是丁級詞匯外,其余皆為超綱詞,鑒于詞數(shù)和頻次在現(xiàn)代漢語中所占比例極低,且名詞為開放性詞類,我們認為在中類范疇上,二語學(xué)習(xí)者基本習(xí)得了目的語的語義范疇,也間接證實二語者語義范疇構(gòu)建的難點主要還是體現(xiàn)在低位范疇上。此外,對于現(xiàn)代漢語,沒有發(fā)現(xiàn)活動大類下的迷信活動(HL)中類共現(xiàn)詞,可以認為該語義范疇不屬于或不常出現(xiàn)在“喜歡”的語境范疇內(nèi)。
根據(jù)詞林的編寫原則,表示同一基本義的詞放入同一詞群,為了進一步探查二語學(xué)習(xí)者低位語義范疇的構(gòu)建情況,我們對詞群的語義分布進行了統(tǒng)計,見表3。
表3可見,隨著語義范疇的細化,共現(xiàn)詞的聚類集中在了特定詞群。在低位語義范疇上,中介語和現(xiàn)代漢語差異顯著。整體來看,中介語詞群豐富度為54.60%,和高位范疇94.62%的豐富度相比,出現(xiàn)了明顯的語義類窄化。12大類中有8大類的詞群豐富度超過了50%,助語(K)大類的豐富度為62.81%,助語類主要是虛詞,助語類豐富度最高的詞群為“非?!保↘a01A)類副詞,表明二語者習(xí)得了目標詞“喜歡”的程度語境范疇。語義類窄化更明顯表現(xiàn)在動作類(F)(44.44%)和更抽象的現(xiàn)象與狀態(tài)類(I)(37.78%)。
3.2.3 語義匹配度
為了考察二語學(xué)習(xí)者的地道性情況,我們對詞群的匹配度也進行了統(tǒng)計,結(jié)果如表4。
統(tǒng)計結(jié)果顯示,中介語聚類的843個詞群中有71.77%和現(xiàn)代漢語相匹配,占現(xiàn)代漢語詞群的39.18%。其中時間與空間(C)、助語(K)大類的匹配度分50%、52.89%,分別占中介語詞群的90.91%和84.21%,表明在最為基礎(chǔ)的時-空范疇的構(gòu)建上要優(yōu)于其他類別。匹配度最低的詞群類為敬語(L),敬語類以難歸類的客套語為主,現(xiàn)代漢語中“喜歡”的共現(xiàn)詞“敬語類”聚類有四個詞群且詞數(shù)和頻次均為1,可見這類詞顯然不是“喜歡”的核心語義范疇。其次為現(xiàn)象與狀態(tài)(I)類,該類詞多為抽象類詞,通過統(tǒng)計數(shù)據(jù)可以看出,該類中除了始末類(Ig)完全匹配外,其他詞群匹配度均較低。由此可以推測,使用不同語言者在更細化的語義范疇上具有相似性和差異性,相似的語義范疇,比如時間空間范疇,構(gòu)建要更接近于目的語者水平,抽象化的語義范疇的構(gòu)建難度較大。
3.2.4 語義符號化
為進一步檢驗二語者從概念到具體詞的選擇情況,本文對現(xiàn)代漢語和中介語最低位語義范疇原子詞群的共有共現(xiàn)詞的語義分布進行統(tǒng)計,總詞數(shù)576個,共現(xiàn)總頻次9100次,分屬于70個中類,321個小類,395個詞群,458個原子詞群。統(tǒng)計結(jié)果見表5。
統(tǒng)計結(jié)果可以看出,中類范疇上,兩個語料庫的總語義分布率均超過了75%,但在詞群范疇上都小于50%且差異顯著,即二語學(xué)習(xí)者在構(gòu)建語義范疇時隨著語義范疇的細化出現(xiàn)了語義窄化現(xiàn)象,這一點從單個類的匹配度變化也能體現(xiàn)出來,例如現(xiàn)象和狀態(tài)類(I)的匹配度從中類逐漸細化到原子詞群的匹配度分別為100%、20%、4.44%,封閉的虛詞類助語(K)的匹配度分別為100%、52.89%、45.45%,由此可見從概念到符號的轉(zhuǎn)變確實是二語詞匯習(xí)得的難點。
同時我們還對具體語義下匹配的共現(xiàn)詞數(shù)和共現(xiàn)頻次分布進行了統(tǒng)計,見表6。
從表6統(tǒng)計可看出,在具體的概念向詞匯的轉(zhuǎn)換過程中,中介語不僅表現(xiàn)出語義的窄化,還表現(xiàn)出詞語選擇和使用的相對集中化。例如,從句法語義界面(syntax-semantics-inferface)上看,“喜歡”作為突顯人物心理的SE動詞(Subject-Experiencer verb),共現(xiàn)的語義范疇必然包含兩類名詞,喜歡的感受者和對象,在作為感受者的人(A)語義范疇下,兩個語料庫共有詞占現(xiàn)代漢語的19.38%,使用頻率占70.24%,占中介語的詞比例和頻次比例分別為51.11%和92.18%,明顯顯示出詞語選擇和使用的集中趨勢。
3.3 語義范疇發(fā)展變化研究
為了觀察二語者的語義范疇構(gòu)建的發(fā)展過程,我們以學(xué)習(xí)漢語的時長為標準把中介語語料庫分為初級(0.5-1年)、中級(1.5-2.5年)和高級(gt;2.5年)三個子語料庫,采用分層隨機抽樣的方法各抽取124句,并對語義多樣性、語義豐富度、語義匹配度及語義符號化進行了測算和統(tǒng)計。
本文首先對不同水平的二語者構(gòu)建語義范疇的多樣性發(fā)展情況進行了單因素方差分析,結(jié)果表明:不同水平的二語者在語義多樣性上沒有顯著差異F(2,366)=1.380,p=0.253,整體多樣性統(tǒng)計結(jié)果表明:U值隨著漢語水平的提高而增加,如表7所示,這表明二語學(xué)習(xí)者會隨著漢語水平的提高呈現(xiàn)語義擴充。我們猜測個體差異并不顯著,這一方面是由于我們考察的是“喜歡”的單句,而單句共現(xiàn)的語義范疇有限,另一方面,語義的發(fā)展是一個緩慢的過程,詞語的使用環(huán)境在大的范圍下是固定的,我們組建不同的句子也只是在某一語義范疇下挑選不同的詞語,這從不同漢語水平共現(xiàn)詞增長情況也可以看出來,見表8。
從表8可以看出,“喜歡”共現(xiàn)詞無論從詞數(shù)還是從所聚類的語義數(shù)上來看,中級都比初級有所增加,高級比中級有增長。就共現(xiàn)詞的增長幅度而言,中級至高級低于初級至中級。Selinker(1972)提出“化石化現(xiàn)象”理論,認為絕大多數(shù)的二語學(xué)習(xí)者的第二語言能力發(fā)展到一定階段后就會停滯不前。本研究發(fā)現(xiàn)也佐證了這一觀點,中級學(xué)習(xí)者的詞匯發(fā)展緩慢并在達到一定水平時發(fā)生“化石化現(xiàn)象”。
不同水平的二語學(xué)習(xí)者語義豐富度和匹配度統(tǒng)計結(jié)果如表9所示。表9可見二語者漢語水平的提高會引起所構(gòu)建的語義范疇豐富度與匹配度的變化。具體表現(xiàn)為隨著漢語水平的提升,二語者構(gòu)建語義范疇的豐富度和匹配度在中類范疇下逐漸增長,在詞群范疇下,豐富度隨漢語水平的提升增長,匹配度并沒有出現(xiàn)相同的情況,由初級到中級匹配度顯著增長后,至高級階段則維持相似的水平,也就是說隨著學(xué)習(xí)者詞匯量的增長,在低位范疇下,匹配度和豐富度并沒有呈現(xiàn)正相關(guān)。
本研究同時也對不同水平的二語學(xué)習(xí)者語義符號化情況進行了統(tǒng)計,和目的語相比,初、中、高級共有共現(xiàn)詞數(shù)分別為168、217、218,語義符號化比率分別為4.2%、5.4 %、5.5%,和語義豐富度一致,概念到具體詞的轉(zhuǎn)化情況也隨著漢語水平的提升逐步改善。
4. 綜合討論
以上研究結(jié)果表明,和目的語者相比,二語學(xué)習(xí)者在動詞使用過程中語義范疇的構(gòu)建主要表現(xiàn)為語義類的窄化和詞語使用的集中化,并且呈現(xiàn)出明顯的發(fā)展特點,具體表現(xiàn)為:隨著漢語水平的不斷提高,產(chǎn)生了語義和詞匯的雙重拓展,語義的多樣性、豐富度、匹配度以及符號化程度逐漸提高,而發(fā)展到一定階段容易產(chǎn)生“化石化現(xiàn)象”。這也與Schmitt(1998)的研究結(jié)論相似,即二語者的詞匯語義的發(fā)展是一個緩慢的過程,語義石化現(xiàn)象時有發(fā)生。以下我們從三個方面具體討論研究結(jié)果。
(1)二語者動詞語義范疇構(gòu)建呈現(xiàn)語義類窄化和詞語集中化,不同水平階段側(cè)重構(gòu)建不同位語義范疇。和目的語者相比,隨著語義范疇的細化語義多樣性差距逐漸增大,二語者語義范疇的構(gòu)建難度主要在低位范疇上,雖然在共現(xiàn)詞和使用頻次上表現(xiàn)出和目的語大致相同的模式,但存在著詞語使用集中化的趨勢。例如,中介語中虛詞所占的比例(8.94%)低于現(xiàn)代漢語(10.06%),使用的分布比例(32.43%)卻高于現(xiàn)代漢語(28.91%)。就其發(fā)展而言,隨著漢語水平的提升,語義多樣性同步增加,但伴隨語義范疇細化呈現(xiàn)出語義類變窄,詞語集中的特點。在共現(xiàn)詞總量上,二語學(xué)習(xí)者由初級到高級,單語義詞數(shù)、多語義詞數(shù)、總語義數(shù)均呈現(xiàn)增長趨勢,其中初級至中級的增幅除多語義詞數(shù)都高于42%,中級到高級的增幅低于5%,且單語義詞數(shù)增幅為2.7%,多語義詞數(shù)增幅接近20%。這說明中級到高級語義的多元化發(fā)展要大于初級到中級,詞匯量的增加先集中在單語義,隨水平的增長發(fā)展多語義,這也是語義多樣性發(fā)展的表現(xiàn)。統(tǒng)計中我們還發(fā)現(xiàn)在高位語義范疇中類上二語者的語義類逐漸擴充,低位語義范疇詞群上,中級語義范疇類數(shù)明顯高于初級,高級和中級之間沒有明顯差異。這一結(jié)果說明,漢語學(xué)習(xí)初、中級階段以高位語義范疇的構(gòu)建為主,對原有語義范疇進行整合和調(diào)整,包括語境語義范疇的擴充,語感的培養(yǎng);中高級階段側(cè)重于具體詞群的構(gòu)建和同義詞語的擴充,即概念到具體符號的轉(zhuǎn)化。
(2)二語者動詞語義范疇構(gòu)建由典型化向非典型化逐步擴充。和目的語者相比,二語者基本已經(jīng)完成了大類和中類的構(gòu)建,差異主要表現(xiàn)在低位語義范疇,即詞群的構(gòu)建上出現(xiàn)了明顯的語義類窄化(54.6%),主要表現(xiàn)在動作類(F)(44.44%)和更抽象的現(xiàn)象與狀態(tài)類(I)(37.78%)。語義豐富度也隨漢語水平的變化而發(fā)展,說明語義范疇的構(gòu)建是一個動態(tài)的連續(xù)統(tǒng),隨詞匯量擴展和目標詞匯運用的加深,語義范疇逐步擴展,具體表現(xiàn)在匹配的語義類以擴展詞匯為主,非匹配的語義類以拓展語義類為主,例如,中介語和現(xiàn)代漢語完全匹配的時-空范疇(C),從初級的30個詞發(fā)展到中級的35個詞再到高級的40個詞,而不完全匹配的大類范疇人(A),初級有5個中類范疇(Aa、Ab、Ah、Aj、Al),中級又增加了職業(yè)范疇(Ae),高級階段在前6個中類范疇的基礎(chǔ)上又增加了籍屬(Ad)和身份(Af)兩個中類范疇。無論在高位語義范疇中類上還是在低位語義范疇詞群上,初級到中級的發(fā)展都快于中級到高級的發(fā)展,并且中類發(fā)展的增幅要大于詞群發(fā)展的增幅。蔣紹愚(2014)提出一些重要的概念范疇在全人類具有共通性,二語者習(xí)得詞匯是以原有概念為前提,學(xué)習(xí)全新的語言表達形式(邢紅兵,2013),一致性良好的語義概念的習(xí)得要優(yōu)于非一致且缺失性較高者,這從中類的豐富度、匹配度一致,而詞群的豐富度和匹配度卻相差較大也能表現(xiàn)出來。
(3)二語者動詞語義范疇構(gòu)建逐步趨近目的語者,抽象類范疇構(gòu)建及語義符號化是其構(gòu)建的難點。語義匹配度能夠衡量中介語地道性程度,和目的語者相比,時間空間(C)類匹配度最高,占中介語詞群的90.91%,占現(xiàn)代漢語詞群的55%,抽象類現(xiàn)象與狀態(tài)(I)匹配度最低,占中介語詞群的52.9%,占現(xiàn)代漢語詞群的20%??梢姡橄蠓懂牭臉?gòu)建是二語學(xué)習(xí)者構(gòu)建的難點,相對于范疇一致性的時間空間類主要擴展詞匯而言,抽象類的范疇構(gòu)建要點主要集中在語義類的逐步增加。此外,統(tǒng)計結(jié)果顯示在高位范疇上,豐富度和匹配度發(fā)展相一致,即二語者隨著漢語水平的提升,逐漸習(xí)得詞語的大類使用環(huán)境,但在低位范疇上,即使發(fā)展到高級階段,詞群的匹配度也較低且與目的語者存在明顯區(qū)別(Singleton,1999),并沒有隨著詞匯量的增長而增大。邢紅兵(2020)認為二語學(xué)習(xí)者目的語知識體系構(gòu)建的首要階段是目的語概念與符號聯(lián)結(jié)體系的建立,石高峰等(2021)提出二語學(xué)習(xí)者搭配的錯誤主要體現(xiàn)為使用語義相關(guān)的詞語進行規(guī)則化的不地道產(chǎn)出問題上,從統(tǒng)計結(jié)果我們也可以明顯看出,二語者在最低位原子詞群的構(gòu)建上,即從語義范疇到具體詞項的選擇上表現(xiàn)為詞語的泛化和集中化。例如,人(A)語義范疇下,兩個語料庫共有詞占現(xiàn)代漢語的19.38%,使用頻率占70.24%,占中介語的詞比例和頻次比例分別為51.11%和92.18%。而從發(fā)展變化的統(tǒng)計數(shù)據(jù)來看,語義符號化是發(fā)展最緩慢卻最容易出現(xiàn)“化石化現(xiàn)象”,這也從側(cè)面說明語義符號化是二語學(xué)習(xí)者詞匯習(xí)得的難點。
5. 結(jié)論
本文采用中介語對比分析的方法對二語學(xué)習(xí)者在動詞使用過程中語義范疇的構(gòu)建過程進行了考察。主要的研究結(jié)論有:(1)和目的語者相比,二語者所構(gòu)建的語義范疇呈現(xiàn)出語義類窄化和詞語集中化等特點;(2)二語者在詞語使用過程中所構(gòu)建的語義范疇受漢語水平的影響較大,語義范疇的多樣性、豐富度、匹配度和符號化都隨著漢語水平的提升而提高,但發(fā)展到一定階段會出現(xiàn)“化石化現(xiàn)象”;不同水平的二語者語義范疇構(gòu)建也不平衡,初、中級階段以高位語義范疇的構(gòu)建為主,中高級階段側(cè)重于具體詞群和同義詞語的擴充;(3)二語者構(gòu)建語義范疇的豐富度和匹配度并非正相關(guān),具體表現(xiàn)在語義概念一致性相對較高的中類范疇上,匹配度和豐富度表現(xiàn)一致;在差異較大的低位范疇詞群上,匹配度明顯低于豐富度,即語義符號化是影響二語者習(xí)得漢語地道性的主要影響因素,也是詞匯習(xí)得的難點。
另外,作為全句共現(xiàn)語義聚類研究的一次嘗試,本研究也存在不足之處。比如為了自動抽取語義范疇,以《同義詞詞林》為參照資源,在中介語語料庫中漏掉的未登錄詞包含了第二語言學(xué)習(xí)者特有的偏誤合成詞,該部分詞在認知上所歸屬的語義范疇對于二語學(xué)習(xí)者語義構(gòu)建同樣具有一定的價值,這有待進一步的深入研究。
[參考文獻]
儲誠志,陳小荷 1993 建立“漢語中介語語料庫系統(tǒng)”的基本設(shè)想[J]. 世界漢語教學(xué)(3).
侯曉明,孫培健,張婷婷 2022 整體頻次和搭配強度在母語和二語多詞序列加工中的作用——以漢語雙字副詞短語為例[J].世界漢語教學(xué)(2).
魯健驥 1987 外國人學(xué)習(xí)漢語的詞語偏誤分析[J].語言教學(xué)與研究(3).
梅家駒,高蘊琦 1990 語義形式化的研究[J].外國語(上海外國語學(xué)院學(xué)報)(5).
梅家駒,竺一鳴,高蘊琦,殷鴻翔(編) 1983 同義詞詞林[M].上海:上海辭書出版社.
曲維光,陳小荷,吉根林 2004 基于框架的詞語搭配自動抽取方法[J].計算機工程(23).
曲學(xué)智 2017 基于全句內(nèi)共現(xiàn)的現(xiàn)代漢語和漢語中介語詞匯知識對比研究[D]. 北京語言大學(xué)碩士學(xué)位論文.
全昌勤,劉 輝,何婷婷 2005 基于統(tǒng)計模型的詞語搭配自動獲取方法的分析與比較[J].計算機應(yīng)用研究(9).
邵敬敏,趙春利 2006 關(guān)于語義范疇的理論思考[J].世界漢語教學(xué)(1).
孫曉明 2009 留學(xué)生產(chǎn)出性詞匯的發(fā)展模式研究[J].民族教育研究(4).
石高峰,楊彩影 2021 漢語動詞句法框架信息加工機制及二語習(xí)得研究[J]. 語言教學(xué)與研究(1).
石高峰,楊彩影,李梅秀 2021 漢語二語學(xué)習(xí)者詞匯搭配知識地道性發(fā)展研究[J].國際中文教育(中英文)(3).
王大亮,涂序彥,鄭雪峰,佟子健 2008 多策略融合的搭配抽取方法[J]. 清華大學(xué)學(xué)報(自然科學(xué)版)(4).
王志軍,郝瑜鑫 2014 母語環(huán)境下美國漢語學(xué)習(xí)者心理詞匯發(fā)展的實證研究[J].語言教學(xué)與研究(1).
吳繼峰 2016 英語母語者漢語寫作中的詞匯豐富性發(fā)展研究[J].世界漢語教學(xué)(1).
邢紅兵 2009 中介語詞匯與現(xiàn)代漢語詞匯對比分析[J]. 對外漢語研究(1).
——— 2012 第二語言詞匯習(xí)得的語料庫研究方法[J]. 漢語學(xué)習(xí)(2).
——— 2013 詞語搭配知識與二語詞匯習(xí)得研究[J]. 語言文字應(yīng)用(4).
——— 2020 第二語言詞匯知識的構(gòu)成與發(fā)展[J]. 華文教學(xué)與研究(2).
邢紅兵,辛 鑫 2013 第二語言詞匯習(xí)得的中介語對比分析方法[J]. 華文教學(xué)與研究(2).
徐婷婷 2020 基于語言事實的動詞信息語義特征知識體系構(gòu)建[D]. 北京語言大學(xué)博士學(xué)位論文.
楊惠中 2002 語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社.
趙 奕 2013 基于語料庫的單一動詞句法框架研究及二語習(xí)得考察[D]. 北京語言大學(xué)碩士學(xué)位論文.
張江麗 2018 漢語作為第二語言學(xué)習(xí)者筆語產(chǎn)出性詞匯研究[J]. 世界漢語教學(xué)(3).
張淑靜 2005 從聯(lián)想測試看二語心理詞匯之間的聯(lián)系[J]. 解放軍外國語學(xué)院學(xué)報(2).
周 琳 2020 漢語二語學(xué)習(xí)者詞匯語義系統(tǒng)動態(tài)發(fā)展研究[J]. 世界漢語教學(xué)(1).
Durrant, P. L. 2008 High Frequency Collocations and Second Language Learning[D]. Ph.D Thesis, University of Nottingham.
Read, John 2000 Assessing Vocabulary[M]. Cambridge: Cambridge University Press.
Singleton, D. 1999 Exploring the Second Language Mental Lexicon[M]. Cambridge: Cambridge University Press.
Schmitt, N. 1998 Tracking the incremental acquisition of second language vocabulary: A longitudinal study[J]. Language Learning(48).
A study on the process of constructing semantic categories
of verbs for CSL learners: Taking xihuan (喜歡) as an example
YAN Yaya, XING Hongbing
Key words: second language acquisition; whole sentence co-occurrence; contrastive interlanguage analysis; lexical knowledge; semantic category
Abstract: This study, taking full-sentences as the window and with reference to Chinese Thesaurus, compares the co-occurrence of semantic categories of the verb xihuan(喜歡)in modern Chinese and in the interlanguage corpus, and investigates the construction and development of semantic categories by CSL learners. The results show that: (1) as compared with the target language, the construction of semantic categories by CSL learners is characterized by the narrowing of semantic categories and the concentration of chosen words; (2) the construction of semantic categories shows distinct developmental characteristics with the improvement of Chinese language proficiency, specifically the semantic diversity, semantic richness, semantic matching and semantic symbolization, all of which increase along with the improvement of Chinese language proficiency, but at a certain stage of development, the “fossilization phenomenon” appears; (3) the richness and matching of the semantic categories constructed by CSL learners are not positively correlated; the middle categories, which are the categories with relatively high semantic conceptual consistency, have a consistent matching and richness performance, while as for the lower category word groups with large differences, their matching is significantly lower than their richness, i.e., semantic symbolization is the main influence on bilinguals acquisition of Chinese. In other words, semantic symbolization is the main factor influencing the acquisition of Chinese as well as the difficulty of vocabulary acquisition.
【責任編輯 師玉梅】
[收稿日期] 2023-08-02
[作者簡介] 閆亞亞,女,暨南大學(xué)華文學(xué)院/國家語委海外華語研究中心,主要從事漢語學(xué)習(xí)與認知研究,
yan_yaya@foxmail.com;邢紅兵,男,北京語言大學(xué)國際學(xué)生教育政策與評價研究院,主要從事漢語學(xué)習(xí)與認知研究,xinghb@blcu.edu.cn。
[基金項目] 北京語言大學(xué)一流學(xué)科團隊支持計劃項目“語言測試與教育評價研究”(2023YJC02);世界漢語教學(xué)學(xué)會2023年中青年學(xué)術(shù)創(chuàng)新項目“‘把’字句對動詞選擇頻率關(guān)系的漢語二語習(xí)得過程研究”(SH23Y12)