劉艷偉 劉玉琴
(大連理工大學(xué) 軟件學(xué)院,遼寧 大連 116624)
基于NLB檢索系統(tǒng)詞語(yǔ)搭配統(tǒng)計(jì)值的日語(yǔ)近義詞詞典編纂構(gòu)想
劉艷偉 劉玉琴1
(大連理工大學(xué) 軟件學(xué)院,遼寧 大連 116624)
日語(yǔ)近義詞詞典作為日語(yǔ)學(xué)習(xí)者重要的參考工具書(shū),若不能提供豐富、詳盡、科學(xué)的近義詞辨析信息,很可能導(dǎo)致誤用,阻礙學(xué)習(xí)。語(yǔ)料庫(kù)提供大量的真實(shí)語(yǔ)料,基于語(yǔ)料庫(kù)的詞語(yǔ)搭配,對(duì)近義詞進(jìn)行辨析,使近義詞研究更具科學(xué)性和有效性。NLB檢索系統(tǒng)是日本國(guó)立國(guó)語(yǔ)研究所和Lago語(yǔ)言研究所共同開(kāi)發(fā)的日語(yǔ)在線(xiàn)檢索系統(tǒng),檢索數(shù)據(jù)源于「現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス」語(yǔ)料庫(kù)。NLB自動(dòng)呈現(xiàn)節(jié)點(diǎn)詞與搭配詞的共現(xiàn)頻數(shù)、MI值和LD值。本文基于NLB檢索系統(tǒng),以近義詞「文句」和「苦情」為例,從詞配角度區(qū)分二者的異同,探討日語(yǔ)近義詞詞典編纂的新方法。
NLB檢索系統(tǒng);詞語(yǔ)搭配;共現(xiàn)頻數(shù);MI值;LD值
近義詞(synonym),在很多研究中也被譯為“同義詞”。Lyons(1981:50)定義并確立了同義詞的分類(lèi)標(biāo)準(zhǔn),同時(shí)也指出了近義詞的概念:意義上相近但不相同的詞。本文中的近義詞將沿用Lyons的概念。
日語(yǔ)近義詞的大量存在使近義詞辨析成為日語(yǔ)學(xué)習(xí)中不容忽視的領(lǐng)域。任培紅(2008:57)指出:“傳統(tǒng)的近義詞辨析方法,是在教學(xué)中給出定義和描述,輔之以少量例句。教師和學(xué)習(xí)者往往依賴(lài)詞典,或通過(guò)內(nèi)省和憑經(jīng)驗(yàn)進(jìn)行定性分析,以比較近義詞之間的差異。”日語(yǔ)近義詞詞典作為日語(yǔ)學(xué)習(xí)者重要的參考工具書(shū),應(yīng)該提供豐富詳盡的近義詞辨析信息。筆者選取一組常用的近義詞「文句」和「苦情」,考察了近義詞詞典對(duì)其用法的解釋?zhuān)l(fā)現(xiàn)結(jié)果并不盡如人意。
語(yǔ)料庫(kù)問(wèn)世前的研究,缺乏足夠的自然數(shù)據(jù),缺乏科學(xué)性和有效性。語(yǔ)料庫(kù)提供大量的真實(shí)語(yǔ)料,國(guó)內(nèi)外學(xué)者運(yùn)用語(yǔ)料庫(kù)的方法對(duì)近義詞進(jìn)行了研究,具有代表性的歐美學(xué)者有Biber等(2000)、Kennedy(1998)、Thomas & Short(2001);日本學(xué)者有田野村忠溫(1994)、大曾美惠子(2002)、野田春美(2004)、杉本武(2009);國(guó)內(nèi)運(yùn)用語(yǔ)料庫(kù)方法從事英語(yǔ)近義詞研究的有張繼東、劉萍(2005)、任培紅(2008)、王春艷(2009)、陸軍(2010)等,從事日語(yǔ)近義詞研究的有毛文偉(2002)、王華偉、曹亞輝(2012)等。其中,有些研究并沒(méi)有科學(xué)的統(tǒng)計(jì)方法,缺乏科學(xué)理論依據(jù)。有的研究雖然采用了科學(xué)的統(tǒng)計(jì)方法,但由于統(tǒng)計(jì)過(guò)程完全靠人工進(jìn)行,需要語(yǔ)言學(xué)者必須掌握統(tǒng)計(jì)學(xué)知識(shí),也會(huì)耗費(fèi)大量的精力。
張繼東、劉萍(2005)提出了基于語(yǔ)料庫(kù)進(jìn)行同義詞辨析的三種方法,即同義詞在不同語(yǔ)域中詞頻分布差異;搭配詞的計(jì)算與同義詞的辨析;語(yǔ)義韻、類(lèi)聯(lián)結(jié)與同義詞的辨析。其中搭配詞的計(jì)算與同義詞的辨析方法就是以節(jié)點(diǎn)詞的跨距為參照,統(tǒng)計(jì)同義詞的顯著搭配詞,并計(jì)算同義詞與其搭配詞相互信息值(MI值)以及Z值(或T值)。
朱文慧、馬立東(2010)將基于語(yǔ)料庫(kù)的近義詞辨析的方法歸為四種:近義詞的詞匯搭配,近義詞的語(yǔ)義韻,近義詞的類(lèi)連接以及近義詞的語(yǔ)域分布的異同。嘗試將語(yǔ)料庫(kù)中檢索到的近義詞的搭配詞及語(yǔ)義韻特點(diǎn)等信息整合到英漢學(xué)習(xí)型詞典的近義詞辨析欄中,從而實(shí)現(xiàn)英漢學(xué)習(xí)型詞典中近義詞辨析欄的優(yōu)化設(shè)置。這開(kāi)辟了基于語(yǔ)料庫(kù)編纂近義詞詞典的科學(xué)新理念。但只是宏觀提出了劃分方法,關(guān)于詞配研究的相關(guān)統(tǒng)計(jì)值、統(tǒng)計(jì)方法和顯著搭配的例句等都沒(méi)有涉及。
本文借鑒以上張繼東、劉萍(2005)、朱文慧、馬立東(2010)提出的通過(guò)詞語(yǔ)搭配進(jìn)行同義詞辨析的方法,以近義詞「文句」和「苦情」為例,在綜合現(xiàn)有日語(yǔ)近義詞詞典的基礎(chǔ)上,結(jié)合NLB檢索系統(tǒng)提供的詞語(yǔ)搭配值(MI值和LD值),來(lái)區(qū)分日語(yǔ)近義詞異同,提出基于NLB檢索系統(tǒng)詞語(yǔ)搭配統(tǒng)計(jì)值,編纂日語(yǔ)近義詞詞典的新方法。
NLB為NINJAL-LWP for BCCWJ的簡(jiǎn)稱(chēng)。日本國(guó)立國(guó)語(yǔ)研究所構(gòu)建的「現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス」已經(jīng)廣為中國(guó)日語(yǔ)研究者所知。正是為了方便「現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス」的檢索,日本國(guó)立國(guó)語(yǔ)研究所和Lago語(yǔ)言研究所共同開(kāi)發(fā)了在線(xiàn)檢索系統(tǒng)NLB。該系統(tǒng)于2013年6月25日公開(kāi),容量共計(jì)約1.05億詞。NLB最大的特征是能系統(tǒng)地展示各詞匯與節(jié)點(diǎn)詞之間的共起關(guān)系。網(wǎng)址為:http:// nlb.ninjal.ac.jp/。所使用的解析器和詞典為:形態(tài)素解析器 MeCab0.99+IPA,詞典2.7.0,系受關(guān)系解析器CaboCha0.64。
詞語(yǔ)搭配指詞與詞的結(jié)伴,是一種高度因循性的詞語(yǔ)組合,是詞語(yǔ)間的典型共現(xiàn)行為(鄧耀臣,2003)。在外語(yǔ)學(xué)習(xí)中,掌握和使用典型的詞語(yǔ)搭配是學(xué)習(xí)本族語(yǔ)者的無(wú)標(biāo)記語(yǔ)言的重要內(nèi)容之一(鄧耀臣,2003)。語(yǔ)料庫(kù)證據(jù)表明,每一個(gè)詞項(xiàng)都有其獨(dú)特的搭配行為,同義詞也不例外,它們一般只在概念意義上相同或接近,但在搭配詞選擇上并不能隨意替換(陸軍,2010)。國(guó)內(nèi)關(guān)于詞語(yǔ)搭配中共現(xiàn)詞顯著性的測(cè)量方法通常使用MI值和T值兩種。這兩種方法都是通過(guò)比較共現(xiàn)詞的觀察頻數(shù)(observed frequency)和期望頻數(shù)(expected frequency)的差異來(lái)確定搭配序列在語(yǔ)料庫(kù)中出現(xiàn)概率的顯著程度(鄧耀臣,2003)。
(一)MI值的統(tǒng)計(jì)測(cè)量
MI值(Mutual Information Score 互信息值)表示的是互相共現(xiàn)的兩個(gè)詞中,一個(gè)詞對(duì)另一個(gè)詞的影響程度,或者說(shuō)一個(gè)詞在語(yǔ)料庫(kù)中出現(xiàn)的頻數(shù)所能提供的關(guān)于另一個(gè)詞出現(xiàn)的概率信息。MI值越大,說(shuō)明節(jié)點(diǎn)詞對(duì)其詞匯環(huán)境影響越大,對(duì)其共現(xiàn)詞吸引力越強(qiáng)。因此,MI值表示的是詞語(yǔ)間的搭配強(qiáng)度。
MI=log2(共現(xiàn)的實(shí)際頻數(shù)×語(yǔ)料庫(kù)總詞數(shù)/節(jié)點(diǎn)詞頻數(shù)×搭配詞頻數(shù))(王華偉 曹亞輝,2012)
基于語(yǔ)料庫(kù)的詞語(yǔ)搭配研究中通常把MI值≥3的詞作為顯著搭配詞(Church等,1991)。
(二)T值的統(tǒng)計(jì)測(cè)量
T值表示的是節(jié)點(diǎn)詞與搭配詞相互預(yù)見(jiàn)或相互吸引的程度。T值達(dá)到一定程度,搭配詞即可被視為顯著搭配詞,它與節(jié)點(diǎn)詞組成的序列則是顯著搭配。衛(wèi)乃興(2002:107)指出:“研究者一般將T值≥2的認(rèn)定為顯著值,因?yàn)橛迷撝祷旧峡蓪⑴既淮钆湓~過(guò)濾掉,獲得全部有意義的搭配。”
(三)LD值的統(tǒng)計(jì)測(cè)量
NLB檢索系統(tǒng)采用的是MI值和LD值的統(tǒng)計(jì)測(cè)量。中條、內(nèi)山(2004)對(duì)9種統(tǒng)計(jì)值準(zhǔn)確度比較后得知,D值是有用度和準(zhǔn)確度都很高的指標(biāo)。D值常用來(lái)統(tǒng)計(jì)處理詞語(yǔ)搭配,它的計(jì)算不需要語(yǔ)料庫(kù)的總詞量,只通過(guò)節(jié)點(diǎn)詞頻數(shù)和共起詞頻數(shù)二者的關(guān)系來(lái)計(jì)算詞語(yǔ)搭配的強(qiáng)度。
但是因?yàn)镈值很小,常常是0.0xx,所以Rychly(2008)提出用LD值代替D值。LD即LogDice,是將D值對(duì)數(shù)化的結(jié)果。
LD的最大值是14,通常情況下小于10。LD值越大,搭配強(qiáng)度越大。本文將LD值≥3的搭配視為顯著搭配。
「文句」和「苦情」都有“牢騷、抱怨、不滿(mǎn)”之意,在表示該意義時(shí)為近義詞。本文將二者進(jìn)行比較,目的在于說(shuō)明NLB檢索系統(tǒng)提供的MI值和LD值在區(qū)分日語(yǔ)近義詞時(shí)起到的重要作用,提出基于NLB檢索系統(tǒng)編纂日語(yǔ)近義詞詞典的新方法?!肝木洹购汀缚嗲椤故莾蓚€(gè)常用的名詞,在句中可以充當(dāng)主語(yǔ)或賓語(yǔ)成分。詞典中對(duì)二者表示“牢騷、抱怨、不滿(mǎn)”之意時(shí)的解釋為:
表1 詞典中對(duì)「文句」和「苦情」的釋義①
詞典雖然列舉了一些搭配和例句, 但單憑這些脫離上下文和真實(shí)語(yǔ)境的例子很難使學(xué)習(xí)者真正掌握二者微妙的差異和恰當(dāng)?shù)挠梅?。根?jù)以上解釋?zhuān)照Z(yǔ)學(xué)習(xí)者很容易做出如此判斷:「文句」是單純地向?qū)Ψ奖硎静粷M(mǎn),而「苦情」則是因?yàn)樽约旱睦媸艿搅藫p害而不滿(mǎn)。由于例句過(guò)短、過(guò)少,使學(xué)習(xí)者無(wú)法更多地把握該詞的使用語(yǔ)境,很有可能造成誤用。再有, 例句中出現(xiàn)的搭配詞語(yǔ)是否為顯著搭配不得而知?!缎旅鹘鈬?guó)語(yǔ)詞典》中給出的「苦情を取り扱う」,這種搭配本身雖然沒(méi)有問(wèn)題,但它的顯著程度還需要科學(xué)的驗(yàn)證。
『使い方の分かる類(lèi)語(yǔ)例解辭典』⑤(以下簡(jiǎn)稱(chēng)為《類(lèi)語(yǔ)辭典》)把「文句」和「苦情」作為一對(duì)近義詞進(jìn)行了辨析:
相同意義:對(duì)蒙受的傷害、妨礙等表示的不滿(mǎn)、不平或憤怒。
區(qū)別:(一)「苦情」是因?yàn)橥饨缃o自己帶來(lái)了妨礙、困擾或因購(gòu)買(mǎi)的商品存在問(wèn)題而提出的不滿(mǎn),是比較正式的表達(dá)方式。(二)「文句」可用于挑刺兒、找茬兒等沒(méi)有正當(dāng)理由的不滿(mǎn)。
《類(lèi)語(yǔ)辭典》同樣存在以上三部詞典的問(wèn)題:例句過(guò)短過(guò)少;搭配詞語(yǔ)是否為顯著搭配有待驗(yàn)證。除此之外,《大》、《新》、《明》三部詞典將“蒙受外界的損害”只作為「苦情」的前提,關(guān)于「文句」的釋義中是沒(méi)有這個(gè)前提的,因此日語(yǔ)學(xué)習(xí)者很有可能將這一前提作為「文句」和「苦情」的區(qū)別。而《類(lèi)語(yǔ)辭典》卻將這一前提作為二者的共同之處,詞典之間的矛盾使日語(yǔ)學(xué)習(xí)者感到迷茫,手足無(wú)措。
在NLB檢索系統(tǒng)中輸入節(jié)點(diǎn)詞「文句」和「苦情」,系統(tǒng)顯示出「現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス」中所包含的節(jié)點(diǎn)詞「文句」的頻數(shù)為2,490,節(jié)點(diǎn)詞「苦情」的頻數(shù)為2,376,不符合義項(xiàng)要求的部分將在考察時(shí)排除。NLB檢索系統(tǒng)將節(jié)點(diǎn)詞的所有用法都進(jìn)行了歸類(lèi),如「節(jié)點(diǎn)詞+助詞+動(dòng)詞」「動(dòng)詞+節(jié)點(diǎn)詞」「節(jié)點(diǎn)詞+助詞+形容詞」「節(jié)點(diǎn)詞+助詞」等。本文基于NLB檢索系統(tǒng)提供的頻數(shù)、MI值和LD值,以近義詞「文句」和「苦情」為例,從詞配角度區(qū)分二者的異同,探討編纂日語(yǔ)近義詞詞典的新方法。
首先將節(jié)點(diǎn)詞「文句」和「苦情」后續(xù)「を+動(dòng)詞」用法中共現(xiàn)頻數(shù)最多的前10個(gè)搭配詞及其MI值和LD值進(jìn)行匯總,形成表2。
點(diǎn)擊語(yǔ)料庫(kù)中的共現(xiàn)詞,可以查看語(yǔ)料庫(kù)中包含該共現(xiàn)詞的例句。筆者經(jīng)過(guò)逐一檢驗(yàn)之后,排除以下類(lèi)型檢索結(jié)果。
(1)「文句を唱える」類(lèi)型。這里的「文句」應(yīng)該是“詞句、話(huà)語(yǔ)”之意,不符合義項(xiàng)要求。
(2)后續(xù)動(dòng)詞為非實(shí)意動(dòng)詞的類(lèi)型,(表2中標(biāo)記*之處)例如:
★文句を~~いる
◆お父さんは黙っている。お母さんはどんどん続けてお父さんに文句を言っている。でも、お父さんの聲は聞えない。/父親沉默不語(yǔ)。媽媽一個(gè)勁兒地發(fā)著牢騷??墒牵瑓s聽(tīng)不到父親的聲音。
★文句を~~くる
◆どうにか家までたどり著いたと思ったら、今度は料金に文句をつけてきた。/想著這下可算到家了,可是又對(duì)費(fèi)用問(wèn)題挑起刺兒來(lái)。
表2 節(jié)點(diǎn)詞「文句」和「苦情」后續(xù)「を+動(dòng)詞」時(shí)共現(xiàn)頻數(shù)最多的前10個(gè)搭配詞⑥
★文句を~~てる
◆新婚旅行のお土産を配った同僚に「これっくらいの土産じゃね…」と面と向かって文句を言ってた。/一個(gè)同事剛分完自己新婚旅行的禮物,就有人當(dāng)面牢騷道:“就這種禮物啊……”。
「苦情を~~いる」和「苦情を~~くる」屬于同一類(lèi)型,在此省略例句,這類(lèi)用法也不屬于本文考察范圍,篩選時(shí)將其排除。
從表2的搭配情況來(lái)看,「文句」和「苦情」后面存在相同的共現(xiàn)動(dòng)詞「言う」。動(dòng)詞「つける」「言える」「始める」等只與「文句」共現(xiàn),而「申し立てる」「見(jiàn)る」「受け付ける」等只與「苦情」共現(xiàn)。從共現(xiàn)頻數(shù)來(lái)看,與兩詞共現(xiàn)頻數(shù)最高的都是「言う」,分別為680次和106次,前者約等于后者的6倍,可見(jiàn)「文句を言う」比「苦情を言う」的使用頻率高。
然而,搭配詞共現(xiàn)頻數(shù)高并不意味著是顯著搭配,還需要分析MI值和LD值的情況。MI值≥3,LD值≥3的詞即可視為顯著搭配詞。MI值和LD值越大,說(shuō)明節(jié)點(diǎn)詞對(duì)其詞匯環(huán)境影響越大,對(duì)其共現(xiàn)詞吸引力越強(qiáng)。
表2中節(jié)點(diǎn)詞「文句」后續(xù)「を言う」頻數(shù)為680,排在第一位,MI值為7.95,LD值為6.35,遠(yuǎn)大于3,所以,「を言う」為「文句」的顯著搭配。而節(jié)點(diǎn)詞「苦情」后續(xù)「を見(jiàn)る」的頻數(shù)為17,雖然排在第3位,但由于其MI值為5.50,LD值為2.03,LD值小于3,所以不視為顯著搭配。
使用以上方法,分別匯總「文句」和「苦情」所有用法中的顯著搭配,再將其分條對(duì)照地編入詞典,并篩選出語(yǔ)料庫(kù)中有代表性的句子作為例句。擬編寫(xiě)近義詞詞典樣例,參見(jiàn)表3。篇幅原因,表3中只列出「文句」和「苦情」后續(xù)「を+動(dòng)詞」的用法。詞典采取左右對(duì)照的形式,相同用法在同一行左右對(duì)照出現(xiàn),使兩詞區(qū)別一目了然。
從表3的樣例可以清楚的比較兩個(gè)近義詞的區(qū)別。第一,在后續(xù)「を+動(dòng)詞」的用法中,與「文句」顯著搭配的動(dòng)詞只有「言う」和「つける」兩個(gè),而與「苦情」顯著搭配的動(dòng)詞有「言う」「申し立てる」「受け付ける」和「受ける」。第二,「言う」與兩個(gè)詞都是顯著搭配,表達(dá)的意義卻不同。通過(guò)詞典樣例可知,「文句」是一方帶有情緒地埋怨另一方,而「苦情」是對(duì)自己蒙受的損失、不利或遭到的不愉快提出申訴,多用于公眾發(fā)出的不滿(mǎn)或個(gè)人對(duì)公家的不滿(mǎn),而親人、朋友之間的不滿(mǎn)則用「文句」。
NLB檢索系統(tǒng)自動(dòng)呈現(xiàn)頻數(shù)、MI值和LD值,省去了日語(yǔ)研究者自己統(tǒng)計(jì)的過(guò)程,彌補(bǔ)了研究者統(tǒng)計(jì)學(xué)知識(shí)的匱乏,打破了語(yǔ)言學(xué)與統(tǒng)計(jì)學(xué)之間的界限。根據(jù)頻數(shù)、MI值和LD值,能夠科學(xué)準(zhǔn)確地判斷詞語(yǔ)搭配強(qiáng)度等相關(guān)信息,掌握節(jié)點(diǎn)詞的常用用法,便于區(qū)分近義詞的異同。
另外,NLB檢索系統(tǒng)中的語(yǔ)料為廣大日語(yǔ)學(xué)者非常熟悉的「現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス」語(yǔ)料庫(kù)語(yǔ)料,它呈現(xiàn)的是原汁原味的真實(shí)語(yǔ)料,把這些日常生活中經(jīng)常用到的日語(yǔ)經(jīng)過(guò)篩選之后編入詞典,會(huì)幫助日語(yǔ)學(xué)習(xí)者在不同語(yǔ)境中了解近義詞的各自用法,方便對(duì)近義詞做出辨析,有助于區(qū)分近義詞,避免誤用,加快正確掌握目的語(yǔ)的進(jìn)程。
注釋?zhuān)?/p>
① 本文日文例句部分為筆者譯。
② 參見(jiàn):松村明.2006.大辭林 第二版[Z].東京:三省堂.
③ 參見(jiàn):金田一京助.1999.新明解國(guó)語(yǔ)辭典 第五版[Z].東京:三省堂.
④ 參見(jiàn):北原保雄.2002.明鏡國(guó)語(yǔ)辭典 第一版[Z].東京:大修館書(shū)店.
⑤ 參見(jiàn):遠(yuǎn)藤織枝等.2003.使い方の分かる類(lèi)語(yǔ)例解辭典 新裝版[Z].東京:小學(xué)館.
⑥ 「文句」節(jié)點(diǎn)詞頻數(shù):1,070,搭配動(dòng)詞數(shù)量:88;「苦情」節(jié)點(diǎn)詞頻數(shù):292,搭配動(dòng)詞數(shù)量:70。
[1] Biber, D., S. Conrad & R. Reppen. 2000.Corpus Linguistics Foreign Language[M]. Cambridge: Cambridge University Press.
[2] Church, K. et al. 1991. Using statistics in lexical analysis[A]. In U. Zernik (ed.), Lexical Acquisition:Exploring On-line Resources to Build a Lexicon[C]. Hillsdale, NJ:Lawrence Erlbaum Associates.
[3] Kennedy, G. 1998.An Introduction to Corpus Linguistics[M]. London: Addison Wesley Longman.
[4] Lyons, J. 1981. Language and L inguistics[M].Cambridge: Cambridge University Press.
[5] Rychly, P. 2008. A lexicographer-friendly association score[J]. Proceedings of Recent Advances in Slavonic Natural Language Processing, (4):6-9.
[6] Thomas, J & M. Short. 2001.用語(yǔ)料庫(kù)研究語(yǔ)言[M].北京:外語(yǔ)教學(xué)與研究出版社.
[7] 石川慎一郎.2008.コロケーションの強(qiáng)度をどう測(cè)るか——ダイス係數(shù)、tスコア,相互情報(bào)量を中心として[A].徳永健伸.自然言語(yǔ)処理[C].京都:中西印刷.
[8] 大曽美惠子.2002.コーパスから得られるコロケーション情報(bào)―『影響、刺激、感動(dòng)』を中心に― [A].名古屋大學(xué)言語(yǔ)文化部?國(guó)際言語(yǔ)文化研究科.言語(yǔ)文化論集[C].名古屋:名古屋大學(xué).
[9] 杉本武.2009.コーパスからみた類(lèi)義語(yǔ)動(dòng)詞:「ねじる」と「ひねる」[J].文蕓言語(yǔ)研究言語(yǔ)篇,(55):109-122.
[10] 田野村忠溫.1994.丁寧體の述語(yǔ)否定形の選択に関する計(jì)量の調(diào)査——「~ません」と「~ないです」[A].古谷大輔.大阪外國(guó)語(yǔ)大學(xué)論集[C].大阪:一心社.
[11] 中條清美 內(nèi)山將夫.2004.統(tǒng)計(jì)的指標(biāo)を利用した特徴語(yǔ)抽出に関する研究[A].斉田智里.関東甲信越英語(yǔ)教育學(xué)會(huì)紀(jì)要[C].橫浜:関東甲信越英語(yǔ)教育學(xué)會(huì).
[12] 野田春美.2004.否定ていねい形「ません」と「ないです」の使用に関わる要因―用例調(diào)査と若年層アンケート調(diào)査に基づいてー[J].計(jì)量國(guó)語(yǔ)學(xué),(5):228-244.
[13] 鄧耀臣.2003.詞語(yǔ)搭配研究中的統(tǒng)計(jì)方法[J].大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),(4):74-77.
[14] 陸軍.2010.基于語(yǔ)料庫(kù)的學(xué)習(xí)者英語(yǔ)近義詞搭配行為與語(yǔ)義韻研究[J].現(xiàn)代外語(yǔ),(3):276-286+329-330.
[15] 毛文偉.2002.試析復(fù)合辭“~テナラナイ”“~テショウガナイ”“~テタマラナイ”的異同──語(yǔ)料庫(kù)統(tǒng)計(jì)法在語(yǔ)法研究中的應(yīng)用一例[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),(3):62-66.
[16] 任培紅.2008.近義詞的教與學(xué):以Common和Ordinary為例[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),(4):57-60.
[17] 王春艷.2009.基于語(yǔ)料庫(kù)的中國(guó)學(xué)習(xí)者英語(yǔ)近義詞區(qū)分探討[J].外語(yǔ)與外語(yǔ)教學(xué),(6):27-31.
[18] 王華偉 曹亞輝.2012.日語(yǔ)教學(xué)中基于語(yǔ)料庫(kù)的詞語(yǔ)搭配研究——以一組動(dòng)詞近義詞為例[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),(2):71-75+91.
[19] 衛(wèi)乃興.2002.基于語(yǔ)料庫(kù)和語(yǔ)料庫(kù)驅(qū)動(dòng)的詞語(yǔ)搭配研究[J].當(dāng)代語(yǔ)言學(xué),(2):101-114.
[20] 張繼東 劉萍.2005.基于語(yǔ)料庫(kù)近義詞辨析的一般方法[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),(6):49-52.
[21] 朱文慧 馬立東.2010.英漢學(xué)習(xí)型詞典中近義詞辨析欄的優(yōu)化設(shè)置──基于語(yǔ)料庫(kù)的近義詞辨析及其應(yīng)用[J].辭書(shū)研究,(6):78-87.
Conceptions of Japanese Synonym Lexicography Based on the Statistics of Word Collocation in NLB Retrieval System
As an important reference book for Japanese learners, Japanese synonym dictionary will impede students’ Japanese learning and lead them to misuse some words if it cannot provide rich, detailed and scientific synonym discrimination information. Since a corpus provides a large quantity of authentic language materials, synonym discrimination based on a corpus can make the research into synonyms more scientific and effective. As an online Japanese retrieval system jointly developed by National Institute for Japanese Language and Linguistics and Lago Language Research Institute, NLB gets its data from the Balanced Corpus of Contemporary Written Japanese and it can automatically reflect the co-occurrence frequency, MI value and LD value of node words and their collocates. Based on the collocation information found in NLB, this paper analyzes the similarities and differences between “文句” and “苦情”, and thus explores the new methods of Japanese synonym lexicography.
NLB retrieval system; collocation; co-occurrence frequency; MI score; LD score
G42
A
2095-4948(2015)02-0070-06
本文為教育部人文社會(huì)科學(xué)研究規(guī)劃基金項(xiàng)目“基于視頻語(yǔ)料庫(kù)的日語(yǔ)拒絕行為的研究”(13YJA740039)、遼寧省教育科學(xué)“十二五”規(guī)劃項(xiàng)目“基于視頻語(yǔ)料庫(kù)的日語(yǔ)授受表達(dá)習(xí)得平臺(tái)的建設(shè)”(JG14DB090)的階段性成果。
劉艷偉,女,大連理工大學(xué)軟件學(xué)院講師,研究方向?yàn)閼?yīng)用語(yǔ)言學(xué);劉玉琴,女,大連理工大學(xué)軟件學(xué)院副教授,博士,研究方向?yàn)榻逃W(xué)、應(yīng)用言語(yǔ)學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)。