張緒華
摘 要 本研究以語料庫數(shù)據(jù)驅(qū)動的短語學(xué)方法,分析高頻詞語touch的短語學(xué)特征,并將其與主流在線英語學(xué)習(xí)型詞典中的短語信息記錄進行比較,以此管窺在線英語學(xué)習(xí)型詞典短語的收錄及編排情況。研究發(fā)現(xiàn),在線英語學(xué)習(xí)型詞典在短語收錄和編排方面仍需加強,在處理短語信息時各詞典普遍欠缺內(nèi)部一致性,且存在詞典間短語記錄缺乏統(tǒng)一標(biāo)準(zhǔn)等問題。在線詞典的眾源編纂方式和語料庫例證等異于紙質(zhì)版詞典的設(shè)計豐富了詞典編纂的手段和資源,給在線詞典用戶提供了極大的便利。最后,針對觀察到的短語收錄和編排方面的問題,本研究提出了相應(yīng)的解決方案。
關(guān)鍵詞 短語學(xué) 在線詞典 語料庫 搭配
一、 引言
得益于20世紀(jì)末以來互聯(lián)網(wǎng)技術(shù)和信息數(shù)字化技術(shù)的迅猛發(fā)展,英語學(xué)習(xí)型詞典的網(wǎng)絡(luò)出版取得了長足的進步。劍橋、朗文、麥克米倫和柯林斯等具有國際影響力的詞典出版機構(gòu)紛紛在紙質(zhì)版學(xué)習(xí)型詞典基礎(chǔ)上推出在線版本。研究顯示,在線詞典在查閱速度、查閱方式和查得率等方面極大地改善了用戶體驗。(Granger & Paquot2012;戴遠君,徐海2014)
語料庫語言學(xué)的介入同樣給詞典編纂帶來了全面的變革。通過“將詞語頻次信息引入詞典”(Kilgarriff1997),詞典編纂者改進了詞典編纂工具,改變了詞典編纂中詞目選擇、釋義及義項排序等方式,甚至具有較強主觀性的例證尋找工作也可以由電腦程序自動完成。(Sinclair1987;Atkins & Rundell2008;Kilgarriff et al. 2008;Hanks2009)尤為重要的是,研究者基于語料庫語言學(xué)研究最新進展,將豐富的短語信息納入詞典,對詞典編纂影響巨大(Moon2007;Walker2009;徐海2013),Paquot(2015)甚至認(rèn)為語料庫數(shù)據(jù)驅(qū)動的短語學(xué)研究給詞典編纂帶來了革命性的改變。
作為語言學(xué)領(lǐng)域一個日漸成熟的專門學(xué)科,語料庫數(shù)據(jù)驅(qū)動的短語學(xué)研究以“語言形式的概率或頻數(shù)高低為證據(jù)取舍標(biāo)準(zhǔn);研究根植于真實語言使用,內(nèi)容涵蓋詞語搭配、固定和半固定表達、成語、不完整的詞語片語等豐富復(fù)雜的語言形式”。(衛(wèi)乃興2007)研究者(Sinclair1991;Renouf & Sinclair1991;Altenberg1998;Cowie1999;Wray2005;Granger & Meunier2008)關(guān)注詞語的形式、意義和功能的共選特征,將短語視為意義最重要的承載單位。這種研究范式不僅為詞典編纂提供了真實、客觀的語言證據(jù),更是為語言觀察和描寫增加了新視角,其中最顯著的變化就是增加了大量以詞語和語法結(jié)合形式出現(xiàn)的短語信息。
Moon(2007)從短語信息記錄的角度,將出版于1987年的第一部基于語料庫數(shù)據(jù)編纂的學(xué)習(xí)型詞典——《柯林斯COBUILD英語詞典》(Collins COBUILD English Language Dictionary)與分別出版于1974年和1978年的《牛津高級英語學(xué)習(xí)者詞典》(Oxford Advanced Learners Dictionary of Current English)和《朗文當(dāng)代英語詞典》(Longman Dictionary of Contemporary English)進行了對比。以FACT為例,牛津和朗文詞典中FACT詞條所占版面較小,而柯林斯詞典中該詞條的篇幅大幅增加,其義項增加了約一倍,多達15個。之所以占據(jù)大量篇幅,是因為柯林斯詞典對于FACT的短語信息進行了詳盡的分類和描述。與之形成鮮明對比的是,牛津和朗文詞典中僅列舉了寥寥幾個短語用法。Moon(2008)進一步考察了單語、學(xué)習(xí)型及雙語詞典中搭配及短語收錄情況。數(shù)據(jù)顯示,學(xué)習(xí)型詞典中的搭配詞語信息最多,且較之之前出版的詞典,基于語料庫編纂的詞典中的短語信息更為豐富。另一方面,作者認(rèn)為,盡管研究中所涉及的基于語料庫編纂的詞典已經(jīng)在短語信息收錄方面比以往的詞典有了巨大的進步,但是這些詞典仍然或多或少缺乏短語信息的參考。
研究者(Walker2009; Ferraresi et al. 2010; Granger & Lefer2012;Paquot2015)從不同的角度驗證了Moon(2007,2008)的觀點,并發(fā)現(xiàn)在目前的主流英語學(xué)習(xí)型詞典中,在短語信息的收錄和編排方面尚存以下問題: 1) 不同的詞典之間在搭配詞的收錄方面存在嚴(yán)重不一致現(xiàn)象;2) 詞典傾向于收錄最為高頻的搭配詞,對于中低頻詞的搭配詞則很少收錄;3) 與其他類型的詞典比較,單語詞典中的短語信息最為匱乏;4) 在當(dāng)前詞典編纂實踐中,除了搭配之外,詞語的短語信息同樣被忽視;5) 詞典中收錄的短語信息大量以次詞條或例子的形式記錄,僅有少量以詞條形式收錄。
學(xué)習(xí)型詞典短語收錄和編排方式對于用戶的查詢體驗具有直接的影響。首先,部分短語信息的缺失影響了查得率;其次,所收錄短語的編排方式也存在用戶友好性等方面問題,例如,用戶常難以確定應(yīng)該在短語的哪一個詞下查詢該短語(徐海2013)。鑒于已有研究大多聚焦紙質(zhì)版詞典中的短語信息,鮮有針對在線詞典的研究,本研究以touch及其名詞和形容詞搭配詞為出發(fā)點,以語料庫數(shù)據(jù)驅(qū)動的方法,觀察touch的短語學(xué)特征,并將觀察結(jié)果與主流在線英語學(xué)習(xí)型詞典(以下簡稱“在線詞典”)中的相關(guān)記錄進行對比,管窺在線詞典短語的收錄及編排情況。在線詞典在信息存儲空間、查詢方式、查詢界面和更新速度等方面明顯優(yōu)于紙質(zhì)版詞典,因此我們關(guān)注存在于紙質(zhì)版詞典中短語信息收錄和編排方面的問題是否已經(jīng)得到解決。選擇touch作為觀察對象,是因為touch是高頻詞語,且具有名詞和動詞兩種詞性,以及豐富的短語信息。
二、 研究思路和方法
本研究以語料庫數(shù)據(jù)驅(qū)動的方法,基于美國當(dāng)代英語語料庫(Corpus of Contemporary American English,簡稱COCA)[1](Davis2014),觀察touch的短語信息在劍橋[2]、朗文[3]、柯林斯[4]在和麥克米倫[5]等四部在線詞典中的記錄情況[6],尤其關(guān)注其名詞和形容詞搭配詞。
? 本研究的具體研究步驟如下:?
1. 在COCA語料庫中檢索與touch顯著共現(xiàn)的形容詞和名詞搭配詞(MI值大于3),選取頻次最高的10個形容詞和10個名詞搭配詞作為研究對象(詳見表1)。搭配詞的共現(xiàn)信息是詞典編纂過程中的重要參考依據(jù)。(Kilgarriff1997)編纂者傾向于收錄最為高頻的搭配詞,而忽視中、低頻詞的搭配詞。(Walker2009)本研究聚焦高頻搭配詞,觀察受到編纂者“偏愛”的短語信息是否被在線詞典充分收錄,以及是否以便于查詢的方式編排;
2. 基于COCA語料庫索引行,分析并歸納在真實語境下,touch與高頻搭配詞構(gòu)建的短語信息,包括連續(xù)性和非連續(xù)性短語信息;
3. 查詢在線詞典,分別以短語查詢和文內(nèi)檢索兩種方式,獲取詞典中短語和搭配信息。通過短語查詢,觀察短語是否被收錄,以及是否以詞條形式編排;通過文內(nèi)檢索,窮盡在線詞典中touch詞條下以釋義和例子等方式記錄的全部短語信息;
4. 對比語料庫與在線詞典記錄信息,觀察在線詞典短語收錄和編排情況。
三、 數(shù)據(jù)與討論
(一) COCA語料庫中touch與搭配詞的短語信息
根據(jù)短語意義的透明或非透明情況,touch與20個搭配詞組成的連續(xù)性或非連續(xù)性短語可以分為三組搭配形式。首先,由形容詞+名詞或名詞+名詞構(gòu)成專有名詞短語(5個),包括therapeutic touch和healing touch等(詳見表2)。其中,touch screen(s)和iPod touch是近十年出現(xiàn)的電子產(chǎn)品,而therapeutic touch和healing touch則屬于擁有注冊商標(biāo)的另類或替代療法(alternative therapy)。此類專有名詞短語結(jié)構(gòu)非常穩(wěn)定,鮮有形式上的變化,且意義透明、指向明確。
? 所謂短語或搭配意義透明(compositional),是指整個短語的意義是其中單個詞語意義的簡單疊加。(Stubbs2001)例如,如果了解gentle和touch的含義,那么當(dāng)它們作為一個短語gentle touch出現(xiàn)時,通過疊加詞義可以了解該詞塊的含義為“輕微的或溫柔的觸摸”,因此稱之為透明短語。非意義透明(noncompositional)短語則與之相反,即其整體意義難以通過簡單的詞語意義疊加獲得。例如,touch base (with somebody)的含義“當(dāng)面聊聊”或“(與……)聯(lián)系(或接觸、接洽)”,與其中單個詞語意義的簡單疊加相去甚遠。然而,需要指出的是,透明短語與非透明短語的劃分并非完全客觀。例如,healing touch雖然被歸類為透明詞塊,但是touch本身的含義在很大程度上被弱化了,該短語的意義并非完全透明。
(1) If the kids decide mom is a soft touch and dad is the heavy, theyll soon be wanting to stay at moms all the time.
(2) The ice caves add a nice touch to what could have been a typical roller coaster.
短語意義是否透明對于學(xué)習(xí)者的習(xí)得和認(rèn)知具有重要的影響。在面對透明短語的時候,學(xué)習(xí)者如果了解其中詞語的基本意義,通常不需要借助詞典即可大致了解短語含義;而對于非透明短語,則需要語境及詞典才能對其進行解讀。當(dāng)然,存在具有誤導(dǎo)性的“透明短語”。例如,沒有充分語境信息的情況下,soft touch容易被學(xué)習(xí)者憑字面含義理解為“柔軟的觸感”。語料庫證據(jù)顯示,不同于上述意義,例(1)中的“soft touch”義為“容易被欺騙/說服的人”或“耳根子軟的人”。因此,詞典記錄對于學(xué)習(xí)者解讀非透明短語具有重要意義。
其次,由形容詞+名詞、動詞+名詞或者名詞+動詞組成的連續(xù)或非連續(xù)意義透明短語(6個),包括gentle和tender等形容詞,以及reality和finger等名詞(詳見表2)。這些形容詞及名詞都與關(guān)鍵詞touch顯著共現(xiàn),構(gòu)成形式半固定,且意義較為透明的短語。例如,gentle和reality分別與touch構(gòu)成gentle touch和(be/lose/remain/get)(in/out)of touch with reality等短語。這些意義透明短語屬于一般意義上的搭配,其中“詞項的搭配力、結(jié)構(gòu)可變性和語義明晰性都顯示出一定程度的‘有限性”(衛(wèi)乃興2002),因此也可以稱為有限組合(restricted combinations)。大多數(shù)情況下,它們的意義可以通過解讀其中的詞語意義獲得。在少數(shù)例外的情況中,一些較為透明的搭配詞,例如,tender和gentle的部分用法也需要語境才能解讀其特殊含義。
(3) We were playing electric keyboards, which only require a very light touch.
(4) Porat said they meet with her team on a regular basis: the days of the “l(fā)ight touch” regulatory approach are over.
最后,由形容詞和名詞與touch構(gòu)成的形容詞+名詞以及動詞+名詞意義非透明短語(9個)。這些短語的形式較為固定,但意義卻非透明,其中包括nice和soft等形容詞,以及toes和bases等名詞(詳見表2)。這些詞與touch搭配的時候,在特定語境中共同表達并非詞語字面含義簡單相加的隱含意義。例如,nice touch常常用于描述“對于整體有提升或改善作用的小且非必要的細節(jié)”。例(2)中的nice touch需根據(jù)語境理解為“很好的感覺”,而不是按照字面意思,翻譯成“良好的觸感”。需要說明的是,非透明短語有時也表達“透明”含義,需要根據(jù)語境具體分析。如例(3)和例(4)中,light touch分別表達透明含義“輕觸”和非透明含義“寬松的管控”。
(二) touch短語信息在四部在線詞典中的總體分布情況
我們將詞典中的短語信息存在形式分成四類進行記錄,分別是釋義、例子、詞條,以及信息缺失(詳見表3,分別用“#”“*”“+”和“!”標(biāo)識)。
首先,在第一組專有名詞短語中,僅有touch screen(s)以詞條的形式出現(xiàn)在全部四部在線詞典中,與之形成對比的是,therapeutic touch僅以詞條形式出現(xiàn)在柯林斯一部在線詞典中,而healing touch和iPod touch沒有以任何形式被記錄在本研究所調(diào)查的四部在線詞典中??傮w而言,四部在線詞典中的專有名詞短語記錄大量缺失(詳見表4)。此外,值得商榷的是,既然柯林斯在線詞典已經(jīng)收錄了therapeutic touch,那么與其類似的healing touch療法也應(yīng)該進行記錄。
其次,在線詞典中關(guān)于意義透明的有限組合短語的記載較為少見(詳見表4)。全部6個搭配詞與touch構(gòu)成的意義透明短語都沒有以詞條的形式出現(xiàn)在詞典記錄中,也就是說,詞典用戶無法直接在詞典中檢索到這些短語。此外,除finger在四部在線詞典的touch詞條中出現(xiàn)在釋義或者例句中外,其余5個詞僅零星出現(xiàn)在釋義或者例句中(共6次,見表3)。其中,tender甚至從未以任何形式出現(xiàn)在四部在線詞典中。對于詞典用戶而言,在面對此類意義透明的半固定搭配短語時,解讀例(3)和例(4)語境中touch的含義并沒有很高的難度,因此,詞典中記錄的缺失并不會影響學(xué)習(xí)者的使用。
? 最后,相對而言,四部在線詞典中對于非透明短語的記錄更加豐富,共出現(xiàn)32次,占全部短語記錄的60.4%(詳見表4)。如表3所示,四部在線詞典都以詞條,也就是可以直接檢索獲取的方式記錄了soft touch和touch bases的短語信息,并且提供例句以便用戶參考;除劍橋詞典以例句的方式呈現(xiàn)外,其余三部詞典都以詞條的方式記錄了soft touch短語。在四部在線詞典中,共有短語詞條記錄15個,短語信息缺失也相對較少(詳見表4)。短語信息以詞條的方式收錄和編排最有利于學(xué)習(xí)者的查詢,不過也給詞典編纂者進行詞條釋義帶來了挑戰(zhàn)。編纂者需要標(biāo)注詞語在短語中的含義,同時還需要解釋短語作為整體的意義。因此,編纂者還以另一種方式處理非透明短語,即在釋義或例子中展示非透明短語。四部在線詞典中共出現(xiàn)14次非透明短語的例子,分列于不同的義項之下。例(5)和例(6)分別來自劍橋和朗文在線詞典:?
(5) He has a deft touch with tricky painting jobs.
(6) There was a vase of flowers in the room, which was a nice touch.
對于用戶而言,在劍橋和朗文在線詞典中分別查詢例(5)和例(6)中的deft touch和nice touch,首先需要在詞典中依次閱讀touch的義項,然后找到正確的義項(分別是ABILITY和DETAIL/ADDITION)(詳見圖1和圖2),解讀釋義,再根據(jù)例子分析短語意義。這對于詞典用戶,尤其是初級學(xué)習(xí)者而言,存在一定的查閱難度。
此外,對于本組中個別搭配詞而言,例句數(shù)量明顯不足(詳見表2)。四部在線詞典中,僅有劍橋在線詞典給出了deft touch的例句,其他詞典沒有例句或者釋義輔助解讀;僅有劍橋在線詞典和柯林斯在線詞典在釋義中用slight(ly)解釋touch作為動詞和名詞都有極少的數(shù)量或程度的含義。不管是以例句還是釋義的方式展示短語信息,對于用戶而言,都存在一定的查詢和解讀方面的問題。對于學(xué)習(xí)者而言,如果沒有經(jīng)過詳細的指導(dǎo)和充分地實踐,很難有效地利用詞典。(Wingate2004)以下我們將進一步分析四部在線詞典在短語收錄和編排方面存在的問題。
(三) 四部在線詞典在短語收錄和編排方面的問題
首先,各詞典在短語收錄和編排方面缺乏統(tǒng)一標(biāo)準(zhǔn)。僅計算可直接檢索短語詞條的情況下,各在線詞典間的記錄數(shù)并無顯著差異(詳見表3),劍橋在線詞典的記錄最少,只有4次,柯林斯在線詞典的記錄最多,達到8次。從短語總記錄的角度衡量,各在線詞典間的記錄同樣沒有明顯差異,多則15次,少則11次(詳見表3)。然而,將對比具體到單個搭配詞,各詞典間記錄的不一致性就凸顯了出來。
四部在線詞典僅僅就soft,screen(s),fingers,bases與touch搭配的短語信息達成了一致,即都以詞條或都以釋義的形式幫助用戶理解,僅占全部短語的25%。如果將四部在線詞典touch詞條下都沒有相關(guān)記錄的tender,reality和iPod也加入統(tǒng)計的話,那么詞典間短語信息記錄的一致性為40%。各詞典對于其他詞語與touch構(gòu)成的短語處理方式各異。據(jù)表3顯示,僅有一部詞典收錄了deft,reality,cheek與touch的搭配信息;僅有兩部詞典分別收錄了gentle,delicate,slight,toes與touch的搭配信息。各詞典在收錄touch的短語信息方面并無明確的標(biāo)準(zhǔn)。
以slight(est) touch及l(fā)ight(er) touch為例。slight(est)和touch在COCA語料庫中共現(xiàn)61次,其中8次組成非透明短語。例(7)中的slightest touch不能按照詞語的字面意思理解,而應(yīng)按照朗文在線詞典中的次詞條A TOUCH OF SOMETHING中touch的釋義進行解讀。在A TOUCH OF SOMETHING次詞條中,touch意為“少量的東西”(a small amount of something),則例(7)可以理解為“‘瘋狂的紅發(fā)魔鬼,她用清晰的、只略帶英國口音的英語說到”。四部在線詞典中,僅有劍橋和柯林斯詞典在釋義中將a touch釋義為slightly,其余兩部詞典沒有以任何形式記錄slight(est)和touch構(gòu)建的短語。
(7) “Crazy red head devil,” she says in clear English with just the slightest touch of an English accent.
(8) But when the cops tried a lighter touch and the result was more looting and arson, that was criticized too.
(9) Sometimes even a light touch on the face is enough to trigger off this pain.
Light(er) touch在COCA中出現(xiàn)45次,根據(jù)語境信息,其中將近一半(21次)并非表達字面含義“輕微地碰觸”,而是表達例(8)中“寬松的管控”。劍橋和麥克米倫詞典對于light touch的記錄較為詳盡,其余兩部詞典沒有l(wèi)ight touch的相關(guān)記錄。例(9)是柯林斯詞典touch詞條中的例子,不過其中的light touch意義透明,表達“輕微的接觸”。因此,橫向比較各詞典之間有關(guān)touch的詞條記錄(詳見表3),不難發(fā)現(xiàn),各詞典間對于touch的搭配詞和短語信息記錄缺乏一致性,無統(tǒng)一標(biāo)準(zhǔn),記錄不一致。
其次,各詞典在處理短語信息時欠缺內(nèi)部一致性,即在具有統(tǒng)計學(xué)意義的復(fù)現(xiàn)短語時方式各異,甚至對部分短語選擇性忽視。以麥克米倫在線詞典為例,本研究所涉及的9個非透明短語中,麥克米倫在線詞典僅對其中6個以詞條的方式進行收錄,而對于其他3個短語的意義和用法[nice touch,slight(est) touch和slight(est) touch],則沒有給予任何解釋或說明(詳見表3)。作為收錄touch短語信息最豐富的在線詞典(共15次,詳見表3),劍橋在線詞典在處理短語信息時,同樣缺乏內(nèi)部一致性。詞典編纂者給予了soft touch,light(er) touch及touch bases詞條的地位,卻僅以示例的形式展示nice touch,finishing touch,deft touch及at a/the touch of a button等短語,卻忽視了touch your toes這個意義非透明短語。
最后,僅部分短語被以短語詞條的形式收錄和編排,且短語詞條并不具備真正詞條的地位。本研究將在線詞典中可直接檢索得到的短語稱為短語詞條,即詞典編纂者給予了該短語詞條的地位,以詞條的形式收錄編排。對于詞典用戶而言,短語詞條是檢索短語信息最便捷和最高效的信息編排方式。然而,數(shù)據(jù)顯示,在本研究所統(tǒng)計的短語中,僅有不到半數(shù)(45.3%)(詳見表4)以短語詞條的形式收錄和編排在四部詞典當(dāng)中,大多數(shù)短語仍僅僅出現(xiàn)在釋義和例句中。由此可見,短語詞條仍然并非是詞典編纂者收錄和編排短語的首選方式。更為重要的是,對比各在線詞典中的短語詞條與單詞詞條記錄,不難發(fā)現(xiàn),短語詞條通常篇幅較小,且其中的信息較不充分。
以soft touch為例,四部在線詞典都以詞條的方式收錄和編排該短語(詳見圖3—圖6),不過并未給予充分的解讀。僅有劍橋在線詞典給出了單復(fù)數(shù)和讀音信息,其他三部詞典只提供了釋義,且沒有任何一部詞典給出例句、同反義詞或者搭配詞等在其他單詞詞條中常見的信息。當(dāng)然并非所有的短語詞條都缺乏例證信息。例如,在處理touch bases詞條時,各詞典都給出了至少一個例句(朗文詞典給出兩個例句及一個語料庫例句),不過仍然缺乏同反義詞及搭配詞等信息。顯而易見,盡管詞典編纂者給予了soft touch和touch bases詞條的地位,但卻沒有真正將其視為詞條或給予充分描述。
Sinclair(2010)在討論多詞單位在詞典中的處理方式時,認(rèn)為未來多詞單位(短語)應(yīng)該在詞典中獲得與普通單詞詞條相同的地位。關(guān)于如何將短語單位以更加方便查詢和解讀的方式收錄到詞典中,Sinclair(1996)認(rèn)為應(yīng)該將擴展意義單位(extended units of meaning)作為研究的起點。擴展意義單位以節(jié)點詞為核心,在其周圍吸引其他詞語與其共現(xiàn),并形成固定的形式,由節(jié)點詞、核心搭配、類聯(lián)接、語義選擇趨向、語義韻等5個要素組成。擴展意義單位的標(biāo)準(zhǔn)形式往往就是其最簡形式,其變體就是其完全形式(full canonical form)。對于每一個不同的意義單位,都有一個擴展意義單位的完全形式與其對應(yīng)。以in touch為例,作為擴展意義單位的標(biāo)準(zhǔn)形式,其變體可以是keep in touch with,keep可以被get、stay和be等動詞替換,成為形式不同、但通常表達積極語義韻的擴展意義單位完全形式。收錄擴展意義單位的標(biāo)準(zhǔn)形式及其變體的詞典被Sinclair視為詞典的發(fā)展方向,其稱為“終極詞典”(ultimate dictionary)。(Sinclair & Teubert2004)
當(dāng)然,擴展意義單位及“終極詞典”并非短語單位收錄和編排的唯一路徑?;诳蚣苷Z義學(xué)(Frame Semantics)的FrameNet工程(Fillmore et al. 2003)及基于常態(tài)與拓展理論(Theory of Norms and Exploitations)的英語動詞形式詞典(Pattern Dictionary of English Verbs)(Hanks2004)等網(wǎng)絡(luò)短語詞典都是對于短語單位辨識和詞典收錄的有益嘗試。
四、 結(jié)語
本文基于COCA語料庫數(shù)據(jù),以touch為例,辨識其在真實語境下與名詞和形容詞搭配詞組成的短語,并對比四部主流在線英語學(xué)習(xí)型詞典中的短語記錄,以此考察在線詞典的短語收錄及編排情況。研究顯示,存在于紙質(zhì)版詞典中短語信息收錄和編排方面的問題并未得到有效解決: (1) 在線英語學(xué)習(xí)型詞典在短語記錄方面存在明顯缺失,大量短語信息沒有以任何形式收錄在四部在線詞典中,在短語查得率方面有較大提升空間;(2) 在短語信息編排方面,在線詞典普遍存在用戶友好性問題。記錄在四部詞典中的短語信息僅有不到一半(453%) 以可直接檢索的短語詞條的形式收錄和編排。其余短語信息以釋義或例子的方式展示,對于用戶而言,查詢此類信息存在一定困難;(3) 四部在線詞典僅就不到半數(shù)(40%)的短語信息收錄達成了一致,各詞典間并沒有統(tǒng)一的短語信息收錄和編排標(biāo)準(zhǔn),且各詞典在處理短語信息時欠缺內(nèi)部一致性。此外,與單詞詞條比較,短語詞條通常篇幅較小,且其中的信息較不充分。
我們認(rèn)為,詞典編纂者可以從以下四個方面著手,解決本研究中發(fā)現(xiàn)的問題。首先,在短語信息的收錄方面,在線詞典的短語信息收錄不必顧慮詞典容量問題,應(yīng)該盡可能將短語,尤其是意義非透明短語收錄其中。值得一提的是,在四部在線詞典中,我們觀察到了迥異于紙質(zhì)版詞典的信息記錄和編排方式,即眾源編纂(Crowdsourcing)和語料庫例證。從用戶的角度來看,這兩種設(shè)計豐富了在線詞典中的信息,并且為檢索查詢提供了便利。例如,在麥克米倫詞典的檢索界面中,檢索soft touch,會得到圖6中的記錄,即該詞條是詞典用戶在眾源編纂方式下提供的釋義。眾源編纂在近年來被越來越多的學(xué)者所倡導(dǎo)(Cˇibej et al2015),是在線詞典未來發(fā)展的方向之一。詞典檢索結(jié)果中的語料庫補充信息也極大地拓展了詞典的內(nèi)容。用戶在詞條其他部分無法獲取有效幫助的情況下,可以嘗試在語料庫例證版塊查找相關(guān)用法,幫助解碼。其次,在短語信息的編排方面,不應(yīng)該將短語作為單詞詞條的次詞條,或者以釋義或例子的形式展示,而是應(yīng)該給予其與單詞詞條同等的地位,方便用戶直接檢索。此外,給予短語詞條更加充分的描寫,增加讀音、例子、同反義詞及搭配詞等單詞詞條必備的信息。再次,制定可行的短語信息識別、標(biāo)注、收錄及編排標(biāo)準(zhǔn),解決詞典在處理短語信息時的內(nèi)部一致性缺失問題,并改善各詞典間收錄短語信息不一致的問題。最后,借鑒網(wǎng)絡(luò)短語詞典和“終極詞典”等辭書設(shè)計理念,增強在線詞典中短語信息的數(shù)量和質(zhì)量。
附 注
[1]截至2018年4月,COCA語料庫的庫容為5.6億詞。
[2]https:∥dictionary.cambridge.org/
[3]https:∥www.ldoceonline.com/
[4]https:∥www.collinsdictionary.com/
[5]https:∥www.macmillandictionary.com/
[6]本研究中在線詞典查詢時間截至2018年4月4日。
參考文獻
1. 戴遠君,徐海.電子詞典研究現(xiàn)狀與展望.辭書研究,2014(4): 19.
2. 衛(wèi)乃興.詞語搭配的界定與研究體系,上海: 上海交通大學(xué)出版社,2002: 60.
3. 衛(wèi)乃興.中國學(xué)生英語口語的短語學(xué)特征研究——COLSEC語料庫的詞塊證據(jù)分析.現(xiàn)代外語,2007(3): 280291.
4. 徐海.短語學(xué)與英語短語的詞典收錄及編排.辭書研究,2013(5): 4652.
5. Altenberg B. On the Phraseology of Spoken English: The Evidence of Recurrent Wordcombinations. ∥Cowie A P.(ed.) Phraseology: Theory, Analysis and Applications. Oxford: Oxford University Press, 1998: 101122.
6. Atkins S, Rundell M. The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press, 2008.
7. Cˇibej J, Fier D. Kosem I. The Role of Crowdsourcing in Lexicography. Electronic Lexicography In the 21st century: Linking Lexical Data in the Digital Age. Proceedings of the Elex conference, 2015: 7083.
8. Cowie P. Phraseology and Corpora: Some Implications for Dictionarymaking. International Journal of Lexicography, 1999(4): 307323.
9. Davies M. The Corpus of Contemporary American English (COCA). Canadian Journal of Chemistry, 2014(1): 915.
10. Ferraresi A, Silvia B, Picci G. et al. Web Corpora for Bilingual Lexicography: A Pilot Study of English/French Collocation Extraction and Translation.∥Richard X.(ed.) Using Corpora in Contrastive and Translation Studies. Newcastle: Cambridge Scholars Publishing, 2010: 337362.
11. Fillmore J, Johnson R, Petruck L. Background to Framenet. International Journal of Lexicography, 2003(3): 235250.
12. Granger S, Lefer M. Towards More and Better Phrasal Entries in Bilingual Dictionaries. Paper Presented at the Proceedings of the 15th EURALEX International Congress, 2012.
13. Granger S, Meunier F. Phraseology: An Interdisciplinary Perspective. Amsterdam: John Benjamins Publishing, 2008.
14. Granger S, Paquot M. Electronic Lexicography. Oxford: Oxford University Press, 2012.
15. Hanks P. The Syntagmatics of Metaphor and Idioms. International Journal of Lexicography, 2004(3).
16. Hanks P. The Impact of Corpora on Dictionaries. Contemporary Corpus Linguistics, 2009: 214236.
17. Kilgarriff A. Putting Frequencies in the Dictionary. International Journal of Lexicography, 1997(2): 135155.
18. Kilgarriff A, Husk M, McAdam K. et al. GDEX: Automatically Finding Good Dictionary Examples in a Corpus. Paper Presented at the Proc. Euralex, 2008.
19. Moon R S. Lexicography and the Cobuild Project: The Application of Theory. International Journal of Corpus Linguistics, 2007(2): 159181.
20. Moon R. Dictionaries and Collocation. Phraseology. An Interdisciplinary Perspective. Amsterdam: John Benjamins Publishing, 2008: 313336.
21. Paquot M. Lexicography and Phraseology. The Cambridge Handbook of Corpus Linguistics. Cambridge: Cambridge University Press, 2015.
22. Renouf A, Sinclair J. Collocational Frameworks in English.∥Aijmer K, Altenberg B. (eds.) English Corpus Linguistics: Studies in Honour of Jam Svartvik. London: Longman, 1991: 128143.
23. Sinclair J. Looking up: An Account of the COBUILD Project in Lexical Computing and the Development of the Collins COBUILD English Language Dictionary. London: Collins Elt, 1987.
24. Sinclair J. Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.
25. Sinclair J. The Search for Units of Meaning. Textus, 1996(IX): 75106.
26. Sinclair J. Defining the Definiendum.∥De Schryver G.M. (ed.) A Way with Words: Recent Advances in Lexical Theory and Analysis. Kampala and Ghent: Menha Publishers, 2010: 3747.
27. Sinclair J, Teubert W. Interview with John Sinclair Conducted by Wolfgang Teubert.∥Sinclair J, Jones R, Teubert W, et al. English Collocation Studies: The OSTI Report. London: Continuum International Publishing Group Ltd, 2004: IV.
28. Stubbs M. Words and Phrases: Corpus Studies of Lexical Semantics. Oxford: Blackwell Publishers Oxford, 2001: 220.
29. Walker C. The Treatment of Collocation by Learners Dictionaries, Collocational Dictionaries and Dictionaries of Business English. International Journal of Lexicography, 2009(3): 281299.
30. Wingate U. Dictionary Use — the Need to Teach Strategies. Language Learning Journal, 2004(1): 511.
31. Wray A. Formulaic Language and the Lexicon. Cambridge: Cambridge University Press, 2005.
(復(fù)旦大學(xué) 上海 200433)
(責(zé)任編輯 劉 博)