李更春
(浙江廣播電視大學(xué)外國(guó)語(yǔ)學(xué)院,浙江杭州,310030)
傳統(tǒng)上,詞匯通常被認(rèn)為是一個(gè)個(gè)的單詞。當(dāng)然,這種觀點(diǎn)現(xiàn)在已被證明是不恰當(dāng)?shù)?,因?yàn)樵~匯還包括許多大于正字法單詞的語(yǔ)言單位,如give up, burn the midnight oil, one of the most等。對(duì)大型語(yǔ)料庫(kù)的分析表明,這些多詞詞匯單位(multi-word unit)至少在英語(yǔ)中[1],尤其在口頭話語(yǔ)中是無(wú)處不在的[2]。實(shí)際上,大量的研究表明,語(yǔ)言在很大程度上是由程式化成分構(gòu)成的[3?10]。楊玉晨[11](24)甚至認(rèn)為,自然話語(yǔ)中的90%是由那些處于單詞和固定短語(yǔ)之間的半固定的“板塊”結(jié)構(gòu)來(lái)實(shí)現(xiàn)的。不同的學(xué)者賦予了這種語(yǔ)言結(jié)構(gòu)以不同的名稱(chēng),如 lexical phrases[12]、lexical chunks[13]、multi-word items[1]、lexical bundles[7]、formulaic sequences[14?16]、 multi-word units[17]、 morpheme equivalent unit[18]等。這些術(shù)語(yǔ)的定義雖各不相同,但亦有重疊之處,所指稱(chēng)的現(xiàn)象也是同中有異,較易混淆。此外,學(xué)者們?cè)趯?duì)什么是程式語(yǔ)這一問(wèn)題上意見(jiàn)不一,在程式語(yǔ)的識(shí)別標(biāo)準(zhǔn)上也是各持己見(jiàn)。這在一定程度上阻礙了不同學(xué)科中程式語(yǔ)研究的交流與借鑒,使人們難以全面地認(rèn)識(shí)和領(lǐng)會(huì)程式性現(xiàn)象的本質(zhì)和功能并自覺(jué)地應(yīng)用于語(yǔ)言理解、產(chǎn)出與習(xí)得等過(guò)程中。本文擬對(duì)程式語(yǔ)的各種識(shí)別標(biāo)準(zhǔn)進(jìn)行梳理和評(píng)析,以期為進(jìn)一步的研究打下一定的基礎(chǔ)。
Wray和 Perkins[19](1)從心理表征的角度將“程式語(yǔ)”(formulaic sequences)定義為“一個(gè)由單詞或其他意義成分組成的連續(xù)或非連續(xù)的序列,該序列是或看起來(lái)是預(yù)制的,即在使用時(shí)是從記憶中整體提取或存儲(chǔ)的而不是通過(guò)語(yǔ)言的語(yǔ)法生成或分析的”。該定義既涵蓋了那些具有高度習(xí)用性且不可改變的單詞串(如by and large)又包括了那些語(yǔ)義上透明、句法上靈活、含有空槽且其中可填入開(kāi)放詞類(lèi)的單詞串(如 NP be-TENSE sorry to keep-TENSE you waiting)。此后,Wray[16](9)對(duì)上述定義進(jìn)行了修正,將“意義”一詞從該定義中刪去。在該定義的基礎(chǔ)上,我們將程式語(yǔ)重新定義為:某言語(yǔ)社團(tuán)以整體形式辨識(shí)、存儲(chǔ)和提取,連續(xù)或非連續(xù)、具有較完整的結(jié)構(gòu)與意義/功能或參與語(yǔ)篇構(gòu)建、使用頻率較高的多詞單位。該定義既涵蓋了傳統(tǒng)語(yǔ)法所認(rèn)可的程式化表達(dá)(如習(xí)語(yǔ)、諺語(yǔ)、短語(yǔ)/詞組以及其他類(lèi)別的固定表達(dá)),又涵蓋了通過(guò)語(yǔ)料庫(kù)驅(qū)動(dòng)方法識(shí)別的多詞單位或詞束。
程式語(yǔ)在構(gòu)成與功能上非常多樣,它們可以是填充詞(如sort of),簡(jiǎn)單的功能短語(yǔ)(如excuse me),詞語(yǔ)搭配(如tell a story),習(xí)語(yǔ)或諺語(yǔ)(如back to square one, let’s make hay while the sun shines),以及較長(zhǎng)的標(biāo)準(zhǔn)化短語(yǔ)(如there is a growing body of evidence that……)。正是因?yàn)槠浯嬖谛问脚c語(yǔ)言功能的多樣性,所以目前很難對(duì)該現(xiàn)象下一個(gè)全面的定義,這種對(duì)定義的缺乏一直是該領(lǐng)域亟待解決的問(wèn)題之一。在這種情況下,如何準(zhǔn)確、可靠、全面地識(shí)別出語(yǔ)言使用中的程式語(yǔ)呢?不同的研究者往往采用不同的標(biāo)準(zhǔn)進(jìn)行判定。我們大致可以將這些標(biāo)準(zhǔn)分為3類(lèi):① 基于語(yǔ)言學(xué)特征的識(shí)別標(biāo)準(zhǔn)[1,10,19?20];② 基于使用頻率的識(shí)別標(biāo)準(zhǔn)[7,21?27];③ 基于學(xué)習(xí)者語(yǔ)言產(chǎn)出的識(shí)別標(biāo)準(zhǔn)[28?32]。下文將分而述之。
有些學(xué)者通過(guò)對(duì)程式語(yǔ)語(yǔ)言學(xué)特征的研究,總結(jié)出判別程式語(yǔ)的一些標(biāo)準(zhǔn)。
Moon[1](44)認(rèn)為,程式語(yǔ)具有以下3個(gè)特征,即:① 慣例化(institutionalization),指的是某多詞項(xiàng)目被該言語(yǔ)社團(tuán)視作一種單位的程度;② 固定性(fixedness),指的是某多詞項(xiàng)目作為一種單詞序列而凝固的程度;③ 非組構(gòu)性(non-compositionality),指的是某多詞項(xiàng)目不能以單詞為基礎(chǔ)進(jìn)行解讀而具有一種特殊的整體意義的程度。其中,固定性與非組構(gòu)性(或非透明性)是學(xué)者們普遍接受的標(biāo)準(zhǔn),但這些標(biāo)準(zhǔn)被證實(shí)為一種連續(xù)體,這種情況增加了區(qū)分程式化與非程式化表達(dá)的難度[33](33)。Hudson[20](8?9)總結(jié)了有關(guān)固定表達(dá)(fixed expressions)研究中經(jīng)常使用的4種標(biāo)準(zhǔn):① 對(duì)其組成部分的意料之外的句法限制,即那些我們通常不會(huì)預(yù)料到的對(duì)句法變異性(syntactic variability)的限制,例如:數(shù):the other day,*the other days(對(duì)比 the other boy – the other boys);冠詞:strike a light!,*strike the light!(對(duì)比 strike a match – strike the match);詞序:trials and tribulations,*tribulations and trials(對(duì)比 sorrow and pain – pain and sorrow)。② 對(duì)該表達(dá)中的單詞在搭配上的意料之外的限制,即與我們通常預(yù)料的不同,該表達(dá)的某部分并不能被來(lái)自相關(guān)集合的項(xiàng)目所替換,例如:first of all,*second of all(對(duì)比 first in line – second in line);above board,*below board(對(duì)比 above standard – below standard);disaster area,*catastrophe area(對(duì)比 major disaster –major catastrophe);how do you do,*how do they do(對(duì)比 how do you do it – how do they do it);類(lèi)似地,對(duì)此類(lèi)表達(dá)的修改通常也受到了限制,例如:for good,*for very good;kick the bucket,*kick the plastic bucket。③ 反常的句法或用法,即固定表達(dá)有時(shí)候是不能就其組成部分來(lái)分析的,例如:all of a sudden(形容詞sudden在這里被用作名詞);spick and span(spick和span在當(dāng)代英語(yǔ)中已不再使用)。④ 比喻意義。即其部分與整體之間存在著一種語(yǔ)義上的失配(mis-match),如 a red herring, a hot potato, to kick ass,not much cop, at the end of the day。例如,在a red herring 這個(gè)固定表達(dá)中,red和herring的意義相加并不能得到red herring的意義。Hudson指出,這些標(biāo)準(zhǔn)有時(shí)候是互相矛盾的。例如,(to)sow wild oats根據(jù)“比喻意義”標(biāo)準(zhǔn)可以被視為固定的,但根據(jù)前兩個(gè)標(biāo)準(zhǔn)則并非如此。換句話說(shuō),其組成部分的意義相加不能得到其整體的意義,但該表達(dá)容許很大程度上的變化,與此相反,像all of a sudden這樣的表達(dá)在語(yǔ)義上并不是模糊的,然而根據(jù)可變性標(biāo)準(zhǔn)則是完全固定的?;谶@樣的考慮,Hudson將其對(duì)固定性的定義建立在可變性標(biāo)準(zhǔn)①和②上。
Wray和Perkins[19](5)認(rèn)為,很多程式語(yǔ)并不是通過(guò)語(yǔ)義組構(gòu)的(semantically composed),而是在句法上不規(guī)則的整體項(xiàng)目,如straight from the horse’s mouth或to pull someone’s leg。這種不規(guī)則性表現(xiàn)在兩個(gè)方面:① 對(duì)句法操控(syntactic manipulation)的限制,例如,我們不能使用beat around the bush的復(fù)數(shù)形式,不能使用face the music的被動(dòng)形式,也不能說(shuō)you slept a wink或feeding you up等。② 對(duì)正常約束的違反,例如,那些具有“不及物動(dòng)詞+直接賓語(yǔ)”結(jié)構(gòu)的單詞序列(如come a cropper, go the whole hog)或其他違反句法規(guī)則的語(yǔ)言形式(如by and large)。此外,Wray和Perkins[19](1)將“程式性”定義為“在一串語(yǔ)言項(xiàng)目中,每個(gè)項(xiàng)目與剩下部分的關(guān)系是相對(duì)固定的,且將某項(xiàng)目替換為同一類(lèi)別的項(xiàng)目相對(duì)受到制約”。可見(jiàn),Wray和Perkins是從句法的不規(guī)則性和形式的(相對(duì))固定性來(lái)界定程式性現(xiàn)象的。
Van Lancker-Sidtis和Rallon[10]指出,程式化表達(dá)在以下幾個(gè)方面區(qū)別于新創(chuàng)話語(yǔ):① 它們經(jīng)常包含一些非字面或非標(biāo)準(zhǔn)意義的詞匯項(xiàng)目(如It broke the ice;just in the nick of time)。② 它們一般具有某種態(tài)度或情感上的暗指,而新創(chuàng)話語(yǔ)在情感內(nèi)容上可以是中立的。例如,she has him eating out of her hand暗含著“屈服”“依靠”與“情感依戀”等意義,類(lèi)似地,have a nice day蘊(yùn)含著“愉快”的意義。相比之下,新創(chuàng)表達(dá)the cat is on the chair需要以標(biāo)記性的語(yǔ)調(diào)說(shuō)出或增加形容詞才能表達(dá)特定的情感意義。③ 它們具有一種語(yǔ)音上的連貫性,而新創(chuàng)話語(yǔ)則不具有這種連貫性。此外,它們的措辭和語(yǔ)序都是固定的,語(yǔ)調(diào)也往往一成不變,因?yàn)閷?duì)句子重音的選擇是有限制的。例如,在I wouldn’t want to be in his shoes中,如果我們將句子重音放在 shoes上,那么這句話聽(tīng)起來(lái)就不是那么地道或規(guī)范。④ 程式化表達(dá)是“似曾相識(shí)的”,因?yàn)楸咀逭Z(yǔ)者會(huì)認(rèn)出它們具有這種特殊的地位。例如,See you later!或 Let’s call it a day(言語(yǔ)公式);I’d like to give you a piece of my mind 或 He’s at the end of his rope(習(xí)語(yǔ));以及Look before you leap或He who hesitates is lost(諺語(yǔ))都是“似曾相識(shí)的”,因?yàn)楸咀逭Z(yǔ)者能夠識(shí)別出這些話語(yǔ)、對(duì)它們進(jìn)行補(bǔ)充(當(dāng)省略部分單詞時(shí))以及知道它們的特殊意義以及所適合的語(yǔ)境。
Butler[21](76)根據(jù)其對(duì)西班牙語(yǔ)語(yǔ)篇基于頻率的研究,提出了一種結(jié)構(gòu)或形式上的標(biāo)準(zhǔn),即,“大多數(shù)較長(zhǎng)的重復(fù)的序列是以連詞、冠詞、代詞、介詞或語(yǔ)篇標(biāo)記詞開(kāi)頭的”。然而,這一發(fā)現(xiàn)有待于進(jìn)一步的考察。對(duì)一個(gè)語(yǔ)篇基于直覺(jué)的考察可能會(huì)使我們相信,一個(gè)以某個(gè)介詞為首個(gè)固定成分的單詞序列實(shí)際上是以可填入開(kāi)放詞類(lèi)(如名詞或動(dòng)詞)的空槽開(kāi)頭的。例如,NPibe-TENSE past PROi-POSSESSIVE sell-by date(如This cheese is past its sell-by date, Dad is past his sell-by date)可能被表征為 past PROi-POSSESSIVE sell-by date,但由于該句中充當(dāng)主語(yǔ)的名詞短語(yǔ)必須與代詞同指(co-indexed),所有它對(duì)整個(gè)序列來(lái)說(shuō)是必不可少的。但由于該空槽中的內(nèi)容是可以變化的,所以單靠語(yǔ)料庫(kù)搜索無(wú)法將其識(shí)別為某個(gè)復(fù)現(xiàn)序列的一部分。所以,Butler的觀察只是告訴我們,一個(gè)復(fù)現(xiàn)序列的首個(gè)固定的單詞往往是功能詞或語(yǔ)篇標(biāo)記詞,而不是說(shuō)它一定是以這樣的單詞開(kāi)頭的。
Biber和他的同事們主要通過(guò)語(yǔ)料庫(kù)驅(qū)動(dòng)方法來(lái)識(shí)別話語(yǔ)和/或語(yǔ)篇中的程式語(yǔ)[7,22?27]。他們將出現(xiàn)頻率高于某臨界值且出現(xiàn)在一定數(shù)量語(yǔ)篇中的復(fù)現(xiàn)單詞組合判斷為某種程式語(yǔ)或詞串。但不同的研究者往往根據(jù)不同的研究目的和語(yǔ)料庫(kù)的大小而設(shè)置不同的標(biāo)準(zhǔn)來(lái)識(shí)別語(yǔ)料中的詞串。例如,Biber等人[7]將出現(xiàn)頻率不低于10次/mw且至少出現(xiàn)在5個(gè)不同語(yǔ)篇中的單詞序列視為某種詞串;Cortes[24]將該頻率截?cái)帱c(diǎn)提高至20次/mw;Biber等人[23]更是將之提高到40次/mw。因此,不同的研究得出的結(jié)果往往存在著較大的差異。例如,Altenberg[5]統(tǒng)計(jì)了London-Lund 語(yǔ)料庫(kù)中至少出現(xiàn)兩次的單詞組合,發(fā)現(xiàn)這些復(fù)現(xiàn)組合超過(guò)了該語(yǔ)料庫(kù)詞容的80%;Biber等人[7]發(fā)現(xiàn),3-4詞的詞串占他們研究的會(huì)話的28%,學(xué)術(shù)散文的20%;據(jù)Erman和Warren[8]計(jì)算,各類(lèi)程式語(yǔ)要占到其分析的英語(yǔ)口頭語(yǔ)篇的 58.6%,書(shū)面語(yǔ)篇的 52.3%??梢?jiàn),語(yǔ)言在很大程度上是程式化的,但 Butler[21]和 Moon[34]的研究結(jié)果與此結(jié)論相差甚遠(yuǎn)。Butler發(fā)現(xiàn),在他研究的西班牙語(yǔ)語(yǔ)料庫(kù)(10 000單詞)的口語(yǔ)部分中只有12.5%的語(yǔ)言是程式化的,在兩個(gè)轉(zhuǎn)寫(xiě)的訪談中(均為14 000詞)只有 9%與 8.2%的語(yǔ)言是程式化的。Moon研究了超過(guò) 1 800萬(wàn)詞的 Oxford Hector Pilot Corpus,發(fā)現(xiàn)只有4%~5%的語(yǔ)言是程式化的。
有些學(xué)者對(duì)學(xué)習(xí)者的口頭產(chǎn)出進(jìn)行了研究,在此基礎(chǔ)上提出了判別公式語(yǔ)的另一些標(biāo)準(zhǔn)。
Coulmas[28]指出,某單位必須至少具有兩個(gè)詞素的長(zhǎng)度,且在語(yǔ)音上是連貫的才能被識(shí)別為某種公式語(yǔ)。他還指出,公式語(yǔ)在語(yǔ)法上可能比其他語(yǔ)言更加超前,相對(duì)于學(xué)習(xí)者產(chǎn)出的常規(guī)語(yǔ)言來(lái)說(shuō)在句法和語(yǔ)音上更為復(fù)雜。
類(lèi)似地,Peters[29]也提出了識(shí)別學(xué)習(xí)者語(yǔ)言中的公式語(yǔ)的一些標(biāo)準(zhǔn),即:① 語(yǔ)音連貫性(phonological coherence);② 相對(duì)其他輸出來(lái)說(shuō)更長(zhǎng)且更復(fù)雜;③情景依賴性(situational dependence);④ 高頻性與形式的不變性(invariance in form)。
Weinert[31]在Peters的基礎(chǔ)上對(duì)語(yǔ)言習(xí)得研究中常見(jiàn)的標(biāo)準(zhǔn)進(jìn)行了總結(jié)。這些標(biāo)準(zhǔn)是:① 語(yǔ)音連貫性,即流利的、沒(méi)有遲疑的編碼(fluent, non-hesitant encoding),語(yǔ)調(diào)升降曲線(intonation contour)沒(méi)有中斷;② 與學(xué)習(xí)者其他的輸出相比更長(zhǎng)且更復(fù)雜;③ 在序列中沒(méi)有能產(chǎn)規(guī)則的使用情況;④ 在整個(gè)社團(tuán)內(nèi)廣泛使用(community-wide use);⑤ 特質(zhì)性/不合適的用法;⑥ 情景依賴性;⑦ 高頻性與形式的不變性。
此外,在語(yǔ)言產(chǎn)出研究中,學(xué)者們還使用了一些與流利性相關(guān)的時(shí)間變量(temporal variables)如語(yǔ)速(speech rate)、停頓(pauses)和遲疑現(xiàn)象(hesitation phenomenon)作為公式語(yǔ)的判斷標(biāo)準(zhǔn)。其中后兩種是程式化單位的邊界標(biāo)記(boundary markers)[35](轉(zhuǎn)引自Weinert,1995:183)。
如前所述,識(shí)別程式語(yǔ)的一種標(biāo)準(zhǔn)就是某語(yǔ)言形式的慣例化程度。誠(chéng)然,某些程式語(yǔ)(如習(xí)語(yǔ)、諺語(yǔ)或其他固定表達(dá))由于其深厚的歷史和文化根基在某言語(yǔ)社團(tuán)內(nèi)具有很高的慣例化程度,因此,本族語(yǔ)者也是很有可能將之以整體形式存儲(chǔ)和表征于心理詞庫(kù)中的。但語(yǔ)言形式的慣例化程度也是有等級(jí)之分的,Howarth[36](28)認(rèn)為,不同的單詞組合在慣例化程度上構(gòu)成了一種連續(xù)體:純習(xí)語(yǔ)(pure idioms)的慣例化程度最高,比喻性習(xí)語(yǔ)(figurative idioms)次之,限制性搭配(restricted collocations)的慣例化程度中等,自由組合(free combinations)的慣例化程度最低。但是,語(yǔ)言形式的慣例化程度不是固定不變的,而是動(dòng)態(tài)變化的,因此不同范疇之間并不存在明確的界限。此外,使用該標(biāo)準(zhǔn)難免也涉及到一些主觀因素,不同的研究者在某語(yǔ)言形式的慣例化程度上可能有著不同的判斷。
識(shí)別程式語(yǔ)的另一種標(biāo)準(zhǔn)是通過(guò)它們的內(nèi)部構(gòu)成或組構(gòu)性來(lái)加以判斷。的確,很多程式化表達(dá)具有的一種特質(zhì)就是它們的非組構(gòu)性,也就是說(shuō),它們的整體意義不能通過(guò)其詞匯成分的意義推斷出來(lái)。這種非組構(gòu)性或不透明性根源于某言語(yǔ)社團(tuán)語(yǔ)言實(shí)踐的演變過(guò)程,被認(rèn)為是程式語(yǔ)的主要特征之一[34,37?38]。這種方法的核心思想為:一旦某單詞串程式化之后,它就不受語(yǔ)法規(guī)則與詞匯搭配的制約,即該單詞串并不一定要合乎語(yǔ)法和/或符合語(yǔ)義邏輯。單詞串在固化或僵化之后常常保留了那些當(dāng)前并不使用的單詞或語(yǔ)法形式(如by dint of , If I were you)。因此,在極端情況下,為了達(dá)到對(duì)某非組構(gòu)性序列的正確理解,我們只能將其加以整體記憶。然而,這種識(shí)別方法過(guò)于保守,因?yàn)樗懦四切┬问揭?guī)則、語(yǔ)義透明的程式語(yǔ)。
我們還可以通過(guò)固定性來(lái)識(shí)別程式語(yǔ)。這種識(shí)別標(biāo)準(zhǔn)建立在這樣一種認(rèn)識(shí)之上,即真正的習(xí)語(yǔ)在形式上是完全固定的。Pawley[39](107?108)通過(guò)比較 first (and only)attempt 與 first (*and only)aid 表明,這種插入成分影響了程式化表達(dá)的地道性。再如,短語(yǔ) lead up the garden path 是一個(gè)比喻性的程式語(yǔ),但 *lead,happily singing, up the winding garden path 即使當(dāng)作比喻性的表達(dá)來(lái)理解也失去了它原來(lái)的意思。對(duì)于某些程式語(yǔ)來(lái)說(shuō),這種以及其他類(lèi)似的固定性測(cè)試也許能起到一定的作用,但是這種作用顯然是有其局限性的,正如 Wray[16](34)所言:“我們?nèi)绱说亓?xí)慣于進(jìn)行語(yǔ)言游戲(無(wú)論是對(duì)程式化的還是對(duì)非程式化的語(yǔ)言),以至于我們可能并不清楚哪些變化將影響到以及哪些變化并不會(huì)影響某單詞序列的完整性,因?yàn)樵诮裉爝€是新穎的、俏皮的改寫(xiě)可能在明天就變成程式化的了,如果人們接受了該表達(dá)并重復(fù)使用了幾次?!贝送猓挥猩贁?shù)程式語(yǔ)是完全固定的,語(yǔ)言中存在大量半固定的單詞序列,在這些序列中存在一個(gè)或多個(gè)空槽,說(shuō)話者可根據(jù)表達(dá)的需要填入不同的語(yǔ)言成分(如單詞,短語(yǔ)或小句)使之適用于不同的使用場(chǎng)合。
另一個(gè)經(jīng)常使用的標(biāo)準(zhǔn)就是出現(xiàn)頻率。人們假定,如果某單詞序列在語(yǔ)料庫(kù)中出現(xiàn)的頻率很高,這就表明至少在某種程度上它在該言語(yǔ)社團(tuán)中是慣例化的。在語(yǔ)料庫(kù)研究中,越來(lái)越多的研究者通過(guò)計(jì)算機(jī)對(duì)口頭和/或書(shū)面語(yǔ)語(yǔ)料庫(kù)進(jìn)行搜索來(lái)找出其中的單詞串,這些單詞串因其重復(fù)出現(xiàn)的特點(diǎn)(即高頻率)往往被劃歸為程式語(yǔ)。從表面上看,運(yùn)用計(jì)算機(jī)搜索來(lái)識(shí)別常見(jiàn)的單詞串并將某頻率閾限(frequency threshold)作為判斷某單詞串是否是程式化的標(biāo)準(zhǔn),這種做法是完全有道理的。原因是,我們?cè)绞墙?jīng)常使用某單詞串,那么為了節(jié)省加工努力(processing efforts),該單詞串以預(yù)制的形式(prefabricated form)存儲(chǔ)的可能性就越大,而在它以預(yù)制的形式存儲(chǔ)后,當(dāng)我們需要再次表達(dá)相同的信息時(shí),它就會(huì)成為人們偏好的選擇。這種對(duì)預(yù)制形式的偏好實(shí)際上將壓制(repress)其他可能的表達(dá)方式出現(xiàn)的頻率,因此,它們之間在頻率上的差異應(yīng)該是顯而易見(jiàn)的。然而,單純的頻率標(biāo)準(zhǔn)也容易產(chǎn)生一系列的問(wèn)題。第一,當(dāng)檢索工具忽略句子或主要成分(major constituent)之間的邊界、說(shuō)話人的變化(change of speaker),錯(cuò)誤的啟動(dòng)(false start)等因素時(shí),我們也許要運(yùn)用結(jié)構(gòu)標(biāo)準(zhǔn)來(lái)刪除那些在短語(yǔ)學(xué)上沒(méi)有意義的單詞組合。第二,口頭語(yǔ)料常常含有對(duì)遲疑現(xiàn)象的轉(zhuǎn)寫(xiě)(如erm、er等),這時(shí)研究者就必須決定這些現(xiàn)象是否構(gòu)成單詞。第三,該標(biāo)準(zhǔn)可能會(huì)納入一些只有“十五分鐘熱度”(fifteen minutes of fame)的或有話題或文體偏向性的表達(dá)法[40](50)。第四,語(yǔ)料也許并不能反映某類(lèi)程式語(yǔ)的真實(shí)分布情況。不容置疑的是,他們提供的信息要比我們通過(guò)直覺(jué)獲取的信息好得多。然而,小型語(yǔ)料庫(kù)的選擇性(selectiveness)可能會(huì)將某些常見(jiàn)的但不容易搜集到的語(yǔ)言材料排除在外。有些語(yǔ)言在本族語(yǔ)者看來(lái)明顯是程式化的,但其在語(yǔ)料庫(kù)中的出現(xiàn)頻率并不高,如 Long live the king!, All for one and one for all。第五,對(duì)多詞表達(dá)的長(zhǎng)度及其頻率閾限的確定具有隨意性,而且頻率測(cè)量不能區(qū)分某單詞串是程式性的還是創(chuàng)造性的[16,33]。第六,研究者們對(duì)從語(yǔ)料庫(kù)中識(shí)別的多詞表達(dá)提出了多種頻率與關(guān)聯(lián)比(association ratio)的標(biāo)準(zhǔn)[16,33],這進(jìn)一步增加了通過(guò)語(yǔ)料庫(kù)研究程式語(yǔ)的主觀性。最后,使用語(yǔ)料庫(kù)方法識(shí)別程式語(yǔ)的另一個(gè)問(wèn)題與這些單詞序列的可變性(variability)或靈活性(flexibility)有關(guān)。Schmitt和Carter[41]指出,雖然由固定成分組成的程式化表達(dá)識(shí)別起來(lái)更容易,但是可變的序列難以使用目前的計(jì)算機(jī)軟件來(lái)識(shí)別,即使這類(lèi)表達(dá)要比某些固定表達(dá)的頻率更高。在這種可變的序列中,除了某些固定成分之外,還有一些需要根據(jù)特定的語(yǔ)境填入特定的詞(或短語(yǔ)、小句)的空槽。與此類(lèi)似的是,還存在一些序列,其成分在語(yǔ)篇中的距離比較遠(yuǎn),難以使用語(yǔ)料庫(kù)軟件對(duì)其進(jìn)行識(shí)別。最后,語(yǔ)料庫(kù)工具并不能區(qū)分出程式語(yǔ)的邊界,這也是我們運(yùn)用本族語(yǔ)者直覺(jué)進(jìn)行識(shí)別時(shí)所遇到的問(wèn)題。
基于學(xué)習(xí)者語(yǔ)言產(chǎn)出的識(shí)別標(biāo)準(zhǔn)也存在一些問(wèn)題。雖然已有證據(jù)表明,程式語(yǔ)在產(chǎn)出時(shí)具有一種完整的語(yǔ)調(diào)升降曲線,但這種證據(jù)經(jīng)常是印象性的(impressionistic),且只適用于對(duì)二語(yǔ)產(chǎn)出進(jìn)行判斷[42](434)。此外,Peters[29]指出,學(xué)習(xí)者往往通過(guò)融合(fusion)將某些經(jīng)由語(yǔ)法規(guī)則構(gòu)造的話語(yǔ)當(dāng)做一個(gè)整體單位加以使用。這些表達(dá)雖然不為本族語(yǔ)者所使用,但能使他們達(dá)到交流的目的[16]。這一發(fā)現(xiàn)似乎與Weinert[31]總結(jié)的第三和第四個(gè)標(biāo)準(zhǔn)有所出入(即“在序列中沒(méi)有能產(chǎn)規(guī)則的使用情況”,“在整個(gè)社團(tuán)內(nèi)廣泛使用”)。此外,第四個(gè)標(biāo)準(zhǔn)和第五個(gè)標(biāo)準(zhǔn)似乎也是互相矛盾的。某語(yǔ)言形式不可能既“在整個(gè)社團(tuán)內(nèi)廣泛使用”又是某學(xué)習(xí)者“特質(zhì)性的/不合適的用法”??傊?,在這些標(biāo)準(zhǔn)中,并不是每條都絕對(duì)適用于判別學(xué)習(xí)者語(yǔ)言產(chǎn)出中的程式語(yǔ),它們?cè)谶m用的程度上可能并不相等;此外,不同語(yǔ)言水平的學(xué)習(xí)者所適用的標(biāo)準(zhǔn)也是不同的,例如,語(yǔ)言水平較高的學(xué)習(xí)者可能適用①②③④⑤⑥⑦,而語(yǔ)言水平較低的學(xué)習(xí)者可能使用①②③④⑤⑥⑦。當(dāng)然,到底適用什么樣的標(biāo)準(zhǔn)應(yīng)取決于具體的研究對(duì)象和研究方法,不能一概而論。
針對(duì)以往程式語(yǔ)識(shí)別研究存在的各種問(wèn)題,Wray[16](43)指出,當(dāng)我們對(duì)話語(yǔ)中的程式語(yǔ)進(jìn)行識(shí)別時(shí),“情況可能是,識(shí)別不能建立在單一的標(biāo)準(zhǔn)上,而需要利用一整套特征”。最近,Wray和Namba[43](29?32)及 Wray[18](116?125)提出了識(shí)別程式語(yǔ)的 11種標(biāo)準(zhǔn),分別是:① 該單詞串在語(yǔ)法上存在著不同尋常的地方(即語(yǔ)法的不規(guī)范性);② 該單詞串的部分或整體缺乏語(yǔ)義透明性(即語(yǔ)義的不透明性);③ 該單詞串與某一具體的情景和/或語(yǔ)域聯(lián)系在一起(即使用語(yǔ)域的專(zhuān)門(mén)性);④ 該單詞串作為一個(gè)整體除了表達(dá)其成分單詞本身的意義之外,在交際或話語(yǔ)中還執(zhí)行了某種功能(即語(yǔ)用功能);⑤ 某說(shuō)話者/寫(xiě)作者在表達(dá)該思想時(shí)最經(jīng)常使用這種確切的表達(dá)方式(即個(gè)人使用頻率);⑥ 某說(shuō)話者/寫(xiě)作者在說(shuō)出或?qū)懗鲈搯卧~串時(shí)伴隨有一種行為、標(biāo)點(diǎn)符號(hào)的使用或某種語(yǔ)音型式,賦予該詞串以某種單位的特殊地位和/或重復(fù)他/她剛聽(tīng)到或讀到的東西(即伴隨的語(yǔ)言或非語(yǔ)言的標(biāo)記);⑦某說(shuō)話者/寫(xiě)作者或其他人以某種方式對(duì)該單詞串進(jìn)行了語(yǔ)法或詞匯上的標(biāo)記,賦予了該詞串以某種單位的特殊地位(即語(yǔ)法或詞匯標(biāo)記);⑧ 基于直接的證據(jù)或我的直覺(jué),有一種大于隨機(jī)水平的可能性是,某說(shuō)話者/寫(xiě)作者在之前與他人交流時(shí)遇到過(guò)這種確切的措辭(即似曾相識(shí)性);⑨ 雖然該單詞串是新創(chuàng)的,但顯然它是某種程式化表達(dá)的有意或無(wú)意的派生(即派生性);⑩ 雖然該單詞串是程式化的,但它被無(wú)意地用錯(cuò)了地方(即使用不得體性);該單詞串包含了某種過(guò)于復(fù)雜或過(guò)于簡(jiǎn)單的語(yǔ)言材料,以至于不能和說(shuō)話者總體的語(yǔ)法和詞匯能力相匹配(與使用者語(yǔ)言水平不符的特點(diǎn))。Wray和Namba建議,針對(duì)不同的研究對(duì)象需要使用不同的標(biāo)準(zhǔn)組合來(lái)識(shí)別其語(yǔ)言使用中的(可能的)程式語(yǔ)。我們認(rèn)為,程式語(yǔ)難以識(shí)別的原因在于該現(xiàn)象的主體性差異。換句話說(shuō),某語(yǔ)言形式是否為程式語(yǔ)既不是語(yǔ)法學(xué)家規(guī)定的,也不是通過(guò)出現(xiàn)頻率進(jìn)行判定的,而要取決于語(yǔ)言使用者本身。實(shí)際上,每個(gè)人都有自己獨(dú)特的個(gè)人語(yǔ)型(idiolect),由其個(gè)人的語(yǔ)言庫(kù)(repertoire)所構(gòu)成,而作為個(gè)人語(yǔ)型的構(gòu)成要素,程式語(yǔ)可能也會(huì)因人而異,隨著其經(jīng)驗(yàn)與語(yǔ)言接觸的差異而有所不同。這種“程式語(yǔ)型”(formulalect)或“短語(yǔ)語(yǔ)型”(phrasalect)既包括了某言語(yǔ)社團(tuán)大部分成員作為整體存儲(chǔ)的程式語(yǔ),又包括了言語(yǔ)社團(tuán)成員并非作為整體存儲(chǔ)的程式語(yǔ)。正如一個(gè)人的心理詞庫(kù)是由某些獨(dú)特的單詞構(gòu)成的,該心理詞庫(kù)可能也包括一些獨(dú)特的程式語(yǔ)。
從以上的論述中不難看出,以往的研究多根據(jù)語(yǔ)言形式特征并結(jié)合主觀判斷來(lái)對(duì)語(yǔ)言使用中的程式語(yǔ)進(jìn)行識(shí)別,這種識(shí)別方法往往費(fèi)時(shí)低效,而且其識(shí)別的結(jié)果有時(shí)也存在著一定的可信度問(wèn)題。語(yǔ)料庫(kù)語(yǔ)言學(xué)的興起和發(fā)展給程式語(yǔ)研究帶來(lái)了很大的便利,人們可以借助語(yǔ)料庫(kù)軟件輕松地識(shí)別出語(yǔ)言使用中的程式語(yǔ),但該方法也是有其局限性的。此外,對(duì)小文本自建語(yǔ)料中程式語(yǔ)的識(shí)別,目前仍沒(méi)有一套完全可行并行之有效的標(biāo)準(zhǔn)。實(shí)際研究中使用較多的是通過(guò)本族語(yǔ)者直覺(jué)來(lái)對(duì)程式語(yǔ)進(jìn)行識(shí)別。為了將這種方法中主觀因素的影響降低到最低程度,研究者往往使用若干名本族語(yǔ)者(或經(jīng)驗(yàn)豐富的語(yǔ)言教師)作為評(píng)判員,要求他們獨(dú)立地識(shí)別出語(yǔ)料中(可能的)程式語(yǔ),然后將他們共同識(shí)別的單詞組合視為某種程式語(yǔ)[10[44]。但這種方法也是有其局限性的。首先,該方法只限于對(duì)少量語(yǔ)料的分析。其次,長(zhǎng)時(shí)間作業(yè)中的一些人力因素(如勞累、注意力不集中)可能會(huì)導(dǎo)致識(shí)別標(biāo)準(zhǔn)前后不一。再次,程式語(yǔ)可能會(huì)出現(xiàn)相互嵌套(embedding)的現(xiàn)象,因此,即使識(shí)別標(biāo)準(zhǔn)是完全一致的,仍有可能會(huì)出現(xiàn)模棱兩可的情況。最后,直覺(jué)并不總能全面地反映語(yǔ)言事實(shí),某些常見(jiàn)的、非常熟悉的程式語(yǔ)可能并不會(huì)引起識(shí)別者的注意。我們認(rèn)為,應(yīng)該將主觀的本族語(yǔ)者和/或語(yǔ)言教師的直覺(jué)與客觀的標(biāo)準(zhǔn)相結(jié)合,根據(jù)不同的研究對(duì)象(如本族語(yǔ)兒童/成人或以英語(yǔ)為二語(yǔ)/外語(yǔ)的兒童或成人)、語(yǔ)料的大小和/或具體的研究方法與目的來(lái)制定一套具體的識(shí)別標(biāo)準(zhǔn),只有這樣我們才有可能準(zhǔn)確、可靠、全面地識(shí)別出語(yǔ)言使用中的程式語(yǔ)。
[1]Rosamund Moon.Vocabulary connections: Multi-word items in English [C]// Vocabulary: Description, Acquisition and Pedagogy.Cambridge: Cambridge University Press, 1997: 40?63.
[2]Michael McCarthy, Ronald Carter.Written and spoken vocabulary [C]// Vocabulary: Description, Acquisition, and Pedagogy.Cambridge: Cambridge University Press, 1997:20?39.
[3]Helen B.Sorhus.To hear ourselves—implications for teaching english as a second language [J].English Language Teaching Journal, 1977, 31: 211?221.
[4]Ray Jackendoff.The boundaries of the lexicon [C]// Idioms:Structural and Psychological Perspectives.Hillsdale, NJ:Lawrence Erlbaum, 1995: 133?166.
[5]Bengt Altenberg.On the phraseology of spoken English: The evidence of recurrent word-combinations [C]// Phraseology:Theory, Analysis, and Applications.Oxford: Clarendon Press,1998: 101?122.
[6]Peter Howarth.The Phraseology of Learners’ Academic Writing[A].Phraseology: Theory, Analysis and Applications[C].Oxford:Oxford University Press, 1998: 161?186.
[7]Douglas Biber, Stig Johansson, Geoffrey Leech, Susan Conrad,Edward Finegan.Longman Grammar of Spoken and Written English [M].Harlow: Longman, 1999.
[8]Britt Erman, Beatrice Warren.The idiom principle and the open-choice principle [J].Text, 2000, 20: 29?62.
[9]Pauline Foster.Rules and Routines: A Consideration of Their Role in the Task-based Language Production of Native and Non-native Speakers [A].Researching Pedagogic Tasks: Second Language Learning, Teaching, and Testing[C].Harlow:Longman, 2001: 75?93.
[10]Diana Van Lancker-Sidtis, Gail Rallon.The incidence of formulaic expressions in everyday speech: methods for classification and verification [J].Language and Communication,2004, 24(3): 207?240.
[11]楊玉晨.英語(yǔ)詞匯的“板塊”性及其對(duì)英語(yǔ)教學(xué)的啟示[J].外語(yǔ)界, 1999(3): 24?27.
[12]James R.Nattinger, Jeanette S.DeCarrico.Lexical phrases and language teaching [M].Oxford: Oxford University Press, 1992.
[13]Michael Lewis.The lexical approach: The state of ELT and a way forward [M].London: Language Teaching Publications,1993.
[14]Alison Wray.Formulaic language in learners and native speakers[J].Language Teaching, 1999, 32(4): 213?231.
[15]Alison Wray.Formulaic sequences in second language teaching:Principle and practice [J].Applied Linguistics, 2000, 21(4):463?489.
[16]Alison Wray.Formulaic language and the lexicon [M].Cambridge: Cambridge University Press, 2002.
[17]Lynn Grant, Laurie Bauer.Criteria for re-defining idioms: are we barking up the wrong tree [J].Applied Linguistics, 2004, 25(1):38?61.
[18]Alison Wray.Formulaic language: Pushing the boundaries [M].Oxford: Oxford University Press, 2008.
[19]Alison Wray, Michael R.Perkins.The functions of formulaic language: An integrated model [J].Language and Communication, 2000, 20: 1?28.
[20]Jean Hudson.Perspectives on fixedness: Applied and theoretical[M].Lund: Lund University Press, 1998.
[21]Chris S.Butler.Repeated word combinations in spoken and written text: Some implications for functional grammar [A].A Fund of Ideas: Recent Developments in Functional Grammar [C].Amsterdam: IFOTT, University of Amsterdam, 1997: 60?77.
[22]Douglas Biber, Susan Conrad.Lexical bundles in conversation and academic prose [A].Out of Corpora: Studies in Honour of Stig Johansson [C].Amsterdam and Atlanta: Rodopi, 1999:181?190.
[23]Douglas Biber, Susan Conrad, Viviana Cortes.If you look at…:Lexical bundles in university teaching and textbooks [J].Applied Linguistics, 2004, 25(3): 371?405.
[24]Viviana Cortes.Lexical bundles in published and student disciplinary writing: Examples from history and biology [J].English for Specific Purposes, 2004, 23(3): 397?423.
[25]Douglas Biber, Federica Barbieri.Lexical bundles in university spoken and written registers [J].English for Specific Purposes,2007, 26: 263?286.
[26]Ken Hyland.As can be seen: Lexical bundles and disciplinary variation [J].English for Specific Purposes, 2008, 27: 4?21.
[27]Douglas Biber.A corpus-driven approach to formulaic language in English [J].International Journal of Corpus Linguistics, 2009,14(3): 275?311.
[28]Florian Coulmas.On the sociolinguistic relevance of routine formulae [J].Journal of Pragmatics, 1979, 3: 239?266.
[29]Ann M.Peters.The units of language acquisition [M].Cambridge: Cambridge University Press, 1983.
[30]Tina Hickey.Identifying formulas in first language acquisition[J].Journal of Child Language, 1993, 20: 27?41.
[31]Regina Weinert.The role of formulaic language in second language acquisition: A review [J].Applied Linguistics, 1995,16(2): 180?205.
[32]Florence Myles, Janet Hooper, Rosamond Mitchell.Rote or rule?Exploring the role of formulaic language in classroom foreign language learning [J].Language Learning, 1998, 48: 323?364.
[33]John Read, Paul Nation.Measurement of formulaic sequences[C]// Formulaic Sequences: Acquisition, Processing and Use.Amsterdam: John Benjamins, 2004: 23?26.
[34]Rosamund Moon.Fixed expressions and idioms in English: A corpus-based approach [M].Oxford: Clarendon Press, 1998.
[35]Manfred Raupach.Formulae in second language speech production [C]// Second Language Productions.Tübingen,Germany: Gunter Narr Verlag, 1984:114?137.
[36]Peter Howarth.Phraseology and second language proficiency [J].Applied Linguistics, 1998: 24?44
[37]Chitra Fernando.Idioms and idiomaticity [M].Oxford: Oxford University Press, 1996.
[38]Michael McCarthy.Spoken language and applied linguistics [M].Cambridge: Cambridge University Press, 1998.
[39]Andrew Pawley.Lexicalization [A].Language & Linguistics:The Interdependence of Theory, Data & Application[C].Georgetown University Round Table on Languages and Linguistics, 1985: 98?120.
[40]張霞.基于語(yǔ)料庫(kù)的中國(guó)高級(jí)英語(yǔ)學(xué)習(xí)者詞塊使用研究[J].外語(yǔ)界, 2010(5): 48?57.
[41]Norbert Schmitt, Ronald Carter.Formulaic Sequences in Action:An Introduction[A].Formulaic Sequences: Acquisition,Processing and Use [C].Amsterdam: John Benjamins, 2004:1?22.
[42]Nan Jiang, Tatiana M.Nekrasova.The processing of formulaic sequences by second language speakers [J].The Modern Language Journal, 2007, 91(3): 433?445.
[43]Alison Wray, Kazuhiko Namba.Formulaic language in a Japanese-English bilingual child: A practical approach to data analysis [J].Japanese Journal for Multilingualism and Multiculturalism, 2003, 9(1): 24?51.
[44]Jie Li, Norbert Schmitt.The acquisition of lexical phrases in academic writing: A longitudinal case study [J].Journal of Second Language Writing, 2009, 18: 85?102.