陳 平
(澳大利亞昆士蘭大學語言與文化學院)
提 要 語法研究所用經(jīng)驗證據(jù)有三個主要來源:自擬,真實出現(xiàn)的語言材料,包括口語和書面語,以及實驗或調(diào)查。現(xiàn)代漢語語法研究始于黎錦熙1924出版的《新著國語文法》。1950年代之前的現(xiàn)代漢語語法著作,根據(jù)的幾乎全部是書面語材料,包括早期白話文和現(xiàn)代白話文作品,并且大都標明出處,以示有書為證。 這種做法延續(xù)到1950年代。從1955—1956年公布的普通話定義也可以看出,它代表了當時的共識。1960年代之后,尤其是近三四十年來,通過自擬獲取例證的做法漸漸通行開來,更為重視口語,尤其是北京口語的研究,從書面語直接引用或改寫的例句也可以不必注明出處。這些變化反映漢語語法研究者對自己語感的自信在不斷增強,反映現(xiàn)代漢語語法學界對于什么是合語法或不合語法的用法有了越來越多的共識,也反映現(xiàn)代漢語標準化程度在不斷提高。現(xiàn)代漢語語法研究應該如何獲取證據(jù),涉及許多同現(xiàn)代漢語標準語的起源與發(fā)展有關的問題,主要圍繞如何看待作為語料的現(xiàn)代漢語標準語、口語和書面語這三者之間的關系,如何把握自擬、利用真實語料以及實驗/調(diào)查這三種獲取證據(jù)的方式各自的特點。本文的主要目的,是梳理有關問題的來龍去脈,并指出某些問題的癥結所在。
任何一個論點,首先需要有可靠的論據(jù),然后經(jīng)過嚴密論證才能成立。無征不信,說話要有根據(jù),不僅是日常生活中的基本思維方法和行為準則,更是科學研究中的鐵律。論點、論據(jù)和論證三者中,論據(jù)是基礎,論證是方法?;A不牢靠,論證和論點都談不上。胡適常將 “有幾分證據(jù)說幾分話,有七分證據(jù)不能說八分話” 寫成條幅送人。言必有據(jù),體現(xiàn)了五四時代提倡的科學精神,也是包括乾嘉學派在內(nèi)的中國優(yōu)良學術傳統(tǒng)的重要內(nèi)容。無論是傳統(tǒng)語言學還是現(xiàn)代語言學研究,論據(jù)最常見的表現(xiàn)方法就是例證,用例子說明問題。黎錦熙早年提出“例不十,不立法”,更是為語言規(guī)律能否成立給出量化標準。王力又將這句話引申到反例上去,提出 “例外不十,法不破”。兩位學者主張的是同一條原則:尋繹語言規(guī)律的過程中,例證必不可少,而孤證或者出現(xiàn)次數(shù)很少的例子不足為憑。
強調(diào)例證的同時,我們也要避免陷入“唯證據(jù)論”的誤區(qū)。語言學既是經(jīng)驗科學,也是理論科學。涉及具體研究課題時,理論問題和實證問題往往密切相關,甚至纏繞難解。在討論某個論點的過程中,我們或許會認為,論點能否成立完全取決于能否找到證實或證偽的例證。這種態(tài)度是片面的。面對我們研究的問題,我們首先要區(qū)分,這是理論問題,還是實證問題?哪些方面是理論問題?哪些方面是實證問題?大多數(shù)理論觀點應該通過經(jīng)驗證據(jù)來檢驗能否成立,但也有許多理論觀點,尤其涉及定義問題時,經(jīng)驗證據(jù)的多寡強弱往往對論點能否成立并無實質(zhì)影響,甚至毫無影響。劃清經(jīng)驗證據(jù)的效用邊界,能使我們對例證在語言學研究中所能起到的作用,有更清醒的認識。我們下面以1950年代漢語語法學界三次大討論為例,說明這個道理。
首先是漢語詞類劃分,這是至今都充滿爭議的研究課題。主要有兩個相連的問題,一是漢語有無詞類,或者說能否劃分出名動形這樣的詞類;二是如果認為漢語有詞類,那么劃分詞類的標準是什么?如何劃分詞類?這個問題之所以聚訟紛紜,一定程度上是因為涉及的問題,有些是理論立場問題,有些是經(jīng)驗證據(jù)問題。高名凱主張,區(qū)別詞類,只能以狹義的、標明各種詞類的特殊詞形變化為標準。這個主張有兩方面的內(nèi)容,一是經(jīng)驗證據(jù)問題:漢語中能否找到他說的狹義的特殊詞形變化。如果找得到,那漢語能分出詞類;如果找不到,就無法為漢語劃分詞類;二是理論立場問題,高名凱認定,只有他說的特殊詞形變化才是劃分詞類的標準,其他如意義、功能、分布等都與此無關。這是典型的由定義決定的理論立場,不涉經(jīng)驗證據(jù)。評判這類理論立場,主要根據(jù)其邏輯是否自洽、周延,對有關語言現(xiàn)象的說明是否全面、透徹,描寫和解釋的方式是否簡練、深刻,是否導向有重大意義的研究課題等標準來決定它們的優(yōu)劣。在高名凱詞類劃分標準問題上,就理論立場而言,經(jīng)驗事實本身不足用作證據(jù)判定他這個主張的對錯, 因為旁人用來證明漢語可以分出詞類的語言事實,用高名凱的定義來衡量,作為劃分漢語詞類的標準,都不合格,因此沒有充任證據(jù)的資格。黎錦熙(1924)主張,“凡詞,依句辨品,離句無品”。這個觀點也有兩個部分,第一部分“依句辨品”,是他主張用來辨別詞類的方法,是個理論立場問題,無法用經(jīng)驗事實對它證實或證偽;“離句無品”則是個經(jīng)驗事實問題,如果有語言事實可以證明,離開句子,照樣能對漢語中的詞進行分類,那就是用證據(jù)推翻了“離句無品”的論點。其他研究者給出“離句無品”的反證之后,黎錦熙改變了自己的觀點。他在《新著國語文法》 1951年“今序”中說: “ ‘凡詞,依句辨品’是對的,但又說‘離句無品’則是不正確的?!?黎錦熙 1924/1992:25)其實,“依句辨品”是理論立場問題,不受經(jīng)驗事實左右,只有優(yōu)劣之別,沒有對錯之分。討論漢語詞類劃分的文獻中,涉及有無所謂兼類詞,以及兼類詞的劃類策略等問題時,一般會用到“常體”“變體”等概念,取決于具體用法在語言中使用頻率的高低,這是經(jīng)驗事實問題,可以通過統(tǒng)計數(shù)字來判定。
主語賓語的辨識在很大程度上也是一個理論立場問題,無法根據(jù)經(jīng)驗事實決定對錯。漢語傳統(tǒng)語法著作中,往往將施事認作主語,受事認作賓語,施事受事是初始成分,主語賓語是次生成分,后者的認定取決于前者。 “他賣了棟房子”是主謂賓句,“房子他賣了”成了賓語前置句。美國結構主義理論框架中,主語賓語也都是句子的次生成分,由句子的結構關系(constituency), 主要是層次關系和前后語序決定,可由短語結構語法定義。句子S下轄兩個直接成分,NP和VP, NP就是主語,VP是謂語。VP下轄V和NP,V后面的NP就是賓語。主賓不在同一個層次。在一些以依存關系 (dependency)為主的理論模式中,主語賓語同為初始成分,在句中位于同一層次,一般不設謂語的概念。在這幾大類理論模式中,主語賓語的辨識由理論立場決定,同經(jīng)驗事實沒有多大關系。在功能語法研究傳統(tǒng)中,往往將主語看作施事、話題等語義、語用成分的語法化結果,具備某些典型的語法行為特征,涉及許多經(jīng)驗事實范疇里的問題。
至于單復句問題,幾乎完全取決于研究者自己設定的標準,是個理論立場問題,旁人無法根據(jù)經(jīng)驗事實來判斷對錯。所謂單復句之爭,因為各人所用標準不同,往往實際上并沒有許多實質(zhì)內(nèi)容。
語法研究所用的例證有三種主要來源。首先是自擬,研究者根據(jù)自己的語感,就有關語言現(xiàn)象自造例句,并以此為據(jù),對有關論點加以論證。自擬例證可靠程度有多高,主要取決于本人對于該語言的熟悉程度。 一般說來,研究者只有對自己的母語才有資格通過自擬獲得可靠的例證。
第二種來源是真實出現(xiàn)的語言材料,可以是口語,也可以是書面語。錄音機出現(xiàn)之前則基本都從書面語獲得例證,即所謂的“書證”。 研究古代語言,因為不能起古人于地下,書證向來是唯一選擇。從語料價值來看,書證其實有很大缺陷。首先,書證表現(xiàn)的主要是書面語而不是口語,而就語言的本質(zhì)屬性來說,口語是第一位的,書面語是口語的文字表現(xiàn)。書面語同口語之間一般來說總是有距離的,書面語作者往往時間充裕,在遣詞造句方面可以仔細推敲,傾向使用比較正式的詞語;而口語則相對而言比較隨意,在用詞和組織條理上有時不是太齊整。即使盡可能忠實再現(xiàn)口語內(nèi)容的文字記錄,也無可避免地會丟失許多重要信息,如說話人語音語調(diào)上的快慢輕重等。 二十世紀錄音機的普遍使用,對語言學家來說,無疑為口語研究帶來很大方便。從事社會語言學、話語分析等研究工作的人經(jīng)常使用錄音材料作為研究對象。過去幾十年來,出現(xiàn)了匯集數(shù)億甚至數(shù)十億字詞的書面語和口語語料庫,為研究者提供了可用電腦方便地搜索、提取、歸類、對比的語言材料,大大豐富了語言研究經(jīng)驗證據(jù)的種類和數(shù)量。
值得強調(diào)指出的是,利用真實語料搜集證據(jù)的方法,還有一個嚴重的缺陷。當代語言學在研究方法上有別于傳統(tǒng)語言研究的創(chuàng)新之一,是大量利用不合語法或不適用所在語境的句子,從反面揭示相關規(guī)則。這種例證可以通過自擬或實驗/調(diào)查方法獲取,但在實際出現(xiàn)的語料中是見不到的。
第三種是通過實驗或調(diào)查方式獲取例證。實驗或調(diào)查采取的形式可以多種多樣,規(guī)??纱罂尚 S械氖前凑站脑O計的方案請多人參與的正式實驗和調(diào)查,也有的只是向個別人簡單地問幾個問題?,F(xiàn)代漢語語法研究領域里通過大規(guī)模實驗和調(diào)查獲取證據(jù)的情況并不常見,但研究人員就某個語言成分的用法咨詢周圍說母語的人的意見,則是非常普遍的做法。
研究者的理論背景、研究領域和課題,很大程度上決定了他們主要使用哪一種方式獲取證據(jù)。致力構建形式理論模式的生成語言學派幾乎完全使用自擬的例證,認為對于語句是否合乎語法的判斷,是說話人語言能力(competence)的一個核心內(nèi)容。 心理語言學、社會語言學、語言習得、方言研究等所用的經(jīng)驗證據(jù),基本上都是通過實驗或調(diào)查取得。話語分析,以及最近二三十年發(fā)展很快的基于用法的一些理論學派,主要用的是實際出現(xiàn)的真實語料,尤其是口語材料,而語言成分所在的語境則是語料不可分割的一部分。功能語言學、認知語言學背景的語言學家,一般根據(jù)研究課題和研究目的,在自擬、利用真實語料與實驗/調(diào)查三種方式中間,選擇最方便、最有效的方式獲取證據(jù),常常采取一種以上的方式。
獲取例證的三種主要方式各有特點、各有利弊, 但都有一個可靠性問題。語法研究中,某個句子是否能說,語義應該怎樣理解,用在某個特定的語境是否適當?shù)龋忌婕把芯空叩呐袛鄦栴}。自擬例證完全是研究者基于語感的個人判斷,主觀性最強。真實出現(xiàn)的語料以及實驗和調(diào)查取得的結果,并非能自動成為可靠的證據(jù)。對于前者,研究者從中挑選可以用作證據(jù)的材料,選擇的過程,就是個人主觀判斷的過程。雖然實驗和調(diào)查結果相對而言客觀性較強,但實驗和調(diào)查方式的設計,以及所得結果的解讀,許多時候也是個人判斷的結果。個人基于語感的判斷是否可靠,是語言學界許多爭議的癥結所在。
三種方式中,自擬無疑最省事省力,是語法研究中最常用的舉證方式。但是,研究人員雖然講的是同一語言,語感往往可能因國別、方言、年齡、家庭背景、教育背景等因素而表現(xiàn)出或大或小的差異。 在涉及語句合法性 (grammaticality) 和適當性 (appropriateness) 判斷的時候,自擬的例子往往是一些結構復雜、語義晦澀、日常生活中極少碰到的語句,而生成學派的創(chuàng)始人Chomsky 與其同道偏偏十分喜好這樣的例句。他們認為,正是這些常人看來復雜得不可思議的語句,最能反映說話人的語言能力,反映語言的本質(zhì)特征。研究者對這類句子的判斷是否可靠,是否會受個人語言(idiolect)的影響而缺乏足夠的代表性,一直有很大爭議(參見 Schütze 1996/2016)。 Gibson & Fedorenko (2013) 認為,在句法和語義研究中,語句的合法性判斷不能僅僅根據(jù)單個語言學家的語感,而是應該采用科學實驗的常規(guī)方法,請許多人對有關語句是否能說作出獨立的判斷。他們提出,參與測試的人員數(shù)量要足夠大,而且不能是語言學家,避免因專業(yè)背景的影響而作出不夠客觀的判斷。Sprouse & Almeida (2013)對此作出回應。他們采用Gibson & Fedorenko (2013) 建議的方法,做了幾個實驗。其中一個實驗是以Adger (2003)一書中的例句作為檢驗對象。該書共有469個例句,用以說明9個領域中365個句法問題。作者請了大量非語言學家對這些句子的合法性給出獨立判斷,結果顯示,365個句法問題中,參加測試的人員在359個問題的判斷上同該書作者 Adger一樣,重合率達98%。 另一個實驗是,生成語言學主要刊物LinguisticInquiry2001—2010十年間刊登的所有論文中,一共出現(xiàn)1743個例句,作者隨機抽取了292 個例句,涉及146個語言現(xiàn)象,實驗請來的測試人員在139個現(xiàn)象的判斷上同原作者一致,重合率達95%。Sprouse & Almeida (2013)根據(jù)這些測試結果得出的結論是,應該認為,句法和語義研究中,研究者根據(jù)內(nèi)省獲取的證據(jù)是可靠的。兩位作者同時指出,有些例句介乎合法與不合法之間,文獻中一般在句子前用問號標注,多人參與的檢測結果能就這類句子的合法性給出更為全面的定量分析,而單個研究者則無法提供這類信息。
從現(xiàn)代語言學的角度研究漢語語法,始于1898 出版的《馬氏文通》。20世紀前半葉的漢語語法研究,可以商務印書館1980 年代重印的《漢語語法叢書》十種,再加上胡以魯和劉復的兩部著作為主要代表:
《馬氏文通》 馬建忠 1898
《高等國文法》 楊樹達 1920
《國文法草創(chuàng)》 陳承澤 1922
《國文法之研究》 金兆梓 1922
《新著國語文法》 黎錦熙 1924
《中國文法論》 何容 1942
《中國文法要略》 呂叔湘 1942—1944
《中國文法革新論叢》 陳望道等 1943
《中國現(xiàn)代語法》 王力 1943
《漢語語法論》 高名凱 1948
《國語學草創(chuàng)》 胡以魯 1913
《中國文法通論》 劉復 1920
以上十二部著作中,大多數(shù)研究對象是古代漢語。比較系統(tǒng)、全面地描寫漢語語法的專著共有五種,分別是《馬氏文通》《高等國文法》《新著國語文法》《中國文法要略》和《中國現(xiàn)代語法》?!恶R氏文通》和《高等國文法》研究對象是古代漢語,兩部書有共同的特點:一是均從清儒的訓詁學著作,如《助字辨略》《經(jīng)傳釋詞》《古書疑義舉例》等中采擷了許多觀點與材料;二是都因依西文語法著作的理論框架,參伍比較,為漢語語法搭建新的描寫架構。在大量使用源自西文語法著作的概念、術語和分類組織框架的同時,兩位作者也致力于揭示漢語本身的特點。用楊樹達的話來說,“酌采歐西文法之規(guī)律,而要以保存國文本來面貌為期”(楊樹達 1920/1955:2)。 幾乎所有例子,都標明出處。兩書在解釋詞語意義時,很少提到現(xiàn)代漢語?!恶R氏文通》只有幾處將古漢語詞語同所謂“俗語”相比,如講到“矣”字時,解釋說:“‘矣’字者,所以決事理已然之口氣也。已然之口氣,俗間所謂‘了’字也。凡‘矣’字之助句讀也,皆可以 ‘了’字解之。”(呂叔湘、王海棻 1986:566)同書中所收七千多古漢語例句相比,提到現(xiàn)代口語的次數(shù)極少。
黎錦熙的《新著國語文法》是第一部以現(xiàn)代漢語為研究對象的語法著作?!恶R氏文通》和《高等國文法》受拉丁文語法著作的影響,均以詞法為主,而《新著國語文法》主要以英語語法著作如Reed & Kellogg 的《高級英文法》(HigherLessonsinEnglish) 為參照對象,句法占了重要地位,并提出后世影響較大的“句本位”主張。作者說,該書的研究對象是現(xiàn)代的漢語,不是文言文,是大眾的普通話,不是某一階層的行話和某一地區(qū)的方言。作者在解釋書名中的“文法”一詞時特意說明, 文法就是grammar 的翻譯,不作“行文之法”講,因為說話也要符合文法。之所以不用“國語法”,是因為當時小學有“說話”課,教“話法”,又稱“口語法”,同“讀法”(讀書) 和“綴法”(作文)對立,如果用“語法”或“白話文法”,可能會引起誤解。黎錦熙同時說明,本書的主要研究對象,并不是口語,而是局限于用漢字書面化的白話文。當時流行的白話文中,歐化文體在知識階層中相當通行,尤其常見于翻譯作品和一些文藝作品?!缎轮鴩Z文法》對書面語中的歐化現(xiàn)象舉例很少,因此未能全面反映當時白話文語言特點的全貌,作者后來認為這是一個缺點。書中所收例句,主要出自明清傳統(tǒng)白話小說如《水滸傳》《西游記》《儒林外史》《石頭記》《老殘游記》等,以及五四以來新出的白話文作品,前者給了出處,后者則一般從略。
呂叔湘1942—1944年間出版了三卷本《中國文法要略》,上卷講詞語結構,中卷和下卷從范疇和關系出發(fā),研究它們的表現(xiàn)形式。上卷從形式出發(fā)研究意義,中/下卷從意義出發(fā),研究表現(xiàn)形式,是第一部全面研究漢語語義的著作。該書的另一個特點是將文言和白話放在一起講,讀者通過對比,可以在文言和白話的異同以及聯(lián)系方面獲得深入了解。書中例句來源很廣,大都取自當時流行的中學課本,從四書五經(jīng)、傳統(tǒng)白話小說、詩歌、詞曲,一直到當代作家如冰心、老舍、徐志摩等人的現(xiàn)代白話文作品,大都標明出處。
王力1943年出版《現(xiàn)代漢語語法》。該書以不自造例句為原則,同時為避免語言夾雜,南腔北調(diào),例證盡量先從用北京話寫成的《紅樓夢》里找,而且挑選口語化的句子,如家常談話時所用,文縐縐的語句不用。如果《紅樓夢》里找不到合適的例子,則臨時自造,或從《兒女英雄傳》里尋找。凡是書證,都標明出處。
就語料的性質(zhì)來說,成書于20世紀上半葉的這三部研究現(xiàn)代漢語的語法著作有兩個共同的特點,一是它們語料的主要來源都是白話文著作,包括傳統(tǒng)白話文和現(xiàn)代白話文,是書面語而不是口語,大都標明出處; 二是自擬的例子很少。
1948年哈佛大學出版社出版趙元任的MandarinPrimer:AnIntensiveCourseinSpokenChinese(《國語入門》)。這是趙元任在哈佛大學教美國陸軍漢語口語短訓班用的教科書。李榮將該書部分內(nèi)容編譯成一本書,1952年以《北京口語語法》為名由開明書局出版。全書例句均為當代北京口語,沒有標明出處。
趙元任又于1968年出版AGrammarofSpokenChinese(《中國話的文法》)。他在該書前言中寫了這樣一段話,解釋為什么不用“國語文法”這樣的書名:
“國語有標準官話的意思,而我想強化的是淡化官話的標準性,因為尤其是就語法而言,本書有關官話的討論大都適用于整個漢語,甚至適用于文言的許多方面。”(“Gwoyeuconnotes Standard Mandarin, and my emphasis has been to de-emphasize the standard aspect of Mandarin, since, especially in matters of grammar, most of what is said here about Mandarin is true of all Chinese, even of a good part of the literary language.”)(Chao 1968:viii)
趙元任在自己兩本著作的中文書名中沒有用“口語”或“漢語語法”這些詞,認為它們是“新造的學術詞匯”,有“專門名詞的氣味”。 趙元任(1968)有呂叔湘的節(jié)譯本《漢語口語語法》(1979年由商務印書館出版),香港中文大學出版社1980年出版丁邦新的全譯本《中國話的文法》。 書中例句有多種來源,主要是自擬的例子、真實口語記錄以及口語化的當代文學作品,一般不標明出處。
1961年,商務印書館出版丁聲樹等撰寫的《現(xiàn)代漢語語法講話》。該書根據(jù) 1952年7月至1953年11月《中國語文》連載的《語法講話》修訂而成。該書前言中說,書中 “討論的現(xiàn)代漢語,口語和書面語并重,口語以北京話為主,書面語以現(xiàn)代作品為主”。所用例句百分之八十以上采自當代白話文作品,并給出了來源,代表以北京話為主的口語例句不到百分之二十。朱德熙1982年出版的《語法講義》,標明書面語例句出處的不到百分之五。1984年商務印書館出版呂叔湘主編的《現(xiàn)代漢語八百詞》,該書編纂過程中參考了大量從書面材料里摘抄下來的例句,但在書中都沒有標明出處。 1990年代以后,《中國語文》等學術刊物刊登的現(xiàn)代漢語語法論文,例句自擬的比例相當高,摘自書面材料的例句許多也并不標明出處。
如無其他限定詞,“現(xiàn)代漢語語法研究” 中的“現(xiàn)代漢語”,指的是現(xiàn)代漢語標準語。從上面的簡單回顧中可以看出,從黎錦熙(1924)開始,1950年代之前的現(xiàn)代漢語語法研究所用例證幾乎全部出自用漢字書寫的白話文,包括早期白話文和現(xiàn)代白話文作品,而且大都標明出處。自擬的例子和日常生活中的口語一般來說不足為證,因此在書中出現(xiàn)次數(shù)很少。這種做法一直延續(xù)到1950年代。1955年公布的普通話定義有兩個部分: 以北京語音為標準音,以北方方言為基礎方言;1956年補充了第三部分,以典范的現(xiàn)代白話文著作為語法規(guī)范。 其中第一部分講語音,第二部分講詞匯,第三部分講語法。普通話的定義反映了當時的共識,即現(xiàn)代漢語語法研究所需的證據(jù)應該從書面語而不是口語中獲取。
從1960年代開始,尤其是近三四十年來,通過自擬取得例證的做法漸漸為較多的研究者所采用,口語語料得到更多的重視,書證標明出處的做法也越來越松動。不過,多年來搜集例證最常用的還是傳統(tǒng)方式,研究人員許多時間花在從各類書報雜志上搜集例句,打勾畫線,轉錄為卡片,分門別類存檔,寫論文時再將相關卡片全部攤開。使用例句卡片,主要目的是便于研究,大量相關例句排列在一起,有助于對照、比較、聯(lián)想和總結,從中找出語法規(guī)律。這樣做的另一個好處是方便,可將例句直接寫到論文里去。因此,從過去到現(xiàn)在,卡片一直是語法研究中普遍使用的工具。古代漢語和近代漢語研究人員寫論文,例句必須標明出處;現(xiàn)代漢語語法研究論文所用例句雖然沒有強制說一定得提供出處,但相當長一段時間里比較普遍的看法似乎是,標明出處比不標明出處顯得更為嚴謹一些,哪怕是“我抱著花,向大家敬禮”這類幾乎人人日常生活中都會說、毫無爭議的句子。對普通例子都要標明出處,或許反映自擬的例證在研究者群體中可能公信力不足,要有書為證才好。這同時也反映,對于什么是現(xiàn)代漢語語法研究中的合格證據(jù),研究者群體還缺乏足夠的共識。
在現(xiàn)代漢語語法研究的證據(jù)問題上, 我們在相當長的一段時期內(nèi)主要依靠書面語而不是口語材料,較少使用自擬的例句。這種態(tài)度和做法的原因是什么,結果是什么,是我們下面要討論的問題。
我們稱之為普通話的現(xiàn)代漢語標準語,1950年代以前叫國語,如趙元任(1948) 中文書名《國語入門》所示。明確定位為現(xiàn)代漢語標準語的國語,其實歷史并不長。 受日本明治維新后語言文字改革取得很大成績的啟發(fā),從19世紀下半葉開始,漢字、漢文及漢語必須改革以促進中國社會的進步,成了當時社會精英階層的共識。除了文字改革以外,清末開始的國語運動有兩個主要目標,首先是言文一致,用接近口語的白話文取代傳統(tǒng)文言文,成為主要的書面語文體; 用來取代文言的新式白話文,到底應該是什么樣子,同傳統(tǒng)白話文有何區(qū)別,同日??谡Z有何聯(lián)系?在這些問題上,學界討論十分熱烈。傅斯年(1919)在談到怎樣做白話文時,提出兩個胡適認為最重要的主張,一是必須根據(jù)我們說的活語言,先講究說話,話說好了,自然能做好白話文,二是要歐化,充分吸收西洋語言的細密結構,這樣才能傳達復雜的思想,以因應新時代的新需要。第一個主張聽上去很有道理,但在當時實行起來會有很大困難。 對于生活在廣大南方方言區(qū)的人來說,除非他們先學會說比較流利的北方官話,否則無法將他們的活語言筆之于文。提出“我手寫我口”的黃遵憲,母語是廣東話,“我手寫我口”對他來說,實際上是很難做到的。
國語運動的另一個主要目標是國語統(tǒng)一,向全國推廣標準口語。中國現(xiàn)代教育制度二十世紀初才開始漸漸在全國建立。當時中國存在極大的方言歧異,缺乏普及的共同語,給不同地區(qū)的口語交流造成很大的障礙。作為標準語的國語應該是什么樣子,也是一個引起熱烈討論的問題。代表當時語言文字改革中堅力量的國語運動積極分子,于1916年成立了自己的組織“國語研究會”,1917年在《新青年》雜志上刊登了下面的主張:
同一領土之語言皆國語也。然有無量數(shù)之國語較之統(tǒng)一之國語,孰便? 必曰統(tǒng)一為便;鄙俗不堪書寫之語言,較之明白近文,字字可寫之語言,孰便? 則必曰近文可寫者為便。然則,語言之必須統(tǒng)一,統(tǒng)一之必須近文,斷然無疑矣。
使立定國語之名義,刊行國語之書籍,設一軌道而導之,自然漸趨于統(tǒng)一,不過遲速之別而已。
不必慮統(tǒng)一之難,當先慮統(tǒng)一之無其術與具爾。同人等有見于此。思欲達統(tǒng)一國語之目的,先從創(chuàng)造統(tǒng)一之術與夫統(tǒng)一之器具為入手方法(嚴修等 1917)
“國學研究會”認為,口語含有許多鄙俗成分,因此不能將口語等同于國語。哪些口語成分能成為“統(tǒng)一之國語”的一部分呢?條件是必須要“近文”,要“字字可寫”,也就是說,能否以文字形式進入書面語,是口語成分是否有資格進入國語的衡量標準。
胡適(1918)提出“國語的文學,文學的國語”,簡潔、明確地表述了他在現(xiàn)代漢語標準口語和標準書面語兩者之間關系問題上的主張。 胡適認為,“文學”,即書面語,要基于標準國語,用漢字將國語寫成書面語,就是現(xiàn)代白話文,因此他將“白話文學”正名為“國語文學”。而另一方面,“國語”又要基于書面語,是現(xiàn)代白話文的口語形式。仔細分析胡適的主張,可以發(fā)現(xiàn),這實際上是個先有雞還是先有蛋的問題。沒人能夠根據(jù)他的主張,寫出基于全國統(tǒng)一的標準國語的白話文,因為當時國語還沒有標準;而要有標準國語,又先要有普遍認可、普遍使用的現(xiàn)代白話文。 胡適說,不能等有了標準國語以后再開始寫白話文,大家應該先做起來,慢慢形成標準。據(jù)他自述,他的白話文是從《儒林外史》《紅樓夢》《兒女英雄傳》《老殘游記》等傳統(tǒng)白話小說中學來的,同當時的國語沒有多少關系。因此,胡適做的白話文,與其說是“國語的文學”,不如說是“《儒》《紅》《兒》《老》的文學” (詳細討論參見陳平 2017b)。取代文言文成為通用文體的現(xiàn)代白話文應該比較接近口語,通俗易懂,對此大家沒有異議。但是,自1917年白話文運動起,直到現(xiàn)在,對于什么是現(xiàn)代白話文,我們實際上并沒有普遍認可的標準。在如何對待文言、俗語、方言、明清小說中的傳統(tǒng)白話、歐化文體等問題上,作家們基本上是各行其是,只要有讀者就行。有過幾次白話文標準的大討論,涉及如何看待現(xiàn)代白話文同文言、方言、歐化文體和大眾口語的關系,但離取得共識還差得很遠(陳望道等 1943)。 現(xiàn)代漢語書面語在處理這些語言成分的實際做法上,同其他語言如英語很不一樣。我們閱讀今天的英文書報,見不到古英語的蹤跡,但古漢語詞語句式卻是現(xiàn)代漢語書面語的常用成分。
確定國語的標準音,相對來說比較簡單,1932年采用新國音的《國音常用字匯》公布以后,以北京音為國語標準音的原則基本上就此確定了。不過,即使有標準國語,要推廣普及到全國也并非易事。自1950年代起完整的教育體系在全國建立起來以后,我們以舉國之力,花了近半個世紀的時間,才將普通話普及到近百分之六十的人口中去。對于許多人來說,掌握國語和現(xiàn)代白話文的順序,往往不是先學會說國語,然后根據(jù)國語做白話文;而是如胡適那樣,先從書面語學會寫大家能懂的白話文,不必理會是否符合標準國語。
國語長期缺乏普遍認可的標準并且未能在全國及時普及,造成學界對于什么是現(xiàn)代漢語標準語長期缺少共識,語法學家對于包括自己在內(nèi)的語感缺乏信任,加上嚴重的方言歧異,知識階層傳統(tǒng)的重文字、輕口語——所有這些因素加在一起是1920年代開始的大半個世紀里,現(xiàn)代漢語語法研究倚重現(xiàn)成的書面語材料、較少使用自擬例證的主要原因。
主要以典范的現(xiàn)代白話文作品中出現(xiàn)的例子為經(jīng)驗證據(jù),由此尋鐸現(xiàn)代漢語標準語的語法規(guī)律,這既是我們定下的原則,也是自黎錦熙(1924) 之后半個多世紀里的常規(guī)做法,這樣的指導原則和實踐給現(xiàn)代漢語語法研究帶來什么問題呢?
首先,何為“典范”,何為“現(xiàn)代白話文”? 兩者都是模糊概念,伸縮范圍可以很大,方言、古漢語、早期白話、歐化等語言成分,都會在現(xiàn)代漢語白話文作品中程度不同地出現(xiàn),語法研究者對這些成分如何辨識和處理,取決于研究者本人的語言能力、理論水平和研究目的。涉及一個個具體例證時,研究者本人的語感是否可靠,基于語感所作的判斷是否具有足夠的代表性,能否為漢語語法研究者群體所普遍接受?我們常說“有書為證”,其實,僅僅是以文字形式出現(xiàn)過,這本身并不足以為證。根據(jù)來源多樣、成分復雜的語料得出來的語法規(guī)則,其科學價值如何?這些都是我們常常思考的問題。根據(jù)大型計算機語料庫進行現(xiàn)代漢語語法研究,因為語料庫所收材料往往相當蕪雜,情況可能會更為復雜。很難想象如“了”“著”“過”的用法等這樣需要均質(zhì)性很強的語料才能做出精準判斷的研究課題,能夠完全依靠大型計算機語料庫提供的證據(jù)來完成(陳平 2015a、2015b)。現(xiàn)代漢語語法研究論文因作者對文中例句的可接受度判斷與他人不同,從而引起爭議,是時時發(fā)生在我們周圍的事情。前面提到的 Sprouse & Almeida (2013)那樣的測試,我們還沒有人做過。是否現(xiàn)代漢語語法研究領域里也會有那么高的重合率,是一個值得考察的問題。
朱德熙(1987)主張,要使現(xiàn)代漢語語法研究深入下去,應該對口語語法和書面語語法分別進行細致的研究,觀察它們之間的異同。以書面語為對象的語法著作應當將目前書面語語法的不穩(wěn)定性恰當?shù)胤从吵鰜?。他同時提出,現(xiàn)代漢語語法研究應該以北京口語語法研究為基礎。他用來作為范例的是趙元任(1968)《中國話的文法》。該書以北京口語為主要研究對象,從北京口語語料中尋繹漢語語法的規(guī)律。朱德熙(1987)提出的無疑都是很有見地并且十分及時的主張,其基本出發(fā)點是作為語法研究的語料,數(shù)量要足夠大,純度應該盡量高,即內(nèi)部均勻、無矛盾。
北京口語的范圍應該比典范的現(xiàn)代白話文著作窄得多,語法研究因語料內(nèi)部不一致而造成的問題也會相應少得多。 但是,實際研究過程中還是有不少有待回答的問題,有些是技術問題,有些是理論問題。首先,怎樣搜集例證?可以通過自擬,也可以依靠北京人日常說話的錄音或精確的錄音轉寫。但是,許多因素決定了幾乎不可能完全依靠這類錄音材料開展比較大的研究課題。一般來說,日??谡Z有許多遲疑、省略、重復、倒錯現(xiàn)象,如果做話語分析,這些現(xiàn)象應該都是研究對象(陳平 2017a),但要從中總結出語法規(guī)律,則需研究者決定哪些現(xiàn)象能說明語法規(guī)律因而可用,哪些不可用,這就取決于研究者本人的語感和理論水平,于是又回到是自擬可靠還是客觀語料可靠的老問題。還有一個實際問題是,我們很難有大量可靠的錄音和轉寫材料可用。幾乎所有現(xiàn)代漢語語法研究者,包括趙元任和朱德熙本人,除了書證以外,涉及口語時實際上都主要通過自擬獲取例證,必要時再采用調(diào)查或實驗方式加以補充。從事現(xiàn)代漢語語法研究的非京籍語言學家應該都能說流利的普通話,但很少有人會說地道的北京話。如果承認非京籍語法學家也獨立做出了大量的一流研究成果,能否就此推論,就語法規(guī)則來說,普通話和北京口語兩者的交集非常大,對稱差非常小,對于語法研究往往不產(chǎn)生實質(zhì)性影響?不過,無論這個推論是否成立,許多從事現(xiàn)代漢語語法研究的非京籍研究人員,包括筆者在內(nèi),為審慎起見,研究過程中經(jīng)常同時用上自擬、書證和調(diào)查三種搜集證據(jù)的方式,重要例句或者自己沒有太大把握的地方,都要向北京本地人核實一遍才放心。
上面的討論引出另外一個問題:京籍語言學家在現(xiàn)代漢語語法研究上無疑具有獨特的優(yōu)勢,但正如朱德熙(1987)所說,漢語語法研究從來不是京籍語言學家的專利。那么,非京籍漢語語法學家,他們從事以北京口語為基礎的語法研究時,語感從何而來?他們的普通話是怎么學的? 中小學教育、廣播影視應該是主要渠道,但另一個重要渠道是書面語。非北方官話區(qū)的人從書面語而不是口語中學會許多普通話常用的詞語結構,一直是十分普遍的現(xiàn)象。甚至北京人也從書面語學會一些北京話原來沒有的成分,漸漸用在日??谡Z中。黎錦熙1951年對于歐化長句,發(fā)表了這樣的意見:雖然出現(xiàn)次數(shù)少,不適宜于口語,但如果符合漢語“共同的法式和基本的規(guī)律”,因為許多人實際上是通過書面語學習語言的,所以這些歐化長句盡管不是“從群眾中來”,但很容易“向群眾中去”,變成大家的普通說法(黎錦熙 1924/1992:24-25)。這個判斷不僅適用于歐化成分,也適用于方言成分?!坝袥]有VP” 是吳語成分,“有VP”是閩南方言成分, 這些用法開始都是先在書面語中出現(xiàn),沒過多少年, “有沒有VP” 已經(jīng)完全進入普通話,“有VP” 也越來越常用(王森等 2006)。這說明,書面語不僅是人們掌握北京話和普通話的重要渠道,也同時成為北京口語、普通話、方言、白話文等語體之間相互借用、相互影響的重要渠道,這就無可避免地降低了北京口語的獨特性和“純度”。
造成北京口語內(nèi)部非均質(zhì)性的原因,除了方言和歐化等外源成分的影響之外,還有兩個重要因素,一是誰的北京口語,二是口語所指對象到底應該是什么。
北京人本身是個相當模糊的概念。年齡、職業(yè)、居住地區(qū)、家庭和教育背景不同的人,其日常口語也不會完全相同。老舍和王朔是現(xiàn)代漢語語法研究中最常用來作為北京口語發(fā)話人代表的兩位作家,他們兩人的語言還是有相當差別的。某些數(shù)詞如“一”“二”等后跟名詞時省略個體量詞,是當代北京口語中的常見現(xiàn)象,青年人中尤其盛行。這種用法據(jù)說是王朔開的頭,他的小說和根據(jù)小說改編的影視作品走紅以后才流行開來的。同樣代表北京口語但年代早一些的作品,如老舍的《茶館》,沒有或極少見到這樣的用法(陳平 2016)。王朔是北京軍隊大院子弟,從小在封閉環(huán)境中長大,說的是大院通行的普通話,同北京老百姓幾乎沒有什么接觸。據(jù)王朔自述,上中學開始是在東城區(qū),后來轉到西城一所中學后才第一次聽周圍的人說北京話,開始許多詞根本就聽不懂。我們的問題是,老舍、王朔、在京機關學校工作人員、內(nèi)九城胡同里的居民、京郊的工人農(nóng)民,誰的語言能代表北京口語?還是他們都能代表北京口語?如果都能代表北京口語,那么北京口語和普通話到底有什么區(qū)別? 北京人這個概念不易精準定義,他們的口語也同樣如此。
根據(jù)使用場合、目的、受眾等因素的不同,口語的用詞、句式和組織也會有很大的區(qū)別。陶紅印(1999)提出,就現(xiàn)代漢語語法研究的對象來說,口語書面語兩分不夠,應該根據(jù)語體 (genre) 進行更詳細的分類,找出語體之間語法特征的異同。文中證明,現(xiàn)代漢語的一些語法現(xiàn)象,如“把”和“將”的用法,用語體的概念比用口語書面語的區(qū)別更能將有關規(guī)律揭示出來。這告訴我們,有必要更深入地探討“北京口語”或“口語”“書面語” 這些概念的內(nèi)涵和外延,以及它們同語體等概念之間的關系。從例證采集方法上來看,涉及語體時,只能更多地利用自擬之外的其他兩種方法,主要還得依靠書面語材料。
朱德熙 (1987)文中提出的另一個建議是對口語語法和書面語語法分別作細致的研究,找出它們的異同。這也是一個很好的建議。限于篇幅,我們另文討論對該建議的具體想法。與此同時,我們不妨觀察一下英語語法研究中的相關情況。近幾十年來最重要的英語語法著作應該是Huddleston & Pullum (2002)。 它是一部1842頁的巨著,出版后廣受好評。作者說,他們要寫一部盡量在口語和書面語之間保持中立的著作,但讀者可能還是會覺得,該書在語料問題上偏重書面語。作者解釋說,如果確實對書面語有所偏重,那并非他們的編寫原則,而只是出于實際考慮:書面語能直接引用,書面語語料比口語語料容易獲取,口語材料如錄音中錯誤很多等。更重要的是,作者持有這樣一個假設 (assumption): 口語和書面語各自內(nèi)部都有文體 (style)上的差異,但口語句法和書面語句法之間的顯著分歧罕見到不存在的程度 (rare to the point of non-existence) (Huddleston & Pullum 2002:11-13)。也就是說,根據(jù)書面語提供的例證,寫一部在口語和書面語之間保持中立的英語語法著作,理論上是做得到的。 我認為,英語語法學家能將撰寫大部頭的語法著作建立在這樣的假設之上,主要原因之一是現(xiàn)代英語 (Modern English) 歷史較長,一般認為從1776年開始就基本定形了。我們現(xiàn)代漢語語法學家能持這樣的假設嗎?
本文結束之前,我引用一段黎錦熙1951年講的話 (黎錦熙 1924/1992:21):
在三十多年以前,一般人只注意中國的文言文法,對于口語和白話文,聽說也要建立起文法來,就感覺到是一件新奇而困難的事:你究竟根據(jù)一些什么材料呢?
一個世紀過去了,我們今天依然問同樣的問題。 從現(xiàn)代漢語語法研究實踐來看,1950年代之前的現(xiàn)代漢語語法著作,根據(jù)的幾乎全部是書面語材料,包括早期白話文和現(xiàn)代白話文作品,并且大都標明出處,以示有書為證。 這種做法延續(xù)到1950年代。從1955—1956年公布的普通話定義也可以看出,它代表了當時的共識。1960年代之后,尤其是近三四十年來,例證自擬的做法漸漸通行開來,更為重視口語,尤其是北京口語的研究,從書面語直接引用或改寫的例句也可以不必注明出處。這些變化反映漢語語法研究者對自己語感的自信在不斷增強,反映現(xiàn)代漢語語法學界對于什么是合語法或不合語法的用法有了越來越多的共識,也反映現(xiàn)代漢語標準化程度在不斷提高。
現(xiàn)代漢語語法研究應該如何獲取證據(jù),涉及許多同現(xiàn)代漢語標準語的起源與發(fā)展有關的問題,主要圍繞如何看待作為語料的現(xiàn)代漢語標準語、口語和書面語這三者之間的關系,如何把握自擬、利用真實語料以及實驗/調(diào)查這三種獲取證據(jù)的方式各自的特點。本文的主要目的是梳理有關問題的來龍去脈,并指出某些問題的癥結所在。本文同時提出許多問題,沒有現(xiàn)成答案,希望引起更多的關注。