劉善濤 王曉
[摘 要] 民國時期為我國漢語語文辭書古今轉型的關鍵時期,《王云五大辭典》是該時期第一部采用現(xiàn)代漢語語法體系為字詞標注詞性的白話詞典,本文對《王云五大辭典》的詞類劃分依據和詞性標注特點進行了較為系統(tǒng)的剖析,并與其他代表性辭書的詞性標注加以對比,總結《王云五大辭典》在詞性標注理念的時代創(chuàng)新性,也指出其字詞詞性標注中存在的不足,供當前的辭書編纂參考借鑒。
[關鍵詞] 漢語語文辭書 《王云五大辭典》 詞性標注 詞典對比
[中圖分類號]H06 [文獻標識碼]A [文章編號]1000-3541(2020)01-0099-08
王云五在民國時期主持商務印書館25年,為中國近代文化和漢語辭書編纂做出杰出貢獻[1]。他主編的《王云五大辭典》(以下簡稱《大辭典》)[2]《王云五小辭典》《王云五小字匯》《中山大辭典“一”字長編》《王云五新詞典》等一系列語文辭書,涵蓋了字典和詞典,普通語文詞典和新詞語詞典,小型、中型、大型甚至巨型辭書的不同類別。而《大辭典》出版時間最早、最完整、最具代表性,也是我國第一本進行詞性標注的現(xiàn)代語文詞典,它處于《辭源》(1915年)之后,《國語辭典》(1937—1945年)、《新華字典》(1953年)、《現(xiàn)代漢語詞典》(1960年)之前,處于中國語文辭書由傳統(tǒng)到現(xiàn)代過渡的關鍵環(huán)節(jié),為知識的普及和漢語語文辭書的現(xiàn)代化做出貢獻,本文即以此為主要分析對象。
中國傳統(tǒng)小學研究較多地關注漢字形音義方面的考釋和訓讀,元代以后開始有學者關注古漢語虛字的研究,但沒有形成系統(tǒng)的漢語語法學,也很難在辭書中進行明確的詞性標注。明末傳教士入華使歐洲學人得以用一種全新的域外視角重新審視漢語和漢字。1592—1593年間,多明我會傳教士胡安·柯伯(Juan Cobo)《漢語語法》(Arte de la Lengua China)是迄今發(fā)現(xiàn)記錄在案的最早漢語語法著作,惜已失傳。1682年,瓦羅(Francisco Varo)西班牙文《華語官話語法》是流傳至今的最早漢語語法著作,書中根據古典拉丁語法的詞類范疇將漢語詞分作九個詞類[3]475。之后,其他傳教士也編寫了一些漢語語法著作,由于各種原因,當時并未引起中國學者的注意。
我國學者對漢語詞類的系統(tǒng)研究始于《馬氏文通》,但該書以古代漢語為研究對象,詞類研究實為對字的語法分類。我國第一部系統(tǒng)完整的現(xiàn)代漢語語法著作為黎錦熙的《新著國語文法》,該書在總結歸納國語語法特點的基礎上,形成了一套影響深遠的教學語法體系[4]。
一、《大辭典》的詞類劃分依據
民國政府成立后,白話文運動逐步展開,古漢語語法研究已不合時用。孫中山積極倡導言文一致的白話語法研究,為推進教育、啟發(fā)民智服務,“所望吾國好學深思之士,廣搜各國最近文法之書,擇取精義,為一中國文法,以演明今日通用之言語,而改良之也。夫有文法以規(guī)正言語,使全國習為普通知識,則由言語以知文法,由文法而進窺古人之文章,則升堂入室,有如反掌,而言文一致亦可由此而恢復也”[5]。由此,對國語語法的研究逐漸得以重視,胡適《國語文法概論》(亞東圖書館1922年版)從宏觀上指出了國語文法研究的重要性,黎錦熙《新著國語文法》在參照納斯佛爾德(Nesfield)《英語語法》的基礎上創(chuàng)建了以“句本位”為體系的語法系統(tǒng),標志著現(xiàn)代漢語語法研究系統(tǒng)的初步建立,對漢語語法研究的深入和語法知識的普及起到積極作用。
漢語本體研究只有付諸語言實踐才能體現(xiàn)其應用價值,辭書作為語言系統(tǒng)中不同詞匯單位的集合,能夠較為全面地展現(xiàn)漢語詞類的分布狀況,對漢語語法知識的普及和語言應用能力的提高都有所助益。同時,語言實踐活動對本體研究成果的采用還呈現(xiàn)出一定的滯后性,就漢語辭書的詞性標注而言,陸爾奎在主編《新字典》之初曾欲標注詞性,“近來新編字典,每字每義標舉名代動靜等品詞,本書初稿亦循是例”(《例言》),但終因語法理論研究和辭書編纂實踐的不成熟而被迫放棄,“惟東西文化有語尾變化,應用既異,則字母因而增減,我國字體一成不變,虛字實用,實字虛用,殆少不可通者,無用強為分析,故屬稿及半,即行削去,非矯同立異也”,陸爾奎所謂“強為分析”“矯同立異”的缺陷在后世辭書中也有所體現(xiàn)。
自《馬氏文通》出版近30年后,我國產生了第一部標注詞性的白話學生字典《(詞性分解紅皮新式)中華字典》(簡稱《中華字典》)[6],《大辭典》則為我國第一部為字詞標注詞性的白話詞典。兩書雖然都為漢字標注詞性,但所采用的詞類劃分系統(tǒng)不盡一致,前書采用馬建忠的詞類系統(tǒng),后書基本上采用黎氏的詞類系統(tǒng)。王云五在《編輯凡例》中對該書詞類狀況進行了簡要介紹:
(四)本書單字均分別詞性,加以解釋,詞性略語如下:
名=名詞動=動詞????? 代=代名詞??? 形=形容詞
副=副詞接=接續(xù)詞??? 前=前置詞歎=感歎詞????? 助=語助詞
黎錦熙在《新著國語文法》中將漢語詞也分為九類,九種詞類之下含有不同的子類。《大辭典》在“編輯凡例”中雖然沒對詞類劃分依據進行說明,但在附錄11中專設“國語文法表”,兩相對照可以看出除了在介詞、連詞的命名上王云五分別稱作“前置詞”“接續(xù)詞”,在詞語小類的劃分上有細微差異外,王云五和黎錦熙的詞類劃分大體一致,可以說《大辭典》的詞類標注體系以黎錦熙為基礎,一方面,顯示出黎錦熙語法在語言研究中的影響,另一方面,也反映出王云五辭書在詞類劃分中密切結合最新的研究成果,積極采用最能體現(xiàn)白話語法體系的詞類系統(tǒng),為白話文運動和國民教育服務。
二、《大辭典》詞性標注的特點
我們對《大辭典》加以抽樣分析,方法是《大辭典》正文共計1384頁,每隔14頁抽取1頁,共得99頁,其中所包含的字頭及其所統(tǒng)領的詞目為代表樣本,為本研究建立了適量的封閉域。經統(tǒng)計,數(shù)據庫中《大辭典》共收條目4288條,其中,單字格665條,占總數(shù)的15.51%,如“嬴、糗、丫”等;雙字格數(shù)量最多,共2842條,占總數(shù)的66.28%,如“讓步、諄諄、浦江”等;三字格429條,占總數(shù)的10%,如“店小二、話匣子、新西蘭”等;四字格318條,占總數(shù)的7.42%,如“齊大非偶、新陳代謝、五卅慘案”等;五字格23條,占總數(shù)的0.61%,如“廬山真面目、新石器時代、啟羅立脫爾”;六字格7條,占總數(shù)的0.16%,如“一不做二不休、新達爾文學說、一等有期徒刑”;七字格和八字格各有2條,各占總數(shù)的0.05%,如“一失足成千古恨、威斯特法里亞和議”。依此比例可以推斷《大辭典》中收字九千左右,收詞五萬左右,比《現(xiàn)代漢語詞典(試印本)》(1960年)四萬余條的收詞量略高。
(一)對逐字標類原則的貫徹
如《編輯凡例》所述:“本書單字均分別詞性”,這包含兩層意思:一是沒有釋義的字頭都沒有標注詞性;二是單字不區(qū)分其意義和用法,只要有注音和釋義就予以詞性標注。《大辭典》中只列字頭,沒有釋義的情況分為兩種:一是異體字;二是四角號碼容易檢錯的字?!洞筠o典》將使用頻率不高的異體字立為副條,在副條條目之后只用“=”關聯(lián)出該字的正條形式,在正體字目下予以注音和釋義,并標注詞性,此類副條異體字不再標注詞性。經統(tǒng)計,數(shù)據庫中共有異體字51組,包含102個單字,占單字條目總數(shù)的15.34%,如“驘=騾、箇=個”等。
《大辭典》出版之時,四角號碼檢字法公布不久,再加之該檢字法多次修訂,使用者對這種方法還不太熟練,存在檢錯的現(xiàn)象,因此王云五為了讀者查檢的方便,就在某些漢字易檢錯的號碼下也將該字立為字目,后面用“見”字標明該字的正確號碼,方便讀者查檢。這類字在《大辭典》中也沒有標注詞性,經統(tǒng)計,在數(shù)據庫中該類字共36個,占單字總量的5.41%。
除了上述兩類情況,所有字頭均標明詞性并釋義。根據漢字在構詞中的表義作用可將漢字分為有義漢字、無義漢字和棄義漢字[7],有義漢字一般對應漢語中的語素,包括自由語素和粘著語素,辭書對有義漢字標注詞性可以展現(xiàn)語素的構詞作用和語法意義,對于全面理解字目意思極為必要。對于一些不能獨立使用、只起構詞作用的棄義漢字或無義漢字來說,詞性標注和對單字的釋義就顯得有些不妥?!洞筠o典》在編纂中已經注意到此類漢字不能獨立成詞的特點,如:
16600硇(鐃)ㄋㄠˊNau
[名]硇砂=綠化錏鑛物,易溶於水,加熱則變氣體,可作工業(yè)原料。
16600砂(沙)ㄕㄚ?? Sha
[名]極碎的石。
46410妲(達)ㄉㄚˊ? Dar
[名]妲己=殷紂的妃名。
17717己(幾)ㄐㄧˇJii
[代]自身,(例)舍己從人。
[名]記時符號“天干”的第六位。
26211貔(皮)ㄆㄧˊPyi
[名]貔貅=猛獸,(喻)勇士。
24290貅(休)ㄒㄧㄡShiou
[名]貔貅=猛獸,(喻)勇士。
99011恍(慌)ㄏㄨㄤˇ? Hoang
[副]恍惚=不清楚的樣子。
97032惚(呼)ㄏㄨ? Hu
[副]恍惚=看不清楚的情形。
《大辭典》在釋義中往往先列出這類漢字所構成的詞語,然后對詞語進行整體釋義,上例中“硇砂”的“硇”、“妲己”的“妲”都是無義漢字,《大辭典》的處理與有義漢字“砂”“己”有所不同。單純詞“貔貅”“恍惚”等中的漢字都不能獨立使用,《大辭典》則在每個漢字下都列出所構詞語,在不同字頭下對同一詞語進行重復釋義??梢钥闯?,《大辭典》對于無義漢字的詞性和義項標注考慮到該字的構詞作用,對此類字的詞性標注和詞義解釋也即對該字所構詞語的詞性和義項說明。由于編者語言觀和辭書編纂經驗的不足,《大辭典》在處理此類漢字時還存在明顯的缺陷,首先是無義字和有義字在編纂設計中的區(qū)分不夠明顯,如“叩”釋為“[動]叩頭=以頭觸地,系舊日的最敬禮”,這就使有義字“叩”在設計體例上與上述無義字沒有形成有效的區(qū)分?!洞筠o典》在每個無義字下都列出所構詞語,并標明詞性和義項,造成了辭典編纂空間的浪費,可以利用“參見”加以關聯(lián)。
(二)一字多類、一字兼類現(xiàn)象突出
馬建忠(1898年)從意義的角度出發(fā),認為“字無定義,固無定類”,主張“依義定類,隨義轉類”,字義不同,詞性也不盡相同。黎錦熙(1924年)則主張“依句辨品,離句無品”,“國語的九種詞類,隨它們在句中的位置或職務而變更,沒有嚴格的分業(yè)”[4],二人都主張寬泛意義上的“詞無定類”。受漢語本體研究的影響,《大辭典》在編纂中“一字多類、一字兼類”的現(xiàn)象比較突出。除了異體字和四角號碼易錯字不標注詞性以外,《大辭典》對剩余字目一律標明詞性和義項。根據辭典對字頭詞性的標注類型,以及詞性與義項的對應關系可分為如下四種情況:
1.一字一類,即字頭下只有一個詞性,這又可分為兩小類:
(a)單性單義,即所立字目只標注一個詞性和義項,此類字頭共有279個,占字目總數(shù)的41.95%,如:
00217廬(盧)ㄌㄨˊ? Lu
[名]屋舍。
27220勿(務)ㄨˋWuh
[副]不要,(例)非禮勿言=不要說非禮的話。
91547叛(判)ㄆㄢˋPann
[動]離背,(例)群臣離叛。
(b)單性多義,即所立字目只有一個詞性,但詞性之下對應多個義項,此類字頭共有125個,占字目總數(shù)的18.8%,如:
00261店(電)ㄉㄧㄢˋDiann
[名]1出賣貨物的鋪戶。2旅館。
22947緩(歡上)ㄏㄨㄢˇHoan
[形]1舒遲,(例)緩急。2寬的。
64065嘻(西)ㄒㄧShi
[歎]1悲歎聲。2驚懼聲。
2.一字多類,即所立字目有多個詞性,不同詞性之下對應數(shù)量不等的義項,此類字頭共有129個,占字目總數(shù)的19.4%,其中,兩個詞性的字頭112個,三個詞性的字頭16個,四個詞性的字頭1個,如:
00217贏(盈)ㄧㄥˊYng
[形]有餘的。
[動]得勝。
00222序(緒)ㄒㄩˋShiuh
[名]1東西的房屋,(例)兩序。2古代的學校,(例)庠序。3先後的順次,(例)次序。4總括全書概要,排在書籍起首的文,(例)序文。
[參 考 文 獻]
[1] 周薦.文化達人王云五對漢語辭書學的貢獻[J].河北師范大學學報:哲學社會科學版,2013(6).
[2]王云五.王云五大辭典[K].上海:商務印書館,1930.
[3]姚小平.現(xiàn)存最早的漢語語法著作:瓦羅著《華語官話語法》簡介[J].中國語文,2001(5).
[4]黎錦熙.新著國語文法[M].上海/北京:商務印書館,1924/1992.
[5]孫中山.建國方略之一:心理建設,1918;又見建國方略[M].中華書局,2011.
[6]黃鐘瀛.詞性分解紅皮新式中華字典[K].上海:世界書局,1927.
[7]周薦.論詞的構成、結構和地位[J].中國語文,2003(2).
[8] 孫全洲,主編.現(xiàn)代漢語學習詞典[K]. 上海:上海外語教育出版社,1995.
[9] 李行健,主編.現(xiàn)代漢語規(guī)范字典[K].北京:語文出版社,1998.
[10] 郭良夫,主編.應用漢語詞典[K]. 北京:商務印書館,2000.
[11]李行健,主編.現(xiàn)代漢語規(guī)范詞典[K].北京:外語教學與研究出版社,語文出版社,2004.
[12]中國社會科學院語言研究所詞典編輯室.現(xiàn)代漢語詞典:第5版[K].北京:商務印書館,2009.
A Research on Part-of-Speech Tagging about Chinese? Dictionaries in Republican Period?? ——Taking “Wang Yunwus?? Dictionaries” As An Example
Liu Shantao? Wang Xiao
Abstract:? The period of the Republic of China is a crucial phase for the transformation of Chinese language dictionaries from ancient to modern times. Wang Yunwu Dictionaries is the first vernacular dictionary in the history of modern Chinese dictionary that uses the modern Chinese grammar system to mark the part of speech.This paper analyzes the base of word-class-diving and the features of part-of-speech tagging systematically, we also compare it with other typical dictionaries, summarizing the innovation of tagging idea, and pointing out the insufficiency which could be used for reference in current lexicography.
Key words: Chinese dictionaries? Wang Yunwu Dictionaries? part-of-speech tagging? dictionaries comparison