孫 博
(長春師范大學(xué) 文學(xué)院,吉林 長春 130032)
吉林省普通話語料庫建設(shè)現(xiàn)狀芻議
孫 博
(長春師范大學(xué) 文學(xué)院,吉林 長春 130032)
普通話語料庫建設(shè)方興未艾。本文就吉林省普通語語料庫建設(shè)的現(xiàn)狀進(jìn)行了分析,發(fā)現(xiàn)語料庫建設(shè)在取得不俗成績的同時(shí)也存在諸多問題,并就這些問題指出解決辦法。
吉林省;普通話語料庫
隨著計(jì)算機(jī)軟件技術(shù)的發(fā)展以及人們對實(shí)際語料價(jià)值的重新認(rèn)識(shí),20世紀(jì)60年代以來,基于語料庫的語言學(xué)研究取得了長足的進(jìn)步,涌現(xiàn)出大量的優(yōu)秀成果。各類語料庫也應(yīng)運(yùn)而生,在當(dāng)今語言學(xué)研究中扮演著十分重要的角色,為語言學(xué)研究提供了豐富、詳實(shí)的語言素材。
自國家開始推廣普通話伊始,吉林省便積極響應(yīng)國家政策,出臺(tái)了一系列相關(guān)的政策條文,支持普通話的發(fā)展。目前普通話語料庫已基本健全,形成了比較科學(xué)規(guī)范的管理和運(yùn)行體系,產(chǎn)生了廣泛的社會(huì)影響。以推進(jìn)漢語的詞法、句法、語義和語用的研究為目的,同時(shí)也為中文信息處理的研究提供語言資源。在人文科技發(fā)展與基礎(chǔ)教育領(lǐng)域中發(fā)揮著巨大的優(yōu)勢,對少數(shù)民族地區(qū)普通話的推廣起到了不可替代的作用。
但存在的問題也不容忽視。語料庫的快速建設(shè)跟不上語言發(fā)展態(tài)勢的潮流。當(dāng)代網(wǎng)絡(luò)傳媒飛速發(fā)展,其新興用語及詞法變更必將打破傳統(tǒng)語言格式的發(fā)展態(tài)勢,而是否將其納入語料庫的辭海之中還有待商榷與解決。同時(shí),語料庫的發(fā)展必將造成語料庫層序混亂,良莠不齊。很多當(dāng)?shù)厝俗砸詾檎f的就是普通話,不重視普通話的學(xué)習(xí)和訓(xùn)練,勢必混淆某些普通話與非普通話之間的句法、詞匯。例如東北方言中使用頻率很高的方言特色詞匯“賊!哎呀媽呀!嗯哪!那啥!疙瘩”等。是否把這些非普通話詞匯納入其中是一個(gè)未知命題。有些地區(qū)方言與普通話發(fā)音相差甚遠(yuǎn),以白山方言特色詞語為例: [挨克] āi kēi 即受到指責(zé)、訓(xùn)斥; [包屈] bāo qū 即委屈。通話方言:“兒白兒著虎——真的不騙你;外屋地——廚房;勁引的——故意的;腦乎——暖和;管燈——日光燈;手悶子——棉手套”等等。吉林俗語:“捏嘎達(dá),睞懸,繃丁,大氅等等”。這些都是推廣和普及普通話亟待解決的問題。
此外,作為普通話語言推廣工作的攔路虎,語音問題的存在也不容忽視。以舌尖音為例,在吉林方言和普通話之間主要存在聲母轉(zhuǎn)化的差異。在通化、遼源、延吉和四平這四個(gè)地區(qū),舌尖音轉(zhuǎn)化在不同人群中也存在明顯差異。這些都不約而同地傳達(dá)著同一個(gè)信息,即發(fā)音問題與人們所處地區(qū)、年齡、文化程度等有一定的關(guān)系。地域環(huán)境的影響已經(jīng)深深植根于每一個(gè)吉林人心中,要想徹底填補(bǔ)吉林方言與普通話之間的鴻溝,非一日之功。所以,語料庫在建設(shè)成功之始,問題的出現(xiàn)也相伴而生。如何推廣,是一個(gè)任重而道遠(yuǎn)的任務(wù)。
吉林方言來自多元文化的融合,下面就以白山、吉林、通化、延邊等代表性方言詞語為例來詮釋其與普通話之間的差異。
白城方言與普通話間存在一些異議。首先,古精組字在普通話中把舌尖聲母成讀[ts、tsh、s],白山話中古精組字與古知、章、莊組字存在混淆。其次,白山話也分為四個(gè)聲調(diào),但調(diào)值、語速接近于山東話。白山話把普通話中的陰平調(diào)55全部降調(diào),讀成介于44- 22之間的平直調(diào),如撈33。白山話的兩個(gè)字詞語中,上聲 + 陰平被變調(diào)為35+33,如:眼眵214+55。
吉林方言與普通話最大的差別就是平舌和翹舌不分的問題。首先,是平、翹舌音混用:普通話常用漢字3500字中,翹舌音字有624個(gè),平舌音字只有262個(gè)。吉林方言卻恰恰相反,往往把普通話中的翹舌音讀成平舌音,把平舌音讀成翹舌音,兩者混用情況較為嚴(yán)重,造就了吉林人獨(dú)特的發(fā)音方式。其次,是舌尖前音z、c、s和舌面音j、q、x混淆:大多數(shù)吉林人把舌面音j、q、x,讀得接近舌尖前音z、c、s,造成了語音缺陷,聽起來純凈度不夠,給人一種含混不清的感覺。吉林人還存在著語音缺陷,即聲母發(fā)音時(shí)發(fā)音部位不準(zhǔn)確,讀翹舌音(zh、ch、sh)時(shí)只是舌尖接觸或接近上腭位置過于靠后或靠前,但還沒有完全錯(cuò)讀為平舌音(z、c、s),使人難以在短時(shí)間內(nèi)辨別他們所說的詞匯到底是什么。吉林話在韻母上存在的問題較少,稍加注意,基本上就可以解決。最后,是多加聲母n:普通話中有四個(gè)韻母不能構(gòu)成零聲母音節(jié),它們是——-i(前)、-i(后)、ong、eng,但在吉林話里,常常在e、ai、ao、ou、an、en、ang這7個(gè)開口呼零聲母音節(jié)前加上聲母n,比如,把惡(è)讀成 (nè)。
通化方言的使用地區(qū)包括通化市、通化縣、集安等地,因距離說膠遼官話的丹東、寬甸等地很近,至今保留了膠遼官話的特征,主要表現(xiàn)在古平聲清音的調(diào)值為423 或312。 其主要特征有如下幾方面:首先,在通化方言中不存在古知莊章組字。普通話古精組字讀 z、c、s, 古知莊章組字今讀 zh、ch、sh。 通化方言中古知莊章組字今讀 z、c、s,如只=茲 zī、詩=思 sī、抄=操cāo、是=四 sì等。通化方言常把r讀作零聲母字。如:人=銀 yín、冉=演 yǎn 等。其次,端系字有丟u 介音現(xiàn)象。普通話中,u 韻母作韻頭的開口呼韻母有 8 個(gè) :an、uo、uai、ui、uan、un、uang、ueng, 通化方言中丟韻頭的主要有 3 個(gè) ,即 ui、uan、un,如:短=膽 dǎn、端=丹 dān、亂=爛 làn、孫=森 sēn、酸=三 sān 等。通化方言中丟失介音在農(nóng)村比較普遍,老年人丟介音的情況多于年輕人,所以要改正通化方言中丟介音的現(xiàn)象,需從年輕人抓起。最后,通化方言中至今還保留著一些膠遼官話特殊讀音,如:干什么 gàn hén me、你家něn jià、 塌 hā、 藥 yüè、 摘 zé等。 改正這些方言所存在的問題,需要幾代人的不懈努力。
作為少數(shù)民族聚居的延邊自治州,其語音與普通話語音存在較多區(qū)別。(1)舌尖前聲母 z、c、s 與舌尖后聲母 zh、ch、sh 不分,也就是我們常說的平翹舌不分。(2)聲調(diào)發(fā)音不到位,把“然后”的“ran(二聲)”讀成“ran(一聲)”、把“照舊”的“舊 jiu(四聲)”讀成“jiu(一聲)”。延邊地區(qū)另外一種語音錯(cuò)誤現(xiàn)象,就是一個(gè)人讀一個(gè)字的時(shí)候,也會(huì)讀出不同的音,如:“站臺(tái)”的“站 zhan(四聲)”,讀出 zan3、zhan3、zhan4、zan4 四種音,這說明延邊人不懂得到底如何去讀。對于這一點(diǎn),沒有立竿見影的辨正方法,只能循序漸進(jìn)地進(jìn)行糾正。(3)將 w讀成 v。如:“蚊子”的“蚊”wen(二聲)——ven(二聲)。(4)把韻母 o誤讀成 e的現(xiàn)象也是存在的。把韻母 ong 誤讀成 eng,如:把“濃nong2”誤讀成“neng2”;把 “r”讀成“y”,如:熱re(四聲)——ye(四聲)、潤run(四聲)——yun(四聲)月。(5)把聲母m 讀成n,如:把“謎語”的“謎 mi(二聲)”誤讀成“ni(二聲)。(五)把介音“u”省略,主要體現(xiàn)在“l(fā)uan”這個(gè)音節(jié)上,如:將“山巒”的“巒 luan(二聲)”誤讀成“巒 lan(二聲)”。(六)把聲母r 讀成l或者y,如“扔reng(一聲)——leng(一聲)”和“允run(三聲)——(三聲)”這兩個(gè)字上。(7)在一些音節(jié)中把“iao”讀成“üe”,如:上學(xué)xue(二聲)——xiao(二聲)、姓岳yue(四聲)讀成yao(四聲)。所以相對來說,延邊地區(qū)普通話存在的問題較為嚴(yán)重,應(yīng)加以重視。
“御敵之法不在勝人在自勝”。了解各地區(qū)方言語音的問題及規(guī)律,對于解決普通話發(fā)音問題有著至關(guān)重要的作用。只有在明確了普通話語音問題的根本原因后,才能集中精力解決問題。一步一個(gè)腳印,穩(wěn)扎穩(wěn)打,方言語音的現(xiàn)存問題和當(dāng)代普通話的推廣問題便會(huì)迎刃而解。
語料庫建設(shè)的目的是重整中國語言的整體構(gòu)架與思維態(tài)勢,完善和健全國語在華夏大地的推廣工作。目前吉林省普通話語料庫已基本健全,形成了比較科學(xué)規(guī)范的管理和運(yùn)行體系,產(chǎn)生了廣泛的社會(huì)影響。但仍存在不完善之處,針對我省語料庫建設(shè)狀況,有如下建設(shè)策略:
(一)與時(shí)俱進(jìn),借鑒國外先進(jìn)經(jīng)驗(yàn)
隨著計(jì)算機(jī)網(wǎng)絡(luò)的快速發(fā)展、新傳媒的出現(xiàn),人們的交流方式日益豐富,這造就了一大批新興詞匯的出現(xiàn),如“囧”、“ 驢友”、“俯臥撐”、“雷”等。這些詞如今已經(jīng)不僅出現(xiàn)在網(wǎng)絡(luò),而且已經(jīng)在傳統(tǒng)媒體如電視、報(bào)紙及期刊中出現(xiàn),并且得到廣泛認(rèn)可。對這些新興語匯,我們必須加以重視。因而,語料庫的建設(shè)必須與時(shí)俱進(jìn),才能不落窠臼。與此同時(shí),我們還應(yīng)時(shí)刻關(guān)注國外語料庫的建設(shè)進(jìn)度,借鑒外國先進(jìn)的方法手段,并根據(jù)我省的實(shí)際情況將其本土化。
(二)利用人工及現(xiàn)代先進(jìn)科技,將語料庫進(jìn)行細(xì)化篩選
語料庫的規(guī)模以及對語料加工的細(xì)化程度,決定了語料庫的數(shù)據(jù)的可靠性以及為使用者提供的服務(wù)程度。由于吉林省的語料極為龐雜且存在混同的問題,我們必須對其收錄的語料進(jìn)行二次甚至多次篩選。利用現(xiàn)代科技,對其重復(fù)添加詞加以刪除,更新語料庫,使其正確添加新的詞匯。同時(shí),對少數(shù)不規(guī)律的以及一些方言詞匯,必須聘任相關(guān)語言專家進(jìn)行人工評測,確保語料庫的數(shù)據(jù)全面、規(guī)范及細(xì)致。同時(shí),應(yīng)建立“中介語”語音語料庫。漢語普通話“中介語”語音語料庫如果全面展開,必定是一個(gè)規(guī)模浩大的工程,需構(gòu)筑一個(gè)技術(shù)平臺(tái),探索一套研究模式,并為將來建立更大規(guī)模的“中介語”語音料庫提供一個(gè)范本。
(三)實(shí)地考察與理論研究相結(jié)合
吉林省屬于多個(gè)少數(shù)民族聚居的省份,語言面貌比較多樣且復(fù)雜。按照吉林省行政區(qū)劃,全省轄8個(gè)地級市、1個(gè)自治州、20個(gè)市轄區(qū)。其中遼源市、通化市、白山市、松原市、白城市、延邊朝鮮族自治州6個(gè)地區(qū),因其自身有其獨(dú)特的語音面貌,被列為重點(diǎn)語料樣本選取地區(qū)。我們應(yīng)該注重實(shí)地調(diào)查,通過交談、收聽、問答等多種方式收集方言詞匯,書寫記錄調(diào)查方言詞匯必須做到既準(zhǔn)確又全面,并以當(dāng)時(shí)當(dāng)?shù)氐恼Z境了解詞語的語義和詞語的感情色彩。
[1]李如龍.漢語方言比較研究[M].北京:商務(wù)出版社,2001.
[2]羅福騰.膠遼官話研究[D].濟(jì)南;山東大學(xué),1998.
[3]李榮.現(xiàn)代漢語方言大詞典[Z].南京:江蘇教育出版社,2004.
[4]王如辰.吉林方言區(qū)內(nèi)普通話教學(xué)[J].白城師范高等??茖W(xué)校學(xué)報(bào),2002(4).
[5]錢曾怡.漢語方言研究的方法與實(shí)踐[M].北京:商務(wù)印書館,2002.
[6]孫維張.吉林方言分區(qū)略說[J].方言,1986(1).
[7]馮常榮.吉林省方言結(jié)構(gòu)詞的特點(diǎn)[J].白城師范學(xué)院報(bào),2009(8).
[8]鄒德文.近百年來漢語東北方言語音研究述論[J].哈爾濱師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2012(4).
2014-01-09
吉林省教育廳“十二五”社會(huì)科學(xué)研究項(xiàng)目(JYKL125YB-10)。
孫 博(1959- ),男,吉林長春人,長春師范大學(xué)文學(xué)院教授,從事文藝學(xué)與文化研究。
H01
A
2095-7602(2014)03-0049-03