国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)料庫(kù)漢字偏誤分類(lèi)和標(biāo)注體系研究*

2014-03-10 23:02張瑞朋
關(guān)鍵詞:錯(cuò)字遺漏偏誤

張瑞朋

(中山大學(xué) 國(guó)際漢語(yǔ)學(xué)院,廣東 廣州510275)

一、引言

目前在對(duì)外漢語(yǔ)教學(xué)與研究方面,中介語(yǔ)語(yǔ)料庫(kù)的建設(shè)與運(yùn)用是個(gè)熱門(mén),但是漢字偏誤標(biāo)注信息,尤其是錯(cuò)字信息在中介語(yǔ)語(yǔ)料庫(kù)中體現(xiàn)得還不夠。

北京語(yǔ)言大學(xué)HSK動(dòng)態(tài)作文語(yǔ)料庫(kù)是目前公開(kāi)的規(guī)模較大的綜合性語(yǔ)料庫(kù)。該庫(kù)從字、詞、句、篇、標(biāo)點(diǎn)符號(hào)等角度對(duì)語(yǔ)料進(jìn)行了全面標(biāo)注,其中關(guān)于漢字的標(biāo)注項(xiàng)目有:錯(cuò)字、別字、漏字、多字、繁體字、異體字、拼音字等。語(yǔ)料庫(kù)對(duì)錯(cuò)字的處理方式是:在語(yǔ)料中用正確字代替錯(cuò)字,并在旁邊標(biāo)注出錯(cuò)字符號(hào),用戶(hù)要想查看錯(cuò)字原貌,必須打開(kāi)原始的掃描語(yǔ)料。但因?yàn)閽呙璋嬷械腻e(cuò)字沒(méi)有編碼,故無(wú)法直接檢索和統(tǒng)計(jì),更無(wú)法進(jìn)行字形對(duì)比。其他能見(jiàn)到的語(yǔ)料庫(kù)中,錯(cuò)字偏誤標(biāo)注信息也不充分,僅僅表示是錯(cuò)字或者別字,這除了與計(jì)算機(jī)技術(shù)水平有關(guān)外,也與語(yǔ)言學(xué)界對(duì)漢字偏誤的研究有關(guān)。

留學(xué)生“學(xué)習(xí)一定的漢語(yǔ)詞匯,對(duì)漢語(yǔ)和母語(yǔ)詞匯方面的差異有了一定的了解,學(xué)生在運(yùn)用漢語(yǔ)詞匯的時(shí)候,就會(huì)有意識(shí)地?cái)U(kuò)大這種差異,由于掌握的漢語(yǔ)詞匯知識(shí)的不足,從而導(dǎo)致偏誤”[1]。偏誤分析自中介語(yǔ)理論引進(jìn)以來(lái),在我國(guó)已全面展開(kāi)研究。目前關(guān)于偏誤分析,主要集中于詞匯和語(yǔ)法方面,在外國(guó)人書(shū)習(xí)漢字的偏誤方面雖已有所探討,但尚未系統(tǒng)展開(kāi)。關(guān)于外國(guó)人書(shū)習(xí)漢字的偏誤,學(xué)界主要有對(duì)漢字偏誤進(jìn)行分類(lèi)、考察漢字習(xí)得的形音變化情況、漢字國(guó)別化區(qū)域化研究等幾個(gè)方面,其中對(duì)漢字偏誤進(jìn)行分類(lèi)研究的主 要 有 朱 志 平、哈 麗 娜 (1996)[2]、施 正 宇(1999)[3]、施正宇(2000)[4]、肖奚強(qiáng)(2002)[5]等。這些分類(lèi)顯得比較隨意,有的分類(lèi)標(biāo)準(zhǔn)不太統(tǒng)一,有的分類(lèi)交叉重疊,錯(cuò)字和別字仍是漢字偏誤的主要界限,并且對(duì)偏誤成因也沒(méi)有比較系統(tǒng)的分析,不太適合標(biāo)注語(yǔ)料庫(kù)中的漢字偏誤。況且眾多分類(lèi)都是給出特定的類(lèi)型標(biāo)簽之后,再舉例說(shuō)明,個(gè)例的分析固然很有必要,但不容易展示一種內(nèi)在傾向性。本文在大規(guī)模語(yǔ)料調(diào)查的基礎(chǔ)上,盡可能系統(tǒng)、充分地揭示出其內(nèi)在的規(guī)律性,并從漢字認(rèn)知的角度做出相應(yīng)的說(shuō)明。這種大規(guī)模語(yǔ)料庫(kù)驅(qū)動(dòng)的漢字習(xí)得研究或許給漢字乃至漢語(yǔ)習(xí)得研究提供一種新視角,展示一種新思路。

眾所周知,外國(guó)學(xué)生書(shū)寫(xiě)的偏誤漢字中有一部分跟中國(guó)人的錯(cuò)別字不同,比如,將“竹”字頭寫(xiě)成英文字母k,“女”寫(xiě)成近似兩個(gè)半圓,這與受其母語(yǔ)負(fù)遷移影響有關(guān)。又如,把“云”寫(xiě)成“臺(tái)”,把“筆”寫(xiě)成“笑”,把“在”寫(xiě)成“左”,把“受”寫(xiě)成“愛(ài)”,把“絕”寫(xiě)成“綠”,這些偏誤漢字是成字的,但是音意都無(wú)關(guān),只是字形有相似之處。尤其像“在”寫(xiě)成“左”,也可以說(shuō)是因漏掉一筆而錯(cuò)寫(xiě)成了“左”,中國(guó)人一般不會(huì)寫(xiě)這樣的別字。這些字到底歸為錯(cuò)字還是別字,是有爭(zhēng)議的,本文不再以錯(cuò)字和別字作為劃分漢字偏誤的主要界限,而是從語(yǔ)料庫(kù)中錯(cuò)別字的標(biāo)注需求出發(fā),立足于現(xiàn)有的對(duì)外漢語(yǔ)偏誤分析的研究成果,從筆畫(huà)、部件、整字3個(gè)層級(jí),從偏誤特征和偏誤成因入手,對(duì)外國(guó)學(xué)生漢字書(shū)寫(xiě)偏誤進(jìn)行新視角研究。

因?yàn)槿枕n學(xué)生有漢字背景,其筆下的漢字有的是不再使用的繁體字,比如,把“書(shū)”寫(xiě)成“書(shū)”,把“異”寫(xiě)成“異”,有的是跟現(xiàn)代漢字有區(qū)別的本國(guó)漢字,比如,日本學(xué)生把“游”寫(xiě)成“遊”,“賴(lài)”寫(xiě)成“”,“坐”寫(xiě)成”,“錢(qián)”寫(xiě)成”,有的漢字受本國(guó)繁體字影響而局部用繁體局部用簡(jiǎn)體,如,把“驗(yàn)”寫(xiě)成“ ”,“訓(xùn)”寫(xiě)成“訓(xùn)”,“結(jié)”寫(xiě)成“結(jié)”。這些漢字很難說(shuō)是傳統(tǒng)意義上的別字,也很難說(shuō)是錯(cuò)字,在語(yǔ)料庫(kù)中標(biāo)注錯(cuò)別字時(shí)必須把這些現(xiàn)象分開(kāi)來(lái)處理,并區(qū)別日韓背景和非日韓背景下的漢字。下文討論主要是針對(duì)非日韓背景下的漢字書(shū)寫(xiě)。

二、外國(guó)學(xué)生書(shū)寫(xiě)漢字的偏誤特征分類(lèi)

筆畫(huà)和部件是現(xiàn)代漢字的結(jié)構(gòu)成分。獨(dú)體字直接由筆畫(huà)構(gòu)成,合體字的結(jié)構(gòu)則有筆畫(huà)、部件、整字3個(gè)層次。本文即從筆畫(huà)、部件、整字這3個(gè)層級(jí)來(lái)分析漢字的偏誤特征,即,筆畫(huà)偏誤、部件偏誤、整字偏誤。

筆者調(diào)查了中山大學(xué)漢字偏誤標(biāo)注的漢語(yǔ)連續(xù)中介語(yǔ)語(yǔ)料庫(kù),一共收集錯(cuò)字種類(lèi)2103個(gè),錯(cuò)字共8045個(gè),根據(jù)字形表面偏誤特征,把偏誤類(lèi)型分為遺漏、誤加、誤代、錯(cuò)位①在詞匯和語(yǔ)法偏誤中,錯(cuò)序和錯(cuò)位是相同的概念,但在漢字偏誤中,因?yàn)闈h字是平面的、方塊的,筆畫(huà)、部件的位置會(huì)寫(xiě)錯(cuò),所以統(tǒng)一用錯(cuò)位概念比較好。和雜糅5種。我們對(duì)偏誤類(lèi)型的歸納雖然仍基于偏誤分析中的基本思路而做出概括,但我們側(cè)重于每種偏誤類(lèi)型的內(nèi)在結(jié)構(gòu)關(guān)系,而不是簡(jiǎn)單地收集錯(cuò)誤的用例。(下面舉例中,短橫“—”之前的為正字,其后的為偏誤漢字,用“*”標(biāo)示出來(lái))

(一)遺漏

漢字書(shū)寫(xiě)中的遺漏情況只能出現(xiàn)在筆畫(huà)和部件這兩個(gè)層面。

部件遺漏則基本上是由于不會(huì)寫(xiě)某個(gè)字而以同音字或近音字代替的結(jié)果。如:城—*成、萍—*蘋(píng)、較—*交、畢—*比、健—*建、稼—*家、歷—*力。有時(shí)則跟語(yǔ)音并不相關(guān),如:色—*巴。還有部件遺漏后不成字的情況,如:隨—*這種情況往往是本字具有較復(fù)雜的多層次結(jié)構(gòu)。

相對(duì)于筆畫(huà)遺漏,部件遺漏的偶然性較大。遺漏現(xiàn)象在國(guó)別中體現(xiàn)出高度泛國(guó)別化特征,但是筆畫(huà)遺漏多發(fā)生在學(xué)習(xí)者的初級(jí)階段,部件遺漏則在初中高級(jí)都會(huì)發(fā)生。

(二)誤代

漢字書(shū)寫(xiě)中的誤代情況在筆畫(huà)、部件和整字這三個(gè)層面都有體現(xiàn)。

整字誤代既有用形近字來(lái)代替本字的,如:買(mǎi)—*頭、辦—*為、云—*會(huì)、木—*術(shù)、真—*直、見(jiàn)—*貝、來(lái)—*傘、代表—*化表、臺(tái)—*云、夏—*復(fù);也有用音同或音近的字來(lái)代替本字的,如:青—*輕、齡—*領(lǐng)。形近字的誤代占多數(shù),這跟我們教授漢字的過(guò)程相關(guān)。

(三)錯(cuò)位

凡是筆畫(huà)寫(xiě)錯(cuò)位置或者筆畫(huà)出頭與否而導(dǎo)致筆畫(huà)關(guān)系出錯(cuò)的,都是錯(cuò)位。既有筆畫(huà)的錯(cuò)位,也有部件的錯(cuò)位。

部件錯(cuò)位是指合體字中的兩個(gè)部件位置互換而形成的錯(cuò)字,如:像“還”寫(xiě)成將半包圍結(jié)構(gòu)的漢字寫(xiě)成左右結(jié)構(gòu)),也可看作部件錯(cuò)位。施正宇(1999)有關(guān)部件的偏誤類(lèi)別中的“部件異位”和“結(jié)構(gòu)異位”大多屬于此,如:“加”寫(xiě)成““規(guī)”寫(xiě)成“ ”;肖奚強(qiáng)(2001)“部件的變形和變位”中的“部件鏡像變位”也屬于這種情況,如“和”寫(xiě)成“ ”,“知”寫(xiě)成”[6]。本文的部件錯(cuò)位的所指范圍要比他們的寬泛。

筆畫(huà)錯(cuò)位和部件錯(cuò)位多發(fā)生在非日韓國(guó)家學(xué)習(xí)者的初級(jí)階段。

(四)誤加

誤加指書(shū)寫(xiě)者在寫(xiě)字的過(guò)程中,添加了不應(yīng)有的筆畫(huà)或部件。筆畫(huà)誤加如:施正宇(1999)在偏誤類(lèi)別中沒(méi)有談到“誤加”[2],而施正宇(2000)“形符類(lèi)推”和“形符累加”中的“加形符”都屬于部件誤加[3];肖奚強(qiáng)(2001)中“部件的增加”也屬于部件誤加[5]。綜觀誤加的情形,誤加后形成的部件大多是一個(gè)既已存在的漢字部件;即便有的在現(xiàn)代漢字系統(tǒng)中不存在,但其誤加之處也往往受到形似部件尤其是偏旁的影響。這里也可以看出漢字結(jié)構(gòu)化意識(shí)對(duì)漢字習(xí)得的影響。

筆畫(huà)誤加多發(fā)生在非日韓學(xué)生的初級(jí)階段,部件誤加則在初中高級(jí)都可能發(fā)生。

(五)雜糅

所謂雜糅,就是講兩個(gè)漢字的相關(guān)部件“整合”在了一起,造出了一個(gè)不存在的漢字。如將“該”寫(xiě)成“ ”,實(shí)際是“應(yīng)”和“該”的雜糅(朱其智,2009)[7]。同樣,“她”寫(xiě)成“ ”,應(yīng)該是“他”和“女”的雜糅,“起”寫(xiě)成,實(shí)際是“起床”各取一部分的雜糅,“服”寫(xiě)成,應(yīng)該是“服”和“務(wù)”的雜糅,“那”寫(xiě)成,應(yīng)該是“那”的左邊和“個(gè)”的雜糅。可以看出雜糅中有一部分是把經(jīng)常放在一起使用的兩個(gè)漢字,各自取一部分放在一起。這是一個(gè)值得深入考察的認(rèn)知現(xiàn)象,其錯(cuò)字形成的機(jī)制從一個(gè)特殊的角度揭示了漢字形體和意義之間的關(guān)聯(lián),而這是傳統(tǒng)漢字研究所不關(guān)心的問(wèn)題。

雜糅反映了學(xué)習(xí)者對(duì)部件有了一定認(rèn)識(shí),又沒(méi)有完全掌握漢字書(shū)寫(xiě),這時(shí)就可能發(fā)生不同部件混雜在一起的現(xiàn)象。

除上面所述的幾種偏誤特征以外,跟語(yǔ)法偏誤不同,漢字的幾種偏誤形式是可以同時(shí)存在并互相轉(zhuǎn)化的。筆畫(huà)遺漏可以導(dǎo)致部件誤代,如:筆畫(huà)誤加也可以導(dǎo)致部件誤代,如:誤代也可以導(dǎo)致部件誤代,如漏也可導(dǎo)致部件誤代,如:明—* ;在同一個(gè)漢字中,也可能同時(shí)存在筆畫(huà)遺漏和筆畫(huà)誤加,如:

三、外國(guó)學(xué)生書(shū)寫(xiě)漢字的偏誤原因

施正宇(1999)在每類(lèi)偏誤字“表現(xiàn)形式”一欄中所提的“形符形近”、“形符意近”、“詞義干擾”、“修飾詞干擾”、“量詞干擾”、“中心詞干擾”其實(shí)都是根據(jù)“偏誤成因”所做的分類(lèi),但她只是在“形符類(lèi)推”一類(lèi)中,把“形符類(lèi)推”、“詞義干擾”這些偏誤特征歸為“錯(cuò)誤原因”[2]。肖奚強(qiáng)(2002)所列的三大類(lèi)偏誤中的小類(lèi),如:形近改換、意近改換、類(lèi)化改換;母語(yǔ)遷移變形、部件鏡像變位都是根據(jù)偏誤成因再做的分類(lèi)[4],但分類(lèi)標(biāo)準(zhǔn)不統(tǒng)一。本文用偏誤分析中的偏誤成因來(lái)統(tǒng)一規(guī)范和分析它們。偏誤分析在分析語(yǔ)法偏誤時(shí)把偏誤成因分為母語(yǔ)負(fù)遷移、交際策略、學(xué)習(xí)策略、目的語(yǔ)規(guī)則泛化、誤導(dǎo)等,但漢字畢竟是平面的、方塊的,學(xué)生在習(xí)得漢字時(shí)形成的偏誤有跟語(yǔ)法偏誤成因相同的,也有其不同的,跟漢字本身的獨(dú)特特點(diǎn)有關(guān)。

(一)漢字偏誤的根本成因

漢字的基本組成零件是筆畫(huà)和部件,筆畫(huà)層面的錯(cuò)字產(chǎn)生的根本原因是學(xué)習(xí)者沒(méi)有正確掌握筆畫(huà)的屬性,即筆畫(huà)的數(shù)目、形狀、組合關(guān)系,甚至于書(shū)寫(xiě)過(guò)程中的筆順。如果這個(gè)問(wèn)題解決了,用非筆畫(huà)單位來(lái)代替筆畫(huà)的現(xiàn)象也就會(huì)解決,如:因筆畫(huà)不規(guī)范而造成的錯(cuò)字也可以解決,如象說(shuō)明學(xué)生正處于學(xué)習(xí)漢字的模糊狀態(tài),沒(méi)有真正掌握漢字筆畫(huà)書(shū)寫(xiě)。

部件是漢字的構(gòu)形單位,部件層面的錯(cuò)字產(chǎn)生的根本原因是學(xué)習(xí)者沒(méi)有把握住部件的意義特征。形聲字的形旁表意,聲旁表音,抓住這一特點(diǎn),將會(huì)有利于外國(guó)學(xué)生學(xué)習(xí)漢字。留學(xué)生有些錯(cuò)字反映了學(xué)生并未掌握形聲字這一特點(diǎn)。比如:疾病— ,表示學(xué)生不明白“ ”表示疾病的意義。療— ,說(shuō)明學(xué)生沒(méi)有掌握形聲字聲旁表音特點(diǎn)。這些都說(shuō)明學(xué)生未抓住形旁的意義特征。

筆畫(huà)和部件是漢字的兩個(gè)基本組成,不徹底解決這兩個(gè)層面的問(wèn)題,外國(guó)學(xué)習(xí)者對(duì)于漢字的認(rèn)識(shí)無(wú)法達(dá)到理性的高度,但是漢字書(shū)寫(xiě)并不是解決了筆畫(huà)和部件就能徹底解決的問(wèn)題。外國(guó)學(xué)生書(shū)寫(xiě)漢字出現(xiàn)偏誤的原因比較復(fù)雜,跟漢字本身的特點(diǎn)有關(guān),也與其自身的知識(shí)背景和習(xí)得過(guò)程有關(guān)。

(二)漢字偏誤的其他成因

1.母語(yǔ)文字系統(tǒng)的負(fù)遷移

學(xué)界對(duì)漢語(yǔ)習(xí)得中的母語(yǔ)負(fù)遷移現(xiàn)象有了比較深入的探討,但對(duì)漢字習(xí)得中的母語(yǔ)文字系統(tǒng)的負(fù)遷移現(xiàn)象認(rèn)識(shí)不多。這可以從兩個(gè)方面來(lái)看。

拼音文字背景學(xué)生的負(fù)遷移主要是在書(shū)寫(xiě)時(shí)用字母等來(lái)替代漢字的筆畫(huà)。比較常見(jiàn)的如把“竹”字頭寫(xiě)成兩個(gè)字母k,如“笑”、“筆”寫(xiě)成其他偏誤。又如把的右半部寫(xiě)成字母寫(xiě)成數(shù)字3。當(dāng)然,這種情況的出現(xiàn),有些是由于寫(xiě)漢字的隨意性造成的。

2.錯(cuò)誤類(lèi)推

錯(cuò)誤類(lèi)推是指,漢字偏誤的出現(xiàn)是由于學(xué)習(xí)者根據(jù)上下文或者學(xué)生本身的語(yǔ)言知識(shí)進(jìn)行的錯(cuò)誤類(lèi)推而形成的。這是在學(xué)習(xí)習(xí)得一定的漢字部件、并具備了相當(dāng)?shù)臐h字結(jié)構(gòu)意識(shí)之后經(jīng)常出現(xiàn)的偏誤情況。漢字習(xí)得過(guò)程中的錯(cuò)誤類(lèi)推雖然相當(dāng)復(fù)雜,但集中體現(xiàn)為下面3種情況:

受經(jīng)常作為詞出現(xiàn)的另一個(gè)漢字的影響。也就是說(shuō),如果兩個(gè)漢字經(jīng)常在一起出現(xiàn),頻率很高,學(xué)生則會(huì)把這兩個(gè)漢字混淆。比如:痛苦—*疼苦,據(jù)說(shuō)—*根說(shuō)。大概因?yàn)椤疤弁础边@個(gè)詞經(jīng)常出現(xiàn),學(xué)生混淆了“疼”和“痛”,把“痛苦”寫(xiě)成“疼苦”。“根”和“據(jù)”一起出現(xiàn)的頻率較高,學(xué)生也混淆了這兩個(gè)漢字,把“據(jù)說(shuō)”寫(xiě)成“根說(shuō)”。也就是說(shuō),經(jīng)常作為詞出現(xiàn)在一起的兩個(gè)漢字,學(xué)生可能會(huì)混淆這兩個(gè)漢字。這個(gè)現(xiàn)象也值得進(jìn)一步考察,學(xué)生在習(xí)得一部分漢字的時(shí)候,是把他們作為整體詞語(yǔ)習(xí)得的,但是分開(kāi)后,對(duì)每個(gè)漢字,掌握得并不好。

受學(xué)生本身已經(jīng)內(nèi)化的語(yǔ)言知識(shí)影響。除了受上下文影響,有些偏誤產(chǎn)生于學(xué)生已經(jīng)內(nèi)化的語(yǔ)言知識(shí)。這可能是書(shū)寫(xiě)者根據(jù)“亻”與人有關(guān),“忄”、“心”與心理活動(dòng)有關(guān)、“美”與女人有關(guān)而類(lèi)推的。又比已經(jīng)有了形聲字聲旁意識(shí),認(rèn)為“努力”可能跟“女”有關(guān),所以下半寫(xiě)了“女”。又比如:趣—*說(shuō)明學(xué)生已經(jīng)明白形符的表意作用,只是不懂得不同的漢字形符有時(shí)是固定不能隨意變化的。再比如,“?!睂?xiě)成學(xué)生考慮到“祝福、祝賀”要用嘴說(shuō)話(huà),所以寫(xiě)成“讠”;“塊”寫(xiě)成“* ”,是因?yàn)閷W(xué)生考慮到“塊”是“錢(qián)”的量詞,所以和“錢(qián)”的偏旁一樣。施正宇(1999)中的形似形符替代、義近形符替代、相關(guān)形符替代和形符類(lèi)推中的偏誤字,都是學(xué)生根據(jù)本身已經(jīng)內(nèi)化的語(yǔ)言知識(shí)而推出的錯(cuò)誤形式。這些例子有些漢字雖然是錯(cuò)誤的,卻能反映出學(xué)生選擇漢字時(shí)并不是盲目的,有些錯(cuò)誤倒帶有一定的理?yè)?jù)性,還能自圓其說(shuō),對(duì)這類(lèi)錯(cuò)誤,如果教師平時(shí)好好引導(dǎo)應(yīng)該可以避免。

3.羨余

漢字有一定羨余性,即表意時(shí)用了多余的信息來(lái)表達(dá)。漢字羨余度比拼音文字要大,留學(xué)生利用漢字的羨余現(xiàn)象,從而形成漢字偏誤。在中山大學(xué)的漢字偏誤連續(xù)性中介語(yǔ)語(yǔ)料庫(kù)中,分別有一些越南、菲律賓、印尼、俄羅斯等學(xué)生把“鯉魚(yú)”、“鯊魚(yú)”寫(xiě)成“*里魚(yú)”、“*沙魚(yú)”的情況,而在“錦鯉”和“大白鯊”等詞語(yǔ)中,“鯉”和“鯊”都書(shū)寫(xiě)正確。大概是因?yàn)椤磅庺~(yú)”、“鯊魚(yú)”這些詞中,有類(lèi)名“魚(yú)”存在,專(zhuān)名“鯉”和“鯊”字中的形旁“魚(yú)”就是羨余的,所以學(xué)生會(huì)把形旁“魚(yú)”漏掉,而在“錦鯉”和“大白鯊”等詞語(yǔ)中,沒(méi)有類(lèi)名“魚(yú)”存在,“鯉”和“鯊”字形旁就沒(méi)有遺漏[5]。再比如:在柬埔寨的學(xué)生作業(yè)中,學(xué)生把“米粉”寫(xiě)成“*米分”,但在“吃粉還是吃面”中,因?yàn)闆](méi)有“米”的出現(xiàn),“粉”的形旁就沒(méi)有遺漏。在另一個(gè)柬埔寨的學(xué)生作業(yè)中,出現(xiàn)了把“車(chē)輪”寫(xiě)成“車(chē)*侖”,但是在“輪到我”中,形旁“車(chē)”則沒(méi)有出現(xiàn)遺漏。①朱其智老師提供,來(lái)自柬埔寨不同的學(xué)生作業(yè)。這種因?yàn)闈h字羨余而形成漢字偏誤的現(xiàn)象在不同國(guó)別的不同學(xué)生中,尤其是非日韓學(xué)生的中高級(jí)階段,呈現(xiàn)出一定規(guī)律性,并非個(gè)別化現(xiàn)象,這種現(xiàn)象值得我們特別的關(guān)注。

四、漢字偏誤分析在漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)中的應(yīng)用

據(jù)前文分析可知,留學(xué)生的“錯(cuò)字”和“別字”跟中國(guó)人筆下的“錯(cuò)字”和“別字”有所不同,所以,對(duì)留學(xué)生筆下的“錯(cuò)字”和“別字”重新界定目前還比較困難,上文從筆畫(huà)、部件、整字3個(gè)層級(jí)上對(duì)偏誤漢字做統(tǒng)一的分析,可以避免錯(cuò)別字難以區(qū)分的問(wèn)題。同時(shí),這種分析可以使?jié)h字偏誤特征表現(xiàn)得更加細(xì)致而有體系,方便漢字偏誤研究。我們?cè)趯?shí)際語(yǔ)料中可以據(jù)此標(biāo)注,先從外觀上,對(duì)漢字偏誤從筆畫(huà)、部件、整字3個(gè)層次按照客觀特征來(lái)標(biāo)注。筆畫(huà)誤加標(biāo)為bhwj,筆畫(huà)遺漏標(biāo)為bhyl,筆畫(huà)誤代標(biāo)為bhwd,筆畫(huà)錯(cuò)位標(biāo)為bhcw;部件誤加標(biāo)為bjwj,部件遺漏標(biāo)為bjyl,部件誤代標(biāo)為bjwd,部件錯(cuò)位標(biāo)為bjcw,部件雜糅標(biāo)為bjzr;整字誤代標(biāo)為zzwd。偏誤原因可以作為參數(shù),比如個(gè)偏誤漢字是部件誤代,正字是“陌”,原因是母語(yǔ)負(fù)遷移。又如:,表示偏誤和正字之間是部件誤代的關(guān)系,偏誤成因是偏誤漢字跟正字字形相近。領(lǐng)zzwd(齡,音近),表示括號(hào)外的偏誤漢字和括號(hào)里的偏誤漢字是整字誤代的關(guān)系,成因是括號(hào)外的偏誤漢字跟括號(hào)里的正確漢字音近。

我們?cè)阱e(cuò)字?jǐn)?shù)據(jù)庫(kù)中將把遺漏的筆畫(huà)、部件作為這種特征的參數(shù)標(biāo)出來(lái)。比如:遺標(biāo)為bhyl(貳,內(nèi)橫),參數(shù)表示“貳”遺漏“內(nèi)橫”,誤示“圈”誤代了,并且是bhwd(豎橫折,撇),表示“貝”誤代了“見(jiàn)”,并且是“撇”誤代了“豎橫折”。標(biāo)為(起〈走〉,床〈木〉),表示“起”的“走”部和“床”的“木”部雜糅。

中山大學(xué)漢字偏誤標(biāo)注中介語(yǔ)語(yǔ)料庫(kù)已經(jīng)有200多萬(wàn)字,同時(shí)還依據(jù)這個(gè)語(yǔ)料庫(kù)建立了一個(gè)附屬數(shù)據(jù)庫(kù):錯(cuò)字?jǐn)?shù)據(jù)庫(kù),其目的就是方便各種筆畫(huà)、部件、漢字錯(cuò)誤特征和偏誤成因的調(diào)查和統(tǒng)計(jì)?,F(xiàn)在該錯(cuò)字?jǐn)?shù)據(jù)庫(kù)已經(jīng)收集2000多個(gè)錯(cuò)字字類(lèi),8000多個(gè)錯(cuò)字,本文的各種漢字實(shí)例即來(lái)自該數(shù)據(jù)庫(kù)。同時(shí),我們已經(jīng)依據(jù)這種標(biāo)注體系在2萬(wàn)字的中介語(yǔ)語(yǔ)料中進(jìn)行實(shí)驗(yàn),結(jié)果表明,這種標(biāo)注體系可以避免留學(xué)生部分偏誤漢字到底是別字還是錯(cuò)字的爭(zhēng)論。從偏誤客觀特征進(jìn)行分類(lèi),比較概括,它將分散的類(lèi)上升到客觀特征,便于看出正確與錯(cuò)誤的差別。同時(shí)這個(gè)分類(lèi),邊界清晰,偏誤特征客觀易見(jiàn)。

五、結(jié) 語(yǔ)

目前,漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)中的漢字偏誤尤其是錯(cuò)字標(biāo)注信息極少,這與計(jì)算機(jī)技術(shù)的發(fā)展有關(guān),更與語(yǔ)言學(xué)界對(duì)漢字偏誤的研究有關(guān)。語(yǔ)料庫(kù)中的漢字偏誤標(biāo)注,要求漢字偏誤分類(lèi)邊界清晰,符號(hào)意義明了,便于檢索,同時(shí)能用簡(jiǎn)單的方法標(biāo)注出偏誤成因,則能進(jìn)一步為用戶(hù)提供幫助。這樣的分類(lèi)和研究才能適合在語(yǔ)料庫(kù)中運(yùn)用。上述研究即撇開(kāi)了傳統(tǒng)的基于錯(cuò)字和別字的分類(lèi),而是從筆畫(huà)、部件、整字3個(gè)層面,對(duì)偏誤特征和偏誤成因進(jìn)行了分析,這種分類(lèi)可能更有利于漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)中偏誤漢字的標(biāo)注,同時(shí)這種體系的設(shè)計(jì)和規(guī)范也是出自正在建設(shè)的錯(cuò)字?jǐn)?shù)據(jù)庫(kù)。因此本文的研究來(lái)源于語(yǔ)料庫(kù),同時(shí)得出的結(jié)論又應(yīng)用于語(yǔ)料庫(kù),對(duì)漢字偏誤的進(jìn)一步標(biāo)注具有實(shí)踐價(jià)值和意義。

[1]臧志文.HSK作文語(yǔ)料庫(kù)中出現(xiàn)的逆序詞現(xiàn)象分析[J].大理學(xué)院學(xué)報(bào),2011,(9).

[2]朱志平.漢字構(gòu)形學(xué)說(shuō)與對(duì)外漢語(yǔ)教學(xué)[J].語(yǔ)言教學(xué)與研究,1996,(4).

[3]施正宇.外國(guó)留學(xué)生形符書(shū)寫(xiě)偏誤分析[J].北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1999,(4).

[4]施正宇.外國(guó)留學(xué)生字形書(shū)寫(xiě)偏誤分析[J].漢語(yǔ)學(xué)習(xí),2000,(2).

[5]肖奚強(qiáng).外國(guó)學(xué)生漢字偏誤分析[J].世界漢語(yǔ)教學(xué),2002,(2).

[6]朱其智.偏誤生成學(xué)的范圍和方法[J].學(xué)術(shù)研究,2009,(8).

猜你喜歡
錯(cuò)字遺漏偏誤
遺漏的光陰
易錯(cuò)字 來(lái)提醒
錯(cuò)字在身邊
60秒找錯(cuò)字
60秒找錯(cuò)字
“一……就……”句式偏誤研究
應(yīng)用品管圈降低腹腔鏡抗反流手術(shù)術(shù)前準(zhǔn)備遺漏率的實(shí)踐
遺漏焦慮
關(guān)于《突厥語(yǔ)大詞典》漢字譯寫(xiě)偏誤研究
“ü”偏誤調(diào)查與“v”替代的拼音策略
莱阳市| 天镇县| 远安县| 岑溪市| 广东省| 乌拉特后旗| 衡阳县| 伊吾县| 永善县| 临朐县| 绵竹市| 买车| 肇源县| 广饶县| 嘉义市| 杭锦旗| 洪洞县| 东城区| 沧州市| 新闻| 锡林郭勒盟| 白朗县| 定结县| 连平县| 阳新县| 双鸭山市| 东海县| 延安市| 宜黄县| 吉木萨尔县| 曲沃县| 嘉义县| 绍兴市| 攀枝花市| 新安县| 工布江达县| 南靖县| 舞阳县| 台江县| 余姚市| 辉南县|