郭曙綸 樸貞姬
零、引言
本文的工作是對(duì)國(guó)家語(yǔ)言文字工作委員會(huì)語(yǔ)言文字規(guī)范GF3003-1999,即傅永和等編《GB13000.1字符集:漢字字序(筆畫(huà)序)規(guī)范》(以下簡(jiǎn)稱《筆畫(huà)序規(guī)范》)中的20902個(gè)漢字的筆畫(huà)及筆畫(huà)數(shù)進(jìn)行統(tǒng)計(jì)與分析。
本文的做法是:首先把《筆畫(huà)序規(guī)范》中的20902個(gè)漢字的筆畫(huà)及筆畫(huà)數(shù)逐個(gè)輸入電腦。這項(xiàng)輸入與校對(duì)工作前后花了大約半年的時(shí)間,這是本文整個(gè)統(tǒng)計(jì)研究工作中最基礎(chǔ)性的工作,當(dāng)然也是最繁重的工作。然后在此基礎(chǔ)上進(jìn)行了數(shù)據(jù)統(tǒng)計(jì)。
在統(tǒng)計(jì)中,本文首先統(tǒng)計(jì)了20902個(gè)漢字的筆畫(huà)及筆畫(huà)數(shù)。作為比較,本文還統(tǒng)計(jì)了《現(xiàn)代漢語(yǔ)常用字表》中的3500個(gè)現(xiàn)代漢語(yǔ)常用字的相關(guān)數(shù)據(jù)。本文的統(tǒng)計(jì)包括兩個(gè)方面,一是畫(huà)數(shù)(筆畫(huà)數(shù))統(tǒng)計(jì),一是筆畫(huà)統(tǒng)計(jì)。我們對(duì)所有統(tǒng)計(jì)數(shù)據(jù)都進(jìn)行了分析說(shuō)明,最后對(duì)全文的統(tǒng)計(jì)分析進(jìn)行了簡(jiǎn)要的小結(jié)。
一、畫(huà)數(shù)統(tǒng)計(jì)
首先來(lái)看《筆畫(huà)序規(guī)范》的總體數(shù)據(jù)。
《筆畫(huà)序規(guī)范》中20902個(gè)漢字筆畫(huà)總數(shù)為268479,平均每字12.8畫(huà),最少的1畫(huà),有10個(gè)字,最多的48畫(huà),只有1個(gè)字。其中12畫(huà)的漢字最多,有1957個(gè),其次是11畫(huà)、13畫(huà)。這說(shuō)明筆畫(huà)數(shù)超過(guò)平均值的要比低于平均值的多。詳見(jiàn)表一。
表一不同筆畫(huà)數(shù)漢字?jǐn)?shù)表(20902字)
《現(xiàn)代漢語(yǔ)常用字表》3500個(gè)現(xiàn)代漢語(yǔ)常用字筆畫(huà)總數(shù)為34097,平均每字9.7畫(huà),最少的1畫(huà),有2個(gè)字,最多的24畫(huà),只有1個(gè)字。其中9畫(huà)的漢字最多,有415個(gè),其次是8畫(huà)、10畫(huà)。這里更說(shuō)明筆畫(huà)數(shù)超過(guò)平均值的要比低于平均值的多,平均是每字9.7畫(huà),但9畫(huà)的漢字最多。詳見(jiàn)表二。
表二不同筆畫(huà)數(shù)漢字?jǐn)?shù)表(3500常用字)
其中2500個(gè)最常用字筆畫(huà)總數(shù)為22925,平均每字9.2畫(huà),最少的1畫(huà),有2個(gè)字,最多的23畫(huà),只有1個(gè)字。其中9畫(huà)的漢字最多,有316個(gè),其次是8畫(huà)、10畫(huà)。詳見(jiàn)表三。
表三不同筆畫(huà)數(shù)漢字?jǐn)?shù)表(2500最常用字)
其中1000個(gè)次常用字漢字筆畫(huà)總數(shù)為11172,平均每字11.2畫(huà),最少的2畫(huà),有2個(gè)字,最多的24畫(huà),只有1個(gè)漢字。其中11畫(huà)的漢字最多,有142個(gè),其次是10畫(huà)、12畫(huà)。詳見(jiàn)表四。
表四不同筆畫(huà)數(shù)漢字?jǐn)?shù)表(1000次常用字)
二、筆畫(huà)統(tǒng)計(jì)
接下來(lái),我們?cè)倏匆幌虏煌P畫(huà)使用的情況。
還是先來(lái)看總體數(shù)據(jù)。20902個(gè)漢字筆畫(huà)總數(shù)為268479,其中橫畫(huà)最多,82682個(gè),占30.8%,其次是豎畫(huà),51459個(gè),占19.2%。從中可以看出:橫畫(huà)和豎畫(huà)加起來(lái)占一半,剩下的撇畫(huà)、點(diǎn)畫(huà)和折畫(huà)所占比例差不多,它們加起來(lái)也占一半。
表五不同筆畫(huà)統(tǒng)計(jì)表(20902字)
下面是3500常用字的筆畫(huà)數(shù)據(jù)。不同筆畫(huà)的比例與20902個(gè)漢字的有所不同,但是大同小異,總的比例差不多,也是橫畫(huà)和豎畫(huà)占一半,撇畫(huà)、點(diǎn)畫(huà)和折畫(huà)占一半。
表六不同筆畫(huà)統(tǒng)計(jì)表(3500常用字)
其中2500最常用字的筆畫(huà)數(shù)據(jù)是:
表七不同筆畫(huà)統(tǒng)計(jì)表(2500最常用字)
1000次常用字的筆畫(huà)數(shù)據(jù)是:
表八不同筆畫(huà)統(tǒng)計(jì)表(1000次常用字)
最常用字的筆畫(huà)與次常用字的筆畫(huà)比例有一些差別,主要是橫畫(huà)和豎畫(huà)的比例:最常用字的較低,而次常用字的較高。
三、小結(jié)
(一)畫(huà)數(shù)數(shù)據(jù)
現(xiàn)在,我們把漢字的平均筆畫(huà)數(shù)據(jù)放在一起來(lái)做個(gè)歸納,可以發(fā)現(xiàn)一些比較明顯的變化。
表九不同筆畫(huà)數(shù)漢字?jǐn)?shù)比較表
從這個(gè)比較表中,可以看出:
1、常用漢字的平均筆畫(huà)要少,尤其是最常用漢字要少很多,但次常用漢字的平均筆畫(huà)卻少得并不多:3500常用字的平均筆畫(huà)要比《筆畫(huà)序規(guī)范》中20902個(gè)漢字的少3.1,其中最常用的2500個(gè)漢字,平均筆畫(huà)比20902個(gè)漢字的少3.6,而次常用的1000個(gè)漢字的平均筆畫(huà)卻比20902個(gè)漢字的只少1.6;
2、C行的數(shù)據(jù)普遍低于B行的數(shù)據(jù),這說(shuō)明筆畫(huà)數(shù)多的漢字要比低的漢字多,這也驗(yàn)證了越常用的漢字筆畫(huà)越少;
3、從E行的數(shù)據(jù)看,漢字最多的筆畫(huà)數(shù)的漢字?jǐn)?shù)(即某一個(gè)筆畫(huà)數(shù)的漢字最多,最多的這個(gè)筆畫(huà)數(shù)的漢字?jǐn)?shù))占整個(gè)漢字總數(shù)的百分比在9.4%到14.2%之間,平均為12.0%,約為八分之一。一般說(shuō)總字?jǐn)?shù)越多,最多漢字的筆畫(huà)數(shù)也大。這并不奇怪。但有趣的是:隨著總字?jǐn)?shù)的減少,漢字最多的筆畫(huà)數(shù)的漢字?jǐn)?shù)占整個(gè)漢字總數(shù)的百分比卻逐步增大。
(二)筆畫(huà)數(shù)據(jù)
表十不同筆畫(huà)統(tǒng)計(jì)比較表
從表十的比較看,橫畫(huà)最多,其次是豎畫(huà),再次是點(diǎn)畫(huà)、折畫(huà)和撇畫(huà)。這其中,橫畫(huà)和豎畫(huà)加起來(lái)占一半,剩下的撇畫(huà)、點(diǎn)畫(huà)和折畫(huà)差不多,它們加起來(lái)也占一半??偟膩?lái)說(shuō),筆畫(huà)數(shù)據(jù)的比例變化不大,只有橫畫(huà)占有絕對(duì)優(yōu)勢(shì),比例總是最高,高達(dá)三成。
本文通過(guò)對(duì)《筆畫(huà)序規(guī)范》20902個(gè)漢字筆畫(huà)數(shù)據(jù)的統(tǒng)計(jì)分析,可以對(duì)漢字筆畫(huà)有個(gè)總體的了解,同時(shí)對(duì)常用漢字筆畫(huà)數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,更讓我們看到了常用漢字的筆畫(huà)數(shù)情況。我們相信這些數(shù)據(jù)可以為漢字的整理、筆形編碼以及漢字教學(xué)提供重要的參考。
參考文獻(xiàn):
[1]傅永和等.GB13000.1字符集:漢字字序(筆畫(huà)序)規(guī)范[M].上海教育出版社,2000.
[2]國(guó)家語(yǔ)言文字工作委員會(huì)漢字處.現(xiàn)代漢語(yǔ)常用字表[M].語(yǔ)文出版社,1988.
[3]周錫衛(wèi)、陳民.對(duì)<漢字部件規(guī)范>的若干數(shù)據(jù)統(tǒng)計(jì)[J].計(jì)算機(jī)世界,1998,(15).
(郭曙綸 樸貞姬,上海交通大學(xué)國(guó)際教育學(xué)院)