孫玥佳
【摘要】隨著互聯(lián)網(wǎng)普及和我國(guó)對(duì)漢字的逐漸重視,依靠排列組合原理,利用一種新的漢字輸入法——拼音筆畫(huà)輸入法,解決重碼和讀音不準(zhǔn)問(wèn)題,科學(xué)構(gòu)建漢字字庫(kù)系統(tǒng)、漢字單字或多詞組應(yīng)用數(shù)據(jù)分析系統(tǒng)和漢字信息快速搜索系統(tǒng),使?jié)h字發(fā)展能更好地適應(yīng)新形勢(shì)所需.
【關(guān)鍵詞】拼音筆畫(huà);數(shù)學(xué);體系構(gòu)建
一、數(shù)學(xué)聚集整合技術(shù)的應(yīng)用
英國(guó)著名科學(xué)家李約瑟編撰的《中國(guó)科學(xué)技術(shù)史》一書(shū),曾這樣說(shuō)過(guò):中國(guó)是最早發(fā)明水排的國(guó)家,也是最早發(fā)明風(fēng)箱的民族,但卻沒(méi)有把它們整合起來(lái)變成蒸汽機(jī).其原因是沒(méi)有最終把兩者有機(jī)整合在一起.
說(shuō)起蒸汽機(jī),首先想到瓦特,但他并不是發(fā)明者.瓦特的重大貢獻(xiàn)就在于技術(shù)改進(jìn),且運(yùn)用數(shù)學(xué)原理,經(jīng)過(guò)反復(fù)實(shí)驗(yàn)、計(jì)算得出運(yùn)行效率高于以往四倍的結(jié)果,使蒸汽機(jī)性能大大提高,從而促進(jìn)了第一次工業(yè)革命的興起.下面介紹的拼音筆畫(huà)輸入法,就是利用了聚集、整合技術(shù)和數(shù)學(xué)方法構(gòu)建的.
二、拼音筆畫(huà)輸入法
我們知道漢語(yǔ)拼音是由聲母和韻母組合而成的漢字字音,而拼音筆畫(huà)輸入法是利用拼音聲母與漢字筆畫(huà)相結(jié)合來(lái)實(shí)現(xiàn)的.漢語(yǔ)拼音總共有23個(gè)聲母,漢字筆畫(huà)可分為五種:橫、豎、撇、捺、折,可以用鍵盤(pán)數(shù)字1、2、3、4、5代替.每一個(gè)漢字都是由聲母與筆畫(huà)組合而成,根據(jù)數(shù)學(xué)中排列組合乘法定理,可以計(jì)算出總組合數(shù)來(lái).現(xiàn)將乘法定理敘述如下:
完成一件事,需要將其過(guò)程分成幾個(gè)步驟,做第一步有m1種不同的方法,對(duì)于第一步的每一種方法,做第二步均有m2種不同的方法;對(duì)于前兩步的每種方法,做第三步有m3種方法……以此類推,做第n步,對(duì)于前(n-1)步的每種方法,均有mn種方法,那么完成這件事共有P=m1*m2*——*mn種不同的方法.
1.漢字的單字輸入法
規(guī)則:取聲母232取筆畫(huà)53
筆畫(huà)取法:上下結(jié)構(gòu)的漢字取第一、第二筆畫(huà)和末筆畫(huà);左右結(jié)構(gòu)的漢字取左側(cè)的第一筆畫(huà)和右側(cè)的第一筆畫(huà)及末筆畫(huà);不夠三筆的漢字用空格代替.
聲母與筆畫(huà)總組合數(shù)為:232*53=2875種
例如:漢 h454 字 z421
需要說(shuō)明,不是每一種聲母與筆畫(huà)的組合都可以組成一個(gè)漢字,但是每一個(gè)漢字都是由聲母與筆畫(huà)組成,這里的總組合數(shù)為平均數(shù).根據(jù)國(guó)家公布《通用規(guī)范漢字表》(2013版),共收錄漢字8105個(gè)左右.假設(shè)每一個(gè)聲母和筆畫(huà)都可以組成一個(gè)漢字,那么平均重碼率8105/2875≈3個(gè)漢字.從理論上來(lái)講基本上滿足我們使用要求,不翻頁(yè)或少翻頁(yè)找字,極大地節(jié)約了輸入漢字的時(shí)間.
2.漢字的雙字詞組輸入法
規(guī)則:取聲母組合數(shù)232取筆畫(huà)組合數(shù)52
筆畫(huà)取法:取第一個(gè)字的第一筆畫(huà)與第二個(gè)字的最后一筆.
雙字詞組總組合數(shù)為:232*52=13225
例如:科學(xué)kx32 東西dx11
根據(jù)《現(xiàn)代漢語(yǔ)詞典》詞匯總量約六萬(wàn)條,其中雙字詞組不超過(guò)四萬(wàn)條,漢字平均重碼率40000/13225≈3個(gè)字,同樣也節(jié)省了漢字雙字詞組輸入的時(shí)間.
3.漢字的三字詞組輸入法
規(guī)則:取聲母組合233筆畫(huà)輸入52
筆畫(huà)取法:取第一個(gè)字第一筆,最后一個(gè)字末筆畫(huà).
漢字三字詞組總組合數(shù)為233*52=304175
例如:俄羅斯 els32
漢字三字詞組基本上不存在重碼,大多不需要翻頁(yè).
4.漢字四字詞組輸入法
規(guī)則:直接輸入聲母,筆畫(huà)輸入基本上不需要采用.
四個(gè)字聲母組合數(shù)234=279841
例如:一針見(jiàn)血yzjx 一心一意yxyy
五個(gè)字及其以上的詞組(容量235=6436343)只要使用聲母就可以完成漢字詞組的輸入,不需要再輸入筆畫(huà),這樣輸入速度更加快捷方便.
三、拼音筆畫(huà)輸入法特點(diǎn)
從以上對(duì)漢字單字及詞組進(jìn)行計(jì)算與分析,得出規(guī)律為:漢語(yǔ)拼音的聲母用來(lái)輸入漢字或詞組,筆畫(huà)用來(lái)確定矯正每一個(gè)漢字或詞組.當(dāng)輸入四個(gè)字及其以上的詞組時(shí),根據(jù)其組合容量,基本上不需要輸入筆畫(huà),這樣極大地減少了敲擊鍵盤(pán)的次數(shù),使輸入詞組更加快速方便.拼音筆畫(huà)輸入法還有以下一些特點(diǎn):
1.減少敲擊鍵盤(pán)的平均次數(shù)
以拼音輸入為例,輸入一個(gè)漢字,最少敲擊2次鍵盤(pán) (不算重碼翻頁(yè))(壹yi),最多敲擊6次鍵盤(pán)(狀zhuang),平均輸入鍵盤(pán)3.5次。
從上表中可以看出,采用拼音筆畫(huà)輸入法,敲擊鍵盤(pán)的次數(shù)明顯減少.
2.解決漢字讀音不準(zhǔn)的問(wèn)題
地區(qū)方言差異較大,聲母不易讀準(zhǔn)的音zh、ch、sh與z、c、s;韻母不易讀準(zhǔn)的音en、eng、in、ing,這些不容易讀準(zhǔn)的聲母和韻母在漢字中占有很大比例,由于讀音不準(zhǔn)確,導(dǎo)致在拼音輸入過(guò)程中輸入速度受到影響.
3.解決漢字輸入過(guò)程中的重碼問(wèn)題
無(wú)論是使用拼音輸入法還是筆畫(huà)輸入法都存在大量的重碼,但把兩種輸入法結(jié)合起來(lái),就大大地降低了重碼率,節(jié)約輸入時(shí)間,從而使?jié)h字輸入更加簡(jiǎn)便、快捷.
4.加深人們對(duì)漢字字型的印象
漢字是語(yǔ)言與字型完整結(jié)合的產(chǎn)物,這是漢字文化固有特點(diǎn),使用這種輸入法,可以加深對(duì)中國(guó)傳統(tǒng)漢字字型的記憶印象,加強(qiáng)對(duì)中國(guó)漢字書(shū)寫(xiě)與閱讀的繼承與發(fā)展,具有不可替代的意義.
5.推進(jìn)漢字輸入法的延伸和擴(kuò)展
漢字的字形結(jié)構(gòu)形式比較復(fù)雜,它不僅有上下、左右結(jié)構(gòu),還有許多字形結(jié)構(gòu)形式,如里外型(國(guó))、品字型(森)、倒品型(馨)及獨(dú)體字型(凸、凹)等,為了減少重碼,增加幾個(gè)常用字根以及相對(duì)應(yīng)的數(shù)碼,使輸入漢字更快捷.所增加的字根及數(shù)碼鍵盤(pán)對(duì)應(yīng)如下:
鍵盤(pán)0:口、日、目、月、田、罒等,此類部首占漢字總量16%~20%左右.
例如:國(guó)g014 、 啟q450 、曼m004 、眼 y054
鍵盤(pán)7:七、土、士、扌、艸等,此類部首占漢字總量10%左右;
例如:草c702 、地 d757 、把b757、北b217
鍵盤(pán)8:八、乄、人、丷、灬.小等,此類部首占漢字總量10%左右.
例如:放f438 、然r348 、眾z888、兌d805
增加的3個(gè)數(shù)碼,其拼音與筆畫(huà)組合數(shù)為:23*83=11776.重碼率為8000/11776≈0.68%
四、建立與時(shí)俱進(jìn)的漢字輸入應(yīng)用體系
漢字拼音筆畫(huà)輸入法被大家認(rèn)同需要一個(gè)過(guò)程.但它應(yīng)用數(shù)學(xué)原理建立起來(lái)的數(shù)學(xué)體系非常重要.馬克思說(shuō):“一門(mén)學(xué)科只有當(dāng)它達(dá)到了能夠成功運(yùn)用數(shù)學(xué)時(shí),才能真正發(fā)展”.數(shù)學(xué)原理的引入為我們?cè)诠ぷ髦薪鉀Q實(shí)際問(wèn)題提供了理論依據(jù),它揭示了事物內(nèi)在規(guī)律,化難為易,把奧妙變?yōu)槌WR(shí).為此,拼音筆畫(huà)輸入法的應(yīng)用又進(jìn)一步拓展了空間.
1.建立屬于自己的漢字字庫(kù)系統(tǒng)
由于每個(gè)人使用漢字的用途及專業(yè)分類領(lǐng)域不同,使用漢字單字和詞組的頻率也不盡相同.因此,有必要組建屬于自己的漢字字庫(kù)系統(tǒng),從字庫(kù)系統(tǒng)中提煉出屬于自己的漢字字庫(kù),再結(jié)合漢字輸入過(guò)程中的聯(lián)想功能和學(xué)習(xí)記憶功能等,以便更好地為我所用.例如:普通人手機(jī)微信、短信交流,約3000~3500個(gè)常用漢字足夠用,但是研究中國(guó)古代漢語(yǔ)的,約需要1.5萬(wàn)個(gè)漢字,作為醫(yī)生除了常用漢字外,還需要在字庫(kù)里儲(chǔ)存較多專業(yè)名詞或大量的藥品名稱等.
2.建立漢字單字或多詞組應(yīng)用數(shù)據(jù)分析系統(tǒng)
漢字與英文單詞有很大不同,英語(yǔ)由26個(gè)字母組合成單詞,而漢語(yǔ)是由單字與詞組組合而成,而且每一個(gè)單字又可以組合成詞組,這就造成漢字的新詞組不斷涌現(xiàn).我們有必要建立漢字應(yīng)用數(shù)據(jù)分析系統(tǒng),對(duì)漢字或詞組的使用頻率、新舊詞組的增減、漢字字庫(kù)的容量等進(jìn)行科學(xué)統(tǒng)計(jì),利用統(tǒng)計(jì)結(jié)果對(duì)漢字的使用情況進(jìn)行分類,把漢字進(jìn)行數(shù)字化、科學(xué)化的整理,讓漢字更好地為各行各業(yè)人群服務(wù).
3.建立快速漢字信息搜索系統(tǒng)
我們?cè)诰W(wǎng)上搜索信息時(shí),一般需要將漢字信息全部輸入,方可查尋到此類信息.如果我們建立快速漢字信息搜索系統(tǒng),根據(jù)聲母的排列組合的組合數(shù)容量,5個(gè)字以下利用聲母與筆畫(huà)相配合查找,五個(gè)字以上的,直接輸入聲母就可以非??焖俨樵兊酱祟愋畔?此方法非常適合圖書(shū)館的信息檢索系統(tǒng).
基于數(shù)學(xué)原理的拼音筆畫(huà)輸入法,不僅是一門(mén)漢字輸入技術(shù),而且能使?jié)h字體系進(jìn)一步深化,為快速發(fā)展的各個(gè)領(lǐng)域提供更好的服務(wù).