国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

甲骨文輸入法綜述

2020-11-16 07:46劉永革
殷都學(xué)刊 2020年3期
關(guān)鍵詞:甲骨輸入法甲骨文

劉永革,李 強(qiáng)

(安陽師范學(xué)院 甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,河南 安陽 455000)

一、前言

甲骨文是迄今為止中國發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),是漢字的源頭和中華優(yōu)秀傳統(tǒng)文化的根脈。從發(fā)現(xiàn)甲骨文至今120年間,甲骨文的研究從早期的冷門絕學(xué)到現(xiàn)在慢慢受到更多人的關(guān)注,特別是信息化技術(shù)的介入,將加快甲骨文的研究進(jìn)展。

早期人們研究甲骨文的重要資料多數(shù)為紙質(zhì)的出版物,為信息檢索造成了諸多不便?,F(xiàn)在隨著古籍信息化處理以及信息技術(shù)的發(fā)展,越來越多的甲骨文研究轉(zhuǎn)移到電腦和網(wǎng)絡(luò)上進(jìn)行,那么如何把甲骨文輸入到電腦中,就顯得特別重要。甲骨文輸入法的研究將直接影響到當(dāng)前數(shù)字化網(wǎng)絡(luò)時(shí)代下能否十分便捷地進(jìn)行處理、出版甲骨文文獻(xiàn),以及使廣大甲骨文學(xué)者、專家和愛好者方便地傳播與交流甲骨文的相關(guān)研究成果。所以,甲骨文輸入法在甲骨文信息處理領(lǐng)域中起著特別重要的作用。

二、甲骨文輸入法

通過收集整理甲骨文輸入法的文獻(xiàn)資料,我們發(fā)現(xiàn)甲骨文輸入的方法主要分兩大類。

2.1 編碼類輸入法

編碼是一串?dāng)?shù)字或字符,這類輸入法是人為地對(duì)每個(gè)甲骨字分配編碼,用戶通過輸入編碼就可以把甲骨字輸入到計(jì)算機(jī)中。這類輸入法的關(guān)鍵是如何給每個(gè)甲骨字編碼,根據(jù)編碼的關(guān)注點(diǎn),編碼類里有形碼和音碼兩種方法。

2.1.1 形碼

形碼是目前最多的甲骨文輸入法,該方法通過分析甲骨字的幾何形狀與相對(duì)結(jié)構(gòu),借助當(dāng)前漢字的結(jié)構(gòu)處理方式,結(jié)合甲骨字的特征,對(duì)甲骨文進(jìn)行析構(gòu)并編碼,從而達(dá)到對(duì)應(yīng)唯一的甲骨字,進(jìn)而完成輸入。只有對(duì)所要輸入的甲骨字完成精準(zhǔn)的析構(gòu)才能得到正確的結(jié)果。這種方法的缺點(diǎn)是需要使用者對(duì)甲骨字的字形結(jié)構(gòu)有較為完善的認(rèn)識(shí)。對(duì)這種編碼使用方式需要熟練應(yīng)用,因此,學(xué)習(xí)成本較大,難于推廣和應(yīng)用。

1995年,華中師范大學(xué)的研究人員徐松開發(fā)了甲骨文象形碼輸入法[1]。該輸入法是屬于編碼輸入法,其應(yīng)用了26個(gè)英文字母和9個(gè)阿拉伯?dāng)?shù)字與甲骨文中500多個(gè)字根和碼元相對(duì)應(yīng),建立了一個(gè)編碼映射表從而實(shí)現(xiàn)了可使用鍵盤輸入字符的方式輸入甲骨文。該輸入法通過應(yīng)用合理的算法具有輸入速度較快,輸入查找對(duì)應(yīng)甲骨字十分精準(zhǔn)等優(yōu)良特性。但其缺點(diǎn)也較為明顯,使用者必須牢記其編碼規(guī)則和字根表,這就為輸入者造成了極大的使用負(fù)擔(dān)與學(xué)習(xí)成本,不利于其輸入法的推廣和應(yīng)用。

2010年,聶艷召和劉永革研發(fā)了甲骨文自由筆畫輸入法[2],該方法把甲骨文的字形拆分為9種鍵元(點(diǎn)、橫、豎、撇、捺、彎、框、曲、圓),在輸入時(shí)無需對(duì)編碼的順序有任何要求,只要可以正確的拆分待輸入甲骨字的筆畫,則可以根據(jù)筆畫對(duì)應(yīng)的編碼鍵元完成此甲骨字的輸入,所以這種輸入法叫“自由筆畫”輸入法。但是,該輸入法仍有缺陷,需要用戶對(duì)甲骨文字進(jìn)行準(zhǔn)確的拆分才能完成輸入,這仍然需要使用者掌握一定的甲骨文知識(shí)或至少需要少量研究甲骨文的相關(guān)經(jīng)驗(yàn)。

2011年,由劉志祥等人所開發(fā)的字形編碼型甲骨文6位數(shù)字碼輸入法獲得了專利。該輸入法設(shè)計(jì)思想為將眾多的甲骨字按照3種筆畫結(jié)構(gòu)進(jìn)行拆分:封閉曲線筆畫和其延長線結(jié)構(gòu)、交叉筆畫結(jié)構(gòu)、離散筆畫結(jié)構(gòu),并編制了一種全新的甲骨文字形編碼,用以檢索甲骨字并實(shí)現(xiàn)輸入,該字形編碼類似于漢字檢索的四角號(hào)碼。本輸入法通過自行設(shè)計(jì)的六位字形碼可以實(shí)現(xiàn)精確的輸入甲骨文字,同時(shí)還可以輸入異形體,這較好的滿足了使用者輸入任意存在甲骨字的需求。同時(shí),本輸入法還具有其配套的已出版的學(xué)習(xí)參考資料,并可以隨意下載其所開發(fā)的甲骨文六位數(shù)字碼輸入法并使用,這為使用者提供了一定的便利。但是,本輸入法的使用規(guī)則屬于人為設(shè)定,使用者必須對(duì)使用規(guī)則進(jìn)行學(xué)習(xí)并熟記掌握,否則在使用時(shí)容易出錯(cuò),以及若沒有長時(shí)間的甲骨文解構(gòu)經(jīng)驗(yàn),則索引時(shí)更容易由于析構(gòu)出錯(cuò)而無法獲取所需結(jié)果。這無疑增加了使用者的學(xué)習(xí)負(fù)擔(dān)。

2012年,安陽師范學(xué)院栗青生等研究人員共同研發(fā)了基于甲骨文字形動(dòng)態(tài)描述庫的甲骨文輸入方法[3]。該輸入方法給出了一種甲骨文字形動(dòng)態(tài)描述的方法。該方法在現(xiàn)代漢字的編碼和書寫規(guī)范基礎(chǔ)上,使用有向筆段和筆元對(duì)甲骨文進(jìn)行描述,用擴(kuò)展的編碼區(qū)域和外部描述字形庫相結(jié)合的方式,成功解決了甲骨文字特別是異形體和未識(shí)甲骨文字的輸入和輸出問題,在甲骨文異形體的輸入方面具有重大意義。應(yīng)用本輸入法輸入甲骨文或其異形體時(shí),對(duì)于已破譯的甲骨字來說,每次輸入需要根據(jù)已經(jīng)破譯的甲骨字的對(duì)應(yīng)簡(jiǎn)體字找到此甲骨字,然后通過檢索數(shù)據(jù)庫將此字的所有異形體進(jìn)行輸出。這使得使用者必須對(duì)甲骨字的知識(shí)相當(dāng)熟練,以至于每個(gè)甲骨字所對(duì)應(yīng)的現(xiàn)代漢字均十分清楚才可以完成輸入,這無疑給用戶輸入造成了一定困難。而對(duì)于未破譯的甲骨字則需要通過給定的甲骨文字形描述庫進(jìn)行逐個(gè)的檢索,進(jìn)而找到待輸入的甲骨字后再進(jìn)行下一步的輸入處理。但由于當(dāng)前已破譯的甲骨字在所有已知的甲骨字中所占的比例并不大,這就使得用戶多數(shù)時(shí)候均需要通過逐個(gè)檢索的方式輸入甲骨字或異形體,這勢(shì)必造成用戶輸入甲骨字時(shí)需要花費(fèi)的精力十分巨大,從而喪失其一定的實(shí)用性。

2.1.2 音碼

音碼就是通過類似拼音輸入漢字的方法輸入甲骨字,但由于甲骨字現(xiàn)階段很多字不認(rèn)識(shí),更不知道讀音,所以這種輸入方法的缺點(diǎn)是只能輸入已識(shí)甲骨字和部分已釋甲骨文字。這種輸入方法是建立在拼音輸入法的基礎(chǔ)上,所以沒有專門開發(fā)的甲骨文拼音輸入法,在“殷契文淵”甲骨文大數(shù)據(jù)平臺(tái)(http://jgw.aynu.edu.cn)上提供這種輸入方法。

2.2 無編碼類輸入法

這類方法的優(yōu)點(diǎn)是不用記憶編碼,有映射法、可視化輸入法、手寫輸入法。

2.2.1 映射法

這種方法也叫替換法,就是先把漢字輸入電腦,通過改變字體變成甲骨文,其前提條件是這個(gè)甲骨文字必須是已識(shí)甲骨文字,有明確的甲骨文字—漢字對(duì)應(yīng)關(guān)系。其實(shí)現(xiàn)技術(shù)是把宋體字庫修改為甲骨文字庫,把字庫中漢字的位置放入對(duì)應(yīng)的甲骨文字形。比如在宋體字庫的“中”的碼位上,替換成甲骨文字的,在使用的時(shí)候,輸入漢字“中”,通過改變字體,就能變成甲骨文的,從而達(dá)到輸入甲骨文的目的。

1990年,河南大學(xué)的周德民等人研究開發(fā)的計(jì)算機(jī)甲骨文信息處理系統(tǒng)(CJPS)[4],此處理系統(tǒng)的完成標(biāo)志著突破了計(jì)算機(jī)輸入輸出甲骨文的難題,為甲骨文的研究做出了極大的貢獻(xiàn)。該系統(tǒng)采用編碼映射表的方式對(duì)甲骨字進(jìn)行索引從而完成甲骨文的輸入、顯示與打印,但此系統(tǒng)受限于當(dāng)時(shí)的計(jì)算機(jī)技術(shù)水平,該系統(tǒng)是運(yùn)行在DOS操作系統(tǒng)下的甲骨文輸入軟件,已經(jīng)無法滿足當(dāng)前現(xiàn)代操作系統(tǒng)的使用。因此本系統(tǒng)的意義在于對(duì)甲骨文信息化處理領(lǐng)域起到了開天辟地的作用,CJPS的研發(fā)成功使得甲骨文第一次可以被計(jì)算機(jī)進(jìn)行操作與處理,為后續(xù)的研究起到了奠基作用。

2.2.2 可視化輸入法

這種方法采用“所見即所得”的方式,就是通過鼠標(biāo)點(diǎn)擊圖片輸入甲骨文字。2004年,安陽師范學(xué)院劉永革等人共同開發(fā)了可視化甲骨文輸入法[5](見圖1)。該輸入法提供給用戶一張甲骨文部首表,用戶根據(jù)待輸入甲骨字的結(jié)構(gòu),選擇相應(yīng)的部首,程序?qū)@些部首的結(jié)果呈現(xiàn)給用戶,用戶點(diǎn)擊需要的字完成輸入。此輸入法一舉擺脫使用甲骨文傳統(tǒng)的編碼輸入方式,改用可視化方法,通過鼠標(biāo)點(diǎn)擊選擇輸入甲骨文字的方式。這樣很大程度上解決了編碼形式的甲骨文輸入法所造成的記憶負(fù)擔(dān)與學(xué)習(xí)成本大的問題。同時(shí),該輸入法還具有輸入十分直接、形象等優(yōu)點(diǎn),基本實(shí)現(xiàn)了所見即所得的輸入需求,為甲骨文研究和傳播做出了重要作用和意義。該輸入法當(dāng)前已由甲骨文信息處理重點(diǎn)實(shí)驗(yàn)室的研究人員移植到“殷契文淵”甲骨文大數(shù)據(jù)平臺(tái)上,以網(wǎng)頁形式存在并可供用戶直接使用,感興趣的讀者可通過殷契文淵大數(shù)據(jù)平臺(tái)(http://jgw.aynu.edu.cn)使用。

圖1 可視化甲骨文輸入法

但是,可視化甲骨文輸入法也有缺點(diǎn),仍然需要具有一定的甲骨文專業(yè)知識(shí)才可以熟練使用,需要掌握甲骨文結(jié)構(gòu)知識(shí)從而才可以根據(jù)部首查找,并確定自己所輸入的甲骨字,這就造成普通大眾用戶還需要付出一定的學(xué)習(xí)精力,從而阻礙了甲骨文文化的推廣。同時(shí),在實(shí)際使用過程中,同一個(gè)部首下的甲骨文文字?jǐn)?shù)量較多,這造成了輸入時(shí)需要從大量的候選結(jié)果中找到自己所要輸入的甲骨文字,進(jìn)而降低了使用者的工作效率。

2.2.3 手寫輸入法

根據(jù)上述綜合分析的結(jié)果可知,以上甲骨文輸入法的主要問題在于學(xué)習(xí)成本較大以及記憶負(fù)擔(dān)較重這兩大困難。針對(duì)此問題,最直接的辦法便是開發(fā)一個(gè)手寫輸入法,可以使用戶根據(jù)字形直接手寫輸入,而后由程序自動(dòng)識(shí)別并將識(shí)別結(jié)果以候選甲骨字的方式呈現(xiàn)給用戶進(jìn)行選擇,進(jìn)而完成輸入。但此方法的研制和開發(fā)具有一定的技術(shù)困難,主要難點(diǎn)在于如何能夠正確的識(shí)別用戶手寫的甲骨字,并較準(zhǔn)確的提供給用戶進(jìn)行選擇。除識(shí)別準(zhǔn)確率高之外,還需要以較快的響應(yīng)速度來讓用戶可以流暢、無卡頓的完成甲骨字的輸入。

當(dāng)前研究開發(fā)甲骨文手寫輸入法的機(jī)構(gòu)并不多,已知的是廈門大學(xué)開發(fā)的一款甲骨文手寫輸入法,該輸入法可通過鼠標(biāo)在提供的虛擬手寫板上通過直接書寫甲骨字再選擇識(shí)別結(jié)果完成甲骨字輸入。其間程序響應(yīng)速度十分迅速,基本滿足了輸入需求。但在實(shí)際多次使用中發(fā)現(xiàn)本輸入法的識(shí)別能力較差,多次使用書寫后,發(fā)現(xiàn)所提供的甲骨字候選結(jié)果中并不存在所需的甲骨文字,這就降低了使用者的工作效率與工作進(jìn)度的問題,同時(shí)影響使用效果。

因此,針對(duì)上述分析的各個(gè)甲骨文輸入法的不足之處以及當(dāng)前存在的手寫輸入法的識(shí)別能力不高等問題,安陽師范學(xué)院甲骨文信息處理重點(diǎn)實(shí)驗(yàn)室劉永革、李強(qiáng)等人共同研發(fā)了新一代的甲骨文手寫輸入法(見圖2)。該輸入法在開發(fā)過程中,采用當(dāng)前最新的人工智能深度學(xué)習(xí)研究成果,以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),研發(fā)了甲骨文識(shí)別網(wǎng)絡(luò)為識(shí)別模塊,在最終的測(cè)試中以95.63%的識(shí)別率完成測(cè)試任務(wù),同時(shí)還具有較快的響應(yīng)速度,以及較小的模型空間規(guī)模。而用戶在使用過程中,僅需要通過鼠標(biāo)將所需輸入甲骨字的字形書寫至輸入法提供的虛擬手寫板上,而后程序便會(huì)迅速的根據(jù)當(dāng)前的書寫筆跡完成識(shí)別并將候選結(jié)果顯示到候選區(qū)域供用戶輸入和處理。整個(gè)輸入過程完全實(shí)現(xiàn)了所見即所得的輸入思想,同時(shí)無需用戶具有任何的甲骨文相關(guān)知識(shí),只要知道所需輸入的甲骨字字形便可通過書寫進(jìn)而實(shí)現(xiàn)甲骨字的錄入,真正實(shí)現(xiàn)了零學(xué)習(xí)成本與零門檻的甲骨文輸入方法。從而方便了甲骨文專家和學(xué)者的研究,并十分有利于甲骨文及甲骨文文化的推廣和發(fā)展。

圖2 手寫輸入法示意圖

通過使用該甲骨文手寫輸入法,用戶可以簡(jiǎn)單、方便的完成甲骨文文本和圖片多種不同數(shù)據(jù)類型的錄入,從而可以滿足不同的工作需求,以及高效的完成甲骨文輸入任務(wù)。該輸入法有個(gè)人計(jì)算機(jī)的單機(jī)版本,可以滿足各種甲骨文錄入工作。除此之外,該甲骨文手寫輸入法已經(jīng)與殷契文淵甲骨文大數(shù)據(jù)平臺(tái)(http://jgw.aynu.edu.cn)進(jìn)行結(jié)合,開發(fā)了網(wǎng)頁版的甲骨文手寫輸入法,以滿足用戶需求。手寫輸入法也有缺點(diǎn),如輸入效率不高。

三、結(jié)束語

本文綜合分析了當(dāng)前各種甲骨文輸入法,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了深入的分析和討論。每種輸入法適合不同的用戶需求和使用場(chǎng)景,希望甲骨文學(xué)界的專家、學(xué)者以及廣大甲骨文愛好者根據(jù)自己的情況選擇使用。

猜你喜歡
甲骨輸入法甲骨文
基于造字機(jī)理的甲骨字生成技術(shù)研究
21世紀(jì)以來的甲骨綴合
要命的輸入法
字溯甲骨?文承龍韻
找回微軟拼音輸入法設(shè)置
輸入法順序聽我使喚
百度被訴侵犯商標(biāo)權(quán)和不正當(dāng)競(jìng)爭(zhēng)
圖說漢字
圖說漢字
刻在甲骨上的愛情
江华| 龙门县| 乌苏市| 苏尼特左旗| 二连浩特市| 晋中市| 蒲城县| 灌云县| 浦县| 安顺市| 同心县| 辽宁省| 蒙城县| 库尔勒市| 景泰县| 莎车县| 新乐市| 阜阳市| 鞍山市| 台东市| 隆德县| 阳春市| 济宁市| 永新县| 呼图壁县| 仪陇县| 建宁县| 尼木县| 江都市| 拉萨市| 花莲市| 图们市| 高阳县| 孙吴县| 东阿县| 四川省| 岳普湖县| 东乌珠穆沁旗| 漳州市| 沙河市| 左权县|