馬宏艷
摘要:模糊數(shù)學(xué)自誕生以來取得了快速的發(fā)展,隨著計算機應(yīng)用技術(shù)的發(fā)展,特別是網(wǎng)絡(luò)的普及,人們越來越離不開計算機,計算機獲取各種信息的主要工具,大量的信息處理工作也離不開計算機。在日常生活和工作中,存在著大量的文字信息處理工作,必須交由計算機處理。漢字識別是模式識別領(lǐng)域的一個重要方向,涉及到很多方面的知識,同時它的實踐意義也很深遠(yuǎn)。
關(guān)鍵詞:模糊數(shù)學(xué);漢字識別;模糊匹配
中圖分類號:TP391文獻標(biāo)識碼:A文章編號:1009-3044(2012)21-5176-02
Fuzzy Theory Application to Chinese Characters Recognition
MA Hong-yan
(Information Engineering Institute, Longdong University ,Qinyang 745000,China)
Abstract: The fuzzy mathematics since its birth has achieved rapid development, with the popularization and application of computer tech? nology, especially the popularization of Internet, people depend more and more on computers to get all kinds of information, a lot of infor? mation processing are transferred to a computer for. In daily life and work, there are a large number of text information processing prob? lems, the text information to the computer processing requirements becomes very urgent. Character recognition is the field of pattern rec? ognition is an important direction, involving many aspects of knowledge, and its practical significance is far-reaching.
Key words: fuzzy mathematics;Chinese characters recognition;fuzzy matching
1965年,美國加州大學(xué)的L.A.Zadeh教授發(fā)表的題為:“Fuzzy Sets”和“Fuzzy Sets and Systems”兩篇開創(chuàng)性的論文是模糊數(shù)學(xué)誕生的標(biāo)志。
模糊性概念現(xiàn)在用模糊集來進行描述,運用模糊數(shù)學(xué)的概念可以進行判斷、推理、評價、決策以及控制的過程等。例如模糊聚類分析、模糊模式識別等。這些方法構(gòu)成了一種模糊性系統(tǒng)理論,構(gòu)成了一種思辨數(shù)學(xué)的雛形,在氣象、醫(yī)學(xué)、心理、地質(zhì)、石油、環(huán)境、生物、林業(yè)、農(nóng)業(yè)、經(jīng)濟管理、化工、語言、遙感、控制、體育、教育等方面已經(jīng)取得了明顯的成果。模糊數(shù)學(xué)的應(yīng)用領(lǐng)域主要是計算機智能方面,這也是計算機發(fā)展的一個主要方向。模糊數(shù)學(xué)主要研究的內(nèi)容是三個方面:第一是模糊數(shù)學(xué)理論的研究,以及它和傳統(tǒng)的精確數(shù)學(xué)、隨機數(shù)學(xué)之間的關(guān)系。第二是模糊語言學(xué)以及模糊邏輯的研究。這兩方面的研究目前還不是很成熟,需要進一步的深入研究。第三是模糊數(shù)學(xué)的應(yīng)用的研究,這是模糊數(shù)學(xué)的主要研究方向。模糊數(shù)學(xué)的研究對象是不確定性的事物,因此它對于傳統(tǒng)的精確數(shù)學(xué)、隨機數(shù)學(xué)的不足能起到彌補的作用?,F(xiàn)已有模糊群論、模糊拓?fù)鋵W(xué)、模糊概率、模糊圖論、模糊邏輯學(xué)、模糊語言學(xué)等分支。
1模式識別
模式識別的主要任務(wù)是讓機器模擬人的思維方法,對客觀世界中帶有模糊特征的事物進行識別和分類。計算機分析各種模式,并對未知模式給出分類和結(jié)構(gòu)描述。模式識別問題是已知事物的各種類別,然后來判斷給定的對象是屬于哪一個類別的問題,"模式"是指標(biāo)準(zhǔn)的模板。實際生活中,有些事物的類別(即模式)是明確、清晰和肯定的,但也有很多事物的模式帶有不同程度的模糊性,對這些具有模糊性的模式借助于模糊理論來刻畫。具有"模糊模式"的模式識別問題,可以用"模糊模式識別"方法來處理[1]。
解決模式識別的問題時使用模糊邏輯的方法或思想的方法就是模糊模式識別。模糊技術(shù)在統(tǒng)計模式識別及句法模式識別方面均有較好的應(yīng)用。其主要特點是它能更直接更自然地表達人們習(xí)慣使用的一些邏輯含義,模糊數(shù)學(xué)對于直接的或者高層的知識表示很是適用,這就使得模糊概念的模式識別能成為智能科學(xué)前沿領(lǐng)域的研究的有效工具之一。
模糊模式識別通常由傳感器部分、預(yù)處理部分、特征提取部分、識別分類部分四部分組成的,在模式識別中特征的提取是非常重要的。模式識別的方式有兩種:第一種是最大隸屬原則(直接方法),這種方法應(yīng)用相當(dāng)廣泛,象三角形的識別、染色體的識別等都屬于這一類,這類問題的難點在于隸屬函數(shù)的建立。第二種是擇近原則(間接方法),擇近原則是模式識別中的一種間接方法,目前它已用于計算機識別手寫數(shù)碼及文字。對于文字識別,無論是印刷體還是手寫體,讓計算機識別時,輸入的模型都是選取特征后面的平面格點,它是一個模糊集,而計算機原來存貯的模型也是幾個模糊集,這時需要考慮的就是貼近問題。
漢字識別技術(shù)是一種高速、自動的信息錄入手段,是未來計算機的重要職能接口,同時也是辦公自動化、新聞出版、機器翻譯等
在自然語言的處理過程中,模糊字辨認(rèn)還是一個比較困難的事情,因此迫切需要一種高效率的自動的辨認(rèn)方法。該文提出了一種基于語義的模糊匹配算法,能夠很好地解決這個問題,而且具有實際應(yīng)用的可能。
模糊數(shù)學(xué)是一門嶄新的數(shù)學(xué)學(xué)科,它的產(chǎn)生不僅拓廣了經(jīng)典數(shù)學(xué)的基礎(chǔ),而且是使計算機科學(xué)向人們的自然機理方面發(fā)展的重大突破。它在科學(xué)技術(shù)、經(jīng)濟發(fā)展和社會學(xué)等問題的廣泛應(yīng)用領(lǐng)域中顯示了巨大的力量。它雖然只有二十多年的歷史,但已被國內(nèi)外數(shù)學(xué)界以及信息、系統(tǒng)、計算機和自動控制科學(xué)、人員的普遍關(guān)注,它是正在迅速發(fā)展中的有著廣闊應(yīng)用前景的一門嶄新學(xué)科。
[1]周擁,張彪,夏寬理.基于語義的模糊匹配在模糊漢字辨認(rèn)中的應(yīng)用[J].計算機工程,2002(5).
[2]張忻中.漢字識別技術(shù)[M].北京:清華大學(xué)出版社,1992.
[3]謝季堅,劉承平.模糊數(shù)學(xué)方法及其應(yīng)用[M].3版.武漢:華中科技大學(xué)出版社,2006.
[4]梁保松,曹殿立.模糊數(shù)學(xué)及其應(yīng)用[M].北京:科學(xué)出版社,2007.
[5]姚瑤,王偉,王愛菊.一種新的快速圖像細(xì)化算法研究與實現(xiàn)[J].電腦知識與技術(shù),2010(6).