姜琴
摘要:在對(duì)數(shù)字樣本進(jìn)行篩選的過(guò)程中,需要使用到手寫體數(shù)字識(shí)別的過(guò)程,用聚類源的形式來(lái)對(duì)篩選的結(jié)果進(jìn)行歸納,再經(jīng)過(guò)對(duì)模糊關(guān)系矩陣的構(gòu)建,就能夠開始時(shí)模糊聚類了。實(shí)踐證明,該方法具有非常搞得有效性,能夠?qū)ν饨绲母蓴_有很強(qiáng)的抵制作用,不僅準(zhǔn)確率和識(shí)別率都有所提高,而且還消除了傳統(tǒng)算法下單因子因素帶來(lái)的局限性的影響,具有非常高的實(shí)踐意義。
關(guān)鍵詞:模糊聚類;算法;手寫體;數(shù)字識(shí)別
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)04-0175-02
在針對(duì)模式識(shí)別的研究領(lǐng)域中,無(wú)約束手寫體識(shí)別一直是長(zhǎng)久以來(lái)一直研究的一個(gè)話題,在傳統(tǒng)的形式下,手寫數(shù)字能夠提供的樣本庫(kù)太少,一直成為了研究突破的一個(gè)瓶頸,運(yùn)用無(wú)約束手寫體數(shù)字識(shí)別一直是評(píng)判算法質(zhì)量及效果的一個(gè)非常具有影響力的檢測(cè)方式。國(guó)內(nèi)外的科研人員對(duì)這類問(wèn)題開展可研究工作,也有著不同的算法建議。不過(guò)以最終結(jié)果來(lái)看,被廣泛應(yīng)用的識(shí)別算法有統(tǒng)計(jì)法、神經(jīng)網(wǎng)絡(luò)法、聚類分析法。這些算法具體來(lái)說(shuō),有Bagging算法、Adaboost算法、誤差反向傳播算法、支持向量機(jī)。自組織映射和徑向基函數(shù)。經(jīng)過(guò)實(shí)踐證明,這些算法在實(shí)踐過(guò)程中給用戶帶來(lái)了完美的影響,具有非常高質(zhì)量的識(shí)別效果。然而,這些算法也存在這局限性,如果在其他領(lǐng)域例如對(duì)支票、統(tǒng)計(jì)報(bào)表、銀行票據(jù)等文件的識(shí)別當(dāng)中,它們的質(zhì)量和精確率就很難得到保證,難以完成識(shí)別目的。
1 識(shí)別系統(tǒng)的構(gòu)建
模糊聚類是目前采用率最高的一種的一種手寫體識(shí)別方法,但是在實(shí)踐過(guò)程中,也有著自己的優(yōu)勢(shì)和局限,優(yōu)勢(shì)就是它的模糊性和容錯(cuò)率非常高,對(duì)識(shí)別質(zhì)量有一定的保障,但是它的劣勢(shì)也比較突出,在實(shí)踐應(yīng)用中出現(xiàn)了下列一些問(wèn)題。例如,第一,在對(duì)模糊關(guān)系矩陣進(jìn)行識(shí)別的過(guò)程中,具有難確定的基本特點(diǎn)。第二,模糊聚類在識(shí)別過(guò)程中,其識(shí)別對(duì)象往往異常龐大,這就造成了在模糊關(guān)系矩陣當(dāng)中,存在的階數(shù)較高,導(dǎo)致了其識(shí)別過(guò)程選喲非常高的計(jì)算量。針對(duì)這一局限性,一般在模糊聚類的手寫體數(shù)字識(shí)別過(guò)程中,會(huì)采用BP神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行輔助識(shí)別,它的原理是在模糊聚類識(shí)別過(guò)程中,BP神經(jīng)網(wǎng)絡(luò)協(xié)助其對(duì)特征因素也進(jìn)行篩選,有些不符合的條件被排除開外,降低了計(jì)算幅度,這就提高了計(jì)算速度,對(duì)聚類的效果和質(zhì)量有了極大的保證。之所以會(huì)取得如此明顯的變化,這是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)自身就有著非常高的對(duì)外界的適應(yīng)能力,在對(duì)樣本進(jìn)行篩選的練習(xí)中能夠?qū)颖具M(jìn)行分析,最終得出相應(yīng)的規(guī)律,如果識(shí)別因素具有交叉性,那么BP神經(jīng)網(wǎng)絡(luò)模式下的模糊聚類識(shí)別就具有非常高的篩選作用,其提供的數(shù)據(jù)能夠很好地指導(dǎo)以后的模糊聚類識(shí)別。一般情況下,高效率的模糊聚類都是與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行有效的聯(lián)系,其原理就是,第一步:先給出一定的數(shù)字樣本,BP網(wǎng)絡(luò)對(duì)給出的樣本進(jìn)行訓(xùn)練。第二步,模糊聚類分析方法的使用倆完成對(duì)矢量數(shù)據(jù)的歸類工作。通過(guò)這兩步,可以完成數(shù)字識(shí)別的具體工作。識(shí)別系統(tǒng)流程是先輸出樣本,再對(duì)樣本進(jìn)行預(yù)處理,BP神經(jīng)網(wǎng)絡(luò)在處理過(guò)程中提取這些樣本的特征,然后在其學(xué)習(xí)下提取標(biāo)準(zhǔn)特征完成特征篩選工作。這些標(biāo)準(zhǔn)特征完成模糊關(guān)系矩陣之后,進(jìn)行模糊聚類,最后進(jìn)行識(shí)別輸出。
2 模糊聚類條件下的手寫體數(shù)字識(shí)別方法
1)預(yù)處理
由于識(shí)別方法的不同,預(yù)處理的項(xiàng)目和要求也會(huì)不盡相同,具有一定的差異性,在設(shè)計(jì)識(shí)別系統(tǒng)的過(guò)程中,預(yù)處理的過(guò)程一共由三部分組成,依次是二值化、歸一化、平滑。第一步,在識(shí)別之前,要對(duì)樣本的整體閾值進(jìn)行確定,因此可以采用閾值法來(lái)確定閾值,閾值法是在灰度直方圖的基礎(chǔ)上建立起來(lái)的。第二步,需要對(duì)數(shù)字或文字的尺寸進(jìn)行規(guī)定,規(guī)定的方法主要是采用外框歸一化,按照一定的比例,將數(shù)字的外界邊框縮小或者是放大,以滿足文字的規(guī)定尺寸。第三步,也就是平滑的過(guò)程,也就是對(duì)二值數(shù)字點(diǎn)進(jìn)行掃描,一般都采用三乘三的輔助矩形進(jìn)行掃描工作。平滑過(guò)程還需要做到一步工作,就是將矩陣最重型的被平滑的像素X0從“0”變成“1”,或者是從“1”變成“0”。這一工作主要是根據(jù)輔助矩陣中的像素0,1的分布來(lái)完成的。
2)特征提取
通過(guò)模糊聚類與BP神經(jīng)網(wǎng)絡(luò)的結(jié)合來(lái)完成特征提取,就首先需要進(jìn)行定義并提取出6種基本特征,依次為端點(diǎn)、分店、交叉點(diǎn)、直線、弧和圓。采用一定的結(jié)構(gòu)特征組合。如果規(guī)定起始點(diǎn)只有一種,那就是端點(diǎn),線段有兩種,那就是直線和??;終點(diǎn)有三種,那就是端點(diǎn)、分點(diǎn)和交叉點(diǎn)。按照這種邏輯對(duì)線段的結(jié)構(gòu)特征進(jìn)行分析,可以發(fā)現(xiàn)結(jié)構(gòu)特征具有6各組合,以此是第一種,端點(diǎn)加直線加端點(diǎn);第二種,端點(diǎn)加弧加端點(diǎn);第三種。端點(diǎn)加直線加交叉點(diǎn);第四種是端點(diǎn)加弧加交叉點(diǎn);第五種低端點(diǎn)加直線加分點(diǎn)。第六種是端點(diǎn)節(jié)哀弧加分點(diǎn)。這時(shí)候我們需要增加一個(gè)定義,那就是V,它來(lái)對(duì)這些組合進(jìn)行表示,它包括{0,1,-1,2,-2,3,-3},當(dāng)v是零的情況下表示這個(gè)區(qū)域內(nèi)沒(méi)有圖像信息。下一步,我們把圖像分為三乘三的區(qū)域,對(duì)特征矢量進(jìn)行構(gòu)造S1,S1包含著九個(gè)不同的特征向量,他們的端點(diǎn)位置特征都具有不同性,端點(diǎn)的位置特征有這幾種情況{0,1,-1,2,-2,3,-3}。這就表示在不同的位置具有一條與其位置相似的一條曲線。直線和弧在交叉點(diǎn)的指向上具有四種不同的方向,依次是上下左右四種。
3)BP識(shí)別器特征篩選
BP神經(jīng)網(wǎng)絡(luò)作為一種學(xué)習(xí)算法,具有反向傳播的特性,它主要被應(yīng)用于前向多層神經(jīng)網(wǎng)絡(luò)。通過(guò)對(duì)其特征的選取的過(guò)程進(jìn)行總結(jié)會(huì)得出結(jié)論,造成這些特征的因素很可能是其中存在著一定的相互交叉現(xiàn)象。因?yàn)锽P網(wǎng)絡(luò)在多層的情況之下會(huì)具有一些特點(diǎn)例如自動(dòng)學(xué)習(xí)的特性、容錯(cuò)性、分類能力較強(qiáng)并能夠并行處理,將它作用于對(duì)手寫體數(shù)字識(shí)別訓(xùn)練具有非常高的現(xiàn)實(shí)意義。在本文當(dāng)中,BP網(wǎng)絡(luò)一共有三層,輸入層具有十五個(gè)輸出點(diǎn),與特征矢量的十五個(gè)分量一一對(duì)應(yīng)。它的輸出層也具有十個(gè)輸出點(diǎn)。在BP網(wǎng)絡(luò)對(duì)數(shù)字樣本進(jìn)行訓(xùn)練之后,可以將學(xué)習(xí)的結(jié)果歸納入聚類源,通過(guò)公式Y(jié)=f(x)=(1-e-x)-1來(lái)對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這個(gè)公式是輸入輸出的轉(zhuǎn)化公式,具有一定的實(shí)踐意義。另一方面,設(shè)置N是每次修正權(quán)值的步長(zhǎng),權(quán)值的取值要符合一定的標(biāo)準(zhǔn),必須得經(jīng)過(guò)嚴(yán)格的控制,
當(dāng)取值太小或者取值太大都會(huì)影響結(jié)論的正確性。如果取值太大的話,在網(wǎng)絡(luò)的輸出過(guò)程中會(huì)出現(xiàn)震蕩現(xiàn)象,在最終收斂的過(guò)程中會(huì)出現(xiàn)阻礙作用。如果取值太小的化,會(huì)導(dǎo)致訓(xùn)練的時(shí)間太長(zhǎng),如果當(dāng)前網(wǎng)絡(luò)狀態(tài)的變化在誤差曲面的平坦區(qū)域內(nèi),可能會(huì)導(dǎo)致訓(xùn)練的時(shí)間更加長(zhǎng)。
4)模糊聚類分析
模糊聚類分析主要由兩個(gè)階段組成一個(gè)是構(gòu)造模糊相似矩陣,另一個(gè)則是聚變。在構(gòu)造模糊相似矩陣過(guò)程中,設(shè)論域U={u1,u2,u3……un},其中有n個(gè)待識(shí)別的手寫體數(shù)字,這些數(shù)字每一個(gè)都有不同的向量值邊式與其一一對(duì)應(yīng),當(dāng)ui={ui1,ui2,ui3……uim}(i=1,2,3,……n)。通過(guò)對(duì)這些取值進(jìn)行標(biāo)準(zhǔn)化存放,可以得到一個(gè)矩陣,這個(gè)矩陣有n行m列。通過(guò)數(shù)量積法對(duì)矩陣標(biāo)準(zhǔn)化可以得到模糊相似矩陣R(rij)nxm,其中可以得出
當(dāng)相似矩陣構(gòu)造完成后就是聚類,可以應(yīng)用直接聚類法,通過(guò)從模糊相似矩陣出發(fā),可以求出聚類圖。第一步,是構(gòu)建相似類,第二步是得出等價(jià)分類,第三步將所有的樣本歸為一類。
3 結(jié)果分析
通過(guò)對(duì)某印刷體的測(cè)試片段進(jìn)行提取,按照以上的方式來(lái)對(duì)每一個(gè)手寫體數(shù)字進(jìn)行特征提取特征向量,可以得出U={u1,u2,u3,u4,……,u115}的論域,論域中包含著一百一十五各待識(shí)別手寫體數(shù)字,這些數(shù)字中,它們每一個(gè)的特征矢量都是十五位,將這些待識(shí)別的手寫體數(shù)字作為輸入樣本,將它通過(guò)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)之后,可以得到一個(gè)十維的輸出向量,將這些向量中的每一個(gè)數(shù)字的特征矢量進(jìn)行模糊聚類分析。如下圖所示,利用該BP神經(jīng)網(wǎng)絡(luò),我們將n的初始值設(shè)為0.15,為了達(dá)到分析識(shí)別目的,需要對(duì)初始值的值進(jìn)行不斷的調(diào)減,讓初始值逐漸變小,而調(diào)減的方法是利用退火函數(shù)n(1)=Cx(1-t/tm)、通過(guò)調(diào)減之后,可以將定勢(shì)態(tài)因子進(jìn)行調(diào)整,將其定值為0.175,BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)結(jié)束的條件是網(wǎng)絡(luò)的均方根ERMS=0.1。提供參數(shù)M=50.0,可以得出標(biāo)準(zhǔn)模式相似矩陣,通過(guò)模糊聚類之后,可以得出三十九種分類結(jié)果。當(dāng)取值為0.135時(shí),分類效果最好。
4 總結(jié)
通過(guò)實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn)模糊聚類條件下的手寫體數(shù)字識(shí)別具有非常高的正確率,能夠達(dá)到百分之九十八,識(shí)誤率可以達(dá)到百分之一點(diǎn)六,拒誤率是百分之一點(diǎn)七,具有百分之九十六的可靠程度。因此,我們可以得出結(jié)論,利用模糊聚類來(lái)對(duì)手寫體數(shù)字識(shí)別結(jié)合BP神經(jīng)網(wǎng)絡(luò)能更加的增加識(shí)別的有效性,與傳統(tǒng)的統(tǒng)計(jì)識(shí)別比起來(lái),可靠性、正確率有了明顯的提高。
參考文獻(xiàn):
[1] 葉佩,江濤. 基于BP特征篩選的模糊聚類手寫體數(shù)字識(shí)別[J]. 武漢理工大學(xué)學(xué)報(bào),2007(6):128-130.
[2] 洪沛霖,張佑生,邢燕. 基于改進(jìn)模擬退火算法的手寫體數(shù)字識(shí)別[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2007(9):15-17+20.
[3] 柳回春,馬樹元,吳平東,等. 基于結(jié)構(gòu)特征的手寫體數(shù)字識(shí)別算法[J]. 計(jì)算機(jī)工程,2002(11):28-29.
[4] 黃心曄,王茂祥,富煜清,等. 基于結(jié)構(gòu)分析的手寫體數(shù)字識(shí)別算法[J]. 電子工程師,1999(11):23-25.
[5] 陳軍勝. 組合結(jié)構(gòu)特征的自由手寫體數(shù)字識(shí)別算法研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2013(5):179-184+194.
[6] 王松,蘇輝,夏紹瑋. 無(wú)約束手寫體數(shù)字識(shí)別的預(yù)處理算法[J]. 模式識(shí)別與人工智能,1997(3):243-250.
[7] 盛積德,常勝江,陳戍,等. 用于手寫體數(shù)字識(shí)別的視覺與神經(jīng)網(wǎng)絡(luò)混合算法[J]. 光電子·激光,2001(12):1280-1283.
[8] 李云峰,胡文平. SVM多類分類算法及其在手寫體數(shù)字識(shí)別中的應(yīng)用[J]. 物流工程與管理,2012(7):131-134.