馬金定
【摘 要】特征在圖像處理中起著非常重要的作用。利用特征提取技術(shù)來提取圖像的特性,通過這些特征可以快速的對字符圖像進(jìn)行分類和識別。我們通過對不同類型的特征和特征提取技術(shù)分析,研究在不同的特征類型中哪些特征提取技術(shù)最適合的,整個分析研究以字符識別為基礎(chǔ)來進(jìn)行。
【關(guān)鍵詞】特征提?。蛔址R別;模式識別
特征是描述了一幅圖像中關(guān)于形狀的信息,通過對圖像的特征提取和處理,使得對圖像的分類很容易實現(xiàn)。在模式識別和圖像處理中,特征提取是一種特殊的降維處理,主要目的是從原始數(shù)據(jù)的低維度空間信息表達(dá)方式中獲得相關(guān)的信息。對數(shù)據(jù)處理算法來說,輸入數(shù)據(jù)處理時間太長,我們認(rèn)為是數(shù)據(jù)是冗余的,為了提高處理速度,將著輸入數(shù)據(jù)將轉(zhuǎn)化為精簡的一系列特征表達(dá)方式(如特征向量),這個過程稱為特征提取。常用的特征提取方法有模板匹配、圖像轉(zhuǎn)換、圖形描述、直方圖、幾何不變矩、Zernike矩、樣條曲線逼近、傅里葉描述、梯度特征和Gabor特性[1]。文中以字符識別為基礎(chǔ)進(jìn)行特征與特征提取技術(shù)的研究。
1 特征提取
特征提取盡可能判別和獲得特征,而對于特征選擇,對原有的特征集的一個子集選擇,特征提取重要的一步是分類器的建設(shè),旨在提取每一類特征的相關(guān)信息,在這一過程中相關(guān)特征從對象、字母中提取出來構(gòu)成特征向量。然后使用這些特征向量分類器識別輸入單元和目標(biāo)輸出單位。特征提取的過程是從原始數(shù)據(jù)檢索最重要的數(shù)據(jù),找到特定的一系列參數(shù),這些參數(shù)對一個字符來書來說是精確描述并且是獨一無二的形狀特性的。在特征提取階段,字符是由特征向量表示。特征提取的主要目標(biāo)是提取一組特征,實現(xiàn)用最少的特征實現(xiàn)最大化的識別率和對各種各樣的相同的符號實例生成類似的特征集。
2 特征選擇
特征選擇的主要思想是:通過刪除弱或無預(yù)測信息的特征來選擇輸入變量的一個子集同時保持分類精度,約翰等人描述了強(qiáng)和弱相關(guān)特征的關(guān)聯(lián)性,強(qiáng)相關(guān)特征意味著在不損失分類精度情況下是不能被刪除。弱相關(guān)的特征意味著對分類精度影響不大[2]。
選擇最有意義的特性集合是在分類問題處理過程中的至關(guān)重要的一步,良好的特征集包含可以從其他對象區(qū)分出特定對象的識別信息。特征可分為局部特征和全局特征,局部特征通常是幾何特性(凹、凸部分,端點數(shù)量、分支、節(jié)點等)。全局特征,全局特征,通常拓?fù)涮匦裕ㄟB通性、投影特性等)或統(tǒng)計特性(不變矩等)。
筆跡識別包括宏觀和微觀兩個類型的筆跡特性。宏觀特性主要有:基于灰度值的宏觀特性(閾值,黑色像素),基于輪廓的宏觀特性(內(nèi)部和外部輪廓),基于斜率的宏觀特性(水平,積極的,垂直的),筆劃寬度、傾斜度和高度。字符的凹凸特性通過捕捉主要的拓?fù)浜蛶缀翁卣鳌N⒂^特性發(fā)現(xiàn)不同的作家的筆跡,微觀特征有:縱橫比,終點數(shù),節(jié)點數(shù),形狀大小和圈數(shù),寬度和高度的分布,傾斜,形狀,平均曲率和梯度特征。
3 特征提取方法的研究
3.1 傅里葉描述
傅里葉變換廣泛應(yīng)用于形狀分析,傅里葉變換的系數(shù)構(gòu)成圖形的傅立葉描述,這些描述是在頻域中表示圖形的特征,描述符包含的低頻信息表示圖形的一般特征,而高頻率信息表示圖形細(xì)節(jié)部分。雖然傅里葉變換的系數(shù)的數(shù)目往往很大,但是該系數(shù)的一個子集足以捕捉圖形的整體特征。
假設(shè)一個特定圖形的邊界有K個像素,編號從0到K-1,沿著圖形輪廓的第K個像素的位置為(xk,yk)。因此,我們可以用兩參數(shù)方程來描述的圖形:
x(k)= xk,y(k)= yk,我們認(rèn)為,(x,y)的坐標(biāo)點不在直角坐標(biāo)系,而是在復(fù)平面,表達(dá)方式如下:
3.2 主成分分析(PCA)
主成分分析是一種數(shù)學(xué)方法,采用一個正交變換將一組可能相關(guān)的變量轉(zhuǎn)換為一組不相關(guān)變量,這些不相關(guān)的變量叫做主成分,他們是數(shù)據(jù)的中心X,計算的協(xié)方差矩陣C,獲得特征向量和協(xié)方差矩陣的特征值U,P,在特征空間的原始數(shù)據(jù)P=UT·X。
主成分個數(shù)小于或等于原始變量的數(shù)目,這種轉(zhuǎn)變的方式為,第一主成分盡可能多地具有較高的方差(也就是說,占據(jù)盡可能多的數(shù)據(jù)變化),主成分的數(shù)量小于或等于原始變量的數(shù)量。這種轉(zhuǎn)變中定義,第一主成分盡可能高方差(即占盡可能多的數(shù)據(jù)的變化),并且每一個成功的成分又有盡可能高的方差,在與前面計算出的數(shù)據(jù)正交(不相關(guān)的)的約束情況下,步驟計算出PCA變換的數(shù)據(jù)矩陣X。只有當(dāng)數(shù)據(jù)是滿足正態(tài)分布時,主成分的保證是獨立的。
3.3 Gabor濾波器
在空間域和頻域中伽柏濾波器具有最佳的定位特性,依據(jù)給定的系數(shù)矩陣Gabor濾波器提出了一種多分辨率分析的方法[3],在這種方法中,用一個二維Gabor濾波器進(jìn)行特征提取。Gabor濾波器在空間域是正弦信號調(diào)制高斯函數(shù),在頻域中是高斯頻移。Gabor濾波器可表示為:
Gabor過濾器的性能通過調(diào)節(jié)參數(shù)?姿,?酌,和?茲來改變。x和y是圖像坐標(biāo)。?姿是余弦方程的波長,?酌是高斯函數(shù)形狀的特征,當(dāng)γ= 1時,形狀是圓的。當(dāng)γ<1時,形狀為橢圓形。?茲指定了Gabor函數(shù)并行條紋的方向,它的取值為0到360度。
3.4 扇形特征提取
扇形特征提取的識別率完全取決于從字符中提取特征的效率。這些特征可以是拓?fù)?,幾何和結(jié)構(gòu)(角度,距離)等等[4]。對于機(jī)打字符,這些字符的形狀變化不大,拓?fù)浜徒Y(jié)構(gòu)的特征提取效果很好。然而,對于手寫字體,由于寫作習(xí)慣的不同,同一個字符的形狀也不同,相應(yīng)的拓?fù)浜徒Y(jié)構(gòu)特性不適用于手寫字體的特征。
在扇形提取中,我們使用特征矩陣的中心作為固定點,字符圖像尺寸統(tǒng)一變?yōu)?2×32像素,從圖像的中心選擇一個角把圖像分割成一個固定數(shù)量的扇區(qū)。字符“E”細(xì)分為12部分,如圖1所示。第一部分是從0度到30度;第二部分是從30到60度等等,每個部分用于特征提取。
3.5 距離和角度的特征提取
Nk表示在第K個子塊中的像素值為1的像素數(shù)量,k=1,2,…,12,歸一化向量距離為每個字塊中的像素為1的數(shù)量和除以整個字符圖像中像素為1總數(shù)量,在字符圖像中(xi,yi)是字塊中像素為1的坐標(biāo),(xM,yN)是字符圖像的中心坐標(biāo)。
向量距離DK作為一組特征,角度AK作為另一組特征。從12個子塊中提取了距離向量和角度向量共24個特征,這些特征繪制出一個原字符的近似形狀如圖2所示。
3.6 Zernike矩
Zernike矩已被用于對二值化字符的識別,Zernike矩可以提取旋轉(zhuǎn)變化和旋轉(zhuǎn)不變特征,很明顯不變特征對灰度圖像是非常有用[5]。當(dāng)使用傅里葉描述符,矩不變量,或Zernike矩等這些技術(shù)時,由于我們不使用高階項,相應(yīng)的可以去除離散誤差和其它高頻噪聲。分區(qū)的方法采用低通濾波的方法,抗高頻噪聲干擾的能力很強(qiáng)。在單一的圖像變換,K-L變換是均方誤差意義下數(shù)據(jù)壓縮的最佳變換。然而,由于特征僅僅是輸入字符圖像像素的線性組合,我們不能指望他們能夠提取高層次特征,因此,一個大的特征訓(xùn)練數(shù)據(jù)集是必要的,同時特征與像素位置相對應(yīng),我們不能期望得到的類描述適用于參數(shù)統(tǒng)計分類器,然而,非參數(shù)的分類,如最近鄰分類器在K-L變換的特征方面表現(xiàn)出色。
4 結(jié)論
本文對字符的特征類別進(jìn)行了詳細(xì)分析,在此基礎(chǔ)上根據(jù)特征的類別找出相對應(yīng)的特征提取技術(shù),同時對已有的特征提取技術(shù)的優(yōu)缺點進(jìn)行了分析。字符的宏觀特征主要針對于字符的識別和分類,而對于筆跡識別更側(cè)重于微觀特征來識別。隨著字符圖像類型的復(fù)雜程度越來越高(如,灰度圖像,彩色圖像),特征提取技術(shù)的改進(jìn)和新的特征選取將快速提高處理速度和識別效率。
【參考文獻(xiàn)】
[1]王巖.離線手寫體漢字鑒別及其算法研究[M].河北工業(yè)大學(xué),2013.
[2]Khaled Mohammed bin Abdl,Siti Zaiton Mohd,Azad Kamilah Muda,“Feature Extraction and Selection forHandwriting Identification: A Review”,375-381[M].
[3]陳蓉,鄧洪波,金連文.一種基于局部Gabor濾波器組的手寫體漢字識別方法[J].計算機(jī)應(yīng)用,2007,27(5):1222-1224.
[4]曾子銘,韓中華,等.基于扇形特征和BP神經(jīng)網(wǎng)絡(luò)算法的字符識別[J].沈陽建筑大學(xué)學(xué)報,2010,26(3):604-608.
[5]簡麗瓊.基于Hu矩和Zernike矩的文字識別,科技信息[J].2009,17:460-461.
[責(zé)任編輯:鄧麗麗]