特征提取在圖像處理中的應(yīng)用

2015-10-08 14:10:36馬金定

科技視界 2015年27期

馬金定

【摘要】特征在圖像處理中起著非常重要的作用。利用特征提取技術(shù)來提取圖像的特性，通過這些特征可以快速的對字符圖像進(jìn)行分類和識別。我們通過對不同類型的特征和特征提取技術(shù)分析，研究在不同的特征類型中哪些特征提取技術(shù)最適合的，整個分析研究以字符識別為基礎(chǔ)來進(jìn)行。

【關(guān)鍵詞】特征提?。蛔址R別；模式識別

特征是描述了一幅圖像中關(guān)于形狀的信息，通過對圖像的特征提取和處理，使得對圖像的分類很容易實現(xiàn)。在模式識別和圖像處理中，特征提取是一種特殊的降維處理，主要目的是從原始數(shù)據(jù)的低維度空間信息表達(dá)方式中獲得相關(guān)的信息。對數(shù)據(jù)處理算法來說，輸入數(shù)據(jù)處理時間太長，我們認(rèn)為是數(shù)據(jù)是冗余的，為了提高處理速度，將著輸入數(shù)據(jù)將轉(zhuǎn)化為精簡的一系列特征表達(dá)方式（如特征向量），這個過程稱為特征提取。常用的特征提取方法有模板匹配、圖像轉(zhuǎn)換、圖形描述、直方圖、幾何不變矩、Zernike矩、樣條曲線逼近、傅里葉描述、梯度特征和Gabor特性[1]。文中以字符識別為基礎(chǔ)進(jìn)行特征與特征提取技術(shù)的研究。

1 特征提取

特征提取盡可能判別和獲得特征，而對于特征選擇，對原有的特征集的一個子集選擇，特征提取重要的一步是分類器的建設(shè)，旨在提取每一類特征的相關(guān)信息，在這一過程中相關(guān)特征從對象、字母中提取出來構(gòu)成特征向量。然后使用這些特征向量分類器識別輸入單元和目標(biāo)輸出單位。特征提取的過程是從原始數(shù)據(jù)檢索最重要的數(shù)據(jù)，找到特定的一系列參數(shù)，這些參數(shù)對一個字符來書來說是精確描述并且是獨一無二的形狀特性的。在特征提取階段，字符是由特征向量表示。特征提取的主要目標(biāo)是提取一組特征，實現(xiàn)用最少的特征實現(xiàn)最大化的識別率和對各種各樣的相同的符號實例生成類似的特征集。

2 特征選擇

特征選擇的主要思想是：通過刪除弱或無預(yù)測信息的特征來選擇輸入變量的一個子集同時保持分類精度，約翰等人描述了強(qiáng)和弱相關(guān)特征的關(guān)聯(lián)性，強(qiáng)相關(guān)特征意味著在不損失分類精度情況下是不能被刪除。弱相關(guān)的特征意味著對分類精度影響不大[2]。

選擇最有意義的特性集合是在分類問題處理過程中的至關(guān)重要的一步，良好的特征集包含可以從其他對象區(qū)分出特定對象的識別信息。特征可分為局部特征和全局特征，局部特征通常是幾何特性（凹、凸部分，端點數(shù)量、分支、節(jié)點等）。全局特征，全局特征，通常拓?fù)涮匦裕ㄟB通性、投影特性等）或統(tǒng)計特性（不變矩等）。

筆跡識別包括宏觀和微觀兩個類型的筆跡特性。宏觀特性主要有：基于灰度值的宏觀特性（閾值，黑色像素），基于輪廓的宏觀特性（內(nèi)部和外部輪廓），基于斜率的宏觀特性（水平，積極的，垂直的），筆劃寬度、傾斜度和高度。字符的凹凸特性通過捕捉主要的拓?fù)浜蛶缀翁卣鳌Ｎ⒂^特性發(fā)現(xiàn)不同的作家的筆跡，微觀特征有：縱橫比，終點數(shù)，節(jié)點數(shù)，形狀大小和圈數(shù)，寬度和高度的分布，傾斜，形狀，平均曲率和梯度特征。

3 特征提取方法的研究

3.1 傅里葉描述

傅里葉變換廣泛應(yīng)用于形狀分析，傅里葉變換的系數(shù)構(gòu)成圖形的傅立葉描述，這些描述是在頻域中表示圖形的特征，描述符包含的低頻信息表示圖形的一般特征，而高頻率信息表示圖形細(xì)節(jié)部分。雖然傅里葉變換的系數(shù)的數(shù)目往往很大，但是該系數(shù)的一個子集足以捕捉圖形的整體特征。

假設(shè)一個特定圖形的邊界有K個像素，編號從0到K-1，沿著圖形輪廓的第K個像素的位置為（xk，yk）。因此，我們可以用兩參數(shù)方程來描述的圖形：

x（k）= xk，y（k）= yk，我們認(rèn)為，（x，y）的坐標(biāo)點不在直角坐標(biāo)系，而是在復(fù)平面，表達(dá)方式如下：

3.2 主成分分析（PCA）

主成分分析是一種數(shù)學(xué)方法，采用一個正交變換將一組可能相關(guān)的變量轉(zhuǎn)換為一組不相關(guān)變量，這些不相關(guān)的變量叫做主成分，他們是數(shù)據(jù)的中心X，計算的協(xié)方差矩陣C，獲得特征向量和協(xié)方差矩陣的特征值U，P，在特征空間的原始數(shù)據(jù)P=UT·X。

主成分個數(shù)小于或等于原始變量的數(shù)目，這種轉(zhuǎn)變的方式為，第一主成分盡可能多地具有較高的方差（也就是說，占據(jù)盡可能多的數(shù)據(jù)變化），主成分的數(shù)量小于或等于原始變量的數(shù)量。這種轉(zhuǎn)變中定義，第一主成分盡可能高方差（即占盡可能多的數(shù)據(jù)的變化），并且每一個成功的成分又有盡可能高的方差，在與前面計算出的數(shù)據(jù)正交（不相關(guān)的）的約束情況下，步驟計算出PCA變換的數(shù)據(jù)矩陣X。只有當(dāng)數(shù)據(jù)是滿足正態(tài)分布時，主成分的保證是獨立的。

3.3 Gabor濾波器

在空間域和頻域中伽柏濾波器具有最佳的定位特性，依據(jù)給定的系數(shù)矩陣Gabor濾波器提出了一種多分辨率分析的方法[3]，在這種方法中，用一個二維Gabor濾波器進(jìn)行特征提取。Gabor濾波器在空間域是正弦信號調(diào)制高斯函數(shù)，在頻域中是高斯頻移。Gabor濾波器可表示為：

Gabor過濾器的性能通過調(diào)節(jié)參數(shù)？姿，？酌，和？茲來改變。x和y是圖像坐標(biāo)。？姿是余弦方程的波長，？酌是高斯函數(shù)形狀的特征，當(dāng)γ= 1時，形狀是圓的。當(dāng)γ<1時，形狀為橢圓形。？茲指定了Gabor函數(shù)并行條紋的方向，它的取值為0到360度。

3.4 扇形特征提取

扇形特征提取的識別率完全取決于從字符中提取特征的效率。這些特征可以是拓?fù)?，幾何和結(jié)構(gòu)（角度，距離）等等[4]。對于機(jī)打字符，這些字符的形狀變化不大，拓?fù)浜徒Y(jié)構(gòu)的特征提取效果很好。然而，對于手寫字體，由于寫作習(xí)慣的不同，同一個字符的形狀也不同，相應(yīng)的拓?fù)浜徒Y(jié)構(gòu)特性不適用于手寫字體的特征。

在扇形提取中，我們使用特征矩陣的中心作為固定點，字符圖像尺寸統(tǒng)一變?yōu)?2×32像素，從圖像的中心選擇一個角把圖像分割成一個固定數(shù)量的扇區(qū)。字符“E”細(xì)分為12部分，如圖1所示。第一部分是從0度到30度；第二部分是從30到60度等等，每個部分用于特征提取。

3.5 距離和角度的特征提取

Nk表示在第K個子塊中的像素值為1的像素數(shù)量，k=1，2，…，12，歸一化向量距離為每個字塊中的像素為1的數(shù)量和除以整個字符圖像中像素為1總數(shù)量，在字符圖像中（xi，yi）是字塊中像素為1的坐標(biāo)，（xM，yN）是字符圖像的中心坐標(biāo)。

向量距離DK作為一組特征，角度AK作為另一組特征。從12個子塊中提取了距離向量和角度向量共24個特征，這些特征繪制出一個原字符的近似形狀如圖2所示。

3.6 Zernike矩

Zernike矩已被用于對二值化字符的識別，Zernike矩可以提取旋轉(zhuǎn)變化和旋轉(zhuǎn)不變特征，很明顯不變特征對灰度圖像是非常有用[5]。當(dāng)使用傅里葉描述符，矩不變量，或Zernike矩等這些技術(shù)時，由于我們不使用高階項，相應(yīng)的可以去除離散誤差和其它高頻噪聲。分區(qū)的方法采用低通濾波的方法，抗高頻噪聲干擾的能力很強(qiáng)。在單一的圖像變換，K-L變換是均方誤差意義下數(shù)據(jù)壓縮的最佳變換。然而，由于特征僅僅是輸入字符圖像像素的線性組合，我們不能指望他們能夠提取高層次特征，因此，一個大的特征訓(xùn)練數(shù)據(jù)集是必要的，同時特征與像素位置相對應(yīng)，我們不能期望得到的類描述適用于參數(shù)統(tǒng)計分類器，然而，非參數(shù)的分類，如最近鄰分類器在K-L變換的特征方面表現(xiàn)出色。

4 結(jié)論

本文對字符的特征類別進(jìn)行了詳細(xì)分析，在此基礎(chǔ)上根據(jù)特征的類別找出相對應(yīng)的特征提取技術(shù)，同時對已有的特征提取技術(shù)的優(yōu)缺點進(jìn)行了分析。字符的宏觀特征主要針對于字符的識別和分類，而對于筆跡識別更側(cè)重于微觀特征來識別。隨著字符圖像類型的復(fù)雜程度越來越高（如，灰度圖像，彩色圖像），特征提取技術(shù)的改進(jìn)和新的特征選取將快速提高處理速度和識別效率。

【參考文獻(xiàn)】

[1]王巖.離線手寫體漢字鑒別及其算法研究[M].河北工業(yè)大學(xué)，2013.

[2]Khaled Mohammed bin Abdl，Siti Zaiton Mohd，Azad Kamilah Muda，“Feature Extraction and Selection forHandwriting Identification： A Review”，375-381[M].

[3]陳蓉，鄧洪波，金連文.一種基于局部Gabor濾波器組的手寫體漢字識別方法[J].計算機(jī)應(yīng)用，2007，27（5）：1222-1224.

[4]曾子銘，韓中華，等.基于扇形特征和BP神經(jīng)網(wǎng)絡(luò)算法的字符識別[J].沈陽建筑大學(xué)學(xué)報，2010，26（3）：604-608.

[5]簡麗瓊.基于Hu矩和Zernike矩的文字識別，科技信息[J].2009，17：460-461.

[責(zé)任編輯：鄧麗麗]

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

特征提取在圖像處理中的應(yīng)用