国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

特征提取在圖像處理中的應(yīng)用

2015-10-08 14:10:36馬金定
科技視界 2015年27期
關(guān)鍵詞:字符識別模式識別特征提取

馬金定

【摘 要】特征在圖像處理中起著非常重要的作用。利用特征提取技術(shù)來提取圖像的特性,通過這些特征可以快速的對字符圖像進(jìn)行分類和識別。我們通過對不同類型的特征和特征提取技術(shù)分析,研究在不同的特征類型中哪些特征提取技術(shù)最適合的,整個分析研究以字符識別為基礎(chǔ)來進(jìn)行。

【關(guān)鍵詞】特征提?。蛔址R別;模式識別

特征是描述了一幅圖像中關(guān)于形狀的信息,通過對圖像的特征提取和處理,使得對圖像的分類很容易實現(xiàn)。在模式識別和圖像處理中,特征提取是一種特殊的降維處理,主要目的是從原始數(shù)據(jù)的低維度空間信息表達(dá)方式中獲得相關(guān)的信息。對數(shù)據(jù)處理算法來說,輸入數(shù)據(jù)處理時間太長,我們認(rèn)為是數(shù)據(jù)是冗余的,為了提高處理速度,將著輸入數(shù)據(jù)將轉(zhuǎn)化為精簡的一系列特征表達(dá)方式(如特征向量),這個過程稱為特征提取。常用的特征提取方法有模板匹配、圖像轉(zhuǎn)換、圖形描述、直方圖、幾何不變矩、Zernike矩、樣條曲線逼近、傅里葉描述、梯度特征和Gabor特性[1]。文中以字符識別為基礎(chǔ)進(jìn)行特征與特征提取技術(shù)的研究。

1 特征提取

特征提取盡可能判別和獲得特征,而對于特征選擇,對原有的特征集的一個子集選擇,特征提取重要的一步是分類器的建設(shè),旨在提取每一類特征的相關(guān)信息,在這一過程中相關(guān)特征從對象、字母中提取出來構(gòu)成特征向量。然后使用這些特征向量分類器識別輸入單元和目標(biāo)輸出單位。特征提取的過程是從原始數(shù)據(jù)檢索最重要的數(shù)據(jù),找到特定的一系列參數(shù),這些參數(shù)對一個字符來書來說是精確描述并且是獨一無二的形狀特性的。在特征提取階段,字符是由特征向量表示。特征提取的主要目標(biāo)是提取一組特征,實現(xiàn)用最少的特征實現(xiàn)最大化的識別率和對各種各樣的相同的符號實例生成類似的特征集。

2 特征選擇

特征選擇的主要思想是:通過刪除弱或無預(yù)測信息的特征來選擇輸入變量的一個子集同時保持分類精度,約翰等人描述了強(qiáng)和弱相關(guān)特征的關(guān)聯(lián)性,強(qiáng)相關(guān)特征意味著在不損失分類精度情況下是不能被刪除。弱相關(guān)的特征意味著對分類精度影響不大[2]。

選擇最有意義的特性集合是在分類問題處理過程中的至關(guān)重要的一步,良好的特征集包含可以從其他對象區(qū)分出特定對象的識別信息。特征可分為局部特征和全局特征,局部特征通常是幾何特性(凹、凸部分,端點數(shù)量、分支、節(jié)點等)。全局特征,全局特征,通常拓?fù)涮匦裕ㄟB通性、投影特性等)或統(tǒng)計特性(不變矩等)。

筆跡識別包括宏觀和微觀兩個類型的筆跡特性。宏觀特性主要有:基于灰度值的宏觀特性(閾值,黑色像素),基于輪廓的宏觀特性(內(nèi)部和外部輪廓),基于斜率的宏觀特性(水平,積極的,垂直的),筆劃寬度、傾斜度和高度。字符的凹凸特性通過捕捉主要的拓?fù)浜蛶缀翁卣鳌N⒂^特性發(fā)現(xiàn)不同的作家的筆跡,微觀特征有:縱橫比,終點數(shù),節(jié)點數(shù),形狀大小和圈數(shù),寬度和高度的分布,傾斜,形狀,平均曲率和梯度特征。

3 特征提取方法的研究

3.1 傅里葉描述

傅里葉變換廣泛應(yīng)用于形狀分析,傅里葉變換的系數(shù)構(gòu)成圖形的傅立葉描述,這些描述是在頻域中表示圖形的特征,描述符包含的低頻信息表示圖形的一般特征,而高頻率信息表示圖形細(xì)節(jié)部分。雖然傅里葉變換的系數(shù)的數(shù)目往往很大,但是該系數(shù)的一個子集足以捕捉圖形的整體特征。

假設(shè)一個特定圖形的邊界有K個像素,編號從0到K-1,沿著圖形輪廓的第K個像素的位置為(xk,yk)。因此,我們可以用兩參數(shù)方程來描述的圖形:

x(k)= xk,y(k)= yk,我們認(rèn)為,(x,y)的坐標(biāo)點不在直角坐標(biāo)系,而是在復(fù)平面,表達(dá)方式如下:

3.2 主成分分析(PCA)

主成分分析是一種數(shù)學(xué)方法,采用一個正交變換將一組可能相關(guān)的變量轉(zhuǎn)換為一組不相關(guān)變量,這些不相關(guān)的變量叫做主成分,他們是數(shù)據(jù)的中心X,計算的協(xié)方差矩陣C,獲得特征向量和協(xié)方差矩陣的特征值U,P,在特征空間的原始數(shù)據(jù)P=UT·X。

主成分個數(shù)小于或等于原始變量的數(shù)目,這種轉(zhuǎn)變的方式為,第一主成分盡可能多地具有較高的方差(也就是說,占據(jù)盡可能多的數(shù)據(jù)變化),主成分的數(shù)量小于或等于原始變量的數(shù)量。這種轉(zhuǎn)變中定義,第一主成分盡可能高方差(即占盡可能多的數(shù)據(jù)的變化),并且每一個成功的成分又有盡可能高的方差,在與前面計算出的數(shù)據(jù)正交(不相關(guān)的)的約束情況下,步驟計算出PCA變換的數(shù)據(jù)矩陣X。只有當(dāng)數(shù)據(jù)是滿足正態(tài)分布時,主成分的保證是獨立的。

3.3 Gabor濾波器

在空間域和頻域中伽柏濾波器具有最佳的定位特性,依據(jù)給定的系數(shù)矩陣Gabor濾波器提出了一種多分辨率分析的方法[3],在這種方法中,用一個二維Gabor濾波器進(jìn)行特征提取。Gabor濾波器在空間域是正弦信號調(diào)制高斯函數(shù),在頻域中是高斯頻移。Gabor濾波器可表示為:

Gabor過濾器的性能通過調(diào)節(jié)參數(shù)?姿,?酌,和?茲來改變。x和y是圖像坐標(biāo)。?姿是余弦方程的波長,?酌是高斯函數(shù)形狀的特征,當(dāng)γ= 1時,形狀是圓的。當(dāng)γ<1時,形狀為橢圓形。?茲指定了Gabor函數(shù)并行條紋的方向,它的取值為0到360度。

3.4 扇形特征提取

扇形特征提取的識別率完全取決于從字符中提取特征的效率。這些特征可以是拓?fù)?,幾何和結(jié)構(gòu)(角度,距離)等等[4]。對于機(jī)打字符,這些字符的形狀變化不大,拓?fù)浜徒Y(jié)構(gòu)的特征提取效果很好。然而,對于手寫字體,由于寫作習(xí)慣的不同,同一個字符的形狀也不同,相應(yīng)的拓?fù)浜徒Y(jié)構(gòu)特性不適用于手寫字體的特征。

在扇形提取中,我們使用特征矩陣的中心作為固定點,字符圖像尺寸統(tǒng)一變?yōu)?2×32像素,從圖像的中心選擇一個角把圖像分割成一個固定數(shù)量的扇區(qū)。字符“E”細(xì)分為12部分,如圖1所示。第一部分是從0度到30度;第二部分是從30到60度等等,每個部分用于特征提取。

3.5 距離和角度的特征提取

Nk表示在第K個子塊中的像素值為1的像素數(shù)量,k=1,2,…,12,歸一化向量距離為每個字塊中的像素為1的數(shù)量和除以整個字符圖像中像素為1總數(shù)量,在字符圖像中(xi,yi)是字塊中像素為1的坐標(biāo),(xM,yN)是字符圖像的中心坐標(biāo)。

向量距離DK作為一組特征,角度AK作為另一組特征。從12個子塊中提取了距離向量和角度向量共24個特征,這些特征繪制出一個原字符的近似形狀如圖2所示。

3.6 Zernike矩

Zernike矩已被用于對二值化字符的識別,Zernike矩可以提取旋轉(zhuǎn)變化和旋轉(zhuǎn)不變特征,很明顯不變特征對灰度圖像是非常有用[5]。當(dāng)使用傅里葉描述符,矩不變量,或Zernike矩等這些技術(shù)時,由于我們不使用高階項,相應(yīng)的可以去除離散誤差和其它高頻噪聲。分區(qū)的方法采用低通濾波的方法,抗高頻噪聲干擾的能力很強(qiáng)。在單一的圖像變換,K-L變換是均方誤差意義下數(shù)據(jù)壓縮的最佳變換。然而,由于特征僅僅是輸入字符圖像像素的線性組合,我們不能指望他們能夠提取高層次特征,因此,一個大的特征訓(xùn)練數(shù)據(jù)集是必要的,同時特征與像素位置相對應(yīng),我們不能期望得到的類描述適用于參數(shù)統(tǒng)計分類器,然而,非參數(shù)的分類,如最近鄰分類器在K-L變換的特征方面表現(xiàn)出色。

4 結(jié)論

本文對字符的特征類別進(jìn)行了詳細(xì)分析,在此基礎(chǔ)上根據(jù)特征的類別找出相對應(yīng)的特征提取技術(shù),同時對已有的特征提取技術(shù)的優(yōu)缺點進(jìn)行了分析。字符的宏觀特征主要針對于字符的識別和分類,而對于筆跡識別更側(cè)重于微觀特征來識別。隨著字符圖像類型的復(fù)雜程度越來越高(如,灰度圖像,彩色圖像),特征提取技術(shù)的改進(jìn)和新的特征選取將快速提高處理速度和識別效率。

【參考文獻(xiàn)】

[1]王巖.離線手寫體漢字鑒別及其算法研究[M].河北工業(yè)大學(xué),2013.

[2]Khaled Mohammed bin Abdl,Siti Zaiton Mohd,Azad Kamilah Muda,“Feature Extraction and Selection forHandwriting Identification: A Review”,375-381[M].

[3]陳蓉,鄧洪波,金連文.一種基于局部Gabor濾波器組的手寫體漢字識別方法[J].計算機(jī)應(yīng)用,2007,27(5):1222-1224.

[4]曾子銘,韓中華,等.基于扇形特征和BP神經(jīng)網(wǎng)絡(luò)算法的字符識別[J].沈陽建筑大學(xué)學(xué)報,2010,26(3):604-608.

[5]簡麗瓊.基于Hu矩和Zernike矩的文字識別,科技信息[J].2009,17:460-461.

[責(zé)任編輯:鄧麗麗]

猜你喜歡
字符識別模式識別特征提取
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
一種改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識別
淺談模式識別在圖像識別中的應(yīng)用
電子測試(2017年23期)2017-04-04 05:06:50
一種基于LBP 特征提取和稀疏表示的肝病識別算法
第四屆亞洲模式識別會議
儀表字符識別中的圖像處理算法研究
基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識別
第3屆亞洲模式識別會議
基于MED和循環(huán)域解調(diào)的多故障特征提取
電氣設(shè)備的故障診斷與模式識別
河南科技(2014年5期)2014-02-27 14:08:35
黄山市| 夏邑县| 上蔡县| 阳春市| 长乐市| 恩施市| 芦溪县| 游戏| 东明县| 新巴尔虎左旗| 高邮市| 德昌县| 巴南区| 清水河县| 岚皋县| 武邑县| 昌黎县| 高尔夫| 黄陵县| 图片| 六盘水市| 康乐县| 慈利县| 德昌县| 柘城县| 建宁县| 嵊泗县| 昌吉市| 吴川市| 依安县| 娱乐| 兴安县| 萝北县| 蒙山县| 比如县| 绥芬河市| 昆明市| 革吉县| 留坝县| 岳池县| 石屏县|