国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

手寫漢字圖像的特征矩陣提取

2020-08-07 14:40于萬波李耀升
現(xiàn)代計(jì)算機(jī) 2020年18期
關(guān)鍵詞:識(shí)別率手寫矩陣

于萬波,李耀升

(大連大學(xué)信息工程學(xué)院,大連116000)

0 引言

圖像識(shí)別技術(shù)應(yīng)用廣泛,近些年成為研究熱點(diǎn)[1-4]。而圖像的特征提取與匹配則是圖像識(shí)別的關(guān)鍵步驟,關(guān)于圖像的特征提取,近年來涌現(xiàn)出大量的特征提取與識(shí)別算法,圖像特征的種類也是十分的豐富;而各種語言的手寫字識(shí)別,作為一種較為特別的圖像識(shí)別,也成為了研究熱點(diǎn),尤其是以手寫漢字做為研究對(duì)象進(jìn)行的研究,如:Wang Yanwei 等人提出一種在分類前重新訓(xùn)練數(shù)據(jù)集的方法,訓(xùn)練集由位于分類邊界附近的樣本構(gòu)成,并在HCL2000 和HCD 漢字?jǐn)?shù)據(jù)庫(kù)上進(jìn)行檢測(cè),解決了對(duì)于自由筆跡,字符形狀和外觀樣本的變異性較大,不能嚴(yán)格滿足高斯分布,導(dǎo)致識(shí)別不準(zhǔn)的問題[5]。Gao Xue 等人提出了一種新的用于手寫漢字識(shí)別的局部線性判別分析(LDA)方法,解決了傳統(tǒng)的LDA算法在用于無約束手寫漢字識(shí)別時(shí),容易出現(xiàn)類分離問題和多模式樣本分布問題[6]。Bi Ning 等人將有效卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型GoogLeNet 用于手寫漢字識(shí)別,并進(jìn)行了一些調(diào)整,實(shí)驗(yàn)結(jié)果具有很高的準(zhǔn)確性[7]。Chen Guang 等人提出了一種新的基于非線性歸一化的增強(qiáng)加權(quán)動(dòng)態(tài)網(wǎng)格的特征提取方法,改善了手寫漢字識(shí)別系統(tǒng)的性能,具有很好的識(shí)別效果[8]。關(guān)于手寫漢字圖像特征提取的方面,具有一定的研究意義與價(jià)值。

本文研究的是手寫漢字圖像的特征提取,以矩陣的形式表述圖像特征,將從迭代和非迭代兩個(gè)方面入手,首先以迭代法作為切入點(diǎn),基于迭代理論,利用迭代函數(shù)系統(tǒng)的特性,構(gòu)造相關(guān)動(dòng)力系統(tǒng),生成迭代序列,對(duì)這些迭代序列進(jìn)行分析研究并構(gòu)造圖像特征矩陣,從中獲取一定的規(guī)律并用于手寫漢字圖像的識(shí)別探究。另外通過構(gòu)造三維矩陣序列圖像,獲取手寫漢字圖像的特征矩陣,并以此實(shí)現(xiàn)手寫漢字圖像的匹配與識(shí)別。實(shí)驗(yàn)探究使用的數(shù)據(jù)集為HCL2000 漢字庫(kù),使用MATLAB 實(shí)現(xiàn)實(shí)驗(yàn)仿真。

1 圖像數(shù)據(jù)的獲取及處理

依據(jù)HCL2000 漢字庫(kù)的數(shù)據(jù)特性可知,HCL2000漢字?jǐn)?shù)據(jù)圖像按書寫者以文件形式存放。每個(gè)HCL文件包含一個(gè)512 字節(jié)的文件頭,記錄了該文件的作者等相關(guān)信息。各手寫漢字按區(qū)位碼的順序存放,每個(gè)漢字圖像為64×64 的點(diǎn)陣,在存儲(chǔ)過程中按比特存儲(chǔ),壓縮為512 字節(jié)。所以,在獲取圖像數(shù)據(jù)的時(shí)候,需要對(duì)HCL 文件中的漢字?jǐn)?shù)據(jù)進(jìn)行解壓,使其還原為64×64 的點(diǎn)陣。在這里,根據(jù)北京郵電大學(xué)模式識(shí)別實(shí)驗(yàn)室給出的HCL 文件讀取方法,使用MATLAB 進(jìn)行實(shí)現(xiàn),從而讀取出指定的手寫漢字圖像。每個(gè)圖像的灰度值大約有40-60 個(gè),圖1、圖2 所示為數(shù)據(jù)集中第8個(gè)人、第12 個(gè)人所書寫的第31-60 個(gè)漢字。

圖1 第8個(gè)人書寫的第31-60個(gè)漢字

圖2 第12個(gè)人書寫的第31-60個(gè)漢字

由于圖像的本質(zhì)就是一個(gè)矩陣,所以直接用漢字圖像矩陣代入corrcoef 函數(shù)計(jì)算相關(guān)系數(shù),通過實(shí)驗(yàn)發(fā)現(xiàn),直接計(jì)算出的相關(guān)系數(shù)不能很好的表述兩幅圖像的相關(guān)性;所以在此不能直接使用圖像矩陣數(shù)據(jù)進(jìn)行相關(guān)系數(shù)的計(jì)算。

接下來我們將嘗試?yán)玫瘮?shù)系統(tǒng)進(jìn)行手寫漢字圖像的特征矩陣的提取與識(shí)別檢測(cè)。

2 基于迭代的特征矩陣提取與研究

2.1 迭代動(dòng)力系統(tǒng)構(gòu)造與分析

構(gòu)造的如式(1)所示動(dòng)力系統(tǒng):

其中p1、p2 隨機(jī)給定(p1=p2=0.01*rand)。

讀取手寫漢字?jǐn)?shù)據(jù),解壓并存儲(chǔ)在二維數(shù)組中;確定實(shí)驗(yàn)參數(shù)并進(jìn)行迭代運(yùn)算多次,保存、輸出迭代軌跡序列矩陣T;

通過實(shí)驗(yàn)分析發(fā)現(xiàn):由于手寫漢字圖像存在大面積的平坦區(qū)域,從而導(dǎo)致動(dòng)力系統(tǒng)的混沌特性較差,系統(tǒng)容易收斂,所以當(dāng)初值(u,v)比較少,迭代次數(shù)較多(m 較大)時(shí)得到的序列點(diǎn)較少,不能獲得較好的迭代軌跡序列。

接下來,我們考慮對(duì)漢字圖像進(jìn)行一些相關(guān)處理,并對(duì)系統(tǒng)進(jìn)行改進(jìn),以此來提高實(shí)驗(yàn)效果。

2.2 圖像預(yù)處理

(1)給圖像加斜面

根據(jù)圖像的大小,初始化一個(gè)相同大小的斜面矩陣,加在目標(biāo)圖像矩陣上,使其整體傾斜,減小其字體邊緣部分的像素差,效果如圖3 所示。

圖3 加斜面之后的漢字圖像與原圖像對(duì)比

使用加了斜面的圖像矩陣進(jìn)行迭代演算,獲取迭代序列并記錄保存,分析迭代序列數(shù)據(jù),進(jìn)行識(shí)別計(jì)算,其實(shí)驗(yàn)效果有了一定的提升。

(2)拉伸圖像,使其增高

接著來嘗試,將目標(biāo)圖像的字體拉伸,擴(kuò)大其輪廓,使其字跡加粗,減小空白區(qū)域,并對(duì)字體部分進(jìn)行加高處理(思路源自刻章)[9]。

通過循環(huán),將原圖像素點(diǎn)依次按照左、下、右、上的次序進(jìn)行多次位移,將每次位移之后的圖像依次疊加起來,從而起到拓寬圖像字體并使其增高的效果,如圖4 所示。

圖4 移位疊加操后的圖像與原圖像對(duì)比

最后將疊加后的圖像放大至256×256 大小,然后對(duì)圖像矩陣進(jìn)行歸一化處理,并使其像素值保持在1到255 之間,使用處理后的圖像與三角函數(shù)迭代式共同構(gòu)造動(dòng)力系統(tǒng),進(jìn)行下一步實(shí)驗(yàn)操作。

2.3 識(shí)別優(yōu)化

通過實(shí)驗(yàn)發(fā)現(xiàn),直接用三角函數(shù)表達(dá)式與圖像函數(shù)構(gòu)造動(dòng)力系統(tǒng)來實(shí)驗(yàn),效果并不是很好,用三角函數(shù)表達(dá)式作為迭代式,迭代賦值構(gòu)造迭代矩陣T,用矩陣T 與圖像構(gòu)造動(dòng)力系統(tǒng),這樣效果提升很多。然后我們考慮多個(gè)特征綜合來進(jìn)行識(shí)別。

選取多個(gè)人書寫的同一個(gè)漢字,分別進(jìn)行迭代實(shí)驗(yàn),將每次的特征矩陣綜合起來作為這一漢字的綜合特征,然后與目標(biāo)圖像的特征矩陣進(jìn)行相關(guān)系數(shù)的計(jì)算,發(fā)現(xiàn)實(shí)驗(yàn)效果有所提升。

在這里,我們選取數(shù)據(jù)集中前10 個(gè)人的第2、3、4個(gè)漢字作為樣本數(shù)據(jù),分別構(gòu)造出這三個(gè)漢字的綜合特征矩陣,并與第10 個(gè)人所書寫的前六個(gè)漢字的特征矩陣進(jìn)行相關(guān)系數(shù)的計(jì)算;實(shí)驗(yàn)發(fā)現(xiàn),其同一個(gè)漢字的相關(guān)系數(shù)最高能達(dá)到0.35 左右,不同漢字的相關(guān)系數(shù)普遍在0.2 以內(nèi),這能較好的體現(xiàn)兩幅漢字圖像的相關(guān)性(例如給定閾值0.3,規(guī)定大于0.3 的為相同漢字,小于0.3 的為不同漢字)。

具體實(shí)驗(yàn)數(shù)據(jù)如表1 所示。

表1 多個(gè)漢字間的相關(guān)系數(shù)

接下來,我們嘗試擴(kuò)大樣本數(shù)據(jù),設(shè)計(jì)識(shí)別率計(jì)算算法,進(jìn)行識(shí)別率相關(guān)探究。

2.4 識(shí)別率的計(jì)算及其分析

改進(jìn)迭代方法,并設(shè)計(jì)識(shí)別率計(jì)算算法,提取多個(gè)人書寫的多個(gè)漢字圖像作為樣本數(shù)據(jù),同一組為不同人寫的同一個(gè)漢字,獲取樣本數(shù)據(jù)的特征矩陣;確定每個(gè)漢字的訓(xùn)練情況,構(gòu)造綜合特征矩陣,并按數(shù)據(jù)集中漢字的存儲(chǔ)順序保存;使用樣本數(shù)據(jù)中所有漢字的特征矩陣分別與每個(gè)字的綜合特征矩陣計(jì)算相關(guān)系數(shù),判斷每個(gè)漢字所產(chǎn)生的多個(gè)相關(guān)系數(shù)中,最大值的位置是否與本漢字的組數(shù)一致,若一致則說明識(shí)別成功。

算法1 迭代提取圖像特征

1)將式(2)做為迭代式,循環(huán)計(jì)算,得到迭代矩陣T;

2)確定樣本數(shù)據(jù)量,依次讀取樣本中每個(gè)漢字圖像,并對(duì)其進(jìn)行加斜面、移位疊加操作;

3)利用迭代矩陣T 與漢字圖像構(gòu)成迭代動(dòng)力系統(tǒng),提取樣本中每個(gè)漢字的特征矩陣T1,并按組別順序保存(同一個(gè)漢字為一組,分組順序與數(shù)據(jù)集中漢字排列順序一致);

4)訓(xùn)練部分漢字:確定樣本數(shù)據(jù)中的每種漢字的訓(xùn)練情況(選擇多幅圖像來構(gòu)造這一漢字的綜合特征矩陣),將準(zhǔn)備訓(xùn)練的圖像數(shù)據(jù)循環(huán)代入迭代動(dòng)力系統(tǒng)(同步驟3),得到每個(gè)漢字的綜合特征矩陣T2,按照漢字存儲(chǔ)的順序保存;

5)依次將樣本中所有漢字的特征矩陣與這些漢字的綜合特征矩陣進(jìn)行相關(guān)系數(shù)的計(jì)算,每個(gè)漢字對(duì)應(yīng)多個(gè)相關(guān)系數(shù),若使相關(guān)系數(shù)最大的那個(gè)綜和特征的位置與漢字的組數(shù)一致,則說明識(shí)別成功;

6)記錄識(shí)別成功的漢字?jǐn)?shù)目,與樣本漢字總數(shù)對(duì)比,計(jì)算識(shí)別率。

我們先來提取30 個(gè)人書寫的20 個(gè)漢字,共計(jì)600個(gè)漢字圖像,每個(gè)漢字訓(xùn)練10 張圖像(即用10 個(gè)人書寫的同一漢字來構(gòu)造綜合特征矩陣)運(yùn)行程序后,識(shí)別出421 個(gè)漢字,識(shí)別率為70.17%;每個(gè)漢字訓(xùn)練20張,可識(shí)別出477 張,識(shí)別率為79.5%;若每個(gè)漢字訓(xùn)練30 張(即全部訓(xùn)練),可識(shí)別出600 張,識(shí)別率為100%;為了保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,我們繼續(xù)擴(kuò)大樣本數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)如表2 所示。

表2 擴(kuò)大樣本后的實(shí)驗(yàn)數(shù)據(jù)

由這些實(shí)驗(yàn)結(jié)果可以說明,基于迭代的手寫漢字圖像特征矩陣提取方法確實(shí)可行,所提取的特征矩陣能較好的表述圖像之間的相關(guān)性。

3 基于三維矩陣的圖像特征提取與識(shí)別

由于一個(gè)手寫漢字圖像的大小為64×64,所以在這里,我們使用64 個(gè)人書寫的同一個(gè)漢字,來構(gòu)成64×64×64 的三維矩陣作為樣本數(shù)據(jù),然后獲取一個(gè)人書寫的某一個(gè)漢字圖像,并對(duì)其進(jìn)行一些相關(guān)處理,改變其結(jié)構(gòu)使其成為64×64×64 的三維矩陣,然后與樣本中的矩陣進(jìn)行相關(guān)性的計(jì)算,分析結(jié)果,進(jìn)行手寫漢字的識(shí)別探究。

3.1 構(gòu)造三維特征矩陣計(jì)算相關(guān)系數(shù)

算法2 迭代提取三維特征矩陣

(1)獲取64 個(gè)人所書寫的同一個(gè)漢字的圖像數(shù)據(jù),并解壓為64×64 大小的矩陣;

(2)將所得的64 個(gè)64×64 矩陣糅合為64×64×64的三維矩陣,作為樣本數(shù)據(jù)并保存;

(3)獲取一個(gè)人的一個(gè)漢字圖像,并對(duì)其邊緣裁剪64 次,得到64 個(gè)64×64 的矩陣,并將其糅合為64×64×64 的三維矩陣;

(4)計(jì)算兩個(gè)三維矩陣的相關(guān)系數(shù)。

通過大量實(shí)驗(yàn)結(jié)果表明,同一個(gè)漢字的相關(guān)系數(shù)大約在0.15~0.3 左右,不同漢字的相關(guān)系數(shù)基本小于0.15,初步判斷該算法可用于手寫漢字圖像識(shí)別的實(shí)際研究。

3.2 計(jì)算識(shí)別率

在上述算法2 的基礎(chǔ)上,做出一些改進(jìn),在這里我們選取30 個(gè)漢字構(gòu)造三維矩陣并按漢字排列順序保存,作為樣本數(shù)據(jù),然后選取其中一個(gè)漢字圖像作為目標(biāo),得到其三維矩陣,并與30 個(gè)樣本矩陣進(jìn)行相關(guān)系數(shù)的計(jì)算,若使相關(guān)系數(shù)最大的樣本數(shù)據(jù)的位置與目標(biāo)漢字的位置相同則說明識(shí)別成功。

算法3 利用三維特征矩陣進(jìn)行識(shí)別

(1)讀取64 個(gè)人書寫的同一漢字?jǐn)?shù)據(jù),解壓糅合為64×64×64 的矩陣;

(2)重復(fù)第1 步驟30 次來獲取30 個(gè)漢字的數(shù)據(jù),將每次得到的三階矩陣存入64×64×64×30 大小的數(shù)組中去,作為樣本數(shù)據(jù);

(3)任意選擇10 個(gè)人,依次獲取其書寫的樣本中的30 的漢字?jǐn)?shù)據(jù),并進(jìn)行相關(guān)處理;

(4)將所得的300 個(gè)漢字分別與樣本數(shù)據(jù)中的30個(gè)漢字計(jì)算相關(guān)系數(shù),每個(gè)目標(biāo)漢字可得到30 個(gè)相關(guān)系數(shù),若相關(guān)系數(shù)最大的對(duì)應(yīng)的樣本漢字在數(shù)據(jù)集中的位置與目標(biāo)漢字所對(duì)應(yīng)的位置相同,則說明識(shí)別成功;

(5)記錄識(shí)別個(gè)數(shù),計(jì)算識(shí)別率。

下面我們來分析實(shí)驗(yàn)過程,嘗試提高識(shí)別率。

3.3 識(shí)別效果及分析

為提高實(shí)驗(yàn)效率,我們以30 個(gè)漢字作為樣本數(shù)據(jù),以10 個(gè)人書寫的30 個(gè)漢字作為目標(biāo)數(shù)據(jù),來進(jìn)行實(shí)驗(yàn),分析探究,提高識(shí)別率。

在上節(jié)實(shí)驗(yàn)中,10 個(gè)人書寫的30 個(gè)漢字,識(shí)別率為80.67%。

(1)裁剪目標(biāo)數(shù)據(jù)

為了讓目標(biāo)漢字(64×64)與樣本數(shù)據(jù)(64×64×64)能更好的比較,在之前的算法中,我們將所獲取的目標(biāo)漢字圖像進(jìn)行邊緣裁剪,共裁剪64 次,將所得的64 個(gè)圖像數(shù)據(jù)糅合為與樣本同規(guī)格的數(shù)據(jù)來進(jìn)行實(shí)驗(yàn)比較,在這里我們從這一角度出發(fā),多次調(diào)整目標(biāo)數(shù)據(jù)的裁剪參數(shù),找到識(shí)別效果最好的參數(shù),以此來提高識(shí)別率,并在此基礎(chǔ)上對(duì)漢字圖像進(jìn)行一次預(yù)處理,對(duì)其進(jìn)行移位疊加操作。

(2)對(duì)圖像進(jìn)行移位疊加

算法4 移位處理后提取特征

1)打開數(shù)據(jù)集文件,讀取漢字?jǐn)?shù)據(jù);

2)將漢字?jǐn)?shù)據(jù)解壓為64×64 大小的矩陣;

3)初始化一個(gè)64×64 的矩陣temp,用來存放解壓后的漢字?jǐn)?shù)據(jù);

4)初始化一個(gè)64×64 的矩陣tempN;

5)移位疊加,操作如下:

①將圖像矩陣數(shù)據(jù)整體左移一位,賦給新初始化的矩陣(將temp 的2 到64 列賦給tempN 的1 到63 列);

②再將原圖像矩陣依次下移、右移、上移一個(gè)點(diǎn)位,然后每次都行平移的矩陣賦給tempN(依次疊加);

③重復(fù)步驟1、2 多次,每次平移的點(diǎn)位加1。6)用疊加后的圖像進(jìn)行實(shí)驗(yàn)操作;

此時(shí)的識(shí)別率為85.33%;優(yōu)化實(shí)驗(yàn)操作以及擴(kuò)大樣本后的實(shí)驗(yàn)結(jié)果如表3 所示。

表3 多組樣本的實(shí)驗(yàn)數(shù)據(jù)對(duì)比

這些實(shí)驗(yàn)結(jié)果說明,構(gòu)造三維矩陣(序列圖像)作為漢字圖像的特征矩陣進(jìn)行手寫漢字識(shí)別的方法確實(shí)可行,并且取得了較為不錯(cuò)的實(shí)驗(yàn)結(jié)果。

4 結(jié)語

目前比較常見的脫機(jī)手寫漢字識(shí)別主要是基于深度學(xué)習(xí)技術(shù)來進(jìn)行的,而關(guān)于這方面的研究也涌現(xiàn)出大量的文獻(xiàn)報(bào)道,本文所提出的特征提取與識(shí)別的方法,與其他方法相比,具有系統(tǒng)結(jié)構(gòu)復(fù)雜度低,運(yùn)算成本小,樣本數(shù)據(jù)的獲取成本低等優(yōu)點(diǎn)。

大多基于深度學(xué)習(xí)的方法,在獲取樣本數(shù)據(jù)的時(shí)候,需要進(jìn)行大量的訓(xùn)練才能達(dá)到滿意的程度,系統(tǒng)結(jié)構(gòu)較為復(fù)雜,運(yùn)行成本較高;我們?cè)趯?shí)驗(yàn)探究過程中,通過迭代構(gòu)造特征矩陣以及構(gòu)造三維序列圖像矩陣等方法來獲取樣本數(shù)據(jù),一定程度上降低了系統(tǒng)結(jié)構(gòu)的復(fù)雜程度和運(yùn)算成本,提高了實(shí)驗(yàn)效率。

猜你喜歡
識(shí)別率手寫矩陣
我手寫我心
我手寫我意
多項(xiàng)式理論在矩陣求逆中的應(yīng)用
檔案數(shù)字化過程中OCR技術(shù)的應(yīng)用分析
基于PCA與MLP感知器的人臉圖像辨識(shí)技術(shù)
科技文檔中數(shù)學(xué)表達(dá)式的結(jié)構(gòu)分析與識(shí)別
人工智能現(xiàn)狀和發(fā)展
6萬字的情書
矩陣
矩陣
中宁县| 武隆县| 舒城县| 东阿县| 乐清市| 兴海县| 获嘉县| 栾城县| 永顺县| 新绛县| 皋兰县| 双城市| 临颍县| 永年县| 胶南市| 平塘县| 错那县| 阿瓦提县| 上林县| 隆德县| 五家渠市| 盱眙县| 铜鼓县| 凤台县| 山阴县| 肃宁县| 德令哈市| 黔东| 富顺县| 南昌市| 滦平县| 若尔盖县| 宁陵县| 黔东| 芜湖市| 夹江县| 和硕县| 翼城县| 丹阳市| 灯塔市| 新乐市|