国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)字圖像處理的字跡識別技術(shù)

2019-10-11 01:38:20陳錦玉
電子制作 2019年18期
關(guān)鍵詞:傅立葉字跡端點

陳錦玉

(北京市第四中學(xué),北京,100043)

0 引言

字跡識別是對人通過落筆形成的字跡進行鑒別和分析的活動,也叫筆跡鑒定[1]。不論年齡大小,在一定時間內(nèi),人的書寫習(xí)慣都會具有一定的特征性和穩(wěn)定性,并反映在字跡中。通過對筆跡的觀察和分析,可以分辨出文件中的字跡來自于幾個人,是否是本人所寫,利用筆跡進行一個人身份的認(rèn)定,查證文件的真?zhèn)?。在一般鑒定中,要先了解案件的大致情況,明確鑒定的要求;再觀察分析筆跡有無異樣,有無偽裝或因為其他原因而導(dǎo)致的字跡問題;然后要選擇能反映出本人書寫的穩(wěn)定的習(xí)慣的特征;最后,將選材中的特征和樣本中提取出的特征進行比較,找出相同點和問題點并制做鑒定書,提出問題點形成原因的綜合評斷并提出意見[2]。

字跡識別作為人們的另一種身份證明,應(yīng)用廣泛,每年約幾萬個案件涉及字跡識別技術(shù),在生活中也常用到[3]。但相對于人臉識別、指紋識別等,字跡識別技術(shù)的發(fā)展和應(yīng)用并沒有受到太多重視[4],無論是在刑事案件上還是民事訴訟上,一旦需要字跡鑒定都只能到司法機關(guān)鑒定,且需要一年的時間才能出鑒定結(jié)果。過程之長增加了很多問題的復(fù)雜度。本文將利用計算機代替人工鑒定,使字跡識別過程更快更準(zhǔn)確。

因為現(xiàn)階段大部分字跡識別還仍靠字跡專家觀察鑒定,于是就存在字跡識別的主觀臆斷、人才短缺、酬金過高、申請流程復(fù)雜、分析時間過長等問題。專家鑒定這種人為觀察判斷很容易受主觀心理的影響而使分析結(jié)果有一定的偏差,而現(xiàn)階段國內(nèi)字跡專家人數(shù)相對較少,不能保證技術(shù)的全覆蓋和便利性,這一點對民眾來說也是極大的困擾。如,很多人因為借款方不承認(rèn)欠條上的簽名是自己簽的而拿不回應(yīng)得的借款,若他們拿欠條去做鑒定,更是需要長達一年的時間才能得到結(jié)果,很多人因此放棄打官司,使不法分子逍遙法外,而為了保證質(zhì)量,人工鑒別必須需要大量重復(fù)性工作來驗證結(jié)論。而如今隨著計算機技術(shù)的迅速發(fā)展,特別是圖像處理技術(shù)的日益成熟,為字跡識別與鑒定提供了條件良好的基礎(chǔ)。

結(jié)合上述問題,通過了解和研究后,本文考慮到可以用圖像處理的方式來解決這個問題,這樣就能夠極大地解決在字跡識別方面出現(xiàn)的很多問題?,F(xiàn)階段對于基于圖像處理的字跡識別技術(shù)方面的研究相對較少,大多數(shù)是從整體到局部分析筆畫間的結(jié)構(gòu),用紋理分析法獲得全局特征,從特征字的比較提取局部特征的方法,把整體和局部特征進行整合綜合決策。本文也將運用圖像預(yù)處理法,結(jié)合構(gòu)建大數(shù)據(jù)數(shù)據(jù)庫的方法,通過筆記采集的方式采集樣本,提供后臺的數(shù)據(jù)支持。在后續(xù)的技術(shù)完善中,我們構(gòu)想將這些技術(shù)編入APP 或設(shè)備中,直接通過設(shè)備拍攝圖像,直接鑒別,做到速度更快,成本更低。

基于圖像預(yù)處理的字跡識別技術(shù)將一定程度上解決國內(nèi)字跡識別主觀臆斷、專家短缺和流程復(fù)雜的問題,極大地便利了各地警方破案的效率。同時,在民事訴訟方面,如在借條、合同造假等問題的分析和解決上更是提供了捷徑,加快了法律流程的速度,使人民積極參與法律活動,更便利快捷和有效地維護自身利益。本文運用大數(shù)據(jù)分析法,通過筆記采集的方式,利用計算機更快捷有效地解決問題。在此之后,我們可以構(gòu)建全國字跡大數(shù)據(jù)數(shù)據(jù)庫,錄入每個人的字跡,使之成為繼臉部識別、指紋識別后,又一個認(rèn)證身份的有力證據(jù)。

1 圖像預(yù)處理

1.1 圖像拍攝與灰度化

由于獲取圖像的工具或手段的影響,最開始得到的圖像會受到多種條件的限制和不同的干擾,一般不能直接使用,必須要在視覺信息處理的早期階段對原始圖像進行灰度化處理、二值化處理等的矯正,使矯正后的圖像選擇性地體現(xiàn)原始圖像上的信息,濾掉影響因素,增強某些對于往后的處理中比較重要的圖像特征。因此圖像預(yù)處理就顯得尤為重要,本文也將先運用灰度化、二值化的方法對圖片進行初步處理。

灰度化處理是指,使具有色彩的圖像轉(zhuǎn)化成灰度圖像的過程。在彩色圖像中,每一個像素的色彩都取決于R、G、B 三個分量,其中,每個分量都另有255 個中值可以取到,這樣處理后,每個像素點就有255*255*255 種變化范圍變化色彩?;叶葓D像就是由相同的這三個分量組成的一種特殊的圖像,其中,像素點的變化范圍就有255 種。雖然灰度化后的圖像在原圖的基礎(chǔ)上改變了大部分的色彩,但它同樣可以反映圖像整體和局部的色度和亮度等級的分布特征。因為R、G、B 三個分量代表的是彩色值,我們需要將它們轉(zhuǎn)化成灰白圖像。這里,我們采用RGB 和HIS 的轉(zhuǎn)換,在算法中,HIS 和RGB 的轉(zhuǎn)換公式如下:

在公式(1)中采用了加權(quán)平均法進行灰度化。

灰度化處理圖片的方法有很多:①分量法(做三個灰度圖像,灰度值分別選取原圖中的三個分量的亮度,再根據(jù)需要選一幅圖像)。②最大值法(灰度值采用三個分量中亮度的最大值)。③平均值法(灰度值采用三個分量亮度的平均值)。④加權(quán)平均法(灰度值選取三個分量亮度的加權(quán)平均)。本文運用第三種平均值法,希望能快速簡易并合理地處理圖像,并結(jié)合灰度拉伸技術(shù),使圖像的細節(jié)更加突出。

圖像二值化(Image Binarization)指將整個圖像呈現(xiàn)出明顯的黑白效果的過程,也就是將圖像上的像素點的灰度值設(shè)置為0 或255。經(jīng)過二值化處理過后的圖像在關(guān)于字跡識別的圖像處理中同樣地位重要,經(jīng)過二值化處理后,圖像中的數(shù)據(jù)量大幅度降低,因此,處理后的圖像輪廓更鮮明。

1.2 圖像的濾波去噪

對于經(jīng)過灰度化和二值化處理后的圖像,為了減少圖像灰度的尖銳變化,減小噪聲,在字跡識別的圖像處理過程中,圖像的濾波去噪技術(shù)同樣是一個重要的步驟。通過圖像的濾波去噪,可以更便于觀察。如今圖像濾波去噪有很多途徑值得參考:運用均值濾波器、中值濾波器、最大值濾波器、最小值濾波器。通過對比可以發(fā)現(xiàn):最大值濾波器和最小值濾波器都存在一定程度上忽略細節(jié)的問題,最大值濾波器使圖片過亮,最小值濾波器使圖像更暗,兩者都造成了很大程度上的失真,而對于均值濾波器來說更是存在邊緣模糊的問題。這些問題看似很小,但在字跡識別,一個比較注重細節(jié)的問題上卻會造成很大的影響。對比下來,用中值濾波器進行濾波去噪雖然也存在忽略細節(jié)的問題,相對于這兩種算法,中值濾波器忽略的細節(jié)會相對少一點,失真也沒有那么嚴(yán)重。同時中值濾波器在邊緣上也比均值濾波器清晰。于是,通過對比,本文將運用中值濾波器來處理字跡圖像。中值濾波器的原理就是將各個顏色點排序,在一個特定的范圍中取中值,使這個特定范圍中的顏色點都和中值顏色一樣。在中值濾波器中,有3*3、5*5、9*9、15*15、35*35 的處理,為了減少圖像模糊的問題,我們選用3*3 的處理方法。

1.3 圖像的歸一化

圖像歸一化,顧名思義,就是將圖像的格式統(tǒng)一,讓它轉(zhuǎn)換成有一固定標(biāo)準(zhǔn)形式的圖片的過程,而這種處理后的圖像就被稱作是歸一化的圖像。最開始的圖像在經(jīng)過了幾步特殊的處理后就能成為副本圖像,而標(biāo)準(zhǔn)圖像就是由這些圖像經(jīng)過相同參數(shù)的圖像歸一化處理后得到的。

在字跡識別方面,我們需要應(yīng)用圖像歸一化來調(diào)整字跡和字跡之間的間距和行距,使字跡看起來更工整,也更方便對字跡進行特征的提取和對比。

2 字跡特征提取識別

2.1 建立字跡數(shù)據(jù)庫

為提取字跡特征,首先需要用建立數(shù)據(jù)庫對各種已知出處的筆跡進行歸納整理。本文事先采集了五十個不同出處的字跡原件,形成一個小型數(shù)據(jù)庫。為了更方便更快捷地從數(shù)據(jù)庫中找到對應(yīng)的字跡,在處理時我們會先將數(shù)據(jù)庫中的字跡原件進行先一步分類,提高處理效率。

首先通過整體紋理,再通過漢字局部識別。在實驗中,選取了50 個不同的字跡,建數(shù)據(jù)庫,從中隨機選取一個作為待識別的字跡。對于字跡紋理識別,我們選用分類的方法,在處理前將收集到的字跡分成三類:左傾、右傾、豎直。經(jīng)過紋理識別后可提前獲知被分配的類別以減少后續(xù)工作量。

傅立葉變換也稱傅氏變換,是一種常用的信號分析方法,它可以分析信號的成分,也可以用來合成信號,傅立葉變換選用了正弦波作為信號的成分。傅立葉變換在概率學(xué)、聲學(xué)、海洋學(xué)、密碼學(xué)、結(jié)構(gòu)動力學(xué)等領(lǐng)域都有著廣泛的作用,甚至可以將一首曲譜用波的形式來表示。

通過傅立葉公式,將圖像信號變成頻率信號,再處理后得到p 值。它的大小及方向能體現(xiàn)紋理的大小與粗細,體現(xiàn)圖像的排列規(guī)律。在頻率域圖像分析法中,用傅立葉特征來分析圖像紋理是一種典型方法。研究者們經(jīng)常用研究譜成分的方法來研究它的物理意義。具體公式如下:

經(jīng)過傅立葉公式轉(zhuǎn)換后就能用二維圖像反應(yīng)空間中頻率的強度。得到的圖像就是轉(zhuǎn)換完的功率譜圖像。圖像中幅值的變化方向和圖像的紋理有一定的關(guān)系。字跡紋理粗的話,幅值就會比較大。圖像的鏡像值能體現(xiàn)紋理的方向。由此可知,得到的值在范圍內(nèi),值的大小和鏡像的值能分出粗細與方向。

傅立葉圖像轉(zhuǎn)化后可以根據(jù)圖譜建立坐標(biāo),以坐標(biāo)原點為0,粗紋在原點附近有較高的值,細紋的能量譜向周圍散開,坐標(biāo)軸范圍通常為(-N/2,N/2),顯出來即可分析紋理的粗細和方向。

通過傅立葉的方式衡量紋理,是字跡的初步識別,屬于整體分析。

2.2 字跡局部特征識別

從上文所述的50 種字跡中,本文任意挑選了一種字跡中的一個字和原來的50 個字作對比。步驟如下:

(1)調(diào)整圖像亮度、色度和飽和度,將50 幅圖像的背景統(tǒng)一起來。(2)調(diào)整圖像大小,統(tǒng)一格式,將圖像預(yù)處理。(3)將50 個字跡分成了三組:左傾、右傾、豎直。(4)將待測字體大致歸為一類或多類后,一對一的擬合。

首先通過整體紋理,再通過漢字局部識別。在實驗中,選取了50 個不同的字跡,建數(shù)據(jù)庫,從中隨機選取一個作為待識別的字跡。

對于擬合的方法我們選取了數(shù)待測字跡中端點、交叉點和拐點的個數(shù),看已知字跡中是否有字跡的三個數(shù)據(jù)完全一樣或相差一點。但在分析端點、交叉點和拐點之前,我們還需要做字跡骨架的優(yōu)化。

簡化后是端點提取。端點可以等效為交叉數(shù),一個黑色像素點的八鄰域,當(dāng)八鄰域中只有一組黑白像素交替的話,此黑點就是一個端點。我們設(shè)黑像素為(w,z),交叉點數(shù)為x,則x 的公式如下所示:

利用這個公式來判斷,當(dāng)x 為1 時為端點,x 等于3 時是交叉點。其中,nk為這個點的八個相鄰的點,nk∈{0,1},且n9=n1。在x=1 時,(w,z)就是一個端點。

交叉點與端點提取方法類似,而因為拐點的電腦計算十分復(fù)雜,本次采用了計數(shù)法。在算出端點、拐點和交叉點后,利用如下公式,計算相似度:

最終我們發(fā)現(xiàn),圖1(待測)和圖2 的相似度為百分之百,而圖1(待測)與圖3 的相似度為百分之七十。

圖3

最終我們得出結(jié)論:圖1 和圖2 是一個人寫的。

3 結(jié)論

本文通過對字跡進行預(yù)處理、圖像紋理識別、圖像局部特征識別的方法,實現(xiàn)了筆跡識別與判斷,可以解決字跡鑒別不夠客觀、分析時間長、操作不便利等問題,雖然在準(zhǔn)確性上還有待優(yōu)化,還無法做到百分之百的正確率,但用圖像預(yù)處理和建立數(shù)據(jù)庫的方法識別字跡能為以后智能化的字跡識別技術(shù)提供了參考的依據(jù)。希望我的努力,能為字跡識別走向智能化提供參考依據(jù)和解決辦法,更能為維護廣大人民群眾利益、提高法律實效性做出一定的貢獻。希望字跡識別不再成為法律鑒別里的一道鴻溝,而是作為無辜者建立最堅實的證據(jù)出現(xiàn)在法庭上,成為法網(wǎng)編織中不可或缺的、起指向性的重要一環(huán)。

猜你喜歡
傅立葉字跡端點
非特征端點條件下PM函數(shù)的迭代根
不同坐標(biāo)系下傅立葉變換性質(zhì)
三角函數(shù)的傅立葉變換推導(dǎo)公式
不等式求解過程中端點的確定
電力電纜非金屬外護套材料的傅立葉紅外光譜鑒別法
電線電纜(2018年6期)2019-01-08 02:45:36
基于傅立葉變換的CT系統(tǒng)參數(shù)標(biāo)定成像方法探究
智富時代(2018年7期)2018-09-03 03:47:26
字跡潦草
快樂語文(2017年33期)2017-12-06 09:21:01
參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點估計
基丁能雖匹配延拓法LMD端點效應(yīng)處理
筆跡不說謊
会理县| 张家口市| 平江县| 福安市| 运城市| 宜章县| 锡林郭勒盟| 东宁县| 施秉县| 阳曲县| 樟树市| 娄底市| 离岛区| 海兴县| 青阳县| 甘洛县| 河池市| 嘉黎县| 敦煌市| 司法| 仁布县| 连平县| 兴国县| 长海县| 和静县| 曲靖市| 郸城县| 广宗县| 聂荣县| 永定县| 新闻| 太和县| 凤山市| 云安县| 扎囊县| 伊宁市| 赣榆县| 兰考县| 卫辉市| 巴东县| 南京市|