国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種古籍漢字圖像的多屬性模糊檢索模型

2020-12-28 02:24:48齊艷媚田學(xué)東張充李亞康
關(guān)鍵詞:查準(zhǔn)率角點(diǎn)古籍

齊艷媚,田學(xué)東,張充,李亞康

(1. 河北大學(xué) 網(wǎng)絡(luò)空間安全與計(jì)算機(jī)學(xué)院,河北 保定 071002;2. 河北大學(xué)附屬醫(yī)院 信息中心,河北 保定 071000)

漢語言文字研究的深入帶來了對(duì)文獻(xiàn)數(shù)字化、信息化處理的更高要求.古籍漢字多為結(jié)構(gòu)復(fù)雜、書寫風(fēng)格多樣的繁體字,加之年代久遠(yuǎn)對(duì)字形存在形態(tài)所帶來的影響,如噪聲和斷筆等情況,導(dǎo)致傳統(tǒng)的基于內(nèi)容的圖像檢索技術(shù)和文字識(shí)別技術(shù)在對(duì)古籍漢字圖像進(jìn)行檢索時(shí),難以取得理想的結(jié)果.因此,根據(jù)古籍漢字的特點(diǎn),研究、提取有效的古籍漢字圖像特征并建立相應(yīng)的匹配算法,是古籍漢字圖像檢索研究中的重點(diǎn)和難點(diǎn).

近年來,針對(duì)古籍漢字圖像檢索的研究相對(duì)較少,可供參考的主要有脫機(jī)手寫漢字圖像的檢索與識(shí)別方法.張睿[1]和姜文[2]等介紹了方向線素法,通過抽取漢字輪廓,考察像素點(diǎn)的8鄰域內(nèi)像素在0°、±45°、90°4個(gè)方向上的分布情況,雖然方向線素特征同時(shí)兼顧了統(tǒng)計(jì)特征和結(jié)構(gòu)特征的優(yōu)勢(shì),但其維數(shù)較多增加了識(shí)別難度.冉耕等[3]介紹了一種彈性網(wǎng)格法,利用彈性網(wǎng)格對(duì)圖像進(jìn)行分塊,獲取彈性網(wǎng)格特征,能較好地反映漢字的結(jié)構(gòu)細(xì)節(jié)和字符特征,克服手寫漢字由于書寫風(fēng)格多樣造成的字體變形和數(shù)據(jù)采集造成的樣本變形等問題.

除了傳統(tǒng)特征提取方法,卷積神經(jīng)網(wǎng)絡(luò)也被引入到漢字識(shí)別領(lǐng)域中來.毛曉波等[4]提出一種新的卷積結(jié)構(gòu),將當(dāng)前層與前一層特征圖疊加,用于對(duì)脫機(jī)手寫漢字的識(shí)別,不但減少了參數(shù)數(shù)量,對(duì)梯度消失的問題也有所緩解.劉虹等[5]提出將余弦相關(guān)性加入卷積神經(jīng)網(wǎng)絡(luò)的算法,使卷積神經(jīng)網(wǎng)絡(luò)的特征提取能力增強(qiáng),能夠在惡劣環(huán)境下達(dá)到較高的識(shí)別效率,增強(qiáng)了網(wǎng)絡(luò)結(jié)構(gòu)的模式檢測(cè)能力,獲得了更快的收斂速度.郭利敏等[6]利用卷積神經(jīng)網(wǎng)絡(luò)的分類問題替代古籍漢字識(shí)別問題,通過深度學(xué)習(xí)構(gòu)建分類器,用于漢字圖像與漢字字符的分類,進(jìn)而提升古籍漢字的識(shí)別率.

由于手寫漢字大多存在字體復(fù)雜多變、風(fēng)格多樣等問題,因此,在漢字圖像檢索時(shí)引入了模糊特征理論.Zhou等[7]針對(duì)筆觸的交集和交集之類的含糊區(qū)域會(huì)給手寫漢字的筆畫提取帶來困難的問題,設(shè)計(jì)了一種借助模糊區(qū)域信息來進(jìn)行漢字筆畫提取的方法,首先獲取漢字骨骼上模糊區(qū)域的筆畫子段間的連接系數(shù),然后修改骨骼上的變形,檢測(cè)突然的轉(zhuǎn)折點(diǎn),獲得最終行程:該方法提取的筆畫保持良好的形狀,能正確反映筆畫之間的位置關(guān)系,可用于手寫漢字的相關(guān)研究.魏瑋等[8]提出了一種模糊雙彈性網(wǎng)格的特征提取方法,在特征提取時(shí)加入了模糊特征和雙彈性網(wǎng)格劃分,能夠更有效地提取漢字“撇”和“捺”方向的特征.Mapari等[9]針對(duì)手寫化學(xué)結(jié)構(gòu)或符號(hào)難以被有效識(shí)別的問題,提出了一種基于模糊規(guī)則和SOM(self organization map)的模型,在進(jìn)行模糊圖像分割時(shí)運(yùn)用低模糊規(guī)則和高模糊規(guī)則方法,提高了手寫體化學(xué)符號(hào)和結(jié)構(gòu)的識(shí)別率.柴彥立[10]在模糊特征基礎(chǔ)上引入猶豫模糊集理論,融合結(jié)構(gòu)與統(tǒng)計(jì)特征,提出一種面向古籍漢字圖像檢索的猶豫模糊特征提取算法,提升了古籍漢字圖像的檢索查全率和查準(zhǔn)率.

由于古籍漢字具有結(jié)構(gòu)繁雜多變、筆畫風(fēng)格多樣、年代久遠(yuǎn)等特點(diǎn),導(dǎo)致上述方法在處理古籍漢字圖像檢索時(shí)難以取得理想效果.鑒于模糊集理論的單一隸屬度導(dǎo)致其無法完整有效地處理古籍漢字在筆畫以及結(jié)構(gòu)特征方面的信息,本文在對(duì)古籍漢字圖像檢索時(shí)引入猶豫模糊集理論[11],利用其在處理多隸屬度方面的優(yōu)勢(shì),來適應(yīng)古籍漢字風(fēng)格多樣、結(jié)構(gòu)多變的特點(diǎn),充分考慮漢字筆畫和角點(diǎn)的構(gòu)成特征,從多角度出發(fā),建立融合古籍漢字圖像筆畫特征和角點(diǎn)特征的多屬性模糊檢索模型,更好地滿足古籍漢字研究過程中專家對(duì)古籍漢字圖像檢索的實(shí)際需求.

1 古籍漢字圖像的特征分析

1.1 古籍漢字圖像的角點(diǎn)特征分析

1.2 古籍漢字圖像的彈性網(wǎng)格劃分

1.交叉點(diǎn);2.端點(diǎn);3.拐點(diǎn).圖1 古籍漢字圖像的角點(diǎn)特征Fig.1 Corner feature map of ancient Chinese character images

a.縱橫彈性網(wǎng)格劃分;b.規(guī)范化對(duì)角彈性網(wǎng)格劃分.圖2 古籍漢字圖像的重疊規(guī)范化雙彈性網(wǎng)格劃分Fig.2 Overlapping normalized bi-elastic mesh division diagram

1.3 古籍漢字圖像的筆畫方向分解

漢字大多由“橫”、“豎”、“撇”、“捺”4種筆畫組成,因此,漢字的基本特征可以用這4種筆畫進(jìn)行有效地表示.F(x,y)表示細(xì)化后的二值圖像,對(duì)漢字細(xì)化后采用“OR”[12]技術(shù)進(jìn)行分解的規(guī)則如表1所示.

表1 漢字筆畫分解規(guī)則

2 古籍漢字圖像的相似度評(píng)價(jià)

本文引入猶豫模糊集理論,利用其在處理多隸屬度決策方面的優(yōu)勢(shì),從古籍漢字圖像的多角度屬性出發(fā),完成古籍漢字圖像間的匹配檢索.

2.1 猶豫模糊集

猶豫模糊集[11]是由Torra對(duì)模糊集[13]進(jìn)行推廣而提出的新理論,設(shè)U是一個(gè)非空集合,則稱

F={∶x∈U}

(1)

為U上的猶豫模糊集,hF(x)表示[0,1]上的非空集合,是x∈U對(duì)集合F的多個(gè)可能隸屬度的集合,猶豫模糊集中隸屬度是若干可能值的集合,而不是一個(gè)確定的值或者分布[11].

文獻(xiàn)[14]在進(jìn)行距離測(cè)度計(jì)算時(shí)考慮到了權(quán)重的影響,根據(jù)評(píng)價(jià)對(duì)象屬性的重要程度,在加權(quán)平均算子的基礎(chǔ)上,給出了猶豫模糊加權(quán)距離測(cè)度的計(jì)算公式.

(2)

2.2 古籍漢字圖像相似度評(píng)價(jià)屬性

定義2設(shè)Ir表示輸入的古籍漢字圖像,Irj表示數(shù)據(jù)集中任一古籍漢字圖像(j= 1, 2, 3, …,m.m為數(shù)據(jù)集中古籍漢字圖像的總數(shù)).

2.2.1 筆畫屬性

下面以在規(guī)范化對(duì)角雙彈性網(wǎng)格下對(duì)“橫”筆畫子圖的特征分析為例,給出在縱橫彈性網(wǎng)格下的“橫”筆畫像素對(duì)應(yīng)的隸屬度函數(shù)的定義,并求出在當(dāng)前網(wǎng)格下的隸屬度值.

1)數(shù)量特征

定義3“橫”筆畫像素的數(shù)量特征隸屬度函數(shù)為

(3)

其中tolH表示“橫”筆畫子圖中“橫”筆畫像素的總數(shù).分別計(jì)算Gi內(nèi)(k=H、S、P、N)(分別表示“橫”“豎”“撇”“捺”像素)的隸屬度,加權(quán)平均即為當(dāng)前網(wǎng)格在筆畫數(shù)量特征下的隸屬度值.

2)位置特征

利用Gi內(nèi)的筆畫像素與其周圍網(wǎng)格的相交情況,作為評(píng)估2幅古籍漢字圖像相似程度的標(biāo)準(zhǔn).如果網(wǎng)格Gi內(nèi)的所有筆畫均不存在與周圍網(wǎng)格相交的情況,則筆畫像素在Gi內(nèi)的位置特征對(duì)應(yīng)的隸屬度值為1.

橫筆畫像素在縱橫彈性網(wǎng)格下的位置特征圖如圖3a所示,Gi內(nèi)筆畫1和筆畫2皆與周圍網(wǎng)格有相交情況,筆畫3與任何網(wǎng)格均無相交情況,因此橫筆畫像素在Gi內(nèi)的位置特征對(duì)應(yīng)隸屬度值為(m1+m2+l3)/(l1+l2+l3).

橫筆畫像素在規(guī)范化對(duì)角彈性網(wǎng)格下的位置特征圖如圖3b所示,Gi內(nèi)的所有筆畫皆與鄰接網(wǎng)格有相交情況,因此橫筆畫像素在Gi內(nèi)的位置特征對(duì)應(yīng)隸屬度值為(m1+m2+m3)/(l1+l2+l3).如果2幅圖像在網(wǎng)格Gi內(nèi)所有筆畫像素點(diǎn)與同本網(wǎng)格有交叉的所有筆畫長度總和的比值越接近,說明它們的相似程度越大.

定義4“橫”筆畫像素的位置特征隸屬度函數(shù)為

(4)

3)距離特征

將Gi內(nèi)筆畫像素到鄰近網(wǎng)格的最短距離作為評(píng)估不同古籍漢字圖像間相似程度的標(biāo)準(zhǔn).

a.縱橫彈性網(wǎng)格;b.規(guī)范化對(duì)角彈性網(wǎng)格.圖3 彈性網(wǎng)格下“橫”筆畫像素的位置特征Fig.3 Location feature map of “horizontal” stroke pixels under elastic grid

a.縱橫彈性網(wǎng)格;b.規(guī)范化對(duì)角彈性網(wǎng)格.圖4 彈性網(wǎng)格下的“橫”筆畫像素的距離特征Fig.4 Distance feature map of “horizontal” stroke pixels under elastic grid

定義5“橫”筆畫像素的距離特征隸屬度函數(shù)為

(5)

2.2.2 角點(diǎn)屬性

組成漢字的元素除了筆畫外,角點(diǎn)也占了很高的比重,古籍漢字的結(jié)構(gòu)信息能夠通過角點(diǎn)得到很好的展現(xiàn),因此本文將漢字筆畫的交叉點(diǎn)、拐點(diǎn)、端點(diǎn)在漢字圖像中的數(shù)量分布以及位置信息作為古籍漢字的角點(diǎn)特征.

1)角點(diǎn)距離特征

定義6角點(diǎn)的距離特征隸屬度函數(shù)定義為

(6)

2)角點(diǎn)分布特征

a.縱橫彈性網(wǎng)格;b.規(guī)范化對(duì)角彈性網(wǎng)格.圖5 彈性網(wǎng)格下的古籍漢字圖像角點(diǎn)距離特征圖Fig.5 Corner distance feature map of ancient Chinese character images based on elastic grid

a.縱橫彈性網(wǎng)格;b.規(guī)范化對(duì)角彈性網(wǎng)格.圖6 彈性網(wǎng)格下的古籍漢字圖像角點(diǎn)分布圖Fig.6 Distribution characteristics of corner points in ancient Chinese character images under elastic grid

定義7角點(diǎn)的分布特征隸屬度函數(shù)定義為

(7)

2.3 基于猶豫模糊集的古籍漢字圖像檢索

對(duì)古籍漢字圖像Ir和Irj經(jīng)過多隸屬度評(píng)價(jià)后,形成猶豫模糊集合fr和frj,其中f由隸屬度集合Ufn、Ufp、Ufd、UfT_J、UfT_F構(gòu)成,任一評(píng)價(jià)屬性Ew(w=1,2),w=1和2分別表示筆畫屬性和角點(diǎn)屬性,猶豫模糊集合對(duì)應(yīng)的猶豫模糊元素集合為hfr和hfrj,hfr和hfrj中元素為Ir和Irj在屬性Ew包含的各個(gè)特征下的隸屬度值的集合,利用猶豫加權(quán)測(cè)度公式進(jìn)行處理,如式(8)~(10)所示.

(8)

(9)

sim(Ir,Irj)=1-d(Ir,Irj),

(10)

(11)

(12)

.

(13)

3 實(shí)驗(yàn)結(jié)果及分析

3.1 數(shù)據(jù)集介紹

為了驗(yàn)證古籍漢字圖像的多屬性模糊檢索方法的有效性,本文從已實(shí)現(xiàn)數(shù)字化的四庫全書文淵閣中的經(jīng)、史、子、集中共選取92幅版面圖像,對(duì)其切分獲得11 574幅單字圖像作為古籍漢字圖像檢索的實(shí)驗(yàn)樣張,采用13位編碼進(jìn)行標(biāo)注,如表2所示(例如:GJHZ_0000030011012表示文淵閣經(jīng)部第0003冊(cè)001頁下第012個(gè)單字圖像).

將數(shù)據(jù)集中所有單字圖像按字形結(jié)構(gòu)劃分為左右結(jié)構(gòu)(A)、上下結(jié)構(gòu)(B)、獨(dú)體結(jié)構(gòu)(C)、包圍結(jié)構(gòu)(D)4大類,部分實(shí)驗(yàn)樣張如表3所示.

表2 古籍漢字圖像數(shù)據(jù)集編碼格式

表3 古籍漢字圖像檢索實(shí)驗(yàn)樣張

3.2 隸屬度函數(shù)中的參數(shù)設(shè)置

為了確定公式(7)中的權(quán)重系數(shù)α和β,歸納總結(jié)11 574幅單字圖像在每個(gè)彈性網(wǎng)格和其八鄰域情況下的角點(diǎn)分布對(duì)檢索結(jié)果的影響程度,得出α的值為0.465,β的值為1.625.

為了分析古籍漢字圖像的多屬性模糊檢索方法的有效性,選擇查全率和查準(zhǔn)率對(duì)圖像的檢索結(jié)果進(jìn)行評(píng)價(jià).

定義8查全率(recall rate,簡稱R),表示檢索結(jié)果中與輸入圖像相似的圖像數(shù)量NS占數(shù)據(jù)集中所有相似圖像數(shù)量NT的百分?jǐn)?shù).

(14)

定義9查準(zhǔn)率(precision ratio,簡稱P),表示檢索結(jié)果中與輸入圖像相似的圖像數(shù)量NS占全部檢索結(jié)果圖像數(shù)量NR的百分?jǐn)?shù).

(15)

3.3 古籍漢字圖像檢索性能分析

通過歸納重疊規(guī)范化雙彈性網(wǎng)格下古籍漢字圖像的筆畫屬性和角點(diǎn)屬性的猶豫模糊集合,從多角度出發(fā)考察古籍漢字特征,同時(shí)引入猶豫模糊加權(quán)距離測(cè)度,考慮了不同屬性所占比重不同的問題.為了驗(yàn)證本文方法的可行性,構(gòu)造傳統(tǒng)特征提取算法中的基于重疊規(guī)范化雙彈性網(wǎng)格的梯度特征提取方法[3]作為對(duì)比算法1,基于手寫體漢字雙彈性網(wǎng)格模糊特征算法[8]作為對(duì)比算法2;構(gòu)造卷積神經(jīng)網(wǎng)絡(luò)類檢索算法中的基于卷積神經(jīng)網(wǎng)絡(luò)的古籍漢字識(shí)別算法[6]作為對(duì)比算法3,結(jié)合余弦相關(guān)性的卷積網(wǎng)絡(luò)識(shí)別漢字的算法[5]作為對(duì)比算法4,對(duì)其網(wǎng)絡(luò)模型稍作修改,使其能更加適用于古籍漢字圖像檢索.

設(shè)NS為與待檢索圖像相似度高于某一閾值T/%時(shí)檢索出的圖像數(shù)量;NR為檢索出的所有圖像的數(shù)量.以常見的左右結(jié)構(gòu)圖像“”(編碼為GJHZ_0000010100161)為例,根據(jù)查準(zhǔn)率計(jì)算法則(例如,當(dāng)閾值設(shè)置為90%時(shí),其輸出圖片數(shù)量為11,其中相似圖片為9幅,則查準(zhǔn)率為9/11=0.818)計(jì)算相應(yīng)的P(查準(zhǔn)率)值,如表4所示.

表4 本文與模擬實(shí)驗(yàn)算法在不同閾值下的參數(shù)統(tǒng)計(jì)結(jié)果

從表4可知,相比傳統(tǒng)檢索類算法中的梯度特征(算法1)和模糊特征(算法2)方法,本文方法在面對(duì)古籍漢字圖像檢索時(shí)能達(dá)到更高的查準(zhǔn)率和查全率,這是由于本文利用猶豫模糊集理論在處理多屬性決策方面的優(yōu)勢(shì),從多角度出發(fā)提取古籍漢字圖像的特征,定義相應(yīng)的隸屬度函數(shù),并且通過相應(yīng)權(quán)重更新算法考察了不同特征所占比重不同的問題,更加適用于古籍漢字圖像檢索;在不同閾值下本文方法與卷積神經(jīng)網(wǎng)絡(luò)類方法的查準(zhǔn)率基本保持在80%左右,當(dāng)閾值T為85%和80%時(shí)本文方法略顯優(yōu)勢(shì),但是在其他情況下出現(xiàn)了本文參數(shù)略低于模擬系統(tǒng)的情況,這是由于古籍漢字圖像大多結(jié)構(gòu)繁雜多變、存在狀態(tài)較差等因素,導(dǎo)致本文算法在對(duì)古籍漢字圖像進(jìn)行特征提取時(shí)較卷積類算法略顯劣勢(shì),造成了本文算法的查準(zhǔn)率出現(xiàn)略低于模擬系統(tǒng)的情況.但是,總體來說本文方法在對(duì)古籍漢字圖像檢索時(shí),能夠取得較好的效果.

為進(jìn)一步驗(yàn)證本文實(shí)驗(yàn)的有效性,考察本文算法與模擬實(shí)驗(yàn)算法在不同漢字字形結(jié)構(gòu)下的查全率與查準(zhǔn)率間的差異.不同字形結(jié)構(gòu)下的查全率和查準(zhǔn)率的值由組內(nèi)全部圖像(20幅圖像)的平均值得出,幾種方法的平均查全率和平均查準(zhǔn)率對(duì)比結(jié)果如表5所示.

表5 本文與模擬實(shí)驗(yàn)算法在不同字形結(jié)構(gòu)下的檢索結(jié)果對(duì)比

表5中的平均查全率和平均查準(zhǔn)率表示了整個(gè)測(cè)試數(shù)據(jù)集的最終評(píng)價(jià)值,由表4可知,無論在何種情況下,本文算法的查全率、查準(zhǔn)率均高于算法1和算法2 兩種傳統(tǒng)檢索類算法;本文算法的平均查全率分別比算法3和算法4高0.1%和0.1%,平均查準(zhǔn)率比算法3低了0.1%,比算法4高了0.1%.在類別B和類別C下算法3的查準(zhǔn)率略高于本文算法,類別C下算法3的查全率略高于本文算法,這是由于在進(jìn)行特征提取時(shí),基于猶豫模糊集的圖像檢索算法與基于卷積的圖像檢索算法的側(cè)重點(diǎn)不同,導(dǎo)致了在面對(duì)古籍圖像書寫質(zhì)量較差以及紙張破損嚴(yán)重等問題時(shí),本文算法的查準(zhǔn)率和查全率存在略低于對(duì)比算法的情況.綜合實(shí)驗(yàn)結(jié)果,本文算法的總體效果基本達(dá)到了預(yù)期目標(biāo).

3.4 古籍漢字圖像檢索結(jié)果分析

a.本文檢索結(jié)果top10;b.算法1檢索結(jié)果top10;c.算法2檢索結(jié)果top10; d.算法3檢索結(jié)果top10;e.算法4檢索結(jié)果top10.圖7 古籍漢字圖像檢索結(jié)果Fig.7 Image retrieval results of ancient Chinese characters

圖8 5種算法檢索時(shí)間對(duì)比Fig.8 Five algorithms retrieve time comparison

由圖7可知,5種算法檢索結(jié)果前8張圖像均與目標(biāo)圖像有較高的相似度,且圖7a中的后2張圖像相似度明顯高于圖7b和圖7c,說明本文古籍漢字圖像的多屬性模糊檢索算法能達(dá)到相對(duì)較好的檢索效果.

3.5 古籍漢字圖像檢索速度分析

對(duì)算法運(yùn)行時(shí)間進(jìn)行統(tǒng)計(jì),結(jié)果如圖8所示.由圖8可知,雖然由于本文引入猶豫模糊集理論,從多角度出發(fā)進(jìn)行圖像檢索相似度的計(jì)算,造成了時(shí)間復(fù)雜度略高于算法1和算法2的結(jié)果,但在可接受范圍之內(nèi);本文方法運(yùn)行時(shí)間明顯優(yōu)于算法3和算法4 2種卷積神經(jīng)網(wǎng)絡(luò)類方法,原因是卷積神經(jīng)網(wǎng)絡(luò)在對(duì)圖像進(jìn)行檢索時(shí)需要提取自適應(yīng)特征并不斷訓(xùn)練數(shù)據(jù)集圖像,導(dǎo)致其運(yùn)行時(shí)間較長.

綜上所述,本文算法在運(yùn)行速度上相比傳統(tǒng)特征提取算法雖有一定劣勢(shì),但是由3.3可知本文算法在查全率和查準(zhǔn)率上均有一定程度的提高;此外,從3.3和3.4可以看出本文方法與卷積神經(jīng)網(wǎng)絡(luò)類特征提取算法在檢索準(zhǔn)確率和檢索結(jié)果上無明顯差異.雖然卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)手寫漢字識(shí)別與檢索能夠達(dá)到較好的效果,但其無法滿足漢字研究專家需要實(shí)時(shí)獲得古籍漢字研究時(shí)出現(xiàn)的新字形的需求,且卷積神經(jīng)網(wǎng)絡(luò)不僅需要高配置的硬件,還需要搭建復(fù)雜的網(wǎng)絡(luò)模型,因此,在查全率、查準(zhǔn)率無明顯差異的情況下,本文算法更加適用于古籍漢字圖像檢索.

4 結(jié)束語

古籍漢字圖像檢索是輔助古籍漢字研究的重要手段,為了更好地滿足古籍漢字研究的需求,本文采用融合結(jié)構(gòu)與統(tǒng)計(jì)特征的圖像檢索,設(shè)計(jì)了一種多屬性模糊的古籍漢字圖像檢索方法.首先提取漢字圖像的筆畫和角點(diǎn)等多特征信息,存入特征數(shù)據(jù)庫;然后利用猶豫模糊加權(quán)距離測(cè)度公式計(jì)算圖像間的距離測(cè)度,并按相似度進(jìn)行初步排序,得到最終檢索結(jié)果.實(shí)驗(yàn)結(jié)果表明,所提出的算法在對(duì)古籍漢字圖像檢索中取得了較好的效果.

鑒于古籍漢字結(jié)構(gòu)多變、風(fēng)格多樣的特點(diǎn),本文方法還有很多有待改進(jìn)之處.首先,需進(jìn)一步完善權(quán)重模型,使其能更加適用于古籍漢字圖像檢索;其次,隸屬度函數(shù)的定義和相應(yīng)評(píng)價(jià)屬性的選擇需要優(yōu)化,通過建立更加適合古籍漢字的特征索引來減小時(shí)間復(fù)雜度,進(jìn)一步提高檢索系統(tǒng)性能.

猜你喜歡
查準(zhǔn)率角點(diǎn)古籍
中醫(yī)古籍“疒”部俗字考辨舉隅
關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
天一閣文叢(2020年0期)2020-11-05 08:28:06
關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
天一閣文叢(2018年0期)2018-11-29 07:48:08
基于FAST角點(diǎn)檢測(cè)算法上對(duì)Y型與X型角點(diǎn)的檢測(cè)
大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
我是古籍修復(fù)師
金橋(2017年5期)2017-07-05 08:14:41
基于深度特征分析的雙線性圖像相似度匹配算法
基于邊緣的角點(diǎn)分類和描述算法
電子科技(2016年12期)2016-12-26 02:25:49
基于圓環(huán)模板的改進(jìn)Harris角點(diǎn)檢測(cè)算法
基于Harris角點(diǎn)和質(zhì)量評(píng)價(jià)的圖像篡改檢測(cè)
连云港市| 龙岩市| 虎林市| 柳州市| 上林县| 西平县| 浮山县| 鄯善县| 广宁县| 杭州市| 保山市| 锦州市| 光山县| 台中县| 通州市| 南雄市| 凌云县| 合作市| 灯塔市| 东山县| 南昌县| 宕昌县| 景宁| 盐津县| 阳西县| 洞头县| 清苑县| 铁岭县| 山西省| 天水市| 凉山| 佛山市| 昔阳县| 淮滨县| 平谷区| 固镇县| 内江市| 阿尔山市| 成都市| 定边县| 平安县|