国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于文本和內(nèi)容檢索的美術(shù)作品查詢系統(tǒng)

2012-09-20 05:31:12劉爽史萍
關(guān)鍵詞:直方圖邊緣檢索

劉爽,史萍

(中國(guó)傳媒大學(xué)信息工程學(xué)院,北京100024)

1 引言

隨著經(jīng)濟(jì)水平不斷提高,物質(zhì)資源逐漸豐富,人們開(kāi)始追求精神層面的享受。美術(shù)作為藝術(shù)的一種,能直觀地傳達(dá)美感,溝通心靈。隨著多媒體和互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,人們將傳統(tǒng)藝術(shù)和現(xiàn)代技術(shù)結(jié)合,提出了數(shù)字美術(shù)館的概念。數(shù)字美術(shù)館以數(shù)字化的形式存貯各種不同載體、不同地理位置的美術(shù)作品和畫(huà)家資源,實(shí)現(xiàn)了美術(shù)作品的保存、展示、銷售、研究、教育等功能。這種形式將真實(shí)的美術(shù)館數(shù)字化、虛擬化,充分體現(xiàn)了現(xiàn)今網(wǎng)絡(luò)共享的思想。觀眾無(wú)需出門,即可舒適地欣賞到世界著名美術(shù)館珍藏的上萬(wàn)幅藝術(shù)作品。然而,這樣的數(shù)字美術(shù)作品管理系統(tǒng)卻面臨著如何有效地組織和檢索大規(guī)模圖像數(shù)據(jù)的問(wèn)題。傳統(tǒng)的基于文本的圖像檢索技術(shù)(Text-based Image Retrieval,簡(jiǎn)稱 TBIR)從圖像名稱、作者、年代等方面標(biāo)引圖像,以關(guān)鍵詞的形式進(jìn)行圖像檢索,回避了對(duì)圖像可視化元素的分析,其性能取決于用戶對(duì)方法的理解,具有很大的局限性[1]。面對(duì)多元化的查詢需求,基于內(nèi)容的圖像檢索技術(shù)[2](Content-based Image Retrieval,簡(jiǎn)稱 CBIR)顯得更為重要。這種技術(shù)使用特定的算法手段由計(jì)算機(jī)自動(dòng)提取包含圖像內(nèi)容的可視特征,如顏色、紋理、形狀、對(duì)象的位置和相互關(guān)系等,通過(guò)降維技術(shù),構(gòu)建索引結(jié)構(gòu),融合圖像多特征進(jìn)行索引匹配。基于內(nèi)容的圖像檢索技術(shù)克服了傳統(tǒng)檢索方法的缺陷,已成為國(guó)內(nèi)外研究的熱點(diǎn)。

綜上所述,本文設(shè)計(jì)和實(shí)現(xiàn)了一種美術(shù)作品查詢系統(tǒng)。該系統(tǒng)結(jié)合上述兩種圖像檢索技術(shù),通過(guò)人機(jī)對(duì)話,能夠方便快捷地查詢到美術(shù)作品信息。

2 系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)

2.1 系統(tǒng)設(shè)計(jì)

本文設(shè)計(jì)的美術(shù)作品查詢系統(tǒng)共分為四大模塊:用戶模塊,描述模塊,查詢模塊,數(shù)據(jù)庫(kù)模塊。該系統(tǒng)能實(shí)現(xiàn)基于文本和基于內(nèi)容的兩種作品檢索方式。用戶可以輸入作品的關(guān)鍵字,文本匹配得到結(jié)果。當(dāng)用戶希望搜索與感興趣作品相似的圖像時(shí),可以輸入檢索圖像,采用基于圖像內(nèi)容的檢索方式得到結(jié)果。圖1表示系統(tǒng)結(jié)構(gòu)。

圖1 系統(tǒng)結(jié)構(gòu)

數(shù)據(jù)庫(kù)模塊采用典型的圖像數(shù)據(jù)庫(kù)。它是與圖像有關(guān)的數(shù)據(jù)集合,包括圖像的文本數(shù)據(jù)和圖像內(nèi)容數(shù)據(jù)。文本數(shù)據(jù)可以使用基本數(shù)據(jù)類型,或由基本數(shù)據(jù)類型組成的復(fù)雜數(shù)據(jù)類型準(zhǔn)確地描述。圖像內(nèi)容包括圖像實(shí)體及其特征、圖像內(nèi)某一對(duì)象的意義、圖像之間的邏輯關(guān)系等。為了完成數(shù)據(jù)庫(kù)的特征存儲(chǔ)和特征查詢功能,我們不僅需要把生成的特征向量以記錄集的形式迅速加入數(shù)據(jù)庫(kù)中,還需要使用查詢語(yǔ)言快速定位想要的數(shù)據(jù)記錄。本系統(tǒng)在指定位置存放作品圖像文件,同時(shí)建立圖像數(shù)據(jù)庫(kù),存儲(chǔ)圖像的文本和特征信息。兩者通過(guò)圖像地址關(guān)聯(lián)起來(lái)。本系統(tǒng)采用SQL Server 2000工具設(shè)計(jì)數(shù)據(jù)庫(kù),一共建立了4張表。一張是圖像文本信息表,用于存儲(chǔ)作品圖像的文本信息,包括作品名、畫(huà)家、時(shí)代、分類、簡(jiǎn)介、地址、畫(huà)家首字母七列。其他三張表均為圖像特征表,用于存儲(chǔ)作品圖像的顏色、形狀和紋理特征信息。

用戶模塊是用戶和系統(tǒng)的接口。用戶可以根據(jù)自己的需要,自主選擇提交文字還是圖片進(jìn)行瀏覽或查詢。若對(duì)檢索結(jié)果不滿意,該模塊還提供調(diào)整查詢條件的接口,以獲得更好的檢索效果。為了便于輸入圖像與數(shù)據(jù)庫(kù)內(nèi)作品進(jìn)行匹配,描述模塊對(duì)圖像進(jìn)行預(yù)處理后,提取圖像的顏色、形狀、紋理三大特征,接著傳遞給查詢模塊進(jìn)行處理。查詢模塊是整個(gè)系統(tǒng)的核心。主要完成兩大功能:基于文本檢索功能和基于內(nèi)容檢索功能。當(dāng)用戶提交文本關(guān)鍵詞時(shí),根據(jù)指定條件把關(guān)鍵詞和數(shù)據(jù)庫(kù)圖像文本表內(nèi)的文本數(shù)據(jù)進(jìn)行搜索,查詢得到相關(guān)作品。當(dāng)用戶提交作品圖片時(shí),將描述模塊提取出的特征值與數(shù)據(jù)庫(kù)圖像特征表內(nèi)的特征數(shù)據(jù)計(jì)算相似度,根據(jù)相似度大小取出若干幅相似作品反饋給用戶。

2.2 系統(tǒng)功能

本系統(tǒng)按照功能分為管理部分,瀏覽部分和檢索部分。管理部分主要負(fù)責(zé)對(duì)圖像數(shù)據(jù)庫(kù)的管理,瀏覽部分可以按照分類或者畫(huà)家瀏覽,檢索部分可以按照?qǐng)D像內(nèi)容或者圖像文本檢索。圖2表示系統(tǒng)功能。

圖2 系統(tǒng)功能

2.2.1 基于文本檢索功能

基于文本檢索功能是根據(jù)輸入關(guān)鍵字,篩選出包含關(guān)鍵字的記錄,主要是通過(guò)SQL的查詢語(yǔ)句來(lái)實(shí)現(xiàn)。通過(guò)用戶輸入的關(guān)鍵詞,應(yīng)用SELECT語(yǔ)句檢索數(shù)據(jù)表中的數(shù)據(jù),而哪些數(shù)據(jù)被檢索出來(lái)則由列出的數(shù)據(jù)行與語(yǔ)句中的WHERE子句決定。美術(shù)作品的文本信息繁多復(fù)雜。一幅作品有作品名、畫(huà)家、分類等多個(gè)信息。作為用戶,既有單獨(dú)查詢某個(gè)字段,也有聯(lián)合查詢多重信息的需要。因此,本文采取了兩種文本檢索方式,即:單條件檢索和多條件檢索,把多種用戶需求完整地表達(dá)出來(lái)。單條件檢索只限定用戶對(duì)作品的單一信息進(jìn)行查詢。用戶選定哪個(gè)字段查詢,系統(tǒng)就只在該字段內(nèi)檢索。多條件檢索提供了多條件同時(shí)滿足下的查詢。實(shí)際上,考慮到用戶可能無(wú)法輸入完整的作品信息,例如:畫(huà)家的全名等,本文提供了人性化的模糊查詢機(jī)制,只要包含輸入關(guān)鍵詞的都可作為檢索結(jié)果,以防漏檢。

2.2.2 基于內(nèi)容檢索功能

基于內(nèi)容檢索功能是在提取表征圖像內(nèi)容的顏色、紋理、形狀的底層視覺(jué)特征的基礎(chǔ)上,通過(guò)對(duì)查詢圖像和數(shù)據(jù)庫(kù)圖像在特征空間進(jìn)行相似性匹配,檢索得到樣本圖像或與之相似的圖像。本文使用歐式距離計(jì)算圖像特征之間的相似程度,按照相似距離從小到大的順序排列,取排在前面的若干幅圖像反饋給用戶。

1)顏色特征提取

圖像顏色往往和圖像中包含的物體或場(chǎng)景十分相關(guān),因此顏色特征的應(yīng)用最為廣泛。顏色具有一定的穩(wěn)定性,對(duì)圖像本身的尺寸、方向、視角的依賴性較小。顏色特征提取算法包括:Swain和Ballard提出的顏色直方圖法,顏色集法、顏色矩法等。本文采用基于顏色結(jié)構(gòu)直方圖的特征提取算法。在提取顏色特征時(shí),首先將圖像的RGB空間顏色值轉(zhuǎn)換成HSV空間顏色值,再進(jìn)行采樣。之后,根據(jù)符合人眼視覺(jué)特性的非均勻量化模式將圖像的顏色值量化為72個(gè)等級(jí),統(tǒng)計(jì)顏色結(jié)構(gòu)直方圖。

數(shù)字圖像的顏色一般是用 RGB(Red,Green,Blue)三個(gè)值來(lái)表示的,而 HSV(Hue,Saturation,Value)模型[3]與人觀察顏色的方式相一致,更貼近人眼的視覺(jué)特性,更有利于圖像處理。

本文先將輸入圖像像素由RGB空間值轉(zhuǎn)換至HSV空間值后,對(duì)HSV空間的數(shù)據(jù)進(jìn)行量化,以降低直方圖矢量維數(shù)。量化時(shí),將HSV這3個(gè)分量按照色彩的不同范圍和人的視覺(jué)分辨能力進(jìn)行非等間隔的量化:把色調(diào)H空間分成8份,飽和度 S和亮度V空間分為3份。為了進(jìn)一步降低HSV三個(gè)顏色特征組合維數(shù),本文利用公式(1)把三者統(tǒng)一成一維向量G。

其中:Qs和Qv分別是分量s和v的量化級(jí)數(shù),取 Qs=3,Qv=3,則:G=9H+3S+V

最后,本文采用統(tǒng)計(jì)顏色結(jié)構(gòu)直方圖[4]的方法記錄顏色特征矢量的分布情況。具體做法是:用8×8的結(jié)構(gòu)元素在圖像上移動(dòng),統(tǒng)計(jì)在結(jié)構(gòu)元素中出現(xiàn)了哪些顏色,只要某種顏色出現(xiàn)了,那種顏色的直方圖值就加1,如果沒(méi)出現(xiàn),就不加,遍歷之后即可得到顏色直方圖信息。顏色結(jié)構(gòu)直方圖的優(yōu)點(diǎn)在于它不僅包含了顏色信息,還包含了顏色與空間的結(jié)構(gòu)關(guān)系。經(jīng)過(guò)上述的處理可以得到72柄的直方圖數(shù)據(jù),將其存入數(shù)據(jù)庫(kù)。

2)形狀特征提取

物體和區(qū)域的形狀是圖像表達(dá)和圖像檢索中的另一個(gè)重要特征。形狀特征通常和目標(biāo)聯(lián)系在一起,含有一定的語(yǔ)義信息,對(duì)感興趣目標(biāo)的檢索很有效。由于形狀的描述涉及到對(duì)一條封閉邊界的描述以及對(duì)這個(gè)封閉邊界所包圍區(qū)域的描述,因此,形狀特征檢索分為基于輪廓的檢索和基于區(qū)域的檢索[5]。這里選用基于區(qū)域的簡(jiǎn)單形狀描述方法:不變矩法。不變矩通常能滿足平移、尺度、旋轉(zhuǎn)不變性的要求,但在物體發(fā)生較大尺度旋轉(zhuǎn)時(shí),不能保證不變性。本文形狀特征提取的具體步驟是:先對(duì)彩色圖像提取亮度,對(duì)只含亮度值的灰度圖像進(jìn)行邊緣檢測(cè),再根據(jù)邊緣檢測(cè)值,提取不變矩作為形狀特征向量。

邊緣檢測(cè)是圖像局部特征不連續(xù)性,如:灰度突變、顏色突變、紋理結(jié)構(gòu)突變等的反映,通常選擇一階和二階導(dǎo)數(shù)來(lái)檢測(cè)邊界。由于一階、二階微分算子的邊緣檢測(cè)很難得到區(qū)域的精確邊緣,而Canny邊緣檢測(cè)利用高斯函數(shù)的一階微分,在噪聲抑制和邊緣檢測(cè)之間尋求了較好的平衡,抗噪性能優(yōu)秀,因此,這里選用Canny邊緣檢測(cè)。Canny邊緣檢測(cè)首先對(duì)圖像進(jìn)行高斯(Gauss)平滑,以除去噪聲,然后進(jìn)行一階微分運(yùn)算,對(duì)獲得的梯度幅值進(jìn)行非極大值抑制,最后用雙閾值算法檢測(cè)和連接邊緣。

邊緣檢測(cè)之后,我們需要提取表示形狀特征的不變矩。本文選擇一系列具有旋轉(zhuǎn)、縮放和平移無(wú)關(guān)的七個(gè)矩(Hu矩[6])來(lái)表征圖像的形狀。Hu矩是由二階和三階中心矩組合而成。由于Hu矩屬于區(qū)域矩,所以需對(duì)其進(jìn)行一些修正,使之變成適用于輪廓描述的曲線矩。最終將每幅圖像處理得到七個(gè)形狀特征描述向量存于數(shù)據(jù)庫(kù),以便特征匹配。

3)紋理特征提取

我們通常把圖像中局部不規(guī)則而整體有規(guī)律的特性稱為紋理。它是圖像的全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物表面性質(zhì),包括表面結(jié)構(gòu)組織及其與周圍環(huán)境關(guān)系的許多重要信息[7]。該特征具有旋轉(zhuǎn)不變性,對(duì)噪聲也具有較強(qiáng)的抵抗能力。在檢索具有粗細(xì)、疏密等方面有較大差別的紋理圖像時(shí),利用紋理特征進(jìn)行檢索是一種有效的方法。紋理提取方法主要有統(tǒng)計(jì)分析法、幾何法、信號(hào)處理法和模型法。

目前紋理提取主要以統(tǒng)計(jì)分析法為主。在對(duì)圖像區(qū)域劃分和灰度化的基礎(chǔ)上,本文提取各區(qū)域的局部邊緣直方圖[8]作為紋理特征。具體步驟是:對(duì)灰度化的圖像進(jìn)行4×4分解,采用五種可能的邊緣檢測(cè)符進(jìn)行操作,對(duì)五種運(yùn)算結(jié)果進(jìn)行邊緣提取,最后統(tǒng)計(jì)邊緣直方圖。

首先提取彩色圖像亮度值,對(duì)灰度化的圖像區(qū)域進(jìn)行分解得到4×4個(gè),共16個(gè)子圖像,每個(gè)子圖像又均勻分解成固定個(gè)數(shù)的2×2的圖像塊。對(duì)于每個(gè)子圖像出現(xiàn)的五種可能的邊緣類型:水平邊緣、垂直邊緣、45度邊緣、135度邊緣和無(wú)方向邊緣,本文采取五種邊緣檢測(cè)操作符對(duì)五種邊緣進(jìn)行處理,得到五個(gè)方向的梯度值。圖3表示五方向邊緣檢測(cè)模板。

圖3 邊緣檢測(cè)模板

其次,對(duì)這五個(gè)邊緣方向梯度的最大值進(jìn)行閾值判斷,若這個(gè)最大值大于預(yù)先設(shè)定的閾值,則說(shuō)明圖像有該方向上的邊緣,將其計(jì)算入邊緣直方圖。最后,統(tǒng)計(jì)邊緣直方圖并且直方圖歸一化。由于圖像被分成16個(gè)子圖像,每個(gè)子圖像能夠統(tǒng)計(jì)出五種方向的邊緣值,因此一共能提取出16×5=80柄的直方圖數(shù)據(jù),即:80維的紋理特征描述向量,存入數(shù)據(jù)庫(kù),以便特征匹配。

4)特征匹配

特征匹配是檢索的最后一步。特征匹配是將查詢圖像提取得到的特征與圖像數(shù)據(jù)庫(kù)的候選圖像特征進(jìn)行比較,獲取在視覺(jué)效果上最為接近的圖像序列。從特征提取的分析可以看出,圖像視覺(jué)特征大多用特征向量表達(dá),所以常用的相似度度量方法都是向量空間模型,把圖像的特征看作是向量空間中的點(diǎn),通過(guò)計(jì)算兩個(gè)點(diǎn)之間的距離來(lái)衡量圖像間的相似程度。常用的度量函數(shù)有:絕對(duì)值距離、歐式距離、二次式距離(馬氏距離)、直方圖相交、加權(quán)歐式距離等。本文采用歐式距離計(jì)算圖像之間的相似程度,這種方法度量精度較高,算法也相對(duì)簡(jiǎn)單。設(shè)兩個(gè)向量分別為:A(x1,x2,…,xn)和 B(y1,y2,…,yn),則兩者的歐式距離定義為公式(2)。

5)綜合多特征提取及匹配

以上采用的單特征檢索方法只能表達(dá)圖像的部分屬性,缺乏足夠的區(qū)分信息,常不能取得理想的檢索效果。本文采取的多特征檢索方法能更好地利用圖像提供的各類“內(nèi)容”得到用戶意向的綜合信息,通過(guò)融合三種特征得出一種貢獻(xiàn)最大、最為典型的綜合特征,增加返回圖像中目標(biāo)圖像的比率。不同特征分量的幅度變化大、物理意義不同,相似距離的可比性差,一般需要利用內(nèi)部和外部歸一化[9]處理,使得不同特征在進(jìn)行綜合度量時(shí)具有相同的效果。

內(nèi)部歸一化使特征向量?jī)?nèi)部各分量在相似性度量時(shí)具有相同的地位。本文采用高斯(Gauss)歸一化。高斯歸一化是一種較好的歸一化方法,其主要特點(diǎn)是少量超大或超小的數(shù)值對(duì)整個(gè)歸一化后的元素值分布影響不大。具體的實(shí)現(xiàn)過(guò)程如下:

假設(shè)圖像某一個(gè)特征是N維特征向量,記為:R=[r1,r2,…,rN]。假設(shè)圖像庫(kù)共有 M 幅圖像,用I1,I2,…,IM表示,則任一幅圖像 Ii的特征向量表示為:R=[ri1,ri2,…,riN],rik表示特征向量 ri中的第 k個(gè)分量。M幅圖像的特征向量即可組成一個(gè)M×N矩陣。矩陣中的每一列是維數(shù)為M的特征序列Rj=[r1j,r2j,…,rMj],rkj表示圖像數(shù)據(jù)庫(kù)中第 k 個(gè)圖像的第j個(gè)特征分量。首先分別統(tǒng)計(jì)矩陣中每個(gè)特征序列Rj的均值μj和標(biāo)準(zhǔn)差σj,然后通過(guò)公式(3)、(4)歸一化至[0,1]空間,得到最終的歸一化特征分量。

外部歸一化是對(duì)圖像庫(kù)所有圖像所有特征之間的相似距離進(jìn)行歸一化處理,使得不同特征在檢索時(shí)發(fā)揮相同的作用。具體做法是:假設(shè)數(shù)據(jù)庫(kù)內(nèi)有M幅圖像。計(jì)算查詢圖像某一特征向量與數(shù)據(jù)庫(kù)所有圖像在該特征上的歐式距離,得到,Di,i=0,1,…,M。求出Di的均值μ和標(biāo)準(zhǔn)差σ之后,按照公式(5)對(duì)M個(gè)相似距離進(jìn)行歸一化,可使得變換后的距離值都落在[0,1]區(qū)間內(nèi)。

重復(fù)以上步驟,將查詢圖像與數(shù)據(jù)庫(kù)圖像在其他特征上都進(jìn)行歸一化處理,即第j個(gè)特征歸一化后的相似距離為:D-ij,i=0,1,…,M,j=0,1,2。外部歸一化處理后,可以保證不同的特征向量在相似度計(jì)算過(guò)程中的地位基本相同。

當(dāng)?shù)玫綒w一化的3個(gè)特征歐式距離之后,需要對(duì)綜合距離進(jìn)行計(jì)算。假設(shè)三個(gè)特征的權(quán)重分別為:W1,W2,W3,則利用公式(6)可求得加權(quán)之后的距離。

綜合特征檢索時(shí),用戶根據(jù)自己的需要提供每個(gè)特征的權(quán)值,系統(tǒng)按照該加權(quán)距離從小到大排列出若干幅圖像,作為檢索結(jié)果。

2.3 系統(tǒng)實(shí)現(xiàn)

本文設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)以Visual C++6.0為開(kāi)發(fā)環(huán)境,使用SQL Server 2000的基于文本和內(nèi)容檢索的美術(shù)作品查詢系統(tǒng)。數(shù)據(jù)庫(kù)一共有122幅圖像,按作品內(nèi)容分為花鳥(niǎo)、建筑、人物、風(fēng)景四大類,按時(shí)代分為現(xiàn)代和當(dāng)代。畫(huà)家采用首字母標(biāo)記,作品有簡(jiǎn)介描述。

2.3.1 管理端實(shí)現(xiàn)

管理端是圖像檢索系統(tǒng)的管理員對(duì)數(shù)據(jù)庫(kù)圖像及其特征進(jìn)行管理的平臺(tái),可實(shí)現(xiàn)美術(shù)作品的入庫(kù)、查看、分類、修改、刪除等功能。管理端分為兩大模塊:瀏覽記錄模塊和添加記錄模塊。圖4表示管理端界面。

圖4 管理端界面

瀏覽記錄模塊用于管理員瀏覽數(shù)據(jù)庫(kù)的作品。系統(tǒng)不僅能顯示作品的寬高信息以及作品名、畫(huà)家、首字母、時(shí)代、分類、簡(jiǎn)介的文本信息,還支持管理員對(duì)圖像的修改和刪除功能。刪除和修改成功后,數(shù)據(jù)庫(kù)會(huì)自動(dòng)更新,對(duì)話框也會(huì)實(shí)時(shí)刷新。

添加記錄模塊用于新作品的入庫(kù)。打開(kāi)的目標(biāo)作品將會(huì)顯示在下方的靜態(tài)文本框內(nèi),文本框內(nèi)填寫好文本信息之后,依次單擊“特征提取”和“信息入庫(kù)”按鈕,系統(tǒng)將自動(dòng)分析該作品,提取其顏色、形狀和紋理特征,把作品的路徑信息,輸入的文本信息以及特征向量存入對(duì)應(yīng)的數(shù)據(jù)表內(nèi)。

2.3.2 用戶端實(shí)現(xiàn)

用戶端是外來(lái)用戶實(shí)現(xiàn)作品檢索的平臺(tái)。用戶不但可以隨意瀏覽美術(shù)作品,還可進(jìn)行基于內(nèi)容和文本的作品查詢。用戶端分為三大模塊:瀏覽模塊、內(nèi)容檢索模塊、文本檢索模塊。圖5表示用戶端界面。

瀏覽模塊支持分類和畫(huà)家瀏覽。按分類瀏覽時(shí),用戶可選擇花鳥(niǎo)、建筑、人物、風(fēng)景分類中的一種進(jìn)行瀏覽。按畫(huà)家瀏覽時(shí),用戶可根據(jù)提供的姓氏首字母,快速選擇畫(huà)家名瀏覽。對(duì)于感興趣的作品,用戶可以雙擊縮略圖,即可彈出作品的詳細(xì)信息。

圖5 用戶端界面

文本檢索模塊支持用戶填寫關(guān)鍵詞進(jìn)行檢索。系統(tǒng)采用單條件和多條件檢索。單條件檢索可以依據(jù)填寫的作品或畫(huà)家關(guān)鍵詞檢索;多條件檢索可根據(jù)需要,填寫分類、作品名、時(shí)代、畫(huà)家中的多項(xiàng)信息進(jìn)行檢索。不需要查詢的信息可以不填寫。

內(nèi)容檢索模塊支持用戶輸入查詢作品,經(jīng)過(guò)特征提取和特征匹配,檢索得到相似作品。系統(tǒng)支持單特征和綜合特征檢索。多特征檢索時(shí),用戶可使用滑動(dòng)條靈活選擇顏色、形狀、紋理特征的權(quán)值(相應(yīng)權(quán)值為百分制,顯示在滑動(dòng)條右邊文本框內(nèi))進(jìn)行綜合檢索。檢索結(jié)果可以和原始作品對(duì)比顯示。

2.3.3 實(shí)驗(yàn)結(jié)果分析

基于文本的圖像檢索較為準(zhǔn)確。文本檢索實(shí)驗(yàn)結(jié)果如圖6所示。單條件檢索時(shí),查找包含“冰“字作品名的作品即可得到數(shù)據(jù)庫(kù)唯一一幅于志學(xué)的《冰雪山水》作品,如圖6(a)所示。多條件檢索時(shí),選擇“人物”分類,作品名包含“花”的作品,可得到如圖6(b)的六幅作品。單條件檢索簡(jiǎn)單快捷,目標(biāo)明確,多條件檢索可以滿足用戶查詢的多種需要。

基于內(nèi)容的圖像檢索比較復(fù)雜。本文選取一幅花鳥(niǎo)圖像,如圖7所示,選擇檢索返回5幅圖像,采用各種檢索方式得到的實(shí)驗(yàn)結(jié)果如圖8所示。

從實(shí)驗(yàn)結(jié)果可以看出,鑒于人眼視覺(jué)特性的復(fù)雜性,不同人對(duì)作品的相似性可能會(huì)有不同的判斷,因此很難利用數(shù)據(jù)來(lái)評(píng)價(jià)實(shí)驗(yàn)結(jié)果。但從檢索效果來(lái)看,單獨(dú)利用顏色特征能檢索出大范圍顏色視覺(jué)感覺(jué)相似的作品。利用形狀特征能檢索出畫(huà)面中有突出物體且畫(huà)面主輪廓相似的作品。由于紋理特征可以針對(duì)作品整體灰度進(jìn)行規(guī)律性的概括,對(duì)畫(huà)面內(nèi)容豐富復(fù)雜的圖像檢索性能較好。綜合特征檢索能夠融合三大特征,更加貼近用戶需求,檢索效果比較好??偟膩?lái)說(shuō),由于作品高層語(yǔ)義和底層視覺(jué)特性的不統(tǒng)一性,圖像特征選取簡(jiǎn)單,圖像特征提取算法的精度不高,相似度衡量不精確等原因?qū)е掠行z索結(jié)果還不符合人的視覺(jué)感覺(jué)。在今后的學(xué)習(xí)中,需要進(jìn)一步進(jìn)行研究。

圖8 基于內(nèi)容的圖像檢索結(jié)果

3 總結(jié)

本文設(shè)計(jì)和實(shí)現(xiàn)了一種基于文本和內(nèi)容檢索的美術(shù)作品查詢系統(tǒng)。系統(tǒng)能夠通過(guò)用戶輸入關(guān)鍵字以及提交查詢作品圖像進(jìn)行檢索。本文對(duì)圖像特征提取技術(shù)、特征匹配等技術(shù)進(jìn)行了研究,能夠完成圖像輸入、數(shù)據(jù)庫(kù)管理、圖像處理、圖像檢索等各項(xiàng)功能。美術(shù)作品豐富多彩,內(nèi)容多種多樣。由于本文采取的多特征檢索技術(shù)還只是基于圖像的低層視覺(jué)特征,而未涉及與人類判斷更貼近的高層語(yǔ)義特征。在今后的研究中,用什么特征來(lái)描述圖像,如何快速特征匹配、如何人機(jī)交互,如何實(shí)現(xiàn)信息共享網(wǎng)絡(luò)化等都將是需要攻克的難點(diǎn)。

[1] 楊建林.基于本體的文本信息檢索研究[J].信息系統(tǒng),2006.

[2] 李向陽(yáng),莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2001.

[3] 王濤,胡事民,孫家廣.基于顏色-空間特征的圖像檢索[J].軟件學(xué)報(bào),2002.

[4] 王惠明.基于MPEG-7的圖像視頻檢索系統(tǒng)研究與實(shí)現(xiàn)[D].北京:中國(guó)傳媒大學(xué),2007.

[5] 李劍,王加俊.基于形狀的圖像檢索技術(shù)研究[D].蘇州:蘇州大學(xué),2009.

[6] Hu Mk.Visual pattern recognition by moment invariants[J].IRE Trans.on Information Theory,1962(2):179-187.

[7] 李悅,覃團(tuán)發(fā).MPEG7區(qū)域綜合特征匹配的圖像檢索算法[J].中國(guó)圖象圖形學(xué)報(bào),2009.

[8] Shuai Qin,Qin Tuanfa,Tang Zhenhua.Image retrieval system based on edge histogram descrip tor of MPEG7[J].Journal on Communications,2005,26(12A):9213.

[9] 韓殿元.基于內(nèi)容圖像檢索中的綜合特征歸一化方法[J].濰坊學(xué)院學(xué)報(bào),2006.

猜你喜歡
直方圖邊緣檢索
統(tǒng)計(jì)頻率分布直方圖的備考全攻略
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
2019年第4-6期便捷檢索目錄
用直方圖控制畫(huà)面影調(diào)
一張圖看懂邊緣計(jì)算
專利檢索中“語(yǔ)義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
基于直方圖平移和互補(bǔ)嵌入的可逆水印方案
國(guó)際標(biāo)準(zhǔn)檢索
國(guó)際標(biāo)準(zhǔn)檢索
在邊緣尋找自我
雕塑(1999年2期)1999-06-28 05:01:42
武鸣县| 桦甸市| 岗巴县| 两当县| 渝北区| 安化县| 突泉县| 桑植县| 乌审旗| 麻栗坡县| 交口县| 东平县| 巩留县| 普兰店市| 如皋市| 莱州市| 洛扎县| 尖扎县| 环江| 祁连县| 融水| 塘沽区| 电白县| 井冈山市| 文安县| 玉林市| 平定县| 理塘县| 邵武市| 扶风县| 屏南县| 耿马| 高邮市| 蕉岭县| 罗甸县| 察哈| 沙河市| 油尖旺区| 萨嘎县| 井研县| 安乡县|