王朝霞+姜軍
摘要:該文提出了基于大昭寺壁畫圖像形狀輪廓特征提取算法,首先采用Snake模型輪廓檢測(cè)算法分割大昭寺壁畫圖像,提取出圖像底層形狀的曲率函數(shù)、質(zhì)心距離和復(fù)坐標(biāo)函數(shù)特征,并采用傅里葉描述子進(jìn)行描述,在特征歸一化基礎(chǔ)上用歐氏距離計(jì)算相似度并加以匹配,最后分析實(shí)驗(yàn)結(jié)果。該算法能提高大昭寺壁畫圖像的檢索效率,對(duì)大昭寺壁畫文物保護(hù)、傳承具有重要意義。
關(guān)鍵詞:壁畫;圖像形狀;輪廓特征;檢索算法
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)28-0215-03
1 概述
現(xiàn)實(shí)世界環(huán)境由一幀幀圖像組成,圖像的特定顏色、紋理、形狀等構(gòu)成了圖像語義級(jí)別的視覺特征。形狀能較為準(zhǔn)確地描述圖像內(nèi)容、刻畫對(duì)象,是圖像的重要視覺特征之一。圖像的形狀特征不隨紋理、顏色的變化而變化,同時(shí)具備平移及旋轉(zhuǎn)尺度不變性,是圖像較為穩(wěn)定的一項(xiàng)特征內(nèi)容,因此通常采用形狀特征對(duì)圖像庫(kù)進(jìn)行圖像檢索。另外,對(duì)于破壞性較強(qiáng)的大昭寺壁畫,因歷史悠久,加之自然風(fēng)化作用,其圖像紋理及顏色信息有所欠缺,也可以使用形狀特征加以檢索,提升效率。圖像形狀通常被定義為由一條封閉輪廓曲線所包圍的圖像區(qū)域,因此圖像形狀包含輪廓曲線描述和區(qū)域描述兩種表達(dá)方式,前者使用圖像形狀的外部邊界特征對(duì)目標(biāo)形狀加以描述,稱其描述結(jié)果為外部描述;后者使用預(yù)設(shè)目標(biāo)在圖像內(nèi)的覆蓋區(qū)域形狀來加以描述,稱其描述結(jié)果為內(nèi)部描述。圖像的形狀特征表達(dá)必須以圖像中特定對(duì)象的區(qū)域劃分為基礎(chǔ),以圖像分割為前提,因此也是較難提取和識(shí)別的特征信息之一。
圖像特征的提取是基于特征層的圖像語義提取技術(shù),是圖像檢索技術(shù)的基礎(chǔ),圖像特征提取的好壞對(duì)圖像檢索成效具有非常重要的影響,直接關(guān)系到圖像檢索精度和效率。
大昭寺是國(guó)家重點(diǎn)文物保護(hù)單位,其精美的壁畫具有很高的文物價(jià)值和歷史價(jià)值。然而,隨著環(huán)境和人類活動(dòng)的影響,這些文物正逐步遭受破壞。為了更好地?cái)?shù)字化保護(hù)、傳承大昭寺壁畫文物[1],本文設(shè)計(jì)了基于大昭寺壁畫圖像形狀輪廓特征提取及識(shí)別算法,主要采用Snake模型和傅里葉描述子對(duì)大昭寺壁畫圖像形狀輪廓特征加以提取和描述,利用歐氏距離對(duì)形狀特征進(jìn)行相似度度量,實(shí)現(xiàn)了較好地檢索效果。如圖1所示。
2 大昭寺壁畫圖像形狀輪廓特征提取
2.1 大昭寺壁畫圖像預(yù)處理
在對(duì)大昭寺壁畫文物圖像進(jìn)行數(shù)字化采集、保存、傳輸過程中,由于受光線、自然風(fēng)化等諸多因素影響,讓采集到的文物圖像與真實(shí)事物之間存在一定差別,無可厚非地影響人為或機(jī)器識(shí)別,影響形狀特征提取算術(shù)的檢索效率。在執(zhí)行特征提取前,為了消除圖像采集及傳輸過程的噪聲,通常需要對(duì)目標(biāo)圖像進(jìn)行圖像平滑、圖像增強(qiáng)等預(yù)處理,以此增強(qiáng)圖像清晰度、對(duì)比度,以期改善圖像質(zhì)量,方便后續(xù)分析和算法處理。
2.2 Snake算法模型
Snake算法是1987年由Michael Kass提出的一種形狀輪廓提取方法,其基本思想是在圖像信息基礎(chǔ)上進(jìn)行迭代演化,使其逐步封閉圖像的曲線輪廓形狀以逼近于圖像中的目標(biāo)輪廓,最終找到目標(biāo)圖像邊界[2]。Snake算法的關(guān)鍵是如何掌握閉合輪廓曲線形變規(guī)律,這就需要定義度量閉合輪廓曲線形變的能量函數(shù),通過能量函數(shù)的最小化將閉合輪廓曲線逐漸逼近于目標(biāo)圖像區(qū)域邊緣。初始閉合輪廓曲線和能量函數(shù)構(gòu)成了Snake算法的兩大要素,在進(jìn)行大昭寺壁畫圖像形狀輪廓特征提取時(shí),需要首先對(duì)其進(jìn)行選擇和設(shè)計(jì)。初始閉合輪廓曲線的選擇要求為:以封閉狀態(tài)盡量處于圖像目標(biāo)區(qū)域附近并接近于目標(biāo)實(shí)際輪廓[3]。能量函數(shù)的設(shè)計(jì)要求為:相關(guān)選擇屬性(包含初始閉合輪廓曲線的連續(xù)性、平滑性以及與高梯度、灰度區(qū)域的接近程度等)要能引起能量縮小,即:在能量函數(shù)作用下初始閉合輪廓曲線在特定范圍內(nèi)移動(dòng)時(shí)能連續(xù)、平滑地收斂到局部邊界。Snake模型是閉合輪廓曲線本身內(nèi)力和外部約束力雙重作用下的變形輪廓,內(nèi)力(也稱為內(nèi)部能量函數(shù))對(duì)閉合輪廓曲線起連續(xù)性和平滑性的約束作用,外力(也稱為外部能量函數(shù))則牽引Snake模型向感興趣的圖像目標(biāo)區(qū)域移動(dòng),任何能實(shí)現(xiàn)此目標(biāo)的能量表達(dá)式均可以使用,本文以常用的灰度和梯度屬性來構(gòu)建圖像外部能量函數(shù)。
2.3 基于傅里葉描述子的形狀輪廓特征提取
物體邊界函數(shù)是采用某個(gè)特征函數(shù)來描述物體形狀的邊界線。傅里葉描述符則是通過傅里葉變換將物體邊界的形狀輪廓特征轉(zhuǎn)換到特定頻域中,然后采用低頻系數(shù)來數(shù)字表示物體輪廓[5]。由于傅里葉低頻系數(shù)能客觀表達(dá)物體形狀的輪廓特征量,本文采用較少的系數(shù)來數(shù)字化表示物體輪廓,有利于形狀輪廓的檢索、識(shí)別和匹配計(jì)算。由于傅里葉描述符是在物體形狀的二維輪廓基礎(chǔ)上抽象成一維輪廓函數(shù)并加以傅里葉變換所得,所以傅里葉描述符在性能上與物體形狀輪廓之間具備密切相關(guān)性。假設(shè)物體的二維輪廓抽象為一系列坐標(biāo)像素點(diǎn)(xs,ys),(其中0≤s≤N-1,而N為物體輪廓上像素點(diǎn)總數(shù)),這些坐標(biāo)像素點(diǎn)坐標(biāo)可以推導(dǎo)為三種意義的形狀表達(dá),即質(zhì)心距離[D(s)]、曲率函數(shù)[Q(s)]和復(fù)坐標(biāo)函數(shù)[Z(s)][6]。
3 傅里葉描述子的特征歸一化
由(4)(5)(6)直接推導(dǎo)所得的傅里葉系數(shù)具有旋轉(zhuǎn)、起點(diǎn)、位移和尺度依賴性,因此需要對(duì)傅里葉系數(shù)進(jìn)行歸一化處理[7]。為了確保旋轉(zhuǎn)無關(guān)性,本文忽略了傅里葉系數(shù)的相位信息,僅僅采用幅度信息進(jìn)行形狀描述。為了確保縮放無關(guān)性,本文采用參數(shù)的大小除以第一個(gè)非零參數(shù)即直流分量來加以實(shí)現(xiàn)。為了確保位置無關(guān)性,本文采用第一個(gè)非零頻率分量對(duì)其他形變參數(shù)進(jìn)行標(biāo)準(zhǔn)化。
4 傅里葉描述子特征相似性度量
圖像檢索性能由相似性度量的好壞決定,圖像檢索響應(yīng)時(shí)間由相似性度量的計(jì)算復(fù)雜度決定。在模式識(shí)別中通常采用距離法計(jì)算特征相似性度量,即用特征向量空間距離表示特征相似性程度,特征向量空間距離值越大,相似性越差;值越小,相似性越好。endprint
由于歸一化后的質(zhì)心距離、曲率函數(shù)、復(fù)坐標(biāo)函數(shù)的傅里葉描述子各頻率分量之間兩兩正交[8],因此本文采用歐氏距離計(jì)算兩種形狀I(lǐng),J的相似度,歐氏距離是圖像檢索領(lǐng)域應(yīng)用較為成熟的距離計(jì)算公式,在一定程度上滿足人為心理生理的圖像視覺差異感受。歐氏距離定義圖像相似性度量公式如下:
其中W為傅里葉變換低頻系數(shù)的選擇個(gè)數(shù);[d(n)]為傅里葉形狀描述子在歸一化后的處理結(jié)果。顯然,同一圖像目標(biāo)在I,J兩種形狀計(jì)算出的歐氏距離值[D(I,J)]差異性較?。欢趦蓚€(gè)不同目標(biāo)形狀計(jì)算出的歐氏距離值[D(I,J)]越大,則兩個(gè)目標(biāo)形狀的差距性相對(duì)較大。
5 實(shí)驗(yàn)結(jié)果分析
本實(shí)驗(yàn)所需大昭寺壁畫圖像來源于課題組成員實(shí)地采集并預(yù)處理后的數(shù)字壁畫圖像。從中選擇了10幅具有人物特征的壁畫圖像作為小型壁畫圖像庫(kù),如圖2所示。同時(shí)選擇第一張圖片(1.jpg)為待檢索圖像,如圖3所示。在Snake模型提取圖像輪廓后,對(duì)所提取出的圖像輪廓實(shí)施傅里葉變換并歸一化處理,用歐氏距離計(jì)算1.jpg與圖像庫(kù)中圖像之間的特征距離,計(jì)算所得歐氏距離值越小,兩幅圖像之間的相似程度越高;計(jì)算所得歐氏距離值越大,兩幅圖像之間的相似程度越低。由表1的檢索結(jié)果值得知,1.jpg和它自身圖像的歐氏距離值為零,因?yàn)橥环鶊D像之間最相似。同時(shí)從表1的匹配順序得知,歐氏距離值逐漸增大,相似程度也逐漸減弱。
6 結(jié)束語
對(duì)于圖像形狀特征檢索,曲線輪廓邊界處理一致是一大難題。本文采用曲線Snake輪廓檢測(cè)方法,在對(duì)大昭寺壁畫預(yù)處理基礎(chǔ)上,對(duì)圖案邊緣區(qū)域進(jìn)行追蹤后達(dá)到分割效果,再采用傅里葉描述子加以描述并歸一化處理,最后匹配兩幅壁畫圖像的相似程度。相對(duì)于具有明顯特征的壁畫而言,算法檢索效果更佳。本算法僅考慮了傅里葉算子特征,只能對(duì)縮放、平移、旋轉(zhuǎn)加以研究,無法處理光照及破損圖像問題。如何與顏色、紋理及感興趣區(qū)域特征有機(jī)結(jié)合開展壁畫特征提取,是課題組下一步亟待加強(qiáng)解決的問題。
參考文獻(xiàn):
[1] 姜軍,卓嘎,王朝霞,等. 以TV模型為例的西藏壁畫數(shù)字圖像修復(fù)技術(shù)研究[J].電子設(shè)計(jì)工程,2013,21(3):136-139.
[2] 周正杰,王潤(rùn)生.基于輪廓的形狀特征提取與識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用, 2006(14).
[3] Dengsheng Zhang,Guojun Lu.Review of Shape Representation and Description and Description Techniques[J].Pattern Recognition,2004,37:1-19.
[4] Tao WANG,Wenyin LIU,Jiaguang SUN.Using Fourier Descriptors to Recognize Objects Shape[J].Journal of Computer Research and Development,2002,12(39):1714-1719.
[5] 朱科鈐,盧章平.基于極坐標(biāo)和傅里葉描述子的二值商標(biāo)圖像檢索[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006(11).
[6] Dengsheng ZHANG,Guojun LU.Shape-based image retrieval using generic Fourier descriptior[J].Signal Processing:Image Communication,2002,17:825-848.
[7] 全權(quán),張弘,謝鳳英.從電場(chǎng)角度引出的基于邊緣特征的歸一化形狀識(shí)別算法研究[J].中國(guó)圖像圖形學(xué)報(bào),2004(7).
[8] 鐘尚平,高慶獅.矢量地圖水印歸一化相關(guān)檢測(cè)的可行性分析與改進(jìn)[J].中國(guó)圖像圖形學(xué)報(bào),2006(3).endprint