張 琪,屈 嚴(yán),董志芳
(東南大學(xué)電子科學(xué)與工程學(xué)院,南京 210096)
當(dāng)今社會(huì),圖像識(shí)別與檢索已經(jīng)成為我們正常生活中如影隨形的一項(xiàng)技術(shù)。但是由于在圖像獲取及傳輸過(guò)程中的數(shù)據(jù)丟失,圖像一定程度上會(huì)發(fā)生畸變,故而直接基于灰度圖的圖像識(shí)別早已不能滿(mǎn)足當(dāng)今時(shí)代的要求。Hu 于1962年提出了用于區(qū)域形狀識(shí)別的連續(xù)函數(shù)不變矩[1],不變矩特征由于其在圖像平移、伸縮、旋轉(zhuǎn)時(shí)均保持不變,而且具有全局特性,已成為圖像識(shí)別的主要方法之一。但是,在離散狀態(tài)下Hu 矩的比例不變性并不成立[4],針對(duì)這一問(wèn)題,許多學(xué)者進(jìn)行了相應(yīng)的研究工作。首先,由Chen 實(shí)現(xiàn)了離散狀態(tài)下的比例不變性[2],但是對(duì)邊界情況沒(méi)有考慮;之后,杜亞娟、王波濤、徐學(xué)強(qiáng)等人又相繼在前人的基礎(chǔ)上提出了改善的不變矩算法[3-7],最終將區(qū)域、邊界和離散狀態(tài)都考慮在內(nèi)。但是,徐學(xué)強(qiáng)等人的算法在圖像識(shí)別的效率上具有一定的局限性,因而,我們?cè)谖墨I(xiàn)5 的基礎(chǔ)上進(jìn)行了優(yōu)化。經(jīng)過(guò)大量的識(shí)別實(shí)驗(yàn),結(jié)果表明,本文的不變矩算法具有良好的不變性,同時(shí)提高了圖像在尺度變換中識(shí)別率,同時(shí)針對(duì)圖像旋轉(zhuǎn)變換的特點(diǎn)[8],通過(guò)引入權(quán)向量一定程度上消除了識(shí)別的誤差,進(jìn)一步提高了旋轉(zhuǎn)變換后的識(shí)別率,是一種更加穩(wěn)定的不變矩算法。
一幅M×N 圖像f(x,y)的(p+q)階原點(diǎn)矩和(p+q)階中心矩分別定義為:
其中,(ˉx,ˉy)為圖像f(x,y)灰度質(zhì)心。
歸一化的中心距定義為:
Hu 利用歸一化的二階和三階中心距構(gòu)造了7個(gè)不變矩函數(shù)值式,這7個(gè)函數(shù)式對(duì)于平移、旋轉(zhuǎn)、尺度變換都具有不變性。為了方便計(jì)算我們只取前4個(gè)不變矩,分別用φ1、φ2、φ3、φ4表示。
文獻(xiàn)[5]證明了在離散狀態(tài)下,Hu 定義的7個(gè)不變矩的比例不變性是不成立的。因此需要對(duì)Hu進(jìn)行改進(jìn),但該方法在應(yīng)用中具有一定的局限性,因此我們改進(jìn)了文獻(xiàn)[5]的統(tǒng)一Hu 矩,構(gòu)造出新的,但同樣適用基于區(qū)域矩、邊界矩、離散狀態(tài)的歸一化中心矩,具體如下所示:
其中k值表征的是尺度變換后新坐標(biāo)點(diǎn)相對(duì)于原坐標(biāo)點(diǎn)的伸縮的倍率。
根據(jù)k值表征的意義,要得到離散狀態(tài)下不變矩,就必須消去此伸縮倍率?;谶@種思想,我們?cè)谖墨I(xiàn)[5]中的統(tǒng)一Hu 矩的基礎(chǔ)上,進(jìn)一步改進(jìn)的不變矩如下:
可以證明:對(duì)于區(qū)域、邊界、離散的情況,不變矩的公式是統(tǒng)一的,但由于篇幅所限這里不作證明。
上文已經(jīng)說(shuō)明,在區(qū)域、邊界、離散情況下,不變矩的公式是統(tǒng)一的,于是我們?cè)趫D像的識(shí)別上就不考慮邊界效應(yīng)的影響,因此對(duì)于圖像的識(shí)別就集中在對(duì)統(tǒng)一Hu 中5個(gè)參數(shù)的利用和判別上。
在原點(diǎn)矩和中心距的定義式(1)、式(2)中,圖像經(jīng)過(guò)角度θ(初始角度設(shè)為θ0,(ˉx,ˉy)為灰度質(zhì)心,Δx,Δy 表示待旋轉(zhuǎn)點(diǎn)相對(duì)于質(zhì)心的坐標(biāo))的旋轉(zhuǎn)后,新圖像變?yōu)閒(x′,y′),于是我們可以得到:
根據(jù)μpq的定義可得:
其中F1=p1×cos(α);F2=p2×sin(α),并合并為F=p×cos(α+φ)。
故μpq將包含有Fp+q+1,F(xiàn)p+q兩項(xiàng),而μ00則只包含有F 的1 次方項(xiàng)。對(duì)于前一項(xiàng),在歸一化中心距的計(jì)算中由于和μ00的階數(shù)相同,因而在歸一化中心距的計(jì)算中會(huì)消去,因此不予考慮。對(duì)于第二項(xiàng),在歸一化中心距的計(jì)算中會(huì)留下F-1項(xiàng),導(dǎo)致后邊的計(jì)算產(chǎn)生誤差。為了消除誤差,引入權(quán)向量A,根據(jù)各矩所需的需消誤差來(lái)分配權(quán)值。
對(duì)A* 歸一化即可得到權(quán)向量A。
在行業(yè)交流方面,聯(lián)盟共舉辦三屆“全國(guó)BIM聯(lián)盟聯(lián)席會(huì)”,邀請(qǐng)各省市BIM聯(lián)盟參加,通過(guò)每年舉辦一屆聯(lián)席會(huì),加強(qiáng)全國(guó)各BIM聯(lián)盟之間交流;走訪(fǎng)聯(lián)盟觀(guān)察員單位,與裝配式鋼結(jié)構(gòu)民用建筑產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟進(jìn)行工作交流;受香港科技大學(xué)(The Hong Kong University of Science and Technology, HKUST)和香港建造業(yè)議會(huì)(The Construction Industry Council,CIC)的邀請(qǐng)參加“全球BIM標(biāo)準(zhǔn)現(xiàn)狀”技術(shù)論壇。
每個(gè)統(tǒng)一矩對(duì)于相似度的貢獻(xiàn)自然不同,根據(jù)實(shí)際應(yīng)用的同一類(lèi)圖像在得到圖像旋轉(zhuǎn)各個(gè)角度的矩后,除以原圖像的各個(gè)矩的值進(jìn)行歸一化處理,然后每個(gè)矩用最大值減去平均值可以近似的得到a值。于是我們得到了5個(gè)a值a1,a2,a3,a4,a5,也得到了向量A*,歸一化后得A。
定義圖像識(shí)別的目標(biāo)函數(shù)為:
S 用以表征圖像間的相似度,越小表示相似度越高,識(shí)別性越好。
為了驗(yàn)證改進(jìn)的統(tǒng)一Hu 矩對(duì)圖像識(shí)別的有效性,我們選用圖1所示的4 類(lèi)圖像進(jìn)行類(lèi)間圖像識(shí)別實(shí)驗(yàn),通過(guò)比較其目標(biāo)函數(shù)的大小來(lái)進(jìn)行圖像識(shí)別。每副圖又分別經(jīng)過(guò)平移、旋轉(zhuǎn)和尺度變換各產(chǎn)生26副實(shí)驗(yàn)樣本圖像,繼而進(jìn)行類(lèi)內(nèi)相似度匹配實(shí)驗(yàn)。
圖1 四幅不同類(lèi)型的圖像
圖1為4 類(lèi)樣本的基準(zhǔn)圖,表1 給出了相應(yīng)的矩不變量,及另外3 幅圖與目標(biāo)圖像的相似度比較。
對(duì)于目標(biāo)圖像可以選取圖像的權(quán)向量為:
表1 類(lèi)間目標(biāo)特征差異實(shí)驗(yàn)數(shù)據(jù)
分析表1 數(shù)據(jù),可以看出,不同圖像之間統(tǒng)一Hu 矩的差異明顯。由于S 越接近0,相似度越高,G1、G2、G3與目標(biāo)圖像的相似度差異在0.05 以上,完全可以將目標(biāo)圖像從其他圖像中識(shí)別出來(lái)。
采用了圖1 的目標(biāo)圖像進(jìn)行識(shí)別實(shí)驗(yàn)。每一種基準(zhǔn)圖像分別以旋轉(zhuǎn),平移和尺度變換產(chǎn)生3 組圖像,共計(jì)26 副圖像。目標(biāo)圖像經(jīng)過(guò)平移、旋轉(zhuǎn)和尺度變換后相似度檢測(cè),得到表2。
表2 目標(biāo)圖像在平移、旋轉(zhuǎn)和尺度變換后的相似度比較
當(dāng)相似度閾值設(shè)定為0.015 時(shí),有5個(gè)沒(méi)有識(shí)別出來(lái),識(shí)別率為80.76%。當(dāng)相似度閾值設(shè)為0.025 時(shí),26個(gè)樣本中僅有一個(gè)樣本沒(méi)有識(shí)別出來(lái),識(shí)別率為96.15%。另外,在尺度變換中相似度S值在0.01 以下,具有很好的識(shí)別效果,經(jīng)分析得到是對(duì)統(tǒng)一Hu 矩φ3改進(jìn)后的效果。
為了對(duì)比改進(jìn)后的效果,我們做出下表來(lái)進(jìn)行說(shuō)明。
在0.025為閾值的條件下的識(shí)別度見(jiàn)表3。
表3 閾值為0.025 時(shí)的識(shí)別百分比
在0.015為閾值的條件下的識(shí)別度見(jiàn)表4。
表4 閾值為0.015 時(shí)的識(shí)別百分比
通過(guò)對(duì)比可以發(fā)現(xiàn),改進(jìn)后的算法在圖像旋轉(zhuǎn)和尺度變換的識(shí)別上有很大幅度的提高,其中尺度變換的矩不變性在實(shí)驗(yàn)中很好的表現(xiàn)了出來(lái)。
本文對(duì)離散狀態(tài)下歸一化中心距和統(tǒng)一Hu 矩進(jìn)行了改進(jìn),使得在尺度變換中統(tǒng)一Hu 矩的識(shí)別率顯著提高,并證明了改進(jìn)后的統(tǒng)一Hu 矩同樣具有區(qū)域、邊界、離散狀態(tài)下的不變性。但同時(shí)發(fā)現(xiàn)了其對(duì)于旋轉(zhuǎn)的識(shí)別效果仍需提高,所以經(jīng)過(guò)誤差分析后提出了權(quán)向量的改進(jìn)方法,大幅度提高了圖像經(jīng)過(guò)旋轉(zhuǎn)變換后的識(shí)別率,具有更好地應(yīng)用前景。
[1]丁明躍.不變矩算法研究[J].數(shù)據(jù)采集于處理,1992,7(1):1-9.
[2]Chen C C.Improved Moment Invariants for Shape Discrimination[J].Patten Recognition,1993,26(5):683-686.
[3]杜亞娟,潘泉,張洪才.一種新的不變矩特征在圖像識(shí)別中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),1999,21(10):71-74.
[4]王波濤,孫景鰲,蔡安妮.相對(duì)矩及在幾何形狀識(shí)別中的應(yīng)用[J].中國(guó)圖像圖形學(xué)報(bào),2001,6(3):296-300.
[5]徐學(xué)強(qiáng),汪渤,賀鵬.統(tǒng)一Hu 矩及在電視圖像目標(biāo)識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2006,29:213-214.
[6]肖家慶,盧凌,李晟,等.基于矩不變量的圖像識(shí)別[J].武漢理工大學(xué)學(xué)報(bào),2006,30(4):696-699.
[7]柳林霞,陳杰,竇麗華.不變矩理論及其在目標(biāo)識(shí)別中的應(yīng)用[J].火力與指揮控制,2003,28(2):13-14.
[8]程波,楊陽(yáng),沈田雙.一種基于不變矩和SVM 的圖像目標(biāo)識(shí)別方法[J].儀器儀表學(xué)報(bào),2006,27(6):2093-2093.