宋 超,王瑞光,馮英翹,陳 宇,鄧意誠
(1.中國科學(xué)院 長春光學(xué)精密機(jī)械與物理研究所,長春130033;2.華北理工大學(xué) 信息工程學(xué)院,河北 唐山063009)
目前已有的客觀圖像質(zhì)量評價算法在預(yù)測常見圖像失真類型(如有損壓縮、噪聲和模糊等)的主觀感知方面表現(xiàn)出很好的準(zhǔn)確性[1]。黃小喬等[2]在S-CIELAB色差模型的基礎(chǔ)上,提出一種基于色差的均方誤差與峰值信噪比彩色圖像質(zhì)量評價方法,首先將圖像分別經(jīng)過S-CIELAB 空間濾波處理后,再轉(zhuǎn)換到CIELAB 均勻顏色空間,然后利用CIELAB 色差公式計算兩幅圖像每一個像素間的色差,最后計算色差均方根和色差峰值信噪比以進(jìn)行質(zhì)量評價。實(shí)驗(yàn)結(jié)果表明,該算法的客觀評價結(jié)果與平均主觀評價分?jǐn)?shù)具有較好的一致性。王宇慶等[3]針對傳統(tǒng)的圖像質(zhì)量評價方法忽略顏色信息的問題,提出一種使用四元數(shù)矩陣來描述彩色圖像結(jié)構(gòu)信息的客觀評價方法。該方法對四元數(shù)矩陣進(jìn)行奇異值分解,將最大奇異值作為度量圖像結(jié)構(gòu)相似性的主要參數(shù),并通過分析圖像結(jié)構(gòu)差異映射圖譜得到評價結(jié)果量化值。使用LIVE圖像庫測試的結(jié)果表明,該方法與人眼視覺感知特性的一致性優(yōu)于傳統(tǒng)方法。武海麗 等[4]比 較 了S-CIELAB 和iCAM 兩 種 模 型對圖像質(zhì)量評價結(jié)果的有效性和準(zhǔn)確性,分別使用兩種模型計算兩幅圖像的色差并與主觀實(shí)驗(yàn)結(jié)果進(jìn)行對比,發(fā)現(xiàn)iCAM 模型色差計算結(jié)果比SCIELAB 模型更符合人眼視覺實(shí)驗(yàn)結(jié)果。Baranczuk等[5]利用客觀圖像質(zhì)量評價指標(biāo)對色域映射后的圖像質(zhì)量進(jìn)行評價,以心理物理學(xué)主觀評價結(jié)果為參照選擇出最優(yōu)的評價指標(biāo),結(jié)果證明SSIM 具有比主觀評價結(jié)果更好的預(yù)測準(zhǔn)確性。但上述方法均利用了圖像的顏色信息,但都沒有考慮色域映射失真圖像的特點(diǎn),在實(shí)驗(yàn)驗(yàn)證時也未利用色域映射圖像進(jìn)行驗(yàn)證,對映射圖像主觀評價結(jié)果的預(yù)測準(zhǔn)確性均有待驗(yàn)證。
本文針對色域映射失真類型圖像,在FSIM[6]算法的基礎(chǔ)上,提出了一種能夠提高色域映射圖像預(yù)測準(zhǔn)確性的圖像質(zhì)量評價方法,可用于開發(fā)新的色域映射算法,也可在一定程度上代替復(fù)雜費(fèi)時的主觀評價實(shí)驗(yàn)對色域映射算法的效果進(jìn)行驗(yàn)證。
首先將源圖像和映射圖像都轉(zhuǎn)換到CIELAB均勻顏色空間中。對圖像的明度分量,根據(jù)人類視覺對相位一致的不同頻率的波具有較高的分辨率的特性,首先提取圖像明度分量中的相位一致性信息作為圖像的一個特征。由于相位一致性特征具有對比度不變性,而視覺具有對比度敏感性,因此提取圖像明度分量中的邊緣強(qiáng)度作為另一個特征。對圖像彩度和色相分量,根據(jù)色域映射的特點(diǎn),分別提取彩度和色相分量的彩度差和色相差作為圖像的另外兩個特征。
相位一致性(Phase congruency,PC)是一種特征點(diǎn)檢測方法,與傳統(tǒng)的基于圖像亮度梯度的方法不同,它利用圖像信號在特征點(diǎn)處的傅里葉分量具有最大相位一致性的特性來進(jìn)行特征點(diǎn)的檢測。目前已有多種提取給定圖像PC 圖的實(shí)現(xiàn)方式,本文使用Kovesi[7]提出的一種改進(jìn)的PC提取方法,該方法已廣泛應(yīng)用在各種圖像處理中。
為了計算二維明度圖像的PC 特征,采取從一維信號到二維信號擴(kuò)展的思路。首先對于一維信號g(i),分別用和表示尺度為n 的偶對稱濾波器和奇對稱濾波器,它們是正交的。在尺度為n時,分別使用濾波器和對信號進(jìn)行卷積運(yùn)算,在每個像素位置i處形成一個對應(yīng)的向量可求出在像素位置i處的局部幅度為:
對上述一維信號,本文采用Log-Gabor濾波器組作為濾波器正交對。一維Log-Gabor濾波器在頻域中的轉(zhuǎn)換函數(shù)為:
式中:ω0為濾波器的中心頻率;σr為控制濾波器的帶寬。
對上述一維Log-Gabor濾波器的垂直方向利用高斯函數(shù)作為擴(kuò)展函數(shù),將一維Log-Gabor濾波器擴(kuò)展到二維,計算二維明度圖像的PC 特征。使用高斯函數(shù)作為映射函數(shù),得到二維Log-Gabor函數(shù)的轉(zhuǎn)換函數(shù)如下:
式中:j={0,1,…,J-1};θj=j(luò)π/J為濾波器的方向角,J 為方向數(shù);σθ決定方向角的角帶寬,例如在頻域中的二維Log-Gabor濾波器,ω0=1/6,θj=0,σθ=0.4,如圖1所示,其中圖1(a)為濾波器的徑向分量,圖1(b)為濾波器的角度分量,圖1(c)為徑向分量和角度分量相結(jié)合的Log-Gabor濾波器。
圖1 頻域中Log-Gabor的濾波器Fig.1 Log-Gabor filter in the frequency domain
通過調(diào)整ω0和θj的值,并使用二維Log-Gabor濾波器G2D(ω,θj)對二維明度圖像作卷積,對每個像素位置i 得到對應(yīng)的向量
在尺度為n、方向?yàn)棣萰時,局部幅度表示為:
沿方向θj的局部能表示為:
最終可以得到二維明度圖像在像素位置i處的相位一致性為:
式中:PC2D(i)為0到1之間的實(shí)數(shù)。
邊緣是指圖像中指示語義目標(biāo)邊界的像素集,一般是通過尋找圖像中亮度急劇變化的像素集來確定的。圖像邊緣包含以下兩個特點(diǎn):沿特定方向的局部連續(xù)性和沿正交方向的局部不連續(xù)性,如圖2(a)所示,其中紅色箭頭指示沿特定方向的規(guī)則信息,黃色箭頭指示正交方向的不規(guī)則信息。本文認(rèn)為,圖像中存在各向異性結(jié)構(gòu)并且邊緣總是向各個方向延伸[8]。將上述3個特點(diǎn)全部包含在內(nèi),構(gòu)建了新的邊緣強(qiáng)度特征提取方法。
將源圖像表示為O = O1,…,Oi,…,ON,N為圖像中所有像素的個數(shù)。圖像沿多個方向的局部規(guī)則性是用方向?qū)?shù)來測量的。
用?Oi()d 來表示圖像第i 個像素沿方向d的方向?qū)?shù),并且僅考慮4個方向,即j=1,2,3,4,如圖2(b)所示。定義垂直或者水平方向的邊緣強(qiáng)度為:
圖2 邊緣特征圖和邊緣強(qiáng)度定義Fig.2 Characteristic figure of edge and the definition of the edge-strength
為了符合人眼視覺,引入ρ作為邊緣強(qiáng)度非線性調(diào)節(jié)因子。類似地,在對角線的邊緣強(qiáng)度定義為:
這個新定義的邊緣強(qiáng)度把邊緣的3個特征考慮在內(nèi),并且能夠使用卷積快速計算。
將源圖像O的色域映射圖像表示為R=R1,…,Ri,…,RN,為了保證源圖像O 和映射圖像R在每個像素上能在相同的方向比較邊緣強(qiáng)度,定義映射圖像R 在第i個像素的邊緣強(qiáng)度為:
因?yàn)槿搜垡曈X系統(tǒng)對顯示更強(qiáng)邊緣強(qiáng)度的方向更敏感,定義第i個像素的整個邊緣強(qiáng)度為:
每個像素的方向?qū)?shù)?Oi(d)是通過使用卷積核K()j 與圖像進(jìn)行卷積運(yùn)算得到的。卷積核的形式如下:
卷積核的設(shè)計或選擇在圖像質(zhì)量評價研究中十分重要,不同的卷積核會導(dǎo)致不同的評價性能。在FSIM[6]算法中,作者對3 種圖像梯度卷積核(Prewitt,Sobel,Scharr)進(jìn)行了比較,結(jié)果顯示Scharr算子能夠達(dá)到最好的效果。本文中上述卷積核K(j)即在Scharr算子的基礎(chǔ)上設(shè)計的。
在大部分情況下,色域映射過程中顏色失真是必然的。顏色三屬性中,色相是感知和辨別顏色中最主要的顏色屬性。大部分色域映射算法都是以保持色相不變?yōu)樵瓌t,并且基本上都是在CIELAB 均勻顏色空間中保持色相角不變來實(shí)現(xiàn),然后在明度和彩度分量上進(jìn)行顏色映射[9]。但是,色相角并不能完全反應(yīng)視覺感知的色相,也就是說,即使顏色在相同色相角平面上移動,人眼仍然會感知色相的改變,這是由于色空間本身的不均勻性引起的。
為了表征色域映射圖像與源圖像的顏色分量的相似性,分別提取源圖像和映射圖像在像素位置i的彩度差和色相差:
式中:C(O,i)、C(R,i)分別為源圖像和映射圖像在像素 位 置i的 彩 度 分 量;a(O,i)、a(R,i)、b(O,i)、b(R,i)分別為對源圖像和映射圖像在CIELAB均勻顏色空間中分解對應(yīng)的a和b分量。
本文中ΔH 是用歐幾里得距離而不是用色相角的差值來表示的,一方面是因?yàn)樵贑IELAB均勻顏色空間中,即使兩種顏色的色相角的差維持不變,隨著彩度的增大,視覺色相差也會增大。另一方面,使用色相角的差來衡量色相變化,不易對色相的相似性比較進(jìn)行公式化。
利用從圖像明度分量中提取的相位一致性特征、邊緣強(qiáng)度特征和從彩度與色相分量中提取的彩度差特征、色相差特征,設(shè)計了一種可用于色域映射失真類型的圖像質(zhì)量評價方法。為方便起見,本文將這種算法稱為色域映射相似性評價算法(Gamut mapping similarity,GMSIM)。
對于圖像明度分量,從源圖像O 中提取的相位一致性和邊緣強(qiáng)度特征分別為PC(O,i)和ES(O,i),從映射圖像R 中提取的相位一致性和邊緣強(qiáng)度特征分別為PC(R,i)和ES(R,i),則源圖像O和映射圖像R 明度分量相似性由兩部分構(gòu)成,其中相位一致性特征相似性定義如下:
邊緣強(qiáng)度特征的相似性定義如下:
式中:Q1和Q2均為正實(shí)數(shù),用于提高SPC和SES的穩(wěn)定性,其值大小分別取決于PC 和ES 的動態(tài)取值范圍。
式中:B 為預(yù)先設(shè)置的常數(shù);ρ為邊緣強(qiáng)度非線性調(diào)節(jié)因子。
圖像中不同的像素位置在人眼視覺系統(tǒng)對圖像視覺感知的貢獻(xiàn)是不同的,例如邊緣位置就比平滑區(qū)域傳達(dá)了更重要的視覺信息。因?yàn)槿搜蹖ο辔灰恢滦越Y(jié)構(gòu)具有敏感性,取源圖像O 和映射圖像R 相位一致性的最大值作為權(quán)重,用于圖像明度分量的相似性度量。圖像明度分量的相似性權(quán)重定義如下:
圖像明度分量的相似性可定義如下:
式中:α和β 是用來表示相位一致性和邊緣強(qiáng)度特征重要性的參數(shù)。
根據(jù)源圖像O 和映射圖像R 彩度差和色相差的定義,取在圖像彩度分量和色相分量的相似性定義為:
式中:參數(shù)Q3和Q4用于調(diào)整所檢測的彩度差和色相差大小。
將所有相似性結(jié)合在一起,即可得到源圖像O 和映射圖像R 的相似值如下:
GMSIM 算法在實(shí)際應(yīng)用中的流程見圖3。
圖3 GMSIM 算法流程圖Fig.3 GMSIM algorithm scheme
本 文 中 選 用 TID2008 圖 像 庫[10]作 為GMSIM 算法參數(shù)調(diào)試和算法性能驗(yàn)證的一部分圖像源。TID2008數(shù)據(jù)庫共有1700幅測試圖像,包括25幅源圖像,對每幅源圖像各有17種失真類型,每種失真類型有4個失真等級。數(shù)據(jù)庫的主觀測試值(Mean opinion scores,MOS)是由3個國家共約256 000人次實(shí)驗(yàn)的基礎(chǔ)上獲得的。
使用已有色域映射算法主觀對比實(shí)驗(yàn)中形成的3個圖像集[5]作為GMSIM 算法參數(shù)調(diào)試和性能驗(yàn)證的另一部分圖像源。這幾個圖像集包含約15種色域映射算法及其組合,共有234 幅源圖像,2136幅色域映射圖像,共有14 106次有效主觀對比評價。在圖像集形成的主觀對比評價實(shí)驗(yàn)中,將兩幅色域映射圖像并排,并將源圖像置于兩幅映射圖像的下方,3幅圖像同時展示給觀察者。觀察者從兩幅映射圖像中選擇與源圖像更相似的一幅,完成一次對比評價。
在TID2008圖像庫中,最終主觀評價結(jié)果是以MOS值的形式給出。客觀圖像質(zhì)量評價算法對整個圖像庫進(jìn)行處理,并將運(yùn)算結(jié)果與MOS值作相關(guān)性分析。相關(guān)度越高,則客觀圖像質(zhì)量評價算法對主觀評價結(jié)果的預(yù)測性越好。
對色域映射失真類型圖像而言,將觀察者對比選擇原始數(shù)據(jù)轉(zhuǎn)換到MOS需要假設(shè)并選擇原始數(shù)據(jù)分布模型、分析觀察者內(nèi)和觀察者間的不確定性以及分析圖像內(nèi)容對選擇結(jié)果的影響等各種因素。因此,本文使用命中率來衡量圖像質(zhì)量評價算法對色域映射圖像主觀對比評價結(jié)果的預(yù)測準(zhǔn)確性。命中率p 的計算式為:
式中:m 為主觀對比評價總次數(shù);h為客觀評價算法成功預(yù)測主觀對比評價的次數(shù)。如果某圖像質(zhì)量評價算法命中率p ≈0.5,則表示該算法預(yù)測性能很差,其效果近似為隨機(jī)預(yù)測。
在對色域映射圖像集的主觀評價實(shí)驗(yàn)中,不同的觀察者對同樣的兩幅色域映射圖像做出的主觀評價可能是不同的。因此,客觀評價算法對主觀對比評價的命中率不可能為1,而是有一個最大值pm。只有對同樣的兩幅色域映射圖像做出的主觀對比評價中的大多數(shù)選擇做出成功預(yù)測,客觀圖像質(zhì)量評價算法的命中率才能達(dá)到pm。因此,算法的命中率存在一個取值區(qū)間即命中率越接近于pm,表明算法對主觀評價結(jié)果的預(yù)測性能越好。鑒于pm的存在,本文同樣以pp 作為衡量客觀圖像質(zhì)量評價算法的指標(biāo)之一。
從3個色域映射圖像集中隨機(jī)抽取一半源圖像作為訓(xùn)練圖像集,用于本文圖像質(zhì)量評價算法的參數(shù)擬合。該訓(xùn)練圖像集中共包括117幅源圖像,1068幅色域映射圖像,共對應(yīng)7932次對比評價結(jié)果。使用該圖像集對客觀圖像質(zhì)量評價算法中的各個參數(shù)進(jìn)行試錯性選擇,使得算法的命中率達(dá)到最大。最終得到的參數(shù)如下:N =4,J =4,σr=0.5978,σθ=0.6545,Q1=1.2,α=1,ρ=0.9,B=0.126,Q2=62.75,β=0.8,Q3=0.000 25,Q4=0.002。Q1、Q2和Q3、Q4在各自的相似性公式中使用的方式不同,因此不能相互比較。
3個色域映射圖像集的全部圖像及主觀對比評價結(jié)果用于測試GMSIM 算法的預(yù)測準(zhǔn)確性,同時使用CIE推薦的色差公式、S-CIELAB圖像色差公式、傳統(tǒng)的圖像質(zhì)量評價算法SSIM[11]和FSIM[6]作為對比,比較5種算法在該圖像集上的預(yù)測準(zhǔn)確性。
式中:N 為源圖像中的像素個數(shù)。
SSIM 和FSIM 圖像質(zhì)量評價算法僅使用圖像的明度分量進(jìn)行運(yùn)算。各種圖像質(zhì)量評價算法得到的命中率如表1所示。
表1 圖像質(zhì)量評價算法命中率對比Table 1 Comparison of hit rates
對SSIM、FSIM 和GMSIM 這3種圖像質(zhì)量評價算法在TID2008圖像庫進(jìn)行了性能評估和比較,并使用肯德爾等級相關(guān)系數(shù)(Kendall rank-order correlation coefficient,KROCC)和斯皮爾曼等級相關(guān)系數(shù)(Spearman rank-order correlation coefficient,SROCC)兩種評價指標(biāo)進(jìn)行評價對比。等級相關(guān)系數(shù)能夠測量圖像質(zhì)量評價方法的預(yù)測單調(diào)性,一個更好的客觀圖像質(zhì)量評價方法應(yīng)該有更高的KROCC值和SROCC 值。因?yàn)門ID2008 圖像庫為RGB 數(shù)據(jù),首先將其從RGB 顏色空間通過sRGB轉(zhuǎn)換公式轉(zhuǎn)換到CIELAB 均勻顏色空間,提取圖像的明度圖像,然后使用3種圖像質(zhì)量評價算法進(jìn)行處理。對GMSIM 圖像質(zhì)量評價算法,不使用其彩度和色相分量的相似性公式。
圖4 各評價算法命中率對比Fig.4 Comparison of hit rates
3種算法在TID2008圖像庫的預(yù)測性能對比如表2所示。從表2 中可以看出:GMSIM 算法優(yōu)于SSIM 算法和FSIM 算法。因?yàn)樘荻刃畔⒃谥豢紤]圖像中每個像素的平均變化,并沒有將邊緣的3個特征同時考慮在內(nèi),算法的比較結(jié)果也證明了邊緣的3個特征的有用性。
表2 TID2008圖像庫中圖像質(zhì)量評價方法性能比較Table 2 Performance comparison of IQA methods on TID2008image database
將3種算法得到的客觀評價結(jié)果與TID2008圖像庫提供的主觀評價結(jié)果繪制成散點(diǎn)圖,根據(jù)散點(diǎn)數(shù)據(jù)可得到主觀觀測值和各種算法的客觀預(yù)測值的擬合曲線,如圖5所示。從圖中可以看出:本文提出的GMSIM 算法得到的散點(diǎn)圖比SSIM和FSIM 具有相對更好的聚合度,擬合曲線線性度更好。
圖5 圖像質(zhì)量評價算法散點(diǎn)圖對比Fig.5 Comparison of scatter plots
本文針對色域映射失真類型圖像提出了一種新的圖像質(zhì)量評價方法GMSIM。使用3個色域映射圖像集和TID2008 圖像庫對GMSIM 算法進(jìn)行參數(shù)擬合和算法預(yù)測準(zhǔn)確性分析。實(shí)驗(yàn)結(jié)果顯示:GMSIM 算法對色域映射失真圖像主觀感知的預(yù)測準(zhǔn)確性比傳統(tǒng)的SSIM 方法提高約4.5%,但仍有較大的進(jìn)步空間。在TID2008 圖像庫的預(yù)測性能也有所提高。
[1]Zhang Lin,Zhang Lei,Mou Xuan-qin,et al.A comprehensive evaluation of full reference image quality assessment algorithms[C]∥IEEE International Conference on Image Processing,Orlando,2012:1477-1480.
[2]黃小喬,石俊生,楊健,等.基于色差的均方誤差與峰值信噪比評價彩色圖像質(zhì)量研究[J].光子學(xué)報,2007,36(增刊):295-298.Huang Xiao-qiao,Shi Jun-sheng,Yang Jian,et al.Study on color image quality evaluation by MSE and PSNR based on color difference[J].Acta Photonica Sinica,2007,36(Sup.):295-298.
[3]王宇慶,朱明.評價彩色圖像質(zhì)量的四元數(shù)矩陣最大奇異 值 方 法[J].光 學(xué) 精 密 工 程,2013,21(2):469-478.Wang Yu-qing,Zhu Ming.Maximum singular value method of quaternion matrix for evaluating color image quality[J].Optics and Precision Engineering,2013,21(2):469-478.
[4]武海麗,黃慶梅,苑馨方,等.基于S-CIELAB 和iCAM 模型的圖像顏色質(zhì)量評價方法的實(shí)驗(yàn)研究[J].光學(xué)學(xué)報,2010,30(12):3447-3453.Wu Hai-li,Huang Qing-mei,Yuan Xin-fang,et al.Experimental research of evaluating methods of image quality based on models of S-CIELAB and iCAM[J].Acta Optica Sinica,2010,30(12):3447-3453.
[5]Baranczuk Z.Image-individualized gamut mapping algorithms[J].Journal of Imaging and Technology,2010,54(3):030201.
[6]Zhang Lin,Zhang Lei,Mou Xuan-qin,et al.FSIM:a feature similarity index for image quality assessment[J].IEEE Transactions on Image Processing,2011,20(8):2378-2386.
[7]Kovesi P.Image features from phase congruency[J].Videre:Journal of Computer Vision Research,1999,1(3):1-26.
[8]Zhang Xuan-de,F(xiàn)eng Xiang-chu,Wang Wei-wei,et al.Edge strength similarity for image quality assessment[J].IEEE Signal Processing Letters,2013,20(4):319-322.
[9]黃慶梅,趙達(dá)尊.彩色復(fù)制中的色域映射[J].照明工程學(xué)報,2002,13(1):19-26.Huang Qing-mei,Zhao Da-zun.Color gamut mapping in color reproduction[J].China Illuminating Engineering Journal,2002,13(1):19-26.
[10]Ponomarenko N,Lukin V,Zelenshy A,et al.TID2008-a database for evaluation of full-reference visual quality assessment metrics[J].Advanced of Modern Radio-electronics,2009,10:30-45.
[11]Wang Zhou,Bovik Alan Contrad,Sheikh Hamid Rahim,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004,13(4):600-612.