国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于非線性高斯平均差分的圖像質(zhì)量評(píng)價(jià)

2019-10-18 00:45校嘉蔚張選德
關(guān)鍵詞:高斯差分主觀

校嘉蔚,張選德

(陜西科技大學(xué) 電子信息與人工智能學(xué)院,陜西 西安 710021)

0 引言

在信息時(shí)代,圖像作為一種應(yīng)用極為廣泛的信息源,在幫助人類更好地認(rèn)知世界的同時(shí),也給人類帶來了巨大挑戰(zhàn).由于圖像信息在采集、編碼、存儲(chǔ)、傳輸?shù)入A段需要大量設(shè)備資源及成本的投入,并且圖像信息易遭受噪聲污染使得處理過程難度增加,因此如何準(zhǔn)確地評(píng)價(jià)圖像質(zhì)量已經(jīng)成為亟待解決的問題[1-3].在圖像質(zhì)量評(píng)價(jià)中,人類作為圖像信息的最終感知者,其主觀評(píng)價(jià)最為直接可靠,但主觀評(píng)價(jià)耗時(shí)費(fèi)力成本高且不具有實(shí)時(shí)性,所以有必要研究客觀評(píng)價(jià)方法.客觀評(píng)價(jià)方法旨在構(gòu)建數(shù)學(xué)模型來預(yù)測(cè)圖像質(zhì)量,以達(dá)到與主觀評(píng)價(jià)一致性較高的評(píng)分.

根據(jù)能夠得到的參考信息的多少,圖像質(zhì)量評(píng)價(jià)可分為全參考圖像質(zhì)量評(píng)價(jià)、無參考圖像質(zhì)量評(píng)價(jià)和部分參考圖像質(zhì)量評(píng)價(jià),本文的研究對(duì)象為全參考圖像質(zhì)量評(píng)價(jià)[4].圖像質(zhì)量客觀評(píng)價(jià)中,最簡(jiǎn)單的全參考圖像質(zhì)量評(píng)價(jià)方法為均方誤差(Mean Squared Error,MSE)和峰值信噪比(Peak Signal-to-Noise Ratio,PSNR),它們直接通過計(jì)算參考圖像和失真圖像像素灰度值上的差異來評(píng)估失真圖像的質(zhì)量,其方法簡(jiǎn)單,但由于未考慮人類視覺系統(tǒng)的特性,其評(píng)價(jià)效果與主觀評(píng)價(jià)相差甚遠(yuǎn)[5-7].

隨著對(duì)人類視覺系統(tǒng)認(rèn)知的深入,人們開始將人類視覺系統(tǒng)的某些特性引入到客觀質(zhì)量評(píng)價(jià)中,提出了大量的圖像質(zhì)量評(píng)價(jià)算法.2004年,Wang Zhou等[8]提出結(jié)構(gòu)相似性理論(Structural Similarity Index,SSIM),該算法假設(shè)人類視覺系統(tǒng)能夠高度自適應(yīng)地提取場(chǎng)景中的結(jié)構(gòu)信息,對(duì)參考圖像的亮度、對(duì)比度和結(jié)構(gòu)信息進(jìn)行比較,得到了較好的效果,被認(rèn)為是圖像質(zhì)量評(píng)價(jià)領(lǐng)域具有里程碑意義的算法.該算法受到了研究者的廣泛關(guān)注,同時(shí)也激發(fā)研究者不斷探索HVS對(duì)圖像質(zhì)量的感知機(jī)制,并將其應(yīng)用于IQA算法設(shè)計(jì),以求獲得與主觀評(píng)價(jià)更好的一致性.

隨后,許多學(xué)者在SSIM的基礎(chǔ)上進(jìn)行了改進(jìn),提出多尺度的結(jié)構(gòu)相似性[9](Multi-Scale Structural Similarity Index,MS-SSIM)和信息量加權(quán)的結(jié)構(gòu)相似性[10](Information Content Weighted Structural Similarity Index,IW-SSIM)評(píng)價(jià)算法.MS-SSIM算法將不同分辨率和觀察條件下的圖像細(xì)節(jié)結(jié)合到質(zhì)量評(píng)價(jià)算法中;IW-SSIM算法則基于互信息理論提出信息量加權(quán)的池化策略,由信息量的大小度量視覺顯著的不同程度,局部質(zhì)量圖的計(jì)算依舊采用SSIM中的定義,這兩種算法的精確度相較于SSIM都有了一定的提高.

2011年,Zhang Lin等[11]提出的特征相似性算法FSIM(Feature Similarity)強(qiáng)調(diào)人類視覺系統(tǒng)理解圖像主要根據(jù)圖像低級(jí)特征,選擇相位一致性(Phase Congruency,PC)和圖像梯度幅值(Gradient Magnitude,GM)作為特征來計(jì)算圖像質(zhì)量.此后又加入顏色特征并用相位一致性信息做加權(quán)平均,發(fā)展出FSIMc算法.

2013年,Zhang Xuande等[12]提出的ESSIM假定圖像中能夠被感知到的邊界是形成語義認(rèn)知的基礎(chǔ),并結(jié)合圖像邊界的各向異性、正則性和奇異性等因素來定義邊界強(qiáng)度,然后基于邊界強(qiáng)度的相似性來度量圖像質(zhì)量.

Xue Wufeng等[13]于2014年發(fā)表的GMSD(Gradient Magnitude Similarity Deviation)只用梯度作為特征,采用標(biāo)準(zhǔn)差池化策略代替以前的均值池化策略,達(dá)到了較好的效果.

2017年發(fā)表的基于哈爾小波的相似性算法HaarPSI[14]首先將圖像進(jìn)行Haar小波變換,細(xì)尺度用來計(jì)算相似度譜,較粗尺度用來對(duì)相似度譜進(jìn)行加權(quán)從而度量圖像質(zhì)量,是目前在公認(rèn)數(shù)據(jù)庫上效果最好的算法.

以上大多數(shù)算法都基于某種假設(shè),其用到的特征主要包括結(jié)構(gòu)相似度、信息保真度、梯度、邊緣強(qiáng)度等,一些算法還將多種特征融合以求更為全面地表達(dá)圖像信息,但由于多重特征提取的算法復(fù)雜度較高,常常會(huì)導(dǎo)致評(píng)價(jià)效率的降低,也難以判斷哪種特征在評(píng)價(jià)算法中能夠更好的刻畫變化.圖像質(zhì)量評(píng)價(jià)的本質(zhì)是構(gòu)造一個(gè)合適的模型模擬人類視覺系統(tǒng)來度量參考圖像與失真圖像之間的變化,其關(guān)鍵在于模擬人類視覺系統(tǒng)對(duì)于圖像質(zhì)量的感知過程[15].

本文遵循人類視覺系統(tǒng)具有非線性的特點(diǎn),提出了一種非線性高斯平均差分圖像質(zhì)量評(píng)價(jià)算法.該算法利用高斯濾波器和均值濾波器分別對(duì)圖像進(jìn)行卷積,通過高斯平均差分得到差分圖像,并對(duì)差分圖像采取非線性處理后計(jì)算相似度譜,在求得相似度譜后再一次采取非線性處理得到最終的相似性度量,最后對(duì)相似度譜進(jìn)行均值池化得到質(zhì)量評(píng)分.此算法更符合人類視覺系統(tǒng)的非線性特點(diǎn),在測(cè)試數(shù)據(jù)庫上的實(shí)驗(yàn)表明,此算法能夠獲得與主觀評(píng)價(jià)較好的一致性.

1 神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)與HVS的非線性特點(diǎn)

1.1 神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)

神經(jīng)網(wǎng)絡(luò)是一個(gè)相當(dāng)大的、多學(xué)科交叉的學(xué)科領(lǐng)域.目前對(duì)于神經(jīng)網(wǎng)絡(luò)使用最廣泛的定義是“由具有適應(yīng)性的簡(jiǎn)單單元組成的廣泛的并行互連的網(wǎng)絡(luò),它的組織能夠模擬生物神經(jīng)系統(tǒng)對(duì)真實(shí)世界物體所做出的交互反應(yīng)”[16].神經(jīng)網(wǎng)絡(luò)中最基本的成分是神經(jīng)元模型,在生物神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元與其他神經(jīng)元相連,當(dāng)它“興奮”時(shí),就會(huì)向相連的神經(jīng)元發(fā)送化學(xué)物質(zhì),從而改變這些神經(jīng)元內(nèi)的電位;如果某神經(jīng)元的電位超過了一個(gè)“閾值”,那么它就會(huì)被激活,即“興奮”起來,向其他神經(jīng)元發(fā)送化學(xué)物質(zhì).后來上述情形被抽象為“M-P神經(jīng)元模型”[17].在這個(gè)模型中,神經(jīng)元接收到來自n個(gè)其他神經(jīng)元傳遞過來的輸入信號(hào),這些輸入信號(hào)通過帶權(quán)重的連接進(jìn)行傳遞,神經(jīng)元接收到的總輸入值將與神經(jīng)元的閾值進(jìn)行比較,然后通過“激活函數(shù)”處理以產(chǎn)生神經(jīng)元的輸出.設(shè)第j個(gè)神經(jīng)元在多個(gè)輸入xi(i=1,2,3,…,n)的作用下,產(chǎn)生了輸出yj,則神經(jīng)元輸入、輸出之間的關(guān)系可以記為

yj=f(xi)

(1)

式(1)中:f為激活函數(shù).f(xi)的表達(dá)形式不同,可以構(gòu)成不同的神經(jīng)元模型,其中比較典型的有線性函數(shù)、階躍函數(shù)和Sigmoid函數(shù)等.理想中的激活函數(shù)是階躍函數(shù),它將輸入值映射為輸出值“0”或“1”,顯然“1”對(duì)應(yīng)于神經(jīng)元興奮,“0”對(duì)應(yīng)于神經(jīng)元抑制.然而,階躍函數(shù)具有不連續(xù)、不光滑等性質(zhì),因此實(shí)際常用Sigmoid函數(shù)作為激活函數(shù).它可將神經(jīng)元的輸出限制在兩個(gè)有限值之間,具有圖1所示類似指數(shù)函數(shù)的形狀,且在物理意義上最為接近生物神經(jīng)元[18].其一般表達(dá)式為

(2)

式(2)中:參數(shù)α>0.

圖1 激活函數(shù)l(x)

在神經(jīng)網(wǎng)絡(luò)中,如果沒有使用激活函數(shù),每一層輸出都是上層輸入的線性函數(shù),無論神經(jīng)網(wǎng)絡(luò)有多少層,輸出都是輸入的線性組合,這種情況就是最原始的感知機(jī).相反,激活函數(shù)給神經(jīng)元引入了非線性因素,使得神經(jīng)網(wǎng)絡(luò)可以任意逼近任何非線性函數(shù),這樣神經(jīng)網(wǎng)絡(luò)就可以應(yīng)用到眾多的非線性模型中.

1.2 HVS的非線性特點(diǎn)

人對(duì)于圖像質(zhì)量的評(píng)價(jià)不僅與圖像信號(hào)差異有關(guān),而且取決于人的主觀判斷.也就是說,在評(píng)價(jià)圖像時(shí),不僅要考慮信號(hào)值的差異,也要考慮人的視覺和心理機(jī)制,即HVS在感知和理解階段具有非線性的特點(diǎn)[19].如圖2所示,當(dāng)向原圖像加上成倍增加的高斯噪聲后,人眼對(duì)于這四幅圖的質(zhì)量評(píng)分并不成倍下降,可以清楚觀察到,圖2(b)、(c)、(d)之間的變化很難被人眼察覺,因此人類視覺系統(tǒng)在進(jìn)行主觀評(píng)價(jià)時(shí)會(huì)給出較相似的質(zhì)量評(píng)分,而在一般算法中,只考慮客觀變化時(shí),圖2(b)較圖2(c)和(d)具有較高的圖像質(zhì)量評(píng)分.大多數(shù)算法通過處理得到的圖像之間的變化屬于客觀變化,而人眼所觀察到的變化經(jīng)處理后屬于主觀變化,這兩種變化之間存在一種非線性映射關(guān)系.我們借由神經(jīng)網(wǎng)絡(luò)中激活函數(shù)的啟發(fā),利用式(3)將客觀計(jì)算量經(jīng)由激活函數(shù)轉(zhuǎn)換為主觀量,構(gòu)建了一種非線性圖像質(zhì)量評(píng)價(jià)算法,使得評(píng)分更符合HVS的非線性特點(diǎn).

(a)Wall原圖 (b)Wall 高斯噪聲sigma=0.000 25

(c)Wall (d)Wall高斯噪聲sigma=0.002 5 高斯噪聲sigma=0.025圖2 不同失真程度的Wall圖像

1.3 非線性圖像質(zhì)量評(píng)價(jià)模型

一個(gè)神經(jīng)元的功能是求得輸入向量與權(quán)向量的內(nèi)積后,經(jīng)一個(gè)非線性傳遞函數(shù)得到一個(gè)標(biāo)量結(jié)果.類似地,在圖像質(zhì)量評(píng)價(jià)中,將應(yīng)用圖像與濾波器作內(nèi)積得到特征譜,再經(jīng)非線性傳遞函數(shù)得到結(jié)果.其模型可表示為

I(r,d)=l[S(l(Diff))]

(3)

式(3)中:l表示計(jì)算激活函數(shù);S表示計(jì)算相似度譜;Diff表示計(jì)算參考圖像和失真圖像之間的差異;r和d分別表示參考圖像和失真圖像.

本算法在求得參考圖像和失真圖像之間的高斯平均差分后,通過一個(gè)非線性傳遞函數(shù)得到非線性高斯平均差分結(jié)果,再由此結(jié)果求得相似度譜,最終對(duì)相似度譜進(jìn)行一個(gè)非線性傳遞函數(shù)處理并經(jīng)均值池化得到質(zhì)量評(píng)分.在本文算法中,所用到的激活函數(shù)為Sigmoid函數(shù).經(jīng)實(shí)驗(yàn)證明,此函數(shù)很好地?cái)M合了人體神經(jīng)元的工作原理,更符合人類視覺系統(tǒng)特性,在測(cè)試數(shù)據(jù)庫上的實(shí)驗(yàn)表明,此算法能夠獲得與主觀評(píng)價(jià)較好的一致性.

2 基于非線性高斯平均差分的圖像質(zhì)量評(píng)價(jià)算法

視覺系統(tǒng)在處理圖像信息時(shí)采用的基本方式之一,就是通過不同形式的感受逐級(jí)進(jìn)行抽取,也就是在每一水平上拋棄某些不太重要的信息,抽取更有用的信息[19].Hubel &Wiesel認(rèn)為大腦皮層包含了大量的特征探測(cè)器,這些探測(cè)器可以調(diào)節(jié)不同寬度和方向的邊緣.相應(yīng)的,D.Marr &E.Hildreth提出自然圖像在大尺度范圍內(nèi)會(huì)發(fā)生亮度變化,這些變化需要在不同尺度探測(cè)器下檢測(cè).在給定尺度下,高斯函數(shù)的二階導(dǎo)數(shù)是較為合適的濾波器,因此對(duì)于圖像I來說,找到2G(x,y)*I(x,y)的零點(diǎn)是檢測(cè)給定尺度下圖像亮度變化的最佳方法.其中,G(x,y)為二維高斯分布,2為拉普拉斯,2G可看作是Wilson′s 所提出的高斯差(Difference of Gaussians,“DOG”)的極限,因此使用DOG來近似2G[20,21].DOG算法被認(rèn)為是在模擬視網(wǎng)膜上的神經(jīng)從圖像中提取信息從而提供給大腦.

本算法對(duì)DOG濾波器進(jìn)行變形,由高斯濾波器和均值濾波器組成高斯平均差(Difference of Gaussians and Mean,“DOGM”)來度量邊緣亮度變化.本文NLDOGM算法的總體框架如圖3所示,首先分別對(duì)參考圖像和失真圖像進(jìn)行卷積并求得高斯平均差分圖像,對(duì)所求得差分圖像采取非線性處理,使所度量的變化由客觀量轉(zhuǎn)換為主觀量,在求得相似度譜后再一次采取非線性處理得到最終的相似性度量,最后經(jīng)均值池化得到質(zhì)量評(píng)分.

記參考圖像為r=[r1,…,ri,…,rN]T∈RN,失真圖像為d=[d1,…,di,…,dN]T∈RN,其中i表示像素索引,N表示像素總數(shù).圖像之間的變化由高斯平均差度量,即采用高斯濾波器h1和均值濾波器h2分別對(duì)參考圖像和失真圖像進(jìn)行卷積,在i處卷積后的圖像記為

g1(r,i)=h1*r

(4)

g2(r,i)=h2*r

(5)

g1(d,i)=h1*d

(6)

g2(d,i)=h2*d

(7)

于是,同一模板的高斯平均差分圖像定義為

DOGM(r,i)=g1(r,i)-g2(r,i)

(8)

DOGM(d,i)=g1(d,i)-g2(d,i)

(9)

(10)

(11)

兩者的相似度譜計(jì)算定義為

S(r,d)=

(12)

式(12)中:C為調(diào)節(jié)參數(shù).

最后以逐點(diǎn)像素的非線性高斯平均差分預(yù)測(cè)圖像質(zhì)量,本文采用均值池化策略計(jì)算圖像的客觀評(píng)分,考慮到HVS對(duì)于感知到的變化在處理時(shí)也具有非線性的特點(diǎn),因此在均值池化之前再一次對(duì)由非線性高斯平均差分得到的相似度譜進(jìn)行非線性操作,最終本算法可概括為

NLDOGM(r,d)=

(13)

圖3 NLDOGM的實(shí)現(xiàn)框架.其中r為參考圖像,d為失真圖像

3 實(shí)驗(yàn)結(jié)果分析

3.1 數(shù)據(jù)庫及評(píng)估方法

對(duì)新提出的IQA評(píng)價(jià)指標(biāo)與已存在IQA評(píng)價(jià)指標(biāo)進(jìn)行比較時(shí),需在公開數(shù)據(jù)庫上進(jìn)行實(shí)驗(yàn).通常,在一個(gè)數(shù)據(jù)庫中有一組參考圖像,每一幅參考圖像有許多不同類型的失真圖像,每一種類型又有不同失真等級(jí)的失真圖像.目前,圖像質(zhì)量評(píng)價(jià)的公開數(shù)據(jù)庫有7個(gè),分別為CSIQ、LIVE、IVC、MICT、A57、WIQ、TID 2008和TID2013,這些數(shù)據(jù)庫具有不同數(shù)目的參考圖像、失真圖像、失真類型和失真等級(jí),并且在圖像個(gè)數(shù)和觀察者人數(shù)等方面都有很大不同.比如,A57數(shù)據(jù)庫中為灰度圖像,有3幅參考圖像、54幅失真圖像、6種失真類型和7個(gè)觀察者.LIVE和CSIQ數(shù)據(jù)庫中的圖像都是以常見失真類型為主,即加性高斯白噪聲、高斯模糊、JPEG壓縮和JPEG2000壓縮等;而TID2013數(shù)據(jù)庫為彩色圖像,有25幅參考圖像、3 000幅失真圖像、24種失真類型和971個(gè)觀察者.在以上7個(gè)數(shù)據(jù)庫中TID2008[22]、TID2013[23]、CSIQ[24]、LIVE[25]是最具綜合性的.因此選用以上四大公開圖像測(cè)試數(shù)據(jù)庫作為本文實(shí)驗(yàn)數(shù)據(jù)對(duì)象.

客觀質(zhì)量評(píng)價(jià)指標(biāo)在數(shù)據(jù)庫上對(duì)每幅失真圖像完成客觀評(píng)分后,通過以下四個(gè)評(píng)價(jià)方法度量IQA指標(biāo)的效果,分別為斯皮爾曼相關(guān)系數(shù)(Spearman Rank Order Correlation Coefficient,SROCC),肯德爾相關(guān)系數(shù)(Kendall Rank Order Correlation Coefficient,KROCC),皮爾森線性相關(guān)系數(shù)(Pearson Linear Correlation Coefficient,PLCC)和均方根誤差(Root Mean Square Error,RMSE).

令某一圖像質(zhì)量指標(biāo)對(duì)數(shù)據(jù)庫中第i幅圖像給出的客觀質(zhì)量評(píng)分為xi,i=1,2,…,n,這幅圖像的主觀質(zhì)量評(píng)分(Mean Opinion Score,MOS)值為yi,則SROCC相關(guān)系數(shù)為

(14)

式(14)中:Di為xi和yi按順序排列后的序號(hào)差,若(xi,yi)與(xj,yj)滿足xi>xj且yi>yj(xi

(15)

這兩種度量只考慮主客觀評(píng)分單調(diào)性而不考慮分值之間的相對(duì)距離[26].另外為了計(jì)算PLCC和RMSE這兩個(gè)評(píng)價(jià)指標(biāo),需要提供一個(gè)回歸分析,預(yù)測(cè)客觀分?jǐn)?shù)和主觀平均意見分?jǐn)?shù)之間的非線性映射.

(16)

式(16)中:x和ρ(x)分別為IQA算法客觀評(píng)分及非線性映射后的分值,β1,β2,β3,β4和β5為函數(shù)參數(shù).然后利用xi,i=1,2,…,n經(jīng)ρ(x)映射后的值記為zi=ρ(xi)和yi,i=1,2,…,n之間的PLCC相關(guān)系數(shù)和RMSE來度量主客觀評(píng)分的一致性.其中PLCC定義為兩者協(xié)方差與標(biāo)準(zhǔn)差的商

(17)

(18)

SROCC、KROCC和PLCC的值都在[-1,1]之間,負(fù)值表示負(fù)相關(guān).這三種相關(guān)系數(shù)的絕對(duì)值越高,說明客觀評(píng)價(jià)方法與主觀評(píng)價(jià)結(jié)果的一致性越高.與前三種相關(guān)系數(shù)不同,RMSE值較小,說明主客觀相關(guān)性越高,算法越準(zhǔn)確.

3.2 實(shí)驗(yàn)參數(shù)

本文算法中需設(shè)定參數(shù)有C,α和β.在計(jì)算相似性度量時(shí),為避免分母為零以及保持計(jì)算的穩(wěn)定性,常引入調(diào)節(jié)參數(shù)C;α和β分別為兩次非線性處理中激活函數(shù)的參數(shù),α用于以高斯平均差分計(jì)算相似度譜時(shí)將其由客觀量轉(zhuǎn)換為主觀量的非線性處理中;β則用于以相似度譜計(jì)算最終質(zhì)量時(shí)將客觀量轉(zhuǎn)換為主觀量的非線性處理中.這兩次非線性處理的依據(jù)為HVS的非線性特點(diǎn),即人眼在觀察圖像時(shí),并不以圖像質(zhì)量的線性改變而給出相應(yīng)的線性質(zhì)量評(píng)分,因此對(duì)于差分圖像采取非線性處理使其由客觀量轉(zhuǎn)換為主觀量;主觀評(píng)分階段中,對(duì)于所觀察到的變化在處理時(shí)也具有非線性特點(diǎn),因此對(duì)于相似度譜也采取了同樣的非線性處理.實(shí)驗(yàn)參數(shù)通過在TID2008數(shù)據(jù)庫的子集上實(shí)驗(yàn)來確定,子集包含數(shù)據(jù)庫中前6個(gè)參考圖像及相應(yīng)的408幅失真圖像,以在該子集上獲得最高的SROCC值確定最佳參數(shù)值,根據(jù)實(shí)驗(yàn)數(shù)據(jù),最終分別取C,α和β的值為0.25,20和0.13.

3.3 性能比較

實(shí)驗(yàn)中采用的比較算法包括PSNR、VSNR、SSIM、MS-SSIM、IW-SSIM、和FSIM、ESSIM、GMSD、GSIM.所有這些算法均用 MATLAB-R2016a來實(shí)現(xiàn)且在dell-PC Intel(R)Core(TM)i7-7700 CPU @ 3.60GHz 3.60 GHz,8G內(nèi)存的計(jì)算機(jī)上運(yùn)行.實(shí)驗(yàn)中對(duì)比算法直接采用作者公布的代碼.

另外,對(duì)于彩色圖像,實(shí)驗(yàn)中只對(duì)亮度成分進(jìn)行評(píng)價(jià),亮度成分用下式來提取

l=0.299R+0.587G+0.114B

(19)

式(19)中:彩色圖像紅、綠、藍(lán)三通道分別用R,G,B表示.

首先驗(yàn)證算法在整體數(shù)據(jù)庫上的評(píng)價(jià)效果,表1列出了九種不同圖像質(zhì)量評(píng)價(jià)算法在TID2008,TID2013,CSIQ和LIVE數(shù)據(jù)庫上關(guān)于四個(gè)性能評(píng)價(jià)指標(biāo)的評(píng)價(jià)結(jié)果.從表1可以看出,排名首位算法中算法NLDOGM出現(xiàn)6次,ESSIM同樣出現(xiàn)6次,GMSD出現(xiàn)4次,F(xiàn)SIM出現(xiàn)1次.表中排名第二位算法中NLDOGM出現(xiàn)3次,ESSIM同樣出現(xiàn)3次,GMSD出現(xiàn)3次,F(xiàn)SIM出現(xiàn)5次.在TID2008與TID2013這兩個(gè)數(shù)據(jù)庫上,SROCC、KROCC指標(biāo)結(jié)果顯示,NLDOGM算法在圖像主客觀評(píng)價(jià)分值單調(diào)性能比較上略高于GMSD,均好于其他算法;在預(yù)測(cè)準(zhǔn)確性方面,ESSIM和NLDOGM效果相當(dāng),優(yōu)于其他算法.在LIVE數(shù)據(jù)庫上,NLDOGM的KROCC指標(biāo)和均方根誤差RMSE指標(biāo)分別與ESSIM并列第一,均優(yōu)于FSIM和GMSD.

表1 九種不同IQA算法在TID2008、TID2013、LIVE、CSIQ數(shù)據(jù)庫的實(shí)驗(yàn)結(jié)果比較

續(xù)表1

數(shù)據(jù)庫性能指標(biāo)PSNRVSNRSSIMMS-SSIMIW-SSIMFSIMESSIMGMSDNLDOGMLIVESROCCKROCCPLCCRMSE0.8750.6860.87213.360.9270.7620.92310.500.9470.7960.9448.9440.9440.7920.9439.0950.9560.8170.9528.3470.9630.8330.9597.6780.9620.8390.9537.0030.9600.8230.9607.620.9620.8390.9537.003CSIQSROCCKROCCPLCCRMSE0.8050.6080.8000.1570.8110.6250.8000.1580.8750.6900.8610.1330.9130.7390.8990.1140.9210.7520.9140.1060.9240.7560.9120.1000.9320.7680.9220.1010.9570.8130.9540.0790.9540.8070.8250.174

為了進(jìn)一步驗(yàn)證本文算法的圖像質(zhì)量評(píng)價(jià)效果,針對(duì)圖像單一失真類型進(jìn)行實(shí)驗(yàn),選取SROCC相關(guān)系數(shù)作為評(píng)價(jià)指標(biāo).表2中列出了九種評(píng)價(jià)算法在TID2008上對(duì)每一種失真類型SROCC指標(biāo)的評(píng)價(jià)效果,并加粗顯示了排名前兩位的實(shí)驗(yàn)結(jié)果.從表2可以看出,PSNR對(duì)噪聲類型(以彩色分量為主的加性噪聲ANMC、掩膜噪聲MN、高頻噪聲HFN和脈沖噪聲IMN)的失真有較好的評(píng)價(jià)效果.但對(duì)其它失真類型的評(píng)價(jià)效果與主觀評(píng)價(jià)一致性較差,NLDOGM算法能夠在噪聲類失真上取得與 PSNR 相當(dāng)?shù)男Ч?另外,表中顯示 NLDOGM 算法對(duì)TID2008上大部分失真類型的評(píng)價(jià)效果較好.綜上,本文算法針對(duì)不同類型失真能取得與主觀評(píng)價(jià)較好的一致性.

表2 九種不同IQA算法在TID2008數(shù)據(jù)庫單一失真性能(SROCC)的比較

4 結(jié)論

本文工作的貢獻(xiàn)主要有兩點(diǎn):其一,在以往經(jīng)典的以構(gòu)造某種度量來刻畫變化的框架上,將神經(jīng)網(wǎng)絡(luò)中的非線性處理與其相結(jié)合,提出一種基于非線性高斯平均差分圖像質(zhì)量評(píng)價(jià)算法.文中將神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)框架映射在圖像質(zhì)量評(píng)價(jià)這個(gè)問題中,使得本算法能夠獲得較好的評(píng)價(jià)效果.

其二,文中討論的現(xiàn)有大多數(shù)IQA算法基于度量圖像之間的客觀變化而設(shè)計(jì),并未結(jié)合HVS的非線性特點(diǎn),本算法考慮了HVS的非線性特點(diǎn)并構(gòu)建了一種基于非線性高斯平均差分的圖像質(zhì)量評(píng)價(jià)算法,該算法通過度量參考圖像與失真圖像的非線性高斯平均差分之間的相似性來預(yù)測(cè)圖像質(zhì)量,在公開測(cè)試數(shù)據(jù)庫中與目前主流算法進(jìn)行實(shí)驗(yàn)比較,本文算法取得較好的結(jié)果.

近年來,基于機(jī)器學(xué)習(xí)的方法普遍應(yīng)用于無參考圖像質(zhì)量評(píng)價(jià)中,并能夠取得較好的效果.如何將機(jī)器學(xué)習(xí)方法與特征提取方法相結(jié)合應(yīng)用于特定圖像質(zhì)量評(píng)價(jià)中,是我們下一步研究的方向.

猜你喜歡
高斯差分主觀
RLW-KdV方程的緊致有限差分格式
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
“美好生活”從主觀愿望到執(zhí)政理念的歷史性提升
數(shù)列與差分
加一點(diǎn)兒主觀感受的調(diào)料
數(shù)學(xué)王子高斯
天才數(shù)學(xué)家——高斯
對(duì)立與存在
從自卑到自信 瑞恩·高斯林
相對(duì)差分單項(xiàng)測(cè)距△DOR