馬華林 張立燕
1(浙江工商職業(yè)技術(shù)學(xué)院 浙江 寧波 315012)2(寧波大學(xué)信息科學(xué)與工程學(xué)院 浙江 寧波 315012)
HDR圖像相比低動(dòng)態(tài)范圍(Low Dynamic Range,LDR)圖像能夠表示更大的亮度范圍,其亮度范圍大約是10-4cd/m2~105cd/m2[1-2]。LDR圖像能表示的動(dòng)態(tài)范圍不超過(guò)3個(gè)數(shù)量級(jí),但人類視覺(jué)系統(tǒng)在真實(shí)場(chǎng)景中可以接受的動(dòng)態(tài)范圍可以達(dá)到6個(gè)數(shù)量級(jí)。因此,HDR圖像對(duì)用戶來(lái)說(shuō)感受更真實(shí)更有吸引力。隨著成像和計(jì)算機(jī)圖形學(xué)技術(shù)的發(fā)展,HDR圖像的獲得越來(lái)越容易。然而,HDR顯示設(shè)備比較昂貴[3],超出了普通消費(fèi)者的承受范圍。為了解決這個(gè)問(wèn)題,產(chǎn)業(yè)界和學(xué)術(shù)界開發(fā)了許多色調(diào)映射算子[4],TMO能夠把HDR圖像轉(zhuǎn)換成LDR圖像,轉(zhuǎn)換后的LDR圖像被稱為色調(diào)映射圖像(Tone-mapped Image,TMI)。由于TMI相對(duì)HDR圖像縮小了動(dòng)態(tài)范圍,不可避免地產(chǎn)生失真,例如亮度信息丟失、結(jié)構(gòu)信息丟失、不自然的顏色等。針對(duì)一個(gè)HDR圖像,不同的TMO產(chǎn)生的效果不一樣。因此,TMI質(zhì)量評(píng)價(jià)對(duì)于選擇合適的TMO和改進(jìn)TMO本身具有重要的研究意義。
TMI質(zhì)量評(píng)價(jià)分為主觀質(zhì)量評(píng)價(jià)和客觀質(zhì)量評(píng)價(jià),而早期的TMO性能評(píng)價(jià)主要采用主觀質(zhì)量評(píng)價(jià)。因?yàn)槿搜凼荰MI的最終接受者,主觀質(zhì)量評(píng)分具有準(zhǔn)確性高的特點(diǎn)。然而,主觀質(zhì)量評(píng)價(jià)[5]具有三方面的缺點(diǎn):主觀質(zhì)量評(píng)價(jià)比較耗時(shí)費(fèi)力,需要昂貴的HDR顯示器和多個(gè)測(cè)試人員多次實(shí)驗(yàn);主觀質(zhì)量不能嵌入到圖像處理系統(tǒng)來(lái)改進(jìn)TMO;主觀評(píng)價(jià)由于人為的一些不確定因素導(dǎo)致評(píng)價(jià)的誤差,例如對(duì)于主觀評(píng)分相近的兩個(gè)圖像人眼也很難判斷哪個(gè)圖像更好一點(diǎn)。傳統(tǒng)的客觀質(zhì)量評(píng)價(jià)方法假定參考圖像和測(cè)試圖像具有相同的動(dòng)態(tài)范圍,因此傳統(tǒng)的客觀質(zhì)量評(píng)價(jià)方法不能直接評(píng)價(jià)TMI。
近年來(lái),全參考TMI質(zhì)量評(píng)價(jià)算法取得了豐碩的成果。Yeganeh等[5]是最先關(guān)注TMI質(zhì)量評(píng)價(jià)的學(xué)者之一。他們首次建立了色調(diào)映射圖像數(shù)據(jù)庫(kù)(Tone-mapped Image Database,TMID),可以下載并用于評(píng)價(jià)TMI質(zhì)量評(píng)價(jià)算法的性能。同時(shí),他們提出了一種全參考TMI質(zhì)量評(píng)價(jià)方法(Tone Mapped Image Quality Index,TMQI)。這個(gè)方法的基本思想是高質(zhì)量的TMI不但要保護(hù)HDR圖像的結(jié)構(gòu)信息,還要保留圖像的自然場(chǎng)景統(tǒng)計(jì)特性(Natural Scene Statistics,NSS)。Nafchi等[6]基于圖像的局部相位信息提出了FSITM方法,該方法考慮了圖像的顏色信息,但沒(méi)有考慮圖像的自然度。Kundu等[7]針對(duì)TMQI均勻池化的缺點(diǎn),在TMQI基礎(chǔ)上加入了視覺(jué)注意力模型,運(yùn)用感知池化策略提升質(zhì)量評(píng)價(jià)算法的性能。Xie等[8]使用字典學(xué)習(xí)技術(shù)在稀疏域提取局部結(jié)構(gòu)相似度和全局自然度,合并這兩個(gè)特征提出了一種全參考質(zhì)量評(píng)價(jià)算法SMTI。鑒于色調(diào)映射圖像失真類型多的特點(diǎn),Hadizadeh等[9]從結(jié)構(gòu)保真度、自然度、亮度、顏色等方面提取了八類特征來(lái)評(píng)價(jià)TMI質(zhì)量。
無(wú)參考TMI質(zhì)量評(píng)價(jià)相對(duì)全參考TMI質(zhì)量評(píng)價(jià)具有更強(qiáng)的實(shí)用性。由于TMI失真通常不會(huì)出現(xiàn)模糊、塊效應(yīng)等類型的失真,傳統(tǒng)的無(wú)參考質(zhì)量評(píng)價(jià)算法不適合評(píng)價(jià)TMI。Gu等[10]結(jié)合信息量、結(jié)構(gòu)、自然度三方面提出了BTMQI算法,該算法取得了很好的效果,但沒(méi)有考慮TMI的顏色失真。Yue等[11]模擬人腦對(duì)顏色信息的處理過(guò)程來(lái)評(píng)價(jià)TMI質(zhì)量,從簡(jiǎn)單細(xì)胞的響應(yīng)中提取紋理信息特征,從復(fù)雜細(xì)胞的響應(yīng)中提取結(jié)構(gòu)和紋理信息。本文提出一種基于人眼感知的無(wú)參考色調(diào)映射圖像質(zhì)量評(píng)價(jià)方法,主要貢獻(xiàn)如下:
(1) 首次采用聚類算法針對(duì)TMI高亮區(qū)、低暗區(qū)曝光異常的特點(diǎn)把色調(diào)映射圖像分成暗區(qū)、中間區(qū)、亮區(qū),根據(jù)物理亮度距離與聚類中心亮度值的特性,優(yōu)化了使用K-means聚類對(duì)TMI分區(qū)的方法。相對(duì)不分區(qū)的色調(diào)映射圖像質(zhì)量評(píng)價(jià)方法顯著提高算法性能。
(2) 在色調(diào)映射圖像質(zhì)量評(píng)價(jià)研究中首次使用非負(fù)矩陣分解方法,根據(jù)TMI灰度圖像非負(fù)矩陣分解獲得的系數(shù)特性,提出了一種新的圖像顯著性區(qū)域識(shí)別方法。
(3) 結(jié)合亮度和顏色兩種信息來(lái)提取圖像自然度,發(fā)現(xiàn)了亮度自然度和顏色自然度的互補(bǔ)性,相對(duì)單獨(dú)使用顏色自然度或者亮度自然度顯著提高了算法的SROCC指標(biāo)。
根據(jù)Weber定律,人眼能感受到的最小亮度變化應(yīng)滿足ΔS=KS,其中K為常量,當(dāng)亮度值S相近時(shí),對(duì)應(yīng)的能被人眼感知的最小亮度變化范圍ΔS也相近,按照祖母神經(jīng)元理論人眼感受到亮度變化的原因是由一組感受S+ΔS亮度的神經(jīng)細(xì)胞興奮所致。因此,聚集亮度感知變化范圍相似的細(xì)胞為同一個(gè)類別,分別分析每一類細(xì)胞感知到的圖像質(zhì)量。本文首先把TMI轉(zhuǎn)換成灰度圖像,然后使用K-means聚類算法把灰度圖像按照亮度值進(jìn)行聚類,每一類對(duì)應(yīng)一個(gè)區(qū)域,在多個(gè)區(qū)域分別提取特征來(lái)評(píng)價(jià)圖像質(zhì)量。
根據(jù)TVI曲線人眼視覺(jué)系統(tǒng)具有5個(gè)亮度適應(yīng)等級(jí)[12],因此分別把色調(diào)映射圖像分成3個(gè)區(qū)域、4個(gè)區(qū)域、5個(gè)區(qū)域在TMID[5]圖像數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn)。例如對(duì)于三個(gè)區(qū)域的劃分,首先把色調(diào)映射圖像用K-means聚類算法分成3個(gè)區(qū)域,分別提取每個(gè)區(qū)域的信息熵特征,然后用SVM聚合三個(gè)信息熵特征預(yù)測(cè)圖像質(zhì)量評(píng)分。選取Pearson線性相關(guān)系數(shù)(Pearson Linear Correlation Coefficient,PLCC)、Spearman秩相關(guān)系數(shù)(Spearman Rank-order Correlation Coefficient,SROCC)作為評(píng)價(jià)指標(biāo)分別評(píng)價(jià)圖像預(yù)測(cè)值與主觀評(píng)分的準(zhǔn)確性和一致性。
如表1所示,把色調(diào)映射圖像劃分成三個(gè)區(qū)域時(shí),信息熵特征的性能指標(biāo)是最好的,這三個(gè)區(qū)域分別是亮區(qū)、中間區(qū)、暗區(qū)。色調(diào)映射過(guò)程會(huì)縮小TMI的動(dòng)態(tài)范圍,導(dǎo)致TMI圖像的高亮區(qū)和低暗區(qū)細(xì)節(jié)丟失,從而影響TMI的質(zhì)量。如圖1所示,亮區(qū)包含了曝光過(guò)度的區(qū)域(高亮區(qū)域),同理,對(duì)于曝光不足的圖像,暗區(qū)包含低暗區(qū),因此三個(gè)區(qū)域的劃分體現(xiàn)了TMI圖像的特性。
表1 不同區(qū)域劃分方法信息熵特征的性能指標(biāo)
(a) 灰度圖 (b) 分成三個(gè)區(qū)域后圖1 TMID數(shù)據(jù)庫(kù)中的一幅圖
K-means聚類時(shí)只考慮像素點(diǎn)到聚類中心的距離來(lái)確定像素點(diǎn)的類別,沒(méi)有考慮人眼對(duì)亮度感知的非線性特性。設(shè)聚類中心亮度值為S1,感知亮度為P1,某個(gè)像素點(diǎn)像素亮度值為S2,感知亮度為P2。根據(jù)費(fèi)希納定理:
(1)
則亮度感知差P2-P1和S2與S1的關(guān)系為:
(2)
在K-means算法中S1和S2的物理亮度距離為:
D=(S2-S1)2=S12×(10P2-P1-1)2
(3)
對(duì)于相近的人眼感知差P2-P1,物理亮度距離與聚類中心的亮度值成正比,即人眼對(duì)暗區(qū)聚類時(shí)與聚類中心的距離要短一些,對(duì)中間區(qū)域聚類時(shí)與聚類中心的距離要長(zhǎng)一些。因此,采用如下算法對(duì)色調(diào)映射圖像的三個(gè)區(qū)域進(jìn)行調(diào)整。
設(shè)L為圖像像素亮度值,C1、C2、C3分別為暗區(qū)、中間區(qū)、亮區(qū)的聚類中心,則三個(gè)區(qū)域的分類如下:
(4)
如表2所示,采用式(4)對(duì)三個(gè)區(qū)域的分區(qū)進(jìn)行調(diào)整后,信息熵特征的PLCC和SROCC都明顯提升,說(shuō)明分區(qū)的調(diào)整方法符合人眼的感知特性。
表2 區(qū)域調(diào)整前后信息熵特征的性能指標(biāo)
TMI失真主要表現(xiàn)為信息細(xì)節(jié)的丟失、不自然的顏色、全局亮度和對(duì)比度的失真。因此,本文算法綜合考慮了TMI的失真特點(diǎn)。如圖2所示,本文主要提取了聚類感知特征、顯著性區(qū)域特征、自然度特征。聚類感知特征在亮度域上提取,先把TMI轉(zhuǎn)換成灰度圖,根據(jù)亮度信息進(jìn)行聚類,把圖像分成亮區(qū)、暗區(qū)、中間區(qū)三個(gè)區(qū)域,在每個(gè)區(qū)域分別提取面積比率和信息熵兩個(gè)特征。生理學(xué)和心理學(xué)的一些證據(jù)[13]表明人眼觀察一幅圖像時(shí)先看圖像的整體,人腦會(huì)抑制圖像中高頻出現(xiàn)的特征,視覺(jué)注意力容易關(guān)注偏差比較大的區(qū)域,即顯著性區(qū)域。假設(shè)圖像中一個(gè)M×M區(qū)域具有亮區(qū)、暗區(qū)、中間區(qū)這三個(gè)區(qū)域中兩個(gè)或兩個(gè)以上區(qū)域的像素,這樣的區(qū)域稱為混合區(qū)域?;旌蠀^(qū)域中像素間的亮度值差異比較大,具有顯著性區(qū)域的特點(diǎn)。本文通過(guò)對(duì)TMI的非負(fù)矩陣分解得到測(cè)試圖像對(duì)應(yīng)的系數(shù),對(duì)系數(shù)進(jìn)行分析識(shí)別出TMI的混合區(qū)域,在混合區(qū)域提出塊比例、信息熵特征。由于TMO處理過(guò)程縮小了HDR圖像的動(dòng)態(tài)范圍,影響了TMI的自然度,因此提取了亮度通道和顏色通道的自然統(tǒng)計(jì)特征。最后使用機(jī)器學(xué)習(xí)方法對(duì)所有特征進(jìn)行回歸,提出了無(wú)參考TMI質(zhì)量評(píng)價(jià)方法。
圖2 無(wú)參考TMI質(zhì)量評(píng)價(jià)框架
在視覺(jué)注意處理中,人類視覺(jué)系統(tǒng)對(duì)視覺(jué)細(xì)胞產(chǎn)生的刺激進(jìn)行融合,通過(guò)不同的信息特征進(jìn)行聚類,形成人類視覺(jué)系統(tǒng)的注意力分配圖,因此聚類是人類視覺(jué)系統(tǒng)的固有功能。設(shè)m×n的灰度圖像I,I(x,y)表示圖像I中(x,y)像素點(diǎn)的亮度值,設(shè)暗區(qū)、中間區(qū)、亮區(qū)的像素亮度值集合分別為RL、RM、RH,則:
(5)
式中:C3、C1為亮區(qū)和暗區(qū)的聚類中心。信息熵是衡量信息量的有效方法,設(shè)p為概率密度,對(duì)RL、RM、RH,I分別求信息熵為:
(6)
EL、EM、EH分別表示暗區(qū)、中間區(qū)、亮區(qū)的信息熵。考慮到人眼觀察圖像時(shí)先整體后局部的特點(diǎn),同時(shí)提取全局信息熵EG。
由于TMI圖像容易出現(xiàn)過(guò)曝光或欠曝光的區(qū)域,這些區(qū)域的大小會(huì)影響圖像的質(zhì)量,因此提取了三個(gè)區(qū)域的面積比例作為特征。設(shè)N(·)函數(shù)表示計(jì)算圖像或者圖像塊的像素個(gè)數(shù),則每個(gè)區(qū)域的面積比例可以表示為:
(7)
RatioL、RatioH、RatioM分別表示暗區(qū)、亮區(qū)、中間區(qū)的面積比率。聚類感知特征向量Fcluster為:
Fcluster={EL,EM,EH,EG,RatioL,RatioM,RatioH}
當(dāng)人眼看一幅圖像時(shí)注意力會(huì)被吸引到圖像中的一部分區(qū)域,這部分區(qū)域被稱為顯著性區(qū)域,是大部分人認(rèn)為圖像中重要的或者顯著的部分。顯著性區(qū)域的圖像質(zhì)量顯然影響人眼對(duì)圖像整體質(zhì)量的評(píng)價(jià)。Goferman等[13]認(rèn)為人眼觀察一幅圖像時(shí)先看圖像的整體,人腦會(huì)抑制圖像中高頻出現(xiàn)的特征,視覺(jué)注意力容易關(guān)注偏差比較大的區(qū)域,即顯著性區(qū)域。本文對(duì)TMI灰度圖像的非負(fù)矩陣分解獲得對(duì)應(yīng)圖像的系數(shù),通過(guò)對(duì)系數(shù)的直方圖的分析,提出了一種混合區(qū)域的識(shí)別方法,然后對(duì)混合區(qū)域提取信息熵,塊比率等特征。
許多研究表明稀疏表示符合人腦對(duì)圖像信號(hào)的認(rèn)知,非負(fù)矩陣分解(NMF)與稀疏表示的字典學(xué)習(xí)類似。非負(fù)矩陣分解是把一個(gè)數(shù)據(jù)矩陣M分解為兩個(gè)非負(fù)矩陣W和S的乘積,W為特征矩陣對(duì)應(yīng)字典學(xué)習(xí)的原子矩陣,S為編碼矩陣。數(shù)據(jù)矩陣M可以看作特征矩陣W中每一列和S中對(duì)應(yīng)系數(shù)的線性組合,由于S的非負(fù)性,M是由W中的每一列按照S決定的權(quán)重系數(shù)累加而成,由于W中的每一列就是一個(gè)圖像塊,因此非負(fù)矩陣分解與部分組成整體的直觀認(rèn)知相符。
圖3 從TMID數(shù)據(jù)庫(kù)中選取的原始訓(xùn)練圖像
對(duì)于訓(xùn)練樣本庫(kù)M,NMF的目標(biāo)是尋找特征矩陣W=[W1,W2,…,Wr]∈Rm×r和S=[S1,S2,…,Sn]∈Rr×n來(lái)近似訓(xùn)練樣本矩陣M:
M=WS
(8)
式中:r是大于零的整數(shù),表示特征矩陣中列向量的個(gè)數(shù)。W和S的尋找過(guò)程可以轉(zhuǎn)化為如下優(yōu)化問(wèn)題:
(9)
本文用Lin[14]的方法計(jì)算出了W和S,W就是通過(guò)訓(xùn)練庫(kù)訓(xùn)練得到的特征矩陣。對(duì)于一個(gè)測(cè)試圖像塊轉(zhuǎn)化而成的列向量Ti∈Rm×1,則得到Ti非負(fù)矩陣分解后的編碼矩陣Fi∈Rr×1為:
Ti=WFi?Fi=(WTW)-1WTTi
(10)
式中:(WTW)-1WT是W的偽逆矩陣。對(duì)于測(cè)試圖像T=[T1,T2,…,Tn]獲得編碼矩陣F=[F1,F2,…,Fn],n為一幅測(cè)試圖像包含的圖像塊的個(gè)數(shù)。
TMI的混合性區(qū)域是區(qū)域中像素來(lái)自兩種或兩種以上聚類感知區(qū)域,例如一個(gè)圖像塊有三分之一的亮區(qū)像素和三分之二的中間區(qū)像素。把亮區(qū)、暗區(qū)、中間區(qū)、混合區(qū)圖像塊分別進(jìn)行非負(fù)矩陣分解,對(duì)每個(gè)區(qū)域的編碼矩陣進(jìn)行直方圖分析,如圖4所示。
(a) 原圖 (b) 暗區(qū)系數(shù) (c) 中間區(qū)系數(shù) (d) 亮區(qū)系數(shù) (e) 混合區(qū)系數(shù)圖4 亮區(qū)、暗區(qū)、中間區(qū)、混合區(qū)編碼矩陣直方圖
可以看出,圖像暗區(qū)、中間區(qū)、亮區(qū)的編碼矩陣的系數(shù)值比較小,混合區(qū)系數(shù)有較大值。因此可以通過(guò)分析編碼矩陣的最大值來(lái)判斷顯著性區(qū)域,設(shè)閾值TH,定義顯著性區(qū)域S如下:
S={Ti|max(Fi)>TH,Fi=(WTW)-1WTTi}
i=1,2,…,n
(11)
信息熵能有效衡量圖像的信息量,根據(jù)式(6)對(duì)S的所有像素求信息熵獲得顯著性區(qū)域的信息量ES。顯著性區(qū)域面積越大,對(duì)圖像質(zhì)量的影響越大,因此提取顯著性區(qū)域的面積比例RatioS:
(12)
式中:N(·)函數(shù)表示計(jì)算圖像或者圖像塊的像素個(gè)數(shù);I表示圖像。顯著性特征FS為:
FS={ES,RatioS}
HDR圖像經(jīng)過(guò)色調(diào)映射后可能會(huì)出現(xiàn)曝光過(guò)度或者曝光不足的現(xiàn)象,造成TMI看起來(lái)不自然。然而,高質(zhì)量的TMI不應(yīng)當(dāng)破壞其自然特性。TMI的自然度失真主要體現(xiàn)在圖像過(guò)亮、過(guò)暗、不自然的顏色,因此本文考慮基于亮度和顏色提取自然度特征。
(1) 亮度自然度特征。本文采用了TMQI[5]的自然度統(tǒng)計(jì)模型,該模型使用3 000幅包括動(dòng)物、夜景、建筑、草地等14個(gè)不同類別場(chǎng)景的自然圖像。首先把每一幅圖像轉(zhuǎn)化成灰度圖像,然后把灰度圖像分割成11×11的圖像塊,分別求出每個(gè)圖像塊的均值與標(biāo)準(zhǔn)差,最后統(tǒng)計(jì)一幅圖像中所有圖像塊的均值與標(biāo)準(zhǔn)差的均值,獲得一幅圖像的均值和標(biāo)準(zhǔn)差。圖像的均值、標(biāo)準(zhǔn)差分別與高斯概率密度函數(shù)和Beta概率密度函數(shù)能夠很好地?cái)M合。兩個(gè)概率密度函數(shù)計(jì)算如下:
(13)
(14)
式中:B(·)是Beta函數(shù),模型的參數(shù)設(shè)置為μm=115.94,αm=27.99,αd=4.4,βd=10.1。TMQI的亮度和對(duì)比度的聯(lián)合概率如下:
(15)
式中:K是隨著Pm和Pd改變的標(biāo)準(zhǔn)化因子,K=max{Pm,Pd}使得統(tǒng)計(jì)自然度N標(biāo)準(zhǔn)化。
(2) 顏色自然度。本文采用Wang等[15]提出的基于顏色空間的自然度統(tǒng)計(jì)方法,該方法表明局部標(biāo)準(zhǔn)化顏色系數(shù)(local normalized color coefficients,LNCC)服從高斯分布,LNCC可以表示為:
(16)
式中:IC(i,j)是給定圖像的C顏色通道某個(gè)像素的值,(i,j)是圖像的空域坐標(biāo)。
(17)
(18)
采用廣義高斯函數(shù)(generalized Gaussian distribution,GGD)來(lái)擬合LNCC參數(shù)。GGD概率密度函數(shù)如下:
(19)
式中:Γ(·)是伽馬函數(shù)。β為:
(20)
如表3所示,RGB顏色空間自然度特征獲得了最好的性能,因此選擇RGB顏色空間來(lái)提取顏色自然度特征FC:
表3 RGB、LAB、YCbCr顏色空間自然度特征性能指標(biāo)
本文提取了聚類感知、顯著性區(qū)域、自然度三類特征共16個(gè),設(shè)V是TMI的特征向量,可以表示為:
V={FC,FS,N,FC}
(21)
特征提取之后需要一個(gè)回歸模型來(lái)建立一個(gè)函數(shù),這個(gè)函數(shù)能夠映射特征向量到主觀圖像質(zhì)量評(píng)價(jià)分。由于支持向量機(jī)(Support Vector Machine,SVM)在圖像處理領(lǐng)域得到廣泛的應(yīng)用,因此把訓(xùn)練圖像的特征向量和對(duì)應(yīng)的MOS值輸入支持向量機(jī)訓(xùn)練出一個(gè)預(yù)測(cè)模型f(·),把測(cè)試圖像的特征向量輸入預(yù)測(cè)模型獲得圖像的客觀質(zhì)量預(yù)測(cè)值Q。
本文在TMID數(shù)據(jù)庫(kù)上對(duì)提出的算法進(jìn)行了相關(guān)性能指標(biāo)驗(yàn)證。TMID數(shù)據(jù)庫(kù)由加拿大滑鐵盧大學(xué)開發(fā),數(shù)據(jù)庫(kù)中包括15幅不同場(chǎng)景的HDR圖像,在每一幅HDR圖像上使用8種TMO總共生成120幅TMI。主觀實(shí)驗(yàn)邀請(qǐng)了20位測(cè)試人員,分別將每幅HDR圖像對(duì)應(yīng)的8幅TMI按主觀質(zhì)量的好壞進(jìn)行排序,序號(hào)1~8作為分?jǐn)?shù),然后將每幅TMI的平均分作為主觀質(zhì)量分?jǐn)?shù)。
根據(jù)視頻質(zhì)量專家組(video quality expert group,VQEG)的建議,PLCC和SROCC兩個(gè)參數(shù)經(jīng)常被用來(lái)檢測(cè)各種圖像質(zhì)量評(píng)價(jià)方法的性能。SROCC用來(lái)評(píng)價(jià)客觀質(zhì)量評(píng)價(jià)算法和主觀評(píng)價(jià)的一致性。PLCC用來(lái)評(píng)價(jià)客觀質(zhì)量評(píng)價(jià)算法和主觀評(píng)價(jià)的準(zhǔn)確性。在計(jì)算PLCC之前,為了消除主觀質(zhì)量評(píng)價(jià)引入的非線性因素,需對(duì)客觀質(zhì)量評(píng)價(jià)結(jié)果和主觀質(zhì)量評(píng)價(jià)結(jié)果進(jìn)行非線性擬合,本文采用了五參數(shù)Logistic擬合方法。PLCC和SROCC值越大表示客觀質(zhì)量評(píng)價(jià)算法的性能越好。
采用交叉驗(yàn)證的方法來(lái)評(píng)價(jià)本文提出的無(wú)參考色調(diào)映射質(zhì)量評(píng)價(jià)方法。首先將TMID圖像庫(kù)中的TMI分為兩個(gè)不重疊的圖像子集。第一子集為訓(xùn)練圖像,包含了數(shù)據(jù)庫(kù)中120×n%的測(cè)試色調(diào)映射圖像,并用這部分圖像建立本文所需的預(yù)測(cè)模型。第二個(gè)子集為余下的120×(1-n%)色調(diào)映射圖像并作為測(cè)試圖像。為了消除性能偏差,本文隨機(jī)重復(fù)1 000次之前的訓(xùn)練-測(cè)試過(guò)程,并將這1 000次測(cè)試所得到的性能指標(biāo)的中值作為最終的性能指標(biāo)。如表4所示,隨著訓(xùn)練集尺寸的增大,預(yù)測(cè)模型的性能逐漸提高,但當(dāng)訓(xùn)練集達(dá)到80%時(shí),SROCC性能指標(biāo)提升不再明顯。
表4 不同大小訓(xùn)練集的性能指標(biāo)
本文算法提取了三類特征,具體包括聚類感知特征、自然度特征、顯著性區(qū)域特征,如表5所示。聚類感知特征包括全局信息熵、三個(gè)區(qū)域的信息熵、三個(gè)區(qū)域的面積比率,全局信息熵可以看作是整個(gè)圖像為一類的特殊情況。信息熵越大,說(shuō)明圖像的信息量越大,對(duì)圖像分亮區(qū)、中間區(qū)、暗區(qū)提取的信息熵相對(duì)全局信息熵具有更好的性能指標(biāo),說(shuō)明對(duì)圖像聚類分區(qū)域感知圖像質(zhì)量的方法是有效的。三個(gè)區(qū)域信息熵特征和全局信息熵的組合顯著提升了性能指標(biāo),說(shuō)明三個(gè)區(qū)域信息熵特征可以彌補(bǔ)全局信息熵特征的不足。由于TMI圖像容易出現(xiàn)過(guò)曝光或欠曝光的區(qū)域,這些區(qū)域的大小會(huì)影響圖像的質(zhì)量,三個(gè)區(qū)域的面積比例RatioΩ和EL、EM、EH、EG的組合提升了性能指標(biāo)。自然度特征包括亮度通道特征N和RGB顏色通道特征FC,自然度顯然與聚類感知特征具有很好的互補(bǔ)性,自然度和聚類感知特征結(jié)合后性能指標(biāo)大大提高。顯著性區(qū)域提取的混合區(qū)域特征ES和塊比例RatioS結(jié)合使用比單獨(dú)使用效果好很多,說(shuō)明這兩個(gè)特征具有互補(bǔ)作用。聚類感知特征、自然度、顯著性特征聯(lián)合使用后算法的性能指標(biāo)進(jìn)一步提高,說(shuō)明顯著性特征對(duì)TMI質(zhì)量有一定的影響。
表5 本文算法中各特征的性能指標(biāo)
為了驗(yàn)證本文算法的準(zhǔn)確性和有效性,在TMID數(shù)據(jù)庫(kù)上與現(xiàn)有的代表性算法進(jìn)行了比較,如表6所示。選擇了有代表性的全參考和無(wú)參考圖像質(zhì)量評(píng)價(jià)方法作為對(duì)比。全參考圖像質(zhì)量評(píng)價(jià)方法包括TMQI[5]、FSITM[6]、NITI[16]。無(wú)參考圖像質(zhì)量評(píng)價(jià)方法包括BRISQUE[17]、BLIINDS-II[18]、Yue[11]、BTMQI[10]。TMQI、FSITM、NITI等專門為TMI設(shè)計(jì)的全參考圖像質(zhì)量評(píng)價(jià)方法要優(yōu)于BRISQUE、BLIINDS-II等針對(duì)LDR圖像的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,說(shuō)明針對(duì)LDR的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法不適合TMI的質(zhì)量評(píng)價(jià)。BTMQI的性能超越了TMQI、FSITM等全參考方法,說(shuō)明對(duì)TMI質(zhì)量評(píng)價(jià),無(wú)參考質(zhì)量評(píng)價(jià)方法也能取得很好的效果。實(shí)驗(yàn)結(jié)果表明在TMID數(shù)據(jù)庫(kù)上,對(duì)于PLCC和SROCC兩個(gè)性能指標(biāo),本文算法優(yōu)于現(xiàn)有代表性的算法。
表6 本文算法與代表性算法的比較
本文受Weber定律啟發(fā),采用聚類感知TMI圖像的質(zhì)量。用K-means聚類算法把TMI分成暗區(qū)、中間區(qū)、亮區(qū),提取三個(gè)區(qū)域的信息熵、面積比率和全局信息熵作為特征。通過(guò)分析圖像編碼矩陣的系數(shù)提取顯著性區(qū)域,并在顯著性區(qū)域提取信息熵、面積比率特征。在亮度和顏色通道提取了自然度特征。最后用SVM融合全部提取的特征獲得TMI的質(zhì)量分。實(shí)驗(yàn)表明,本文算法在TMID數(shù)據(jù)庫(kù)上具有很好的性能。