張祎 孔祥維 王振帆 付海燕 李明
在計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域,輸入數(shù)據(jù)的維數(shù)過(guò)高會(huì)增加計(jì)算的復(fù)雜度,使得對(duì)數(shù)據(jù)的處理變得困難.為了降低數(shù)據(jù)的維數(shù),通常采用矩陣分解的方法.矩陣分解的方法將數(shù)據(jù)矩陣分解成多個(gè)矩陣的形式,其中一個(gè)矩陣可以很好地逼近原始矩陣,在保留原始信息的條件下,同時(shí)可以從高維到低維的映射,學(xué)習(xí)更好的特征描述方法.這樣這種矩陣分解的方法有多種,如SVD(Singular value decomposition)、QR 分解、NMF(Nonnegative matrix factorization)等.
NMF可以將原始數(shù)據(jù)分解為基矩陣和系數(shù)矩陣的乘積.基矩陣的作用類(lèi)似人臉的各個(gè)不同局部塊的描述,系數(shù)矩陣為原始數(shù)據(jù)在這些基向量的線(xiàn)性組合的權(quán)重.對(duì)于給定的數(shù)據(jù)矩陣X,在學(xué)習(xí)到對(duì)應(yīng)的基矩陣U之后,對(duì)應(yīng)的系數(shù)矩陣V便可以描述原始矩陣.最近的研究表明,NMF在人腦識(shí)別等領(lǐng)域已經(jīng)超過(guò)基于SVD的方法[1?3].
雖然單視圖的NMF提高了原始數(shù)據(jù)的有效性,但是圖像可以從不同的視圖進(jìn)行描述.這些視圖可以是不同的數(shù)據(jù)集,也可以是側(cè)重于不同角度的特征提取方法,所以,這些視圖具有多種特征:有的是視覺(jué)底層特征、有的是視覺(jué)美學(xué)特征,甚至有中層語(yǔ)義特征.這些特征往往可以互補(bǔ)地描述圖像[4],因此,多視圖學(xué)習(xí)相比較于單視圖的方法能更有效地利用視圖之間的互補(bǔ)信息.而在實(shí)例檢索[5]任務(wù)上,Multi的思想[6]也被用于獲得更加精確的檢索效果.目前,利用多視圖來(lái)進(jìn)行聚類(lèi)分析的方法主要有兩種:多視圖譜聚類(lèi)和多視圖K均值聚類(lèi).其中,多視圖譜聚類(lèi)有文獻(xiàn)[7?11]等.雖然這些方法性能的相比單視圖的譜聚類(lèi)有所提高,但是多視圖譜聚類(lèi)需要為每一個(gè)視圖都計(jì)算親和矩陣,視圖越多,計(jì)算的復(fù)雜度也更大.相比之下,多視圖K均值聚類(lèi)不需要計(jì)算親和矩陣,只需要利用原始特征即可.多視圖K均值聚類(lèi)又分為基于指示矩陣的方法和基于NMF矩陣分解的方法.基于指示矩陣的方法有RMKMC[12]和DEKM(Discriminatively emmbedded K-means)[13]等,這種方法是從樣本角度來(lái)形成聚類(lèi)質(zhì)心,且這種方法的準(zhǔn)確率依賴(lài)于指示矩陣的初始值.而基于NMF矩陣分解的方法是從維數(shù)的角度來(lái)進(jìn)行降維,從而形成聚類(lèi)質(zhì)心.具體地,關(guān)于矩陣分解多視圖學(xué)習(xí)方面的研究有很多:在文獻(xiàn)[14]中,Kumar等利用全局和局部2種視圖的特征,提高了單視圖NMF在人臉識(shí)別問(wèn)題上的準(zhǔn)確率;文獻(xiàn)[15]利用稀疏編碼框架來(lái)對(duì)多視圖特征學(xué)習(xí)進(jìn)行研究;文獻(xiàn)[16]中,Akata等提出Collective-NMF算法令多種特征數(shù)據(jù)共享相同的系數(shù)矩陣,這等同于先串聯(lián)各種特征然后進(jìn)行NMF分解.然而Liu等認(rèn)為這種共享系數(shù)矩陣具有太強(qiáng)的約束,提出一種弱化的約束,旨在保證每種特征的一致性,即視角間的一致性保持[17].
但是,以上這些方法沒(méi)有考慮相同樣本在不同視角中的空間結(jié)構(gòu)關(guān)系,這種局部空間結(jié)構(gòu)在半監(jiān)督學(xué)習(xí)、流形學(xué)習(xí)等多個(gè)領(lǐng)域的方法中具有重要的意義.典型的計(jì)算空間局部結(jié)構(gòu)約束的方法有 Locality preserving projection(LPP)[18]和Spectral Regression[19]等.Cai等在文獻(xiàn)[19]的算法中,通過(guò)引入局部結(jié)構(gòu)約束達(dá)到了大幅度提高實(shí)驗(yàn)準(zhǔn)確率的效果.
因此,本文提出了一種基于局部結(jié)構(gòu)約束的多視圖特征學(xué)習(xí)方法,稱(chēng)之為MultiGNMF.這種方法的主要目標(biāo)是相似的數(shù)據(jù)在每個(gè)視圖都有相近的相似性.因此,我們通過(guò)構(gòu)建親和矩陣來(lái)將每個(gè)視圖的空間結(jié)構(gòu)加入到目標(biāo)函數(shù)中,并提出迭代規(guī)則來(lái)解決這個(gè)優(yōu)化問(wèn)題.然而,MultiGNMF等多視圖學(xué)習(xí)方法要求特征矩陣的值是非負(fù)的,而實(shí)際中并不能總是保證這一限制條件.為了消除這一限制條件,本文又提出了一種基于多視圖學(xué)習(xí)的MultiGSemiNMF算法.
文章主要結(jié)構(gòu)分為4個(gè)部分:在第1節(jié),簡(jiǎn)要回顧一下基于矩陣分解的特征學(xué)習(xí)方法,并將局部結(jié)構(gòu)約束引入多視圖學(xué)習(xí)框架中,提出基于局部結(jié)構(gòu)約束的多視圖NMF分解算法—MultiGNMF;在第2節(jié),針對(duì)MultiGNMF等多視圖學(xué)習(xí)方法只適用于非負(fù)矩陣的缺點(diǎn),提出MultiGSemiNMF算法,并對(duì)其進(jìn)行詳細(xì)介紹;第3節(jié)對(duì)所提的算法進(jìn)行實(shí)驗(yàn)驗(yàn)證和分析;最后,第4節(jié)對(duì)本文的工作進(jìn)行總結(jié).
在這一節(jié),我們首先介紹基于NMF分解的單視圖特征學(xué)習(xí)方法.然后,考慮到多視圖特征比單視圖特征能更好地描述圖像,且分解后的系數(shù)矩陣應(yīng)與原始特征據(jù)的空間結(jié)構(gòu)相似,我們提出了基于局部結(jié)構(gòu)約束的多視圖特征學(xué)習(xí)方法—MultiGNMF.下面將分別介紹NMF和MultiGNMF這兩種特征學(xué)習(xí)算法.
下面介紹NMF的求解過(guò)程.
定義X=[X.,1,···,X.,N]∈RM×N為輸入數(shù)據(jù)矩陣,每一列都描述的是一個(gè)數(shù)據(jù),U∈RM×K為基矩陣,V∈RN×K為系數(shù)矩陣,即新的描述子,兩者的乘積是對(duì)原始矩陣的逼近,如式(1)所示,其中K是一個(gè)變量,它決定了特征最終學(xué)習(xí)的特征維數(shù).
采用KKT(Karush-Kuhn-Tucher)條件,分別引入拉格朗日因子Ψ和Φ將U≥0,V≥0這兩個(gè)約束條件變成無(wú)約束優(yōu)化問(wèn)題,如式(3)所示.
對(duì)于同時(shí)滿(mǎn)足U和V的條件下對(duì)于式(3)這種無(wú)約束優(yōu)化問(wèn)題是非凸優(yōu)化問(wèn)題,沒(méi)有精確的求解方法.文獻(xiàn)[19]提出了乘子更新法則來(lái)迭代求解上述最小化約束問(wèn)題.迭代過(guò)程如式(4)和(5)所示.
NMF是基于單視圖的特征學(xué)習(xí)方法,然而,對(duì)同一個(gè)樣本而言,不同視圖的多種特征往往可以互補(bǔ)地描述圖像.基于此,文獻(xiàn)[17]提出了對(duì)每種特征保持弱化的一致性約束的多視圖學(xué)習(xí)方法—MultiNMF.現(xiàn)將MultiNMF介紹如下.定義X為G個(gè)視圖的輸入特征數(shù)據(jù)矩陣,為第f個(gè)視圖的特征矩陣.其中,Mf為第f個(gè)視圖的特征維數(shù),N為樣本數(shù)據(jù)的數(shù)量.對(duì)應(yīng)地,定義基矩陣U=U1,···,UG和系數(shù)矩陣V=V1,···,VG,Uf∈RMf×K,Vf∈RN×K.其中,K為定義的新特征維數(shù).Liu在文獻(xiàn)[17]中提出Soft-regularization的方法認(rèn)為,對(duì)每個(gè)視圖映射后的特征Vf需要保持一致性的約束,但是允許存在差異性,差異的大小采用歐氏空間中的lF范數(shù)來(lái)度量.于是,可以得到Liu的方法定義的損失函數(shù)如下式(6)所示.
方程的解需要采用乘子更新法則來(lái)進(jìn)行迭代求得,具體過(guò)程這里不再贅述.
局部空間結(jié)構(gòu)約束的思想主要是保持樣本的局部空間結(jié)構(gòu)不變(近似不變),這種局部空間結(jié)構(gòu)在多個(gè)領(lǐng)域的方法中具有重要的意義.而MultiNMF沒(méi)有考慮相同樣本的原始數(shù)據(jù)與降維之后數(shù)據(jù)的空間結(jié)構(gòu)關(guān)系,因此,本文提出了基于NMF矩陣分解的局部結(jié)構(gòu)正則化約束多視圖學(xué)習(xí)方法,稱(chēng)之為MultiGNMF.下面對(duì)MultiGNMF方法進(jìn)行詳細(xì)介紹.
1.3.1 局部結(jié)構(gòu)正則化約束
局部空間結(jié)構(gòu)近似不變的具體含義就是:如果兩個(gè)樣本xi和xj在原始空間中相似,那么我們認(rèn)為它們?cè)谟成浜蟮目臻g中(分別用Vi,.和Vj,.表示)也應(yīng)該有近似的相似程度,即原始數(shù)據(jù)與映射后的數(shù)據(jù)有相似的局部結(jié)構(gòu)關(guān)系.
根據(jù)以往文獻(xiàn)的考察,我們采用數(shù)據(jù)的親和矩陣W來(lái)表征局部結(jié)構(gòu)關(guān)系.計(jì)算親和矩陣的方法很多,在沒(méi)有監(jiān)督信息的前提下,一般采用數(shù)據(jù)之間的歐氏距離構(gòu)建親和矩陣W.定義一個(gè)正整數(shù)變量k,一個(gè)樣本i與其他樣本的權(quán)重可以如此計(jì)算:對(duì)所有樣本與該樣本的距離進(jìn)行從小到大的排序,如果樣本j在前k個(gè),那么Wij=1;否則,Wij=0.還有其他的方法不采用0/1值作為權(quán)值,而是直接用數(shù)據(jù)之間的核函數(shù)值作為權(quán)值.典型的核函數(shù)有高斯核,線(xiàn)性核等.不同的計(jì)算方法適應(yīng)于不同的研究?jī)?nèi)容,在文檔特征中采用線(xiàn)性核表現(xiàn)更好,在圖像視覺(jué)特征中高斯核可能更適合.在和其他的方法比較的過(guò)程中,我們采用比較通用的高斯核函數(shù)值作為權(quán)值,從而就可以得到原始數(shù)據(jù)的親和矩陣W.但是,這些方法的性能受參數(shù)的影響較大.最近,Nie等[20]提出了一種無(wú)參數(shù)構(gòu)建親和矩陣W的方法,該方法不需要任何參數(shù),很好地解決了構(gòu)圖過(guò)程需要反復(fù)調(diào)節(jié)參數(shù)的問(wèn)題.但本文提出的MultiGSemiNMF和MultiGNMF算法直接應(yīng)用無(wú)參數(shù)構(gòu)圖后缺乏普適性,因此本文仍然使用高斯核函數(shù)來(lái)構(gòu)建親和矩陣,在以后的工作將深入研究無(wú)參數(shù)構(gòu)圖和本文方法的結(jié)合.對(duì)于經(jīng)過(guò)映射后的數(shù)據(jù)Vi,.和Vj,,,仍用歐氏距離來(lái)度量它們之間的相似程度,如式(7)所示.利用親和矩陣W,我們便可以構(gòu)造用于約束局部結(jié)構(gòu)的平滑懲罰因子.對(duì)于第f個(gè)視圖的平滑懲罰因子Rf,公式如下:
其中,L=D?W為拉普拉斯矩陣,D是一個(gè)對(duì)角矩陣.
1.3.2 目標(biāo)方程的構(gòu)建及求解
將平滑懲罰因子引入多視圖特征學(xué)習(xí)Multi-NMF的框架中,我們得到MultiGNMF方法的目標(biāo)函數(shù)如下:
Liu在文獻(xiàn)[17]中建議用對(duì)角陣Q歸一化U和V,即UVT=UQ?1QVT.其中,Qf定義如下:
diag(·)表示對(duì)角矩陣.這樣,經(jīng)過(guò)歸一化后,.因此,式(9)可以改寫(xiě)成:
由此,我們可以得到整體的損失函數(shù)定義如式(12)所示.
MultiGNMF在Uf≥0,Vf≥0的約束下最小化LG是一個(gè)帶約束的優(yōu)化問(wèn)題.采用迭代的方法求解.引入拉格朗如因子后,MultiGNMF的第f種特征損失函數(shù)為式(13).
L1分別對(duì)U和V求導(dǎo),求導(dǎo)結(jié)果如下:
根據(jù)文獻(xiàn)[17],我們?cè)诿看蔚玫経和V之后,按照式(10)進(jìn)行歸一化處理,即:
在優(yōu)化U和V之后,將它們視為常量,對(duì)L1求導(dǎo)得到V?的更新表達(dá)式如下所示:
NMF和MultiGNMF都要求U≥0,V≥0,X≥0.這種非負(fù)性約束來(lái)源于在現(xiàn)實(shí)世界中大部分?jǐn)?shù)據(jù)是非負(fù)的,系數(shù)的累加也是非負(fù)的.然而,實(shí)際情況中,我們提取到的圖像特征往往存在負(fù)數(shù),這就使得以上兩種特征學(xué)習(xí)方法存在局限性.為了消除這個(gè)局限,我們提出一種對(duì)負(fù)數(shù)特征也適用的多視圖特征學(xué)習(xí)方法—ultiGSemiNMF,我們將在下一節(jié)對(duì)其進(jìn)行詳細(xì)介紹.
在第1節(jié)中我們分析了各種基于NMF矩陣分解的特征學(xué)習(xí)方法的優(yōu)越表現(xiàn),不過(guò)這些方法有一個(gè)重要的約束:所有數(shù)據(jù)都必須是非負(fù)的.在物理世界中可能大部分?jǐn)?shù)據(jù)保持這個(gè)特性,但是,在圖像處理中有些特征,如由小波變換得到的三分法特征、結(jié)構(gòu)特征等,并沒(méi)有保持非負(fù)性的條件,如果強(qiáng)制向正數(shù)方向映射,往往含有一定的失真.這就使得基于NMF的特征學(xué)習(xí)方法有一定的局限性.如何將NMF算法拓展到對(duì)負(fù)數(shù)矩陣也適用,文獻(xiàn)[13]中進(jìn)行了詳細(xì)探究.其中一種方法是SemiNMF,下面我們對(duì)其進(jìn)行介紹,并由此引出本文所提算法—ultiGSemiNMF.
SemiNMF中的數(shù)據(jù)與NMF中的數(shù)據(jù)一致,但是,SemiNMF算法對(duì)原始數(shù)據(jù)X和基矩陣U不帶有非負(fù)性約束,只需系數(shù)矩陣V≥0.由此,我們可以得到SemiNMF的目標(biāo)方程和損失函數(shù)分別如式(18)和(19)所示:
SemiNMF在V≥0的約束下最小化Lsemi是一個(gè)帶約束的優(yōu)化問(wèn)題.采用迭代的方法求解,求解過(guò)程我們將在第2.2節(jié)具體介紹.
SemiNMF這種方法具有很好的描述性,同時(shí)相對(duì)NMF有較大使用范圍和較高性能.于是,為了克服基于NMF的各種特征學(xué)習(xí)方法只適用于非負(fù)數(shù)據(jù)的缺點(diǎn),本文提出基于SemiNMF的多視圖特征學(xué)習(xí)算法,我們稱(chēng)之為MultiGSemiNMF.下面將對(duì)這種方法做詳細(xì)的介紹.
2.2.1 目標(biāo)方程
多視圖學(xué)習(xí)過(guò)程中我們需要遵守幾個(gè)準(zhǔn)則:1)每個(gè)視圖學(xué)習(xí)的新特征需要保持一致性;2)在學(xué)習(xí)前的特征和學(xué)習(xí)后的特征對(duì)樣本之間的局部結(jié)構(gòu)進(jìn)行度量,需要保持這種結(jié)構(gòu)的一致性.于是,我們得到弱化的一致性約束項(xiàng)和局部結(jié)構(gòu)正則化約束項(xiàng)tr((Vf)TLfVf).我們將多視圖學(xué)習(xí)的準(zhǔn)則應(yīng)用到SemiNMF,于是,我們可以得到MultiGSemiNMF算法的目標(biāo)函數(shù)如式(20)所示.
其中,Qf的引進(jìn)是為了使方程滿(mǎn)足的約束條件.而的約束條件是為了每一種特征的數(shù)據(jù)歸一化處理,那么對(duì)應(yīng)的系數(shù)矩陣也變得歸一化,具有比較性.又因?yàn)?所以,在U歸一化之后如果對(duì)X也進(jìn)行歸一化處理,V便也達(dá)到歸一化的目的.而X為原始數(shù)據(jù)我們能更好的操作,故在求解過(guò)程中只需要在每次迭代U之后對(duì)其進(jìn)行歸一化即可.所以,式(20)可以簡(jiǎn)寫(xiě)成(21),但是我們需要求解前對(duì)原始數(shù)據(jù)X進(jìn)行歸一化操作,在每次迭代后對(duì)U進(jìn)行歸一化.
由此,我們可以得到MultiGSemiNMF算法的整體損失函數(shù)如下所示:
其中,L=D?W為拉普拉斯矩陣,D是一個(gè)對(duì)角矩陣,W為樣本在原始空間關(guān)系的親和矩陣.各變量的具體含義及計(jì)算方法詳見(jiàn)第1.3節(jié).
2.2.2 方程求解
MultiGSemiNMF在Vf≥0的約束下最小化LGSemi是一個(gè)帶約束的優(yōu)化問(wèn)題.對(duì)于每個(gè)視圖的特征,引入拉格朗日因子后,MultiGSemiNMF的第f個(gè)視圖特征的損失函數(shù)為
損失函數(shù)在變量U和V下不是一個(gè)凸優(yōu)化問(wèn)題沒(méi)有精確的數(shù)值解,采用迭代優(yōu)化方法求解,具體計(jì)算步驟如下:
1)對(duì)V取隨機(jī)矩陣或者采用K-means算法得到的系數(shù)矩陣.
2)固定V更新U.將L2中只有變量U,變成一個(gè)無(wú)約束優(yōu)化問(wèn)題,對(duì)其求導(dǎo),獲得U的解析解.其中VTV∈RK×K在一般情況下是一個(gè)半正定的矩陣,在不可逆的情況下,用偽逆矩陣來(lái)代替(Matlab中的pinv函數(shù)).
3)固定U更新V.將U固定,L2中只有變量V,對(duì)其求導(dǎo)=0,采用KKT條件Φj,kVj,k=0獲得式(25)的優(yōu)化問(wèn)題.
式(25)是一個(gè)典型的定點(diǎn)等式問(wèn)題,求解f(x)=0,可以變成x=g(x)的形式,迭代式子xi+1=g(xi)由于存在V≥0的約束條件,式(25)中的各項(xiàng)需要保持絕對(duì)的非負(fù)性.所以,我們采用拆分的方法.通過(guò)拆分,XTU=(XTU)+?(XTU)?,UTU=(UTU)+?(UTU)?,其中的拆分函數(shù)定義如式(26)所示.這樣式(25)便變成多個(gè)非負(fù)矩陣之間的線(xiàn)性組合.
文獻(xiàn)[21]提出一種滿(mǎn)足定點(diǎn)等式的x=g(x)形式,將式 (27)所示,代入到式 (25)中(V UTU?XTU+λf(V?V?+μLV))ikVik0,由于KKT條件約束βikVik=0,當(dāng)Vik6=0時(shí),必然存在(V UTU?XTU+λf(V?V?+μLV))ik=0,式(27)滿(mǎn)足式(25);反之,當(dāng)Vik=0也滿(mǎn)足.綜合考慮,式(27)滿(mǎn)足KKT條件.迭代式(27)的收斂性證明方法可以詳見(jiàn)文獻(xiàn)[21?22].
4)交替迭代第2)步和第3)步,直到損失函數(shù)值小于閾值或損失函數(shù)值變化小于閾值.
5)在優(yōu)化U和V之后,將它們視為常量,利用式(17)更新V?.MultiGSemiNMF與Multi-GNMF的不同之處在于缺少了Uf≥0的約束,因此不僅適用于特征矩陣非負(fù)的情況,在特征矩陣中存在負(fù)數(shù)時(shí),也表現(xiàn)良好.式(28)是各種變量的迭代方程.
為了驗(yàn)證MultiGNMF算法和MultiGSemiNMF算法的有效性,我們?cè)?個(gè)公共的圖像數(shù)據(jù)庫(kù)中和其他幾種多特征學(xué)習(xí)算法比較圖像聚類(lèi)效果.下面分別從實(shí)驗(yàn)設(shè)置、評(píng)估指標(biāo)和實(shí)驗(yàn)結(jié)果及分析這三部分作詳細(xì)介紹.
3.1.1 數(shù)據(jù)庫(kù)
實(shí)驗(yàn)中所用的數(shù)據(jù)庫(kù)為CMU PIE人臉數(shù)據(jù)庫(kù)、UCI手寫(xiě)體數(shù)字圖像數(shù)據(jù)庫(kù)、3-Sources文本數(shù)據(jù)庫(kù)和ORL人臉庫(kù).表1詳細(xì)介紹這4個(gè)數(shù)據(jù)庫(kù)的統(tǒng)計(jì)特性.具體介紹如下:
CMU PIE人臉數(shù)據(jù)庫(kù)包含41368張32×32像素的人臉圖像,這些數(shù)據(jù)是68個(gè)人按照指定的13種姿勢(shì)角度和43種不同光照條件下采集人臉的圖像.在實(shí)驗(yàn)中,我們從每個(gè)人的一個(gè)角度中隨機(jī)選擇42幅圖像,構(gòu)成2856幅人臉圖像.如果按照人臉作為聚類(lèi)中心的話(huà),那么數(shù)據(jù)可以分成68個(gè)集群.在本次實(shí)驗(yàn)中,我們用圖像的像素值(二維圖像按行展開(kāi))和HOG(Histogram of oriented gradient)特征作為CMU PIE的兩個(gè)視圖.
UCI手寫(xiě)體數(shù)字?jǐn)?shù)據(jù)庫(kù)有UCI大學(xué)構(gòu)建數(shù)字0~9的手寫(xiě)體圖像,數(shù)據(jù)庫(kù)包含2000個(gè)樣本.我們利用手寫(xiě)體圖像的低頻傅里葉變換和原始像素值作為不同的視圖.
3-Sources文本數(shù)據(jù)庫(kù)包含BBC、Reuters和Guardian三種流行的網(wǎng)上新聞資源.其中,有169條新聞被這三個(gè)新聞網(wǎng)報(bào)道過(guò).我們選取這169條新聞作為測(cè)試樣本,這三個(gè)新聞網(wǎng)分別作為三個(gè)視圖來(lái)進(jìn)行聚類(lèi)分析.這些新聞的主題包含商業(yè)、娛樂(lè)、健康、政治、運(yùn)動(dòng)和科技,我們將其作為我們聚類(lèi)的標(biāo)簽.
ORL(Olivetti research laboratory)人臉庫(kù)是英國(guó)劍橋大學(xué)Olivetti研究所制作的人臉數(shù)據(jù)庫(kù),它共包含400張的人臉圖像.這些數(shù)據(jù)是40個(gè)人在不同的時(shí)間、變化的光線(xiàn)、面部表情(張開(kāi)/合攏眼睛、微笑/不微笑)和面部細(xì)節(jié)(戴眼鏡/不戴眼鏡)下拍攝的.所有的圖像為實(shí)驗(yàn)者的正臉,帶有一定程度的朝上下左右的偏轉(zhuǎn)或傾斜,相似的黑暗同質(zhì)背景.所有圖像的大小均為28×23像素.在本次實(shí)驗(yàn)中,我們用圖像的像素值(二維圖像按行展開(kāi))和低頻傅里葉變換系數(shù)值作為ORL的兩個(gè)視圖.
表1 4個(gè)數(shù)據(jù)庫(kù)的資料Table 1 The information of four databases
3.1.2 對(duì)比算法
為了更全面地評(píng)估本文提出的算法,我們比較了近期多種典型的多視圖學(xué)習(xí)算法.下面對(duì)它們進(jìn)行描述.
1)單視圖算法(BSV和WSV):我們對(duì)每個(gè)視圖利用NMF算法進(jìn)行特征學(xué)習(xí),將學(xué)習(xí)的系數(shù)矩陣作為特征.統(tǒng)計(jì)每個(gè)視圖的效果,我們?nèi)∶總€(gè)視圖該算法對(duì)應(yīng)的最好效果為BSV和最差效果為WSV.
2)ConcatNMF:這是一種前向融合的學(xué)習(xí)方法.其算法可以簡(jiǎn)單理解為,首先將每個(gè)視圖的特征串聯(lián)成一個(gè)向量(矩陣)作為數(shù)據(jù)新的特征,然后利用非負(fù)矩陣分解算法進(jìn)行特征學(xué)習(xí),所有算法流程和度量標(biāo)準(zhǔn)與單視圖的方法一致.
3)ColNMF:一種多視圖學(xué)習(xí)方法,采用一致性準(zhǔn)則,如式(29)所示,所有的視圖共享相同的系數(shù)矩陣.與ConcatNMF類(lèi)似,不過(guò)每個(gè)視圖添加了權(quán)重和歸一化約束.min
4)Co-reguSC:一種改進(jìn)的譜聚類(lèi)算法,在文獻(xiàn)[23]中被Kumar等提出.每個(gè)視圖采用譜聚類(lèi)學(xué)習(xí)作為基本的聚類(lèi)學(xué)習(xí)算法,與MultiNMF算法相似的是,在視圖之間采用弱一致性準(zhǔn)則約束各個(gè)視圖的映射矩陣之間的關(guān)系,如式(30)所示.在實(shí)驗(yàn)中我們采用高斯核核函數(shù),該算法的詳細(xì)介紹可以參考文獻(xiàn)[23].
5)MultiNMF:本文算法的基準(zhǔn)算法,采用弱一致性約束的多視圖NMF學(xué)習(xí)方法.
6)Sc-ML:是一種改進(jìn)的Co-reguSC算法.Dong等在文獻(xiàn)[24]中提出,利用格拉斯曼流行距離中的一種投影距離來(lái)定義不同視圖學(xué)習(xí)的子空間之間一致性準(zhǔn)則.
7)MMSC:是一種多模態(tài)的譜聚類(lèi)方法.不同的模態(tài)(也就是圖像特征)共享一個(gè)相同的圖拉普拉斯矩陣,也就是最后的聚類(lèi)指示矩陣G.該算法的詳細(xì)介紹可以參考文獻(xiàn)[10].
8)AMGL:是一種多視圖譜聚類(lèi)方法.但是不同視圖所占的權(quán)重是自動(dòng)學(xué)得的,不需要有額外的參數(shù)來(lái)指導(dǎo)訓(xùn)練.該算法的詳細(xì)介紹可以參考文獻(xiàn)[11].
本文采用以往文獻(xiàn)中的經(jīng)典評(píng)估方法:AC(精確度)和NMI(歸一化互信息)來(lái)度量圖像數(shù)據(jù)聚類(lèi)的評(píng)估指標(biāo).給定一幅圖像,定義為圖像的標(biāo)簽類(lèi)別,為圖像對(duì)應(yīng)的聚類(lèi)中心的類(lèi)別標(biāo)簽,AC可以用如下式(31)來(lái)定義.其中n為所有的測(cè)試圖像數(shù)量,是一個(gè)脈沖函數(shù),函數(shù)中兩個(gè)參數(shù)相同則返回1,否則返回0.是一種將聚類(lèi)中心的標(biāo)簽映射到圖像集已知的對(duì)等標(biāo)簽,其中我們采用Kuhn-Munkres[25]的映射方法.
給定兩個(gè)數(shù)據(jù)集的所有聚類(lèi)中心,它們之間的互信息可以用式(32)計(jì)算.
其中,p(ci)和表示在所有測(cè)試圖像中被分到各自對(duì)應(yīng)聚類(lèi)中心的概率,在這里我們用數(shù)量比率代表概率,表示一個(gè)圖像被同時(shí)分到這兩個(gè)聚類(lèi)中心ci和的概率,同樣我們用數(shù)量比代替概率(注意在這里聚類(lèi)算法計(jì)算得到的聚類(lèi)中心的編號(hào)可以為任意的順序).在實(shí)驗(yàn)中,第一個(gè)聚類(lèi)中心集為圖像的已知類(lèi)別標(biāo)簽,同一個(gè)標(biāo)簽的圖像為一個(gè)聚類(lèi)中心,第二個(gè)聚類(lèi)中心集為聚類(lèi)算法得到的標(biāo)簽,標(biāo)簽可以為任意的順序標(biāo)簽.歸一化的互信息為互信息除以最大的聚類(lèi)標(biāo)簽熵,其中H(C)=?Pip(ci)log2p(ci),p(ci)指屬于聚類(lèi)中心ci的圖像數(shù)量比率.
3.3.1 聚類(lèi)的準(zhǔn)確性驗(yàn)證
在本文提出的方法需要計(jì)算各個(gè)數(shù)據(jù)之間的局部結(jié)構(gòu)關(guān)系,我們采用高斯核函數(shù)值作為權(quán)值,即.變量k=5,這種參數(shù)設(shè)置在非大量樣本數(shù)據(jù)庫(kù)中使用的較多.在式(12)中所有的變量我們?cè)O(shè)定為λf=0.01(f=1,···,G),μ=10,與算法MultiNMF和MultiGNMF保持一致.
在定義了參數(shù)之后,計(jì)算每個(gè)視圖圖像之間的親和矩陣,每種方法我們都運(yùn)行20次,取所有次數(shù)運(yùn)行結(jié)果的平均值和方差作為最終的算法效果評(píng)估值.經(jīng)過(guò)20次的實(shí)驗(yàn)運(yùn)行,我們統(tǒng)計(jì)了各種算法在4個(gè)數(shù)據(jù)庫(kù)上的AC和NMI值,如表2和表3所示.
在表2和表3中我們可以看到本文提出的算法在聚類(lèi)分析中相比較其他多視圖學(xué)習(xí)算法在準(zhǔn)確度和歸一化互信息兩個(gè)指標(biāo)下都有較好的表現(xiàn).同時(shí)我們注意到Co-reguSC和SC-ML算法也采用了局部結(jié)構(gòu)約束的條件(譜聚類(lèi)算法是一種基于數(shù)據(jù)樣本圖結(jié)構(gòu)的算法),MMSC也采用了一致性約束,本文算法同樣超過(guò)該類(lèi)算法.在比較本文提出的算法MultiGSemiNMF和MultiGNMF算法中,我們發(fā)現(xiàn)基于MultiGSemiNMF的算法相對(duì)于MultiGNMF算法聚類(lèi)效果上也有提升,即使所有特征并沒(méi)有負(fù)數(shù)或零,這證明在特征學(xué)習(xí)中MultiGSemiNMF算法比MultiGNMF算法在一些應(yīng)用場(chǎng)景中具有更好的表現(xiàn),且MultiGSemiNMF消除了MultiGNMF算法要求所有特征非負(fù)的限制,因此也有著更為廣闊的應(yīng)用平臺(tái).
表2 不同方法在4個(gè)數(shù)據(jù)庫(kù)中的AC值Table 2 The AC values by different methods in four databases
表3 不同方法在4個(gè)數(shù)據(jù)庫(kù)中的NMI值Table 3 The NMI values by different methods in four databases
3.3.2 參數(shù)對(duì)算法性能的影響
在式(12)中有G個(gè)參數(shù)變量λf,它的物理意義是不同視圖對(duì)學(xué)習(xí)過(guò)程的重要性進(jìn)行權(quán)衡.如果我們具有一些先驗(yàn)知識(shí),帶有噪聲的視圖特征可以適當(dāng)減少權(quán)重,被認(rèn)為重要的視圖如文本標(biāo)簽信息等可以適當(dāng)增加權(quán)重.在我們的實(shí)驗(yàn)中沒(méi)有先驗(yàn)知識(shí),同時(shí)數(shù)據(jù)已經(jīng)歸一化處理,所以所有的λf定義為相同的數(shù).但是λf的大小會(huì)影響聚類(lèi)效果,λf越小則對(duì)系數(shù)矩陣的一致性約束越松弛,反之,λf為無(wú)窮大的話(huà)所有系數(shù)矩陣為相同的數(shù)值.
下面我們?cè)趦蓚€(gè)數(shù)據(jù)庫(kù)CMU PIE和UCI Digit上用MultiNMF、MultiGNMF和MultiSemiNMF三個(gè)算法做聚類(lèi)分析,準(zhǔn)確率AC作為指標(biāo)度量不同的λf值對(duì)實(shí)驗(yàn)的影響.我們?cè)O(shè)定λf為0.001,0.005,0.002,0.01,0.02,0.05,0.1,圖1和圖2描述了對(duì)應(yīng)的聚類(lèi)效果.
從圖1和圖2中我們可以看到,在Multi-NMF、MultiGNMF和MultiSemiNMF三個(gè)算法中,MultiGSemiNMF算法的準(zhǔn)確率最高,且受參數(shù)影響很小,在較小或者較大的值均能有穩(wěn)定的表現(xiàn).MultiGNMF算法最不穩(wěn)定,但是在大部分實(shí)驗(yàn)中仍能超過(guò)基準(zhǔn)算法MultiNMF.三種算法均在λ=0.01時(shí)有較高的表現(xiàn).
圖1 在UCI Digit數(shù)據(jù)庫(kù)中參數(shù)λ對(duì)本文算法的影響Fig.1 The in fluences ofλon UCI Digit database
圖2 在CMU PIE數(shù)據(jù)庫(kù)中參數(shù)λ對(duì)本文算法的影響Fig.2 The in fluences ofλon CMU PIE database
本文提出的算法MultiGSemiNMF和Multi-GNMF需要構(gòu)建一個(gè)樣本親和矩陣,在損失函數(shù)其中有一個(gè)參數(shù)k,k值越大樣本的局部結(jié)構(gòu)約束越多,反之局部結(jié)構(gòu)約束越少.不同的k值對(duì)聚類(lèi)效果有一定影響,在與其他算法的比較中,我們采用其他算法一樣的k值,在這里我們另外分析k值對(duì)本文提出算法的影響.在UCI Digit數(shù)據(jù)總庫(kù),我們選取k=5,10,15,20構(gòu)建親和矩陣(λ=0.01),用聚類(lèi)的準(zhǔn)確率AC來(lái)評(píng)估算法效果,如圖3所示.
圖3 在UCI Digit中參數(shù)k對(duì)本文提出算法的影響Fig.3 The in fluences ofkon UCI Digit database
從圖3我們看到參數(shù)k對(duì)本文算法有一定的影響,k值越大雖然能更充分地保留樣本之間的局部空間結(jié)構(gòu)關(guān)系,但是從圖中的結(jié)果來(lái)看聚類(lèi)準(zhǔn)確度隨著k的變大有降低的趨勢(shì).過(guò)度的保留空間結(jié)構(gòu)關(guān)系并不能提升算法的效果,反而可能產(chǎn)生過(guò)度擬合的副作用,因?yàn)闃颖镜慕Y(jié)構(gòu)關(guān)系是基于原始特征的距離計(jì)算得到,而原始特征并不能充分描述樣本信息,其中或多或少含有冗余和噪聲.同時(shí),也可以看出,無(wú)論參數(shù)k取何值時(shí),MultiGSemiNMF算法的性能都優(yōu)于MultiGNMF算法.
本文提出了兩種多視圖學(xué)習(xí)的方法:Multi-GNMF算法和MultiGSemiNMF算法.Multi-GNMF和MultiGSemiNMF算法都是基于樣本局部結(jié)構(gòu)空間約束的非負(fù)矩陣分解多視圖學(xué)習(xí)方法.
本文首先介紹了一種單視圖學(xué)習(xí)方法:NMF矩陣分解.然后,NMF算法的基礎(chǔ)之上,在以往多視圖學(xué)習(xí)的框架準(zhǔn)則下,本文提出了基于樣本局部結(jié)構(gòu)空間約束的非負(fù)矩陣分解多視圖學(xué)習(xí)方法MultiGNMF.但是,MultiGNMF方法只適用于非負(fù)的特征矩陣.MultiGSemiNMF算法則不限于此.
為了驗(yàn)證本文提出的多視圖學(xué)習(xí)算法的性能,我們?cè)诠械膱D像數(shù)據(jù)庫(kù)中做聚類(lèi)分析.實(shí)驗(yàn)中和以往的算法比較,實(shí)驗(yàn)結(jié)果表明本文提出的算法相對(duì)于其他基于矩陣分解的多視圖學(xué)習(xí)方法有更好的表現(xiàn).同時(shí)實(shí)驗(yàn)中分析了算法中的參數(shù)變化對(duì)算法性能的影響,實(shí)驗(yàn)結(jié)果表明MultiGSemiNMF對(duì)參數(shù)變化具有很好的魯棒性.在未來(lái)的工作中,我們將探索一種新的基于局部結(jié)構(gòu)約束的多視圖學(xué)習(xí)方法.