李 梅,孔令罔
(1. 運城學院 機電工程系,山西 運城 044000;2. 武漢大學 印刷與包裝系,武漢 430079)
基于混合算法的色彩信號多光譜表示空間研究
李 梅1,孔令罔2
(1. 運城學院 機電工程系,山西 運城 044000;2. 武漢大學 印刷與包裝系,武漢 430079)
根據(jù)光譜光效率函數(shù),利用聚類分析法對多光譜數(shù)據(jù)集進行線性降維,進而利用快速獨立成分分析法對初次降維數(shù)據(jù)提取獨立成分,然后根據(jù)獨立成分進行光譜空間重建,最后從均方誤差以及色度空間兩方面對此方法與主成分分析法進行對比。實驗結果表明,該方法的均方差平均值較PCA降低了3.64%,平均色差較PCA降低了24.08%。可見,利用混合算法重建的多光譜表示空間能夠更高效地表示原始光譜空間。
多光譜空間;聚類分析;獨立成分分析;均方誤差;色差
傳統(tǒng)的色彩復制基于同色異譜復制原理,此種復制方法受光源及周圍環(huán)境的影響,不能保證色彩的始終一致性。隨著社會的發(fā)展,基于多光譜重現(xiàn)的色彩顯示與復制正在逐步走進人們的生活。但是由于多光譜數(shù)據(jù)采集的波段多,相關性強,導致存儲空間大,并在進行圖像顏色處理時,消耗時間長[1]。因此,快速實現(xiàn)數(shù)據(jù)有效提取,高效率實現(xiàn)顏色高精度復制已成為亟待解決的問題。本文提出以聚類分析和快速獨立成分分析相結合的混合算法來實現(xiàn)色彩信號多光譜空間的降維與重建,并從均方誤差和色度空間兩方面對此方法與主成分分析法進行對比。
1.1 聚類分析
在實際應用中,單獨應用聚類分析就可以根據(jù)數(shù)據(jù)的特征獲得數(shù)據(jù)的分布狀況,為研究者觀察每一類數(shù)據(jù)的特征,進一步集中對特定的類分析帶來很大的便利。所謂聚類分析就是根據(jù)一定的標準,將原始數(shù)據(jù)進行有規(guī)律的分類。目前聚類分析大體上分為層次聚類法和非層次聚類法。本文主要利用層次聚類法中的最短距離法和非層次聚類法中的K-均值法[2]。
首先在需要處理的數(shù)據(jù)中,隨機選取k個值作為初始聚類點,為以后的聚類奠定基礎。然后根據(jù)最短距離法對整體數(shù)據(jù)與k個值進行具體歸類。這次的聚類要求所有數(shù)據(jù)都歸于以k個值為中心點的類。歸類完成后,求取各個類的平均值,并以該值為中心點,繼續(xù)對整體數(shù)據(jù)運用最短距離法進行歸類。依次類推,直到k個中心點不變?yōu)橹?。具體流程如圖1所示。
圖1 K-均值法流程圖
1.2 快速獨立成分分析
FICA算法[3]是實現(xiàn)信號盲源分離的一種方法,在實現(xiàn)過程中考慮了高階的相關性[4],是尋找非高斯性最大值的不動點迭代法。該算法運用近似牛頓迭代法尋找混合信號中的獨立成分,其計算量是一般梯度算法的1/20-1/50[5],收斂速度較快。
假設一組隨機變量x=(x1(t),x2(t),…,xn(t))T,t是樣本標號,是由獨立成分s=(s1(t),s2(t),…,sn(t))T線型混合的,則混合信號可表示為式1。
x=As
(1)
式中,只有x是已知的,需要根據(jù)x來求解出s,這個過程就稱為盲信號分離。當源信號數(shù)目等于混合信號數(shù)目時,解混矩陣等于混合矩陣的逆,表示為式2。
W=A-1
(2)
從而,獨立成分可以由式3估算出:
s=Wx
(3)
本文中的FICA算法主要包含預處理和并行正交化算法兩個方面。
1.2.1 預處理
預處理可以在一定程度上降低盲源分離問題的復雜度,有效減少工作量,所以在實現(xiàn)FICA算法時,通常需要對輸入的原始數(shù)據(jù)進行預處理[6]。實施過程如下:
1) 中心化
對混合信號x進行中心化是一個必要條件。具體中心化方式就是用混合信號將每一列的平均值減去,使混合信號變?yōu)榱憔底兞?。這也意味著分離出來的獨立信號也是零均值的。如式4。
x-E{x}→x
(4)
2)白化
白化處理,又可稱為球化處理。因為混合信號之間大都具有相關性,所以在數(shù)據(jù)處理過程中會引起收斂不穩(wěn)定。因此一般情況下,都需要對混合信號進行白化或球化處理。白化處理不僅可以去除各混合信號之間的相關性,提高收斂穩(wěn)定性,而且還可以簡化計算過程。當混合信號的個數(shù)大于獨立成分的個數(shù)時,可以實施白化直接將混合信號的維數(shù)降到與獨立成分的維數(shù)相同[7]。白化原理如下:(1)根據(jù)零均值向量,計算x的協(xié)方差矩陣C;(2)計算協(xié)方差矩陣的特征值和其對應的特征向量β,如式5;(3)根據(jù)特征值及特征向量,計算白化矩陣V,如式6,其中Λ為特征值的對角陣,U為特征向量矩陣;(4)最終得到白化向量Z,如式7。
(5)
V=Λ-1/2UT
(6)
Z=Vx
(7)
1.2.2 并行正交化算法
快速ICA學習規(guī)則本質上是要找一個方向,這個方向可以使WTX的非高斯性最大。為了使計算簡單,對于非高斯性度量,WTX負熵的最大近似值通常都在E{G(WTX)}的極值點處獲得。即根據(jù)拉格朗日條件,在E{G(WTX)}=‖W‖2=1的約束條件下,E{G(WTX)}的最大近似值能夠由式8獲得
F=E{xg(WTX)}+βW=0
(8)
(9)
從而求得權向量W??梢?,并行正交化算法進行的是并行批量迭代,是實現(xiàn)FICA的主要部分,所得到的結果誤差較小。
最后根據(jù)權向量W得到解混矩陣提取獨立成分。如式10,
S=WTZ
(10)
最終FICA具體實現(xiàn)流程如圖2:
圖2 FICA算法流程圖
研究采用芬蘭Kuopio大學的Munsell Color Matt光譜數(shù)據(jù)集,這個數(shù)據(jù)集包含有1269個色樣的光譜反射率。這個光譜數(shù)據(jù)集是由Perkin-Elmer Lambda分光光度計在光源為D65,視場為2°的條件下,從400nm到700nm間隔5nm測量的,其中在波長400nm-420nm處,光譜反射率噪聲比較大。
1)運用聚類法對原光譜集孟塞爾色卡的1269個色塊的光譜反射率進行分類,達到分出來的每一組反射光譜的波形,既能達到幾何上的相似分布的分布歸并,也可以達到人眼視覺閾限的分布歸類。然后在峰值一類的反射光譜中,選取峰值居中的反射光譜作為基準,根據(jù)光譜光效率函數(shù)[8]分別對應計算各個組中反射光譜在各個波長點處的光譜反射率之差,如果在光譜光效率函數(shù)范圍內(nèi),則歸為一類;反之,如果超出光譜光效率函數(shù)范圍,則將其歸為新的一類。聚類分析后,色樣由1269組反射光譜線為972組,然后將每一類中作為基準的光譜反射率作為下面實現(xiàn)ICA降維的原始數(shù)據(jù)X。
2)運用快速獨立成分分析法提取降維后數(shù)據(jù)的獨立成分。
首先進行預處理,然后選取獨立成分個數(shù)5,進而根據(jù)上述并行正交化算法求取權向量,最終實現(xiàn)獨立成分提取s。
3)色彩信號的多光譜空間重建
色彩信號的多光譜空間是否成功重建是檢驗混合算法是否成功的一個關鍵因素。由FICA原理可知,得到混合矩陣和獨立成分就可以重建多光譜空間。由上文可知,已經(jīng)提取出獨立成分S。而混合矩陣A可根據(jù)式6、式9推出,表示為式11:
A=V-1W-1
(11)
(12)
3.1 均方差分析
平均平方誤差,顧名思義,是指估計值與真值之差平方的平均值,是光譜分布向量意義上的評價標準。公式如式13。
(13)
圖3 色樣的均方誤差分布圖
平均平方誤差的值越小,說明所得實驗數(shù)據(jù)與源數(shù)據(jù)相比精確度越高。整個光譜集的重建光譜與原始光譜的均方誤差分布如下:
從圖3中可以得知均方誤差分布比較均勻,除了一個色樣外,其他均在3.0 x10-4以下。混合算法與PCA[9]算法重建光譜與原光譜的均方差比較如表1。
表1 混合算法降維法與PCA降維法的光譜重建均方差比較
由表1可知,經(jīng)混合算法降維處理后重建的光譜誤差較PCA算法的要小。MSE最大值和最小值所對應的色樣的序號為1058和539。圖4為具有MSE最大值及最小值的重建光譜分布和所對應的原始光譜分布。
圖4 具有MSE最小值及最大值的重建和原始光譜分布
3.2 色差分析
色差是將人眼的視覺考慮在內(nèi)的,屬于感觀評價,是色彩復制的評價標準[9]。經(jīng)過該混合算法的降維,可得重構光譜與原光譜的色差如圖5。
圖5 色樣的色差分布圖
結合圖5可知,混合算法重構的光譜與原光譜的色差均小于0.3,說明重構光譜表色只有微量變化,人眼感覺不到[8]?;旌纤惴ㄅcPCA算法重建光譜與原光譜的色差比較如表2。
表2 混合算法與PCA算法重建光譜色差比較
由表2可知,兩種算法重建的光譜空間表色能力都比較理想,但是經(jīng)混合算法重建的光譜空間表色能力更強。
色差最大值和最小值所對應的色樣的序號為1064和157。圖6為具有色差最大值及最小值的重建光譜分布和所對應的原始光譜分布。
圖6 具有色差最小值及最大值的重建和原始光譜分布
綜上所述,1058號色樣的均方誤差是色樣中最大的,但是色差卻不是最大的;539號色樣的均方誤差是色樣中最小的,但是色差也不是最小的。可見,均方誤差只能在一定程度上解釋重建誤差的物理意義,當其值達不到0時,色差的評價更具有實際意義。
本文設計了以聚類分析和FICA算法的混合算法。并對此算法和PCA算法進行對比分析,得出利用混合算法重建的多光譜空間能夠更好地表示原始光譜空間。但是由于本算法所應用的數(shù)據(jù)只是理想數(shù)據(jù),有一定的局限性,以后可以將其應用到實際印刷色塊,從而實現(xiàn)該算法的應用價值。
[1] 王瑩,曾平.面向打印的光譜色彩管理中間空間構造方法[J].計算機科學,2010(5).
[2] 衛(wèi)俊霞,相里斌,高曉惠,段曉峰.基于K-均值聚類與夾角余弦法的多光譜分類算法[J].光譜學與光譜分析,2011(5).
[3] Vasilescu M A O, Terzopoulos D. Multilinear independent components analysis: 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR 2005[Z]. San Diego, CA, United states: 2005: 547-553.
[4]王一帆,唐正寧. 基于PCA和ICA的多光譜數(shù)據(jù)降維方法[J]. 光學技術,2014(2).
[5]王瑩,曾平,羅雪梅,謝琨.一種用于低維光譜空間構造的非負主成分分析法[J].四川大學學報(工程科學版),2010(2).
[6]Soize C. Construction of probability distributions in high dimension using the maximum entropy principle: Applications to stochastic processes, random fields and random matrices[J]. International Journal for Numerical Methods in Engineering. 2008, 76(10): 1583-1611.
[7]Hill B. Color capture, color management and the problem of metamerism: Does multispectral imaging offer the solution Proceedings of the 2000 Color Imaging: Device-Independent Color, Color Hardcopy, and Graphic Arts V[M]. San Jose, CA, USA: 2000: 2-14.
[8]劉武輝.印刷色彩學[M].胡更生.北京:化學工業(yè)出版社,2008.
[9]孔令罔,朱元泓,李瓊.以混合算法建立寬帶多光譜色彩表示空間[J].武漢大學學報(信息科學版),2006(9).
【責任編輯 馬太來】
Abstrat: By using the cluster analysis method according to the spectral luminous efficiency functions, the linear dimensionality reduction in multispectral dataset was realized, and the independent components of the dimensionality reduction data were extracted by using the fast independent component analysis method. Then, the spectral space was reconstructed according to the independent components. Finally, contrast this method and the principal component analysis method from the mean square error and color difference. The experimental results showed that the average value of mean-square error of proposed method reduced by 3.64% and the average value of color difference increases by 24.08% in comparison with PCA. The multispectral space reconstructed by using hybrid algorithm can efficiently represent the original spectral space.
Research of Color Signal Multispectral Representation Space Based on Hybrid Algorithm
LI Mei1,KONG Ling-wang2
(1.DepartmentofMechanicalandElectricalEngineering,YunchengUniversity,Yuncheng044000,China)
(2.DepartmentofPrintingandPackage,WuhanUniversity,Wuhan430079,China)
Multi-spectral space; Cluster analysis;Independent component analysis; Mean square error; Color difference
2015-02-11
運城學院院級科研項目 (CY-2013021)
李梅(1987-),女,山西呂梁人,運城學院機電工程系教師,碩士,研究方向為色彩科學與應用。
TS801
A
1008-8008(2015)03-0029-05