摘 要:在數(shù)字印刷領域,精確再現(xiàn)計算機圖像的顏色是高質量印刷的前提,其中色彩特征化是關鍵環(huán)節(jié)。傳統(tǒng)多項式回歸模型由于高階項會放大特征化樣本集中的奇異值,導致模型振蕩從而影響色彩特征化的準確性?;谏窠?jīng)網(wǎng)絡的色彩特征化算法精度較高,但算法復雜度也呈數(shù)量級的提高,難以滿足工業(yè)生產(chǎn)中的效率要求。為解決上述問題,提出殘差修正的加權多項式回歸算法,采用具有較強抗差能力的Huber損失函數(shù)來替代均方誤差。通過自適應機制確定各個樣本權重,并利用殘差值迭代優(yōu)化得到最佳權重矩陣,從而降低奇異值樣本對系統(tǒng)的影響;此外,修正模塊捕獲第一個模型可能遺漏的非線性情況輔助調整轉換結果,進而提高顏色再現(xiàn)準確性。結果表明,該算法與普通多項式回歸相比,平均色差降低1.2,與基于深度置信網(wǎng)絡的推理算法精度接近,但運行時間比其減少99.37%。
關鍵詞:色彩特征化; 多項式回歸; 自適應加權; 色彩復制; 色彩管理
中圖分類號:TP301 文獻標志碼:A
文章編號:1001-3695(2024)10-044-3188-06
doi:10.19734/j.issn.1001-3695.2023.11.0597
Weighted polynomial regression color characterizationalgorithm with residual correction
Yang Chen1, Lian Kaicheng1, Xu Hao1, Wu Qin1,2, Chai Zhilei1,2
(1.School of Artificial Intelligence & Computer Science, Jiangnan University, Wuxi Jiangsu 214122, China; 2.Jiangsu Provincial Engineering Laboratory of Pattern Recognition & Computational Intelligence, Wuxi Jiangsu 214122, China)
Abstract:In the field of digital printing, accurately reproducing the color of computer images is a prerequisite for high-quality printing, where color characterization is a key step. Traditional polynomial regression models tend to amplify outliers in the characterization sample set due to high-order terms, causing model oscillation and affecting the accuracy of color characterization. Color characterization algorithms based on neural network have higher precision but significantly increase in algorithmic complexity, making them unsuitable for the efficiency requirements in industrial production. To address these issues, this paper proposed a color characterization method based on weighted polynomial regression algorithm with residual correction. This algorithm employed the Huber loss function, known for its strong robustness against outliers, as a substitute for mean squared error. It determined the weight of each sample through an adaptive mechanism and iteratively optimizes the residual values to obtain the optimal weight matrix, effectively reducing the impact of outlier samples on the system. Additionally, the correction module captured nonlinear scenarios that the initial model might miss, significantly improving the adjustment of the transformation results and thereby enhanced characterization precision. The results show that compared to conventional polynomial regression, this algorithm reduces the average color difference by 1.2. It achieves a precision close to that of deep belief network algorithms but with more than 99.37% reduction in inference time.
Key words:color characterization; polynomial regression; adaptive weighted; color reproduction; color management
0 引言
打印機作為最常用的彩色圖像輸出設備,在其輸出流程中,圖像需經(jīng)過多次顏色轉換以生成打印設備所能識別和處理的數(shù)據(jù)格式。打印機和顯示器的呈色特性不同。CMYK打印機通過顏料介質來表達顏色,采用減色呈色法;RGB顯示器使用色光介質來表達顏色,采用加色呈色法。由于不同設備的呈色方式不一致且色彩再現(xiàn)能力不同,若想將計算機制版或掃描拍攝的圖像打印出來,需要將顯示器下的RGB顏色空間轉換為印刷設備的CMYK顏色空間。
為了精確控制顏色信號在不同顏色器件之間的傳輸,國際色彩聯(lián)盟將與設備無關的顏色空間CIE Lab或CIE XYZ作為連接色彩空間(profile connection space,PCS),該顏色空間是與設備無關的色度顏色空間,任何設備到設備的轉換都需要經(jīng)過該媒介。在印刷流程中,需要先將RGB顏色空間轉換為PCS,由于設備的色域不一樣,還需要在PCS空間下進行色域映射,最后將PCS轉換成CMYK顏色空間[1],如圖1色彩復制過程。在整個色彩復制過程中,通常將建立PCS和設備顏色空間關系的過程稱為色彩特征化。在實際印刷流程中,主要依賴于特征化模型中PCS空間色度值到印刷設備空間CMYK值的轉換,該過程是印刷色彩管理的一個重要過程和關鍵技術,對提升印刷質量和視覺效果有著不可或缺的作用[2]。
在已有的特征化算法中,主流是上述基于色度匹配的方式。近年來,也有少量使用光譜模型進行特征化,如文獻[3,4]尋找最佳光譜再現(xiàn)所需的墨水數(shù)量。然而,光譜的研究主要集中在理論上,在實際應用時,由于受到光譜圖像數(shù)據(jù)獲取以及硬件設備等因素的影響,其精度也沒有預期高,導致光譜打印產(chǎn)品屈指可數(shù)。常見的基于色度的匹配方式主要有多維度查找表法、模型法、多項式回歸法以及神經(jīng)網(wǎng)絡法。劉菊華[5]在四色印刷中使用多維查找表進行色彩特征化,但是隨著顏色數(shù)量的增多,樣本集也急劇增加,不適用于多色打印情況。文獻[6]通過紐介堡方程模擬打印輸出的呈色機理,然而打印輸出受到半色調、輸出設備以及多方面因素的影響,其色彩特征化精度較低。隨著技術的進步和AI的崛起,許多人工智能技術被應用于顏色管理領域,文獻[7,8]使用DNN,文獻[9]通過深度置信網(wǎng)絡進行顏色預測,雖然再現(xiàn)效果顯著,但訓練和推理階段的耗時較長。此外,每當更換墨水或打印材料時,都需要對特征化樣本集進行重采集,這不可避免地導致工作量大幅增加,影響了打印流水線的正常運作。由于模型的復雜性,在客戶端機器上的部署變得尤為困難,進一步增加了AI方法在打印領域應用的挑戰(zhàn)。在3D打印領域,Chen等人[10~12]提出深度學習特征化框架,可以達到較高的預測效果,但是由于神經(jīng)網(wǎng)絡模型的訓練時間長、訓練數(shù)據(jù)需求大、超參數(shù)的不確定性,模型訓練起來通常需要較大的計算資源。該類方法大多還是用在高分辨率的全彩色3D打印中。在色彩學領域,多項式回歸以其計算量小、模型簡單的優(yōu)勢占據(jù)著主導地位,尤其在特定高實時性要求的領域有著較好的應用前景。武漢大學Yang等人[13]使用傳統(tǒng)多項式建立特征化模型,文獻[14,15]闡述多項式回歸精度優(yōu)于其他傳統(tǒng)算法,但是此類回歸算法由于模型受到奇異值影響而振蕩,因此無法滿足更高精度的色差需求。在后續(xù)的工作中,研究人員通過對樣本集中的奇異值樣本進行限制以提高精度,例如文獻[16~18]通過添加約束項以及修正多項式階數(shù),減少樣本集中奇異值對多項式模型的影響,但是階數(shù)達到三階以上時約束項的推導會變得相當復雜。Zhao等人[19]使用KPLS進行色彩特征化,精度較為理想,但是需要選擇合適的核函數(shù)和相關參數(shù),這增加了模型調整的復雜性,并且有時會造成過擬合風險,且神經(jīng)網(wǎng)絡方法大同小異。
本研究聚焦于提高工業(yè)印刷的生產(chǎn)效率與色彩復現(xiàn)的精確性。對傳統(tǒng)的多項式回歸算法進行改進,以減輕其在高精度應用中因高階項引入而導致的模型振蕩問題。在考慮樣本集奇異值對多項式回歸模型影響的工作基礎上,本文創(chuàng)新性地引入了樣本迭代加權策略,同時融合了殘差修正機制,構建了一個輕量化的高精度特征化模型。算法采用以Huber算子為影響函數(shù)的迭代加權最小二乘方法來求解轉換關系。迭代過程根據(jù)當前殘差動態(tài)調整權重,即對于殘差較小的點,賦予較大的權重,而對于殘差較大的點,賦予較小的權重,有效減少了奇異值點對系統(tǒng)的影響,從而提升了常規(guī)數(shù)據(jù)點的預測準確度;再引入更高階多項式計算修正值,并對轉換后的預測設備值進行修正,不僅顯著提高了對奇異值的預測精度,同時也優(yōu)化了常規(guī)數(shù)據(jù)點的預測效果。實驗結果表明,本方案相較于傳統(tǒng)的紐介堡方程、查找表等算法,在各項指標上表現(xiàn)均較優(yōu)。與普通多項式回歸算法相比,平均減少1.2個色差,最大色差減少了10.6%。與在配備16核的i7-5960X CPU和GeForce RTX 2080 Ti GPU上運行的深度置信網(wǎng)絡相比,本文算法色差降低了約8.3%,推理時間減少了99.37%,模型訓練節(jié)省了7.9 h。
1 問題背景
1.1 樣本集中奇異值說明
原色墨水的原料缺陷和紙張等多種因素導致打印效果和理想狀態(tài)偏差較大。在理想打印狀態(tài)下,不同百分比單色墨水的色相應該恒定不變,并且明度隨著墨量的均勻變化也會產(chǎn)生相同變化。如圖2的CMYK三原色明度階調曲線所示,當墨量百分比達到一定程度之后,由于紙張墨量限制、油墨密度等原因,造成墨量較高時,明度曲線呈非線性趨勢。同樣的情況也體現(xiàn)在色度分量上,如圖3所示,由若干個點連接而成的線段表示隨著墨量增大時a、b變量的變化情況。每級墨量的色相角為圖中的點和原點連線后的線段和x軸的夾角,可以發(fā)現(xiàn)高墨量原色的色相角偏離正常軌跡。由此可知,彩色打印機的原色墨量和L、a、b之間的關系存在非線性,尤其是在高墨量和暗部區(qū)域,導致疊印之后,非線性更強。在特征化印刷樣本集中,由于較強的非線性導致部分樣本偏離常規(guī)軌跡。該部分樣本和其他樣本特征明顯不同,將這類樣本點稱為奇異值點,也稱為離群點。在多項式算法中,由于回歸后所擬合的是樣本的常規(guī)規(guī)律,所以往往將預測結果和實際標簽有較大差距的點認定為奇異值點。
在陶瓷、包裝、紡織品、金屬和玻璃等特殊印刷領域,印刷工藝和材料特性會導致最終效果與預期色彩有所差異。例如,在陶瓷印刷中的高溫窯爐處理,包裝印刷中的覆膜和上光等后期處理,以及金屬、玻璃等特殊承印物上的打印,都可能影響油墨的顏色表現(xiàn)。這些過程中產(chǎn)生的奇異值是正?,F(xiàn)象,而且往往是不可避免的。
1.2 特征化算法應用瓶頸
神經(jīng)網(wǎng)絡在色彩復現(xiàn)領域精度較高,但用于工業(yè)生產(chǎn)會遇到一些實際問題。它們訓練耗時,并需要昂貴的計算資源,這讓它們難以在成本和硬件資源有限的情況下使用。相對而言,多項式回歸模型更加高效、易于部署。隨著打印環(huán)境的變化,例如墨水和承印物的更換、溫度的變化、印刷速度的改變以及打印設備的磨損和老化,輕量級的多項式回歸模型可以快速迭代。在考慮成本效益和效率的同時,多項式回歸模型在許多實際應用場景中比神經(jīng)網(wǎng)絡模型更具優(yōu)勢。
盡管在色彩學領域中,輕量級的多項式模型顯示出其獨特的優(yōu)勢,但其適用性受到樣本集中奇異值的限制,特別是在算法需要采用高階項以獲得更高精度的場景。因此,采取相應的措施以應對這種局限性變得至關重要。
2 改進的多項式回歸特征化算法
彩色打印機的特征化模型的主要目標是建立設備顏色空間和PCS之間的轉換關系。在高保真多色印刷中,考慮到多色樣本集的建立以及色度值和顏色通道之間一對多的映射關系,將多個基色在色相平面下劃分為多個區(qū)域。圖4為顏色分區(qū)圖。本文通過計算原稿中某個顏色的色相角來確定其所屬區(qū)域,然后根據(jù)該顏色所在區(qū)域的三個基色合成該顏色,并使用回歸模型建立它們之間的關系[20]。因此,在建立特征化模型的時候,首先要對整個顏色空間進行分區(qū),即將CMYKOG顏色在LAB顏色空間下按照色相角分為GCK、CMK、MOK、YOK、YGK五個區(qū)域。然后,對每個分區(qū)采取多項式回歸方法建立特征化模型。
在需要高精度顏色復現(xiàn)的應用場景下,添加高階項可以顯著提高多項式模型的精度,但高階項可能會放大數(shù)據(jù)中的奇異值。如果直接將多項式回歸應用于實際復雜的打印場景中,由于各種材料和承印物的不穩(wěn)定性,導致樣本集存在奇異值,模型可能會變得不穩(wěn)定。例如在圖5奇異值展示中,圖(a)是特征化模型的訓練數(shù)據(jù),圖(b)是使用多項式回歸算法轉換得到的結果。下面以此圖來說明傳統(tǒng)多項式模型在引入高階項后的局限性。在圖(a)的第一列高墨量的青油墨樣本中,隨著墨量的增加,其色相發(fā)生變化,導致其色度值和設備值之間存在較強的非線性,普通的多項式擬合的關系和其真實情況有較大偏差。如圖(b)所示,轉換后的顏色和原色塊顏色差別較大,其他紅色框標注的色塊也是同樣情況,這些和原始樣本差別較大的數(shù)據(jù)就是奇異值樣本。由于多項式回歸模型旨在捕捉樣本點中普遍存在的規(guī)律,所以此類奇異值樣本不僅會干擾模型的擬合過程,還會削弱模型的預測效果。
當多項式回歸引入高階項時,這些高階項可能會放大數(shù)據(jù)中的離群值。此外,與數(shù)據(jù)相關性較高的數(shù)據(jù)集不同,本實驗數(shù)據(jù)集中包含了奇異值樣本。對于這些奇異點,常規(guī)多項式回歸模型可能不具備足夠的魯棒性。因此,本文采用了穩(wěn)健估計算法并集成誤差修正技術。采用更穩(wěn)健、更具預測性的Huber影響函數(shù),再使用Huber算子求得標準殘差,并以迭代的方式不斷調整樣本權重,進而求得每個訓練樣本的最佳權重。該策略極大地提高了模型的魯棒性[21],但鑒于離群點有時也代表有效的樣本數(shù)據(jù),對其進行準確估計也很重要。為進一步提高模型對少量離群點的預測能力,還需將奇異值和常規(guī)數(shù)據(jù)點一同進行修正。該修正模型不僅僅提高了此類奇異點的預測能力,還能提高模型整體的非線性表現(xiàn)能力,以達到更高的特征化精度。
如圖6所示,本文算法在實際應用過程中,首先通過打印輸出預設計的色彩特征化樣本集,并使用色度計對打印色塊進行測量。由于考慮到上述奇異值對模型的影響,所以接下來會使用殘差修正的加權多項式回歸算法擬合樣本集變量中存在的非線性關系。當圖片或其他數(shù)據(jù)輸入本文算法模型后,通過訓練得到的轉換關系生成特征化結果。最后,這些結果將被用于指導打印設備,完成打印工作。加權多項式回歸算法和殘差修正算法的具體細節(jié)見2.1、2.2節(jié)。
2.1 自適應樣本加權策略
回歸方法主要是研究一個因變量和一個或多個自變量之間關系的方法。通過對已知的自變量和因變量之間建立多項式方程獲取兩者之間的轉換關系,實現(xiàn)對其他未知自變量的預測。該轉換矩陣可由影響函數(shù)為Huber函數(shù)的迭代加權最小二乘法來求得,通過求得的系數(shù)矩陣,把源色空間轉換到目標色空間。
以最常見的二階十項式為例:有H*βfinal=T,H是N×L的輸入矩陣,βfinal是L×3轉換矩陣,T是N×3輸出矩陣,N是樣本數(shù),L是多項式項數(shù)。取項數(shù)L=10,Hi的表達式如式(1),式中Li、ai、bi分別對應樣本集中色塊i的PCS顏色空間的色度值L、a、b,則所有色塊的輸入色度矩陣H如式(2)所示。以GCK分區(qū)為例,所有色塊的輸出矩陣為T,GCK各分量表示設備值,下標對應相應的樣本編號,表達式如式(3)所示。
Hi=[1,Li, ai,bi,Li*ai,Li*bi,ai*bi,L2i,a2i,b2i](1)
H=h11h12…h(huán)1Lh21h22…h(huán)2LhN1hN2…h(huán)NL(2)
T=G1C1K1G2C2K2GNCNKN(3)
下面以預測G分量然后擴展到三維分量GCK為例。一般情況下H*β=G是無解的(G是G分量的矩陣形式),因此是求解一個最優(yōu)的,使得設備的預測值盡量和真實值接近。是G分量的回歸系數(shù),是L×1的轉換矩陣。通過最小二乘法,可以最小化每個方程結果的殘差平方和[22],經(jīng)過分析有
=arg minβ Q(β)(4)
那么關于殘差的目標函數(shù)為Q(β),如式(5)所示,必須保證預測值和真實值之間的殘差平方和最小。
Q(β)=∑Ni=1(ei)2=∑Ni=1(Gi-Hiβ)2=
(G1-H1β,G2-H2β,…,GN-HNβ)G1-H1βG2-H2β GN-HNβ=
(G-Hβ)T(G-Hβ)(5)
此時對Q(β)求偏導并令表達式為0,得到
=(HTH)-1HTG(6)
由于普通最小二乘法尚未考慮每個樣本的權重,可能導致較大的誤差,所以對每個樣本賦予權重,權重函數(shù)為ρ,從而可以得到更為精準的結果。那么樣本加權后的目標函數(shù)為
Q(β)=∑Ni=1ρ(ei)=∑Ni=1ρ(Gi-Hiβ)(7)
則目標函數(shù)對參數(shù)β求偏導,原理和上面一樣,并令偏導數(shù)等于零,得到式(8),Ψ(x)為ρ(x)的導函數(shù)。
∑Ni=1Ψ(Gi-Hiβ)Hi=0(8)
此時令Wi=ψ(Gi-Hiβ)Gi-Hiβ,有HTW(G-Hβ)=0,最終求得
=(HTWH)-1HTWG(9)
將G分量推廣到GCK的三維分量形式T,可求解最終轉換矩陣final,其表達式如式(10)所示,此時W只是初始權重矩陣。
final=(HTWH)-1HTWT(10)
ρ往往采用均方誤差,但是為了使模型不易受異常值影響,使用Huber算子作為影響函數(shù)。當誤差較大時,Huber損失趨向于平均絕對值誤差(mean absolute error,MAE),當誤差較小時,趨向于均方誤差(mean squared error,MSE)。這個分段線性的設計使得當誤差在k范圍內時,損失函數(shù)類似于均方誤差(平方損失),它對異常值的懲罰相對較小;而當誤差超出k時,損失函數(shù)的增長是線性的,對異常值的懲罰變得更大。因此,異常值對整體損失的影響被有效地限制在一定范圍內,其表達式ρ(x)如式(11)所示,k為調和函數(shù),默認取1.345。
ρ(x)=x2/2 |x|≤kk|x|-k2/2|x|>k(11)
本文采用GCK各分量之間的歐氏距離作為ei,為了使估計更具穩(wěn)健性,引入絕對離差中位數(shù)s使得殘差標準化。標準化殘差ui通過絕對離差中位數(shù),除以一個常數(shù)0.674 5后得到,如式(12)所示。
ui=eis=0.6745×eimed(|ei|)(12)
其中:med代表中位數(shù)計算。那么使用標準化殘差過后的Q(β)求偏導并令表達式為0后的結果如式(13)所示。
∑Ni=1Ψ(ui)Hi=∑Ni=1Ψ(ui)ui·uiHi=∑Ni=1Wi·ui·Hi=0(13)
其中:Wi是序號為i的樣本權重,通過該式可以得到標準化殘差操作后的轉換矩陣也是式(10)。為進一步提高預測精度,β的穩(wěn)健估計可用迭代加權最小二乘求解。通過不斷計算目前轉換矩陣的殘差,對樣本集進行重新分配權重,當轉換矩陣變化很小時結束迭代,得到最佳權重矩陣,流程如圖7所示。
最終迭代加權后的轉換矩陣結果如式(14)所示,Wfinal為最佳權重矩陣。對于任意輸入的N個三維LAB數(shù)據(jù),首先按照式(1)的形式將該N×3矩陣拓展成N×10矩陣X,再與得到的轉換矩陣相乘,得到自適應迭代加權的結果為Y,其維度為N×3,如式(15)所示。后續(xù)殘差修正模塊將在此Y的基礎之上進行修正。
final=(HTWfinalH)-1HTWfinalT(14)
Y=X*final(15)
2.2 殘差修正策略
在迭代加權求解后,部分預測還存在較大誤差,往往需要對特征化結果進行進一步優(yōu)化。在不同的色度值下,特征化結果和標準設備值都有一個偏差。通過建立色度值和設備值偏差之間的關系,再計算相應色度值對應的損失,將損失累加到原始設備值,則對結果可以起到輔助修正作用。通過該策略可以對異常值點進行誤差修正,同時通過更高階多項式捕獲第一個模型可能遺漏的非線性情況,從而提高特征化精度。
下面進行算法介紹,同樣以GCK分區(qū)為例進行說明。顏色值GCK通過色度計測量得到的真實色度值為LAB,使用模型對LAB進行預測得到預測設備值G^C^K^,對預測值進行測量得到該設備值對應的預測色度L^A^B^。若想得到預測模型的修正值,需要經(jīng)過兩次多項式回歸從而建立LAB和ΔGΔCΔK的關系。首先對樣本集真實值和預測值進行采集并計算,得到LAB和L^A^B^的差值ΔLΔAΔB;接著,將LAB和ΔLΔAΔB的若干組數(shù)據(jù)作為訓練數(shù)據(jù),建立LAB和ΔLΔAΔB的多項式回歸模型,以求得當前色度值下對應的色度損失;進而建立色度損失ΔLΔAΔB和顏色損失ΔGΔCΔK之間的關系。這樣對于任意一個輸入的LAB色度值就可以得到一個校正值,那么利用該修正值對預測值進行補償即可達到提高精度的效果,修正過程如圖8最終設備值求解(以GCK分區(qū)設備值為例)。由于特征化模型的最終評價是在LAB顏色空間下進行的,所以引入預測設備值G^C^K^對應的色度值L^A^B^,通過色差計算補償值,該方法可以更精準地計算出ΔGΔCΔK的值,從而對預測結果進行修正。從理論上來說,該校正模塊首先使用低階多項式進行迭代加權求解,從而確保對于未見過的數(shù)據(jù)具有較好的泛化能力。在初步轉換結束后,引入更高階多項式用于校正,從而減少了過擬合的風險。通過修正模塊可以調整原始結果,提高了模型的預測能力,使得最終特征化結果融入了預測值和修正值,從而對加權回歸后的數(shù)據(jù)有更好的提升效果,尤其是奇異值部分。
3 實驗結果與分析
3.1 實驗環(huán)境
為了驗證所提出模型在存在奇異值的情況下有較好的特征化精度,本研究在600dpi的噴墨打印機上對特征化模型進行部署并與其他算法進行比較。對于數(shù)據(jù)集,本文采用i1 Profiler軟件創(chuàng)建了一系列自定義設備色值的色塊文件,并通過RIP軟件控制打印機打印這些色塊。使用分光光度計i1 Pro3對打印出的色塊進行了LAB色度值的測量。
本實驗過程主要分為樣本集的生成、模型的訓練和模型精度的測試三個階段,具體步驟如下:
a)設計供打印機打印的GCK分區(qū)色塊,并用分光光度計測量其打印色塊的LAB色度值,將得到的GCK數(shù)據(jù)與對應的LAB測量值配對,形成數(shù)據(jù)集,并隨機劃分為訓練集和測試集。
b)應用本文算法、查找表方法、紐介堡方程以及神經(jīng)網(wǎng)絡方法,分別建立GCK設備值與LAB色度值間的映射關系,從而得到各自的特征化模型。
c)在測試集上應用這些特征化模型,將LAB色度數(shù)據(jù)轉換為GCK設備值。接著,根據(jù)預測的GCK值創(chuàng)建可打印的色塊文件,并指導打印機進行打印。打印后,測量不同算法轉換后色塊的LAB值,并計算與測試集原始LAB值之間的色差。
為了更加清晰明了地理清各個步驟的具體操作以及內部關系,本文對實驗流程進行圖片展示,如圖9所示。
3.2 結果與分析
本實驗使用傳統(tǒng)算法、單獨加權和修正模塊、粒子群算法優(yōu)化(particle swarm optimization,PSO)的深度信念網(wǎng)絡(deep belief network,DBN)以及本文算法進行色差量化分析。特征化精度評價一般以色差為主,ΔEab色差公式如式(16),其更符合人眼的形式。ΔE00見文獻[23]推導,本文以ΔE00作顏色評價。
ΔEab=(L^-L)2+(A^-A)2+(B^-B)2(16)
下面展示不同算法在GCK分區(qū)的平均色差、平均色差(較低90%)、色差最大值,在GCK分區(qū)的色差對比結果如表1所示。
結果表明,樣本加權模塊使用自適應策略調整樣本集權重,提高了模型的穩(wěn)定性,因此對整體的預測效果有較大的改善。單獨的加權模塊將平均色差從3.4降低到3.0,但是對于奇異值點的預測不佳。殘差修正可以在回歸模型比較穩(wěn)定的基礎上對奇異值等進行更好的補償,單獨使用時可以將色差最大值從24.4降低到16.1,同時平均色差減少26.47%。殘差修正的自適應加權多項式回歸在樣本集中存在奇異值的情況下較傳統(tǒng)的特征化算法具有更好的復現(xiàn)效果,有較高的魯棒性,對于更復雜的打印場景有較好的預測水平,相比于傳統(tǒng)多項式回歸,平均色差從3.4降低到2.2,色差升序排序后,前90%樣本的平均色差也從2.6降低至1.6,而且更重要的是,色差最大值得到了較好的改善,降低了9.2個色差,效果比較明顯。本文算法在其他顏色分區(qū)也有著較好的表現(xiàn)效果,如表2所示,最終特征化結果的色差約為2.3左右,能夠滿足國際標準ISO 12647-7規(guī)定的ΔE00≤2.5。在本項研究中,為了評估所提算法相較于傳統(tǒng)多項式回歸方法和機器學習算法的準確性,本文進行了一系列實驗。實驗過程中,利用這些算法生成的特征化結果被輸送至打印機以執(zhí)行打印任務,隨后采用具有600 DPI分辨率的掃描儀進行圖像捕獲,以獲取最終打印效果的視覺呈現(xiàn)。如圖10所示,實驗輸出包括三部分:左側圖像展示了本文算法的效果,中間圖像代表傳統(tǒng)多項式回歸模型的輸出,而右側為原始圖像。通過與原圖的比較分析可以觀察到,由于打印機色域限制,特定的飽和顏色區(qū)域,尤其是紅色區(qū)域,并未得到精確復現(xiàn)。特別值得注意的是,在圖中標注紅框的黃色區(qū)域以及面部的藍色部分(參見電子版),本文算法在顏色還原方面表現(xiàn)出了比傳統(tǒng)多項式回歸方法更高的準確度。從表1中的數(shù)據(jù)可知,本文算法與PSO+DBN模型在精度上表現(xiàn)接近。圖11展示了本文算法與PSO+DBN模型的對比結果。從圖(a)(b)中可以看出,在使用這兩種不同的特征化算法時,肉眼幾乎無法區(qū)分它們之間的差異。
另外,對于PSO+DBN的神經(jīng)網(wǎng)絡模型而言,該算法用PSO尋找DBN模型的最優(yōu)隱含層神經(jīng)元數(shù)量等超參數(shù)后進行訓練,模型預測精度較高。本文模型精度在和其精度接近的情況下,訓練時間和計算時間都大幅度降低。實驗在配備16核的i7-5960X CPU和GeForce RTX 2080 Ti GPU上完成,以訓練2 033個樣本以及預測343個樣本進行測試,結果如表3所示。結果表明,由于PSO+DBN模型的復雜性,即使在GPU上進行訓練,訓練時間和本文算法相比相差甚遠,在CPU上運行網(wǎng)絡模型就更耗時。另外,該神經(jīng)網(wǎng)絡模型在CPU上的推理時間是本文算法的210倍左右,CPU+GPU的異構處理平臺上處理時間是本文算法的25倍左右。在GPU上進行數(shù)據(jù)處理雖然提升了處理效率,但是也帶來額外的主機端和設備端的傳輸開銷。本文算法在模型訓練方面更是占據(jù)絕對優(yōu)勢,比在CPU上訓練縮短17.1 h,比訓練較快的CPU+GPU模式還要少7.9 h。多項式回歸模型簡單,所以計算和訓練時間都非常短,而且在精度要求比較高的領域,多項式回歸可以通過添加項數(shù)或者增加樣本集達到更好的效果。如果將該特征化模型直接應用到寬幅打印、實時打印、高分辨率打印等領域,按照該方法處理可以更好地滿足實時性的要求。而且這種處理方式具有顯著的優(yōu)勢,因為它不依賴于高配置的硬件設備,為廣泛應用提供了靈活性。
在色彩特征化領域,基于所進行的深入分析,驗證了本文算法在實際應用場景中的可行性與有效性。
4 結束語
本文致力于開發(fā)一種具有高生產(chǎn)效率和低計算復雜度的模型,旨在滿足工業(yè)印刷領域的需求。本文提出的特征化模型通過加權樣本的策略提高了魯棒性,并集成修正模塊調整原始結果,極大地提高了特征化精度。實驗結果表明,本文算法優(yōu)于傳統(tǒng)的多項式回歸方法,有更好的色彩復現(xiàn)效果。同時其計算復雜度遠遠小于神經(jīng)網(wǎng)絡模型,能解決印刷效率和模型部署問題。該算法對于陶瓷、包裝、玻璃打印以及近年來興起的3D打印、在線打印等具有較高的實用價值。
參考文獻:
[1]Sharma A. Understanding color management[M]. Hoboken, NJ: Wiley, 2018.
[2]Morovic J, Arnabat J, Richard Y, et al. Sampling optimization for printer characterization by greedy search[J]. IEEE Trans on Image Processing, 2010, 19(10): 2705-2711.
[3]Babaei V, Hersch R D. N-Ink printer characterization with barycentric subdivision[J]. IEEE Trans on Image Processing, 2016, 25(7): 3023-3031.
[4]Ansari N, Alizadeh-Mousavi O, Seidel H P, et al. Mixed integer ink selection for spectral reproduction[J]. ACM Trans on Graphics, 2020, 39(6): 1-16.
[5]劉菊華. 彩色打印機色彩特性化關鍵技術研究[D]. 武漢: 武漢大學, 2014. (Liu Juhua. Research on key technologies for color characterization of color printers[D]. Wuhan: Wuhan University, 2014.)
[6]Deshpande K. N-colour separation methods for accurate reproduction of spot colours[D]. London: University of the Arts London, 2015.
[7]Velastegui R, Pedersen M. CMYK-CIELAB color space transformation using machine learning techniques[EB/OL]. (2021-09-20). https://doi.org/10.2352/issn.2694-118x.2021.lim-73.
[8]MacDonald L. Color space transformation using neural networks[C]//Proc of Color and Imaging Conference. Springfield, VA: Society for Imaging Science and Technology, 2019: 153-158.
[9]Su Zebin, Yang Jinkai, Li Pengfei, et al. A precise method of color space conversion in the digital printing process based on PSO-DBN[J]. Textile Research Journal, 2022, 92(9-10): 1673-1681.
[10]Chen Danwu, Urban P. Deep learning models for optically characterizing 3D printers[J]. Optics Express, 2021, 29(2): 615-631.
[11]Chen Danwu, Urban P. Inducing robustness and plausibility in deep learning optical 3D printer models[J]. Optics Express, 2022, 30(11): 18119-18133.
[12]Chen D, Urban P. Multi-printer learning framework for efficient optical printer characterization[J]. Optics Express, 2023, 31(8): 13486-13502.
[13]Yang Huifang, Yi Yaohua, Liu Juhua, et al. Research on multi-color separation model based on polynomial regression[J]. Applied Mechanics and Materials, 2015, 731: 27-31.
[14]Lyu Guangwu, Cao Peng. Color space conversion technology and comparative research[C]//Proc of the 8th International Conference on Information Technology: IoT and Smart City. London: Springer, 2020: 115-118.
[15]Bi Zhicheng, Cao Peng. Color space conversion algorithm and comparison study[C]//Proc of International Conference on Computer.[S.l.]: IOP Publishing, 2021: 012008.
[16]Finlayson G D, Mackiewicz M, Hurlbert A. Color correction using root-polynomial regression[J]. IEEE Trans on Image Processing, 2015, 24(5): 1460-1470.
[17]Yamakabe R, Monno Y, Tanaka M, et al. Tunable color correction between linear and polynomial models for noisy images[C]//Proc of IEEE International Conference on Image Processing. Piscataway, NJ: IEEE Press, 2017: 3125-3129.
[18]Ji Jing, Fang Suping, Shi Zhengyuan, et al. An efficient nonlinear polynomial color characterization method based on interrelations of color spaces[J]. Color Research & Application, 2020, 45(6): 1023-1039.
[19]Zhao Siyu, Liu Lu, Feng Zibing, et al. Colorimetric characterization of color imaging system based on kernel partial least squares[J]. Sensors, 2023, 23(12): 5706.
[20]曹朝輝. 多色印刷分色模型研究[D]. 鄭州: 解放軍信息工程大學, 2007. (Cao Zhaohui. Research on color separation model for multicolor printing[D]. Zhengzhou: Information Engineering University,2007.)
[21]Sun Qiang, Zhou Wenxin, Fan Jianqing. Adaptive Huber regression[J]. Journal of the American Statistical Association, 2020, 115(529): 254-265.
[22]胡義函, 張小剛, 陳華,等. 一種基于魯棒估計的極限學習機方法[J]. 計算機應用研究, 2012, 29(8): 2926-2930. (Hu Yihan, Zhang Xiaogang, Chen Hua, et al. Extreme learning machine on robust estimation[J]. Application Research of Computers, 2012, 29(8): 2926-2930.)
[23]Gómez-Polo C, Muoz M P, Luengo M C L, et al. Comparison of the CIELab and CIEDE2000 color difference formulas[J]. The Journal of Prosthetic Dentistry, 2016, 115(1): 65-70.