陳夢濤,余 粟
(1.上海工程技術(shù)大學(xué) 機械與汽車工程學(xué)院;2.上海工程技術(shù)大學(xué) 工程實訓(xùn)中心,上海 201620)
近年來,隨著計算機技術(shù)的不斷發(fā)展,用戶獲取的彩色圖像越來越豐富,大量的圖像處理任務(wù)需要更高效和準(zhǔn)確的彩色圖像分割方法[1]。經(jīng)典圖像分割算法一般基于灰度圖像特征進行分割,主要包括閾值法、邊界檢測法、區(qū)域法等[2]。但在很多情況下,灰度圖像包含的信息有限,單純利用灰度圖像分割方法進行彩色圖像分割,無法處理色調(diào)與飽和度等彩色信息,分割效果往往難以滿足用戶需求,需借助彩色圖像分割方法[3]。
國內(nèi)外學(xué)者對此進行了大量研究。如文獻[4]和文獻[5]將改進的閾值法與區(qū)域法引入彩色圖像分割中,使圖像目標(biāo)準(zhǔn)確地從背景中分離,但受默認(rèn)的RGB 空間中3 顏色分量高度相關(guān)限制,分割圖色彩表現(xiàn)較差;文獻[6]嘗試將顏色空間由RGB 空間轉(zhuǎn)換到Lab 空間,并與k 均值算法相結(jié)合,使分割圖色彩更符合人類視覺,但算法初始聚類數(shù)目依賴經(jīng)驗確定,不具備普適性;文獻[7-8]使用神經(jīng)網(wǎng)絡(luò)方法進行分割實驗,分割圖色彩度和準(zhǔn)確度較為理想,但需大批量圖像進行標(biāo)注和訓(xùn)練,成本高且計算過程復(fù)雜,不適合大規(guī)模的彩色圖像分割任務(wù)。以上研究均未設(shè)計出一種在分割效率、分割準(zhǔn)確度以及色彩飽和度方面均表現(xiàn)良好的彩色圖像分割算法。
基于現(xiàn)有研究可發(fā)現(xiàn)選用合適的顏色空間和分割方法是提高算法質(zhì)量的兩個關(guān)鍵因素。因此,本文結(jié)合Lab均勻顏色空間與運行效率高的k 均值算法進行實驗,添加數(shù)據(jù)預(yù)處理階段,使其能夠自適應(yīng)地獲得全局初始聚類質(zhì)心位置和數(shù)目,有效減少算法迭代次數(shù),得到一種分割速度快、分割質(zhì)量高的彩色圖像分割算法。
圖像領(lǐng)域中應(yīng)用最多的色彩信息表達方式是RGB 顏色空間,它通過紅、綠、藍三原色混合疊加可以產(chǎn)生多種顏色。但是RGB 空間中三顏色通道存在高度線性相關(guān)性,即其中任何1 個顏色分量發(fā)生改變都會導(dǎo)致圖像整體顏色產(chǎn)生變動,這種相關(guān)性特征極不利于圖像中彩色信息聚類和分割[8]。另外由于人眼視覺細(xì)胞對自然界中紅、綠、藍三原色敏感程度不同,因此在人類視覺感知到的RGB 顏色空間下,分割圖色彩均勻性、色彩飽和度很難達到預(yù)期效果[9]。由此可以看出常用的RGB 顏色空間不適合處理彩色圖像分割任務(wù)。
Lab 顏色空間是在1931 年由國際照明委員會制定的一種不受設(shè)備影響、以人的視覺生理特性為依據(jù),通過數(shù)字化方式客觀描述人視覺感應(yīng)的色彩系統(tǒng)[10]。在Lab 顏色空間中包含1 個亮度通道和兩個顏色通道。其中,L 亮度通道單純表示亮度軸,取值范圍(0~100),表示從純黑到純白。顏色通道a 取值范圍(-128~+127),表示從綠色到紅色的漸變;顏色通道b 取值范圍(-128~+127),表示從藍色到黃色的光譜變化[11],參數(shù)直觀圖如圖1 所示(彩圖掃OSID 碼可見)。
從圖1 中可以看出,該顏色空間正值為暖色,負(fù)值為冷色,兩個基礎(chǔ)色均為混合色而非單一色調(diào),混合疊加后能夠產(chǎn)生較為明亮的彩色效果[12]??梢钥偨Y(jié)出Lab 顏色空間優(yōu)點包括:①為調(diào)節(jié)Lab 顏色空間亮度,需調(diào)節(jié)L 通道,為實現(xiàn)調(diào)節(jié)色彩平衡,僅需分別調(diào)a 和b 通道,因此可單獨編輯圖像亮度和顏色;②Lab 顏色空間擁有比電子顯示器和人類視覺更加寬闊的色域,可以更加精確地表達圖像色彩細(xì)節(jié);③Lab 顏色空間不受設(shè)備左右,更適合圖像存儲及轉(zhuǎn)換;④Lab 顏色空間與人類視覺原理類似,都有紅綠和藍黃兩個視覺通道,因此基于Lab 空間處理的圖像在色彩表現(xiàn)上更符合人眼標(biāo)準(zhǔn)[13]。
Fig.1 Intuitive diagram of Lab color space parameters圖1 Lab 顏色空間參數(shù)直觀圖
由上述優(yōu)點可以推斷出,Lab 顏色空間能夠克服原RGB 空間中各分量之間高度線性相關(guān)和色彩表現(xiàn)不足的缺點,更適合用于彩色圖像分割。
圖像默認(rèn)存儲模式為RGB 顏色空間模式,因此必須將RGB 空間轉(zhuǎn)換為Lab 空間,才能進行Lab 空間彩色圖像分割實驗。又因為RGB 空間與Lab 空間分別屬于設(shè)備相關(guān)和設(shè)備無關(guān)的兩種完全不同的顏色系統(tǒng),因此它們之間不存在直接線性對應(yīng)轉(zhuǎn)換關(guān)系,需借助XYZ 過渡顏色空間完成兩者轉(zhuǎn)換[14]。即RGB→XYZ→Lab,RGB 轉(zhuǎn)XYZ 公式為:
然后將XYZ 空間轉(zhuǎn)到Lab 空間。
式(1)中RGB 3 個參數(shù)取值范圍均為(0~100),式(2)中X'、Y'、Z'是圖像中三原色XYZ 在白光條件下的刺激值,取值X=96.422 1;Y=100;Z=82.522 1,如式(3)所示。f 函數(shù)則表示為顏色空間中三色道參數(shù)值和上述刺激值比值,如式(4)所示。
通過以上步驟完成本文實驗第一步,將圖像顏色空間由默認(rèn)的RGB 空間轉(zhuǎn)換到Lab 均勻顏色空間,轉(zhuǎn)換后的圖像由L、a 和b 三通道參數(shù)表示,以便進行后續(xù)彩色圖像分割實驗。
K 均值算法是一種通過均值迭代思想對數(shù)據(jù)集合進行劃分的無監(jiān)督學(xué)習(xí)聚類算法,需憑借人為經(jīng)驗設(shè)置初始聚類個數(shù)K,然后在定義域內(nèi)隨機初始化生成K 個對應(yīng)的初始聚類中心,再以歐式距離為度量將其余點劃分為K 個聚類集合(簡稱為簇),在劃分好的集合中重新計算均值以生成新的聚類中心和數(shù)據(jù)簇,通過逐步迭代優(yōu)化直至收斂后最終取得聚類結(jié)果[15]。
從上述算法原理中可以推斷出:盡管k 均值算法具有易于實現(xiàn)的巨大優(yōu)勢,但該算法有兩個較為明顯的缺陷:①算法采用隨機選擇的方法確定初始聚類中心,然后利用爬山法不斷調(diào)整以獲得最優(yōu)解,這種初始點一旦選擇的位置過于鄰近密集,聚類中心很有可能集中于同一個數(shù)據(jù)簇,易陷入局部最優(yōu),聚類效果比較差,算法也將多次迭代,時間成本較高[16];②初始聚類個數(shù)的確定完全依賴于主觀經(jīng)驗判斷,面對背景復(fù)雜和噪音較多的圖像,很難主觀獲得恰當(dāng)?shù)某跏季垲悅€數(shù)[17]。因此,需尋找1 種方法自適應(yīng)地確定初始聚類中心位置和最優(yōu)聚類個數(shù)K,以獲得理想的圖像分割效果。
為了避免K 均值算法隨機選擇的初始聚類中心過于鄰近,本文通過改進最大最小距離的方法迭代獲得全局初始聚類中心。首先選取兩個距離最遠的初始數(shù)據(jù)點,但傳統(tǒng)最大最小距離方法需遍歷數(shù)據(jù)集X(n)中每兩個點之間的歐式距離,然后選用距離最大的兩個點作為初始聚類中心點[18]。其時間復(fù)雜度為O(N2),在面對彩色圖像分割任務(wù)時有較高的計算負(fù)擔(dān),且過于關(guān)注圖像邊緣背景細(xì)節(jié),而不是側(cè)重于圖像目標(biāo)主體分割。因此,本文設(shè)計一種時間復(fù)雜度為O(N)的兩個距離最大的初始點確定方法。
假設(shè)X={x1,x2,x3,…,xn}是數(shù)據(jù)對象個數(shù)為n 的數(shù)據(jù)集:
隨機選擇一個數(shù)據(jù)對象xt,尋找距它最遠的數(shù)據(jù)對象xi,用dit表示兩者間的歐式距離。
尋找距xi最遠的數(shù)據(jù)對象xj,用dij表示兩者間的歐式距離。
如果j≠t 且dit≤dij,則xi與xj互為最大距離點,如果t=j,轉(zhuǎn)到下一步驟。
如果t=j,則xt與xi互為最大距離點。
如果dit>dij,則與上一步驟同結(jié)果,xt與xi互為最大距離點。
互為最大距離的兩個點分別用Z1和Z2表示并存儲。
戴維森堡丁指數(shù)(Davies Bouldin Inde,DBI)是一種以數(shù)據(jù)集合內(nèi)數(shù)據(jù)對象緊密程度為標(biāo)準(zhǔn),判斷聚類效果好壞的函數(shù)。DBI 利用類間距離與類內(nèi)離散度,即計算數(shù)據(jù)簇內(nèi)距離之和與數(shù)據(jù)簇間距離之和之比[19]。從上述定義中可以看出,DBI 值越小則同一簇內(nèi)數(shù)據(jù)對象越緊密,且不同簇之間的差異越大,初始聚類個數(shù)K 越接近客觀真實的聚類個數(shù)。DBI 計算公式為:
在式(5)中,Wi指類中所有樣本到Ci類聚類中心的平均距離,di和vi分別表示Ci類內(nèi)數(shù)據(jù)對象個數(shù)與數(shù)據(jù)集合中的平均值,其中‖x‖代表歐氏距離,Wj同上。式(6)中K代表聚類簇數(shù),Cij代表Ci和Cj類中心之間的歐式距離[20]。本文確定全局初始聚類中心算法過程為:
(1)通過上述算法得到兩個相互距離最大的數(shù)據(jù)對象Z1和Z2,記為兩個初始聚類中心,并根據(jù)式(5)、式(6)計算此時DBI 指數(shù),記為DBIold。
(2)計算數(shù)據(jù)集中剩余數(shù)據(jù)點xi到Z1的距離記為Di1,到Z2的距離記為Di2,…,到Zk的距離記為Dik。
(3)在所有Di1,Di2,…Dik中統(tǒng)計計算Dik=max{min(Di1,Di2,…Dik)},則xk為可能存在的擬新聚類中心Z3,Z3的取舍需通過下一步驟判斷。
(4)根據(jù)式(5)、式(6)計算擬新聚類中心Z3加入后的DBI 指數(shù),記為DBInew,如果DBInew>DBIold,則舍去擬新聚類中心Z3,算法結(jié)束。
(5)如果DBInew 通過上述算法改進,添加K 均值算法數(shù)據(jù)預(yù)處理階段,解決傳統(tǒng)K 均值算法初始聚類質(zhì)心數(shù)目和位置難以確定的兩大問題,大幅提高了彩色圖像分割算法自適應(yīng)性和魯棒性。盡管本文算法加入了確定全局初始聚類中心的程序,但該過程非常有效地減少了K 均值算法的后續(xù)迭代次數(shù),大幅減少了算法運算量,因此分割速度較快。改進的彩色圖像分割算法整體流程如圖2 所示。 本文實驗硬件環(huán)境為處理器Intel i7,內(nèi)存8G,顯卡NVIDIA GeForce GTX 950M,軟件環(huán)境為操作系統(tǒng)Windows10,Python3.7(OpenCV、Sklearn)。 為驗證改進算法在Lab 空間中進行彩色圖像分割的實驗效果,從國際公認(rèn)的Corel 圖像庫中選擇整體顏色相近、色彩鮮艷、圖像背景復(fù)雜、有陰影噪音等不同情況的4 張彩色圖片進行分割實驗,與傳統(tǒng)K 均值算法在RGB 空間彩色圖像分割進行對比,如圖3 所示(彩圖掃描OSID 碼可見)。 Fig.2 The overall flow of the improved color image segmentation algorithm圖2 改進的彩色圖像分割算法整體流程 Fig.3 Comparison of the two algorithms圖3 兩種算法對比效果 從圖3 可以看出,傳統(tǒng)K 均值算法在RGB 空間進行彩色圖像分割時不能很好地將背景與主體分割出來,并且分割效果顏色不飽和,有較為明顯的色差;在Lab 空間中運行改進算法進行彩色圖像分割時,可以實現(xiàn)圖像目標(biāo)和背景精準(zhǔn)分離,色彩飽和度更加接近原圖,圖像目標(biāo)主體輪廓細(xì)節(jié)也更加清晰,分割效果與人工分割效果相近。由于人眼不能客觀描述圖像分割程度,因此用運行時間和誤差概率作為評價指標(biāo)定量分析圖像分割效果,實驗中4 張彩色圖片分割圖性能對比結(jié)果如圖4、圖5 所示。 Fig.4 Error probability comparison between two algorithms圖4 兩種算法誤差概率對比折線 Fig.5 The running time comparison of the two algorithms圖5 兩種算法運行時間對比折線 在Corel 圖像庫中隨機選取400 張圖像,其平均算法性能如表1 所示。 Table 1 Comparison of average algorithm performance表1 平均算法性能對比 由表1 運行時間和誤差概率可以看出,改進算法平均運行時間較傳統(tǒng)算法快6.316s,誤差概率下降18.712%,表現(xiàn)出更快的分割速度和更準(zhǔn)確的分割精度。 本文結(jié)合OpenCV 圖像處理工具與Sklearn 機器學(xué)習(xí)標(biāo)準(zhǔn)函數(shù)庫,設(shè)計了一種基于Lab 空間的改進K 均值自適應(yīng)彩色圖像分割算法。首先,將圖像由RGB 空間轉(zhuǎn)換到Lab空間,擺脫原RGB 顏色空間中各顏色分量之間高度相關(guān)性的影響,提高分割圖色彩飽和度,優(yōu)化分割目標(biāo)邊緣細(xì)節(jié);在此基礎(chǔ)上添加K 均值算法數(shù)據(jù)預(yù)處理階段,使其能夠自適應(yīng)地確定初始聚類中心數(shù)目和位置。改進算法在真實數(shù)據(jù)集測試結(jié)果中取得了理想的分割效果,為后續(xù)圖像處理提供更佳操作空間。但改進算法對噪音多、背景過于復(fù)雜的彩圖進行分割時,運行速度還無法滿足需求,還待更深入的研究。3 實驗結(jié)果及分析
4 結(jié)語