李 鵬
(長江大學 計算機科學學院,湖北 荊州434023)
圖像分割是一種常見的圖像處理過程中的預處理過程,其中包括基于區(qū)域的緊湊圖像場景描述,可將它分解成具有相似屬性的空間相關區(qū)域來進行實現(xiàn)[1-2]。此類底層視覺任務往往是許多圖像理解算法和計算機視覺應用的起始步驟,同時也是重要的預處理步驟[3-4]。
本文提出的圖像分割方法在理論上與文獻 [5]是有區(qū)別的,它不是考慮復雜質(zhì)感設計的自然圖像分割模型,本文探討用來進行替換的融合 (即有效結合形式)進行快速估計的圖像分割模型,從而能夠最終得到可靠準確的圖像分割結果。文獻 [6]中在概念上增加有區(qū)別的標簽領域融合模型,并提出混合空間圖像分割目標和快速估計應用領域 (例如運動估計/字段分割、封閉圖像等)。目標融合過程的相關解釋是在于當?shù)厝诤系臉撕烆I域涉及兩個不同性質(zhì)標簽在不同的抽象層次 (即逐像素、逐區(qū)域)。更確切的說,它的目標是以迭代形式來修改相關應用領域,使其區(qū)域適合的顏色區(qū)域進行空間分割與假設顏色分割比的應用領域的區(qū)域更詳細。在這種方式中,錯誤分類的像素中應用領域過濾并銳化blobby形狀,并產(chǎn)生更精確的最終應用標簽字段。
概率等級索引 (probabilistic rand index,PRI)是由Unnikrishnan[7]提出的新概念,它考慮在人類觀察者之間可能的解釋固有變化的圖像,即多個可接受的地面真像與每個自然圖像之間進行的圖像分割。最近文獻 [8]指出觀察者之間的這種變化在Berkeley分割數(shù)據(jù)集上得到體現(xiàn)。其實,每個人在不同程度上選擇的圖像分割都有區(qū)別。這種變化是由于圖像分割是高斯法問題,不同可能值的數(shù)量對應Apriori應具有多種解決方案。
因此,在特有的地面真像進行分割的情況下,對聚類質(zhì)量進行度量是具有自動量化分割的協(xié)議,此協(xié)議可用手動分割來代表一組相關變化。實際上規(guī)模非常小的樣本集對于一致的相關解釋圖像具有所有可能的感知[9]。文獻[10]對于解決此問題中不均勻加權的圖像像素對這種可變性設置在地面真像的統(tǒng)計方法。更確切地說,考慮一組相對應的手動分割分段圖像其圖像大小為N,設定Stest是手動標記集合和進行比較的分割指定的相關聯(lián)區(qū)域標簽與圖像分割圖Sgtk的像素位置xi,概率等級索引PRI的定義如式 (1)所示
其中針對pij估計值 (i和j像素具有相同的根據(jù)分割圖的標簽概率)的簡單經(jīng)驗比例進行較好選擇的方法,pij估計值計算如式 (2)所示
式中的δ符號是Kronecker函數(shù)。在此計算方法中,PRI計算方法是針對像素對進行簡單等級索引計算得到的平均值[6]。因此,PRI計算方法將有利于得到可接受的分割圖形,這種方法比較符合人類進行手動分割從而得到圖像分割結果。圖像分割也可能會有折中解決或一致共識,在水平層次詳情和每個地面真像分割表現(xiàn)出的輪廓精度執(zhí)行水平。在圖1給出了融合圖像實例,使用手動生成的圖像分割,在細節(jié)水平上表現(xiàn)出細致變化。這個概率度量不會退化,所有的不良分割將提供低評價且不會出現(xiàn)例外。
圖1 融合結果實例 (PRIF[K1=16|K2=10|K3=2])
在文獻 [6]中,{pij}(即在 {Sgtk}中進行計算每個像素對的成對經(jīng)驗概率定義)的集合定義正確分割小規(guī)模有吸引力的生成模型圖像,簡單表示為Gibbs分布模型。Gibbs分布模式可以生成正確的分割模式 (S={li}),這也可以當作是S的似然估計值。在這種方式中,基于PRI的含義可將后驗概率表示為如下變化形式此式中的〈i,j〉是基于二階派系或二進制派系的馬爾可夫隨機場 (MRF)模型定義的完整圖形 (每個節(jié)點或像素點xi都連接到所有其它像素點圖像)和T=N(N-1)是符合Boltzmann—Gibbs分布模型,這是兩次小于等級索引中的歸一化因子的溫度因數(shù)。因為當i<j時,有兩次以上的二進制派系比〈i,j〉對像素。Z是恒定分區(qū)函數(shù),經(jīng)過簡化后表示為如式 (3)所示
其中,Z1=Z/exp(r)是恒定分區(qū)函數(shù) (r參數(shù)只依賴數(shù)據(jù)因素),即表達為如下形式。
Ω是集中所有可能配置區(qū)域(S={li})且大小為N的像素分割而成的集合。因為類數(shù)量或者分割區(qū)域數(shù)目不是先驗概率已知的情況,類數(shù)量之間并不同于區(qū)域數(shù)目N在此圖像中的像素點位置。在此配置區(qū)域中,(1-2pij)可被看作潛在的空間變化二進制派系 (或成對相互作用區(qū)域)的等效非平穩(wěn)馬爾可夫隨機場,其中被設定為一組代表地面真像分割情況下的正確分割生成模型。此外,針對S中的分割結果進行比較后可得 ({Sgtk}),可看作是實現(xiàn)與PRI生成模型,其極大似然估計是成比例的統(tǒng)計測量方法。S集合的估計值在此生成模型中最大似然估計可以得到的圖像分割結果 (即融合結果),具有較高準確度以待融合的組分割
針對L集合的分割 {S1,S2,...,SL}子集,與大小為 N的相互關聯(lián)的集合關系是緊密的 (即可以有效進行融合),以便能夠獲得最終可靠準確的分割圖像結果。式 (3)中所提到的正確分割,可以在生成Gibbs分布模型中提供一個有效融合模型的分割圖形,最大的PRI值或等價意義的基礎Gibbs模型的最大似然估計 (maximum likelihood Estimator,MLE)表示如式 (3)所示。
在本框架中,{pij}集合的計算與經(jīng)驗比例估計 (具體見式 (2))的數(shù)據(jù) {S1,S2,...,SL}。如果 {pij}具有估計值,極大似然估計融合分割映射則定義為最大似然分布具體如式 (4)所示
式中:UL——生成融合模式的可能性能量,應該盡量減少,以方便求解
對于相同或不同的像素標簽,UL對約束集執(zhí)行編碼從而提供每個已被融合的L集合進行分隔。針對最小集UL執(zhí)行生成的圖像分割,還能夠優(yōu)化PRI具體標準。
圖像分割問題是高斯法問題。它可以表達出多種不同可能值的類數(shù)量。要呈現(xiàn)此問題必須提出特定解決方案,在分割過程中定義部分必要的約束條件有利于減少過分割區(qū)域。從概率角度出發(fā),可將這些正則約束看成是通過本地未知分割S={li}的具體實現(xiàn)。例如,隨機字段內(nèi)部的MRF框架或分析,編碼所顯示的現(xiàn)有能量的本地或全局先驗概率可加入似然估計術語。
在本文提出的框架中,本文認為設置指定融合過程中的全局約束能量函數(shù)。此函數(shù)可在所得的圖像分割結果圖中限制區(qū)域數(shù)量。因此,本文將能量函數(shù)定義如式 (5)所示
式中:|R(S)|——在圖像分割S中的區(qū)域數(shù)量 (設定連接屬于同類型像素),H(·)——Heaviside函數(shù),τ——融合模型內(nèi)部參數(shù)的物理表示數(shù)目。以上這種存在約束限制區(qū)域數(shù)量。從概率來看,正規(guī)化約束對應到從τ開始的簡單移動,隨著最終分割顯示區(qū)域數(shù)量呈現(xiàn)指數(shù)分布。
正規(guī)化解決方案對應的最大后驗概率解決方案的融合模型的解決方案,即的最大后驗分布定義是P(S|{pij}∝P(S)P({pij}|S)),因此可得式 (6)
在式 (6)中的β是正則化參數(shù)控制術語,UL表達進行組分割的準確度和融合后與UP關于可接受的最終分割作為估計的類型。以這種方式得到的相關標準,使用在本小節(jié)所得的融合模型可以看作是指定參數(shù)的最大等級估計值。
由本文融合框架將被融合的初始分割簡單映射,在應用程序中通過K—means聚類方法來對輸入圖像表示的不同色彩空間和不同數(shù)量的類進行應用。作為輸入多維特征描述符,本文使用重新量化的顏色直方圖的數(shù)值集合來與等距進行分級,從而通過估計周圍像素來進行分類。在應用程序中,這個局部直方圖同樣進行重新量化,為每個圖像的3種彩色通道運用Nb=q3b進行描述,計算重疊平方圍繞來進行分類像素尺寸 (Nw=7)和固定鄰域。
算法1:每個像素的Bin描述符估計算法:
參數(shù):
(1)Nx:在Nw×Nw鄰居區(qū)域設置以x為像素中心的位置x;
(2)h[]:Bin描述符,Nb實數(shù)數(shù)組 (h[0],h[1],...,h[Nb-1]);
(3).:取整數(shù)部分。
針對每個像素點x∈Nx,具有顏色值Rx,Gx,Bx,執(zhí)行循環(huán)體:
(1)k←q2q·Rx/256 +q· q·Gx/256 + q·Bx/256 ;
(2)h[k]←h[k]+1/N2w;
(3)直到遍歷所有像素點為止。
在這個簡單模型中,紋理基元 (即重復字符或元素中有紋理的圖像)在本文中其特征在于由更精確的混合顏色通過重新量化的本地顏色直方圖的數(shù)值。這種模式是種簡化計算模式,可以明顯減少實際數(shù)據(jù)量,同時噪聲和當?shù)貓D像轉(zhuǎn)換效率可證明相關跟蹤應用。
最后,(q3b-bin)中的描述符可分為不同類型的簇,對應每個類的圖像,通過經(jīng)典的K—means算法中的L1范數(shù)(也稱為Manhattan距離)。最后合并步驟中加入每個分割結果圖,由定影每個小區(qū)域 (即:小區(qū)域大小為不超過200個像素)與該區(qū)域的共享最長邊界。
每個分割結果圖可通過執(zhí)行時間來保持簡單分割模式,根據(jù)K和q,未優(yōu)化的C++代碼執(zhí)行時間在0.25秒至2秒之間。
這種簡單的分割策略中的輸入圖像為K類進行不同的色彩空間 (它可被看作是不同圖像通道提供的各種傳感器或捕捉器),并為不同類型的K值和不同的qb值提供具體依據(jù),qb值是不同值的重新量化顏色直方圖的數(shù)量。
每種顏色空間都有一種屬性,它可以使最終的融合過程結果更加可信。
基于RGB三原色理論的加色系統(tǒng)屬于非線性視覺感知。這種色彩空間是用于跟蹤的最佳應用程序。由于HSV具有優(yōu)秀的去除相關屬性的識別能力和傳輸效率,YIQ系統(tǒng)的優(yōu)點是利用人類顏色響應特性。XYZ具有心理視覺特性,它是具有非線性分量和線性分量混合色彩的優(yōu)點。LAB顏色系統(tǒng)則接近人類視覺,L分量密切匹配人類感知亮度。LUV組件提供歐氏顏色空間來產(chǎn)生聽覺均勻的間距顏色近似Riemannian空間 (在此空間內(nèi)的兩點之間的歐氏距離可表示更多或更少感知區(qū)別)。I1I2I3是近似Karhunen Loeve轉(zhuǎn)換的RGB空間。它創(chuàng)建顏色通道是正交性完全相關。因此,這個顏色系統(tǒng)具有的屬性,以實現(xiàn)最佳的能量壓縮并呈現(xiàn)出亮點和光照強度不變。H1H2H3是唯一的顏色空間,它也是唯一具有通道差異的。最后,針對TSL彩色空間使用高斯模型是行之有效的皮膚分割和檢測方法。
這些有待融合的初始分割可以提供由不同分割模型或不同分割結果來提供的不同隨機分割模型。不同結果與不同初始化都是由不同通道提供的,不同圖像中相同確定性分割器或傳感器,最后提供不同評價指標的K—Means聚類得到的輸出結果。
在本文實驗中,已經(jīng)考慮本文融合方法中平方窗口大小主要用來計算初始分割的局部直方圖的簡單分割模型,在第2節(jié)種得到初始分割大小為Nw=7×7。
實驗表明,本文融合模型是行之有效的。如果要融合的初始分割是多樣化的,同時為了方便實驗具有普適性,作者考慮進行60種融合分割。
(1)10種不同的顏色空間 (NS=10),具體分別是RGB,HSV,YIQ,XYZ,LAB,LUV,I1I2I3,H1H2H3,YCbCr,TSL。
(2)3個不同數(shù)值的類,分別為K1,K2和K3。
(3)兩種不同數(shù)目的量化顏色直方圖,即:Nb=53與Nb=43情況。
在本文實驗中,首先測試本文分割算法在Berkeley分割數(shù)據(jù)庫中的結果。Berkeley數(shù)據(jù)庫由300幅大小為481×321的彩色圖像構成,數(shù)據(jù)庫分為200幅訓練圖像集合和100幅測試圖像集合。針對每幅彩色圖像,人類觀察者提供的一組基準分割結果是有效的,將被用于量化進行圖像分割算法可靠性。為了確保評價完整性,本算法的內(nèi)部參數(shù) (K1,K2,K3,β、τ)在參數(shù)空間上和在有效范圍內(nèi)的參數(shù)值 (即:K1,K2,K3∈ [2-20][步長為2],β∈ [0-4000][步長為1000],τ∈ [5-20][步長為5])。該算法是通過在標記使用獨立測試集的最佳訓練參數(shù),我們把本文算法與5種無監(jiān)督公開算法進行比較,稱為PRIF[K1|K2|K3][β,τ],PRIF 、K1、K2、K3、β和τ 是它的內(nèi)部參數(shù)。對于每個算法來說,內(nèi)部參數(shù)設置為最佳值和本文建議數(shù)值。這些算法的均值漂移 (hs=13,hr=19),所有彩色圖像歸一化到具有第320個像素的最長邊為止。然后,超級采樣分割結果與原來分辨率 (481×321)的估計性能度量以獲得分割結果圖像。
基于PRI性能比較方法,即:PRI=0.80意思是平均80%的像素對所在標簽能夠進行正確分類并得到圖像分割結果。F—Measure方法能夠推論出的圖像分割的準確度/反饋值,表示兩個圖像分割區(qū)域邊界之間的協(xié)議。F—Measure方法目前已廣泛應用于計算機視覺和邊緣檢測領域。準確度測量Measure(P)定義為真實邊界的檢測部分;F—Measure數(shù)值低表示有明顯的過分割現(xiàn)象,或大量邊界像素具有較差的本地化趨勢。反饋值Recall(R)的測量結果可提供真實邊界檢測,反饋值較低時通常表示根據(jù)分割結果表示未能獲得顯著的圖像結構。因此,在精確量化的噪聲檢測器輸出結果中,而回收量量化的檢測到的地面真像。邊界檢測器性能可提供由精確反饋的平面中的像素點的二進制輸出表示。如果輸出的是軟邊界圖像,參數(shù)的精確反饋曲線則表示主要參數(shù)各不相同的邊界探測器中沒有噪聲和真實度之間的折中解決地面真像。查準率和查全率可以結合質(zhì)量統(tǒng)計措施,F(xiàn)—Measure方法 (F=2PR/(P+R))定義為它們的調(diào)和平均值能夠結合精確度和反饋值作為衡量性能的相關標準。精確反饋可用曲線上的最大F—Measure數(shù)值性能的探測器的圖像作為簡要統(tǒng)計數(shù)據(jù)。
在PRI方法中,本文觀察到所討論的融合策略提供了有效結果 (PRI=0.80意思是平均80%的像素對所在標簽能夠進行正確分類并得到圖像分割結果),在相對較低的方差Berkeley圖像數(shù)據(jù)庫的圖像設置。圖2算法PRIF[K1=18|K2=10|K3=2]是針對 Berkeley圖像數(shù)據(jù)集中的300張圖像,在表示出的分布PRI方法。
圖2 Berkeley數(shù)據(jù)庫中PRI性能指標分布
在F—Measure方法中,可以發(fā)現(xiàn)所獲圖像分割與較低的F—Measure值相比現(xiàn)有的最好的邊界檢測算法的最高分數(shù)是F=0.70@(0.71,0.68)。本文算法也給出了比較大部分邊界探測器基準的一組封閉曲線,這組曲線表示為“硬”邊界?;诖嗽颍疚乃惴ㄅc最佳邊界檢測算法[4]中提出的確定圖像分割圖 (即封閉曲線)來進行比較,F(xiàn)—Measure值則是F =0.67@(0.69,0.66)。
因為基礎算法 (計算F—Measure)將會在不要封閉輪廓的基礎上尋找最優(yōu)閾值,“軟”輸出這項措施更為適合本文算法。本文分割結果和地面真像所提供的Berkeley數(shù)據(jù)庫的對比結果表明,本文算法往往有過分割現(xiàn)象,從而導致噪聲信號 (即假輪廓)在最終分割結果中出現(xiàn)。為了證明此情況,并客觀比較的本文分割方法與最佳邊界探測器(探測器一般提供 “軟”輸出,其閾值操作不能保證是封閉輪廓),本文測試使用的是最終 “硬”邊界表示轉(zhuǎn)換到“軟”版本,只需更換由數(shù)值梯度幅值的每一個檢測到的邊界像素的Nb-bin描述符 (即:重新在基于初始顏色圖像的小型平方大小窗口上量化本地計算顏色直方圖,請參閱算法1)。通過計算每個位于行與列的像素點 (檢測為分界點),下面計算簡單距離的公式為
求和運算在10個不同色彩空間種,D(hi-d,j,hi+d,j)是Manhattan距離 (L1范數(shù))之間的矢量,計算一個平方Nw-size的窗口hi-d,j和hi+d,j分別在中心位置 (i-d,j)和(i+d,j)(參見算法1)。根據(jù)結果顯示得分最高的FMeasure值為F=0.63@(0.62,0.63)。
通過圖4可見當Ns(針對分割數(shù)進行融合)較高時,PRI測量性能更好。同樣可在F—Measure方法中進行測量。本實驗表明本文融合過程具有不斷完善的算法有效性。如果需要進一步改進,可以增加與Nb=33進行融合,或使用不同的特征描述符或不同的相似性度量直方圖之間的通過下列方式獲得的聚類結果,來獲得圖像分割映射到組分割的描述符。
例如分割Berkeley數(shù)據(jù)庫圖像區(qū)域的大小區(qū)域數(shù)量和分布情況,由本文方法的圖像分割結果執(zhí)行統(tǒng)計,算法PRIF[K1=18|K2=10|K3=2]的運行結果在圖5和圖6中描述。
為了進一步驗證本文融合過程中,本文嘗試了幾種均值漂移的圖像分割時間間隔內(nèi)分別隨機融合hs與hr間隔在[2,...,15]和 [20,...,40]之間。本文融合過程中顯著提高性能方法,在單一圖像分割比較得到:PRI=0.7905。
最后測試本文融合算法針對所述組輸入手工標記的地面真像進行分割相關的給定的Berkeley圖像 (參見圖3分割結果)。為了使這方面的分割效果更為詳細,本文選擇的是自然圖像,它表現(xiàn)出高度變化分割的整體存在。將所得融合圖像 (參見圖3)的顯著區(qū)域平均數(shù)目,相對的組地面真像可以比喻成具有相同數(shù)量圖像分割的手動生成的輸入信息。本文融合模型添加了正面Gibbs能量模型,也可以計算每個地面真像進行分割的準確度,輸入地面真像的集合;在與反面Gibbs能量成正比的PRand度量中,每個輸入分割向所得的融合地圖。然后,此信息可被有效地利用,刪除異常值或加權的信心,每個輸入分割均在PRI Sense中。
圖3 Berkeley圖像具體分割實例
本文提出在細分策略基礎上的馬爾可夫貝葉斯融合過程。目標是把幾個快速估計的分割模型進行融合以求達到更可靠、更準確的圖像分割結果。這種融合模型是實現(xiàn)懲罰的最大PRI意義上有準確意義。與普通的語言到各種數(shù)字圖像和計算機視覺應用程序相比,融合的圖像分割可以簡單完美地實現(xiàn)這種融合框架。
本文認為此種融合模型較容易使貝葉斯融合模型并行化,為圖像分割的細分模型中存在困難圖像分割問題提供解決方案。
[1] Mignotte M.Segmentation by fusion of histogram—based k—means clusters in different color spaces [J].IEEE Transactions on Image Processing,2008,17 (5):780—787.
[2]Ma Y,Derksen H,Hong W,et al.Segmentation of multivariate mixed data via lossy coding and compression [J].IEEE Transactions on Pattern Analysis Machine Intelligence,2007,29 (9):1546—1562.
[3]Reed S,Ruiz I R,Capus C,et al.The fusion of large scale classified side—scan sonar image mosaics [J].IEEE Transactions on Pattern Analysis Machine Intelligence,2006,15(7):2049—2060.
[4]Jodoin P M,Mignotte M,Rosenberger C.Segmentation framework based on label field fusion [J].IEEE Transactions on Image Processing,2007,16 (10):2535—2550.
[5]Kato Z.A Markov random field image segmentation model for color textured images[J].Image Vision Computation,2006,24 (10):1103—1114.
[6]Yang A Y,Wright J,Sastry S,et al.Unsupervised segmen—tation of natural images via lossy data compression [J].Computational Vision Image Understanding,2008,110 (2):212—225.
[7]Unnikrishnan R,Pantofaru C,Hebert M.Toward objective evaluation of image segmentation algorithms [J].IEEE Transactions on Pattern Analysis Machine Intelligence,2007,29 (6):929—944.
[8]Ilea D E,Whelan P F.CTEX—an adaptive unsupervised segmentation algorithm on color—texture coherence [J].IEEE Transactions on Image Processing,2008,17 (10):1926—1939.
[9]Martin D,F(xiàn)owlkes C.The berkeley segmentation database and benchmark [M/OL].University California,Berkeley,2010.[2010—05—06].http//www.cs.berkeley.edu/projects/vision/grouping/segbench/.
[10]Maire M,Arbelaez P,F(xiàn)owlkes C,et al.Using contours to detect and localize junctions in natural images [C]//Proc of IEEE Conference Computation Vision Pattern Recognition,2008:1—8.
[11]ZHANG Hengwei, YANG Youlong, ZHU Yuanyuan.Multi—step prediction of frequency—hopping sequences based on Bayesian networks [J].Application Research of Computers,2012,29 (1):237—240 (in Chinese).[張恒偉,楊有龍,朱原媛.基于貝葉斯網(wǎng)絡的跳頻序列多步預測 [J].計算機應用研究,2012,29 (1):237—240.]
[12]QIAN Zhengming,GUAN Rui.Application of reliability model about computer business information system based on Bayesian network [J].Application Research of Computers,2012,29 (12):4651—4653 (in Chinese). [錢爭鳴,管睿.基于貝葉斯網(wǎng)絡的計算機經(jīng)濟信息系統(tǒng)可靠性模型及其應用[J].計算機應用研究,2012,29 (12):4651—4653.]