王麗艷,戚大偉
(東北林業(yè)大學(xué) 理學(xué)院,黑龍江 哈爾濱 150040)
木材是人們生產(chǎn)生活中不可缺少的物質(zhì)資料。但是木材生長周期長,得不到及時的供給,增加了供需矛盾。而人們不合理的利用木材,更加劇了供需矛盾。為了更好的保護森林資源,節(jié)約能源[1],木材缺陷檢測有很大的價值。對木材缺陷CT圖像的處理也是方法之一。木材缺陷CT圖像分割的方法有很多種,實質(zhì)都是將目標(biāo)與背景分離,即將缺陷與背景分離[2]。由于事物之間具有或多或少的相似性即產(chǎn)生了模糊現(xiàn)象,給圖像分割帶來了困難。利用模糊數(shù)學(xué)聚類的圖像分割方法就應(yīng)運而生。而模糊C均值(Fuzzy C-Means,FCB)聚類算法是當(dāng)今比較流行的一種算法[3]。它的特點是不需要有先知經(jīng)驗就可以將圖像分割成幾類,是一種無監(jiān)督的聚類算法。它以這種強大的優(yōu)勢應(yīng)用到生活的各個領(lǐng)域,例如醫(yī)院、氣象、經(jīng)濟管理等領(lǐng)域。
但是模糊C均值聚類算法并非十全十美,有很多問題需要改善。主要分為兩大方面:一是圖像分割過程中,模糊C均值算法各項參數(shù)的選擇。二是模糊C均值算法對噪聲敏感,分割圖像時,不能完整的保留邊緣細節(jié),丟失很多信息。針對以上問題,許多學(xué)者從不同角度對算法進行改進。本文主要是針對模糊C均值算法各項參數(shù)的選擇問題進行研究。
采用圖論的圖像分割算法[4]首先分析圖像在不同F(xiàn)RFT域的能量分布特點,通過歸一化剩余誤差因子評估和分析圖像所包含的信息,在采用最小生成樹的方法對圖像區(qū)域進行分割。還有很多快速分割方法[5],將圖像數(shù)據(jù)劃分成一定數(shù)量的子集,然后利用區(qū)域粗糙度標(biāo)記所有子集,最后根據(jù)子集質(zhì)心及其權(quán)重進行模糊聚類圖像分割。這兩種方法都是先將圖像預(yù)先分割成幾個區(qū)域,然后在通過一個適合的方法在將這幾個區(qū)域在分類。對于木材缺陷CT圖像,本文希望將其缺陷例如節(jié)子、空洞、腐朽、裂紋等從背景中分割出來[6]。這些缺陷在木材缺陷CT圖像中已經(jīng)自然形成幾類。針對木材缺陷CT圖像,我們采用半模糊聚類方法對其進行分割[7]。
聚類也就是分類,即把相似的事物歸到一類。在現(xiàn)實生活中事物之間沒有明顯的界限,在某些方面上它們之間因為具有相似的特征,使得它們之間存在著聯(lián)系[9]。模糊聚類分析是比較流行的分割方法。而模糊C均值聚類算法是模糊聚類經(jīng)典代表。假設(shè)在數(shù)據(jù)集X中,有n個樣本,即n個單元,可有如下表示:Xk(k=0,1,…n-1)。而聚類問題的目的是把{X0,X1…,Xn-1}這個X數(shù)據(jù)集,分成c(2≤c≤n)個子集,要求相似的樣本應(yīng)盡量在同一子集(聚類)內(nèi),c為聚類數(shù)目。其原則是:較為相像的樣本應(yīng)歸納到同一個區(qū)域,C則為子集個數(shù),聚類的數(shù)量。
以往的聚類分析太過于死板,只能將分割好的塊嚴苛的歸類到某一區(qū)域,使之變成具有這一區(qū)域的塊的性質(zhì),事實上,好多模塊的性能并不能從一而論,它會具有好多好多特性,嚴格的分類反而會降低分析的效果,如果引用模糊聚類的方法,問題就解決了.模糊聚類分析的處理方法為;:假如將所有的數(shù)據(jù)都規(guī)整到C類里,挑X中的其中一個子模塊Xk(k=0,1,2,…n-1),針對一于另一類i(i=0,1,2…c-1),則可得到μik(0≤μik≤1),得到的這個數(shù)據(jù)庫則可組成一個模糊聚類數(shù)據(jù)庫,可稱作模糊聚類矩陣,其具備的性質(zhì)如下:
(1)
模糊C均值聚類之所以能得到大家的一致認可,是因為它具有其他聚類分析方法所沒有的優(yōu)良性能,F(xiàn)CM具有很多智能的特性,比如清晰明了的敘述,將分割好的圖像自動劃分結(jié)合。FCM聚類算法的提出者是J.C.Bezdek,他定義了這種算法的函數(shù),即模糊目標(biāo)函數(shù)法,其函數(shù)J(U,V)是:
(2)
式中:(Uik)(i=0,1,…c-1;k=0,1,…n-1)為模糊聚類矩陣,且滿足式(1);V={V0,V1,V2,…Vc-1}為C個聚類中心的集合,且Vi∈Rp;m∈[2,∞]為加權(quán)指數(shù);dik為第k個樣本到第i類的距離,其定義為
(dik)2=‖Xk-Vi‖2(Xk-Vi)T(Xk-Vi)。
(3)
這里Xk為數(shù)據(jù)樣本,且Xk∈RP;T表示矩陣轉(zhuǎn)置;‖·‖為范數(shù),表示歐幾里得距離。
如果想要分類得到的結(jié)果使人滿意,就要選擇適合的聚類原則和條件。而模糊C均值算法是通過不斷優(yōu)化目標(biāo)函數(shù)來實現(xiàn)的。目標(biāo)函數(shù)表示為J(U,V),加權(quán)指數(shù)是區(qū)域子集Xk對第i類隸屬度μik的m次方。Bezdek提出加權(quán)指數(shù)在1.1≤m≤5范圍內(nèi)推廣,后來給出經(jīng)驗范圍是m=2時最合適[12]。把聚類的條件設(shè)置為求目標(biāo)函數(shù)J(U,V)的最小值minJ(U,V)。迭代方案如下:
(1)先將聚類數(shù)目C(2≤c≤n)與加權(quán)指數(shù)m(m∈[2,∞])確定好。
(2)確定模糊聚類矩陣的初始值ul=[uik]l,取l=0。
(3)由以上兩步可得到各類的聚類中心Vi的函數(shù)式:
(4)
(4)按照下面方法計算新的模糊聚類矩陣u(l)=(l=l+1)
Ik={i0≤i≤c;dik=‖Xk-Vi‖=0},
(5)檢查‖U(l-1)-U(l)‖是否小于預(yù)先設(shè)定的閾值。如果小于,則停止,否則轉(zhuǎn)至(3)步驟。其任務(wù)是確定‖U(l-1)-U(l)‖與先前確定的限值的大小,小于限值則不用繼續(xù),如果大于則返回到(3)步驟。
FCM迭代算法結(jié)束后,將閥值設(shè)為α,那么圖像分割的函數(shù),看以下公式uik=max{u0k,u1k,…uc-1k}≥α,則Xk∈第i類圖像分割,這是大區(qū)域內(nèi)的數(shù)據(jù)歸納范疇,F(xiàn)CM算法也有其限制性,究其原因,是因為運算太過復(fù)雜的緣故,因為迭代的算法要反復(fù)的計算聚類中心及隸屬度矩陣[10],所以此方法未能極大限度的應(yīng)用。
(1)假設(shè)要分割的圖像為f(rk,ck),圖像所對應(yīng)的任一坐標(biāo)點為(rk,ck),那么函數(shù)Xk=f(rk,ck)代表圖像在這個點處的特征向量,如果圖像分割時設(shè)定的向量為S個,
設(shè)E0為圖像中所有非“邊緣”點的區(qū)域集,E1為所有“邊緣”點的區(qū)域集,那么E0={Xk|E(rk,ck)=1,Xk∈X},且X=E0∪E1。
(2)已進行了邊緣檢測,接著便是分割“邊緣”部分,使之形成獨立的互補鏈接的個體,然后“邊緣”部分的這些獨立個體便智能的分到相近的區(qū)域,也就是物理學(xué)中的就近法則,從而形成的互相獨立而又連接不斷的子圖,這樣初次的圖像分割就成功了。
(4)以(2)和(3)給出的數(shù)據(jù)為基礎(chǔ),將其設(shè)定為模糊迭代的最初值,加以迭代計算,迭代時的隸屬度
只有在隸屬度公式中點Xk∈E1為“邊緣”點時,其計算公式才能與普通的FCM相吻合,其采用的是模糊化隸屬關(guān)系的方法;
(5)
(5)當(dāng)以上4個步驟都順利的完成后,每一個像素的位置將被固定,就終止了迭代。終止迭代也是有相應(yīng)的條件和方法的,有兩種是被廣泛應(yīng)用的:第一,設(shè)定某個閥值為上限,控制兩代原型的變化范圍在其以內(nèi)。第二,設(shè)定某個閥值,使歸整的矩形變化范圍在其之內(nèi)。
(1)圖像分割的正確性是否高,關(guān)鍵取決于其是否具有抗外力的能力,在圖像分割的操作中,無論是檢測還是迭代都很容易受噪聲的干擾,以至于影響分割的準確性,因此本文則主張用中值濾波[11]的方案。
圖1 去噪處理后的木材缺陷灰度圖像
(2)灰度圖像的邊緣檢測。本文提到的此邊緣檢測并非是以得到精確的邊緣圖像為目的,只是作為得到聚類用的最初數(shù)據(jù),為下一步得到更精確的圖像做鋪墊,至于邊緣的尺寸和形狀可先忽略。下面的邊緣圖像,是由Robert這種算子檢測后得到的。優(yōu)點是保留更多的信息[8]。
圖2 利用Robert算子邊緣檢測的木材缺陷圖像
圖3 利用區(qū)域生長算法預(yù)分割的木材缺陷圖像
(3)ESFCM聚類迭代。針對灰度圖像來說,設(shè)圖像的區(qū)域集為X={X1,X2,…,Xn}?R是在特征向量區(qū)域R中的一個有值的區(qū)域集(包含多重集合的可能),因為Xk=f(rk,ck)代表的是第k個點(rk,ck)的灰度值,因此在ESFCM算法中,其目標(biāo)函數(shù)(2)可簡單表示為:
(6)
在上述函數(shù)中,c可視為ESFCM算法類別數(shù)得初始值,那么聚類核心v=(V1,V2,…Vc)也可看作一個C特征向量,Dik可視為是點到類的物理距離D(p,Xj)=Min{d(p,q)|q∈Xj}其中d(p,q)為點p到點q的歐式距離[11]。
圖4 經(jīng)ESFCM處理的木材缺陷圖像
本文以含有缺陷的木材為研究對象,利用半模糊聚類算法進行木材缺陷邊緣檢測,首先對木材缺陷CT圖像進行預(yù)處理,解決了聚類參數(shù)不好確定等問題,利用區(qū)域生長法將這些區(qū)域又重新分類。實驗結(jié)果可知:木材缺陷CT圖像的缺陷中的節(jié)子和空洞邊緣連續(xù)、平滑,這樣就保留了更多的細節(jié)。通過這樣的方式使圖像缺陷分割出來,并且取得理想的效果。
【參 考 文 獻】
[1]樸順姬,戚大偉,金雪蜻.多尺度分形特征在木材內(nèi)部缺陷檢測中的應(yīng)用[J].森林工程,2012,28(5):56-59
[2]張德豐.MATLAB數(shù)字圖像處理[M].北京:機械工業(yè)出版社,2012
[3]謝季堅,劉承平.模糊數(shù)學(xué)方法及應(yīng)用[M].武漢:華中科技大學(xué)出版社,2008
[4]張建梅,孫志田,余秀萍.基于圖論的圖像分割算法仿真研究[J].計算機仿真,2011,28(12):268-271.
[5]孫藝峰,王向陽,王春花.一種新的快速模糊C均值聚類圖像分割算法[J].小型微型計算機系統(tǒng),2008,29(2):320-323.
[6]戚大偉,李 莉.基于分形維數(shù)特征的原木漏節(jié)圖像的研究[J].森林工程,2007,23(5):11-14
[7]張愛華.基于模糊聚類分析的圖像分割技術(shù)研究[D].武漢:華中科技大學(xué),2004
[8]韓書霞,戚大偉,于 雷.基于多重分形理論的原木CT腐朽圖像分析與處理[J].森林工程,2007,23(5):15-18
[9]李永生.基于模糊理論的木材X射線圖像分析與處理[D].哈爾濱:東北林業(yè)大學(xué),2009
[10]范九倫,吳成茂.FCM算法中隸屬度的新解釋及其應(yīng)用[J].電子學(xué)報,2004,32(2):350-352.
[11]唐權(quán)華,周 艷,金煒東.中值濾波算法的研究與改進[J].微計算機信息,2008,24(8):187-189.
[12]王黎明.自適應(yīng)加權(quán)空間信息的FCM醫(yī)學(xué)圖像分割[J].微型機與應(yīng)用,2011,30(22):42-45.