摘 要:本篇論文主要討論如何通過較脈沖耦合神經(jīng)網(wǎng)絡的方法,來對若干種不同類型的圖像進行圖像分割的問題,并取得較好的分割效果。
關鍵詞:圖像分割;脈沖耦合神經(jīng)網(wǎng)絡;計算機視覺
在計算機視覺的研究中,圖像分割是連接低級視覺與高級視覺的橋梁和紐帶,圖像分割的結果既取決于低級視覺中各種預處理的效果,又決定了高級視覺中的各種應用中最終輸出的質(zhì)量。因此,圖像分割是人多數(shù)視覺系統(tǒng)中最為關鍵和重要的一個環(huán)節(jié)。在過去的幾十年里,圖像分割的研究一直受到人們高度的重視。
1 脈沖耦合神經(jīng)網(wǎng)絡(PCNN)
脈沖耦合神經(jīng)網(wǎng)絡核心運作機制就是神經(jīng)元能夠接受外部信號和相鄰神經(jīng)元的加權輸入,通過耦合部分得到神經(jīng)元的內(nèi)部活性,脈沖耦合神經(jīng)元的脈沖爆發(fā)機制是PCNN運行機制的核心。
對于較小的饋給輸入和較弱的鏈接強度,單個脈沖足以使閾值復位,這就是但脈沖機制,而鏈接強度較大時,神經(jīng)元從它周圍接收到較強的鏈接輸入,他會得到一個較大內(nèi)部活性。這樣,就會驅(qū)使神經(jīng)元不斷地產(chǎn)生脈沖直到閾值超過內(nèi)部活性,這就是多脈沖爆發(fā)機制。大多數(shù)圖像處理中鏈接強度都選得較小,一般應用的都是弱脈沖爆發(fā)機制。
當考慮一組互關聯(lián)的神經(jīng)元時,情況較為復雜。一個神經(jīng)元要接受來自該組中其它神經(jīng)元的鏈接輸入,鏈接輸入的量隨著該組中脈沖產(chǎn)生的個數(shù)而增長,它必須重復爆發(fā),直到推動它的閾值超過鏈接輸入,反過來又影響該神經(jīng)元的鏈接輸入,由于鏈接與饋給域的時間常數(shù)不同,鏈接輸入會首先達到飽和,因而從使得神經(jīng)元閾值最終增大到超過內(nèi)部活性而停止爆發(fā)脈沖。
由以上可知,在一組神經(jīng)元相互作用的情況下,脈沖耦合神經(jīng)元的閾值大小主要由鏈接輸入決定,脈沖爆發(fā)周期既是它自身饋給輸入的函數(shù)也是這個區(qū)域鏈接輸入的函數(shù)。脈沖爆發(fā)的數(shù)量由區(qū)域的總能量決定,兩次爆發(fā)的時間間隔近似于該區(qū)域面積的對數(shù)函數(shù)。當兩組神經(jīng)元相互作用時,每個組的捕獲時間是另一個組的面積函數(shù),且隨兩組距離增大而減小。每個組的捕獲時間同脈沖同步爆發(fā)的時間之比可以比較小,這樣即使它們處于強鏈接多脈沖爆發(fā)區(qū)域也能提供較弱而有效的鏈接。在這種情況下,內(nèi)部同步的族之間的相互作用就相當于大的單個神經(jīng)元直接作用的關系。這種同步是根據(jù)區(qū)域關系而不是內(nèi)部細小的強度鏈接,各區(qū)域之間表現(xiàn)出的關系同單個神經(jīng)元之間表現(xiàn)出的關系完全不同。多脈沖模式中區(qū)域相連關系是圖像分割等圖像處理操作的本質(zhì)所在。
2 圖像分割
基于PCNN的圖像分割是根據(jù)圖像的自然屬性,利用PCNN的脈沖快速并行傳播特性對圖像進行自然而迅速的分割。本文中圖像處理時,PCNN連接方式是相同的。同時,PCNN中所有神經(jīng)元的參數(shù)均相同。具體應用在灰度圖像分割時,PCNN為一單層二維的局部連接的網(wǎng)絡,神經(jīng)元的個數(shù)等于輸入圖像中像素點的個數(shù),神經(jīng)元與像素點一一對應。每一個神經(jīng)元與對應的像素點相連,同時每個神經(jīng)元與其8鄰域中的其它神經(jīng)元相連。每個神經(jīng)元的輸出只有兩種狀態(tài):1與0。經(jīng)過簡化后的神經(jīng)元模型,每個神經(jīng)元的饋送域信號等于對應像素點的亮度值,鏈接域信號是鏈接域?qū)?鄰域中其它神經(jīng)元輸出的響應和。
基于PCNN的圖像分割算法的基本思路是用PCNN沿著由高亮度值到低亮度值的方向分層依次分割灰度圖像,同時結合圖像熵得到最終的分割結果。
某個PCNN神經(jīng)元點火時,其鄰域內(nèi)的任何一個未點火的且輸入亮度與其輸入亮度差別不大的神經(jīng)元都會受其影響而點火。PCNN用于圖像分割時,圖像內(nèi)的一些輸入亮度值較高的神經(jīng)元先點火,發(fā)放脈沖,捕捉到它們8鄰域內(nèi)的輸入亮度值相似的還未點火的神經(jīng)元,使得它們也發(fā)放出脈沖,繼續(xù)進行捕捉的過程。當捕捉過程結束時,就分割出一塊區(qū)域。鏈接域信號的統(tǒng)一使得圖像分割的過程清楚明了,便于控制。用PCNN分割圖像時,既考慮到圖像中同一區(qū)域內(nèi)像素點亮度之間的相似性,又通過其脈沖并行傳播特性自如地利用圖像中像素點之間的空間位置關系。
在算法中引入圖像熵,是因為對于絕大多數(shù)圖像來說,不管采用何種分割算法,一般分割后的圖像熵值越大,說明分割后從原圖得到信息量越大,分割圖像細節(jié)越豐富,因而總體分割效果也應越好。將此特性應用于PCNN圖像分割中,得到了一種基于圖像熵和PCNN的圖像分割算法。分割后得到的二值圖像的圖像熵可由下式確定:
其中,分別表示該分割后的圖像為、為的概率,。
注意,時,圖像全白,;時,圖像全黑,這兩種情況下,圖像熵取得最小值。當時,圖像熵取得最大值。
下面給出具體的基于圖像熵和PCNN的圖像分割算法:
(1)給出閾值,鏈接強度,分割次數(shù),步長,同時令每個像素點處于熄火狀態(tài),即。
(2)在時,計算鏈接信號:。
(3)計算每個神經(jīng)元的內(nèi)部活性:。
(4)將與閾值相比,記錄神經(jīng)元的輸出,即點火或不點火,,調(diào)整閾值。
(5)計算的圖像熵,將到目前為止圖像熵最大的存為,當循環(huán)結束時,取得最大值,就是最終的分割結果。
(6),如果,回到(2);否則,結束。
3 結語
本文結合圖像熵概念,成功地將簡化了的PCNN模型應用于256灰度級的圖像分割中。通過對不同類型的圖像進行計算機仿真,我們認為,該算法具有較廣泛的通用性,如對氣象云圖、高空拍攝圖片等不同類型圖像,均能得到較好的、細節(jié)較豐富的分割結果。
參考文獻:
[1] Rafael C.Gonzalez,Richard E.Woods.數(shù)字圖像處理(第二版)[M].北京:電子工業(yè)出版社,2007.
[2] J.L.Johnson,M.L.Padgett . PCNN Models and Applications[J] . IEEE Transactions on Neural Networks,1999(10).