劉永俊,王劍
(常熟理工學(xué)院計算機科學(xué)與工程學(xué)院,江蘇常熟 215500)
多聚焦像素級數(shù)字圖像信息融合
劉永俊,王劍
(常熟理工學(xué)院計算機科學(xué)與工程學(xué)院,江蘇常熟 215500)
根據(jù)圖像的清晰恢復(fù)結(jié)合數(shù)字圖像處理的基本理論算法,采用多聚焦圖像融合技術(shù),提出基于像素級的多聚焦數(shù)字圖像的融合算法.用統(tǒng)計學(xué)的方法計算出不同聚焦圖像上的聚焦點,并將其取出合成為一張清晰圖像.根據(jù)以上算法設(shè)計了圖像融合軟件,并進(jìn)行了實驗驗證.
圖像表示方法;數(shù)字圖像處理;圖像融合
圖像理解和計算機視覺領(lǐng)域中,圖像融合已成為近些年來一項重要的新技術(shù)[1-6].圖像融合技術(shù)作為一種有效的信息融合技術(shù),能增強場景理解、突出目標(biāo),已經(jīng)廣泛應(yīng)用在軍事偵察、醫(yī)療成像、遙感、天氣預(yù)報等領(lǐng)域.圖像融合的目的是把同一目標(biāo)或同一場景經(jīng)多個傳感器的成像或單一傳感器的多次成像進(jìn)行一定的處理,生成一幅新的圖像,這幅新的圖像能夠包含源圖像中更多的有用信息.多聚焦彩色圖像是指鏡頭聚焦目標(biāo)不同的多個彩色圖像,這多幅圖像的成像條件是相同的.這樣通過圖像融合技術(shù),可以得到更適于人眼觀察或計算機的后續(xù)處理的若干目標(biāo)都聚焦清晰的彩色融合圖像.
圖像融合是一項綜合同一場景多源圖像信息的技術(shù),來自多個傳感器的多源圖像能夠提供互補或冗余的信息.實驗證明,利用冗余信息可以改善信噪比并且可獲得更為可靠的結(jié)果,同樣,利用冗余信息可使獲得的融合圖像包含更豐富的細(xì)節(jié)及更全面的信息[2-3].由于利用了來自多傳感器的多源圖像,所以,通常意義下融合后的圖像對場景的描述比任何單一源圖像都更全面、更精確[4-6].圖像融合最簡單的方法是算術(shù)平均方法,即對源圖像的相應(yīng)像素進(jìn)行加權(quán)平均而得到的融合圖像.這種方法最簡單,但融合效果也最差.Burt等人提出圖像金字塔技術(shù)以后,金字塔技術(shù)被應(yīng)用與圖像融合,其中包括:Lapalcian金字塔、梯度金字塔、比率低通金字塔等.隨著90年代小波變換在圖像處理中的廣泛應(yīng)用,基于小波變換的圖像融合算法也被不斷推出.綜合來看,目前大多數(shù)方法還僅限于灰度圖像的研究,且存在一定的誤差,無法重構(gòu)出原始圖像.鑒于來自同一景物的兩幅變焦點彩色圖像的每幅圖像中都有聚焦不同的目標(biāo),針對這種圖像的清晰恢復(fù),通常要先判斷清晰目標(biāo)和模糊目標(biāo).
綜上所述,融合圖像往往更符合人和機器的視覺特性,更有利于諸如目標(biāo)識別、特性提取等進(jìn)一步的圖像處理[6].在不利條件下(如煙、霧、雨、低照明、運動等)或者當(dāng)一個圖像傳感器不足以提供用于目標(biāo)識別或場景描述的足夠信息時,通過圖像融合我們?nèi)钥色@得較滿意的圖像效果.人的視覺系統(tǒng)雖然對于圖像的對比度變化較為敏感,對有些差異可以直接覺察,可是人眼只能檢測到用不足24級的全部強度描述的單色圖像中很糟的輪廓效應(yīng).所以要對圖像有效融合,必須要應(yīng)用建立在數(shù)學(xué)和概率統(tǒng)計基礎(chǔ)上的數(shù)字圖像處理,加上計算機的處理速度與精度,才能精確方便地分辨出清晰目標(biāo)和模糊目標(biāo).本文實現(xiàn)了基于多聚焦圖像的圖像融合算法.
2.1 算法設(shè)計思想
三原色RGB是彩色圖像構(gòu)成的基礎(chǔ),眾所周知,自然界中的所有顏色都可以由紅綠藍(lán)(R、G、B)3原色組合而成.有的顏色含有紅色成分多一些,其他成分少一些.針對含有紅色成分的多少,可以人為地分成0到255共256個等級,0級表示不含紅色成分,255級表示含有100%的紅色成分.同樣,綠色和藍(lán)色也可以被分成256級.這樣,根據(jù)紅、綠、藍(lán)各種不同的組合我們就能表示出256*256*256(約1600萬)種顏色.當(dāng)一幅圖中每個像素被賦予不同的RGB值時,就能呈現(xiàn)出五彩繽紛的顏色了,這就形成了彩色圖像.
圖像在計算機中是以二維矩陣來表示和存儲的.某一點的像素可以用RGB三原色的值來表示,某點的灰度值可以用(R*77+G*151+B*28)來表示,然后把這個灰度值分別賦予這點的RGB值,由于灰度圖某點RGB值是一樣的,所以此彩色圖就轉(zhuǎn)換成了灰度圖.BMP格式的文件中并沒有灰度圖這個概念,但是我們可以很容易地用BMP文件來表示灰度圖.方法是用256色的調(diào)色板,只不過這個調(diào)色板有點特殊,每一項的RGB值都是相同的,也就是說RGB值從(0,0,0),(1,1,1)一直到(255,255,255).(0,0,0)是全黑色,(255,255,255)是全白色,中間是灰色.這樣,灰度圖就可以用256色圖來表示了.
多聚焦圖像融合技術(shù)的主要部分是對灰度圖像進(jìn)行處理,計算出不同聚焦圖像上的聚焦點.方法是求出各幅圖像各點像素的標(biāo)準(zhǔn)差,然后進(jìn)行比較,標(biāo)準(zhǔn)差大的就是所要得到的聚焦點.求標(biāo)準(zhǔn)差的方法分兩步:(1)求出灰度圖像中一個3*3矩陣的像素平均值;(2)求出圖像中每個點像素的標(biāo)準(zhǔn)差,主要思想是在以該點為中心的3*3矩陣中,把剛剛求得的平均值分別減去矩陣中每個點的像素,把它們的絕對值相加,所得到的結(jié)果就是該點的標(biāo)準(zhǔn)差.求出標(biāo)準(zhǔn)差后,將每幅圖同一點的標(biāo)準(zhǔn)差進(jìn)行比較,值大的,說明在該點顏色變化范圍大,這點就是聚焦點,也就表示這點最清晰.程序設(shè)計框圖如圖1.
2.2 算法的實現(xiàn)
多聚焦圖像融合技術(shù)的核心是比較各點像素的標(biāo)準(zhǔn)差,所以如何得到標(biāo)準(zhǔn)差并比較各值,再提取源圖像素填入新圖成為程序設(shè)計的主體.
(1)定義一個求出每點像素灰度值的函數(shù)gray()
這段程序可以實現(xiàn)求出像素點的灰度值.
(2)定義求3*3矩陣像素平均值的函數(shù)Ave()
圖1 算法設(shè)計流程圖
軟件使用的具體操作步驟及顯示:
1)打開軟件
雙擊Project1.Exe,即會彈出程序主框架,如圖2. 2)打開圖像
選擇需要載入的圖像(bmp格式的圖),連續(xù)輸入兩幅圖后會自動停止輸入.輸入后的界面如圖3所示.
3)圖像融合效果
點擊圖像融合按扭,在下方就會出現(xiàn)第三幅圖,仔細(xì)比較后就會發(fā)覺經(jīng)過多聚焦圖像融合處理后生成的圖像比前兩幅都清晰.如圖4.
4)關(guān)閉程序
點擊關(guān)閉程序,該應(yīng)用程序?qū)詣雨P(guān)閉.從實驗結(jié)果看,該軟件所采用的算法有效的從像素級對多聚焦圖像進(jìn)行了融合.
圖2 程序主界面
盡管多聚焦圖像融合作為當(dāng)前圖像處理中的研究熱點之一,其應(yīng)用研究已相當(dāng)廣泛,但是其難點也是顯而易見的,由于多傳感器圖像形式具有多樣性以及融合處理的多樣性和復(fù)雜性特點,圖像融合理論至今尚未形成系統(tǒng)的理論框架和有效的廣義融合模型和算法.迄今為止,絕大部分研究工作都是針對特定應(yīng)用領(lǐng)域的問題來展開的,也就是說,根據(jù)問題的種類建立各自的直觀認(rèn)識原理和融合準(zhǔn)則,并在此基礎(chǔ)上形成所謂的最佳融合方案.所以還需要繼續(xù)深入的探討研究多聚焦圖像融合的基礎(chǔ)支撐理論以及擴展算法的通用性.
圖3 加載多幅原始圖像
圖4 融合后的效果圖
[1]Kemp R G,Pike P,White A.Musselman Perception and recognition of normal and negative faces:the role of shape from shading and pigmentation cues[J].Perception,1996,25:37-52.
[2]Torres L,Reutter J Y,Lorente L.The importance of the color information in face recognition[J].International Conference on Image Processing(ICIP 99),1999(3):627-631.
[3]張新曼,韓九強,王勇.用視覺特性和自適應(yīng)優(yōu)化搜索實現(xiàn)多聚焦彩色圖像重構(gòu)[J].微電子學(xué)與計算機,2003,11:123-125.
[4]霍宏濤.數(shù)字圖像處理[M].北京:北京理工大學(xué)出版社,2002.
[5]勒中鑫.數(shù)字圖像信息處理[M].北京:國防工業(yè)出版社,2003.
[6]章毓晉.圖像處理和分析基礎(chǔ)[M].北京:高等教育出版社,2003.
A Survey of Color Facial Discriminating Feature Extraction
LIU Yong-jun,WANG Jian
(School of Computer Science and Engineering,Changshu Institute of Technology,Changshu 215500,China)
With the advent of information age,the way of human getting information has been widened.Images have been a necessary way to receive the information.The need of digital image processing technique arises day by day.This paper introduces the general situation that arithmetic figure picture handles.For some color images from the same scene,each of them has a different focus.A novel image fusion scheme for clear restoration of the image is presented in this paper.According to the clear recovery of the image,combined with digital image processing algorithm of the basic theory,and by means of multi-focus image fusion technology,this paper proposes the fusion algorithm of the multi-focus digital image based on the pixel level and calculates the focuses of different focus images with statistical methods and takes out their synthesis for a clear image.Besides,the paper designs the image fusion software based on the above algorithm and conducts a validation by means of the experiment.
the representation of the image;digital image processing;image fusion
TP391.41
A
1008-2794(2012)04-0100-05
2012-03-01
常熟理工學(xué)院青年基金“基于多控制融合的人臉圖像自動識別技術(shù)研究”(KY2008111);江蘇省高校自然科學(xué)基金“基于投影分析理論與算法的圖像特征抽取及分類技術(shù)研究”(05KJB520152)
劉永俊(1981—),男,山東青島人,講師,碩士,研究方向:人工智能與智能系統(tǒng),模式識別理論與應(yīng)用,人臉識別.