李靖+李杜+胡文花+李文進(jìn)
摘 要 伴隨著信息技術(shù)的快速發(fā)展,計(jì)算機(jī)和機(jī)器人等都被賦予了視覺的功能,希望計(jì)算機(jī)能夠通過雙目視覺來觀察世界。這就是建立在人類視覺系統(tǒng)研究的基礎(chǔ)上,使得計(jì)算機(jī)通過二維圖像來認(rèn)知三維的世界。而且與人工視覺相比,計(jì)算機(jī)在雙目視覺技術(shù)下,能夠更快速、準(zhǔn)確和數(shù)字化的識(shí)別世界。而計(jì)算機(jī)對(duì)圖像的預(yù)處理又決定了其質(zhì)量,因此對(duì)雙目視覺圖像匹配領(lǐng)域的現(xiàn)有算法進(jìn)行優(yōu)化,能夠在保證圖像匹配精度的前提下,盡可能提升系統(tǒng)效率。
關(guān)鍵詞 雙目視覺;圖像處理;圖像匹配
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2017)182-0084-02
視覺模型及算法的基礎(chǔ)是利用兩張存在視差的二維圖形,構(gòu)造一個(gè)具有更深度信息的立體圖形。雙目視覺系統(tǒng)則是利用兩個(gè)攝像機(jī)來模擬人的雙眼,對(duì)場(chǎng)景進(jìn)行識(shí)別和測(cè)量,然后通過一定的計(jì)算方法將場(chǎng)景結(jié)果(圖像)進(jìn)一步處理,就可以獲得一個(gè)三維的圖像。因此雙目視覺系統(tǒng)在各行各業(yè)都得到了廣泛的應(yīng)用,例如醫(yī)學(xué)檢查、制造業(yè)和軍工制造等領(lǐng)域,也成為目前研究的熱點(diǎn)。
1 雙目視覺系統(tǒng)圖像處理原理與現(xiàn)狀
1.1 圖像處理原理與流程介紹
雙目視覺具有使用成本低、利用方便、效率較高的有點(diǎn),因此被廣泛應(yīng)用于諸多領(lǐng)域。計(jì)算機(jī)視覺系統(tǒng)主要有圖像獲取、圖像處理和分析、輸出和顯示3個(gè)步驟組成的,細(xì)化之后,可以將之分為以下幾個(gè)步驟。
雙目攝像機(jī)標(biāo)定是根據(jù)有效的攝像機(jī)成像模型,通過實(shí)驗(yàn)和計(jì)算來確定攝像機(jī)的內(nèi)外參數(shù),進(jìn)而能夠正確建立物體表面點(diǎn)的集合位置,以及對(duì)應(yīng)投影點(diǎn)坐標(biāo)之間的關(guān)系。這是計(jì)算機(jī)雙目視覺系統(tǒng)不可缺少的關(guān)鍵步驟。
圖像獲取是雙目視覺系統(tǒng)的信息來源,攝像機(jī)在拍攝到場(chǎng)景后,轉(zhuǎn)化為數(shù)字信號(hào)然后生成二維圖形。進(jìn)而在此基礎(chǔ)上形成三維圖形。但是光線條件、攝像機(jī)的性能等對(duì)所獲取圖像的品質(zhì)影響較大。
圖像處理技術(shù)將輸入的圖像經(jīng)過處理算法,對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理操作,降低無用信息和其他信息的干擾,從而達(dá)到提高圖像質(zhì)量,使圖像能夠進(jìn)行進(jìn)一步的分析。
圖像匹配的目的在于尋找同一場(chǎng)景在左右像平面上的投影點(diǎn),獲取位置關(guān)系并得到視差,這是雙目視覺系統(tǒng)中最為重要的一步。
獲取深度信息是在圖像匹配并得到視差后,可以根據(jù)三角測(cè)量方法計(jì)算目標(biāo)物體的深度信息,從而獲得物體表面點(diǎn)的三維坐標(biāo)。
在整個(gè)流程中,圖像的匹配工作是雙目視覺領(lǐng)域最為基礎(chǔ)的問題,也是為后續(xù)的圖像分析和理解奠定基礎(chǔ)的工作。但是由于雙目攝像機(jī)在不同的場(chǎng)景、不同的角度和位置拍攝,以及受到光線條件的影響,每一幅圖像存在較大的差異。例如灰度水平、場(chǎng)景位置、分辨率等等。而圖像匹配就是尋找這些因素具有不變性的特征,進(jìn)而根據(jù)這些特征來對(duì)兩幅圖像進(jìn)行匹配。
1.2 影響圖像匹配的因素分析
在雙目攝像機(jī)在獲取圖像時(shí),由于攝像器材、光線充足、拍攝角度的不同,都會(huì)讓圖像產(chǎn)生一定的畸變,這些畸變導(dǎo)致的誤差會(huì)在進(jìn)行圖像匹配時(shí)被放大,進(jìn)而導(dǎo)致匹配結(jié)果錯(cuò)誤的發(fā)生。首先是平移、旋轉(zhuǎn)等幾何變化時(shí),會(huì)導(dǎo)致兩幅圖像的所有像素都產(chǎn)生位移,對(duì)圖像的匹配產(chǎn)生較大的影響。而旋轉(zhuǎn)則是由于攝像設(shè)備的視角差異,兩幅圖的相對(duì)關(guān)系發(fā)生旋轉(zhuǎn)。其次是光線條件,在對(duì)同一場(chǎng)景進(jìn)行拍攝時(shí),由于光線條件的差異也會(huì)導(dǎo)致圖像存在差異。例如在光線較強(qiáng)時(shí),圖像的平均灰度高,會(huì)產(chǎn)生陰影。而在光線不足的情況下,所獲取的圖片分辨率就會(huì)降低,帶來部分遮擋現(xiàn)象,這些差異給圖像匹配帶來很大的難度。第三種是傳感器的噪聲產(chǎn)生的影響。傳感器是將獲取的信息轉(zhuǎn)換成電信號(hào),因此在獲取圖像時(shí)、電磁輻射、傳感器件、開關(guān)器件等都會(huì)產(chǎn)生一定的成像噪聲。系統(tǒng)就會(huì)對(duì)信號(hào)進(jìn)行離散化并編碼,以便進(jìn)行計(jì)算機(jī)處理,但是在這個(gè)過程中就會(huì)出現(xiàn)量化誤差,給圖像匹配造成影響。
1.3 圖像匹配算法的研究現(xiàn)狀
在國(guó)內(nèi)外專家學(xué)者的研究中,是針對(duì)不同的應(yīng)用目的為出發(fā)點(diǎn),提出了許多具有針對(duì)性的匹配算法,具體來說可以分為基于圖像灰度和基于圖像特征兩個(gè)類別。兩種算法對(duì)比來看,基于灰度的匹配算法,是對(duì)圖像的平均灰度水平、灰度直方圖、平均絕對(duì)值以及平方差、協(xié)方差等進(jìn)行統(tǒng)計(jì),根據(jù)這些特點(diǎn)進(jìn)行匹配具有精度高的優(yōu)勢(shì)。但是也存在計(jì)算量大、時(shí)間效率不高的問題,因此并不能滿足現(xiàn)實(shí)生活的需求。而基于特征的圖像匹配方法,在是針對(duì)圖像中包含各種特征的信息進(jìn)行提取,數(shù)據(jù)量相對(duì)較小,因此匹配效率更高,能夠滿足時(shí)時(shí)圖像處理的需要。具體來說,基于灰度的圖像匹配算法,是通過對(duì)圖像的灰度信息進(jìn)行分析,計(jì)算圖像之間的相似度,進(jìn)而尋找圖像的最佳匹配。也就是說該方法所選取的特征即是圖像的灰度??梢娫摲椒ㄋ悸肥趾?jiǎn)單,有利于在雙目視覺中實(shí)現(xiàn)。但由于計(jì)算量較大,因此許多研究者提出了快速算法。例如FFT、SSDA等計(jì)算方法。而基于特征的圖像匹配算法,則是通過對(duì)兩幅圖像的特征和內(nèi)容進(jìn)行對(duì)比,對(duì)特征進(jìn)行參數(shù)描述,然后根據(jù)計(jì)算得出的相似度進(jìn)行匹配,完成圖像匹配。優(yōu)勢(shì)在于該方法的計(jì)算過程不會(huì)因?yàn)閹缀挝恢?、光線強(qiáng)度等因素的差異而影響匹配結(jié)果,數(shù)據(jù)量較小,極大地提高了計(jì)算效率。
2 雙目視覺圖像處理算法的優(yōu)化
圖像的特征,主要包括輪廓特征和區(qū)域特征,輪廓特征是指場(chǎng)景或物體的外部邊界,而區(qū)域特征則是圖像某一區(qū)域中所獨(dú)有的屬性。從內(nèi)容上看,圖像的特征包括形狀、空間、顏色和紋理等;從結(jié)構(gòu)看,圖像特征又可以分為點(diǎn)、線、面。因此優(yōu)化特征圖像匹配算法,就要用以下幾個(gè)方面衡量,一是圖像特點(diǎn)的檢測(cè)和提取是否快捷;二是圖像特征描述向量維樹是否適合;三是特征點(diǎn)數(shù)是否適合。
在本文的研究中,主要采用了SURF特征圖像匹配算法。提取圖像特征的具體步驟如下。
第一步是特征點(diǎn)檢驗(yàn)。利用Hessian矩陣的行列式的值的正負(fù)來判斷該點(diǎn)是否為極值點(diǎn),此過程中采用方框?yàn)V波替代二階高斯濾波來減少構(gòu)建尺度空間的計(jì)算量,并引入積分圖像來加速圖像卷積的計(jì)算;
第二步是特征點(diǎn)的精確定位。根據(jù)檢測(cè)所得到的極點(diǎn)值與周圍的26個(gè)像素點(diǎn)進(jìn)行比較,進(jìn)而確定特征點(diǎn),比周圍26個(gè)像素的值都大或者都小的即是特征點(diǎn)。
第三步是生成特征描述向量,通過計(jì)算得出特征點(diǎn)處圓形領(lǐng)域內(nèi)的Haar小波響應(yīng),然后劃出扇形模板,并計(jì)算扇形范圍的內(nèi)的Haar小波響應(yīng),根據(jù)這些特征點(diǎn)來構(gòu)建特征描述向量。
最后采用SURF特征算法提取,其函數(shù)原型如下。
cvExtractSURF(image,0,&Keypoints,&Descriptors,storage,params);?
其中image為圖像,Keypoints和Descrip tors是兩個(gè)隊(duì)列,用來保存圖像的關(guān)鍵點(diǎn)位置信息和特征點(diǎn)的描述向量,storage?為圖像進(jìn)行特征提取時(shí)開辟的暫存區(qū)域,params為SURF參數(shù)。
3 結(jié)論
在本文的研究中,對(duì)圖像匹配算法的兩類常用方法進(jìn)行了分析,可見目前特征點(diǎn)提取算法更加適合現(xiàn)代社會(huì)的需要,計(jì)算量小而且效率高。同時(shí)在圖像進(jìn)行平移、選擇等因素的影響后,具有不變性的特點(diǎn),這也提高了圖像匹配的魯棒性。在基于SURF特征算法下,提高了圖像計(jì)算和匹配效率,更加適合雙目視覺系統(tǒng)的需要。
參考文獻(xiàn)
[1]郝捧華,龔國(guó)慶,陳勇.雙目視覺圖像處理算法的優(yōu)化[J].北京信息科技大學(xué)學(xué)報(bào),2012(5):64-67.
[2]戴玉艷.一種基于圖像處理的雙目視覺校準(zhǔn)方法[J].電子設(shè)計(jì)工程,2015(16):178-181.
[3]楊陽(yáng).基于雙目感知的立體視覺集成[J].現(xiàn)代計(jì)算機(jī),2016(5):63-66.
[4]張曉會(huì),張鳳生,王立偉.雙目視覺法測(cè)量接觸線幾何參數(shù)的圖像處理方法研究[J].青島大學(xué)學(xué)報(bào):自然科學(xué)版,2016(2):80-85.