趙曉華
(陜西交通職業(yè)技術(shù)學(xué)院 西安 710018)
隨著人們生活水平逐步的提高以及信息技術(shù)的不斷發(fā)展,人們對信息的傳播需求也越來越大。由于數(shù)字圖像具有存儲便捷、攜帶方便、易于傳輸?shù)忍攸c(diǎn),所以數(shù)字圖像被人們廣泛用于信息等的傳播。伴隨著數(shù)字圖像的廣泛應(yīng)用,數(shù)字圖像處理技術(shù)也得到了日新月異的發(fā)展,圖像拼接技術(shù)作為數(shù)字圖像處理技術(shù)之一,也越來越被人們重視[1~3]。
從數(shù)碼照相機(jī)誕生之日起,它的便捷性和經(jīng)濟(jì)性就使其迅速在人群中推廣開來,可是數(shù)碼相機(jī)自身實(shí)現(xiàn)機(jī)制的限制使得數(shù)碼相機(jī)的鏡頭焦距比傳統(tǒng)膠片相機(jī)更小,更小的成像面積使得使用者在拍攝一些面積極為龐大的物體和影像時為了保證成像的高精度,不得不使用高級的廣角鏡頭乃至超廣角鏡頭,這些設(shè)備對于大眾用戶來說不僅價格過于昂貴,操作也十分復(fù)雜。但是數(shù)碼影像的不確定性和易變性卻可以很好地拿來利用,圖像拼接技術(shù)便是在此特性之上應(yīng)運(yùn)而生,數(shù)碼相機(jī)用戶可以使用特定的計(jì)算機(jī)軟件對自己的多個圖像進(jìn)行整合和拼接,同樣可以得到高精度的廣角成像[4~5]。由于通過圖像拼接技術(shù)能夠?qū)⒍喾信d趣的圖像拼接成一幅完整且清晰的圖像,所以圖像拼接技術(shù)被廣泛應(yīng)用于包括醫(yī)療診斷、航天航空、軍事探測在內(nèi)的多種技術(shù)領(lǐng)域[6~7]。因此對圖像拼接技術(shù)的研究具有非常重要的意義。對此,本文提出了基于SURF特征點(diǎn)的圖像拼接技術(shù)研究。
圖像配準(zhǔn)方法大致來講有三種技術(shù)根源,分別是灰度信息、交換域和特征點(diǎn),本文研究的是基于特征點(diǎn)的圖像配準(zhǔn)技術(shù)。當(dāng)然這樣也是籠統(tǒng)的說法,即使是基于特征點(diǎn)的配準(zhǔn)技術(shù)也有更為精確的細(xì)分。但是總的來說基于特征的匹配技術(shù),首先都是對要進(jìn)行匹配的圖像進(jìn)行初始化處理,一般是將圖像進(jìn)行劃分和局部特征的識別和記錄,再在提取到的特征值之上進(jìn)行不同圖像之間的聚類,從而建立不同圖像直接的配準(zhǔn)映射,使用的最為常見的特征是以坐標(biāo)值表示的點(diǎn)特征。
該類方法的具體實(shí)現(xiàn)流程如圖1所示。
圖1 基于特征的圖像匹配過程
1)特征提取
一般本文是使用人工智能算法自動的檢測圖像的不變特征,選取特征的基本標(biāo)準(zhǔn)為:(1)提取的特征應(yīng)該是圖像中突出的且大量存在于畫面易于區(qū)分的部分;(2)選取的特征應(yīng)當(dāng)有一定的客觀抗干擾能力,即對拍攝時采光、鏡頭或者抖動等干擾有抵抗能力;(3)特征最終是用于兩幅圖像的配準(zhǔn),所以選取的特征在兩幅圖像里應(yīng)當(dāng)具有同步性。
2)特征匹配
選取出的特征,本文要用精確的抽象模型進(jìn)行描述和記錄,這個本文稱之為特征描述算子。而兩幅圖像之間的特征的相似度也要用精確的量化標(biāo)準(zhǔn)去進(jìn)行定義。然后本文就使用這兩部分信息進(jìn)行兩幅圖像之間的特質(zhì)匹配工作。而且有些匹配算法甚至還完成了下一步的模型參數(shù)估計(jì)的工作。
3)變換模型估計(jì)
根據(jù)上一步的特質(zhì)匹配工作得到的信息,本文建立起兩幅圖像之間的映射模型,最佳擬合不同圖像之間的幾何變換差異,并根據(jù)變換的程度本文將建立的模型分為全局映射或者局部映射。顧名思義,全局映射就是將所有特征點(diǎn)都用于模型的參數(shù)猜測,而局部映射就只用到了一部分特征值信息。一般來說用的最簡單的也是最常見的就是多項(xiàng)式變換模型。
4)坐標(biāo)變換與插值
建立起了映射模型后本文就可以對圖像進(jìn)行變換,讓兩幅圖像處于一個參照系之下,這樣就可以進(jìn)行下一步的配準(zhǔn)處理。而且這一步的變換計(jì)算是浮點(diǎn)計(jì)算,對于精度的要求是之后成像精確的重要影響因子之一,所以本文還需要特殊的數(shù)值計(jì)算算法來處理。這里用到的最多的數(shù)值計(jì)算方式是插值法。
2.2.1 基于模板匹配的方法
此類方法需要預(yù)先進(jìn)行特征模版的設(shè)定,設(shè)定好模塊各項(xiàng)量化標(biāo)準(zhǔn)后,就直接將模塊跟待處理圖像進(jìn)行相似性對比,滿足一定相似度的子窗口像元就是本文需要的特征點(diǎn)。但是這種方法需要的時間太長,而且不同的圖像要建立不同的模型,兼容性不強(qiáng),只能處理小規(guī)模的圖像特征點(diǎn)提取工作。
2.2.2 基于幾何特征的點(diǎn)提取算法
此類方法本文又要進(jìn)行細(xì)分:一種方法關(guān)注圖像的邊界信息,將圖像進(jìn)行分割,并且對分割后的子圖象的邊界信息進(jìn)行特征提取,日后進(jìn)行對比的也是不同的子圖象的模式識別,這種提取思路的時間復(fù)雜度極其不樂觀,可是對圖像內(nèi)的噪點(diǎn)干擾有很好的抗性;另一種方式關(guān)于圖像的灰度,直接從圖像的灰度信息中進(jìn)行特征提取,這種方法的實(shí)現(xiàn)十分簡單。
2.2.3 基于Harris角點(diǎn)檢測算法
Harris角點(diǎn)檢測算法的基本原理是取一個以目標(biāo)像素點(diǎn)為中心的小窗口,計(jì)算該窗口沿任意方向移動后的灰度變化,并用解析形式表達(dá)。假設(shè)以像素點(diǎn)(x,y)為中心,Harris算法給出的灰度變化量的表達(dá)式如下式:
其中,Ex,y表示窗口內(nèi)的灰度變化量,wx,y表示窗口函數(shù),一般定義為
I表示圖像灰度函數(shù),省略無窮小項(xiàng)得
將Ex,y轉(zhuǎn)化為
M為實(shí)對稱矩陣:
通過對角化處理后得到
其中,R代表旋轉(zhuǎn)因子,進(jìn)行對角化操作后并不能改變以u,v為坐標(biāo)參數(shù)的空間曲面的形狀,它的特征值反應(yīng)了兩個主軸方向的圖像表面曲率。
在介紹SURF算法之前,本文需要介紹它的前身SIFT,也就是路易在兩千零四年發(fā)明的尺度不變特征換算法,SIFT建立起源圖像和高斯核的卷積之間的尺度空間,在金字塔形高斯差分空間中以尺度不變?yōu)闃?biāo)準(zhǔn)提取特征點(diǎn)[8~9]。此算法具有的尺度不變性給予了處理結(jié)果的高強(qiáng)度抗性,使得最終結(jié)果可以在一定程度的視角差異、光強(qiáng)差異、位置差異下保持一致性。這種優(yōu)越的性能讓SIFT成為了最適用的圖像特征提取技術(shù)[10~11]。數(shù)學(xué)表達(dá)式為
然后分別計(jì)算其與圖像中每個特征點(diǎn)的鄰域像素值差的平方和,即:
而本文提到的SURF特征點(diǎn)檢測算法,就是SIFT的一種改良變體,誕生于SIFT的兩年后。SURF的改良在于引進(jìn)了加速魯棒特征,使得可以簡化SIFT的計(jì)算量和計(jì)算速度,使用了近似Harr小波方法來提取特征點(diǎn),簡化了二階微分模板的構(gòu)建,提高了尺度空間的特征檢測的效率。SURF算法在積分圖像上使用了盒子濾波器對二階微分模板進(jìn)行了簡化,從而構(gòu)建了Hessian矩陣元素值,進(jìn)而縮短了特征提取的時間,提高了效率[12~14]。
3.1.1 圖像拼接總體框架
圖像拼接是一個復(fù)雜的多步處理流程,每一步的精度和效果都會直接干涉最終成像的完成度,本文探討的圖像拼接技術(shù)的大致流程如圖2所示。
3.1.2 圖像拼接系統(tǒng)的實(shí)現(xiàn)
前文已經(jīng)提提到了圖像拼接技術(shù)的處理中需要用到大量的數(shù)值計(jì)算、矩陣處理[15],所以最好的軟件選擇就是美國Mathworks公司開發(fā)的Matlab平臺,該平臺不僅針對科學(xué)計(jì)算功能進(jìn)行的大量的優(yōu)化和功能封裝,還具有大量的擴(kuò)展包可以擴(kuò)展外圍功能,所以極為適合做本文的圖像處理工作,Matlab本身也有針對計(jì)算機(jī)視覺方向的工具包可以使用。而本文就是利用Matlab進(jìn)行一個簡易的圖片拼接軟件的開發(fā)。本文希望在保證極強(qiáng)用戶交互性的前提下,能夠使得用戶便捷的輸入自己要處理的圖片,然后將圖像進(jìn)行上述流程的處理,最終輸出用戶想要的結(jié)果。
圖2 圖像拼接總體框架
以下本文簡述本系統(tǒng)的技術(shù)實(shí)現(xiàn)流程:1)用戶啟動系統(tǒng)后會進(jìn)入系統(tǒng)的主界面,主界面給予用戶端口提交自己要處理的圖片,本文設(shè)置兩個按鈕Load Image1、Load Image2,按下之后就可以載入相應(yīng)的圖片;2)用戶在載入圖片后就開始進(jìn)行相應(yīng)的處理流程——特征提取、特征匹配、匹配對提純、拼接和融合,本文設(shè)置不同的按鈕,按下相應(yīng)按鈕就可以進(jìn)行相應(yīng)的處理;3)處理流程正常結(jié)束后,本文可以就得到了本文的最終結(jié)果,通過設(shè)置好的save按鈕來保存本文的結(jié)果到本文想要的位置;4)點(diǎn)擊exit按鈕就可以成功退出系統(tǒng)。
本文用幾組樣本數(shù)據(jù)演驗(yàn)證Harris算法、SIFT算法與SURF算法的有效性,并對三種算法得出的特征點(diǎn)和特征匹配對進(jìn)行對比。本文使用的是索尼數(shù)碼照相機(jī),具有1200萬像素,成像規(guī)格是640x480。本文運(yùn)行程序使用的計(jì)算機(jī)配置為1GB RAM,CPU主頻2.5GHz,四核四線程,操作系統(tǒng)為Windows7。詳細(xì)測試數(shù)據(jù)可由表1所示。
從表中觀察可以看到,提取到的特征點(diǎn)個數(shù)從小到大依次是Harris算法、SURF算法、SIFT算法,提取特征點(diǎn)的速度從小到大依次是Harris算法、SIFT算法與SURF算法。所以一般來講Harris算法雖然處理的時間只比SURF慢了0.3s,但是提取到的特征點(diǎn)太少,進(jìn)行圖像匹配的話,構(gòu)造的模型精度很值得懷疑。但是表格的數(shù)據(jù)只是量化計(jì)數(shù),如果本文觀察三種算法提取出的特征點(diǎn)坐標(biāo)的話,會發(fā)現(xiàn)雖然SIFT算法得到了大量的特征點(diǎn),但是這些特征點(diǎn)的分布雜亂無章,大部分特征點(diǎn)嚴(yán)格來說都是判斷失誤得出的,并無實(shí)際作用,反而會影響最終的匹配準(zhǔn)確性。
表1 三種特征點(diǎn)提取算法比較結(jié)果
在該系統(tǒng)中,用戶可以觀察到一定范圍的真實(shí)情況,從而獲取到自己需要的信息。下面通過一組實(shí)例來說明圖像拼接技術(shù)的應(yīng)用,如圖3~5所示。
圖3 測試圖A
圖4 測試圖B
圖5 拼接結(jié)果
圖3和圖4是拍攝到的某一場景圖像,圖5是采用本文圖像拼接方法得到的拼接圖,從效果來看,實(shí)現(xiàn)了無縫拼接。
總的來說,無論是進(jìn)行特征點(diǎn)的提取,還是進(jìn)行特征點(diǎn)的匹配,SURF算法的精確度和速度都遙遙領(lǐng)先于SIFT算法。
圖像處理領(lǐng)域里圖像拼接技術(shù)是應(yīng)用廣泛,受眾龐大的高需求熱門研究方向,并且隨著此種技術(shù)逐漸進(jìn)入人們的視野并被大眾廣泛接受。圖像拼接技術(shù)追求的效率也在不斷的向前進(jìn)步,人們不斷希望自己使用的處理軟件能夠更快、更準(zhǔn)確和更簡單的完成自己期望的任務(wù)。本文提出了基于SURF特征點(diǎn)的圖像拼接技術(shù)研究。利用基于特征點(diǎn)的配準(zhǔn)方法作為本文采用的配準(zhǔn)方法。并利用SURF算法設(shè)計(jì)了本文圖像拼接方法的總體設(shè)計(jì),然后對本文圖像拼接算法的實(shí)現(xiàn)進(jìn)行了描述。最后,本文搭建了實(shí)驗(yàn)平臺,設(shè)計(jì)了仿真實(shí)驗(yàn),通過仿真實(shí)驗(yàn)分析,表明了本文所設(shè)計(jì)的圖像拼接方法不僅具有良好的圖像拼接效果,而且該方法在進(jìn)行圖像拼接時還具有較高的拼接效率,為圖像拼接技術(shù)的進(jìn)一步研究提供了有效的參考。
[1]劉靖.實(shí)時列車圖像拼接和信息分析系統(tǒng)[J].自動化與儀器儀表,2016,2(165):165-167.
[2]楊云濤,馮瑩,曹毓.基于SURF的序列圖像快速拼接方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(3):6-9.
[3]張銳娟,張建奇,楊翠.基于SURF的圖像配準(zhǔn)方法研究[J].紅外與激光工程,2009,38(1):160-165.
[4]賀元香,史寶明,李恒杰.一種改進(jìn)的抗幾何攻擊彩色圖像水印算法[J].自動化與儀器儀表,2014,1(1):102-105.
[5]邱建國,張建國,李凱.基于harris與sift的圖像匹配方法[J].測量技術(shù)學(xué)報(bào),2009,23(3):271-274.
[6]李云霞,曾毅,鐘瑞艷.基于SIFT特征匹配的圖像拼接算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009,1(19):43-46.
[7]羅三定,賀俊耀.基于SURF和KLT跟蹤的圖像拼接算法[J].計(jì)算機(jī)工程,2010,1(36):215-217.
[8]史露,蘇剛,韓飛.基于SIFT和SURF圖像拼接算法的改進(jìn)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2013,6(30):72-74+78.
[9]高超,張鑫,王云麗.一種基于SIFT特征的航拍圖像序列自動拼接方法[J].計(jì)算機(jī)應(yīng)用,2007,11(27):2789-2792.
[10]王玉亮,沈建新,廖文和.基于SIFT特征的眼底圖像自動拼接[J].中國圖象圖形學(xué)報(bào),2011,4(16):654-659.
[11]曹楠,王萍.基于SIFT特征匹配的圖像無縫拼接算法[J].計(jì)算機(jī)與應(yīng)用化學(xué),2011,2(28):242-244.
[12]高盛豐,王正勇,藏媛媛.基于顏色不變量和SURF的彩色圖像拼接[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(12):113-115.
[13]朱奇光,王佳,張朋珍.基于高斯矩改進(jìn)SURF算法的移動機(jī)器人定位研究[J].儀器儀表學(xué)報(bào),2015,11(36):2451-2457.
[14]詹曙,王少武,蔣建國.基于尺度限制SURF的圖像配準(zhǔn)[J].電子測量與儀器學(xué)報(bào),2013,10(27):963-967.
[15]袁翰祖.醫(yī)學(xué)圖像拼接中特征點(diǎn)檢測算法研究實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2013(7):103-104.