曲少軍 鞠李聃
摘 要:計(jì)算機(jī)視覺(jué)研究的目的是為了實(shí)現(xiàn)人類(lèi)視覺(jué)的功能,也就是利用二維影像來(lái)實(shí)現(xiàn)對(duì)客觀(guān)世界三維場(chǎng)景的感知與理解。立體匹配技術(shù)是計(jì)算機(jī)視覺(jué)研究領(lǐng)域中最基本、最關(guān)鍵和最難徹底解決的問(wèn)題之一。對(duì)這一技術(shù)進(jìn)行研究可以使通過(guò)像點(diǎn)獲取距離信息以及實(shí)現(xiàn)三維立體再現(xiàn)目標(biāo)成為可能。因此,計(jì)算機(jī)視覺(jué)下的立體匹配技術(shù)是今后該領(lǐng)域研究的一個(gè)重點(diǎn)方向?;谟?jì)算機(jī)視覺(jué)下,文章主要介紹了立體匹配技術(shù)的相關(guān)內(nèi)容、原理、主要算法及其未來(lái)發(fā)展的趨勢(shì)。
關(guān)鍵詞:立體匹配技術(shù) 計(jì)算機(jī)視覺(jué) 原理 算法 發(fā)展趨勢(shì)
中途分類(lèi)號(hào):TP391.41 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1672-3791(2015)08(a)-0014-02
計(jì)算機(jī)等科學(xué)技術(shù)的飛速發(fā)展,使得其在人類(lèi)視覺(jué)系統(tǒng)領(lǐng)域內(nèi)得到了廣泛的應(yīng)用,并對(duì)人類(lèi)肉眼觀(guān)察難以看到的一些東西具有一定的輔助作用。其在人類(lèi)視覺(jué)研究中所具有的巨大價(jià)值和意義使得其逐漸成為眾人所追捧的一門(mén)技術(shù)。人們對(duì)視覺(jué)技術(shù)的不斷探索,促使人們將視覺(jué)技術(shù)與計(jì)算機(jī)技術(shù)良好的融合在一起。立體匹配技術(shù)作為兩者結(jié)合的產(chǎn)物,在計(jì)算機(jī)視覺(jué)下,研究立體匹配技術(shù)可以取得較好的成果。
1 立體匹配技術(shù)內(nèi)容介紹
立體視覺(jué)是興起于20世紀(jì)60年代中期的一門(mén)交叉性學(xué)科,對(duì)計(jì)算機(jī)視覺(jué)下,立體匹配技術(shù)的研究具有是十分重要的意義。它研究的主要內(nèi)容是在借助成像技術(shù)的前提下,如何從圖像中獲取場(chǎng)景內(nèi)物體的距離信息。實(shí)踐證明,立體視覺(jué)在很多領(lǐng)域內(nèi)都具有較大的應(yīng)用價(jià)值,例如三維測(cè)量學(xué)、微操作系統(tǒng)的檢測(cè)與控制以及虛擬現(xiàn)實(shí)等。實(shí)現(xiàn)立體視覺(jué)的基本方法是采用兩個(gè)或多個(gè)視點(diǎn)對(duì)同一物體目標(biāo)進(jìn)行觀(guān)察,以獲取一組不同視角下的圖像信息,然后利用視覺(jué)成像原理計(jì)算出不同圖像中對(duì)應(yīng)像素間的相位信息,進(jìn)而對(duì)物體目標(biāo)的空間位置進(jìn)行較為準(zhǔn)確的推斷。
立體視覺(jué)進(jìn)行匹配的過(guò)程主要分為兩步。第一,在兩個(gè)或多個(gè)點(diǎn)中找出其之間的對(duì)應(yīng)關(guān)系,并在此基礎(chǔ)上計(jì)算出各個(gè)點(diǎn)處的視差。第二,根據(jù)得出的視差信息借助一定的投影設(shè)備,將原始場(chǎng)景畫(huà)面進(jìn)行還原,在成像模型已知的前提下,可以直接通過(guò)對(duì)對(duì)應(yīng)點(diǎn)所蘊(yùn)含的視差信息進(jìn)行恢復(fù),進(jìn)而完成圖像信息的三維重建。由此可以看出,找出匹配的對(duì)應(yīng)點(diǎn)是立體匹配技術(shù)中的關(guān)鍵。
2 立體匹配技術(shù)的原理
立體畫(huà)也稱(chēng)為三維立體畫(huà),它不是一種圖像,而是一種技術(shù),一種使人們可以從三維立體圖中獲得二維平面圖信息的技術(shù)。三維立體圖是由一組相同的二維圖片按照一定順序大量堆積而成,所以其具有立體性效果。在正常情況下,通過(guò)人類(lèi)肉眼觀(guān)察,三維立體圖像表面似乎毫無(wú)規(guī)則,但若借助一些特殊的技術(shù)和一些高科技的觀(guān)察設(shè)備進(jìn)行合理的觀(guān)察,人們就可以看到一組井然有序的、神奇美妙的圖片。
人類(lèi)眼睛觀(guān)察物體大致遵循以下原理,即當(dāng)人類(lèi)利用左、右眼對(duì)其所在的空間平面進(jìn)行觀(guān)察的時(shí)候,人們能夠看到的都只是一些雜亂無(wú)序的圖片。然而,當(dāng)人類(lèi)將左、右眼重新聚焦或是在觀(guān)察畫(huà)面過(guò)程中呈現(xiàn)出一定的層次感,那么人類(lèi)左、右眼觀(guān)察到的這組重復(fù)的畫(huà)面在經(jīng)過(guò)人腦識(shí)別以后,這些畫(huà)面之間便會(huì)存在一定的距離差異,進(jìn)而在人腦中形成一種立體感。
立體匹配技術(shù)正是基于人眼觀(guān)察事物的原理,并且從兩個(gè)不同的方向?qū)κ挛镞M(jìn)行觀(guān)察,以從中獲得目標(biāo)圖像的信息,然后通過(guò)對(duì)其進(jìn)行一定的處理,最終獲得三維重建的物體立體信息技術(shù)。
3 立體匹配技術(shù)主要算法
3.1 基于區(qū)域的匹配算法
對(duì)于給定場(chǎng)景一樣的兩幅圖像,其尺度上圖像對(duì)空間具有很大的相似性。若將圖像對(duì)空間劃分為許多個(gè)小圖像塊,那么每一個(gè)小圖像塊與劃分前對(duì)應(yīng)的圖像相比都更為相似。由此可見(jiàn),基于區(qū)域匹配算法的實(shí)質(zhì)就是利用局部窗口之間灰度信息之間的相關(guān)程度,這種算法在細(xì)節(jié)較為豐富且變化較為平緩的地方可以達(dá)到較高的匹配精度。區(qū)域匹配算法對(duì)區(qū)域的確定通常是通過(guò)將圖像對(duì)空間劃分為許多個(gè)小圖像塊,或是通過(guò)改變圖像對(duì)空間尺度的大小來(lái)實(shí)現(xiàn)?;趨^(qū)域的匹配算法,以基準(zhǔn)圖中的待匹配點(diǎn)作為中心創(chuàng)建一個(gè)窗口,并用相鄰區(qū)域圖像像素的灰度值分布來(lái)表示該窗口的像素,接著在對(duì)準(zhǔn)圖中尋找像素與之相同的區(qū)域,再以其為中心創(chuàng)建一個(gè)相同的窗口,并同樣將其相鄰區(qū)域范圍內(nèi)像素與之相同的灰度值分布來(lái)作為該窗口的像素,這兩個(gè)窗口之間的相似性必須能夠滿(mǎn)足一定的閾值條件。
3.2 基于相位的匹配算法
與其他兩種算法相比,基于相位的匹配算法起步較晚,是近二十年才逐漸發(fā)展起來(lái)的。相位作為匹配算法中的基元,具有反映信號(hào)結(jié)構(gòu)信息的功能,同時(shí)對(duì)圖像的高頻噪聲還具有很好的抑制作用。相位匹配算法適用于并行處理,并能獲取到精度為亞像素級(jí)別的致密視差?;谙辔坏钠ヅ渌惴ㄊ窃谝环N假定的基礎(chǔ)之上建立的,這種假定認(rèn)為像對(duì)中各對(duì)應(yīng)點(diǎn)的局部相位是相等的。從平移定理的角度分析,信號(hào)在空間域中的平移能夠在頻率域上產(chǎn)生相互成比例的相位平移。從數(shù)學(xué)表達(dá)的角度來(lái)看,頻率域信號(hào)的分析更有助于區(qū)域的分析。從變換空間支撐為無(wú)限的角度考慮,通?;谙辔坏钠ヅ渌惴▽?duì)像對(duì)間視差的獲取是通過(guò)對(duì)帶通濾波信號(hào)的相位信息進(jìn)行處理而實(shí)現(xiàn)。相位差頻率法和相位相關(guān)法是基于相位的匹配算法中最常采用的兩種方法。
4 計(jì)算機(jī)視覺(jué)下立體匹配技術(shù)難點(diǎn)及發(fā)展趨勢(shì)分析
現(xiàn)階段的立體匹配技術(shù)主要是通過(guò)計(jì)算機(jī)來(lái)尋找所采集到的兩幅或多幅圖片中各像對(duì)之間的對(duì)應(yīng)關(guān)系,然后根據(jù)這些關(guān)系對(duì)二維圖像信息進(jìn)行判定,最終生成三維重建。但在這一過(guò)程中,二維圖像信息的匹配卻面臨重重困難,導(dǎo)致采集到的畫(huà)面信息存在瑕疵,使得尋找圖片匹配點(diǎn)的難度大大增加;選定場(chǎng)景中一些深度不連續(xù)的區(qū)域大多處于場(chǎng)景的邊緣地帶,而這些位置的圖片采集容易出現(xiàn)邊緣不清晰、像素不高等問(wèn)題,又進(jìn)一步給圖像匹配帶來(lái)了一定的難度等。
根據(jù)以上分析可知,目前的立體匹配技術(shù)在技術(shù)方面存在很多難點(diǎn),而這些難點(diǎn)都在很大程度上限制了其在計(jì)算機(jī)技術(shù)領(lǐng)域中的應(yīng)用和發(fā)展。因此,設(shè)計(jì)出準(zhǔn)確、高效、快速、通用性強(qiáng)的立體匹配技術(shù)及其算法已成為其未來(lái)發(fā)展與研究的重點(diǎn)方向。
結(jié)合當(dāng)前情況分析,可以大致推斷出立體匹配技術(shù)接下來(lái)的發(fā)展方向主要體現(xiàn)在以下幾方面。第一,逐漸由傳統(tǒng)的雙目視覺(jué)轉(zhuǎn)變?yōu)槎嗄恳曈X(jué),由靜態(tài)視覺(jué)轉(zhuǎn)變?yōu)閯?dòng)態(tài)視覺(jué),并通過(guò)增加信息的輸入來(lái)降低視覺(jué)計(jì)算的難度。第二,在信息化時(shí)代的影響下,逐漸向著智能化的方向發(fā)展,并在基于知識(shí)、規(guī)則和模型的基礎(chǔ)上制定出立體視覺(jué)研究方法。第三,立體匹配算法逐漸并行化。隨著并行流水線(xiàn)機(jī)制和專(zhuān)用的信號(hào)處理機(jī)制在立體匹配技術(shù)中應(yīng)用的越來(lái)越廣泛和越來(lái)越成熟,不僅立體匹配系統(tǒng)會(huì)越來(lái)越具有實(shí)用性,而且會(huì)在很大程度上引導(dǎo)立體匹配算法區(qū)域并行化。
5 結(jié)語(yǔ)
通過(guò)眼睛的觀(guān)看人們可以感受到外界事物的存在,可以看到外界有形事物的具體形態(tài),可以清楚的了解到事物的立體信息,可以看到事物距離的遠(yuǎn)近。所以從某種角度而言,人類(lèi)視覺(jué)感知系統(tǒng)就是一個(gè)立體感知系統(tǒng)。根據(jù)文章分析,計(jì)算機(jī)視覺(jué)下的立體匹配技術(shù)正是基于人眼視覺(jué)觀(guān)察物體的原理。因此,將計(jì)算機(jī)技術(shù)與立體匹配技術(shù)進(jìn)行完美的融合,不僅有助于人類(lèi)視覺(jué)可以觀(guān)察到物體三維結(jié)構(gòu)中信息這一目標(biāo)的實(shí)現(xiàn),而且能夠幫助人們更加容易的獲取到物體的信息。
參考文獻(xiàn)
[1] 裴聰.基于計(jì)算機(jī)視覺(jué)中雙目立體匹配技術(shù)研究[D].鎮(zhèn)江:江蘇大學(xué),2010.
[2] 郭龍?jiān)?計(jì)算機(jī)視覺(jué)立體匹配相關(guān)理論與算法研究[D].南京:南京理工大學(xué),2009.
[3] 侯小麗.立體視覺(jué)中的立體匹配技術(shù)研究的現(xiàn)狀與展望綜述[J].太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào),2008(12):162-163.