摘 要 計算機視覺技術(shù)是以后發(fā)展的一個重要方向,文章首先簡要介紹了雙目立體視覺的概念,接著就雙目立體視覺匹配技術(shù)的原理進行了重點介紹,最后簡要分析了雙目立體視覺匹配技術(shù)的應(yīng)用難點和發(fā)展趨勢。
關(guān)鍵詞 計算機視覺;立體匹配;研究情況
中圖分類號:TP391 文獻標識碼:A 文章編號:1671-7597(2014)07-0001-01
隨著科學技術(shù)的快速發(fā)展,計算機技術(shù)也得到了飛速的發(fā)展。將計算機技術(shù)應(yīng)用于人類的視覺系統(tǒng),并輔助人們觀察到一些眼睛難以看到的東西,已經(jīng)逐漸成為一門大家所熱捧和追逐的技術(shù)。隨著人們對視覺傳感器技術(shù)越來越多的探索,人們也逐漸實現(xiàn)了古代時想擁有千里眼的夢想。目前,人們已經(jīng)把視覺傳感器技術(shù)和計算機技術(shù)良好的結(jié)合在一起,并把這些技術(shù)應(yīng)用到食品、建筑、醫(yī)藥、電子、航天航空等眾多領(lǐng)域當中。而該項技術(shù)的快速發(fā)展,也幫助人們解決了一些日常工作當中人類視覺存在盲區(qū)的問題,保證了人們工作過程的安全。視覺技術(shù)與IT技術(shù)的完美結(jié)合使得人們的生活變得更加便利,讓人們親身體會到了IT技術(shù)給人們生活帶來的便捷。
1 雙目立體視覺概述
雙目立體視覺又稱雙目視覺技術(shù),是目前計算機視覺應(yīng)用領(lǐng)域的重要研究內(nèi)容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應(yīng)用功能的不同,組成也都各不相同。
雙目立體視覺的實現(xiàn)原理是基于人眼的視網(wǎng)膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據(jù)匹配的結(jié)果,獲取同一個物體不同偏差位置的信息。最后在依據(jù)三角測量技術(shù),根據(jù)已經(jīng)獲得的這些偏差信息從而獲得這些不同點對應(yīng)的距離信息,并最終獲得這些實際物體的具體坐標位置信息。
視差測距技術(shù)告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據(jù)同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設(shè)備、圖像預處理設(shè)備、攝像機標定設(shè)備、立體匹配設(shè)備、根據(jù)二維信息實現(xiàn)三維重構(gòu)設(shè)備等五個重要設(shè)備。
2 雙目立體視覺技術(shù)的原理
立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術(shù)。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術(shù)或者通過合理的觀察手段和觀察設(shè)備,就可以看到一組秩序井然的美妙圖片。
三維立體圖是一組重復的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復案在經(jīng)過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。
雙目立體視覺技術(shù)正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經(jīng)過一定的處理獲得三維重建的物體立體信息的技術(shù)。
雙目立體視覺在計算機技術(shù)中實現(xiàn)三維重建的大致流程
如下。
1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數(shù)的大概值,并根據(jù)這些參數(shù)值設(shè)定攝像機。
2)用設(shè)定參數(shù)的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。
3)通過計算機技術(shù)實現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應(yīng)關(guān)系。
4)在第三步中若得到兩組二維圖像的關(guān)系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。
5)根據(jù)得到的視差圖最終實現(xiàn)場景的三維圖形的重建。
3 雙目立體匹配技術(shù)的研究難點和未來的發(fā)展方向
盡管目前有很多學者都投身到雙目立體匹配技術(shù)的研究和開發(fā)當中,直至目前為止也解決了很多關(guān)于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術(shù)的難點已經(jīng)成為限制將雙目技術(shù)應(yīng)用到計算機技術(shù)當中的重要瓶頸。
立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應(yīng)關(guān)系,然后根據(jù)這些像素關(guān)系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個方面。
1)由于視角的問題或者觀察物體存在遮擋問題,導致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區(qū)域。
2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。
3)場景當中的低紋理的圖片匹配特征和匹配關(guān)系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結(jié)果,而這些匹配結(jié)果當中有一大部分是錯誤的。這樣子的結(jié)果勢必會導致最終的圖像匹配正確率極為低下。
從以上的分析,我們可以看出立體匹配技術(shù)存在很多技術(shù)上的難點,這些都在很大程度上限制雙目立體匹配技術(shù)在計算機當中的應(yīng)用發(fā)展。如何才能設(shè)計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設(shè)計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術(shù)在計算機視覺當中得到廣泛的應(yīng)用。
4 結(jié)束語
人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機中的雙目立體匹配技術(shù)正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結(jié)合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術(shù)與計算機技術(shù)的完美結(jié)合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術(shù)應(yīng)用于人類的視網(wǎng)膜當中,以幫助一些視網(wǎng)膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。
參考文獻
[1]高文,陳熙霖.計算機視覺算法與系統(tǒng)原理[M].北京:清華大學出版社,2002.
[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學,2008.
[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準則及其快速算法[J].電路與系統(tǒng)學報,2007,12(4):137-14.
[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學,2012.
作者簡介
陳嘉弛(1994-),男,浙江寧波人,本科在讀,研究方向:計算機視覺。endprint