李星云,李眾立,廖曉波
(西南科技大學(xué)制造科學(xué)與工程學(xué)院,四川綿陽(yáng)621010)
視覺定位技術(shù)是機(jī)器人領(lǐng)域的一個(gè)重要研究方向[1],它綜合運(yùn)用了機(jī)械學(xué)、電子學(xué)、光學(xué)、圖像處理等學(xué)科,將其應(yīng)用到工業(yè)生產(chǎn)中,可以對(duì)目標(biāo)尺寸和位姿進(jìn)行測(cè)量,具有非接觸、速度快、柔性好等優(yōu)點(diǎn),在現(xiàn)代制造行業(yè)中具有非常廣泛的應(yīng)用前景。G PENG[2]介紹了視覺技術(shù)的關(guān)鍵問題,實(shí)現(xiàn)了對(duì)目標(biāo)的定位。但該方法的缺點(diǎn)是利用單個(gè)特征點(diǎn)進(jìn)行測(cè)量,容錯(cuò)率較低;沈慧杰[3]建立了單目視覺測(cè)距的模型,但是要通過設(shè)置在場(chǎng)地上特征點(diǎn)與攝像機(jī)之間構(gòu)成三角關(guān)系后求出坐標(biāo),加大了運(yùn)算量。周娜[4]建立了基于平面模板的攝像機(jī)定位方法,但為了獲得圖像間以及模板與圖像之間對(duì)應(yīng)點(diǎn)的匹配,需要人為干預(yù),不能實(shí)現(xiàn)實(shí)時(shí)定位。
單目視覺定位在理論上有很多的研究,但圖像處理主要是在計(jì)算機(jī)上進(jìn)行,所以集成性較低,成本較高。論文從實(shí)際生產(chǎn)情況出發(fā),提出了一種在嵌入式平臺(tái)上的單目視覺定位方法,選用S3C2440 微處理器和OV3640 圖像傳感器,以工件為目標(biāo),設(shè)計(jì)出一套集成高,計(jì)算快,測(cè)量準(zhǔn)確的單目定位系統(tǒng)。
圖1 靜態(tài)圖像采集平臺(tái)結(jié)構(gòu)
為了保證目標(biāo)的空間位置和姿態(tài)準(zhǔn)確測(cè)量,測(cè)量模塊要固定在目標(biāo)的正上方,并且鏡頭的光軸與地面垂直[5]。定位系統(tǒng)的靜態(tài)圖像采集平臺(tái)結(jié)構(gòu)如圖1 所示。其中f 為攝像機(jī)焦距,r 為視場(chǎng)角,c 為測(cè)量模塊,1 為光源。
為了提高測(cè)量精度和計(jì)算速度,應(yīng)選擇計(jì)算速度快的微處理器以及像素高的圖像傳感器[6]
(1)微處理器的選擇
微處理器選擇的是三星公司生產(chǎn)的一款高性能、低功耗、體積小的S3C2440[7]處理芯片。由于該處理芯片有一個(gè)專用的Camera-Interface (CAMIF)接口,該接口支持YCrCb8 位的數(shù)字視頻接口標(biāo)準(zhǔn),并且無需接口轉(zhuǎn)換電路,便可以和圖像傳感器直接連接使用。
(2)圖像傳感器的選擇
圖像傳感器選擇的是OV 公司生產(chǎn)的300W 像素的CMOS 傳感器OV3640[8]。該芯片在QXGA (2 048×1 536)格式下,處理速度高達(dá)15 幀/s,可輸出YCb-Cr422、RGB565 等多種格式,并可通過設(shè)置其內(nèi)部寄存器來控制其曝光時(shí)間、白平衡、飽和度、增益等參數(shù)。
(3)光學(xué)鏡頭的選擇
光學(xué)鏡頭須選擇固定焦距、固定視場(chǎng)角和景深比較大的防畸變光學(xué)鏡頭。
在測(cè)量平臺(tái)的硬件設(shè)計(jì)中,將微處理器與圖像傳感器集成在一塊電路板上,并固定在保護(hù)外殼的內(nèi)部,在保護(hù)外殼上連接光學(xué)鏡頭,構(gòu)成測(cè)量模塊,如圖2 所示。
圖2 測(cè)量模塊
視覺定位系統(tǒng)的主要硬件連接圖如圖3 所示。
圖3 視覺定位系統(tǒng)的主要硬件連接圖
首先微處理器向圖像傳感器發(fā)出采集圖像的信號(hào),收到信號(hào)后,圖像傳感器將光學(xué)圖像轉(zhuǎn)換成電子信號(hào),經(jīng)過信號(hào)放大處理將數(shù)據(jù)結(jié)果通過DMA 傳送到存儲(chǔ)單元;然后微處理器將圖像數(shù)據(jù)從儲(chǔ)存單元中讀取出,通過計(jì)算得到目標(biāo)的空間位置和姿態(tài);最后通過通信接口將得到的數(shù)據(jù)發(fā)送到機(jī)器人控制器去控制機(jī)器人運(yùn)動(dòng)。
單目視覺定位原理是利用一個(gè)攝像機(jī)獲取目標(biāo)圖片,然后將圖像空間中的目標(biāo)信息通過相關(guān)算法,轉(zhuǎn)化成真實(shí)空間中的目標(biāo)信息[9]。在該系統(tǒng)中,將得到的圖像坐標(biāo)(u,v)通過相關(guān)算法,計(jì)算出目標(biāo)的空間位置與姿態(tài)。
(1)成像平面坐標(biāo)系
如圖4 所示,O-XY 為成像平面坐標(biāo)系,其中點(diǎn)O 是鏡頭光軸與成像平面的交點(diǎn),位于圖像中心。XY 平面與地面平行。
(2)圖像坐標(biāo)系
如圖4 所示,o-uv 為圖像坐標(biāo)系,由于圖像信息儲(chǔ)存在矩陣中,所以其坐標(biāo)(u,v)表示圖像中各像素點(diǎn)的行數(shù)和列數(shù),其原點(diǎn)o 位于圖像的左上角。u 軸和v 軸分別平行于成像平面坐標(biāo)系的X 軸和Y 軸。
(3)攝像機(jī)坐標(biāo)系
如圖4 所示,Oc-XcYcZc為攝像機(jī)坐標(biāo)系,其中點(diǎn)Oc為鏡頭的光心,Xc軸和Yc軸與成像平面坐標(biāo)系的X 軸與Y 軸平行,Zc軸為鏡頭的光軸,與成像平面垂直。
(4)世界坐標(biāo)系圖
如圖4 所示,Ow-XwYwZw為世界坐標(biāo)系,用來描述目標(biāo)的空間位置,為了提高運(yùn)算速度,此系統(tǒng)定義的世界坐標(biāo)系的原點(diǎn)Ow為鏡頭光軸與地面的交點(diǎn),XwYw平面與地面重合。
圖4 定位系統(tǒng)坐標(biāo)系
在圖像坐標(biāo)中,像素點(diǎn)坐標(biāo)(u,v)為該像素在數(shù)組中的位置,并非實(shí)際的物理坐標(biāo)值,所以需要轉(zhuǎn)換到成像平面坐標(biāo)系中。已知圖像中心的坐標(biāo)為(uo,vo)和一個(gè)像素點(diǎn)的尺寸為dx、dy,通過坐標(biāo)系之間的關(guān)系可得其轉(zhuǎn)化公式為:
由各坐標(biāo)系之間的幾何關(guān)系可知:點(diǎn)O 為鏡頭的光心,Xc軸和Yc軸與成像平面的X 軸和Y 軸平行,Zc軸為鏡頭的光軸,它與成像平面垂直,其交點(diǎn)即為成像平面的坐標(biāo)原點(diǎn)O。OOc為攝像機(jī)的焦距f。根據(jù)圖4 中的各坐標(biāo)系關(guān)系,可以得到成像平面坐標(biāo)系與攝像機(jī)坐標(biāo)系之間的轉(zhuǎn)換公式:
通過齊次坐標(biāo)轉(zhuǎn)換公式,可以得到攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的轉(zhuǎn)換公式:
由于定義的世界坐標(biāo)系的原點(diǎn)Ow為鏡頭光軸與地面的交點(diǎn),且攝像機(jī)坐標(biāo)系和世界坐標(biāo)系沒有相對(duì)旋轉(zhuǎn),只在Zc軸正方向進(jìn)行平移,距離為a,所以可以得到R 為3 ×3 的單位矩陣,T 為[0,0,a]T,聯(lián)立(1)(2)(3)3 個(gè)公式,可以得到公式:
從公式(4)可以看出,只要求出Zc的坐標(biāo)值,世界坐標(biāo)(Xw,Yw,Zw)即可求出。
由于已知圖像傳感器的像素陣列為m ×n、靶面長(zhǎng)度和寬度為L(zhǎng)u與Lv以及目標(biāo)的長(zhǎng)度和寬度為L(zhǎng)x與Ly,并且通過圖像處理可以得出目標(biāo)長(zhǎng)邊和寬邊的像素點(diǎn)個(gè)數(shù)分別lx和ly,通過圖像空間與真實(shí)空間的轉(zhuǎn)化關(guān)系,可以得到公式:
為了減少誤差,可以通過公式(5)(6)分別求出Zc的值,取其平均值,然后將得到的結(jié)果代入公式(4),即可求出目標(biāo)的空間坐標(biāo)。
目標(biāo)的姿態(tài)測(cè)量主要是計(jì)算目標(biāo)中心線與Xw軸正方向之間的夾角來確定的。經(jīng)過圖像處理,已知目標(biāo)兩條平行長(zhǎng)邊上像素點(diǎn)的坐標(biāo)(u,v),因此可以通過計(jì)算出對(duì)應(yīng)像素點(diǎn)坐標(biāo)的斜率來確定其夾角角度。為了縮短計(jì)算時(shí)間以及減少誤差,通過反復(fù)的測(cè)試,決定每條長(zhǎng)邊取相同間距的10 個(gè)像素點(diǎn)。
定位系統(tǒng)采用的圖像數(shù)據(jù)格式是YCbCr422,其中Y 表示明亮度,而Cb和Cr表示色度,其作用是描述圖像色彩及飽和度,用于指定像素的顏色。在該格式下,每個(gè)像素點(diǎn)保存一個(gè)Y 值,每2 個(gè)像素點(diǎn)保存一個(gè)Cb和Cr值。由圖像處理原理可知,圖像的像素點(diǎn)越多,識(shí)別與計(jì)算精度越高。所以選擇Y 分量圖像來進(jìn)行二值化處理和計(jì)算。
目標(biāo)Y 分量的灰度圖像及其直方圖和閥值分隔后的二值化圖像如圖5 所示。
圖5 Y 分量圖像及其直方圖和分割后二值化圖像
如圖5 (a)為目標(biāo)Y 分量的灰度圖像,5 (b)為其灰度直方圖,通過灰度直方圖可以看出,目標(biāo)與非目標(biāo)之間的灰度峰值有較大的間隔,可以較好地提取出目標(biāo)特征(因此盡量提高目標(biāo)與非目標(biāo)之間亮度差),通過閾值分割,得到二值化圖像,如圖5 (c)所示,并在二值圖像中,通過邊緣連接法[10]求出目標(biāo)邊界像素點(diǎn)。
該視覺定位系統(tǒng)圖像處理的主要流程是:首先進(jìn)行系統(tǒng)初始化,其次采集目標(biāo)圖像并對(duì)圖像Y分量進(jìn)行二值化處理,然后通過二值化圖像,得到目標(biāo)邊緣像素點(diǎn),最后通過目標(biāo)邊緣的像素點(diǎn),確定目標(biāo)的空間位置和姿態(tài)。圖像處理的軟件流程圖如圖6所示。
圖6 圖像處理的軟件流程圖
為了保證空間位置和姿態(tài)計(jì)算的準(zhǔn)確性,應(yīng)該注意以下幾點(diǎn):
(1)鏡頭的光心盡量是成像平面坐標(biāo)系的原點(diǎn),若偏差較小,則需要調(diào)整(u0,v0)的坐標(biāo)值,如果偏差較大,必須進(jìn)行校正。
(2)圖像傳感器的靶面尺寸必須和光學(xué)鏡頭的靶面尺相同,若圖像傳感器的靶面尺寸大于光學(xué)鏡頭的靶面,則采集到圖像周圍會(huì)有黑影,若小于,則采集圖像的會(huì)出現(xiàn)邊緣缺失。
(3)如果作業(yè)現(xiàn)場(chǎng)環(huán)境光線變化很大,會(huì)影響二值化圖像的閾值選取,從而影響計(jì)算出的位姿信息。所以在光線變化很大的環(huán)境中,應(yīng)該采用自適應(yīng)閾值提取法[11]。
在數(shù)據(jù)采集的過程中,分別讓采集模塊在不同高度對(duì)目標(biāo)圖像進(jìn)行采集,以判斷不同高度下的系統(tǒng)誤差,采集到的數(shù)據(jù)如表1 所示。
表1 不同高度下的圖像采集數(shù)據(jù)
通過表1 的數(shù)據(jù)可計(jì)算出目標(biāo)上表面中心的世界坐標(biāo),結(jié)果如表2 所示。
表2 不同高度下的圖像處理結(jié)果
在對(duì)目標(biāo)姿態(tài)的測(cè)量過程中,分別選擇了0°,15°,30°,45° 4 種角度,計(jì)算結(jié)果如表3 所示。
表3 不同角度的圖像處理結(jié)果
通過表1、表2 可知,測(cè)量模塊分別距地面為1 600、1 850、2 100 mm 時(shí),系統(tǒng)測(cè)量誤差均小于5 mm,通過表3 可知,在不同偏移角度下,測(cè)量誤差小于0.5°。通過以上數(shù)據(jù)可知,目標(biāo)空間位置與姿態(tài)測(cè)量的誤差均在操作允許的范圍內(nèi),因此該單目視覺定位系統(tǒng)是可行的。
通過選用S3C2440 與OV3640 的硬件配置,提出了一種處理簡(jiǎn)單、計(jì)算準(zhǔn)確的單目視覺定位系統(tǒng)。將該系統(tǒng)應(yīng)用在工業(yè)機(jī)器人上,可以準(zhǔn)確地獲取工件目標(biāo)的位置和姿態(tài)的信息,從而降低了工人的勞動(dòng)強(qiáng)度,提高了工作效率。隨著微處理器與圖像傳感器性能的不斷增強(qiáng),測(cè)量精度也會(huì)不斷提高,因此具有很高的推廣價(jià)值。
[1]倪受東,劉洋,袁祖強(qiáng).機(jī)器人視覺伺服綜述[J].機(jī)床與液壓,2007,35(9):1-5.
[2]PENG G,HUANG X H,GA0 J,et al .Vision Based Intelligent Control for Mobile Robot[C]//Intelligent Control and Automation,2006.WCICA 2006.The Sixth World Congress,2006,2:9124-9128.
[3]沈慧杰.基于單目視覺的攝像機(jī)定位方法的研究[D].長(zhǎng)春:吉林大學(xué),2009.
[4]周娜.基于單目視覺的攝像機(jī)定位技術(shù)研究[D].南京:南京航空航天大學(xué),2007.
[5]曹毓,馮瑩,趙立雙.相機(jī)姿態(tài)安裝誤差對(duì)單目視覺定位精度的影響[J].傳感器與微系統(tǒng),2012,31(12):23-26.
[6]彭章君,廖曉波,羅亮,等.拉鉚釘多參數(shù)高精度在線檢測(cè)系統(tǒng)的設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2011,19(2):260-265.
[7]Samsung Electronics.S3C2440 user's manual[M].Republic of Korea,2004.
[8]OmniVision Technologies.OV3640 user's manual [M].2006.
[9]廖曉波,李眾立,廖璇.磚窯卸垛機(jī)器人視覺定位系統(tǒng)研究[J].控制工程,2013,20(4):650-653.
[10]鄒柏賢,林京壤.圖像輪廓提取方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(25):1-4.
[11]郭佳.基于光照不均勻圖像的自適應(yīng)二值化方法研究[D].武漢:武漢科技大學(xué),2013.