鹿天柱++羅罹++胡開(kāi)亮
摘要:針對(duì)家庭服務(wù)類(lèi)機(jī)器人撿垃圾的問(wèn)題,提出了一種基于機(jī)器人識(shí)別物體上的Naomark標(biāo)記來(lái)間接識(shí)別物體的策略。文中簡(jiǎn)單介紹了RGB以及HSV色彩模式,闡明了引用Naomark的原因,給出了Nao機(jī)器人撿垃圾的具體過(guò)程。
關(guān)鍵詞:Nao機(jī)器人;RGB;HSV;Naomark
中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)11-0154-02
1 Nao機(jī)器人的基本介紹
隨著人類(lèi)在人工智能機(jī)器人領(lǐng)域的不斷探索與發(fā)展,越來(lái)越多種類(lèi)的機(jī)器人被研發(fā)與投入使用,在這之中,Nao機(jī)器人憑借其顯著的特點(diǎn)逐漸成為學(xué)術(shù)領(lǐng)域乃至世界范圍內(nèi)應(yīng)用最廣泛的人工智能機(jī)器人。
在硬件方面,Nao配置了眾多可移動(dòng)的關(guān)節(jié)位置,這些關(guān)節(jié)位置使 Nao擁有25個(gè)自由度[1],保證了機(jī)器人動(dòng)作的連貫性,再加上機(jī)器人內(nèi)部配置了壓力傳感器,霍爾效應(yīng)傳感器,慣性導(dǎo)航儀,紅外接收器和超聲波傳感器等設(shè)備[2],進(jìn)一步提升了Nao機(jī)器人行走,抓取等動(dòng)作的流暢與穩(wěn)定,此外,通過(guò)AMD Geode等嵌入式軟件,Nao可以實(shí)現(xiàn)聲音合成、音響定位、探測(cè)視覺(jué)圖像及探測(cè)障礙物等多種功能。
編程方面Nao可在Linux、Windows或Mac OS等多種操作系統(tǒng)下通過(guò)現(xiàn)成的指令塊進(jìn)行可視化編程編程并且擁有一個(gè)開(kāi)放式的構(gòu)架,大大簡(jiǎn)化了程序員的工作,并且用戶(hù)可以通過(guò)自己想要達(dá)到的效果來(lái)探索不同的領(lǐng)域。
2 物體識(shí)別技術(shù)的選擇
2.1 RGB和HSV
在顏色空間的選擇方面,最廣泛運(yùn)用的是RGB色彩模式以及HSV色彩模式。
RGB色彩模式是將紅(Red)綠(Green)藍(lán)(Blue)三種原色的色光以不同的比例相加,這樣就可以產(chǎn)生很多種不同效果的色光,具體來(lái)說(shuō)一個(gè)圖像的每個(gè)像素點(diǎn)都分別有R、G、B三個(gè)色彩分量,而在RGB顏色模型中,每個(gè)像素點(diǎn)的每個(gè)分量被分配了一個(gè)0到255之間的色彩值。例如:純紅色的R值為255,G值為0,B值為0;白色的R、G、B都為255;黑色的R、G、B都為0。經(jīng)過(guò)理論分析以及眾多實(shí)際應(yīng)用經(jīng)驗(yàn),RGB圖像可以表示多達(dá)16777216種顏色。但是使用RGB顏色模型的一個(gè)很大的問(wèn)題是這種顏色空間受光照強(qiáng)度的影響比較大,相關(guān)實(shí)驗(yàn)表明,對(duì)于同一物體來(lái)說(shuō)在不同強(qiáng)度的光照下測(cè)得的RGB色值分布很分散,但是在Nao機(jī)器人執(zhí)行撿垃圾任務(wù)的環(huán)境中光線(xiàn)強(qiáng)度的變化可能會(huì)比較大,這就無(wú)法保證識(shí)別的準(zhǔn)確性,如果采用RGB顏色空間的話(huà),機(jī)器人就很可能把并非指定顏色的物體誤認(rèn)為指定顏色的物體或者忽略了應(yīng)該識(shí)別的物體,顯然,RGB是不能滿(mǎn)足實(shí)際要求的。
HSV顏色模型的H、S、V三個(gè)分量分別表示色調(diào)、飽和度和亮度[3],色調(diào)H由角度度量,由繞V軸的旋轉(zhuǎn)角給定,并做規(guī)定紅色對(duì)應(yīng)的角度為0,按照逆時(shí)針?lè)较蛐D(zhuǎn),相應(yīng)的黃色對(duì)應(yīng)的角度為60°,綠色對(duì)應(yīng)于角度120°,青色對(duì)應(yīng)角度為180°藍(lán)色對(duì)應(yīng)于角度240°,,品紅對(duì)應(yīng)角度為300°。飽和度S取值從0.0到1.0,值越大表示色彩越飽和,比較特別的是S幾乎不隨光照強(qiáng)度的變化而改變,這一特點(diǎn)恰恰彌補(bǔ)了RGB顏色空間的缺陷。 亮度V取值范圍從0到255,每一個(gè)值對(duì)應(yīng)于一種顏色[4]
2.2 Naomark
為了避免RGB顏色模式中光照的影響以及在HSV顏色模式上有所創(chuàng)新,我們采用了一種Naomark標(biāo)識(shí)技術(shù)。Naomark以一個(gè)黑色圓圈為圓心,周?chē)腥舾梢詧A圈為中心打開(kāi)的白色扇環(huán),黑色圓圈里的數(shù)字叫做Mark ID,是對(duì)不同Naomark的標(biāo)記,將Naomark放在目標(biāo)物體上,并放在Nao行動(dòng)范圍內(nèi)的不同位置,Nao便把直接尋找目標(biāo)物體的任務(wù)轉(zhuǎn)換成通過(guò)探測(cè)Naomark來(lái)間接定位目標(biāo)物體,這樣做的直接原因就是為了解決上面提到的RGB顏色空間的色值分散問(wèn)題,實(shí)驗(yàn)結(jié)果表明,Nao探測(cè)Naomark時(shí)受光照的影響可以被控制在允許的范圍內(nèi),因此識(shí)別的準(zhǔn)確度在很大程度上得到了保證。
獲取結(jié)果的代碼:
From naoqi import ALProxy
IP=”your _robot_ip”
PORT=9559
#Create a proxy to ALMemory
memProxy=ALProxy(“ALMemory”,IP,PORT)
#Get data from landmark detection(assuming face detection has been activated)
Data=memProxy.getData(“LandmarkDetected”)
如果探測(cè)無(wú)結(jié)果,則變量值為空,(Python語(yǔ)言里為”[]”)。如果探測(cè)到N個(gè)Naomark,則會(huì)有如下的信息:[[TimeStampField[Mark_info_0,Mark_info_1,......Mark_info_N-1]]]。假設(shè)獲取到的Naomark信息如下:
Mark ID:150
alpha 0.062-beta 0.030
width0.032-heught0.032
則表示已經(jīng)檢測(cè)到150號(hào)Naomark,width和height是寬度和高度信息,alpha和beta是測(cè)試信息。
3 撿垃圾的具體過(guò)程
首先在垃圾以及垃圾桶上貼上Naomark,之后Nao在一定的區(qū)域內(nèi)進(jìn)行檢測(cè),結(jié)果是先定位到垃圾上的Naomark,Nao向目標(biāo)垃圾移動(dòng),撿起垃圾后繼續(xù)檢測(cè),定位到垃圾桶上的Naomark,向垃圾桶移動(dòng),并最終完成撿垃圾的動(dòng)作。
這個(gè)過(guò)程在實(shí)際實(shí)驗(yàn)中主要遇到了兩個(gè)問(wèn)題,一個(gè)是在Nao第一次檢測(cè)過(guò)程中如果先識(shí)別到了垃圾桶上的Naomark,我們要求Nao不能向垃圾桶移動(dòng)。解決方案是我們把垃圾上的Mark ID定義為0~100,把垃圾桶上的Mark ID定義為101~200。在第一次的檢測(cè)過(guò)程中把檢測(cè)到的Mark ID 限制在0~100,如果檢測(cè)到其他的Mark ID,Nao會(huì)自動(dòng)丟棄。還有一個(gè)問(wèn)題是Nao在向目標(biāo)物移動(dòng)的過(guò)程中的平穩(wěn)問(wèn)題,實(shí)驗(yàn)證明,在移動(dòng)過(guò)程中Nao大概有40%的幾率出現(xiàn)不穩(wěn)甚至跌倒的情況,這需要我們開(kāi)發(fā)一套更加完備的機(jī)器人行走算法,這是日后主要的研究方向。
4 結(jié)論
文章分析了RGB以及HSV色彩模式的原理特點(diǎn)以及不足,提出了一種基于Naomark的物體識(shí)別技術(shù),即通過(guò)探測(cè)Naomark上的Mark ID來(lái)識(shí)別和定位物體,這么做可以有效的彌補(bǔ)Nao機(jī)器人在應(yīng)用RGB色彩模式時(shí)易受光線(xiàn)影響的缺陷。文章然后給出了Nao機(jī)器人從識(shí)別物體到完成撿垃圾動(dòng)作的完整過(guò)程,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)Nao機(jī)器人在實(shí)際應(yīng)用中會(huì)出現(xiàn)行走不穩(wěn)甚至跌倒的問(wèn)題,因此為了解決這一問(wèn)題,日后需要開(kāi)發(fā)出一套算法使機(jī)器人行走更加平穩(wěn)與流暢。
參考文獻(xiàn):
[1] 孟憲龍, 李龍澍, 羅罹, 等. RoboCup中NAO機(jī)器人球場(chǎng)目標(biāo)紅球識(shí)別與快速找球策略[J].電腦知識(shí)與技術(shù), 2013, (24):5515-5519.
[2] 豐昆劍. 監(jiān)控視頻流的特征分析與壓縮技術(shù)的實(shí)現(xiàn)[D]. 東南大學(xué), 2008.
[3] Tsutomu Kuroda,Tomio Watanabe.Method for lip extraction from face image using HSV color space[J].日本機(jī)械學(xué)會(huì)論文集. C編,1995,61(592):4724-4729.
[4] 宮興亮. 支持自頂向下色彩設(shè)計(jì)的模型構(gòu)建與應(yīng)用[D]. 西北工業(yè)大學(xué), 2007.