国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于RGB&D傳感器的手勢(shì)與人臉識(shí)別智能輪椅控制系統(tǒng)

2021-12-30 01:26:20萬(wàn)昔源
關(guān)鍵詞:手勢(shì)識(shí)別率輪椅

萬(wàn)昔源

(義烏工商職業(yè)技術(shù)學(xué)院 義烏創(chuàng)新研究院,浙江 義烏 322000)

0 引言

中國(guó)發(fā)展基金會(huì)發(fā)布報(bào)告預(yù)測(cè),到2022年中國(guó)65歲以上人口將占總?cè)丝诘?4%,從老齡化社會(huì)進(jìn)入老齡社會(huì)。報(bào)告還顯示,2050年左右,中國(guó)60歲以上的人口將達(dá)到5億人[1]。因此,輪椅的需求量將越來越大。但是,目前市場(chǎng)上的電動(dòng)輪椅仍然以通過搖桿控制為主。部分科研機(jī)構(gòu)已進(jìn)行新型人機(jī)交互控制輪椅方式的研究。比如,重慶郵電大學(xué)智能機(jī)器人研究所開發(fā)了基于手指命令識(shí)別的機(jī)器人運(yùn)動(dòng)控制系統(tǒng),如圖1所示[2];日本神奈川理工學(xué)院的方案是,將手作為虛擬鼠標(biāo)進(jìn)行輪椅控制,如圖2所示[3]。但是,手指識(shí)別的方案受限于操作者的手指靈活度;虛擬鼠標(biāo)控制的方案經(jīng)過測(cè)試,操作難度較高,容易誤操作??紤]到老年用戶的操作精度問題,本文利用深度攝像頭,采用了較大幅度的手勢(shì)以及頭部動(dòng)作識(shí)別來控制輪椅[4],并設(shè)計(jì)了一套安全優(yōu)先的控制邏輯。

圖1 重慶郵電大學(xué)研究成果

圖2 日本神奈川理工學(xué)院研究成果

本系統(tǒng)整體研究框架如下:第一,原始數(shù)據(jù)利用Kinect傳感器深度數(shù)據(jù)與RGB圖像;第二,通過雙指數(shù)平滑濾波,以消除抖動(dòng),平滑數(shù)據(jù);第三,將用戶深度數(shù)據(jù)與背景分離,以降低背景噪聲干擾;第四,創(chuàng)新地利用匹配深度坐標(biāo)系和RGB相機(jī)坐標(biāo)系的方式檢測(cè)用戶手勢(shì)命令,提高識(shí)別率,并使得用戶操作感知更加直觀。系統(tǒng)框架如圖3所示。

圖3 系統(tǒng)框架

1 數(shù)據(jù)獲取與處理

1.1 深度數(shù)據(jù)的獲取

Kinect傳感器的深度數(shù)據(jù)流由圖像幀組成(如圖4所示)。在每幅深度圖像幀中,任意像素都有特定的深度數(shù)據(jù),即Kinect傳感器到物體的距離,單位為mm。每個(gè)像素有16位數(shù)據(jù),較高的13位是Kinect到對(duì)象的深度數(shù)據(jù),較低的3位是用戶索引數(shù)據(jù),如圖5所示。因此,Kinect可以測(cè)量的理論深度為0-213(mm)。

圖4 深度數(shù)據(jù)圖

圖5 深度數(shù)據(jù)流

1.2 雙指數(shù)平滑濾波

由于硬件與軟件性能限制,有多種原因會(huì)引起數(shù)據(jù)的抖動(dòng)。其中一個(gè)主要原因是由于數(shù)據(jù)量大,每分鐘系統(tǒng)要處理超過1000萬(wàn)次的深度數(shù)據(jù)。因此,在使用深度數(shù)據(jù)之前的一個(gè)重要步驟是使用降噪濾波器從數(shù)據(jù)中去除盡可能多的噪聲,使得獲取到的數(shù)據(jù)更平滑。

一個(gè)理想的濾波器用于消除所有不必要的噪音和抖動(dòng)的數(shù)據(jù),并且沒有任何滯后或延遲。但是,在實(shí)踐中,濾波與無(wú)延遲之間幾乎是一對(duì)矛盾,濾波過程中,必然產(chǎn)生一些程序運(yùn)行的延時(shí)。所以需要在這兩個(gè)目標(biāo)之間找一個(gè)折中點(diǎn)。經(jīng)過測(cè)試,本系統(tǒng)中選擇了雙指數(shù)平滑濾波算法[5-6]。算法公式如下:

其中,bn是利用特定時(shí)間間隔獲取的數(shù)據(jù)擬合形成預(yù)測(cè)的趨勢(shì),xn是通過控制趨勢(shì)bn的權(quán)重所輸出的結(jié)果。濾波結(jié)果如下:

做如圖6和圖7所示的姿勢(shì),并保持圖7的姿勢(shì)一段時(shí)間。檢測(cè)右手深度數(shù)據(jù)的輸出如圖8所示,濾波參數(shù)α=0.35,γ=0.7,X軸單位為幀,Y軸單位為米。灰色線是過濾后的數(shù)據(jù),黑色線是原始數(shù)據(jù)??捎^察到,濾波后的輸出數(shù)據(jù)比原始數(shù)據(jù)平滑,雖有一定的延遲,但在可接受范圍內(nèi)。

圖6 濾波測(cè)試手勢(shì)a

圖7 濾波測(cè)試手勢(shì)b

圖8 濾波測(cè)試結(jié)果

1.3 分離用戶與背景數(shù)據(jù)

背景數(shù)據(jù)的存在會(huì)引起不必要的干擾,因此需要在獲取到的深度數(shù)據(jù)中,將用戶的數(shù)據(jù)提純。

數(shù)據(jù)處理方法如圖9所示,矩陣a表示一組簡(jiǎn)化的深度圖像的16位數(shù)據(jù)矩陣示例,它包括一個(gè)用戶和其他背景。將矩陣a的每個(gè)像素左移13位,就可以得到矩陣b。從矩陣b中,很容易區(qū)分哪些數(shù)據(jù)代表用戶,哪些是背景。因此,可以從矩陣a中得到用戶的數(shù)據(jù),如矩陣c所示。

圖9 深度圖像矩陣

提純后的深度數(shù)據(jù)圖像如圖10所示。

圖10 分離背景

2 動(dòng)作識(shí)別

2.1 命令識(shí)別

手勢(shì)是一種旨在傳達(dá)信息的人體運(yùn)動(dòng)或動(dòng)作,特定的手勢(shì)可以讓應(yīng)用程序知道我們要做什么。在獲取到深度數(shù)據(jù)后,需要做的就是將若干深度數(shù)據(jù)組合起來,設(shè)計(jì)一組發(fā)送手勢(shì)命令的邏輯。手勢(shì)識(shí)別大體上有兩種方案:第一種是采用識(shí)別雙臂交叉的手勢(shì)發(fā)送命令[7]。交叉手勢(shì)方法的主要思想是跟蹤兩個(gè)或多個(gè)指定的關(guān)節(jié),當(dāng)它們交叉或重疊時(shí)觸發(fā)事件執(zhí)行。但它也有一些缺點(diǎn),例如,做手勢(shì)如圖11左圖所示并獲取400幀圖像數(shù)據(jù),然后切換到手勢(shì)如圖11右圖所示,同樣獲取400幀數(shù)據(jù),從左側(cè)y軸數(shù)據(jù)(圖12)可以看出,前半部分與后半部分完全不同。前400幀是穩(wěn)定的,而400幀到800幀有很多抖動(dòng)。這樣的抖動(dòng)情況,用于輪椅控制中是不能接受的。

圖11 交叉手勢(shì)測(cè)試

圖12 交叉手勢(shì)測(cè)試數(shù)據(jù)

因此本文采用了另一種方案:利用在RGB圖像中計(jì)算關(guān)節(jié)相對(duì)坐標(biāo)的方式來設(shè)計(jì)控制命令。此方法的主要思想是跟蹤人體骨骼的關(guān)節(jié)數(shù)據(jù),然后在RGB圖像上進(jìn)行匹配。這樣就可以得到RGB圖像中人體關(guān)節(jié)點(diǎn)的相對(duì)位置。由于傳感器獲取的深度坐標(biāo)數(shù)據(jù)是原點(diǎn)位于傳感器中心的三維數(shù)組,而RGB圖像數(shù)據(jù)是原點(diǎn)位于圖像左上角的二維數(shù)組,故物體深度數(shù)據(jù)的坐標(biāo)系與RGB圖像坐標(biāo)系有所偏差。正如我們?cè)趫D12中所看到的,當(dāng)兩個(gè)關(guān)節(jié)交叉時(shí),骨架坐標(biāo)系中的X和Y軸數(shù)據(jù)將有很大的抖動(dòng),所以我們不能使用深度數(shù)據(jù)中的X和Y軸值。為了讓圖像呈現(xiàn)更加直觀,不直接使用X和Y軸深度數(shù)據(jù)來呈現(xiàn)給用戶,而需將深度圖像坐標(biāo)系映射到RGB圖像坐標(biāo)系中。映射公式如公式(3)和(4)所示,其中Point.x為X軸方向得出的映射結(jié)果,Xd為深度圖像X坐標(biāo)系值,Xmax為深度圖像坐標(biāo)系x軸的最大值,image.width為圖像的寬度,Point.y為Y軸方向得出的映射結(jié)果,Yd為深度圖像Y坐標(biāo)系值,Ymax為深度圖像坐標(biāo)系y軸的最大值,image.height是圖像高度,k是經(jīng)驗(yàn)值。

2.2 控制方式設(shè)計(jì)

本系統(tǒng)設(shè)計(jì)了如下5種控制方式:

(1)前進(jìn):點(diǎn)頭(超過20度)二次;

(2)左轉(zhuǎn):頭向左轉(zhuǎn)大約20度,并保持;

(3)右轉(zhuǎn):頭向右轉(zhuǎn)大約20度,并保持;

(4)停止:舉起雙手或者張開嘴巴;

(5)加/減速:舉右/左手過頭頂并保持;

(6)開關(guān):雙手同時(shí)舉過頭頂。

3 系統(tǒng)測(cè)試

本文設(shè)計(jì)了兩個(gè)部分的測(cè)試(如表1所示):首先,在第一節(jié)中測(cè)試了每個(gè)功能的動(dòng)態(tài)和靜態(tài)性能,比較了這兩種不同狀態(tài)下得出的識(shí)別率;其次,在第二節(jié)中測(cè)試了環(huán)境對(duì)系統(tǒng)的干擾,如將行人、運(yùn)行時(shí)間等作為變量。

表1 系統(tǒng)測(cè)試項(xiàng)目

測(cè)試結(jié)果如下:

如圖13所示,系統(tǒng)對(duì)初學(xué)者手勢(shì)命令的識(shí)別率在80%左右,經(jīng)過一段時(shí)間訓(xùn)練,能顯著提高識(shí)別率,最終達(dá)到95%以上;

圖13 用戶熟練度對(duì)比測(cè)試數(shù)據(jù)

如圖14所示,系統(tǒng)能夠規(guī)避路人的干擾,緊緊跟蹤住操作者;

圖14 路人干擾測(cè)試

如圖15所示,系統(tǒng)在運(yùn)行60分鐘后,由于硬件設(shè)備原因,識(shí)別率產(chǎn)生了一些衰減。今后將在硬件穩(wěn)定性方面,做進(jìn)一步優(yōu)化。

圖15 系統(tǒng)運(yùn)行時(shí)常對(duì)比測(cè)試數(shù)據(jù)

4 結(jié)語(yǔ)

隨著傳感器技術(shù)的進(jìn)步,人機(jī)交互技術(shù)近年來得到了長(zhǎng)足發(fā)展。如Kinect、Leap Motion等產(chǎn)品不斷涌現(xiàn)。如何將人機(jī)交互技術(shù)與老年人的出行需求結(jié)合起來,開發(fā)出新型的智能輪椅,是一個(gè)值得深入研究的課題。

本文對(duì)傳感器數(shù)據(jù)的獲取、原始深度數(shù)據(jù)的濾波、用戶與背景分離等做了深入研究,并開發(fā)出了一套能夠識(shí)別多種命令的輪椅控制邏輯。實(shí)驗(yàn)結(jié)果表明,基于RGB&D傳感器的手勢(shì)與人臉識(shí)別智能輪椅控制系統(tǒng)抗干擾效果良好,識(shí)別率在95%以上。今后的研究中,還將與輪椅生產(chǎn)相關(guān)企業(yè)如聯(lián)誼電機(jī)股份有限公司等深入合作,加入自動(dòng)避障等模塊,改進(jìn)研究成果。

猜你喜歡
手勢(shì)識(shí)別率輪椅
輪椅上的愛
基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
我的輪椅
挑戰(zhàn)!神秘手勢(shì)
基于真耳分析的助聽器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
V字手勢(shì)的由來
提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
輪椅上的姑娘(外三首)
勝利的手勢(shì)
高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
郎溪县| 绵阳市| 固阳县| 湖南省| 淮阳县| 隆化县| 北海市| 宿迁市| 金昌市| 泰兴市| 泌阳县| 加查县| 康保县| 新丰县| 马尔康县| 贺兰县| 安徽省| 三亚市| 屯昌县| 新泰市| 渑池县| 南昌市| 安丘市| 达州市| 惠州市| 灵石县| 禄丰县| 南靖县| 花莲县| 镇巴县| 武陟县| 二手房| 墨玉县| 汨罗市| 成安县| 寿光市| 博白县| 岳池县| 麻城市| 阳谷县| 南通市|