王坤 黃媛媛 李雪蓮 孫家銘
[摘 要]本文實(shí)現(xiàn)了一種靜態(tài)手勢數(shù)字識別算法。首先對手勢圖像進(jìn)行分割,提取矩特征并進(jìn)行手勢識別,即判斷手指個(gè)數(shù)從而對手勢數(shù)字1~3進(jìn)行識別。根據(jù)識別出的數(shù)字來控制鼠標(biāo)指針及其相關(guān)操作,最終實(shí)現(xiàn)簡單、高效的人機(jī)交互。
[關(guān)鍵詞]人機(jī)交互 手勢識別 膚色檢測 形狀特征
中圖分類號:W65 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2016)10-0241-01
隨著信息技術(shù)的迅猛發(fā)展,人機(jī)交互越來越多,然而人們熟悉和熟練掌握的人機(jī)交互方式仍然局限于鼠標(biāo)、鍵盤等,它們限制了人機(jī)交互的速度與自然性。由于手勢具有自然、方便的特性, 與之相關(guān)的手勢識別技術(shù)越來越受到廣大研究人員的關(guān)注,將手勢識別技術(shù)運(yùn)用于對鼠標(biāo)指針的相關(guān)操作,可以很好地實(shí)現(xiàn)自然、友好、高效的人機(jī)交互[1-7]。
本文針對靜態(tài)手勢識別進(jìn)行研究,運(yùn)用膚色檢測對采集的手勢圖片進(jìn)行分割,對分割后的二值圖像提取矩特征,并根據(jù)每個(gè)手指的特征進(jìn)行區(qū)分是否是手指,從而判斷出手勢數(shù)字1、2、3。用手勢數(shù)字1、2和3分別控制鼠標(biāo)指針的移動、左鍵和右鍵,進(jìn)而實(shí)現(xiàn)簡單、高效的人機(jī)交互。
1.基于形狀特征的靜態(tài)手勢數(shù)字識別
本文主要針對1~3的數(shù)字靜態(tài)手勢識別,進(jìn)而映射為不同的指令,從而實(shí)現(xiàn)人機(jī)交互,主要流程圖如圖1所示[4]。
首先對采集的圖像進(jìn)行中值濾波處理和光照補(bǔ)償,接著對膚色進(jìn)行分割,結(jié)果如圖2所示。
對分割后的圖像進(jìn)行去除小的連通域和洞孔填充,再對分割后的圖像進(jìn)行大小歸一化處理,將手掌大小統(tǒng)一到規(guī)定尺寸,歸一化后的圖像如圖3所示。
對分割后的二值圖像,提取其p+q階矩作為特征:
(1)
其中i,j為圖像坐標(biāo),f(i,j)為在圖像(i,j)點(diǎn)的灰度值。其中勢圖像的質(zhì)心坐標(biāo)為(),其中:質(zhì)心坐標(biāo)可以用作人機(jī)交互的坐標(biāo)參考。
在分類器設(shè)計(jì)方面,每個(gè)手勢采集30張圖片用作訓(xùn)練樣本,根據(jù)訓(xùn)練樣本得到分類器參數(shù)。本文采用圖像分辨率為320×240,數(shù)字1~3的識別率如表1 所示。
2.手勢識別在人機(jī)交互中的應(yīng)用
獲取計(jì)算機(jī)屏幕分辨率(rsx,rsy)和圖像分辨率為(rix,riy),實(shí)現(xiàn)手質(zhì)心坐標(biāo)到屏幕坐標(biāo)(x,y)的轉(zhuǎn)換。
x:=rsx:rix
y:=rsy:riy
當(dāng)手勢移動小于指定閾值時(shí),鼠標(biāo)指針靜止,當(dāng)(x, y)出現(xiàn)在有效區(qū)域時(shí),就會使鼠標(biāo)指針移動,而且(x, y)距離屏幕中心越遠(yuǎn),鼠標(biāo)指針移動速度越快,當(dāng)然,如果手離開了屏幕,鼠標(biāo)指針也會靜止。當(dāng)識別手勢為數(shù)字2或3時(shí),分別調(diào)用函數(shù)來實(shí)現(xiàn)點(diǎn)擊鼠標(biāo)左鍵或右鍵操作。
3.小結(jié)
手勢作為一種高效、自然的人機(jī)交互輸入信號,將其應(yīng)用到人機(jī)交互系統(tǒng)中具有無可比擬的優(yōu)勢。本人機(jī)交互系統(tǒng)運(yùn)用了基于矩特征的靜態(tài)手勢數(shù)字識別算法,并結(jié)合了Windows API鼠標(biāo)類函數(shù),識別效率、精度較高。實(shí)驗(yàn)結(jié)果表明該人機(jī)交互系統(tǒng)可以簡單、高效的控制鼠標(biāo)指針及其相關(guān)操作。下一步研究的重點(diǎn)是復(fù)雜背景下的手勢分割,并進(jìn)一步研究手勢特性,進(jìn)而提出更好的解決方案。
參考文獻(xiàn)
[1] 顧立忠,蘇劍波.基于表觀的手勢識別及人基于表觀的手勢識別及人機(jī)交互研究[D].上海:上海交通大學(xué),2008.
[2] 孫超,馮志全,李揚(yáng),等.第5屆全國普適計(jì)算學(xué)術(shù)會議(PCC2010)論文集[C].河南:2010.
[3] 林水強(qiáng),吳亞東,陳永輝.基于幾何特征的手勢識別方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35(2):637-639.
[5] Blum H.Biological shape and visual science:Part I[J].Theoretical Biology,1973,38(2):205-287.
[6] 李平,李允俊.基于手勢識別算法的鼠標(biāo)終端[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(8):86
[7] Deval G.Patel.Point Pattern Matching Algorithm for Recognition of 36 ASL Gestures[J].International Journal of Science and Modern Engineering,2013,7(1):24-28.