摘 要:伴隨著信息技術(shù)的快速發(fā)展,人體行為識(shí)別技術(shù)逐漸被引入到各領(lǐng)域中,如安防監(jiān)控、運(yùn)動(dòng)分析、醫(yī)學(xué)輔助診斷和智能人機(jī)交互等,而技術(shù)實(shí)現(xiàn)的關(guān)鍵在于借助相關(guān)的特征融合方法。文章對(duì)人體行為識(shí)別的相關(guān)技術(shù)以及興趣點(diǎn)提取方法、尺度混合特征模型與MKL方法的應(yīng)用進(jìn)行分析,以期對(duì)人體行為識(shí)別技術(shù)的發(fā)展起到推動(dòng)作用。
關(guān)鍵詞:人體行為識(shí)別;特征融合;興趣點(diǎn)提?。欢嗪藢W(xué)習(xí)
人體行為識(shí)別是近年來(lái)學(xué)術(shù)界研究的焦點(diǎn),因此有大量相關(guān)的識(shí)別方法和表達(dá)方法不斷涌現(xiàn)出來(lái),如行為表達(dá)方法中常見(jiàn)的局部時(shí)空特征,或于概率潛在語(yǔ)義分析模型中引入幾何信息等。值得注意的是,假若在高層語(yǔ)義環(huán)境下進(jìn)行人體行為分析,僅通過(guò)底層信息的獲取很難保證辨別力,這就要求將融合特征作為分析方案,通過(guò)高層特征信息的提取達(dá)到識(shí)別目標(biāo)。因此,本文對(duì)人體行為識(shí)別中特征融合方法的應(yīng)用分析,具有十分重要的意義。
1 人體行為識(shí)別相關(guān)技術(shù)分析
1.1 人體行為特征提取
關(guān)于人體行為特征提取,其目的在于服務(wù)于行為識(shí)別模型構(gòu)建,由于不同模型構(gòu)建在特征提取方式上有一定差異,所以需做好行為特征提取分析。常見(jiàn)的行為特征提取模型主要可細(xì)化為:(1)全局特征模型。該模型在檢測(cè)對(duì)象上以整個(gè)運(yùn)動(dòng)人體為主,又包括不同階段,如人體結(jié)構(gòu)模型、外觀模型與運(yùn)動(dòng)特征模型。其中在人體結(jié)構(gòu)模型上,強(qiáng)調(diào)檢測(cè)與跟蹤人體關(guān)鍵部位,通過(guò)參數(shù)化描述各部位姿態(tài);而外觀模型,要求在光流法或多幀差分法應(yīng)用下對(duì)人體行為區(qū)域檢測(cè),可獲得更多行為信息;運(yùn)動(dòng)特征模型,其可解決前兩種方法應(yīng)用下的計(jì)算復(fù)雜度高、過(guò)多依賴圖像處理等問(wèn)題,更注重借助運(yùn)動(dòng)時(shí)空興趣點(diǎn)分析。(2)局部特征模型。該模型下提取的人體行為識(shí)別,要求檢測(cè)與識(shí)別運(yùn)動(dòng)人體變化顯著的部位,包括腿、腳、膝蓋等,常見(jiàn)的方式為興趣點(diǎn)提取,獲取的行為識(shí)別效果較為理想。
1.2 人體行為特征融合
在人體行為特征融合方面,提取中既可從時(shí)域、空域上著手,同時(shí)也能在多傳感器應(yīng)用下進(jìn)行不同特征的獲取。具體表現(xiàn)為:(1)時(shí)域視角下的人體行為特征。其注重對(duì)人體相關(guān)的顏色、紋理、外形與輪廓特征提取,如輪廓方法、剪影方法等。(2)空域視角下的人體行為特征。該方法需對(duì)人體歷史信息、行為深度提取,可通過(guò)對(duì)運(yùn)動(dòng)興趣點(diǎn)周圍信息分析,實(shí)現(xiàn)人體細(xì)節(jié)特征信息獲取目標(biāo)。(3)人體行為多特征融合。這種方式需結(jié)合多種特征,如多底層特征融合、多渠道提取特征融合等,可將單一特征分析人體行為中的不足進(jìn)行彌補(bǔ)[1]。
1.3 人體行為特征識(shí)別
在人體行為信息提取中,需借助上述特征提取與特征融合方式,但在進(jìn)行行為所屬類別判斷中則需通過(guò)人體行為識(shí)別與分類實(shí)現(xiàn)。常見(jiàn)的識(shí)別方式主要以模板匹配、詞袋模型統(tǒng)計(jì)分類和狀態(tài)空間分類等方法為主。如模板匹配方法,亦可被稱之為直接分類方法,可借助近鄰分類器完成行為模式分類;而對(duì)于詞袋模型,側(cè)重于通過(guò)概率潛在語(yǔ)義分析模型,完成統(tǒng)計(jì)分類;另外,在狀態(tài)空間分類方法上,需對(duì)各靜態(tài)姿勢(shì)定義為狀態(tài),在切換狀態(tài)中形成概率關(guān)系,最終得到的聯(lián)合概率可作為分類的根據(jù)[2]。
2 人體行為識(shí)別中興趣點(diǎn)提取方法的運(yùn)用
2.1 興趣點(diǎn)提取
興趣點(diǎn)識(shí)別方法應(yīng)用下,主要利用興趣點(diǎn)局部特征,如肢體部位便可作為某一興趣點(diǎn),而不同行為動(dòng)作在興趣點(diǎn)上有一定差異,可利用這些差異完成人體行為識(shí)別過(guò)程。具體進(jìn)行興趣點(diǎn)提取中,本文主要結(jié)合相應(yīng)的時(shí)空興趣點(diǎn)檢測(cè)方法,具體表現(xiàn)在:(1)Harris 3D檢測(cè)器。由Laptev提出,應(yīng)用原理表現(xiàn)為在Harris算子應(yīng)用下,借助自相關(guān)函數(shù),使圖像某一像素點(diǎn)自相關(guān)矩陣被給出,這樣所得出的特征值便可用于函數(shù)一階曲率推測(cè),若函數(shù)中X,Y方向都有較高的曲率值,說(shuō)明該特征值為興趣點(diǎn)。(2)Dollar檢測(cè)器。作為時(shí)空興趣點(diǎn)檢測(cè)方法,可彌補(bǔ)Harris 3D檢測(cè)方法應(yīng)用下的可靠興趣點(diǎn)數(shù)量不足情況,操作流程體現(xiàn)為時(shí)間域上Gabor濾波器的構(gòu)建、響應(yīng)函數(shù)的構(gòu)造、結(jié)合響應(yīng)值進(jìn)行時(shí)空興趣點(diǎn)的篩選。(3)Bregonzio檢測(cè)器。由于Dollar檢測(cè)器應(yīng)用中有背景噪聲、人體遮擋等影響,所獲取的結(jié)果易出現(xiàn)偽興趣點(diǎn),此時(shí)便引入Bregonzio檢測(cè)器,操作中能夠進(jìn)行噪聲處理,得到可靠的興趣點(diǎn)[3]。
2.2 特征描述
在興趣點(diǎn)行為識(shí)別方法中,對(duì)于人體行為特征描述,可從3方面表現(xiàn)出來(lái):(1)以外觀形狀特征進(jìn)行描述。該方法在既往研究資料中多有體現(xiàn),強(qiáng)調(diào)對(duì)人體的外觀表現(xiàn)進(jìn)行描述,原理在于以人的身體軀干比例進(jìn)行行為分析,如跑步行為、揮手行為,兩種行為所展示的長(zhǎng)寬比例關(guān)系有明顯差異,利用該差異可達(dá)到特征描述目標(biāo);(2)運(yùn)動(dòng)特征描述。這種方式主要借助運(yùn)動(dòng)信息進(jìn)行特征描述,如運(yùn)動(dòng)速率、運(yùn)動(dòng)軌跡等;(3)多特征融合描述。該描述方法在原理上表現(xiàn)為利用不同特征相互補(bǔ)充,如將人體外觀姿態(tài)、人體運(yùn)動(dòng)方向、人體運(yùn)動(dòng)軌跡等融合,這樣可對(duì)特征間的不足進(jìn)行彌補(bǔ)。
2.3 行為識(shí)別
在興趣點(diǎn)行為識(shí)別中,采用的人體行為識(shí)別分類方法,通常體現(xiàn)為直接分類與詞袋模型兩種方法。以直接分類識(shí)別方法為例,一般借助K-最近鄰分類器(K-Nearest Neighbor,KNN)實(shí)現(xiàn),或引入其他相關(guān)向量機(jī)(Relevance Vector Machine,RVM)、支持向量機(jī)(Support Vector Machine,SVM)。而詞袋模型,最初應(yīng)用中體現(xiàn)在文本分類上,將人體行為視頻作為文本,這樣整個(gè)文本所展示的行為便可被識(shí)別,識(shí)別效果明顯。
3 人體行為識(shí)別中尺度混合特征模型的運(yùn)用
盡管興趣點(diǎn)識(shí)別方法應(yīng)用下可獲取顯著的識(shí)別效果,但需注意這些方法應(yīng)用中所采用的詞袋模型等,強(qiáng)調(diào)對(duì)局部時(shí)空描述符的辨別力依賴,其余如興趣點(diǎn)分布情況被忽略,這樣一旦其中有潛在價(jià)值的興趣點(diǎn)被遺忘,便會(huì)影響平滑運(yùn)動(dòng)信息的捕捉。對(duì)此,可考慮引入尺度混合特征融合應(yīng)用下進(jìn)行人體行為識(shí)別。
3.1 尺度混合特征融合
該方法應(yīng)用中,所考慮的因素以運(yùn)動(dòng)周期、運(yùn)動(dòng)延時(shí)為主,特征描述中除對(duì)單幀興趣點(diǎn)觀察外,也結(jié)合多幀興趣點(diǎn),這樣可使動(dòng)作延時(shí)、運(yùn)動(dòng)周期辨識(shí)度更加清晰,其中的幀便可稱之為尺度。對(duì)于尺度混合特征融合,其實(shí)現(xiàn)的流程表現(xiàn)為:輸入數(shù)據(jù);全局外觀比例、多尺度興趣點(diǎn)以及相鄰幀速度獲??;特征融合;直接分類;分類結(jié)果輸出。
3.2 尺度混合特征提取
尺度混合特征融合提取中,需配以相應(yīng)的提取算法,以SV-PDI尺度混合特征提取算法為例,具體步驟為:(1)將Bregonzio時(shí)空興趣點(diǎn)檢測(cè)器引入,計(jì)算每幀圖像;(2)以人體行為區(qū)域、興趣點(diǎn)位置作為依據(jù),進(jìn)行人體最小外接矩形、興趣點(diǎn)最小外接矩形的計(jì)算;(3)在尺度大小選定后,對(duì)各尺度下興趣點(diǎn)外接矩形相關(guān)特征,如密度、速度與形狀進(jìn)行計(jì)算;(4)做V-PDI值、多尺度下特征值計(jì)算,得出尺度特征結(jié)果,最后將所有結(jié)果合并并更新,完成提取過(guò)程。
4 人體行為識(shí)別中MKL方法的運(yùn)用
除興趣點(diǎn)、尺度混合特征方法為,人體行為識(shí)別中也可引入多核學(xué)習(xí)(Multiple Kernel Learning ,MKL)方法,其應(yīng)用下旨在支持向量機(jī)分類中函數(shù)最優(yōu)組合選擇問(wèn)題得以解決。從該方法應(yīng)用原理看,主要表現(xiàn)為在不同核函數(shù)應(yīng)用下確定權(quán)重,在此基礎(chǔ)上做組合分類,考慮到核函數(shù)線性組合下,操作中有信息丟失可能,所以應(yīng)以多核線性組合方式為主。對(duì)于MKL算法,在流程上表現(xiàn)為輸入數(shù)據(jù)、特征空間與核空間數(shù)據(jù)獲取、合成核空間中的加權(quán)求和核、SVM分類器分類以及分類結(jié)果輸出。
5 結(jié)語(yǔ)
人體行為識(shí)別技術(shù)在當(dāng)前許多生活領(lǐng)域中應(yīng)用都極為廣泛,但其實(shí)現(xiàn)卻需依托于特征融合。本文在明確人體行為識(shí)別相關(guān)技術(shù)的基礎(chǔ)上,提出基于興趣點(diǎn)、尺度混合特征以及MKL等方法,可被應(yīng)用于人體行為識(shí)別中,對(duì)人體行為識(shí)別技術(shù)的發(fā)展起到推動(dòng)作用。
作者簡(jiǎn)介:趙雄偉(1991— ),男,河北石家莊,碩士;研究方向:模式識(shí)別與人工智能方向。
[參考文獻(xiàn)]
[1]方達(dá).人體行為特征融合與行為識(shí)別研究[D].南京:南京師范大學(xué),2016.
[2]吳冬梅,謝金壯,王靜.基于多特征融合的人體行為識(shí)別[J].計(jì)算機(jī)應(yīng)用與軟件,2015(11):171-175.
[3]邵延華,郭永彩,高潮.基于特征融合的人體行為識(shí)別[J].光電子·激光,2014(9):1818-1823.
Abstract: With the rapid development of information technology, human behavior recognition technology has been gradually introduced into various fields, such as security monitoring, motion analysis, medical assistant diagnosis and intelligent human-computer interaction, and the key to technology realization is to use the corresponding feature fusion method. This paper analyzed the related technology of human behavior recognition and the method of interest point extraction, scale mixed feature model and application of MKL, with a view to promot the development of human behavior recognition technology.
Key words: human behavior recognition; feature fusion; interest point extraction; multiple kernel learning