国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于動(dòng)作
——身份模型的動(dòng)作分類

2014-03-25 10:22:46劉碩明劉
中國新技術(shù)新產(chǎn)品 2014年8期
關(guān)鍵詞:時(shí)空身份聚類

劉碩明劉 佳

(1.武警北京總隊(duì)醫(yī)院信息科,北京 100000;2.武警工程大學(xué)電子技術(shù)系,陜西 西安 710086)

基于動(dòng)作
——身份模型的動(dòng)作分類

劉碩明1劉 佳2

(1.武警北京總隊(duì)醫(yī)院信息科,北京 100000;2.武警工程大學(xué)電子技術(shù)系,陜西 西安 710086)

早期動(dòng)作識(shí)別的研究主要關(guān)注在簡單背景及可控環(huán)境下單個(gè)人體動(dòng)作的分類從而忽略了人的身份信息。本文主提出如何同時(shí)識(shí)別動(dòng)作和身份。提出時(shí)空興趣點(diǎn)不僅僅刻畫了動(dòng)作的時(shí)空屬性,在采取不同的描述算子的情況下,它也能反映出關(guān)于動(dòng)作執(zhí)行人的身份信息。實(shí)驗(yàn)的結(jié)果驗(yàn)證了本文的想法。

動(dòng)作識(shí)別;身份識(shí)別;碼書;主題模型

1 概述

絕大多數(shù)用于識(shí)別的方法中,僅僅存在一種視覺碼書。本文提出利用兩種碼書來進(jìn)行視頻表示。具體來說,用動(dòng)作碼書來表示動(dòng)作,而用作者碼書來表示身份?;舅枷腩愃朴谖恼碌膬?nèi)容用主題來表示,而寫文章的人用作者來表示。本文認(rèn)為時(shí)空興趣點(diǎn)不僅僅刻畫了動(dòng)作的時(shí)空屬性,在采取不同的描述算子的情況下,它也能反映出關(guān)于動(dòng)作執(zhí)行人的身份信息。實(shí)驗(yàn)的結(jié)果驗(yàn)證了本文的想法。已經(jīng)有一些文獻(xiàn)致力于同時(shí)進(jìn)行動(dòng)作識(shí)別和身份驗(yàn)證。例如文獻(xiàn)[1,2]。

2 動(dòng)作身份模型

1)識(shí)別框架

基本框架如下:首先,利用時(shí)空興趣點(diǎn)檢測器提取局部時(shí)空點(diǎn)區(qū)域,然后分別對動(dòng)作和身份兩種問題,提取不同的局部描述子,接著利用聚類的方法得到兩種碼書:動(dòng)作碼書和作者碼書。利用LDA和AM進(jìn)行模型參數(shù)的學(xué)習(xí)和推斷。

2)視頻表示及碼書

文中利用Dollar[3]提出的時(shí)空檢測器進(jìn)行興趣點(diǎn)的檢測,它能產(chǎn)生穩(wěn)健的時(shí)空點(diǎn),給定一組時(shí)空興趣點(diǎn)的描述子后,建立了兩種類型的碼書,分別用來進(jìn)行動(dòng)作信息的表示和身份信息的表示。首先為了學(xué)習(xí)得到碼書中的詞項(xiàng),首先將所有訓(xùn)練視頻中的時(shí)空興趣描述子進(jìn)行聚類,本文采用K均值聚類的方法,每一個(gè)聚類中心對應(yīng)碼書(動(dòng)作碼書和身份碼書)中的一個(gè)詞項(xiàng)。

3)動(dòng)作-身份模型

本文提出的動(dòng)作身份模型是一個(gè)概率主題模型,因此可用圖模型的方法表示,如圖1所示。

圖1 動(dòng)作-身份模型的圖模型表示

圖3 KTH數(shù)據(jù)庫上的混淆矩陣結(jié)果

其中ad表示身份信息,w1和w2分別表示動(dòng)作碼書和身份碼書中的單詞項(xiàng)。Nd1和Nd2分別表示動(dòng)作單詞和身份單詞的個(gè)數(shù),其余變量為隱含變量或模型參數(shù)。在這個(gè)生成模型中包含了兩種類型的碼書,w1和w2是分別來自動(dòng)作碼書和身份碼書中的視覺詞。 實(shí)際上,這個(gè)包含兩種碼書的動(dòng)作身份模型正是LDA模型[4]和作者模型[5]的組合。在動(dòng)作模型和身份模型相對獨(dú)立時(shí),可以將動(dòng)作模型和身份模型分開進(jìn)行學(xué)習(xí)和推斷。盡管w1和w2來自不同的描述子,但他們都對應(yīng)相同的時(shí)空點(diǎn)位置,只是在這個(gè)時(shí)空點(diǎn)上提取的特征不同。

3 實(shí)驗(yàn)及結(jié)果分析

本文在KTH 數(shù)據(jù)庫上進(jìn)行了測試。通過利用時(shí)空興趣點(diǎn)局部特征以及采用隱主題模型進(jìn)行動(dòng)作身份分類,能夠有效的克服這些因素的影響。實(shí)驗(yàn)結(jié)果表明本文的方法不僅能夠?qū)?dòng)作類別和位置進(jìn)行識(shí)別,同時(shí)還能給出關(guān)于身份的信息。平均識(shí)別率的混淆矩陣如圖3所示。6個(gè)主題的LDA模型對應(yīng)的混淆矩陣如圖3 (a)所示,這里采用的動(dòng)作碼書的大小為1000。關(guān)于身份模型的25類的混淆矩陣如圖3 (b)所示,這里作者碼書的大小也是1000。從圖中可以看出,對于身份的識(shí)別具有一定的可判別性。

(a)動(dòng)作分類的結(jié)果(b)身份的分類結(jié)果平均分類正確率(54.6%)。

實(shí)驗(yàn)結(jié)果表明本文的方法不僅能夠?qū)?dòng)作類別和位置進(jìn)行識(shí)別,同時(shí)還能給出關(guān)于身份的信息。

結(jié)語

本文在時(shí)空興趣點(diǎn)的基礎(chǔ)上,提出了一種動(dòng)作身份模型用來識(shí)別動(dòng)作的類型、位置以及動(dòng)作執(zhí)行人的身份。文中將動(dòng)作身份模型在三種數(shù)據(jù)庫上進(jìn)行了測試,驗(yàn)證了該方法的有效性。

[1]Fabio, C. Using bilinear models for viewinvariant action and identity recognition. in CVPR. 2006.

[2].Jack M.. Multifactor Gaussian process models for style-content separation. In ICML. 2007. Corvallis.

[3] Dollar, , Behavior recognition via sparse spatio-temporal features. IEEE Workshop on VSPETS, 2005: p. 1-8.

[4] Blei, D.M., Latent Dirichlet allocation, In JMLR, 2003. 3(4-5): p. 993-1022.

[5] M. Rosen-Zvi, The author-topic model for authors and documents. in Conference on UAI. 2004.

TP915

A

猜你喜歡
時(shí)空身份聚類
跨越時(shí)空的相遇
鏡中的時(shí)空穿梭
玩一次時(shí)空大“穿越”
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
跟蹤導(dǎo)練(三)(5)
他們的另一個(gè)身份,你知道嗎
時(shí)空之門
基于改進(jìn)的遺傳算法的模糊聚類算法
互換身份
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
青海省| 镶黄旗| 宁明县| 定州市| 河北区| 襄樊市| 祁门县| 清徐县| 筠连县| 呼和浩特市| 金塔县| 宁乡县| 嘉峪关市| 集安市| 伊川县| 长阳| 卓资县| 托克托县| 武安市| 石河子市| 曲阳县| 博客| 宁都县| 衡水市| 米泉市| 水城县| 三明市| 普陀区| 景宁| 湖北省| 石家庄市| 洪雅县| 舒兰市| 冕宁县| 南涧| 怀远县| 蒙自县| 微博| 临西县| 安国市| 莆田市|