郇 戰(zhàn), 萬彩艷, 梁久禎, 李 晨
(常州大學(xué) 信息科學(xué)與工程學(xué)院 江蘇 常州 213164)
人類的步態(tài)包含非常獨(dú)特的模式,可用于身份的識別和驗(yàn)證.加速度傳感器以其低廉的價(jià)格、較高的靈敏度和較小的體積被廣泛應(yīng)用于智能手機(jī)中.其具有的獨(dú)特優(yōu)勢使研究人員認(rèn)識到它在基于步態(tài)身份識別領(lǐng)域的應(yīng)用前景.基于步態(tài)的身份識別主要難點(diǎn)和重點(diǎn)集中在特征提取和分類識別方法上,特征提取是為了從步態(tài)加速度傳感器信號中提取可以表征人體身份的特征向量,是基于智能手機(jī)傳感器用戶身份識別技術(shù)中的關(guān)鍵所在,其效果會(huì)直接影響分類器的識別率.其中,基于加速度信號特征提取的方法可以分為時(shí)域分析法、頻域分析法和時(shí)頻域分析法.文獻(xiàn)[1-3]中只在時(shí)域階段提取了簡單特征,雖然計(jì)算量小,但是所取得的識別率并不是很高.文獻(xiàn)[4-6]添加了頻域的特征,其識別率得到了很大的提高,但是整體的特征維數(shù)較高,需要對特征進(jìn)行降維或優(yōu)化處理,其處理效果又直接影響最終的結(jié)果.文獻(xiàn)[7]引入了時(shí)-頻分析方法,能夠在時(shí)間和頻率兩個(gè)空間內(nèi)更好地觀察信息特性,但冗余度較大.隨著基于加速度傳感器步態(tài)身份識別研究的不斷深入,研究人員不斷嘗試通過提取新的特征來提高身份識別率.
傅里葉描述子[8-9]是一種新型的描述圖像特征的數(shù)學(xué)方法,已成功運(yùn)用于圖形圖像領(lǐng)域中的曲線軌跡形狀匹配.因此,可以根據(jù)步態(tài)加速度數(shù)據(jù)在時(shí)域的曲線圖,將步態(tài)身份識別問題轉(zhuǎn)換為軌跡曲線形狀的匹配問題.從圖像學(xué)角度出發(fā),本文利用傅里葉描述子來描述步態(tài)曲線的較粗輪廓的全局軌跡曲線特征,并提出方向角描述子的概念來進(jìn)一步刻畫步態(tài)曲線細(xì)致的局部軌跡曲線特征,最后將二者結(jié)合完成步態(tài)軌跡曲線的匹配.結(jié)果表明,本文所提出的步態(tài)軌跡曲線特征能夠很好地用于身份識別.本文在步態(tài)身份識別中的主要工作如下.
1) 提出將步態(tài)身份識別問題轉(zhuǎn)換為步態(tài)加速度數(shù)據(jù)的平面軌跡曲線匹配問題.
2) 傅里葉描述子是粗輪廓的特征,在局部細(xì)節(jié)特征方面描述不足,本文提出用方向角描述子來描述曲線的局部軌跡曲線特征.
3) 軌跡曲線特征不同于傳統(tǒng)的時(shí)域統(tǒng)計(jì)特征,本文將兩者相結(jié)合取得了較高的識別率.
觀察步態(tài)加速度數(shù)據(jù)在時(shí)域上的曲線形狀,發(fā)現(xiàn)同一個(gè)人的步態(tài)曲線具有較大的相似性,而不同人的步態(tài)曲線具有較大的差異性.之前的身份識別研究工作中,大多數(shù)方法都是直接從步態(tài)數(shù)據(jù)本身出發(fā).對于最能反映步態(tài)曲線的形狀特征卻沒有深入的研究,事實(shí)上,形狀是最能反映其變化的特征.因此,本文從圖像學(xué)形狀角度出發(fā),根據(jù)步態(tài)軌跡曲線特征來完成身份識別.
已知步態(tài)數(shù)據(jù)是時(shí)變的周期信號,為了減少計(jì)算量,本文只考慮步態(tài)的單個(gè)周期.具體周期分割如圖1(a)所示,圖1(a)是以極小值點(diǎn)為周期的分割點(diǎn).在實(shí)際數(shù)據(jù)采集中,步態(tài)序列包含多個(gè)周期,在開展后期工作前,需要提取單個(gè)標(biāo)準(zhǔn)周期,使得該周期能夠表征整個(gè)步態(tài)特征.本文參照文獻(xiàn)[3]的方法提取周期,然后使用平均周期作為標(biāo)準(zhǔn)周期,如圖1(b)所示.圖1(b)表示多個(gè)周期疊加的箱線圖,黑實(shí)線表示平均周期.
本文提出將軌跡曲線特征和統(tǒng)計(jì)特征相結(jié)合用于身份識別.因此,統(tǒng)計(jì)特征的選擇至關(guān)重要.而大多數(shù)傳統(tǒng)的統(tǒng)計(jì)特征方法是直接從時(shí)域或頻域上提取諸如均值、標(biāo)準(zhǔn)差、最大值、最小值、偏度、峰度、四分位差、峰值數(shù)量、均方根等特征值,再通過特征值進(jìn)行身份識別.實(shí)際上不是選取的特征越多,識別率就越高.所以,本文采用了一種自底向上、逐步合并的特征聚合方法[10].
人在行走過程中的步態(tài)曲線反映了人在行走過程中的步態(tài)特征,這些步態(tài)曲線更好地展現(xiàn)了每個(gè)人的行走姿勢,并且能夠很好地表征步態(tài)數(shù)據(jù)的結(jié)構(gòu)、軌跡形狀等一些重要的信息.所以可將不同人員的步態(tài)軌跡曲線特征作為判別一個(gè)人身份識別的條件之一.
1.3.1非閉合步態(tài)曲線的閉合化操作 步態(tài)時(shí)序曲線是一條未封閉的曲線,而傅里葉描述子不能對非閉合曲線輪廓特征進(jìn)行描述,因?yàn)榉情]合曲線首尾兩點(diǎn)信號不連續(xù),會(huì)導(dǎo)致信號不連續(xù).為了能夠使用傅里葉形狀描述子模型進(jìn)行曲線輪廓提取,本文將非閉合步態(tài)曲線閉合化操作.對首尾點(diǎn)做連線并以此連線為軸進(jìn)行鏡像處理,構(gòu)成封閉的曲線,鏡像部分與原曲線形狀完全相同,可視為原曲線的對偶形狀(首尾曲線坐標(biāo)不是原點(diǎn)的連線,而是曲線首尾坐標(biāo)的連線).如圖2所示,非閉合步態(tài)曲線經(jīng)過鏡像處理形成一條封閉的步態(tài)曲線.
圖1 標(biāo)準(zhǔn)步態(tài)周期提取Fig.1 Standard gait cycle extraction
圖2 步態(tài)曲線封閉處理Fig.2 Closed treatment of gait curve
1.3.2傅里葉形狀描述子 傅里葉描述子是一種基于頻域變換的形狀表示算法.經(jīng)過大量的實(shí)驗(yàn)研究表明,傅里葉描述子對軌跡曲線特征有很強(qiáng)的描述和識別的能力,并且計(jì)算簡單、運(yùn)行速度快、精度較高.首先將輪廓曲線表示成1個(gè)一維的封閉的曲線函數(shù),可以表示為以周長為周期的函數(shù).然后對此封閉的輪廓曲線函數(shù)進(jìn)行傅里葉變換,傅里葉變換中的一系列的級數(shù)被稱為傅里葉形狀描述子.
假設(shè)在xy平面上有N個(gè)坐標(biāo)點(diǎn),P0,P1,P2,…,PN-1為該封閉曲線上的點(diǎn),以P0為起始點(diǎn),PN-1為結(jié)束點(diǎn)(P0=PN-1),以順時(shí)針方向經(jīng)過P0(x0,y0),P1(x1,y1),…,PN-1(xn-1,yn-1)后可回到原始位置,并可反復(fù)循環(huán).設(shè)x(k)=xk,y(k)=yk,所以一條封閉曲線的邊界點(diǎn)可表示為Z(k)=(x(k),y(k)),k=0,1,…,N-1,每一個(gè)坐標(biāo)又可以處理成復(fù)數(shù)的形式Z(k)=X(k)+jY(k),k=0,1,2,…,N-1,X(k)為復(fù)數(shù)坐標(biāo)的實(shí)部;Y(k)為復(fù)數(shù)坐標(biāo)的虛部.
傅里葉級數(shù)的各項(xiàng)系數(shù)Cn為復(fù)數(shù),模向量C=(‖c1‖,‖c2‖,…,‖ck‖),向量C與形狀的尺度、方向和選擇的起始點(diǎn)有關(guān),為了使其具有選擇、平移和尺度的不變性,則需要對C進(jìn)行歸一化處理,得到傅里葉形狀描述子.歸一化后的傅里葉形狀描述子為d(i)=‖c(i)‖/‖c(1)‖,i=1,2,…,K.
由于步態(tài)軌跡曲線的全局特征大都集中在低頻部分,而高頻部分體現(xiàn)步態(tài)軌跡曲線的細(xì)節(jié)特征.系數(shù)選擇得越多,變換后的數(shù)據(jù)與原數(shù)據(jù)的誤差越小,但本文的目的在于分類識別,而不在于精確的原數(shù)據(jù)重構(gòu),而且選擇的系數(shù)越多并不代表識別的效果越好.根據(jù)實(shí)驗(yàn),論文選取前15個(gè)低頻傅里葉系數(shù),它們對應(yīng)著目標(biāo)的總體軌跡形狀特征,用FD表示此部分提取的特征集合.
其中:N表示第N個(gè)周期;FD表示傅里葉描述子的形狀輪廓特征;AD表示角度變化特征.
隨機(jī)森林算法是采用自主聚類把多個(gè)不同的決策樹集成為一個(gè)學(xué)習(xí)機(jī)的集成學(xué)習(xí)方法.Bagging方法從全部的訓(xùn)練樣本集合中通過可重復(fù)采樣技術(shù)得到不同的訓(xùn)練子集,利用隨機(jī)產(chǎn)生的多個(gè)訓(xùn)練樣本子集訓(xùn)練模型,生成多個(gè)相應(yīng)的決策樹.在分類識別時(shí),對每個(gè)決策樹的分類結(jié)果進(jìn)行投票,取票數(shù)最多的類別作為測試數(shù)據(jù)的最終類別[11].本文提出的基于步態(tài)特征的身份識別方法的框架結(jié)構(gòu)如圖4所示.該方法包括兩個(gè)階段:訓(xùn)練階段和測試階段.在訓(xùn)練階段,將步態(tài)的軌跡曲線特征用訓(xùn)練隨機(jī)森林分類器進(jìn)行訓(xùn)練,產(chǎn)生訓(xùn)練模型;在測試階段,對測試數(shù)據(jù)獲取軌跡曲線特征后,基于訓(xùn)練階段產(chǎn)生的訓(xùn)練模型利用測試隨機(jī)森林分類器通過投票產(chǎn)生分類結(jié)果.
圖3 方向角描述子Fig.3 Direction angle descriptor
圖4 基于隨機(jī)森林的步態(tài)識別方法框架Fig.4 Gait recognition method framework based on random forest
仿真設(shè)置:選用三星Note II 手機(jī)采集加速度步態(tài)數(shù)據(jù),內(nèi)置傳感器的采樣數(shù)據(jù)頻率為100 Hz,以Python 2.7 作為仿真平臺(tái),硬件平臺(tái)處理器為Intel Core i5 CPU,2.20 GHz,內(nèi)存4 GB,操作系統(tǒng)環(huán)境為Windows 8.1,64位.采集40名健康志愿者的原始加速度數(shù)據(jù),平均年齡為23~26歲,身高為155~185 cm.全體志愿者將設(shè)備放置在褲子前面的右側(cè)口袋中,并且手機(jī)的屏幕朝外.以正常速度在平地上行走大約200 m,對每人采集數(shù)據(jù)30次.
本文參照文獻(xiàn)[12]使用十折交叉驗(yàn)證,將數(shù)據(jù)集進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為測試集.通過4組實(shí)驗(yàn)對本文的方法進(jìn)行驗(yàn)證.
3.2.1第1組實(shí)驗(yàn) 為了證明軌跡曲線特征(傅里葉描述子、角度描述子)的有效性及魯棒性.分別在4組不同的數(shù)據(jù)集上進(jìn)行驗(yàn)證,結(jié)果如表1所示.分別使用傅里葉描述子和角度描述子作為特征在4組不同的數(shù)據(jù)集上進(jìn)行驗(yàn)證.實(shí)驗(yàn)的正確識別率都不是很高,主要因?yàn)椴綉B(tài)軌跡曲線并不是穩(wěn)定不變的,利用軌跡曲線形狀進(jìn)行匹配識別很大程度上受到曲線本身的限制,但依舊可以驗(yàn)證使用軌跡曲線特征用于身份識別的有效性及強(qiáng)魯棒性.
表1 不同數(shù)據(jù)集上軌跡曲線特征的驗(yàn)證
3.2.2第2組實(shí)驗(yàn) 為進(jìn)一步提高識別率,本文將軌跡曲線特征和統(tǒng)計(jì)特征相結(jié)合.提取的統(tǒng)計(jì)特征[2-4,7-14]以及選取的幾種特征組合如表2所示.
表2 常見特征及標(biāo)號
注:1~21為時(shí)域特征,22、23為頻域特征.
在步態(tài)識別中使用的步態(tài)特征大都基于時(shí)域或頻域以及二者結(jié)合,該類特征提取方便,計(jì)算簡單.同時(shí)根據(jù)表3發(fā)現(xiàn),不是提取的特征越多分類的效果就越好,從中選取有效的特征至關(guān)重要.因此,本文使用1.2中的特征提取方法從表2中提取有效的統(tǒng)計(jì)特征,結(jié)果如表4所示.
表3 提取的特征值及識別率
表4 隨機(jī)森林算法的特征選擇過程表
由表4可知:選取1,2,3,5,6,7,8,9,13,15特征時(shí)取得的分類識別率最高,達(dá)到88.40%.因此本文選取上述特征作為統(tǒng)計(jì)特征.
3.2.3第3組實(shí)驗(yàn) 根據(jù)第1組的軌跡曲線特征,第2組的統(tǒng)計(jì)特征,該部分實(shí)驗(yàn)用于驗(yàn)證軌跡曲線特征及組合特征的識別率(本文使用表1中的數(shù)據(jù)集2,采用十折交叉驗(yàn)證).結(jié)果如表5所示.單獨(dú)使用其中任一軌跡曲線特征,正確識別率不是很高,將兩種特征相結(jié)合能有效地提升正確識別率.但軌跡曲線特征不同于傳統(tǒng)的時(shí)域統(tǒng)計(jì)特征,其性能會(huì)受到曲線自身特性的制約.因此,本文將二者相結(jié)合,識別率提升近2%.
3.2.4第4組實(shí)驗(yàn) 為了驗(yàn)證本文所用方法的有效性,將其與現(xiàn)有的幾種方法進(jìn)行對比,根據(jù)實(shí)驗(yàn)結(jié)果可知,文獻(xiàn)[2-3,5-7]使用傳統(tǒng)的統(tǒng)計(jì)特征用于分類識別,所得到的最高識別準(zhǔn)確率為93.87%.而本文使用的軌跡曲線特征用于分類識別,得到的識別率為95.60%,在分類識別率上提高了近2%,說明本文使用的軌跡曲線特征能夠有效地用于身份識別,但步態(tài)軌跡曲線特征也受到曲線自身的制約.將步態(tài)軌跡曲線特征和統(tǒng)計(jì)特征進(jìn)行融合,融合后的特征可以進(jìn)一步提高人體身份識別率,識別率達(dá)到97.10%.
基于手機(jī)加速度傳感器的步態(tài)特征身份識別是近幾年開始的身份識別方法.一般都是從時(shí)、頻域提取的統(tǒng)計(jì)特征用于分類識別,前人在統(tǒng)計(jì)特征值方面的研究已經(jīng)較為成熟,想要從中提取新的特征值較為困難.與傳統(tǒng)的統(tǒng)計(jì)特征不同,本文從圖像學(xué)軌跡形狀角度出發(fā),根據(jù)步態(tài)的軌跡曲線特征來完成身份識別.針對方向角描述子缺乏整體方面的描述以及傅里葉描述子在局部描述中的欠缺,本文將這2種描述子相結(jié)合作為一種步態(tài)軌跡曲線特征.實(shí)驗(yàn)結(jié)果表明,相對于單獨(dú)使用方向角描述子和傅里葉描述子,這是一種更為有效的步態(tài)軌跡曲線特征.軌跡曲線特征不同于傳統(tǒng)的時(shí)域統(tǒng)計(jì)特征,本文將二者相結(jié)合取得了較高的識別率.同時(shí)本文也存在一些問題,如僅考慮了正常步行時(shí)的步態(tài)曲線,存在局限性.下一步需要對跑、上、下樓梯等多種情形下的步態(tài)曲線分析,同時(shí)也需要考慮手機(jī)放置對識別率的影響.