汪西原,閆 輝
(寧夏大學(xué)物理電氣信息學(xué)院,寧夏銀川750021)
由于人體步態(tài)特征具有難以偽裝,正常情況下不易修改,識別時具有遠(yuǎn)距離非接觸,對系統(tǒng)分辨率要求低的特點(diǎn)而逐漸成為模式識別研究領(lǐng)域的一個重點(diǎn)。步態(tài)識別算法可分為基于模型(橢圓模型[1]、鐘擺模型[2]、三維模型[3]等)和基于特征兩種。由于運(yùn)動過程中步態(tài)特征的復(fù)雜性,基于模型的方法描述步態(tài)運(yùn)動具有一定的局限性?;谔卣鞯姆椒ㄈ珀悓?shí)等人[4]采用極直方圖的方法描述步態(tài)輪廓;Rahati等人[5]采用小波變換;馬勤勇等人[6]利用一幅步態(tài)輪廓圖提取三段步態(tài)輪廓線;楊旗等人[7]提出的動靜態(tài)信息融合及動態(tài)貝葉斯網(wǎng)絡(luò)的步態(tài)識別算法等。但是,當(dāng)人體目標(biāo)與攝像機(jī)在相對運(yùn)動過程中出現(xiàn)幾何變化(位置、尺度和方向)時,上述基于特征的方法無法獲得準(zhǔn)確的步態(tài)特征信息,因此識別的正確率會降低,而利用不變矩提取的特征對發(fā)生幾何變化的圖像也有很好的不變性,尤其可以很好地描述視頻序列中單幀人體形狀的步態(tài)特征,如林敏等人[8]提出了一種基于統(tǒng)一Hu矩和支持向量機(jī)的步態(tài)識別算法;張前進(jìn)等人[9]提出了基于Radon變換特征提取的步態(tài)識別;Xiao等人[10]提出了基于Zernike矩和BP神經(jīng)網(wǎng)絡(luò)的步態(tài)識別算法;Lu[11]利用偽Zernike矩聯(lián)合付立葉描述子和小波描述子并采用決策級融合的方法進(jìn)行步態(tài)特征識別。但是,這些基于不變矩的步態(tài)識別算法需要對視頻序列中檢測到的灰度目標(biāo)圖像進(jìn)行二值化和歸一化處理,之后再進(jìn)行不變性特征的提取,而二值化過程會造成很多細(xì)節(jié)與有用信息丟失,歸一化過程則會引入重采樣與重量化誤差,這必然導(dǎo)致算法識別率的降低。
為了克服上述不足,本文將基于Radon變換和解析Fourier-Mellin變換[12]的不變性特征提取算法應(yīng)用于步態(tài)識別。由于直接對灰度圖像進(jìn)行特征提取,沒有二值化和歸一化,因此得到的特征具有更多的細(xì)節(jié)信息,對原圖像有更好的描述能力。圖1和圖2為兩種算法實(shí)現(xiàn)框圖。
該算法首先對目標(biāo)灰度圖像利用Radon變換(見圖2)將原圖像的旋轉(zhuǎn)變化轉(zhuǎn)化到沿H方向平移的投影空間(見圖3),尺度變化轉(zhuǎn)換為在r軸的尺度與幅度變化,然后對Radon投影空間利用解析Fourier-Mellin變換進(jìn)一步變換,由此即可實(shí)現(xiàn)將Radon投影空間H方向的平移和r軸的尺度變化與幅度變化分別轉(zhuǎn)化為相位因子和幅度變化,最后即可通過定義一些具有旋轉(zhuǎn)與尺度不變性的函數(shù)提取步態(tài)特征,應(yīng)用分類算法實(shí)現(xiàn)分類識別。
圖3 f(x,y)的Radon變換
對于一個二維函數(shù)f(x,y),它的Radon變換就是該函數(shù)沿平面內(nèi)不同的直線的線積分,如圖3所示。其定義如下
對于圖像的幾何變換,Radon變換有以下性質(zhì):
1)平移性質(zhì)
2)旋轉(zhuǎn)性質(zhì)
3)尺度變換性質(zhì)
用極坐標(biāo)表示的情況下,二維函數(shù)g(r,θ)的解析Fourier-Mellin變換的定義式為
式中:s=σ-iu,u為實(shí)數(shù)變量,σ為大于0的實(shí)常數(shù),一般取值為0.5。因此式(5)可以寫為
本文對于步態(tài)的識別過程主要分為兩個步驟,首先是對視頻序列中檢測到的人體運(yùn)動目標(biāo)進(jìn)行步態(tài)周期的檢測并得到一個步態(tài)周期的關(guān)鍵幀,其次是利用不變性特征函數(shù)對得到的關(guān)鍵幀提取不變性特征并用K近鄰分類算法對特征進(jìn)行分類識別。
根據(jù)人體寬度變化分析步態(tài)周期是一種相對簡單的方法,人體下肢的寬度變化一般不會受到其他因素的影響,因此本文根據(jù)人體下肢區(qū)域?qū)挾葋矸治霾綉B(tài)周期。此處的下肢區(qū)域的高度指的是膝蓋到腳底的距離,這個距離既不會受到上肢的影響,也可以很好地反映步態(tài)周期的變化。需要說明的是,根據(jù)醫(yī)學(xué)對人體研究表明,膝蓋到腳底的高度約為人體高度的0.260倍,如圖4所示[13]。
在正常的行走狀態(tài)下,步態(tài)具有重復(fù)性,也就是說具有準(zhǔn)周期性。根據(jù)醫(yī)學(xué)上對步態(tài)周期的定義,如圖5所示,以右腳跟著地為起始點(diǎn),當(dāng)左腳跟著地時為半個周期,當(dāng)右腳跟再次著地時即為一個步態(tài)循環(huán)。因此,根據(jù)人體下肢的寬度變化就可以得到人體運(yùn)動的周期。
圖5 人體步態(tài)周期分析
由于已采用上述方法檢測到了一個運(yùn)動周期內(nèi)步態(tài)寬度的最大值和最小值,可以將這些極值幀作為關(guān)鍵幀,如果想得到更多的關(guān)鍵幀,可以在極值幀之間選取得到。
設(shè)圖像f(x,y)經(jīng)過尺度因子λ與角度旋轉(zhuǎn)φ變換后獲得的圖像為(x,y)表示,則由式(2)~式(4)可得(x,y)的Radon變換為
式中:P(r,θ)是函數(shù)f(x,y)的 Radon 變換。對P^(r,θ)進(jìn)行Fourier-Mellin變換后有
dr=λdτ ,dθ=dβ ,式(8)可變?yōu)?/p>
式中:M(u,k)為函數(shù)P(r,θ)的 Fourier-Mellin 變換。
由式(9)可以看出原圖像f(x,y)的旋轉(zhuǎn)和尺度變換經(jīng)過Radon變換和Fourier-Mellin變換后轉(zhuǎn)化為相位和幅度因子,由此可以定義函數(shù)
由式(9)和式(10)可得
由式(11)可知,函數(shù)Z(u,k)與原圖像的旋轉(zhuǎn)和尺度變換無關(guān),因此基于不變函數(shù)Z(u,k)提取旋轉(zhuǎn)和尺度變換后圖像的不變性特征如下
算法采用MATLAB2008編程進(jìn)行實(shí)驗(yàn)仿真。所采用的數(shù)據(jù)庫(CASIA步態(tài)數(shù)據(jù)庫)是由中科院自動化所提供,本實(shí)驗(yàn)從中分別選取了10個人和20個人,每個人有2個步態(tài)的視頻序列。每個人的一個步態(tài)視頻作為訓(xùn)練樣本,另一個作為測試樣本,分別采用Hu矩、Zernike矩和本文的不變矩進(jìn)行步態(tài)特征的提取和識別。此處本實(shí)驗(yàn)選取了1個步態(tài)周期內(nèi)的8幅關(guān)鍵幀圖像(如圖6所示)進(jìn)行步態(tài)特征的提取,其圖像和對應(yīng)的不變矩特征如表1~表3所示。
圖6 1個步態(tài)周期的關(guān)鍵幀圖像
表中F1,F(xiàn)2,…,F(xiàn)8表示圖6中從左至右每一個關(guān)鍵幀圖像,e,H,Z分別代表不同算法得到的矩特征。
表1 本文不變矩提取不變性特征得到的特征值
采用K近鄰算法分類得到的識別正確率如表4所示。由表4可以看出,在均采用K近鄰分類算法時,本文提出的步態(tài)特征提取算法的分類能力較好,有效解決了目前基于不變矩的步態(tài)特征提取算法需要對灰度圖像進(jìn)行二值化和歸一化的問題,克服了目前方法僅能對二值圖像提取步態(tài)特征的不足,同時,采用本文算法提取的步態(tài)特征的分類正確率遠(yuǎn)高于目前采用Hu矩和Zernike矩的方法,說明本文算法應(yīng)用于步態(tài)識別是可行且更有效的。
表2 Hu不變矩不變性特征得到的特征值
表3 Zernike不變矩不變性特征得到的特征值
表4 3種算法的分類正確率
本文提出了一種基于Radon變換和解析Fourier-Mellin變換的步態(tài)識別算法,該算法首先對灰度圖像進(jìn)行Radon變換,之后再進(jìn)一步進(jìn)行Fourier-Mellin變換,這樣就避免了目前基于不變矩的方法對灰度圖像二值化和歸一化時所造成的量化誤差和細(xì)節(jié)信息的丟失,因此,采用本文算法提取的特征更準(zhǔn)確地描述了步態(tài)信息,進(jìn)行步態(tài)識別有更高的識別率。但是,與目前成熟的指紋、虹膜等識別方法相比,本文算法的識別率還有待于進(jìn)一步提高,尤其是當(dāng)樣本數(shù)據(jù)增大時,識別率也明顯下降,下一步工作的研究重點(diǎn)是將本文算法提取的特征與顏色、紋理、人耳或人臉等一種或多種特征融合以提高算法識別率,同時考慮采用快速Fourier變換來提高算法執(zhí)行效率,使本文算法最終達(dá)到實(shí)際應(yīng)用的目的。
[1] XU JH,WANGC,LIJ,etal.Gait recognition based on key frame and ellipticalmodel[C]//Proc.2010 IEEE International Conference on Information and Automation(ICIA).Harbin,China:IEEE Press,2010:2483-2487.
[2] HEW H,LIP.Gait recognition using the temporal information of leg angles[C]//Proc.2010 3rd IEEE International Conference on Computer Science and Information Technology.Chengdu,China:IEEE Press,2010:78-83.
[3] JEGOON R,KAMATA S.Front view gait recognition using spherical spacemodelwith human point clouds[C]//Proc.2011 18th IEEE International Conference on Image Processing.Brussels,Belgium:IEEE Press,2011:3209-3212.
[4] CHEN S,GAO Y X.An invariant appearance model for gait recognition[C]//Proc.2007 IEEE International Conference on Multimedia and Expo.Beijing,China:IEEE Press,2007:1375-1378.
[5] RAHATI S,MORAVEJIAN R,KAXEMI F M.Gait recognition using wavelet transform[C]//Proc.the Fifth InternationalConferenceon Information Technology:New Generations.Las Vegas,USA:[s.n.],2008:932-936.
[6]馬勤勇,聶棟棟,王申康.基于主運(yùn)動輪廓線的步態(tài)表示與識別[J].自動化學(xué)報,2009,35(5):519-525.
[7]楊旗,薛定宇.動靜態(tài)信息融合及動態(tài)貝葉斯網(wǎng)絡(luò)的步態(tài)識別[J].中國圖象圖形學(xué)報,2012,17(7):783-790.
[8]林敏,吳清江.基于統(tǒng)一Hu和支持向量機(jī)的步態(tài)識別[J].微計算機(jī)信息,2010,26(13):197-199.
[9]張前進(jìn),徐素莉,孫炎增.基于Radon變換特征提取的步態(tài)識別[J].數(shù)據(jù)采集與處理,2010,25(2):268-272.
[10] LU JW,ZHANG E H.Gait recognition for human identification based on ICA and fuzzy SVM throughmultiple views fusion[J].Pattern Recognition Letters,2007,28(16):2401-2411.
[11] XIAO D G,YANG L.Gait recognition using zernike moments and BP neural network[C]//Proc.2008 IEEE International Conference on Networking,Sensing and Control.Sanya, China:IEEE Press,2008:418-423.
[12] WANG X,XIAOB,MA JF,etal.Scaling and rotation invariantanalysis approach to object recognition based on radon and Fourier-Mellin transforms[J].Pattern Recognition,2007,40(12):3503-3508.
[13]蘇開娜,劉玉棟,馬麗.身份識別中步態(tài)特征的提?。跩].北京工業(yè)大學(xué)學(xué)報,2005,31(4):388-393.