吳建寧 伍 濱
(福建師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福州 350007)
當(dāng)前,老年人跌倒的發(fā)生率高,已成為老年人致傷、致殘、甚至死亡的主要原因之一。如何有效預(yù)防老年人跌倒,已成為眾多學(xué)者探討和關(guān)注的熱點(diǎn)問(wèn)題[1]。相關(guān)研究表明,人體步態(tài)(人體行走時(shí)的方式或姿態(tài))與人體解剖結(jié)構(gòu)、神經(jīng)生理功能、運(yùn)動(dòng)控制能力等因素密切相關(guān),在某種程度上反映人體行走功能的狀況。特別在衰老期間,老年人受下肢骨骼肌肉功能下降、下肢關(guān)節(jié)柔韌性降低、前庭功能和平衡能力下降等生理因素的影響,其行走時(shí)步態(tài)功能下降,產(chǎn)生不穩(wěn)定等危險(xiǎn)步態(tài),增大了他們跌倒風(fēng)險(xiǎn)。及早、準(zhǔn)確地量化評(píng)價(jià)老年人步態(tài),可有效降低老年人跌倒的風(fēng)險(xiǎn)[2-3]。
量化評(píng)價(jià)老年人步態(tài)變化的相關(guān)研究在生物力學(xué)等相關(guān)領(lǐng)域較早開(kāi)展,并得到高度重視和廣泛關(guān)注[4]。早期,相關(guān)學(xué)者運(yùn)用步態(tài)分析方法,評(píng)價(jià)青年人和老年人在步速、步頻、下肢關(guān)節(jié)角度變化范圍及足-地反作用力等步態(tài)特征參數(shù)的差異,量化評(píng)價(jià)人體步態(tài)是否轉(zhuǎn)入老年人步態(tài)[4-5]。隨著步態(tài)分析系統(tǒng)技術(shù)和數(shù)據(jù)處理技術(shù)的快速發(fā)展,眾多學(xué)者嘗試將先進(jìn)的數(shù)據(jù)處理技術(shù)用于各類(lèi)步態(tài)數(shù)據(jù)分析中,有效鑒別青年人步態(tài)和老年人步態(tài)的差異,獲取有效量化評(píng)價(jià)老年人的步態(tài)變化的技術(shù)手段,諸如基于人工神經(jīng)網(wǎng)絡(luò)構(gòu)建步態(tài)分類(lèi)模型被用來(lái)評(píng)價(jià)老年人的步態(tài)變化[6]。近年來(lái),基于構(gòu)建泛化性能優(yōu)越的步態(tài)分類(lèi)模型鑒別老年人步態(tài)模式來(lái)評(píng)價(jià)老年人的步態(tài)變化,已成為眾多學(xué)者探討的熱點(diǎn)問(wèn)題。從近年的文獻(xiàn)報(bào)道來(lái)看,基于先進(jìn)機(jī)器學(xué)習(xí)理論構(gòu)建步態(tài)分類(lèi)模型在步態(tài)分析中得到廣泛應(yīng)用。特別是基于有監(jiān)督學(xué)習(xí)算法的支持向量機(jī)二分類(lèi)模型,在量化評(píng)價(jià)老年人步態(tài)及其變化研究中持續(xù)受到關(guān)注和重視[7-11]。Begg等首次采用支持向量機(jī)二分類(lèi)模型,通過(guò)鑒別12名健康青年和12名健康老年受試者的步態(tài)模式(由時(shí)空步態(tài)參數(shù)、運(yùn)動(dòng)學(xué)步態(tài)參數(shù)、動(dòng)力學(xué)步態(tài)特征參數(shù)組成),量化評(píng)價(jià)了老年人的步態(tài),并驗(yàn)證了小樣本步態(tài)數(shù)據(jù)在支持向量機(jī)分類(lèi)算法中的適應(yīng)性[10]。Reginaldo等采用支持向量機(jī)分類(lèi)算法,分析了17名健康青年和17名老年人的運(yùn)動(dòng)學(xué)步態(tài)數(shù)據(jù),探討了與年齡相關(guān)的老年人步態(tài)變化[11]。當(dāng)前,基于有監(jiān)督學(xué)習(xí)的支持向量機(jī)二分類(lèi)算法來(lái)評(píng)價(jià)老年人步態(tài)的相關(guān)研究取得了積極的進(jìn)展,但研究中僅考慮有標(biāo)注步態(tài)數(shù)據(jù)類(lèi)別間的差異信息,而忽略步態(tài)數(shù)據(jù)類(lèi)內(nèi)有價(jià)值的“內(nèi)在信息”。另外,目前的研究?jī)H局限于有標(biāo)注的小樣本步態(tài)數(shù)據(jù),而忽略大量無(wú)標(biāo)注步態(tài)數(shù)據(jù)在步態(tài)分類(lèi)算法中的有效利用,特別是在大量無(wú)標(biāo)注的老年人步態(tài)數(shù)據(jù)中,包含“有價(jià)值”的危險(xiǎn)步態(tài)變異信息未得到有效利用,必將影響其泛化能力,降低學(xué)習(xí)算法的精度,難以準(zhǔn)確評(píng)價(jià)老年人行走時(shí)的步態(tài)狀況。事實(shí)上,在醫(yī)療環(huán)境中,獲取大量有標(biāo)注的人體步態(tài)數(shù)據(jù)比較費(fèi)時(shí)費(fèi)力,而獲取大量的無(wú)標(biāo)注的人體步態(tài)數(shù)據(jù)比較容易。如何尋找一種能有效利用大量無(wú)標(biāo)注的人體步態(tài)數(shù)據(jù),構(gòu)建泛化性能優(yōu)越的步態(tài)分類(lèi)模型,準(zhǔn)確量化評(píng)價(jià)老年人步態(tài),是筆者研究的興趣所在。
據(jù)近年的相關(guān)文獻(xiàn)報(bào)道,基于半監(jiān)督學(xué)習(xí)的支持向量機(jī)分類(lèi)算法能夠有效地利用大量無(wú)標(biāo)注數(shù)據(jù),較好地改善分類(lèi)性能,并已在腦電、心電等生物醫(yī)學(xué)信息處理中得到成功的應(yīng)用[12-13],但在量化評(píng)價(jià)人體步態(tài)變化的相關(guān)研究中仍未得到應(yīng)用。在研究中,筆者嘗試應(yīng)用半監(jiān)督支持向量機(jī)分類(lèi)算法來(lái)分析大量無(wú)標(biāo)注的人體步態(tài)數(shù)據(jù),旨在充分考慮利用步態(tài)數(shù)據(jù)類(lèi)別間和步態(tài)數(shù)據(jù)內(nèi)在“有價(jià)值”的步態(tài)變異信息,改善支持向量機(jī)步態(tài)分類(lèi)算法的性能,準(zhǔn)確評(píng)價(jià)老年人行走時(shí)的步態(tài)狀況。近年來(lái),自訓(xùn)練半監(jiān)督支持向量機(jī)分類(lèi)算法在生物醫(yī)學(xué)信息處理中得到普遍重視[12-13]。在算法設(shè)計(jì)研究中,首要考慮的問(wèn)題就是在自訓(xùn)練過(guò)程中如何從無(wú)標(biāo)注生理數(shù)據(jù)中獲取有標(biāo)注數(shù)據(jù),并且每次添加到樣本訓(xùn)練集中標(biāo)注的樣本對(duì)于當(dāng)前分類(lèi)模型而言必須最具信息量,否則將嚴(yán)重影響分類(lèi)器的學(xué)習(xí)能力[14]。為此,如何尋找一個(gè)能有效衡量步態(tài)數(shù)據(jù)樣本信息量大小的有效參量,是設(shè)計(jì)步態(tài)分類(lèi)算法非常重要的環(huán)節(jié)?;谌梭w步態(tài)數(shù)據(jù)的非平穩(wěn)性、復(fù)雜性等特性以及前期的研究工作發(fā)現(xiàn),小波熵能夠有效表征人體步態(tài)系統(tǒng)內(nèi)在的紊亂變化程度,能夠獲取更多表達(dá)人體步態(tài)變異的信息量[15]。基于上述思路,筆者提出了一種基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類(lèi)算法,旨在嘗試采用基于小波熵從未標(biāo)注步態(tài)數(shù)據(jù)中來(lái)挑選那些在當(dāng)前分類(lèi)器下最具信息量的樣本,以提高自訓(xùn)練半監(jiān)督支持向量機(jī)分類(lèi)器的泛化能力,準(zhǔn)確量化評(píng)價(jià)行走時(shí)的老年人步態(tài)。在研究中,采集了120名不同年齡組的未標(biāo)注足-地反作用力步態(tài)數(shù)據(jù),采用本研究提出的分類(lèi)算法對(duì)其進(jìn)行分析,并與基于有監(jiān)督學(xué)習(xí)的支持向量機(jī)分類(lèi)模型比較,以驗(yàn)證所提出的分類(lèi)模型評(píng)價(jià)老年人步態(tài)的有效性和優(yōu)越性。
半監(jiān)督學(xué)習(xí)是一種近年來(lái)應(yīng)用于模式識(shí)別等領(lǐng)域較先進(jìn)的機(jī)器學(xué)習(xí)算法,其核心思想是依據(jù)光滑性假設(shè),充分綜合考慮利用數(shù)據(jù)類(lèi)別間概率分布信息和數(shù)據(jù)類(lèi)別內(nèi)在結(jié)構(gòu)分布信息,以改善傳統(tǒng)監(jiān)督學(xué)習(xí)算法中忽略數(shù)據(jù)所具有某種內(nèi)在結(jié)構(gòu)分布信息的不足,提高學(xué)習(xí)器的泛化性能[14]。通過(guò)對(duì)來(lái)自某種未知分布的一個(gè)有標(biāo)注示例集X1={(xi,yi)(xi表示i個(gè)數(shù)據(jù),yi是xi的類(lèi)別標(biāo)號(hào)),與一個(gè)無(wú)標(biāo)注示例集X2={xi}進(jìn)行學(xué)習(xí),期望得到一個(gè)決策函數(shù)f:X→Y(X=(X1,X2),Y={yi}),能夠?qū)κ纠?xi準(zhǔn)確預(yù)測(cè)其標(biāo)記 yi。本研究采用yi∈{-1,+1},其中-1表示青年人步態(tài)模式,+1表示老年人步態(tài)模式。為了找到函數(shù),通過(guò)任取一個(gè)滿足Mercer定理的核函數(shù)K:X×X→R,對(duì)數(shù)據(jù)X=(X1,X2)映射,在產(chǎn)生與之對(duì)應(yīng)的重構(gòu)核Hibert空間(RKHS)中進(jìn)行優(yōu)化學(xué)習(xí),使其具有最小值,即
通過(guò)引入松弛變量ξ,可將式(1)表示為
為此,利用支持向量機(jī)算法(SVM),即可得到一個(gè)決策函數(shù)f:X→Y。
考慮到步態(tài)數(shù)據(jù)與腦電、心電數(shù)據(jù)具有相同的高維性、非平穩(wěn)性、復(fù)雜性等特性[6],采用自訓(xùn)練半監(jiān)督學(xué)習(xí)算法在RSHK中尋找最優(yōu)的決策函數(shù)?;舅悸肪褪鞘紫壤蒙倭康挠袠?biāo)注樣本步態(tài)數(shù)據(jù)訓(xùn)練構(gòu)建支持向量機(jī)分類(lèi)模型,然后對(duì)無(wú)標(biāo)注步態(tài)數(shù)據(jù)分類(lèi)預(yù)測(cè),選取新的有標(biāo)注的步態(tài)數(shù)據(jù)添加樣本訓(xùn)練集,構(gòu)建新的樣本訓(xùn)練集(由訓(xùn)練數(shù)據(jù)、無(wú)標(biāo)注數(shù)據(jù)、新添加的標(biāo)注數(shù)據(jù)組成),訓(xùn)練學(xué)習(xí)新的支持向量機(jī)分類(lèi)模型,循環(huán)上述過(guò)程,不斷更新樣本訓(xùn)練集,直到得到最終的支持向量機(jī)模型,也就是直到獲得泛化性能最優(yōu)的步態(tài)分類(lèi)模型為止。在自訓(xùn)練過(guò)程中,添加到樣本訓(xùn)練集的樣本標(biāo)號(hào)與所選樣本的真實(shí)類(lèi)別標(biāo)號(hào)是否一致至關(guān)重要。若不一致,可能產(chǎn)生的誤差就會(huì)在迭代過(guò)程中不斷積累,必將影響學(xué)習(xí)性能。為此,要求選取的樣本數(shù)據(jù)對(duì)當(dāng)前分類(lèi)模型最具信息量,盡量減少在自訓(xùn)練迭代過(guò)程中可能產(chǎn)生的誤差。在研究中,考慮到人體步態(tài)功能變異與人體步態(tài)系統(tǒng)內(nèi)在紊亂變化程度密切相關(guān)的特性[15],嘗試采用小波熵作為衡量從未標(biāo)注步態(tài)數(shù)據(jù)中來(lái)挑選那些在當(dāng)前分類(lèi)器中最具信息量樣本的有效參量。
首先計(jì)算小波熵值[15],也就是對(duì)步態(tài)數(shù)據(jù)進(jìn)行多尺度小波分解,得到各分解層的小波系數(shù){Dj(k),其中 m 為每個(gè)分解層小波系數(shù)的個(gè)數(shù)。根據(jù)所得小波系數(shù),計(jì)算各分解層的能量分布及所有小波系數(shù)的能量之和,有
然后根據(jù)各分解層的能量計(jì)算相對(duì)小波能量,即
然后根據(jù)相對(duì)小波能量計(jì)算小波熵,有
然后依據(jù)前期研究工作[15],根據(jù)計(jì)算得到的健康青年和老年受試者步態(tài)數(shù)據(jù)小波熵值的統(tǒng)計(jì)差異,定義從未標(biāo)注數(shù)據(jù)、挑選標(biāo)注樣本數(shù)據(jù)的閾值。青年和老年人的小波熵值變化范圍分別定義為M±SD,其中M為平均值、SD為標(biāo)準(zhǔn)差,若有相沖突的數(shù)據(jù)則剔除。
綜上所述,本研究提出基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類(lèi)算法,其流程框架如圖1所示。
圖1 基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)分類(lèi)算法流程框架Fig.1 The framework of the classification algorithm of the self-training semi-supervised support vector machine based on wavelet entropy
具體的算法主要包括4個(gè)步驟。
步驟1:用少量有標(biāo)注的步態(tài)數(shù)據(jù)構(gòu)建樣本訓(xùn)練集,學(xué)習(xí)訓(xùn)練得到支持向量機(jī)分類(lèi)模型,然后對(duì)無(wú)標(biāo)注的步態(tài)數(shù)據(jù)分類(lèi),得到預(yù)測(cè)標(biāo)注樣本,并計(jì)算其相應(yīng)的小波熵值,并依據(jù)小波熵閾值挑選一些新的標(biāo)注步態(tài)數(shù)據(jù)。
步驟2:用訓(xùn)練樣本數(shù)據(jù)、剩余的無(wú)標(biāo)注步態(tài)數(shù)據(jù)、上一步得到的新的標(biāo)注步態(tài)數(shù)據(jù),構(gòu)建一個(gè)新的樣本訓(xùn)練集,再進(jìn)行訓(xùn)練學(xué)習(xí),得到一個(gè)新的支持向量機(jī)分類(lèi)模型。同樣,對(duì)剩余的無(wú)標(biāo)注步態(tài)數(shù)據(jù)進(jìn)行預(yù)測(cè),計(jì)算預(yù)測(cè)樣本的小波熵值,并依據(jù)小波熵閾值挑選一些新的標(biāo)注步態(tài)數(shù)據(jù)。
步驟3:計(jì)算新的支持向量機(jī)相應(yīng)的目標(biāo)函數(shù)值,有
步驟4:k次迭代步驟2和步驟3。假定一個(gè)正常數(shù)δ0,計(jì)算第k次和k-1次的支持向量機(jī)相應(yīng)的目標(biāo)函數(shù)值,判斷兩者的絕對(duì)值是否小于δ0,若不小于δ0則繼續(xù)k+1次迭代,若小于δ0則停止循環(huán),從而得到測(cè)試樣本的最終分類(lèi)標(biāo)注,即最后的分類(lèi)結(jié)果。
由于研究中要采集大量未標(biāo)注老年人步態(tài)數(shù)據(jù),考慮到老年人受試者行走狀況,所以設(shè)計(jì)受試者步態(tài)數(shù)據(jù)采集過(guò)程不僅要簡(jiǎn)單易行,并且采集的步態(tài)數(shù)據(jù)要能夠包含更多與人體步態(tài)變異密切相關(guān)的本質(zhì)信息。目前,在生物力學(xué)中有關(guān)的步態(tài)假說(shuō)研究表明,足-地反作用力等動(dòng)力學(xué)步態(tài)參數(shù)能體現(xiàn)人體步態(tài)的內(nèi)在“動(dòng)力鏈”,可較好地反映人體行走時(shí)下肢力量及步態(tài)變異狀況[2,16]。為此,筆者采集了120名不同年齡組受試者的足-地反作用力步態(tài)數(shù)據(jù),其相關(guān)生理參數(shù)如表1所示。在采集過(guò)程中,為避免各種干擾因素,要求受試者赤足按本人習(xí)慣或自然的步速在一個(gè)內(nèi)嵌測(cè)力平臺(tái)的實(shí)驗(yàn)水平步道上行走;為確保測(cè)力平臺(tái)準(zhǔn)確記錄受試者步行時(shí)的足-地反作用力步態(tài)數(shù)據(jù),要求每個(gè)受試者在步行時(shí)一只足盡可能地踏在測(cè)力平臺(tái)的中間位置。采樣頻率為400 Hz,每個(gè)受試者記錄3~5次滿足條件的步態(tài)數(shù)據(jù)。在采集前,讓受試者在實(shí)驗(yàn)水平步道上行走數(shù)次,以便熟悉數(shù)據(jù)采集試驗(yàn)環(huán)境和要求;同時(shí),要求所有受試者熟悉和同意步態(tài)數(shù)據(jù)采集方案及相關(guān)事項(xiàng)[15]。
表1 不同年齡組受試者的生理參數(shù)(均值±標(biāo)準(zhǔn)差)Tab.1 The physiological parameters from the subjects groups with different ages(M±SD)
為消除受試者之間的個(gè)體差異,便于步態(tài)數(shù)據(jù)量化分析,對(duì)足-地反作用力步態(tài)數(shù)據(jù)進(jìn)行歸一化處理。將每個(gè)受試者足-地間反作用力除以其自身體重,即將每個(gè)受試者足-地反作用力歸一化為其自身體重的百分比,以消除受試者自身體重所造成的差異;將每個(gè)受試者的足與地面的接觸時(shí)間長(zhǎng)度歸一化為步態(tài)周期中支撐期的百分比,以消除受試者之間因不同步速所產(chǎn)生的差異。一名受試者的步態(tài)數(shù)據(jù)如圖2所示,其中Fz為垂直方向力(vertical force),F(xiàn)y為前后方向力(anterior-posterior force),F(xiàn)x為左右方向力(medio-lateral forces))
圖2 一名受試者在3個(gè)不同方向的足-地反作用力在支撐期的變化狀況Fig.2 The change of the three different ground reaction force(GRF)during stance phase
在實(shí)驗(yàn)中,為便于小波變換計(jì)算,將一個(gè)支撐期數(shù)據(jù)長(zhǎng)度處理為256個(gè)數(shù)據(jù)點(diǎn),采用Daubechies6小波基函數(shù)對(duì)步態(tài)數(shù)據(jù)進(jìn)行7尺度小波分解,計(jì)算相應(yīng)的小波熵值。依據(jù)筆者在前期研究建立的健康青年和老年人數(shù)據(jù)庫(kù),由于垂直和前后方向的足-地反作用力步態(tài)數(shù)據(jù)蘊(yùn)含較多的人體步態(tài)變異信息[2,5,16],所以選取 12 名健康青年受試者和 12 名健康老年受試者垂直和前后方向足-地反作用力步態(tài)數(shù)據(jù)計(jì)算小波熵值,并用t-檢驗(yàn)法統(tǒng)計(jì)分析兩組小波熵值差異(檢驗(yàn)顯著性水平值P<0.05,小波熵具有顯著差異)。由于在上述兩個(gè)不同方向足-地反作用力步態(tài)數(shù)據(jù)上,青年受試者比老年受試者在不同尺度上的相對(duì)小波能量分布較均勻(詳見(jiàn)文獻(xiàn)[15]),為了得到較好的標(biāo)注數(shù)據(jù),所以確定標(biāo)注健康青年數(shù)據(jù)的小波熵閾值應(yīng)大于統(tǒng)計(jì)分析的平均值,而標(biāo)注老年數(shù)據(jù)的小波熵閾值應(yīng)小于統(tǒng)計(jì)分析的平均值,其結(jié)果如表2所示。
表2 健康青年和老年受試組在垂直方向和前后方向反作用力步態(tài)數(shù)據(jù)分析結(jié)果Tab.2 The analyzed results obtained the vertical and anterior-posterior GRF from health young and elderly subjects
由于支持向量機(jī)分類(lèi)算法的泛化性能與表達(dá)數(shù)據(jù)的特征向量的維數(shù)大小密切相關(guān),實(shí)驗(yàn)中為了較好地表達(dá)步態(tài)數(shù)據(jù),分別從垂直方向和前后方向的足-地反作用力步態(tài)數(shù)據(jù)中,選取步態(tài)分析中常用的10個(gè)含有大量與人體步態(tài)變化密切相關(guān)特征信息的步態(tài)參數(shù),構(gòu)建步態(tài)模式特征向量[2,16](見(jiàn)圖3),也就是將一個(gè)步態(tài)模式表示為10維的特征向量。其中,(a)為垂直方向力,主要有足跟著地時(shí)的最大承受力Fz1、與Fz1相應(yīng)的時(shí)刻Tz1、全足著地時(shí)的最小承受力Fz2,與Fz2相應(yīng)的時(shí)刻Tz2、足尖離地時(shí)的最大承受力Fz3、與Fz3相應(yīng)的時(shí)刻Tz3;(b)為前后方向力,主要有足停止時(shí)最大承受力Fy1與相應(yīng)的時(shí)刻Ty1、足離地時(shí)最大承受力Fy2與相應(yīng)的時(shí)刻Ty2)。
圖3 從垂直方向(a)和前后方向(b)力中選取的步態(tài)特征參數(shù)Fig.3 The gait features selected from vertical(a)and anterior–posterior(b)directional GRF during stance phase respectively
首先選取20名(10名健康青年和10名健康老年)受試者的步態(tài)數(shù)據(jù)構(gòu)建樣本訓(xùn)練集,建立支持向量機(jī)分類(lèi)模型,然后采用自訓(xùn)練算法對(duì)120名未標(biāo)注受試者的數(shù)據(jù)進(jìn)行預(yù)測(cè)和訓(xùn)練,另選取24名健康青年和24名健康老年受試者的步態(tài)數(shù)據(jù)作為測(cè)試數(shù)據(jù),評(píng)估自訓(xùn)練過(guò)程中每次迭代的支持向量機(jī)分類(lèi)性能。由于數(shù)據(jù)有限,每次迭代添加的標(biāo)注樣本數(shù)據(jù)數(shù)根據(jù)預(yù)測(cè)樣本量大小及相應(yīng)小波熵值而定,添加的標(biāo)注樣本數(shù)量可變。在實(shí)驗(yàn)中,起始添加的標(biāo)注樣本數(shù)量為6,設(shè)置調(diào)節(jié)參數(shù)C1=0.85,C2=0.2,利用 LIBSVM 實(shí)現(xiàn) SVM 算法[17],采用線性核K(xi,xj)=xixj。為了比較,沒(méi)有依據(jù)小波熵閾值選取添加的樣本,而是根據(jù)每次的預(yù)測(cè)樣本隨機(jī)選取添加的樣本,兩種不同的添加樣本方法(在每次迭代過(guò)程的添加的樣本數(shù)相同)的分類(lèi)性能如圖4所示??梢钥吹剑С窒蛄繖C(jī)分類(lèi)性能隨著添加的標(biāo)注樣本數(shù)增加逐步得到改善,迭代初期兩種樣本選取方法的分類(lèi)性能相當(dāng),這可能由于此時(shí)樣本訓(xùn)練集中的樣本數(shù)較少,分類(lèi)泛化性能差。隨著迭代次數(shù)增加,基于預(yù)測(cè)樣本隨機(jī)選取添加的標(biāo)注樣本方法的泛化性能不穩(wěn)定;而基于小波熵選取的標(biāo)注樣本方法的泛化性能明顯優(yōu)于前者,當(dāng)?shù)螖?shù)為12時(shí),分類(lèi)性能最優(yōu)。上述結(jié)果表明,小波熵能夠有效地從未標(biāo)注步態(tài)數(shù)據(jù)中來(lái)挑選那些在當(dāng)前分類(lèi)器里最具信息量的樣本,可有效提高自訓(xùn)練半監(jiān)督支持向量機(jī)的泛化性能。
圖4 兩種不同的添加樣本方法對(duì)分類(lèi)性能影響的比較Fig.4 The comparison of the effect of classification performance on the two methods for samples added in training sample set
此外,為了比較步態(tài)數(shù)據(jù)對(duì)分類(lèi)性能的影響,筆者采用文獻(xiàn)[10]中的有監(jiān)督學(xué)習(xí)支持向量機(jī)方法來(lái)評(píng)價(jià)不同方向反作用力步態(tài)數(shù)據(jù),兩種方法在不同方向的足-地反作用力步態(tài)數(shù)據(jù)的最優(yōu)分類(lèi)泛化性能如表3所示??梢钥吹剑罁?jù)筆者提出的半監(jiān)督步態(tài)分類(lèi)算法,垂直方向和前后方向的足-地反作用力數(shù)據(jù)的分類(lèi)正確率分別為85%和81%,基于兩種不同方向的足-地反作用力相結(jié)合的步態(tài)數(shù)據(jù)的最大分類(lèi)正確率為90%;相比之下,依據(jù)文獻(xiàn)[10]的有監(jiān)督步態(tài)分類(lèi)模型,垂直方向和前后方向的足-地反作用力數(shù)據(jù)的最大分類(lèi)正確率僅分別為83%和75%,基于兩種不同方向的足-地反作用力相結(jié)合的步態(tài)數(shù)據(jù)的最大分類(lèi)正確率為85%。結(jié)果表明,半監(jiān)督支持向量機(jī)分類(lèi)算法能夠有效綜合利用步態(tài)數(shù)據(jù)類(lèi)別間和步態(tài)數(shù)據(jù)內(nèi)在的“有價(jià)值”的步態(tài)變異信息,改善支持向量機(jī)步態(tài)分類(lèi)算法性能,準(zhǔn)確鑒別青年和老年人步態(tài)模式,為有效評(píng)價(jià)人體步態(tài)轉(zhuǎn)為老年人步態(tài)狀況提供依據(jù)。
表3 兩種步態(tài)分類(lèi)算法在不同方向力步態(tài)數(shù)據(jù)上的分類(lèi)正確率Tab.3 The accuracy obtained by two gait classification algorithm based on two directional GRF gait data
實(shí)驗(yàn)結(jié)果表明,筆者提出的基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類(lèi)算法能夠充分利用大量未標(biāo)注步態(tài)數(shù)據(jù),有效提高步態(tài)分類(lèi)性能。在研究中,首先挑選了一些健康的青年和老年人受試者步態(tài)數(shù)據(jù)來(lái)定義小波熵閾值,從表2的統(tǒng)計(jì)分析結(jié)果來(lái)看,青年和老年的步態(tài)模式存在較大差異。為了有效評(píng)價(jià)小波熵從未標(biāo)注步態(tài)數(shù)據(jù)中獲取保持真實(shí)的標(biāo)注樣本數(shù)據(jù),在未標(biāo)注數(shù)據(jù)中添加了中年年齡段(45~55歲)的步態(tài)數(shù)據(jù),主要考慮到該年齡段處于老年前期,受人體神經(jīng)生理功能、運(yùn)動(dòng)控制能力下降等因素對(duì)步態(tài)功能的影響,步態(tài)功能易發(fā)生變異,其步態(tài)數(shù)據(jù)可能含有與老年人步態(tài)變化密切相關(guān)的特征信息,有助于準(zhǔn)確評(píng)價(jià)老年人步態(tài)。目前,在應(yīng)用半監(jiān)督學(xué)習(xí)算法進(jìn)行生物醫(yī)學(xué)信息處理的研究中,眾多學(xué)者針對(duì)不同的生物醫(yī)學(xué)數(shù)據(jù)特性,探討了如何從未標(biāo)注數(shù)據(jù)中進(jìn)行有效標(biāo)注數(shù)據(jù),以提高半監(jiān)督學(xué)習(xí)分類(lèi)算法的性能[12-13]。在研究中,針對(duì)步態(tài)數(shù)據(jù)的非平穩(wěn)性、復(fù)雜性以及有效表達(dá)步態(tài)數(shù)據(jù)分布的特性,采用小波熵作為衡量從未標(biāo)注步態(tài)數(shù)據(jù)中來(lái)挑選那些在當(dāng)前分類(lèi)器中最具信息量樣本的有效參量。從圖4的結(jié)果來(lái)看,隨著基于小波熵閾值選取的添加標(biāo)注樣本數(shù)增加,基于半監(jiān)督學(xué)習(xí)的分類(lèi)算法性能不斷增強(qiáng),經(jīng)過(guò)12次迭代以后,步態(tài)分類(lèi)器的最終分類(lèi)正確率逐步平穩(wěn),表明基于小波熵獲取的添加樣本能夠較好地代表樣本在特征空間的分布,12次迭代以后添加的樣本對(duì)分類(lèi)性能影響較小。然而,依據(jù)每次預(yù)測(cè)樣本隨機(jī)選取添加樣本,構(gòu)建自訓(xùn)練支持向量機(jī)步態(tài)分類(lèi)器,其分類(lèi)性能不穩(wěn)定,這可能是由于在自訓(xùn)練過(guò)程中,添加到樣本訓(xùn)練集的樣本標(biāo)號(hào)與所選樣本真實(shí)類(lèi)別標(biāo)號(hào)不一致,產(chǎn)生的誤差在迭代過(guò)程中不斷積累,從而影響學(xué)習(xí)的性能。上述結(jié)果表明,小波熵能夠有效地衡量從未標(biāo)注步態(tài)數(shù)據(jù)中挑選那些在當(dāng)前分類(lèi)器中最具信息量的樣本,改善半監(jiān)督步態(tài)分類(lèi)的泛化性能。
在研究中,僅考慮采用足-地反作用力的步態(tài)數(shù)據(jù)進(jìn)行分析來(lái)評(píng)價(jià)人體步態(tài)變化。從表3的結(jié)果來(lái)看,基于筆者的算法和大量未標(biāo)注的足-地反作用力數(shù)據(jù),能夠獲得與文獻(xiàn)[10](基于有監(jiān)督學(xué)習(xí)支持向量機(jī)分類(lèi)算法,同時(shí)采用時(shí)空步態(tài)數(shù)據(jù)、足-地反作用力步態(tài)數(shù)據(jù)、下肢關(guān)節(jié)角度步態(tài)數(shù)據(jù))相近的最大分類(lèi)正確率。僅從足-地反作用力的步態(tài)數(shù)據(jù)來(lái)看,采用筆者提出的分類(lèi)算法得到的最終分類(lèi)正確率高于文獻(xiàn)[10]中的分類(lèi)正確率5%,表明大量未標(biāo)注的步態(tài)數(shù)據(jù)蘊(yùn)含大量與人體步態(tài)功能變化密切相關(guān)的變異信息,對(duì)于改善步態(tài)分類(lèi)算法性能和評(píng)價(jià)老年人步態(tài)極其重要。此外,分別對(duì)垂直和前后方向足-地反作用力數(shù)據(jù)進(jìn)行分析。從表3中的結(jié)果看到,基于垂直方向的足-地反作用力步態(tài)數(shù)據(jù)的最終分類(lèi)正確率明顯優(yōu)于基于水平方向足-地反作用力步態(tài)數(shù)據(jù)的最終分類(lèi)正確率,說(shuō)明垂直方向足-地反作用力中的步態(tài)特征參數(shù)(如足跟著地時(shí)的最大承受力Fz1、全足著地時(shí)的最小承受力Fz2等)能夠提供更多的表達(dá)轉(zhuǎn)化為老年人步態(tài)的變異信息,這個(gè)結(jié)果與文獻(xiàn)[2,5,16]的研究結(jié)果一致。
本研究提出的基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類(lèi)算法,能夠充分利用大量未標(biāo)注的足-地反作用力步態(tài)數(shù)據(jù),獲取步態(tài)數(shù)據(jù)內(nèi)在與人體步態(tài)功能變異密切相關(guān)的有價(jià)值信息,改善步態(tài)分類(lèi)算法性能,準(zhǔn)確鑒別青年和老年的步態(tài)模式,可有效評(píng)價(jià)人體步態(tài)變化,為量化評(píng)價(jià)老年人步態(tài)提供了新思路和新方法。今后的工作嘗試是將本研究提出的算法應(yīng)用于時(shí)空步態(tài)數(shù)據(jù)、運(yùn)動(dòng)學(xué)等不同類(lèi)型步態(tài)數(shù)據(jù)的分析,進(jìn)一步探討老年人步態(tài)變異機(jī)制的相關(guān)研究?jī)?nèi)容。
[1]中華人民共和國(guó)衛(wèi)生部疾病預(yù)防控制局.老年人跌倒干預(yù)技術(shù)指南[EB/OL].http://www.moh.gov.cn,2011-09-06/2012-11-20.
[2]Giannini S,Catani F,Benedetti MG,et al.Gait analysis:Methodologies and clinical applications[M] //Benedetti MG,eds.Terminology,Parameterization and Normalization in Gait Analysis.Amsterdam:IOS Press,1994:65 -88.
[3]Brach JS,Perera S,Studenski S,et al.Meaningful change in measures of gait variability in older adults[J].Gait and Posture,2010,31(2):175-179.
[4]Nigg BM,Skleryk BN.Gait characteristics of the elderly[J].Clinical Biomechanics,1988,3(2):79-87.
[5]Fran?ois P,Hélène C,Réjean H.Gait in the elderly[J].Gait and Posture,1997,5(2):128-135.
[6]Chau T.A review of analytical techniques for gait data.Part 2:Neural network and wavelet methods[J].Gait and Posture,2001,13:102-120.
[7]Wu Jianning,Wang Jue,Liu Li.Feature extraction via KPCA for classification of gait patterns[J].Human Movement Science,2007,26(3):393-411.
[8]Begg RK,Palaniswami M,Owen B.Support vector machines for automated gait classification[J].IEEE Trans on Biomedical Engineering,2005,52(9):828-838.
[9]Khandoker AH,Lai DT,Begg RK,et al.Wavelet-based feature extraction for support vector machines for screening balance impairments in the elderly[J].IEEE Trans on Neural Systems and Rehabilitation Engineering,2007,15(4):587-97.
[10]Begg RK,Kamruzzaman J.A machine learning approach for automated recognition of movement patterns using basic,kinetic and kinematic gait data [J].Journal of Biomechanics,2005,38:401-408.
[11]Reginaldo K,F(xiàn)ukuchi B,Bjoern M,et al.Support vector machines for detecting age-related changes in running kinematics[J].Journal of Biomechanics,2011,44(3):540 -542.
[12]堯德中,劉鐵軍,雷 旭,等.基于腦電的腦-機(jī)接口:關(guān)鍵技術(shù)和應(yīng)用前景 [J].電 子 科 技 大 學(xué) 學(xué) 報(bào),2009,38(5):550-553.
[13]王金甲,賈敏.標(biāo)簽均值的自訓(xùn)練半監(jiān)督支持向量機(jī)用于EEG分類(lèi)[J].中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2011,30(5):666-672.
[14]Chapelle O,Scholkopf B,Zien A.Semi-supervised Learning[M]//JoachimsT,eds. Transductive SupportVector Machines.Cambridge:MIT Press,2006:101 -112.
[15]吳建寧,伍濱,王玨.用小波熵評(píng)價(jià)人體步態(tài)變化[J].航天醫(yī)學(xué)與醫(yī)學(xué)工程,2009,22(6):437-442.
[16]Begg RK,Rahman SM.A method for the reconstruction of ground reaction force-time characteristics during gait from force platform recordings of simultaneous foot falls[J].IEEE Trans on Biomedical Engineering,2000,47:547-551.
[17]Chang CC,Lin CJ.LIBSVM:a library for support vector machine[EB/CP].http://www.csie.ntu.edu.tw/~ cjlin/libsvm,2009-05-01/2012-11-20.