趙 翔涂 娟*黃紫娟
(1.福州大學(xué),電氣工程與自動(dòng)化學(xué)院,福建 福州350108;2.福建省醫(yī)療器械與醫(yī)藥技術(shù)重點(diǎn)實(shí)驗(yàn)室,福建 福州350108)
表面肌電信號(hào)(Surface Electromyography,sEMG)是一種易受實(shí)驗(yàn)環(huán)境影響的微弱生物電信號(hào)[1],是由運(yùn)動(dòng)時(shí)肌肉興奮所產(chǎn)生的動(dòng)作電位序列在皮膚疊加而成,它一般比肢體運(yùn)動(dòng)超前30 ms ~150 ms[2],易獲取,主要依賴于驅(qū)動(dòng)運(yùn)動(dòng)的肌肉,并不依賴于執(zhí)行運(yùn)動(dòng)的肢體,廣泛應(yīng)用于人機(jī)交互技術(shù)[3]。 目前肌電信號(hào)特征提取方法有時(shí)域分析法、頻域分析法和非線性分析法[4-7]。 下肢肌肉存在于皮膚深處,且彼此之間存在明顯的重疊,與上肢肌肉相比,下肢肌肉表面肌電信號(hào)的分類更加困難[8]。采用多域特征融合進(jìn)行動(dòng)作分類,可以有效提高分類準(zhǔn)確率。 文獻(xiàn)[9]將時(shí)域特征和頻域特征組合成多特征組合,用于步態(tài)識(shí)別,獲得95%的平均識(shí)別率。 特征融合能夠增加特征的多樣性,但是增加了計(jì)算復(fù)雜度,并導(dǎo)致分類性能的下降。 文獻(xiàn)[10]使用有監(jiān)督降維方法局部Fisher 差別分析(Local Fisher Discriminant Analysis,LFDA)和無監(jiān)督降維方法局部保持投影(Locality Preserving Projections,LPP)來處理冗余特征,提高了分類性能。
反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)通過實(shí)驗(yàn)數(shù)據(jù)正向傳播、誤差反向傳播來訓(xùn)練神經(jīng)網(wǎng)絡(luò),進(jìn)行運(yùn)動(dòng)分類時(shí)會(huì)出現(xiàn)權(quán)值參數(shù)設(shè)置繁瑣、且訓(xùn)練速度慢等缺點(diǎn)[11]。 黃廣斌[12]提出了一種單隱層前饋神經(jīng)網(wǎng)絡(luò)算法,即極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM),學(xué)習(xí)速度比BP 神經(jīng)網(wǎng)絡(luò)要快,準(zhǔn)確率也較高,但ELM 權(quán)重參數(shù)和隱含層神經(jīng)元個(gè)數(shù)會(huì)對(duì)分類結(jié)果產(chǎn)生較大的影響。 核極限學(xué)習(xí)機(jī)(Kernel ELM,KELM)將正則化系數(shù)和核函數(shù)引入ELM,可以解決ELM 隨機(jī)選擇權(quán)重參數(shù)和隱含層神經(jīng)元個(gè)數(shù)所造成的分類結(jié)果穩(wěn)定性差的問題。 文獻(xiàn)[13]采用量子粒子群算法(Quantum Particle Swam Optimization,QPSO)優(yōu)化KELM 的正則化系數(shù)和核函數(shù),提高了KELM 的泛化性能。 文獻(xiàn)[14]使用模糊加權(quán)核極限學(xué)習(xí)機(jī)(KFWELM)來解決離散點(diǎn)和噪聲樣本對(duì)KELM 分類的影響,提高了分類性能,但處理數(shù)據(jù)的能力有待提高。
本文提出一種基于優(yōu)化KFWELM 的下肢運(yùn)動(dòng)分類方法。 該方法分別使用LPP 和LFDA 對(duì)提取的EMG 多域特征進(jìn)行降維處理,采用改進(jìn)高斯量子離子群算法(Gaussian Quantum Particle Swarm Optimization,GQPSO)優(yōu)化KFWELM 的正則化系數(shù)和核參數(shù),提高KFWELM 處理特征的能力,最后進(jìn)行自適應(yīng)融合得到分類結(jié)果。 實(shí)驗(yàn)表明,該方法具有良好的分類精度,能夠用來實(shí)現(xiàn)下肢運(yùn)動(dòng)的準(zhǔn)確分類。
為了更好地揭示下肢運(yùn)動(dòng)模式獲取的EMG 信號(hào)的內(nèi)在屬性,提取其時(shí)域、頻域、非線性特征,組成48 維多域特征。 如果將多域特征直接輸入神經(jīng)網(wǎng)絡(luò)中,會(huì)出現(xiàn)特征冗余等問題,從而造成分類性能的下降,需要對(duì)特征值進(jìn)行降維處理。 目前降維分為有監(jiān)督降維和無監(jiān)督降維,有監(jiān)督降維主要考慮特征實(shí)現(xiàn)數(shù)據(jù)有效的分類,無監(jiān)督降維主要考慮低維特征有效地表示高維特征。 有監(jiān)督降維方法LFDA[10,15-16]通過選定一個(gè)較優(yōu)的投影方向,將高維問題降低到一維問題,變換后的一維數(shù)據(jù)既可以聚集每一類的數(shù)據(jù),又可以使不同類的數(shù)據(jù)盡可能分隔開。 因此在進(jìn)行降維處理時(shí),可以在實(shí)現(xiàn)最大區(qū)分類間可分性的同時(shí)保持類內(nèi)局部特性。 無監(jiān)督降維方法LPP 處理特征值時(shí)能夠保持其局部性[10,17]。 本文結(jié)合這兩種降維方式的優(yōu)點(diǎn),同時(shí)使用有監(jiān)督LFDA 降維和無監(jiān)督LPP 降維,最后進(jìn)行自適應(yīng)融合,以提高分類性能,盡可能減少原特征的信息損失,更全面地分析數(shù)據(jù)特征。
ELM 是一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)[12],隨機(jī)產(chǎn)生輸入層權(quán)重和偏差,并使用廣義逆矩陣求解出輸出權(quán)值,測試數(shù)據(jù)利用訓(xùn)練好的輸出權(quán)值實(shí)現(xiàn)分類或回歸。 隱含層節(jié)點(diǎn)、輸入權(quán)重和偏差對(duì)模型性能會(huì)產(chǎn)生極大的影響,對(duì)此引入核函數(shù),構(gòu)建KELM,對(duì)輸入數(shù)據(jù)進(jìn)行核映射,進(jìn)而求出輸出權(quán)值。 為了進(jìn)一步消除離散點(diǎn)和噪聲樣本對(duì)KELM分類的影響,處理不平衡數(shù)據(jù),采用模糊加權(quán)核極限學(xué)習(xí)機(jī)(KFWELM)。
給定N個(gè)任意樣本組成的數(shù)據(jù)集(xj,tj),其中tj=[tj1,…,tjm]T∈Rm,xj=[xj1,…,xjn]∈Rn,第j個(gè)輸入樣本xj是n×1 個(gè)特征向量,第j個(gè)輸出樣本tj是m×1 個(gè)編碼后的目標(biāo)輸出向量,KFWELM 表示為[14]:
式中:W為權(quán)重矩陣,S為模糊隸屬度,sjj為S的對(duì)角元素,h(·)為隱含層輸出向量,C為正則化系數(shù),tj為輸出向量,xj為輸入向量,β為輸出權(quán)值,ξj為訓(xùn)練誤差。
權(quán)重W表示如下:
式中:W是對(duì)角矩陣,wjj為W的對(duì)角元素,N(tj)是tj類中的樣本數(shù),N是樣本總數(shù)。
模糊隸屬度S的計(jì)算:
①考慮訓(xùn)練樣本和樣本中心距離的模糊隸屬度定義為:
式中:xj是第j個(gè)輸入樣本,Nk是第k類輸入樣本數(shù),c是類別數(shù),δ是任意小的正數(shù),S1為對(duì)角矩陣,s1jj為S1的對(duì)角元素,
從式(3)中可以看出,賦予噪聲樣本等最小的模糊隸屬度,以減少對(duì)分類的影響。
②使用K近鄰(K Nearest Neighbor,KNN)分類方法來度量訓(xùn)練集周圍的關(guān)聯(lián)性,第k類的樣本xj周圍的關(guān)聯(lián)性定義為:
從(5)中可以看到離散值和噪聲樣本的關(guān)聯(lián)性是稀疏的,因此離散值和噪聲樣本也將被賦予最小模糊隸屬度。
將S1和S2相結(jié)合的模糊隸屬度S定義為:
式中:S是對(duì)角矩陣,sjj是S的對(duì)角元素。
運(yùn)用KKT[12,18]原理求解(1),輸出權(quán)值β定義為:
式中:H為隱含層輸出矩陣,H= [h(x1),…,h(xN)]T,W為權(quán)重矩陣,S為模糊隸屬度,C為正則化系數(shù),T為輸出矩陣。
KFWELM 的輸出函數(shù)矩陣為:
式中:ΩELM=HHT,h(xi)×h(xj)=K(xi,xj)=ΩELMi,j,小波核函數(shù)K(xi,xj)為:
式中:ψ和λ為核參數(shù),適當(dāng)選擇可提高算法性能。
KFWELM 的正則化系數(shù)和核參數(shù)需要人為設(shè)定,為提高KFWELM 的泛化性能和穩(wěn)定性,使用優(yōu)化算法對(duì)這兩種參數(shù)進(jìn)行優(yōu)化。 GQPSO 在進(jìn)行參數(shù)尋優(yōu)時(shí),采用高斯變異算子替代隨機(jī)序列,可以防止其過早收斂,提高尋優(yōu)的能力,但還是有陷入局部最優(yōu)值的可能[19]。 為此提出一種擾動(dòng)式的動(dòng)態(tài)慣性權(quán)重來改進(jìn)GQPSO,對(duì)KFWELM 的正則化系數(shù)(C)和核參數(shù)(γ和ψ)進(jìn)行優(yōu)化,并使用混沌映射產(chǎn)生初始化參數(shù),提高算法的全局尋優(yōu)能力。
GQPSO 的基本公式為:
式中:利用具有零均值和單位方差的高斯概率分布的絕對(duì)值來產(chǎn)生隨機(jī)數(shù)G和q,即為abs(N(0,1)),Mbest(?)是個(gè)體最優(yōu)值的平均值,φ為慣性權(quán)重,?為當(dāng)前迭代次數(shù),yi(?)為粒子當(dāng)前位置,pbesti(?)為當(dāng)前粒子的最優(yōu)位置,gbest(?)為當(dāng)前所有粒子的最優(yōu)位置,η1和η2為學(xué)習(xí)因子。
使用混沌映射初始化粒子位置,可以提高粒子的整體性和多樣性,取得比偽隨機(jī)數(shù)更好的結(jié)果,本文使用Logistic 映射進(jìn)行粒子種群初始化:
式中:zk是第k個(gè)混沌數(shù),范圍為0 到1 之間,z0∈rand(0,1)且z0?(0,0.25,0.5,0.75,1)。
初始化粒子群位置(y(start))為:
式中:ymax和ymin分別為粒子位置最大值和最小值。z為Logistic 映射后的初始矩陣,范圍為0 到1之間。
為避免算法陷入局部最優(yōu),采用一種擾動(dòng)式的動(dòng)態(tài)慣性權(quán)重來更新粒子的位置,使得權(quán)重雖然整體呈減少趨勢(shì)但是在一定范圍內(nèi)波動(dòng),提高算法全局搜索能力:
式中:φmax和φmin分別為慣性權(quán)重的最大值和最小值,?max為最大迭代數(shù)。
改進(jìn)GQPSO-KFWELM 基本步驟如下:
①改進(jìn)GQPSO 的最大進(jìn)化代數(shù)為?max=400,粒子群種群規(guī)模為M=100,慣性權(quán)值的最大值φmax和最小值φmin分別取0.9 和0.4,學(xué)習(xí)因子分別為η1=1.49 和η2= 1.49,粒子位置設(shè)定為yi(?)=[Ci(?)γi(?)ψi(?)]T,粒子位置最大值和最小值分別為ymax=600 和ymin=0.01,并采用混沌序列進(jìn)行粒子種群初始化。
②使用五折交叉驗(yàn)證產(chǎn)生訓(xùn)練集和驗(yàn)證集,將其平均分類準(zhǔn)確值作為適應(yīng)度。 將當(dāng)前計(jì)算的適應(yīng)度值與該粒子最優(yōu)位置的適應(yīng)度值進(jìn)行比較,選擇適應(yīng)度值較大粒子的位置作為新的。 將當(dāng)前計(jì)算的適應(yīng)度值與所有粒子最優(yōu)位置gbest(?)的適應(yīng)度值進(jìn)行比較,選擇適應(yīng)度值較大粒子的位置作為新的gbest(?)。
③根據(jù)式(10)和式(11)來更新每個(gè)粒子的位置。
④判斷yi(?)中的數(shù)據(jù)是否超出了范圍,若yi(?)中的數(shù)據(jù)大于ymax,取ymax,若yi(?)中的數(shù)據(jù)小于ymin,取ymin。 對(duì)最大迭代次數(shù)進(jìn)行檢驗(yàn),檢查當(dāng)前迭代次數(shù)大于等于?max時(shí),得到最優(yōu)參數(shù)gbest=[Cbestγbestψbest]T,反之則令?=?+1,繼續(xù)執(zhí)行步驟②~步驟④。
為防止單一降維造成信號(hào)特征的缺失,同時(shí)使用有監(jiān)督LFDA 和無監(jiān)督LPP 對(duì)特征進(jìn)行降維,并在決策級(jí)對(duì)最終處理后的數(shù)據(jù)進(jìn)行自適應(yīng)融合。 根據(jù)參考文獻(xiàn)[20],首先將運(yùn)用這兩種降維方式組成的輸出矩陣f(x)轉(zhuǎn)換成概率輸出矩陣,記為PI(x)
式中:c為類別數(shù)
融合權(quán)值計(jì)算方式為:
將每組分類器中的概率進(jìn)行加權(quán)處理,加權(quán)結(jié)果最大標(biāo)簽作為融合結(jié)果的輸出,即為:
本文使用UCI 數(shù)據(jù)庫(http:/ /archive.ics.uci.edu/ml/datasets/EMG+dataset+in+Lower+Limb),該數(shù)據(jù)庫提供了22 名18 歲以下的男性參與者下肢的4 通道EMG 數(shù)據(jù)和1 通道測角儀數(shù)據(jù),參與者中11人健康,11 人有膝關(guān)節(jié)病變(6 人前交叉韌帶損傷,4 人半月板損傷,1 人坐骨神經(jīng)損傷)。 采集股內(nèi)側(cè)肌、半腱肌、股二頭肌和股直肌的表面肌電信號(hào),并將測角器保持在膝關(guān)節(jié)外側(cè)。 分別記錄坐著伸膝、站立屈膝、平地行走3 種三種運(yùn)行方式的EMG 和膝關(guān)節(jié)角度。 最后把4 通道EMG 數(shù)據(jù)分成具有64 ms重疊的256 ms 窗口。
將預(yù)處理后的表面肌電信號(hào)提取時(shí)域、頻域、非線性特征,組成48 維特征,采用本文方法進(jìn)行下肢運(yùn)動(dòng)分類,其中正則化系數(shù)與核參數(shù)的范圍為0.01~600,最后使用三折交叉驗(yàn)證算法分類的準(zhǔn)確率,算法流程如圖1 所示。
圖1 算法流程圖
使用BP、KNN、ELM、KELM、KFWELM、GQPSOKFWELM 和本文方法對(duì)UCI 數(shù)據(jù)庫中的數(shù)據(jù)集進(jìn)行下肢運(yùn)動(dòng)識(shí)別,健康人群和患病人群的算法分類性能如表1 所示。 將多域特征直接輸入BP、KNN、ELM、KELM、KFWELM 和GQPSO-KFWELM 進(jìn)行訓(xùn)練測試;本文方法使用LFDA 和LPP 對(duì)48 維特征降維處理。
從表1 看出,在對(duì)健康人群和患病人群進(jìn)行坐著伸膝、站立屈膝、平地行走三種下肢運(yùn)動(dòng)識(shí)別中,相較于傳統(tǒng)的分類算法,KFWELM 的分類準(zhǔn)確性更高,說明構(gòu)建權(quán)重和模糊隸屬度可以提高KELM 處理特征值的能力,從而提高分類準(zhǔn)確率。 本文提出使用GQPSO 優(yōu)化KFWELM 的正則化系數(shù)和核參數(shù),實(shí)驗(yàn)結(jié)果表明,對(duì)健康人群和患病人群的三種下肢運(yùn)動(dòng)識(shí)別率與KFWELM 相比較,分別提高了0.022、0.008、0.011 和0.011、0.014、0.009,采用GQPSO-KFWELM 方法可以有效解決隨機(jī)選擇KFWELM的正則化系數(shù)和核參數(shù)所帶來的魯棒性差、分類準(zhǔn)確率降低等問題,提高了KFWELM 的泛化性能和分類準(zhǔn)確率。 本文方法的運(yùn)動(dòng)識(shí)別準(zhǔn)確率是最高的。 在GQPSO-KFWELM 的基礎(chǔ)上采用有監(jiān)督和無監(jiān)督降維、決策級(jí)融合的分類方法,有效地解決了多域特征的冗余性會(huì)造成GQPSO-KFWELM 分類性能下降的問題。
表1 本文方法與傳統(tǒng)方法的分類準(zhǔn)確率對(duì)比
表2 為本文方法與已發(fā)表且采用相同數(shù)據(jù)集驗(yàn)證的改進(jìn)算法性能對(duì)比。 本文提出的改進(jìn)算法可以有效提高坐著伸膝、站立屈膝、平地行走三種下肢運(yùn)動(dòng)識(shí)別準(zhǔn)確率。
表2 本文方法與已發(fā)表論文方法的分類準(zhǔn)確率對(duì)比
針對(duì)不同情況下獲取的表面肌電信號(hào)存在差異性等問題,本文提出了一種優(yōu)化KFWELM 的分類算法,以實(shí)現(xiàn)人體下肢運(yùn)動(dòng)分類。 為了消除肌電特征冗余及不相關(guān)的特征,同時(shí)避免單個(gè)降維造成特征信號(hào)的缺失,分別采用LFDA 有監(jiān)督降維和LPP 無監(jiān)督降維,使用改進(jìn)的GQPSO-KFWELM 對(duì)降維后的特征值進(jìn)行處理,避免正則化系數(shù)和核參數(shù)對(duì)KFWELM 的影響,最后使用決策級(jí)融合得到分類結(jié)果。 本文方法準(zhǔn)確度高,適合用于下肢運(yùn)動(dòng)分類。