王 鳳, 潘廣貞, 孫艷青
(中北大學 軟件學院,山西 太原 030051)
心電(electrocardiogram,ECG)信號是心臟系統(tǒng)生物電活動的記錄,通過分析ECG信號模式,可以診斷心率失常[1]。ECG信號中的波形特征,在正常搏動和心率失常搏動中不同,在不同病患身上會表現(xiàn)出不同形態(tài),同一個體在不同條件下正常心跳常表現(xiàn)出不同形態(tài),使得心率失常識別更加困難,因此,提升ECG識別準確度尤為重要[2~4]。
心電分類過程為預處理、特征提取和分類。文獻[5]提出基于數(shù)學形態(tài)學及機器學習心率失常識別;文獻[6]采用經(jīng)驗模式分解(empirical mode decomposition,EMD)法選擇ECG信號特征,并結(jié)合支持向量機(support vector machine,SVM)分類;文獻[7]使用基于塊的神經(jīng)網(wǎng)絡將ECG心跳分為5類;文獻[8]用離散余弦變換提取ECG心跳特征,并采用費舍爾線性判別器對心率失常進行檢測和分類。
特征選擇對心率失常識別有重要作用。上述特征選擇方法基于時域或頻域特征,只能在一定程度上反映ECG心跳特征,而基于非線性動力學參數(shù)的特征提取方法在生理信號處理中取得良好效果,卻在ECG心跳中少有涉及[9]。動力學特征能顯示ECG更深層次的信息,包含了ECG全部信息。不同類別心跳在不同時間尺度上表現(xiàn)出不同復雜度,因此本文提出將ECG心跳的模糊熵作為特征度量輸入徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡,從而實現(xiàn)ECG分類的算法。
為了對ECG心跳進行深層次特征提取,將經(jīng)過預處理的ECG心跳分解為若干分量,集合EMD(ensemble EMD,EEMD)方法能夠根據(jù)信號自身特點分解信號,具有良好抗模態(tài)混疊性能[9,10]。該方法在處理生物信號時具有獨特優(yōu)勢,通過對原始信號執(zhí)行多次EMD,在加入每次分解白噪聲,將每次EMD得到的內(nèi)蘊模態(tài)函數(shù)(intrinsic modal function,IMF)分量求和再取平均得到最終IMF分量[11]。
ECG心跳經(jīng)EEMD得到IMFs分量,模糊熵作為ECG心跳動力學特征可以反映ECG心跳特點,故提取有效IMFs分量模糊熵作為特征值。熵是用來衡量信號復雜度的非線性方法,其值越大代表序列復雜度越大,一般定義為[12]:
4)最終計算出的模糊熵為FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)。
序列長度N,模式維數(shù)m和相似容限r(nóng)的選取直接影響實驗結(jié)果。大量實驗表明,N=1 000,m=1或2,r=(0.1~0.25)Std(Std為x(i)(i=1,2,…,N)的標準差),才能保證有效統(tǒng)計特性和較小誤差。
所提心電分類算法流程如圖1所示。
圖1 算法總體流程
實驗平臺MATLAB 10.0搭建在Windows 7操作系統(tǒng)上。實驗對5種常見ECG心跳進行識別,分別為:正常心跳(normal),左束支傳導阻滯(LBBB),右束支傳導阻滯(RBBB),房性早搏(APC)和室性早搏(PVC)。
采用F值(Fmeasure)和總精確度(Acc)對識別效果進行性能評估
(1)
式中TPi為正確分類為第i類的心跳數(shù),TNi為本不屬于第i類的且不被分為第i類的心跳數(shù)目,FPi為本不屬于第i類卻被錯誤劃分為該類的心跳數(shù)目,FNi為本該屬于第i類卻被劃分到其他類的數(shù)目,NT為總分類文件數(shù)目,NE為總分類文件中被錯誤分類的數(shù)目。
ECG數(shù)據(jù)源取自MIT-BIH Arrthythmia 數(shù)據(jù)庫導聯(lián)II(MLII),采樣頻率為360 Hz。選取5種不同心跳類型,在每種類型ECG心跳中各選取120組樣本(每個樣本以R波為基準點,向前、向后共取300個采樣點),將數(shù)據(jù)集分為訓練集和測試集。得到訓練集與測試集樣本數(shù)量均為300組,樣本集劃分如表1所示。
表1 MIT-BIH數(shù)據(jù)集
2.3.1 特征提取
以MIT-BIH/100號為例,對其EEMD得到各IMFs分量,各IMF分量未見模態(tài)混疊,且各分量QRS波群集,分解效果比較理想。大量實驗證明,第2~6個IMFs分量與原始信號最為相關(guān),說明這5個分量包含ECG心跳主要特征信息,以MIT-BIH/100為例,選取這5個分量進行重構(gòu)。圖2為原始信號和重構(gòu)信號對比,可見重構(gòu)信號良好保留ECG心跳峰值和特征,所以選取IMF2~IMF6 5個IMF分量作為提取模糊熵的分量。
圖2 IMF2~IMF6重構(gòu)信號
由于樣本數(shù)量較多,僅在每種類型心跳中各選取2組測試樣本,并分別對5個IMF分量計算模糊熵值,本文取N=300,m=2,r=0.2 Std。計算結(jié)果如表2所示。
表2 各IMF分量模糊熵值
實驗結(jié)果表明各類型心跳模糊熵有明顯區(qū)別,不同類型心跳在不同時間尺度上表現(xiàn)出不同熵值,故可以用此作為特征值區(qū)別不同心跳類型。
圖3為各心跳類型10組數(shù)據(jù)的IMF2分量對比,可見不同心跳類型的模糊熵差異。其中,Normal型心跳的IMF分量模糊熵最大,這是因為Normal型心跳隨機性大。
圖3 IMF2分量的模糊熵
2.3.2 心率失常識別
將IMF2~IMF6分量模糊熵組成的特征向量送入RBF神經(jīng)網(wǎng)絡進行識別。圖4為數(shù)據(jù)集分類結(jié)果,其中縱坐標1~5分別表示Normal,LBBB,RBBB,PVC,APC心跳類型。
圖4 分類結(jié)果
圖4顯示300組測試集中錯誤識別6組數(shù)據(jù)。其中,Normal類型樣本全部分類正確,1個LBBB樣本被錯誤劃分為RBBB類型,1個RBBB樣本被錯誤劃分為PVC類型,1個PVC樣本被錯誤劃分為LBBB類型,2個PVC樣本被錯誤劃分為RBBB類型,1個APC樣本被錯誤劃分為Normal類型。結(jié)果表明,所提算法可以有效分類5種心跳。
由分類結(jié)果計算得到F值和Acc如表3所示。
表3 性能指標
可知,該分類方法具有較高準確率,對不同類別心跳均有效,其中對Normal類型的識別精確度達到100 %,對PVC類型識別精確度不高與其病癥特點不明顯有關(guān)。
為進一步顯示該算法在心率失常識別上的優(yōu)越性,分別采用模糊熵、EMD多尺度模糊熵和本文方法進行性能對比,對比結(jié)果如表4所示。性能指標顯示,本文方法提取的特征量能更好地反映ECG心跳特點。
表4 各方法心律失常識別率對比 %
基于多尺度模糊熵和RBF神經(jīng)網(wǎng)絡的心電分類算法,可以對ECG進行特征提取和模式識別。采用EEMD對ECG進行多尺度分解,將有效IMF分量的模糊熵組合成特征向量以分類5種不同ECG心跳。實驗結(jié)果表明該方法能夠有效地提高心電分類準確率。這種分類識別方法還可以應用到其它類似生物信號處理上,但由于數(shù)據(jù)局限于MIT-BIH數(shù)據(jù)庫,存在樣本類別不平衡問題,對病人適應性未知。這也是下一步要探究的問題。