彭韻陶,李健
(四川大學(xué)電子信息學(xué)院,成都 610065)
心電信號(hào)是心臟電活動(dòng)的綜合反映,心律失常是心電活動(dòng)極為常見但又非常重要的異常狀態(tài)。因此,心律失常的分類在心臟病診斷中具有重要意義[1]。
心電圖自動(dòng)分類大致分為三個(gè)步驟:預(yù)處理、特征提取和分類。第一階段,消除基線漂移和電力線干擾,將心電信號(hào)切割為心拍。第二階段,心拍的特征提取。由于不同人擁有不同心拍類型,不同類型心拍在形態(tài)上可能彼此相似,導(dǎo)致心拍分類異常困難。因此,ECG 特征提取方法尤為重要,主要包括三類:形態(tài)特征提取[2]、統(tǒng)計(jì)特征提取[3]和變換域特征提取[4-6]。最后,使用不同的分類器對(duì)不同心拍分類,如支持向量機(jī)[2-4]、隨機(jī)森林[6]和卷積神經(jīng)網(wǎng)絡(luò)[7-8]。
雖然心電圖分類已進(jìn)行大量研究,但仍存在問題。首先,美國(guó)醫(yī)療器械發(fā)展協(xié)會(huì)(AAMI)[9]已在1987年制定將心拍類型分組為5 類的標(biāo)準(zhǔn),但仍較少文章使用該標(biāo)準(zhǔn)對(duì)心拍分類。AAMI 標(biāo)準(zhǔn)建議同一病人心拍不應(yīng)同時(shí)出現(xiàn)在訓(xùn)練集和測(cè)試集,因?yàn)檫@不符合現(xiàn)實(shí)的醫(yī)學(xué)診斷。因此,按照該標(biāo)準(zhǔn),本文采用不將訓(xùn)練心拍和測(cè)試心拍混合的“患者間”方案。其次,大量研究存在使用過多特征造成識(shí)別耗時(shí)過長(zhǎng)或使用過少特征但識(shí)別精度下降的問題。
就上述問題,本文提出了一種所需特征量少且識(shí)別精度高的邏輯混沌投影矩陣與RR 間期結(jié)合的心拍分類算法。
ECG 數(shù)據(jù)從MIT-BIH 心律失常數(shù)據(jù)庫[10]中獲取,該數(shù)據(jù)庫包括48 條半小時(shí)的動(dòng)態(tài)ECG 記錄,記錄采樣頻率為360Hz。每條記錄包含兩個(gè)數(shù)據(jù)通道,第一數(shù)據(jù)通道為改良肢體導(dǎo)聯(lián)II(MLII),另一數(shù)據(jù)通道通常是 V1,V2,V5 或 V4 導(dǎo)聯(lián)。本文采用 MLII 導(dǎo)聯(lián)數(shù)據(jù)。MLII 導(dǎo)聯(lián)包含15 種不同的心拍類型,包括大約109500 心拍,其中70%為正常心拍,其余為異常心拍。根據(jù)AAMI 提出的評(píng)價(jià)ECG 分類器的標(biāo)準(zhǔn),將所有心拍形態(tài)分為五類:即正常搏動(dòng)(N)、室上性異位搏動(dòng)(S)、室性異位搏動(dòng)(V)、V 與 N 融合(F)以及未知搏動(dòng)類型(Q)。同時(shí),遵循 Chazal 等人[11]提出的 ECG 記錄劃分標(biāo)準(zhǔn),實(shí)現(xiàn)患者間的ECG 分類方案,其中訓(xùn)練數(shù)據(jù)集:101,106,108,109,112,114,115,116,118,119,122,124,201,203,205,207,208,209,215,220,223,230。測(cè)試數(shù)據(jù)集:100,103,105,111,113,117,121,123,200,202,210,212,213,214,219,221,222,228,231,232,233,234。
表1 根據(jù)AAMI 標(biāo)準(zhǔn)的MIT-BIH 心率失常數(shù)據(jù)集
本文心律失常自動(dòng)分類流程圖如圖1 所示。
(1)從MIT-BIH 數(shù)據(jù)庫中提取原始信號(hào),經(jīng)過預(yù)處理和分割,獲得去噪后的心拍。
(2)利用邏輯混沌投影矩陣獲取每個(gè)心拍的投影特征,同時(shí),兩維RR 間期特征被添加到最終特征矩陣中。
(3)使用隨機(jī)森林分類器對(duì)心拍分類。
此外,數(shù)據(jù)歸一化(Z-score)用于減少來自不同儀器和不同個(gè)體導(dǎo)致的心拍幅度偏差問題。
圖1 心律失常自動(dòng)分類流程圖
原始ECG 信號(hào)含有多種噪聲,為了去除這些噪聲,本文采用小波去噪方法,選擇“bior2.6”作為小波母函數(shù),分解層數(shù)設(shè)為8。原始信號(hào)被分解后,將最高頻率和最低頻率系數(shù)置零,以消除基線漂移和工頻干擾。心拍分割階段,由于分割精度高,本文在該領(lǐng)域未做出貢獻(xiàn),直接利用MIT-BIH 心律失常數(shù)據(jù)庫中提供的搏動(dòng)位置注釋,選擇搏動(dòng)位置之前100 個(gè)采樣點(diǎn)和之后的150 個(gè)采樣點(diǎn),組成一個(gè)心拍。圖2 展示了原始心拍和去噪心拍樣本,可觀察到基線漂移和工頻干擾已被去除。
圖2 心拍樣本
(1)投影矩陣
投影矩陣是壓縮感知理論的一部分。Candes 等人[12]和Donoho[13]為這種新穎的采樣方案奠定了理論基礎(chǔ)。該理論指出,只要信號(hào)在變換域中被壓縮或稀疏,就可以利用投影矩陣將高維信號(hào)投影到低維空間上。心電信號(hào)在時(shí)域上是稀疏信號(hào),因此投影矩陣能將心電信號(hào)投影到低維實(shí)現(xiàn)信號(hào)的壓縮和特征提取。
假設(shè)輸入信號(hào)為x ∈Rn,用m 個(gè)線性觀測(cè)向量投影,數(shù)學(xué)描述如下:
其中,φ 是 m×n 的矩陣,y ∈Rm。在本項(xiàng)研究中,y 為壓縮后的心拍數(shù)據(jù),x 為壓縮前的心拍數(shù)據(jù),φ 為邏輯混沌投影矩陣。通過上式,原心拍數(shù)據(jù)與混沌投影矩陣相乘后可獲得壓縮后的心拍數(shù)據(jù)。
邏輯混沌序列是一種常見的投影方法,通常用于壓縮數(shù)據(jù)。該方法序列定義如下:
其中,zj∈[0,1], j ∈ N(N ∈0,…,n×m-1) 。初始值z(mì)0=0.01。當(dāng)系統(tǒng)參數(shù)u=4 時(shí)邏輯映射為滿映射,所生成的混沌序列有良好的隨機(jī)性。邏輯混沌投影矩陣(φ)通過式(2)迭代獲得。
(2)RR 間期
前RR 間期和后RR 間期是ECG 信號(hào)的形態(tài)特征。前RR 間期為給定R 峰值與其前一個(gè)R 峰值之間的間隔。后RR 間期為當(dāng)前R 峰值和后一個(gè)R 峰值之間的間隔。心臟信號(hào)的前后RR 間期特征表示瞬時(shí)節(jié)律特征,對(duì)心臟疾病的診斷有著重要作用。
隨機(jī)森林(RF)是分類預(yù)測(cè)的有效工具,由Breiman[14]提出。RF 使用多個(gè)決策樹對(duì)樣本進(jìn)行分類,具有訓(xùn)練快,分類效果好的優(yōu)點(diǎn)。同時(shí),樹的棵樹通常是唯一的設(shè)置參數(shù)。
本文使用MATLAB 2010 軟件包,硬件配置包括Intel Core i5 處理器 CPU 2.50 GHz 和 6.00GB RAM。實(shí)驗(yàn)結(jié)果如表2 所示,使用五類心拍構(gòu)建多類混淆矩陣以提供不同類的錯(cuò)誤分類信息,可作為未來比較研究的基礎(chǔ)。
表3 顯示了基于MIT-BIH 心律失常數(shù)據(jù)庫的算法總結(jié)。Acharya 等人[7]和Zubair 等人[8]使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)心拍分類,分別達(dá)到94.03%和92.7%的準(zhǔn)確率。Kallas[3]等人利用KPCA 技術(shù)獲得97%的分類準(zhǔn)確率。然而,患者內(nèi)的心拍分類策略是不符合實(shí)際的,心拍分類方法應(yīng)遵循更公平的評(píng)估策略(患者間策略)。因此,本文側(cè)重于與采用病人間策略的研究比較[5,7,11,12]。
表4 所示,本文在分類“N”心臟病類型靈敏度優(yōu)于Herry 等人[5]和 Raj 等人[4],同時(shí),“V”類型靈敏度高于Chen 等人[2]和精確度高于 Raj 等人[5]。對(duì)于“F”型心臟病,分類準(zhǔn)確率優(yōu)于 Li 和 Zhou[6],Raj 等人[4]和 Chen 等人[2]。然而,當(dāng)對(duì)“S”型心臟病識(shí)別時(shí),本算法是不充分的,其原因可能是數(shù)據(jù)的不平衡。此外,與上述算法的識(shí)別準(zhǔn)確率和特征數(shù)量相比,本算法使用4 維特征在識(shí)別準(zhǔn)確率上高于使用6 個(gè)特征的文獻(xiàn)[5]和23 個(gè)特征的文獻(xiàn)[4]。與Chen[2]相比,本文在識(shí)別準(zhǔn)確率上低約1.5 百分點(diǎn),但特征數(shù)量減少8 倍。與Li 和Zhou[6]相比,本文在識(shí)別準(zhǔn)確率上低約3%,但特征數(shù)量減少17 倍。綜上所述,本算法具有所需特征數(shù)少且識(shí)別準(zhǔn)確率高的優(yōu)點(diǎn)。
表2 心拍分類混淆矩陣
表3 基于MIT-BIH 心律失常數(shù)據(jù)庫的算法總結(jié)
表4 本文與以往工作分類準(zhǔn)確率和特征數(shù)量的比較
隨著智能醫(yī)療設(shè)備的小型化及實(shí)時(shí)性需要,計(jì)算耗時(shí)被提出更高的要求,因此如何使采用較少特征數(shù)達(dá)到更高識(shí)別精度成為小型智能醫(yī)療設(shè)備亟待解決的問題,本文提出一種基于邏輯混沌投影矩陣與RR 間期相結(jié)合的算法,使用4 維特征獲得91.81%的識(shí)別準(zhǔn)確率,與現(xiàn)有算法相比,更適用于小型智能醫(yī)療設(shè)備。