徐 利,徐久強,馮家樂
1(東軟集團(tuán)股份有限公司 研究院,沈陽 110179)
2(東北大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,沈陽 110819)E-mail:xu-li@neusoft.com
心電信號中包含了大量用于診斷心臟疾病的生理信息.由于體表心電信號是一種弱電信號,在采集過程中易受外界干擾,因此降噪成為心電信號預(yù)處理中最重要的一環(huán).小波變換作為一種時頻分析方法,是研究非平穩(wěn)、非線性信號的熱點,已有大量基于小波變換的降噪方法被提出[1].但小波存在一定的局限性,如小波基的選取、固定的基函數(shù)等會影響基于小波的ECG降噪效果.經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)[2]是一種完全根據(jù)信號特點進(jìn)行時頻分析的方法,利用EMD分解含高斯噪聲信號時其作用類似于一組二進(jìn)濾波器[3].在基于EMD方法的降噪研究方面,Kopsinis Y等人提出了間期閾值和模態(tài)單元的概念并基于間期閾值和模態(tài)單元進(jìn)行濾波[4].
近年來,隨著物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,對信號傳感器的要求越來越高,信號降噪方面的研究也越來越活躍,出現(xiàn)了許多基于EMD降噪改進(jìn)算法.如:使用EMD將信號分解為若干本征模態(tài)函數(shù)(Intrinsic mode function,IMF),再通過組合這些IMF以達(dá)到低通、高通、帶通濾波效果的重構(gòu)法[5];直接對IMF進(jìn)行濾波然后再重構(gòu)的IMF濾波法[6];改進(jìn)的區(qū)間閾值法與迭代法相結(jié)合的基于EEMD的去噪方法[7];利用相關(guān)性分析去除IMF分量中的噪聲分量,對剩余的IMF分量分量進(jìn)行小波包能量處理后在進(jìn)行信號重構(gòu)的方法[8];基于完全集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN)聯(lián)合排列熵(PE)的BCG降噪方法[9]等.盡管上述方法都取得了較好的效果,但仍存在以下問題:重構(gòu)法會丟失信號的高頻細(xì)節(jié),類小波閾值法和IMF直接濾波法忽略了IMF的物理意義,直接使用會導(dǎo)致信號某些物理特征的丟失.這些方法用于ECG降噪會存在某些點不連續(xù)的問題.也有基于深度學(xué)習(xí)的各種研究方法[10],但用于ECG降噪效果都不理想.
針對上述問題,本文提出基于自適應(yīng)白噪聲的完備總體經(jīng)驗?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)并結(jié)合ECG特點進(jìn)行閾值選取的解決方案.該方案使得降噪后不連續(xù)的點有所減少,信噪比也相對提高了,另外本文提出的解決基線漂移的方法,也有效解決了低頻噪聲干擾的問題.
含噪聲的數(shù)字信號x(t)可以描述如下:
(1)
CEEMDAN方法是基于EMD的一種優(yōu)化的分解算法,具體步驟如下:
1)在信號x(t)中添加不同幅值高斯白噪聲nk(t)得到若干新的信號,xk(t)=x(t)+σknk(t).
2)利用EMD方法對xk(t)進(jìn)行分解得到他們的第一個IMF,然后計算他們的平均值:
(2)
4)記Ej(?)為對信號進(jìn)行EMD分解操作后的第j個IMF分量,則第二個IMF獲取方式為:
(3)
5)依次類推計算L個剩余分量為:
(4)
第L+1個IMF為:
(5)
一直分解到剩余分量為單調(diào)函數(shù),即不滿足EMD分解條件時,分解過程結(jié)束.
6)最后,原始心電信號被表示為:
(6)
R(t)為剩余分量.
心電信號經(jīng)過上述過程分解后,較高頻率的信號會分布在前幾層IMF中,例如,QRS波群、T波和高頻噪聲,最后幾層中包含低頻細(xì)節(jié),例如基線.
針對高頻噪聲的降噪.在這里假設(shè)CEEMDAN分解得到的IMFs的第一層是高頻噪聲含量最多的[3],因此可根據(jù)第一層所含噪聲的能量估算剩下IMFs的能量:
(7)
(8)
相關(guān)文獻(xiàn)通過對噪聲能量的研究,得出第k層IMF的閾值估計式:
(9)
這里B是個常數(shù)[4],一般取0.7,M是IMF的長度.
和小波閾值法降噪很相似,EMD降噪也用到了閾值降噪,但小波閾值法是直接針對每一層中的小波系數(shù)進(jìn)行的賦值處理.直接對IMF進(jìn)進(jìn)行軟(硬)閾值處理會對重構(gòu)信號的連續(xù)性產(chǎn)生災(zāi)難性后果.
文獻(xiàn)[4]中提出了間期閾值法的概念.
(10)
(11)
(12)
在文獻(xiàn)[7]提出了一種基于EEMD和改進(jìn)區(qū)間閾值的方法,其改進(jìn)的閾值函數(shù)如下:
(13)
(14)
其中α為可調(diào)節(jié)參數(shù),文獻(xiàn)中給出的值為5.這種方法在心電信號降噪時會出現(xiàn)在某些情況下一些關(guān)鍵點出現(xiàn)不連續(xù),會導(dǎo)致疾病的誤診,如圖1所示.
圖1 EEMD-MIT方法降噪
針對2.4節(jié)中所提文獻(xiàn)存在的問題,本文提出了一種改進(jìn)區(qū)間閾值的方法.閾值函數(shù)如下:
(15)
(16)
(17)
迭代在降噪中是種非常強力的策略,通過多次的迭代可以進(jìn)一步削減噪聲的影響,于是本文進(jìn)一步改進(jìn)了降噪的策略,提出CEEMDAN-MIIT算法.具體步驟如下:
1)利用CEEMDAN對原始含噪聲的信號進(jìn)行分解x(t).
4)利用后L-1個IMF進(jìn)行重構(gòu)得到新的數(shù)據(jù):
5) 隨機(jī)改變hn(1)(t)的位置得到新的噪聲數(shù)據(jù):
6)將新的噪聲數(shù)據(jù)加入xp(t)中得到xa(t):
圖2展示了迭代次數(shù)為4和10的降噪效果以及隨著迭代次數(shù)的變化,降噪后信噪比的變化.其中心電信號選擇的是MIT-BIH中107號數(shù)據(jù),添加噪聲為10dB.
圖2 CEEMDAN-MIIT降噪效果與迭代次數(shù)的聯(lián)系
在心電信號中的基線漂移是一種變換緩慢干擾信號,可以被認(rèn)為是一種低頻噪聲,其頻率一般在1.5Hz以下[11],因此基線漂移成分主要分布最后幾層IMF.由于心電信號的主要成分集中在前幾層IMF中,所以直接丟棄包含基線漂移信號的IMF對原始信號的影響很小,故關(guān)鍵問題在于如何確定基線漂移所在的IMF.本文利用過零率來判斷哪些IMF為基線漂移的成分,過零率的計算公式如下:
(18)
其中tn為要計算的信號,sgn為符號函數(shù),即:
具體過程如下:
1)對每個分解得到的IMF計算過零率.
2)丟棄過零率低于1.5的IMF.
3)疊加剩余IMF重構(gòu)信號.
在本文實驗中,使用來自MIT-BIH心律失常數(shù)據(jù)庫的mitdb/100、mitdb/105、mitdb/107、mitdb/108、mitdb/203和mitdb/223評估所提出方法的性能,降噪的效果使用信噪比(signal to noise ratio,SNR)和均方根誤差(root mean square error,RMSE)來衡量,公式如下:
(19)
(20)
在上述兩個公式中x(n)是原始信號,x′(n)是降噪后的信號,N是樣本的數(shù)量.本文實驗中樣本數(shù)量均選擇隨機(jī)挑選的十秒鐘,其中采樣頻率為360Hz.
圖3和圖4是mitdb/107在添加不同分貝高斯噪聲后4種方法的降噪對比圖,從圖中可以看出4種算法中,在添加噪聲分貝值較低的情況下,本文提出的兩種方法均好于文獻(xiàn)[7]中提出的方法,在添加噪聲分貝較高時,文獻(xiàn)中提出的迭代EEMD-MIT要好于CEEMDAN-MIT但始終低于本文的迭代CEEMDAN-MIT.表1給出了4種方法對mitdb/100、mitdb/105、mitdb/108、mitdb/203和mitdb/223進(jìn)行降噪處理后信噪比的對比,可以從表中看出,4種降噪方法的效果與圖4表現(xiàn)的一致.
圖3 降噪后RMSE
表1 不同信號降噪后的信噪比
圖4 降噪后SNR
圖5展示了使用過零率來去除基線漂移.其中使用的是mitdb/107在添加mitdb 噪聲測試數(shù)據(jù)庫中真實的基線漂移信號后得對比,從圖中可以看出,添加的基線漂移的信號中還包含著高頻噪聲,去除基線漂移后,對信號的高頻部分影響甚微.
圖5 去除基線漂移
本文提出了一種改進(jìn)區(qū)間閾值法與CEEMDAN相結(jié)合的方法CEEMDAN-MIT去除高頻噪聲,另外迭代的CEEMDAN-MIT進(jìn)一步地改進(jìn)了降噪的效果.本文提出的算法相對于文獻(xiàn)[7]和文獻(xiàn)[9]所提出的方法降噪后不連續(xù)的點有所減少,相對于文獻(xiàn)[7]所提出的方法信噪比也相對提高了.另外本文還基于文獻(xiàn)[11]提出的過零率的概念提出了一種解決基線漂移的方法,有效解決了低頻噪聲的干擾.