李潤川 張行進(jìn) 王 旭 陳 剛,4* 冀沙沙 王宗敏*
1(鄭州大學(xué)產(chǎn)業(yè)技術(shù)研究院 河南 鄭州 450000)2(鄭州大學(xué)互聯(lián)網(wǎng)醫(yī)療與健康服務(wù)河南省協(xié)同創(chuàng)新中心 河南 鄭州 450000)3(解放軍信息工程大學(xué)數(shù)學(xué)工程與先進(jìn)計(jì)算國家重點(diǎn)實(shí)驗(yàn)室 河南 鄭州 450003)4(鄭州大學(xué)遠(yuǎn)程教育學(xué)院 河南 鄭州 450000)
心律失常(arrhythmia)是由于心臟活動(dòng)的起源或傳導(dǎo)受阻導(dǎo)致的心臟搏動(dòng)的頻率或節(jié)律異常,而引起的心電活動(dòng)異常癥狀。心電圖(electrocardiography,ECG)是被普遍采用的非侵入性檢查和診斷心律失常等多種心臟疾病的重要手段,在全世界的臨床中得到廣泛的應(yīng)用。最近,一些論文運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來檢測異常的心電信號[1-2]。通常該類方法所設(shè)計(jì)的CNN網(wǎng)絡(luò),更復(fù)雜,更深入、更廣泛。它們被設(shè)計(jì)用來自動(dòng)學(xué)習(xí)基于大量數(shù)據(jù)集的特征,進(jìn)一步增強(qiáng)CNN的處理能力。Acharya等[3]使用卷積神經(jīng)網(wǎng)絡(luò)來分析ECG信號。Kiranyaz等[4]使用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)來分類心搏形態(tài)。Rajpurkar等[5]采用多層卷積神經(jīng)網(wǎng)絡(luò)算法,通過便攜式心電貼檢測心律失常。übeyli等[6]將循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型用于心電圖心搏分類。但他們都沒有綜合考慮到心博的局部性與整體性特征的結(jié)合。LSTM模型是由Hochreiter等[7]提出的一種對RNN的改進(jìn)模型,它通過構(gòu)建專門的記憶單元來存儲(chǔ)歷史信息。LSTM模型是用來處理序列數(shù)據(jù)的,往往忽略未來的上下文信息,而雙向LSTM模型(Bidirectional LSTM,BiLSTM)結(jié)構(gòu)解決了這個(gè)問題,它給輸出層提供輸入序列中每一個(gè)點(diǎn)完整的過去和未來的上下文信息。注意力機(jī)制是文獻(xiàn)[8-9]中提出的一種模擬人腦注意力觀察的模型,它能夠通過計(jì)算注意力概率分布,對關(guān)鍵性輸入進(jìn)行突出,該模型被應(yīng)用到機(jī)器翻譯、文本分析等多個(gè)深度學(xué)習(xí)應(yīng)用領(lǐng)域,從而對傳統(tǒng)的模型起到良好的優(yōu)化和改進(jìn)作用[10]。
本文通過二進(jìn)樣條小波變換定位R波峰值位置,并在此基礎(chǔ)上提取QRS復(fù)合波數(shù)據(jù),以及RR間期的計(jì)算。本文使用了單心搏活動(dòng)特征,即單個(gè)心搏的QRS波群局部特征數(shù)據(jù)、單個(gè)心搏的RR間期整體特征數(shù)據(jù)(RR間期代表了當(dāng)前心搏活動(dòng)時(shí)長特征)構(gòu)建單心博活動(dòng)特征能更加全面地表征心搏形態(tài)信息。采用基于注意力機(jī)制的雙向LSTM(BiLSTM-Attention)神經(jīng)網(wǎng)絡(luò)算法對心搏形態(tài)進(jìn)行分類。通過BiLSTM-Attention計(jì)算模型實(shí)現(xiàn)網(wǎng)絡(luò)中神經(jīng)元之間的連接,建立更準(zhǔn)確客觀的心搏形態(tài)識別模型,并使用MIT-BIH心律失常臨床數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)驗(yàn)證[11]。
小波變換良好的空間和頻域定位特性使其能夠進(jìn)行信號多尺度詳細(xì)分析,研究人員已經(jīng)使用小波變換來實(shí)現(xiàn)精確和高效的R波峰值定位[12-15]。小波基函數(shù)和連續(xù)小波變換的基本定義如下:
(1)
(2)
式中:a為尺度因子,τ為平移因子。因a和τ是連續(xù)變換的值,所以稱其為連續(xù)小波變換。連續(xù)小波變換運(yùn)算過程復(fù)雜,所以將連續(xù)小波尺度因子進(jìn)行離散化處理。離散小波變換的平移不變性使其非常適合信號檢測,實(shí)際應(yīng)用時(shí)使用二進(jìn)小波變換:
(3)
一個(gè)常見心搏的完整波形主要由P波、QRS波以及T波組成,其波形形態(tài)如圖1所示。我們選擇二進(jìn)樣條小波來檢測R波的位置,這是由于其對稱性和正交性以及濾波器設(shè)計(jì)簡單的優(yōu)點(diǎn)。本文利用二進(jìn)樣條小波變換生成的模極大極小值來定位R波峰值點(diǎn),在此基礎(chǔ)上進(jìn)行RR間期的計(jì)算及QRS波群數(shù)據(jù)的提取。圖2顯示了R波峰值位置檢測的結(jié)果。
圖1 心電信號單心搏波形
圖2 R波峰值位置檢測的結(jié)果
基于圖2檢測出的R峰位置,我們從記錄中提取R峰處的187點(diǎn)片段,即為提取的單個(gè)心搏的局部特征。以當(dāng)前R點(diǎn)為參考向左搜索72個(gè)采樣點(diǎn),如果位置點(diǎn)存在,則記錄左端點(diǎn)坐標(biāo),否則停止搜索;再以當(dāng)前R點(diǎn)為參考向右搜索114個(gè)采樣點(diǎn),如果位置點(diǎn)存在,則記錄右端點(diǎn)坐標(biāo),否則停止搜索。我們默認(rèn)使用長度為187個(gè)采樣點(diǎn)的QRS波群段。其中在第188個(gè)樣本點(diǎn)處存儲(chǔ)RR間期的長度值,即為提取的單個(gè)心搏的整體特征。
長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)由三個(gè)門(輸入門、遺忘門和輸出門)及一個(gè)cell單元來實(shí)現(xiàn)歷史信息的更新和保留[7],在時(shí)刻t時(shí),輸入門會(huì)根據(jù)上一時(shí)刻LSTM單元的輸出結(jié)果ht-1和當(dāng)前時(shí)刻的輸入xt都作為輸入,表述為:
it=sigmoid(Wi·[ht-1,xt]+bi)
(4)
遺忘門會(huì)根據(jù)上一時(shí)刻隱藏層的輸出結(jié)果ht-1和當(dāng)前時(shí)刻的輸入xt作為輸入,來決定需要保留和舍棄的信息,實(shí)現(xiàn)對歷史信息的存儲(chǔ),可以表述為:
ft=sigmoid(Wf·[ht-1,xt]+bf)
(5)
對于當(dāng)前的候選單元記憶值是由當(dāng)前輸入數(shù)據(jù)xt和上一時(shí)刻LSTM隱藏層單元輸出結(jié)果ht-1決定的,可以表述為:
Cin=tanh(Wc·[ht-1,xt]+bc)
(6)
當(dāng)前時(shí)刻記憶單元狀態(tài)值Ct除了由當(dāng)前的候選單元Cin以及自身狀態(tài)Ct-1外,還需要通過輸入門和遺忘門對這兩部分因素進(jìn)行調(diào)節(jié),*為矩陣對應(yīng)元素相乘??梢员硎鰹椋?/p>
ct=ft*ct-1+it*cin
(7)
計(jì)算輸出門Ot,用于控制記憶單元狀態(tài)值的輸出,可以表述為:
ot=sigmoid(Wo·[ht-1,xt]+bo)
(8)
最后LSTM單元的輸出為ht,可以表述為:
ht=ot*tanh(ct)
(9)
在計(jì)算每個(gè)位置的隱藏矢量之后,我們將最后的隱藏矢量看作是ECG信號心搏特征的表示。
(10)
(11)
(12)
ut=tanh(wwht+bw)
(13)
(14)
st=∑tatht
(15)
式中:ht是上一層BiLSTM神經(jīng)網(wǎng)絡(luò)層的輸出向量,ww表示權(quán)重系數(shù),bw表示偏置系數(shù),ut表示ht所決定的能量值,at為各個(gè)隱藏層狀態(tài)在新的隱藏層狀態(tài)中所占比重大小的權(quán)重系數(shù),uw為表示隨機(jī)初始化的注意力矩陣,并在訓(xùn)練過程中不斷學(xué)習(xí),st為經(jīng)過Attention機(jī)制的輸出向量。輸出層的輸入是上一層Attention機(jī)制層的輸出,其采用softmax函數(shù)對輸出層的輸入進(jìn)行相應(yīng)計(jì)算,從而進(jìn)行心搏分類并輸出結(jié)果,具體公式如下:
yj=softmax(wjst+bj)
(16)
式中:wj表示Attention機(jī)制層到輸出層的待訓(xùn)練的權(quán)重系數(shù)矩陣,bj表示待訓(xùn)練相對應(yīng)的偏置,yj為輸出的心搏預(yù)測類型?;谧⒁饬C(jī)制的雙向LSTM模型中注意力機(jī)制層與前向傳播層和后向傳播層通過ht計(jì)算連接,可以充分發(fā)揮Attention機(jī)制的模型優(yōu)勢。BiLSTM-Attention模型工作過程示意圖如圖3所示。
圖3 基于Attention機(jī)制的Bi-LSTM模型
本實(shí)驗(yàn)先將ECG數(shù)據(jù)通過雙正交小波變換方法去噪;再采用二進(jìn)樣條小波變換檢測R波峰值,進(jìn)而計(jì)算RR間期并抽取QRS復(fù)合波數(shù)據(jù);然后通過BiLSTM-Attention模型分析數(shù)據(jù);最后輸出分類結(jié)果。該實(shí)驗(yàn)流程如圖4所示。
圖4 實(shí)驗(yàn)流程圖
心搏分類的問題可以定義為對ECG心搏時(shí)序信號B=[b1,b2,…,bn]的輸入序列進(jìn)行分類的任務(wù),輸出標(biāo)簽C=[c1,c2,…,c5]序列的每個(gè)ci是C的不同心搏類型之一。每個(gè)輸出標(biāo)簽對應(yīng)于輸入的一個(gè)心搏活動(dòng)特征。我們使用BiLSTM-Attention模型在監(jiān)督學(xué)習(xí)框架中以端到端的方式解決這個(gè)問題。損失函數(shù)是ECG心搏分類的交叉熵誤差,可以表示為:
(17)
為了訓(xùn)練模型,Nadam方法被應(yīng)用。Nadam類似于帶有Nesterov動(dòng)量項(xiàng)的Adam(Adaptive Moment Estimation)。Adam算法是隨機(jī)梯度下降算法(SGD)的優(yōu)化,被廣泛用于深度學(xué)習(xí)中。SGD就是逐次迭代計(jì)算mini-batch的梯度,主要公式為:
gt=▽θt-1f(θt-1)
(18)
Δθt=-ηgt
(19)
式中:η是學(xué)習(xí)率,gt表示t時(shí)刻的梯度。SGD選擇合適的學(xué)習(xí)率比較困難,容易收斂到局部最優(yōu)。Adam結(jié)合了AdaGrad和RMSProp算法最優(yōu)的性能,它能夠提供解決稀疏梯度和噪聲問題的優(yōu)化方法。其中Adam的計(jì)算公式如下:
mt=μ·mt-1+(1-μ)·gt
(20)
(21)
(22)
(23)
(24)
式中:μ是動(dòng)量因子;為平滑項(xiàng),以防止除數(shù)為零;mt和nt分別是對梯度的一階矩估計(jì)和二階矩估計(jì),可以看作對期望E|gt|和的估計(jì);和是對mt和nt的修正,這樣就能夠近似為對期望的無偏估計(jì)。Nadam在公式上的變化如下:
(25)
mt=μt·mt-1+(1-μt)·gt
(26)
(27)
(28)
(29)
可以看出,Nadam相對Adam提高了收斂速度,對學(xué)習(xí)率有了更強(qiáng)的約束[16]。
本文使用MIT-BIH心律失常數(shù)據(jù)庫[11],依據(jù)ANSI/AAMI EC57:2012標(biāo)準(zhǔn)將所有心搏數(shù)據(jù)分為N(正常或者束支傳導(dǎo)阻滯心搏)、S(室上性異常心搏)、V(心室異常心搏)、F(融合心搏)4類。如表1所示,本文對MIT-BIH心律失常數(shù)據(jù)庫中標(biāo)Ⅱ?qū)?lián)通道中的89 538個(gè)心搏進(jìn)行分類,從中隨機(jī)抽取90%的數(shù)據(jù)集用于訓(xùn)練,10%的數(shù)據(jù)集用于測試。81 693個(gè)心搏被專家記錄為N類型,其中的73 502個(gè)被用于訓(xùn)練,8 191個(gè)被用于測試。2 561個(gè)心搏被記錄為S類型,其中2 295個(gè)用于訓(xùn)練,266個(gè)用于測試。4 519個(gè)心搏被記錄為V類型,其中4 073個(gè)用于訓(xùn)練,446個(gè)被用于測試。只有765個(gè)心搏被記錄為F類型,其中709個(gè)用于訓(xùn)練,56個(gè)用于測試??梢钥闯觯瑢?shí)驗(yàn)是在不平衡樣本下進(jìn)行的,不同類型的心搏個(gè)數(shù)有很大的不同。N型數(shù)量大約是S型數(shù)量的32倍,V型數(shù)量的18倍,F(xiàn)型數(shù)量的107倍。
表1 實(shí)驗(yàn)數(shù)據(jù)分布情況
(30)
(31)
(32)
本實(shí)驗(yàn)是在具有i7-7700K處理器和32 GB RAM的PC上使用tensorflow-gpu 1.11.0[17]及Keras 2.2.4和MATLAB 2017b開發(fā)工具進(jìn)行的。表2顯示了實(shí)驗(yàn)分類的混淆矩陣結(jié)果,其中N、S、V、F代表醫(yī)生標(biāo)注的心搏類型,n、s、v、f代表模型預(yù)測出的心搏類型。
表2 心搏分類結(jié)果統(tǒng)計(jì)
表3 本實(shí)驗(yàn)與其他實(shí)驗(yàn)結(jié)果的比較 %
上述分析表明,本文基于單心搏活動(dòng)特征與BiLSTM-Attention模型的心律失常檢測方法在心搏類型識別上的精確性得到了提高,受數(shù)據(jù)集的不平衡影響較小,對正常或束支傳導(dǎo)阻滯、室上性異常心搏和心室異常心搏識別度高,對融合心搏也有一定的識別度,有利于準(zhǔn)確識別心律失常,在動(dòng)態(tài)心電圖分析領(lǐng)域具有明顯的臨床意義和實(shí)用性。
心電圖的高精度診斷可以為心臟病患者的臨床監(jiān)測、診斷和治療提供客觀依據(jù),減輕醫(yī)生的工作量,使臨床醫(yī)生減少誤診的次數(shù)并節(jié)省不少的時(shí)間,進(jìn)而提高心電診療工作的效率。本文使用了單心搏活動(dòng)特征,既包含單心博的局部特征,又包含單心搏的整體特征,能更精確地識別異常心搏。但由于數(shù)據(jù)的不平衡性,F(xiàn)類型心搏識別的精度還有待提高,我們將會(huì)不斷探索更有效的檢測方法,從而幫助醫(yī)生得到更準(zhǔn)確的診斷結(jié)果。