齊繼 ,張瑞卿,沈陽(yáng),常世杰,沙憲政
心臟傳導(dǎo)阻滯指由于心肌傳導(dǎo)組織發(fā)生病理性改變,導(dǎo)致起搏細(xì)胞發(fā)出的動(dòng)作電位的傳遞出現(xiàn)障礙,產(chǎn)生傳導(dǎo)被阻或傳導(dǎo)延緩的現(xiàn)象,是心律失常的表征之一。心臟傳導(dǎo)阻滯常見于急性心肌梗死、病毒性心肌炎、心內(nèi)膜炎等心血管病[1]。心臟傳導(dǎo)阻滯按部位分為完全左、右束支阻滯,不完全左、右束支阻滯,及左前分支、左后分支阻滯,按嚴(yán)重程度分為Io、IIo和IIIo傳導(dǎo)阻滯[2]。對(duì)于大多數(shù)心臟傳導(dǎo)阻滯的診斷,臨床檢查最常用的方法是心電圖。利用傳統(tǒng)的數(shù)字信號(hào)處理方法,如小波變換等對(duì)心電數(shù)據(jù)進(jìn)行處理,能夠達(dá)到較高的識(shí)別率[3]。但如果想利用數(shù)字信號(hào)處理的方法識(shí)別心電數(shù)據(jù)特征,則需要人工提取每一種特征。深度學(xué)習(xí)技術(shù)使用大數(shù)據(jù)對(duì)設(shè)計(jì)的模型進(jìn)行訓(xùn)練,使得模型能夠自動(dòng)提取數(shù)據(jù)之間隱含的特征,進(jìn)而能夠識(shí)別心電信號(hào)所表現(xiàn)出的疾病。
在心電識(shí)別領(lǐng)域,KIRANYAZ等[4]基于MIT-BIH數(shù)據(jù)庫(kù),利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)[5]模型進(jìn)行訓(xùn)練,對(duì)心室異位節(jié)拍的識(shí)別準(zhǔn)確率為99%,對(duì)室上性異位節(jié)拍的識(shí)別準(zhǔn)確率為97.4%; RAJPURKAR等[6]基于實(shí)驗(yàn)室構(gòu)建的心電數(shù)據(jù)庫(kù),利用CNN模型對(duì)14種心律失常數(shù)據(jù)進(jìn)行研究,得到80.9%的平均識(shí)別準(zhǔn)確率;ISIN等[7]基于MIT-BIH數(shù)據(jù)庫(kù),利用CNN對(duì)MIT-BIH數(shù)據(jù)進(jìn)行三分類,得到92.4%的準(zhǔn)確率。目前,還沒(méi)有心臟傳導(dǎo)阻滯定位的相關(guān)研究。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是人工智能應(yīng)用的一部分,在圖像分析、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域均表現(xiàn)出強(qiáng)大的性能。其主要框架[8-12]有卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)等,其中CNN在數(shù)據(jù)識(shí)別中的應(yīng)用較為廣泛,CNN的變體如GoogLeNet[13]、VGG[14]、ResNet[15]等網(wǎng)絡(luò),對(duì)于復(fù)雜數(shù)據(jù)有更好的分類效果。本文在CNN的基礎(chǔ)上提出多分辨率稀疏連接殘差網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠應(yīng)用于心臟傳導(dǎo)阻滯定位的自動(dòng)識(shí)別,并可以輔助醫(yī)生進(jìn)行心血管疾病的診斷,有一定的臨床意義。
CNN是一種復(fù)雜的神經(jīng)網(wǎng)絡(luò)(如圖1所示),它的中間層有若干組卷積層與池化層組成,卷積層對(duì)輸入層數(shù)據(jù)進(jìn)行卷積運(yùn)算,產(chǎn)生特征映射圖,完成局部特征提取的第一步,確定局部特征與其他特征之間的位置關(guān)系,然后根據(jù)池化窗口的大小,對(duì)特征映射圖進(jìn)行池化操作,融合相似的局部特征,再通過(guò)激活函數(shù)得到特征映射圖。用同樣的方法進(jìn)行n次卷積和池化操作,最后輸入到全連接層,得到輸出。
圖1 卷積神經(jīng)網(wǎng)絡(luò)Fig.1 Convolutional neural network
CNN的卷積層和池化層可以用下式表示:
其中,yjl表示第l層的j個(gè)輸出,Mj表示特征映射圖的集合,f是激活函數(shù),k為權(quán)值矩陣的對(duì)應(yīng)值,b表示加法偏置,β表示乘法偏置,down表示下采樣函數(shù)。
ResNet是CNN的一種變體,用來(lái)解決退化以及網(wǎng)絡(luò)過(guò)深時(shí)無(wú)法訓(xùn)練的問(wèn)題[15]。 如圖2所示,ResNet 的主要特點(diǎn)是跨層連接,它通過(guò)引入短連接技術(shù)將輸入跨層傳遞后與卷積之后的結(jié)果相加。ResNet 使得底層的網(wǎng)絡(luò)能夠得到充分訓(xùn)練,準(zhǔn)確率也隨著深度的加深而得到顯著提升。
通過(guò)預(yù)實(shí)驗(yàn),利用上述傳統(tǒng)方法處理心臟傳導(dǎo)阻滯數(shù)據(jù)時(shí),遇到了網(wǎng)絡(luò)模型在訓(xùn)練過(guò)程中無(wú)法收斂的問(wèn)題。
圖2 殘差網(wǎng)絡(luò)模塊Fig.2 A block of residual networks
本研究設(shè)計(jì)了如圖3所示的網(wǎng)絡(luò)結(jié)構(gòu),它有1個(gè)輸入層和1個(gè)輸出層,隱藏層由1個(gè)卷積層、2個(gè)最大池化(Max Pool)層和3組ResNet模塊構(gòu)成,每組ResNet模塊含有10個(gè)卷積層,本網(wǎng)絡(luò)結(jié)構(gòu)共有31個(gè)卷積層。卷積核的大小是1×9。第一個(gè)卷積層對(duì)應(yīng)的輸出節(jié)點(diǎn)數(shù)為32,每組ResNet模塊分別對(duì)應(yīng)128、128、256個(gè)輸出節(jié)點(diǎn)。
圖3 稀疏連接殘差網(wǎng)絡(luò)Fig.3 Sparsely connected ResNet
訓(xùn)練步驟如下:
(1)訓(xùn)練集數(shù)據(jù)進(jìn)入第1層卷積層,通過(guò)修正線性單元(Recitified Linear Units,ReLU)函數(shù)進(jìn)行激活,ReLU可以有效克服梯度消失問(wèn)題,并提高訓(xùn)練效率[16]。
(2)第2層為最大池化(Max Pool)層,再通過(guò)ReLU激活后的輸出分為兩個(gè)支路,其中一個(gè)支路繼續(xù)沿著主框架向下進(jìn)行訓(xùn)練,另一個(gè)支路保留數(shù)據(jù)信息,連接到第1組ResNet 模塊的輸出端。
(3)第1組的ResNet 模塊間的輸出分為兩個(gè)支路,其中一條支路經(jīng)ReLU激活函數(shù)和Max Pool層處理后,沿主框架向下訓(xùn)練,另一條支路直接連接到第2組 ResNet 模塊的輸出端。
(4)第2組的ResNet 模塊間的輸出分為兩個(gè)支路,其中一條支路經(jīng)ReLU激活后,沿主框架向下訓(xùn)練,另一條支路直接連接到第3組 ResNet 模塊的輸出端。
(5)最后通過(guò)平均池化(Average Pool)層、全連接層和softmax分類器得到最終輸出。
需要指出的是,每個(gè)卷積層之后都伴隨一個(gè)批量歸一化(Batch Normalization,BN)層,BN層是一種訓(xùn)練優(yōu)化方法,用來(lái)解決Covariate Shift的問(wèn)題,即把每層網(wǎng)絡(luò)任意神經(jīng)元的輸入值限制為均值為0方差為1的正態(tài)分布,使得梯度變大,訓(xùn)練過(guò)程收斂快,加快訓(xùn)練速度,避免梯度消失問(wèn)題[17]。
這里將該網(wǎng)絡(luò)結(jié)構(gòu)稱為稀疏連接殘差網(wǎng)絡(luò)(Sparsely Connected ResNet,RSCR)。
本文采用MIT-BIH標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練和驗(yàn)證。
MIT-BIH是美國(guó)麻省理工學(xué)院提供的研究心律失常的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)采集了48位患者的心電數(shù)據(jù)并以心拍的形式進(jìn)行記錄,采樣率為360 Hz。本文根據(jù)MIT-BIH數(shù)據(jù)注釋文件的特點(diǎn)設(shè)計(jì)提取的規(guī)則為:選擇二導(dǎo)聯(lián)數(shù)據(jù),先找到注釋文件中標(biāo)注阻滯注釋的心拍,之后以此為中心截取10 s的數(shù)據(jù)長(zhǎng)度,形成一個(gè)樣本,每條樣本提取3 600個(gè)電位數(shù)據(jù),之后進(jìn)行線性插值運(yùn)算,使每個(gè)樣本具有5 600個(gè)數(shù)據(jù)點(diǎn),從而實(shí)現(xiàn)數(shù)據(jù)的擴(kuò)增。
從MIT-BIH數(shù)據(jù)庫(kù)提取的訓(xùn)練集與測(cè)試集數(shù)據(jù)分布如表1所示,訓(xùn)練集數(shù)據(jù)有右束支傳導(dǎo)阻滯(RBBB)、左束支阻滯(LBBB)和正常(NORMAL)心電數(shù)據(jù)各1 000條,共計(jì)3 000條;測(cè)試集有RBBB、LBBB、NORMAL各250條共計(jì)750條數(shù)據(jù)。
表1 訓(xùn)練集與測(cè)試集的數(shù)據(jù)分布Tab.1 The distribution of training set and test set
本文采用較為精短的LeNet34、Vgg16、ResNet34、RAJPURKAR[6]提出的模型與本文提出的RSCR進(jìn)行對(duì)比。利用MIT-BIH訓(xùn)練集數(shù)據(jù)對(duì)五種模型分別進(jìn)行訓(xùn)練,測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的模型中,得出模型的分類結(jié)果。
本文采用的開發(fā)平臺(tái)是Windows 10操作系統(tǒng),CNTK 2.0,編程語(yǔ)言是python 3.5.2。計(jì)算機(jī)配置:Intel Core i3-2120 3.3 GHz,顯卡為NVIDIA GeForce GTX1080,顯存大小為8 GB,內(nèi)存大小為16 GB。
本文采用的RSCR網(wǎng)絡(luò)模型參數(shù)設(shè)置如下:
學(xué)習(xí)率設(shè)置為0.000 025~0.000 1,訓(xùn)練集和測(cè)試集的輸入數(shù)據(jù)矩陣大小均為1×1×5 600,故輸入層的節(jié)點(diǎn)數(shù)為5 600,隱藏層的節(jié)點(diǎn)數(shù)為32~256。
本文從MIT-BIH數(shù)據(jù)庫(kù)選取如表1所示的訓(xùn)練集與測(cè)試集數(shù)據(jù),分別基于LeNet34、Vgg16、ResNet34、MRSCR以及RAJPURKAR[6]提出的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,識(shí)別結(jié)果如表2所示,RSCR的準(zhǔn)確率為95.2%,均高于其他四種網(wǎng)絡(luò)。
表2 RSCR與經(jīng)典模型測(cè)試集識(shí)別準(zhǔn)確率對(duì)比Tab.2 Comparison of RSCR and classic models' identify precision on test data
進(jìn)一步分析實(shí)驗(yàn)結(jié)果,為了體現(xiàn)訓(xùn)練集數(shù)據(jù)在訓(xùn)練過(guò)程中的收斂情況,得到上述五種模型的收斂曲線如圖4所示??梢娤噍^于其他網(wǎng)絡(luò),RSCR收斂曲線更加平滑,收斂效果更好。在訓(xùn)練過(guò)程中RSCR的識(shí)別錯(cuò)誤率能夠降得較低,并且維持在比較穩(wěn)定的水平。
本文提出MRSCR網(wǎng)絡(luò)并將其用于心臟傳導(dǎo)阻滯精確定位的自動(dòng)識(shí)別。首先,從MIT-BIH數(shù)據(jù)庫(kù)中提取訓(xùn)練集數(shù)據(jù)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,提取測(cè)試集數(shù)據(jù)用于評(píng)估模型識(shí)別效果。然后,將傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)與RSCR進(jìn)行對(duì)比。最后,對(duì)RSCR模型的分類結(jié)果進(jìn)行可視化處理。
對(duì)MIT-BIH數(shù)據(jù)庫(kù)進(jìn)行三分類,RSCR的識(shí)別準(zhǔn)確率均高于RAJPURKAR提出的模型以及LeNet34等其他深度學(xué)習(xí)模型;在RAJPURKAR等[6]的試驗(yàn)中,臨床專家對(duì)完全心臟傳導(dǎo)阻滯的識(shí)別準(zhǔn)確率為70%,RSCR模型的識(shí)別準(zhǔn)確率為95.2%,高于臨床專家的識(shí)別準(zhǔn)確率;在ISIN等[7]的試驗(yàn)中,識(shí)別準(zhǔn)確率為92.4%,與前者相比,RSCR準(zhǔn)確率略高,并省去了噪聲處理、數(shù)據(jù)預(yù)處理等復(fù)雜的人工特征提取步驟。由實(shí)驗(yàn)可知,在心臟傳導(dǎo)阻滯定位識(shí)別方面,RSCR有較高的準(zhǔn)確率和較好的臨床診斷效果,可以應(yīng)用于臨床心電圖輔助診斷任務(wù),也可以與硬件相結(jié)合,開發(fā)帶有輔助診斷功能的家用心電監(jiān)護(hù)便攜設(shè)備,用于家庭日常監(jiān)護(hù)診斷和預(yù)警。在以后的研究中,將對(duì)心臟傳導(dǎo)阻滯以外的心電數(shù)據(jù)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,使其能夠識(shí)別更多種類的心血管疾病,從而在臨床心電數(shù)據(jù)自動(dòng)診斷中實(shí)現(xiàn)更廣泛的應(yīng)用。
圖4 在訓(xùn)練集中RSCR與經(jīng)典模型的收斂曲線對(duì)比Fig.4 Comparison of RSCR and classic models' convergent curve on train data