吳志勇 丁香乾 許曉偉 鞠傳香
據(jù)世界衛(wèi)生組織統(tǒng)計(jì),2012年全球約有17.5萬人死于心血管疾病,占全球死亡人數(shù)的31%[1].為降低心臟疾病的發(fā)生,預(yù)防性的前期診斷是關(guān)鍵.心電圖作為一種重要的非侵入式心電檢測(cè)工具被心臟專家廣泛使用.通常情況下,針對(duì)短時(shí)心電圖可通過視覺觀察來識(shí)別各種心電信號(hào)異常的各種癥狀.但是,隨著便攜式心電圖(例如,Holter、Loop recorder)的廣泛使用,因其可連續(xù)記錄24小時(shí)、48小時(shí),甚至14個(gè)月的心電信號(hào)記錄[2].面對(duì)龐大的數(shù)據(jù),采用傳統(tǒng)的視覺方法判斷心臟疾病已不可能,取而代之的是采用智能化的心電信號(hào)自動(dòng)分類技術(shù).
心電信號(hào)自動(dòng)分類系統(tǒng)通常包括5個(gè)階段,包括心電信號(hào)采集、預(yù)處理、心跳分段、特征提取和降維、自動(dòng)分類,如圖1所示.心電信號(hào)采集可綜合利用智能硬件、物聯(lián)網(wǎng)等核心技術(shù)遠(yuǎn)程采集心電信號(hào)數(shù)據(jù),匯入醫(yī)療健康數(shù)據(jù)倉庫.心電信號(hào)預(yù)處理主要去除心電信號(hào)的各種噪聲,為后續(xù)階段處理提供干凈的信號(hào)信息,去除的心電噪聲主要包括基線漂移、工頻干擾和高頻噪聲等[3].心跳分段的目的是提取每個(gè)完整的心跳周期波形,需要檢測(cè)P波、QRS波群和T波等關(guān)鍵點(diǎn)[4].針對(duì)心電信號(hào)預(yù)處理和心跳分段技術(shù),已有眾多學(xué)者在文獻(xiàn)中進(jìn)行了研究并得到了廣泛應(yīng)用,本文重點(diǎn)研究心電信號(hào)特征提取和自動(dòng)分類兩方面技術(shù).在心電信號(hào)特征提取方面,近十年來大量文獻(xiàn)提出了各種方法,包括心電信號(hào)形態(tài)特征[3]、時(shí)間間隔特征[5]、小波變換特征[6]和高階統(tǒng)計(jì)特征[7]等.為獲取更有效的特征集合,在分類系統(tǒng)應(yīng)用中往往組合運(yùn)用多種類型的心電信號(hào)特征,為此,特征降維方法,例如主成分分析、獨(dú)立成分分析等[6?9]常應(yīng)用于上百心電特征的關(guān)鍵特征提取中.在心電信號(hào)自動(dòng)分類技術(shù)方面,以低維特征空間為基礎(chǔ),分類模型多采用各種智能算法,例如人工神經(jīng)網(wǎng)絡(luò)[9]、最近路徑森林[10]、群智能算法[11]和模糊分類[12]等.
從以上提到的各種文獻(xiàn)來看,盡管各種心電信號(hào)分類系統(tǒng)在特定心電信號(hào)數(shù)據(jù)集(例如,MIT-BIH、AHA和CSE數(shù)據(jù)庫等)取得較高的準(zhǔn)確率.但仍然面臨以下幾個(gè)問題:1)特征提取的過程通常需要心臟專家的參與,導(dǎo)致時(shí)間和費(fèi)用成本的增加;2)因心電特征需人工設(shè)計(jì),可能造成源心電信號(hào)特征信息丟失;3)構(gòu)建的心電信號(hào)分類模型對(duì)不同病患者具有低適應(yīng)性的缺陷.針對(duì)上述問題,近年來,隨著深度無監(jiān)督特征提取技術(shù)的深入研究,基于深度學(xué)習(xí)技術(shù)的心電信號(hào)自動(dòng)分類系統(tǒng)得到廣泛關(guān)注.
深度學(xué)習(xí)方法思想是對(duì)輸入層數(shù)據(jù)可自動(dòng)學(xué)習(xí)特征的過程.與傳統(tǒng)方法相比,深度學(xué)習(xí)已在圖像識(shí)別[13]、語音識(shí)別[14]和生理數(shù)據(jù)分析[15]等方面取得較好的成績(jī).典型的深度學(xué)習(xí)框架包括深度信念網(wǎng)絡(luò)(Deep belief network,DBN)[16]、棧式自編碼器(Stacked auto-encoder,SAE)[17]和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)[18]等.基于深度學(xué)習(xí)方法進(jìn)行心電信號(hào)自動(dòng)識(shí)別已有眾多學(xué)者開展研究,并取得了較好的結(jié)果.例如,Kiranyaz等[19]采用一維卷積神經(jīng)網(wǎng)絡(luò)提取信號(hào)特征為特定病人進(jìn)行心電異常實(shí)時(shí)診斷;Rahhal等[15]提出采用棧式自動(dòng)編碼器從源心電信號(hào)中學(xué)習(xí)特征進(jìn)行心電信號(hào)分類,并用Softmax算法實(shí)現(xiàn)多心律分類;Yan等[20]和Meng等[21]均基于受限玻爾茲曼機(jī)(Restricted Boltzmann machine,RBM)構(gòu)造的DBN提取心電特征,在分類技術(shù)方面,前者使用Softmax多分類器,后者使用支持向量機(jī)決策樹.從上述文獻(xiàn)來看,基于無監(jiān)督深度學(xué)習(xí)的心電特征提取技術(shù)相對(duì)于傳統(tǒng)的人工特征設(shè)計(jì)方法優(yōu)勢(shì)突出,而在心電信號(hào)分類技術(shù)方面,仍舊難以體現(xiàn)心電信號(hào)模糊分類特性.傳統(tǒng)心電信號(hào)異常診斷中,醫(yī)生的診斷過程本身具有模糊性,而且大量復(fù)雜多樣心電信號(hào)中異常心跳屬于少數(shù).因此,采用具有對(duì)稀有數(shù)據(jù)敏感特性、模糊性和更符合人類思維過程的模糊聚類過程算法進(jìn)行心電信號(hào)分類得到廣泛研究.zbay等[22]結(jié)合模糊C均值(Fuzzy c-means,FCM)聚類算法和多層感知機(jī)對(duì)多種心電信號(hào)分類;Yeh等[23]利用FCM算法對(duì)異常心電分類并給出了4個(gè)詳細(xì)的聚類步驟.本文綜合深度學(xué)習(xí)與模糊分類技術(shù)的優(yōu)勢(shì),提出一種結(jié)合深度學(xué)習(xí)和模糊C均值技術(shù)的心電信號(hào)分類方法.首先,描述了該方法的技術(shù)流程,包括心電信號(hào)降噪預(yù)處理、心電信號(hào)分段和采樣點(diǎn)統(tǒng)一化、無監(jiān)督心跳特征學(xué)習(xí)、模糊分類等;然后,提出模糊C均值深度信念網(wǎng)絡(luò)模型結(jié)構(gòu)和算法,介紹了面向心電信號(hào)特征提取的深度網(wǎng)絡(luò)DBN構(gòu)建方法和面向心電信號(hào)的模糊C均值分類方法;最后,基于MIT-BIH心律異常數(shù)據(jù)庫進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證該方法的有效性.
本文基于深度學(xué)習(xí)和模糊C均值的心電信號(hào)分類技術(shù)流程如圖2所示,心電信號(hào)降噪預(yù)處理、心電信號(hào)分段和采樣點(diǎn)統(tǒng)一化、無監(jiān)督心跳特征學(xué)習(xí)、模糊分類4個(gè)步驟依次推進(jìn)、相互依賴,每個(gè)步驟都影響著最終分類結(jié)果的準(zhǔn)確性.
采集的心電信號(hào)通常需要去除基線漂移、肌電噪聲和工頻噪聲等干擾信號(hào),提高波形檢測(cè)和分類準(zhǔn)確率.從去噪預(yù)處理技術(shù)發(fā)展來看,主要包括數(shù)字濾波器技術(shù)、自適應(yīng)濾波器技術(shù)和以小波變換、數(shù)學(xué)形態(tài)學(xué)及神經(jīng)網(wǎng)絡(luò)為代表的現(xiàn)代高新濾波技術(shù).由于數(shù)字濾波器具有很好的系統(tǒng)可靠性、低廉的設(shè)計(jì)成本及靈活方便的應(yīng)用性等優(yōu)點(diǎn),是心電信號(hào)預(yù)處理最簡(jiǎn)單且廣泛的應(yīng)用技術(shù).本文按照de Chazal等[3]提出的降噪預(yù)處理方法,先用200ms中值濾波去除QRS波群和P波,然后再用600ms的中值濾波去除T波,最后用源信號(hào)減去兩個(gè)中值濾波后的信號(hào)即可得到去除基線漂移心電信號(hào),肌電和工頻噪聲信號(hào)使用帶有35Hz、3dB、12-tap低通濾波器去除,最后得到可用于后續(xù)處理的心電信號(hào).
心電信號(hào)分技術(shù)已有三十多年的研究歷史,主要圍繞P波峰和QRS波群的檢測(cè)來展開.Pan等[4]提出了一種基于數(shù)字濾波的檢測(cè)方法,可有效檢測(cè)P、QRS和T波的波峰、上下沿等關(guān)鍵點(diǎn),該方法因其簡(jiǎn)單性和有效性得到廣泛應(yīng)用.本文利用基于該方法開發(fā)的Ecgpuwave工具 “http://www.physionet.org/physiotools/wag/ecgpuw-1.htm”識(shí)別心電信號(hào)各種波形邊界,以實(shí)現(xiàn)心電信號(hào)心跳分段.根據(jù)檢測(cè)獲取的各個(gè)關(guān)鍵點(diǎn)計(jì)算后,可容易分段各心跳樣本.因不同的個(gè)人身體狀況具有不同的心跳周期,分段后的樣本具有不同的采樣點(diǎn)數(shù)目,而心電特征抽取模型需要統(tǒng)一的輸入.為此,需要對(duì)心跳樣本進(jìn)行采樣點(diǎn)統(tǒng)一化處理,本文采用插值算法對(duì)獲取到的心跳樣本統(tǒng)一化為200個(gè)采樣點(diǎn).
圖1 心電信號(hào)自動(dòng)分類系統(tǒng)流程Fig.1 The system flow of ECG classification
圖2 基于深度學(xué)習(xí)和模糊C均值的心電信號(hào)分類技術(shù)流程Fig.2 The process of ECG classification using deep learning and fuzzy C-means
無監(jiān)督特征學(xué)習(xí)可自動(dòng)抽取無標(biāo)簽樣本特征,相對(duì)人工設(shè)計(jì)特征的方式能夠更好地發(fā)現(xiàn)潛在特征,且減少數(shù)據(jù)專家參與,具有省時(shí)、省力,降低數(shù)據(jù)分析成本的優(yōu)點(diǎn).目前,具有無監(jiān)督特征學(xué)習(xí)能力的數(shù)據(jù)模型結(jié)構(gòu)有多種,例如受限玻爾茲曼機(jī)(RBM)[16]及其擴(kuò)展模型條件RBM[24]、門限RBM[25]、自動(dòng)編碼器(Auto-encoder,AE)[26]、循環(huán)神經(jīng)網(wǎng)絡(luò) (Recurrent neural network,RNN)[27]等.本文采用具有無監(jiān)督特征學(xué)習(xí)能力的DBN抽取心電信號(hào)的高層抽象特征,該DBN由多層高斯伯努利RBM(Gaussian-Bernoulli RBM,GBRBM)和伯努利伯努利RBM(Bernoulli-Bernoulli RBM,BBRBM)堆棧而成,最底層GBRBM用于接收連續(xù)值心電信號(hào),最頂層使用線性激活函數(shù)輸出連續(xù)特征向量,構(gòu)建過程包括無監(jiān)督模型訓(xùn)練和有監(jiān)督模型優(yōu)化微調(diào)兩個(gè)階段.
近年來,模糊系統(tǒng)在醫(yī)療健康領(lǐng)域得到廣泛應(yīng)用,用于診斷和識(shí)別各種疾病,例如帕金森疾病[28]、乳腺癌[29]和肝臟疾病[30]等.從文獻(xiàn)來看,無監(jiān)督模糊分類技術(shù)不僅應(yīng)用于醫(yī)療圖像分段分析,還廣泛用于各種醫(yī)療體征信號(hào)的識(shí)別診斷中.例如,Meau等[31]基于多層感知機(jī)擴(kuò)展了卡爾曼濾波,構(gòu)建了一套復(fù)雜的模糊系統(tǒng)用于心電信號(hào)分類.Ozbay等[32]利用模糊聚類神經(jīng)網(wǎng)絡(luò)進(jìn)行早期心臟疾病診斷.本文以深度模型抽取的心電信號(hào)高層抽象特征為數(shù)據(jù)基礎(chǔ),采用目前最為廣泛使用的FCM算法進(jìn)行心電信號(hào)分類.FCM算法最早在1973年由Dunn提出[33],1981年Bezdek對(duì)該算法進(jìn)行了優(yōu)化[34],被廣泛應(yīng)用于圖像檢索、語音識(shí)別和模式識(shí)別等領(lǐng)域.
則網(wǎng)絡(luò)模型的實(shí)現(xiàn)目標(biāo)是基于采集的心電信號(hào)數(shù)據(jù)找到XL→YL的映射關(guān)系.本文提出的模糊C均值深度網(wǎng)絡(luò)結(jié)構(gòu)包括DBN抽象特征提取和FCM分類兩部分,如圖3所示.底層DBN網(wǎng)絡(luò)模型由多層無方向的受限玻爾茲曼機(jī)(RBM)堆建而成,含有一層可接收連續(xù)心電信號(hào)的可見單元和多層二值隱藏單元,最后輸出高層連續(xù)抽象特征向量,為構(gòu)建DBN模型通常需要無監(jiān)督學(xué)習(xí)訓(xùn)練和模型微調(diào)兩個(gè)階段.頂層FCM分類模型以DBN輸出的高層抽象特征為基礎(chǔ),計(jì)算每類心電信號(hào)的聚類中心,然后計(jì)算最短距離的方式進(jìn)行心電信號(hào)的模糊分類,為構(gòu)建FCM模型一般需要計(jì)算心電信號(hào)聚類中心和中心距離計(jì)算兩個(gè)階段.
心電信號(hào)DBN模型采用經(jīng)典的由低到高逐層貪婪無監(jiān)督訓(xùn)練RBM 方法,對(duì)深度網(wǎng)絡(luò)內(nèi)的RBM 參數(shù)進(jìn)行設(shè)置.RBM作為DBN的基本模塊具有很強(qiáng)的非線性無監(jiān)督學(xué)習(xí)能力,能夠從復(fù)雜的數(shù)據(jù)中學(xué)習(xí)有用信息,具備針對(duì)一組狀態(tài)(v,h)的能量定義.模型第一層RBM因需要接收心電信號(hào)連續(xù)值,則使用高斯–伯努利RBM(GBRBM),其能量定義如式(2).模型其他層RBM 均為伯努利–伯努利RBM(BBRBM),其能量定義如式(3).
圖3 模糊C均值深度網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Fuzzy C-means deep network structure
其中,v表示RBM的可見層單元向量,h表示RBM的隱藏層單元向量.分別為GBRBM和BBRBM的參數(shù)向量,W表示RBM可見層單元和隱藏層單元之間的無向權(quán)值向量,a和b分別為可見層單元和隱藏層單元的偏置向量,σ為可見層單元高斯噪音的標(biāo)準(zhǔn)差向量.n表示可見層單元數(shù)量,m表示隱藏層單元數(shù)量.
因RBM具有層間連接、層內(nèi)無連接的結(jié)構(gòu),可方便計(jì)算第j個(gè)隱藏單元的條件概率和第i個(gè)可見單元的條件概率.則針對(duì)GBRBM和BBRBM,條件概率計(jì)算公式分別為式(4)、(5)和式(6)、(7).
其中,η(.|u,σ2)表示均值u和方差σ2的高斯概率密度函數(shù),δ(x)表示邏輯回歸函數(shù).
利用心電信號(hào)數(shù)據(jù)訓(xùn)練RBM目的是獲取θ1和θ2參數(shù)值,可根據(jù)Hinton提出的對(duì)比散度快速學(xué)習(xí)算法[35]使其對(duì)數(shù)似然函數(shù)在訓(xùn)練集上最大化,則連接權(quán)重wij、可見層單元的偏置ai和隱藏層單元的偏置bj的更新準(zhǔn)則為:
依據(jù)DBN深度框架從低到高逐層訓(xùn)練RBM的方法,在初始階段各層之間的連接權(quán)重w和偏置a,b全部隨機(jī)產(chǎn)生,最頂層輸出ht即為心電信號(hào)的高層抽象特征,如式(10)所示.
DBN無監(jiān)督訓(xùn)練結(jié)束后,使用L條有標(biāo)簽的心電信號(hào)樣本通過梯度下降和反饋傳播算法對(duì)參數(shù)進(jìn)行優(yōu)化微調(diào)以增強(qiáng)模型的分類性能,此優(yōu)化問題可用式(11)表達(dá):
設(shè)H={h1,h2,···,hL}是通過深度DBN 模型抽取的對(duì)應(yīng)L條心電信號(hào)樣本的抽象特征向量,若抽象特征維度為p,則H可用式(12)表示.
本文利用FCM算法,通過最小化目標(biāo)函數(shù)(13),不斷更新隸屬度和心電信號(hào)分類中心,直到分類中心位置固定或兩次迭代的目標(biāo)函數(shù)值之差在允許的范圍內(nèi).
其中,m為模糊度參數(shù),U=(uc,l)C×L為劃分矩陣,如式(14),uc,l為屬于類c的hl特征向量的隸屬度,且滿足式(15)的兩個(gè)條件,V={v1,v2,···,vC}為心電聚類中心向量集合,vc可根據(jù)式(16)計(jì)算,dc,l為hl樣本特征向量到心電類c中心vc的歐氏距離.
傳統(tǒng)的模糊神經(jīng)網(wǎng)絡(luò)通過調(diào)整模糊參數(shù)m來優(yōu)化隸屬度函數(shù)以達(dá)到對(duì)目標(biāo)數(shù)據(jù)進(jìn)行分類的目的.而在模糊深度網(wǎng)絡(luò)結(jié)構(gòu)中,針對(duì)心電信號(hào)分類需求,模型的優(yōu)化需要心電信號(hào)采樣數(shù)據(jù)L、高層抽象心電特征向量H、模糊參數(shù)m和相應(yīng)的標(biāo)簽向量Y協(xié)同建模與微調(diào).
算法1描述了FCMDBN的訓(xùn)練和分類過程,因采樣得到的心電信號(hào)是連續(xù)值數(shù)據(jù),在初始化DBN階段需設(shè)置最底層RBM類型為GBRBM,其他層RBM類型為BBRBM;隱藏層單元個(gè)數(shù)、模型層數(shù)、訓(xùn)練次數(shù)和批次大小等參數(shù)根據(jù)心電信號(hào)數(shù)據(jù)維度和樣本集大小確定;動(dòng)量學(xué)習(xí)率、學(xué)習(xí)率、懲罰率和初始偏置等,則需要經(jīng)驗(yàn)賦初始值;RBM初始化權(quán)值向量則隨機(jī)產(chǎn)生;模糊分類個(gè)數(shù)和聚類終止閾值根據(jù)具體心電信號(hào)分類需求進(jìn)行設(shè)置,模糊度參數(shù)同樣需經(jīng)驗(yàn)賦值.
FCMDBN模型經(jīng)過以下兩個(gè)構(gòu)建過程后可對(duì)心電信號(hào)類型進(jìn)行分類:
1)利用無標(biāo)簽和有標(biāo)簽的心電信號(hào)采樣數(shù)據(jù)訓(xùn)練DBN模型,獲取心電信號(hào)類型的FCM劃分矩陣.首先,利用無標(biāo)簽采用數(shù)據(jù)對(duì)DBN模型進(jìn)行逐層貪婪無監(jiān)督學(xué)習(xí)和有標(biāo)簽采樣數(shù)據(jù)對(duì)DBN模型進(jìn)行梯度下降監(jiān)督學(xué)習(xí).然后,依據(jù)獲取的高層抽象心電信號(hào)特征向量數(shù)據(jù)計(jì)算每類心電信號(hào)的聚類中心,構(gòu)建劃分矩陣.
2)優(yōu)化微調(diào)FCMDBN模型.結(jié)合反向回饋算法和FCMDBN模糊分類功能,利用有標(biāo)簽的心電信號(hào)采樣數(shù)據(jù)進(jìn)行逐層貪婪學(xué)習(xí)和梯度下降學(xué)習(xí)后對(duì)FCMDBN模型參數(shù)進(jìn)行調(diào)整優(yōu)化.
算法1.ECG-FCMDBN
輸入.訓(xùn)練樣本;測(cè)試樣本
FCMDBN參數(shù):
每層RBM類型{GBRBM,BBRBM};
模型層數(shù)n;每層單元個(gè)數(shù)N1,N2,···,Nn;
訓(xùn)練次數(shù)E;隨機(jī)初始化權(quán)值向量w;初始化偏置向量a,b;
動(dòng)量學(xué)習(xí)率?;學(xué)習(xí)率η;懲罰率p;批次大小s;
模糊分類個(gè)數(shù)C;模糊度參數(shù)m;聚類終止閾值ε;
輸出.FCMDBN模型的權(quán)值向量w,偏置向量a,b,劃分矩陣U
步驟1.基于心電信號(hào)ds_training訓(xùn)練樣本對(duì)DBN進(jìn)行逐層貪婪無監(jiān)督學(xué)習(xí)
步驟2.根據(jù)式(10)對(duì)訓(xùn)練的DBN進(jìn)行有監(jiān)督學(xué)習(xí),獲取訓(xùn)練樣本的高層抽象特征向量.
步驟3.根據(jù)式(12)計(jì)算每一種心電信號(hào)類型的聚類中心向量,構(gòu)建劃分矩陣U.
步驟4.采用XL,YL,U微調(diào)FCMDBN模型
再次基于心電信號(hào)ds_training訓(xùn)練樣本對(duì)DBN進(jìn)行逐層貪婪無監(jiān)督學(xué)習(xí).
再次根據(jù)式(10)對(duì)訓(xùn)練的DBN進(jìn)行有監(jiān)督學(xué)習(xí),采用反向回饋算法調(diào)整DBN參數(shù).
步驟5.基于心電信號(hào)ds_testing測(cè)試樣本進(jìn)行分類.
圖4 5類心律波形圖Fig.4 Five types of cardiac rhythms graph
表1 5類心律MIT-BIH實(shí)驗(yàn)數(shù)據(jù)集Table 1 The data set of MIT-BIH including five types of cardiac rhythms
實(shí)驗(yàn)數(shù)據(jù)來源于MIT-BIH心律異常數(shù)據(jù)庫,該數(shù)據(jù)庫由麻省理工學(xué)院開發(fā),數(shù)據(jù)全部采集于Beth Israel醫(yī)院的心律異常實(shí)驗(yàn)室.MIT-BIH心律異常數(shù)據(jù)庫中每條記錄采集心電信號(hào)時(shí)間約30分鐘,采樣頻率360Hz,心跳類型18種并已做標(biāo)簽注釋.共包含48條記錄,23條心電記錄可作為常規(guī)臨床記錄的代表性樣本,其他25條記錄包含了復(fù)雜心室、交界和室上性等心律失常問題.參照文獻(xiàn)[3]中對(duì)心電信號(hào)預(yù)處理方式,實(shí)驗(yàn)選取5類心律類型進(jìn)行分類,包括正常心跳(NORM)、左束支傳導(dǎo)阻滯(LBBB)、右束支傳導(dǎo)阻滯(RBBB)、室性早搏(PVC)和房性早搏(APC),如圖4中(1-1)、(2-1)、(3-1)、(4-1)和(5-1)所示.不同人體對(duì)象通常具有不同的心跳頻率,分段后的心電信號(hào)具有不同的心跳長(zhǎng)度,實(shí)驗(yàn)對(duì)分段信號(hào)進(jìn)行重插值抽樣,在保持原有波形形態(tài)的情況下得到統(tǒng)一長(zhǎng)度為200個(gè)采樣點(diǎn)的心跳信號(hào),如圖4中(1-2)、(2-2)、(3-2)、(4-2)和(5-2)所示.最后得到的5類心律實(shí)驗(yàn)數(shù)據(jù)集如表1所示,其中DS1為訓(xùn)練數(shù)據(jù)集,DS2為測(cè)試數(shù)據(jù)集.
實(shí)驗(yàn)中FCMDBN模型的DBN各層單元個(gè)數(shù)結(jié)構(gòu)為{200?400?300?100?50?10},第1層200單元接收統(tǒng)一寬度的心電信號(hào)連續(xù)數(shù)據(jù),第6層10單元輸出心電信號(hào)的高層抽象特征信息.模型定義動(dòng)力學(xué)習(xí)率=[0.4 0.3 0.2 0.1 0],批次大小=100,訓(xùn)練次數(shù)=50,懲罰率=0.0002;FCM 模糊分類個(gè)數(shù)=5,模糊度參數(shù)m=1.2,聚類終止閾值=0.001.實(shí)驗(yàn)利用臺(tái)式計(jì)算機(jī)進(jìn)行仿真,設(shè)備配置為Intel Core i7-4790,CPU 3.6GHz,RAM 16GB,and GPU Intel HD graphics 4600.
基于DBN抽取的樣本10個(gè)心電特征數(shù)據(jù),本文對(duì)每類心律類型進(jìn)行分析和聚類中心點(diǎn)計(jì)算.箱線圖 5描述了每類心律特征值信息,從圖 5結(jié)果來看,NORM、LBBB、RBBB、PVC和APC 5類心律值具有明顯可區(qū)分的分布范圍.表2給出了5類心律特征中心點(diǎn)數(shù)據(jù),基于中心點(diǎn)數(shù)據(jù)計(jì)算某心電信號(hào)的距離進(jìn)行心律分類.
實(shí)驗(yàn)隨機(jī)選擇特征點(diǎn)向量為[3.8624,1.9699,?4.6216,3.3794,1.1686,2.2271,3.1660,3.5609,?3.5019,0.7997]的樣本,其與各特征中心點(diǎn)的歐氏距離分別為d1=14.4160,d2=12.6650,d3=9.6987,d4=9.5196,d5=10.6587,如圖6所示,根據(jù)距離最小原則,該心電信號(hào)樣本屬于RBBB類型.
圖5 心律特征值分布范圍Fig.5 Distribution range of cardiac rhythms features value
為方便分類結(jié)果比較,本文采用靈敏度(Sensitivity,Se),陽性預(yù)測(cè)值(Positive predictive value,PPV)和總準(zhǔn)確率(Total classification accuracy,TCA)三種度量方式,公式定義分別如下所示.
其中,TP表示心跳被正確分類的個(gè)數(shù);FN表示心跳被錯(cuò)誤分類的個(gè)數(shù);TN表示不屬于某種心跳被分類的個(gè)數(shù);FP表示屬于某種心跳被錯(cuò)誤分類的個(gè)數(shù).
表2 5類心律特征中心點(diǎn)Table 2 The centers of feature vectors of five kinds of cardiac rhythms
圖6 隨機(jī)樣本與各類心率中心點(diǎn)歐氏距離Fig.6 Euclidean distance between random sample and the center point of heart rate
表3是基于FCMDBN模型在DS2數(shù)據(jù)集上的分類混淆矩陣結(jié)果,從表4分類結(jié)果性能比較來看,本文采用的基于深度學(xué)習(xí)的模糊分類方法可自動(dòng)提取源心電信號(hào)的全面高層抽象特征進(jìn)行聚類,相對(duì)其他方法具有較高的分類準(zhǔn)確性,NORM、LBBB、RBBB、PVC、APC 5類心律的分類性能分別為:Se=98.32%PPV=99.28%;Se=98.32%,PPV=99.28%;Se=98.32%,PPV=99.28%;Se=98.32%,PPV=99.28%;Se=98.32%,PPV=99.28%,總體準(zhǔn)確律TCA=96.54%.另外,仿真實(shí)驗(yàn)中模型訓(xùn)練和測(cè)試采用了不同的數(shù)據(jù)集,證明了所提方法對(duì)心電信號(hào)診斷的適應(yīng)性更強(qiáng).
表3 FCMDBN模型在DS2數(shù)據(jù)集上的分類混淆矩陣Table 3 Confusion matrix for ECG arrhythmias classification on DS2 using the FCMDBN
表4 分類結(jié)果性能比較Table 4 Performance comparison of classification results
面對(duì)大數(shù)據(jù)量心電信號(hào)自動(dòng)分析診斷問題,本文提出了基于深度學(xué)習(xí)和模糊分類相結(jié)合的心臟疾病診斷方法.深度學(xué)習(xí)是目前研究最為廣泛的對(duì)象特征自動(dòng)提取技術(shù),在眾多應(yīng)用領(lǐng)域均有研究成果,本文采用基于RBM構(gòu)建的深度信念網(wǎng)絡(luò)DBN對(duì)連續(xù)心電信號(hào)進(jìn)行高層抽象特征抽取,形成用于心律分類的特征向量數(shù)據(jù)基礎(chǔ),然后結(jié)合模糊C均值聚類算法構(gòu)建心電分類模型.仿真實(shí)驗(yàn)表明:與傳統(tǒng)人工設(shè)計(jì)心電特征相比,本文所提方法分類準(zhǔn)確率更高、適應(yīng)性更強(qiáng).未來工作可深入研究其他深度學(xué)習(xí)方法和分類算法相結(jié)合在心電信號(hào)自動(dòng)分類中的應(yīng)用,構(gòu)建多種不同的體征信號(hào)自動(dòng)分析算法庫.