蘇淏璇,徐秀林
(上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200093)
心血管疾病是全球第一大死亡病因,主要由心臟病和中風(fēng)引起[1]。因此,臨床上對心血管疾病的精確識別診斷至關(guān)重要。心電圖(electrocardiogram, ECG)信號是評估心臟功能最常用的檢查方法,是一種反映潛在心臟狀況的非侵入性檢測,且價格低廉[2-3]。
目前臨床上主要是由經(jīng)驗豐富的醫(yī)生對ECG進(jìn)行解讀診斷,異常ECG信號的非線性和復(fù)雜性,使得很難檢測其特征,往往需要花費(fèi)大量時間,其準(zhǔn)確性也易受醫(yī)生主觀因素的影響[4-5]。因此,如何將快速發(fā)展的人工智能技術(shù)與ECG診斷相結(jié)合,開發(fā)一種輔助醫(yī)生快速精確診斷ECG的系統(tǒng),是研究人員急待解決的問題。
二十一世紀(jì)的醫(yī)學(xué)診斷以大量的生物醫(yī)學(xué)數(shù)據(jù)以及用于數(shù)據(jù)分析的高性能計算工具的發(fā)展為標(biāo)志[6],伴隨著人工智能的發(fā)展和深度學(xué)習(xí)的出現(xiàn),尤其是將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)成功應(yīng)用于圖像分類后,深度學(xué)習(xí)技術(shù)已在醫(yī)學(xué)圖像分析中獲得了快速發(fā)展[7-8]。深度學(xué)習(xí)應(yīng)用于計算機(jī)輔助診斷(computer aided diagnosis,CAD),能實(shí)現(xiàn)快速和準(zhǔn)確輔助醫(yī)生對疾病進(jìn)行診斷和治療。
上世紀(jì)七十年代,Hubel等[9]通過對貓視覺皮層細(xì)胞的研究,提出感受野概念,即卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)每一層輸出的特征圖上的像素點(diǎn)在輸入圖片上映射的區(qū)域大小。后來,F(xiàn)ukushima[10]在感受野概念的基礎(chǔ)上提出的神經(jīng)認(rèn)知機(jī)(Neocongition)概念,可以看作CNN的第一個實(shí)現(xiàn)網(wǎng)絡(luò)。深度學(xué)習(xí)已引起越來越多研究者的關(guān)注,在圖像處理、自然語言處理、語音處理等方面均有成功應(yīng)用,尤其是圖像識別方面[11]。
CNN是受生物思維啟發(fā)的多層感知器(multilayer perceptron,MLP),由輸入層、卷積層、池化層、完全連接層和輸出層組成[12],見圖1。與機(jī)器學(xué)習(xí)一樣,CNN模型也需要對輸入數(shù)據(jù)進(jìn)行預(yù)處理,常見的預(yù)處理方式有去均值、歸一化、PCA/SVD降維等。卷積層使用卷積核進(jìn)行特征提取和特征映射,通常使用多層卷積層來得到更深層次的特征圖。池化層通常周期性插入在卷積層間,其作用是逐漸降低數(shù)據(jù)體的空間尺寸,進(jìn)而減少網(wǎng)絡(luò)中參數(shù)的數(shù)量,減少計算資源消耗,同時還能很好地控制過擬合。全連接層是將上一層輸出展開成一維數(shù)據(jù),并連接到每一個神經(jīng)元上,然后輸入到分類器中。CNN通常以softmax作為輸出層,應(yīng)用于分類問題。
圖1 CNN架構(gòu)
一維ECG采樣值序列數(shù)據(jù)往往不能反應(yīng)波形的局部特征,如陡峭、凹凸程度及傾斜程度等。Huang等[14]提出一種基于二維深度CNN(two dimensional depth neural network,2D-CNN)的心電心律失常分類方法,利用短時傅里葉變換將ECG的時域信號轉(zhuǎn)換為時域譜圖,將其作為2D-CNN的輸入,對不同心律失常類型的ECG進(jìn)行識別和分類。利用MIT-BIT數(shù)據(jù)庫的ECG數(shù)據(jù),結(jié)果顯示1D-CNN的平均準(zhǔn)確率為90.93%,而2D-CNN的平均準(zhǔn)確率達(dá)到了99.00%。
Rasmus等[15]采用CNN和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)相結(jié)合的端到端模型,從ECG分割的RR間隔(RRI)片段中,采用CNN提取高級特征,并且加入循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)結(jié)構(gòu)。RNN結(jié)構(gòu)因使用自反饋的神經(jīng)元,在處理ECG等時間序列數(shù)據(jù)時具有優(yōu)越性。將ECG分類為心房顫動(AF)和正常竇心性心率(NSR),該模型在三個不同數(shù)據(jù)集上進(jìn)行訓(xùn)練和驗證,通過5倍交叉驗證,其靈敏度和特異性分別達(dá)到98.98%和96.95%,此外,該模型能在1 s內(nèi)高效分析24 h的ECG記錄。研究結(jié)果表明,該模型與標(biāo)準(zhǔn)基準(zhǔn)ECG數(shù)據(jù)集上評估的最新模型相比,在檢測AF上具有更好的性能。
CNN通過局部感受野、權(quán)重共享和降采樣三大策略,減低了網(wǎng)絡(luò)模型復(fù)雜度,同時對圖片特征的平移、旋轉(zhuǎn)、尺度縮放等形式具有不變性,因此被廣泛應(yīng)用于醫(yī)學(xué)影像診斷領(lǐng)域。
RNN和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)一樣,可分為輸入層、隱藏層和輸出層。RNN的特別之處在于其對序列的每個元素均執(zhí)行相同的任務(wù),輸出取決于先前的計算,具有“記憶”功能,結(jié)構(gòu)原理見圖2。網(wǎng)絡(luò)在t時刻接收到輸入Xt之后,隱藏層的值是St,輸出值是Ot。St的值不僅僅取決于Xt,還取決于St-1。
為建立具有自動特征學(xué)習(xí)方案和高效優(yōu)化機(jī)制的ECG心電節(jié)拍分類系統(tǒng),Wang等[16]提出一種基于RNN和主動學(xué)習(xí)的全局可更新分類方案,即全局循環(huán)神經(jīng)網(wǎng)絡(luò)(global recurrent neural network,GRNN)。利用主動學(xué)習(xí)擴(kuò)大了訓(xùn)練范圍,從而改善了訓(xùn)練樣本的多樣性,由大型未標(biāo)記數(shù)據(jù)池中選擇信息量最大的樣本,并將其添加到訓(xùn)練集中。GRNN是基于形態(tài)和時間信息,采用RNN探索ECG搏動的潛在特征。首先,依靠GRNN的大容量和擬合能力,可使用一個模型對多個不同患者的樣本進(jìn)行分類。其次,當(dāng)訓(xùn)練樣本和測試樣本來自不同的數(shù)據(jù)庫時,GRNN可以提高泛化能力。此外,RNN能自動識別不同類別樣本之間的潛在差異。
圖2 RNN結(jié)構(gòu)原理圖Fig.2 RNN structure schematic diagram
Elif[17]提出一種基于心電信號為混沌信號的ECG變化自動診斷方法。利用非線性動力學(xué)工具計算出四種ECG(正常搏動、充血性心力衰竭搏動、室性心動過速搏動、房顫搏動)的Lyapunov指數(shù),并作為RNN模型的輸入數(shù)據(jù)。研究表明,Lyapunov指數(shù)能很好地體現(xiàn)心電信號的特征,基于這些特征訓(xùn)練的RNN模型具有很高的分類精度。
給出相關(guān)參數(shù),對兩個球體模型進(jìn)行,給定中心埋深相同z1=z2=20m,質(zhì)量不同,以及中心埋深不同z1=20m,z2=40m,質(zhì)量亦不同,其他參數(shù)不變,得到成像結(jié)果圖7。
為解決RNN在訓(xùn)練過程中容易出現(xiàn)梯度下降或者梯度爆炸的問題,Hochreater等[18]提出了長短期記憶(long short-term memory ,LSTM)網(wǎng)絡(luò)架構(gòu),是RNN算法的一種改進(jìn)。其引用CEC單元解決了隨時間反向傳播算法和RNN模型的梯度消失和梯度爆炸問題。Annisa等[19]提出一種基于RNN的深度學(xué)習(xí)序列建模方法用于心電節(jié)律信號的分類,并與RNN改進(jìn)的LSTM模型進(jìn)行了性能比較。對比結(jié)果表明,在網(wǎng)絡(luò)模型超參數(shù)相同的情況下,LSTM在敏感性、特異性和精密性方面均優(yōu)于標(biāo)準(zhǔn)的RNN,分別達(dá)到98.49%、97.97%和95.67%。
RNN通過引進(jìn)時序,可以根據(jù)以往的數(shù)據(jù)來推測未來的事件,在語音識別和文本推測方面取得了突破性進(jìn)展,但由于RNN無法進(jìn)行長期記憶的輸出,一些RNN改進(jìn)的長期記憶模型正在研究中。
Hinton[20]在2006年提出深度信念網(wǎng)絡(luò)(deep belief network,DBN), DBN由多層神經(jīng)元受限玻爾茲曼機(jī)(restricted boltzmann machine,RBM)構(gòu)成,其結(jié)構(gòu)見圖3。RBM又分為顯性神經(jīng)元和隱性神經(jīng)元,其中顯性神經(jīng)元用于輸入訓(xùn)練數(shù)據(jù),隱性神經(jīng)元用于提取特征,隱性神經(jīng)元又稱特征檢測器。玻爾茲曼可用于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
Sherin等[21]采用RBM和 DBN,對在單導(dǎo)聯(lián)ECG檢測心室和室上性心跳進(jìn)行ECG分類。通過心跳檢測獲取 R波波峰,再經(jīng)過圖像分割檢測出T波。采用兩種特征集,特征集1包括RR間期、心跳間期和分段形態(tài)學(xué),特征集2由RR區(qū)間和固定形態(tài)組成。將特征集作為DBNs的輸入進(jìn)行分類,DBNs是一種多層生成神經(jīng)網(wǎng)絡(luò),它由堆疊的邏輯RBM組成,其中最底層的RBN學(xué)習(xí)數(shù)據(jù)的淺模型,下一層RBM學(xué)習(xí)對第一層隱藏單元建模。在進(jìn)行分類時,DBN可以使用RBM預(yù)訓(xùn)練過程來初始化深度網(wǎng)絡(luò)的權(quán)重,然后通過反向傳播的誤差導(dǎo)數(shù)對這些權(quán)值進(jìn)行有區(qū)別的微調(diào)。仿真獲得室性異位搏動平均識別正確率(93.63%)和室上異位搏動平均識別正確率(95.57%)。結(jié)果證明,對比傳統(tǒng)方法,基于深度學(xué)習(xí)框架分類器以更低采樣率和更簡單的特征實(shí)現(xiàn)了最先進(jìn)的性能模型。
圖3 DBN架構(gòu)
Wu等[22]為了深入提取連續(xù)心電信號特征,將高斯-伯努利和伯努利-伯努利兩種類型的受限波耳茲曼機(jī)堆疊在一起形成DBN。通過對比散度和持續(xù)對比散度兩種訓(xùn)練算法來學(xué)習(xí)RBM參數(shù),因此,可以以無監(jiān)督的方式從原始ECG數(shù)據(jù)中提取合適的特征。為了提高DBN性能執(zhí)行微調(diào)過程,在結(jié)果隱藏表示層的頂部添加softmax回歸層,以執(zhí)行多分類。結(jié)果表明DBN分類心率失常時,在特征學(xué)習(xí)時間上取得了較好的效果。
通過母體能有效對胎兒心電圖(the foetal electrocardiogram,fECG)進(jìn)行檢測。Jagannath等[23]提出一種用于fECG信號增強(qiáng)的貝葉斯深度信念網(wǎng)絡(luò)(bayesian deep belief network,BDBN)。貝葉斯濾波器為腹部ECG(aECG)中的非線性轉(zhuǎn)化的母體ECG(mECG)成分提供了理想的近似值。DBN系統(tǒng)評估m(xù)ECG的非線性變換信號的非線性關(guān)系,并準(zhǔn)確地將mECG信號與噪聲信號進(jìn)行消除,得到理想的高質(zhì)量的fECG信號。
DBN的靈活性使其可與其他模型進(jìn)行融合拓展。針對高維度數(shù)據(jù)訓(xùn)練困難的問題,卷積DBNs(convolutional deep belief networks,CDBNs)利用相鄰像素的空間關(guān)系,可輕松得到變換的高維圖像。目前已有張義超等[24]研究的基于優(yōu)化卷積深度信念網(wǎng)絡(luò)的智能手機(jī)身份認(rèn)證方法,但由于模型的學(xué)習(xí)率受到樣本量大小和計算資源等限制,在臨床圖像應(yīng)用上還無法訓(xùn)練出較成熟的模型。
He等[25]提出深度殘差網(wǎng)絡(luò)(deep residual networks,DRN),其網(wǎng)絡(luò)深度達(dá)到152層,比經(jīng)典的CNN網(wǎng)絡(luò)多147層,比GoogleNet多130層,能很好地避免梯度爆炸或消失,其原理見圖4。DRN引入了殘差塊的設(shè)計,原理是將前面若干層的數(shù)據(jù)輸出直接跳過多層,引入到后面數(shù)據(jù)層的輸入部分,解決了神經(jīng)網(wǎng)絡(luò)層數(shù)越深越容易產(chǎn)生模型梯度消失和梯度爆炸的問題。
圖4 DRN工作原理圖
Cao等[27]提出了一種改進(jìn)的多尺度分解增強(qiáng)殘差卷積神經(jīng)網(wǎng)絡(luò)。該方法將長度差異較大的原始心電記錄重新分割為9 s的短樣本,然后利用導(dǎo)出的小波框架分解,將分割后的段樣本分解,并重構(gòu)成不同尺度的子信號樣本。利用原始短信號數(shù)據(jù)集和各尺度重構(gòu)數(shù)據(jù)集訓(xùn)練快速下采樣殘差卷積神經(jīng)網(wǎng)絡(luò)(fast down-sampling residual convolutional neural network,F(xiàn)DResNets),然后應(yīng)用遷移學(xué)習(xí)技術(shù)將性能良好的三個FDResnet耦合成一個多尺度分解增強(qiáng)殘差卷積神經(jīng)網(wǎng)絡(luò)(multi-scale decomposition enhanced residual convolutional neural network,MSResNet)。結(jié)果表明, 基于2017年P(guān)hysiNet/CinC[28]比賽提供的大型單導(dǎo)聯(lián)ECG數(shù)據(jù)集,經(jīng)過6次交叉驗證,多尺度神經(jīng)網(wǎng)絡(luò)平均準(zhǔn)確率達(dá)到92.1%,F(xiàn)1綜合評分達(dá)到89.9%。
Deepankar等[28]開發(fā)了一個端對端的框架,利用DRN將不同的ECG片段分為四類,即心房顫動、正常節(jié)律、其他非噪聲癥狀心電節(jié)律和噪聲節(jié)律,從而消除手工制作特征的需要,將DRN結(jié)合CNN和卷積遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,利用數(shù)據(jù)增強(qiáng)技術(shù)解決了數(shù)據(jù)不平衡的問題,生成更多的少數(shù)類樣本,并利用F1對模型進(jìn)行了測試。結(jié)果表明,采用PhysiNet/CinC心臟病學(xué)挑戰(zhàn)杯2017年數(shù)據(jù)庫,該方法F1評分為0.88±0.02,其準(zhǔn)確率和F1評分均優(yōu)于CNN和RNN。
隨著深度神經(jīng)網(wǎng)絡(luò)層數(shù)的不斷增加,模型獲取高階特征的能力也越來越強(qiáng),而當(dāng)網(wǎng)絡(luò)層級達(dá)到一定的深度后,模型訓(xùn)練精度和測試精度由于梯度消失或梯度爆炸而迅速下降,而DRN可以很好解決該退化問題,通過增加網(wǎng)絡(luò)深度提高網(wǎng)絡(luò)模型性能。
隨著智能化醫(yī)療需求的不斷增加,人工智能正快速地應(yīng)用于醫(yī)療科技領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)將更加深入地應(yīng)用于臨床,為廣大醫(yī)護(hù)人員和患者提供更高質(zhì)量的醫(yī)療服務(wù)。
深度神經(jīng)網(wǎng)絡(luò)不同的架構(gòu)和分類方法映射出不同的模型學(xué)習(xí)能力及獲取特征的角度,例如在ECG分類識別中,CNN的識別率略高于其他判別模型深度神經(jīng)網(wǎng)絡(luò),而RNN的優(yōu)勢是對短時間序列數(shù)據(jù)更敏感,長短期記憶網(wǎng)絡(luò)則解決RNN無法處理長距離依賴的問題。但是由于深度神經(jīng)網(wǎng)絡(luò)無法做到對網(wǎng)絡(luò)層級的進(jìn)一步深化,從而誕生了DRN,大量研究表明,DRN可以很好地解決深度神經(jīng)網(wǎng)絡(luò)層級越深,越出現(xiàn)梯度消失或梯度爆炸的問題,使模型的準(zhǔn)確率得到進(jìn)一步提升。DBN不同于CNN和RNN等圖像處理架構(gòu),既可用于非監(jiān)督學(xué)習(xí)、特征學(xué)習(xí),也可以作為分類器用于監(jiān)督學(xué)習(xí)。
應(yīng)用不同深度網(wǎng)絡(luò)架構(gòu),研究人員可以很好地開發(fā)并構(gòu)建ECG診斷模型,幫助醫(yī)護(hù)人員進(jìn)行精確治療。目前,大部分基于深度學(xué)習(xí)的ECG輔助診斷系統(tǒng)均在試驗中,且大多使用全球公共數(shù)據(jù)集來驗證其算法的準(zhǔn)確性,公共數(shù)據(jù)集已經(jīng)對ECG進(jìn)行標(biāo)記分類等預(yù)處理。而我國大部分醫(yī)院采用的是12導(dǎo)聯(lián)的ECG圖片,其未經(jīng)過導(dǎo)聯(lián)的分類和處理,可能同時存在正常心拍與非正常心拍,因此,在應(yīng)用診斷準(zhǔn)確率上有待提高。另一方面大部分神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率因受到訓(xùn)練樣本和計算資源的限制,尚未訓(xùn)練出較為成熟的深度模型,各個網(wǎng)絡(luò)模型均存在缺陷,如CNN池化層會丟失大量有價值信息,忽略局部和整體之間的關(guān)聯(lián)性,RNN的梯度爆炸在LSTM及其改進(jìn)模型中得到了一定程度的解決,但是對于更長的序列數(shù)據(jù),LSTM神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率不高,且計算費(fèi)時。因此,如何通過改進(jìn)深度神經(jīng)網(wǎng)絡(luò)架構(gòu)和模型超參數(shù),使其廣泛應(yīng)用于臨床心電圖,是深度神經(jīng)網(wǎng)絡(luò)在ECG輔助診斷中需要解決的關(guān)鍵問題。