薛淵元,李朵,宋江玲,張瑞
(西北大學(xué)醫(yī)學(xué)大數(shù)據(jù)研究中心,陜西 西安 710127)
心肌梗死(Myocardial Infarction,MI),簡(jiǎn)稱心梗,是由冠狀動(dòng)脈急性或持續(xù)性缺血缺氧引起的一種常見的心律失常疾病[1].臨床表現(xiàn)為持續(xù)性胸痛、呼吸急促、大汗、乏力和發(fā)熱等,嚴(yán)重者可伴有心力衰竭、昏厥和休克等癥狀.心肌梗死發(fā)作后,如果未能在90分鐘內(nèi)得到及時(shí)有效的治療,患者心臟的冠狀動(dòng)脈出現(xiàn)血栓堵死現(xiàn)象,心肌細(xì)胞將會(huì)因缺血發(fā)生大面積壞死,從而引發(fā)不可逆性的損傷,嚴(yán)重者可能會(huì)導(dǎo)致心室顫動(dòng)、房室傳導(dǎo)阻滯、心室游離壁破裂和心源性休克等并發(fā)癥,甚至死亡.因此,對(duì)于心肌梗死的及時(shí)、準(zhǔn)確診斷是至關(guān)重要的.
心電圖(Electrocardiogram,ECG)是反映人體心臟電信號(hào)變化的連續(xù)曲線,可以表征人體心臟的綜合狀態(tài),是臨床上診斷心肌梗死的首要篩查手段[2].心肌梗死在心電圖上(MI-ECG)的特異性表現(xiàn)主要有:①ST-T改變,即ST段異常抬高或壓低;②出現(xiàn)T波高尖、低平、雙相變化和倒置等異常T波;③出現(xiàn)病理性Q波,Q波表現(xiàn)為“寬而深”,即Q波時(shí)限大于等于0.04s,Q波幅值大于同導(dǎo)聯(lián)R波的1/4(如圖1(b)所示)[3-4].鑒于心電圖采集便捷、操作簡(jiǎn)單、具有可連續(xù)監(jiān)測(cè)等特點(diǎn),以MI-ECG為數(shù)據(jù)源,采用機(jī)器學(xué)習(xí)方法挖掘MI-ECG中的特異性特征并據(jù)此實(shí)現(xiàn)MI-ECG的自動(dòng)判讀,顯然對(duì)于心肌梗死的及時(shí)確診具有重要的臨床意義和現(xiàn)實(shí)價(jià)值.
圖1 心電信號(hào)示例
關(guān)于MI-ECG自動(dòng)判讀的研究主要聚焦于如何刻畫心肌梗死發(fā)作時(shí)在心電信號(hào)中的特異性表現(xiàn).在時(shí)域分析方面,文獻(xiàn)[5]針對(duì)心肌梗死心電信號(hào)中ST段特異性變化,提取了ST-T段偏斜度對(duì)心肌梗死心電進(jìn)行識(shí)別.文獻(xiàn)[6]提取了T波時(shí)限、T波偏斜度等刻畫T波異常的特征,并結(jié)合SVM算法實(shí)現(xiàn)心肌梗死和正常心電信號(hào)的分類.文獻(xiàn)[7]通過(guò)提取QRS波群的面積、偏斜度等特征用以描述心肌梗死發(fā)作時(shí)Q波的異常表現(xiàn).此外,文獻(xiàn)[8]利用多項(xiàng)式擬合法對(duì)心電信號(hào)進(jìn)行擬合,并以擬合曲線的多項(xiàng)式系數(shù)作為特征,結(jié)合J48決策樹、隨機(jī)森林、Kstar和樸素貝葉斯等分類算法區(qū)分正常和心肌梗死心電信號(hào).在信號(hào)復(fù)雜度分析方面,文獻(xiàn)[9]利用平穩(wěn)小波變換對(duì)II、III和avF導(dǎo)聯(lián)心電信號(hào)進(jìn)行分解,并提取了樣本熵、對(duì)數(shù)能量熵和歸一化子帶能量等刻畫信號(hào)復(fù)雜度的特征,用于實(shí)現(xiàn)心肌梗死心電的自動(dòng)判讀.文獻(xiàn)[10]提取了信號(hào)能量、Shannon熵和Renyi熵等特征,結(jié)合統(tǒng)計(jì)學(xué)離群點(diǎn)剔除法提出兩級(jí)SVM分類算法,對(duì)心肌梗死心電信號(hào)進(jìn)行有效判讀.
由于心肌梗死發(fā)作時(shí)在心電信號(hào)中的異常表現(xiàn)復(fù)雜多樣且具有明顯的個(gè)體異質(zhì)性,因此設(shè)計(jì)一種多特征融合方法,顯然是提高M(jìn)I-ECG自動(dòng)判讀準(zhǔn)確率的有效途徑.基于此,本文提出一種新的基于融合特征的心肌梗死心電自動(dòng)判讀方法.首先,對(duì)原始MI-ECG信號(hào)進(jìn)行去噪預(yù)處理;其次,對(duì)去噪后的心電信號(hào)進(jìn)行QRS波群和T波的特征波定位;在此基礎(chǔ)上,進(jìn)一步針對(duì)心肌梗死發(fā)作時(shí)MI-ECG信號(hào)的三種異常表現(xiàn),分別提取特征并進(jìn)行特征級(jí)融合;最后,結(jié)合輕量梯度提升算法完成MI-ECG的自動(dòng)判讀,并在PTB數(shù)據(jù)庫(kù)上驗(yàn)證所提方法的有效性.
心電信號(hào)在采集過(guò)程中易受到噪聲干擾,主要包括基線漂移、工頻干擾和肌電干擾[11].其中基線漂移是人體呼吸、電極片移動(dòng)等所引起的低頻噪聲,頻率小于1Hz;工頻干擾是由電力系統(tǒng)引起的一種干擾,頻率為50/60Hz;肌電干擾是由于人體肌肉顫動(dòng)所引起的噪聲,頻率為5-2000Hz.
本文采用小波變換和軟閾值法對(duì)原始心電信號(hào)進(jìn)行去噪[12],選取coif5函數(shù)為基小波,并設(shè)置分解層數(shù)為9.圖2展示了一條時(shí)長(zhǎng)為8s的心電信號(hào)片段去噪前后對(duì)比.
圖2 心電信號(hào)去噪效果
QRS波群是心電圖中最主要的波群之一,其中病理性Q波的出現(xiàn)、ST-T段和T波異常是心肌梗死發(fā)作時(shí)典型表現(xiàn).而Q波和S波的定位依賴于R波的定位,因此,本小節(jié)聚焦于QRS波群、T波及其起止點(diǎn)的準(zhǔn)確定位算法.
給定去噪后的心電信號(hào)為X={X(1),X(2),···,X(N)},其中 N 為樣本點(diǎn)數(shù),采樣率為fs.
2.2.1 QRS波群定位
利用文獻(xiàn) [13]的波形檢測(cè)方法對(duì) QRS波群峰值點(diǎn)進(jìn)行檢測(cè),得到 R峰序列 R={R(1),R(2),···,R(m)},S 峰序列 S={S(1),S(2),···,S(m)},以及 Q 峰序列 Q={Q(1),Q(2),···,Q(m)}.
計(jì)算RR間期序列,記為
其中RR(i)=R(i+1)-R(i).
2.2.2 T波定位
T波異常變化是診斷心肌梗死發(fā)作最顯著的指征,而刻畫T波異常的特征分類性能好壞在一定程度上依賴于T峰和T波終點(diǎn)的定位是否準(zhǔn)確.基于此,本小節(jié)提出一種新的T峰和T波起點(diǎn)/終點(diǎn)的準(zhǔn)確定位算法,具體過(guò)程可總結(jié)為如下算法(T波定位算法):
步驟1:T波峰值點(diǎn)定位
首先,以R峰為基點(diǎn),向后進(jìn)行搜索區(qū)間為WT=[Rv+0.15×fs,Rv+0.15×fs+50]的加窗搜索,其中Rv為R峰位置點(diǎn),fs為采樣率,以此獲得預(yù)選T波段序列.
其次,計(jì)算預(yù)選T波段的黎曼和分別為ST0i:
其中,k為所述心電片段中劃分的子區(qū)間數(shù),這里取樣本點(diǎn)個(gè)數(shù),ΔXTj為預(yù)選T波段對(duì)應(yīng)的心電片段序列第j個(gè)子區(qū)間的長(zhǎng)度,FTj為其對(duì)應(yīng)的幅值.若ST0i>0,則T波為正向波;若ST0i<0,則T波為倒置波.
最后,以R峰為起點(diǎn),向后進(jìn)行窗寬為v1的加窗處理,通過(guò)極大(小)值法,得到T峰的位置,其中v1=2/3*RR,得到的正向T峰序列記為
倒置 T 峰序列記為 T2={T2(1),T2(2),···,T2(m)}.
步驟2:T波起點(diǎn)/終點(diǎn)定位
首先,以 T峰為起始點(diǎn),向心電信號(hào)采樣方向相同的方向 (向后)進(jìn)行窗寬為 v2的加窗處理,在每一個(gè)窗內(nèi)通過(guò)求導(dǎo)法,得到候選的 T波終點(diǎn),其中 v2=150ms,得到的候選正向 T波終點(diǎn)序列記作 T1e0={T1e0(i)}和候選倒置 T波終點(diǎn)記作 T2e0={T2e0(i)},其中 i=1,2,···,m.
其次,判斷候選T波終點(diǎn)是否存在誤檢,并對(duì)誤檢T波終點(diǎn)進(jìn)行修正.計(jì)算候選T波終點(diǎn)與T峰之間的水平距離,記作d={di|di=Te0(i)-T(i)},其中i=1,2,···,m.
若di<THR,其中THR為誤檢的閾值,根據(jù)T波時(shí)長(zhǎng)特點(diǎn)得到,單位為位置點(diǎn)數(shù),則說(shuō)明候選T波終點(diǎn)存在誤檢.那么以T(i)為起始點(diǎn),向后進(jìn)行二次加窗處理,在每一個(gè)窗內(nèi)通過(guò)求導(dǎo)法檢測(cè)拐點(diǎn),記作kij,j=1,2,···,K,K 為檢測(cè)到的拐點(diǎn)個(gè)數(shù),并計(jì)算其對(duì)應(yīng)的幅值.計(jì)算二次加窗得到的拐點(diǎn)與T峰之間的水平距離為dij=kij-T(i),其中j=1,2,···,K,如果T波為正向波(倒置波),則將窗內(nèi)dij>THR,且幅值最小(大)的拐點(diǎn)作為第i個(gè)T波終點(diǎn)修正后的位置點(diǎn).
若di≥THR,則以候選T波終點(diǎn)為最終的T波終點(diǎn).
最后,重復(fù)執(zhí)行上述步驟,直至得到最終的T波終點(diǎn)序列,記作
其中 i=1,2,···,m.
利用上述方法,向心電信號(hào)采樣方向相反的方向進(jìn)行加窗,準(zhǔn)確定位T波起點(diǎn)位置.
在臨床中,心肌梗死發(fā)作時(shí)在心電圖上主要表現(xiàn)為Q波、ST-T段和T波異常.基于此,本小節(jié)從非線性和時(shí)域角度提取5個(gè)特征并將其融合,以此更全面地刻畫心肌梗死發(fā)作時(shí)的3個(gè)典型異常表現(xiàn).
大斑病、小斑病是玉米種植中最為常見的兩種病害,主要病害部位是葉鞘和苞葉,在病情嚴(yán)重的時(shí)候,果穗也會(huì)被波及,最初病斑呈現(xiàn)水浸狀,之后會(huì)逐漸變成青灰色,接著會(huì)呈現(xiàn)褐色,直至玉米植株枯死。針對(duì)這種病害,可以選擇抗病性強(qiáng)的玉米品種,及時(shí)消除越冬病菌,減少發(fā)病幾率。
2.3.1 特征提取
心率變異性(heart rate variability,HRV)是指竇性心律周期性改變現(xiàn)象,是評(píng)價(jià)心臟自主神經(jīng)功能的一種定量指標(biāo)[14].計(jì)算RR間期的標(biāo)準(zhǔn)差作為刻畫心肌梗死心電信號(hào)心率變異性的特征:
其中,RR={RR(i),i=1,2,···,m-1},RR(i)=R(i+1)-R(i).
T波高聳或低平通常出現(xiàn)在 MI-ECG中,當(dāng) T波幅值小于同導(dǎo)聯(lián) R波幅值的1/10,稱之為T波低平;當(dāng)以R波為主的肢體導(dǎo)聯(lián)T波幅值大于0.6mV,胸導(dǎo)聯(lián)大于1.0 mV時(shí),稱之為T波高聳.因此,提取TR幅值比用于刻畫T波幅值異常,其表達(dá)式為:
其中,i=1,2,···,m,fT和fR分別是T波幅值和R波的幅值.
取TR幅值比的均值作為特征,記作MDTR.
T波倒置是心肌梗死最典型的特征之一,可通過(guò)計(jì)算R波和T波的幅值的乘積得到,記為
若FT<0,則表示T波方向與R波方向相反,即存在T波倒置,將其記為1;反之,記為0.
進(jìn)而,不受心率變異影響的QT間期離散度可表示為
其中,QTcd(i)=QTcmax(i)-QTcmin(i),QTcmax為校正QT間期最大值,QTcmin為校正QT間期最小值.
取QT間期離散度的均值作為特征,記作MDQT.樣本熵是由文獻(xiàn)[6]提出的一種反映時(shí)間序列復(fù)雜度的方法[16].
對(duì)于給定的樣本點(diǎn)數(shù)為N的時(shí)間序列x,其樣本熵計(jì)算方法如下:
從給定的時(shí)間序列中提取N-m個(gè)長(zhǎng)度為m的子序列,記作
綜合上述特征,稱
為本文所提取的MI-ECG融合特征.
2.3.2 MI-ECG 自動(dòng)判讀方法
對(duì)于預(yù)處理后的MI-ECG數(shù)據(jù),基于上述所提出的方法進(jìn)行特征提取,并結(jié)合輕量梯度提升算法(Light Gradient Boosting Machine,LingtGBM)[17]完成MI-ECG的自動(dòng)判讀.具體流程如圖3所示.
圖3 MI-ECG自動(dòng)判讀算法流程圖
本文使用的心電信號(hào)均來(lái)源于德國(guó)國(guó)家計(jì)量研究所PTB診斷數(shù)據(jù)庫(kù)[18],該數(shù)據(jù)庫(kù)共包含來(lái)自290位受試者的549條記錄,每條記錄包含常規(guī)12導(dǎo)聯(lián)和3個(gè)Frank導(dǎo)聯(lián),采樣率為1000Hz,分辨率為16bit.其中心肌梗死患者148例(368條記錄),健康受試者52例(80條記錄).本小節(jié)選取80條健康受試者心電記錄和160條心肌梗死心電記錄進(jìn)行數(shù)值實(shí)驗(yàn),所有實(shí)驗(yàn)通過(guò)Matlab 2020b和Python 3.7進(jìn)行實(shí)現(xiàn).
數(shù)值實(shí)驗(yàn)中,隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,其余30%作為測(cè)試集.為了降低隨機(jī)劃分所導(dǎo)致的訓(xùn)練集和測(cè)試集中不同類數(shù)據(jù)點(diǎn)的不均衡,實(shí)驗(yàn)執(zhí)行10次,并取10次實(shí)驗(yàn)的平均結(jié)果作為最終分類性能的度量.
3.2.1 T波定位結(jié)果分析
在T波檢測(cè)過(guò)程中,以R峰為起點(diǎn),向后進(jìn)行窗寬為v1=*RR,檢測(cè)窗內(nèi)極大(小)值點(diǎn),并將其作為T波峰的位置點(diǎn),結(jié)果如圖4所示,分別展示了正常和T波倒置、低平、高聳等不同異常T波的檢測(cè)結(jié)果.在T波終點(diǎn)修正過(guò)程中,結(jié)合T波時(shí)長(zhǎng)特點(diǎn)[19],設(shè)置窗寬v2=150(即0.15s),閾值THR=80(即0.08s).修正后T波終點(diǎn)位置如圖4中寶藍(lán)色星形所示.
圖4 T波檢測(cè)結(jié)果
3.2.2 MI-ECG 融合特征的性能分析
圖5展示了本文所提取的心率變異性指標(biāo) SDNN、TR幅值比、T波倒置指標(biāo)、QT間期離散度、樣本熵以及融合所有特征的ROC曲線,從圖中可以看出,融合特征在MI-ECG的自動(dòng)判讀中性能表現(xiàn)更為良好,優(yōu)于從單一角度考慮的特征.
圖5 不同特征的ROC曲線
3.2.3 MI-ECG 自動(dòng)判讀的結(jié)果分析
本文采用準(zhǔn)確率Acc、敏感性Sen和特異性Spe作為評(píng)估算法性能的度量指標(biāo),分別表示如下:
其中,TP(true positive)為真陽(yáng)性,表示實(shí)際為心肌梗死心電且被正確檢測(cè)為心肌梗死心電;TN(true negative)為真陰性,表示實(shí)際為正常心電且被正確檢測(cè)為正常心電;FP(false positive)為假陽(yáng)性,表示實(shí)際為正常心電但被錯(cuò)誤檢測(cè)為心肌梗死心電;FN(false negative)為假陰性,表示實(shí)際為心肌梗死心電但被錯(cuò)誤檢測(cè)為正常心電.
表1展示了本文方法與已有方法在PTB診斷數(shù)據(jù)庫(kù)中實(shí)現(xiàn)MI-ECG自動(dòng)判讀的性能比較.從表中可以看出,本文所提方法平均準(zhǔn)確率、敏感性和特異性優(yōu)于其他已有方法,分別為97.74%,98.32%和96.40%.
表1 本文方法與已有方法性能對(duì)比
本文提出了一種新的基于融合特征的 MI-ECG自動(dòng)判讀方法.首先,利用小波變換和軟閾值法對(duì)原始心電信號(hào)進(jìn)行去噪處理;其次,對(duì)去噪后的信號(hào)進(jìn)行QRS波群和T波的定位,進(jìn)而計(jì)算RR間期、R波幅值和 T波幅值;然后,提取心率變異性指標(biāo)SDNN、TR幅值比、QT間期離散度、T波倒置指標(biāo)和樣本熵等特征并將其融合;最后,結(jié)合 PTB診斷數(shù)據(jù)庫(kù)中心肌梗死心電數(shù)據(jù),利用輕量梯度提升算法實(shí)現(xiàn)MI-ECG的自動(dòng)判讀.數(shù)值實(shí)驗(yàn)結(jié)果表明,本文所提方法在MI-ECG自動(dòng)判讀中具有可行性且性能表現(xiàn)良好,能夠?yàn)檩o助醫(yī)生快速完成心肌梗死臨床診斷提供有效指導(dǎo),從而提高心肌梗死的診斷效率和準(zhǔn)確率.