朱曉慶 陳韜 沈娟 郭軍
心房顫動(dòng)(房顫)是最常見的心律失常之一[1]。中國45歲及以上的成年人中約790萬人患房顫,隨著人口老齡化進(jìn)程,房顫患病率持續(xù)增加[2]。既往研究發(fā)現(xiàn)房顫與心原性腦卒中風(fēng)險(xiǎn)增加、生活質(zhì)量降低及心力衰竭風(fēng)險(xiǎn)增加密切相關(guān),與其他病因的腦卒中相比,房顫相關(guān)腦卒中的致殘率及死亡風(fēng)險(xiǎn)明顯增加[3-4]。由于房顫往往是陣發(fā)性且部分患者發(fā)作時(shí)無癥狀[5],因此早期診斷及預(yù)防干預(yù)具有一定挑戰(zhàn)性。據(jù)估計(jì),15%的房顫患者未被檢出,且其中超過半數(shù)的患者處于缺血性腦卒中的中高風(fēng)險(xiǎn)分層[6],因此早期檢出房顫具有重要臨床意義。疾病風(fēng)險(xiǎn)預(yù)測模型是目前的研究熱點(diǎn),通過構(gòu)建預(yù)測模型,能夠篩選出房顫高風(fēng)險(xiǎn)人群,針對該人群的密集監(jiān)測可以提高房顫檢出率,隨后的預(yù)防干預(yù)能夠?yàn)榛颊邘砼R床獲益[7]。
已有許多研究使用經(jīng)典的回歸方法分析房顫相關(guān)的臨床危險(xiǎn)因素,并構(gòu)建風(fēng)險(xiǎn)評分模型,便于計(jì)算且可解釋性強(qiáng),但在分析臨床、實(shí)驗(yàn)室及影像學(xué)等大數(shù)據(jù)時(shí)仍存在一定的局限性。近些年,人工智能發(fā)展迅猛并廣泛應(yīng)用于醫(yī)療衛(wèi)生領(lǐng)域。目前,基于機(jī)器學(xué)習(xí)算法,使用多維臨床數(shù)據(jù)進(jìn)行心血管疾病診斷及預(yù)測的研究日益增多[8-10]。機(jī)器學(xué)習(xí)算法具有分析和組合不同變量以預(yù)測房顫的潛力,其效能遠(yuǎn)超過傳統(tǒng)方法[11]。本文將對房顫預(yù)測的傳統(tǒng)回歸方法和機(jī)器學(xué)習(xí)方法作如下綜述。
回歸分析是一種基于統(tǒng)計(jì)學(xué)原理的分析方法,通過建立數(shù)學(xué)模型,以描述自變量和因變量之間的關(guān)系,通常使用參數(shù)估計(jì)及假設(shè)檢驗(yàn)等方法來確定模型的參數(shù),最終使用這些參數(shù)預(yù)測未知數(shù)據(jù)的結(jié)果。常用的方法包括線性回歸、Logistic回歸、Cox比例風(fēng)險(xiǎn)回歸等?;谔囟ê瘮?shù)所建立的回歸模型直觀性強(qiáng)且便于計(jì)算。但其僅適合處理低維度的特征變量,模型性能存在多方面的限制。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是實(shí)現(xiàn)人工智能的技術(shù)手段,通常通過監(jiān)督式學(xué)習(xí)、無監(jiān)督式學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等方式,使用多維數(shù)據(jù)訓(xùn)練模型,實(shí)現(xiàn)預(yù)測、聚類等任務(wù)。在臨床研究中常用的傳統(tǒng)機(jī)器學(xué)習(xí)算法包括人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、隨機(jī)生存森林(RSF)等。
深度學(xué)習(xí)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法,通過多層次的非線性變換和特征自動(dòng)提取,實(shí)現(xiàn)對大規(guī)模數(shù)據(jù)的高效整合分析。常用的深度學(xué)習(xí)算法包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時(shí)記憶網(wǎng)絡(luò)(LSTM)等。目前,深度學(xué)習(xí)在醫(yī)學(xué)影像自動(dòng)分割、疾病診斷和預(yù)測等研究中廣泛應(yīng)用。
既往許多研究使用易獲取的臨床變量,構(gòu)建房顫風(fēng)險(xiǎn)評分模型。Framingham心臟研究(FHS)中,基于美國白人人群構(gòu)建了房顫風(fēng)險(xiǎn)評分模型,AUC為0.78[12],但對非白人的房顫預(yù)測的適用性仍不明確,因此,Chamberlain等[13]基于社區(qū)動(dòng)脈粥樣硬化風(fēng)險(xiǎn)(ARIC)研究的雙種族隊(duì)列開發(fā)了一個(gè)全新的評分模型(AUC=0.78)。心臟與老齡化基因流行病隊(duì)列(CHARGE-AF)研究進(jìn)一步綜合了心血管健康研究(CHS)、FHS及ARIC研究三大隊(duì)列,構(gòu)建的模型在美國整體人群中更具代表性,模型表現(xiàn)(AUC=0.77)不劣于以往的單人種模型[14]。近些年,陸續(xù)有團(tuán)隊(duì)在亞洲人群中開展相關(guān)研究?;谥袊_灣人群構(gòu)建的CHASE-LESS模型以及基于中國云南人群構(gòu)建的C2HEST模型均僅包含6個(gè)臨床變量,計(jì)算方便且便于應(yīng)用,AUC分別達(dá)到0.73和0.75[15-16]。
此外,實(shí)驗(yàn)室檢查、影像學(xué)數(shù)據(jù)及心電圖數(shù)據(jù)中可能蘊(yùn)藏著新發(fā)房顫相關(guān)的標(biāo)志物。常見的血清心臟生物標(biāo)志物,如利鈉肽和C反應(yīng)蛋白被證明可增強(qiáng)臨床風(fēng)險(xiǎn)評分的預(yù)測能力[17]。胱抑素C以及內(nèi)皮功能障礙也被證明與新發(fā)房顫相關(guān)[18]?;颊邫z查及檢驗(yàn)數(shù)據(jù)中包含龐大數(shù)量的參數(shù),采用傳統(tǒng)回歸建模已變得不切實(shí)際。隨著臨床記錄的數(shù)字化,研究人員開始探索使用機(jī)器學(xué)習(xí)算法篩選重要預(yù)測因子,構(gòu)建房顫預(yù)測模型。
Tiwari等[19]的研究納入了近200萬例患者,使用電子健康記錄中提取的200多個(gè)變量,訓(xùn)練了一種機(jī)器學(xué)習(xí)模型以預(yù)測未來6個(gè)月房顫風(fēng)險(xiǎn),AUC為0.80,比基于危險(xiǎn)因素的Logistic回歸模型略好。英國一項(xiàng)大型研究中,采用機(jī)器學(xué)習(xí)方法構(gòu)建的模型表現(xiàn)優(yōu)異(AUC=0.83)[20],顯著優(yōu)于傳統(tǒng)的CHARGE - AF評分模型(AUC=0.73),并且該機(jī)器學(xué)習(xí)模型在外部隊(duì)列測試中表現(xiàn)出極強(qiáng)的穩(wěn)健性(AUC=0.87)[21]。
許多因素會影響模型性能,不能僅憑AUC評價(jià)模型優(yōu)劣。研究隨訪時(shí)間的差異顯著影響了研究終止時(shí)的房顫發(fā)病率。Tiwari等[19]的研究僅有6個(gè)月的隨訪時(shí)間,若隨訪時(shí)間延長,其中的“假陽性”患者將變?yōu)椤罢骊栃浴?,一定程度上會提高測試性能??傮w對比來看,機(jī)器學(xué)習(xí)模型比傳統(tǒng)回歸模型表現(xiàn)出更強(qiáng)的穩(wěn)健性。
PREDICT-AF研究表明,在房顫發(fā)作前兩年就已存在心外膜纖維化面積、波形蛋白陽性的間質(zhì)細(xì)胞面積增大等左心房亞臨床重構(gòu)的特征性改變[22]。因此,患者未發(fā)生房顫時(shí)可能已存在與纖維化相關(guān)的亞臨床心臟電生理改變,使得利用竇性心律期間的心電圖預(yù)測房顫風(fēng)險(xiǎn)成為可能。
研究顯示,心電圖的心房和心室參數(shù)可以作為房顫的預(yù)測因子。心房參數(shù)包括P波時(shí)限、高度房內(nèi)傳導(dǎo)阻滯、P波起始至波峰時(shí)間、PR間期、P波離散度、P波面積、P波電軸、P波終末電勢、P波振幅等[23-30]。心室參數(shù)包括左心室肥厚、QT間期、QRS時(shí)限、束支傳導(dǎo)阻滯、R波遞增不良、ST-T波異常等[31-35]。此外,心房早搏復(fù)合征(APC)的形態(tài)和頻率可作為陣發(fā)性房顫的預(yù)測因子[36]。一項(xiàng)韓國研究分析了進(jìn)行24 h動(dòng)態(tài)心電圖監(jiān)測的患者,結(jié)果顯示APC負(fù)擔(dān)與新發(fā)房顫相關(guān),其AUC為0.58[37]。鑒于心電參數(shù)在房顫中的預(yù)測價(jià)值,Sanz-García等[38]基于竇性心電圖參數(shù)構(gòu)建了一個(gè)Logistic回歸模型,其AUC達(dá)到0.776。
Ebrahimzadeh等[39]開展的自身對照研究中,截取了房顫發(fā)作前30 min與終止后45 min的5 min心電圖片段,提取了時(shí)域、頻域和非線性特征,基于多種機(jī)器學(xué)習(xí)方法預(yù)測陣發(fā)性房顫,靈敏度、特異度及準(zhǔn)確度分別達(dá)到了100%、95.5%及98.2%。結(jié)果表明組合的機(jī)器學(xué)習(xí)比單一機(jī)器學(xué)習(xí)方法,如多層感知器、K近鄰、支持向量機(jī)的表現(xiàn)更佳。
算法的創(chuàng)新助推了深度學(xué)習(xí)在房顫預(yù)測中的應(yīng)用。妙佑醫(yī)療國際的一項(xiàng)研究使用了超過60萬份的竇性心電圖,基于CNN訓(xùn)練了人工智能(AIECG)模型。該模型能夠通過患者的一份竇性心電圖預(yù)測未來30天新發(fā)房顫風(fēng)險(xiǎn),AUC達(dá)到0.87[40]。Raghunath等[41]使用160多萬份竇性心電圖開發(fā)了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的人工智能模型,預(yù)測未來一年新發(fā)房顫風(fēng)險(xiǎn),AUC達(dá)到0.85。Khurshid等[42]的研究在訓(xùn)練基于CNN的心電圖模型以外,還結(jié)合了CHARGE-AF評分模型以預(yù)測患者5年房顫風(fēng)險(xiǎn),AUC達(dá)到0.84。
傳統(tǒng)方法處理心電數(shù)據(jù)的過程繁瑣耗時(shí),機(jī)器學(xué)習(xí)方法能夠提取并分析大量的心電特征。越來越多的研究正不斷拓展機(jī)器學(xué)習(xí)在基于心臟電生理數(shù)據(jù)預(yù)測房顫中的應(yīng)用價(jià)值。此外,基于心電圖的疾病風(fēng)險(xiǎn)預(yù)測的一個(gè)未研究的方向是心電參數(shù)的時(shí)間演變。目前尚不清楚是心電參數(shù)的變化還是參數(shù)的絕對值在房顫進(jìn)展中更加重要,心電圖參數(shù)的變化模式可能成為更好的房顫預(yù)測指標(biāo),有待進(jìn)一步研究。
房顫患者常伴有心臟影像學(xué)上的結(jié)構(gòu)異常,包括超聲心動(dòng)圖、心臟CT及心臟磁共振成像(CMR)。既往基于超聲心動(dòng)圖的研究表明,左心房容積、舒張功能障礙、心室壁厚度及心房總傳導(dǎo)時(shí)間與新發(fā)房顫相關(guān)[43-46]。心臟CT顯示的左心房厚度是心房病變的標(biāo)志物,與陣發(fā)性房顫向持續(xù)性房顫轉(zhuǎn)變相關(guān)[47-48]。
CMR在評估心臟組織特征方面具有獨(dú)特的能力,CMR測得的左心房釓延遲增強(qiáng)(LGE)與左心房纖維化程度相關(guān)。一項(xiàng)研究證明,左心房LGE絕對面積及其占左心房壁面積百分比與新發(fā)房顫相關(guān),在包含危險(xiǎn)因素及左心房和心室功能的模型中加入該指數(shù)可顯著提高預(yù)測效能(AUC:67.7% vs.78.9%)[49]。一項(xiàng)隊(duì)列研究納入了7 639例無房顫病史且進(jìn)行CMR檢查的患者,從CMR 的疾病表型、健康問卷、電子病歷中提取了115個(gè)變量,基于隨機(jī)生存森林構(gòu)建模型,預(yù)測新發(fā)房顫的1年、2年、3年的AUC分別為0.80、0.79和0.70[50]。這些研究僅使用了影像學(xué)的常規(guī)參數(shù),模型仍缺乏一定準(zhǔn)確性,有待深度挖掘醫(yī)學(xué)影像數(shù)據(jù)完善現(xiàn)有的房顫預(yù)測研究。
4.2.1 基本概念與研究流程
近些年,機(jī)器學(xué)習(xí)在圖像分析領(lǐng)域發(fā)展迅猛,繼影像組學(xué)概念提出后,機(jī)器學(xué)習(xí)與影像組學(xué)的結(jié)合極大促進(jìn)了醫(yī)學(xué)影像分析的迭代。影像組學(xué)通過高通量地提取醫(yī)學(xué)影像的定量特征,提供更加多元的信息特征,并在疾病診斷及預(yù)測研究中廣泛應(yīng)用[51]。
與來自電子健康記錄的分類或連續(xù)變量的輸入不同,影像組學(xué)在應(yīng)用機(jī)器學(xué)習(xí)時(shí)需要更復(fù)雜的方法,但基本理論類似[52]。區(qū)別于傳統(tǒng)人工判讀圖像時(shí)主觀定性的解釋,影像組學(xué)能夠量化提取感興趣區(qū)(ROI)內(nèi)的圖像灰度、形狀、紋理等信息,通過機(jī)器學(xué)習(xí)篩選所提取的海量特征,建立模型以改進(jìn)疾病診斷、預(yù)測及預(yù)后評估[53]。
4.2.2 房顫消融術(shù)后復(fù)發(fā)的預(yù)測
較多研究關(guān)注于房顫消融術(shù)后的復(fù)發(fā)風(fēng)險(xiǎn)。一項(xiàng)研究分析了接受房顫消融術(shù)患者的術(shù)前心臟CT,在左心房、肺靜脈、心肌壁的ROI中提取了28個(gè)影像組學(xué)特征,基于隨機(jī)森林算法預(yù)測術(shù)后房顫復(fù)發(fā),結(jié)合臨床危險(xiǎn)因素后的模型AUC達(dá)到0.87[54]。另一項(xiàng)研究分析了患者術(shù)前心臟CT的左心房形態(tài),結(jié)合臨床因素與影像學(xué)特征的模型AUC為0.78[55]。Yang等[56]提取了心臟CT圖像下左心房周圍心外膜脂肪組織的影像組學(xué)特征并結(jié)合容量信息構(gòu)建了預(yù)測模型,AUC達(dá)到0.86。
4.2.3 影像組學(xué)與新發(fā)房顫預(yù)測
目前基于影像組學(xué)預(yù)測新發(fā)房顫的研究仍然較少。一項(xiàng)使用英國生物銀行數(shù)據(jù)庫的研究分析了患者基線CMR圖像,在收縮末期和舒張末期的右心室腔、左心室腔和左心室心肌的ROI中提取影像組學(xué)特征,基于支持向量機(jī)算法構(gòu)建預(yù)測模型。基于CMR影像組學(xué)的模型AUC為0.73,結(jié)合臨床危險(xiǎn)因素后提升至0.76[57]。未來研究需要進(jìn)一步發(fā)展影像組學(xué)在房顫等非影像學(xué)診斷的疾病的檢測及預(yù)測中的應(yīng)用??紤]到篩查無癥狀患者的高成本問題以及接受心臟影像學(xué)檢查的患者存在選擇偏倚的問題,開展基于人群的大型研究仍存在一定困難。
盡管基于人工智能的模型在預(yù)測性能上表現(xiàn)出比傳統(tǒng)方法更大的優(yōu)勢,但在部署應(yīng)用人工智能模型時(shí)仍存在相關(guān)倫理及法律問題。目前,人工智能應(yīng)用仍處于早期階段,深度學(xué)習(xí)算法固有的“黑匣子”特性使得研究人員無法明確人工智能算法提取、組合和選擇了哪些預(yù)測變量。此外,在影像組學(xué)中,復(fù)雜算法提取的影像特征很難被影像學(xué)專家識別出來。當(dāng)人工智能工具輸出結(jié)果時(shí),其可靠性需要審慎地判斷,假陽性和假陰性的問題可能會導(dǎo)致干預(yù)及治療上的嚴(yán)重醫(yī)療事故,隨后的責(zé)任歸屬將產(chǎn)生分歧。
回歸模型由于結(jié)構(gòu)簡單,具有事前解釋能力。但復(fù)雜的機(jī)器學(xué)習(xí)算法本身不具備可解釋性,因此模型構(gòu)建后必須提供輸出結(jié)果的事后解釋,以便醫(yī)生理解、信任并安全地使用人工智能輔助工具??山忉屓斯ぶ悄埽╔AI)的出現(xiàn)增強(qiáng)了對機(jī)器學(xué)習(xí)輸出的解釋,常用方法包括類激活映射、Grad-CAM、Smooth Grad、顯著性圖,可以標(biāo)記圖像中哪些部位對預(yù)測具有更高價(jià)值。在結(jié)構(gòu)化數(shù)據(jù)預(yù)測中,SHAP(Shapley Additive Explanations)的應(yīng)用最為廣泛,能夠度量每個(gè)特征對模型輸出的貢獻(xiàn)[58]??山忉屓斯ぶ悄苋允切屡d的研究領(lǐng)域,如何更加明確地窺視“黑箱”中的信息,是未來研究的方向。
基于機(jī)器學(xué)習(xí)開展的房顫預(yù)測研究日益增多,但大多數(shù)研究僅基于單個(gè)數(shù)據(jù)庫開展模型訓(xùn)練,在外部數(shù)據(jù)庫的測試效能往往不及內(nèi)部測試集,針對不同地區(qū)、種族的泛化性較差。進(jìn)一步研究基于本國人群的風(fēng)險(xiǎn)預(yù)測模型是必要的。
雖然目前人工智能在醫(yī)學(xué)研究領(lǐng)域的應(yīng)用仍處于早期階段,并且人工智能模型存在其固有的難以解釋性,但機(jī)器學(xué)習(xí)在提高房顫預(yù)測能力方面仍表現(xiàn)出巨大優(yōu)勢。毫無疑問,隨著人工智能技術(shù)的不斷進(jìn)步以及對人工智能理解的不斷深入,人工智能將在醫(yī)學(xué)領(lǐng)域發(fā)揮更為突出的作用。未來臨床、影像學(xué)、心臟電生理數(shù)據(jù)的整合必將提高機(jī)器學(xué)習(xí)模型的預(yù)測性能,并最終改善全球患者的診療及護(hù)理。
利益沖突:所有作者均聲明不存在利益沖突