陳曉宇 王希明
急性缺血性卒中是一種由動脈粥樣硬化和血栓形成引起的急性腦血管疾病,是成人致殘的主要原因。如何客觀準(zhǔn)確地評估缺血性腦卒中病人的狀況,如血管閉塞的部位、梗死灶的面積、腦側(cè)支循環(huán)的狀態(tài)等,對于臨床診治十分重要。在缺血性腦卒中的診斷過程中會產(chǎn)生大量影像數(shù)據(jù),但受醫(yī)師經(jīng)驗水平和時間所限,往往難以對這些影像數(shù)據(jù)分析透徹,從而造成誤診、漏診[1]。將人工智能(artificial intelligence,AI)技術(shù)與CT 和MRI 等影像技術(shù)相結(jié)合來構(gòu)建并訓(xùn)練輔助診斷模型,有利于提高疾病診斷的準(zhǔn)確性,并為臨床治療決策提供較大的幫助。目前,AI 已廣泛用于急性缺血性卒中成像,其對梗死灶檢測、Alberta 卒中項目早期CT 評分(Alberta stroke program early CT score, ASPECTS)分級、大血管閉塞檢測、圖像分割和病人預(yù)后的預(yù)測等有重要輔助作用;同時,它還具有自我糾正的能力,可根據(jù)反饋不斷提高準(zhǔn)確性。本文對常用于急性缺血性卒中成像中的AI 技術(shù)予以概述,并分別介紹AI 在卒中的CT 平掃、CT 血管成像(computed tomography angiography, CTA)、CT 灌注 (computed tomography perfusion,CTP)及 MRI 中的應(yīng)用。
AI 作為計算機(jī)科學(xué)的一個分支,能夠模擬、延伸和擴(kuò)展人類的思維過程和智能行為[2]。AI 包括計算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)(machine learning,ML)等技術(shù)。其中,ML 最常用于醫(yī)學(xué)成像,其依賴于不同算法對復(fù)雜多樣的數(shù)據(jù)進(jìn)行深層分析。傳統(tǒng)的ML 算法包括支持向量機(jī)(support vector machine,SVM)、線性回歸、邏輯回歸、決策樹、隨機(jī)森林、貝葉斯學(xué)習(xí)等,目前在科學(xué)研究領(lǐng)域被廣泛應(yīng)用[3]。在ML 的應(yīng)用過程中,這些傳統(tǒng)算法對簡單任務(wù)比較有效,但是對于一些復(fù)雜的臨床問題其效能較差。深度學(xué)習(xí)(deep learning,DL)是ML 的一個新的分支,相對于傳統(tǒng)的ML 算法,它的性能更優(yōu)越。DL 能夠利用一種特定類型的ML 架構(gòu)大致模仿人類大腦的功能,即人工神經(jīng)網(wǎng)絡(luò),通常被稱為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)[3]。CNN 不僅可以輸入定量數(shù)據(jù),還可以輸入像素或體素信息,解決影像的分類和回歸問題。因此,DL 通過組合低層特征形成更加抽象的高層屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的特征性分布,實現(xiàn)對數(shù)據(jù)的分組,最終達(dá)到診斷的目的。
CT 平掃主要用于排除出血和其他非缺血性病變,初步判斷有無新鮮梗死灶,確定梗死部位和范圍[4]。急性缺血性卒中的特異性表現(xiàn)包括CT 平掃顯示高密度血管征(hyperdense vessel sign,HDVS),即患側(cè)大腦中動脈密度高于正常側(cè),提示大腦中動脈閉塞[5]。Takahashi 等[6]采用一種基于 SVM 算法的模型對CT 平掃上的HDVS 進(jìn)行檢測,該模型敏感度達(dá) 97.5%。Shinohara 等[7-8]對 46 例存在 HDVS 和 52例不存在HDVS 的病例進(jìn)行研究,將ML 模型與神經(jīng)放射醫(yī)師對HDVS 的診斷效能進(jìn)行了比較,結(jié)果顯示ML 模型的準(zhǔn)確度為81.6%,受試者操作特征曲線下面積(area under curve, AUC)為 0.869,而神經(jīng)放射醫(yī)師的初始準(zhǔn)確度為78.8%,AUC 為0.882;但參考ML 模型的結(jié)果后,神經(jīng)放射醫(yī)師第2 次測試的準(zhǔn)確度提升至84.7%,AUC 達(dá)0.932。由此可見,AI 有望輔助醫(yī)師提高對HDVS 的診斷效能。
ASPECTS 為評價早期前循環(huán)缺血性改變的評分量表,該評分將大腦中動脈供血區(qū)域劃為10 個,密度減低的范圍每涉及1 個區(qū)域則減去1 分。Kuang 等[9]以 MR 擴(kuò)散加權(quán)成像(diffusion weighted imaging,DWI)作為金標(biāo)準(zhǔn),使用ML 構(gòu)建模型用來評估ASPECTS 的分級,結(jié)果顯示該模型的特異度為91.8%,敏感度為66.2%。Nagel 等[10]開發(fā)了一個能夠?qū)崿F(xiàn)自動ASPECTS 分級的商業(yè)軟件(e-ASPECTS),該軟件對急性缺血性卒中病人CT 平掃上低密度灶的識別與神經(jīng)影像醫(yī)師的一致性較高,且準(zhǔn)確性相似;但當(dāng)急性缺血性卒中病人存在其他腦實質(zhì)病變(如腦白質(zhì)脫髓鞘改變、陳舊性腦梗死等)時,e-ASPECTS 的準(zhǔn)確性不如神經(jīng)放射醫(yī)師。另一項關(guān)于自動化ASPECTS 評分商業(yè)軟件(Rapid ASPECTS)的研究[11]發(fā)現(xiàn),以 DWI 上的 ASPECTS 為金標(biāo)準(zhǔn),結(jié)果顯示自動化軟件基于CT 平掃的ASPECTS 分級與金標(biāo)準(zhǔn)之間的一致性(κ=0.9)高于神經(jīng)放射醫(yī)師(κ=0.56~0.57),在急性缺血性卒中發(fā)病1 h 時,自動化軟件的ASPECTS 分級與金標(biāo)準(zhǔn)之間的一致性較好(κ=0.78),而在發(fā)病4 h 時,兩者之間的一致性更優(yōu)(κ=0.92)。
對于急性缺血性卒中病人,明確梗死的體積有助于指導(dǎo)臨床治療及預(yù)測病人預(yù)后。AI 已逐漸實現(xiàn)在CT 平掃影像上對梗死體積進(jìn)行分割和測量,如CNN 技術(shù)已應(yīng)用于梗死體積的分割[12]。Sales 等[13]在急性缺血性腦卒中的CT 平掃影像上基于CNN 技術(shù)分割獲得梗死體積,與作為金標(biāo)準(zhǔn)的DWI 獲得的梗死體積之間具有極好的一致性,組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient, ICC)達(dá)到 0.88(最佳 ICC 為 1)。
CTA 能清晰顯示頸內(nèi)動脈,椎動脈,基底動脈,大腦前、中、后動脈,可用以判別急性缺血性腦卒中的責(zé)任血管并評估其側(cè)支循環(huán)[4]。將AI 技術(shù)用于CTA 影像,使得自動化探測缺血性腦卒中病人大血管閉塞、測量梗死核心及評估側(cè)支循環(huán)成為可能。Rodrigues 等[14]采用 AI 商業(yè)軟件(Via.ai)對 610 例卒中病人進(jìn)行探測分析,結(jié)果顯示,該軟件對雙側(cè)頸內(nèi)動脈或大腦前、中動脈閉塞的診斷敏感度、特異度和準(zhǔn)確度分別為87.6%、88.5%和87.9%。Sheth等[15]利用大腦的對稱性研發(fā)了RAPID 軟件用于識別CTA 上的雙側(cè)頸內(nèi)動脈或大腦前、中動脈的閉塞并測量核心梗死體積,RAPID 軟件對179 例病人的核心梗死體積進(jìn)行了評估,并以CTP 上的核心梗死體積為金標(biāo)準(zhǔn),結(jié)果顯示該軟件的準(zhǔn)確性與CTP 相近且AUC 為0.88。You 等[16]將CT 平掃和臨床基本信息結(jié)合,構(gòu)建了一種基于ML 方法(包括邏輯回歸、隨機(jī)森林、SVM 等)的診斷模型,隨后在300 例雙側(cè)頸內(nèi)動脈或大腦前、中動脈閉塞病人中進(jìn)行驗證,得到了較高的診斷效能(AUC 為0.847)。?man等[17]在CTA 上運用三維CNN 技術(shù),以檢測和分割核心梗死區(qū),獲得的AUC 值為0.93,Dice 系數(shù)為0.61。此外,在缺血性腦卒中側(cè)支循環(huán)自動化評估方面,Grunwald 等[18]采用商業(yè)軟件 e-CTA 評估 98 例機(jī)械取栓病人的側(cè)支循環(huán)TAN 評分,結(jié)果顯示e-CTA 使得神經(jīng)放射醫(yī)師的ICC 從0.58 提升至0.77,且該軟件對側(cè)支循環(huán)的敏感度和特異度分別為0.99 和 0.94。
CTP 可以顯示核心梗死區(qū)域[4]。在一項基于缺血性卒中發(fā)病6 h 內(nèi)CTP 影像的回顧性研究中,以DWI 上的核心梗死體積為金標(biāo)準(zhǔn),結(jié)果表明CNN中延遲和色散校正的準(zhǔn)確性高于標(biāo)準(zhǔn)化流程[19]。Kasasbeh 等[20]基于CTP 和臨床資料使用CNN 構(gòu)建模型以預(yù)測急性缺血性卒中病人的核心梗死體積,同樣使用DWI 作為金標(biāo)準(zhǔn),結(jié)果顯示單純CTP 組的 AUC 為 0.85,CTP 結(jié)合臨床資料的 AUC 為 0.87,最大Dice 系數(shù)為0.48。這些研究表明,AI 與CTP 相結(jié)合可以實現(xiàn)準(zhǔn)確評估核心梗死體積。
對于急性缺血性卒中,MRI 影像上核心梗死區(qū)的AI 自動分割和測定常采用DWI 影像或表觀擴(kuò)散系數(shù)(ADC)圖,DWI 上的核心梗死體積亦常被作為金標(biāo)準(zhǔn)。Kim 等[21]用一種編碼解碼 CNN 的U-net 模型在DWI 和ADC 圖上進(jìn)行圖像分割,發(fā)現(xiàn)U-net模型的分割結(jié)果與專家的手動分割結(jié)果之間具有高度一致性,ICC 高達(dá) 1.0。Wu 等[22]利用 3D CNN 對多中心的DWI 數(shù)據(jù)上急性缺血性病灶進(jìn)行分割,并將結(jié)果與人工測量的病灶體積比較,發(fā)現(xiàn)兩者之間相關(guān)性極好(相關(guān)系數(shù)為0.92)。除DWI 序列,MR灌注成像(perfusion weighted imaging, PWI)也可用于卒中診斷和梗死灶分割。Bouts 等[23]在右側(cè)大腦中動脈閉塞后自發(fā)或誘導(dǎo)再灌注和無再灌注的嚙齒動物模型中比較了5 種DL 算法,其中廣義線性模型在檢測PWI 缺血半暗帶中的表現(xiàn)最好,Dice 系數(shù)為 0.79。Huang 等[24]基于 SVM 在 PWI 的腦血流量圖和ADC 圖上對缺血半暗帶進(jìn)行分割,以檢測大腦中動脈閉塞,該模型在動脈閉塞后30 min、60 min診斷的AUC 分別為88%和94%。此外,利用多模態(tài)MRI 或液體衰減反轉(zhuǎn)恢復(fù)(fluid-attenuated inversion recovery,FLAIR)序列對缺血半暗帶和核心梗死區(qū)影像分割的研究也已獲得一些成果。結(jié)合隨機(jī)森林算法的多模態(tài)MRI 模型在對梗死灶的灌注估量和分割的準(zhǔn)確性較高,平均Dice 系數(shù)分別為0.82 和0.59[25]。在使用FLAIR 序列進(jìn)行梗死灶分割的研究[26-28]中,隨機(jī)森林模型的準(zhǔn)確性也較高,Dice 系數(shù)范圍為 0.54~0.6。
急性缺血性腦卒中的發(fā)病時間對于治療方式的選擇至關(guān)重要,但某些時候無法準(zhǔn)確得知病人的發(fā)病時間。Lee 等[29]納入部分發(fā)病時間不明確的急性缺血性卒中病人,采用DWI-FLAIR 不匹配判斷其發(fā)病時間是否處于4.5 h 內(nèi),以期判斷是否適用靜脈溶栓治療,結(jié)果表明人工判斷DWI-FLAIR 不匹配的敏感度僅為48.5%,而基于ML 的判斷具有更高的敏感度,如隨機(jī)森林的敏感度為72.7%,Logistic回歸和SVM 敏感度均達(dá)75.8%,且這3 種ML 方法并未使特異度下降。因此,AI 可輔助確定急性缺血性卒中病人的發(fā)病時間,有助于臨床決策的實施。
梗死后出血轉(zhuǎn)化作為缺血性腦卒中治療后的一種嚴(yán)重并發(fā)癥與不良預(yù)后相關(guān)。Yu 等[30]以24 h的隨訪MRI 作為金標(biāo)準(zhǔn),使用包括SVM、線性回歸、決策樹等的ML 模型在DWI 和PWI 影像上預(yù)測潛在出血轉(zhuǎn)化的部位,ML 模型的準(zhǔn)確度高達(dá)84%。Bouts 等[31]在梗死后再灌注誘導(dǎo)的出血轉(zhuǎn)化動物模型中,發(fā)現(xiàn)基于多參數(shù)MRI 的隨機(jī)森林模型可以有效預(yù)測出血,AUC 為 0.85~0.89。
缺血性腦卒中會導(dǎo)致認(rèn)知或運動功能的喪失,因此,對腦卒中病人臨床預(yù)后的預(yù)測可以影響醫(yī)師的治療決策,也有助于減少卒中額外的并發(fā)癥,并最大限度地提高病人生活質(zhì)量。最近的研究集中在利用AI 預(yù)測卒中病人的臨床預(yù)后,以期支持早期的臨床決策。例如,Tang 等[32]研發(fā)并驗證基于SVM、決策樹等算法的ML 模型對病人短期和長期的臨床預(yù)后進(jìn)行預(yù)測,結(jié)合術(shù)前DWI 和PWI 影像資料、臨床基本資料構(gòu)建綜合模型,并與僅有臨床基本資料和缺血半暗帶體積的模型比較,發(fā)現(xiàn)綜合模型在預(yù)測短期和長期的臨床預(yù)后結(jié)果方面更為準(zhǔn)確,AUC達(dá)0.863。一項回顧性研究[33]采用梯度提升算法預(yù)測病人預(yù)后,結(jié)合影像學(xué)資料、流行病學(xué)資料及臨床基本資料構(gòu)建綜合模型,其預(yù)測不良預(yù)后的準(zhǔn)確度為87.7%。Chauhan 等[34]將3D MRI 影像數(shù)據(jù)輸入基于CNN 的模型以評估缺血性卒中病人言語障礙的嚴(yán)重程度,通過比較基于線性回歸、SVM 算法的ML模型和CNN 模型發(fā)現(xiàn),CNN 模型預(yù)測言語障礙的能力最優(yōu),在更大的樣本量中也得到了驗證。Rehme等[35]利用功能MRI 發(fā)現(xiàn)了與卒中相關(guān)的運動障礙的神經(jīng)影像學(xué)標(biāo)志物,將40 例卒中病人與20 名健康者對照,在治療前的DWI 和治療后的功能MRI上分別運用SVM 算法構(gòu)建模型,發(fā)現(xiàn)該模型可以準(zhǔn)確辨別有無手部運動障礙的卒中病人,準(zhǔn)確度高達(dá)88%。
將AI 與多種影像檢查方法結(jié)合,有助于提高腦卒中的診斷效能。但是目前AI 用在急性缺血性腦卒中研究上還存在一些局限性。首先,AI 尚不能分辨病人腦實質(zhì)中的陳舊性病變,其準(zhǔn)確性還需進(jìn)一步提高。其次,目前AI 在缺血性腦卒中方面的研究多局限于前循環(huán),適用于后循環(huán)的較少,希望未來檢測缺血性腦卒中的軟件能被進(jìn)一步研發(fā)、完善、推廣。再次,AI 的應(yīng)用還存在一些挑戰(zhàn),由于AI模型需要經(jīng)過大樣本量的數(shù)據(jù)訓(xùn)練后才能獲得穩(wěn)定的效能,如何構(gòu)建大規(guī)模、高質(zhì)量的訓(xùn)練集數(shù)據(jù),這是AI 的一大難點。另外,AI 的準(zhǔn)確性需要進(jìn)行驗證,這需要投入大量的人力和時間。最后,數(shù)據(jù)的合法性問題,尤其是數(shù)據(jù)的監(jiān)管、數(shù)據(jù)隱私性和網(wǎng)絡(luò)安全性方面,其倫理層面的保護(hù)措施是AI 領(lǐng)域的關(guān)注點。相信隨著今后AI 技術(shù)與醫(yī)學(xué)影像技術(shù)的進(jìn)一步結(jié)合,能為缺血性腦卒中病人的診療提供更有力的幫助。