王笑男,李春媚,陳敏*
1.北京醫(yī)院放射科 國家老年醫(yī)學(xué)中心 中國醫(yī)學(xué)科學(xué)院老年醫(yī)學(xué)研究院,北京 100730;2.中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院研究生院,北京 100730;*通信作者 陳敏 cjr.chenmin@vip.163.com
阿爾茨海默?。ˋlzheimer's disease,AD)是老年人最常見的癡呆類型,通常起病隱匿,進(jìn)行性發(fā)展,伴有記憶力減退、認(rèn)知功能障礙及性格行為異常等多種臨床癥狀[1],早期難以準(zhǔn)確診斷及鑒別診斷,容易延誤治療。AD的主要病理學(xué)特征為腦內(nèi)β-淀粉樣肽聚集形成神經(jīng)斑,神經(jīng)纖維纏結(jié)及神經(jīng)元變性或缺失[2],目前尚無有效治療措施可以停止或逆轉(zhuǎn)AD的進(jìn)展,因此尋找一種可以早期診斷AD的影像學(xué)方法,對疾病的準(zhǔn)確診斷、早期干預(yù)及預(yù)后預(yù)測尤為重要。影像組學(xué)通過高通量提取醫(yī)學(xué)影像圖像的灰度、形狀、紋理及濾波等特征,利用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的方法,為臨床疾病的準(zhǔn)確診斷和早期治療提供依據(jù)[3]。近年來,影像組學(xué)在神經(jīng)退行性疾病,尤其是在AD的研究中迅速發(fā)展,本文對其基本原理、臨床應(yīng)用及前景進(jìn)行綜述。
影像組學(xué)是從醫(yī)學(xué)圖像中提取大量特征,進(jìn)而進(jìn)行定量描述及定量分析的研究方法,其基本工作流程包括圖像采集、圖像分割、特征提取、特征選擇、模型建立5個(gè)步驟[4]。
1.1 圖像采集與圖像分割 圖像采集是影像組學(xué)的基礎(chǔ),用于AD的圖像可以來自地方醫(yī)療機(jī)構(gòu)[5]和(或)公開數(shù)據(jù)庫[6-9]。目前最常用的序列是高分辨率T1WI圖像。為了消除不同采集機(jī)型及不同掃描參數(shù)對圖像的影響,可對MR影像進(jìn)行預(yù)處理,包括圖像配準(zhǔn)、直方圖均衡化、三線差值重采樣等方法[10],目前,這些預(yù)處理方法的選擇標(biāo)準(zhǔn)及適用條件尚無統(tǒng)一定論。
圖像分割是將圖像分割成特定腦區(qū)或提取感興趣區(qū)(ROI)的過程,可采用手動(dòng)分割、半自動(dòng)分割和自動(dòng)分割的方式[11-13]。手動(dòng)分割準(zhǔn)確性高,且對不規(guī)則ROI勾畫精細(xì),是目前最常用的“金標(biāo)準(zhǔn)”分割方法,但是受觀察者經(jīng)驗(yàn)及主觀因素影響,可重復(fù)性差、耗時(shí)長、效率較低。半自動(dòng)分割可替代部分人力工作,但需人工校正。自動(dòng)分割排除人為因素,效率及可重復(fù)性大幅提高,但受技術(shù)限制,尚無統(tǒng)一的方案和標(biāo)準(zhǔn)。
1.2 特征提取與特征選擇 特征提取是影像組學(xué)的關(guān)鍵步驟,目前常用的軟件包括MaZda[14]、Matlab[15]、FSL[16]、A.K[5]。影像組學(xué)特征包括灰度、形狀、紋理等。灰度特征又稱一階特征,從灰度直方圖中提取,可以獲得最大(?。┲怠⒎秶?、均值、四分位間距、能量、熵、一致性等統(tǒng)計(jì)量。形狀特征可以定量描述圖像中目標(biāo)的幾何屬性(長短、直徑、表面積、體積、球形度等)、統(tǒng)計(jì)屬性(不變距等)及拓?fù)鋵傩裕?、連通等)。紋理特征[17]包括灰度共生矩陣、灰度相關(guān)矩陣、灰度游程矩陣、灰度區(qū)域大小矩陣、局部灰度差分矩陣等。
特征選擇又稱特征降維,是影像組學(xué)模型泛化性的決定因素。特征選擇方法包括過濾法、封裝法、嵌入法。過濾法不依賴機(jī)器學(xué)習(xí),不考慮特征的相關(guān)性,計(jì)算方法簡單、速度快,適合高維數(shù)據(jù),包括卡方檢驗(yàn)、相關(guān)系數(shù)、最小冗余最大相關(guān)等。封裝法根據(jù)目標(biāo)函數(shù),選擇或排除特征,計(jì)算量較大,實(shí)際應(yīng)用較少。嵌入法是實(shí)際應(yīng)用中最常見的方法,可以在計(jì)算過程中搜索最佳特征子集,包括決策樹、隨機(jī)森林、最小絕對收斂和選擇算法等。
1.3 模型建立與分析 模型建立是影像組學(xué)的最終目標(biāo)。建模方法有Logistic回歸模型、支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)等。
1.3.1 Logistic回歸模型 Logistic回歸模型是最有用的監(jiān)督分類模型,因其分類方法簡單,分類結(jié)果合理,在臨床應(yīng)用中很受歡迎。
1.3.2 SVM SVM是一種二分類模型,目的是尋找一個(gè)超平面將數(shù)據(jù)分為兩類(有應(yīng)答及無應(yīng)答),既可以用于線性可分樣本,又可以通過核技巧轉(zhuǎn)化用于非線性可分樣本,適用范圍較廣,在影像組學(xué)研究中應(yīng)用廣泛[18]。
1.3.3 RF RF是一個(gè)分類決策樹概念,由根節(jié)點(diǎn)、中間節(jié)點(diǎn)和葉節(jié)點(diǎn)組成,可以模擬人類的推理過程,其優(yōu)點(diǎn)是計(jì)算復(fù)雜程度不高,對中間值缺失不敏感;缺點(diǎn)是容易造成過度擬合。
1.3.4 CNN CNN是一種前饋神經(jīng)網(wǎng)絡(luò),可以不進(jìn)行圖像預(yù)處理及特征提取,直接學(xué)習(xí)對原始圖像進(jìn)行操作,是經(jīng)典的機(jī)器學(xué)習(xí)方法之一。
AD進(jìn)展是一個(gè)連續(xù)的過程,從臨床前階段到輕度認(rèn)知障礙(mild cognitive impairment,MCI),進(jìn)而發(fā)展為AD,會(huì)持續(xù)數(shù)年,尤其MCI階段,尚不滿足癡呆診斷標(biāo)準(zhǔn)但已經(jīng)出現(xiàn)一定程度的認(rèn)知損害,而大腦萎縮不明顯,確診需要依靠腦組織活檢[2],很難在臨床上開展。因此,尋找正常衰老的健康人、MCI及AD患者的影像學(xué)差異,尤其確立MCI階段的影像診斷標(biāo)志物,建立病程轉(zhuǎn)歸的預(yù)測模型,并與患者認(rèn)知障礙程度建立聯(lián)系尤為重要。
2.1 診斷 海馬區(qū)是AD進(jìn)展過程中較早累及的區(qū)域之一[19-20]。S?rensen等[21]基于T1WI圖像提取海馬區(qū)紋理,通過SVM法區(qū)分正常衰老的健康對照者、MCI和AD患者,結(jié)果顯示健康對照者/MCI、健康對照者/AD的ROC曲線下面積(AUC)分別為0.724、0.912,證實(shí)影像組學(xué)具有區(qū)分正常衰老的健康對照者與MCI及區(qū)分正常衰老的健康對照者與AD的能力。Feng等[22]利用ANOVA軟件進(jìn)一步提取海馬頭和海馬尾的111個(gè)有意義的影像特征,將區(qū)分AD和健康對照組的AUC提高到0.93,敏感度為84.21%,特異度為88.89%。多項(xiàng)研究證實(shí)AD患者認(rèn)知水平下降與胼胝體萎縮有關(guān)[23-24],范炤等[25]分析78例AD患者及44名健康對照者的三維T1WI圖像,手動(dòng)分割胼胝體并提取385個(gè)影像特征,結(jié)果證實(shí)胼胝體的MR影像紋理特征可以區(qū)分AD與健康對照者,AUC為0.720,敏感度為0.792,特異度為0.500。與健康對照者相比,AD及MCI患者組學(xué)特征不僅在海馬、胼胝體這些已證實(shí)與認(rèn)知密切相關(guān)的區(qū)域存在差異,多項(xiàng)擴(kuò)展到全腦不同結(jié)構(gòu)的研究也提示組學(xué)特征具有鑒別意義,如基于自動(dòng)分割的不同腦區(qū)[25-26]、腦葉[27-28]及灰質(zhì)[29],而不同腦結(jié)構(gòu)可靠的組學(xué)特征仍需要大量樣本的驗(yàn)證。影像組學(xué)能夠反映組織內(nèi)部的異構(gòu)性,彌補(bǔ)單純基于肉眼所見的體積、形狀、信號變化的不足,提高了AD的診斷準(zhǔn)確性,具有良好的臨床應(yīng)用前景。
2.2 預(yù)測 由MCI到確診AD一般耗時(shí)3~6年,預(yù)測MCI何時(shí)會(huì)轉(zhuǎn)化為AD對指導(dǎo)臨床早期干預(yù)具有重要意義。Shu等[7]分析203例穩(wěn)定MCI及154例進(jìn)展為AD患者的組學(xué)特征,用邏輯回歸方法建立模型,預(yù)測MCI在48個(gè)月內(nèi)進(jìn)展為AD的準(zhǔn)確度在訓(xùn)練集及測試集中分別為0.814和0.807,敏感度分別為0.822和0.745,特異度分別為0.671和0.738;研究者利用該模型預(yù)測12個(gè)月內(nèi)MCI進(jìn)展為AD的AUC為0.814,敏感度為0.726,特異度為0.798,表明影像組學(xué)模型可以預(yù)測由MCI進(jìn)展為AD的高危人群。Spasov等[30]基于影像組學(xué)、人口學(xué)特征、載脂蛋白E基因等建立多參數(shù)深度學(xué)習(xí)模型,區(qū)分3年內(nèi)穩(wěn)定MCI及發(fā)展為AD的MCI,準(zhǔn)確度為86%,為預(yù)測MCI進(jìn)展為AD提供了一種計(jì)算機(jī)輔助方法。Tang等[6]納入來自阿爾茨海默病神經(jīng)影像學(xué)倡議數(shù)據(jù)庫(Alzheimer's disease neuroimaging initiative,ADNI)的162例MCI(包括5年內(nèi)轉(zhuǎn)化為AD 68例,穩(wěn)定MCI 94例),結(jié)果發(fā)現(xiàn)基于影像組學(xué)-臨床-實(shí)驗(yàn)室預(yù)測模型較單純臨床-實(shí)驗(yàn)室預(yù)測模型的訓(xùn)練組診斷效能增長約5%,表明影像組學(xué)在預(yù)測MCI轉(zhuǎn)換為AD方面存在潛在的應(yīng)用價(jià)值。
2.3 基于MRI的影像組學(xué)與認(rèn)知障礙的關(guān)系 簡易智力狀況評分(mini-mental status examination score,MMSE)是國內(nèi)外廣泛應(yīng)用的首選的AD篩查量表,能全面、準(zhǔn)確、迅速地反映受試者的智力狀態(tài),是AD患者認(rèn)知功能缺損程度分級的標(biāo)準(zhǔn)之一。Feng等[22]分析116例單中心數(shù)據(jù),從雙側(cè)海馬區(qū)共提取111個(gè)有意義的組學(xué)特征,其中98個(gè)與MMSE評分相關(guān)。此外,影像組學(xué)特征還與多種智力損傷評分相關(guān),如海馬紋理特征與基于Addenbrooke改良認(rèn)知評估量表的認(rèn)知功能評分呈負(fù)相關(guān)(r=-0.25,P<0.001)[21],結(jié)合快速問答評分較單純灰度直方圖將區(qū)分AD與健康對照者的準(zhǔn)確率由84.07%提高到97.01%[29]。由此可見,影像組學(xué)可以作為臨床認(rèn)知障礙損傷程度的評價(jià)指標(biāo)。
基于MRI的影像組學(xué)在AD中的研究多為回顧性分析,不同的掃描設(shè)備、不同MR參數(shù)及不同醫(yī)學(xué)中心掃描方式會(huì)有所差異,如何獲取標(biāo)準(zhǔn)醫(yī)學(xué)影像數(shù)據(jù)是目前研究中亟待解決的問題[31]。影像組學(xué)模型建立方法多種多樣,圖像預(yù)處理方法選擇和執(zhí)行順序尚無統(tǒng)一的標(biāo)準(zhǔn),是影響影像組學(xué)模型泛化性的原因之一。手工提取感興趣區(qū)的可靠性及可重復(fù)性不能保證,也限制了影像組學(xué)在臨床上的推廣。因此,更規(guī)范、更科學(xué)、更穩(wěn)定的影像組學(xué)方法,是未來需要突破的方向。
影像組學(xué)可以對MR圖像信息進(jìn)行深度挖掘,將影像診斷方法從傳統(tǒng)肉眼的定性診斷向定量診斷轉(zhuǎn)變,并與疾病診斷、轉(zhuǎn)歸預(yù)測及臨床嚴(yán)重程度相關(guān)聯(lián),在影像數(shù)據(jù)高通量提取與疾病診療中顯示出巨大的潛力。影像組學(xué)在AD中的應(yīng)用處于探索階段,基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的影像組學(xué)是未來發(fā)展的方向,可能成為臨床AD診療的可靠方法,為臨床診治提供更精確的指導(dǎo)。隨著醫(yī)療大數(shù)據(jù)時(shí)代的到來及人工智能的發(fā)展,影像組學(xué)的應(yīng)用具有更廣闊的前景,期待在不久的將來,基于大樣本的影像組學(xué)成為AD的可靠診斷工具。