林萬云 杜民
阿爾茨海默病(Alzheimer disease, AD)是一種退行性神經(jīng)系統(tǒng)疾病。該病是一種最常見的癡呆疾病,占所有癡呆疾病的60%~70%[1]。患有該病的患者往往會經(jīng)歷漸進(jìn)的認(rèn)知衰退、語言障礙和定向障礙。到2015年,全世界已有約300萬人患有老年癡呆癥,預(yù)計(jì)這一數(shù)字在未來40年將增加3倍[2]。目前還沒有發(fā)現(xiàn)有效的藥物或方法來治療該疾病或阻止其發(fā)展,如果患者被診斷為老年癡呆癥,大多數(shù)治療方法都將無效。該病的進(jìn)展是一個(gè)持續(xù)的過程,其發(fā)病過程大致可分為正常人(normal control,NC) 、輕度認(rèn)知障礙(mild cognitive impairment,MCI) 以及AD。對早期AD的診斷并提前采取措施進(jìn)行干預(yù)能夠減緩病情,降低發(fā)病概率或推遲發(fā)病,因此對于MCI階段的研究更加重要。當(dāng)前,中國人口老齡化問題日益突出,因此AD的早期診斷和治療至關(guān)重要,不僅可以減輕個(gè)人家庭負(fù)擔(dān),而且可以減少社會資源的消耗。
研究表明,早期MCI患者的大腦內(nèi)側(cè)顳葉開始萎縮,其中海馬萎縮最為嚴(yán)重[3-4]。早期AD的發(fā)現(xiàn)和治療,可以有效地減少患者大腦功能的惡化。已經(jīng)有許多相關(guān)研究將傳統(tǒng)機(jī)器學(xué)習(xí)方法應(yīng)用于磁共振圖像(magnetic resonance image,MRI)中并取得不錯(cuò)結(jié)果。例如,利用MRI解剖學(xué)特征的變化,提出一種使用極限學(xué)習(xí)機(jī)來診斷AD以及MCI的方法[5],以及基于MRI提取腦部海馬區(qū)域紋理特征參數(shù)建立AD早期分類預(yù)測的模型[6]。還有一些研究使用基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的端到端的深度學(xué)習(xí)方法。例如,采用2D CNN模型和2D MRI切片數(shù)據(jù)來進(jìn)行AD診斷[7],以及從3D 圖像中提取2.5D的數(shù)據(jù)[8-9]來進(jìn)行AD的診斷。然而,腦萎縮的發(fā)生是一個(gè)漸進(jìn)的過程,早期難以察覺,再考慮到正常衰老導(dǎo)致腦部正常萎縮的情況,該病早期引起的腦部萎縮很難被發(fā)現(xiàn)。MRI是結(jié)構(gòu)像,雖然圖像質(zhì)量高,可以清楚看到腦部結(jié)構(gòu)但無法反映組織內(nèi)部情況。正電子發(fā)射型計(jì)算機(jī)斷層顯像(positron emission computed tomography,PET)是功能像,能夠反映人體內(nèi)部代謝情況,是核醫(yī)學(xué)領(lǐng)域比較先進(jìn)的臨床檢查影像技術(shù)。在AD的早期階段海馬體等區(qū)域萎縮并不明顯,但是內(nèi)部的代謝情況已經(jīng)有較大改變,因此從PET圖像中可以更好地獲取相關(guān)的疾病信息。此外,由于所研究醫(yī)學(xué)圖像都是3D的,大腦的不同區(qū)域之間存在一定的聯(lián)系,如果直接從3D圖像上取2D或2.5D切片數(shù)據(jù)勢必會丟失這一部分的信息,這會導(dǎo)致三維圖像中空間位置信息無法得到充分利用。
相比于MRI,使用PET圖像可以更容易獲取早期AD大腦的變化。相比于傳統(tǒng)機(jī)器學(xué)習(xí)方法,CNN方法可以實(shí)現(xiàn)端到端的預(yù)測。相比于2D或2.5D CNN,3D CNN可以充分利用MRI、PET影像的三維空間位置信息。MRI、PET等圖像是含有大量體素的三維圖像,其中大部分區(qū)域與AD關(guān)系不大[10-11],直接使用全圖的話,不僅造成計(jì)算資源的浪費(fèi),可能冗余數(shù)據(jù)還會對最終結(jié)果產(chǎn)生影響。因此,本文擬采用基于PET模態(tài)數(shù)據(jù)的3D CNN模型,通過充分利用MRI、PET影像的三維空間位置信息,并且選取海馬體附近區(qū)域作為感興趣區(qū)域(region of interst,ROI)加快疾病識別效率,實(shí)現(xiàn)了AD的智能早期輔助診斷(即3年發(fā)病的預(yù)測)??傮w算法流程如圖1所示。
圖1 算法流程圖Figure 1 Algorithm flowchart
本文使用的數(shù)據(jù)來自阿爾茨海默病神經(jīng)影像學(xué)倡議(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)庫。ADNI是一項(xiàng)正在進(jìn)行的縱向研究,為了測試MRI、PET、其他生物標(biāo)志物以及臨床和神經(jīng)心理學(xué)評估是否可以結(jié)合起來,用以早期檢測和跟蹤AD,并衡量MCI的進(jìn)展。在本研究中,使用來自該數(shù)據(jù)集的T1-MRI和氟代脫氧葡萄糖(fludeoxyglucose,F(xiàn)DG)PET。該數(shù)據(jù)庫中病例標(biāo)簽有AD、MCI和NC,本文主要研究MCI階段。MCI受試者根據(jù)精神疾病診斷與統(tǒng)計(jì)手冊(The Diagnostic and Statistical Manual of Mental Disorders,DSM)第5版標(biāo)準(zhǔn)分為進(jìn)展型輕度認(rèn)知障礙(progressive mild cognitive impairment,pMCI)和穩(wěn)定型輕度認(rèn)知障礙(stable mild cognitive impairment,sMCI),即MCI如果在3年內(nèi)發(fā)展為AD,應(yīng)定義為pMCI,如果沒有發(fā)展為AD,則定義為sMCI,隨訪數(shù)據(jù)不超過3年的受試者被忽略。AD與NC是較容易區(qū)分的,在大量已發(fā)表的研究中使用深度學(xué)習(xí)方法可達(dá)90%以上[12]。而sMCI和pMCI較難區(qū)分,準(zhǔn)確率一般為60%~70%[13]。本研究數(shù)據(jù)使用的詳細(xì)情況如表1所示。注意,同一位患者如果在不同時(shí)間進(jìn)行檢測會有多張圖片,即一位患者可以有幾張不同的圖像。
表1 實(shí)驗(yàn)中數(shù)據(jù)使用情況Table 1 Data usage in the experiment
使用zxhtools[14]的zxhreg和zxhtransform,將MR圖像重新采樣到221×257×221的分辨率和1 mm的間距,即每個(gè)像素值表示實(shí)際的1 mm距離。每個(gè)PET圖像配準(zhǔn)到各自的MR圖像上,獲得配對的圖像。由于海馬體在AD診斷中具有重要意義,所以選擇海馬體中心大小為96×96×48的區(qū)域進(jìn)行裁剪獲取所需的ROI數(shù)據(jù)塊。數(shù)據(jù)可視化展示見圖2。
CNN是一種多層神經(jīng)網(wǎng)絡(luò),擅長處理圖像特別是大圖像的相關(guān)機(jī)器學(xué)習(xí)問題。CNN通過卷積層與池化層配合,組成多個(gè)卷積組,逐層提取特征,可以將數(shù)據(jù)量龐大的圖像識別問題不斷降維,最終使其能夠被訓(xùn)練。總之,CNN通過卷積來提取特征,并且通過卷積的權(quán)值共享及池化層來降低網(wǎng)絡(luò)參數(shù)的數(shù)量級,最后通過傳統(tǒng)神經(jīng)網(wǎng)絡(luò)全連接FC(fully connected,FC)層完成分類等任務(wù),后續(xù)又發(fā)展出了許多先進(jìn)的網(wǎng)絡(luò)如AlexNet[15]、VGG[16]、ResNet[17]等。
3D CNN是在2D CNN的基礎(chǔ)上改變而來,在2D CNN中,卷積核沿2個(gè)方向移動,2D CNN的輸入和輸出數(shù)據(jù)是3維的。而在3D CNN中,卷積核沿3個(gè)方向移動,3D CNN的輸入和輸出數(shù)據(jù)是4維的,主要用于3D圖像數(shù)據(jù)。多出的一個(gè)維度是除了圖片本身的維度外再加上一個(gè)通道數(shù)。
本文根據(jù)數(shù)據(jù)集大小及實(shí)際情況,構(gòu)建了一個(gè)3D CNN,其網(wǎng)絡(luò)結(jié)構(gòu)如表2所示。該模型由4層卷積層和2層FC層組成。每層卷積層后都接有一個(gè)最大池化層來減少參數(shù)量。第一層FC層有512個(gè)結(jié)點(diǎn),第二層FC層有2個(gè)節(jié)點(diǎn),最后通過一個(gè)softmax層,模型輸出疾病預(yù)測的標(biāo)簽。
表2 3D CNN的結(jié)構(gòu)Table 2 3D CNN structure
圖2 數(shù)據(jù)可視化展示Figure 2 Data visualization display
評估模型性能,目前常常采用的評價(jià)指標(biāo)有準(zhǔn)確率(accuracy),特異度(specificity)、靈敏度(sensitivity)等。
式中:TP(true positive)、TN(true negative)、FP(false positive)和FN(false negative)分別代表真陽性率、真陰性率、假陽性率和假陰性率。還有一些其他常見的評價(jià)指標(biāo)如受試者工作特性曲線(receiver operating characteristic curve,ROC曲線)、曲線下面積(area under curve,AUC)等。ROC曲線是以真陽性率(靈敏度)為縱坐標(biāo),假陽性率為橫坐標(biāo)繪制的曲線。ROC曲線越靠近左上角,AUC值越大,表明性能越好。
本文所有網(wǎng)絡(luò)模型都是基于PyTorch編程,所有實(shí)驗(yàn)都在一塊Nvidia GTX1080 GPU上進(jìn)行。為了加速訓(xùn)練過程并避免局部最小值,使用ADAM優(yōu)化器作為優(yōu)化[18],初始學(xué)習(xí)率設(shè)置為0.000 1。歸一化方式選擇批量歸一化(batch normalization,BN),批量訓(xùn)練大小設(shè)置為16, Relu作為激活函數(shù)。交叉熵?fù)p失(cross-entropy loss)作為損失函數(shù)。使用PyTorch中的nn.Linear實(shí)現(xiàn)兩層FC層。epoch數(shù)設(shè)置為60。在訓(xùn)練過程中,模型的參數(shù)每5個(gè)epoch保存一次。
此外,為了避免數(shù)據(jù)泄露問題[19-20],研究組將數(shù)據(jù)集根據(jù)患者編號隨機(jī)拆分以保證同一患者的所有影像數(shù)據(jù)只出現(xiàn)在訓(xùn)練集、驗(yàn)證集、測試集的某一個(gè)集合里。由于數(shù)據(jù)樣本數(shù)量不大,為了保證原始數(shù)據(jù)集的每個(gè)樣本都有機(jī)會出現(xiàn)在訓(xùn)練集和測試集中,采用10折交叉驗(yàn)證方法。最后,在訓(xùn)練集上進(jìn)行訓(xùn)練,在驗(yàn)證集上選擇最佳模型,在測試集上做最后的測試,訓(xùn)練集、驗(yàn)證集、測試集數(shù)據(jù)的比例是7∶2∶1。
為評估設(shè)計(jì)的模型是否合理,必須選用其他模型使用相同的數(shù)據(jù)進(jìn)行對比實(shí)驗(yàn)分析。本實(shí)驗(yàn)選擇VGG和ResNet作為對比模型,因?yàn)檫@兩個(gè)模型不但是計(jì)算機(jī)視覺中兩個(gè)經(jīng)典的模型,而且在許多分類和分割等比賽中都有較好表現(xiàn),是公認(rèn)的在實(shí)際中效果比較穩(wěn)定比較好的模型并且實(shí)現(xiàn)起來也比較容易。此外,已發(fā)表論文中也有許多是用VGG和ResNet系列的模型做對比實(shí)驗(yàn),因此本實(shí)驗(yàn)采用3D VGG11和3D ResNet18作為對比模型。為保證實(shí)驗(yàn)準(zhǔn)確性,對這3種模型使用相同的參數(shù)設(shè)置。基于MRI數(shù)據(jù)sMCI、pMCI分類實(shí)驗(yàn)結(jié)果如表3所示?;赑ET數(shù)據(jù)sMCI、pMCI分類實(shí)驗(yàn)結(jié)果如表4所示。ROC曲線如圖3所示。
圖3 sMCI與pMCI的受試者工作特征曲線Figure 3 Receiver operating characteristic curves for sMCI and pMCI
從表3可以看到3D CNN模型準(zhǔn)確率、敏感度分別達(dá)到65.37%、69.44%,ROC曲線下面積如圖3(a)最大,為65.23%,優(yōu)于作為對比模型的VGG和ResNet。VGG也取得了不錯(cuò)的效果,特異度達(dá)到61.66%,比本文模型略高一些。從表4可以看到和表3中類似的結(jié)果,準(zhǔn)確率、敏感度分別達(dá)到71.19%、79.29%,ROC曲線下面積如圖3(b)最大,為71.09%,也優(yōu)于作為對比模型的VGG和ResNet。結(jié)果表明,設(shè)計(jì)的3D CNN模型對于本研究涉及的分類任務(wù)是合理的,與另外兩個(gè)模型相比,在多個(gè)評價(jià)指標(biāo)上都取得了不錯(cuò)的結(jié)果。
表3 各模型在MRI數(shù)據(jù)上的表現(xiàn)(單位:%)Table 3 The performance of each model on MRI data (unit:%)
通過對比表3和表4,以及圖3的結(jié)果發(fā)現(xiàn),如果采用相同的模型但使用不同的數(shù)據(jù),則模型在PET圖像上的效果要比在MR 圖像上的結(jié)果要好。實(shí)驗(yàn)結(jié)果表明,在AD的早期診斷中,PET數(shù)據(jù)比MRI更有優(yōu)勢。
表4 各模型在PET數(shù)據(jù)上的表現(xiàn)(單位:%)Table 4 The performance of each model on PET data(unit:%)
本研究通過設(shè)計(jì)一個(gè)3D CNN模型,分別采用MRI、PET圖像進(jìn)行AD的早期診斷實(shí)驗(yàn)。根據(jù)表3、表4實(shí)驗(yàn)結(jié)果可以看到各模型使用PET數(shù)據(jù)時(shí),準(zhǔn)確率、敏感度、特異度等指標(biāo)均高于使用MRI數(shù)據(jù)時(shí)的結(jié)果,這符合本文引言中所說的,在AD早期階段腦萎縮還不明顯的時(shí)候,腦部相關(guān)區(qū)域代謝已經(jīng)有較明顯變化,PET是功能像正好能比較敏感地反映出這些區(qū)域的代謝變化,而MRI是結(jié)構(gòu)像無法做到這一點(diǎn),因此PET圖像在AD早期診斷中可以獲得比MRI更好的效果。Coimbra等[21]使用FDG進(jìn)行PET成像檢測局部腦代謝的變化,再結(jié)合傳統(tǒng)醫(yī)學(xué)評估,可以對AD進(jìn)行更靈敏、準(zhǔn)確的早期診斷。Lin[22]由MRI圖像合成相對應(yīng)的PET圖像,進(jìn)一步提高診斷準(zhǔn)確率。Marcus等[23]等通過分析腦部PET圖像中葡萄糖代謝的模式特征可以將AD與其他癡呆病因區(qū)分開,這樣的結(jié)果對于本實(shí)驗(yàn)有一定的啟發(fā)性,同時(shí)表明PET成像在評估AD病程中具有重要價(jià)值。
本模型與對比模型相比有較好的結(jié)果。因?yàn)?,與大多數(shù)圖像分類模型的結(jié)構(gòu)相比,本研究組在第一層卷積層中使用較小尺寸的卷積核來防止過早的下采樣,而ResNet在第一層使用較大尺寸的卷積核并且使用較大的步長來迅速減小輸入圖像的尺寸,雖然這樣做可以減少參數(shù)加快計(jì)算速度,但是由于CNN在前面層主要提取一些淺層的特征,到后面層的CNN才會提取到高級的語義特征,所以在第1層使用大步長和大尺寸卷積核會導(dǎo)致在前面層就丟失大量信息,這可能對結(jié)果產(chǎn)生不利影響。本模型在越前面的層使用越小尺寸的卷積核和越小的步長,充分保留相關(guān)的特征信息。等到后面層已經(jīng)提取到有效的語義層次的信息,這時(shí)就采用較大尺寸的卷積核和步長,不僅可以減少參數(shù)量,加快運(yùn)算速度,還能去除大量冗余信息,避免冗余信息對結(jié)果產(chǎn)生不利影響。此外,在實(shí)驗(yàn)中使用的是ROI數(shù)據(jù)塊,輸入尺寸僅為96×96×48, 因此,模型在前面層使用大步長和大尺寸卷積核使輸入尺寸迅速減小過多會導(dǎo)致嚴(yán)重的性能下降。還有一個(gè)可能的原因是本研究的病例樣本數(shù)量只有幾百個(gè),不宜采用太深的模型,否則容易出現(xiàn)過擬合等問題。先前介紹中已有大量研究使用端到端CNN方法來進(jìn)行疾病的診斷,并取得非常不錯(cuò)的結(jié)果,這表明采用CNN進(jìn)行疾病的診斷具有巨大潛能。本研究所提出的方法也展示了良好的結(jié)果,對于AD的早期診斷具有一定的輔助作用,具備進(jìn)一步研究的意義。本實(shí)驗(yàn)的不足之處在于對AD早期診斷的準(zhǔn)確率仍有很大的提升空間,如果需要進(jìn)一步提高預(yù)測結(jié)果,則需要進(jìn)一步結(jié)合臨床實(shí)際探索更加合理有效并且更具有可解釋性的方法[例如,收集不同模態(tài)數(shù)據(jù)的信息如MRI、PET、腦脊液(cerebro-spinal fluid,CSF)、基因等信息并設(shè)計(jì)有效的融合方法融合這些信息],因此,更為具體的實(shí)驗(yàn)方案有待建立和實(shí)施。
本研究從ADNI數(shù)據(jù)庫獲得數(shù)據(jù)后對原始數(shù)據(jù)進(jìn)行相關(guān)的預(yù)處理,同時(shí)設(shè)計(jì)了一種3D CNN模型用于快速準(zhǔn)確地對AD進(jìn)行早期診斷。還對比了MRI和PET圖像對于AD診斷的結(jié)果,實(shí)驗(yàn)結(jié)果表明腦部PET圖像在AD早期診斷中具有非常好的效果,對于疾病的相關(guān)研究以及早期診斷具有重大意義。本研究樣本有限,對于所設(shè)計(jì)模型的更多測試還需要進(jìn)一步跟蹤ADNI數(shù)據(jù)庫以及對比其他深度學(xué)習(xí)方法,進(jìn)一步優(yōu)化實(shí)驗(yàn)方法。