張柏雯,林 嵐,孫 珅,吳水才
(北京工業(yè)大學(xué)生命科學(xué)與生物工程學(xué)院,北京 100124)
阿爾茨海默?。ˋlzheimer'sdisease,AD)是一種發(fā)病隱匿的神經(jīng)退行性疾病[1-2],主要表現(xiàn)為神經(jīng)功能失調(diào)和記憶減退。由于AD一經(jīng)發(fā)現(xiàn)難以控制或逆轉(zhuǎn),目前已成為最常見的癡呆病癥。預(yù)計到2050年,全球AD患者將達到1.07億[3]。結(jié)構(gòu)磁共振成像(structuralMRI,sMRI)因其無創(chuàng)性具有較高的普及率,被廣泛用于AD診斷。AD常發(fā)病于海馬、顳葉等部位,會引起全腦體積的縮小及腦灰質(zhì)、白質(zhì)、腦脊液的減少[4-5]。但AD初期沒有明顯的癥狀,發(fā)病機制尚不明確,約有一半的患者被誤認為是正常老化(normal control,NC)[6],因此借助計算機輔助診斷成為早期AD與NC分類的趨勢。
機器學(xué)習(xí)的方法能從已知數(shù)據(jù)中學(xué)習(xí)到復(fù)雜的結(jié)構(gòu)特征,近年來已被廣泛運用至神經(jīng)影像學(xué)疾病的診斷中[7],針對大腦結(jié)構(gòu)的體素特征構(gòu)建分類模型是機器學(xué)習(xí)在AD分類與預(yù)測中常見的應(yīng)用。Adaszewski等[8]將全腦灰質(zhì)密度作為特征,運用支持向量機[9](support vector machines,SVM)的方法構(gòu)建早期AD的診斷模型。同時,基于感興趣區(qū)特征提取也是一種常用的分類方法。Huang等[10]從sMRI獲取大腦皮層厚度、海馬區(qū)域等特征,結(jié)合鄰近元素分析和隨機森林等方法構(gòu)建了AD各病程的分類模型。但是這些方法都以手工提取特征為前提,存在主觀性較大的問題。深度學(xué)習(xí)起源于人工神經(jīng)網(wǎng)絡(luò),是機器學(xué)習(xí)的一種,因其能從原始數(shù)據(jù)中自動提取特征,通過非線性模型將原始特征轉(zhuǎn)變?yōu)榈蛯犹卣鳎牡偷礁咧饘映橄鬄榫哂蟹诸惔硇缘母邔犹卣鱗11-12],從而建立更加復(fù)雜、分類特性更高的模型,為早期AD與NC的分類提供了新的方法。深度學(xué)習(xí)可以分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。被用于AD與NC分類的常見無監(jiān)督學(xué)習(xí)主要有堆棧自動編碼器[13-14](stacked auto encoder,SAE)、深度玻爾茲曼機[15](deep Boltzmann machines,DBM)等。Liu等[14]提出多階段特征表示法,將從MRI與PET的原始圖像中提取的生物標記物作為低特征輸入SAE網(wǎng)絡(luò),在多層次的SAE網(wǎng)絡(luò)中進行逐層特征抽象得到高維特征,從而實現(xiàn)對AD與NC的分類,其分類精度為89.6%。無監(jiān)督的深度學(xué)習(xí)方法雖然分類結(jié)果較為理想,但是使用的圖像均為高維特征,而無監(jiān)督神經(jīng)網(wǎng)絡(luò)節(jié)點均為全連接,更適用于低維數(shù)據(jù),因此會帶來特征損失和分類模型效率過低等問題[16]。
深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是一種起源于動物大腦視覺皮層的前饋神經(jīng)網(wǎng)絡(luò),除了輸入層、輸出層外,一般被分為卷積層、池化層和全連接層,是近年來被廣泛應(yīng)用于圖像識別的、有監(jiān)督的深度學(xué)習(xí)算法[17]。由于CNN在圖像識別上的優(yōu)異表現(xiàn),被用于基于MRI的AD分類研究中[18],如Hosseini-Asl等[19]運用3DCNN在受試者的MRI中提取皮層厚度、大腦尺寸、海馬等信息輸入網(wǎng)絡(luò)模型中訓(xùn)練,以實現(xiàn)AD與NC的分類,且分類準確率達97.6%。
本研究中,選用特征遷移學(xué)習(xí)的方法,用已經(jīng)在自然圖像上訓(xùn)練的經(jīng)典網(wǎng)絡(luò)AlexNet[17]作為基礎(chǔ)模型,逐層進行特征提取后,再將提取特征進行三維重組,并用主成分分析法(principal component analysis,PCA)[20]及序列前向搜索(sequential forward search,SFS)[21]的方法將特征降維與選擇,最后運用SVM將特征進行分類。對上述流程構(gòu)建的分類模型所得到AD與NC的分類結(jié)果進行分析,并對不同卷積層和不同預(yù)處理參數(shù)引起的結(jié)果差異進行討論。
本研究中共收集了299例患者sMRI的T1WI數(shù)據(jù),年齡55~90歲,其中105例為早期AD患者,194例為NC患者,數(shù)據(jù)均來自阿爾茨海默病神經(jīng)影像學(xué)組織(Alzheimer Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)庫。所有受試者均無精神異常疾病,并根據(jù)ADNI要求接受定期跟蹤隨訪[22]。數(shù)據(jù)采集設(shè)備為Philips 3.0T磁共振掃描系統(tǒng),采用三維磁化快速梯度回波成像(magnetization prepared rapid gradient echo,MPRAGE)。掃描參數(shù):重復(fù)時間(repetition time,TR)6.8 ms,回波時間(echo time,TE)3.1 ms;視野(field of view,F(xiàn)OV)RL(左右)方向為 204 mm,AP(前后)方向為240 mm;體素大小1 mm×1 mm×1.2 mm;掃描層數(shù)170層,層厚1.2 mm。
研究中各組受試者分組標準如下:(1)早期AD:簡易精神狀態(tài)檢查表(mini-mental state examination,MMSE)評分20~26分,臨床癡呆評測表(clinical dementia rating,CDR)評測1.0分,測試指標均滿足美國國立神經(jīng)病學(xué)與語言障礙協(xié)會及腦卒中研究所對AD的診斷標準。(2)NC:MMSE評分24~30分,CDR評測0分,沒有記憶衰退、生活障礙等現(xiàn)象。實驗對象相關(guān)信息詳見表1。
表1 實驗對象相關(guān)信息
全腦的灰質(zhì)密度圖是在MATLAB 2015b中運行通用工具包SPM-12[23]完成的。圖像預(yù)處理內(nèi)容包括:非腦組織(如脖頸、顱骨等部分)的去除,白質(zhì)、灰質(zhì)、腦脊液的分割,受試者灰質(zhì)密度圖像的標準化等,具體處理流程如圖1所示。在生成灰質(zhì)密度圖的過程中,本研究將高斯平滑核半高寬(full width at half maximum,F(xiàn)WHM)分別設(shè)置為0和8 mm。
AlexNet在2012年ImageNet舉辦的圖像識別大賽中脫穎而出,圖像識別錯誤率僅為15.4%,比錯誤率為26%的第2名采用的方法低了近10%[17],其網(wǎng)絡(luò)參數(shù)如圖2所示。AlexNet輸入為227×227的RGB三通道圖像,含有5層卷積層與3層全連接層。卷積層采用修正線性單元(rectified linear unit,ReLU)為激活函數(shù)。ReLU的表達式為f(x)=max(0,x),具有比神經(jīng)網(wǎng)絡(luò)常用的sigmoid、tanh等飽和非線性函數(shù)更快的收斂速度[24]。Conv1與conv2卷積層后均通過池寬為3、步長為2的池化層進行重疊池化。在特征學(xué)習(xí)中,卷積層主要是進行特征的抽象與學(xué)習(xí),池化層則在降低特征維度、提高網(wǎng)絡(luò)效率的同時將相鄰區(qū)域的特征加以聚合。
運用特征遷移理論,即將所有預(yù)處理后的圖像分別輸入已經(jīng)在自然圖像上訓(xùn)練完成的AlexNet模型,再分層提取特征。本研究在CAFFE[25]平臺基于圖形處理器(graphics processing unit,GPU)模態(tài)執(zhí)行。
圖1 數(shù)據(jù)預(yù)處理流程圖
圖2 AlexNet網(wǎng)絡(luò)參數(shù)示意圖
在提取特征后,本研究將每位患者的特征按照三維圖像的形式重新組合。在conv3與conv4中,每位受試者的維度為4 218 240維(65幅13×13×384特征圖),第5層卷積層每位受試者的維度為2 812 160維(65幅13×13×256特征圖)。Conv3和conv4卷積后本無池化層,本研究中借鑒了conv1、conv2的池化方式,即設(shè)置步長為2、池寬為3的池化層進行重疊池化。池化計算公式為
其中,W為輸入的長或?qū)挘籏為池寬;S為步長;N為輸出的長或?qū)?,若不為整?shù)則向上取整。經(jīng)過池化后,conv3與conv4的維度變?yōu)榱?98 560維(65幅6×6×384的特征圖),conv5變?yōu)榱?99 040維(65幅 6×6×256的特征圖)。
池化降維后雖然維度得到了大幅降低,但相對于總數(shù)不足300例的受試者來說,十萬級以上的特征數(shù)依然很高,因此本研究又選用PCA對池化后的特征進一步降維。PCA是一種可將原始特征通過線性變換實現(xiàn)降維的方法,經(jīng)過PCA后的特征每一個主成分都是原始特征的線性組合,并可以按照原始方差百分比進行排序,其降維流程如圖3所示。
圖3 PCA降維流程圖
經(jīng)過PCA提取特征后,特征維度大大降低,并且按照貢獻率大小依次排序,但是對于AD與NC分類,單憑貢獻率的大小選取特征用于分類并不能取得最佳的分類結(jié)果,因此本研究中選擇了SFS方法??紤]到實際AD與NC數(shù)據(jù)不均衡、訓(xùn)練集與預(yù)測集數(shù)量分配的合理性等問題,將隨機化后的AD與NC各組中選擇的75例受試者數(shù)據(jù)作為SFS特征選擇及SVM分類器構(gòu)建的訓(xùn)練集,其余的AD組30例與NC組119例受試者數(shù)據(jù)作為測試集。
在選擇特征后,將各分類組所選特征輸入SVM分類器。SVM將輸入特征映射至高維空間,找到最優(yōu)分類超平面使得樣本得以正確分開。本研究中SVM采用一般線性分類器。在輸入SVM分類模型前,采用(0,1)的歸一化方法對分類集進行去中心化處理。實現(xiàn)過程在MATLAB 2015b中加載臺灣大學(xué)林智仁教授團隊開發(fā)的LIBSVM工具包[26]。
根據(jù)深度卷積網(wǎng)絡(luò)特性,深層的卷積層主要提取的是圖像的高級特征,這些特征往往能夠代表不同類別的分類特性,所以本研究將conv3、conv4、conv5所學(xué)習(xí)到的特征作為下一步的分類特征。SFS特征選擇時的錯誤分類比率如圖4所示。由圖4可以看出,大約在20個特征時錯誤分類比率最低且相對穩(wěn)定,因此本研究選擇20個特征輸入SVM分類器中進行分類統(tǒng)計。
圖4 SFS錯誤分類比率
將選擇的特征輸入線性SVM分類器中,得到各層的分類結(jié)果,詳見表2。
表2 高斯平滑核FWHM為0、8 mm時AD與NC二分類統(tǒng)計結(jié)果%
分類結(jié)果統(tǒng)計采用準確率(Acc)、靈敏度(Sen)、特異性(Spe)3項指標,計算公式如下:
其中,TP為真陽性,即被準確分類的AD樣本;FP為假陽性,即被誤分至NC組的AD樣本;TN為真陰性,即被準確分類的NC樣本;FN為假陰性,即被誤分至AD組的NC樣本。
將隨機化后的AD與NC各組中選擇的75例受試者數(shù)據(jù)作為SFS特征選擇及SVM分類器構(gòu)建的訓(xùn)練集,其余NC組119例與AD組30例受試者數(shù)據(jù)用于測試集。從表2中可以得出,本文研究的分類模型在AD與NC分類中得到很好的應(yīng)用。2種高斯平滑核FWHM分類中,最高準確率均在conv4,conv5準確率相對較低。高斯平滑核FWHM為0 mm時,conv4中準確率達到95.14%,且靈敏度與特異性均最好。
本研究將sMRI提取的全腦灰質(zhì)密度圖作為特征提取與分類的數(shù)據(jù)基礎(chǔ),AlexNet作為特征提取的深度模型基礎(chǔ),運用特征遷移學(xué)習(xí)和特征選擇的方法,實現(xiàn)了AD與NC的分類研究。FWHM為0 mm時,分類準確率在conv4中達到了95.14%,取得了較為理想的分類結(jié)果。這一結(jié)果也證實了經(jīng)過高斯平滑后的灰質(zhì)密度圖再經(jīng)池化處理,會造成特征的過度平滑,降低模型的敏感度。
雖然本研究提出的模型在AD與NC的分類中取得了很好的結(jié)果,但是仍有可以進一步優(yōu)化的方面。如由于ADNI的數(shù)據(jù)采集本身就存在著各個分類集有效數(shù)據(jù)不均衡的情況,而本研究中在運用SVM分類時采用的一般線性的方法,并沒有調(diào)整各數(shù)據(jù)集中的權(quán)重問題。在今后的研究中,應(yīng)考慮多項式、徑向基等一些核函數(shù),再結(jié)合SVM分類器中懲罰因子與權(quán)重的調(diào)節(jié),可能會在結(jié)果方面有進一步的提升。除了參數(shù)選擇之外,隨著近年來深度學(xué)習(xí)模型的發(fā)展,更深層網(wǎng)絡(luò)有可能取得更好的結(jié)果,如VGG-16[27]等,但是逐層特征提取之后進行降維與分類勢必會帶來更大的時間和成本消耗,所以作為一種借助自然圖像預(yù)訓(xùn)練模型的方法探索,本研究中選用了相對層數(shù)較少的AlexNet,在今后的研究中可以將本文提出的類似方法用于探索更深的網(wǎng)絡(luò)模型。