孔伶旭,吳海鋒,2,曾玉,2,陸小玲,羅金玲
(1.云南民族大學(xué) 電氣信息工程學(xué)院,云南 昆明 650500;2.云南省高校智能傳感網(wǎng)絡(luò)及信息系統(tǒng)創(chuàng)新團(tuán)隊(duì),云南 昆明 650500)
阿爾茲海默癥(Alzheimer's disease,AD)是最常見的一種老年癡呆癥,占所有癡呆癥的60%~70%[1]。AD 的形成原因尚未完全研究清楚[1],目前還沒有任何藥物可以阻止或逆轉(zhuǎn)其發(fā)展,只有在AD 早期時通過一些治療來改善癥狀和干預(yù)其進(jìn)一步的惡化[2],從而減輕患者的病情和延長存活時間。因此,AD 的早期診斷對于該疾病的治療具有非常積極的作用。在AD 發(fā)病之前,患者會經(jīng)歷早期輕度認(rèn)知障礙(early mild cognitive impairment,EMCI),該階段是老年正常認(rèn)知衰退和癡呆癥嚴(yán)重認(rèn)知衰退的中間階段,此時的大腦已具有輕微的認(rèn)知和記憶障礙,但不會影響患者的日常生活,因此在臨床檢測中很難被發(fā)現(xiàn)。已有研究表明,患有EMCI 的個體患AD 的風(fēng)險(xiǎn)高于正常人,約為正常人的10 倍[3-5]。因此,準(zhǔn)確診斷EMCI 對AD 的治療有著十分積極的作用。
目前,較準(zhǔn)確的EMCI 診斷方法為生物標(biāo)志物診斷,如通過腦脊髓液完成[6],然而腦脊髓液抽取屬有創(chuàng)診斷,且診斷過程也較為復(fù)雜。另外一種對EMCI 的診斷方法是讓患者完成神經(jīng)心理學(xué)問卷[7],再經(jīng)神經(jīng)心理學(xué)醫(yī)師進(jìn)行評估,但這種診斷往往帶有一定主觀性,只能作為一種輔助診斷方式。近年來,隨著神經(jīng)影像技術(shù)的發(fā)展,具有無創(chuàng)的核磁共振成像(magnetic resonance imaging,MRI) 和功能性磁共振成像(functional magnetic resonance imaging,fMRI)技術(shù)被越來越多的用于AD 的診斷中[8]。fMRI 反映了受試者執(zhí)行特定任務(wù)時血氧水平依賴(blood oxygen level dependent,BOLD)信號的波動情況,相比MRI 數(shù)據(jù),其不僅包含結(jié)構(gòu)性信息還包含功能性信息,只是獲取fMRI 數(shù)據(jù)需要設(shè)計(jì)合理的實(shí)驗(yàn)任務(wù)[9]。為避免實(shí)驗(yàn)任務(wù)因素對fMRI 數(shù)據(jù)的影響,越來越多的研究[10]表明靜息態(tài)fMRI(resting state fMRI,rsfMRI) 可替代fMRI 來完成EMCI 的診斷。由于在rs-fMRI 數(shù)據(jù)獲取時受試者不用完成任何特定任務(wù),因此避免了實(shí)驗(yàn)任務(wù)對數(shù)據(jù)所帶來的影響。
本文采用深度學(xué)習(xí)的分類方法,通過rsfMRI 數(shù)據(jù)來進(jìn)行EMCI 分類,以輔助AD 的早期發(fā)現(xiàn)。首先將大腦劃分成若干個興趣點(diǎn)(region of interest,ROI)[11],依照ROI 從rs-fMRI 數(shù)據(jù)中抽取出時間序列來形成一個二維矩陣,再用一個二維卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)從該二維矩陣中提取特征信息,以此進(jìn)行后面的分類。同時,為了提高運(yùn)算速度和減少訓(xùn)練時間,CNN 采用遷移學(xué)習(xí)網(wǎng)絡(luò),用一種輕量化CNN 網(wǎng)絡(luò)?擁有從ImageNet 數(shù)據(jù)庫[12]中預(yù)訓(xùn)練權(quán)重的MobileNet 來提取ROI 的特征信息。
AD 癥被視為一種神經(jīng)退化性疾病,疾病早期的癥狀常被誤認(rèn)為是正常的老化,錯過了最佳診斷時機(jī)。AD 癥的前期診斷一般通過病史收集和行為觀察獲得,耗時又耗力。若要較為準(zhǔn)確的診斷,則需要進(jìn)行詳細(xì)的神經(jīng)心理學(xué)檢查才有可能判斷是否存在認(rèn)知障礙[13]。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,人們發(fā)現(xiàn)作為一種輔助診斷方法,機(jī)器學(xué)習(xí)可以提高診斷的效率和準(zhǔn)確率。
在傳統(tǒng)的機(jī)器學(xué)習(xí)分類技術(shù)中,支持向量機(jī)(support vector machine,SVM)是一類具有較高分類準(zhǔn)確率的診斷方法[14],但SVM 的準(zhǔn)確率依賴于提取的特征值,當(dāng)特征值本身未能準(zhǔn)確反映疾病的特征,則其準(zhǔn)確率往往會達(dá)到一個瓶頸。近年來隨著深度學(xué)習(xí)的興起,出現(xiàn)了很多可以自動從分類數(shù)據(jù)中提取有效特征值的方法,如堆疊自動編碼器(stacked auto-encoders,SAE)[15]和CNN[16]等,這些方法均使得分類準(zhǔn)確率得到了很大的提高。通常,深度學(xué)習(xí)的網(wǎng)絡(luò)較為復(fù)雜,權(quán)重?cái)?shù)量巨大,且需要海量的訓(xùn)練數(shù)據(jù)作支持,這都使得深度學(xué)習(xí)的訓(xùn)練耗時耗力。然而,公開的AD 病癥數(shù)據(jù)非常有限,AD 早期病癥的數(shù)據(jù)更為稀少,因此深度學(xué)習(xí)的分類準(zhǔn)確率將嚴(yán)重依賴于疾病數(shù)據(jù)的完備性。為了解決該問題,近年來遷移學(xué)習(xí)被提出來對AD 進(jìn)行診斷,例如AlexNet[16]和VGG16[17]等。由于遷移學(xué)習(xí)網(wǎng)絡(luò)已在其他數(shù)據(jù)庫進(jìn)行了預(yù)訓(xùn)練,只需在AD 數(shù)據(jù)庫中只訓(xùn)練其頂層即可,因此可以縮短訓(xùn)練時間,并可減少分類對訓(xùn)練數(shù)據(jù)的依賴。然而,遷移學(xué)習(xí)的預(yù)訓(xùn)練網(wǎng)絡(luò)是否對EMCI 的診斷有效,目前仍無文獻(xiàn)進(jìn)行報(bào)道,這也是本文關(guān)注的一個重點(diǎn)。
機(jī)器學(xué)習(xí)可以同神經(jīng)影像學(xué)相結(jié)合以完成疾病的診斷,常用的影像技術(shù)包括電子計(jì)算機(jī)斷層掃描(computed tomography,CT)、正電子發(fā)射型計(jì)算機(jī)斷層顯像(positron emission computed tomography,PET)、MRI 和fMRI[18]等,其中又以MRI 和fMRI 的低輻射和無創(chuàng)性而得到了廣泛的關(guān)注。對于MRI,其成像較為清晰,且包含信息豐富,因此被廣泛應(yīng)用于對AD 的診斷[19]。通過對皮質(zhì)體積、皮質(zhì)厚度及皮質(zhì)下體積等腦部結(jié)構(gòu)數(shù)據(jù),MRI 可以較準(zhǔn)確預(yù)測MCI 到AD 的轉(zhuǎn)變。然而,對EMCI 患者來說,其腦部結(jié)構(gòu)變化并不明顯,因此僅使用MRI 數(shù)據(jù)對EMCI 的檢測還是具有一定限制。最近有研究表明,AD 還表現(xiàn)在某些腦區(qū)功能連接的變化上[20],而fMRI 又恰恰能反映功能連接特性,因此可以使用fMRI 數(shù)據(jù)來有效診斷AD 和EMCI。然而,采集fMRI 通常需要被試者完成特定的實(shí)驗(yàn)任務(wù),因此fMRI 數(shù)據(jù)又往往與完成的任務(wù)有關(guān)。其實(shí),大腦即使在不完成任何特定任務(wù)時,各腦區(qū)仍然在相互作用,存在一個默認(rèn)的功能網(wǎng)絡(luò),而這種默認(rèn)模式在一些認(rèn)知障礙的大腦疾病中通常遭到了破壞,因此rsfMRI 也逐漸地用在EMCI 診斷中[21]。與fMRI 數(shù)據(jù)相比,rs-fMRI 的獲取不需要被試者完成預(yù)先設(shè)定好的實(shí)驗(yàn)動作,僅需要被試者保持休息狀態(tài),因此避免了人為因素對數(shù)據(jù)的干擾。
通常,rs-fMRI 為一四維數(shù)據(jù),用于深度分類網(wǎng)絡(luò)需先降維。常用的一種降維方式是,將腦區(qū)劃分成一些ROI,從這些ROI 中提取BOLD 信號,再從這些BOLD 信號提取特征值,如利用SAE[22]或受限玻爾茲曼機(jī)(restricted Boltzmann machine,RBM)[23]提取特征值,最后利用這些特征值進(jìn)行分類。由于輸入數(shù)據(jù)的降維不可避免帶來信息丟失,而不降維又容易產(chǎn)生較復(fù)雜的分類網(wǎng)絡(luò),因此,在rs-fMRI 中如何解決分類網(wǎng)絡(luò)的數(shù)據(jù)輸入是本文需要關(guān)注的另一個重點(diǎn)。
由于深度學(xué)習(xí)能自動提取特征值,且具有較高的分類準(zhǔn)確率,因此本文將采用深度學(xué)習(xí)的方法來進(jìn)行EMCI 的診斷。同時,由于rs-fMRI 無需完成任何實(shí)驗(yàn)任務(wù),本文也采用rs-fMRI 數(shù)據(jù)來進(jìn)行診斷。
將rs-fMRI 應(yīng)用于深度學(xué)習(xí)的EMCI 診斷首先需要解決數(shù)據(jù)輸入的問題,如圖1 所示,既要保證輸入到分類網(wǎng)絡(luò)的數(shù)據(jù)降維后應(yīng)包含豐富的分類信息,又能降低分類網(wǎng)絡(luò)的復(fù)雜性,以確保較少的訓(xùn)練時間。
圖1 特征提取的相關(guān)問題Fig.1 Issues related to feature extraction
若用Y表示一個被測試的rs-fMRI 信號,則該信號不僅包含腦區(qū)結(jié)構(gòu)像信息,還包含時間信息,因此是一個NT×NX×NY×NZ的四維數(shù)據(jù),其中NT表示時間維度,NX、NY和NZ分別表示腦區(qū)的3 個空間維度。目前,常用的CNN大多是針對二維圖像的分類網(wǎng)絡(luò),因此rs-fMRI并不能直接拿來作為輸入。當(dāng)然,由于AD 影像數(shù)據(jù)的高維特性,近年來還出現(xiàn)了一些三維CNN網(wǎng)絡(luò)[24],但作為四維的rs-fMRI 仍然無法被直接使用,需要進(jìn)行降維。
一種常用的降維方式是使用自動解剖標(biāo)記(automated anatomical labeling,AAL)[25]圖譜來得到一個NT×NA的二維ROI 時間序列,其中NA表示ROI 的數(shù)量。此時,原來的rs-fMRI 將從原來的四維降至二維,數(shù)據(jù)量得到了減少。然而,為了從ROI 時間序列數(shù)據(jù)提取特征值,仍然需要訓(xùn)練,以SAE 方法為例[22],設(shè)該網(wǎng)絡(luò)共有NS個隱藏層,其每層隱藏層的神經(jīng)元數(shù)量分別為S1,S2,···,SN,那么該網(wǎng)絡(luò)總共的權(quán)重?cái)?shù)量為
從式(1)看到,由于SAE 采用的是全連接網(wǎng)絡(luò),因此其權(quán)重的數(shù)量與神經(jīng)元數(shù)量和隱藏層數(shù)相關(guān),當(dāng)這兩者數(shù)量增大時將不可避免使得整個網(wǎng)絡(luò)權(quán)重?cái)?shù)變得龐大。當(dāng)然,CNN 也可以自動提取特征值,目前的CNN 利用卷積運(yùn)算對權(quán)重進(jìn)行共享,相比全連接層可以減少權(quán)重?cái)?shù)量。假設(shè)一個CNN 網(wǎng)絡(luò)共有NC個卷積層,其中每個卷積層分別由L1,L2,···,LNc個特征圖組成,特征圖的大小分別為F1×F1,F2×F2,···,FNc×FNc,所使用的卷積核尺寸分別為M1×M1,M2×M2,···,MNc×MNc,若步長(stride)為1 時,那么該網(wǎng)絡(luò)的總共的權(quán)重?cái)?shù)量為
其中b是偏置數(shù)。式(2)的權(quán)重與其層數(shù)密切相關(guān),通常CNN 在深度學(xué)習(xí)中的層數(shù)都較多,即使權(quán)重實(shí)現(xiàn)共享但權(quán)重?cái)?shù)依然龐大。
利用腦區(qū)功能性連接網(wǎng)絡(luò)理論來提取特征值的方法可以進(jìn)一步對數(shù)據(jù)降維[20],其本質(zhì)是求統(tǒng)計(jì)相關(guān)系數(shù),若xt和yt分別為任意兩個ROI 在第t時刻BOLD 信號,那么其相關(guān)函數(shù)可表示為
因此,對于一個NT×NA的二維ROI 時間序列求相關(guān)以后,其維度將變?yōu)橄啾仍璕OI 序列,數(shù)量得到了減少。然而由式(3)可知,Rxy是一個時間統(tǒng)計(jì)平均值,雖然去掉了時間維度NT,但也去掉了ROI 數(shù)據(jù)的瞬時量,不可避免地帶來了部分信息丟失。因此,如何在數(shù)據(jù)降維、信息丟失以及訓(xùn)練時間尋找平衡將是本文主要研究的一個問題。
本文使用rs-fMRI 數(shù)據(jù)以及遷移學(xué)習(xí)的CNN 網(wǎng)絡(luò)來對EMCI 進(jìn)行診斷,方法總體框架如圖2 所示,把患有EMCI 和正常控制組(normal control,NC)的rs-fMRI 數(shù)據(jù)進(jìn)行配準(zhǔn)、頭動校正、顱骨剝離、歸一化、平滑及濾波等預(yù)處理操作,然后使用AAL 對完成預(yù)處理數(shù)據(jù)提取ROI 得到相應(yīng)的二維時間序列,隨后輸入到已預(yù)訓(xùn)練的遷移網(wǎng)絡(luò),以此得到瓶頸(bottneck)特征,最后將該特征輸入到設(shè)計(jì)好的TOP 層中得到分類結(jié)果,完成疾病診斷。
圖2 算法總體框架Fig.2 Algorithm overall framework
將一個具有腦區(qū)空間和時間維度的四維rsfMRI 信號直接作為分類器的輸入,維度較高,可從其中提取ROI 時間序列來降維,但從ROI 時間序列提取特征值,仍需訓(xùn)練。如前所述,SAE 和CNN 網(wǎng)絡(luò)提取特征將面臨權(quán)重?cái)?shù)龐大和訓(xùn)練時間增多的問題,而采用相關(guān)法提取特征又容易丟失瞬時信息,因此本文考慮采用遷移學(xué)習(xí)方法從ROI 提取特征值。
設(shè)Xs和DS分別是一源數(shù)據(jù)集中的二維圖像矢量和對應(yīng)標(biāo)簽,將一CNN 網(wǎng)絡(luò)在該源數(shù)據(jù)集中進(jìn)行預(yù)訓(xùn)練,使其滿足:
預(yù)訓(xùn)練完成后,將由四維rs-fMRI 數(shù)據(jù)張量Y提取出來ROI 時間序列XT,輸入到預(yù)訓(xùn)練完成的瓶頸層函數(shù)fbtneck(·),以此得到瓶頸層特征:
其中F即是從ROI 時間序列提取的特征值。若目標(biāo)網(wǎng)絡(luò)的頂層經(jīng)訓(xùn)練后,使得XT及其對應(yīng)標(biāo)簽DT滿足
圖3 給出了式(6)的遷移學(xué)習(xí)過程,圖中預(yù)訓(xùn)練部分通常無需在本地端完成,即使瓶頸層的權(quán)重wb非常龐大,但由于可由第三方預(yù)先完成而獲得,因此可大幅減少提取特征的訓(xùn)練時間。更重要的是,為保證提取瓶頸特征的有效性,訓(xùn)練和獲取瓶頸層權(quán)重wb往往在一個非常巨大的源數(shù)據(jù)集中完成,如ImageNet 數(shù)據(jù)庫[12],因此相比單純無遷移的CNN,遷移網(wǎng)絡(luò)可以解決目標(biāo)數(shù)據(jù)集不足的情形,而目前獲取大規(guī)模EMCI 的rs-fMRI數(shù)據(jù)仍存在一定困難。
圖3 遷移學(xué)習(xí)提取ROI 特征Fig.3 Transfer learning to extract ROI features
其實(shí),圖3 的EMCI 目標(biāo)網(wǎng)絡(luò)訓(xùn)練僅僅對一頂層網(wǎng)絡(luò)進(jìn)行訓(xùn)練,而頂層只是一個淺層神經(jīng)網(wǎng)絡(luò),其權(quán)重wOt數(shù)量并不大,因此可保證訓(xùn)練能在短時間內(nèi)完成。另外,由于瓶頸層特征F來源于ROI 時間序列,因此相比于求相關(guān)系數(shù)的特征值提取方法,其瞬時特征也得到了保留。當(dāng)然,雖然fbtneck(·) 的權(quán)重可由預(yù)訓(xùn)練得到,但特征F也需通過fbtneck(·) 的計(jì)算得到,因此太復(fù)雜的可遷移CNN 會增大特征提取的計(jì)算量,本文將選用一種輕型的CNN 網(wǎng)絡(luò)來實(shí)現(xiàn)遷移學(xué)習(xí)。
作為一種輕型的CNN 網(wǎng)絡(luò),Mobilenet[26]使用深度可分離卷積替代原有的傳統(tǒng)卷積以減少計(jì)算量,本文將采用該網(wǎng)絡(luò)來作為遷移學(xué)習(xí)函數(shù)fbtneck(·)。深度可分離卷積將標(biāo)準(zhǔn)卷積分解成一個深度卷積和一個點(diǎn)卷積,如圖4 所示。深度卷積將單個卷積核應(yīng)用于每個輸入通道,點(diǎn)卷積使用1×1 卷積核來組合輸出,這種分解可大幅度地減少模型大小和計(jì)算量。
圖4 深度可分離卷積Fig.4 Depth separable convolution
對于一個NT×NA的ROI 時間序列來說,設(shè)其輸入通道為M,經(jīng)過一個標(biāo)準(zhǔn)卷積層,則將產(chǎn)生一個N×NT×NA的特征圖,N是輸出通道數(shù)。若經(jīng)過一個卷積核大小為DK×DK×M×N的標(biāo)準(zhǔn)卷積層,其中DK是卷積核維度,那么該標(biāo)準(zhǔn)卷積的計(jì)算成本為
在深度可分離卷積中,先使用深度卷積為每個輸入通道應(yīng)用單個濾波器,那么深度卷積的計(jì)算成本為
然后使用點(diǎn)卷積(1×1 的卷積核)來創(chuàng)建深度層的輸出的線性組合,其計(jì)算成本為
所以深度可分離卷積的計(jì)算成本為
因此,深度可分離卷積的乘法次數(shù)與標(biāo)準(zhǔn)卷積之比為
由式(11)可知,由MobileNet 得到瓶頸層所需計(jì)算量與相同規(guī)模網(wǎng)絡(luò)比,可大大減少。因此從計(jì)算量角度,選擇MboileNet 作為遷移網(wǎng)絡(luò)是一個較好的選擇。
將ROI 時間序列經(jīng)預(yù)訓(xùn)練的瓶頸層MobileNet 就得到瓶頸特征,隨后再將瓶頸特征輸入到設(shè)計(jì)的頂層就可進(jìn)行分類。頂層網(wǎng)絡(luò)設(shè)計(jì)如圖5 所示,主要包括全局平均池化層、Dropout 層、全連接層和輸出層,其中全局平均池化層可將瓶頸層特征融合,Dropout 層可避免網(wǎng)絡(luò)出現(xiàn)過擬合。因此,該頂層的權(quán)重?cái)?shù)量為式中:NGAP×NGAP為瓶頸特征經(jīng)過全局平均池化層的融合后得到的數(shù)據(jù)維度;Ci為第i層全連接層的神經(jīng)元數(shù);m為全連接層的總層數(shù);r為Dropout層的權(quán)重丟棄率。由于在頂層中,經(jīng)提取和融合后的瓶頸層特征維度已經(jīng)降至很低,且層數(shù)m值較小,因此式(12)的權(quán)重?cái)?shù)不會很大,保證了較少的網(wǎng)絡(luò)訓(xùn)練時間。
圖5 頂層設(shè)計(jì)Fig.5 Top-level design
另外,頂層中的一些參數(shù)設(shè)定會影響最后的分類結(jié)果,如全連接層層數(shù)m、Dropout 層的權(quán)重丟棄率r和全連接層的神經(jīng)元數(shù)Ci。如何選擇合適的參數(shù)值可通過實(shí)驗(yàn)來進(jìn)行實(shí)際測試,這部分的內(nèi)容將在下一節(jié)實(shí)驗(yàn)中作詳細(xì)討論。
最后給出本文EMCI 分類算法訓(xùn)練的步驟,如下所示:
1)預(yù)處理:對rs-fMRI 信號的觀測值Y進(jìn)行配準(zhǔn)、頭動校正、顱骨剝離、歸一化和平滑及濾波等,并分成訓(xùn)練集和驗(yàn)證集;
2)ROI 提?。河葾AL 圖譜從預(yù)處理數(shù)據(jù)中提取ROI 時間序列XT;
3)瓶頸特征提?。河蒮btneck(wb,XT) 獲取瓶頸特征;
5) 驗(yàn)證:由驗(yàn)證集,通過式(6) 得到分類結(jié)果,并計(jì)算分類準(zhǔn)確率;
6)重復(fù)執(zhí)行步驟4)~5)至分類準(zhǔn)確率收斂。
在本實(shí)驗(yàn)中,所采用的rs-fMRI 數(shù)據(jù)均來源于阿爾茨海默病神經(jīng)影像學(xué)數(shù)據(jù)庫(Alzheimer’s disease neuroimaging initiative,ADNI),其網(wǎng)址為http://adni.loni.usc.edu/。在該數(shù)據(jù)庫中,我們選擇了ADNI-2 階段的rs-fMRI 數(shù)據(jù),其具體參數(shù)詳見表1,從中我們分別得到了32 個EMCI 和正常對照組(normal control,NC)的可用的被試數(shù)據(jù),且兩組被試內(nèi)的年齡和性別分布沒有明顯差異。
表1 rs-fMRI 數(shù)據(jù)相關(guān)參數(shù)Table 1 rs-fMRI data related parameters
數(shù)據(jù)預(yù)處理采用數(shù)據(jù)處理和腦成像分析(data processing &analysis of brain imaging,DPABI)工具箱[27],具體過程如下:
1) 去除每個被試者前10 幀圖像,僅保留130 幀圖像;
2)以第48 幀圖像為基準(zhǔn)對所有的圖像進(jìn)行校準(zhǔn),使每個切片上的數(shù)據(jù)具有相同時間點(diǎn);
3)對所有被試進(jìn)行頭動校正,將頭動校正到同一位置,并為接下來的圖像質(zhì)量控制提供數(shù)據(jù);
4)將與rs-fMRI 數(shù)據(jù)匹配的MRI 數(shù)據(jù)進(jìn)行顱骨剝離,然后同功能圖像進(jìn)行配準(zhǔn),將MRI 數(shù)據(jù)變換到rs-fMRI 數(shù)據(jù)的空間,使得rs-fMRI 數(shù)據(jù)可以被分割成腦脊髓液、灰質(zhì)和白質(zhì)信號;
柴油在裝卸過程中,因密封不良、管道破損、管道超溫超壓、儀表失靈等原因造成油品泄漏,泄漏的液體及其揮發(fā)出的蒸氣可能形成爆炸性可燃?xì)怏w。如遇火源,則可能發(fā)生火災(zāi)甚至爆炸事故。
5)去除一些混淆因素,將全局平均信號、腦脊髓液和白質(zhì)信號被作為無關(guān)變量去除,且以6 個頭動參數(shù)(包含3 個轉(zhuǎn)動參數(shù)和3 個平動參數(shù))去除頭動帶來的影響;
6)評估被試者頭部的旋轉(zhuǎn)和平移,發(fā)現(xiàn)所有參與者都沒有表現(xiàn)出過度(任一方向平移超過2 mm 或任一方向轉(zhuǎn)動超過2°)的頭部運(yùn)動;
7)進(jìn)行歸一化和平滑,并將所有數(shù)據(jù)都過濾到一個頻率范圍(0.01~0.08 Hz);
8)使用AAL 圖譜將大腦分為116 個ROI,如圖6 所示,每個半腦球包含58 個區(qū)域,最后得到一個116 ×130 的矩陣,其中列為興趣數(shù),行為時間維度;最后根據(jù)所有被試的頭動情況,圖像成像質(zhì)量以及結(jié)構(gòu)和功能像的配準(zhǔn)質(zhì)量對數(shù)據(jù)進(jìn)行過濾,最終分別得到了32 個EMCI 和NC 圖像。
圖6 大腦節(jié)點(diǎn)Fig.6 Top-level design
在實(shí)驗(yàn)中,采用兩種方法對rs-fMRI 進(jìn)行降維,一種僅通過AAL 提取ROI,一種為提取ROI 后再求pearson 相關(guān)系數(shù),因?yàn)閜earson 相關(guān)系數(shù)通常用于衡量功能連接的強(qiáng)度[28],因此也可以使用它來衡量不同大腦區(qū)域之間的功能連接。其具體參數(shù)詳見表2。在對數(shù)據(jù)降維后,采用兩種方法提取特征值和分類,分別采用SAE 和遷移網(wǎng)絡(luò)MobileNet,具體參數(shù)也由表2 列出,由此我們分別得到以下4 種方法的分類結(jié)果:
表2 相關(guān)實(shí)驗(yàn)方法參數(shù)Table 2 Related experimental method parameters
1)SAE_ROI:由AAL 得到ROI,再由SAE 提取特征值后分類;
3)Transf_Corr:由AAL 得到ROI,再求pearson 相關(guān)系數(shù),再由MoblieNet 提取pearson 相關(guān)系數(shù)特征值后進(jìn)入TOP 層分類;
4)Transf_ROI:由AAL 得到ROI,再由MoblieNet 提取ROI 特征值后進(jìn)入TOP 層進(jìn)行分類,計(jì)算步驟也可參見表1。
以上方法的分類方法都將采用k折交叉驗(yàn)證以防止發(fā)生過度擬合問題[29],其中k取5。實(shí)驗(yàn)中分類準(zhǔn)確率計(jì)算過程為:將總數(shù)據(jù)樣本隨機(jī)分成5 份,選擇其一作為驗(yàn)證集,其余4 個作為訓(xùn)練集,每個子樣本用作測試集一次,交叉驗(yàn)證重復(fù)5 次,分類準(zhǔn)確率就為5 次分類結(jié)果的平均值。為了避免實(shí)驗(yàn)的偶然性結(jié)果,最終分類準(zhǔn)確率結(jié)果為重復(fù)以上實(shí)驗(yàn)10 次后的平均值。
除了統(tǒng)計(jì)分類準(zhǔn)確率,實(shí)驗(yàn)還使用敏感性和特異性來評估分類方法的性能。靈敏度為檢測出真陽性數(shù)與實(shí)際真陽性數(shù)比值,越大的值檢測EMCI 的性能越好。特異度為檢測出真陰性數(shù)與實(shí)際真陰性數(shù)比值,越大的值檢測非EMCI 的性能越好。
另外,文中所用的SAE 基于DeepLearnToolbox-master,下載地址為https://github.com/xiayuan/DeepLearnToobox-master。MobileNet 采用tensorflow 平臺中函數(shù),下載地址為https://github.com/tensorflow/models/treemaster/research/slim,使用的預(yù)訓(xùn)練權(quán)重為Imagent 公開的數(shù)據(jù),下載網(wǎng)址為https://github.com/fchollet/deep-learningmodels/releases/tag/v0.6。
首先,給出各方法的分類準(zhǔn)確率,如表3 所示。從表3 可以看到,SAE_ROI 的分類準(zhǔn)確率為59%,其余3 種方法均超過了59%,這表明利用SAE 提取ROI 特征的方法分類準(zhǔn)確率并不高。在用相關(guān)系數(shù)降維的方法中,利用遷移學(xué)習(xí)提取相關(guān)系數(shù)特征值的方法要優(yōu)于用SAE 的方法約0.17%。分類準(zhǔn)確率最高的是利用遷移學(xué)習(xí)提取ROI 特征值的方法,它能使分類準(zhǔn)確率達(dá)到約74%,與其余的SAE_ROI、SAE_Corr 和Transf_Corr3 種方法的分類準(zhǔn)確率相比,分別提升了近14.67%、10.17%和10%。該結(jié)果也表明了,利用遷移學(xué)習(xí)提取ROI 特征值在分類信息的損失上要小于提取相關(guān)系數(shù)特征值,因此分類準(zhǔn)確率也得到了提高。
表3 分類方法的分類準(zhǔn)確率Table 3 Classification accuracy of classification method
表3 還給出了靈敏度和特異度的實(shí)驗(yàn)結(jié)果。從該結(jié)果中可以發(fā)現(xiàn),Transf_ROI 的靈敏度為0.760,高于Transf_Corr(0.703)、SAE_Corr(0.650)和 SAE_ROI(0.583)。而Transf_ROI 的特異度為0.713,這在所討論的方法中也是最高的,高于Transf_Corr(0.570)、SAE_Corr(0.620) 和SAE_ROI(0.597)。
圖7 給出了采用Transf_ROI 方法所提取的特征值結(jié)果圖,其中圖7(a)是在TOP 層分類網(wǎng)絡(luò)的第3 全連接層所提取的所有NC 特征值均值,圖7(b)是相應(yīng)所有EMCI 特征值均值。從圖中可以看到,雖然兩幅特征值圖的絕大部分像素值均在50 左右,但是還是存在一定的差異性。例如,對于EMCI 組,其在第13 列的3、17、35 和50 行的像素值一道道200 左右,而NC 組相應(yīng)位置仍在50 左右。該結(jié)果也與表3 的結(jié)果一致,表明利用遷移學(xué)習(xí)提取特征值在兩個組別確實(shí)存在差異性,因而可以將兩個組別的被試進(jìn)行分類。
圖7 Transf_ROI 中第3 層全連接層中提取的特征值Fig.7 Feature values extracted from the 3rd fully connected layer in Transf_ROI
圖8 給出了4 種分類方法在10 次實(shí)驗(yàn)中的分類準(zhǔn)確率波動情況,整體看,其曲線由高到低排列大致是Transf_ROI、Transf_Corr、SAE_Corr以及SAE_ROI,與表3 中的結(jié)果一致。并且在10 次實(shí)驗(yàn)中,Transf_ROI 方法在7 次實(shí)驗(yàn)中都取得了最高的分類準(zhǔn)確率,這也表明,不僅在平均值上Transf_ROI 方法分類準(zhǔn)確率較高,而且對于單次實(shí)驗(yàn),Transf_ROI 的方法的分類準(zhǔn)確率也大概率高于其他方法。同時,在10 次實(shí)驗(yàn)中,Transf_ROI 和Transf_Corr 的分類準(zhǔn)確率分別穩(wěn)定在70%~80% 和60%~75%,而SAE_Corr 和SAE_ROI 的分類準(zhǔn)確率在10 次實(shí)驗(yàn)中的波動較大,可能是由于數(shù)據(jù)量不足。
圖8 10 次實(shí)驗(yàn)中的分類準(zhǔn)確率Fig.8 Classification accuracy in ten experiments
給出在不同數(shù)據(jù)輸入及不同模型的條件下提取特征時間和分類時間,其中提取特征時間為分別從時間序列數(shù)據(jù)及相關(guān)系數(shù)數(shù)據(jù)中提取特征以供分類網(wǎng)絡(luò)所占用的時間;分類時間是對全部的被試者,將其從時間序列數(shù)據(jù)及相關(guān)系數(shù)數(shù)據(jù)中提取到的特征,送入分類網(wǎng)絡(luò)獲得分類結(jié)果所用的時間。所有實(shí)驗(yàn)方法均在Inter(R) Core(TM) i5-6300HQ(4 核)的中央處理單元(central processing unit,CPU)環(huán)境下運(yùn)行,未采用任何圖形處理器(graphics processing unit,GPU)。表4 給出了在不同模型和不同數(shù)據(jù)輸入時的提特征取和分類時間,從表中可以看出,與SAE 方法相比,Transf 方法在特征提取時所用的時間減少了近80%,且所用的分類時間也都有減少,網(wǎng)絡(luò)總運(yùn)行時間減少了約60%。這都表明在相同的環(huán)境下,使用遷移學(xué)習(xí)對EMCI 進(jìn)行分類所耗費(fèi)的時間少于SAE 的方法,其原因也在于遷移學(xué)習(xí)其實(shí)具有更少的權(quán)重?cái)?shù)量。
表4 模型性能指標(biāo)Table 4 Model performance indicators s
本文主要分析Transf_ROI 的頂層網(wǎng)絡(luò)的全連接層數(shù)對分類性能的影響,其最終參數(shù)在表2 列出。在這里,給出不同的頂層網(wǎng)絡(luò)參數(shù)設(shè)置對最終分類結(jié)果帶來的不同影響。圖9 分別給出了采用Transf_ROI 中池化層所提取的NC 組和EMCI 組特征值的結(jié)果圖,從圖中可以看到,兩個組別的大部分像素值均在50 左右,當(dāng)然,存在一部分像素值超過了150,但其所在兩個組別的位置也沒有存在明顯差異性。該結(jié)果表明,僅靠池化層提取的特征還不能將兩組進(jìn)行區(qū)分,需要加入全連接層。
圖9 Transf_ROI 中池化層中提取的特征值Fig.9 Feature values extracted from the pooling layer in Transf_ROI
全連接層的層數(shù)也會對實(shí)驗(yàn)結(jié)果產(chǎn)生影響,圖10 和圖11 分別給出了在1~4 層全連接層時的分類準(zhǔn)確率和運(yùn)行時所用的迭代次數(shù)。從圖10中可以看出,在使用3 層全連接層時,分類準(zhǔn)確率最高,且在10 組實(shí)驗(yàn)中,有6 次是最高值。如圖7所示的第3 層全連接層中提取的特征值的組間差異性明顯大于如圖9 所示的池化層中提取的特征值的組間差異性,因此加入全連接層是十分有必要的。
圖10 TOP 層具有1、2、3 和4 個全連接層時的測試精度Fig.10 Test accuracy when TOP layer has 1,2,3 and 4 fully connected layers
而在圖11 中可以看出,隨著全連接層層數(shù)的增多,迭代次數(shù)在相應(yīng)地減少,但減少的程度在降低。根據(jù)圖10 和圖11 綜合考慮分類準(zhǔn)確率和迭代次數(shù)后,我們的實(shí)驗(yàn)選用了3 層全連接層的設(shè)置。
圖11 TOP 層具有1,2,3 和4 個全連接層時的EpochFig.11 Epoch when TOP layer has 1,2,3 and 4 fully connected layers
針對rs-fMRI 數(shù)據(jù)的EMCI 分類問題,本文采用遷移學(xué)習(xí)MoblieNet 網(wǎng)絡(luò)對ROI 時間序列進(jìn)行特征提取,再進(jìn)入到分類網(wǎng)絡(luò)進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,本文的方法較傳統(tǒng)方法的分類準(zhǔn)確率有所提升,且運(yùn)行時間也有較大程度的減少,但還有以下幾點(diǎn)需要進(jìn)一步進(jìn)行討論。
實(shí)驗(yàn)中,本文方法的分類準(zhǔn)確率為73.67%,雖然比其他幾種傳統(tǒng)方法高,但低于文獻(xiàn)[22]給出的86% 的分類結(jié)果,該文獻(xiàn)采用SAE 來提取Pearson 相關(guān)系數(shù)的特征,其主要原因在于,所使用的數(shù)據(jù)集較小,被試者數(shù)為64,而文獻(xiàn)[22]所用被試數(shù)為170。雖然本文所采用的ADNI-2 數(shù)據(jù)庫中,有關(guān)EMCI 的rs-fMRI 數(shù)據(jù)確實(shí)較多,但與其對應(yīng)的MRI 數(shù)據(jù)卻相對較少。沒有對應(yīng)MRI 數(shù)據(jù)將無法進(jìn)行良好配準(zhǔn),這會導(dǎo)致一些混淆變量不能有效去除,如腦脊液和白質(zhì)等,而該混淆變量又會影響分類結(jié)果。因此,最后能夠滿足實(shí)驗(yàn)條件的rs-fMRI 數(shù)據(jù)量就較小。當(dāng)然,實(shí)驗(yàn)中的所采用方法無論是遷移學(xué)習(xí)還是傳統(tǒng)方法,面向的數(shù)據(jù)集是相同的,即本文方法的性能提升是在同樣數(shù)據(jù)條件下所獲得的。在未來的工作中,我們將會嘗試更多的可用數(shù)據(jù),以進(jìn)一步來驗(yàn)證本文的研究。
另外,在頂層參數(shù)設(shè)置的實(shí)驗(yàn)中,僅給出了全連接層數(shù)的實(shí)驗(yàn)結(jié)果,而未對其他參數(shù)作進(jìn)一步討論,這主要是因?yàn)橄鄬τ谄渌麉?shù),全連接層數(shù)對分類結(jié)果的影響比較大。對于激活函數(shù),我們也嘗試了一些常用的函數(shù),如ReLu、Softplus 等[30],但發(fā)現(xiàn)這些函數(shù)的分類結(jié)果并沒有較大差別,因此選擇了較為常見的Softplus。當(dāng)然,還有一些參數(shù)對頂層性能也非常重要,例如全連接層節(jié)點(diǎn)數(shù)。節(jié)點(diǎn)數(shù)量可以根據(jù)經(jīng)驗(yàn)確定,若節(jié)點(diǎn)數(shù)太小,網(wǎng)絡(luò)將無法適應(yīng)復(fù)雜分類,若節(jié)點(diǎn)數(shù)太大,會增加訓(xùn)練時間且可能產(chǎn)生過擬合。在本文的頂層網(wǎng)絡(luò)中,將3 個全連接層的節(jié)點(diǎn)數(shù)分別設(shè)置為200、100 和50。最后還有一個重要的頂層參數(shù)是Dropout 層的神經(jīng)元丟棄率,將其值設(shè)為大于0 時,會降低分類網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)的擬合程度,從而得到較低的分類準(zhǔn)確率,因此最后將其設(shè)置為0。
針對通過rs-fMRI 信號來診斷EMCI 問題,本文提出了一種采用MobileNet 的遷移網(wǎng)絡(luò)來提取ROI 時間序列特征的方法。對于4D 的rs-fMRI信號,采用遷移學(xué)習(xí)來提取特征值可以使網(wǎng)絡(luò)的訓(xùn)練時間大幅度下降,并能減少瞬時信息的丟失。本文在實(shí)驗(yàn)中,采用了ADNI-2 的rs-fMRI 數(shù)據(jù),并用DPABI 工具箱對這些數(shù)據(jù)進(jìn)行預(yù)處理,將本文算法與從相關(guān)系數(shù)提取特征值的方法進(jìn)行了對比,結(jié)果顯示本文算法的分類準(zhǔn)確率比傳統(tǒng)的相關(guān)系數(shù)方法提高了約10%,而網(wǎng)絡(luò)的分類時間大約只有用SAE 提取相關(guān)系數(shù)特征方法的25%。該結(jié)果說明,ImageNet 數(shù)據(jù)庫中預(yù)訓(xùn)練的遷移網(wǎng)絡(luò)從ROI 提取特征的分類準(zhǔn)確率要高于從腦區(qū)網(wǎng)絡(luò)的功能性連接提取特征的方法,并且這種方法還可減少特征提取的時間和分類網(wǎng)絡(luò)運(yùn)行時間。