朱亞飛,黃慶坤,2,楊仕虎,付舒悅,魏新帥,譚穎
(1.西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,成都 610225;2.大理護(hù)理職業(yè)學(xué)院,大理 671000)
精神分裂癥是一組病因未明的重性精神病,并且沒有客觀的測試供予診斷。精神分裂癥其病因未明、診斷信度、如何根治等問題尚未得到解決,揭示其成病原因?qū)εR床和治療有重大意義。功能磁共振成像技術(shù)作為一種神經(jīng)影像技術(shù),憑借其高空間分辨率、無創(chuàng)傷等優(yōu)點(diǎn),已經(jīng)被廣泛應(yīng)用在腦科學(xué)、臨床醫(yī)學(xué)等相關(guān)領(lǐng)域的研究中。但由于神經(jīng)活動本身的復(fù)雜多變性,使得 fMRI(functional Magnetic Resonance Imaging)數(shù)據(jù)存在著噪聲大、有效信息提取困難以及信息冗余等問題。在此背景下,引出fMRI 數(shù)據(jù)與人工智能相結(jié)合的方法,一方面有效的定位激活腦區(qū);另一方面通過差異性腦區(qū)或腦網(wǎng)絡(luò)機(jī)制實(shí)現(xiàn)分類研究。
黃慶坤[1]使用數(shù)學(xué)工具皮爾遜相關(guān)系數(shù)計(jì)算fMRI腦區(qū)之間的相關(guān)系數(shù),經(jīng)過主成分分析法降維后的特征供SVM 學(xué)習(xí)。Yang B 等人[2]使用了三種方法分析fMRI 圖像得到三種fMRI 特征,三種特征被用來訓(xùn)練三個膠囊神經(jīng)網(wǎng)絡(luò)。最終通過集成學(xué)習(xí)的方法獲得分類結(jié)果。黃慶坤等人[3]將PCA 降維后的功能連接系數(shù)作為特征輸入到神經(jīng)網(wǎng)絡(luò)中,得到一個分類模型。
本文將從深度學(xué)習(xí)的角度出發(fā),使用卷積神經(jīng)網(wǎng)絡(luò) CNN(Convolutional Neural Networks)從 fMRI 數(shù)據(jù)中提取出有效信息,對精神分裂癥患者進(jìn)行分類。
CNN 算法基于BP 神經(jīng)網(wǎng)絡(luò),在CNN 訓(xùn)練過程種同樣采用向前和向后傳播。CNN 包含了一個由卷積層和池化層構(gòu)成的特征抽取器,然后通過全連接層進(jìn)行訓(xùn)練輸出(見圖1)。它對于圖像的輸入通過一個權(quán)值矩陣構(gòu)成的卷積核,分別在x 和y 方向通過卷積核對若干個特征平面(feature-maps)進(jìn)行卷積操作來構(gòu)建多維度特征,然后再進(jìn)行ReLU 激活函數(shù)和池化(pooling)來達(dá)到降維度和防止過擬合(over-fitting),將這些特征輸入到全連接層,最后再到輸出層。
在卷積過程中我們通過卷積核對輸入的x*x 大小的圖像沿著x 和y 方向分別以步長(strides)進(jìn)行卷積操作,我們以ReLU 為激活函數(shù),則卷積操作可以描述為:
圖1 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
其中Wi表示第i 層卷積核的權(quán)值向量,運(yùn)算符“?”表示卷積核輸入特征圖進(jìn)行卷積操作,卷積的輸出與第i 層的偏向向量bi相加通過Relu激活函數(shù)得到輸出特征圖。
在卷積過程中由于卷積后像素矩陣會變小,并且在圖像邊緣存在信息丟失的問題,所以我們需要做像素填充 padding 操作。常見的 padding 有 VALID 和SAME 兩種,對于VALID padding 后圖像像素的大小可以表示為
其中xheight和xweight分別輸入像素的長和寬,kheight和kweight為別為卷積核的長和寬s為每一次卷積核移動步長,其中為向上取整符號。SAME padding 后圖像的像素大小可以表示為:
可見通過SAME padding 后可以得到和原來像素一樣大小的矩陣。
本文實(shí)驗(yàn)中所使用的fMRI 數(shù)據(jù)為UCLA 數(shù)據(jù)集[4,5](https:∕∕openfmri.org∕)。數(shù)據(jù)集中包括58 名精神分裂癥患者和138 例健康對照組。實(shí)驗(yàn)中使用DPABI[6]工具包對原始數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理包括時間層矯正、頭動矯正、歸一化處理以及平滑濾波。
預(yù)處理后的數(shù)據(jù)是時間序列上的空間信息,即四維數(shù)據(jù)。實(shí)驗(yàn)中使用AAL[7]模板將大腦劃分為116 個感興趣區(qū)域,在每個感興趣區(qū)域上提取時間序列。在所有被試中,計(jì)算各個感興趣區(qū)域之間的皮爾遜相關(guān)系數(shù),由此來構(gòu)建功能連接矩陣。功能連接矩陣的形狀為[116,116],如圖2 所示。功能連接矩陣作為被試的特征,送入CNN 訓(xùn)練及對精神分裂癥患者進(jìn)行分類。
圖2 功能連接矩陣
在我們的實(shí)驗(yàn)中,我們使用了如圖1 的網(wǎng)絡(luò)模型。其中第一層是卷積核大小為16*16*256 的卷積層,跳步為4,激活函數(shù)為ReLU;第二層為4*4 的最大池化層,第三層再利用4*4*128 的卷積核進(jìn)行卷積,跳步為1,激活函數(shù)為ReLU;第四層為2*2 的最大池化層,第五層為含有64 個神經(jīng)元的全連接層,第六層為含有2 個神經(jīng)元的全連接層,并由Softmax 函數(shù)進(jìn)行輸出。所有的卷積層采用valid 方式進(jìn)行卷積。之后我們將功能連接矩陣用于網(wǎng)絡(luò)訓(xùn)練,并采用十折交叉驗(yàn)證進(jìn)行模型的訓(xùn)練與預(yù)測。
分類準(zhǔn)確率是衡量一個分類模型性能的重要指標(biāo)之一。為了評估該模型的性能,我們定義分類準(zhǔn)確率:
其中N為數(shù)據(jù)分布,P(·)為概率密度函數(shù)。我們將其與其他使用傳統(tǒng)機(jī)器學(xué)習(xí)分類方法的實(shí)驗(yàn)對比,得到如表1 所示的結(jié)果。
與傳統(tǒng)的醫(yī)療圖像分類方法SVM[8]和Bagged SVM[9]相比,CNN 模型的分類準(zhǔn)確率大幅提高,即使是機(jī)器學(xué)習(xí)分類方法中性能較好的Random Forest[10],相對于CNN 模型也存在明顯弱勢。從表格中可知,與機(jī)器學(xué)習(xí)分類方法相比,卷積神經(jīng)網(wǎng)絡(luò)分類模型在分類高維度特征時性能更好。
表1 CNN 及其他模型的分類結(jié)果
本文對精神疾病醫(yī)療圖像分類研究有一定意義,在傳統(tǒng)的機(jī)器學(xué)習(xí)方法難以取得較好成效的領(lǐng)域,我們應(yīng)該嘗試更多的方法,尤其是新興的深度學(xué)習(xí)方法,如DNN、CNN 以及其他改進(jìn)后的網(wǎng)絡(luò)模型,這些方法往往能取得更好的結(jié)果。
本文在醫(yī)療影像數(shù)據(jù)中,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的識別算法,針對差異性腦區(qū)或腦網(wǎng)絡(luò),充分利用CNN 自學(xué)習(xí)特性,有效解決了傳統(tǒng)分類模型,對高維fMRI 數(shù)據(jù)存在著不能有效提取特征的問題,使得訓(xùn)練網(wǎng)絡(luò)模型本身即具有抗噪聲、抗旋轉(zhuǎn)等優(yōu)良特性。在今后的工作中將引用3D 卷積神經(jīng)網(wǎng)絡(luò),來針對fMRI數(shù)據(jù)高時間維度的特性,更好地挖掘大腦隱藏信息。