徐嘉陽 楊婷婷 李 雯 李 擴(kuò) 杜昌旺 劉曉芳 盛多錚 閆相國 王 剛#*
1(生物醫(yī)學(xué)信息工程教育部重點(diǎn)實(shí)驗(yàn)室,西安交通大學(xué)生命科學(xué)與技術(shù)學(xué)院, 健康與康復(fù)科學(xué)研究所,西安 710049)
2(西安交通大學(xué)第一附屬醫(yī)院神經(jīng)外科,西安 710061)
3(北京瑞爾唯康科技有限公司,北京 100071)
癲癇是一種以突然、短暫、反復(fù)的癲癇性發(fā)作為特征的慢性神經(jīng)系統(tǒng)疾病或綜合征[1]。癲癇性發(fā)作則是大腦內(nèi)神經(jīng)細(xì)胞群陣發(fā)性異常超同步電活動(dòng)的臨床表現(xiàn)。反復(fù)、突然的癲癇性發(fā)作十分危險(xiǎn),不僅威脅到患者生命,還為其家庭增添了較大的負(fù)擔(dān)。在臨床上,醫(yī)生通常利用長時(shí)程腦電圖(electroencephalogram,EEG)來監(jiān)測癲癇發(fā)作,然而由于這項(xiàng)工作乏味、耗時(shí),并且很大程度上依賴于臨床醫(yī)生的自身經(jīng)驗(yàn)和主觀判斷,導(dǎo)致人工檢測結(jié)果的準(zhǔn)確性和可重復(fù)性較低[2]。為了使得癲癇發(fā)作可以在較短的時(shí)間內(nèi)被檢測到,癲癇腦電自動(dòng)檢測和識(shí)別技術(shù)的發(fā)展尤為關(guān)鍵。
腦電信號(hào)具有非平穩(wěn)性和非線性特征,因此腦電信號(hào)分析往往以傳統(tǒng)的時(shí)域、頻域或者時(shí)頻結(jié)合的方法為主,通過計(jì)算各種非線性的特征值來區(qū)分腦電信號(hào)[3]。大多數(shù)的數(shù)據(jù)預(yù)處理方法是用小波變換對(duì)信號(hào)進(jìn)行分解[4],但是分層數(shù)、基函數(shù)的選擇對(duì)結(jié)果產(chǎn)生很大影響,不具備對(duì)信號(hào)自適應(yīng)的分解能力。本研究采用多元經(jīng)驗(yàn)?zāi)B(tài)分解( multivariateempiricalmodedecomposition,MEMD)[5]處理信號(hào),此方法不需要根據(jù)先驗(yàn)知識(shí)選擇基函數(shù),能同時(shí)對(duì)多通道數(shù)據(jù)進(jìn)行自適應(yīng)分解,適合于分析具有高度相關(guān)性和非平穩(wěn)性的腦電信號(hào),可以增強(qiáng)定位腦電信號(hào)的頻率信息的準(zhǔn)確性,從而有效地提高對(duì)腦電信號(hào)的識(shí)別能力[6]。
目前所采用的癲癇檢測方法多使用EEG 的幅值、主頻率、變異系數(shù)、熵值等作為分類特征,然后利用支持向量機(jī)(support vector machine, SVM)[7]、決策樹(decision tree, DT)、隨機(jī)森林(random forest,RF)等方法進(jìn)行腦電分類。但是,這些方法沒有將大腦作為一個(gè)有機(jī)整體,沒有考慮在產(chǎn)生行為變化或生理功能改變時(shí)大腦各部分之間會(huì)存在信息交換和流動(dòng)。盡管這些方法在短時(shí)程腦電上檢測結(jié)果表現(xiàn)優(yōu)異,但在長時(shí)程腦電上檢測結(jié)果的精確率指標(biāo)偏低,不符合實(shí)際的臨床需求。此外,在實(shí)際長程腦電的檢測中,發(fā)作期的時(shí)間要遠(yuǎn)遠(yuǎn)短于非發(fā)作期的時(shí)間,數(shù)據(jù)集不平衡導(dǎo)致分類器決策邊界偏移,最終影響到模型分類效果。因此,本研究采用有向傳遞函數(shù)(direct transfer function,DTF)計(jì)算不同腦區(qū)之間的流出信息,區(qū)分在癲癇發(fā)作時(shí)間段內(nèi)和正常狀態(tài)下不同腦區(qū)之間的信息流動(dòng)的差異,并且采用代價(jià)敏感支持向量機(jī)(cost-sensitive support vector machine,CSVM)對(duì)提取的特征信息進(jìn)行分類,利用不同類別的樣本被誤分類而產(chǎn)生不同的代價(jià)進(jìn)行分類學(xué)習(xí),從而解決數(shù)據(jù)不平衡帶來的問題。
本研究利用多元經(jīng)驗(yàn)?zāi)B(tài)分解將腦電信號(hào)分解出一系列本征模函數(shù),利用其流出信息度作為特征,經(jīng)過特征組合與降維后,通過CSVM 進(jìn)行癲癇發(fā)作檢測。結(jié)果表明,此方法具有較高的準(zhǔn)確率、精確率、召回率及F2 值,達(dá)到了較好的癲癇發(fā)作檢測效果。
所用數(shù)據(jù)均源于西安交通大學(xué)第一附屬醫(yī)院,采用NIHON KOHDEN 公司的EEG-1100 腦電圖機(jī)進(jìn)行數(shù)據(jù)采集。該數(shù)據(jù)的采集使用19 導(dǎo)電極,電極位置按照國際10/20 標(biāo)準(zhǔn),以頭頂CZ 的電極為參考電極。數(shù)據(jù)的通帶截止頻率為0.5 ~60 Hz,采樣頻率為200 Hz。數(shù)據(jù)中關(guān)于癲癇發(fā)作點(diǎn)以及棘波波形的信息由交大一附院的兩位具有臨床經(jīng)驗(yàn)的醫(yī)生通過觀察和評(píng)估被測患者的實(shí)際臨床記錄和表現(xiàn)進(jìn)行標(biāo)注。腦電數(shù)據(jù)的總時(shí)長為121.8 h,包含了44 次發(fā)作,其中癲癇發(fā)作期的平均時(shí)間98.7 s。
表1 給出了10 位患者的相關(guān)腦電數(shù)據(jù)信息。數(shù)據(jù)采集通過了西安交通大學(xué)機(jī)構(gòu)評(píng)審委員會(huì)的批準(zhǔn),所有受試者都簽署了腦電數(shù)據(jù)采集和后續(xù)腦電圖記錄分析的知情同意書。
表1 患者信息表Tab.1 Patient Information
為了在長時(shí)程腦電中識(shí)別發(fā)作期的腦電,本研究提出基于自適應(yīng)多尺度腦功能連接的癲癇發(fā)作檢測方法(adaptive and multiscale brain functional connectivity, AMBFC)。首先利用多元經(jīng)驗(yàn)?zāi)B(tài)分解的方法,將19 個(gè)通道的腦電信號(hào)分解為7 個(gè)本征模函數(shù)(intrinsic mode function,IMF)分量和殘量,接著再分別對(duì)7 個(gè)IMF 分量和殘量及原始的腦電信號(hào)建立多變量自回歸模型,用有向傳遞函數(shù)算法,提取不同IMF 分量的腦電信號(hào)和原信號(hào)在不同腦區(qū)的流出信息強(qiáng)度作為特征信息,并將此特征信息進(jìn)行特征組合和PCA 降維,最后經(jīng)過代價(jià)敏感支持向量機(jī)分類器,通過五重交叉驗(yàn)證得到檢測結(jié)果。具體流程圖如圖1 所示。
圖1 所提出的癲癇檢測算法(AMBFC)流程Fig.1 Flow chart of a novel epilepsy detection algorithm
1.2.1 多元經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)是一種自適應(yīng)信號(hào)時(shí)頻分析方法[8],可將信號(hào)分解成一系列IMF,其在處理腦電信號(hào)這一類非平穩(wěn)非線性隨機(jī)信號(hào)上具有明顯的優(yōu)勢(shì)。然而,EMD 在處理多通道腦電圖信號(hào)方面的應(yīng)用仍然有限,故MEMD 作為傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解的多元拓展引入癲癇發(fā)作檢測這一領(lǐng)域。
首先采用滑動(dòng)窗將腦電信號(hào)分割成短時(shí)信號(hào)。由于腦電信號(hào)在采集的過程中,經(jīng)過了0.5 ~60 Hz濾波,因此,為了在后續(xù)分析的過程中能夠分辨頻率為0.5 Hz 的腦電信號(hào),需要將腦電信號(hào)分割為時(shí)長至少為2 s 的片段。本研究選用2 s 的無重疊窗對(duì)腦電信號(hào)進(jìn)行分割。
在t時(shí)刻,一個(gè)經(jīng)過窗分割之后的N導(dǎo)聯(lián)(N=19)的腦電數(shù)據(jù)為
式中,Xn(t) 表示第n個(gè)通道的腦電信號(hào)。對(duì)此信號(hào)進(jìn)行MEMD 分解,以下為具體步驟[5]:
步驟1:采用Hammersley[9]序列采樣法,xθk=[x1,k,x2,k,…,x19,k]表示在18 維球面上對(duì)應(yīng)角θk={θ1,k,θ2,k,…,θ19,k}的方向向量集;
步驟2:計(jì)算原始腦電信號(hào){X(t)}(1≤t≤T)在第k個(gè)方向向量xθk上的投影為{pθk(t)}(1≤t≤T),k為方向向量的總數(shù);
步驟3:找到方向向量的投影信號(hào){pθk(t)}(1≤k≤K) 極值對(duì)應(yīng)的瞬時(shí)時(shí)刻{ti,θk}(1 ≤k≤K),i表示極值點(diǎn)位置,i∈[1,T];
步驟4:用多元樣條插值函數(shù)插值極值點(diǎn)[ti,θk,X(ti,θk)]共得到K個(gè)多元包絡(luò){eθk(t)}(1 ≤k≤K)
步驟5:對(duì)于球空間K個(gè)方向向量,局部均值可由下式計(jì)算:
步驟6:通過d(t)=v(t)- m(t) 提取固有模態(tài)函數(shù)d(t),如果d(t) 滿足多元模態(tài)函數(shù)IMF 判斷標(biāo)準(zhǔn)[10],就將v(t)- m(t) 作為輸入信號(hào)重新提取新的多元IMF 分量。由于不同信號(hào)分解出來的固有模態(tài)數(shù)目有差異,為了便于分類,需使得固有模態(tài)數(shù)目一致,故選用IMF 1~I(xiàn)MF 7。
經(jīng)過多次MEMD 分解,原始的19 通道腦電信號(hào){X(t)={X1(t),X2(t),…,X19(t)} 被分解為一系列IMF 分量和余量r(t) 的和,為
式中,s為IMF 的個(gè)數(shù)(s=7),di(t)={di,1(t),di,2(t),…,di,19(t)},r(t)={r1(t),r2(t),…,r19(t)}對(duì)應(yīng)于19 通道腦電數(shù)據(jù)的19 組7 個(gè)IMF 分量和19 個(gè)余量。
定義Q(t) ={q1(t) ,q2(t) ,…,q9(t) }, 其中qi(t),i =1,2,…,9 表示為
1.2.2 基于有向傳遞函數(shù)的特征提取
多通道腦電之間的相互關(guān)系可以用于評(píng)估腦區(qū)各部分的信息交流,而有向傳遞函數(shù)可以反映不同通道的腦電信號(hào)的相互關(guān)系[11]。為利用有向傳遞函數(shù)進(jìn)行特征提取我們首先對(duì)每個(gè)qi(t)(i =1,2,…,9) 建立多變量自回歸模型(MVAR),然后在求得MVAR 模型系數(shù)的基礎(chǔ)之上,利用有向傳遞函數(shù)(DTF)提取不同腦區(qū)的流出信息強(qiáng)度,該特征能夠反映不同腦電通道之間的流出信息。
在t 時(shí)刻,qi(t) 可以表示為
式中,N的取值為19。通過多通道自回歸模型,該序列又可以表示為
式中,p表示MVAR 模型的階數(shù),Ar為N×N的系數(shù)矩陣,r =1,2,…,p;E(t) 表示估計(jì)誤差,理想情況下為均值為0 的非相關(guān)白噪聲。
模型的階數(shù)可以通過 Schwarz' s Bayesian Criterion (SBC)[12]來確定:系數(shù)矩陣Ar的估計(jì)可以用arfit[13]算法求得。然后對(duì)所獲得的MVAR 模型求得的系數(shù)矩陣Ar作傅里葉變換,有
式中,f為離散頻率變量。定義的傳遞矩陣為
進(jìn)而獲得在頻率f上從導(dǎo)聯(lián)j到導(dǎo)聯(lián)i的信息流:
式中,(f) 表示H(f) 的第i行第j列的元素,hi(f)表示矩陣H的第i列;DTFij(f) 表示在頻率f時(shí)從導(dǎo)聯(lián)j到導(dǎo)聯(lián)i的信息流的強(qiáng)度和方向。
1.2.3 特征提取和降維
DTF 提取的特征為不同頻率下各腦電極信號(hào)的信息流通情況,因此,對(duì)于每一個(gè)頻率均提取19×19 的特征矩陣,在同一頻段內(nèi),若有M 個(gè)頻率數(shù),則該特征矩陣的大小為19×19×M,這樣的特征過于龐大,不利于分類器分類。因此,需要對(duì)特征進(jìn)行降維和組合,具體的步驟如下:
步驟1:將所有頻率下的特征值的平方進(jìn)行累加,即
此時(shí)得到了某個(gè)頻段內(nèi)各個(gè)通道之間的信息流動(dòng)的強(qiáng)度特征,這一步使得特征矩陣由19×19× M壓縮到19×19。
步驟2:考慮到在癲癇發(fā)作期癲癇病灶區(qū)有高強(qiáng)度的放電,此區(qū)域的腦電信息流出強(qiáng)度會(huì)加大,故將特征值矩陣按列(或按行)累加就能得到每個(gè)通道的流出信息的強(qiáng)度,即
此時(shí),特征矩陣由19×19 被壓縮至19×1。將Q(t) 中每個(gè)qi(t) 得到的特征矩陣進(jìn)行線性組合,得到171×1 的一維矩陣。
由于特征數(shù)目過多,選用主成分分析方法,對(duì)特征進(jìn)行降維,利用線性矩陣變換,將高維空間的數(shù)據(jù)映射到低維空間。設(shè)樣本為X =(x1,x2,…,xn),則算法的具體步驟為:
步驟2:計(jì)算樣本的協(xié)方差矩陣:
步驟3: 利用奇異值分解( singular value decomposition, SVD),求出協(xié)方差矩陣的特征值及對(duì)應(yīng)的特征向量;
步驟4:對(duì)特征值從大到小排序,根據(jù)貢獻(xiàn)度,選擇最大的k個(gè)值,將其特征向量分別作為行向量組成特征矩陣P,其中,k值的大小由特征值數(shù)目的占比決定;
步驟5:將數(shù)據(jù)轉(zhuǎn)換到k個(gè)特征向量構(gòu)建的新空間中,即Y=PX。
將經(jīng)降維后的特征放入分類器進(jìn)行學(xué)習(xí),從而區(qū)分發(fā)作期的腦電信號(hào)和非發(fā)作期的腦電信號(hào)。
1.2.4 代價(jià)敏感支持向量機(jī)分類
由于在使用SVM 模型時(shí),要求正反標(biāo)記的樣本量相差不大,然而在實(shí)際長程腦電中,癲癇發(fā)作期的時(shí)間遠(yuǎn)遠(yuǎn)短于非發(fā)作期,使得樣本數(shù)目相差較大,從而造成SVM 模型傾向于數(shù)目較多的一類樣本,進(jìn)而影響分類模型的準(zhǔn)確度?;诖?,引入CSVM[14],該方法在建模時(shí)將不同類別樣本的誤分類代價(jià)考慮在內(nèi),并將這些誤分類代價(jià)嵌入到標(biāo)準(zhǔn)SVM 算法中。
CSVM 算法和SVM 算法的主要區(qū)別在目標(biāo)函數(shù)上。其目標(biāo)函數(shù)和約束條件為
目標(biāo)函數(shù):
約束條件:
式中,C-=C,C+=w1×C-,C是支持向量機(jī)SVM 的基懲罰因子,w1 是懲罰因子調(diào)整系數(shù)。
采用網(wǎng)格搜尋的方法[15]對(duì)算法中的參數(shù)C和w1 尋優(yōu),選用高斯徑向核函數(shù),懲罰系數(shù)C的取值范圍為2-10~210,步長為0.5,w1 的取值范圍為1 ~21,步長為0.5。通過C和w1 的不同取值,我們使用一個(gè)指標(biāo)Fβ作為評(píng)估值,找出Fβ最高時(shí)對(duì)應(yīng)的參數(shù),此時(shí)即為相應(yīng)的最優(yōu)參數(shù)組合。Fβ表示為如下:
式中,真陽性(TP)表示算法和醫(yī)生都判斷為發(fā)作期的片段數(shù);假陽性(FP)表示算法識(shí)別為癲癇發(fā)作期而醫(yī)生標(biāo)記為非發(fā)作期片段數(shù);真陰性(TN)表示算法和醫(yī)生都判斷為非發(fā)作期片段數(shù);假陰性(FN)表示算法識(shí)別為非發(fā)作期而醫(yī)生標(biāo)記為發(fā)作期片段數(shù)。此處,將β取為2(此權(quán)重使得FN 的意義大過FP),因此式(14)可以表示為
為了對(duì)結(jié)果進(jìn)行更精準(zhǔn)的評(píng)估,用于測試的數(shù)據(jù)必須與用于訓(xùn)練模型的數(shù)據(jù)區(qū)分開來。因此,我們采用雙重交叉驗(yàn)證的方法,首先將每一個(gè)患者的腦電數(shù)據(jù)平均分為5 組,每次用4 組數(shù)據(jù)做訓(xùn)練,一組數(shù)據(jù)用來測試。為了在訓(xùn)練中建立最優(yōu)的CSVM 分類器,對(duì)訓(xùn)練集進(jìn)一步進(jìn)行五折交叉驗(yàn)證。隨機(jī)選擇訓(xùn)練集的80%,建立CSVM 模型,并利用該模型在其余20%的訓(xùn)練集上的驗(yàn)證結(jié)果計(jì)算Fβ,以此來評(píng)估和選擇最優(yōu)模型。CSVM模型訓(xùn)練完成后,通過預(yù)留的測試集測試模型,評(píng)估該模型。將5 次的結(jié)果進(jìn)行平均,作為最終測試結(jié)果。
1.2.5 算法評(píng)估標(biāo)準(zhǔn)
通過比較本文算法對(duì)癲癇發(fā)作期、非發(fā)作期的檢測結(jié)果與醫(yī)生所做標(biāo)記的差別,將每個(gè)患者的五次交叉驗(yàn)證的平均結(jié)果作為依據(jù),評(píng)估算法的性能。本文采用以下幾項(xiàng)指標(biāo)進(jìn)行評(píng)估,這些指標(biāo)定義如下[16-17]:
(1)準(zhǔn)確率(Accuracy)
(2)精確率(Precision)
(3)召回率(Recall)
(4)F2 值
經(jīng)過2 s 時(shí)間窗分割,所獲得的訓(xùn)練樣本的平均非發(fā)作期片段數(shù)為12 439,平均發(fā)作片段數(shù)為157,測試樣本的平均非發(fā)作期片段數(shù)為3 110,平均發(fā)作期片段數(shù)為39。經(jīng)實(shí)驗(yàn)發(fā)現(xiàn),如果降維時(shí)保留特征信息的數(shù)目為原特征數(shù)目的85%,可取得最優(yōu)結(jié)果,因此在PCA 的過程中,將主成分占比設(shè)置為85%。
10 位患者癲癇發(fā)作檢測的結(jié)果及平均值如表2 所示。通過五重交叉驗(yàn)證,得到10 位患者癲癇發(fā)作檢測的準(zhǔn)確率為98.60% ±2.49%,精確率為81.90%±16.67%,召回率為81.40%±14.16%,F(xiàn)2值為0.80±0.16。本方法的各項(xiàng)指標(biāo)都在較高的水平。
表2 不同癲癇患者使用AMBFC 方法的癲癇檢測結(jié)果Tab.2 Epilepsy test results of different epilepsy patients using the proposed AMBFC method
為了討論不同IMF 分量的腦電特征對(duì)檢測結(jié)果的影響,利用IMF1 ~4 的特征分別進(jìn)行CSVM 分類,并與AMBFC 算法得到的結(jié)果進(jìn)行比較。首先利用MEMD 分解得到IMF1~4,然后采用DTF 算法求出IMF1~4 的信息流出特征,進(jìn)行CSVM 分類,并與用AMBFC 進(jìn)行分類的結(jié)果進(jìn)行比較。僅針對(duì)患者1 進(jìn)行研究,將各IMF 分量的癲癇發(fā)作檢測結(jié)果與AMBFC 算法的檢測結(jié)果進(jìn)行比較。
基于準(zhǔn)確率、精確率、召回率、F2 值等4 項(xiàng)指標(biāo)的對(duì)比結(jié)果如圖2 所示。由圖可見,AMBFC 算法在保證高準(zhǔn)確率的情況下,在精確率、召回率和F2 值等指標(biāo)上也都達(dá)到了很高的水平,并且用AMBFC方法提取特征的各項(xiàng)指標(biāo)均高于用各IMF 分量提取特征的指標(biāo),說明了AMBFC 算法對(duì)于這些癲癇患者的分類結(jié)果相比于用各IMF 分量作特征提取和分類更具有優(yōu)勢(shì)。由于各IMF 分量的信號(hào)可以為癲癇檢測提供不同的有用信息,將這些信息聚集在一起可以為CSVM 分類提供更多癲癇發(fā)作信息交換特征,所以AMBFC 算法可以提升癲癇檢測的準(zhǔn)確率、精確率、召回率和F2 值。
圖2 用不同IMF 分量的特征進(jìn)行癲癇發(fā)作檢測結(jié)果對(duì)比圖Fig.2 Comparison of results of epileptic seizure detection using features of different IMFs
利用患者1 的隨機(jī)2 000 個(gè)非發(fā)作期樣本和30個(gè)發(fā)作期樣本,對(duì)不同IMF 分量的腦電信號(hào)進(jìn)行信息流特征提取,并利用t-SNE 降維[21]可視化。藍(lán)色的點(diǎn)表示非發(fā)作期樣本,紅色的點(diǎn)代表發(fā)作期樣本。其中,圖3 (a)為IMF1 分量的流出信息特征t-SNE 降維可視化的結(jié)果,圖3 (b)為IMF2 分量的流出信息特征t-SNE 降維可視化的結(jié)果,圖3 (c)為IMF3 分量的流出信息特征t-SNE 降維可視化的結(jié)果,圖3 (d)為IMF4 分量的流出信息特征t-SNE 降維可視化的結(jié)果,圖3 (e)為原信號(hào)和全部IMF 分量(即AMBFC 算法)的流出信息特征t-SNE 降維可視化的結(jié)果。
圖3 不同IMF 分量特征經(jīng)t-SNE 降維可視化結(jié)果。(a) IMF1;(b)IMF2;(c)IMF3;(d)IMF4;(e)AMBFC Fig.3 t-SNE dimension reduction visualization results of different IMF component characteristics. (a) IMF1;(b)IMF2;(c)IMF3;(d)IMF4;(e) AMBFC
可以看出,IMF1 ~4 分量的腦電信號(hào)提取出的特征經(jīng)過降維可視化之后,發(fā)作期和非發(fā)作期的樣本均有較高的重合性,視覺可分性不理想,而AMBFC 提取的特征視覺可分性要明顯優(yōu)于各IMF分量。這些可視化降維的結(jié)果與圖2 中各項(xiàng)指標(biāo)的分類結(jié)果一致。
為了更加客觀地對(duì)AMBFC 方法的癲癇發(fā)作檢測性能進(jìn)行評(píng)價(jià),選取DTF-CSVM 算法和近幾年文獻(xiàn)中報(bào)道的最新方法,用相同的數(shù)據(jù)集進(jìn)行模型的訓(xùn)練和測試。其中,DTF-CSVM 算法相較于AMBFC算法,直接采用DTF 提取特征[18],而未對(duì)腦電信號(hào)進(jìn)行MEMD 分解,即僅對(duì)原信號(hào)建立MVAR 模型,提取各通道腦電數(shù)據(jù)的信息流特征,隨后將特征進(jìn)行組合和CSVM 分類。AMBFC、DTF-CSVM 方法及與最新論文[19-20]]對(duì)比的結(jié)果如表3 所示。由表可見,相較于DTF-CSVM 和EWT 算法,AMBFC 算法在各項(xiàng)指標(biāo)上都取得了最優(yōu)結(jié)果,而相比于Fusion 算法,在除召回率之外的其他指標(biāo)上都取得了更優(yōu)結(jié)果,由于癲癇發(fā)作期和非發(fā)作期的樣本存在嚴(yán)重非均衡化的問題,需要同時(shí)評(píng)估其精確率和召回率,本研究將F2 值作為最主要的評(píng)判指標(biāo),基于此認(rèn)為AMBFC 算法相較于Fusion 算法結(jié)果更優(yōu)。
表3 使用不同方法的癲癇檢測結(jié)果對(duì)比Tab.3 Comparison of epilepsy detection results employing different methods
目前,腦電在癲癇的臨床診斷中已經(jīng)有較為廣泛的應(yīng)用。本研究針對(duì)長時(shí)程腦電癲癇發(fā)作檢測的問題,采用AMBFC 算法對(duì)采集的腦電信號(hào)進(jìn)行癲癇發(fā)作檢測。首先利用MEMD 算法對(duì)腦電進(jìn)行自適應(yīng)分解,再通過多變量自回歸模型計(jì)算有向傳遞函數(shù),建立多尺度的腦功能連接,從而提取不同腦區(qū)之間的信息流出強(qiáng)度,最后利用代價(jià)敏感支持向量機(jī)對(duì)發(fā)作期和非發(fā)作期的數(shù)據(jù)進(jìn)行分類,在準(zhǔn)確率、精確率、召回率和F2 值等4 項(xiàng)指標(biāo)上取得了較優(yōu)的結(jié)果,為長時(shí)程腦電中的癲癇檢測提供可行方案。
由于采集到的腦電信號(hào)具有多通道、非線性、非平穩(wěn)性的特點(diǎn),采用MEMD 算法對(duì)多通道數(shù)據(jù)進(jìn)行自適應(yīng)分解。MEMD 是一種數(shù)據(jù)驅(qū)動(dòng)的分解方法,可定位多變量、非平穩(wěn)、低信噪比的腦電信號(hào)的時(shí)頻信息,且具有較強(qiáng)的自適應(yīng)性,有助于在多個(gè)尺度上發(fā)現(xiàn)內(nèi)在模式,而不要求信號(hào)為諧波信號(hào)或平穩(wěn)信號(hào)[22-23]。本研究通過比較ABMFC 和DTFCSVM 算法,證實(shí)了MEMD 算法可以增強(qiáng)定位腦電信號(hào)的頻率信息的準(zhǔn)確性,從而提高了對(duì)發(fā)作期和非發(fā)作期腦電的識(shí)別能力。此外,通過比較AMBFC算法與不同IMF 分量的癲癇檢測結(jié)果,證明了相較于單個(gè)頻段的信息,不同頻段的信息的組合能夠?yàn)槟X電癲癇檢測提供更多有效信息。
癲癇發(fā)作時(shí),由于神經(jīng)元?jiǎng)幼麟娢话l(fā)放的同步性,多通道腦電之間的信息流強(qiáng)度與非發(fā)作時(shí)相比存在顯著差異[18],而利用基于格蘭杰因果的效應(yīng)性連接分析方法可以有效地衡量不同腦區(qū)之間的交互性連接[24],此前也有相關(guān)研究將DTF 算法應(yīng)用于癲癇發(fā)作的檢測和預(yù)測中[18,25]。因此,本研究利用DTF 算法做特征提取,提取不同腦電通道之間的流出信息,將此作為分類依據(jù)可以有效地區(qū)分發(fā)作期和非發(fā)作期的腦電信號(hào)。而且通過實(shí)驗(yàn)證明,利用PCA 降維保留原始特征數(shù)目的85%,可以達(dá)到更優(yōu)的分類結(jié)果,表明了原始的特征數(shù)目過多,可能造成了分類器的過擬合。
同時(shí),由于非發(fā)作期的樣本數(shù)量遠(yuǎn)遠(yuǎn)多于發(fā)作期的樣本數(shù)量,因此采用CSVM 進(jìn)行分類,可以使得不同樣本的誤分類具有不同的代價(jià)[14]。為了綜合考慮精確率和召回率,采用F2 值作為模型訓(xùn)練時(shí)的評(píng)估指標(biāo)。根據(jù)網(wǎng)格搜尋方法,確認(rèn)F2 值最高時(shí)懲罰因子C和懲罰因子調(diào)整系數(shù)w1 的取值,通常情況下參數(shù)w1 的取值大于1,表明相較于較多數(shù)量的非發(fā)作期樣本,CSVM 算法賦予了較少數(shù)量的發(fā)作期樣本更高的誤分類代價(jià),凸顯出準(zhǔn)確識(shí)別發(fā)作期的樣本的重要性,從而改善了樣本嚴(yán)重非均衡化帶來的問題。
本研究從自適應(yīng)多尺度腦功能連接的角度出發(fā),提取不同頻段腦區(qū)之間的信息流出強(qiáng)度,可有效區(qū)分發(fā)作期和非發(fā)作期的腦電,相較于傳統(tǒng)算法達(dá)到了更高的精確率和召回率,在與新近提出方法的比較中也體現(xiàn)出了一定的優(yōu)越性。但同時(shí)也具有一定的局限性,長期的頭皮腦電記錄中存在高頻肌電偽影,會(huì)對(duì)實(shí)驗(yàn)結(jié)果造成一定的影響,另外,將全部腦電通道的信息流出強(qiáng)度作為有效特征,而未進(jìn)行通道選擇,不能為癲癇病灶的定位提供有力依據(jù)。
本研究針對(duì)長時(shí)程腦電癲癇發(fā)作檢測的問題,提出一種新的基于自適應(yīng)多尺度腦功能連接的癲癇發(fā)作檢測方法。通過結(jié)合MEMD 算法和MVAR模型,對(duì)具有非平穩(wěn)特征的腦電信號(hào)提取流出信息強(qiáng)度,并進(jìn)行特征組合與PCA 特征降維,最后經(jīng)CSVM 分類區(qū)分發(fā)作期和非發(fā)作期腦電。本研究提出的算法在高準(zhǔn)確率的基礎(chǔ)上,達(dá)到了較高的精確率、召回率和F2 值,并具有一定優(yōu)越性,有望應(yīng)用于長時(shí)程腦電的實(shí)時(shí)監(jiān)測。