韋博軒,張冀聰
1. 北京航空航天大學(xué) a. 生物與醫(yī)學(xué)工程學(xué)院;b. 北京市生物醫(yī)學(xué)工程高精尖創(chuàng)新中心;c. 北京市大數(shù)據(jù)精準(zhǔn)醫(yī)療高精尖創(chuàng)新中心,北京 100191;2. 北京航空航天大學(xué) 合肥創(chuàng)新研究院,安徽 合肥 230012
癲癇是一種由于神經(jīng)細(xì)胞異常過度放電而導(dǎo)致的慢性腦部疾病,具有反復(fù)發(fā)作的特征[1]。癲癇患者常伴有無法控制的運(yùn)動(dòng)、意識(shí)喪失及暫時(shí)性混亂等癥狀,嚴(yán)重影響日常生活及工作,甚至威脅到患者的生命[2]。據(jù)癲癇基金會(huì)和世界衛(wèi)生組織調(diào)查顯示[3],目前全世界約有6500 萬人被診斷患有癲癇,240 萬人被發(fā)現(xiàn)有癲癇癥狀。
頭皮腦電圖(Electroencephalogram,EEG)和腦磁圖(Magnetoencephalogram,MEG)是臨床上用于記錄腦部相關(guān)活動(dòng)的無創(chuàng)信號(hào)采集手段[4],具有優(yōu)異的時(shí)間分辨率(EEG和MEG 信號(hào)均來自相同的神經(jīng)生理過程,但MEG 信號(hào)失真較少,且較EEG 信號(hào)而言具有更高的空間分辨率[5]),在癲癇的診斷、治療、療效評(píng)估及機(jī)理研究領(lǐng)域發(fā)揮著重要的作用[4-7]。大量研究顯示,近80%的癲癇患者在癲癇間隙期會(huì)伴有神經(jīng)元的異常放電,在EEG 及MEG 中的波形表現(xiàn)主要有棘波、尖波、棘慢及尖慢復(fù)合波等[8-9]。臨床上,通常選擇提取癲癇發(fā)作間期的癇樣棘波和尖波,并通過定量分析獲取癲癇相關(guān)的病理信息。此外,基于EEG 及MEG 的源定位方法在癲癇患者的術(shù)前評(píng)估及預(yù)后中起到關(guān)鍵性的作用[10],而在這之中,棘波和尖波的檢測是源定位的第一步。
目前臨床上,視覺檢測和手動(dòng)注釋被看作是棘波和尖波檢測的“金標(biāo)準(zhǔn)”,然而大量繁瑣而冗余的工作給專業(yè)人員帶來沉重的負(fù)擔(dān),且其檢測的準(zhǔn)確性過度依賴于檢查者的主觀判斷,因此,設(shè)計(jì)實(shí)現(xiàn)用于EEG 及MEG 信號(hào)解釋的自動(dòng)化系統(tǒng)意義重大。
本文關(guān)注的是EEG 和MEG 信號(hào)中棘波和尖波的自動(dòng)檢測,需要注意以下三點(diǎn):首先,雖然臨床中對(duì)棘波和尖波的定義有所不同,但在棘波和尖波的自動(dòng)識(shí)別領(lǐng)域,將二者統(tǒng)稱為癲癇瞬變現(xiàn)象或統(tǒng)稱為棘波,因此下文將以棘波代指棘波和尖波的集合;其次,兩類信號(hào)均具有多通道特性,因此棘波檢測可在單通道或多通道上進(jìn)行;最后,棘波被認(rèn)為是信號(hào)的異常段,因此大多數(shù)異常檢測技術(shù)均可用于EEG 及MGE 信號(hào)中棘波的檢測,盡管該領(lǐng)域的大部分工作都致力于EEG 棘波檢測,但經(jīng)過一些修改后,同樣可以擴(kuò)展應(yīng)用于MEG 棘波檢測中。
本文結(jié)構(gòu)如下,第一節(jié)主要描述EEG 及MEG 信號(hào)中棘波的波形特征;第二節(jié)介紹通過設(shè)計(jì)特征工程實(shí)現(xiàn)棘波檢測的相關(guān)算法;第三節(jié)討論當(dāng)前工作的結(jié)果并展望棘波檢測算法的未來發(fā)展方向。
由于EEG 和MEG 信號(hào)均來自相同的神經(jīng)生理過程,因此本文以10~20 系統(tǒng)記錄的EEG 為例簡要介紹棘波特征。棘波是大腦皮層神經(jīng)細(xì)胞異常放電在EEG 信號(hào)中引起的波形變化,表現(xiàn)為由皮質(zhì)表面定向引起的表面負(fù)偏斜,上升支和下降支陡峭,整體形狀如同荊棘的尖刺,是EEG 信號(hào)中癇樣放電的典型特征之一。棘波的周期通常為20~70 ms,突出于背景信號(hào),幅度大于20 μV,為背景信號(hào)的1.5 倍以上[11-13]。
受棘波上述特性及檢測方式等因素的影響,自動(dòng)棘波檢測面臨以下挑戰(zhàn):① 由于人與人之間存在的個(gè)體化差異,導(dǎo)致棘波的表現(xiàn)形式各異,很難通過簡單的一致性方法自動(dòng)檢測EEG 及MEG 信號(hào)中存在的棘波;② 由于信號(hào)測量過程中不可避免地存在心跳、眼動(dòng)、肌肉運(yùn)動(dòng)等因素造成的偽差,對(duì)棘波自動(dòng)檢測的準(zhǔn)確率影響較大;③ 相對(duì)于完全放電的棘波,不完全放電的棘波波形特征不夠明顯,進(jìn)一步提高了自動(dòng)檢測的困難。
1972 年,Stevens 等[14]首次嘗試從長時(shí)程的EEG 信號(hào)中提取癇樣棘波,開啟了學(xué)界對(duì)棘波自動(dòng)檢測的研究。自此之后,依據(jù)癇樣棘波的特性,產(chǎn)生了諸多不同角度的棘波檢測算法,包括基于形態(tài)學(xué)[15-17]、信號(hào)相關(guān)性[18-21]、子帶分解[22-23]以及特征工程相關(guān)[24-31]等方向。由于篇幅有限,本文僅對(duì)基于機(jī)器學(xué)習(xí)的相關(guān)方法進(jìn)行介紹。傳統(tǒng)基于機(jī)器學(xué)習(xí)的棘波檢測算法通常分為以下三步,首先是對(duì)EEG/MEG信號(hào)的預(yù)處理,以此來提高信號(hào)的信噪比,為棘波的自動(dòng)檢測提供高質(zhì)量的純凈信號(hào);其次是根據(jù)棘波的特點(diǎn),人工設(shè)計(jì)特征工程,降低信號(hào)維度的同時(shí),突出棘波與背景信號(hào)的差異;最后是根據(jù)得到的特征,進(jìn)行EEG/MEG 信號(hào)中棘波與背景信號(hào)的二分類,實(shí)現(xiàn)EEG/MEG 信號(hào)中棘波信號(hào)的檢出。除此之外,近年來發(fā)展迅猛的深度學(xué)習(xí),作為機(jī)器學(xué)習(xí)中的一類方法,巧妙的結(jié)合的了傳統(tǒng)機(jī)器學(xué)習(xí)算法中特征提取與分類兩個(gè)步驟,為基于機(jī)器學(xué)習(xí)的EEG/MEG 信號(hào)棘波檢測算法提供了新的思路。本文分別從傳統(tǒng)機(jī)器學(xué)習(xí)算法及深度學(xué)習(xí)算法兩個(gè)方面回顧了近10 年來機(jī)器學(xué)習(xí)相關(guān)的棘波檢測算法。
基于傳統(tǒng)機(jī)器學(xué)習(xí)算法的棘波檢測檢測模型中,濾波算法被用于信號(hào)預(yù)處理,以實(shí)現(xiàn)干擾信號(hào)濾除、信號(hào)某部分細(xì)節(jié)的增強(qiáng)或是趨勢(shì)消除,棘波檢測算法中較為簡單的一類正是利用了濾波器可增強(qiáng)信號(hào)某部分細(xì)節(jié)的能力,例如Oikonomou 等[24]提出一種基于卡爾曼濾波的方法,在預(yù)處理階段增強(qiáng)EEG 信號(hào)的信噪比,從而提高棘波的檢出率。由于神經(jīng)細(xì)胞外EEG采集時(shí)環(huán)境、設(shè)備等因素的影響,信號(hào)中不可避免的混雜了來自多個(gè)噪聲源的噪聲,Azami 等[25]基于這一情況,分別使用了基于分形維數(shù)、平滑非線性能量算子及標(biāo)準(zhǔn)差的方法構(gòu)建了三種不同的模型用于檢測含噪信號(hào)中的棘波。
特征提取通過將原始信號(hào)轉(zhuǎn)化為一組具有明顯物理意義或統(tǒng)計(jì)意義的屬性,實(shí)現(xiàn)了對(duì)信號(hào)降維的同時(shí)突出分類目標(biāo)間的差異,因此有學(xué)者根據(jù)棘波與背景信號(hào)的差異,設(shè)計(jì)特征工程,提高傳統(tǒng)機(jī)器學(xué)習(xí)算法的棘波檢測準(zhǔn)確率。例如Keshri 等[26]基于確定有限狀態(tài)自動(dòng)機(jī)(Deterministic Finite Automata,DFA)提出了一種名為DFAspike 的棘波檢測模型。該模型通過掃描EEG 信號(hào)的振幅、斜率及周期,將其轉(zhuǎn)換為{-1, 0, 1}組成的符號(hào)序列,并根據(jù)一段時(shí)間內(nèi)序列變化的方向及劇烈程度控制狀態(tài)轉(zhuǎn)換,最終識(shí)別棘波的開始、終止時(shí)刻及平均出現(xiàn)頻率。文中,作者采用了13 種狀態(tài)生成的轉(zhuǎn)換圖來描述EEG 信號(hào)的可能情況,并最終在植入式電極測得的大鼠EEG 信號(hào)中達(dá)到了99.13%的棘波檢出率。Fürbass 等[27]根據(jù)重癥監(jiān)護(hù)腦電圖術(shù)語(Critical Care EEG Terminology,CCET)提出了一種計(jì)算多通道EEG 信號(hào)的節(jié)律和周期模式的方法,以此來實(shí)現(xiàn)EEG 信號(hào)棘波的檢出。
機(jī)器學(xué)習(xí)是一類由數(shù)據(jù)驅(qū)動(dòng)的建模方法,旨在通過數(shù)據(jù)樣本的學(xué)習(xí),挖掘EEG 及MEG 信號(hào)中棘波與背景信號(hào)的差異信息,自動(dòng)生成二者的分類模型。Khalid 等[21]開發(fā)了一種用于檢測癲癇患者M(jìn)EG 信號(hào)棘波的分類模型。該模型中,作者以共空間模式(Common Spatial Patterns,CSPs)技術(shù)提取MEG 信號(hào)特征,并利用線性判別分析(Linear Discriminant Analysis,LDA)算法構(gòu)建分類器,實(shí)現(xiàn)對(duì)棘波及背景信號(hào)的二分類,并在20 例癲癇患者的MEG 信號(hào)中取得了91.03%的靈敏度和94.21%的特異性。Anh-Dao 等[28]提出了包含預(yù)處理、特征提取、分類以及專家系統(tǒng)在內(nèi)的四個(gè)模塊構(gòu)成的棘波檢測模型。模型中,作者在預(yù)處理階段提出六個(gè)用于描述棘波形態(tài)的特征,將特征兩兩組合后利用三類感知器輸出結(jié)果并進(jìn)行融合決策,初步對(duì)輸入特征所屬的信號(hào)進(jìn)行二分類,即非棘波和疑似棘波;接著利用連續(xù)小波變化提取上一步分類結(jié)果中疑似棘波的特征,并輸入構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)進(jìn)行進(jìn)一步細(xì)分,確定該段信號(hào)是否輸入棘波;最后利用EEG 信號(hào)的空間及時(shí)間背景信息構(gòu)建專家系統(tǒng),對(duì)神經(jīng)網(wǎng)絡(luò)輸出的棘波進(jìn)行最終判定。經(jīng)實(shí)驗(yàn)驗(yàn)證,該方法在17 位癲癇患者的頭皮EEG 數(shù)據(jù)集上獲得了94.5%的準(zhǔn)確率。
自2006 年以來,隨著深度學(xué)習(xí)技術(shù)持續(xù)升溫,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)已成為當(dāng)下諸多領(lǐng)域研究的熱點(diǎn),并在圖像識(shí)別、語音識(shí)別等領(lǐng)域獲得矚目的成果[29-32]。此外,最近的腦電圖及腦磁圖的研究也在某種程度上使用了深度學(xué)習(xí)。例如,卷積神經(jīng)元網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是第一個(gè)應(yīng)用于腦電圖癲癇發(fā)作預(yù)測的深度學(xué)習(xí)模型[33];文獻(xiàn)[34-36]在腦電數(shù)據(jù)上使用另一種稱為深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)的深度學(xué)習(xí)模型分別用于癲癇、不同睡眠狀態(tài)以及情緒識(shí)別的臨界頻帶相關(guān)的異常。除此之外,其他深度學(xué)習(xí)模型也被用于探索復(fù)雜的任務(wù),如發(fā)現(xiàn)大腦結(jié)構(gòu)[37];使用包括CNN、線性支持向量機(jī)和卷積自動(dòng)編碼器在內(nèi)的三種深度模型學(xué)習(xí)腦電波的特征[38];使用多通道DBN 分類腦電圖數(shù)據(jù)[39]。
深度學(xué)習(xí)在EEG 及MEG 棘波檢測算法中的應(yīng)用還在初步階段,未見大量報(bào)道。例如Johansen 等[40]基于CNN 建立了一種棘波檢測模型。模型中,作者利用高通濾波器+陷波器的組合實(shí)現(xiàn)數(shù)據(jù)的預(yù)處理,并利用共同平均算法消除數(shù)據(jù)中存在的偽跡,之后以Relu 為激活函數(shù),最小化二項(xiàng)式交叉熵為損失函數(shù)構(gòu)建了深度為5 層的1 維卷積神經(jīng)網(wǎng)絡(luò),最后使用留一法在五名癲癇患者的腦電數(shù)據(jù)集中進(jìn)行交叉驗(yàn)證,取得了94.7%的準(zhǔn)確率。Van 等[41]將DBN 由生成模型改為判別模型,并以此建立了EEG 信號(hào)的棘波檢測模型。模型中,作者設(shè)計(jì)特征工程,提取7 個(gè)用于描述信號(hào)周期、振幅、坡度及面積的時(shí)域特征,并利用小波變換分別從EEG 信號(hào)的Theta、Alpha、Beta 頻段中提取280 個(gè)時(shí)頻域特征構(gòu)建特征向量,作為DBN 模型的輸入。經(jīng)實(shí)驗(yàn)驗(yàn)證,模型在具有19例癲癇患者的數(shù)據(jù)集上取得了95.97%的準(zhǔn)確率。雖然利用深度學(xué)習(xí)進(jìn)行棘波檢測的相關(guān)研究還很少,但上述種種算法的成功應(yīng)用也為基于機(jī)器學(xué)習(xí)的EEG 及MEG 信號(hào)棘波檢測驗(yàn)證了可能性并提出了進(jìn)一步發(fā)展的方向。
本文概述了近10 年來圍繞特征工程進(jìn)行的一些癇樣棘波檢測方法。不難看出,雖然大部分算法均在研究人員自己的數(shù)據(jù)庫中取得了良好的效果,但是由于數(shù)據(jù)標(biāo)準(zhǔn)、采集環(huán)境、樣本分布等因素的差異,算法間仍難以實(shí)現(xiàn)綜合的評(píng)估和比較。另一方面,由于各個(gè)數(shù)據(jù)集樣本量的限制,大多數(shù)算法均選擇將單個(gè)患者采得的信號(hào)按時(shí)間窗分段,然后隨機(jī)抽取其中的部分段形成訓(xùn)練集,在該部分?jǐn)?shù)據(jù)中分析總結(jié)波幅、周期等具有物理意義或統(tǒng)計(jì)學(xué)意義的特征,并將設(shè)計(jì)形成的棘波檢測模型放在另一部分樣本形成的測試集上驗(yàn)證算法效果,雖然大部分算法都在測試集上獲得了較高的準(zhǔn)確率,但是由于訓(xùn)練集和測試集數(shù)據(jù)中人群分布的局限以及背景數(shù)據(jù)的重復(fù),算法的魯棒性及穩(wěn)定性未能得到充分驗(yàn)證。因此,建立具有統(tǒng)一標(biāo)準(zhǔn)的大規(guī)模癇樣棘波公開數(shù)據(jù)集,并依托其生成一套人群內(nèi)及跨人群的評(píng)估方案以精確衡量算法效率和魯棒性,是當(dāng)下實(shí)現(xiàn)可靠的自動(dòng)棘波檢測系統(tǒng)的迫切需求。
此外,相比于傳統(tǒng)“預(yù)處理-特征分析-分類”三步彼此獨(dú)立的方法,基于深度學(xué)習(xí)的棘波檢測算法獨(dú)具特色:① DNN 作為一種數(shù)據(jù)驅(qū)動(dòng)的建模方法,其無監(jiān)督與有監(jiān)督學(xué)習(xí)結(jié)合的學(xué)習(xí)模式,克服了傳統(tǒng)方法孤立對(duì)待特征分析與學(xué)習(xí)的缺點(diǎn),能夠自適應(yīng)地學(xué)習(xí)數(shù)據(jù)特征;② 其具有的多層非線性映射結(jié)構(gòu)能夠表征特征之間的交互及層次結(jié)構(gòu),從而發(fā)現(xiàn)底層特征之間的深層聯(lián)系;③ DNN 的多層網(wǎng)絡(luò)結(jié)構(gòu)在面對(duì)海量EEG 及MEG 數(shù)據(jù)時(shí)具有比傳統(tǒng)模型更強(qiáng)的表達(dá)能力,且能夠避免傳統(tǒng)模型構(gòu)建特征工程時(shí)對(duì)數(shù)據(jù)包含信息的損傷。然而,相比于人工設(shè)計(jì)的特征工程,深度學(xué)習(xí)算法中特征可解釋性差的弊端嚴(yán)重限制了該類方法在棘波檢測領(lǐng)域中的發(fā)展和應(yīng)用。因此,綜合不同種類方法的特點(diǎn),形成機(jī)理模型與數(shù)據(jù)驅(qū)動(dòng)模型相結(jié)合的棘波檢測模型,將會(huì)是下一步的發(fā)展趨勢(shì)。