楊澤鑫 朱曉軍
(太原理工大學(xué)信息與計算機學(xué)院 山西 太原 030024)
癲癇(epilepsy)是一種精神類疾病,因其反復(fù)發(fā)作的特性,被認為是常見慢性病的一種。據(jù)世衛(wèi)組織統(tǒng)計,全世界的癲癇癥患者約為5 000萬[1]。因此需要構(gòu)建靈敏度高、誤診率低的癲癇發(fā)作檢測算法,從而為患者個人及其家人提供預(yù)測癲癇發(fā)作的有效手段。起初對于癲癇發(fā)作預(yù)測的研究以對腦電圖(Electroencephalogram,EEG)進行手工特征提取結(jié)合傳統(tǒng)分類器來完成[2-3]。而隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)為代表的方法也被陸續(xù)運用在癲癇腦電的特征提取與發(fā)作預(yù)測中。
文獻[4]使用改進的Lyapunov指數(shù)作為腦電片段的特征輸入到人工神經(jīng)網(wǎng)絡(luò)進行分類,相比原始最大Lyapunov指數(shù)在識別發(fā)作前期狀態(tài)上具有更高的準確性。文獻[5]使用卷積神經(jīng)網(wǎng)絡(luò)對多通道EEG進行直接分類,相比手工特征方法在特異性上有明顯提升。文獻[6]使用四種不同組合的深度學(xué)習(xí)模型提取癲癇發(fā)作區(qū)分度最高的特征,并通過遷移學(xué)習(xí)改善模型的學(xué)習(xí)效率。
基于人工特征的分析方法人為對信息進行壓縮,損失部分特征。而普通的CNN往往直接對腦電信號進行處理,忽略了腦電信號本身的特點,計算效率在層數(shù)提升時遭遇瓶頸。本文提出集成抗鋸齒濾波器和多尺度卷積單元的卷積-循環(huán)神經(jīng)網(wǎng)絡(luò)模型,在維持平移不變性的基礎(chǔ)上,以深層結(jié)構(gòu)對腦電信號的空域、頻域和時域信息進行有效提取,克服傳統(tǒng)深度學(xué)習(xí)在信號處理和計算效率上的問題。
癲癇癥患者的腦電記錄可按癲癇發(fā)作分為兩部分,癲癇發(fā)作間期和癲癇的發(fā)作期(Seizure Occurrence Period,SOP)。癲癇發(fā)作間期為患者的正常時期,癲癇發(fā)作期為患者表現(xiàn)出癲癇癥的時期。癲癇預(yù)測算法的目標是在癲癇發(fā)作前的一個時間段內(nèi)做出癲癇將要發(fā)作的判斷,此時間段稱之為癲癇預(yù)測范圍(Seizure Prediction Horizon,SPH)。有效合理的SPH應(yīng)滿足一些條件:(1) SPH應(yīng)與SOP間有足夠長的間隔,以便醫(yī)生、患者有足夠的時間采取措施抑制癲癇的發(fā)作;(2) 做出預(yù)測的時刻距SOP開始的時刻不宜過長。過長的間隔在帶給患者不必要恐慌的同時,也給預(yù)測造成了比較多的困難。通過閱讀相關(guān)的文獻,本文劃定SPH的范圍是從癲癇正式發(fā)作的30分鐘前開始,到癲癇正式發(fā)作5分鐘前為止的時間,如圖1所示。
圖1 癲癇不同階段狀態(tài)圖
癲癇發(fā)作預(yù)測涉及的腦電片段分為三類:第一類為發(fā)作間期,因為后續(xù)無癲癇發(fā)作的傾向所以作為數(shù)據(jù)集中的陰性樣本;第二類為發(fā)作期前30分鐘到5分鐘,屬于發(fā)作預(yù)警產(chǎn)生的合理時間,被視為陽性樣本;最后一類是SOP前5分鐘到癲癇發(fā)作開始的時刻這段時間。雖然該時段屬于癲癇發(fā)作前的時間范圍,但與癲癇發(fā)作距離過近,無實際使用價值。本文將癲癇的預(yù)測問題轉(zhuǎn)化為分類問題,當(dāng)判斷輸入片段屬于SPH階段時則作出癲癇發(fā)作預(yù)警,表明該患者在30分鐘內(nèi)會出現(xiàn)癲癇發(fā)作。
為了利用腦電信號中包含的空間狀態(tài)信息,本文使用Bashivan等[7]提出的等距空間投影方法,通過將多通道腦電信號轉(zhuǎn)化為二維圖像數(shù)據(jù)以使神劇集成網(wǎng)絡(luò)可以有效利用空間信息。方法的第一步是將探測電極的三維坐標投影到2D平面上。以大腦頭皮頂端作為中心位置,根據(jù)到中心點的距離和方位角,計算出電極在二維平面上對應(yīng)位置坐標;第二個步驟是將輸入信號中的不同頻段(0-7、7014、14-49赫茲)的頻域特征映射到RGB的3個通道中為投影值;最后使用三次插值對每個電極在三個頻帶段上的投影值進行插值以生成完整圖像。執(zhí)行完上述操作后,輸入的腦電信號將轉(zhuǎn)化為形如(3×256×256)的圖像。圖像的3個顏色通道分對應(yīng)三個頻段(每個頻帶1個),圖片的高度和寬度均為256像素。部分投影后的腦電圖像如圖2所示。
圖2 腦電信號轉(zhuǎn)化圖片示意
傳統(tǒng)的卷積網(wǎng)絡(luò)在處理腦電數(shù)據(jù)時存在兩方面的問題。一方面卷積層中的下采樣造成模型平移不變性的損失;另一方面深度神經(jīng)網(wǎng)絡(luò)的計算效率不高。針對上述的問題,本文提出使用結(jié)合模糊池化、模糊卷積和多尺度并行卷積結(jié)構(gòu)的空頻特征提取器,減輕平移不變性的損失,在增加模型深度的同時減少計算量的開銷,使模型對腦電信號擁有更好的適配性。
經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)是受人類視覺機理啟發(fā)從而構(gòu)建出的深度神經(jīng)網(wǎng)絡(luò)模型。已有大量的相關(guān)文獻和綜述表明CNN在醫(yī)療診斷相關(guān)的計算機視覺任務(wù)上能取得良好的效果[8-9]。搭配有卷積層和池化層的結(jié)構(gòu)有能力自發(fā)從圖形數(shù)據(jù)上抽取出決定分類的關(guān)鍵特征。
在圖像處理任務(wù)中,二維卷積網(wǎng)絡(luò)由一系列的非線性單元組成,整個網(wǎng)絡(luò)的狀態(tài)方程由式(1)描述。
Bj-i(uj(t))+Ii(t)
(1)
對于每個單元i的相關(guān)的狀態(tài)xi(t)會受到每個單元輸出的yj(t)的影響,而每個單元的輸入將通過函數(shù)Aj-i進行處理,Bj-i則代表模型的偏差量。
1.3.1模糊卷積與模糊池化
在池化層和跨步卷積層中的下采樣操作對模型的平移不變性造成影響。本文提出使用抗鋸齒過濾器對輸入數(shù)據(jù)進行平滑,減少平移不變性的損失,增強網(wǎng)絡(luò)的捕獲腦電特征的能力。
(1) 最大池化轉(zhuǎn)換為模糊池化(BlurPooling)。考慮一組一維信號如[0,0,1,1,0,0,1,1]。當(dāng)將池化窗口設(shè)置為尺寸等于2、步長等于2的狀態(tài)時,原始信號經(jīng)過最大池化層將得到[0,1,0,1]的序列。待元數(shù)據(jù)進行一次右移,以循環(huán)數(shù)據(jù)的形式補齊后得到如[1,0,0,1,1,0,0,1]的信號序列。當(dāng)此信號再次通過最大池化層,將得到[1,1,1,1]的結(jié)果。對比兩次的結(jié)果可知,傳統(tǒng)的最大池化層會造成平移不變性的損失。
從原理角度上看,最大池化層執(zhí)行的計算分為兩個部分,一部分是窗口尺寸為2,步長為1的求最大值操作;另一部分是步長為2的下采樣操作。求取最大值的操作保持著平移不變性,因為計算流程只是單純隨著滑動窗口求取最大值,不改變數(shù)據(jù)本身的分布性質(zhì)。但是下采樣對數(shù)據(jù)的選擇給模型帶來平移不變性的損失。為了緩解因直接下采樣帶來的問題,創(chuàng)新地提出在下采樣操作和最大池化操作中加入一個抗鋸齒濾波器以構(gòu)成模糊池化層。將平移前后的數(shù)據(jù)再輸入到模糊結(jié)構(gòu)后,將分別得到[0.5,1.0.5,1]和[0.75,0.75,0.75,0.75]的兩組結(jié)果。與原結(jié)果對比后可以看出,抗鋸齒濾波器彌合了輸入數(shù)據(jù)平移所帶來的影響,讓得到的兩組結(jié)果彼此相近,且都可以更好地代表原始的數(shù)據(jù)。
(2) 跨步卷積轉(zhuǎn)化為模糊卷積(BlurConv)。因為跨步卷積在計算過程中同樣涉及下采樣操作,會導(dǎo)致平移不變性的丟失。故采取相同的解決方式即加入抗鋸齒濾波器對計算結(jié)果進行平滑處理。
通過將模糊池化與模糊卷積引入到空/頻域特征提取器,有效保證了模型的平移不變性,進一步完善模型捕捉腦電信號中空間特征的能力。
1.3.2并行卷積模塊
在深度神經(jīng)網(wǎng)絡(luò)的設(shè)計建模中,將多層卷積和池化進行縱向?qū)訑?shù)疊加是提高網(wǎng)絡(luò)特征提取能力的有效方法。但在實際中受限于計算機的處理性能以及深度網(wǎng)絡(luò)容易造成梯度消失的問題,簡單的堆疊層數(shù)不是最優(yōu)的選擇。為了在網(wǎng)絡(luò)深度和計算性能達到平衡,本文在卷積特征提取器的深層部分使用多尺度并行卷積結(jié)構(gòu),將傳統(tǒng)的多層深度網(wǎng)絡(luò)結(jié)構(gòu)進行解耦,解決了深度網(wǎng)絡(luò)帶來的計算爆炸和梯度消失的問題,增加腦電空頻特征的獲取能力。
依據(jù)計算圖理論,擴大網(wǎng)絡(luò)的規(guī)模是改善深度卷積神經(jīng)網(wǎng)絡(luò)性能的有效方法。網(wǎng)絡(luò)的擴大包括增加網(wǎng)絡(luò)的深度(層數(shù))和增加單層網(wǎng)絡(luò)中過濾器的尺寸。這種解決方案有兩個主要缺點:大尺寸的過濾器需要計算大量參數(shù),會使得網(wǎng)絡(luò)更容易過擬合,在不平衡的數(shù)據(jù)集如腦電數(shù)據(jù)集中表現(xiàn)尤為明顯;直接擴展網(wǎng)絡(luò)規(guī)模大小的另一個缺點是計算量的急劇增加。例如,在深度卷積網(wǎng)絡(luò)中,如果存在卷積層相連的情況,則前一層濾波器的任何線性增加都會導(dǎo)致總計算量以平方的速度增加。實際中計算能力是有限的。因此擴展網(wǎng)絡(luò)的大小要根據(jù)目標進行合理設(shè)計,實現(xiàn)計算資源的有效分配。
根據(jù)這一思路,結(jié)合集成學(xué)習(xí)中Stacking[10]的思想,本文提出在空頻特征提取器的后半部分使用多尺度并行卷積模塊,使數(shù)據(jù)同時通過不同尺寸的卷積過濾器,增加模型規(guī)模的同時保持對計算資源的有效利用。并行卷積架構(gòu)通過逼近視覺網(wǎng)絡(luò)的稀疏結(jié)構(gòu)對復(fù)雜網(wǎng)絡(luò)拓撲構(gòu)造算法的假設(shè)輸出進行有效評估,在定位和對象檢測[11]中效果顯著。
并行卷積體系結(jié)構(gòu)的主要思想是利用多尺度的卷積窗口對數(shù)據(jù)進行并行處理,在保證覆蓋率的情況下,減少因網(wǎng)絡(luò)層次縱向堆疊而激增的計算量。網(wǎng)絡(luò)架構(gòu)的平移不變性因為BlurPooling和BlurConv得以維持,因此僅需找到適合的并行卷積模塊組成方法并在網(wǎng)絡(luò)中予以重復(fù)即可。為了實現(xiàn)計算的并行化,將每一層的輸入分別發(fā)送到不同尺寸的卷積核中進行處理,同時在原始數(shù)據(jù)上進行不同大小的padding以保證輸出尺寸的統(tǒng)一,最后再將各個輸出進行通道合并。合并后的內(nèi)容作為并行卷積模塊的輸出,并與下一層的輸入層相連。本文所采用的多尺度并行卷積體模塊包含尺寸為1×1、3×3和5×5的過濾器,并分別對后兩種過濾器搭配大小為1和2的循環(huán)padding以完成數(shù)據(jù)對齊。多尺度并行卷積模塊基礎(chǔ)結(jié)構(gòu)如圖3所示。
圖3 并行卷積模塊基礎(chǔ)結(jié)構(gòu)
通過在算法層面的并行化設(shè)計,可以使得算法的運行速度獲得一定程度上的提高。但不難看出,如果對輸入的數(shù)據(jù)不進行任何處理,并行的多個卷積過濾器產(chǎn)生的規(guī)模與按順序進行計算而形成的規(guī)模是一致的:每一尺度的過濾器的層數(shù)f等于輸入數(shù)據(jù)所包含的通道數(shù)c×本層輸出的通道數(shù)o。因此模型在通過并行架構(gòu)后的總通道數(shù)L1如下:
L1=f1+f2+f3+f4
c×(o1+o2+o3)+f4
(2)
其中池化層不改變原始輸入,所以f4無法進行合并。從式(2)可以看出,一個降低計算量的方法是減少輸入到每個卷積核數(shù)據(jù)量的大小。具體到結(jié)構(gòu)上就是在計算量增加顯著的3×3和5×5的卷積過濾器之前使用1×1的卷積過濾器來降低輸入數(shù)據(jù)的通道數(shù)以減小計算量,如圖4所示。
圖4 改進的并行卷積架構(gòu)
綜上所述,本文提出將模糊結(jié)構(gòu)與并行結(jié)構(gòu)由淺及深地集成到卷積神經(jīng)網(wǎng)絡(luò)模型中從而構(gòu)成空頻特征提取器來對輸入圖像中的頻率特征和空間特征進行抽取。相比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型,本文的模型在性能上和腦電數(shù)據(jù)處理上都有比較好的表現(xiàn),空頻特征提取器的結(jié)構(gòu)如圖5所示。
圖5 卷積特征提取器架構(gòu)
為了發(fā)掘腦電信號內(nèi)部的時間特征,本文采用長短期記憶神經(jīng)網(wǎng)絡(luò)(Long short-term memory,LSTM)對腦電數(shù)據(jù)進行分析。LSTM以序列的形式接受輸入x=(x1,x2,…,xT),以此計算隱藏的向量序列h=(h1,h2,…,hT),通過在時刻1到時刻T的時間段內(nèi)迭代式(3)和式(4),產(chǎn)生相應(yīng)的輸出y=(y1,y2,…,yT)。
ht=H(wxh+wbhht-1+bn)
(3)
yt=Whyht+by
(4)
式中:W表示權(quán)重系數(shù)矩陣;b表示偏差;H(·)代表隱藏層函數(shù)。
LSTM的一個計算單元包括內(nèi)部存儲器和門控輸入/輸出的存儲單元,這些輸入/輸出在捕獲長期依存關(guān)系方面比經(jīng)典循環(huán)神經(jīng)網(wǎng)絡(luò)存在更高的效率。LSTM的隱藏層函數(shù)由式(5)方程組計算。
it=σ(Wxixt+Whxht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=ottanh(ct)
(5)
式中:ht-1表示上一時刻單元的輸出,xt標識當(dāng)前單元的輸入,σ為sigmod函數(shù)。
計算遺忘向量ft和輸入門向量it,而后將所得取正切值,存于細胞信息ct中,最后計算輸出門向量ot和隱藏層ht。
鑒于人腦神經(jīng)活動的動態(tài)性,LSTM可以對大腦活動的時間演變規(guī)律進行合理建模。作為混沌系統(tǒng)大腦其狀態(tài)之間的轉(zhuǎn)化過程復(fù)雜多變,因此目標事件的發(fā)生不僅取決于大腦的歷史狀態(tài),也與其未來的狀態(tài)存在關(guān)聯(lián)。為了更好挖掘時間片段中的關(guān)聯(lián)關(guān)系,本文采用雙向LSTM挖掘腦電數(shù)據(jù)的事件關(guān)系,其結(jié)構(gòu)如圖6所示。
圖6 雙向LSTM計算架構(gòu)
雙向LSTM由兩列互不關(guān)聯(lián)的LSTM單元組成:第一列LSTM單元按時間順序處理序列,而第二列單位按相反的時間順序處理序列。雙向LSTM的設(shè)計思路與之前分析相同,臨床上神經(jīng)科醫(yī)生在對特定的窗口進行分類時,常參考過去和將來的窗口。任意的輸出與之前和之后的狀態(tài)同時有關(guān),這與自動發(fā)作檢測的邏輯相符。
波士頓麻省理工學(xué)院附屬兒童醫(yī)院發(fā)布數(shù)據(jù)集(CHB-MIT)[12]是現(xiàn)有最大的免費可用數(shù)據(jù)集之一。相關(guān)學(xué)者在該數(shù)據(jù)集進行了大量工作[13-14]。本數(shù)據(jù)集共涉及23例患者,分為24組(患者chb03有2組記錄,相隔1.5年)。該數(shù)據(jù)集由969小時頭皮腦電圖記錄所構(gòu)成,其中包含由專業(yè)醫(yī)師劃分的173次癲癇發(fā)作數(shù)據(jù)。數(shù)據(jù)集中存在各種類型的癲癇發(fā)作(陣攣性、腦全區(qū)性、強直性)。數(shù)據(jù)集中包含多種類型的患者和不同類型的癲癇發(fā)作使訓(xùn)練出的模型更具有普適性,同時可以提高模型的泛化能力。
本文的研究目標是檢測輸入到模型中的腦電信號是否屬于癲癇發(fā)作前的SPH階段。因此對數(shù)據(jù)集進行一定形式的預(yù)處理:將癲癇發(fā)作的時間段去除,同時截取出癲癇發(fā)作前30 min到前5 min作為目標片段(陽性片段),而其余部分為正常片段(陰性片段)。對于兩部分的片段,以30 s作為時間窗口,5 s作為滑動步長進行切分,最后再將每個窗口中的數(shù)據(jù)按1 s進行切分從而完成數(shù)據(jù)集的預(yù)處理。
算法流程如圖7所示。
圖7 模型整體架構(gòu)
整個模型由腦電信號投影、空頻特征提取器、時間特征提取器以及最后的全連接層分類器組成,訓(xùn)練過程如下:
首先將分割好的腦電片段投影成圖像。然后將30幅腦電圖像分別輸入到空頻特征提取器中以提取腦電片段的相關(guān)特征;而后將提取完成的特征合并輸入到時間特征提取器中以抽取時間特性;最后將得到的特征向量輸入到全連接層中判斷輸入數(shù)據(jù)段所屬類別。循環(huán)過程中利用評估得到的損失反向傳播更新網(wǎng)絡(luò)參數(shù),經(jīng)過迭代執(zhí)行完成模型訓(xùn)練。
卷積層架構(gòu)如表1所示;時間特征提取層以卷積層輸出的30個塊作為輸入,采用雙向LSTM進行時間特征的捕獲。
表1 卷積特征提取器網(wǎng)絡(luò)架構(gòu)
續(xù)表1
為了優(yōu)化模型的參數(shù)和結(jié)構(gòu),本文通過交換卷積層的順序和在超空間上的參數(shù)調(diào)優(yōu)進行預(yù)實驗。結(jié)果表明使用串行卷積層提取前期特征、使用并行卷積模塊提取深層特征時模型性能較好,其中所有卷積層均使用整流線性激活(ReLU)。優(yōu)化后的其他參數(shù)如下:batch size=128,優(yōu)化器選擇RMSProp,不使用dropout,網(wǎng)絡(luò)的學(xué)習(xí)率為0.001。
癲癇預(yù)測有兩個任務(wù)方向,其中一個是建立面向指定病人癲癇發(fā)作預(yù)測模型,另外一個是建立無特定目標的跨患者癲癇預(yù)測模型。
建立特異性癲癇預(yù)測模型,即使用目標患者本人的數(shù)據(jù)訓(xùn)練分類預(yù)測模型。由于單一患者陽性樣本的數(shù)量有限(癲癇發(fā)作通常是相對罕見的事件),因此本文基于留一法為特異性模型的建立設(shè)計數(shù)據(jù)采集方法:選擇其中1次發(fā)作前的片段作為測試樣例,利用其他N-1次發(fā)作前片段和全部間期片段訓(xùn)練模型。本文重復(fù)此過程N次,以便測試每個癲癇發(fā)作記錄。
相比之下,構(gòu)建跨患者癲癇預(yù)測模型是一個具有挑戰(zhàn)性的工作。同樣的癲癇發(fā)作在不同患者之間的腦電圖記錄中存在一定差異(大腦中的位置、頻率、持續(xù)時間等因素),從而使廣義癲癇發(fā)作模型的設(shè)計復(fù)雜化。本文將任意一名患者的腦電數(shù)據(jù)作為待測數(shù)據(jù),利用其他N-1個患者的數(shù)據(jù)訓(xùn)練預(yù)測分類模型,然后利用待測患者進行模型測試。保留模型參數(shù)的同時在全部患者上重復(fù)此過程,在對每個患者進行測試后完成跨患者癲癇預(yù)測模型的構(gòu)建。
文獻[12]開發(fā)的基于支持向量機的商業(yè)化診斷器,通過提取腦電信息在頻譜、空間和時間中自定義特征組合,實現(xiàn)了96.36%的靈敏度和0.11次/h的誤診率,是特異性模型所參照的一個基準。文獻[15]通過使用有限脈沖響應(yīng)濾波器進行高低頻去噪,而后使用癲癇波序列分析(EWS)和周期性波形分析(PWA)的算法在時域和頻域中掃描EEG的節(jié)律模式以建立跨患者癲癇發(fā)作預(yù)測模型,在CHB-MIT上獲得了94.13%的平均靈敏度和0.32次/h的平均誤診率。文獻[5]提出的深度卷積神經(jīng)網(wǎng)絡(luò)模型在跨患者預(yù)測上取得了75.1%的靈敏度和94.1%的特異性,是模型性能在深度學(xué)習(xí)領(lǐng)域的良好參照。
合理選擇評價指標有利于提高模型性能的可信度。本文采用靈敏度和誤診率作為預(yù)測模型的評估標準。靈敏度代表癲癇發(fā)作的檢出率,鑒于癲癇表現(xiàn)出的強破壞力,有效的癲癇檢測模型應(yīng)盡量預(yù)測出全部的發(fā)病記錄,因此靈敏度越高越好;預(yù)測模型應(yīng)減少錯誤報告的次數(shù),降低患者因誤報產(chǎn)生的恐懼感,減少錯誤用藥的次數(shù),即模型的誤診率越低越好。
為了讓模型對比結(jié)果更加直觀,本文將實驗得到的靈敏度與所對比實驗結(jié)果進行相減,將對比實驗的結(jié)果中的誤診率與本文的實驗結(jié)果相減。差值大于0表明本文提出的模型在兩個評價指標上占據(jù)優(yōu)勢,反之表示本文模型的不足之處。
3.2.1特異性癲癇預(yù)測模型比較
圖8(a)比較了本文所提出的集成深度神經(jīng)網(wǎng)絡(luò)模型和Shoeb的支持向量機模型在靈敏度和誤診率上的差異??梢钥闯觯诩缮窠?jīng)網(wǎng)絡(luò)所構(gòu)建的癲癇預(yù)測模型相比SVM模型在患者chb05、chb06以及chb18-chb23上提高了癲癇檢出率,在chb13和chb17上小幅降低了靈敏度,總體上實現(xiàn)了平均98.22%的靈敏度;總體上小幅降低了誤診率,平均誤診率為0.09次/h。
(a)
3.2.2跨患者癲癇預(yù)測模型比較
利用傳統(tǒng)方法構(gòu)建的跨患者癲癇預(yù)測模型通常效果不佳,原因是人工特征對不同患者癲癇前期的腦電特征無法完全概括。與Fubass所提出的方法相比,本文所提出模型表現(xiàn)優(yōu)異。如圖8(b)所示,在部分患者上大幅提高了靈敏度,使模型的整體的靈敏度從94.13%上升95.65%;與此同時降低了大部分患者的誤診率,并且在個別患者上降幅明顯,實現(xiàn)了0.17次/h的平均誤診率。
為了衡量模型在深度學(xué)習(xí)算法中的性能水平,將本文的方法與Robin所使用的深度卷積神經(jīng)網(wǎng)絡(luò)在跨患者分類模型上的性能進行對比,結(jié)果如表2所示。
表2 模型性能對比(%)
從評價指標的對比結(jié)果看,本文所提出的深度集成模型在特異性癲癇預(yù)測模型和跨患者癲癇預(yù)測模型上都有優(yōu)異的表現(xiàn)。從數(shù)據(jù)集的角度分析,原始數(shù)據(jù)集在chb17-chb23的患者中均存在一定程度的通道丟失現(xiàn)象。而傳統(tǒng)方法對數(shù)據(jù)模式有較大的依賴性,當(dāng)部分患者的數(shù)據(jù)模式發(fā)生變更(通道丟失)時,將使所訓(xùn)練過程產(chǎn)生偏差,最后導(dǎo)致模型檢測能力差、泛化性弱。而深度集成模型的主要優(yōu)勢在于其多尺度、多維度對腦電狀態(tài)進行建模,同時對頻域、空域和時域三種特征進行自動提取,具有良好的泛化能力和足夠的健壯性,在部分通道丟失的情況仍能保持一定的檢測能力,優(yōu)于人工特征的方法。
與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)相比,深度集成網(wǎng)絡(luò)在特異性指標上基本持平。表明深度學(xué)習(xí)技術(shù)相比傳統(tǒng)的分類器擁有更好的泛化能力,可以準確識別發(fā)作間期的核心特征;在靈敏度方面,深度集成模型具有優(yōu)秀性能,總體的預(yù)測準確率也相應(yīng)提升。癲癇發(fā)作是一個全腦區(qū)相關(guān)的變化過程。本文方法可以有效捕獲大腦各區(qū)位的空間狀態(tài)變化,精確分析出腦電片段之間的差異,有效提高模型的靈敏度,減少誤報情況的發(fā)生。
本文提出了一種癲癇發(fā)作預(yù)測的深度集成網(wǎng)絡(luò)模型,通過縱向集成空頻特征提取器和時間特征提取器,可以有效地從腦電信號提取多維特征,自動學(xué)習(xí)癲癇發(fā)作前期的一般不變表示。實驗結(jié)果表明深度集成神經(jīng)網(wǎng)絡(luò)所構(gòu)建的特異性癲癇預(yù)測模型和跨患者癲癇預(yù)測模型在性能上對比傳統(tǒng)分類模型和卷積神經(jīng)網(wǎng)絡(luò)都有顯著改善,在癲癇發(fā)作預(yù)測任務(wù)上具有優(yōu)勢。
此外,深度集成網(wǎng)絡(luò)的另一個優(yōu)勢在于可以探測大腦中癲癇發(fā)作的具體位置,與醫(yī)學(xué)專家分析腦電圖的目的相同。通過使用訓(xùn)練好的模型對部分遮蓋的圖像進行分類,比較不同遮蓋部位下的分類準確度可以推導(dǎo)出癲癇發(fā)作前大腦激活的關(guān)鍵區(qū)域。對腦電信號的多維特征共同分析的實踐方法具有研究價值。