国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向癲癇腦電的簡化深度學習模型*

2020-12-07 09:26:34魏建好
國防科技大學學報 2020年6期
關鍵詞:腦電識別率癲癇

張 錦,劉 熔,田 森,陳 勝,魏建好

(1. 湖南師范大學 信息科學與工程學院, 湖南 長沙 410081;2. 湖南師范大學 數學與統(tǒng)計學院, 湖南 長沙 410081; 3. 湖南大學 信息科學與工程學院, 湖南 長沙 410082)

癲癇(epilepsy),又名“羊癲瘋”,是最為常見的神經系統(tǒng)疾病[1]之一,據WHO最新統(tǒng)計,全球約有5000萬癲癇病患者,且每年兒童患病者逐步增加[2]。癲癇年齡跨度大,且趨于年輕化,目前治療方式主要有藥物保守治療、手術切除病灶治療[3]等,治療周期長、副作用大。

癲癇腦電 (Epilepsy ElectroencephaloGram, EEG)研究主要包括特征提取[4-5]和分類兩個方面。近年來,越來越多的研究者開始對不同場景下的信號去噪,以提高檢測率[6]。文獻[7]提出采用小波系數分解的方式提取癲癇腦電信號特征,實現對正常期、發(fā)作期和發(fā)作間期的癲癇腦電分類。近年來,Wang等采用主成分分析和方差性分析降低原始特征空間維數,對癲癇腦電發(fā)作期和非發(fā)作期進行自動分類[8]。

深度學習目前被認為是較為先進的模型,在模式識別和機器學習方面有廣泛的應用[9],在基準數據集分類方面達到甚至比人類本身更高的準確度。大腦對某些刺激、任務或生理狀態(tài)的電響應通常包括許多子反應,這些子反應被組合以提供完整的反應。深度學習現已用于癲癇腦電圖中的分類以及癲癇發(fā)作預測等領域。深度學習在結構上與深度神經網絡類似,文獻[10]提出采用長短時記憶網絡(Long Short-Term Memory, LSTM)結構對癲癇腦電數據進行分類,此外,也可通過基于Softmax回歸方法對癲癇腦電信號進行分類。

目前癲癇腦電識別的方法過程較煩瑣,中間過程參數過多。針對該問題,本文提出一種簡化版的深度學習模型L-NET,首先將原始信號進行經驗模態(tài)分解(Empirical Mode Decomposition, EMD),分別選取前幾階本征模態(tài) (Intrinsic Mode Function,IMF),使用一維卷積替換傳統(tǒng)的二維卷積以保留更豐富的局部特征,通過使用L-NET進行訓練,對五類不同的腦電信號進行對比識別研究;將L-NET模型直接對原始癲癇腦電數據進行五分類,沒有進行數據預處理;基于前面已有實驗,對前三階的本征模態(tài)分量分別重構7種典型特征,利用K近鄰和隨機森林兩種方法分別進行五分類對比。實驗結果表明,經過EMD數據預處理后前三階的IMF分量的識別率最高;通過前八階本征模態(tài)分量識別率較低,表明在處理的過程中,后幾階為殘差分量,這些對于癲癇腦電識別研究具有重要意義。

1 面向癲癇腦電的簡化深度學習模型

1.1 面向癲癇腦電的一維卷積神經網絡

1.1.1 模型結構

面向癲癇腦電的一維卷積神經網絡(Convolutional Neural Network, CNN)包含很多一維卷積層,一個卷積層可以包含很多卷積面。激活函數有很多不同的選擇,但一般為sigmoid函數或校正線性單元(Rectified Linear Unit, ReLU)。池化層將輸入數據劃分為許多小的子區(qū)域,每次只提取子區(qū)域最大值的方法就稱為最大值池化。池化層的意義在于提取出數據中的顯著特征而忽略細節(jié)特征,以減少網絡中的參數和計算量,并且能夠控制過擬合。

卷積神經網絡在圖像[11]、語音識別方面取得非常好的成績,核心想法在于物體的特征往往可以提取出來,且通過卷積、池化可以大大減少輸入數據,加快訓練效率。一維卷積神經網絡可以很好地應用于傳感器數據的時間序列分析[12]也可以實時抗噪診斷[13],還能應用于自然語言處理的任務[14]。深度卷積神經網絡在實際應用中取得了不錯的成果[15]。

1.1.2 算法設計

簡化深度學習模型如算法1所示。

算法1 簡化深度學習模型L-NET

設計算法重要的指標之一是優(yōu)化器,實驗所用到的為RMSProp,其全稱叫Root Mean Square Prop,為了進一步優(yōu)化損失函數在更新中存在擺動幅度過大的問題,RMSProp算法對權重W和偏置b的梯度使用微分平方加權平均數。

另一個重要參數為目標函數,或稱損失函數,是編譯一個模型必要的參數之一。本文中損失函數是binary crossentropy(亦稱作對數損失,logloss),該函數主要用來做極大似然估計,以方便計算。

1.2 模型參數設計

本文模型建立在一般的卷積神經網絡基礎上,同時也增加了部分結構,如圖1所示,模型結構主要是由一維卷積層(conv1D)、一維池化層(max_pooling1D)、批標準化層(batch_normalization)、全局均值池化層(global_average_pooling1D)、全連接層(Dense)和Dropout層等構成。

圖1 簡化深度學習模型L-NET結構Fig.1 Simplified deep learning model L-NET structure

由于原始輸入數據是列向量,根據輸入數據的特殊性設計兩層卷積層疊加結構,增加一層批標準化層,使網絡訓練CNN時更加穩(wěn)定。隨后再增加一個最大池化層,減小模型結構復雜度。全局平均池化層,與普通池化不同之處在于不需要池化窗口在輸入數據上進行滑動采樣,全局平均池化能夠替代卷積神經網絡中的全連接層,好處是能夠減少整個網絡結構的參數數量。兩個全連接層之間是dropout層,是在訓練過程中,對每一個全連接層的神經網絡單元,按照一定的概率將其隨機地丟棄,所以每一個批次(batch)都在訓練不同的網絡,從而增加了網絡的健壯性。另外也設置了L2正則化,使權值變化率相應減小,通過這一系列設置從而減少了過擬合現象的發(fā)生,表1為前三階實驗中模型結構的具體參數。

表1 模型結構參數表

2 性能分析

2.1 數據集

癲癇腦電信號本質上是一種時序信號,本實驗采用的腦電數據是印度學者Varun Bajaj和Ram Bilas Pachori對正常人和癲癇病患者實際測試的數據。腦電信號數據總共分為5類,分別為Z、O、N、F、S,每類腦電子集包含100個信道序列,總共500個信道序列。每個信道持續(xù)時間為23.6 s,信號采樣點數為4097。五類信號分別代表不同人的腦電測試信號,其中Z、O表示的是正常清醒的健康人,N、F表示的是未發(fā)作的癲癇病人,S表示癲癇病發(fā)作時的病人;記錄位置不同,Z、O兩類是在顱外記錄的數據,而其余三類是在顱內記錄的。所有的EEG信號都是由128通道的放大器系統(tǒng)記錄下的,都采用常用的參數設置。在經過12位模數轉換后,數據以173.6 Hz的采樣頻率連續(xù)讀入,在本實驗過程中,將行信號轉置成列信號方便數據處理及后面模型的設計。

2.2 基于數據預處理的EEG識別

2.2.1 基于EMD數據預處理的識別框架

經驗模態(tài)分解算法[16]是一種適用于處理非平穩(wěn)非線性序列的自適應時空分析方法。EMD提取特征后,將一個序列分成多個IMF分量而不偏離時間域。這與一些時空分析方法相似[17],如傅里葉變換和小波分解。這種方法尤其適用于分析自然信號,而自然信號通常是非線性和非平穩(wěn)的[18]。

基于EMD數據預處理的EEG識別流程如圖2所示,這種方法對前面輸入的500個列向量進行數據預處理,每一條原始數據經過EMD后形成8~13不等階數的IMF分量。由于后幾階的分量中包含較多的殘差噪聲,為了保證輸入統(tǒng)一,分別取前三、前五、前七、前八階分量作為模型的輸入。

圖2 基于EMD數據預處理的EEG識別流程圖Fig.2 EEG identification flow chart based on EMD feature extraction

2.2.2 實驗結果

實驗將數據集劃分為3個部分——訓練數據、驗證數據和測試數據(總共五類共500條數據)比例為3 ∶1 ∶1。這些數據每次讀入的時候都是隨機打亂的,訓練過程對訓練數據進行調參,經過一次epoch后,得到一個訓練結果和驗證結果,通過驗證集對模型的準確率進行評估,訓練完成后,用測試集對最后的結果進行總體檢測。

各階數在參數設置環(huán)境相同的情況下,分別進行30次獨立實驗,表2中數據分別表示第1~6次、第7~12次、第13~18次、第19~24次和第25~30次實驗的平均準確率結果。此外,評價指標損失值(loss),通過30次重復實驗得到相應的平均loss值。實驗結果表明,前三階的IMF分量的整體效果是最好的,前三階、前五階準確率逐漸升高,loss值基本持平;前七階、前八階準確率逐漸降低、loss值也逐漸增加。具體實驗數據如表2所示。

表2 基于EMD數據預處理的EEG識別結果Tab.2 EEG recognition results based on EMD feature extraction

2.3 基于深度學習的EEG識別

2.3.1 基于原始數據的識別框架

本實驗硬件環(huán)境:操作系統(tǒng)為Windows10;處理器為AMD Ryzen 5 2600X 六核;內存為金士頓 DDR4 2400 MHz,采用GPU加速,基于MATLAB平臺和Keras平臺,MATLAB由一系列工具組成,其中包含一些內置的函數和文件。Keras框架是一個高層神經網絡應用程序接口,Keras框架由純Python編寫而成并基于Tensorflow、Theano以及CNTK后端??梢灾苯诱{用圖像處理中的一些內置函數及封裝的庫,支持CPU和GPU無縫切換。在基于原始數據的實驗中是直接進行模型訓練,而未進行數據預處理。

基于原始數據的EEG識別流程如圖3所示,首先將其中一道原始波形記錄4097個采樣點,數據采集后組合形成一個行向量,再將原始數據進行轉置變成一個列向量。總共500道波形,將這些波形依次轉置后形成500個列向量直接作為L-NET的輸入,通過訓練模型后識別屬于哪一類。

圖3 基于原始數據的EEG識別流程圖Fig.3 EEG identification flow chart based on raw data

2.3.2 實驗結果

基于原始數據的EEG識別結果如表3所示,本類實驗總共進行30次,以6組實驗為一單位,分別取其平均值,共有5組實驗數據,另外再把5組實驗數據取平均值得到最終的識別結果。輸入數據為轉置后的一維列向量,不需要進行數據預處理,因為L-NET模型是一種深度學習模型,其卷積層可自動提取特征并進行分類。實驗結果表明,未經處理的原始信號識別率基本上能達到90%。

表3 基于原始數據的EEG識別結果

本實驗分為兩部分,即基于原始數據的EEG識別和基于EMD數據預處理的EEG識別。主要是探究簡化的一維卷積神經網絡對于原始腦電信號以及經過EMD數據預處理后的不同IMF分量識別分析,原始信號輸入大小為4097*1,前三階IMF輸入為4097*3,前五階輸入為4097*5,前七階輸入為4097*7,前八階輸入為4097*8。

將基于原始數據的EEG識別結果和基于EMD數據預處理的對比識別結果如圖4所示,根據圖中五類數據,前三階準確率基本高于其他幾類,前七階和前八階本征模態(tài)分量明顯低于原始數據。這些說明通過合適的數據預處理方式能夠提高準確率。另外五類輸入迭代200次的運行時間基本保持在2 min至2 min 40 s以內,時間效率非常高。

圖4也表明經過EMD后確實把噪聲過濾到后幾階IMF中,因此選取的IMF分量越是前幾階,信號中包含的信號噪聲越少,信號的差異越不受噪聲影響,識別率越高。所以,前三階IMF分量因為包含的噪聲較少,識別率最高。由于前八階信號的后幾階信號中包含較多的噪聲,影響信號的真實差異,得到的整體識別率最低。在實驗中,原始信號的識別率高于前七、前八階的識別率,而低于前三、前五階的識別率。這是因為前三、前五階的信號經過EMD后,保留了原始信號的主要信息,同時去除了噪聲,因此識別率高于原始信號。但是當選取的階數越多時,比如,前七、前八階IMF分量信號,這些信號包含被EMD后的低頻信號(例如第7階、第8階IMF分量)和原始信號差異明顯,可能含有較多的噪聲,導致前七階、前八階IMF分量的整體識別率低于原始信號的識別率。

圖4 兩類方法結果對比圖Fig.4 Comparison of the results of the two types of methods

2.4 對比實驗

2.4.1 對比方法

K近鄰(K-Nearest Neighbor,KNN)分類算法是一種既可用于分類又可用于回歸的機器學習算法。其基本思想是找到與當前樣本特征最相近的K個樣本,這K+1個樣本均屬于同一類。這種方法中K的取值較為敏感,通過對距離進行加權,可以優(yōu)化最終的結果。

隨機森林(Random Forest,RF)算法也是一種既可用于分類問題也可用于回歸問題的機器學習算法。它是一種由多棵決策樹組成的集成模型,決策樹本質上是一種樹形結構,每一個節(jié)點表示相關測試,其葉節(jié)點表示分類屬性的概率。對于分類問題,隨機森林通過多棵決策樹投票得到最終的結果,而對于回歸問題,則是根據平均值而得到。

文獻[19]采用最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)是為了克服標準支持向量機復雜度大、計算難度大的問題而提出的。

2.4.2 實驗結果

根據上述實驗結果,經過EMD數據處理后前三階實驗效果最好,基于上述實驗結果,對前三階的本征模態(tài)分量分別重構7種典型特征[20],包括波動指數、變化系數、方差、相對能量、平均頻率、偏斜度和峰度。將五類信號提取特征后,500個信道分別都有7個特征。然后分別采用KNN和隨機森林進行五分類,第三組實驗引用了文獻[20]的實驗結果,最終的實驗結果如表4所示。

表4 對比實驗結果

K近鄰和隨機森林兩組對比實驗均是基于相同的環(huán)境,進行五次對比實驗然后取平均值。通過實驗結果說明,針對癲癇腦電這類時序數據,相對于KNN、隨機森林和最小二乘支持向量機三種方法,本文所提出的方法中癲癇腦電的識別平均準確率分別提升了69.72%、31.04%、20.64%。并且本文中的簡化深度學習模型沒有提取特征這一環(huán)節(jié),只是對數據進行預處理。

3 結論

針對癲癇腦電數據這種時序信號,本文以一維卷積神經網絡為基礎,設計簡化深度學習模型對癲癇腦電信號進行識別研究。相比于二維CNN,這樣設計的模型參數更少,效率更高。通過研究發(fā)現,原始數據經過EMD處理后取前三階分量,再利用一維CNN做分類識別這種方式識別率最高。隨著采用分量數越多識別率降低,實驗結果表明在數據預處理的過程中會給原始信號帶來噪聲。在實驗過程中,以基本調參方法為基礎,L-NET做相應改進,如增加全局均值池化,每一層加入權重和偏置初始化等,使識別率有所提高。這種調參方法對于今后其他模型的參數調整具有借鑒意義。

基于現有的研究,本文將一維CNN應用到其他方面,例如人臉識別,可以將手動預處理后的數據以及數據不做處理進行對比研究。將一維CNN、二維CNN和VGG等一系列網絡結構進行對比分析,通過研究這些模型,可以了解它們之間更多的共性和特性。目前這一方面存在諸多可研究的問題,一般的人臉識別過程包含人臉檢測、特征提取以及人臉識別幾個重要組成部分。其中,人臉檢測是整個識別過程的關鍵部分,已有的檢測方法大部分都是基于目標檢測的方法,另外在人臉識別過程中,已有的研究基本上是基于卷積神經網絡,并在此基礎上進行改進并不斷優(yōu)化,一般的網絡結構非常復雜并且訓練模型復雜,訓練要求設備配置高并且耗時長。本論文中所提出的簡化深度學習模型也可嘗試用于此過程中,將提取人臉面部的128維特征向量作為本文所提出模型的輸入部分,然后進行訓練并進行分類來實現整個人臉識別過程。這種方式使人臉識別幾個過程分離,并且整個過程更加簡化,這是下一步所要研究的方向。

猜你喜歡
腦電識別率癲癇
癲癇中醫(yī)辨證存在的問題及對策
基于類圖像處理與向量化的大數據腳本攻擊智能檢測
計算機工程(2020年3期)2020-03-19 12:24:50
基于真耳分析的助聽器配戴者言語可懂度指數與言語識別率的關系
提升高速公路MTC二次抓拍車牌識別率方案研究
玩電腦游戲易引發(fā)癲癇嗎?
飲食科學(2017年5期)2017-05-20 17:11:53
現代實用腦電地形圖學(續(xù))
現代實用腦電地形圖學(續(xù))
現代實用腦電地形圖學(續(xù)) 第五章 腦電地形圖的臨床中的應用
高速公路機電日常維護中車牌識別率分析系統(tǒng)的應用
現代實用腦電地形圖學(續(xù)) 第五章 腦電地形圖在臨床中的應用
贺兰县| 武汉市| 沙河市| 乃东县| 福清市| 静宁县| 柘城县| 南皮县| 沂水县| 白银市| 淮北市| 大悟县| 平舆县| 遵义县| 陇西县| 疏勒县| 泰来县| 仙游县| 丰城市| 万安县| 沂水县| 启东市| 五台县| 图木舒克市| 贵阳市| 通榆县| 上高县| 新巴尔虎右旗| 肥乡县| 夹江县| 黑山县| 重庆市| 丹阳市| 永顺县| 普格县| 广平县| 大石桥市| 宜章县| 万山特区| 玛多县| 乃东县|