陳澤龍 謝康寧
腦電圖(electroencephalogram,EEG)是一種使用電生理指標記錄大腦活動的方法,是大腦活動時大量神經元同步發(fā)生的突觸后電位經總和后形成,由放置在頭皮表面的電極采集記錄的圖譜[1]。EEG記錄大腦活動時的電波變化,是一種無創(chuàng)生理信號采集方法,具有良好的時間分辨率。
EEG作為腦機接口(brain-computer interface,BCI)的關鍵技術,其應用方法可分為5個階段[2]。①腦電信號的采集;②腦電信號預處理,去除噪聲干擾,原始腦電信號包含眼電、心電及肌電的干擾信號,去除此干擾可簡化后續(xù)腦電信號的分析處理;③腦電信號特征提取,從預處理的腦電信號中提取特征量以區(qū)分不同的腦電信號,并實現(xiàn)信號的降維簡化計算過程;④選取分類器對提取的特征量進行分類,特征量的選取是影響分類效果的重要因素;⑤將分類結果用于控制外部設備或給出判斷結果。腦電信號的預處理、特征提取和分類是腦電信號處理的重要內容,并得到廣泛深入研究[3-4]。
原始腦電信號含眼電、心電及肌電等噪聲,工頻干擾也是腦電偽跡的重要來源,會增加腦電信號處理的復雜度及運算量,需在信號分析前剝離[5]。腦電信號預處理方法主要有共空間模式(common spatial patterns,CSP)、主成分分析(principle components analysis,PCA)、共同平均參考(common average referencing,CAR)、自適應濾波(adaptive filtering,AF)、獨立成分分析(independent component analysis,ICA)以及數(shù)字濾波器(digital filter,DF)等。
CSP濾波來源于共空域子空間分解(common spatial subspace decomposition,CSSD)。CSSD算法的基本思想是在高維空間中尋找方向,對2種情況分類時,使一類方差最大而另一類方差最小。CSP多用于處理基于BCI的運動想象想像腦電數(shù)據(jù),其基本思想是設計一種空間濾波器,對腦電信號進行處理得到新的時間系列,使一類信號方差最大而另一類信號方差最小,從而得到差異最大的特征。其優(yōu)點是無需提前選擇特異性頻帶,缺點是對噪聲敏感且依賴于多通道分析[6]。
PCA是一種統(tǒng)計學方法,通過正交變換將一組相關自變量變換為線性不相關變量,變換后的變量即為“主成分”,其作用在于降低向量維度,減少信號特征提取和分類的復雜度。腦電EEG信號處理應用中,PCA將腦電EEG信號分解為互不相關的成分,主成分具有最大方差,分離眼電、肌電等振幅較大的干擾成分,再重構EEG信號,實現(xiàn)信號去噪[7]。
CAR是一種空間濾波算法,基本思想是濾除腦電EEG信號的共同部分的同時保留特定電極的特征信號,提高信噪比。CAR算法首先計算某一時間點所有通道的腦電電壓平均值,再用特定通道的腦電電壓值減去平均值即得該通道腦電電壓值。CAR算法為公式1:
AF是一種可自動調整參數(shù),無需預知輸入信號和噪聲的統(tǒng)計特性,在工作過程中逐步估計出所需統(tǒng)計特性,從而調整自身參數(shù)以達到最佳濾波效果的濾波方法。完整的AF含4部分:輸入信號、參考信號、濾波器和參數(shù)調整。AF示意見圖1。
圖1 自適應濾波(AF)示意圖
圖1顯示,X(n)為輸入信號,通過可調參數(shù)DF后產生輸出信號y(n),將y(n)與參考信號d(n)進行比較,形成誤差信號e(n),再通過自適應算法對濾波器參數(shù)進行調整使e(n)均方值最小,從而實現(xiàn)最優(yōu)濾波。
Lu等[9]設計一種新的AF方法,叫做自適應拉普拉斯濾波,可改善基于運動感覺的BCI性能,其在22名受試者的研究中證實,該方法可提高基于運動感覺的BCI準確度和魯棒性。
ICA是一種盲源分析方法,可根據(jù)數(shù)據(jù)特征將偽影作為獨立成分從腦電信號中分離出來。根據(jù)ICA算法理論,眼動偽跡、心電偽跡、肌電偽跡和工頻干擾等皆由獨立的信號源產生,具有統(tǒng)計獨立性,通過ICA算法可將其分離,提取出有用的腦電信號。ICA算法提供了分離和去除腦電信號中眼動偽跡的有效方法,Pontifex等[10]探討全自動眼動偽跡ICA成分分離辦法,可避免將頭皮EEG中類似于眼動偽跡分布的信號成分錯誤分離,減少人為確認偽跡可能產生的錯誤。Pontifex等[11]也探討了與ICA算法不確定性相關的變異性可能影響去除眼動偽跡成分后的腦電信號的重構,采用3種不同ICA算法對32名大學生的腦電信號數(shù)據(jù)做分析,重復30次。結果顯示,ICA算法在去除偽跡成分后重構腦電信號的過程中可能引入其他偽跡,認真選取ICA算法和參數(shù)可減少該影響[11]。
腦電信號是隨機且非平穩(wěn)信號,具有非線性,DF從頻率域對腦電信號進行濾波,可分為低通濾波器、高通濾波器、帶通濾波器和帶阻濾波器。DF廣范應用于腦電信號的偽影處理尤其是濾除肌電偽跡。但DF要求腦電信號和偽跡信號分別具有不同頻帶,在實際情況中很難實現(xiàn),其使用受到限制[12]。腦電信號處理中常用的DF為帶通濾波器和陷波濾波器,陷波濾波器可用于濾除50 Hz工頻干擾。
腦電信號預處理主要去除腦電信號中混雜的眼動偽跡、心電偽跡、肌電偽跡和工頻干擾等,為接下來的腦電信號特征提取提供“干凈”的信號數(shù)據(jù)。腦電信號預處理方法多樣,上述CSP、PCA、CAR及ICA屬于空域濾波器,此外還存在時間域濾波器,如傅里葉分析、自回歸分析等。相同數(shù)據(jù)量下,空域濾波器比時間域濾波器在分析時效上有優(yōu)勢。6種腦電信號預處理方法的優(yōu)缺點對比見表1[2]。
表1 腦電信號預處理方法比較
預處理后的原始腦電信號成為較為純凈的腦電信號,但由于腦電信號數(shù)據(jù)量大,直接處理過于復雜,需做特征提取以降低數(shù)據(jù)維度[2]。目前,常用的信號特征提取方法為功率譜密度(power spectrum density,PSD)、PCA、ICA、自回歸分析(auto regressive,AR)、小波變換(wavelet transform,WT)、小波包變換(wavelet packet transform,WPT)及快速傅里葉變換(fast Fourier transform,F(xiàn)FT)等。
PSD定義了時間序列信號的功率如何隨頻率分布,是一種概率統(tǒng)計方法,是對隨機變量均方值的量度。Dea等[13]采用功率譜密度和分形維數(shù)評價兒童睡眠紡錘期“之前”“間期”及“之后”的差異,結果表明“間期”和“之前”“之后”期存在統(tǒng)計學差異,分形維數(shù)也顯著不同,此差異有助于理解睡眠紡錘波的變化。
PCA既可用于腦電數(shù)據(jù)預處理,也可用作腦電數(shù)據(jù)信號的特征提取。PCA從腦電信號的時間序列數(shù)據(jù)中提取出有用信號,同時去除偽影以達到降維的目的。P300字符拼寫B(tài)CI系統(tǒng)應用于日常生活對殘疾人幫助很大,Kundu等[14]采用PCA和加權支持向量機對P300字符拼寫B(tài)CI系統(tǒng)做特征識別,PCA去除多余特征量。Jaiswal等[15]研究癲癇發(fā)作自動監(jiān)測技術,采用基于子模式主成分分析(sub-pattern PCA,SpPCA)和基于交叉子模式相關性主成分分析(cross-subpattern based PCA,SubXPCA)做特征提取,建立腦電信號子模式相關性幫助模式識別。
ICA將信號分解成相互獨立的成分并提取其有用成分。作為“盲源”分離技術,ICA有助于辨別獨立信號并將噪聲信號進行分離,其運算速度快且效率高,適合處理如腦電EEG信號一般的海量的數(shù)據(jù)。Stewart等[16]記錄視覺刺激腦電信號,判斷被試者是否熟悉所見物體。該研究采用ICA做特征提取,支持向量機做分類器,獲得87%的分類準確率。
AR是一種時域分析方法,通過建立數(shù)學模型對腦電信號數(shù)據(jù)進行擬合,實現(xiàn)特征提取。AR模型可表述為線性預測問題,對于時間序列數(shù)據(jù),當前點的預測值可用最鄰近的前n個點的采樣值的線性加權和來近似。腦電信號分析中常用的AR模型可分為自適應模型和非自適應模型[17]。
(1)WT。WT是一種時頻變換方法,其繼承并發(fā)展了短時傅里葉變換局部化的思想,能夠提供一個隨頻率改變的“時間-頻率”窗口。WT突出信號特征,通過伸縮平移運算對信號多尺度細化,實現(xiàn)信號高頻處時間分辨率提高和低頻處頻率分辨率提高,自動適應信號時頻分析要求。WT分解過程中只對信號低頻部分再分解,高頻部分不再分解,因此隨著信號頻率升高頻率分辨率降低,WPT對高頻信號的頻率分辨率比WT高,可自適應選擇最優(yōu)小波包基函數(shù),具有較強信號分析能力,得到廣泛應用。
(2)WPT。Subasi等[18]對偏頭痛患者光刺激的腦電信號做離散小波變換(discrete wavelet transform,DWT),每個通道信號提取23個特征量,經過二次篩選全部用于模式識別。DWT小波基函數(shù)的品質因素Q是固定的,可調品質因子小波變換(tunable Q-factor wavelet transform,TQWT)的品質因子Q是可調的,可調整小波振蕩特性與特征波形振蕩特性相匹配。TQWT一般根據(jù)品質因素Q、冗余度R和分解層數(shù)J將腦電信號分解為不同的子頻帶,因為腦電信號的隨機非平穩(wěn)特性,品質因素Q取值較大,如Q取值14[19]。WPT對高頻信號的分辨率高于WT,是一種更精細的分析方法,在基于腦電信號的測謊、面部表情識別及駕駛意圖識別等研究中用于特征提取,獲得較好分類效果[20-22]。
FFT是離散傅里葉變換的快速算法,在腦電信號特征提取中,F(xiàn)FT將腦電信號從時間域變換到頻率域并做頻譜分析或者計算功率譜密度。Ansari等[23]研究BCI電動輪椅操作控制,受試者腦電數(shù)據(jù)經帶通濾波后做FFT獲得δ、θ、α和β波,計算每個特征量的平均值、標準差和熵值,再將所有特征量輸入分類器做分類識別。FFT還被用于疲勞駕駛腦電信號分析及無人駕駛系統(tǒng)駕駛行為模擬實驗中駕駛員腦電信號分析等研究[24-25]。
腦電EEG信號是大腦各種電生理活動形成的電位在頭皮表面的疊加,具有隨機非平穩(wěn)特性,如何從復雜的EEG信號中提取有用的特征量是腦電信號分析的關鍵。單純按照腦電信號的頻率分布做帶通濾波不足以體現(xiàn)其特征,而高維特征向量會給后續(xù)的分類算法帶來十分復雜的運算量,需要做降維處理,一般采用PCA或ICA降維。7種腦電信號特征[2]提取方法的優(yōu)缺點比較見表2。
表2 腦電信號特征提取方法比較
腦電信號經過預處理和特征提取后,所提取的特征向量由分類器進行分類,實現(xiàn)對腦電信號的分析和預測。常用腦電信號分類器有K最近鄰算法(k-nearest neighbour,K-NN)、線性判別分析(linear discriminant analysis,LDA)、支持向量機(support vector machine,SVM)、樸素貝葉斯(naive Bayes,NB)、人工神經網(wǎng)絡(artificial neural network,ANN)與深度學習(deep learning,DL)等。
K-NN算法是一種基于樣本實例的分類算法,其核心思想是為:如1個樣本在特征空間中的k個最相鄰的樣本中大多數(shù)屬于某個類別,則該樣本也屬于該類別,并具有該類別樣本的特性。K-NN算法首先確定1個訓練樣本集,樣本集中所有樣本類別均為已知,對于待分類的樣本,計算該樣本與訓練樣本集中樣本的相似度,選擇相似度最高的k個樣本,根據(jù)選擇的k個樣本的類別確定待分類樣本的類別。近年來,K-NN算法得到較大改進,并在人臉識別、文字識別和醫(yī)學圖像處理等領域廣為應用[26-28]。Li等[29]利用EEG將K-NN算法用于人臉表情識別,結果顯示,EEG腦波γ頻帶分類識別準確率隨著EEG通道數(shù)的增多而提高,而EEG腦波γ頻帶、β頻帶、α頻帶及θ頻帶數(shù)據(jù)的分類準確率依次降低。同樣用于人臉表情識別領域,Awan等[30]利用分段選擇均方根(segmentation and selection-root mean square,S-RMS)特征向量提取方法結合K-NN分類識別算法使分類準確率達到96.1%。
LDA是Fisher于1936年提出的一種線性學習方法,其主要思想是對于給定的訓練樣本集,找到恰當?shù)耐队胺较驅颖就队暗揭粭l直線上,使同類投影點盡量集中,不同類投影點盡量遠離[31]。用相同方法對新樣本進行分類,根據(jù)新樣本投影點在直線上的位置確定新樣本類別[32]。LDA計算量不大,易于使用,是一種較好的分類方法[2]。LDA用于模式識別時通常將樣本集分為兩類[33]。
SVM是一類按監(jiān)督學習方式對數(shù)據(jù)進行二元分類的廣義線性分類器,基本原理是在空間尋找最優(yōu)決策面,使不同類別數(shù)據(jù)分布在決策面兩側,從而實現(xiàn)分類[34]。SVM按其構建模型由簡至繁可分為線性可分支持向量機、線性支持向量機和非線性支持向量機。Yun[35]采用SVM分類方法對駕駛疲勞程度進行分類,得出區(qū)分駕駛員輕度疲勞和重度疲勞的關鍵節(jié)點在于連續(xù)駕駛時間是否滿2 h,且該算法對重度疲勞的識別效果更好。Siuly等[36]對癲癇EEG數(shù)據(jù)進行最優(yōu)配置并采用PCA做特征提取,在此基礎上分別采用NB、K-NN、LDA和最小二乘支持向量機(least squares-support vector machine,LS-SVM)對特征向量做分類,結果顯示,LS-SVM的分類準確率最高達100%,比現(xiàn)有癲癇腦電數(shù)據(jù)分類算法準確度高7.10%。
NB分類器是基于貝葉斯定理的一種簡單實用的分類器,在一些領域其效率與其他分類器效率相當[37-39]。NB的主要思想是:對于給定的待分類項,求解在此項出現(xiàn)的條件下各個類別出現(xiàn)的概率,待分類項就屬于概率最大的類別,該算法假定樣本之間相互獨立無關聯(lián)[40]。NB分類器在處理高維數(shù)據(jù)時具有速度快、效率高和算法結構簡單的突出特點[41]。在NB算法基礎上,研究人員提出樹增強NB算法、網(wǎng)絡增強NB算法等改進算法,其目的是改善算法性能,提高分類準確率[37]。
ANN是20世紀80年代以來人工智能領域興起的研究熱點,從信息處理角度對人腦神經元網(wǎng)絡進行抽象模擬,建立相應模型,按不同連接方式組成不同網(wǎng)絡。ANN從人腦和各生物神經網(wǎng)絡中獲得啟發(fā),主要用于同時處理海量數(shù)據(jù)[42],解決分類和回歸問題,屬機器學習方法的一個分支。
ANN模擬腦神經的結構和功能建立模型,其基本的神經網(wǎng)絡類型有兩種:前向神經網(wǎng)絡(feedforward neural network,F(xiàn)NN)和循環(huán)神經網(wǎng)絡(recurrent neural network,RNN)。前向神經網(wǎng)絡又分為單層前向神經網(wǎng)絡(single-layered feed forward neural network,SFNN)和多層前向神經網(wǎng)絡(multilayered feed forward neural network,MFNN)。SFNN輸入層和輸出層直接相連,MFNN輸入層和輸出層之間包含隱藏層,RNN在MFNN的基礎上包含反饋回路,即輸出層神經元反饋回自身輸入神經元。神經元是ANN的基本單元,它由輸入變量、輸入變量權重、激活函數(shù)、偏離值和輸出變量等要素組成。
ANN在醫(yī)學診斷尤其是生物醫(yī)學信號的檢測與分析領域應用廣泛,可解決生物醫(yī)學信號處理中常規(guī)方法難以解決或無法解決的問題,在EEG、心電圖、腫瘤和精神病學等方面應用廣泛,通過先驗數(shù)據(jù)的訓練獲得“經驗”,無需對疾病細節(jié)和特征過多關注[42-43]。Dande等[42]介紹經過訓練和學習的ANN用于肺結核診斷,其靈敏度和特異度分別達100%和72%。Grossi等[44]采用基于ANN的以隱函數(shù)作為壓縮時間的多尺度排序組織圖(multi-scale ranked organizing map coupled with implicit function as squashing time,MS-ROM/I-FAST)系統(tǒng)從EEG提取感興趣的特征,對兒童自閉癥的鑒別診斷效果良好,所需EEG數(shù)據(jù)量僅需采數(shù)分鐘EEG數(shù)據(jù)即可滿足,且無需做任何數(shù)據(jù)預處理。
DL是機器學習的一種類型,是ANN的拓展。DL指ANN中包含的大量隱藏層神經元的學習、分析和處理。早期ANN多是淺層模型,DL基本結構是深度神經網(wǎng)絡(deep neural networks,DNN),隱藏層數(shù)多,包含神經元數(shù)量大,需調整參數(shù)多。DL是機器學習的一個重要分支,是近些年的研究熱點,在生理信號的分析處理方面得到廣泛應用。近年來,DL在腦電信號分析分類方面的應用得到廣泛深入研究,采用DL開展腦電信號分類研究的內容主要有情感識別、運動想像象識別、心理負荷檢測、癲癇檢測、事件相關電位檢測和睡眠評分,采用的DNN主要有卷積神經網(wǎng)絡(convolutional neural networks,CNN)、循環(huán)神經網(wǎng)絡(recurrent neural network,RNN)和深度置信網(wǎng)絡(deep belief networks,DBN),還包括棧式自編碼器(stacked auto encoder,SAE)和多層感知機(multilayer perceptron,MLP)等[45]。
CNN是一種前向神經網(wǎng)絡,其網(wǎng)絡結構由輸入層、卷積層、池化層、全連接層和輸出層組成。卷積層做特征提取,池化層減少網(wǎng)絡訓練參數(shù)降低模型過擬合程度,深度卷積神經網(wǎng)絡含有多層卷積層和池化層,全連接層所有神經元與最后一個池化層連接,輸出層包含2個神經元做二分類輸出[46]。
RNN用以處理序列數(shù)據(jù),其結構中神經元的輸入受輸入神經元和之前節(jié)點神經元輸出影響。最常用的RNN是長短期記憶(long short-term memory,LSTM)神經網(wǎng)絡,其基本結構是含3個門控的記憶模塊,分別是輸入門、輸出門和遺忘門,決定信息的輸入、輸出與移除。LSTM的隱含層數(shù)及隱含層中的神經元數(shù)可手動調節(jié),使訓練得到的LSTM模型預測效果最佳。Craik等[45]總結90項基于深度學習的腦電信號研究后認為,CNN、RNN和DBN在腦電信號分類準確性上優(yōu)于SAE和MLP。
基于DL的腦電信號分類研究主要集中在下述6個方面。
(1)Zhang等[47]提出一種時空循環(huán)神經網(wǎng)絡的DL算法用于情感識別,將腦電信號的時間和空間特征信息集成建立時空依賴模型,實驗結果表明,其與目前最先進的分類算法相比更有優(yōu)勢。
(2)Hauke等[48]開發(fā)一種深度學習算法用于基于腦電信號的運動想像BCI系統(tǒng),可提高腦卒中康復效果。該算法采用CNN做特征提取和數(shù)據(jù)降維,采用CNN的全連接層做分類識別。
(3)精神負荷分類識別是研究工作記憶的核心內容。Jiao等[49]針對單通道腦電信號和多通道腦電信號分別建立了不同的CNN模型,一種含時間和空間信息,另一種只含時間信息。在用于精神負荷分類時,既有兩種模型的單獨運用又有兩種模型的聯(lián)合運用,并引入點門限玻爾茲曼機以提高分類性能。目前,醫(yī)生根據(jù)EEG診斷癲癇樣放電的準確率比機器診斷高,但隨著DL的應用,未來十年該優(yōu)勢可能消失。
(4)Tjepkema-Cloostermans等[50]基于EEG,聯(lián)合運用CNN和RNN探測癲癇樣放電,其靈敏度和特異性分別為47.4%和98.0%,該研究認為DL將使人工智能探測癲癇樣放電的準確度與人類專家不相上下。
(5)CNN探測P300腦電信號性能優(yōu)越,Liu等[51]在標準CNN基礎上引入批量歸一化(batch normalization,BN)方法減少過擬合,線性整流函數(shù)(rectified linear unit,ReLU)避免梯度消失提高運算效率,研究表明,改進的算法提高了P300腦電信號特征識別率。
(6)Bresch等[52]融合CNN和LSTM做睡眠分期,其分期結果與專家人工判讀一致性Kappa系數(shù)為0.73,具有良好的魯棒性。
腦電數(shù)據(jù)分類算法多樣,但沒有一種算法具有絕對優(yōu)勢,只有針對具體樣本數(shù)據(jù)選擇合適的分類算法才能達到最佳分類效果。選擇分類器時需考慮數(shù)據(jù)維數(shù)和偏差方差平衡兩種因素。特征向量的維數(shù)越高,所需訓練數(shù)據(jù)量相應呈幾何倍數(shù)增長。而分類器在偏差方差的取舍上傾向于高偏差低方差。
目前,分類器算法的發(fā)展趨勢是各種分類器算法的綜合運用[2]。6種腦電信號分類器算法優(yōu)缺點比較見表3。
表3 腦電信號分類器算法比較
BCI在人腦與外部設備之間建立直接連接通路,實現(xiàn)這一連接的設備主要有EEG和皮層腦電圖(electrocorticography,ECoG)等,其中,EEG作為一種無創(chuàng)生理信號檢測方法得到廣泛研究和應用。BCI系統(tǒng)依賴EEG判斷人腦發(fā)出的指令,EEG信號的采集、數(shù)據(jù)處理和模式分類決定BCI的系統(tǒng)性能,其中,EEG數(shù)據(jù)處理包括數(shù)據(jù)預處理和特征提取:數(shù)據(jù)處理影響后續(xù)模式分類的速度和準確率;分類器的選擇決定模式分類結果。
腦電信號是復雜的非平穩(wěn)隨機信號,腦電數(shù)據(jù)的分析和處理是BCI系統(tǒng)的關鍵技術,也是研究的重難點,決定了BCI系統(tǒng)的的發(fā)展前景。近年來,腦電數(shù)據(jù)的預處理、特征提取和分類識別方法得到廣泛深入研究,多種腦電數(shù)據(jù)處理方法被應用于BCI系統(tǒng)。在實踐中選擇何種數(shù)據(jù)處理方法由研究對象決定,即根據(jù)研究所需腦電數(shù)據(jù)的特征和數(shù)據(jù)量的大小決定采用的數(shù)據(jù)預處理和特征提取方法,多種分類識別方法的綜合運用是腦電信號模式識別的發(fā)展趨勢。
DL算法是機器學習的新領域,在腦電信號的分類識別中優(yōu)勢明顯。傳統(tǒng)機器學習方法需耗費大量時間做特征提取和選擇,損失部分有用信息。DL直接采用原始腦電數(shù)據(jù)作為輸入,無需做特征提取和選擇,實現(xiàn)在最大程度上保留原始腦電信息。同時,DNN架構多樣,需根據(jù)具體研究對象選擇合適的神經網(wǎng)絡,確認網(wǎng)絡架構后需大量原始數(shù)據(jù)進行訓練和調參,涉及大量復雜運算,如何縮短DL模型訓練時間是DNN的研究方向之一。作為腦電數(shù)據(jù)分析分類的研究熱點,隨著臨床大量電生理數(shù)據(jù)的獲取,DL將得到更為廣泛的研究和應用。