張 科 李曉歐 周志勇/ .上海諾誠電氣股份有限公司.上海健康醫(yī)學(xué)院醫(yī)療器械學(xué)院.華東理工大學(xué)
基于SVM集成學(xué)習(xí)的認知障礙腦電分類研究
張 科1李曉歐2周志勇3/ 1.上海諾誠電氣股份有限公司2.上海健康醫(yī)學(xué)院醫(yī)療器械學(xué)院3.華東理工大學(xué)
目的:提出了一種基于小波特征提取的支持向量機集成分類算法,用于腦卒中后認知障礙病人的識別。方法:首先由Infomax獨立分量分析算法去除腦電信號中的干擾成分;然后利用db4小波基提取認知電位P300特征波,并進行疊加平均;最后將特征量基于Bagging算法送入支持向量機基分類器進行集成學(xué)習(xí),通過最大投票法得到分類結(jié)果。結(jié)果:實驗結(jié)果表明,該算法分類效果好,平均分類精度為85.71%。結(jié)論:較單個支持向量機分類器,識別性能好,實現(xiàn)了認知障礙腦電信號的有效分類。
認知障礙;小波變換;支持向量機集成;腦計算機接口
腦卒中是指因各種誘發(fā)因素引起腦內(nèi)動脈狹窄、閉塞或破裂,而造成腦血液循環(huán)障礙,臨床上表現(xiàn)為腦功能障礙的癥狀和體征。我國現(xiàn)有700萬例腦卒中患者,每年新發(fā)病例250萬,并以每年10%的速度遞增。腦卒中不僅引起運動、言語、吞咽等功能障礙,更嚴重的是導(dǎo)致腦的認知障礙。認知障礙嚴重影響了患者的日常生活活動能力,比起正常人尤其關(guān)聯(lián)工作記憶的損失。工作記憶被用于信息的臨時存儲和控制,對長期記憶、語言和執(zhí)行能力等方面起到關(guān)鍵的作用。因此,認知障礙的早期診斷和早期干預(yù)對患者的身體及心理功能恢復(fù),預(yù)防癡呆有著特別重要的意義,這就需要對認知障礙進行準(zhǔn)確的識別,以指導(dǎo)康復(fù)治療,也有助于判斷療效和預(yù)后[1-2]。
目前認知障礙的臨床診斷主要由一些神經(jīng)心理測試量表來完成,如MMSE量表。量表的最大局限性是主觀性太強,只能作為診斷的重要參考資料,在臨床診斷上還需要結(jié)合神經(jīng)電生理學(xué)等檢查結(jié)果,如基于事件相關(guān)電位的腦電信號就可以很好地反映認知障礙,其敏感性遠遠超出量表評分。人在不同的認知活動中,大腦動力學(xué)運動特性不同,認知電位也不同,患有認知功能缺陷的病人在認知活動時的認知電位和正常人的有顯著差別,認知障礙對應(yīng)了腦電信號潛伏期延長、幅度下降、節(jié)律不對稱等抑制現(xiàn)象,通過比較可以評判其認知功能[3]。
一些研究已基于腦電信號利用有效的算法用于認知障礙的自動識別。Lehmann等利用線性判別分析、神經(jīng)網(wǎng)絡(luò)、支持向量機去識別不同程度認知障礙的腦電信號[4];Dauwels等利用線性判別分析、二次判別分析完成認知障礙腦電的分類,他們都獲得了很好的分類效果[5]。在這些基于腦電的分類算法中,基于結(jié)構(gòu)風(fēng)險最小化的SVM算法分類效果最好,尤其適合于解決高維、非線性、小樣本問題。如果將其作為基分類器,再通過集成學(xué)習(xí)可提高整體性能,對于一個應(yīng)用問題來說,會得到更好的解決,這就是支持向量機集成(Support Vector Machine Ensemble, SVME),SVME方法是指按照一定規(guī)則將有限個子支持向量機的結(jié)果結(jié)合起來,以便對新樣本進行分類預(yù)測的學(xué)習(xí)算法。通過SVME,可以在一定程度上避免支持向量機本身的模型選擇問題,并能獲得比單個支持向量機更好的泛化性能[6-7]。
獨立分量分析(Independent Component Analysis, ICA)和小波變換可用于抽取參數(shù)進行腦電信號的分析和分類,提高基分類器即各個支持向量機的訓(xùn)練效率。ICA是一種盲源分離算法,可從記錄信號中抽取獨立源成分[8]。小波變換具有多分辨率分析的特點,可以很好的保留相關(guān)頻帶的小波系數(shù),通過小波重構(gòu),實現(xiàn)腦電特征提取。
本文基于24位高精度腦電信號采集系統(tǒng)記錄誘發(fā)腦電信號,利用ICA算法預(yù)處理認知障礙病人和正常人基于工作記憶任務(wù)的P300信號,小波特征被分別抽取,這些特征和基于Bagging算法的SVME分類器用于完成正常對照和卒中患者的分類,以指導(dǎo)認知評定。
用于認知障礙識別的腦電信號采集系統(tǒng)主要分為2個部分,一個是系統(tǒng)硬件,包括采集腦電電極、信號放大電路、主控電路、信號采集和處理主機。放大電路與主控電路采用光纖連接,屏蔽了工頻干擾,且光纖傳輸數(shù)據(jù)帶寬較普通電纜寬,數(shù)據(jù)傳輸速率快、穩(wěn)定、安全。主控電路采用USB和上位主機連接,把放大電路采集到的腦電數(shù)據(jù)上傳到電腦。另一個是用戶系統(tǒng),包括刺激主機和視覺刺激界面。通過安裝在刺激主機顯示器上的光敏三極管探測誘發(fā)腦電的刺激變化,光敏三極管輸出電信號經(jīng)放大、差分信號轉(zhuǎn)換,通過RS-485通訊接口送至腦電信號采集主機,實現(xiàn)腦電刺激與采集的同步。刺激內(nèi)容由編寫好的N-back WM Task軟件施加,每個任務(wù)包含120個試驗分成3組以便被試者有兩個休息時間段,盡量減少因多次重復(fù)刺激被試者產(chǎn)生神經(jīng)系統(tǒng)的疲勞和適應(yīng)性,而導(dǎo)致實驗誤差。每次刺激顯示時間為500ms,刺激間隔為2500ms??紤]到病人在臨床實驗中的配合度和執(zhí)行情況,選擇1-back工作記憶任務(wù)。刺激內(nèi)容為“1”“2”“3”“4”四個阿拉伯?dāng)?shù)字,刺激順序采用偽隨機方式,靶和非靶的概率相等。1-back任務(wù)中當(dāng)前靶刺激和前一個刺激內(nèi)容一致時即為靶刺激,靶刺激出現(xiàn)時被試者需要按鍵確認。
來自復(fù)旦大學(xué)附屬華東醫(yī)院的首發(fā)急性缺血性腦卒中患者和正常對照各13例參與研究,年齡在50歲左右,具有正常的視覺功能且右手利。記錄18導(dǎo)聯(lián)(EOG1,EOG2,Fp1,Fp2,F3,F4,F7,F8,Fz,C3, Cz,C4,P3,Pz,P4,O1,Oz和O2)的誘發(fā)電位,電極安放采用標(biāo)準(zhǔn)10/20系統(tǒng),采樣頻率為256Hz。
3.1 ICA算法
腦電信號微弱,易受其他電信號和偽跡干擾,如50Hz工頻干擾,線路噪聲,眼電、肌電、心電等生理信號的干擾。ICA算法已應(yīng)用于腦電數(shù)據(jù),以抽取更有效地信息特征,提高分類識別的精度。ICA的數(shù)學(xué)含義是假設(shè)誘發(fā)腦電原始信號為,L為導(dǎo)聯(lián)數(shù)。ICA的任務(wù)是在無先驗知識的前提下尋求分離矩陣W,得到,使中的各分量盡可能地相互統(tǒng)計獨立,從而獲得獨立分量源的估計。ICA有不同的優(yōu)化判據(jù)和尋優(yōu)算法,其中Infomax算法更能可靠地找到功能鮮明的獨立成分,Infomax算法是一種在前向神經(jīng)網(wǎng)絡(luò)中基于熵最大化的自組織學(xué)習(xí)算法[9]。
3.2 小波變換
小波變換基函數(shù)是由一個基本小波通過平移和伸縮得到的,即:
其中,a為尺度參數(shù),b為位置參數(shù)??梢钥闯?,當(dāng)減小時,時寬減小,頻寬增大,且的窗口中心向頻域增大方向移動。給定一個基本小波函數(shù),則一維信號的連續(xù)小波變換是將信號變換到時間─尺度域上。小波基函數(shù)有很多,此處選擇db4,它與腦電信號相似,具有對稱、平滑和緊支撐性,有近最優(yōu)的時頻解,對腦電信號分解和重構(gòu)的效果較好[10]。
3.3 Bagging集成學(xué)習(xí)
Bagging算法隨機地從大小為的原始訓(xùn)練集中抽取個樣本作為此回訓(xùn)練的集合,以此增加分量學(xué)習(xí)器集成的差異度,從而提高泛化能力。Bagging算法對訓(xùn)練集的選擇是隨機的,各輪訓(xùn)練集之間相互獨立,Bagging算法的各個預(yù)測函數(shù)沒有權(quán)重,且可以并行生成。
Bagging算法的原理如下:
給定一數(shù)據(jù)集,基學(xué)習(xí)器為。如果輸入為,就通過來預(yù)測。假定有一個數(shù)據(jù)集序列,每個序列都由個與從同樣分布下得來的獨立觀察組成。任務(wù)是使用來得到一個更好的學(xué)習(xí)器,它比單個數(shù)據(jù)集學(xué)習(xí)器要強,這就要使用學(xué)習(xí)器序列。
如果是數(shù)值的,一個明顯的過程是用在上的平均取代,即通過(x,L)實現(xiàn),其中表示 L上的數(shù)學(xué)期望,表示的綜合。如果預(yù)測一個類,綜合的方法是最大投票或平均方法[11-12]。
在信號預(yù)處理階段,由基于Infomax的ICA算法分解原始腦電信號,得到18個獨立分量,根據(jù)四階累積量的峭度分析去除其中的噪聲干擾,提取出顯著特征分量。通過小波變換把與P300相關(guān)頻帶的小波系數(shù)保留,其余小波系數(shù)均置為零,進行小波重構(gòu)得到P300特征波。db4小波基既具有一定的平滑性又與事件相關(guān)電位P300的P2-N2-P3復(fù)合成分很相似,所以選用db4對腦電信號進行5層小波分解,然后將重構(gòu)信號進行疊加平均,得到如圖1所示的正常對照和卒中患者工作記憶任務(wù)P300波形??梢钥闯觯啾日φ?,在1-back任務(wù)中,卒中患者的P300特征波潛伏期顯著延長(t=-2.856, p<0.05)。如圖:P300波形對比
(a)正常對照1-back腦電波形
(b)卒中患者1-back腦電波形
進入分類識別階段后,通過Bootstrap重復(fù)采樣法先產(chǎn)生個訓(xùn)練子集,由每個訓(xùn)練子集產(chǎn)生對應(yīng)的基學(xué)習(xí)器。基學(xué)習(xí)器采用支持向量機方法,每一個子集訓(xùn)練一個支持向量機個體模型,這些支持向量機個體之間的差異越大,集成學(xué)習(xí)效果將會更好。在訓(xùn)練這些支持向量機模型時,支持向量機的核函數(shù)及其參數(shù)取相同的值。最后通過最大投票法得到的集成分類結(jié)果作為對不同被試人群的P300波形分類結(jié)果的輸出。表1給出正常對照和卒中患者工作記憶任務(wù)腦電信號的分類結(jié)果,可以看出采用SVME算法,分類精度得到了提高,且與基分類器的個數(shù)有關(guān)。
表1 不同算法的分類結(jié)果比較
本文采集正常對照和卒中患者工作記憶1-back任務(wù)的腦電數(shù)據(jù),進行數(shù)據(jù)預(yù)處理提高信噪比,利用小波變換提取認知電位P300作為分類特征量,最后實現(xiàn)了兩種不同人群腦電信號的定量分類,取得了較好的識別結(jié)果,平均分類精度85.71%,為腦機接口自動識別的實現(xiàn)打下了很好的方法基礎(chǔ)。SVME算法相比傳統(tǒng)支持向量機有著較好的識別性能,如何獲得差異最大的基分類器組和如何判別各個分類器之間的關(guān)系是后續(xù)研究的重點。
[1]曲福玲,魏英玲,劉忠良.腦卒中后輕度認知障礙的評定和康復(fù)新進展[J].中國康復(fù)理論與實踐.2009,12(15),1107-1110.
[2]張秋梅,高春華.運動視覺反饋訓(xùn)練對腦卒中偏癱患者上肢功能的影響[J].中華物理醫(yī)學(xué)與康復(fù)雜志.2014,36(4),278-280.
[3]Dockree P M, Robertson I H. Electrophysiological markers of cognitive deficits in traumatic brain injury:a review[J].International Journal of Psychophysiology.2011:1-8.
[4]Lehmann C, Koenig T, Jelic V et al. Application and comparison of classification algorithms for recognition of Alzheimer’s disease in electrical brain activity (EEG)[J].Journal of Neuroscience Methods.2007,161:342-350.
[5]Dauwels J, Vialatte F, Latchoumane C et al. EEG synchrony analysis for early diagnosis of Alzheimer’s disease: a study with several synchrony measures and EEG data sets[C].in 31st Annual International Conference of the IEEE EMBS.2009, pp.2224-2227.
[6]張宏達,王曉丹,白冬嬰等.一種基于凸殼算法的SVM集成方法[J].計算機工程.2008,34(17),28-30.
[7]張妤,王文劍,康向平.一種回歸SVM選擇性集成方法[J].計算機科學(xué).2008,35(4),178-180.
[8]Mijovi′c B, Vos M D, Gligorijevi′c I et al. Source separation from single-channel recordings by combining empirical-mode decomposition and independent component analysis[J]. IEEE Transactions on Biomedical Engineering.2010,57(9),2188-2196.
[9]Akhtar M T, Jung T P, Makeig S et al. Recursive independent component analysis for online blind source separation[C].in IEEE International Symposium on Circuits and Systems. 2012,pp. 2813-2816.
[10]PoornachandraS.Wavelet-based denoising using subband dependent threshold for EEG signals[J].Digital Signal Processing.2008,1:49-55.
[11]王麗麗.集成學(xué)習(xí)算法研究[D].廣西大學(xué)碩士學(xué)位論文.2006.
[12]李曉歐,范嬋嬌.集成學(xué)習(xí)在腦機接口分類算法中的研究.電子測量與儀器學(xué)報.2011,25(11),940-945.
閔行區(qū)產(chǎn)學(xué)研合作計劃項目(項目編號:2015MH119,2015MH129)。