官金安,高 煒, 周 到,高軍峰
( 1 中南民族大學(xué) 生物醫(yī)學(xué)工程學(xué)院, 武漢 430074; 2 中南民族大學(xué) 認(rèn)知科學(xué)國(guó)家民委重點(diǎn)實(shí)驗(yàn)室, 武漢 430074)
傳統(tǒng)的生物識(shí)別方法,如指紋識(shí)別雖然應(yīng)用較為廣泛,但是這些信息存在容易被竊取、復(fù)制等安全性問(wèn)題.而近年來(lái)有關(guān)腦電圖(EEG)的研究驗(yàn)證了腦電信號(hào)可以被用做一種較安全的身份驗(yàn)證的生物識(shí)別方式[1-3].這些研究還為腦-機(jī)接口(BCI)的應(yīng)用開(kāi)辟了新的疆界.
基于EEG的身份識(shí)別系統(tǒng),同其它BCI一樣,對(duì)采集到的EEG信號(hào)的特征提取是系統(tǒng)中重要一環(huán),提取特征的好壞直接關(guān)系到整個(gè)系統(tǒng)的表現(xiàn).由于EEG信號(hào)的非平穩(wěn)性,常用特征提取方法在提取EEG信號(hào)特征時(shí)都有各自的局限性.如時(shí)域或頻域特征直接選取方法,特征提取的優(yōu)劣與研究及使用者經(jīng)驗(yàn)關(guān)系密切,且處理過(guò)程對(duì)設(shè)備要求較高,提供的信息量也較少;主成分分析法(PCA)雖然可以保留EEG信號(hào)矩陣的主要信息,但是會(huì)不可避免的造成信息損失,且在信噪比(SNR)較低的情況下的表現(xiàn)并不好;而共空間模式(CSP)通過(guò)尋找可以使兩類信號(hào)區(qū)別最大的投影方向,來(lái)使兩類EEG信號(hào)樣本的特征增強(qiáng)[4],在用戶識(shí)別這種多分類中并不適用.傳統(tǒng)特征提取方式的不足限制了基于EEG的身份驗(yàn)證系統(tǒng)的實(shí)時(shí)性和易用性,文獻(xiàn)[1]的方法需要記錄61導(dǎo)聯(lián)的腦電信號(hào),文獻(xiàn)[2]中的方法需要使用時(shí)長(zhǎng)3min的腦電信號(hào),且為提取特征參數(shù),均需生成高階自回歸模型,降低了系統(tǒng)的實(shí)時(shí)性.
而進(jìn)年來(lái)發(fā)展迅速的非監(jiān)督特征學(xué)習(xí)方法可以學(xué)習(xí)到樣本的深層特征,且特征學(xué)習(xí)過(guò)程可以由人工神經(jīng)網(wǎng)絡(luò)(ANN)自動(dòng)完成,訓(xùn)練用于特征提取ANN時(shí)不需要樣本的標(biāo)簽信息[5].常見(jiàn)非監(jiān)督特征學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)有多層限制玻爾茲曼機(jī)(RBM)、自編碼機(jī)(Auto-encoder)、稀疏編碼模型(Sparse Coding Model)等,這些方法在圖像處理及自然語(yǔ)言處理中取得了良好的特征提取效果[6-8].
本研究為優(yōu)化基于EEG信號(hào)的生物識(shí)別系統(tǒng)特征提取方法,引入了非監(jiān)督特征學(xué)習(xí)方法,并改善了傳統(tǒng)自編碼機(jī)的網(wǎng)絡(luò)結(jié)構(gòu).設(shè)計(jì)實(shí)現(xiàn)了一個(gè)由6個(gè)相對(duì)獨(dú)立的神經(jīng)節(jié)組成的多神經(jīng)節(jié)人工神經(jīng)網(wǎng)絡(luò)(每個(gè)神經(jīng)節(jié)均為一個(gè)較小規(guī)模的自編碼機(jī)),并將之應(yīng)用在基于模擬閱讀腦電誘發(fā)模式的身份識(shí)別方法中,實(shí)現(xiàn)腦電信號(hào)的特征提取.
模擬閱讀腦-機(jī)接口系統(tǒng)及其腦電誘發(fā)模式由中南民族大學(xué)腦-機(jī)接口實(shí)驗(yàn)室設(shè)計(jì)實(shí)現(xiàn),該BCI系統(tǒng)通信基于視覺(jué)誘發(fā)事件相關(guān)電位的N2和P3成分,采用基于“模擬自然閱讀誘發(fā)電位”模式來(lái)構(gòu)建虛擬鍵盤,用戶像閱讀文本句子那樣,從視覺(jué)物理刺激的目標(biāo)符號(hào)中獲取信息[9,10].該系統(tǒng)使用的靶標(biāo)刺激如圖1-a所示(中央有深色實(shí)線),非靶標(biāo)刺激如圖1-b所示,刺激字符串如圖1-c所示.實(shí)驗(yàn)中在分辨率為1024pix×768pix的黑色屏幕中央設(shè)置一個(gè)30pix×30pix的小窗,字符串中一個(gè)字符劃過(guò)小窗的時(shí)間為150ms,且每個(gè)試次所用字符串中的靶標(biāo)刺激的位置不固定,以降低刺激的可預(yù)測(cè)性來(lái)提高信號(hào)中P3成分的幅值,字符串移動(dòng)如圖 2 所示.
圖1 靶標(biāo)刺激,非靶標(biāo)刺激及刺激字符串Fig.1 Target stimulus, non-target stimulus & stimuli line
圖2 刺激字符串移動(dòng)過(guò)程Fig.2 the movement of stimuli line
該方法可以有效抑制外源性反應(yīng),減弱視線移動(dòng)帶來(lái)的眼電干擾,還可以減輕刺激物閃爍引起的使用疲勞,有助于提高特征信號(hào)的識(shí)別精度,該系統(tǒng)的通信速率可以超過(guò)90bit/min[11].
本次實(shí)驗(yàn)中,我們共記錄了5名受試者(在讀碩士研究生,年齡22~25歲,男性2名,女性3名,視力校正后為 5.0,均為右利手并自愿參加實(shí)驗(yàn))各400個(gè)試次的模擬閱讀實(shí)驗(yàn)?zāi)X電信號(hào)數(shù)據(jù).記錄過(guò)程使用荷蘭Biosemi公司的Biosemi Active Two 腦電信號(hào)采集系統(tǒng),信號(hào)采樣頻率設(shè)為2048Hz,按照國(guó)際標(biāo)準(zhǔn)導(dǎo)聯(lián) 10-20 方法安放電極,記錄 32 通道腦電信號(hào),以雙乳突的平均電位作為參考電位.實(shí)驗(yàn)在面積為20m2的腦-機(jī)接口實(shí)驗(yàn)室進(jìn)行,周遭安靜,實(shí)驗(yàn)后剔除受試者報(bào)告眨眼及注意力分散的試次.數(shù)據(jù)記錄完成后,依次對(duì)其進(jìn)行預(yù)處理,建制訓(xùn)練集與測(cè)試集,完成特征提取,最后訓(xùn)練和測(cè)試分類器驗(yàn)證特征提取效果[12].
模擬閱讀實(shí)驗(yàn)中采集到的腦電信號(hào)經(jīng)顱骨及皮膚衰減、混疊而變得很微弱,同時(shí)信號(hào)常受到外界電磁場(chǎng),肌電的干擾.因此,為減少干擾信號(hào),以提高腦-機(jī)接口信號(hào)的信噪比,我們對(duì)數(shù)據(jù)集進(jìn)行以下的預(yù)處理.
(1)去均值:每個(gè)樣本減去其平均值.去均值后腦電信號(hào)均值為零,峰值在30μV以下,降低了輸入信號(hào)的幅值,信號(hào)可用于預(yù)處理的其他過(guò)程.
(2)30Hz低通濾波:相關(guān)實(shí)驗(yàn)研究標(biāo)明,由靶刺激誘發(fā)的腦電信號(hào)能量集中在30Hz以下,故對(duì)腦電信號(hào)進(jìn)行30Hz低通濾波.
(3)4分頻降采樣:為減少數(shù)據(jù)存儲(chǔ)空間,提高后期特征學(xué)習(xí)及模式分類處理速度,我們對(duì)各通道的腦電數(shù)據(jù)進(jìn)行4分頻降采樣,采樣頻率由2048Hz降至512Hz,根據(jù)Nyquist采樣定理,不會(huì)產(chǎn)生信號(hào)混疊失真.
在模擬閱讀腦電實(shí)驗(yàn)?zāi)J较?,受試者在接受靶視覺(jué)刺激后100~400ms的時(shí)段中的ERP特征明顯.實(shí)驗(yàn)中,我們發(fā)現(xiàn)多名受試者PO3、O1、 Oz、 O2、 PO4、 P4、 P8、CP6通道記錄樣本疊加平均后N2和P3成分較其他通道明顯,于是我們選取各受試者這些通道在上述時(shí)段的信號(hào)作為其特征.數(shù)據(jù)儲(chǔ)存格式為8×150×400(通道×單通道信號(hào)數(shù)據(jù)點(diǎn)數(shù)×試次).各受試者P8通道100試次的特征信號(hào)樣本疊加平均后的波形,如圖 3 所示.可以看出各名受試者的ERP信號(hào)的N200和P300成分的幅值存在明顯差異,依據(jù)選取的特征信號(hào)實(shí)現(xiàn)身份識(shí)別具有一定的可行性.
圖3 5名受試者P8通道疊加特征信號(hào)Fig.3 the P8 channel mean waves of the five subjects
1.5.1 基于多節(jié)人工神經(jīng)網(wǎng)絡(luò)的腦電信號(hào)特征學(xué)習(xí)方法
傳統(tǒng)的自編碼機(jī)通常由三層或多層的人工神經(jīng)網(wǎng)絡(luò)構(gòu)成,多層自編碼機(jī)結(jié)構(gòu)如圖4所示.它通常包含編碼層和解碼層兩部分,編碼層的高層較輸入層含有較少的節(jié)點(diǎn),該人工神經(jīng)網(wǎng)絡(luò)的輸入與訓(xùn)練目標(biāo)相同,即通過(guò)調(diào)整連接權(quán)值使得網(wǎng)絡(luò)的輸入與輸出間誤差達(dá)到最小.網(wǎng)絡(luò)訓(xùn)練完成后,將樣本輸入,取最高解碼層節(jié)點(diǎn)的輸出作為特征向量,即完成深度特征學(xué)習(xí),此類神經(jīng)網(wǎng)絡(luò)隨著層數(shù)的增加,訓(xùn)練越困難,訓(xùn)練耗時(shí)越長(zhǎng).
圖4 傳統(tǒng)自編碼機(jī)結(jié)構(gòu)Fig.4 The structure of auto-encoder
本研究為實(shí)現(xiàn)模擬閱讀誘發(fā)腦電信號(hào)的非監(jiān)督特征學(xué)習(xí)設(shè)計(jì)了一個(gè)包含6個(gè)神經(jīng)節(jié)的神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖 5 所示.每個(gè)神經(jīng)節(jié)均為一個(gè)3層BP神經(jīng)網(wǎng)絡(luò),輸入層200個(gè)神經(jīng)元,隱層25個(gè),輸出層200個(gè),整個(gè)多神經(jīng)節(jié)ANN共含1200個(gè)輸入層節(jié)點(diǎn),150個(gè)隱層節(jié)點(diǎn),1200個(gè)輸出層節(jié)點(diǎn).
圖5 多神經(jīng)節(jié)人工網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 The structure of multi-ganglion ANN
訓(xùn)練該人工神經(jīng)網(wǎng)絡(luò)時(shí),對(duì)于訓(xùn)練集一個(gè)模擬閱讀腦電信號(hào)樣本(按8×150大小的矩陣儲(chǔ)存),我們先將之按列拼接成一個(gè)向量(1×1200),然后將其平均分成六段并分別作為各神經(jīng)節(jié)的訓(xùn)練集樣本.各神經(jīng)節(jié)以其訓(xùn)練集樣本為輸入及訓(xùn)練目標(biāo),訓(xùn)練迭代次數(shù)為2000次,訓(xùn)練結(jié)束后最小均方誤差(MSE)小于0.01,訓(xùn)練函數(shù)選用帶動(dòng)量的梯度下降算法以盡量避免局部最小問(wèn)題在網(wǎng)絡(luò)訓(xùn)練中出現(xiàn).
該多神經(jīng)節(jié)ANN訓(xùn)練完成后,將訓(xùn)練集和測(cè)試集的每一試次數(shù)據(jù)分別依上述方法拼接成一維信號(hào)向量,輸入訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),然后提取各神經(jīng)節(jié)隱層節(jié)點(diǎn)的輸出值,作為特征向量,這樣原腦電信號(hào)樣本的就由8×150降維至1×150,完成特征提取.
在訓(xùn)練過(guò)程中,神經(jīng)元節(jié)點(diǎn)的連接被限制在神經(jīng)節(jié)內(nèi)部,這樣訓(xùn)練過(guò)程中,共有2×200×25×6個(gè)連接權(quán)值需要調(diào)整,而包含相同數(shù)目神經(jīng)元的傳統(tǒng)三層自編碼機(jī)有2×1200×150個(gè)連接權(quán)值需要調(diào)整,后者為前者的6倍(未包含神經(jīng)元輸入偏置的權(quán)值).這樣就減少了網(wǎng)絡(luò)的訓(xùn)練時(shí)間,也避免了間隔較遠(yuǎn),關(guān)系不大的神經(jīng)元之間連接.
1.5.2 支持向量機(jī)模式識(shí)別
支持向量機(jī)(SVM)可以通過(guò)其核函數(shù)將線性不可分的數(shù)據(jù)映射至高維特征空間,然后尋找最優(yōu)分類超平面將數(shù)據(jù)分類,該方法以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),根據(jù)有限的樣本信息, 在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的泛化能力[10].
本研究使用Libsvm工具箱來(lái)實(shí)現(xiàn)支持向量機(jī)對(duì)數(shù)據(jù)的分類,即是求C-SVC問(wèn)題的最優(yōu)解,核函數(shù)選用徑向基核函數(shù)[13],訓(xùn)練過(guò)程采用三折的交叉驗(yàn)證對(duì)參數(shù)C和γ進(jìn)行格型尋優(yōu) (C= 2-5, 2-4, 2-3, …, 23, 24, 25;γ= 2-5, 2-4, 2-3, …, 23, 24, 25),以找到SVM的最佳參數(shù)設(shè)置.
為檢測(cè)多神經(jīng)節(jié)ANN的特征學(xué)習(xí)效果,我們先將之應(yīng)用于基本的二分類問(wèn)題中,即對(duì)5名受試者中的任2名的特征信號(hào)進(jìn)行特征學(xué)習(xí)及分類.為與之對(duì)比,我們依次對(duì)兩名受試者通道PO3、O1、Oz、O2、PO4、P4、P8、CP6的時(shí)域特征信號(hào),使用SVM進(jìn)行模式分類.訓(xùn)練集包含兩名受試者各50%的隨機(jī)選取的樣本,測(cè)試集為余下樣本.此項(xiàng)測(cè)試共進(jìn)行10次,每次訓(xùn)練集和測(cè)試集都重新建制,以檢測(cè)特征學(xué)習(xí)算法的穩(wěn)定性.結(jié)果對(duì)比如圖 6 所示,使用左斜線()標(biāo)注的是采用單通道時(shí)域特征時(shí)最低平均分類正確率,右斜線(/)標(biāo)注的是采用單通道時(shí)域特征時(shí)最高平均分類正確率,上方用箭頭標(biāo)明對(duì)應(yīng)通道.白色柱形為使用多神經(jīng)節(jié)ANN提取的特征向量的分類正確率.坐標(biāo)橫軸為選取的受試者,例:S1/S2為受試者S1與S2特征信號(hào)的分類.可以看出對(duì)五名受試者中的任兩名而言,用以識(shí)別的最佳通道并不相同,且最優(yōu)與最次之間差別顯著(5名受試者,成對(duì)t檢驗(yàn),p值<0.025),故使用固定通道的特征信號(hào)來(lái)實(shí)現(xiàn)五名受試者中任兩名的區(qū)分不可行.但是當(dāng)使用多神經(jīng)節(jié)ANN對(duì)選取的8通道腦電信號(hào)進(jìn)行特征學(xué)習(xí)后,所得到的特征向量,僅在受試者S2與S4之間的分類正確率略低于最優(yōu)單通道的分類正確率,且在這10種受試者組合的平均分類正確率達(dá)到92%,證明使用多神經(jīng)節(jié)ANN學(xué)習(xí)到的特征在此次二分類實(shí)驗(yàn)中是有效的.
圖6 任兩名受試者使用單通道時(shí)域特征及多神經(jīng)節(jié)ANN提取的特征分類正確率對(duì)比Fig.6 The comparison of classification accuracies for each two subjects obtained when using single-channel-temporal features and multi-ganglion ANN extracted features
此時(shí)為多分類問(wèn)題,我們建制的訓(xùn)練集中包含5名受試者各50%隨機(jī)選取的特征信號(hào)樣本,剩余樣本用做測(cè)試集.我們比較了由多神經(jīng)節(jié)ANN從1試次特征信號(hào)樣本,2試次、5試次及10試次疊加特征信號(hào)樣本學(xué)習(xí)到的特征向量的分類正確率,各進(jìn)行10次實(shí)驗(yàn),每次訓(xùn)練集和測(cè)試集均重新建制.作為參照,我們還直接依次對(duì)各疊加方案的單通道樣本進(jìn)行模式分類.結(jié)果對(duì)比圖如圖7 所示.可以看出對(duì)5名受試者的識(shí)別分類實(shí)驗(yàn)中若使用單通道的時(shí)域特征信號(hào)在不同疊加次數(shù)的最佳通道并不相同,且最優(yōu)與最次之間差別顯著(成對(duì)t檢驗(yàn),p值<0.025),而且即便是最優(yōu)通道也僅在疊加試次數(shù)達(dá)到10次時(shí),對(duì)5名受試者的識(shí)別率才達(dá)到80%,且試次疊加次數(shù)過(guò)多會(huì)降低系統(tǒng)的實(shí)用性.對(duì)于使用由多神經(jīng)節(jié)ANN學(xué)習(xí)得到的腦電信號(hào)特征,5名受試者2試次疊加樣本的分類正確率已經(jīng)達(dá)到80%,當(dāng)疊加試次數(shù)達(dá)到5次時(shí),正確率已經(jīng)超過(guò)90%,在實(shí)用中,可以將此疊加次數(shù)設(shè)為5次.最后,我們又對(duì)5名受試者5試次疊加的特征信號(hào)樣本使用傳統(tǒng)的三層自編碼機(jī)提取特征,并使用SVM進(jìn)行分類.與多神經(jīng)節(jié)ANN 10次對(duì)比實(shí)驗(yàn)結(jié)果如表 1 所示.
在訓(xùn)練時(shí)間和提取的特征的分類正確率上(四核2.5GHz Inter i5 處理器,6GB RAM),多神經(jīng)節(jié)ANN都有顯著優(yōu)勢(shì),訓(xùn)練時(shí)間減少到三層自編碼機(jī)的10%左右,分類正確率也有明顯提升(t檢驗(yàn),p值<0.025).
圖7 不同疊加次數(shù)下的分類正確率對(duì)比Fig.7 The comparison of classification accuracies obtained whenaveraging different number of EEG trials.
實(shí)驗(yàn)序號(hào)多神經(jīng)節(jié)ANN訓(xùn)練時(shí)間/s分類正確率/%三層自編碼機(jī)訓(xùn)練時(shí)間/s分類正確率/%178.794.5956.783.5292.491.0966.287.0377.287.5965.683.0482.887.0977.885.5570.391.5956.187.0670.094.0931.582.5773.890.0910.286.0862.692.0887.584.0985.094.5910.083.01077.595.0949.686.5均值77.091.7941.184.8標(biāo)準(zhǔn)差8.52.929.81.8
(1)本研究設(shè)計(jì)的多神經(jīng)節(jié)ANN在對(duì)5名受試者的5次疊加的特征信號(hào)的特征學(xué)習(xí)中取得了良好的效果,特征提取過(guò)程可由人工神經(jīng)網(wǎng)絡(luò)自動(dòng)完成,提取的特征優(yōu)于單通道的時(shí)域特征.該類型人工神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)間和最后的分類正確率上都優(yōu)于傳統(tǒng)的三層自編碼機(jī),且對(duì)采用單通道特征信號(hào)識(shí)別時(shí)存在的最優(yōu)通道不固定,多類識(shí)別正確率過(guò)低的問(wèn)題有所改進(jìn).
(2)在本實(shí)驗(yàn)?zāi)J较拢?試次的特征信號(hào)總時(shí)長(zhǎng)為1.5s,使用通道數(shù)僅為8個(gè),對(duì)數(shù)據(jù)的儲(chǔ)存與傳輸要求不高,且多神經(jīng)節(jié)ANN中的各神經(jīng)節(jié)的訓(xùn)練是相對(duì)獨(dú)立的,實(shí)用中可以通過(guò)并行處理技術(shù),進(jìn)一步提高訓(xùn)練速度.該方法為以腦電信號(hào)為特征的身份識(shí)別系統(tǒng)提供了一種可行的特征提取方式.
參 考 文 獻(xiàn)
[1] Ramaswamy Palaniappan,Danilo P Mandic. Biometrics from Brain Electrical Activity:A Machine Learning Approach [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(4):736-742.
[2] Fei Su,Liwen Xia,et al. Evaluation of recording factors in EEG-based personal identification:A vital step in real implementations [C]// IEEE. International Conference on Systems,Man and Cybernetics. Istanbul:IEEE,2010:3861-3866.
[3] Hideaki Touyama,Michitaka Hirose. Non-Target Photo Images in Oddball Paradigm Improve EEG-Based Personal Identification Rates [C]//IEEE. 30th Annual International IEEE EMBS Conference. Vancouver:IEEE,2008:4118-4121.
[4] Koles Z J,Lind J C,Soong A C K. Spatio-temporal decomposition of the EEG:a general approach to the isolation and localization of sources [J]. Electroenceph clinical Neurophysiol,1995,95(4):219-230
[5] Hugo Larochelle,Yoshua Bengio,et al.Exploring Strategies for Training Deep Neural Networks [J]. Journal of Machine Learning Research,2009,10(1):1-40.
[6] Hinton G E,Salakhutdinov R R. Reducing the Dimensionality of Data with Neural Networks [J]. Science,2006,313(5786):504-507.
[7] Mitchell B,Sheppard J,et al. Deep Spatiotemporal Feature Learning with Application to Image Classification [C]//ICMLA. Ninth International Conference on Machine Learning and Applications. Washington:ICMLA,2010:883-888.
[8] Dong Yu,Hinton G,et al. Introduction to the Special Section on Deep Learning for Speech and Language Processing [J]. IEEE Transactions on Audio,Speech,and Language Processing,2012,20(1):4-6.
[9] 程海英,楊仲樂(lè). 與選擇性注意字符的細(xì)微結(jié)構(gòu)相關(guān)的早內(nèi)源性成分[J]. 華中師范大學(xué)學(xué)報(bào):自然科學(xué)版,1997,31(3):299-303.
[10] 官金安,王艷鳳,陳亞光. 特征篩選對(duì)腦-機(jī)接口信號(hào)單次提取精度的影響[J]. 華中師范大學(xué)學(xué)報(bào):自然科學(xué)版,2006,40(2):193-196.
[11] 官金安,陳亞光. 腦控雙頁(yè)虛擬鍵盤的設(shè)計(jì)與性能分析[J]. 中國(guó)臨床康復(fù),2006,10(9):124-126.
[12] 官金安,荊漢娜,李 娜.“模擬閱讀”腦-機(jī)接口信號(hào)的核Fisher分類[J].中南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2013,32(2):87-91.
[13] Chang C-C,Lin C-J. LIBSVM:a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):1-27.
中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版)2014年4期