楊鑫, 吳之南, 錢松榮
(復(fù)旦大學(xué) 通信科學(xué)與工程系,上海 200433)
基于雙向遞歸神經(jīng)網(wǎng)絡(luò)的單通道腦電圖睡眠分期研究
楊鑫, 吳之南, 錢松榮
(復(fù)旦大學(xué) 通信科學(xué)與工程系,上海 200433)
睡眠分期在神經(jīng)學(xué)和精神學(xué)等領(lǐng)域具有重要的研究與應(yīng)用價(jià)值。傳統(tǒng)的人工睡眠分期方法效率低下并且易受主觀因素影響。近年來(lái),隨著機(jī)器學(xué)習(xí)方法的發(fā)展,自動(dòng)睡眠分期方法取得了一定的成果,但還是存在諸多不足。為了有效地實(shí)現(xiàn)自動(dòng)睡眠分期,提出了基于雙向遞歸神經(jīng)網(wǎng)絡(luò)的單通道腦電圖睡眠分期方法。該方法充分發(fā)揮了雙向遞歸神經(jīng)網(wǎng)絡(luò)優(yōu)異的時(shí)序表達(dá)能力和特征學(xué)習(xí)能力。經(jīng)過(guò)實(shí)驗(yàn)得出,在單通道腦電圖的情況下,睡眠分期準(zhǔn)確率可達(dá)到95%。因此,該方法能夠有效地提高自動(dòng)睡眠分期的準(zhǔn)確率,具有良好的應(yīng)用前景。
睡眠分期; 遞歸神經(jīng)網(wǎng)絡(luò); 腦電圖
睡眠質(zhì)量是影響人體健康的重要因素之一。因此睡眠研究工作對(duì)于診斷和治療與睡眠相關(guān)的疾病具有重要的意義。1968年,Rechtschaffen A和Kales A在前人睡眠研究的基礎(chǔ)上,公布了R&K睡眠分期標(biāo)準(zhǔn)[1]。該標(biāo)準(zhǔn)量化了各種不同的睡眠狀態(tài),為之后的睡眠研究工作做出了重要的貢獻(xiàn)。2007年,美國(guó)睡眠醫(yī)學(xué)學(xué)會(huì)(American Academy of Sleep Medicine, AASM)制訂了新的睡眠分期準(zhǔn)則[2]。根據(jù)這一準(zhǔn)則,睡眠階段可為清醒期、非快動(dòng)眼期(non-rapid eye movement, NREM)和快動(dòng)眼期(rapid eye movement, REM)。其中NREM期又分為NREM1期、NREM2期和NREM3期。NREM3期代表R&K睡眠分期標(biāo)準(zhǔn)中的NREM3期和NREM4期,也稱為慢波睡眠期(slow wave sleep, SWS)。
目前權(quán)威的睡眠分期方法采用多導(dǎo)睡眠圖(polysomnographic, PSG)記錄的包括腦電圖(electroencephalogram, EEG),眼動(dòng)圖(electrooculogram, EOG),肌電圖(electromyography, EMG)等數(shù)據(jù)在內(nèi)的多種生理指標(biāo),由有經(jīng)驗(yàn)的醫(yī)師根據(jù)睡眠分期標(biāo)準(zhǔn)來(lái)得到最終的睡眠分期結(jié)果。但是通過(guò)PSG記錄生理指標(biāo),由醫(yī)師人工進(jìn)行睡眠分期這一方式存在諸多問(wèn)題。一方面由于PSG設(shè)備價(jià)格昂貴,使用方式復(fù)雜,因此只能在醫(yī)療機(jī)構(gòu)等特定場(chǎng)所使用,這可能無(wú)法真實(shí)反應(yīng)使用者的日常生理情況。另一方面,由于受主觀因素影響,人工睡眠分期正確率往往低于90%[3]。由于以上原因,尋求更加高效客觀并且準(zhǔn)確可靠的自動(dòng)睡眠分期方法具有重要的意義。
EEG信號(hào)是最主要的睡眠分期生理信號(hào),已有許多基于EEG的自動(dòng)睡眠分期研究。最近鄰算法 (K-nearest neighbor, KNN)[4],線性判別式分析 (linear discriminant analysis, LDA)[5],隱馬爾可夫模型 (hidden Markov model, HMM)[6]等方法均已被用于EEG睡眠分期。支持向量機(jī)(support vector machine, SVM)在解決小樣本、高緯度、局部最小等問(wèn)題上具有較好的效果,因此被廣泛應(yīng)用于EEG睡眠分期[7,8]。See和Liang通過(guò)三通道EEG信號(hào)的樣本熵和功率譜特征,其基于支持向量機(jī)的睡眠分期準(zhǔn)確率達(dá)到96.2%[7];Bajaj等基于最小二乘法支持向量機(jī)的EEG,使得睡眠分期正確率達(dá)到92.93%[8]。但是基于支持向量機(jī)的睡眠分期方法無(wú)法適用于大數(shù)據(jù)集,且EEG信號(hào)特征提取的好壞對(duì)正確率起到?jīng)Q定性的作用,這對(duì)于特征的抽象度和專業(yè)經(jīng)驗(yàn)都有較高的要求。
近年來(lái),人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)越來(lái)越多的應(yīng)用于自動(dòng)EEG睡眠分期領(lǐng)域[9]。其中,遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)不同于前饋神經(jīng)網(wǎng)絡(luò)(feedforward neural network, FNN)信息只能在輸入節(jié)點(diǎn)和輸出節(jié)點(diǎn)間單向流動(dòng)。作為動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),它的節(jié)點(diǎn)間存在不定向環(huán),因此具有記憶功能,適合于處理EEG信號(hào)等時(shí)間序列信號(hào)[10]。Hsu等提出的基于RNN的單通道EEG睡眠分期方法[11],正確率達(dá)到了87.2%。本文在此基礎(chǔ)上,提出了基于雙向遞歸神經(jīng)網(wǎng)絡(luò)(bidirectional recurrent neural network, BRNN)的單通道EEG睡眠分期方法。
對(duì)于睡眠分期而言,無(wú)法通過(guò)單一時(shí)刻的EEG信息判斷當(dāng)前時(shí)刻所處的睡眠階段,而是需要根據(jù)一段時(shí)間內(nèi)的EEG信息變化情況做出判斷。因此如引言所述,相比于SVM、前饋神經(jīng)網(wǎng)絡(luò)等其他睡眠分期方法,RNN具有反饋歷史信息的能力,能更好的處理EEG信號(hào)中隨時(shí)間變化的時(shí)序信息。在此基礎(chǔ)上,為了能夠同時(shí)獲取歷史信息和未來(lái)信息作為當(dāng)前時(shí)刻的參考,進(jìn)一步提高睡眠分期性能,本文依據(jù)Schuster和Paliwa提出的BRNN 網(wǎng)絡(luò)[12]建立了基于BRNN的單通道EEG睡眠分期方法,彌補(bǔ)了一般RNN只能依據(jù)過(guò)去時(shí)刻歷史信息的不足。
1.1 RNN
一個(gè)簡(jiǎn)單的3層RNN[13],如圖1(左)所示。
圖1 RNN結(jié)構(gòu)及其簡(jiǎn)化模型提出
除了輸入層、隱藏層和輸出層之外,其還有一個(gè)與隱藏層相連接的背景層。背景層保留隱藏層上一時(shí)刻的輸出值,并和輸入層一起作為該時(shí)刻隱藏層的輸入,圖1右圖為其簡(jiǎn)化模型。該網(wǎng)絡(luò)按時(shí)間展開,如圖2所示。
隱藏層上一時(shí)刻的輸出值和輸入層一起作為當(dāng)前時(shí)刻的輸入。
輸入序列x經(jīng)過(guò)網(wǎng)絡(luò)的正向傳播后最終得到輸出序列y。為了訓(xùn)練RNN網(wǎng)絡(luò),需要選擇合適的損失函數(shù)L來(lái)衡量輸出序列y與標(biāo)簽序列z的差距。并通過(guò)隨時(shí)間演化的反向傳播算法(backpropagation through time, BPTT)[14]來(lái)訓(xùn)練RNN網(wǎng)絡(luò)。和一般的反向傳播算法(backpropagation, BP)算法相同,其損失函數(shù)對(duì)輸出層節(jié)點(diǎn)的偏導(dǎo)可以很容易的求得。對(duì)于RNN而言,其特別之處在于損失函數(shù)對(duì)t時(shí)刻隱藏層單元的偏導(dǎo)同時(shí)受到輸出層和下一時(shí)刻該隱藏層的影響。最后,通過(guò)選擇合適的優(yōu)化算法達(dá)到RNN網(wǎng)絡(luò)訓(xùn)練的目的。
圖2 隨時(shí)間展開的RNN
1.2 BRNN
BRNN簡(jiǎn)化模型,如圖3所示。
圖3 BRNN簡(jiǎn)化模型及其隨時(shí)間展開
左圖所示,其隱藏層分別由前向和反向隱藏層構(gòu)成,它們與同一個(gè)輸出層相連接。輸入序列分別以前向和反向的方式輸入這兩個(gè)隱藏層。前向隱藏層的背景層保留了其上一時(shí)刻的輸出值,反向隱藏層保留了其下一時(shí)刻的輸出值。其按時(shí)間展開的示意圖如圖3右圖所示。
可以看到BRNN的前向隱藏層和單向RNN的隱藏層相同。對(duì)BRNN而言,輸入序列以相反的時(shí)間順序分別進(jìn)入各自的隱藏層,且直到隱藏層處理完整個(gè)輸入序列,輸出層才能匯總處理兩個(gè)隱藏層輸出數(shù)據(jù)。因此BRNN的正向傳播算法如下。
從t=1到T:
對(duì)前向隱藏層進(jìn)行前向傳播,保存每一時(shí)刻的激活值;
從t=T到1:
對(duì)反向隱藏層進(jìn)行前向傳播,保存每一時(shí)刻的激活值;
對(duì)所有t:
通過(guò)已存儲(chǔ)的前向和反向隱藏層激活值,對(duì)輸出層進(jìn)行前向傳播。
BRNN的輸出層不僅依賴當(dāng)前時(shí)刻的隱藏層激活值,還受到歷史和未來(lái)時(shí)刻的隱藏層激活值的影響。因此BRNN的BPTT算法如下。
對(duì)所有t:
從t=T到1:
從t=1到T:
1.3 特征提取
RNN特征提取作為影響自動(dòng)EEG睡眠分期方法性能的關(guān)鍵,一直以來(lái)都是研究的重點(diǎn)。但是人工提取的特征無(wú)法穩(wěn)定全面的反應(yīng)EEG信號(hào)。其原因在于,一方面EEG信號(hào)冗雜且信噪比低,容易受到個(gè)體差異和波動(dòng)性的影響,另一方面由于知識(shí)儲(chǔ)備和經(jīng)驗(yàn)的局限性,只能提取人可以理解的特征。因此本文根據(jù)EEG信號(hào)的特點(diǎn),通過(guò)短時(shí)傅里葉變換(short time fourier transformation, STFT)提取EEG功率譜作為特征,最大限度保留原始信息量。利用含有多個(gè)隱藏層的深度BRNN網(wǎng)絡(luò),從EEG功率譜中自主學(xué)習(xí)表達(dá)能力更強(qiáng)的EEG特征。
在對(duì)整個(gè)睡眠時(shí)期的EEG信號(hào)進(jìn)行STFT時(shí),需要通過(guò)滑動(dòng)窗截取分段數(shù)據(jù)進(jìn)行傅里葉變換,然后求出每段EEG信號(hào)的功率譜值。EEG信號(hào)x(n)的N點(diǎn)STFT定義如式(1)。
(1)
(2)
其中,F(xiàn)s為采樣頻率。
2.1 實(shí)驗(yàn)數(shù)據(jù)
本文的EEG睡眠分期數(shù)據(jù)來(lái)源于PhysioBank的Sleep-EDF數(shù)據(jù)庫(kù)[15]中用于研究年齡對(duì)睡眠影響實(shí)驗(yàn)的數(shù)據(jù)集[16]。該數(shù)據(jù)記錄了年齡在25-101歲之間的健康白種人全天的多導(dǎo)睡眠記錄,包括了EEG、EOG、EMG和體溫等數(shù)據(jù)。同時(shí),由專家按照R&K標(biāo)準(zhǔn)人工標(biāo)注相應(yīng)的睡眠狀態(tài)。
本次實(shí)驗(yàn)選取數(shù)據(jù)集中36個(gè)完整的多導(dǎo)睡眠記錄樣本。其中一個(gè)樣本作為神經(jīng)網(wǎng)絡(luò)的測(cè)試樣本,其余35個(gè)作為訓(xùn)練樣本。使用Fpz-Cz電極記錄的單通道EEG數(shù)據(jù)用于睡眠分期研究。數(shù)據(jù)采樣頻率為100 Hz,每30秒為一幀用于標(biāo)注對(duì)應(yīng)的睡眠狀態(tài)。如引言所述,本實(shí)驗(yàn)的睡眠狀態(tài)共分為5個(gè)階段,分別為清醒期、NREM1期、NREM2期、慢波睡眠期和快動(dòng)眼期。
2.2 數(shù)據(jù)預(yù)處理
在原始數(shù)據(jù)集中,每個(gè)樣本的數(shù)據(jù)記錄時(shí)間長(zhǎng)達(dá)一整天,所以為了去除大量非睡眠階段的冗余信息,每個(gè)樣本只選取睡眠階段及前后一個(gè)小時(shí)的記錄。
在特征提取時(shí),考慮到數(shù)據(jù)采樣頻率為100 Hz,且以30秒為一幀,所以在對(duì)于時(shí)域EEG信號(hào)進(jìn)行STFT提取功率譜作為特征值時(shí),滑動(dòng)窗采用了長(zhǎng)度為100的漢明窗(Hamming),前后窗的重疊度為50%。由于EEG信號(hào)需要的最小頻率間隔為0.5 hz,根據(jù)公式(1.1)FFT長(zhǎng)度取為200。經(jīng)過(guò)STFT后可以得到時(shí)間步長(zhǎng)為0.5秒,頻率范圍為0-50 hz的功率譜密度矩陣。由于EEG數(shù)據(jù)每幀為30 s,有效頻率范圍為0.5-50 hz。所以最終用于BRNN訓(xùn)練的輸入數(shù)據(jù)維度為100,與有效頻率相對(duì)應(yīng)。同時(shí)每60組數(shù)據(jù)為一幀,與對(duì)應(yīng)的睡眠狀態(tài)相匹配。
2.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
本實(shí)驗(yàn)使用4層的BRNN用于單通道EEG睡眠分期。輸入層包含100個(gè)輸入單元與輸入數(shù)據(jù)維度相對(duì)應(yīng)。共有2個(gè)隱藏層,每個(gè)隱藏層分別由各含有5個(gè)神經(jīng)元的前向和反向隱藏層構(gòu)成。采用Sigmoid作為隱藏層激活函數(shù)θh。輸出層含有5個(gè)輸出單元與睡眠狀態(tài)相匹配。對(duì)于睡眠分期這一多分類情況,數(shù)L使用多分類交叉熵,優(yōu)化函數(shù)采用RMSprop。經(jīng)過(guò)訓(xùn)練后,BRNN對(duì)測(cè)試數(shù)據(jù)的預(yù)測(cè)正確率達(dá)到了95%。
2.4 對(duì)比分析
本實(shí)驗(yàn)從兩個(gè)角度論證本文基于BRNN的單通道EEG睡眠分期方法。一方面對(duì)比分析了BRNN的不同網(wǎng)絡(luò)結(jié)構(gòu),另一方面與一般的單向RNN進(jìn)行了對(duì)比。
2.4.1 網(wǎng)絡(luò)層數(shù)和單元數(shù)
本實(shí)驗(yàn)針對(duì)EEG睡眠分期的特性,綜合考慮BRNN的網(wǎng)絡(luò)層數(shù)和隱藏層節(jié)點(diǎn)這兩個(gè)網(wǎng)絡(luò)關(guān)鍵因素。首先分析不同的隱藏層網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)的影響。
在相同的4層BRNN基礎(chǔ)上,不同的隱藏層前向和反向?qū)泳W(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)的預(yù)測(cè)結(jié)果,如圖4所示。
圖4 BRNN隱藏層單元個(gè)數(shù)的影響
從圖4中可以看出,隱藏層前向和反向?qū)訂卧獋€(gè)數(shù)均為5時(shí),睡眠分期正確率最高。一方面較少的隱藏層單元無(wú)法提供足夠的特征區(qū)分度,另一方面,由于僅需區(qū)分5個(gè)睡眠階段,因此每個(gè)隱藏層過(guò)多的單元個(gè)數(shù)可能會(huì)導(dǎo)致參數(shù)過(guò)多而造成的過(guò)擬合情況。
為了分析隱藏層層數(shù)的影響,限定隱藏層前向和反向?qū)訂卧獋€(gè)數(shù)均為5,則測(cè)試結(jié)果如圖5所示。
圖5 BRNN隱藏層層數(shù)的影響
從圖5中可以看出,含多個(gè)隱藏層的BRNN網(wǎng)絡(luò)相比僅含單個(gè)隱藏層的情況,預(yù)測(cè)準(zhǔn)確率均有較大幅度的提高,這說(shuō)明了深度神經(jīng)網(wǎng)絡(luò)具有更好的學(xué)習(xí)能力。在隱藏層數(shù)為2和3時(shí),睡眠分期的預(yù)測(cè)準(zhǔn)確度達(dá)到最高。但是隨著網(wǎng)絡(luò)層數(shù)的進(jìn)一步增加,準(zhǔn)確率卻在下降。相比優(yōu)秀的圖像識(shí)別和語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)需要較高的網(wǎng)絡(luò)深度[17,18]來(lái)滿足特別復(fù)雜的分類任務(wù),EEG睡眠分期僅通過(guò)較低的網(wǎng)絡(luò)層數(shù)就能達(dá)到較好的擬合效果。
2.4.2 RNN和BRNN
為了對(duì)比BRNN網(wǎng)絡(luò)和一般的單向RNN網(wǎng)絡(luò)在進(jìn)行睡眠分期時(shí)的差別。本實(shí)驗(yàn)限定BRNN隱藏層的前后向?qū)訂卧獋€(gè)數(shù)和RNN的隱藏層單元個(gè)數(shù)均為5,且使用相同的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。兩種網(wǎng)絡(luò)在不同隱藏層情況下的睡眠分期預(yù)測(cè)正確率,如圖6所示。
圖6 BRNN和RNN對(duì)比
從圖6中可以看到,在相同的條件下,BRNN網(wǎng)絡(luò)的睡眠分期預(yù)測(cè)正確率均比一般的單向RNN網(wǎng)絡(luò)高。這表明,BRNN網(wǎng)絡(luò)在考慮歷史信息的基礎(chǔ)上,通過(guò)對(duì)未來(lái)時(shí)刻信息的有效利用,確實(shí)能提高網(wǎng)絡(luò)對(duì)時(shí)序信號(hào)的表達(dá)能力。
本文提出了一種基于BRNN的單通道EEG睡眠分期。發(fā)揮了BRNN對(duì)時(shí)序信號(hào)前后信息的記憶能力。同時(shí)利用STFT提取基礎(chǔ)特征,通過(guò)深度BRNN的自學(xué)習(xí)能力,達(dá)到更好的訓(xùn)練效果。通過(guò)實(shí)驗(yàn)結(jié)果可以得出,基于BRNN的單通道EEG睡眠分期方法可以提供穩(wěn)定高效的自動(dòng)睡眠分期結(jié)果,具有良好的應(yīng)用價(jià)值。
[1] Rechtschaffen A Q, Kales A A. A Manual Of Standardized Terminology Techniques And Scoring System For Sleep Stages In Human Subjects[J]. Psychiatry & Clinical Neurosciences, 1968, 55.
[2] American Academy of Sleep Medicine, Iber C. The AASM manual for the scoring of sleep and associated events: rules, terminology and technical specifications[M]. American Academy of Sleep Medicine, 2007.
[3] Norman R G, Pal I, Stewart C, et al. Interobserver agreement among sleep scorers from different centers in a large dataset[J]. Sleep, 2000, 23(7): 901-908.
[5] Liang S F, Kuo C E, Hu Y H, et al. Automatic stage scoring of single-channel sleep EEG by using multiscale entropy and autoregressive models[J]. Instrumentation and Measurement, IEEE Transactions on, 2012, 61(6): 1649-1657.
[6] Flexer A, Gruber G, Dorffner G. A reliable probabilistic sleep stager based on a single EEG signal[J]. Artificial Intelligence in Medicine, 2005, 33(3): 199-207.
[7] See A R, Liang C K. A study on sleep EEG Using sample entropy and power spectrum analysis[C]//Defense Science Research Conference and Expo (DSR). 2011. IEEE, 2011: 1-4.
[8] Bajaj V, Pachori R B. Automatic classification of sleep stages based on the time-frequency image of EEG signals[J]. Computer methods and programs in biomedicine, 2013, 112(3): 320-328.
[9] Tagluk M E, Sezgin N, Akin M. Estimation of sleep stages by an artificial neural network employing EEG, EMG and EOG[J]. Journal of medical systems, 2010, 34(4): 717-725.
[11] Hsu Y L, Yang Y T, Wang J S, et al. Automatic sleep stage recurrent neural classifier using energy features of EEG signals[J]. Neurocomputing, 2013, 104: 105-114.
[12] Schuster M, Paliwal K K. Bidirectional recurrent neural networks[J]. Signal Processing, IEEE Transactions on, 1997, 45(11): 2673-2681.
[13] Elman J L. Finding structure in time[J]. Cognitive science, 1990, 14(2): 179-211.
[14] Werbos P J. Backpropagation through time: what it does and how to do it[J]. Proceedings of the IEEE, 1990, 78(10): 1550-1560.
[15] PhysioBank P T. PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation. 101 i23. 215-220.
[16] Mourtazaev M S, Kemp B, Zwinderman A H, et al. Age and gender affect different characteristics of slow waves in the sleep EEG[J]. SLEEP-NEW YORK, 1995, 18: 557-557.
[17] Wu R, Yan S, Shan Y, et al. Deep image: Scaling up image recognition[J]. arXiv preprint arXiv:1501.02876, 2015, 7(8).
[18] Huang P S, Kim M, Hasegawa-Johnson M, et al. Singing-Voice Separation from Monaural Recordings using Deep Recurrent Neural Networks[C]//ISMIR. 2014: 477-482.
Study on Sleep Staging Based on Bidirectional Recurrent Neural Network in Single Channel EEG
Yang Xin,Wu Zhinan,Qian Songrong
(College of Information Science and Engineering,Fudan University,Shanghai 200433,China)
Sleep staging has important research and application value in the field of neuroscience and psychiatry. The traditional artificial sleep staging method is inefficient and easily influenced by subjective factors. Recently, with the development of machine learning method, automatic sleep staging method has obtained certain achievements, but there are still some shortcomings. In order to achieve effective automatic sleep stages, a sleep staging method based on the bidirectional recursive neural network is proposed for single channel EEG. It gives full play to the bidirectional recursive neural network temporal expression ability and characteristics of excellent learning ability. Through experiment in the case of single channel EEG, sleep staging accuracy can reach 95%. Results show that this method can effectively improve the accuracy of automatic sleeping stages and has a good application prospect.
Sleep stage; Recurrent neural network; EEG
楊 鑫(1990-),男,浙江,復(fù)旦大學(xué)通信科學(xué)與工程系,碩士研究生,研究方向:網(wǎng)絡(luò)與數(shù)據(jù)通信;上海 200433 吳之南(1991-),男,上海,復(fù)旦大學(xué)通信科學(xué)與工程系,碩士研究生,研究方向:網(wǎng)絡(luò)與數(shù)據(jù)通信;上海 200433 松榮(1967-),男,上海,復(fù)旦大學(xué)通信科學(xué)與工程系,教授,研究方向:網(wǎng)絡(luò)與數(shù)據(jù)通信;上海 200433
1007-757X(2017)01-0042-04
R318
A
2015.12.21)