程雅楠,李斯卉,宋江玲,張 瑞
(西北大學(xué) 醫(yī)學(xué)大數(shù)據(jù)研究中心, 陜西 西安 710127)
意識障礙(disorders of consciousness, DOC)是由大腦皮質(zhì)及上行網(wǎng)狀激活系統(tǒng)受損,進(jìn)而導(dǎo)致個體對自身和外界的感知能力減弱甚至消失的一種神經(jīng)系統(tǒng)疾病[1]。臨床表現(xiàn)為嗜睡、生理反射消失、視覺和聽覺受損等癥狀,嚴(yán)重時還會導(dǎo)致肺部感染、尿路感染、腦積水等多種并發(fā)癥[2]。據(jù)相關(guān)研究發(fā)現(xiàn),美國目前DOC患者為10~30萬人[3];歐洲D(zhuǎn)OC的平均患病率約為0.06‰[3];我國每年新增DOC患者已超過10萬例[4-5]。
DOC預(yù)后評估是指臨床醫(yī)生根據(jù)患者相關(guān)檢查結(jié)果對患者的預(yù)后情況(良好或不良)進(jìn)行評判的過程。進(jìn)而,根據(jù)評判結(jié)果可以及時調(diào)整治療措施和護理決策。準(zhǔn)確和穩(wěn)健的預(yù)后評估不僅能幫助醫(yī)生制定出針對不同患者的有效治療措施,也能減輕患者的治療痛苦,為患者家屬提供更好的預(yù)后咨詢。目前臨床上對DOC患者常用的預(yù)后評估包括顯性行為觀察、神經(jīng)影像學(xué)檢查[6]。顯性行為觀察以行為量表為基準(zhǔn),結(jié)合患者一段時間的行為表現(xiàn)進(jìn)行評估,但此方法主觀性強,容易受到各種外界因素的干擾;神經(jīng)影像學(xué)檢查通過分析MRI、CT等影像數(shù)據(jù)來判讀大腦皮質(zhì)與其他區(qū)域之間的連接性,從而診斷患者的意識水平,但此類檢查方式需要特殊設(shè)備以及專業(yè)人員的操作,不僅價格昂貴且存在放射線暴露的風(fēng)險,限制了其在臨床上的推廣應(yīng)用。同時,它們存在一個共同問題,即無法執(zhí)行對DOC患者的連續(xù)監(jiān)測。相關(guān)研究表明,腦電圖(electroencephalogram, EEG)與DOC患者的意識水平顯著相關(guān)[7],這為DOC的預(yù)后評估提供了一種潛在的可能。
EEG是一種通過安放在大腦皮質(zhì)或顱內(nèi)的電極所記錄到的生物電信號,具有可連續(xù)床旁監(jiān)測、易獲取、成本低、時間分辨率高、無輻射性等優(yōu)點[8]。但臨床采用EEG進(jìn)行預(yù)后評估需要依靠專業(yè)醫(yī)生對長時程腦電記錄的視覺判讀,不僅工作量大,耗費大量人力、物力,且腦電結(jié)論依賴醫(yī)生的臨床經(jīng)驗和專業(yè)素養(yǎng),主觀性強。鑒于此,如何采用機器學(xué)習(xí)方法對DOC腦電數(shù)據(jù)(DOC-EEG)進(jìn)行有效分析,實現(xiàn)DOC的預(yù)后定量評估越來越受到廣大學(xué)者的關(guān)注。
基于EEG的DOC預(yù)后評估本質(zhì)是一個二分類問題,即從DOC-EEG中提取恰當(dāng)特征并結(jié)合分類器完成DOC預(yù)后狀態(tài)(良好或不良)的分類。目前,僅有少量工作聚焦于這一研究,所提方法大致可以歸為兩類:頻域分析和非線性分析[9]。頻域分析主要是通過刻畫EEG的頻率能量變化來區(qū)分預(yù)后狀態(tài)。Babiloni等人基于快速傅里葉變換計算腦電節(jié)律的能量分布,并結(jié)合Cox回歸分析實現(xiàn)DOC的預(yù)后評估[10]。隨后,Lechinger等人提出以8 Hz以上與8 Hz以下頻率之間的比率和頻譜峰值的頻率作為特征,結(jié)合統(tǒng)計分析方法實現(xiàn)DOC預(yù)后狀態(tài)的自動評估[11]。此外,歸一化腦電功率和中值頻譜頻率[12]等特征也被提出。由于大腦是一個典型的非線性動力系統(tǒng),借助非線性理論方法分析EEG實現(xiàn)DOC的預(yù)后評估也成為一個研究方向。Sara等人提取近似熵及其最大值、最小值和平均值作為腦電特征,通過邏輯回歸分析實現(xiàn)了DOC預(yù)后狀態(tài)的分類[13]。Stefan等人采用排列熵和符號傳遞熵,結(jié)合復(fù)雜網(wǎng)絡(luò)分析完成了DOC患者預(yù)后狀態(tài)的評估[14]。
本文以EEG為數(shù)據(jù)源,提出了一種新的基于EEG的DOC預(yù)后評估方法。首先,計算并繪制不同頻帶下腦電信號的功率譜-龐加萊散點圖;其次,在此基礎(chǔ)上定義了3種新的度量指標(biāo):最大半徑、區(qū)域密度以及密度變異性,并將其作為DOC預(yù)后評估腦電特征;最后,結(jié)合隨機森林分類器,提出基于PPBF的DOC預(yù)后狀態(tài)自動評估方法。采用西安某醫(yī)院神經(jīng)內(nèi)科臨床采集19名DOC患者的腦電數(shù)據(jù)驗證所提方法的可行性與有效性。
本小節(jié)結(jié)合功率譜和龐加萊散點圖,定義了3種新的度量指標(biāo),即最大半徑、區(qū)域密度和密度變異性,并據(jù)此提出了基于功率譜-龐加萊散點圖的DOC腦電特征提取方法。進(jìn)一步結(jié)合隨機森林分類算法,提出了基于PPBF的DOC預(yù)后狀態(tài)評估方法。
研究表明,腦電在不同頻帶的能量變化與DOC患者的預(yù)后表現(xiàn)息息相關(guān)。用來展現(xiàn)腦電不同頻率能量的一種有效方法就是功率譜[15-16]。圖1分別展示了一名預(yù)后良好患者和一名預(yù)后不良患者在5個頻帶(δ:0.5~4 Hz,θ:4~8 Hz,α:8~12 Hz,β:12~30 Hz,γ:30~100 Hz)上的功率分布情況,其中橫軸代表頻率,縱軸代表對應(yīng)頻率的功率值,每種顏色代表在對應(yīng)頻帶(δ:紅色,θ:綠色,α:藍(lán)色,β:黃色,γ:粉色)下的功率譜。從圖中可以看出,兩類患者在每種腦電頻帶下的功率譜都存在一定差異,而在高頻頻帶(即γ頻帶)上的差異更為顯著。
圖1 腦電頻帶的功率譜散點圖Fig.1 Scatter diagram of power spectrum for each EEG band
為了刻畫上述所觀察到的差異性,本文進(jìn)一步結(jié)合龐加萊散點圖將每個頻帶的功率譜在相空間中表示出來。龐加萊散點圖是具有非線性混沌特性的多維空間結(jié)構(gòu)的截面圖,用于研究非線性系統(tǒng)的演化規(guī)律。對于給定信號{x(n)},n=1,2,…,N,其功率譜為
(1)
基于功率譜的龐加萊散點圖由下列N-1個有序數(shù)對所構(gòu)成:
PP={(P(ω),P(ω+1))},
(2)
其中,每個有序數(shù)對表示功率譜序列中的兩個相鄰點。圖2展示了預(yù)后良好與預(yù)后不良患者在兩個腦電頻帶(β和γ)的功率譜-龐加萊散點圖。從圖2中可以看出,預(yù)后良好患者的散點分布較為分散;而預(yù)后不良患者的散點分布十分密集,且集中在原點附近。在其他頻帶也可以觀察到同樣現(xiàn)象。為了刻畫這一差異性,本文進(jìn)一步提出3種度量指標(biāo):最大半徑、區(qū)域密度和密度變異性,并融合3種指標(biāo)提出基于功率譜-龐加萊散點圖的DOC腦電特征PPBF,具體過程見算法1。
圖2 β和γ頻帶的功率譜-龐加萊散點圖Fig.2 Scatter diagram of power spectra-Poincare plot for beta and gamma bands
算法1基于功率譜-龐加萊散點圖的特征提取方法。
給定腦電信號S={s(1),s(2),…,s(M)},其中,M為樣本點數(shù)。
步驟3由式(2)得到Pi的龐加萊散點序列PPi。
(3)
步驟5以h×ri1/4,h=1,2,3,4為半徑分別作扇形Qh,定義區(qū)域Rh(如圖3所示)為
(4)
步驟6對每個區(qū)域Rh分別計算其區(qū)域密度di2與密度變異性vi3:
(5)
(6)
(7)
F1=[r11,r21,…,rr1]T,
F2=[d12,d22,…,dr2]T,
F3=[v13,v23,…,vr3]T。
融合指標(biāo)F1、F2、F3,構(gòu)建基于功率譜-龐加萊散點圖的DOC腦電特征(PPBF),即
F=[F1,F(xiàn)2,F(xiàn)3]。
圖3 β和γ頻帶下散點圖的最大半徑r及4個區(qū)域Fig.3 The maximum radius r and four regions of the scatter plot for β and γ bands
以PPBF為腦電信號特征,并將其作為隨機森林分類器的輸入向量,訓(xùn)練隨機森林分類預(yù)后良好患者與預(yù)后不良患者,從而完成DOC預(yù)后狀態(tài)的自動評估,方法步驟如圖4所示。
本文使用的腦電信號均由西安某醫(yī)院神經(jīng)內(nèi)科專業(yè)醫(yī)師采集所得, 共包含19名DOC患者持續(xù)時長為1 h的18導(dǎo)聯(lián)腦電信號, 采樣率為2 048 Hz。其中,預(yù)后良好患者11人,預(yù)后不良患者8人。圖5分別展示了某一預(yù)后良好患者與某一預(yù)后不良患者在單一通道下時長為1s的腦電片段。
圖4 意識障礙預(yù)后評估算法步驟圖Fig.4 Flowchart of prognostic assessment for DOC
圖5 預(yù)后良好與不良患者的腦電片段Fig.5 EEG signals in patients with good and poor prognosis
DOC-EEG在采集過程中會受到各種噪聲的影響,主要包括基線漂移和工頻干擾。其中,基線漂移是由電極移動、人體呼吸等引起的腦電信號基線的上下波動,通常表現(xiàn)為變化緩慢的近似正弦曲線,頻率在1 Hz以下;工頻干擾是由于周圍環(huán)境有交流電設(shè)備或?qū)?lián)線接觸不良等原因產(chǎn)生的有規(guī)律的正弦波,頻率約為50 Hz。本文首先采用中值濾波方法去除基線漂移,濾波窗口長度設(shè)置為0.01 s。其次,采用巴特沃斯帶阻濾波器去除工頻干擾,阻帶頻率為49~51 Hz。圖6A、6C、6E分別展示了一個時長為1 s的原始腦電片段,以及對其去除基線漂移與工頻干擾后的腦電片段,圖6B、6D、6F為對應(yīng)于圖6A、6C、6E的功率譜圖,從圖6可以看出,1 Hz以下與50 Hz附近的干擾被大大降低。
本小節(jié)主要從以下兩個方面驗證所提方法的有效性:①以隨機森林為分類器,對所定義的單一指標(biāo)(即最大半徑r、區(qū)域密度d和密度變異性v)與所提特征PPBF的性能進(jìn)行比較;②以PPBF為特征,關(guān)于隨機森林與BP(back propagation)神經(jīng)網(wǎng)絡(luò)兩種分類器的性能進(jìn)行比較。
數(shù)值實驗中主要采用評估準(zhǔn)確率作為性能評價指標(biāo),其計算公式如下:
(8)
其中:TP代表正確分類的預(yù)后良好患者數(shù);TN代表正確分類的預(yù)后不良患者數(shù);FP代表被錯誤分類的預(yù)后不良患者數(shù);FN代表被錯誤分類的預(yù)后良好患者數(shù)。數(shù)值實驗均采用十折交叉驗證,并取10次實驗的平均結(jié)果作為最終分類性能。
在特征提取過程中, 首先對去噪后的腦電片段進(jìn)行無重疊加窗分段處理, 窗口長度設(shè)置為5 s。小波包分解中的基小波為db10函數(shù),分解層數(shù)為8層。隨機森林的基學(xué)習(xí)器個數(shù)設(shè)為30,BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包含1個隱藏層,隱節(jié)點個數(shù)設(shè)為15, 學(xué)習(xí)率設(shè)為0.01, 迭代次數(shù)epoch=1 000。
為了方便可視化,本文只展示了γ頻帶下所提取的單一指標(biāo)。圖7為γ頻帶下最大半徑r、區(qū)域R1密度和密度變異性v的特征分布散點圖。其中,藍(lán)色的點代表預(yù)后良好患者每一腦電片段的特征值,紅色的點代表預(yù)后不良患者每一腦電片段的特征值。從圖7可以看出,所提指標(biāo)均能夠有效區(qū)分DOC預(yù)后良好患者與預(yù)后不良患者。
表1展示了3個單一指標(biāo)與所提特征PPBF對于DOC預(yù)后狀態(tài)的評估準(zhǔn)確率,從表1可以看出,所定義的每一指標(biāo)均能夠有效區(qū)分DOC的兩種預(yù)后情況,且相比密度變異性,最大半徑與區(qū)域密度能獲得更好的評估準(zhǔn)確率。而將3個指標(biāo)融合后所構(gòu)建的PPBF特征的評估準(zhǔn)確率得到了顯著提高。
表1 單一指標(biāo)與所提特征的評估準(zhǔn)確率Tab.1 The accuracy of the signal feature and PPBF
圖6 腦電信號去噪結(jié)果Fig.6 The result of denoising EEG singals
此外,為了進(jìn)一步研究不同頻帶腦電信號對于DOC預(yù)后評估的差異性,本文首先從5個頻帶(δ:0.5~4 Hz,θ:4~8 Hz,α:8~12 Hz,β:12~30 Hz,γ:30~100 Hz)提取所定義的3個單一指標(biāo),并在融合指標(biāo)后構(gòu)建單一頻帶上的特征,記為PPBFj(j∈{δ,θ,α,β,γ}),進(jìn)而比較了不同頻帶上PPBFj對于DOC預(yù)后評估的性能。表2給出了所提特征PPBFj對應(yīng)的DOC預(yù)后評估準(zhǔn)確率。從表中可以看出,高頻頻帶(即β、γ)的特征具有更高的分類性能,表明DOC-EEG高頻頻帶所蘊含的信息可能對于評估意識障礙的預(yù)后表現(xiàn)具有更重要的意義。
最后,本文檢驗了所提特征在不同分類器下的性能表現(xiàn)。所提特征PPBF在隨機森林與BP神經(jīng)網(wǎng)絡(luò)分類器下的DOC預(yù)后評估準(zhǔn)確率分別為85.54%和75.55%,均表現(xiàn)出較好的分類性能,且在隨機森林分類算法下的分類效果更好,反映了本文所提特征的有效性與可行性。
圖7 γ頻帶下所提特征的特征值散點圖Fig.7 Scatter diagram of extracted features under gamma band
表2 所提特征在不同頻帶上的性能
本文首先提出了一種新的基于功率譜-龐加萊散點圖的DOC腦電特征提取方法PPBF;其次,結(jié)合隨機森林分類算法,提出了一種基于PPBF的DOC預(yù)后狀態(tài)自動評估方法;最后,采用臨床采集的19名DOC患者的腦電數(shù)據(jù),從以下兩個方面對所提特征的有效性進(jìn)行了驗證:①單一指標(biāo)與所提特征PPBF均能有效區(qū)分DOC的兩種預(yù)后情況,且融合單一指標(biāo)所構(gòu)建的PPBF特征的評估準(zhǔn)確率得到顯著提高;②所提特征PPBF在隨機森林與BP神經(jīng)網(wǎng)絡(luò)下都表現(xiàn)出較好的分類性能,反映了本文所提特征的有效性與可行性。實驗表明所提特征可以有效區(qū)分DOC預(yù)后狀態(tài),這能夠在一定程度上為臨床預(yù)后評估以及護理決策的制定提供一定的輔助作用。