駱睿鵬,鄒任玲,孟令鵬,談宏偉,劉巨濤,徐瀾菲,胡秀枋,曹 立
(1 上海理工大學(xué)健康科學(xué)與工程學(xué)院,上海 200093; 2 上海交通大學(xué)醫(yī)學(xué)院附屬第六人民醫(yī)院神經(jīng)內(nèi)科,上海 200233)
據(jù)世界衛(wèi)生組織不完全統(tǒng)計(jì),全球約有超過(guò)3.5億的不同程度抑郁癥患者,僅中國(guó)統(tǒng)計(jì)出的抑郁癥患者已超過(guò)3 000 萬(wàn),在近20年的時(shí)間抑郁癥患者約增加了120 倍。 然而,對(duì)抑郁癥的病理機(jī)制的認(rèn)識(shí)、尤其量化的評(píng)估或精神健康的指標(biāo)以及有效的精神障礙早診早治方法仍然缺乏,這成為抑郁癥患者痊愈的主要難題。
由于抑郁癥的發(fā)病隱蔽性高和大眾對(duì)抑郁癥不夠重視,仍有不少的抑郁癥患者尚未得到有效治療。目前,對(duì)抑郁癥的診斷主要依賴于臨床醫(yī)生的觀察、問(wèn)診以及問(wèn)卷量表調(diào)查,這種方法存在一定的主觀性和不確定性,易導(dǎo)致誤診、漏診、前后診斷不一致,延誤患者最佳治療時(shí)期。 因此,現(xiàn)階段研究者嘗試運(yùn)用神經(jīng)成像技術(shù)如腦電(Electroencephalogram,EEG)、核磁共振、腦磁圖、正電子發(fā)射斷層顯像等來(lái)實(shí)現(xiàn)對(duì)抑郁癥的客觀評(píng)價(jià)和診斷。 其中,EEG 具有一定的優(yōu)勢(shì),如設(shè)備價(jià)格低、操作簡(jiǎn)單方便、時(shí)間分辨率高等。 隨著人工智能的發(fā)展,采用機(jī)器學(xué)習(xí)方法結(jié)合EEG 信號(hào)特征用于識(shí)別抑郁癥的分類研究越來(lái)越受到重視。
基于機(jī)器學(xué)習(xí)對(duì)抑郁癥患者和正常人的腦電信號(hào)進(jìn)行識(shí)別已經(jīng)有一定的研究基礎(chǔ)。 如Cai 等學(xué)者[1]利用86 名抑郁癥患者和92 名正常人的腦電數(shù)據(jù),提取得到了一部分特征,在KNN 模型上達(dá)到了86.98%的準(zhǔn)確率。 Hosseinifard 等研究者[2]利用45名抑郁癥患者45 名正常人的腦電數(shù)據(jù)提取4 個(gè)不同波段的功率譜和4 種非線性特征等特征,利用邏輯回歸分類器達(dá)到90%的準(zhǔn)確率。 郭雨[3]利用142名抑郁癥患者和72 名健康人的靜息態(tài)腦電數(shù)據(jù),在6 種不同的機(jī)器學(xué)習(xí)算法模型上最好效果均達(dá)到了80%以上的準(zhǔn)確率。 然而,以上這些研究只考慮到腦電信號(hào)的時(shí)域或頻域或動(dòng)力學(xué)方面等單一特征對(duì)識(shí)別的影響,而有大量研究表明抑郁癥患者和正常人之間的不同腦部區(qū)域存在不同的活動(dòng)性,因此需要從多方位地引入各種特征對(duì)抑郁癥識(shí)別進(jìn)行相應(yīng)的研究。 本文擬通過(guò)將機(jī)器學(xué)習(xí)和腦電信號(hào)應(yīng)用到抑郁癥診斷中,一方面可以篩查出大量潛在患者并對(duì)其進(jìn)行及時(shí)有效治療,另一方面可以更客觀準(zhǔn)確地識(shí)別抑郁癥,提高醫(yī)生的工作效率,減輕工作壓力。 實(shí)現(xiàn)基于EEG 信號(hào)的抑郁癥患者識(shí)別將為抑郁癥診斷提供一種新的輔助工具,具有極大的研究?jī)r(jià)值。
本研究使用的數(shù)據(jù)集選用蘭州大學(xué)可穿戴計(jì)算重點(diǎn)實(shí)驗(yàn)室公開(kāi)的用于精神障礙分析的抑郁癥研究數(shù)據(jù)集[4],經(jīng)蘭州大學(xué)第二附屬醫(yī)院倫理委員會(huì)批準(zhǔn),并獲得所有受試者的書面知情同意。 該數(shù)據(jù)集包含24 名抑郁癥患者和29 名健康對(duì)照者所采集的腦電數(shù)據(jù),采用128 導(dǎo)聯(lián)進(jìn)行腦電數(shù)據(jù)采集的頭皮電極位置如圖1 所示,使用HCGSN (HydroCel Geodesic SensorNet)系統(tǒng)采集腦電數(shù)據(jù)和NetStation軟件記錄腦電數(shù)據(jù),整個(gè)采集過(guò)程的采樣頻率設(shè)置為250 Hz,分別采集了受試者閉眼靜息態(tài)和睜眼刺激態(tài)下的腦電數(shù)據(jù)(刺激態(tài)腦電實(shí)驗(yàn)范式是采用中國(guó)化面孔情緒圖片作為刺激材料,以此誘發(fā)注意力任務(wù)下的EEG 信號(hào)。 根據(jù)情緒效價(jià)的不同,共包含恐懼、悲傷、快樂(lè)和中性4 種不同類型的面孔情緒圖片)。 抑郁癥和健康對(duì)照組的年齡分布以及PHQ-9評(píng)分情況統(tǒng)計(jì)如圖2 所示。 由圖2 可知,抑郁癥患者滿足如下條件:
圖1 128 導(dǎo)聯(lián)頭皮電極位置定位圖Fig. 1 Positioning map of 128-lead scalp electrodes
圖2 抑郁癥和健康對(duì)照組的年齡分布及PHQ-9 評(píng)分情況Fig. 2 Age distribution of experimental subjects and PHQ-9 score statistics
(1)男女比例均衡且年齡范圍在16 ~56 歲分布;
(2)在接受被試前均符合DSM 的抑郁癥診斷標(biāo)準(zhǔn),且經(jīng)過(guò)PHQ-9 評(píng)分問(wèn)卷的調(diào)查;
(3)在接受被試前兩周以內(nèi)未服用任何精神類藥品,排除了有嚴(yán)重身體疾病或不良傾向的患者。
健康對(duì)照組滿足如下:
(1)男女比例均衡且年齡范圍在18 ~55 歲分布;
(2)排除了患有精神疾病病史以及有精神障礙家族史的人。
由于EEG 信號(hào)在采集過(guò)程中抗干擾能力較差,會(huì)受到各種干擾信號(hào)和偽跡的影響。 因此采用Matlab 2019b EEGLAB 工具箱和Python 中MNE 軟件包對(duì)從采集設(shè)備獲取到的原始腦電數(shù)據(jù)進(jìn)行預(yù)處理工作,主要步驟如下:
(1)導(dǎo)入連續(xù)的腦電數(shù)據(jù);
(2)電極定位后選擇適用的電極通道;
(3)降低采樣率用以提高運(yùn)行速度;
(4)使用1~45 Hz 的帶通濾波器以及50 Hz 的陷波濾波器來(lái)消除電源電路中的50 Hz 工頻交流電等其他干擾信號(hào);
(5)查看腦電時(shí)域波形圖中是否存在壞通道,若存在則需要對(duì)壞導(dǎo)進(jìn)行插補(bǔ);
(6)將連續(xù)的腦電數(shù)據(jù)分段為多段epoch;
(7)使用ICA 算法手動(dòng)校正由眼電、眨眼、心電、肌肉活動(dòng)等產(chǎn)生的生理性偽跡成分和其他非生理性偽跡影響的數(shù)據(jù)部分以得到較為純凈的腦電數(shù)據(jù);
(8)手動(dòng)去除漂移較大的腦電數(shù)據(jù)段;
(9)對(duì)預(yù)處理后的腦電數(shù)據(jù)進(jìn)行保存。
本節(jié)通過(guò)提取抑郁癥患者和健康對(duì)照組不同狀態(tài)下的腦電信號(hào)的線性特征和非線性特征,使用隨機(jī)森林[5]、邏輯回歸、K 近鄰[6]、支持向量機(jī)[7]四種機(jī)器學(xué)習(xí)算法模型進(jìn)行分類識(shí)別,通過(guò)比較單一類型特征和多種類型特征、靜息態(tài)和刺激態(tài)、不同情緒刺激態(tài)情況下的抑郁癥病癥識(shí)別效果,對(duì)抑郁癥病癥情況進(jìn)行分析,并通過(guò)調(diào)整模型參數(shù)獲得最優(yōu)識(shí)別模型,具體技術(shù)實(shí)現(xiàn)路線如圖3 所示。
圖3 技術(shù)實(shí)現(xiàn)總流程圖Fig. 3 General flowchart of technology realization
大腦皮層根據(jù)不同的位置一般被劃分為額葉、顳葉、頂葉和枕葉,每一塊區(qū)域都能夠反映出人體的不同反應(yīng)活動(dòng)。 其中,額葉區(qū)域與注意力、記憶、個(gè)性和情感等高級(jí)認(rèn)知活動(dòng)有關(guān)[8],有研究者們認(rèn)為額葉病變主要導(dǎo)致精神障礙,常表現(xiàn)為注意力喪失、冷漠、思維反應(yīng)力和創(chuàng)造力都顯著下降,這也是抑郁癥患者的一部分病癥體現(xiàn)。 楊勇等研究人員通過(guò)分析抑郁癥患者的腦區(qū)能量占比發(fā)現(xiàn),與大腦皮層中央?yún)^(qū)域和枕葉區(qū)域相比,重癥抑郁癥患者在經(jīng)過(guò)治療后的額葉區(qū)域能量占比表達(dá)更為強(qiáng)烈。
由抑郁癥引起的腦電信號(hào)異常特征中,經(jīng)典的以明確的α節(jié)律為主,在額葉區(qū)域具有較高的振幅,并且同樣也會(huì)經(jīng)常采集到δ 節(jié)律,有研究表明,與α節(jié)律的異常相比,β、δ、θ節(jié)律的變化更為明顯,不同頻帶信號(hào)的功率譜或大腦不同區(qū)域的數(shù)據(jù)通道之間的不對(duì)稱性也會(huì)顯示出不同。 這些腦電信號(hào)特征可用于確定抑郁癥的發(fā)作情況并評(píng)估治療的有效性,特別是對(duì)于長(zhǎng)期輕度抑郁癥患者。 醫(yī)學(xué)上根據(jù)腦電成分的波動(dòng)特征將腦電信號(hào)分為5 種節(jié)律信號(hào),詳見(jiàn)表1。不同的EEG 節(jié)律頻段對(duì)應(yīng)不同的人體狀態(tài),各種EEG 節(jié)律頻段都可在大腦皮層的不同區(qū)域出現(xiàn),但往往在不同的生理狀態(tài)下最明顯的大腦區(qū)域有所不同。
表1 腦電信號(hào)各節(jié)律頻段及特點(diǎn)Tab. 1 Frequency bands and characteristics of each rhythm of EEG signal
以上這些頻段節(jié)律信號(hào)可以從不同情緒狀態(tài)中獲得,在不同情緒狀態(tài)下,腦電信號(hào)的頻率和振幅都會(huì)發(fā)生相應(yīng)的變化。 本研究采用的線性特征主要由腦電信號(hào)的峰峰值平均幅度、中位振幅、最大振幅、最小振幅以及α、β、δ、θ四種腦電波節(jié)律信號(hào)組成[9]。
由于腦電信號(hào)的非線性、不規(guī)律性以及非平穩(wěn)性的特點(diǎn),傳統(tǒng)的線性特征只是在時(shí)域和頻域上反映EEG 的某方面特征,引入非線性動(dòng)力學(xué)方法能夠更加全面地對(duì)EEG 的特征進(jìn)行分析。 其中,熵作為非線性特征,是可以用來(lái)表征一個(gè)系統(tǒng)的復(fù)雜性和不規(guī)則性。 本研究采用的非線性特征主要由奇異值分解熵、譜熵、排列熵組成[9]。
奇異值分解熵是一種通過(guò)奇異譜和信息熵相結(jié)合的分析方法,其基本思想是通過(guò)對(duì)系統(tǒng)的時(shí)域信號(hào)序列進(jìn)行相空間重構(gòu)和奇異值分解,獲取其內(nèi)在復(fù)雜性特征。 在信號(hào)的奇異譜分析基礎(chǔ)上,計(jì)算奇異譜的信息,即奇異值分解熵,則可定量描述時(shí)間序列的復(fù)雜狀態(tài)特征。 譜熵是用來(lái)表示輸入信號(hào)能量在功率譜劃分下的不確定性,若信號(hào)組成成分較為復(fù)雜時(shí),信號(hào)對(duì)應(yīng)的功率譜越分散,對(duì)應(yīng)的功率譜線會(huì)增多,得到的譜熵值就會(huì)變大,因此譜熵是對(duì)信號(hào)在頻域上能量分布的復(fù)雜程度的定量描述。 排列熵是一種能夠檢測(cè)信號(hào)突變的復(fù)雜程度的平均熵參數(shù),其值越大就表示所對(duì)應(yīng)的信號(hào)越復(fù)雜,計(jì)算過(guò)程簡(jiǎn)單并且具有很好的抗干擾能力和魯棒性,能將無(wú)法定量描述的復(fù)雜系統(tǒng)簡(jiǎn)潔地描述出來(lái)。
在本次實(shí)驗(yàn)中,分類器采用了機(jī)器學(xué)習(xí)中的隨機(jī)森林、邏輯回歸、K 最近鄰、支持向量機(jī)四種算法模型進(jìn)行構(gòu)建,主要對(duì)以下幾種組合情況進(jìn)行討論:
(1)線性特征和非線性特征在單獨(dú)及組合構(gòu)成特征數(shù)據(jù)集下的識(shí)別效果對(duì)比;
(2)靜息態(tài)和刺激狀態(tài)下的腦電信號(hào)進(jìn)行識(shí)別效果對(duì)比;
(3)恐懼、悲傷、快樂(lè)三種不同情緒刺激下的腦電信號(hào)進(jìn)行識(shí)別效果對(duì)比。
為了研究不同類型特征對(duì)抑郁癥患者和正常人的腦電信號(hào)分類的影響,首先分別對(duì)線性特征和非線性特征這2 類單一類型的特征進(jìn)行抑郁癥識(shí)別。
線性特征下的抑郁癥識(shí)別結(jié)果見(jiàn)表2。 由表2可以看出,基于刺激態(tài)特征數(shù)據(jù)集和調(diào)優(yōu)后的隨機(jī)森林算法組合構(gòu)建的抑郁癥識(shí)別分類模型具有最高的分類準(zhǔn)確率,達(dá)到91%。 另外,在悲傷情緒刺激態(tài)和靜息態(tài)下,模型的識(shí)別準(zhǔn)確率最高達(dá)到了70%以上。
非線性特征下的抑郁癥識(shí)別分類結(jié)果見(jiàn)表3。由表3 可以看出,整體的識(shí)別準(zhǔn)確率都不是很高,只有基于快樂(lè)狀態(tài)特征數(shù)據(jù)集和調(diào)優(yōu)后的隨機(jī)森林算法組合構(gòu)建的抑郁癥識(shí)別分類模型的準(zhǔn)確率能達(dá)到60%以上。
表3 非線性特征下的抑郁癥識(shí)別準(zhǔn)確率Tab. 3 Accuracy of depression recognition under nonlinear features%
考慮到單一類型的特征表征抑郁癥病癥信息缺乏片面性,為了充分考慮特征之間的互補(bǔ)性,于是將2 種不同類型的腦電特征進(jìn)行組合作為判斷抑郁癥的特征數(shù)據(jù)集,這樣就能夠盡可能地涵蓋抑郁癥人群和健康人群中關(guān)于大腦活動(dòng)模式的變化。
在上述實(shí)驗(yàn)的基礎(chǔ)上,分別將線性特征數(shù)據(jù)集和非線性特征數(shù)據(jù)集進(jìn)行特征組合后再對(duì)抑郁癥進(jìn)行識(shí)別分類,識(shí)別分類結(jié)果見(jiàn)表4。 表4 中,在恐懼狀態(tài)、悲傷狀態(tài)兩種特征數(shù)據(jù)集下的抑郁癥識(shí)別準(zhǔn)確率能達(dá)到70%以上,在靜息態(tài)和刺激態(tài)兩種特征數(shù)據(jù)集下的抑郁癥識(shí)別準(zhǔn)確率能達(dá)到60%以上。
表4 組合特征下的抑郁癥識(shí)別準(zhǔn)確率Tab. 4 Accuracy of depression recognition with combined features%
分析以上2 組單一類型特征下的抑郁癥識(shí)別結(jié)果,可以看到線性特征下的分類識(shí)別準(zhǔn)確率要普遍高于非線性特征,這在一定程度上表明了抑郁癥患者對(duì)于頻段線性特征信息要更具敏感性,腦電信號(hào)的線性特征能更有效地表征出抑郁癥患者的腦內(nèi)活動(dòng)變化。 分析單一類型特征和多種類型特征下的抑郁癥識(shí)別分類效果,發(fā)現(xiàn)相比較于單一非線性特征的分類結(jié)果,多特征組合后的識(shí)別效果有了一定的提升,說(shuō)明這2 類單一類型特征均包含表征抑郁癥病癥的有效信息,并且采用多種類型特征組合對(duì)于識(shí)別抑郁癥有一定的輔助作用。
為了研究不同類型特征對(duì)抑郁癥患者和正常人的腦電信號(hào)分類的影響,在上述對(duì)比分析基礎(chǔ)上,為了進(jìn)一步探究抑郁癥患者和正常人對(duì)于靜息態(tài)和刺激狀態(tài)下的識(shí)別效果,于是在保證同一類型特征的基礎(chǔ)上分別對(duì)靜息態(tài)和刺激態(tài)進(jìn)行識(shí)別分類,靜息態(tài)識(shí)別結(jié)果如圖4 所示,可以看出,靜息態(tài)下的識(shí)別準(zhǔn)確率最高能達(dá)到70%以上。 刺激態(tài)識(shí)別結(jié)果如圖5 所示,可以看出,刺激態(tài)下的識(shí)別準(zhǔn)確率最高能達(dá)到90%以上。
圖4 靜息態(tài)腦電信號(hào)下的抑郁癥識(shí)別分類結(jié)果Fig. 4 Classification results of depression recognition under resting state EEG signal
圖5 刺激態(tài)腦電信號(hào)下的抑郁癥識(shí)別分類結(jié)果Fig. 5 Classification results of depression recognition under stimulated state EEG signals
從上述對(duì)比結(jié)果可以看出,抑郁癥患者在刺激下相較于靜息態(tài)下能表征出更顯著的特征,因此在抑郁癥臨床早期診斷可以對(duì)就診人進(jìn)行適當(dāng)性的刺激以誘發(fā)出與抑郁癥狀態(tài)相關(guān)的大腦區(qū)域的不同模式。
為了進(jìn)一步分析出刺激態(tài)下抑郁癥患者對(duì)哪種情緒刺激更敏感[10],于是針對(duì)采集腦電實(shí)驗(yàn)范式中的不同類型情緒狀態(tài)下的抑郁癥識(shí)別效果進(jìn)行分析。
恐懼情緒刺激下的抑郁癥識(shí)別分類結(jié)果如圖6所示。 圖6 中,從恐懼情緒狀態(tài)下的抑郁癥識(shí)別分類結(jié)果中可以看出,非線性特征對(duì)于該情緒狀態(tài)下的抑郁癥表征比較顯著,最高準(zhǔn)確率能達(dá)到70%以上,并且在進(jìn)行多特征組合下,非線性特征能有效提高線性特征下的恐懼狀態(tài)下的抑郁癥識(shí)別分類結(jié)果。 悲傷情緒刺激下的抑郁癥識(shí)別分類結(jié)果如圖7所示。 圖7 中,從悲傷情緒狀態(tài)下的抑郁癥識(shí)別分類結(jié)果中可以看出,線性特征對(duì)于該情緒狀態(tài)下的抑郁癥表征比較顯著,最高準(zhǔn)確率能達(dá)到80%以上,而特征組合的方式能有效提高非線性特征在悲傷狀態(tài)下的抑郁癥識(shí)別效果。 快樂(lè)情緒刺激下的抑郁癥識(shí)別分類結(jié)果如圖8 所示。 圖8 中,從快樂(lè)情緒狀態(tài)下的抑郁癥識(shí)別分類結(jié)果中可以看出,不論是非線性特征、還是線性特征對(duì)于該情緒狀態(tài)下的抑郁癥表征都不太顯著,對(duì)于抑郁癥識(shí)別最高準(zhǔn)確率才達(dá)到60%左右。
圖6 恐懼情緒刺激下的抑郁癥識(shí)別分類結(jié)果Fig. 6 Classification results of depression recognition under fearful emotion
圖7 悲傷情緒刺激下的抑郁癥識(shí)別分類結(jié)果Fig. 7 Classification results of depression recognition under sad emotion
圖8 快樂(lè)情緒刺激下的抑郁癥識(shí)別分類結(jié)果Fig. 8 Classification results of depression recognition under happy emotion
通過(guò)對(duì)以上3 種情緒狀態(tài)下的抑郁癥識(shí)別結(jié)果分析,能夠表明抑郁癥患者對(duì)于悲觀情緒下的刺激感知非常顯著,對(duì)于樂(lè)觀情緒下的刺激感知比較遲鈍。 該結(jié)果還充分體現(xiàn)了臨床抑郁癥患者普遍的悲觀消極情緒嚴(yán)重的情形。
本文研究提取了腦電信號(hào)的線性和非線性特征,使用機(jī)器學(xué)習(xí)方法對(duì)抑郁癥患者進(jìn)行綜合分析,通過(guò)對(duì)單特征、多特征的識(shí)別對(duì)比分析,非線性特征不一定能有效提高對(duì)抑郁癥病癥的識(shí)別準(zhǔn)確率,而線性特征在表達(dá)抑郁癥患者和正常人的區(qū)別中有一定的優(yōu)勢(shì),造成這種現(xiàn)象的原因可能是抑郁癥患者的癥狀與大腦皮層的異常活動(dòng)產(chǎn)生的特定頻段電信號(hào)有關(guān)。 通過(guò)構(gòu)建最優(yōu)特征矩陣和調(diào)整最優(yōu)參數(shù)得到了基于刺激態(tài)線性特征和隨機(jī)森林算法抑郁癥識(shí)別模型,其準(zhǔn)確率達(dá)到最高91%,從而驗(yàn)證了機(jī)器學(xué)習(xí)方法進(jìn)行抑郁癥輔助診斷的適用性,能更好地識(shí)別抑郁癥,可對(duì)后續(xù)抑郁癥的早發(fā)現(xiàn)早干預(yù)早治療提供一定的參考價(jià)值。 本文還創(chuàng)新性地對(duì)靜息態(tài)和刺激態(tài)兩種不同腦電狀態(tài)下的數(shù)據(jù)集進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明抑郁癥患者對(duì)于外界刺激較為敏感,進(jìn)而產(chǎn)生了不同于靜息態(tài)下的腦電波成分。同時(shí),還針對(duì)刺激態(tài)下的恐懼、悲傷、快樂(lè)三種情緒狀態(tài)抑郁癥識(shí)別準(zhǔn)確率進(jìn)行對(duì)比分析,結(jié)果顯示抑郁癥患者對(duì)于正性情緒的腦部反饋和認(rèn)知出現(xiàn)異常,而對(duì)負(fù)性情緒產(chǎn)生了認(rèn)知偏向,腦區(qū)活躍程度更大,更容易對(duì)負(fù)性情緒進(jìn)行加工,這進(jìn)一步驗(yàn)證了抑郁癥患者存在對(duì)于正性情緒的選擇性抑制,表現(xiàn)出難以被激活的現(xiàn)象,這為抑郁癥的發(fā)病機(jī)制提供了電生理證據(jù),也為后續(xù)針對(duì)抑郁癥患者進(jìn)行治療采用非物理性的情感認(rèn)知治療手段提供了一定的可行性驗(yàn)證。