劉鑫子 李自艷 鄭思思 朱 虹 尹冬青 賈竑曉*
(1.首都醫(yī)科大學(xué)附屬北京安定醫(yī)院 國家精神心理疾病臨床醫(yī)學(xué)研究中心 精神疾病診斷與治療北京市重點實驗室,北京 100088;2.人腦保護(hù)高精尖創(chuàng)新中心 首都醫(yī)科大學(xué),北京 100069)
抑郁發(fā)作臨床表現(xiàn)為情緒低落、興趣或愉悅感減少、自責(zé)自罪、注意力不集中、體質(zhì)量減輕、失眠等癥狀,抑郁發(fā)作可見于抑郁障礙與雙相情感障礙。雙相情感障礙是一類既有躁狂或輕躁狂發(fā)作又有抑郁發(fā)作的心境障礙。50%的雙相I型患者和75%的雙相Ⅱ型患者常以抑郁發(fā)作為首次發(fā)病的表現(xiàn)[1],且在整個病程中抑郁發(fā)作時長達(dá)躁狂發(fā)作時長的3倍[2]。當(dāng)雙相情感障礙患者首次發(fā)病且以抑郁發(fā)作時,常因難以與單相抑郁進(jìn)行鑒別區(qū)分出現(xiàn)診斷轉(zhuǎn)換延遲,平均延遲長達(dá)(8.74±9.40)年[3]。雙相抑郁治療難度較大,若治療不當(dāng)造成患者轉(zhuǎn)相,出現(xiàn)躁狂發(fā)作或混合特征,進(jìn)而影響預(yù)后。因此區(qū)分抑郁發(fā)作患者是單相抑郁或雙相抑郁是臨床醫(yī)生的難點之一。目前因為雙相情感障礙與抑郁障礙的發(fā)病機(jī)制尚不明確,所以臨床常由臨床醫(yī)生問診結(jié)合病史、病程配合使用輕躁狂檢測清單、心境障礙問卷等進(jìn)行診斷,因為用于診斷的信息多由臨床問診與自評量表所得,他評量表臨床應(yīng)用較少[4],缺少相對客觀化的診斷指標(biāo)。
脈診是中醫(yī)獨特且有效的診斷方法,《內(nèi)經(jīng)》曰:“夫脈者血之府也”,“諸血者,皆屬于心”,“心者,生之本,其充在血脈”。現(xiàn)代中醫(yī)常把雙相抑郁和單相抑郁都納入中醫(yī)“郁證”的范疇,但由于雙相情感障礙與抑郁癥的病機(jī)不同[5],在證候分類上也有所不同[6],影響氣血津液的運(yùn)行輸布不同從而導(dǎo)致脈象的不同。中醫(yī)的脈診信息也因此會表現(xiàn)出特異性,可能是鑒別診斷單相抑郁與雙相抑郁的有效手段。
脈診客觀化是指通過客觀化手段采集脈象,對個體的脈圖進(jìn)行參數(shù)分析,繼而反映機(jī)體整體的病理生理指標(biāo)改變,是中西醫(yī)結(jié)合現(xiàn)代化的成果[7]。脈圖參數(shù)具有客觀化的優(yōu)點,t檢驗與非參數(shù)檢驗可以提供單相抑郁與雙相抑郁脈圖參數(shù)比較,但是統(tǒng)計分析時具有數(shù)據(jù)量多,各類數(shù)據(jù)關(guān)聯(lián)較少的缺點,機(jī)器學(xué)習(xí)則可以彌補(bǔ)t檢驗與非參數(shù)檢驗的不足,得到更加精確地鑒別結(jié)果。向量機(jī)算法(support vector machines,SVM)是一種基于統(tǒng)計學(xué)習(xí)理論中的VC維理論和結(jié)構(gòu)風(fēng)險最小化原理的機(jī)器學(xué)習(xí)方法[8],在小樣本、非線性和高維模式識別問題中都具有其特定的優(yōu)勢;隨機(jī)森林算法(random forest,RF)是一種以決策樹為基分類器的常見機(jī)器學(xué)習(xí)算法,具有適用范圍廣且不易過擬合等優(yōu)點。在處理大量多類數(shù)據(jù)時,SVM模型與RF模型都能建立較好的數(shù)據(jù)模型,并可以相互印證后得出較為準(zhǔn)確的特征變量。
本研究通過對雙相抑郁患者與單相抑郁患者脈象信息進(jìn)行采集,對數(shù)據(jù)進(jìn)行t檢驗與非參數(shù)檢驗獲取比較結(jié)果后,使用機(jī)器學(xué)習(xí)SVM算法和RF算法分別建立雙相抑郁與單相抑郁的SVM與RF分類模型,并對鑒別模型中的重要特征進(jìn)行分析,得出單雙相抑郁脈診特征特點,并有可能將得到的兩個帶有特征參數(shù)的模型應(yīng)用于臨床,以期可以根據(jù)患者脈象得到患者單雙相預(yù)測概率值,對臨床單雙相抑郁的鑒別提供幫助。
研究對象均為首都醫(yī)科大學(xué)附屬北京安定醫(yī)院2020年6月至2021年11月門診就診患者。共收集88例,其中單相抑郁發(fā)作患者31名,雙相情感障礙抑郁發(fā)作患者57名。本研究經(jīng)首都醫(yī)科大學(xué)附屬北京安定醫(yī)院倫理委員會審批,倫理審批號:202025FS-2。
1.2.1 入組標(biāo)準(zhǔn)
①單相抑郁發(fā)作患者符合《精神障礙診斷與統(tǒng)計手冊》(Diagnostic and Statistical Manual of Mental Disorders,DSM-5)重性抑郁障礙診斷標(biāo)準(zhǔn)[9];雙相情感障礙抑郁發(fā)作患者符合DSM-5 雙相情感障礙Ⅰ,目前或最近為抑郁發(fā)作與雙相情感障礙Ⅱ,目前或最近為抑郁發(fā)作診斷標(biāo)準(zhǔn)[9];②漢密爾頓抑郁量表(Hamilton Depression Scale,HAMD)評分>7分;③楊氏躁狂量表(Young Manic Rating Scale, YMRS)評分<6分;④可配合完成各項量表調(diào)查,小學(xué)以上文化者;⑤生命體征平穩(wěn);⑥患者本人或法定監(jiān)護(hù)人簽署知情同意書。
1.2.2 排除標(biāo)準(zhǔn)
①并發(fā)精神分裂癥等其他精神類疾病者;②并發(fā)重大軀體疾病者; ③孕婦、哺乳期婦女;④無人監(jiān)護(hù)或未能簽署知情同意書者。
研究者對患者進(jìn)行基本信息收集后使用道生四診儀DS01-A舌面脈信息采集體質(zhì)辨識系統(tǒng)(滬械注準(zhǔn)20202200060)采集患者脈圖信息。采集方法:待患者在安靜的環(huán)境中靜坐5 min后,在自然呼吸的條件下將脈象傳感器固定在患者左手及右手橈動脈搏動最強(qiáng)處進(jìn)行脈象采集獲得最佳脈圖及其參數(shù)值。將相關(guān)數(shù)據(jù)導(dǎo)出后用Excel工作表整理儲存。
使用Epidata 3.1軟件錄入并整理患者人口學(xué)資料與相關(guān)量表數(shù)據(jù),使用RStudio通過R語言mice程序包對缺失數(shù)據(jù)進(jìn)行多重插補(bǔ)[10],獲得最終的數(shù)據(jù)集。數(shù)據(jù)集包括患者序號、性別、年齡、診斷分組、抑郁癥狀嚴(yán)重程度(HAMD>20為中重度抑郁,7 通過R 4.0.5 “mlr3”程序包[11]將數(shù)據(jù)樣本按7∶3比例隨機(jī)分為訓(xùn)練組和測試組,利用數(shù)據(jù)集特征在訓(xùn)練組中構(gòu)建SVM全模型與RF全模型,用測試組數(shù)據(jù)進(jìn)行驗證。 1.5.1 通過特征選擇對鑒別模型進(jìn)行優(yōu)化 數(shù)據(jù)集包含大量特征(變量),提取相關(guān)特征子集的技術(shù)稱為特征選擇。對特征進(jìn)行篩選可用于提高模型性能,清除與模型無關(guān)的變量,從而提高模型的適用性[12]。本研究使用R 4.0.5 mlr3fselect程序包[13]中的包裝器法(wrapper methods)方法,通過計算重新采樣的預(yù)測性能來評估該特征集合,得到新的特征子集。以分類誤差(classification error,classif.ce)作為衡量標(biāo)準(zhǔn)來預(yù)測特征篩選性能,classif.ce值越小,特征子集的預(yù)測效果越好。 1.5.2 通過超參數(shù)調(diào)優(yōu)對鑒別模型進(jìn)行優(yōu)化 超參數(shù)是控制模型如何適應(yīng)數(shù)據(jù)的學(xué)習(xí)器的參數(shù)。本研究通過R 4.0.5 mlr3 tuning程序包[14]中的自動調(diào)諧(automatic tuning)方法,對特征選擇后重新構(gòu)建的SVM模型行超參數(shù)調(diào)優(yōu)。 采用 R 4.0.5 進(jìn)行統(tǒng)計學(xué)分析。為了更加準(zhǔn)確和全面地評估模型,采用模型鑒別準(zhǔn)確率及曲線下面積( area under curve,AUC )作為預(yù)測結(jié)果的評價指標(biāo)。為了提高模型解釋性,對模型中各特征重要性進(jìn)行評價,取重要性前五的特征進(jìn)行個體條件期望(individual conditional expectation,ICE)分析,形成居中個體條件期望圖(centered ICE plot)。個體條件期望是將每個實例數(shù)據(jù)顯示為一條線,當(dāng)特征發(fā)生變化時預(yù)測實例如何變化。居中個體條件期望圖是將曲線在特征中的某個點居中,并僅顯示與該點的預(yù)測差異[15]。本文擬采用居中個體條件期望圖顯示該特征的預(yù)測差異。研究流程圖詳見圖1。 圖1 研究流程圖Fig.1 Research flow chart 本研究納入單相抑郁患者31例,其中男性14例,女性17例,平均年齡(18.16±9.24)歲,HAMD分?jǐn)?shù)(18.16±9.24)分,YMRS(0.23±0.71)分;雙相抑郁患者57例,其中男性25例,女性32例,平均年齡(23.91±9.68)歲,HAMD分?jǐn)?shù)(17.21±7.76)分,YMRS(1.75±1.72)分。兩組間年齡、性別、HAMD評分差異無統(tǒng)計學(xué)意義(P>0.05),YMRS與病程差異有統(tǒng)計學(xué)意義(P<0.05)。單相抑郁患者服用抗抑郁藥物與苯二氮卓類藥物,雙相抑郁患者除服用抗抑郁藥物與苯二氮卓類藥物外,服用心境穩(wěn)定劑與抗精神病性藥物。詳見表1。 表1 人口學(xué)資料Tab.1 Demographic data 對單相抑郁與雙相抑郁進(jìn)行雙手脈圖參數(shù)比較,其中脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1,組間差異有統(tǒng)計學(xué)意義(P<0.05);脈位、脈律、脈形、脈勢、H2、H3、H4、H5、T1、T2、T3、T4、T5、W1、W2、ASS、T、H4/H1、H5/H1、T1/T、T1/T4、(T4-T1)/T、T5/T4、W1/T、W2/T,組間差異無統(tǒng)計學(xué)意義(P>0.05)。詳見表2。 表2 單相抑郁與雙相抑郁脈圖參數(shù)比較Tab.2 Comparison on scores of pulse graph parameters in different groups 在使用特征選擇清除與模型無關(guān)的變量后,SVM算法優(yōu)化后的特征子集(classif.ce=0.17)為:患者序號、診斷分組、年齡、抑郁癥狀嚴(yán)重程度、脈律、脈率、脈形、H1、H2、H4、T1、T4、W1、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1,共18個特征;RF算法優(yōu)化后的特征子集(classif.ce=0.15)為:患者序號、診斷分組、年齡、抑郁癥狀嚴(yán)重程度、左右手分組、脈律、脈率、脈勢、脈形、H1、H2、H3、H4、T1、T3、T4、W1、W2、AD、T1/T、(T4-T1)/T、T5/T4、H3/H1、(H3-H1)/H1、W1/T、W2/T,共26個特征(表3)。 表3 單相抑郁與雙相抑郁脈圖參數(shù)鑒別的特征選擇結(jié)果Tab.3 Feature selection results of pulse graph parameters in different groups 在SVM模型中將抑郁癥狀嚴(yán)重程度、年齡與16個脈圖參數(shù)作為特征,基于算法進(jìn)行建模,預(yù)測結(jié)果與訓(xùn)練集中真實數(shù)據(jù)進(jìn)行比較,最終得出評判結(jié)果,分類鑒別的準(zhǔn)確率為80.56%,AUC值為83.04%(圖2)。在RF模型中將抑郁癥狀嚴(yán)重程度、年齡、左右手分組與16個脈圖參數(shù)作為特征,分類鑒別的準(zhǔn)確率為80.56%,AUC值為84.62%(圖2)。SVM模型特征重要性前十位為H4、H2、AD、AGE、(T4-T1)/T、H1、T4、脈率、T5/T4、T1(圖3);RF模型特征重要性前十位為H3、H4、AD、AGE、H2、H1、(T4-T1)/T、脈勢、T5/T4、H3/H1(圖3)。SVM和RF模型重要性前5位指標(biāo)居中個體條件期望圖詳見圖4。 圖2 SVM模型與RF模型ROC曲線Fig.2 ROC curve of SVM model and RF model 圖3 特征重要性排序(前10位)Fig.3 Importance ranking of features (top 10) 圖4 Centered ICE plot圖(前5位)Fig.4 Centered ICE plot (top 5 )ICE:individual conditional expectation;SVM:support vector machines;RF:random forest. 本研究通過分析單相抑郁患者、雙相抑郁患者的脈圖參數(shù),使用常規(guī)統(tǒng)計學(xué)方法與較為先進(jìn)的機(jī)器學(xué)習(xí)算法來評估中醫(yī)脈象識別單相抑郁與雙相抑郁鑒別診斷的可行性。兩組患者在性別、年齡、抑郁程度上差異無統(tǒng)計學(xué)意義,YMRS分?jǐn)?shù)均小于6分,患者處于抑郁發(fā)作狀態(tài)。常規(guī)統(tǒng)計學(xué)方法在對患者的雙手脈圖參數(shù)的分析中得到脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7個變量的差異有統(tǒng)計學(xué)意義,表明脈圖參數(shù)在區(qū)分單雙相抑郁中具有一定的可行性;SVM模型與RF模型分別進(jìn)行特征選擇,清除與模型無關(guān)的變量,得到優(yōu)化后的特征子集,并對其進(jìn)行建模,鑒別準(zhǔn)確率均為80.56%,AUC值處于0.80~0.85,具有較好的準(zhǔn)確率和穩(wěn)定性[16],其中AD、H2、H3、H4、(T4-T1)/T、AGE是最相關(guān)的特征變量。 脈圖是血管波動的直觀體現(xiàn),脈圖參數(shù)是反映人體心臟、血管、血液等功能的有效信息。在對脈圖參數(shù)進(jìn)行常規(guī)統(tǒng)計學(xué)時發(fā)現(xiàn),脈力、脈率、AD、T1/T4、H1、H3/H1、(H3-H1)/H1共7個變量差異有統(tǒng)計學(xué)意義,脈圖參數(shù)可以對單相抑郁與雙相抑郁進(jìn)行鑒別,進(jìn)而進(jìn)行了機(jī)器學(xué)習(xí)模型的構(gòu)建,得到特性重要性的排序。其中特征H1為主波幅度,即主波峰頂?shù)矫}搏波圖基線的高度,主要反映左心室的射血功能和大動脈的順應(yīng)性。H2為主波峽高度、H3為潮波高度,即潮波峰頂?shù)矫}象圖基線的幅度。H2與H3生理意義較一致,主要反映動脈血管張力和外周阻力狀態(tài)。H4為降中峽高度,為降中峽谷底到脈搏波圖基線的高度。降中峽高度也同樣可以反映動脈血管外周阻力的大小,常常與被試者舒張壓相應(yīng)。H1與脈力有關(guān),H1越大,脈力越強(qiáng)。H2、H3與H4值越大,表明血壓升高時所遇到的外周阻力越大,血管張力越高,彈性越差[17]。AD為舒張期對應(yīng)的脈圖面積,AD值增大,左室射血分?jǐn)?shù)增大[18]。T1/T4為T1左心室的快速射血期與T4左心室的收縮期的比值,(T4-T1)/T為T4與T1的差值與全脈搏周期的比值,T1/T4值越大,(T4-T1)/T值越小,反映心臟急性射血期速度越慢,左心收縮功能減弱[19]。 在centered ICE plot圖中可以看到在SVM與RF兩個模型中年齡對于分類鑒別具有一定的貢獻(xiàn),機(jī)器學(xué)習(xí)認(rèn)為鑒別時雙相抑郁患者預(yù)測年齡與單相抑郁患者相比較小,這與流行病學(xué)研究雙相抑郁障礙的發(fā)病年齡要早于單相抑郁癥一致[20]。脈圖參數(shù)是反映血管功能的有效指標(biāo),抑郁癥與雙相情感障礙等患者可能因情緒變化而影響血管內(nèi)皮功能最終加速動脈粥樣硬化和早期心血管病的形成[21]。本研究中單雙相抑郁患者均H1值較大,H3/H1>0.7,均體現(xiàn)患者動脈血管處于高張力、高阻力狀態(tài),具有血管彈性差、外周阻力增加的特點[22]。這都提示患者可能已出現(xiàn)血管內(nèi)皮功能受損,具有早期心血管疾病的可能,目前單相抑郁與雙相抑郁血管功能的比較研究還需要進(jìn)一步的研究。 從中醫(yī)理論理解,在脈圖中H1、H2、H3、H3/H1、H4提示單相抑郁與雙相抑郁均為弦脈脈象,H1、AD、T1/T4與(T4-T1)/T則體現(xiàn)患者整體的虛實。弦脈血管彈性較大,壓力傳導(dǎo)速度加快,使得重搏前波抬高(H2、H3);血管血流排空速度減慢,使得降中峽高估也有所增加(H4)[23]、H3/H1、(H3-H1)/H1增大;AD與(T4-T1)/T主要體現(xiàn)左心室射血分?jǐn)?shù)與左心收縮功能的強(qiáng)弱,值較大時被試者通常為健康人或者實證患者,值較小時被試者多為虛證患者[24]。單相抑郁患者較雙相情感障礙患者H3/H1、(H3-H1)/H1值較大提示單相抑郁患者脈象較弦。而大部分雙相抑郁患者H1、AD與(T4-T1)/T值比單相抑郁患者較大,這暗示雙相情感障礙患者在躁狂、抑郁相與穩(wěn)定期三者之間反復(fù),雙相抑郁患者的脈象較弦且有力,呈實象;單相抑郁患者脈較弦且無力,呈虛象,既往中醫(yī)文獻(xiàn)研究[25]顯示從陰陽角度理解雙相情感障礙抑郁發(fā)作的病機(jī)可能與為陰陽不平衡,陽氣功能活動的失常,陰虛失守而至的陽郁有關(guān),而單相患者可能與陽弱失用有關(guān),在脈象上與本研究結(jié)果相契合。雙相抑郁患者雖然癥狀表現(xiàn)與單相抑郁相似,均呈現(xiàn)情緒低落、興趣減退、快感缺失等虛相,但是本質(zhì)可能為實證偏多,這也許是雙相抑郁患者易轉(zhuǎn)躁的原因。遺憾的是在SVM與RF兩個模型中H2與H3在鑒別時沒有呈現(xiàn)一致的趨勢,還需要進(jìn)一步探索。 臨床上,單雙相患者多因情志刺激而出現(xiàn)氣機(jī)紊亂而在脈象上共同具有弦脈的特點[26],但其本質(zhì)是不同的。單相抑郁虛多實少,雖易出現(xiàn)氣郁化火,但隨病程發(fā)展常兼夾氣虛、陰虛、血虛、腎虛等虛證,脈象多為弦緩、弦細(xì)脈。雙相抑郁則不然,常表現(xiàn)為實多虛少,易出現(xiàn)內(nèi)生火熱,邪熱擾神,抑郁癥狀伴隨煩躁易怒、面部痤瘡、舌邊尖紅較多,脈象多弦而有力,可隨病程轉(zhuǎn)化為躁狂與混合狀態(tài)。 綜上所述,本研究使用統(tǒng)計學(xué)分析脈圖參數(shù)與建立相關(guān)機(jī)器學(xué)習(xí)模型兩種方式進(jìn)行單雙相抑郁鑒別,得出脈圖差異變量與分類模型,且模型具有較好的鑒別準(zhǔn)確率和穩(wěn)定性。脈圖參數(shù)作為客觀化評價指標(biāo),對于臨床早期鑒別單雙相抑郁患者提供了有力的依據(jù),后續(xù)本課題組將對特征變量聯(lián)系臨床表現(xiàn)進(jìn)行進(jìn)一步的探索。1.4 單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型算法
1.5 單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型優(yōu)化
1.6 統(tǒng)計分析與脈圖參數(shù)鑒別模型結(jié)果評價
1.7 統(tǒng)計學(xué)方法
2 結(jié)果
2.1 一般資料
2.2 單相抑郁與雙相抑郁脈圖參數(shù)比較
2.3 單相抑郁與雙相抑郁脈圖參數(shù)鑒別的特征選擇
2.4 預(yù)測結(jié)果及單相抑郁與雙相抑郁脈圖參數(shù)鑒別模型性能
3 討論