徐守權(quán),唐國文,黃舞標(biāo),包仲明,陳錦鳳,李超杰,彭美玲,賴瑜梅,文黛薇
急性腦梗死(acute cerebral infarction,ACI)具有較高的致殘率和致死率,可嚴(yán)重威脅人們的生命安全。目前臨床上建議ACI患者采取超早期治療,以減少因血栓堵塞造成的供血區(qū)神經(jīng)元死亡并挽救缺血腦組織[1]。既往研究證實,ACI發(fā)病4.5 h內(nèi)采用重組組織型纖溶酶原激活劑(recombinant tissue-type plasminogen activator,rt-PA)治療是有效的[2-3]。但ACI發(fā)病機(jī)制尚未完全明確,部分患者行溶栓治療后伴有神經(jīng)功能缺損癥狀加重,即出現(xiàn)早期神經(jīng)功能惡化(early neurological deterioration,END),導(dǎo)致患者預(yù)后不良,甚至死亡[4-5]。因此,早期預(yù)測END發(fā)生風(fēng)險對調(diào)整ACI患者治療策略、評估患者預(yù)后具有重要意義。目前,臨床上多采用回歸分析篩選ACI患者發(fā)生END的影響因素,但回歸分析存在無法處理非線性數(shù)據(jù)、僅適用半定量資料等局限。數(shù)據(jù)挖掘是一種新興的統(tǒng)計學(xué)方法。本研究旨在比較BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹預(yù)測ACI患者靜脈溶栓后發(fā)生END的效能,旨在尋找一種能有效預(yù)測ACI患者靜脈溶栓后發(fā)生END的風(fēng)險預(yù)測模型,現(xiàn)報道如下。
1.1 研究對象 選取2021年3月至2022年3月在梧州市中醫(yī)醫(yī)院神經(jīng)內(nèi)科接受靜脈溶栓治療的ACI患者342例。納入標(biāo)準(zhǔn):(1)符合《中國急性缺血性腦卒中診治指南2018》[6]中ACI的診斷標(biāo)準(zhǔn),并經(jīng)顱腦CT和/或MRI檢查證實;(2)美國國立衛(wèi)生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)評分≥4分;(3)發(fā)病至入院時間≤4.5 h;(4)臨床資料完整。排除標(biāo)準(zhǔn):(1)溶栓治療前或溶栓治療后24 h內(nèi)未完善頭頸部血管檢查者;(2)出現(xiàn)癥狀性出血轉(zhuǎn)化者;(3)靜脈溶栓治療后行橋接血管內(nèi)治療者;(4)伴有嚴(yán)重的心、腎、肺等臟器功能損傷、自身免疫系統(tǒng)疾病及惡性腫瘤者;(5)既往有腦外傷、腦卒中及腦腫瘤史者;(6)住院時間<24 h者;(7)伴有腦底異常血管網(wǎng)癥、血管炎者;(8)其他原因?qū)е碌腅ND者,如惡性腦水腫、癇性發(fā)作等。根據(jù)患者是否發(fā)生END將其分為END組(n=66)與非END組(n=276)。本研究經(jīng)梧州市中醫(yī)醫(yī)院醫(yī)學(xué)倫理委員會審核批準(zhǔn)(ZY-021378)。
1.2 END診斷標(biāo)準(zhǔn) 溶栓治療24 h內(nèi)患者NIHSS評分較入院時增加≥4分或死亡定義為END[7-8]。
1.3 方法
1.3.1 rt-PA靜脈溶栓治療方法 所有患者采用rt-PA靜脈溶栓治療,rt-PA治療總劑量為0.9 mg/kg,其中1/10靜脈推注,其余靜脈泵注(1 h內(nèi)完成),rt-PA最大治療劑量為90 mg。
1.3.2 臨床資料收集 查閱醫(yī)院電子病歷系統(tǒng),收集符合納入與排除標(biāo)準(zhǔn)的患者的臨床資料,包括性別、年齡、BMI、合并癥〔腦梗死/短暫性腦缺血發(fā)作(transient ischemic attack,TIA)、糖尿病、高血壓、冠心病、心房顫動〕情況、吸煙情況、用藥情況(使用抗血小板聚集、他汀類藥物情況)、發(fā)病至靜脈溶栓時間、入院至靜脈溶栓時間、TOAST分型(分為大動脈粥樣硬化型卒中、小動脈閉塞型卒中、心源性腦卒中及其他)、基線NIHSS評分、大腦中動脈高密度征(hyperdense middle cerebral artery sign,HMCAS)發(fā)生情況及溶栓前血壓(收縮壓和舒張壓)、實驗室檢查指標(biāo)〔包括空腹血糖、白細(xì)胞計數(shù)、纖維蛋白原、D-二聚體(D-dimer,D-D)、LDL-C、HDL-C、尿酸、單核細(xì)胞與高密度脂蛋白比值(monocyte to high-density lipoprotein cholesterol ratio,MHR)〕。
1.4 預(yù)測模型
1.4.1 BP神經(jīng)網(wǎng)絡(luò) 采用多層感知器,將篩選出的變量作為輸入變量,將是否發(fā)生END作為輸出變量,隱藏層設(shè)置為自動計算,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)。
1.4.2 隨機(jī)森林 采用Rstudio軟件中的randomforest包(包含mtry和ntree參數(shù))構(gòu)建隨機(jī)森林分類識別模型,其中mtry參數(shù)的取值方法為輸入變量數(shù)量開平方根,本研究輸入10個變量,故參數(shù)mtry設(shè)置為3;ntree為隨機(jī)森林中包含的決策樹數(shù)目(默認(rèn)為500)。
1.4.3 決策樹 采用CHAID算法,以是否發(fā)生END為因變量,以篩選出的影響因素為自變量,采用交叉驗證的方式進(jìn)行剪枝,設(shè)置母節(jié)點、子母節(jié)點最小樣本量,生成決策樹。
1.5 統(tǒng)計學(xué)方法 應(yīng)用SPSS 24.0和Rstudio軟件進(jìn)行統(tǒng)計分析。符合正態(tài)分布的計量資料以(±s)表示,兩組間比較采用成組t檢驗;計數(shù)資料以〔n(%)〕表示,組間比較采用χ2檢驗;將所有患者按照7∶3的比例分成訓(xùn)練集和測試集,訓(xùn)練集用于構(gòu)建BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹,測試集用于評估BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹的預(yù)測效能。繪制ROC曲線以評估BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、決策樹預(yù)測ACI患者靜脈溶栓后發(fā)生END的效能,并計算AUC、精確率、召回率、靈敏度、特異度、正確率,AUC的比較采用Delong檢驗。以P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 兩組臨床資料比較 兩組性別、年齡、BMI、糖尿病發(fā)生率、高血壓發(fā)生率、冠心病發(fā)生率、心房顫動發(fā)生率、用藥情況、入院至靜脈溶栓時間、基線NHISS評分及溶栓前舒張壓、纖維蛋白原、LDL-C、HDL-C、尿酸比較,差異無統(tǒng)計學(xué)意義(P>0.05);兩組腦梗死/TIA發(fā)生率、吸煙率、發(fā)病至靜脈溶栓時間、TOAST分型、HMCAS發(fā)生率及溶栓前收縮壓、空腹血糖、白細(xì)胞計數(shù)、D-D、MHR比較,差異有統(tǒng)計學(xué)意義(P<0.05),見表1。
表1 兩組臨床資料比較Table 1 Comparison of clinical data between the two groups
2.2 ACI患者靜脈溶栓后發(fā)生END的預(yù)測模型
2.2.1 BP神經(jīng)網(wǎng)絡(luò) 將表1中有統(tǒng)計學(xué)差異的指標(biāo)〔腦梗死/TIA(賦值:未發(fā)生=0,發(fā)生=1),吸煙(賦值:否=0,是=1),TOAST分型(賦值:大動脈粥樣硬化型卒中=1,小動脈閉塞型卒中=2,心源性腦卒中=3,其他=4),HMCAS(賦值:未發(fā)生=0,發(fā)生=1),發(fā)病至靜脈溶栓時間及溶栓前收縮壓、空腹血糖、白細(xì)胞計數(shù)、D-D、MHR均為實測值〕作為輸入變量,將是否發(fā)生END(賦值:否=0,是=1)作為輸出變量,納入訓(xùn)練集構(gòu)建BP神經(jīng)網(wǎng)絡(luò),結(jié)果顯示,隱藏層數(shù)為1,神經(jīng)網(wǎng)絡(luò)的輸入層層數(shù)與輸入變量數(shù)量相同,共包含10個節(jié)點。根據(jù)輸入變量對網(wǎng)絡(luò)的影響程度由高到低依次為HMCAS、腦梗死/TIA、吸煙、白細(xì)胞計數(shù)、溶栓前D-D、溶栓前空腹血糖、溶栓前MHR、發(fā)病至靜脈溶栓時間、TOAST分型及溶栓前收縮壓,見圖1。
圖1 ACI患者靜脈溶栓后發(fā)生END的BP神經(jīng)網(wǎng)絡(luò)Figure 1 BP neural network for the risk of END in patients with ACI after intravenous thrombolytic
2.2.2 隨機(jī)森林 以mtry=3建立隨機(jī)森林訓(xùn)練模型,當(dāng)ntree>100時,模型誤差率的變動幅度開始減小且趨于平穩(wěn),見圖2;結(jié)合輸入變量重要性測度結(jié)果(見圖3),得出影響ACI患者靜脈溶栓后發(fā)生END的變量排序,依次為溶栓前D-D、溶栓前空腹血糖、發(fā)病至靜脈溶栓時間、溶栓前白細(xì)胞計數(shù)、溶栓前MHR、溶栓前收縮壓、腦梗死/TIA、HMCAS、TOAST分型、吸煙。
圖2 模型錯誤率與隨機(jī)森林樹目關(guān)系的可視化結(jié)果Figure 2 Visualization results of relationship between model error rate and random forest trees
圖3 輸入變量重要性測度結(jié)果Figure 3 Importance measure results of input variables
2.2.3 決策樹 構(gòu)建ACI患者靜脈溶栓后發(fā)生END的決策樹,共篩選出3個解釋變量,分別是溶栓前D-D、發(fā)病至靜脈溶栓時間、溶栓前白細(xì)胞計數(shù)。結(jié)果顯示,溶栓前D-D是ACI患者靜脈溶栓后發(fā)生END的首層影響因素,其中溶栓前D-D≥2.8 mg/L者END發(fā)生率為10%,溶栓前D-D≥1.9 mg/L、發(fā)病至靜脈溶栓時間≥4.1 min、溶栓前白細(xì)胞計數(shù)>7.1×109/L者END發(fā)生率為5%,見圖4。
圖4 ACI患者靜脈溶栓后發(fā)生END的決策樹Figure 4 Decision tree of END after intravenous thrombolysis in ACI patients
2.3 BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、決策樹的預(yù)測效能比較ROC曲線分析結(jié)果顯示,BP神經(jīng)網(wǎng)絡(luò)預(yù)測訓(xùn)練集ACI患者發(fā)生END的AUC為0.963,隨機(jī)森林為1.000,決策樹為0.916,見表2。BP神經(jīng)網(wǎng)絡(luò)預(yù)測測試集ACI患者發(fā)生END的AUC為0.957〔95%CI(0.918,0.995)〕,隨機(jī)森林為0.969〔95%CI(0.913,1.000)〕,決策樹為0.848〔95%CI(0.737,0.959)〕。Delong檢驗結(jié)果顯示,隨機(jī)森林預(yù)測測試集ACI患者發(fā)生END的AUC大于決策樹,差異有統(tǒng)計學(xué)意義(D=-1.982,P=0.049);BP神經(jīng)網(wǎng)絡(luò)與決策樹、BP神經(jīng)網(wǎng)絡(luò)與隨機(jī)森林預(yù)測測試集ACI患者發(fā)生END的AUC比較,差異均無統(tǒng)計學(xué)意義(D值分別為-1.813、0.254,P值分別為0.072、0.780),見表3、圖5。
圖5 BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、決策樹預(yù)測測試集ACI患者靜脈溶栓后發(fā)生END的ROC曲線Figure 5 ROC curve of BP neural network, random forest and decision tree in predicting END after intravenous thrombolysis in test set ACI patients
表2 BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹預(yù)測訓(xùn)練集ACI患者發(fā)生END的效能Table 2 Efficiency of BP neural network,random forest and decision tree in predicting the END after intravenous thrombolysis in training sets ACI patients
表3 BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹預(yù)測測試集ACI患者發(fā)生END的效能Table 3 Efficiency of BP neural network,random forest and decision tree in predicting END after intravenous thrombolysis in test set ACI patients
數(shù)據(jù)顯示,ACI患者溶栓后END發(fā)生率為6.7%~29.8%[9-10],由于END病因不明確,故早期診斷并評估END有助于ACI患者選擇治療策略及評估預(yù)后。既往研究表明,年齡、性別、基礎(chǔ)NIHSS評分、高血壓、糖尿病、高同型半胱氨酸血癥是ACI患者發(fā)生END的重要誘發(fā)因素[11-12]。本研究結(jié)果顯示,腦梗死/TIA、吸煙、發(fā)病至靜脈溶栓時間、TOAST分型、HMCAS及溶栓前收縮壓、空腹血糖、白細(xì)胞計數(shù)、D-D、MHR可能是ACI患者靜脈溶栓后發(fā)生END的影響因素,分析機(jī)制可能如下:(1)腦梗死/TIA發(fā)生機(jī)制較為復(fù)雜,該疾病患者可伴有頸動脈斑塊,動脈管腔狹窄發(fā)生風(fēng)險較高,進(jìn)而增加其END發(fā)生風(fēng)險[13]。(2)研究表明,吸煙患者煙草依賴程度越重,其腦血流量下降程度越明顯,導(dǎo)致神經(jīng)功能缺損癥狀加重,進(jìn)而導(dǎo)致腦血管事件發(fā)生風(fēng)險增加[14]。(3)研究表明,在發(fā)病至靜脈溶栓治療時間窗內(nèi),發(fā)病至靜脈溶栓治療時間越長患者溶栓后發(fā)生END的概率越高,預(yù)后越差[15]。(4)既往研究表明,TOAST分型為大動脈粥樣硬化型卒中是預(yù)測ACI患者發(fā)生END的獨立危險因素[16]。研究表明,大動脈粥樣硬化所致ACI患者靜脈溶栓效果有限,分析其原因主要為:血栓溶解過程中具有明顯致栓性的動脈粥樣硬化斑塊暴露,使血栓擴(kuò)大,而較大的斑塊溶解后形成小栓子并進(jìn)入血液循環(huán),進(jìn)而堵塞遠(yuǎn)端分支動脈,導(dǎo)致腦組織缺血缺氧,臨床癥狀加重[17]。(5)HMCAS的出現(xiàn)提示機(jī)體血液流速變慢,甚至出現(xiàn)栓塞、閉塞。宋紅松等[18]研究結(jié)果顯示,HMCAS陽性患者發(fā)病24 h后腦梗死面積大于HMCAS陰性患者,NIHSS評分高于HMCAS陰性患者。因此,伴有HMCAS的ACI患者溶栓后END發(fā)生風(fēng)險升高。(6)研究顯示,基線收縮壓與腦梗死面積呈正比,且其是腦梗死患者發(fā)生不良臨床結(jié)局的重要影響因素[19]。(7)SAQQUR等[20]研究發(fā)現(xiàn),入院時高血糖是急性缺血性腦卒中患者靜脈溶栓后發(fā)生END的獨立危險因素,分析原因可能為:腦卒中后血糖應(yīng)激性升高,抑制了溶栓藥物繼發(fā)的纖溶系統(tǒng)亢進(jìn),進(jìn)而導(dǎo)致缺血半暗帶血流灌注減少,腦梗死面積擴(kuò)大,END發(fā)生風(fēng)險升高。(8)白細(xì)胞計數(shù)與中性粒細(xì)胞計數(shù)升高是腦梗死患者神經(jīng)功能損傷加重、死亡的危險因素[21]。CHENG等[22]通過分析ACI患者靜脈溶栓后的預(yù)后與白細(xì)胞計數(shù)的關(guān)系發(fā)現(xiàn),白細(xì)胞計數(shù)升高是ACI患者溶栓治療后發(fā)生END、3個月后預(yù)后不良及死亡的獨立危險因素。(9)國外學(xué)者HSU等[23]研究結(jié)果顯示,腦卒中后24 h內(nèi)D-D水平升高的患者出血轉(zhuǎn)化風(fēng)險增加,且D-D水平與預(yù)后不良相關(guān)。(10)單核細(xì)胞是一種免疫細(xì)胞,高密度脂蛋白可逆向轉(zhuǎn)運(yùn)脂肪,是ACI的保護(hù)因素[24],故較高的MHR提示ACI患者病情嚴(yán)重。趙妮等[25]研究表明,MHR升高提示ACI患者氧化應(yīng)激、炎癥反應(yīng)劇烈,故患者溶栓后發(fā)生END的概率升高。
近年臨床數(shù)據(jù)越來越復(fù)雜,傳統(tǒng)數(shù)據(jù)分析方法與數(shù)據(jù)分析工具已無法滿足當(dāng)前需求,而機(jī)器學(xué)習(xí)算法顯示出明顯優(yōu)勢,常用的機(jī)器學(xué)習(xí)算法有可處理非線性關(guān)系的預(yù)測模型(BP神經(jīng)網(wǎng)絡(luò)和決策樹)及具有較高穩(wěn)健性與容錯性、可高效處理大數(shù)據(jù)集的隨機(jī)森林。本研究收集ACI患者病歷資料,分別基于BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹構(gòu)建ACI患者靜脈溶栓后發(fā)生END的風(fēng)險預(yù)測模型,以期能選擇出最優(yōu)的風(fēng)險預(yù)測模型,這對指導(dǎo)臨床醫(yī)務(wù)工作者采取治療策略、降低END發(fā)生率具有重要意義。
本研究基于上述10個危險因素分別構(gòu)建BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和決策樹,結(jié)果顯示,BP神經(jīng)網(wǎng)絡(luò)預(yù)測訓(xùn)練集ACI患者發(fā)生END的AUC為0.963,隨機(jī)森林為1,決策樹為0.916,提示三種模型的擬合效果較好;BP神經(jīng)網(wǎng)絡(luò)預(yù)測測試集ACI患者發(fā)生END的AUC為0.957〔95%CI(0.918,0.995)〕,隨機(jī)森林為0.969〔95%CI(0.913,1.000)〕,決策樹為0.848〔95%CI(0.737,0.959)〕;Delong檢驗結(jié)果顯示,隨機(jī)森林預(yù)測測試集ACI患者發(fā)生END的AUC大于決策樹,BP神經(jīng)網(wǎng)絡(luò)與決策樹、BP神經(jīng)網(wǎng)絡(luò)與隨機(jī)森林預(yù)測測試集ACI患者發(fā)生END的AUC比較無統(tǒng)計學(xué)差異。提示BP神經(jīng)網(wǎng)絡(luò)、決策樹及隨機(jī)森林對ACI患者發(fā)生END的預(yù)測效能均良好,其中隨機(jī)森林對ACI患者發(fā)生END的區(qū)分度優(yōu)于決策樹。分析原因可能如下:與決策樹相比,隨機(jī)森林具有隨機(jī)特征,且不存在過度擬合情況。隨機(jī)森林的主要優(yōu)勢是分析復(fù)雜的非線性關(guān)系的數(shù)據(jù),且不會限制預(yù)測變量數(shù)量,此外其還能根據(jù)特征變量重要程度進(jìn)行排序,并同時處理連續(xù)變量與分類變量[26-27]。但考慮BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林及決策樹均為機(jī)器學(xué)習(xí)算法,且三者預(yù)測ACI患者靜脈溶栓后發(fā)生END的效能均良好。因此,臨床上可結(jié)合患者實際情況選擇風(fēng)險預(yù)測模型。
綜上所述,BP神經(jīng)網(wǎng)絡(luò)、決策樹及隨機(jī)森林對ACI患者靜脈溶栓后發(fā)生END的預(yù)測效能均良好,其中隨機(jī)森林對ACI患者靜脈溶栓后發(fā)生END的區(qū)分度優(yōu)于決策樹。但本研究仍存在以下不足:(1)本研究為單中心、回顧性研究,且樣本量較小,可能存在選擇偏倚和信息偏倚;(2)本研究納入的ACI患者發(fā)生END的危險因素并不全面,仍有待未來研究構(gòu)建更有效的風(fēng)險預(yù)測模型。
作者貢獻(xiàn):徐守權(quán)進(jìn)行文章的構(gòu)思與設(shè)計,并對文章整體負(fù)責(zé)、監(jiān)督管理;徐守權(quán)、包仲明進(jìn)行研究的實施與可行性分析;徐守權(quán)、唐國文、陳錦鳳、李超杰、彭美玲進(jìn)行數(shù)據(jù)收集、整理、分析;徐守權(quán)、賴瑜梅進(jìn)行結(jié)果分析與解釋;徐守權(quán)、黃舞標(biāo)負(fù)責(zé)撰寫、修訂論文;徐守權(quán)、文黛薇負(fù)責(zé)文章的質(zhì)量控制及審校。
本文無利益沖突。