劉志煜,孔亞偉,張揚(yáng)輝,張亞豪,王喆,路新源,鄭穎穎,沈德良,張金盈
糖尿?。―M)是冠狀動(dòng)脈粥樣硬化性心臟病(CHD)最常見的高危因素,而急性心肌梗死(AMI)作為CHD最嚴(yán)重的發(fā)病分型,是全球排名前位的致死疾病[1]。冠狀動(dòng)脈介入治療(PCI)是對(duì)AMI的有效治療方式[2],但目前研究發(fā)現(xiàn),DM作為AMI人群中的極高危因素,行首次PCI后的DM人群仍有30%~50%的患者在院外治療期間可出現(xiàn)主要不良心腦血管事件(MACCE)事件并可導(dǎo)致如心血管死亡事件、心功能不全、腦卒中、再發(fā)急性心肌梗死(re-AMI)、惡性室性失常(VT/VF)等多種嚴(yán)重并發(fā)癥[3,4]。因此對(duì)于PCI術(shù)后的DM-AMI患者進(jìn)行早期篩查和制定強(qiáng)化治療方案尤為重要[5],既往多數(shù)研究采用 Logistic模型構(gòu)建AMI患者的預(yù)測(cè)模型,但目前機(jī)器學(xué)習(xí),尤其是決策樹分析被逐漸運(yùn)用到高危人群分層篩查中,如在腦卒中、肺動(dòng)脈高壓人群有較好的效果[6,7]。因此,本研究比較兩種分析方法建立模型預(yù)測(cè)不良終點(diǎn)事件的作用,并進(jìn)行后者的分層亞組風(fēng)險(xiǎn)計(jì)算,為AMI合并DM的患者行急診PCI的術(shù)后人群不良終點(diǎn)事件建立預(yù)測(cè)模型提供較新的分析思路。
1.1 研究對(duì)象選擇2016年1月至2017年1月于鄭州大學(xué)第一附屬醫(yī)院心臟重癥科(CCU)住院AMI患者;信息采集來自一項(xiàng)大型研究——“冠心病患者PCI術(shù)后臨床結(jié)局及其影響因素分析:CORFCHD-ZZ研究(3561例CHD患者)”,注冊(cè)信息、入組人群、臨床收集資料信息見本研究已發(fā)表的前期報(bào)道[8,9]。本次分析對(duì)象納入標(biāo)準(zhǔn):年齡≥18歲;急診冠狀動(dòng)脈(冠脈)造影證實(shí)急性心肌梗死,至少有一支冠脈血管狹窄程度≥95%[10];發(fā)病12 h內(nèi)行急診PCI并至少植入1枚冠脈支架;已確診2型糖尿病。經(jīng)過納入排除標(biāo)準(zhǔn)篩選后,本研究最終納入DM-AMI初次急診PCI患者共525例(圖1)。本研究遵循Helsinki宣言,經(jīng)醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)。
1.2 隨訪隨訪首要終點(diǎn)事件包括:主要不良心血管事件(MACE)(心血管死亡事件、急性心功能不全住院),和腦血管意外、再發(fā)心肌梗死事件并行PCI、全因死亡、頻發(fā)室速/室顫(VT/VF)和接受擇期CABG手術(shù)。
1.3 統(tǒng)計(jì)學(xué)分析①建模步驟:采用SPSS 24.0統(tǒng)計(jì)軟件。計(jì)量資料的分組(cutoff值)均用受試者工作特征曲線(ROC)曲線進(jìn)行拆分。單因素變量入選多因素回歸、或決策樹的檢驗(yàn)水準(zhǔn)為α=0.05。多因素回歸分析采用似然比檢驗(yàn)的Forward:LR;決策樹模型選用CHAID算法進(jìn)行變量篩選,使用Pearsonχ2檢驗(yàn)篩選出最佳分類結(jié)果。②樹模型:父節(jié)點(diǎn)和子節(jié)點(diǎn)的最小案例數(shù)分別設(shè)置為100和50,樹深度限制為6;檢驗(yàn)方式為“交叉檢驗(yàn)(樣本群數(shù)=10)。③模型評(píng)價(jià):Logistic回歸模型采用似然比χ2和Hosmer-Lemeshow擬合效果檢驗(yàn),ROC曲線對(duì)多因素回歸預(yù)測(cè)效果和決策樹模型效果進(jìn)行評(píng)價(jià),并采用MedcalcV 18.2軟件對(duì)兩個(gè)模型的ROC曲線進(jìn)行繪制與對(duì)比。
2.1 隨訪人群基本資料隨訪患者的一般臨床分層資料如表1所示,不良終點(diǎn)發(fā)生率在年齡>60歲(51.9%vs. 22.2%)、糖尿病病程>5年(46.9%vs. 29.9%)、合并腦血管病史(54.8%vs. 33.7%)、心力衰竭NYHA Ⅱ~Ⅳ級(jí)(45.3%vs.29.2%)、BNP>350 ng/L(48.0%vs. 26.4%)、CRP>8.3 mmol/L(50.3%vs. 33.5%)、院外使用他汀藥物(34.0%vs. 71.2%)、院外使用降糖藥物(32.4%vs. 62.2%)基線資料中的差異有統(tǒng)計(jì)學(xué)意義(P均<0.001),表1。
表1 隨訪患者的臨床資料和不良終點(diǎn)發(fā)生率
2.2 隨訪人群的結(jié)局事件共525例患者完成隨訪,隨訪時(shí)間為24個(gè)月,圖1。其中發(fā)生不良終點(diǎn)事件203例,發(fā)生率38.7%。MACE事件、腦卒中、再發(fā)心肌梗死事件行PCI術(shù)、全因死亡、頻發(fā)室速/室顫、接受擇期CABG手術(shù)等分別發(fā)生:45例、8例、85例、71例、35例、30例,分別占比總?cè)巳?.6%、1.5%、16.2%、13.5%、6.7%、5.7%,圖2。
圖1 入組隨訪流程圖
圖2 隨訪人群的結(jié)局事件分布圖
2.3 單因素Logistic回歸分析“年齡≥60歲”、“糖尿病病程≥5年”、“腦血管病史”、“心力衰竭”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“院外不使用他汀藥物”和“院外不使用降糖藥物”等8個(gè)單因素是不良終點(diǎn)事件的危險(xiǎn)因素,差異有很強(qiáng)的統(tǒng)計(jì)學(xué)意義(P<0.001)。其余臨床資料單因素分析均無(wú)明顯差異。
2.4 不良終點(diǎn)事件的多因素Logistic回歸分析和回歸模型評(píng)價(jià)將單因素Logistic分析的8個(gè)危險(xiǎn)因素納入自變量中,共線性分析提示無(wú)共線性(表2),VIF分別為1.068、1.031、1.070、2.495、2.675、1.155、1.110、1.096。 以2年發(fā)生不良終點(diǎn)事件為因變量,使用多因素Logistic向前逐步回歸發(fā)分析,發(fā)現(xiàn)“年齡≥60歲”、“腦血管病史”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”等是不良終點(diǎn)事件的獨(dú)立危險(xiǎn)因素,“院外使用他汀”、“院外使用降糖藥物”是不良終點(diǎn)事件的獨(dú)立保護(hù)因素(P<0.05),表3。
表2 單因素Logistic回歸分析
表3 多因素Logistic回歸分析
Logistic回歸模型似然比卡方(likeihoodratioχ2)=133.966,DF=7,P<0.001,構(gòu)建的模型具有統(tǒng)計(jì)學(xué)意義。同時(shí)Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)顯示模型擬合較好,χ2=11.976,DF=8,P=0.152。
2.5 不良終點(diǎn)事件的決策樹模型將有單因素Logistic分析的8個(gè)危險(xiǎn)因素作為預(yù)測(cè)因子納入決策樹CHAID模型,得出的模型包括3層,共11個(gè)節(jié)點(diǎn)(0~10),其中終端節(jié)點(diǎn)6個(gè)。共篩選出5個(gè)解釋變量,分別為“年齡≥60歲”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“不使用降糖藥物”和“糖尿病病程≥5年”。結(jié)果顯示年齡是DM-AMI整體人群隨訪時(shí)不良終點(diǎn)事件最重要的影響因素(第一層):它將樣本分為2個(gè)亞群,其中“年齡≥60歲”的患者發(fā)生不良終點(diǎn)事件的概率是51.9%,遠(yuǎn)高于“年齡<60歲”患者22.2%的發(fā)生率,是DM-AMI行急診PCI術(shù)后患者出現(xiàn)不良終點(diǎn)事件時(shí)間的高發(fā)人群,說明年齡是不良終點(diǎn)事件的首要危險(xiǎn)因素,圖3。相同的,第二層“不使用降糖藥物”和“BNP≥350 ng/L”分別成為了“年齡≥60歲”和“年齡<60歲”的人群分層的重要影響因素。在第三層,“CRP≥8.3 mmol/L”和“糖尿病病程≥5年” 分別成為了“年齡≥60歲+使用降糖藥物”和“年齡<60歲+BNP≥350 ng/L”人群分層的重要影響因素。
圖3 糖尿病急性心肌梗死人群急診PCI術(shù)后2年內(nèi)不良終點(diǎn)事件危險(xiǎn)因素的決策樹模型
模型擬合情況指示模型良好,具體見圖4,增益圖從0開始快速增長(zhǎng),逐漸趨于平穩(wěn)到達(dá)100%平臺(tái);指數(shù)圖從高于100%開始,沿移動(dòng)維持較高的穩(wěn)定水平后,快速降低至100%。CHAID決策樹模型的決策點(diǎn)收益分析見表4,決策點(diǎn)4、7、9、8的指數(shù)值>100%,提示這些節(jié)點(diǎn)所涉及的影響因素與未來不良結(jié)局事件具有很強(qiáng)的聯(lián)系。模型風(fēng)險(xiǎn)統(tǒng)計(jì)量為0.309±0.020,表示用該模型的總體正確百分比為69.1%,并且院外治療后未發(fā)生不良終點(diǎn)事件的正確預(yù)測(cè)率為84.8%,擬合效果較好。
表4 DM-AMI人群PCI術(shù)后的不良終點(diǎn)事件決策點(diǎn)收益表
圖4 不良終點(diǎn)事件決策樹模型增益圖和指數(shù)圖
2.6 以決策樹流程模型劃分的分層亞組風(fēng)險(xiǎn)根據(jù)樹模型分割亞組后,圖3和表5所示,分別以每一層最左側(cè)節(jié)點(diǎn):節(jié)點(diǎn)1、節(jié)點(diǎn)3、節(jié)點(diǎn)7分別為每一層的參考組(OR=1.00),計(jì)算每一層其余各個(gè)節(jié)點(diǎn)的不良終點(diǎn)事件生存風(fēng)險(xiǎn)。三維OR風(fēng)險(xiǎn)圖(圖5)。
綜合圖3,表5和圖5,繼第一層以年齡分為亞組后,第二層中同時(shí)符合“不使用降糖藥物”和“年齡≥60歲”兩個(gè)特點(diǎn)的人群具有最嚴(yán)重的不良終點(diǎn)事件發(fā)生風(fēng)險(xiǎn),相對(duì)于決策點(diǎn)3的OR為1.988(P=0.004),發(fā)生不良終點(diǎn)事件的概率為72.9%。
圖5 不良終點(diǎn)事件決策樹對(duì)應(yīng)節(jié)點(diǎn)OR相對(duì)生存風(fēng)險(xiǎn)對(duì)比
表5 以決策樹流程模型劃分的分層亞組生存風(fēng)險(xiǎn)
第三層,決策點(diǎn)7同時(shí)有“CRP≥8.3 mmol/L”、“不使用降糖藥物”和“年齡≥60歲”三種特征的人群具有最嚴(yán)重的不良終點(diǎn)事件發(fā)生風(fēng)險(xiǎn),并且發(fā)生不良終點(diǎn)事件的概率為56.5%:當(dāng)決策點(diǎn)7的相對(duì)OR為1.00的時(shí)候,決策點(diǎn)8、9、10的OR風(fēng)險(xiǎn)只有0.516、0.398、0.158,發(fā)生不良終點(diǎn)事件的概率分別為40.1%、40.4%和21.6%。
2.7 多因素Logistic回歸與分類樹模型預(yù)測(cè)結(jié)果和評(píng)價(jià)對(duì)多因素Logistic回歸預(yù)測(cè)模型,和分類樹模型的個(gè)體發(fā)生2年內(nèi)不良終點(diǎn)事件發(fā)生率分別繪制ROC曲線。決策樹模型靈敏度高于Logistic回歸預(yù)測(cè)模型,為77.6%和73.9%,但Logistic回歸模型的特異度高于決策樹模型,為70.2%和60.1%。分別對(duì)兩模型繪制ROC曲線,結(jié)果顯示多因素回歸模型AUC為0.784(95%CI:0.746~0.818),決策樹模型AUC為0.765(95%CI:0.727~0.818),兩模型的預(yù)測(cè)價(jià)值均為中等(0.7~0.9);兩個(gè)模型的AUC相差使用De Long等的Z檢驗(yàn)[12]對(duì)其進(jìn)行比較,結(jié)果顯示兩個(gè)模型的差異無(wú)統(tǒng)計(jì)學(xué)意義(Z=1.122,0.2619),(圖6,表6)。
表6 Logistic回歸與分類樹模型的擬合指標(biāo)比較
圖6 Logistic回歸與分類樹模型的ROC曲線圖
本研究發(fā)現(xiàn),經(jīng)過單因素分析篩選后,Logistic多因素回歸模型顯示,“年齡≥60歲”、“腦血管病史”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“院外使用他汀”、“院外使用降糖藥物”是預(yù)測(cè)糖尿病急性心肌梗死行急診PCI術(shù)后人群的不良終點(diǎn)事件發(fā)生的獨(dú)立預(yù)測(cè)因子;通過決策樹模型進(jìn)一步證實(shí),“年齡≥60歲”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”和“不使用降糖藥物”參與不良終點(diǎn)事件的發(fā)生。對(duì)比兩模型后發(fā)現(xiàn),Logistic回歸模型的靈敏度低于決策樹,但特異度高于決策樹模型,AUC未見統(tǒng)計(jì)學(xué)差異。
Logistic回歸模型和決策樹模型各有優(yōu)勢(shì),但在直觀展示分層亞組中決策樹更有優(yōu)勢(shì):①?zèng)Q策樹模型可以揭示各個(gè)因素對(duì)結(jié)果變量的重要程度,其表現(xiàn)形式以直觀分層形式展現(xiàn)?!澳挲g≥60歲”為本研究決策樹模型第一分層因素,提示高齡糖尿病患者對(duì)病情預(yù)后的最重要影響。②依據(jù)決策樹模型的流程分層情況,簡(jiǎn)單高效地識(shí)別急診PCI術(shù)后的高危事件發(fā)病人群。本研究結(jié)果提示,長(zhǎng)期優(yōu)化治療方案及隨訪應(yīng)重點(diǎn)關(guān)注高齡人群、不使用降糖藥物/控制血糖不佳人群、心肌持續(xù)損傷人群(BNP≥350 ng/L)和高全身炎癥指標(biāo)人群(CRP≥8.3 mmol/L);而年輕人群、規(guī)律使用降糖藥物人群、非心肌持續(xù)損傷人群和低炎癥指標(biāo)人群發(fā)生不良終點(diǎn)事件的發(fā)生風(fēng)險(xiǎn)較小。因此前者應(yīng)為長(zhǎng)期治療的高危事件預(yù)防觀察對(duì)象。③決策樹模型能夠清楚地顯示各因素間相互作用的關(guān)系。比如高炎癥人群的預(yù)測(cè)意義僅在老年患者、使用糖尿病藥物的人群中具有預(yù)測(cè)意義。④另外,由于Logistic回歸只能對(duì)整體人群構(gòu)建預(yù)測(cè)模型,無(wú)法對(duì)樣本進(jìn)行逐步切割,從而無(wú)法找到一個(gè)目標(biāo)結(jié)果可能性最大的亞組,亦無(wú)法針對(duì)自變量的重要程度進(jìn)行分層排序:如表5和圖5所示,決策樹的分層切割后在每一層中形成了不同亞組,使用三維直方圖可以直觀展示出對(duì)應(yīng)的不同亞組的生存風(fēng)險(xiǎn),而Logistic回歸無(wú)此種優(yōu)勢(shì)。本研究中,Logistic回歸模型中的腦血管病史和他汀藥物的使用沒有進(jìn)入決策樹模型,造成這一差異的原因可能為腦血管病史與降糖藥物有交互作用(交互性P=0.019),并且他汀與降糖藥物也有交互作用(交互性P=0.023),因此決策樹在納入變量時(shí)使用了降糖藥物作為分層因素的主效應(yīng),導(dǎo)致其他兩者沒有進(jìn)入最終的樹模型,但是Logistic回歸模型表明這兩種因素時(shí)不可忽視的。因此,如果在未來能夠?qū)⑸鲜鏊惴〝U(kuò)充到考慮多屬性、擴(kuò)大樣本量或生成樹時(shí)調(diào)整父節(jié)點(diǎn)和子節(jié)點(diǎn)的案例限制數(shù),有可能填補(bǔ)決策樹對(duì)于主效應(yīng)忽略這一缺陷。
隨訪時(shí)終點(diǎn)事件風(fēng)險(xiǎn)評(píng)估模型是從疾病的篩查角度出發(fā),需要較高的診斷靈敏度。決策樹作為一個(gè)有效的未來事件預(yù)測(cè)工具,可在快速對(duì)DM-AMI的PCI術(shù)后人群進(jìn)行不良終點(diǎn)事件的預(yù)測(cè)。決策樹CHAID模型和Logistic回歸分析結(jié)果均顯示高齡、長(zhǎng)糖尿病病史、高BNP、高炎癥反應(yīng)CRP和不使用降糖藥物是糖尿病急性心肌梗死PCI術(shù)后人群不良終點(diǎn)事件的危險(xiǎn)因素。Shreenidhi等的PROCEED前瞻性研究發(fā)現(xiàn)[14],高齡人群和糖尿病的持續(xù)時(shí)間是MACE事件(全因死亡、非致死性心肌梗死或晚期冠脈血管重建)的獨(dú)立危險(xiǎn)因素,在經(jīng)過校正后前者每十年風(fēng)險(xiǎn)升高2.45倍,后者每五年風(fēng)險(xiǎn)升高1.59倍;同時(shí),Aurora等[14]的多中心臨床試驗(yàn)納入了1400例已發(fā)生急性冠脈綜合征(ACS)的糖尿病患者進(jìn)行5年隨訪,發(fā)現(xiàn)其中783例(55.9%)患者出現(xiàn)了至少一次的不良終點(diǎn)事件,并且高齡、外周血管性疾病、充血性心力衰竭均為可預(yù)測(cè)的危險(xiǎn)因素。近期,免疫炎癥反應(yīng)已被證實(shí)在加重動(dòng)脈粥樣硬化作用中具有重要作用[15],秋水仙堿隨機(jī)對(duì)照COLCOT臨床試驗(yàn)發(fā)表于《The New England Journal of Medicine》雜志,首次證實(shí)了秋水仙堿抗炎效果的心血管獲益,其中慢性冠脈綜合征(CCD)患者的不良終點(diǎn)事件風(fēng)險(xiǎn)相對(duì)下降了31%(HR=0.69,95%CI:0.57~0.83,P<0.001)[16]。當(dāng)不使用降糖藥物作為多因素Logistic回歸和決策樹模型均出現(xiàn)的主要危險(xiǎn)因素,提示臨床醫(yī)師在制定患者長(zhǎng)期治療方案時(shí)應(yīng)進(jìn)行心血管、內(nèi)分泌等多學(xué)科合作,提升患者的治療依從性,華思敏等隨機(jī)抽取了國(guó)內(nèi)三級(jí)診療中心的DM門診患者發(fā)現(xiàn)[17],78.1%的患者采用行為、生活方式調(diào)整和藥物治療相結(jié)合的方法來控制DM,僅20.3%采用藥物治療,且34.7%的患者服藥依從性不佳。因此改善患者的藥物認(rèn)知,建立門診隨訪團(tuán)隊(duì),使其得到更加全面的PCI術(shù)后干預(yù),提高對(duì)DM疾病的預(yù)后認(rèn)知,改善其血糖控制率,可進(jìn)一步優(yōu)化患者的生存質(zhì)量。
本研究存在的不足:①本研究為單中心回顧性研究,可能僅能代表部分地區(qū);②CORFCHDZZ研究收集了3561例CHD患者的臨床資料,但本研究在使用了嚴(yán)格的納入排除標(biāo)準(zhǔn)后,最終納入的DM-AMI患者525例(不良終點(diǎn)事件203例,38.7%),對(duì)于決策樹危險(xiǎn)因素進(jìn)行更多深度或更寬的分層構(gòu)建可能會(huì)影響預(yù)測(cè)質(zhì)量;③納入的影響因素多為入院時(shí)的基線水平生化資料及隨訪的臨床藥物資料。因此,多中心、前瞻性的試驗(yàn)亟待進(jìn)行。
綜上所述,采用決策樹分析結(jié)果能更為直觀、形象地反映DM-AMI行急診PCI手術(shù)人群的術(shù)后生存風(fēng)險(xiǎn)特征,還能直觀比較各種不良因素對(duì)終點(diǎn)事件的影響強(qiáng)度,自動(dòng)分層和切割亞組、并明確重要決策點(diǎn)。應(yīng)用分層因素對(duì)AMI患者分類可快速找到對(duì)不良終點(diǎn)事件影響最大的因素組合;我們使用了之前較少的三維分組立方圖展示了分層、亞組的患者風(fēng)險(xiǎn),有利于臨床醫(yī)師對(duì)高危人群進(jìn)行PCI術(shù)后風(fēng)險(xiǎn)預(yù)測(cè)和制定隨訪方案。本研究旨在評(píng)估不良終點(diǎn)事件并提供一種較新的直觀預(yù)測(cè)方法,未來將通過進(jìn)一步追蹤患者的動(dòng)態(tài)資料以完善對(duì)終點(diǎn)事件的預(yù)后評(píng)估,從而為院外治療的防治提供更有價(jià)值的臨床指導(dǎo)方案。
利益沖突聲明:本文作者均無(wú)利益沖突。