王孟,覃露,王春娟,李姣,王伊龍,趙性泉,王擁軍,李子孝
卒中是全球死亡率最高的疾病之一[1]。根據(jù)全球疾病負(fù)擔(dān)研究最新估計(jì),2017年我國卒中死亡率為106/10萬,居我國疾病死因首位[2]。腦出血是致殘率、死亡率最高的一類卒中亞型,分別占卒中發(fā)病、死亡的30.1%和50.0%[1,3]。卒中相關(guān)肺炎(stroke-associated pneumonia,SAP)是腦出血常見并發(fā)癥之一,是導(dǎo)致卒中患者死亡的獨(dú)立危險因素[4-6],增加患者住院時間和醫(yī)療費(fèi)用[7-8]。因此,探索SAP的危險因素,建立風(fēng)險預(yù)測模型,是發(fā)現(xiàn)高危人群、預(yù)防SAP、降低卒中死亡率的有效手段。
研究證明,年齡、性別、吸煙、糖尿病、高血壓、心房顫動、心力衰竭、慢性阻塞性肺疾病、吞咽困難、高血糖等可能是導(dǎo)致SAP的危險因素[9-12]。目前,應(yīng)用于腦出血相關(guān)肺炎的預(yù)測模型較少。冀瑞俊等[13]在中國國家卒中登記人群中,首次建立了腦出血相關(guān)肺炎預(yù)測模型。
機(jī)器學(xué)習(xí)能夠?qū)Υ髷?shù)據(jù)深度挖掘與分析,目前已在疾病發(fā)病、預(yù)后預(yù)測等方面有廣泛應(yīng)用[14-15]。然而,目前尚未有基于機(jī)器學(xué)習(xí)的疾病風(fēng)險預(yù)測模型,應(yīng)用于腦出血相關(guān)肺炎的早期診斷。本研究采用基于機(jī)器學(xué)習(xí)的Logistic回歸、CatBoost、XGBoost、LightGBM四種算法,建立、評價腦出血相關(guān)肺炎預(yù)測模型。
1.1 研究對象 本研究基于中國國家卒中登記Ⅱ(China National Stoke Registry Ⅱ,CNSRⅡ)數(shù)據(jù)庫,以2012年5月-2013年1月連續(xù)登記的發(fā)病7 d內(nèi)的急性腦出血住院患者為研究對象,研究覆蓋我國219家醫(yī)院。
納入標(biāo)準(zhǔn):①年齡>18歲;②根據(jù)世界衛(wèi)生組織診斷標(biāo)準(zhǔn)診斷為腦出血[16];③腦出血診斷經(jīng)CT或MRI確診;④經(jīng)門診或急診住院;⑤入院后經(jīng)吞咽功能評價;⑥患者或法定代表人簽署知情同意。排除臨床信息不完整的患者。
1.2 研究方法
1.2.1 患者基本信息 采用病例報告表收集患者的人口統(tǒng)計(jì)學(xué)信息(年齡、性別、吸煙、飲酒)、既往病史(高血壓、糖尿病、血脂異常、心房顫動、周圍血管疾病、心肌梗死、心力衰竭、慢性阻塞性肺疾病、腦血管?。⑷朐汉笈R床檢查結(jié)果(吞咽功能障礙、NIHSS評分、白細(xì)胞計(jì)數(shù))。病例報告表中數(shù)據(jù)的完整性、準(zhǔn)確性由獨(dú)立的數(shù)據(jù)專家進(jìn)行核查。
1.2.2 卒中相關(guān)肺炎的診斷標(biāo)準(zhǔn) 患者出現(xiàn)呼吸道感染的臨床表現(xiàn)和實(shí)驗(yàn)室指標(biāo)異常(如發(fā)熱、咳嗽、聽診呼吸音粗或啰音、新的膿性痰或痰培養(yǎng)陽性),同時有典型的胸部X線或CT檢查結(jié)果支持,臨床診斷為SAP[17]。
1.2.3 機(jī)器學(xué)習(xí)算法 CatBoost在2017年被Yandex[15]首次提出,它采用對稱樹的方式,并且用特殊的方式來處理分類特征,從而有效地避免了過擬合的問題,提高了泛化能力,提高了模型的魯棒性,特別適合樣本量小、數(shù)據(jù)不平衡的情況。
XGBoost是華盛頓大學(xué)陳天奇[18]于2016年開發(fā)的Boosting庫,兼具線性規(guī)模求解器和樹學(xué)習(xí)算法。傳統(tǒng)的梯度提升迭代決策樹(gradient boosting decision tree,GBDT)方法只利用了一階的導(dǎo)數(shù)信息,XGBoost則是對損失函數(shù)做了二階的泰勒展開,并在目標(biāo)函數(shù)之外加入了正則項(xiàng),整體求最優(yōu)解,用于權(quán)衡目標(biāo)函數(shù)的下降和模型的復(fù)雜程度,避免過擬合,提高模型的求解效率。
LightGBM是微軟2015年提出的新的Boosting框架模型,該算法在傳統(tǒng)的GBDT基礎(chǔ)上引入了兩個新技術(shù):梯度單邊采樣技術(shù)(gradient-based one-side sampling,GOSS)和獨(dú)立特征合并技術(shù)(exclusive feature bundling,EFB)。GOSS可以剔除很大一部分梯度很小的數(shù)據(jù),只使用剩余的數(shù)據(jù)來估計(jì)信息增益,從而避免低梯度長尾部分的影響。EFB實(shí)現(xiàn)互斥特征的捆綁,以減少特征的數(shù)量[18]。
1.3 統(tǒng)計(jì)學(xué)方法 數(shù)據(jù)分析應(yīng)用SAS軟件(版本9.4,SAS Institute Inc,Cary,NC)完成。計(jì)量資料采用中位數(shù)(四分位數(shù)間距)表示,組間比較采用Wilcoxon檢驗(yàn);計(jì)數(shù)資料用頻數(shù)和百分比表示,組間比較采用卡方檢驗(yàn)。將SAP組和非SAP組隨機(jī)分為訓(xùn)練集(80%)和測試集(20%)。在訓(xùn)練集中,采用非條件Logistic回歸,建立預(yù)測模型,選擇納入模型的預(yù)測指標(biāo)。首先采用單因素Logistic回歸,以P<0.1為納入多因素分析的標(biāo)準(zhǔn);將單因素分析選擇出的危險因素納入多因素分析,采用逐步回歸法,以P<0.05為最終納入多因素模型的標(biāo)準(zhǔn),建立腦出血相關(guān)肺炎風(fēng)險預(yù)測模型;用測試集人群對訓(xùn)練集建立的模型進(jìn)行內(nèi)部驗(yàn)證。最后,使用多因素Logistic回歸模型納入的指標(biāo),采用Logistic回歸、CatBoost、XGBoost和LightGBM四種機(jī)器學(xué)習(xí)方法,在訓(xùn)練集、測試集分別建立、驗(yàn)證預(yù)測模型,用ROC曲線下面積(area under the curve,AUC)、靈敏度、特異度和正確率比較4種方法預(yù)測價值。以上統(tǒng)計(jì)均采用雙側(cè)檢驗(yàn),以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
2.1 患者一般特征 本研究共納入符合研究條件的腦出血住院患者2303例,平均年齡62.1±12.7歲,男性占62.1%。住院期間肺炎發(fā)生率為15.7%(3 61/2 3 03)。非SAP組年齡[61(53~71)歲 vs 67(58~76)歲,P<0.001]、NIHSS評分[6(3~10)vs 10(5~16),P <0.0 0 1]和周圍血管疾病史(2.6% vs 5.8%,P=0.001)、慢性阻塞性肺疾病史(1.1% vs 3.9%,P<0.001)、腦血管病史(22.9% vs 31.6%,P<0.001)、吞咽功能障礙發(fā)生率(10.6% vs 50.1%,P<0.001)均顯著低于SAP組;而白細(xì)胞計(jì)數(shù)[7.6(6.0~9.7)×109/L vs 9.3(7.2~12.4)×109/L,P<0.001]顯著高于SAP組;其余人口學(xué)信息、既往病史等,兩組無統(tǒng)計(jì)學(xué)差異(表1)。
2.2 Logistic回歸單因素和多因素分析結(jié)果在訓(xùn)練集中(SAP患者288例,非SAP患者1553例),單因素Logistic回歸結(jié)果顯示年齡、周圍性血管疾病、慢性阻塞性肺疾病、腦血管疾病史、吞咽功能障礙、NIHSS評分、白細(xì)胞計(jì)數(shù)可納入多因素分析。多因素Logistic回歸結(jié)果顯示年齡、吞咽功能障礙、NIHSS評分、白細(xì)胞計(jì)數(shù)可作為候選預(yù)測因子來構(gòu)建預(yù)測模型(表2)。
2.3 Logistic回歸、CatBoost、XGBoost、LightGBM四種模型結(jié)果比較 選擇Logistic回歸選出的4個危險因素,在測試集(SAP患者73例,非SAP患者389例)驗(yàn)證模型效果,并建立CatBoost、XGBoost、LightGBM預(yù)測模型。結(jié)果顯示ROC曲線下面積Logistic回歸、XGBoost、LightGBM模型較高,分別為0.776、0.736、0.767;XGBoost和LightGBM模型靈敏度較高,分別為80.82%和80.82%;Logistic回歸和CatBoost模型特異度較高,分別為69.15%和86.12%;其余結(jié)果見表3和圖1。
表1 根據(jù)住院期間是否發(fā)生肺炎分組的患者基線特征
表2 單因素與多因素Logistic回歸分析結(jié)果
本研究建立并驗(yàn)證腦出血相關(guān)肺炎預(yù)測模型,可用于腦出血患者肺炎發(fā)生風(fēng)險預(yù)測。結(jié)合患者基本信息、疾病史、臨床檢查、血液檢查等指標(biāo),使用Logistic回歸、CatBoost、XGBoost、LightGBM四種算法構(gòu)建預(yù)測模型,以期能夠輔助臨床醫(yī)生診斷、預(yù)測肺炎發(fā)生。
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域中一種新方法,可以對大量輸入數(shù)據(jù)的特征標(biāo)識進(jìn)行有效學(xué)習(xí),為精準(zhǔn)預(yù)測提供了新的研究思路和方法。機(jī)器學(xué)習(xí)算法有傳統(tǒng)的邏輯回歸、決策樹,以及在此基礎(chǔ)上延伸出的隨機(jī)森林、LightGBM、XGBoost等。已有學(xué)者利用這些模型開展疾病預(yù)測研究,且取得較好效果。曹文哲等[19]采用BP神經(jīng)網(wǎng)絡(luò)(back-propagation neural network)、Logistic回歸和隨機(jī)森林3種機(jī)器學(xué)習(xí)算法,納入年齡、游離前列腺癌特異抗原等4種危險因素,建立診斷預(yù)測模型,并比較3種模型對前列腺癌的診斷價值,結(jié)果證明機(jī)器學(xué)習(xí)建立的多因素預(yù)測模型預(yù)測效果,優(yōu)于任意一種單因素建立的預(yù)測模型,所建立模型可納入前列腺癌診斷決策,協(xié)助臨床醫(yī)生對患者的診斷和治療,減少不必要的活檢。Heo等[20]在回顧性隊(duì)列中,采用深度神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、Logistic回歸3種算法,建立急性卒中良好結(jié)局預(yù)測模型,與洛桑急性卒中登記分析(acute stroke registry and analysis of Lausanne,ASTRAL)模型[21]進(jìn)行比較,結(jié)果表明,深度神經(jīng)網(wǎng)絡(luò)效果較好(AUC=0.888),能夠顯著提高模型預(yù)測效果;作者同時證明,當(dāng)選擇和ASTRAL評分相同變量時,機(jī)器學(xué)習(xí)并未顯著提高模型預(yù)測效果。與此結(jié)果類似,本研究中,當(dāng)選擇相同變量時,盡管在訓(xùn)練集中XGBoost(AUC=0.844)、LightGBM(AUC=0.822)模型效果顯著高于Logistic回歸(AUC=0.778)模型,但測試集中,Logistic回歸(AUC=0.776)模型效果略優(yōu)于XGBoost(AUC=0.736)、LightGBM(AUC=0.767)。
表3 Logistic回歸、CatBoost、XGBoost、LightGBM四種模型結(jié)果比較
圖1 Logistic回歸、CatBoost、XGBoost、LightGBM四種模型ROC曲線結(jié)果比較
為了盡早識別發(fā)生肺炎的高風(fēng)險患者,優(yōu)化預(yù)警和干預(yù)措施,可改善患者預(yù)后,近年來國內(nèi)外已經(jīng)建立多個SAP預(yù)測量表[12,22-25],但多為腦梗死相關(guān)肺炎預(yù)測。冀瑞俊等[13]建立首個腦出血相關(guān)肺炎預(yù)測模型,研究采用Logistic回歸,納入年齡、吸煙、飲酒、慢性阻塞性肺疾病、mRS評分、NIHSS評分、GCS評分、吞咽困難等11個指標(biāo),結(jié)果表明,該模型AUC為0.76,預(yù)測效果較好。然而,該模型未納入實(shí)驗(yàn)室檢查的指標(biāo),已有研究證明超敏反應(yīng)蛋白、白細(xì)胞計(jì)數(shù)等指標(biāo)與SAP嚴(yán)重程度正相關(guān)[26-27];同時,該模型納入指標(biāo)過多,在臨床使用時,增加臨床醫(yī)生工作負(fù)擔(dān)。本研究納入實(shí)驗(yàn)室檢查指標(biāo),使用白細(xì)胞計(jì)數(shù)作為預(yù)測因子,結(jié)果顯示,白細(xì)胞計(jì)數(shù)對于SAP發(fā)生的影響(OR 1.11,95%CI 1.07~1.16)高于年齡(OR 1.03,95%CI 1.02~1.04)和NIHSS評分(OR 1.02,95%CI 1.00~1.04);同時本研究只納入4個預(yù)測因子,Logistic回歸(AUC=0.776)和LightGBM(AUC=0.767)兩個模型的預(yù)測效果均高于上述研究的預(yù)測效果,預(yù)測結(jié)果更準(zhǔn)確。
本研究的優(yōu)勢有以下三點(diǎn):首先,腦出血相關(guān)肺炎預(yù)測模型較少,本研究嘗試在腦出血患者中,使用機(jī)器學(xué)習(xí)的方法預(yù)測SAP發(fā)生風(fēng)險,研究方法可供后續(xù)研究使用;其次,白細(xì)胞計(jì)數(shù)在臨床上容易獲得,并且與SAP發(fā)生關(guān)聯(lián)較高,因此模型只納入4個預(yù)測因子,取得較好的預(yù)測效果,方便臨床醫(yī)生的實(shí)際應(yīng)用;最后本研究將人群隨機(jī)分為兩部分,對建立的模型進(jìn)行了內(nèi)部驗(yàn)證,保證了模型結(jié)果的可靠性。同時,本研究也有不足之處,模型未進(jìn)行外部驗(yàn)證,仍需在大樣本、多中心的外部人群中進(jìn)行驗(yàn)證,以保證模型的準(zhǔn)確性與可靠性。
綜上,基于機(jī)器學(xué)習(xí)方法建立的腦出血相關(guān)肺炎風(fēng)險預(yù)測模型有較高的診斷價值,年齡、NIHSS評分、白細(xì)胞計(jì)數(shù)和吞咽功能障礙為候選預(yù)測因子,可將模型納入腦出血相關(guān)肺炎診斷決策。本研究結(jié)果的臨床應(yīng)用價值有待于更大樣本的外部隊(duì)列進(jìn)行驗(yàn)證。
【點(diǎn)睛】基于機(jī)器學(xué)習(xí)的方法,結(jié)合實(shí)驗(yàn)室檢查指標(biāo),可優(yōu)化腦出血相關(guān)肺炎預(yù)測模型。