楊美程,李潤(rùn)發(fā),陳輝,李建清, ,劉澄玉*
(1.東南大學(xué)儀器科學(xué)與工程學(xué)院 數(shù)字醫(yī)學(xué)工程全國(guó)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210096;2.東南大學(xué)附屬中大醫(yī)院重癥醫(yī)學(xué)科 江蘇省重癥醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210009;3.南京醫(yī)科大學(xué)生物醫(yī)學(xué)工程與信息學(xué)院,江蘇 南京 211166)
膿毒癥是一種由感染導(dǎo)致宿主反應(yīng)失調(diào)而危及生命的器官功能障礙疾病,其患病率及死亡率均較高[1]。根據(jù)2020 年《柳葉刀》發(fā)布的研究報(bào)告顯示,全球每年有接近4 900 萬膿毒癥患者,約1 100 萬人死于其并發(fā)癥,占全球總死亡病例的20%[2];2020 年中國(guó)流行病學(xué)研究表明,我國(guó)重癥監(jiān)護(hù)病房(intensive care unit,ICU)膿毒癥發(fā)病率為20.6%,死亡率高達(dá)35.5%[3]。目前,醫(yī)院患者救治負(fù)荷持續(xù)增大,特別是在諸如新冠疫情等重大突發(fā)公共衛(wèi)生事件發(fā)生時(shí)尤其突出,醫(yī)療資源處于持續(xù)飽和狀態(tài),患者管理面臨前所未有的壓力。因此,如何基于醫(yī)學(xué)大數(shù)據(jù)分析以及利用人工智能(artificial intelligence,AI)等手段,通過醫(yī)工交叉創(chuàng)新,減輕醫(yī)生負(fù)擔(dān),提高疾病防治效率,是未來智能化醫(yī)療體系建設(shè)的關(guān)鍵和重點(diǎn)。在AI 算法中,根據(jù)訓(xùn)練所需樣本提供信息以及反饋方式的不同,將其主要分為3 類,分別是監(jiān)督學(xué)習(xí)(supervised learning,SL)、無監(jiān)督學(xué)習(xí)(unsupervised learning,UL)和強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)。本文主要圍繞這3類方法分別對(duì)AI 在膿毒癥早期預(yù)警、臨床分型以及精準(zhǔn)化治療方面的應(yīng)用進(jìn)行綜述。
“中國(guó)預(yù)防膿毒癥行動(dòng)”主張對(duì)膿毒癥要做到“早預(yù)防、早發(fā)現(xiàn)、早干預(yù),降低膿毒癥的發(fā)生率和病死率”的“三早兩降”要求,并提出了“膿毒癥前狀態(tài)”和膿毒癥“未病先防,既病防傳”的防治理念[4]。研究表明,若無法及時(shí)篩查出膿毒癥,可能導(dǎo)致抗菌藥物等治療手段延誤,導(dǎo)致死亡率增加[5-6],特別是在膿毒性休克患者中更為顯著,研究表明每延誤治療1 h 與死亡率增加3.6% ~ 9.9%相關(guān)[7]。因此,實(shí)現(xiàn)對(duì)膿毒癥的早期預(yù)警和及時(shí)診斷至關(guān)重要。
SL 表示在訓(xùn)練AI 模型時(shí),需要提供有標(biāo)簽信息的訓(xùn)練數(shù)據(jù),使得AI 模型能夠?qū)W習(xí)輸入數(shù)據(jù)(特征)至輸出數(shù)據(jù)(標(biāo)簽)之間的映射關(guān)系,常用于膿毒癥的早期預(yù)警任務(wù)。下文主要從傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型的角度,分別介紹基于臨床數(shù)據(jù)利用SL 進(jìn)行膿毒癥早期預(yù)警方面的研究進(jìn)展。
在臨床研究中,各種臨床指標(biāo)和臨床評(píng)分最早被用于膿毒癥早期識(shí)別,如全身炎癥反應(yīng)綜合征 標(biāo) 準(zhǔn)(systemic inflammatory response syndrome,SIRS)、序貫器官衰竭評(píng)分(sequential organ failure assessment,SOFA)、改良早期預(yù)警評(píng)分(modified early warning score,MEWS)以及英國(guó)國(guó)家早期預(yù)警評(píng)分(national early warning score,NEWS)等。盡管這些評(píng)分的應(yīng)用對(duì)診療有所幫助,但這些工具的診斷精度差異很大,并且多數(shù)預(yù)測(cè)價(jià)值較差,難以滿足膿毒癥“三早兩降”的要求[8]。電子病歷(electronic health records,EHR)記錄了患者的基本信息資料,入院后的生命體征,實(shí)驗(yàn)室檢查,藥物使用,出入量記錄,護(hù)理記錄等數(shù)據(jù),涵蓋了描述患者生命健康情況變化的各類信息[9]。如何有效分析這些數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),挖掘臨床相關(guān)特征并建立膿毒癥早期預(yù)警模型是研究重點(diǎn)。隨著EHR的完善和普及,使得利用大數(shù)據(jù)訓(xùn)練AI 模型自動(dòng)給出患者實(shí)時(shí)發(fā)展為膿毒癥的風(fēng)險(xiǎn)概率成為可能[10]?;趥鹘y(tǒng)特征工程,即需要依據(jù)一定的臨床先驗(yàn)知識(shí)設(shè)計(jì)模型輸入特征的機(jī)器學(xué)習(xí)最早應(yīng)用于膿毒癥早期預(yù)警。
2016 年,Calvert 等[11]利用美國(guó)麻省理工學(xué)院計(jì)算生理學(xué)實(shí)驗(yàn)室、貝斯以色列迪康醫(yī)學(xué)中心聯(lián)合發(fā)布的“多參數(shù)智能監(jiān)測(cè)數(shù)據(jù)庫(kù)-Ⅱ(multiparameter intelligent monitoring in intensive care Ⅱ,MIMIC-Ⅱ)”[12]分析了2001—2008 年間的1 394 名重癥患者,使用其中記錄的收縮壓、脈壓、心率、呼吸頻率、體溫、白細(xì)胞計(jì)數(shù)、pH、血氧飽和度以及年齡這9個(gè)指標(biāo),利用多變量分析方法構(gòu)建了Insight 機(jī)器學(xué)習(xí)模型來預(yù)測(cè)基于SIRS 定義的膿毒癥事件。結(jié)果表明,Insight 在膿毒癥事件發(fā)生之前3 h 預(yù)測(cè)95%置信區(qū)間(confidence interval,CI)下的接受者操作特征曲線下面積(area under the receiver operating characteristic curve,AUC)為0.83(95%CI:0.80 ~0.86)。隨后,Mao 等[13]在上述研究基礎(chǔ)上只使用6 個(gè)生命體征指標(biāo)并基于梯度提升樹算法(gradient boosting machine,GBM)構(gòu)建了進(jìn)階版Insight 模型,且對(duì)來自多中心隊(duì)列研究當(dāng)中的68 萬余名患者進(jìn)行了測(cè)試,結(jié)果顯示提前4 h 預(yù)測(cè)嚴(yán)重膿毒癥的AUC為0.85(95%CI:0.79 ~ 0.91)。然而,上述研究只使用了少數(shù)指標(biāo),未充分利用EHR 記錄的信息,無法挖掘更復(fù)雜的特征并建立與膿毒癥事件的映射關(guān)系。同時(shí),研究中對(duì)于膿毒癥事件發(fā)生時(shí)間點(diǎn)的定義仍然具有一定的爭(zhēng)議性。Faisal 等[14]構(gòu)建了一種邏輯回歸(logistic regression,LR)模型,基于常規(guī)收集到患者的首次生命體征和血液測(cè)試記錄,預(yù)測(cè)急診入院后膿毒癥風(fēng)險(xiǎn),膿毒癥事件則根據(jù)EHR記錄的國(guó)際疾病分類確定,模型學(xué)習(xí)數(shù)據(jù)來源則為英國(guó)約克醫(yī)院的26 247 患者。該模型測(cè)試結(jié)果表明,在醫(yī)院內(nèi)部測(cè)試集上的AUC 表現(xiàn)為0.78,在來自北林肯郡和古爾醫(yī)院的30 996 患者外部測(cè)試數(shù)據(jù)集上的AUC 結(jié)果為0.79。雖然該研究納入了更多的實(shí)驗(yàn)室檢查等信息,但未實(shí)現(xiàn)患者入院后膿毒癥風(fēng)險(xiǎn)實(shí)時(shí)預(yù)測(cè)。
2018 年,來自美國(guó)埃默里大學(xué)Nemati 等[15]基于Weilbull-Cox 比例風(fēng)險(xiǎn)模型構(gòu)建了人工智能膿毒癥專家(artificial intelligence sepsis expert,AISE)模型,用來預(yù)測(cè)患者入ICU 后每小時(shí)患膿毒癥的風(fēng)險(xiǎn)。該訓(xùn)練數(shù)據(jù)集納入了來自兩家埃默里大學(xué)醫(yī)院的2.7 萬余例成人重癥患者,并基于心率和血壓時(shí)間序列以及從EHR 提取出的患者基本信息、生命體征以及實(shí)驗(yàn)室檢查等數(shù)據(jù),共設(shè)計(jì)了65 個(gè)變量作為特征向量,同時(shí)根據(jù)最新發(fā)布的膿毒癥3.0 定義及診斷標(biāo)準(zhǔn)[1]定位膿毒癥發(fā)生的時(shí)間點(diǎn)。結(jié)果顯示,AISE 在訓(xùn)練隊(duì)列和來自開源數(shù)據(jù)庫(kù)“重癥監(jiān)護(hù)醫(yī)學(xué)數(shù)據(jù)集-Ⅲ(medical information mart for intensive careⅢ,MICMIC-Ⅲ)”[9]外部驗(yàn)證隊(duì)列的4.2 萬余名患者測(cè)試時(shí),提前4 ~ 12 h 預(yù)測(cè)膿毒癥發(fā)生的AUC均為0.83 ~ 0.85。此外,該研究團(tuán)隊(duì)還利用類似于深度學(xué)習(xí)中顯著性圖的方法來計(jì)算每個(gè)特征的重要性,為實(shí)時(shí)預(yù)測(cè)結(jié)果提供了可解釋的信息。該研究成果發(fā)布之后引起了重癥監(jiān)護(hù)領(lǐng)域的廣泛關(guān)注。然而,由于醫(yī)院EHR 數(shù)據(jù)的隱私性保護(hù),使得對(duì)于絕大多數(shù)AI 專業(yè)研究人員無法獲取大量帶膿毒癥標(biāo)簽的患者數(shù)據(jù)。截至2019 年,大多數(shù)非臨床研究人員的研究數(shù)據(jù)均來源于MIMIC-Ⅱ和更新后的MIMIC-Ⅲ數(shù)據(jù)庫(kù)。
2019 年, 第20 屆 全 球 生 理 測(cè) 量 挑 戰(zhàn) 賽(CinC2019)[16]發(fā)布了以“基于臨床數(shù)據(jù)的膿毒癥早期預(yù)警”為主題的競(jìng)賽,旨在為研究人員提供一個(gè)開源、同質(zhì)化的膿毒癥早期預(yù)警AI 算法測(cè)試平臺(tái)。此次CinC2019 競(jìng)賽共發(fā)布了來自3 個(gè)不同醫(yī)療機(jī)構(gòu)共計(jì)6 萬余名ICU 患者的數(shù)據(jù)。每名患者數(shù)據(jù)包括入ICU 后每小時(shí)40 個(gè)臨床變量的記錄,并提供了具體的膿毒癥患病時(shí)間點(diǎn)作為模型訓(xùn)練標(biāo)簽。此外,競(jìng)賽團(tuán)隊(duì)還專門從臨床實(shí)際應(yīng)用角度設(shè)計(jì)了一個(gè)評(píng)估算法優(yōu)劣的評(píng)分機(jī)制,用于在獎(jiǎng)勵(lì)早期預(yù)警的同時(shí)盡量減少誤報(bào)警的產(chǎn)生。超過100 支團(tuán)隊(duì)參與了此次競(jìng)賽,最終Yang 等[17]提出了一種可解釋的膿毒癥預(yù)測(cè)器(explainable AI sepsis predictor,EASP),獲得了最高的評(píng)分。EASP 基于臨床先驗(yàn)知識(shí)設(shè)計(jì)的168 個(gè)臨床特征,利用GBM 作為預(yù)測(cè)分類器實(shí)現(xiàn)膿毒癥的實(shí)時(shí)預(yù)測(cè),最終提前6 h 預(yù)測(cè)的準(zhǔn)確率AUC為0.85,敏感性為0.90,特異性為0.74。此外,該研究團(tuán)隊(duì)在實(shí)現(xiàn)模型性能最優(yōu)后,基于Shapley 值 可 解 釋(Shapley additive explanations,SHAP)方法[18]對(duì)模型進(jìn)行了全局和個(gè)體化的可解釋性分析,大大提升了模型在臨床實(shí)際應(yīng)用的可操作性。
此外,為進(jìn)一步評(píng)估基于EHR 數(shù)據(jù)的AI 模型在臨床部署應(yīng)用的有效性,Shimabukuro 等[19]和Tarabichi 等[20]開展了隨機(jī)對(duì)照試驗(yàn)(randomized controlled trial,RCT)驗(yàn)證了在膿毒癥AI 預(yù)警模型的幫助下能夠有效改善患者結(jié)局。2022 年Adams等[21]針對(duì)膿毒癥警報(bào)系統(tǒng)(targeted real-time early warning system,TREWS)進(jìn)行的一項(xiàng)多中心前瞻性研究,結(jié)果顯示對(duì)于那些醫(yī)護(hù)人員在警報(bào)發(fā)生后3 h 得到確認(rèn)后的患者,其住院死亡率相對(duì)減少了18.7%,表明TREWS 具有早期識(shí)別膿毒癥患者并改善患者預(yù)后的潛力,為相關(guān)研究提供了有力的參考。
然而,上述研究所使用的數(shù)據(jù)采集頻率較低,生命體征基本每小時(shí)記錄一次,實(shí)驗(yàn)室檢查等指標(biāo)每天采集1 ~ 2 次,因此對(duì)于膿毒癥的預(yù)測(cè)或診斷仍具有一定的滯后性[22]。利用床旁監(jiān)護(hù)儀所記錄的原始生理信號(hào)(包括心電、血壓、脈搏、血氧飽和度、呼吸等)波形數(shù)據(jù)或諸如1 Hz 采樣生命體征數(shù)值型高頻數(shù)據(jù),能夠提取更精細(xì)化的特征并更及時(shí)反饋患者疾病進(jìn)展情況。Huston 等[23]進(jìn)行的生理研究表明,基于心電的心率變異性(heart rate variability,HRV)可能為炎癥反應(yīng)提供有用的信息參考,并且HRV 和復(fù)雜性指數(shù)(例如熵)已被提議作為膿毒癥等疾病引起的神經(jīng)免疫系統(tǒng)失調(diào)的替代標(biāo)記[24]。此外,Shashikumar 等[22]收集了來自埃默里大學(xué)附屬醫(yī)院242 名患者的ICU 床旁監(jiān)護(hù)儀高分辨率(2 Hz 采樣)心率和血壓數(shù)據(jù),并使用多變量建模方法發(fā)現(xiàn)基于多尺度熵的心率和血壓動(dòng)態(tài)測(cè)量是成人膿毒癥的獨(dú)立預(yù)測(cè)因子;隨后該團(tuán)隊(duì)又提出了一種新的對(duì)心率和血壓生理時(shí)間序列進(jìn)行多尺度網(wǎng)絡(luò)的表示方法,并證明了其在成人膿毒癥早期預(yù)測(cè)中的實(shí)用性,并且相較于傳統(tǒng)熵分析特征AUC準(zhǔn)確率從0.66 提升至0.78[25]。HRV 分析同樣在早產(chǎn)兒遲發(fā)性膿毒癥(late-onset sepsis,LOS)的預(yù)測(cè)研究中使用最為廣泛。Griffin 等[26-27]在弗吉尼亞大學(xué)新生兒ICU(neonatal ICU,NICU)的前瞻性驗(yàn)證研究發(fā)現(xiàn),HRV 相關(guān)指征能夠?yàn)樵缙谠\斷LOS 提供有效信息,具有臨床應(yīng)用價(jià)值。然而,上述研究大多未充分利用多通道生理信號(hào)信息,且大多基于監(jiān)護(hù)儀數(shù)值型生命體征進(jìn)行建模。Mollura 等[28]則對(duì)來自MIMIC-Ⅲ波形數(shù)據(jù)庫(kù)中142 名ICU 患者的心電和血壓生理信號(hào)波形數(shù)據(jù)進(jìn)行建模,提取了包括HRV、譜分析等在內(nèi)的68 個(gè)波形相關(guān)特征,預(yù)測(cè)準(zhǔn)確率AUC 為0.92。Cabrera-Quiros 等[29]采集了NICU 64 名早產(chǎn)兒的原始心電和呼吸波形信號(hào)用于提前3 h 預(yù)測(cè)LOS 的發(fā)生,結(jié)果顯示聯(lián)合心電、呼吸以及體動(dòng)特征能夠有效提高模型準(zhǔn)確性;呼吸、血氧飽和度或心率和血氧飽和度之間的相關(guān)性也被證明對(duì)于LOS 早期預(yù)測(cè)具有重要意義[30]。León 等[31]則證明了生理信號(hào)時(shí)間序列的可視圖分析對(duì)于LOS預(yù)測(cè)的性能提升,LOS 前6 h 的AUC 從0.81 提升至0.88;Peng 等[32]重點(diǎn)分析了從多生理信號(hào)中提取的體動(dòng)信息對(duì)臨床早期判斷膿毒癥的有效性,在GBM 的AI 模型下6 h 前預(yù)測(cè)LOS 的AUC 準(zhǔn)確 率達(dá)到了0.88。同時(shí),SHAP 可解釋分析表明,體動(dòng)信息對(duì)于其所提出模型的貢獻(xiàn)度十分重要,為將來利用非接觸式的視頻體動(dòng)分析預(yù)警膿毒癥研究提供了有力參考。
傳統(tǒng)的機(jī)器學(xué)習(xí)模型首先需要人工依據(jù)一定的臨床先驗(yàn)知識(shí)進(jìn)行特征工程設(shè)計(jì),再使用LR、GBM、Cox、隨機(jī)森林(random forest,RF)等方法學(xué)習(xí)特征至標(biāo)簽之間的映射關(guān)系。隨著計(jì)算能力和云計(jì)算的發(fā)展,以及更多臨床數(shù)據(jù)的開放,使得基于端到端的深度學(xué)習(xí)方法應(yīng)用逐漸廣泛,這種方法能夠讓模型自動(dòng)學(xué)習(xí)出好的特征表示以替代人工設(shè)計(jì)的特征,從而最終提升預(yù)測(cè)模型的準(zhǔn)確性。Kam 等[33]于2017 年在Insight 模型研究基礎(chǔ)上設(shè)計(jì)了基于長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)的深度學(xué)習(xí)模型,相較于Insight模型準(zhǔn)確率提升了4.7%。時(shí)域卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)[34]作為一種能夠處理時(shí)間序列數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),也常被用于構(gòu)建膿毒癥預(yù)測(cè)模型。Rosnati 等[35]基于TCN 架構(gòu)融合高斯過程和注意力機(jī)制提出了MGP-AttTCN模型,用于解決EHR 數(shù)據(jù)不規(guī)則采樣導(dǎo)致數(shù)據(jù)缺失的問題,并利用注意力機(jī)制分析了膿毒癥患者一段時(shí)間內(nèi)指標(biāo)變化與膿毒癥風(fēng)險(xiǎn)之間的關(guān)聯(lián);Lauritsen 等[36]同樣基于TCN 架構(gòu)設(shè)計(jì)了可同時(shí)預(yù)測(cè)膿毒癥、急性腎損傷和急性肺損傷的AI 模型,其中對(duì)于提前24 h 預(yù)測(cè)膿毒癥發(fā)生的AUC 為0.80,優(yōu)于傳統(tǒng)SOFA 和MEWS 評(píng)分以及基于GBM 傳統(tǒng)機(jī)器學(xué)習(xí)模型,并且利用逐層相關(guān)性傳播(layer-wise relevance propagation,LRP)方法對(duì)TCN 模型進(jìn)行可解釋分析,也實(shí)現(xiàn)了全局和個(gè)體化的可解釋分析。上述研究大多基于EHR 的結(jié)構(gòu)化數(shù)據(jù)訓(xùn)練AI,Goh等[37]則結(jié)合自然語言處理技術(shù)挖掘EHR 中非結(jié)構(gòu)化的臨床文本記錄信息構(gòu)建模型,結(jié)果表明與僅使用結(jié)構(gòu)化數(shù)據(jù)相比,可提前24 h 預(yù)測(cè)膿毒癥的AUC從0.78 升至0.90。
然而,在臨床實(shí)際問題中,首先由于不同醫(yī)院間醫(yī)療設(shè)備的差異,會(huì)導(dǎo)致生理參數(shù)測(cè)量的差異性;其次,由于不同醫(yī)療機(jī)構(gòu)患者來源不同,人口統(tǒng)計(jì)資料會(huì)產(chǎn)生差異,患者嚴(yán)重程度也會(huì)有差異,導(dǎo)致患者異質(zhì)性突出;再者,醫(yī)護(hù)人員對(duì)于患者的治療手段也存在差異,這些均會(huì)導(dǎo)致不同醫(yī)療機(jī)構(gòu)患者數(shù)據(jù)特征空間分布存在差異,即域偏移[38]。2021年,Wong 等[39]在數(shù)百家醫(yī)療機(jī)構(gòu)驗(yàn)證了一個(gè)應(yīng)用較為成熟的膿毒癥預(yù)警機(jī)器學(xué)習(xí)模型(epic sepsis model,ESM),結(jié)果表明在27 697 例患者的研究隊(duì)列中,ESM 預(yù)測(cè)AUC 準(zhǔn)確率只有0.63,遠(yuǎn)低于最初構(gòu)建模型時(shí)所報(bào)告的0.76 ~ 0.83。此外,盡管越來越多的醫(yī)療機(jī)構(gòu)正逐步完善EHR 系統(tǒng),不斷收集患者數(shù)據(jù),但大多無標(biāo)簽標(biāo)記,無法訓(xùn)練大規(guī)模模型,而直接將從其他機(jī)構(gòu)訓(xùn)練好的模型部署到新醫(yī)療機(jī)構(gòu)易導(dǎo)致模型準(zhǔn)確率無法得到保證。因此,提高膿毒癥早期預(yù)警模型的泛化性是實(shí)現(xiàn)跨醫(yī)療機(jī)構(gòu)部署應(yīng)用的基礎(chǔ)?;谏疃葘W(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)是解決該問題最常見的方法。遷移學(xué)習(xí)作為一種能夠利用從源域?qū)W到的知識(shí)應(yīng)用到目標(biāo)域的方法,在圖像處理以及自然語言處理等方面取得廣泛應(yīng)用,為改善醫(yī)療健康領(lǐng)域AI 模型的泛化能力提供了理論基礎(chǔ)[40-41]。Holder 等[42]利用遷移學(xué)習(xí)中的模型參數(shù)微調(diào)方法改善了預(yù)測(cè)膿毒癥血管加壓藥時(shí)機(jī)模型的泛化性能,準(zhǔn)確率提升了4%。Ding 等[43]利用半監(jiān)督域自適應(yīng)同時(shí)結(jié)合Self-paced 集成方法解決膿毒癥預(yù)測(cè)泛化性能,在僅使用少量部署目標(biāo)醫(yī)院數(shù)據(jù)以及其他無標(biāo)簽數(shù)據(jù)的情況下,將模型準(zhǔn)確率提升了6.5%。Shashikumar 等[44]則利用共形預(yù)測(cè)思想度量域間樣本距離差異,對(duì)那些AI 模型無法有效預(yù)測(cè)的樣本“說不”,為解決膿毒癥預(yù)警模型誤報(bào)警和泛化性問題提供了新的思路。
目前臨床上尚未發(fā)現(xiàn)能夠使膿毒癥患者持續(xù)受益的治療方法,這是因?yàn)槟摱景Y是一種異質(zhì)性綜合征,不同膿毒癥患者之間可能對(duì)治療的反應(yīng)存在差異[45]。UL 指從不包含目標(biāo)標(biāo)簽的訓(xùn)練樣本中自動(dòng)學(xué)習(xí)到有價(jià)值信息,發(fā)現(xiàn)數(shù)據(jù)中潛在的模式和結(jié)構(gòu),從而將數(shù)據(jù)劃分為不同的類別或群組。如何有效利用UL 基于收集到的臨床數(shù)據(jù)表征患者生理狀態(tài),進(jìn)而對(duì)異質(zhì)性的膿毒癥患者進(jìn)行分型,評(píng)估這些分型與臨床特征和生存結(jié)局的關(guān)系,是當(dāng)前研究的重點(diǎn)。將膿毒癥患者劃分為不同的亞類群體后,可以幫助臨床醫(yī)生了解不同群體患者的特點(diǎn),進(jìn)行更有針對(duì)性治療和個(gè)性化的監(jiān)護(hù)管理;或在相關(guān)臨床試驗(yàn)中能夠盡可能納入同質(zhì)性患者,減少異質(zhì)性干擾,提升臨床試驗(yàn)質(zhì)量[46]。下文主要從傳統(tǒng)潛剖面分析(latent profile analysis,LPA)統(tǒng)計(jì)方法、聚類以及軌跡建模3 個(gè)方面展開相關(guān)研究的梳理。
LPA 是一種從多維數(shù)據(jù)中識(shí)別和描述不同潛在剖面或模式的統(tǒng)計(jì)學(xué)方法。LPA 能夠?qū)⒂^測(cè)單位劃分為具有相似觀測(cè)變量模式的剖面,以揭示數(shù)據(jù)集中的隱藏結(jié)構(gòu),在臨床分型應(yīng)用時(shí)幫助識(shí)別患者不同的生理狀態(tài)從而進(jìn)行分組,有助于理解患者的異質(zhì)性。Zhang 等[47]回顧性分析了近1.5 萬名膿毒癥患者入ICU 后第一天的臨床和實(shí)驗(yàn)室檢查數(shù)據(jù),應(yīng)用LPA 方法定義了4 種膿毒癥表型,其中表型1 人群占比最多,死亡率最低為16.9%;表型2 人群主要以呼吸功能障礙為主;而表型3 主要表現(xiàn)為多器官功能障礙,死亡率最高,達(dá)到45.4%;表型4 人群則以神經(jīng)功能障礙為主。此外,該研究還利用多變量邏輯回歸模型分析了不同表型對(duì)于液體復(fù)蘇劑量的反應(yīng)情況。之后,Shald 等[48]在Zhang 等[47]的研究基礎(chǔ)上于320 名膿毒癥人群中外部驗(yàn)證了LPA分出的4 種表型的進(jìn)展情況,結(jié)果證實(shí)了各亞型之間死亡率、住院時(shí)間、無呼吸機(jī)天數(shù)和液體平衡狀態(tài)方面的差異。上述研究表明,使用患者入ICU 第一天的數(shù)據(jù)通過LPA 進(jìn)行亞類分型后,臨床醫(yī)護(hù)人員能夠從呼吸、神經(jīng)、器官功能表現(xiàn)等方面對(duì)膿毒癥患者分組,并在藥物給液治療方面相對(duì)應(yīng)給予不同的劑量。然而,LPA 作為一種基于概率統(tǒng)計(jì)模型,雖然結(jié)果更具有統(tǒng)計(jì)學(xué)意義,但其建立在諸如數(shù)據(jù)正態(tài)分布、獨(dú)立性等嚴(yán)格假設(shè)上,模型假設(shè)依賴性強(qiáng),同時(shí)應(yīng)用時(shí)計(jì)算成本高,不利于大規(guī)模應(yīng)用。
聚類作為常用的UL 方法,用于找尋數(shù)據(jù)內(nèi)在的分布結(jié)構(gòu),將相似的觀測(cè)樣本分組到不同的類別中,致使在類別內(nèi)部具有高度的相似性,而類別之間則具有較大的差異性,有助于識(shí)別潛在的疾病亞群。相較于LPA 而言,聚類簡(jiǎn)單直觀,計(jì)算效率高,不依賴于假設(shè),可用性強(qiáng)。一項(xiàng)利用臨床大數(shù)據(jù)和AI 探索膿毒癥表型的大型回顧性研究中,Seymour等[46]根據(jù)20 189 例膿毒癥患者的人口統(tǒng)計(jì)學(xué)、生命體征、炎癥指標(biāo)、器官損傷等數(shù)據(jù),利用K-means聚類方法提取出了α、β、γ、δ 共4 種膿毒癥表型。其中,α 表型患者(33%)使用升壓藥物劑量最小,病死率最低;β 表型患者(27%)年齡相對(duì)更大,且患有慢性疾病和腎功能不全的比例更高;γ 表型患者(27%)炎癥表現(xiàn)明顯,肺功能障礙比例相對(duì)較高;而δ 表型患者(13%)更多發(fā)生肝功能不全及休克,病死率最高達(dá)到了40%。該研究在獨(dú)立隊(duì)列43 086名膿毒癥患者人群中進(jìn)行了驗(yàn)證,結(jié)果表明這4 種表型的28 天和365 天病死率顯著不同,并且炎癥標(biāo)志物的水平也存在顯著差異。同時(shí),在利用3 項(xiàng)隨機(jī)臨床試驗(yàn)數(shù)據(jù)(涉及4 737 名患者)進(jìn)行藥物治療模擬試驗(yàn)時(shí)發(fā)現(xiàn),這些膿毒癥表型對(duì)標(biāo)準(zhǔn)化治療表現(xiàn)出了不同的反應(yīng),為將來進(jìn)一步藥物隨機(jī)對(duì)照試驗(yàn)納入同質(zhì)性患者提供有力參考。Kudo 等[49]同樣利用K-means 聚類方法對(duì)來自日本的3 694 名膿毒癥患者利用凝血指標(biāo)進(jìn)行了分型,并使用廣義估計(jì)方程評(píng)估不同表型下血栓調(diào)節(jié)蛋白治療與患者28天生存結(jié)局之間的關(guān)聯(lián)。國(guó)內(nèi)Ma 等[50]設(shè)計(jì)了一項(xiàng)涉及25 家醫(yī)療機(jī)構(gòu)的膿毒癥表型研究,利用有限混合模型和K-means 聚類將1 437 名膿毒性休克患者劃分為5 類,類別1 患者占比最多,視為基本人群;類別2 患者表現(xiàn)為疾病進(jìn)展最為嚴(yán)重,死亡率達(dá)到41%;類別3 患者表現(xiàn)為腎功能障礙;類別4 患者則主要為呼吸衰竭;類別5 患者死亡率最低(20%)。在識(shí)別5 個(gè)亞類人群后,該研究團(tuán)隊(duì)進(jìn)一步使用動(dòng)態(tài)治療方案(dynamic treatment regime,DTR)模型估計(jì)個(gè)體化給液和去甲腎上腺素劑量,以改善患者結(jié)局,并在美國(guó)的一個(gè)多中心ICU 數(shù)據(jù)庫(kù)(eICU collaborative research database,eICU-CRD)進(jìn)行了外部有效驗(yàn)證,表明提出的模型能夠有效將異質(zhì)性的患者區(qū)分開來,并進(jìn)行有針對(duì)性的藥物治療。
然而,上述研究大多直接將收集到的臨床數(shù)據(jù)利用聚類方法進(jìn)行臨床表型研究,隨著深度學(xué)習(xí)的發(fā)展,先對(duì)臨床數(shù)據(jù)進(jìn)行高階表示,再進(jìn)行UL 的研究也越來越受到關(guān)注。來自加州大學(xué)圣迭戈分校的研究團(tuán)隊(duì)根據(jù)患者入急診后6 h 的數(shù)據(jù),首先利用神經(jīng)網(wǎng)絡(luò)基于40 個(gè)臨床指標(biāo)構(gòu)建了一個(gè)預(yù)測(cè)膿毒癥發(fā)生的模型;隨后對(duì)該模型中間層所學(xué)習(xí)到的非線性特征表示聚類以此獲得臨床表型;最終實(shí)驗(yàn)結(jié)果顯示共將患者分為4 種表型,研究同時(shí)分析了各表型臨床統(tǒng)計(jì)差異以及對(duì)抗菌治療結(jié)局的差異[51],表明當(dāng)收集到患者入急診后6 h 數(shù)據(jù)后,臨床工作人員即可對(duì)該患者進(jìn)行分型,并根據(jù)該亞組對(duì)于抗菌治療結(jié)局情況相對(duì)應(yīng)的提前調(diào)整用藥方案。
基于LPA 或聚類的大多數(shù)膿毒癥分型研究使用生物標(biāo)志物或臨床數(shù)據(jù)的靜態(tài)信息來識(shí)別膿毒癥表型。然而,膿毒癥發(fā)展是動(dòng)態(tài)的,其生物學(xué)和生理反應(yīng)可能會(huì)在幾分鐘到幾小時(shí)內(nèi)發(fā)生演變[52]。膿毒癥的這種“時(shí)序不穩(wěn)定性”表明實(shí)驗(yàn)室檢驗(yàn)和生命體征的靜態(tài)變量可能無法識(shí)別隨時(shí)間變化的表型[53]。利用縱向(隨時(shí)間變化)數(shù)據(jù)進(jìn)行軌跡建??梢愿鼫?zhǔn)確地識(shí)別出反映患者病程的膿毒癥表型。2019 年,Bhavani 等[54]利用12 413 名患者最開始記錄的72 h 內(nèi)溫度數(shù)據(jù),基于群組軌跡模型識(shí)別了“高溫慢消退”“高溫快消退”“正常體溫”以及“低溫”這4 種溫度軌跡。其中低溫組年齡最大,合并癥最多,炎癥標(biāo)志物水平最低,院內(nèi)死亡率最高(9.5%);高溫慢消退組最年輕,合并癥最少,炎癥標(biāo)志物水平最高,死亡率為5.1%;高溫快消退組死亡率最低(2.9%)。該研究團(tuán)隊(duì)后續(xù)又于2020年發(fā)布了一項(xiàng)前瞻性研究成果,驗(yàn)證了設(shè)計(jì)的溫度軌跡表型與特定的細(xì)胞因子反應(yīng)具有一致性[55]。2022 年,Bhavani 等[56]進(jìn)一步在20 729 名疑似感染住院患者的多中心回顧性分析中,利用住院前8 h內(nèi)的生命體征(溫度、心率、呼吸頻率和血壓)序列,同樣基于群組軌跡模型,根據(jù)生命體征的不同軌跡確定了4 個(gè)表型。這些軌跡表型具有不同的基線臨床特征、實(shí)驗(yàn)室檢查、器官功能障礙以及結(jié)局,隨機(jī)對(duì)照試驗(yàn)表明不同表型對(duì)平衡晶體液與生理鹽水反應(yīng)也具有差異。Zhang 等[57]基于eICU-CRD 數(shù)據(jù)庫(kù),利用潛在生長(zhǎng)混合模型根據(jù)ICU 期間的SOFA評(píng)分識(shí)別出5 種不同的軌跡類別,其中軌跡1 和軌跡2 顯示,隨著時(shí)間的推移,SOFA 評(píng)分不斷增加,并且分別在第16 天和第27 天發(fā)展為持續(xù)性危重疾病,而其余軌跡的SOFA 評(píng)分則表現(xiàn)為穩(wěn)步下降。Liu 等[58]則利用對(duì)膿毒癥的風(fēng)險(xiǎn)軌跡進(jìn)行建模,最后劃分為4 種表型,其中最高風(fēng)險(xiǎn)組和最低風(fēng)險(xiǎn)組膿毒性休克的患病率分別為76.5%和10.4%,死亡率分別為43%和18%。雖然軌跡建模能夠簡(jiǎn)單直觀的對(duì)患者進(jìn)行縱向分型,但難以處理多指標(biāo)下的高維度數(shù)據(jù)以及捕獲不同時(shí)間序列之間的相關(guān)性。深度學(xué)習(xí)在處理高維度時(shí)間序列方面具備優(yōu)勢(shì),但如何表征患者隨時(shí)間的狀態(tài)變化并進(jìn)行有效分組,是未來重要的研究方向。
膿毒癥涉及機(jī)體多系統(tǒng),與多器官生理變化均密切相關(guān),其發(fā)病根本機(jī)制到目前尚不明確,對(duì)于膿毒癥和膿毒性休克患者的管理方案也具有爭(zhēng)議[59]。盡管在2021 年,歐洲危重病醫(yī)學(xué)會(huì)和美國(guó)重癥醫(yī)學(xué)會(huì)聯(lián)合發(fā)布了最新版的膿毒癥與膿毒性休克管理國(guó)際指南,但仍提到需要個(gè)體化對(duì)待患者,進(jìn)行有針對(duì)性地干預(yù)和治療[60]。
為了解決膿毒癥的異質(zhì)性問題,更加有針對(duì)性地給予相關(guān)治療,先前研究先將膿毒癥患者分成不同的亞型,再探究各類亞型對(duì)不同藥物或劑量對(duì)于患者結(jié)局的影響,從而實(shí)現(xiàn)對(duì)于不同膿毒癥群體的治療管理。Seymour 等[46]在劃分α、β、γ、δ 這4種膿毒癥表型后,探究了不同表型對(duì)于早期目標(biāo)導(dǎo)向治療的反應(yīng)差異;Kudo 等[49]利用凝血指標(biāo)對(duì)膿毒癥進(jìn)行了分型,評(píng)估不同表型下血栓調(diào)節(jié)蛋白治療與生存結(jié)局之間的關(guān)聯(lián);Ma 等[50]則在識(shí)別5 個(gè)亞類人群后,進(jìn)一步使用DTR 模型估計(jì)個(gè)體化的給液和去甲腎上腺素劑量,從而有效地進(jìn)行針對(duì)性治療;Boussina 等[51]在識(shí)別表型后探究表型和抗菌治療之間的關(guān)聯(lián);按照溫度軌跡對(duì)膿毒癥患者進(jìn)行的免疫分型,為相關(guān)治療提供了參考[55];基于生命體征軌跡建模的表型則有助于平衡晶體液和生理鹽水的藥物精準(zhǔn)化治療[56]。上述研究為有效理解膿毒癥患者的異質(zhì)性具有重要意義,并為不同表型患者制定更加精準(zhǔn)化的治療方案提供了重要支持。然而,此類精準(zhǔn)化治療依然是面向某個(gè)群體的手段,仍然無法達(dá)到面向單個(gè)患者,更加精細(xì)化、個(gè)性化治療的要求。因此,如何根據(jù)單個(gè)膿毒癥患者的疾病進(jìn)展變化針對(duì)性做出劑量和使用策略的調(diào)整仍然是臨床難點(diǎn)。
RL 指一種旨在與狀態(tài)環(huán)境不斷交互,為每個(gè)狀態(tài)尋找最佳策略以獲取最大收益的AI 方法,與臨床醫(yī)生做出治療決策以改善患者預(yù)后目標(biāo)任務(wù)接近[61]。DL 不需要給出“正確”策略作為監(jiān)督信息,只需要給出策略的(延遲)回報(bào),并通過調(diào)整策略來取得最大化的期望回報(bào)。RL 核心要素包括狀態(tài)、動(dòng)作、策略、狀態(tài)轉(zhuǎn)移概率以及即時(shí)獎(jiǎng)勵(lì)。應(yīng)用RL已被證實(shí)能夠在膿毒癥患者治療過程中根據(jù)患者狀態(tài)的變化給予藥物推薦[62]。
2015 年,Tsoukalas 等[63]利用部分可觀察馬爾可夫決策過程(partially observable Markov decision process,POMDP)模型,基于臨床實(shí)踐、專家知識(shí)等首先定義了RL 應(yīng)用藥物推薦的相關(guān)要素,并基于回顧性的1 492 例膿毒癥患者的EHR 數(shù)據(jù)自動(dòng)學(xué)習(xí)到抗生素選擇的最優(yōu)化策略。該研究結(jié)果顯示,POMDP 模型推薦的抗生素選擇策略能夠有效改善膿毒癥患者預(yù)后。2017 年,Nemati 等[64]應(yīng)用深度RL 基于MIMIC-Ⅱ提供數(shù)據(jù)進(jìn)行最佳肝素給藥策略的推薦。此外,早期、及時(shí)的液體治療或復(fù)蘇和必要的血管活性藥物使用是膿毒癥和膿毒性休克積極治療的基本措施[60]。2018 年,Komorowski 等[61]利用強(qiáng)化學(xué)習(xí)進(jìn)行膿毒癥患者血流動(dòng)力學(xué)治療推薦工作,引起了廣泛關(guān)注。該團(tuán)隊(duì)基于MIMIC-Ⅲ數(shù)據(jù)庫(kù),納入了17 083 名膿毒癥患者包括人口統(tǒng)計(jì)資料、疾病史、生命體征、實(shí)驗(yàn)室檢查、液體出入量和血管活性藥物劑量等在內(nèi)的48 個(gè)臨床變量數(shù)據(jù);并重點(diǎn)關(guān)注患者膿毒癥發(fā)生之前24 h 至發(fā)生后48 h 過程,將這72 h 按照4 h 步長(zhǎng)劃分為多變量的離散時(shí)間序列,從而利用RL 研究整個(gè)過程患者的疾病狀態(tài)變化與該區(qū)間內(nèi)液體復(fù)蘇以及血管活性藥物使用的關(guān)聯(lián)。Komorowski 等[61]將4 h 內(nèi)患者數(shù)據(jù)進(jìn)行K-means 聚類,將患者狀態(tài)劃分成不同類別作為RL要素中的狀態(tài)空間;將液體和血管活性藥物劑量離散為5×5 矩陣,作為動(dòng)作空間;根據(jù)患者院內(nèi)死亡或90 天死亡結(jié)局作為最終的獎(jiǎng)懲目標(biāo);將訓(xùn)練數(shù)據(jù)集中觀察到在每次動(dòng)作后各狀態(tài)的變化次數(shù)來估計(jì)狀態(tài)轉(zhuǎn)移矩陣;模型的策略為由患者在某區(qū)間內(nèi)狀態(tài)估計(jì)的最優(yōu)動(dòng)作,即液體復(fù)蘇和血管活性藥物的劑量,以改善患者結(jié)局。在獨(dú)立的驗(yàn)證隊(duì)列eICUCRD 中測(cè)試模型,結(jié)果表明相較于實(shí)際臨床醫(yī)生給出的用藥方案,由RL 給出的治療略下患者的生存率更高,能有效改善患者預(yù)后。同時(shí),該研究團(tuán)隊(duì)還開源了數(shù)據(jù)提取過程、RL 原始算法代碼,為膿毒癥個(gè)性化藥物治療推薦研究搭建了開放性平臺(tái)。后續(xù),其他研究團(tuán)隊(duì)在此基礎(chǔ)上,相繼在狀態(tài)空間表示、強(qiáng)化學(xué)習(xí)算法、獎(jiǎng)懲函數(shù)設(shè)置上分別進(jìn)行優(yōu)化,以提高推薦劑量的準(zhǔn)確性,并進(jìn)一步在外部獨(dú)立測(cè)試集上進(jìn)行了驗(yàn)證[65-66]。
然而,雖然上述研究回顧性證明了RL 的有效性,但在風(fēng)險(xiǎn)度非常高的領(lǐng)域,如醫(yī)療尤其是重癥監(jiān)護(hù)方面,由于安全性和信任度的限制,醫(yī)生依然難以信任AI 推薦的策略。因此,確定推薦治療方案是否安全,提高對(duì)其可能導(dǎo)致不良結(jié)果的高風(fēng)險(xiǎn)認(rèn)知非常重要。2021年,來自微軟研究院的Fatemi等[67]提出了一種基于RL 的治療高風(fēng)險(xiǎn)識(shí)別方法(deadend discovery,DeD),DeD 不同于傳統(tǒng)藥物治療劑量推薦研究,旨在提示避免使用可能會(huì)導(dǎo)致不良結(jié)局的治療方案,識(shí)別出患者的高風(fēng)險(xiǎn)狀態(tài)。該實(shí)驗(yàn)結(jié)果表明,DeD 識(shí)別出對(duì)于某些高風(fēng)險(xiǎn)患者,有11%的治療干預(yù)可能會(huì)增加患者死亡的風(fēng)險(xiǎn)。利用不確定度量方式提高RL 的安全性也是當(dāng)前研究的重點(diǎn)。針對(duì)膿毒癥藥物治療推薦,F(xiàn)estor 等[68]分析了其中存在的偶然不確定性和認(rèn)知不確定性,進(jìn)行不確定性度量分析,輸出推薦結(jié)果的置信度,使得臨床醫(yī)護(hù)人員能夠根據(jù)輸出結(jié)果的不確定度對(duì)患者進(jìn)行分級(jí)管理,對(duì)置信度低的患者給予更高關(guān)注,置信度高的患者給予低關(guān)注。此外,由于不同地區(qū)的患者之間存在異質(zhì)性、臨床治療手段存在差異、EHR電子系統(tǒng)非標(biāo)準(zhǔn)化以及數(shù)據(jù)的隱私保護(hù)等問題,使得直接將RL 模型跨醫(yī)療機(jī)構(gòu)部署應(yīng)用成為巨大的挑戰(zhàn)。聯(lián)邦強(qiáng)化學(xué)習(xí)作為一種能夠在保護(hù)數(shù)據(jù)隱私前提下,跨數(shù)據(jù)源上聯(lián)合訓(xùn)練模型的方法,將會(huì)成為未來應(yīng)用RL 進(jìn)行精準(zhǔn)化治療研究的熱點(diǎn)[69]。
AI 技術(shù)的發(fā)展為臨床醫(yī)護(hù)人員對(duì)膿毒癥的管理提供了智能化的解決方案。應(yīng)用AI 能夠從膿毒癥患者的早期發(fā)現(xiàn)、及時(shí)干預(yù),到發(fā)病后根據(jù)疾病進(jìn)展?fàn)顟B(tài)進(jìn)行分組管理、針對(duì)性的監(jiān)護(hù),再到個(gè)性化藥物治療方案的提供,這一整個(gè)膿毒癥管理流程中發(fā)揮重要作用。這對(duì)于構(gòu)建智能化的臨床輔助決策系統(tǒng),建立起膿毒癥診療的新體系,降低臨床負(fù)擔(dān),具有重要意義。隨著云計(jì)算、信息化系統(tǒng)、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,利用穿戴設(shè)備對(duì)膿毒癥患者出院后的身體健康狀況進(jìn)行實(shí)時(shí)跟蹤,降低二次住院率,最終實(shí)現(xiàn)膿毒癥患者從發(fā)病前到康復(fù)過程、從院內(nèi)到院外的全周期管理,也是又一個(gè)重要的發(fā)展方向。然而,目前仍需要對(duì)AI 的實(shí)際臨床應(yīng)用效果保持嚴(yán)謹(jǐn)態(tài)度和清醒的認(rèn)識(shí)。在藥物的研發(fā)中,通常需要經(jīng)過藥物發(fā)現(xiàn)、臨床前研究、臨床試驗(yàn)“三部曲”才能進(jìn)入醫(yī)藥市場(chǎng)用于治療疾病,這往往可能需要數(shù)十年的時(shí)間并投入大量研發(fā)經(jīng)費(fèi)。同樣,當(dāng)前用于膿毒癥輔助診療的AI 仍屬于新興領(lǐng)域,絕大多數(shù)為回顧性研究,仍處于算法開發(fā)階段,僅有很少AI 模型被批準(zhǔn)用于臨床使用并大規(guī)模部署。在未來,相關(guān)研究需不僅僅停留于模型算法準(zhǔn)確性本身,而應(yīng)該更加聚焦于如何將模型真正應(yīng)用于臨床,提升模型的可解釋性、可泛化性以及安全性能,深入臨床與醫(yī)護(hù)人員討論如何使AI 能真正給予其幫助。此外,仍然需要更多的RCT 實(shí)驗(yàn)和前瞻性臨床試驗(yàn)來驗(yàn)證算法的有效性,并不斷提升、改善AI 模型。然而,盡管當(dāng)前某些核心技術(shù)還尚未成熟,但隨著諸如ChatGPT大語言模型等新技術(shù)的發(fā)展變革,以及越來越多的研究人員參與到其中,AI 在進(jìn)一步構(gòu)建智能化的膿毒癥患者全周期管理體系中將發(fā)揮越來越重要的作用。