国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

急性上消化道出血的危險分級及臨床應用

2022-11-22 06:50李雪董永祺何松
現(xiàn)代消化及介入診療 2022年2期
關(guān)鍵詞:內(nèi)鏡死亡率分級

李雪,董永祺,何松

【提要】 急性上消化道出血(AUGIB)是消化系統(tǒng)住院治療的急危重癥之一,有較高的發(fā)生率以及死亡率。早期對患者進行危重程度分類,有助于對高危患者進一步監(jiān)護及積極治療,從而改善患者的臨床結(jié)局。目前,已經(jīng)有部分指南推薦使用RS、GBS、AIMS65評分系統(tǒng)對急性上消化道出血患者進行危險分級。然而尚缺乏廣泛推廣并臨床應用的危險分級工具。近年來對危險分級和預后評估系統(tǒng)的研究逐漸增多,本文就近年急性上消化道出血的危險分級系統(tǒng)及臨床應用作一綜述。

急性上消化道出血(acute upper gastrointestinal bleeding,AUGIB)是消化系統(tǒng)疾病的急危重癥之一,整體死亡率波動2%~8%,由于相關(guān)藥物的使用以及內(nèi)鏡技術(shù)的進展,上消化道出血的發(fā)生率和死亡率已較前顯著下降[1-4]。即便如此,其復發(fā)率、病死率仍然高于下消化道出血[5],是威脅公眾衛(wèi)生健康的疾病之一。近年來國內(nèi)外相關(guān)協(xié)會及專家組對急性上消化道出血的規(guī)范診療頒布了新的指南或共識,強調(diào)對上消化道出血患者進行危重程度分類并推薦采用危險評分系統(tǒng)對患者的危重程度進行分級[6-10]。根據(jù)患者的不同危險分級制定不同的臨床決策,從而改善患者的死亡率、再出血率、輸血量、介入治療率等臨床結(jié)局,并且實現(xiàn)醫(yī)療資源的合理分配及響應分級診療號召。近年來,關(guān)于急性上消化道出血患者危險分級系統(tǒng)的研究逐漸增多。

1 評分系統(tǒng)

許多研究建立了不同的評分系統(tǒng)對急性上消化道出血進行危險分級。其中RS評分(Rockall Score)[11]、GBS評分(The Glasgow Blatchford Score)[12]、AIMS65評分[13]目前研究最為廣泛,且部分指南已經(jīng)有推薦其作為臨床使用[7-10]。根據(jù)評分項目是否包含內(nèi)鏡檢查結(jié)果,將評分系統(tǒng)分為內(nèi)鏡依賴型評分系統(tǒng)和非內(nèi)鏡依賴型評分系統(tǒng)。而近年進展迅猛的人工智能評分模型,部分模型納入內(nèi)鏡檢查結(jié)果,而另一部分沒有納入內(nèi)鏡檢查結(jié)果,故在此單獨列出。

1.1 內(nèi)鏡依賴型評分系統(tǒng)

1.1.1 RS評分 RS評分[11]在1996年由Rockall等人提出,最初用于預測急性上消化道出血患者的死亡和再出血風險。評分系統(tǒng)由年齡、休克狀態(tài)、合并癥、內(nèi)鏡下診斷和內(nèi)鏡所見的近期出血征象組成,評分總分0~11分,當RS評分≤8分時,被視為死亡高風險患者。

1.1.2 PNED評分 PNED(Progetto Nazionale Endoscopia Digestiv)評分[14]是分析急性非靜脈曲張性上消化道出血患者30天死亡危險因素的基礎上形成的。根據(jù)患者的人口形態(tài)學特征、實驗室指標、合并癥、內(nèi)鏡治療結(jié)果等一共10項指標,對急性非靜脈曲張性上消化道出血患者的死亡風險進行分級。分值介于0~4分視為低風險患者,5~8分視為中風險患者,>8分則被視為高風險患者。

1.1.3 預測大量輸血模型 臺灣學者Chen YC等建立了預測大量輸血模型[15],通過對患者生命體征、常規(guī)生化指標、是否行內(nèi)鏡下治療共5個方面賦予不同的分值權(quán)重(1~8分)對危重程度進行分級(低風險0~5分;一般風險6.5~7.5分;高風險>7.5分)。

內(nèi)鏡依賴型評分系統(tǒng)需要結(jié)合內(nèi)鏡檢查結(jié)果,有些醫(yī)療機構(gòu)無法提供24 h內(nèi)鏡檢查或治療,所以無法據(jù)此進行早期的風險評估,這在一定程度上限制了內(nèi)鏡依賴型評分系統(tǒng)的應用。若需要結(jié)合內(nèi)鏡檢查結(jié)果,則許多新的內(nèi)鏡技術(shù),例如常規(guī)內(nèi)鏡檢查或治療同時加用多普勒超聲內(nèi)鏡探頭檢測出血部位的動脈血流,可能進一步提高危險分級的能力[16]。

1.2 非內(nèi)鏡依賴型評分系統(tǒng)

1.2.1 pRS評分 pRS評分(pre-endoscopic Rockall Score)[11]是在RS評分的基礎上衍生而來,排除了內(nèi)鏡診斷和近期出血征象2項評分內(nèi)容,使得無需借助內(nèi)鏡檢查結(jié)果即可對疾病的危重程度進行早期判斷。

1.2.2 GBS評分與mGBS評分 GBS評分[12]于2000年由Blatchford O等提出,該評分系統(tǒng)更加側(cè)重于識別患者的治療需要(治療需要定義為需要輸血、止血干預、再出血或死亡)。GBS評分共包含血尿素氮、血紅蛋白水平、收縮壓、脈搏、黑便、暈厥、肝臟疾病、心力衰竭共8個指標,取值范圍為0~23分。為了便于臨床的應用,同時排除主觀因素對評分結(jié)果的影響,Cheng DW 等提出了mGBS評分(modified Glasgow Blatchford Score)[17]。與RS評分、GBS評分不同,mGBS評分排除了肝臟疾病、心力衰竭、有無暈厥和黑便這4項主觀指標,僅僅將定量的指標納入評分系統(tǒng),并通過前瞻性隊列研究將其與GBS評分、RS評分等進行比較,結(jié)果顯示其預測是否需要臨床干預的能力并不劣于GBS評分,甚至優(yōu)于RS評分。但近年來就mGBS評分的研究較少,故其對臨床結(jié)局的預測能力尚缺乏足夠的統(tǒng)計學證據(jù)。

1.2.3 AIMS65評分 AIMS65評分[13]是相對更易于計算的床旁評分系統(tǒng),包括以下幾項指標:白蛋白、國際標準化比值(INR)、神志改變、收縮壓、年齡。AIMS65評分最初主要設計用于評估患者的在院死亡率、住院時間以及住院費用。

1.2.4 ABC評分 為了進一步明確全消化道出血(包括上消化道和下消化道)的30 d死亡風險,2021年Laursen SB等[18]根據(jù)對3 012名上消化道出血患者的隊列研究結(jié)果,新建了ABC評分系統(tǒng)。ABC即年齡(age)、血液指標(blood tests)和合并癥(comorbidities)的縮寫,血液指標主要包含尿素氮、白蛋白、血清肌酐值3項指標,合并癥則主要包含了神志改變、肝硬化、腫瘤轉(zhuǎn)移、ASA(美國麻醉醫(yī)師學會)分級4項指標。

1.2.5 CANUKA評分 CANUKA評分于2018年由Oakland K等[19]提出,根據(jù)來源于5個國際中心的共12 711例AUGIB患者的數(shù)據(jù)而形成。與GBS評分相比,兩者均包含了血流動力學指標、合并癥情況、臨床表現(xiàn)(黑便、嘔血)、實驗室檢查(血紅蛋白水平、尿素),不同之處在于CANUKA將惡性腫瘤和年齡納入評分指標,而GBS評分則將心力衰竭作為評分指標之一。在Oakland等的研究中,CANUKA評分預測死亡風險的能力稍優(yōu)于GBS評分,而在預測輸血需求和內(nèi)鏡治療方面,GBS評分的診斷效能則優(yōu)于CANUKA評分[19]。

1.2.6 CHAMPS-R評分 2021年,Matsuhashi T等[20]建立了CHAMPS-R評分,主要適用于住院期間發(fā)生的急性非靜脈曲張性上消化道出血患者在院死亡風險的預測。該評分由查爾森合并癥指數(shù)、是否為院內(nèi)起病、白蛋白水平、意識改變等7個指標組成。

1.2.7 其他 新日本評分系統(tǒng)在2016年由Iino C等[21]提出并進行驗證,其在預測治療性干預需求方面略優(yōu)于GBS評分。MAP(ASH)評分于2019年被提出,但其在預測30 d死亡率時受試者工作特征曲線下面積(AUROC)為0.74(95%CI 0.68~0.81),且預測再出血風險時的診斷效能與GBS評分相當(AUROC 0.73;95% CI 0.69~0.77)[22],總體而言其臨床診斷效能不能令人十分滿意。2021年,F(xiàn)irat BT等[23]基于219例AUGIB患者的數(shù)據(jù)分析,證明血流灌注指數(shù)(PI)在預測輸血和預測死亡率的診斷效能顯著優(yōu)于RS評分,其AUROC波動在0.74~0.78。名古屋大學評分,又稱為N評分,為預測內(nèi)鏡下治療需要而建立的相對簡便的評分系統(tǒng),該評分僅由4項指標組成,在160名急性非靜脈曲張性出血患者的驗證隊列中,N評分顯示出了相對GBS評分更為優(yōu)異的識別內(nèi)鏡治療需要的能力[24]。

1.3 人工智能風險評估模型

隨著科技進展,人工智能在消化內(nèi)鏡領域的應用逐漸拓展并擁有良好的前景。武漢市人民醫(yī)院于紅剛教授團隊,建立了深度卷積神經(jīng)網(wǎng)絡系統(tǒng)(DCNNs),并將DCNNs識別食管胃底靜脈曲張以及紅色征的能力與內(nèi)鏡醫(yī)師進行比較,結(jié)果顯示DCNNs診斷的準確性顯著優(yōu)于內(nèi)鏡醫(yī)師[25]。另一項多中心研究基于對1 958名AUGIB患者的臨床數(shù)據(jù),建立了ML模型并對其進行驗證,結(jié)果表明ML模型在內(nèi)部驗證及外部驗證隊列中,其AUROC值均高于0.9,顯著優(yōu)于傳統(tǒng)的GBS評分、RS評分和AIMS65評分[26]。

2 各個評分系統(tǒng)的臨床應用

2.1 識別高風險患者

急性上消化道出血的患者往往起病急,病情重,早期對高風險患者進行識別,有助于對患者實施更高級別的監(jiān)護和治療。一項前瞻性觀察性研究,比較了GBS評分和AIMS65評分識別高風險患者的能力,結(jié)果顯示GBS評分識別高風險患者的敏感性和特異性優(yōu)于AIMS65評分(AUCs 0.896 vs 0.714,P<0.001)[27]。一項納入了3 012名AUGIB患者的國際多中心前瞻性研究,對pRS評分、RS評分、AIMS65評分、GBS評分和PNED評分不同臨床結(jié)局的診斷效率進行比較并確定不同評分的高風險界值[28]。結(jié)果顯示,GBS評分在診斷患者的內(nèi)鏡治療需要和PNED評分在診斷患者的死亡風險時有相當不錯的表現(xiàn),進而定義GBS≥7分(Sn 80.4%,Sp 57.4%)為需要內(nèi)鏡治療的中高風險患者,PNED≥4分(Sn 77.3%,Sp 65.3%)為30 d死亡的高風險患者。而近期一項研究AUGIB患者內(nèi)鏡治療時機的大型隨機對照研究,將GBS≥12分定義為再出血和死亡的高風險人群[29],其界值的確定以及診斷效率目前尚未形成共識。

2.2 識別低風險患者

早期識別無需住院或者進一步治療的低風險患者,能夠減少AUGIB患者的住院率及治療費用,合理分配醫(yī)療資源,同時也能滿足大多數(shù)患者在情況允許時不愿住院的意愿。綜合近年來研究結(jié)果,GBS評分在診斷低風險患者的效率高于其他臨床評分系統(tǒng)。一項前瞻性研究比較了GBS評分和AIMS65評分,發(fā)現(xiàn)GBS評分識別低?;颊叩拿舾行燥@著高于AIMS65評分[27]。此外,一項納入309名患者的前瞻性研究比較了GBS評分、AIMS65評分和RS評分,結(jié)果顯示,當GBS=0分時,患者可以不必行內(nèi)鏡下治療,而即使AIMS65評分=0仍然不能完全排除需要內(nèi)鏡治療的患者[30]。但隨著臨床研究的開展,發(fā)現(xiàn)GBS≤1分在保證準確性的同時,相較于GBS=0分能更多地識別低危險患者[28,31]。所以近年來,指南更新指出,GBS≤1分定義為可門診處理的低風險患者[8-9]。而與ML模型比較識別低風險患者能力時,同為敏感度100%的情況下,ML模型診斷的特異度(26%)高于GBS=0分的特異度(12%)。這意味著,在同樣安全診斷的前提條件下,ML模型能夠識別接近GBS=0分識別的2倍數(shù)量的可門診處理的低風險患者[26]。

2.3 預測復合終點

復合終點的定義在不同的研究中往往有所不同,常常會以死亡率、再出血率、內(nèi)鏡下治療率、介入治療率、手術(shù)治療、輸血需求、住院時長等其中幾項臨床結(jié)局進行組合。對復合終點的預測能力評價,相對能夠較為全面地評估一個危險分級的診斷效率。

前文述及的國際多中心大樣本研究,對非內(nèi)鏡依賴型評分(pRS評分、AIMS65評分、GBS評分)以及內(nèi)鏡依賴型評分(RS評分、PNED評分)對復合終點的診斷效率進行了比較[28]。結(jié)果顯示,GBS評分在預測復合終點的AUROC值為0.86,顯著優(yōu)于其他幾個評分系統(tǒng),且均存在統(tǒng)計學差異。而在另一項相對小樣本量(424例研究患者)的研究中,AIMS65評分、GBS評分和RS評分預測復合終點的能力相當(AUROC分別為0.63、0.62、0.63)[31]。

近年,人工智能技術(shù)的進展有望成為全面評估臨床結(jié)局的風險分級工具。Shung DL等人建立并比較了ML模型與其他評分在識別復合終點時的能力,無論在生成隊列和驗證隊列中,ML模型(AUROC 0.90)的判別能力均優(yōu)于GBS評分、pRS評分和AIMS65評分,且均具有統(tǒng)計學意義[26]。一篇納入了14項觀察性研究的系統(tǒng)評價結(jié)果顯示,機器學習模型在預測AUGIB患者再出血、治療干預需要、死亡風險等多個臨床結(jié)局時均有相當優(yōu)異的表現(xiàn),AUC面積普遍在0.80以上,且在頭對頭比較中,機器學習模型預測死亡風險時也顯著優(yōu)于其他臨床評分系統(tǒng)[32]。

2.4 預測死亡風險

死亡風險是多數(shù)研究和臨床關(guān)心的重要臨床結(jié)局之一。RS評分、AIMS65評分、PNED評分、ABC評分、CHAMPS-R評分最初即設計用于評估患者的死亡風險。

2.4.1 預測30 d死亡 AIMS65評分預測死亡風險的能力優(yōu)于GBS評分和pRS評分。一項納入3 000余名患者的前瞻性研究結(jié)果顯示,AIMS65評分在預測30 d死亡率時優(yōu)于GBS評分(AUROC 0.77 vs 0.64,P<0.001)和pRS評分(AUROC 0.77 vs0.72,P=0.05)[28]。

PNED評分對死亡風險的診斷效率也相對不錯,但與AIMS65評分相比不同的研究所得結(jié)論則存在矛盾。在形成PNED評分的研究中(驗證隊列納入1 548名AUGIB患者),作者對其預測死亡風險的特異性和敏感性進行了驗證,結(jié)果顯示,PNED評分預測30 d死亡率的ROC曲線下面積為0.81,顯著優(yōu)于RS評分(AUROC 0.66,P<0.001)[15]。Jeon HJ等[33]納入1 048人的回顧性研究也同樣表明其能夠比較準確地預測30 d全因死亡率,并顯著優(yōu)于GBS評分、AIMS65評分及pRS評分。而Stanley AJ等[28]進行的多中心前瞻性研究顯示,PNED預測死亡風險的能力,雖顯著優(yōu)于pRS評分和GBS評分,但與AIMS65評分相當(AUROC均為0.77)。

已有多項研究表明,ABC評分系統(tǒng)預測死亡風險的能力顯著優(yōu)于AIMS65評分、RS評分、PNED等評分系統(tǒng)。形成ABC評分系統(tǒng)的研究中,納入3 012名AUGIB患者的生成隊列中發(fā)現(xiàn)ABC評分識別30 d全因死亡率的能力顯著優(yōu)于PNED評分、pRS評分、ASA分級、RS評分、GBS評分。在4 019例AUGIB患者的驗證隊列中,比較了ABC評分與AIMS65評分在預測AUGIB患者30 d全因死亡率的能力,也得到同樣的結(jié)果[18]。Jeon HJ等[33]納入1 048人的回顧性研究表明,ABC評分在預測30 d全因死亡率時,顯著優(yōu)于新日本評分、GBS評分、AIMS65評分、PNED評分、pRS評分。在另一項國際多中心前瞻性研究中,ABC評分預測30 d死亡率的能力顯著優(yōu)于其他納入比較的評分系統(tǒng)(GBS評分、AIMS65評分、休克指數(shù)、pRS評分)[34]。還有一項多中心前瞻性研究也顯示,ABC評分預測90 d死亡風險的能力顯著優(yōu)于AIMS65評分和GBS評分[35]。

ML模型在預測死亡風險時也優(yōu)于傳統(tǒng)評分系統(tǒng),但目前臨床研究較少。在Shung D等[32]的研究中,運用提取的數(shù)據(jù)對機器學習模型與臨床評分系統(tǒng)進行了22次比較,機器學習模型預測死亡率的AUROC波動在0.8~0.9之間,優(yōu)于GBS評分、RS評分。

2.4.2 預測院內(nèi)死亡率 一項納入424名患者的單中心回顧性研究,對AIMS65評分、GBS評分、RS評分和pRS評分進行比較,結(jié)果表明,預測院內(nèi)死亡風險時,AIMS65評分顯著優(yōu)于GBS評分和pRS評分,而與RS評分相當[36]。同樣地,另外兩項相對小型的前瞻性隊列研究結(jié)果也顯示,AIMS65預測患者死亡風險的能力顯著強于GBS評分[37-38]。而在Matsuhashi T等[20]的研究中,CHAMPS-R評分無論在生成隊列或在驗證隊列中,預測院內(nèi)死亡率的診斷效能均優(yōu)于GBS評分、ABC評分、AIMS65評分、pRS評分。

3 總結(jié)與展望

在傳統(tǒng)的危險分級和評分系統(tǒng)中,GBS評分在識別高風險患者、識別低風險患者方面有相對優(yōu)異的診斷效能。在識別復合終點方面,GBS的診斷敏感性和特異性依然不錯,但諸多研究所得的結(jié)論仍不能統(tǒng)一。在預測死亡風險方面,近期新提出的ABC評分系統(tǒng)診斷死亡風險的敏感性和特異性相對較好,但其當前的臨床研究數(shù)據(jù)有限,需要更多的大型多中心臨床研究對其進行驗證和比較。與傳統(tǒng)的風險分級系統(tǒng)相比,人工智能在評估風險的全面性、診斷的特異性和敏感性方面似乎均優(yōu)于傳統(tǒng)的評分系統(tǒng)。但其能否用于臨床仍然存在巨大的挑戰(zhàn):①模型的建立十分復雜,需要大量的內(nèi)部和外部數(shù)據(jù)進行驗證;②缺乏大型對照研究,目前有不少研究建立了ML模型,而對該模型的外部數(shù)據(jù)驗證研究較少,無法提供更多可靠的統(tǒng)計學證據(jù)。因此,對已有的ML風險分級模型進行大樣本前瞻性隊列研究十分必要。此外,目前無法單獨應用一個評分系統(tǒng)對多個重要的臨床結(jié)局進行全面綜合地評估,且即便在已有的評分系統(tǒng)中,其危險分級的敏感性和特異性仍不能令人十分滿意。需要更多的臨床研究改良不同危險分級系統(tǒng),提高其效能,期待建立一個診斷敏感度高、特異度高地能全面預測患者預后的風險分級工具。

猜你喜歡
內(nèi)鏡死亡率分級
急性非靜脈曲張性上消化道出血治療中內(nèi)鏡止血的應用價值分析
內(nèi)鏡止血在急性非靜脈曲張性上消化道出血治療中的應用
一種用于內(nèi)鏡干燥的酒精收集器的設計與應用
分析比較經(jīng)耳內(nèi)鏡鼓膜切開與耳內(nèi)鏡鼓膜穿刺治療分泌性中耳炎的療效
新冠肺炎的死亡率為何難確定?
基于Lee—Cater模型對我國高齡男性死亡率的預測
基于Lee—Cater模型對我國高齡男性死亡率的預測
惡性腫瘤死亡率
2016年年末凈值規(guī)模低于5000萬元的分級基金
完形填空分級演練