劉小云 趙延延 朱熠冰 李思冬 尹潞 徐波 李衛(wèi) 王楊
作者單位:100037 北京,國家心血管病中心 北京協(xié)和醫(yī)學院 中國醫(yī)學科學院阜外醫(yī)院醫(yī)學統(tǒng)計部(劉小云、趙延延、朱熠冰、李思冬、尹潞、李衛(wèi)、王楊),介入導管室(徐波)
自21世紀初,經皮冠狀動脈介入治療(percutaneous coronary intervention, PCI)心血管疾病的年手術量已逼近八百萬的數(shù)量級,按2001年開展的577 767例計算,相當于在每100萬人口中有1108例進行PCI術,且該數(shù)字以每年15%~25%的速度持續(xù)增長[1]。藥物洗脫支架(drug-eluting stent, DES)憑借其對支架內再狹窄的有效控制,成為當前PCI的“金標準”[2]。但有研究表明,DES置入可能導致動脈粥樣硬化過程加速、炎癥反應和支架小梁斷裂等風險[3]。因此,近5年研究的熱點逐漸轉移到了以藥物洗脫球囊(drugcoated balloon,DCB)和生物可吸收支架(bioresorbable scarfold, BRS)為代表的新型治療器械[4-9]。新型治療器械可為血管提供“一過性”支撐、且沒有永久的殘留物,從而在理論上避免了殘留物對血管造成的遠期潛在影響[10-11]。DCB及BRS的臨床應用促進PCI進入了“介入無置入”的時代。
隨著冠狀動脈介入治療從普通球囊(plain old balloon angioplasty,POBA)、裸金屬支架(bare-metal stent,BMS)、DES到BRS和DCB的器械不斷創(chuàng)新,在臨床試驗中采用的主要終點指標也在不斷發(fā)生變化,基于影像學的替代終點[如:支架內再狹窄、晚期管腔丟失(late lumen loss,LLL)等],雖然可以有效節(jié)約試驗的樣本量規(guī)模,其臨床價值和臨床意義卻受到廣泛質疑[12-22]。以主要不良心血管事件(major adverse cardiac event,MACE)或靶病變失?。╰arget lesion failure,TLF)等為代表的臨床終點,又會使試驗的規(guī)模直接達到千例甚至更高的數(shù)量級[12,23-24]。而針對創(chuàng)新器械(如:全降解支架)設定的心絞痛或血管收縮功能改善等為試驗指標,多未能獲得預期陽性結果[4,25],或只能在相對局限的人群中進行驗證[16,26]。這些問題都使得“介入無置入”時代的試驗設計面臨諸多的困難和挑戰(zhàn)。
基于上述問題,本綜述的目的在于系統(tǒng)性整理“介入無置入”理念下開展的臨床試驗,重點關注新型冠狀動脈介入器械(包括DCB和全降解支架),提取每一項研究在設計階段制定的主要終點指標情況,及其與最終結果間的對應關系。探討“介入無置入”相關研究中,選擇適宜的評價指標的重要性,期待從方法學角度,為相關領域研究的試驗設計與統(tǒng)計分析提供一定的參考和依據(jù)。
冠狀動脈介入器械臨床試驗療效的評價主要通過影像和臨床兩個方面,前者多基于冠狀動脈造影或血管內超聲(intravascular ultrasound,IVUS)等影像學檢測,后者則多為死亡、心肌梗死和再次血運重建等MACE。目前相關醫(yī)療器械臨床試驗中,常用的安全性、有效性評價指標可簡單歸納如下。
以冠狀動脈造影為基礎的QCA,常用于測量介入術前以及術后的相關指標,如參考血管直徑(reference vessel diameter,RVD)、病變長度(lesion length,LL)、直徑狹窄百分比(diameter stenosis,DS)、最小管腔直徑(minimal lumen diameter,MLD)、再狹窄率(restenosis rate,RR)、LLL以及LLL指數(shù)(late lumen loss index,LLLI)等。
其中,LLL水平目前是DES試驗中較常用的主要評價指標。由于金屬支架內部的回縮問題可忽略,所以LLL(無論支架還是節(jié)段內)被用作對(新生)內膜增生程度的間接測量指標。假如造影隨訪顯示LLL水平較低,則說明置入支架內部的內膜增生程度較低。雖然對支架絲(梁)的覆蓋本身需要一定程度的內膜增生,但過度增生則導致再狹窄,所以什么程度的LLL水平是最優(yōu)的,目前尚未定論。相反,如果LLL水平為負值,則提示存在支架貼壁不良。
IVUS通過三維重建技術能夠對管腔、支架以及外部彈力膜(external elastic membrane, MMB)輪廓進行測量。在支架置入段以及各子節(jié)段,能夠分別測量平均總血管面積(mean total vessel area,VA)、平均支架面積(mean stent area,SA)和平均管腔面積(mean lumen area,LA)。平均新生內膜增生面積(mean neointimal hyperplasia area,NIHA)和圍支架面積(peristent area,PSA)可通過SA和LA或者VA和SA分別計算獲得。IVUS是對支架不完全貼壁的可靠測量方法,如果支架絲(梁)與血管壁分離,IVUS檢查能夠提供支架絲(梁)存在血流的證據(jù)。
OCT是能提供更高分辨率的腔內影像學技術,其軸向分辨率可達10 μm,是IVUS的10倍左右,且成像速度快。與IVUS相比,OCT可提供冠狀動脈管壁更加細微和清晰的信息,可用于評價斑塊纖維帽厚度、脂核大小、鈣化及確定血栓的存在和性質。相比于IVUS更多被用于指導支架的置入,OCT以其高分辨率的優(yōu)勢,在目前臨床試驗中多用于支架置入術后、對支架小梁內皮覆蓋程度的測量,同時OCT也可以用于對斑塊穩(wěn)定性做準確的鑒別,或檢測斑塊的破裂[27]。
MACE是被普遍設定經典臨床終點指標,是多個單項臨床事件復合后的指標,包括死亡(心血管死亡或者全因死亡)、心肌梗死[Q波或非Q波、ST段抬高型心肌梗死(STsegment elevation myocardial infarction,STEMI)或非ST段抬高型心肌梗死(non-ST-segment elevation myocardial infarction,NSTEMI)]和再次血運重建等硬終點。有些研究會采用更有針對性的定義方式,如:患者相關事件復合終點(patient-oriented composite endpoint,PoCE),其組分與MACE類似;PoCE與TLF一類的器械相關復合終點(device-oriented composite endpoint,DoCE)相對應,屬于類似的復合終點定義方式。
靶病變血運重建(target lesion revascularization,TLR)和靶血管血運重建(target vessel revascularization,TVR)也是臨床上普遍使用,臨床試驗一般會同時報告TLR和TVR的結果。需要注意的是,無論TLR還是TVR,前提都是患者接受了再次的心臟導管治療;若患者在PCI術后發(fā)生了MACE,如左前降支(left anterior descending artery,LAD)所致的前壁心肌梗死,但卻沒有接受再次PCI或外科治療,則該事件不會體現(xiàn)在TLR或TVR中。另一方面,對影像學發(fā)現(xiàn)的無癥狀再狹窄、可能增加不必要的再次血運重建治療,所以目前臨床試驗中多采用“有缺血證據(jù)驅動的再次血運重建”作為評價指標。
本綜述總結了近年來PubMed收錄的針對DCB或BRS開展的RCT,首先按適應證的不同劃分為支架內再狹窄病變和小血管/側支/其他病變,并根據(jù)試驗選擇的對照器械差異做進一步分組。通過系統(tǒng)性檢索及文獻篩選,共有18項針對DCB的RCT研究(表1~4)[28-49],其中治療支架內再狹窄病變的11項,治療小血管/側支/其他病變的7項,對照器械多選擇DES或POBA。此外,共檢索到10項針對BRS開展的RCT研究[6-9,50-56](表5),均選擇了DES作為對照器械,且均為冠狀動脈原位原發(fā)病變。
通過分析發(fā)現(xiàn),大多數(shù)RCT研究都選擇影像學替代指標作為主要終點。但在不同的研究中,具體替代終點的選擇會存在一定差異,為進一步對比不同指標對應的效應值(試驗組和對照組的療效差異)的區(qū)別,本綜述中引進一個新指標,即相對獲益(差異)程度,計算方法為:[(試驗組療效—對照組療效)/對照組療效]×100%。比如,Nishiyama等[41]比較DCB與DES治療原位冠狀動脈病變,術后8個月影像學隨訪顯示,DCB組與DES組節(jié)段內LLL水平分別為[(0.25±0.25)mm比(0.37±0.40)mm,P=0.19],則DCB組LLL相對獲益程度為(0.25-0.37)/0.37×100%=-32%,同理可計算節(jié)段內MLD的相對獲益為-9%[DCB 比 DES:(2.12±0.42)mm 比(2.32±0.52)mm,P=0.12]以及DS的相對獲益程度-10%[(14.4±8.3)%比(16.0±15.9)%,P=0.64]。在該研究中,雖然試驗組和對照組術后LLL、MLD和DS比較,差異均無統(tǒng)計學意義,但三個指標計算得到的相對獲益程度是不同的。在同一試驗且同樣基于造影檢查的指標中,LLL上獲得的效應值相比其他兩項指標(MLD和DS)更為明顯,說明不同替代指標之間可能存在對治療效果估計的偏差。
筆者還發(fā)現(xiàn),在以替代指標作為主要終點的臨床試驗中,其中以評價再狹窄程度作為替代終點最為常用,主要歸結為兩類:一類是反映狹窄變化程度(隨訪相對基線或術后檢查)的替代終點,例如LLL;另一類則是直接反映各隨訪時血管狹窄程度的替代終點,包括DS和MLD。但是,即便在同一項研究中,上述替代指標提示的治療效應值卻存在差異,將重點針對這一問題進行探討。
通過總結觀察18項DCB的RCT研究發(fā)現(xiàn),僅有1個研究以臨床終點[術后24周靶血管失?。╰arget vessel failure,TVF)]為主要終點;15項研究以替代指標為主要終點,其中10項以術后LLL為主要終點,3項為術后DS,2項為術后MLD; 另2項研究未預先指明主要指標。在以LLL為主要終點的RCT中,有6項研究的隨訪時間在術后6個月進行,3項研究在術后9個月進行。關于DCB研究的隨訪時間的確定,影像學隨訪多在術后6個月進行,而臨床終點一般在術后6個月及1年時分別進行報告。
首先聚焦DCB治療支架內再狹窄病變的臨床試驗結果(表1)。Claessen等[49]最新研究對比了依維莫司藥物洗脫支架(everolimus-eluting stent,EES)與紫杉醇洗脫球囊(paclitaxel-coated balloon,PCB)在伴有糖尿病的支架內再狹窄患者中的療效(DARE trial)。結果表明,術后6個月兩組節(jié)段內LLL的差異有統(tǒng)計學意義[EES比DCB為:(0.22±0.67)mm比(0.03±0.32)mm,P=0.004],而兩組MLD[(1.46±0.66)mm比(1.67±0.46)mm,P=0.15]以及DS[(42.4±23.1)%比(36.8±15.0)%,P=0.26]差異均無統(tǒng)計學意義。Wong等[48]比較DCB和二代EES(Xience)治療DES形成支架內再狹窄,兩組術后9個月節(jié)段內LLL比較差異無統(tǒng)計學意義(P=0.54),DCB組LLL相對獲益減少21%;兩組MLD差異有統(tǒng)計學意義(P=0.03),相對獲益減少14%;兩組DS差異雖然無統(tǒng)計學意義(P=0.05),但其相對獲益較大(31%)。上述兩項研究均選擇了LLL為主要終點指標。第一項研究中,試驗組和對照組的差異雖然有統(tǒng)計學意義,但是MLD或DS等指標差異無統(tǒng)計學意義。第二項研究雖然兩組LLL差異無統(tǒng)計學意義,但MLD差異有統(tǒng)計學意義,而且DS的相對獲益較大。因此,在應用DCB治療支架內再狹窄病變的RCT研究中,兩類替代終點的獲益不同,單純使用LLL作為主要終點指標,并不能真實有效地反映試驗結果。
若關注DCB治療小血管病變或分叉病變的RCT研究(表2)。以DES為對照器械,如阜外醫(yī)院牽頭的RESTORE-SVD研究[46-47],術后隨訪9個月試驗組與對照組LLL比較,差異無統(tǒng)計學意義(P=0.73),但兩組MLD(P<0.001)和DS(P=0.04)差異有統(tǒng)計學意義;而BELLO研究[31]兩組患者LLL、MLD及DS的差異均無統(tǒng)計學意義,但是三個指標的相對獲益不同,LLL相對減少71%,而MLD相對減少7%,DS相對增加5%。以POBA為對照器械,Kleber等[40]研究顯示,LLL、MLD及DS三個指標的組間比較差異均有統(tǒng)計學意義,但是三個指標相對獲益差異較大,其中LLL相對減少83%,而MLD相對增加29%,DS相對減少37%。上述研究提示在應用DCB治療冠狀動脈小血管或分叉病變的研究中,無論選擇DES或POBA為對照器械,單純使用LLL為主要終點指標,其結果存在較大的差異,不能準確完整地描述試驗療效。
筆者還觀察了針對BRS的RCT研究,在總共10項研究中有4項以臨床終點為主要終點,其中3項為TLF,1項為TVF;另有5項研究明確以替代指標為主要終點,均選擇術后LLL,但隨訪時間窗口不同,1項為術后9個月,1項為術后3年,3項為術后1年;另1項研究未預先指明主要指標。總之,對于BRS試驗的隨訪時間,造影隨訪基本要延后到1年時開展,往往與1年臨床終點同時報告,并且還將開展更為遠期的隨訪觀察(包括影像和臨床)。
表1 DCB 與DES 治療支架內再狹窄病變的RCT 研究
表2 DCB 與 POBA 治療支架內再狹窄病變的RCT 研究
表3 DCB 與DES 治療小血管/側支/其他病變的RCT 研究
表4 DCB 與 POBA 治療小血管/側支/其他病變的RCT 研究
比較各終點指標設置情況,其結果也存在差異(表5)。Han等[54]選擇了單個冠狀動脈原位病變患者,隨機接受中國自行研制的新型西羅莫司洗脫聚L-乳酸(PLLA)BRS或鈷鉻合金依維莫司洗脫支架(cobalt chromium-everolimus eluting stent,CoCr-EES),術后隨訪兩組LLL、MLD及DS的差異均無統(tǒng)計學意義,但相對獲益不同,分別為27%、-3%及2%。同樣,ABSORB Japan研究[7]和ABSORB China研究[8],都是將BRS與CoCr-EES對比,也得出相似結論,上述三個指標兩組比較,差異均無統(tǒng)計學意義,但相對獲益卻相差較大。EVERBIOⅡ 研究[6]將240例有癥狀的冠心病或無癥狀冠狀動脈缺血患者按1∶1∶1隨機分為EES、生物可降解聚合物Biolimus洗脫支架(biolimus-eluting stent,BES)或BRS組,術后隨訪BRS與EES對比三個指標組間比較,差異均無統(tǒng)計學意義,而LLL的相對獲益明顯高于MLD和DS;BRS與RES相比,兩組間LLL比較,差異有統(tǒng)計學意義(P=0.03),而兩組MLD差異無統(tǒng)計學意義且相對獲益很?。▋H0.5%)。通過上述匯總分析,全降解支架的RCT研究同樣提示,LLL水平在不同試驗中所得結果并不一致(相比于其他造影替代指標),單純用其作為主要終點不能有效地評估臨床試驗結果。
通過上述分析,發(fā)現(xiàn)以LLL為代表的傳統(tǒng)替代終點指標和以MLD和DS為代表的新替代終點指標之間存在顯著差別,兩類替代終點結果的獲益相差較大甚至獲益方向(正負)也不一致。Mauri等[57-59]在2005年發(fā)表的“三部曲”文章奠定了LLL作為評價臨床試驗療效的有效替代終點的關鍵“證據(jù)”,證明了LLL的增加與TLR有關,且該關聯(lián)明顯強于再狹窄對TLR的提示作用。歐洲心臟雜志2018年的最新文章,進一步鞏固了LLL作為有效替代終點的地位,證實LLL對TLR的預測能力或關聯(lián)現(xiàn)象甚至適用于5年的長期隨訪結果[60]。但是,上述研究結果均是基于DES試驗所獲得的結果,其對DCB或BRS的適用性還有待驗證。而且在治療技術快速發(fā)展的當代,再狹窄等傳統(tǒng)指標已很難看到明顯獲益[19-21,61]。另外,將LLL作為主要指標能夠使試驗的樣本量規(guī)??刂圃诳尚械姆秶?2]。因此,從某種意義上可以說LLL是為DES“量身定做”的評價指標。
在DES試驗中,用LLL作為替代終點評價再狹窄程度的前提條件是假設DES充分擴張后的血管彈性回縮忽略不計[59]。LLL是由術后即刻與隨訪時的MLD的差值計算得來,其不依賴于參考血管直徑(reference vessel diameter,RVD),且術后MLD不受彈性回縮影響。因此,在DES時代會認為LLL比DS更具“優(yōu)勢”[57-59]。但是,該結論在DCB和BRS的研究中并不成立。國內首個DCB的RCT研究顯示[35,62],術后9個月隨訪DCB組LLL水平低于DES組[(0.54±0.46)mm比(0.62±0.68)mm],提示DCB組術后再狹窄程度低于DES組。如果進一步比較兩組術后即刻MLD,會發(fā)現(xiàn)DCB組的MLD水平低于DES組[(2.39±0.37)mm比(2.56±0.44)mm]。因此,隨訪時DCB組LLL更低的原因有可能是術后即刻MLD更小造成的。因此,看似“更優(yōu)”的DCB患者,其管腔再狹窄程度反而更嚴重[術后即刻DS顯著高于DES組:(10.51±7.22)%比(7.05±6.28)%]。造成這一現(xiàn)象的原因可能是,DCB因治療后缺少支架置入提供的支撐,從而使血管出現(xiàn)一定的彈性回縮,故術后即刻MLD更小,從而不能準確地反映狹窄程度。對BRS也存在同樣問題,由于高分子材料未能提供和金屬支架相當?shù)挠行е螌е卵軓椥曰乜s,使LLL的計算基礎出現(xiàn)問題。而MLD或DS則不存在這一干擾,其可直接反映狹窄程度,不受血管彈性回縮的影響。因此,在“介入無置入”時代用MLD或DS作為替代終點,其與臨床終點的相關性應會更強。
表5 BRS 治療冠狀動脈原位病變的RCT 研究
無論選擇什么樣的替代指標,臨床終點始終是驗證新器械安全性和有效性的“金標準”。雅培公司針對全降解支架開展的系列研究,其中ABSORB Ⅱ研究[50]在3年時血管收縮及LLL兩個共同主要終點指標全部失敗; ABSORB Ⅲ研究[25]則提示在中長期隨訪中(2~3年)BRS組的TLF有潛在的增加趨勢,間接導致了產品的撤市。該系列研究提示在對新型冠狀動脈介入器械開展評價時,應做更全面的考慮,無論是LLL為代表的傳統(tǒng)替代終點還是以MLD和DS為代表的新替代終點,其最終傳遞到的還是臨床結局。因此,評估替代終點與臨床終點的相關性很重要。通過上述分析發(fā)現(xiàn)新的替代終點(MLD,DS)與臨床終點可能相關性更強,但仍需要更進一步的研究驗證。此外,在新的影像學檢查工具層面,雖有IVUS和OCT的引入可以提供更多的測量學信息,但這些指標對應結果的可靠性尚需進一步的驗證與評估,尤其是與臨床終點的相關程度還有待明確。
冠狀動脈治療已進入“介入無置入”時代,新型器械在材料、原理、治療方式和檢測方法上發(fā)生的改變,使得單純沿用經典DES研究中的主要終點可能存在風險,除在療效評價上可能引入偏倚外,在以臨床終點為基礎的安全性結果上也應提供更充分的證據(jù)。因此,如何通過對主要評價指標的合理選擇,在可行性允許的樣本量規(guī)模下開展試驗,并能獲得對干預方法性能的可靠估計,將成為方法學研究努力實現(xiàn)的目標。