李 超 梁煊怡 康軼君 朱 妮 Tao Chen Duolao Wang△ 顏 虹△
【提 要】 目的 介紹Win Ratio法在比較兩組生存資料復(fù)合終點數(shù)據(jù)的基本原理及方法。方法 以一項采用整群隨機化雙盲對照設(shè)計的孕期營養(yǎng)素干預(yù)研究為實例,運用Win Ratio法分析比較不同營養(yǎng)素補充對子代兩種復(fù)合結(jié)局“孕28周至分娩后4周死亡”及次要不良結(jié)局“低出生體重”的影響,并運用Bootstrap法計算95%CI。比較Win Ratio法及傳統(tǒng)Cox風(fēng)險回歸模型計算結(jié)果間的差異。結(jié)果 Win Ratio法與傳統(tǒng)Cox風(fēng)險回歸所得結(jié)果一致,兩組間差異均無統(tǒng)計學(xué)意義。Win Ratio法分析結(jié)果顯示對照組(孕期補充葉酸)的不良結(jié)局發(fā)生率是干預(yù)組(孕期補充多維營養(yǎng)素)的1.07倍,95%CI為(0.85,1.27);傳統(tǒng)Cox風(fēng)險回歸模型分析的結(jié)果與Win Ratio法相似,即對照組的不良結(jié)局發(fā)生是干預(yù)組的1.04倍,95%CI為(0.83,1.31)。結(jié)論 相較于傳統(tǒng)的生存分析,Win Ratio法在分析多種結(jié)局的生存資料時,可考慮結(jié)局間的重要性,同時在保證良好的準確性和檢驗效能的前提下完成對生存資料的區(qū)間估計及干預(yù)效應(yīng)的評價。
在醫(yī)學(xué)隨訪研究中,常通過收集時間-事件數(shù)據(jù)對兩個變量對象的結(jié)局情況進行觀察研究,從而評價某種干預(yù)的效果。目前常用生存分析的相關(guān)方法來解決此類問題,應(yīng)用最多的方法是通過擬合Cox風(fēng)險回歸模型進行組間比較,并通過計算風(fēng)險比(HR值)及其95%CI評價干預(yù)效應(yīng)。但臨床醫(yī)學(xué)研究中,結(jié)局變量常由多種結(jié)果綜合定義,在各結(jié)果成分具有優(yōu)先級順序的研究中,Cox風(fēng)險回歸無法區(qū)分各結(jié)果的主次順序,從而可能導(dǎo)致分析結(jié)果難以解釋。除此之外,Cox風(fēng)險回歸依賴于嚴格的模型假定條件,要求必須滿足比例風(fēng)險假定(PH假定),導(dǎo)致其在實際應(yīng)用中具有一定的局限性[1-3]。本文所介紹的Win Ratio法則可以很好地解決上述問題,不僅可以對生存資料進行組間比較、評價干預(yù)效應(yīng)并估算其95%CI(Bootstrap法),還能對多種結(jié)局變量劃分優(yōu)先順序后進行分析,從而減少因各結(jié)果成分意義不對等而對研究結(jié)論產(chǎn)生的影響。由于目前國內(nèi)尚未出現(xiàn)將Win Ratio法應(yīng)用于復(fù)合終點生存資料分析的報道,故在此對該方法作介紹,愿更多科研工作者能夠從中獲益。
1.Win Ratio法的應(yīng)用
本課題組已系統(tǒng)介紹了Win Ratio法的原理[4]。簡單來說,Win Ratio法以每組研究對象中被稱為“winner”和“l(fā)oser”的頻數(shù)作為數(shù)據(jù)分析的基礎(chǔ),winners定義為在兩組研究對象間可能出現(xiàn)的所有配對情況中干預(yù)組的干預(yù)效果優(yōu)于對照組的總頻數(shù)NW;losers定義為兩組研究對象間所有干預(yù)組的干預(yù)效果劣于對照組的總頻數(shù)NL;干預(yù)組與對照組干預(yù)效果相當?shù)目傤l數(shù)NT定義為tied[5-6]。
應(yīng)用該方法分析生存資料的原理與先前所述一致,但具體輸贏判定標準有所不同。在比較兩組非正態(tài)分布數(shù)據(jù)時,定義結(jié)局變量數(shù)值大的一方為winner,結(jié)局變量數(shù)值小的一方為loser;在對生存資料中的單個結(jié)局變量進行兩組間比較時,以干預(yù)組在一定時間內(nèi)觀察到特定結(jié)局,而對照組未進一步出現(xiàn)與干預(yù)組一致或更優(yōu)的結(jié)局為標準(如對照組出現(xiàn)特定結(jié)局時間晚于干預(yù)組、對照組在干預(yù)組出現(xiàn)特定結(jié)局后中途失訪或?qū)φ战M在研究結(jié)束時均仍未發(fā)生特定結(jié)局),判定該干預(yù)組研究對象為winner,對照組為loser;同理,若對照組在一定時間內(nèi)出現(xiàn)特定結(jié)局而干預(yù)組未進一步出現(xiàn)一致或更優(yōu)結(jié)局,則判定該對照組研究對象為winner,干預(yù)組為loser;若在上述兩種假定下出現(xiàn)有更優(yōu)結(jié)局的情況(如一組在一定時間內(nèi)出現(xiàn)特定結(jié)局而另一組在前組出現(xiàn)特定結(jié)局之前中途失訪),或干預(yù)組和對照組在一定時間內(nèi)均未觀察到特定結(jié)局(如兩組均中途失訪或兩組均在研究結(jié)束時仍未發(fā)生特定結(jié)局),即兩組干預(yù)效果相當,判定為tied[7](圖1)。
若兩組生存資料的結(jié)局變量由具有不對等意義的多個結(jié)果成分組成,需先依照優(yōu)先級為多種結(jié)局變量進行排序,按照從最主要結(jié)局(最具臨床意義的結(jié)局成分)至最次要結(jié)局(臨床意義最小的結(jié)局成分)的順序進行分析,每層結(jié)局的輸贏判定標準與單個結(jié)局變量的生存資料相同(圖1)。需要注意的是,若兩組對象在上一結(jié)局判定中表現(xiàn)為tied,則轉(zhuǎn)而比較下一結(jié)局,直至得出“干預(yù)組win”、“對照組win”、或在最次要結(jié)局水平得出“tied”這三種結(jié)論中的任一種為止,且一組win同時表示另一組lose[8]。
圖1 單個結(jié)局變量的生存資料數(shù)據(jù)Win-lose判斷標準
Win Ratio法評價干預(yù)效應(yīng)的指標為RW值(RW=NW/NL),前期文章中也已對該指標做以詳細說明。在可能出現(xiàn)的所有配對中,干預(yù)組的干預(yù)效果優(yōu)于對照組的概率為[RW/(RW+1)]。
2.Win Ratio法的統(tǒng)計推斷
其假設(shè)檢驗為H0:RW=1,兩組間winner的總頻數(shù)相等,差別無統(tǒng)計學(xué)意義;H1:RW≠1,兩組間winner的總頻數(shù)不等,差別有統(tǒng)計學(xué)意義[5-6]。在此依舊采用Bootstrap法對所得RW值進行區(qū)間估計,求得RW值的95%CI。即在原始數(shù)據(jù)經(jīng)驗分布的基礎(chǔ)上作有放回的重復(fù)隨機抽樣(要求重復(fù)抽樣次數(shù)大于1000次[9-11])。此法估計RW為有偏估計,故需對RW進行對數(shù)轉(zhuǎn)換,再經(jīng)logRW的偏倚校正法[12-13]求得其置信區(qū)間。若RW值的95%CI內(nèi)不包含1,則拒絕原假設(shè),認為兩組間winner的頻數(shù)不等,且差別具有統(tǒng)計學(xué)意義,反之接受原假設(shè),差別無統(tǒng)計學(xué)意義。本研究所有分析均采用SAS 9.4軟件,Win Ratio法分析數(shù)據(jù)的相關(guān)SAS程序可通過查詢相應(yīng)參考文獻或聯(lián)系本文作者獲得。
以2002年至2006年我國陜西省貧困縣孕期營養(yǎng)素補充干預(yù)試驗為例進一步闡釋W(xué)in Ratio法在時間序列分析領(lǐng)域中的應(yīng)用[14]。該孕期營養(yǎng)素補充試驗為嚴格的隨機對照雙盲設(shè)計,于2002年8月至2006年1月間納入該地區(qū)符合條件的孕產(chǎn)婦,在孕期對受試對象分別補充多種微營養(yǎng)素和單純?nèi)~酸,并通過孕期產(chǎn)檢的各項指標及分娩后的隨訪情況進行縱向數(shù)據(jù)采集分析。該研究以探究不同營養(yǎng)素補充方案對孕產(chǎn)不良結(jié)局影響的組間差異為目的,起始時點為末次月經(jīng),終點事件可按結(jié)局成分的主次順序劃分為主要終點子代死亡(死產(chǎn)及新生兒死亡)和次要終點低出生體重。根據(jù)所收集數(shù)據(jù)可知“多微營養(yǎng)組”1579人,葉酸組1727人,多微營養(yǎng)組子代死亡數(shù)87例,低出生體重數(shù)57例,平均死亡時間38.70周,平均隨訪時間43.58周,平均孕周39.77周;葉酸組子代死亡數(shù)91例,低出生體重數(shù)82例,平均死亡時間37.00周,平均隨訪時間43.39周,平均孕周39.56周(表1)。假設(shè)多微營養(yǎng)組(干預(yù)組)總?cè)藬?shù)為NA,葉酸組(對照組)總?cè)藬?shù)為NB,則兩組所有可能的配對數(shù)為NA×NB,且不難得出NA×NB=NW+NL+NT。
表1 兩組間數(shù)據(jù)特征
*:子代死亡包括死產(chǎn)與新生兒死亡;**:平均死亡時間=(子代死亡日期-末次月經(jīng)日期)/7
基于該干預(yù)研究項目,我們所研究的孕產(chǎn)不良結(jié)局由主要不良結(jié)局“子代死亡”和次要不良結(jié)局“低出生體重”組成。在此實例中,由于“子代死亡”(指圍生期死亡,包括死胎、死產(chǎn)、新生兒死亡)相較“低出生體重”對家庭及個體的不良影響更為嚴重,所以本研究中“子代死亡”不良結(jié)局程度顯然應(yīng)優(yōu)先于“低出生體重”,而在其他臨床研究中,需根據(jù)不同的結(jié)局制定相應(yīng)的優(yōu)先順序。假設(shè)干預(yù)組對象i與對照組對象j配對,i出現(xiàn)子代死亡,而j未在隨訪時間內(nèi)觀察到特定結(jié)局或出現(xiàn)子代死亡時間晚于i,則判定對象i為winner,對象j為loser。再假設(shè)干預(yù)組對象s與對照組對象t配對,先比較二者子代死亡情況,對象s出現(xiàn)子代死亡,而t先于s未觀察到特定結(jié)局(如中途失訪)或?qū)ο髎與對象t均未在隨訪時間內(nèi)觀察到特定結(jié)局,即二者作用效果相當(undecided),轉(zhuǎn)至比較二者新生兒低出生體重情況,若s出現(xiàn)低出生體重,而t未在隨訪時間內(nèi)觀察到特定結(jié)局或出現(xiàn)低出生體重的時間(孕周)晚于s,則判定對象s為winner,對象t為loser;若二者再次作用效果相當,則判定為tied(圖2)。
圖2 多個結(jié)局變量時組間win-lose判斷標準
由此可知,運用Win Ratio法分析兩組數(shù)據(jù)所能得到的結(jié)果分為5種:
(1)干預(yù)組在評估“子代死亡”水平win(判定干預(yù)組win),頻數(shù)為Na;
(2)對照組在評估“子代死亡”水平win(判定對照組win),頻數(shù)為Nb;
(3)干預(yù)組在評估“低出生體重”水平win(判定干預(yù)組win),頻數(shù)為Nc;
(4)對照組在評估“低出生體重”水平win(判定對照組win),頻數(shù)為Nd;
(5)各結(jié)局比較均相當(判定為tied),頻數(shù)為Ne。
兩組間所有可能配對都必須參與比較并得出以上五類結(jié)論中的一種,一組獲win的同時表示另一組lose,且有Na+Nc=NW,Nb+Nd=NL,Ne=NT。
故采用Win Ratio法分析該項生存資料得兩組間所有可能配對數(shù)共2726933對,每對隨機由一名多微營養(yǎng)組對象與一名葉酸組對象組成,其中多微營養(yǎng)組的贏率(winners所占比例)為8.0%(Na+Nc),葉酸組的贏率為7.4%(Nb+Nd),兩組相當?shù)谋壤?tied所占比例)為84.6%,多微營養(yǎng)組比葉酸組的RW值為1.07,95%CI(0.85,1.27),判斷兩組間干預(yù)效應(yīng)的差異無統(tǒng)計學(xué)意義(表2)。
表2 利用Win Ratio法對兩組間生存資料進行比較
采用Cox風(fēng)險回歸對兩組數(shù)據(jù)進行生存比較,得風(fēng)險比為1.04,即對照組的死亡率是干預(yù)組的1.04倍,95%CI為(0.83,1.31),因此認為兩組間干預(yù)效應(yīng)的差異無統(tǒng)計學(xué)意義(表3)。
表3 利用Cox風(fēng)險回歸模型對兩組生存資料進行比較
綜上可知,在該實例分析中Win Ratio法所得結(jié)論與Cox風(fēng)險回歸一致,均認為兩組間干預(yù)效應(yīng)的差異無統(tǒng)計學(xué)意義。
本文通過一個實例詳細闡述了Win Ratio法在對兩組間復(fù)合終點生存資料進行分析的一些基本理論和方法。在比較兩組生存數(shù)據(jù)時,應(yīng)用Win Ratio法可在不改變傳統(tǒng)生存分析研究結(jié)論的基礎(chǔ)上考慮生存資料中多種結(jié)局的優(yōu)先順序,從而解決傳統(tǒng)生存分析中因各結(jié)局成分不對等而對研究結(jié)果產(chǎn)生的影響。
在處理縱向數(shù)據(jù)時,傳統(tǒng)的生存分析方法如Cox回歸可用于組間生存資料的比較,計算出P值判斷組間差異是否具有統(tǒng)計學(xué)意義,并通過計算風(fēng)險比及其95%CI評價干預(yù)效應(yīng),但該方法存在兩個主要問題。一是Cox風(fēng)險回歸依賴于嚴格的假定條件,要求必須滿足PH假定和對數(shù)線性假定,限制了該方法的應(yīng)用范圍;二是在該方法無法區(qū)分各結(jié)果的主次順序:當結(jié)局具有多個優(yōu)先級時,Cox風(fēng)險回歸無法區(qū)分各結(jié)果的主次順序,從而可能導(dǎo)致試驗結(jié)果難以解釋和/或可存在一定誤導(dǎo)性[1-3]。
而現(xiàn)實中常有結(jié)局事件由多種結(jié)果復(fù)合而成的情況,通常在臨床和觀察研究中很難用單一的結(jié)果來描述療效或暴露情況,疾病或事件的發(fā)生往往也難以根據(jù)單一的結(jié)果作為判定依據(jù)。但多種結(jié)果的尺度或臨床意義可能有差別,結(jié)果的不對等性也會對研究結(jié)果產(chǎn)生影響。如本文孕婦分娩的不良結(jié)局事件包括子代死亡及低出生體重兩種成分,但相較于低出生體重,顯然子代死亡對孕產(chǎn)婦的影響更大,臨床意義更高。在多數(shù)情況下,我們很難解釋所得復(fù)合結(jié)局是由哪一成分主導(dǎo)的,倘若臨床意義小的成分對結(jié)局的驅(qū)動作用與臨床意義大的成分的驅(qū)動作用相反,則會削弱從研究結(jié)果中獲取可靠結(jié)論的能力。若應(yīng)用Cox回歸,則所有結(jié)局指標被視為同等意義,無法考慮復(fù)合結(jié)局中多種結(jié)果成分的不對等性對最終研究結(jié)論的影響作用。之前有相關(guān)研究報道指出,若將多個結(jié)局視為單一結(jié)局擬合Cox回歸模型,或?qū)⒍鄠€結(jié)局分開分別單獨擬合Cox回歸模型,都將增大回歸系數(shù)的估計值偏差并降低檢驗效能[8]。
本研究介紹的Win Ratio法可以很好地解決上述問題。首先,Win Ratio法可通過計算RW值及其95%CI完成對兩組生存數(shù)據(jù)的組間比較并直觀地評價組間干預(yù)效應(yīng),能在得出與傳統(tǒng)生存分析方法相一致結(jié)果的同時保持與傳統(tǒng)生存分析相似的統(tǒng)計能力[15]。同時與生存分析一樣,對生存資料中的截尾數(shù)據(jù)(如失訪等未在隨訪時間內(nèi)觀察到特定結(jié)局的情況)亦有具體判定方法。相較于傳統(tǒng)生存分析,Win Ratio法不依賴于假定檢驗,使得該方法有著廣泛的應(yīng)用前景。在此基礎(chǔ)上,Win Ratio法另一優(yōu)勢在于關(guān)注結(jié)局變量各復(fù)合成分的相對臨床重要性,考慮不平等的復(fù)合終點對研究結(jié)果的限制影響,以“最劣事件”分析的方式,通過分層分析結(jié)局賦予各優(yōu)先級結(jié)局成分數(shù)據(jù)在數(shù)據(jù)處理過程中不同的參考權(quán)重。本文介紹的是在存在兩種結(jié)局成分(子代死亡和低出生體重)的縱向數(shù)據(jù)資料分析中Win Ratio法的應(yīng)用,而在其他必要情況下,Win Ratio法還可應(yīng)用于存在更多終點事件成分的時間序列分析中,其基本理論與方法和本文中所介紹一致。
需要指出的是,即便Win Ratio法有上述優(yōu)點,我們還應(yīng)注意到該分析方法的局限性。Win Ratio法本身目前尚無公認有效的協(xié)變量控制方法,雖然Win Ratio法可以根據(jù)分層分析校正分層變量的影響,然而該方法只能控制單一因素的影響,故難以在實際科研工作中校正不同混雜因素對結(jié)果的影響,且該方法缺少樣本量及樣本率估算公式。Win Ratio法的使用范圍亦有限制。首先,Win Ratio法難以應(yīng)用于小樣本數(shù)據(jù)或缺少公認輸贏評判策略的數(shù)據(jù)分析中。與此同時,Win Ratio法不能分析比較縱向數(shù)據(jù)中不同時間節(jié)點的組間效應(yīng)差異,故限制了其在重復(fù)測量設(shè)計數(shù)據(jù)中的應(yīng)用。
基于以上局限性與不足之處,Win Ratio法只適用于嚴格控制組間混雜因素的臨床試驗數(shù)據(jù)分析中,至于更為廣泛的生存資料分析,目前只能作為生存分析的輔助或補充方法。誠然,Win Ratio法的性質(zhì)和應(yīng)用還有待進一步探索,亦為廣大科研工作者提供了Win Ratio未來發(fā)展的研究方向。因國內(nèi)尚未出現(xiàn)將Win Ratio法應(yīng)用于生存資料分析的報道,故借此文對應(yīng)用Win Ratio處理生存資料數(shù)據(jù)的方法作以介紹,愿更多科研工作者能夠了解Win Ratio法并將該方法運用到臨床研究的生存資料處理工作中。