陳 陽(yáng) ,劉媛媛 ,李長(zhǎng)平 ,2,胡良平
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,天津 300070;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專(zhuān)業(yè)委員會(huì),北京 100029;3.軍事科學(xué)院研究生院,北京 100850
當(dāng)事先知道某兩種藥物或療法的初步信息(如A藥可能比B藥療效差),但其差值可能不會(huì)超出專(zhuān)業(yè)上允許的一個(gè)界值時(shí),可以考慮采用非劣效性檢驗(yàn)[1]。本文主要介紹臨床試驗(yàn)中非劣效性檢驗(yàn)的相關(guān)內(nèi)容,包括非劣效性檢驗(yàn)的概念、意義以及假設(shè)檢驗(yàn)的原理、重要參數(shù)的解釋和確定。再結(jié)合臨床實(shí)例,展示SAS中兩算術(shù)均值比較非劣效性t檢驗(yàn)的應(yīng)用,并對(duì)程序語(yǔ)句和運(yùn)行結(jié)果進(jìn)行解釋。
以安慰劑作為對(duì)照的隨機(jī)雙盲臨床試驗(yàn)一直被視為藥物開(kāi)發(fā)中的金標(biāo)準(zhǔn),然而隨著可應(yīng)用的有效藥物的不斷出現(xiàn),具有突破性療效的新藥卻越來(lái)越少,所以臨床研究的目的也逐漸改變。盡管某些療法能夠提供更高的功效,但其他新療法可能具有更高的安全性或便利性,或更少的經(jīng)濟(jì)花費(fèi),同時(shí)提供相似的功效。為了尋求良好替代療法,提出了非劣效性檢驗(yàn)。在真實(shí)的非劣效臨床研究中,當(dāng)以陽(yáng)性藥物作為對(duì)照時(shí),實(shí)際上是默認(rèn)了陽(yáng)性對(duì)照的療效是客觀存在且穩(wěn)定的,且已知試驗(yàn)藥的療效不可能等于或優(yōu)于對(duì)照藥的療效,當(dāng)能證明兩者療效之差未超過(guò)臨床上認(rèn)可的界值時(shí),即可稱(chēng)為非劣效。如果非劣效性檢驗(yàn)成立,試驗(yàn)藥物雖然相比于陽(yáng)性對(duì)照藥物在療效上沒(méi)有優(yōu)勢(shì),但考慮到其他方面的優(yōu)點(diǎn),如給藥方便、原材料豐富、價(jià)格便宜、不良反應(yīng)少等,那么新藥也是值得投入的。此外,在臨床試驗(yàn)的設(shè)計(jì)和分析階段,評(píng)估非劣性比優(yōu)效性更為復(fù)雜,但在某些情況下,非劣效檢驗(yàn)的原假設(shè)可能比通常的優(yōu)效性分析更合理,因?yàn)樗谙闰?yàn)的效應(yīng)以及安全性信息[2]。隨著臨床試驗(yàn)中設(shè)計(jì)和統(tǒng)計(jì)分析的不斷改進(jìn)與規(guī)范,標(biāo)準(zhǔn)陽(yáng)性對(duì)照試驗(yàn)的非劣效性設(shè)計(jì)的應(yīng)用更加廣泛,成為了評(píng)價(jià)藥物、器械、生物制品和其他醫(yī)學(xué)治療的主要工具,近十年內(nèi),評(píng)估非劣效性的隨機(jī)試驗(yàn)數(shù)量增加了6倍[3]。目前科研需要發(fā)展具有相當(dāng)功效但兼具其他優(yōu)點(diǎn)的新方法替代標(biāo)準(zhǔn)方法,在這種前提下,非劣效性試驗(yàn)的應(yīng)用就越來(lái)越普遍,但與此同時(shí),為了保證結(jié)果和結(jié)論的可靠性,非劣效試驗(yàn)的報(bào)告內(nèi)容和相關(guān)的規(guī)定也需要不斷完善[4]。
檢驗(yàn)假設(shè):μ1表示試驗(yàn)措施的干預(yù)效果(試驗(yàn)組主要指標(biāo)的效應(yīng)值,均數(shù));μ2表示對(duì)照措施的干預(yù)效果(對(duì)照組主要指標(biāo)的效應(yīng)值,均數(shù))。
同時(shí)還假定:主要指標(biāo)為高優(yōu)指標(biāo),即均值取值大為好(若主要指標(biāo)為低優(yōu)指標(biāo),下面零假設(shè)和備擇假設(shè)中的不等號(hào)需要改變方向,且非劣效界值取正值)。δL表示非劣效界值(通常取負(fù)值);α表示檢驗(yàn)水準(zhǔn)(在通常的情況下取α=0.05,單側(cè)檢驗(yàn));原假設(shè)和備擇假設(shè)分別用H0和H1表示?;谝陨隙x,非劣效性檢驗(yàn)的檢驗(yàn)假設(shè)可表述如下,H0:μ1-μ2≤δL;H1:μ1-μ2>δL。
采用單側(cè)檢驗(yàn)。當(dāng)t>t(1-ɑ),n1+n2-2時(shí),差異有統(tǒng)計(jì)學(xué)意義,拒絕H0,能夠得出試驗(yàn)組非劣于對(duì)照組的結(jié)論[5]。
在非劣效檢驗(yàn)中使用單側(cè)檢驗(yàn),當(dāng)試驗(yàn)組療效劣于對(duì)照組且其差值小于或等于非劣效界值δL時(shí),不能拒絕H0,尚不能得出試驗(yàn)組非劣效于對(duì)照組的結(jié)論;如果大于非劣效界值δL,則拒絕H0,能夠得出試驗(yàn)組非劣效于對(duì)照組的結(jié)論。
在置信區(qū)間法中,非劣效性試驗(yàn)僅關(guān)注試驗(yàn)方法相對(duì)于對(duì)照方法評(píng)價(jià)指標(biāo)的效果差值的置信區(qū)間下限的大小。因此,當(dāng)試驗(yàn)措施與對(duì)照措施的效果差異的單側(cè)95.0%置信區(qū)間完全落在非劣效性界值右側(cè)時(shí),即其單側(cè)95.0%置信區(qū)間的下限大于設(shè)定的判斷界值δL時(shí),則可判定非劣效性假設(shè)成立。對(duì)于兩個(gè)均數(shù)比較的非劣效檢驗(yàn),按照單側(cè)100(1-α)%的可信度,可以計(jì)算單側(cè)置信區(qū)間的下限CL,公式如下:
若(CL,∞)不包括δL,可以得出試驗(yàn)組療效非劣效于對(duì)照組療效的結(jié)論。
美國(guó)食品藥品監(jiān)督管理局指出,在非劣效試驗(yàn)中,設(shè)定檢驗(yàn)界值應(yīng)基于“恒定假設(shè)”,即盡可能確保本次非劣效性試驗(yàn)中陽(yáng)性對(duì)照藥的療效與既往臨床試驗(yàn)保持一致。只有當(dāng)前非劣效試驗(yàn)與其陽(yáng)性對(duì)照藥的歷史試驗(yàn)在所有重要研究設(shè)計(jì)和實(shí)施方面均保持一致時(shí),歷史試驗(yàn)才可用于估計(jì)當(dāng)前非劣效試驗(yàn)的陽(yáng)性對(duì)照藥療效和非劣效界值[6],否則會(huì)導(dǎo)致錯(cuò)誤的非劣效結(jié)論。非劣效性界值δL設(shè)定一般分為兩個(gè)步驟,可采用綜合分析法(常用Meta分析法)估計(jì)陽(yáng)性對(duì)照的絕對(duì)療效M1,計(jì)算陽(yáng)性對(duì)照與安慰劑效應(yīng)之差的95%雙側(cè)置信區(qū)間下限(必須大于0),鑒于療效的一致性和既往的臨床數(shù)據(jù)質(zhì)量,一般M1取值小于計(jì)算所得下限值。非劣效性界值|δL|=M2=f*M1,f一般建議取值為0.5。當(dāng)無(wú)法借鑒歷史資料時(shí),臨床試驗(yàn)的反應(yīng)率(有效率)高于80%時(shí),|δL|一般可以取陽(yáng)性對(duì)照療效的10%~15%。非劣效性界值應(yīng)該結(jié)合文獻(xiàn),由臨床專(zhuān)家確定。根據(jù)經(jīng)驗(yàn),血壓可取為0.67 kPa(5 mmHg),膽固醇可取為0.52 mmol/L(20 mg/dL),白細(xì)胞可取為0.5×109/L(500個(gè)/mm3)[7](注意:前面舉例給出的是非劣效界值的絕對(duì)值,代入公式計(jì)算時(shí),應(yīng)取負(fù)號(hào),代表“方向”)。若確實(shí)沒(méi)有公認(rèn)的文獻(xiàn)資料作為參考依據(jù),需要由在所研究問(wèn)題方面具有權(quán)威性的多位臨床專(zhuān)家共同商定。
【例1】為了比較拉西地平與苯磺酸氨氯地平治療中老年原發(fā)性輕中度高血壓的效果及安全性[8],入選8個(gè)中心年齡在50~80歲的輕中度高血壓患者共263例,隨機(jī)分為拉西地平組和苯磺酸氨氯地平組,于治療20周后比較兩組患者24 h平均收縮壓,評(píng)價(jià)拉西地平控制中老年原發(fā)性輕中度高血壓的效果是否不劣于苯磺酸氨氯地平。見(jiàn)表1。
表1 拉西地平組與苯磺酸氨氯地平組24 h平均收縮壓變化情況(mmHg)
基于該成組設(shè)計(jì)一元定量資料,能夠計(jì)算得到樣本量、均數(shù)及標(biāo)準(zhǔn)差,為了比較兩組的24 h平均收縮壓控制效果,可以采用非劣效性檢驗(yàn)(假定:經(jīng)臨床專(zhuān)家商定,非劣效界值為-5 mmHg),結(jié)合兩組的均數(shù)、標(biāo)準(zhǔn)差判斷該藥物是否有推廣價(jià)值。一般認(rèn)為,降血壓的數(shù)值越多,表明降壓藥的療效越好,故本例的評(píng)價(jià)指標(biāo)(血壓下降值)為“高優(yōu)指標(biāo)”。
SAS程序如下:
【程序說(shuō)明】第1步設(shè)定非劣效性界值L(注意:程序中不便采用δL表示);然后,根據(jù)式(2)計(jì)算中間結(jié)果。第2步進(jìn)行非劣性假設(shè)檢驗(yàn),根據(jù)式(1)和式(3)計(jì)算t值、P值和CL[9]。
【SAS主要輸出結(jié)果及解釋】
以上主要輸出結(jié)果中的utc=1.65071是基于df=132+131-2=261、上尾概率為0.05條件下計(jì)算出t分布曲線下的分位數(shù),若采用正態(tài)分布近似取代t分布,則此數(shù)值應(yīng)該為1.645。
統(tǒng)計(jì)與專(zhuān)業(yè)結(jié)論:t=2.57626,P=0.005269056,按照α=0.05(單側(cè)檢驗(yàn)),拒絕H0,接受H1,可以認(rèn)為拉西地平控制中老年原發(fā)性輕中度高血壓的效果不劣于苯磺酸氨氯地平。從95%置信區(qū)間下限來(lái)看,CL=-3.31148>-5.00,可以認(rèn)為拉西地平不劣于苯磺酸氨氯地平,該結(jié)論與假設(shè)檢驗(yàn)結(jié)果一致。
【例2】為了觀察地賜康的降血脂療效[10],將79例原發(fā)性高血脂癥患者隨機(jī)分為治療組(地賜康沖劑1袋,tid)和對(duì)照組(血脂康膠囊2粒,bid),治療8周后,觀察兩組總膽固醇下降的情況,評(píng)價(jià)地賜康的血脂調(diào)節(jié)效果是否不劣于血脂康膠囊。見(jiàn)表2。
表2 測(cè)定79例原發(fā)性高血脂癥患者8周后總膽固醇下降情況(mmol/L)
表2所示屬于成組設(shè)計(jì)一元定量資料,可以采用非劣效性檢驗(yàn)比較治療組與對(duì)照組的效果。根據(jù)臨床經(jīng)驗(yàn),設(shè)定非劣效性界值為-0.52 mmol/L,以進(jìn)行后續(xù)的非劣效性檢驗(yàn),試判斷地賜康沖劑是否具有推廣和應(yīng)用價(jià)值。
SAS程序如下:
【程序說(shuō)明】第一步,根據(jù)原始定量數(shù)據(jù)建立臨時(shí)數(shù)據(jù)集“example2”,程序?qū)υ囼?yàn)組和對(duì)照組有明確的要求,第一組為試驗(yàn)組,第二組為對(duì)照組。第二步,在TTEST過(guò)程中,sides=u表示采用上單側(cè)檢驗(yàn),h0=-0.52為設(shè)定的非劣效性界值;“alpha=0.10”代表求均值之差的雙側(cè)90.0%置信區(qū)間,相當(dāng)于單側(cè)95.0%置信區(qū)間。
【SAS主要輸出結(jié)果及解釋】
以上結(jié)果分別為兩組總膽固醇變化量的均值以及它們差值的均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、雙側(cè)90.0%(相當(dāng)于單側(cè)95.0%)置信區(qū)間等信息。
根據(jù)方差齊性檢驗(yàn)的結(jié)果(EqualityofVariances),F(xiàn)=1.91,P>0.05,認(rèn)為兩總體方差相等。對(duì)應(yīng)的t檢驗(yàn)結(jié)果中,應(yīng)該參照匯總方法(Pooled),對(duì)應(yīng)方差相等時(shí)的計(jì)算結(jié)果。
若采用置信區(qū)間法,需要參考兩組效應(yīng)差值的95%CLMean的下限,再與δL(取負(fù)值)進(jìn)行比較,得出統(tǒng)計(jì)結(jié)論。
統(tǒng)計(jì)與專(zhuān)業(yè)結(jié)論:t=2.14,P=0.0179,按照α=0.05,拒絕H0,接受H1,可以認(rèn)為地賜康的血脂調(diào)節(jié)效果不劣于血脂康膠囊,結(jié)合地賜康沖劑價(jià)格以及患者的服藥依從性,可以考慮在臨床推廣應(yīng)用。此外,按照單側(cè)95%的置信度,兩組效應(yīng)差值的置信區(qū)間下限CL為-0.3473>-0.52(非劣效界值),可以下非劣效性的結(jié)論,與假設(shè)檢驗(yàn)的結(jié)果一致,即可以認(rèn)為地賜康的血脂調(diào)節(jié)效果非劣效于血脂康膠囊的血脂調(diào)節(jié)效果。
在非劣效性分析中,先驗(yàn)確定了兩種治療方法之間的可接受的差異δL,但非劣效性界值的設(shè)定是研究設(shè)計(jì)時(shí)最復(fù)雜的問(wèn)題。由于確定的非劣效界值一般很小,導(dǎo)致非劣效設(shè)計(jì)中陽(yáng)性對(duì)照的樣本量需求大于安慰劑對(duì)照,而樣本量的確定高度依賴(lài)于界值和試驗(yàn)方法的效應(yīng),這些都必須明確而具有現(xiàn)實(shí)性[11]。關(guān)于非劣效或者等效性研究的文獻(xiàn)有很多混亂及缺陷,如界值的正確選取、樣本量的合理計(jì)算等。造成這一問(wèn)題的重要原因是術(shù)語(yǔ)缺乏統(tǒng)一性和通透性,這是應(yīng)用新方法時(shí)不可避免的。但可以預(yù)料的是,隨著這些方法的應(yīng)用和研究指南的不斷改善,科學(xué)研究將會(huì)向著正確的方向更進(jìn)一步[12]。
少數(shù)情況下當(dāng)安慰劑對(duì)照不被允許或違反倫理,或者想要與已上市的有效藥物或標(biāo)準(zhǔn)治療方案進(jìn)行比較以求能獲得一個(gè)新的治療選擇時(shí),可以考慮進(jìn)行非劣效性分析。這種類(lèi)型的分析存在一些缺點(diǎn),如依賴(lài)于之前對(duì)照的結(jié)果以及確定非劣效界值較復(fù)雜。但是這些缺點(diǎn)可能會(huì)被其優(yōu)點(diǎn)所抵消,如能夠包含多種終點(diǎn)類(lèi)型(二分類(lèi)、有序變量、連續(xù)變量等),基于治療方法和適應(yīng)癥,能夠比安慰劑對(duì)照更具有倫理學(xué)意義。
隨著非劣效設(shè)計(jì)的普遍應(yīng)用,需注意在研究過(guò)程中遵守和維持此類(lèi)有效性研究的基本原則和報(bào)告標(biāo)準(zhǔn)。通過(guò)合理的設(shè)計(jì)和執(zhí)行,非劣效性試驗(yàn)?zāi)軌蛱峁┚哂信R床價(jià)值的創(chuàng)新治療方案。