胡良平,賈元杰,鮑曉蕾 (軍事醫(yī)學(xué)科學(xué)院科技部生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心,北京100850)
在進(jìn)行一項(xiàng)臨床或生物醫(yī)學(xué)科研課題的設(shè)計(jì)時(shí),一般都會涉及兩組或兩組以上病人的藥物或治療措施的有效性與安全性的比較或評價(jià)問題。如果這些組中的病人在很多非試驗(yàn)因素方面幾乎都一致,其區(qū)別僅僅在于試驗(yàn)因素的水平不同,如藥物的種類不同,或同一種藥物的劑量不同,或手術(shù)的方式不同,此時(shí),研究結(jié)果就具有較高的可信度。在進(jìn)行科研設(shè)計(jì)時(shí),科研人員常用的做法是簡單地采用完全隨機(jī)化方法分配受試對象,試圖使試驗(yàn)組和對照組中的受試者在一切非試驗(yàn)因素方面都達(dá)到均衡一致,但這樣做總能如愿以償嗎?本文作者將就此問題開展一些討論,并介紹有利于提高均衡性的策略與措施,最后列舉在均衡性方面常犯的一些錯(cuò)誤案例,并對差錯(cuò)進(jìn)行辨析與釋疑。
均衡原則要求同一個(gè)試驗(yàn)因素各水平組之間除了所考察的因素取不同水平外,在一切非處理因素方面達(dá)到均衡一致。其作用在于使試驗(yàn)因素不同水平組中的受試對象受到非試驗(yàn)因素的影響完全平衡,確保試驗(yàn)因素各水平組間不受其他試驗(yàn)因素或重要的非試驗(yàn)因素的不平衡的干擾和影響,以便使所考察的試驗(yàn)因素取不同水平條件下對觀測結(jié)果的影響能真實(shí)地顯露出來。值得注意的是,在小樣本的試驗(yàn)研究中,完全隨機(jī)化分組常常導(dǎo)致組間嚴(yán)重缺乏均衡性。例如,有某疾病病人24例(重癥16例,輕癥8例),若完全隨機(jī)地將他們均分成兩組,則很有可能某一組中12例病人全是重癥病人。若將重癥者、輕癥者分別隨機(jī)均分成兩組,則每組中重癥與輕癥病人分別為8例和4例,這樣就確保了兩組病人在“病情輕重”這個(gè)重要非試驗(yàn)因素上是均衡的。
實(shí)際操作中,要注意以下兩點(diǎn):(1)科研設(shè)計(jì)時(shí)要考慮采用盲法降低人為因素和心理因素對觀測結(jié)果的干擾和影響。(2)分組時(shí)應(yīng)盡可能采用分層隨機(jī)化法,使各組病人在諸多重要非試驗(yàn)因素方面應(yīng)盡可能一致。比如,病情構(gòu)成(輕、中、重的比例),病程構(gòu)成(短、中、長的比例),性別構(gòu)成,年齡分布,抽煙、飲酒的數(shù)量和過度勞累的程度等方面,在試驗(yàn)組與對照組之間應(yīng)具有很好的可比性。這些可能影響療效評價(jià)的各個(gè)方面,在統(tǒng)計(jì)學(xué)上常被稱為重要的非試驗(yàn)因素。在試驗(yàn)分組時(shí)對此類因素應(yīng)考慮周全,妥善處置。具體地說,可按重要非試驗(yàn)因素形成“復(fù)合型區(qū)組因素”,即對幾個(gè)重要非試驗(yàn)因素的水平進(jìn)行全面組合,形成多個(gè)小組,每個(gè)小組中的受試者在所考察的幾個(gè)重要非試驗(yàn)因素方面是完全相同的,再將每個(gè)小組中的全部受試者完全隨機(jī)均分入試驗(yàn)組與對照組中去,這種分組方法被稱為“分層隨機(jī)化”(stratified radomization)。下面通過一個(gè)實(shí)例生動地說明嚴(yán)格遵守均衡原則進(jìn)行試驗(yàn)設(shè)計(jì)和具體實(shí)施的重要性。
例1 某研究者欲比較蘭索拉唑與法莫替丁治療反流性食管炎(reflux esophagitis,RE)的療效,選取1999年1月-2000年12月經(jīng)胃鏡檢查診斷為RE的病人共46例,男性37例,女性9例,男女之比為4.11∶1。年齡46~86歲,平均年齡67歲,其中60歲以上的老年人共31例,占67.4%。所有病人均排除胃潰瘍的可能,治療前肝、腎功能均正常。內(nèi)鏡檢查診斷,其中Ⅰ型病人23例,Ⅱ型病人18例,Ⅲ型病人3例,Ⅳ型病人2例。將46例病人隨機(jī)分為兩組,一組用蘭索拉唑,另一組用法莫替丁[2]。
對差錯(cuò)的辨析與釋疑 本例中只有一個(gè)要考察的試驗(yàn)因素就是藥物種類,有兩個(gè)水平。原作者在進(jìn)行分組時(shí)采用的是完全隨機(jī)分組方式,這種方式看似符合隨機(jī)原則,但真正能使兩組病人在重要非試驗(yàn)因素方面達(dá)到均衡嗎?通常,相同的治療方案對不同病情的治療效果是不一樣的,病情程度輕的病人治療效果要好于病情程度重的病人。文中寫明46例病人中Ⅰ型病人23例,Ⅱ型病人18例,Ⅲ型病人3例,Ⅳ型病人2例。也就是說這46例病人的疾病分型甚至病情輕重程度是不一樣的。原作者采用簡單隨機(jī)化分組的方法,很有可能使兩組病人的病情輕重分布不一致,如果出現(xiàn)這種情況,試驗(yàn)得到的最終結(jié)論不能令人信服。再如年齡因素,它一般也是重要的非試驗(yàn)因素,年輕病人的療效往往要好于老年病人。原作者并沒有說明對年齡的處理,如果隨機(jī)分組后兩組的年齡分布不一致,同樣也會導(dǎo)致試驗(yàn)結(jié)論不能令人信服。那么,應(yīng)該怎樣才能保證試驗(yàn)是有意義的,結(jié)論是可信的呢?首先應(yīng)確保試驗(yàn)設(shè)計(jì)是正確的,確保試驗(yàn)設(shè)計(jì)正確的關(guān)鍵便是嚴(yán)格遵守試驗(yàn)設(shè)計(jì)的均衡原則。因?yàn)殡S機(jī)、對照、重復(fù)原則都是從屬于均衡原則的。其次,是實(shí)施過程中的嚴(yán)格質(zhì)量控制。因?yàn)閷?shí)施過程中,可變的東西很多,包括環(huán)境條件、試驗(yàn)條件、研究者的技術(shù)水平和心理作用、受試者的依從性和心理狀態(tài)等。如果質(zhì)量控制沒有做好,其組間的可比性也會大大下降。
2.1 從人的主觀能動性角度考慮 (1)研究者應(yīng)具有較好的專業(yè)知識、統(tǒng)計(jì)學(xué)知識和很強(qiáng)的責(zé)任感,對整個(gè)試驗(yàn)研究的各個(gè)方面有整體的把握,使其盡可能滿足均衡性要求,能夠制定出較為理想的試驗(yàn)設(shè)計(jì)方案;(2)試驗(yàn)設(shè)計(jì)方案制定出來以后,應(yīng)該請從事本專業(yè)研究的有經(jīng)驗(yàn)的專家?guī)椭鷮忛喓托薷?使其至少在“基本常識和專業(yè)知識”方面盡可能趨于完善;(3)應(yīng)當(dāng)請對統(tǒng)計(jì)學(xué)有較深入研究的統(tǒng)計(jì)學(xué)工作者參與設(shè)計(jì)方案的制定,至少要請他們幫助審閱和修改設(shè)計(jì)方案[3]。
2.2 從研究的整個(gè)過程角度考慮 (1)制定合理的納入和排除受試對象的標(biāo)準(zhǔn);對參與的研究者進(jìn)行嚴(yán)格的技術(shù)培訓(xùn);(2)對試驗(yàn)條件進(jìn)行標(biāo)準(zhǔn)化管理(如儀器、試劑的校準(zhǔn);制定出科學(xué)的診斷、測定和評價(jià)標(biāo)準(zhǔn));(3)嚴(yán)格按隨機(jī)(注意按重要非試驗(yàn)因素進(jìn)行分層隨機(jī))、對照(強(qiáng)調(diào)設(shè)置合理的對照組)、重復(fù)(各試驗(yàn)條件下應(yīng)有足夠的樣本量,最好用特定的公式估算出來)和均衡原則選取和分配受試對象;(4)對一切重要非試驗(yàn)因素應(yīng)作合理安排和控制,特別是定量的非試驗(yàn)因素,從試驗(yàn)開始就必須記錄其在每個(gè)個(gè)體身上的具體取值;(5)選取合適的設(shè)計(jì)類型,安排多個(gè)試驗(yàn)因素;(6)注意整個(gè)試驗(yàn)過程和數(shù)據(jù)管理過程中的質(zhì)量控制;(7)在統(tǒng)計(jì)分析時(shí),盡可能利用更多的信息,采取相應(yīng)的統(tǒng)計(jì)方法消除混雜因素(如協(xié)方差分析等)對觀測結(jié)果的影響[4]。
3.1 違反均衡原則的案例 例2 某研究者欲研究參芪扶正注射液聯(lián)合化療治療惡性腫瘤的療效,選用2002年12月-2004年5月住院治療的惡性腫瘤病人86例,其中男性46例,女性40例;年齡26~69歲,平均年齡53歲;其中肺癌26例,大腸癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,惡性淋巴瘤4例。將86例病人隨機(jī)等分成A﹑B兩組,分別接受單純化療和參芪扶正注射液聯(lián)合化療兩種方法的治療,觀察相應(yīng)指標(biāo)的變化情況。
對差錯(cuò)的辨析與釋疑 以這個(gè)例子來分析一下哪些地方不符合均衡原則。(1)病情程度 原作者將病人隨機(jī)分成了兩組,每組43例,沒有說明是如何分組的,是否符合隨機(jī)化分組原則,也沒有告知每組中43例病人的病情輕重程度如何。原文中寫明的肺癌、大腸癌、鼻咽癌、乳腺癌、卵巢癌和惡性淋巴瘤,這6種腫瘤的5年存活率是不一樣的,也就是說這幾種腫瘤惡化的輕重程度不一樣。同一種治療方式,病情輕的療效肯定比病情重的療效好。如果兩組病人病情程度的構(gòu)成不一樣,假設(shè)一個(gè)組病情程度輕的病人所占比重大,另一個(gè)組病情程度重的病人所占比重大,即使最后得到兩組差異有統(tǒng)計(jì)學(xué)意義和實(shí)際意義,這個(gè)結(jié)論也是不可信的。(2)病程 病程這個(gè)非試驗(yàn)因素對治療效果一般是有影響的,通常病程越短,治療效果越好。原作者沒有說明病人的病程情況,也沒有說明這兩組病人的病程分布是否相同。如果分布不同,同樣的治療方式,最后的治療效果也是不一樣的。因此,即使統(tǒng)計(jì)學(xué)上得出差異有意義的結(jié)論,其結(jié)論也是不可信的。(3)年齡 原文中受試病人的年齡為26~69歲,年齡跨度大,通常年齡越小治療效果越好。原作者未說明兩組病人的年齡分布是否相同,如果分布不相同,其結(jié)論也是不可信的。正確的做法是采取必要的措施保證各組在重要的非試驗(yàn)因素方面(比如年齡、病程、病情等)達(dá)到均衡,以使各組之間具有可比性。
3.2 違反隨機(jī)和均衡原則的案例 例3 某研究者欲研究在對癥治療的基礎(chǔ)上加用小劑量干擾素及三氮唑核苷治療流行性乙型腦炎的療效,選擇某院收治的該病病人172例,均給予對癥治療。在對癥治療的基礎(chǔ)上,選擇發(fā)病在5 d以內(nèi)的病人(99例),加用小劑量干擾素及三氮唑核苷靜滴,發(fā)病在5 d以上的病人(73例)僅給予對癥治療,療程為5~7 d。比較兩種方法的療效差異。
對差錯(cuò)的辨析與釋疑 本例中試驗(yàn)因素只有“治療方法”一個(gè),但從文中看還有一個(gè)影響試驗(yàn)最終結(jié)果的重要的非試驗(yàn)因素,就是“病程的長短”。即便在相同的治療措施下,發(fā)病時(shí)間短的病人治療效果也會好于發(fā)病時(shí)間長的病人。原作者在進(jìn)行分組時(shí),將99例發(fā)病在5 d以內(nèi)的病人分為一組,將73例發(fā)病在5 d以上的病人分為一組,病程短的這組在對癥治療的基礎(chǔ)上加用小劑量干擾素及三氮唑核苷作為治療組,病程長的這組僅給予對癥治療作為對照組,這樣分組得出的最終結(jié)論是不可信的。原作者在最初的試驗(yàn)設(shè)計(jì)階段沒有很好地遵循試驗(yàn)設(shè)計(jì)的四個(gè)基本原則,違反了其中的隨機(jī)原則和均衡原則。
正確的做法應(yīng)該是采用分層隨機(jī)化的方法,使兩組病人在重要的非試驗(yàn)因素方面達(dá)到均衡,這樣才能使試驗(yàn)因素的效果真實(shí)地顯露出來。
3.3 違反對照和均衡原則的案例 例4 某作者研究支氣管哮喘小鼠肺液清除功能的變化及地塞米松的作用,選取雌性C57/BL6小鼠48只,6~8周齡,體重18~20 g,隨機(jī)分為對照組、哮喘組和地塞米松干預(yù)組。統(tǒng)計(jì)分析采用 t檢驗(yàn)比較組間差異[5]。
對差錯(cuò)的辨析與釋疑 本研究涉及兩個(gè)實(shí)驗(yàn)因素,一個(gè)因素是“是否建?!?另一個(gè)因素是“是否用藥干預(yù)”。每個(gè)因素均有兩個(gè)水平,兩個(gè)因素各水平全面組合,一共應(yīng)有4(2×2=4)種試驗(yàn)條件。研究者僅在3種實(shí)驗(yàn)條件下進(jìn)行了實(shí)驗(yàn),違反了對照原則,犯了對照不全的錯(cuò)誤,也就使整個(gè)實(shí)驗(yàn)的組間均衡性受到了嚴(yán)重的破壞。正確的做法應(yīng)在不建模的基礎(chǔ)上補(bǔ)做一組用地塞米松干預(yù)的實(shí)驗(yàn),這樣形成兩因素析因設(shè)計(jì),可以通過兩因素析因設(shè)計(jì)一元定量資料方差分析得到正確的分析結(jié)果和結(jié)論。
3.4 違反重復(fù)和均衡原則的案例 例5 某研究者研究丁酸氫化可的松軟膏對不同種類的皮炎及濕疹的療效,隨機(jī)從門診選擇160例皮炎、濕疹病人,男性94例,女性66例;年齡最大72歲,最小1歲,平均年齡(28.53±3.67)歲;病程1~10年不等,平均(18.61±7.86)個(gè)月。其中急性濕疹15例、亞急性濕疹35例、慢性濕疹32例、神經(jīng)性皮炎55例、接觸性皮炎5例、蟲咬皮炎18例[6]。
對差錯(cuò)的辨析與釋疑 原文作者按不同種類的皮炎和濕疹分成6組,考察丁酸氫化可的松軟膏對這6種皮炎和濕疹的治療效果。從文中可以看出這6組的樣本例數(shù)差異較大,病人最少的組只有5例,最多的組有55例,最多例數(shù)組樣本量是最少例數(shù)組樣本量的11倍。這6組間在病人例數(shù)方面違反了重復(fù)原則和均衡原則。急性濕疹組、接觸性皮炎組、蟲咬皮炎組病人例數(shù)分別只有15例、5例和18例,樣本量太小,所產(chǎn)生的治療效果的結(jié)論不是很可靠。正確的做法是增大各組的樣本含量,并使各組的樣本含量大體一致,這樣得出的最終結(jié)論才令人信服。另外,病人的年齡、病程也都相差懸殊,很難保證它們在6組間均衡。這也是導(dǎo)致結(jié)論不可信的重要原因。
3.5 重要的非試驗(yàn)因素不均衡的案例 例6 某作者研究了生長抑素和后葉加壓素對食管曲張靜脈破裂出血(esophageal variceal bleading,EVB)的治療效果,選擇1991年以來住院的病人220例,其中生長抑素治療組120例,男83例,女37例,年齡36~76歲,平均(49.5±6.3)歲,其中肝硬化合并EVB 94例,肝癌合并 EVB 26例;后葉加壓素治療組100例,男79例,女21例,年齡38~81歲,平均(46.5±9.4)歲,其中肝硬化合并 EVB 83例,肝癌合并EVB 17例[7]。
對差錯(cuò)的辨析與釋疑 本例中兩組病人的年齡跨度大,需要注意兩組病人年齡分布是否相同。經(jīng)分析,兩組病人年齡差異有統(tǒng)計(jì)學(xué)意義(P= 0.005 3)。既然兩組病人平均年齡不同,那么如果年齡這個(gè)非試驗(yàn)因素對試驗(yàn)結(jié)果有影響,如年輕病人治療效果好,年長病人治療效果差,這種情況下得到的最終結(jié)論是不可信的。
正確的做法是:(1)采取必要的措施保證兩組在重要的非試驗(yàn)因素方面(比如年齡)達(dá)到均衡,以使兩組之間具有可比性。(2)如果采取了必要的措施(如分層隨機(jī)化)后,某些定量的重要非試驗(yàn)因素(如本例中年齡)仍然不能達(dá)到均衡,可以在統(tǒng)計(jì)分析時(shí)將其作為協(xié)變量,采用諸如協(xié)方差分析等方法,以扣除它們對觀測結(jié)果的影響。
[1] 胡良平.科研課題的研究設(shè)計(jì)與統(tǒng)計(jì)分析(第二集)[M].北京:軍事醫(yī)學(xué)科學(xué)出版社,2010:23-24.
Hu LiangPing.Design and statistical analysis of scientific research topics(Second set)[M].Beijing:Military Medical Sciences Press,2010:23-24.Chinese.
[2] 袁曉琴,曹克升,秦為群.蘭索拉唑與法莫替丁治療反流性食管炎療效的比較[J].藥學(xué)服務(wù)與研究,2002,2(2):99-101.
Yuan XiaoQin,Cao KeSheng,Qin WeiQun.Comparison of efficacy of lansoprazole and famotidine in treatment of patients with reflux esophagitis[J].Pharm Care Res,2002,2(2): 99-101.Chinese with title in English.
[3] 胡良平.檢驗(yàn)醫(yī)學(xué)科研設(shè)計(jì)與統(tǒng)計(jì)分析[M].北京:人民軍醫(yī)出版社,2004:14-18.
Hu LiangPing.Scientific research design and statistical analysis in laboratory medicine[M].Beijing:People’s Military Surgeon Press,2004:14-18.Chinese.
[4] 胡良平,陶麗新,毛 瑋,等.如何正確把握試驗(yàn)設(shè)計(jì)中的均衡原則[J].中國骨傷,2009,22(8):638-641.
Hu LiangPing,Tao LiXin,Mao Wei,et al.How to grasp the balance principle in experiment design[J].China J Orthop Traumatol,2009,22(8):638-641.Chinese.
[5] 董春玲,魯繼榮,王桂芳,等.地塞米松對哮喘小鼠肺液清除功能障礙的作用[J].藥學(xué)服務(wù)與研究,2008,8(1):24-27.
Dong ChunLing,Lu JiRong,Wang GuiFang,et al.Effects of dexamethasone on alveolar fluid clearance in mouse asthma models[J].Pharm Care Res,2008,8(1):24-27.Chinese with title in English.
[6] 王宗明.丁酸氫化可的松軟膏治療皮炎濕疹的療效觀察[J].藥學(xué)服務(wù)與研究,2003,3(3):193-194.
Wang ZongMing.Curative effect of hydrocortisone butyrate cream in treatment of chronic cezema[J].Pharm Care Res, 2003,3(3):193-194.Chinese with title in English.
[7] 姚定康,謝渭芬,張忠兵,等.生長抑素和后葉加壓素治療食管曲張靜脈破裂出血的結(jié)果比較[J].藥學(xué)服務(wù)與研究,2001,1 (1):37-39.
Yao DingKang,Xie WeiFen,Zhang ZhongBing,et al.Clinical parallel study of somatostatin and vasopressin in treatment of patients with esophageal variceal bleeding[J].Pharm Care Res,2001,1(1):37-39.Chinese with title in English.