林容基,陳 薇,黃志新,蔡瑞初
(1.廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 廣東 廣州 510006;2.廣東省第二人民醫(yī)院 神經(jīng)內(nèi)科, 廣東 廣州 510317)
在觀察性研究中,推斷某藥物對(duì)患者預(yù)后情況的因果效應(yīng)是一項(xiàng)常見而重要的課題。然而,在實(shí)際應(yīng)用中,觀察性數(shù)據(jù)中常伴隨著未觀測(cè)到的混雜變量,導(dǎo)致觀察到的相關(guān)性往往不僅由因果關(guān)系引起,還受其他因素的干擾。因此,未觀測(cè)到的混雜變量需要被特別考慮。當(dāng)未觀測(cè)變量對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生直接或間接的影響時(shí),準(zhǔn)確估計(jì)因果效應(yīng)將變得復(fù)雜。例如,在試圖估計(jì)藥物治療效果的觀察性研究中,藥物的分配方式受多種因素影響,其中一些因素(如社會(huì)經(jīng)濟(jì)地位)難以量化,成為無法觀測(cè)的混雜因素。盡管隨機(jī)對(duì)照試驗(yàn)是推斷因果關(guān)系和計(jì)算因果效應(yīng)的最有效方法,但其成本昂貴,時(shí)間消耗較大,且在倫理道德方面存在限制,因此觀察性數(shù)據(jù)研究在研究變量之間的因果效應(yīng)方面成為一種常見的替代方法。
目前,用于估計(jì)觀察性數(shù)據(jù)中變量之間的因果效應(yīng)的方法[1]包括但不限于以下幾種:首先,基于分層[2]的方法,通過將研究群體根據(jù)混雜因素分層為不同子群,計(jì)算每個(gè)子群的平均效應(yīng);其次,基于擬群思想的方法,例如重加權(quán)方法[3]、匹配方法[4]、基于樹的方法[5]、表征學(xué)習(xí)方法[6]和多任務(wù)學(xué)習(xí)方法[7]等;第三,采用僅基于觀察性數(shù)據(jù)訓(xùn)練的潛在結(jié)果估計(jì)模型,然后校正由于選擇偏差引起的估計(jì)誤差,例如元學(xué)習(xí)方法[8]。然而,這些方法通常建立在無混淆假設(shè)上,即所有的混雜因素得到充分測(cè)量和控制,這在實(shí)際應(yīng)用中往往難以實(shí)現(xiàn)。
處理未觀測(cè)混雜因素的方法有2種:一是當(dāng)偏差較小或可承受有偏、非一致性估計(jì)量的后果,可以選擇忽略這些因素;二是在利用大規(guī)模數(shù)據(jù)時(shí),采用代理變量來取代這些未觀測(cè)的混雜因素。然而,當(dāng)偏差無法忽略且難以找到合適的代理變量時(shí),工具變量分析方法[9]成為一種值得考慮的選擇。
工具變量(Instrumental Variables,IV)分析提供了一種繞過無混淆假設(shè)進(jìn)行因果推斷的方法,特別在流行病學(xué)研究中變得越來越普遍[10-11]。在臨床試驗(yàn)數(shù)據(jù)中,通常缺乏與所研究的解釋因素相關(guān)的混雜因素信息,從而在計(jì)算解釋因素與預(yù)后結(jié)果之間的關(guān)系時(shí)會(huì)出現(xiàn)較大的偏差。而工具變量是可觀測(cè)的變量,用于預(yù)測(cè)解釋變量,但不直接或間接影響結(jié)果變量,并且與混雜變量獨(dú)立。通常情況下,找到合適的工具變量具有挑戰(zhàn)性,但如果找到了適當(dāng)?shù)墓ぞ咦兞?,便可以得到更加無偏或接近真實(shí)值的結(jié)果。在流行病學(xué)背景下,醫(yī)生的處方偏好可以作為工具變量來評(píng)估藥物效果[12],與感興趣的暴露變量相關(guān)的基因序列也可以作為工具變量[13],后者叫做孟德爾隨機(jī)化[14]。工具變量的方法可以顯著減少由于未觀測(cè)混雜因素引起的偏差,在一定程度上解決混雜因素導(dǎo)致的偽關(guān)聯(lián)問題。盡管該方法仍需要進(jìn)一步完善,但它可以成為實(shí)驗(yàn)分析的有力工具之一。
本文運(yùn)用工具變量法在急性缺血性卒中患者數(shù)據(jù)中進(jìn)行了丁苯酞藥物療效的因果效應(yīng)分析,并得出經(jīng)校正后的因果效應(yīng)。
在回歸模型中,當(dāng)解釋變量與誤差項(xiàng)之間存在相關(guān)性時(shí),工具變量法可以用來獲得一致的估計(jì)量。這種方法的基本思想是引入一個(gè)額外的變量,稱為工具變量,它與解釋變量相關(guān),但不與結(jié)果變量直接或間接相關(guān),且僅通過解釋變量影響結(jié)果變量。通過工具變量,就可以在觀察數(shù)據(jù)中估計(jì)或確定解釋變量對(duì)結(jié)果變量的因果效應(yīng),但為了得到可靠的結(jié)果,必須滿足一些必要的假設(shè)[15]。
在本文中,用變量X表示實(shí)際接受的治療(1表示用藥,0表示不用藥),變量Y表示結(jié)局事件(1表示康復(fù),0表示未康復(fù)),變量Z表示隨機(jī)分配指標(biāo)(1表示分配到用藥組,0表示分配到對(duì)照組)??梢杂^察到變量Z只與變量X相關(guān),且不與結(jié)局事件直接或間接相關(guān),因此變量Z為工具變量。變量U表示同時(shí)影響變量X和變量Y的所有變量的集合,即混雜變量。對(duì)于變量Z,必須滿足以下3個(gè)基本假設(shè)(通常被稱為3大基本假設(shè)):(i)Z與X相關(guān);(ii)Z與U獨(dú)立;(iii) 在給定X和U情況下,Z與Y獨(dú)立。工具變量模型如圖1所示。
圖1 工具變量模型Fig.1 The model of instrumental variables
需要注意的是, 在工具變量的3大基本假設(shè)中,只有假設(shè)(i)是可驗(yàn)證的,它涉及到Z與X之間的直接相關(guān)性。只需證明Z跟X存在相關(guān)性,即E[X=1|Z=1]-E[X=1|Z=0]為正。假設(shè)(ii)和假設(shè)(iii)通常只能被假設(shè)為成立,它們涉及到Z與U之間的關(guān)系,這些關(guān)系往往是不可驗(yàn)證的。因此,工具變量方法在應(yīng)用時(shí)需要謹(jǐn)慎考慮這些假設(shè)的合理性。
工具變量分析采用雙階最小二乘法來擬合線性模型以估計(jì)因果效應(yīng)。在此模型中,自變量表示為X,個(gè)體i是否接受治療為Xi。 因變量為Yi,假定研究中有n個(gè)個(gè)體,下面的線性模型被用于描述X與Y之間的關(guān)系:
式中:i=1,···,n。
假定Xi是 隨機(jī)的,而式(1)中的εi需符合以下最基本的假定:
式(3)中的協(xié)方差為零的假設(shè)通常被稱為“外生性”假定。在這一假定下,關(guān)于Xi取式(1)兩邊的協(xié)方差,得到
上述估計(jì)通常是最小二乘的解,如果將式(1)看作一個(gè)數(shù)據(jù)生成的機(jī)制,在式(2)、(3)的假定下,便可以估計(jì)出因果效應(yīng)β。
問題的關(guān)鍵在于,式(3)往往不成立,即cov(Xi,εi)≠0。例如,如果患者對(duì)自身的預(yù)后期望良好,那么更有可能選擇不接受治療。因此,包含個(gè)體i的其他所有隱藏信息的變量 εi不再與Xi不相關(guān)。這種情況下,最小二乘的估計(jì)值收斂到β +cov(X,ε)/var(Xi)。
此時(shí),引入工具變量Zi。因?yàn)閆i的隨機(jī)性,可以假定cov(Zi,εi)=0。而由于X和Y之間存在混雜因素U,兩者之間的因果作用是不可以用線性回歸相合估計(jì)的。工具變量Z的存在,使得X到Y(jié)的因果作用的識(shí)別成為了可能。
此時(shí),在線性模型式(1)兩邊關(guān)于Zi取協(xié)方差,得到
給定x,y和z的樣本數(shù)據(jù),便可以得到式(6)中的IV估計(jì)量。式(1)中 α^ 的 IV估計(jì)量即為:α ^ =y-^βx。當(dāng)變量X,Y,Z都為二值時(shí),可以采用Wald估計(jì)法,將式(6)化簡為
式中:YX=1和YX=0分別代表治療變量X取值1和0時(shí),觀察到的結(jié)局變量Y。
式(7)中的分子表示Z對(duì)Y的影響,也被稱為治療意向效應(yīng);而分母表示Z對(duì)X的影響,表示被試個(gè)體的配合程度。如果被試個(gè)體完全配合研究人員,那么分母等于1,X對(duì)Y的影響就等于Z對(duì)Y的影響。如果配合程度較低,分母就會(huì)趨近于0,從而X對(duì)Y的影響大于Z對(duì)Y的影響。
當(dāng)實(shí)際情況中治療變量x與混雜因素u相關(guān)時(shí),用工具變量進(jìn)行估計(jì)實(shí)質(zhì)上不是無偏的。在小樣本情況下,工具變量估計(jì)量可能存在相當(dāng)大的偏差,這就是為什么希望有大樣本的一個(gè)原因。
為了對(duì)效應(yīng) β進(jìn)行推斷,需要一個(gè)可用于計(jì)算t統(tǒng)計(jì)量和置信區(qū)間的標(biāo)準(zhǔn)誤差,通常的做法是引入同方差性假設(shè),這類似于普通最小二乘法(Ordinary Least Squares, OLS)情況下的處理方式。然而,同方差性假設(shè)現(xiàn)在是基于工具變量z,而不是基于內(nèi)生解釋變量x來表述的。除了前述關(guān)于u、x和z的假設(shè),還需要增加以下條件:
σ2的一致估計(jì)量的形式類似簡單OLS回歸中得到的σ2估計(jì)量:
實(shí)驗(yàn)覆蓋了2019年9月至2020年6月期間在卒中中心連續(xù)住院的123名急性缺血性卒中患者。數(shù)據(jù)集包括了基線人口統(tǒng)計(jì)學(xué)、臨床和實(shí)驗(yàn)信息。該研究的主要結(jié)果是評(píng)估患者在接受治療后的3個(gè)月內(nèi)是否具有良好的預(yù)后,其中主要是使用改良Rankin量表(mRS)評(píng)分進(jìn)行評(píng)估。當(dāng)患者的評(píng)分小于等于2分時(shí),被視為預(yù)后良好(記為1)。當(dāng)患者的評(píng)分大于2時(shí)被視為預(yù)后不良好(記為0)。需要強(qiáng)調(diào)的是,數(shù)據(jù)集中包括了患者按理論安排的用藥情況,丁苯酞對(duì)腦卒中患者來說并非指南推薦的治療藥物,故這種安排是隨機(jī)的并符合倫理原則。同時(shí),數(shù)據(jù)集還記錄了患者實(shí)際用藥(通過定期回訪形式獲得相關(guān)信息)以及最終的預(yù)后結(jié)果。
為了評(píng)估丁苯酞對(duì)急性缺血性卒中是否具有治療效果,本文采用風(fēng)險(xiǎn)差(Risk Difference,RD)來衡量治療效應(yīng)[17]。在Wald估計(jì)方法中,最小二乘法計(jì)算的因果效應(yīng)估計(jì)也可以被稱為風(fēng)險(xiǎn)差估計(jì)[18]。風(fēng)險(xiǎn)差是干預(yù)組和對(duì)照組在解決事件發(fā)生概率上的絕對(duì)差值,也被稱為歸因危險(xiǎn)度(Attributable Risk,AR)、絕對(duì)風(fēng)險(xiǎn)差(Absolute Risk Difference, ARD)和絕對(duì)風(fēng)險(xiǎn)降低率(Absolute Risk Reduction, ARR)。它反映了干預(yù)組中由于干預(yù)因素導(dǎo)致的凈結(jié)局事件水平(從干預(yù)組角度考慮)。當(dāng)風(fēng)險(xiǎn)差等于零時(shí),表示兩組之間沒有差異。如果研究結(jié)局為不利事件時(shí),當(dāng)風(fēng)險(xiǎn)差小于零時(shí),表示干預(yù)可以降低結(jié)局風(fēng)險(xiǎn)。風(fēng)險(xiǎn)差異的計(jì)算方式如下所示。
在表1的分組情況下,風(fēng)險(xiǎn)差異的點(diǎn)估計(jì)RD為
表1 實(shí)驗(yàn)數(shù)據(jù)分組情況Table 1 The grouping of experimental data
風(fēng)險(xiǎn)差異RD的抽樣分布近似正態(tài)分布,具有標(biāo)準(zhǔn)誤差SE:
式中:Z?為所選顯著性水平的標(biāo)準(zhǔn)分?jǐn)?shù)。
根據(jù)風(fēng)險(xiǎn)差的定義,可以直接計(jì)算未經(jīng)任何調(diào)整的風(fēng)險(xiǎn)差,即計(jì)算干預(yù)組和對(duì)照組結(jié)局事件發(fā)生概率上的絕對(duì)差值。然而,由于數(shù)據(jù)集不是隨機(jī)分配試驗(yàn),患者實(shí)際接受的治療(是否用藥)取決于患者個(gè)體的決策。例如,選擇不用藥的患者可能對(duì)自身的預(yù)后有更樂觀的態(tài)度,這間接地促進(jìn)了良好預(yù)后的發(fā)生。這意味著數(shù)據(jù)中存在未觀測(cè)到的混雜變量(數(shù)據(jù)集中并無衡量心理等因素相關(guān)的指標(biāo)),且無法度量這些混雜變量。直接計(jì)算的效應(yīng)將因此存在偏差,
本研究發(fā)現(xiàn),理論用藥滿足工具變量的相關(guān)定義,因此,本文采用了工具變量來估計(jì)藥效,并將未調(diào)整的藥效估計(jì)、意向性分析(Intention-To-Treat Populaition, ITT)與工具變量估計(jì)進(jìn)行了比較。下文將討論該數(shù)據(jù)集在工具變量的假設(shè)下進(jìn)行的藥效估計(jì)。
本實(shí)驗(yàn)的數(shù)據(jù)集滿足IV三大基本假設(shè):Z表示治療分配,X表示實(shí)際接受的治療,Y表示結(jié)局事件。醫(yī)生為患者提供的治療方案對(duì)患者最終是否接受用藥有一定的指導(dǎo)作用,即實(shí)際接受的治療X受治療分配Z的影響,但是不完全由Z決定,同時(shí)計(jì)算可得E[X=1|Z=1]-E[X=1|Z=0]為正。由此可得,假設(shè)(i)成立;由于治療分配Z是隨機(jī)的,因此假設(shè)(ii)治療分配Z與結(jié)局事件Y獨(dú)立在理論上也是成立的。在給定實(shí)際接受的治療X和混雜因素集合U的情況下,治療分配Z獨(dú)立,所以假設(shè)(iii)理論上也成立。
由表2可見,在治療分配后實(shí)際接受治療的預(yù)后情況比僅僅根據(jù)治療分配決定的預(yù)后情況更加樂觀。這種差異很可能是由混淆因素U引起的,這也在一定程度上說明了在試圖直接估計(jì)治療X對(duì)結(jié)局Y的效應(yīng)時(shí),混雜因素的影響會(huì)導(dǎo)致結(jié)果出現(xiàn)偏差。
表2 隨機(jī)治療分配下實(shí)際接受治療的預(yù)后情況1)Table 2 Prognosis of actual treatment received under the randomized treatment assignment
當(dāng)患者由于一些與結(jié)局Y相關(guān)的原因U而不遵守分配時(shí),即X≠Z,混雜因素U將會(huì)對(duì)結(jié)果產(chǎn)生偏差,這稱為有偏差的治療選擇。例如,那些遵守醫(yī)生的治療分配(接受治療)的患者更可能自身狀況較差,因此即使接受治療,康復(fù)率也較低。在這種情況下,通過計(jì)算所有接受治療的患者的康復(fù)率來估計(jì)治療效應(yīng),將與那些遵守治療方案的患者混淆,因?yàn)橥ǔ碚f,遵守治療方案的患者的身體狀況較差。
這些問題引發(fā)了ITT[19]這類方法的需求。這一方法的主要目的是保持兩組之間的基線特征均衡可比,通過隨機(jī)化,將除了研究因素外的其他變量完全均衡和匹配,以便更好地觀察干預(yù)結(jié)果。具體而言,如果某患者被隨機(jī)分配到A組,那么在意向性分析中,該患者的數(shù)據(jù)必須始終與A組相關(guān),即使在治療過程中途退出,或者轉(zhuǎn)到B組接受其他治療,或者根本沒有接受任何治療。即僅根據(jù)治療分配來測(cè)試和估計(jì)效果,而不考慮實(shí)際接受的治療。然而,這種方法的批評(píng)者指出,實(shí)際接受的治療才是生物療效的來源,而與實(shí)際接受的治療相比,所分配的治療存在偏差,這種偏差不等于0。因此,IV方法提供了一種代替意向性分析這種有較大偏差的極端方法,即將治療分配Z作為一種工具來調(diào)整傳統(tǒng)方式分析接受的治療X對(duì)結(jié)局Y的影響。
本文分析了123位腦卒中患者在用藥組及對(duì)照組下的數(shù)據(jù)集特征,結(jié)果見表3。所選變量均為二值型,包括ASPECT評(píng)分、第14天NIHSS評(píng)分和mRS評(píng)分,當(dāng)ASPECT評(píng)分小于7分、NIHSS14小于3分、mRS小于等于2分時(shí),在各個(gè)指標(biāo)的劃分標(biāo)準(zhǔn)下預(yù)后表現(xiàn)為良好,根據(jù)該標(biāo)準(zhǔn)將其轉(zhuǎn)換為二值型。同時(shí),統(tǒng)計(jì)了臨床上常見的各特征下的人數(shù)及占比,如表3所示。
表3 病人特征Table 3 The characteristics of patients
表4則展示了在協(xié)變量為二分類的情況下,患者的風(fēng)險(xiǎn)差異數(shù)值。本文定義95%置信區(qū)間不包含0值時(shí)具有較強(qiáng)的關(guān)聯(lián)性。實(shí)際用藥與數(shù)據(jù)集測(cè)量的其他特征,如吸煙史和房顫,表現(xiàn)出較強(qiáng)的關(guān)聯(lián)性。然而,在工具變量的調(diào)整下(表4中第3列),這些關(guān)聯(lián)性被減弱了。暗示著原本這些特征具有的較強(qiáng)關(guān)聯(lián)性可能是在未觀測(cè)變量的影響下表現(xiàn)出的偽關(guān)聯(lián),這在計(jì)算最終的因果效應(yīng)時(shí)會(huì)帶來偏差,而工具變量可以在一定程度上調(diào)整協(xié)變量帶來的偏差。
表4 實(shí)際用藥跟工具變量調(diào)整下治療與協(xié)變量的相關(guān)性Table 4 Correlations between treatment and covariates adjusted by using actual drug and instrumental variables
表5展示了未經(jīng)調(diào)整的估計(jì)、ITT估計(jì)和IV估計(jì)的風(fēng)險(xiǎn)差異及置信區(qū)間比較。未經(jīng)調(diào)整的估計(jì)及ITT估計(jì)是根據(jù)標(biāo)準(zhǔn)的風(fēng)險(xiǎn)差異計(jì)算的,而IV估計(jì)則根據(jù)工具變量的定義計(jì)算風(fēng)險(xiǎn)差異及置信區(qū)間。在3組實(shí)驗(yàn)分析中,是否用藥與最終的恢復(fù)都呈正相關(guān)。這表明用藥對(duì)預(yù)后結(jié)果產(chǎn)生一定的積極影響,盡管需要注意到置信區(qū)間的范圍。
表5 風(fēng)險(xiǎn)差異及置信區(qū)間比較Table 5 Comparison of risk differences and confidence intervals
本文提出了工具變量分析方法,分析丁苯酞-急性缺血性卒中問題,調(diào)整未觀測(cè)混雜變量對(duì)結(jié)局變量的影響,得到了更為無偏的因果效應(yīng)估計(jì)。在實(shí)際數(shù)據(jù)集中的應(yīng)用表明,這一方法在處理未觀測(cè)混雜變量問題時(shí)可以一定程度上修正未觀測(cè)混雜變量對(duì)結(jié)局變量帶來的誤差,在臨床醫(yī)學(xué)藥效分析領(lǐng)域具有可行性。在對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行未調(diào)整的風(fēng)險(xiǎn)差異估計(jì)后,本文對(duì)其他變量進(jìn)行了均衡的意向性分析的風(fēng)險(xiǎn)差異估計(jì),最后進(jìn)行了工具變量分析的風(fēng)險(xiǎn)差異估計(jì)。研究發(fā)現(xiàn),這些分析顯示出藥效的估計(jì)呈現(xiàn)趨勢(shì)性的正值,暗示藥物可能對(duì)預(yù)后產(chǎn)生一定的積極作用,這為藥效分析提供了有益的參考。
然而,工具變量分析也存在一些局限性。首先,即使數(shù)據(jù)量足夠大,工具變量仍需要基于模型假設(shè)。其次,稍微違反假設(shè)(i)至(iii)可能會(huì)導(dǎo)致不可預(yù)測(cè)的極大偏移。第三,能夠使用工具變量的理想情形相較于其他傳統(tǒng)的方法更為罕見[20]。
在使用工具變量時(shí),強(qiáng)烈建議慎重考慮模型假設(shè),并進(jìn)行敏感性分析以評(píng)估結(jié)果的穩(wěn)健性。此外,為了更全面地理解工具變量的適用性,未來的研究可以進(jìn)一步探討工具變量假設(shè)的合理性,并拓展研究對(duì)象以驗(yàn)證方法的普適性。這將有助于深入理解藥效與預(yù)后之間的關(guān)系,為臨床實(shí)踐提供更有針對(duì)性的指導(dǎo)。