(二)局部近似隨機化思想
值得注意的是,斷點兩側的研究對象總體上存在差異,但RD主要關注的是臨界值附近的可比性,越接近臨界值時,兩側差異就越小。因此,可以通過比較斷點左側和右側某個區(qū)間內結果之間的平均差異來衡量因果效應。在這個區(qū)間內,兩側差異可以忽略,類似于RCT中的隨機化,但僅限于臨界值附近的區(qū)域,這個區(qū)域定義為帶寬b。這就是RD的局部近似隨機化思想。
二、RD的應用
(一)SRD的推理
當干預變量t完全依賴于分配變量x,假設xi小于斷點c時,ti=0,xi大于斷點c時,ti=1,對應的結果變量t分別為yi(0)和yi(1)。
RCT通過平均因果效應(average casual effect,ACE)來估計因果效應。在SRD中,考慮到局部近似隨機化,在帶寬b內可以計算干預效應(treatment effect)[18]:
①
也可以表示為斷點兩側差值的期望值:
ACESRD=E[yi(1)-yi(0)|xi=c]
②
在實踐中估計ACESRD時,允許斷點兩側斜率不同,常用的線性模型如下所示:
yi=β0+β1ti+β2(xi-c)+β3ti(xi-c)
③
公式③中,ti=1表示接受干預,β1即為ACESRD,β2即為沒有干預時的斜率,β3為分配變量與干預變量交互項的系數(shù),允許斷點兩側有不同的斜率。模型中還可以納入高階項和其他協(xié)變量。
(二)FRD的推理
FRD類似于依從性不完全的RCT,是否干預并不完全依賴于分配變量。分配變量未超過臨界值時,有一定概率存在干預,當分配變量超過臨界值時,接受干預的概率發(fā)生改變。
參考SRD中干預效應的計算公式,在FRD中,ACESRD被定義為意向治療(intent-to-treat,ITT)效應,即為ITTFRD。由于是否干預只有一定的概率受到分配變量的控制,還受到其他因素的影響,只有部分依從了分配變量的分配,即為“依從者(complier)”,因此,其干預效應可稱作“依從者平均因果效應(complier average causal effect,CACEFRD)”[18],計算公式為:
④
即為:
在公式④中,當分母等于1時,干預完全由分配變量決定,此時即為SRD。當分母等于0時,即臨界值兩側干預概率沒有改變時CACEFRD是無意義的,也就無法構成RD。
在實際應用中,FRD可以使用與SRD相同的回歸模型,一般可以用兩階段最小二乘法來完成[18]。
(三)RD應用步驟
1.判斷是否存在斷點:繪制結果變量y與分配變量x之間的散點圖,觀察y是否在斷點處發(fā)生改變。圖1為采用模擬數(shù)據,應用Stata軟件繪制。設置x(0,1)為分配變量,設置斷點c為0.5,t為干預變量,設置協(xié)變量z。結局變量y設置為:
注 圖1A為不存在斷點時的分配變量x與結局變量y間的散點圖;圖1B為干預變量t受到分配變量x控制,存在斷點時,分配變量x與結局變量y間的散點圖
y=3t+12t(x-0.5)+6(x-0.5)+3z+2
如圖1A所示,當t始終為0,即干預變量不存在時,無斷點。而當t受到x值分配時(x<0.5t=0,x≥0.5t=1),存在斷點,如圖1B所示。
由圖1B可以看出,當樣本量較大時,散點圖可能不夠直觀,不易觀察到跳躍現(xiàn)象。因此,可以如圖2B所示添加擬合線,通過觀察兩側擬合線的差異來推測是否有跳躍發(fā)生。在實際應用中,還可以添加更高階的擬合線以觀察斷點處的變化。
注 圖2A同圖1B,為存在斷點時分配變量x與結局變量y間的散點圖;圖2B表示分配變量x與結局變量y間添加擬合線的散點圖
2.判斷RD的類型:根據斷點處干預概率的改變,判斷該研究屬于SRD或FRD??赏ㄟ^專業(yè)知識,根據分配變量與干預變量之間的邏輯關系進行判斷,也可結合分配變量x與干預變量t之間的散點圖進行判斷。
3.建立模型進行因果效應估計:既可以僅使用接近臨界值的數(shù)據,即帶寬內的數(shù)據,進行局部線性回歸,也可以使用完整的數(shù)據集建立回歸模型。在實際應用中,一般會同時采納兩種方法。使用局部線性回歸時,統(tǒng)計學軟件可提供最佳帶寬。當使用完整的數(shù)據集時,可以將高次多項的模型與簡單的線性模型進行比較。
干預效應的局部線性估計結果理論上可以分為4種情形[1]。圖3為應用Stata軟件中的rdcv包進行局部線性回歸繪制。
注 圖3A表示不存在斷點的情形;圖3B表示結局變量y在斷點處跳躍且干預變量t與分配變量x存在交互作用的情形;圖3C為存在斷點,結局變量y在斷點處跳躍的情形;圖3D表示結局變量y未發(fā)生跳躍但干預變量t與分配變量x存在交互作用的情形
第一種如圖3A,沒有明顯的干預效果,干預措施t與結果變量y之間可能沒有因果效應。圖3C顯示了RD的基本思想,只有一個主要的干預效果,在斷點處有明顯跳躍。圖3D從斷點兩側的回歸線斜率變化中可以看出干預變量t與分配變量x的交互作用效應是明顯的,這意味著在干預組中,干預效果隨著分配變量高于臨界值的增加而增加,但斷點處未發(fā)生明顯的跳躍。圖3B是圖3C和圖3D的組合,交互效應和干預效果同時存在。
三、公共衛(wèi)生領域RD應用現(xiàn)狀
RD作為干預效應推斷的常用方法,在公共衛(wèi)生領域的應用逐漸增多,尤其是空氣質量的影響因素及相關政策的干預效果,以及疫苗有效性等方面。新型冠狀病毒感染暴發(fā)以來,RD也越來越多地應用于探究疫情給公眾健康和個人行為帶來的影響。
(一)空氣質量研究
RD常用于探索各種政策、制度對空氣質量的改善情況。例如,在一項探索環(huán)境治理改善空氣質量的研究中,Jiang等[19]應用RD發(fā)現(xiàn),中國政府實行的“藍天保衛(wèi)戰(zhàn)三年行動計劃”有效改善了空氣質量,這一研究結論為發(fā)展中國家制定切實可行的環(huán)境污染控制政策提供了新的思路。RD在探索相關政策對能源消費、環(huán)境支出與空氣質量關系的影響時也十分適用[8-9]。Zhang等[20]以中國北京和天津地區(qū)為例探索“機動車限行”對空氣質量的影響,RD發(fā)現(xiàn)限行主要是減少了汽車尾氣排放,對空氣污染的改善是有限的。另一項以中國北京、天津、河北(京津冀)地區(qū)為例的研究應用RD發(fā)現(xiàn)“聯(lián)防聯(lián)控”區(qū)域的擴大有利于空氣質量的改善[21]。
此外,在探索空氣質量、空氣污染對公眾健康和個人行為產生的影響時,RD也是常用的方法之一。加拿大多倫多的一項研究應用RD探究了空氣質量警報計劃對人群健康的影響,發(fā)現(xiàn)采用這項計劃可能會促進一些呼吸道疾病發(fā)病率的降低[22]。Fan等[23]應用RD估計了冬季燃煤供暖對空氣污染和公眾健康的影響,發(fā)現(xiàn)燃煤供暖會排放大量空氣污染物,空氣質量指數(shù)升高,人群死亡率也有所增高。
RD既可探究空氣質量對人群健康的影響,又可分析各項政策對空氣污染的改善程度,進而有助于公共衛(wèi)生政策的制定與實施,對于空氣質量的改善具有一定意義。
(二)疫苗有效性評價
公共衛(wèi)生領域中,流行病學專家們的一個重要目標是評估疾病的預防和控制策略,包括疫苗和疫苗接種計劃的影響。RD可以靈活運用于疫苗保護效果評價,尤其是臨床試驗難以進行或無法進行的研究[10,24]。
有學者以人乳頭瘤病毒疫苗接種計劃為案例,對RD評估疫苗有效性的因果推斷能力進行了研究[25]。在一項應用幾種準實驗方法評價新型冠狀病毒感染疫苗效果研究中,發(fā)現(xiàn)RD等準實驗方法可能會提供更準確的新型冠狀病毒感染疫苗有效性估計[26]。RD還可應用于對疫苗帶來的其他影響的估計。一項應用RD的觀察性研究發(fā)現(xiàn),以老年人為重點的流感疫苗接種策略對于降低老年人群的發(fā)病率和死亡率的干預效果可能十分有限[27]。
綜上,疫苗接種是重要的公共衛(wèi)生干預措施之一,RD應用于量化疫苗效力和針對特定疾病的有效性具有重要的公共衛(wèi)生意義。
在現(xiàn)代社會的新形勢下,森林保護工作的重要性不言而喻。面對森林保護所帶來的巨大利益,我們更應該堅定信心,努力做好森林保護工作,讓森林發(fā)揮出巨大的作用。并且我們還要隨時關注森林保護過程中存在的問題,并且要對這些問題提出相應的解決措施,還要注意讓森林保護工作落到實處,真正的為我國的環(huán)境保護做出相應的貢獻。
(三)新型冠狀病毒感染研究
新型冠狀病毒感染疫情在全球流行以來,各個國家、地區(qū)采取各種措施以應對疫情流行,包括居家隔離、佩戴口罩、保持社交距離等,在時間序列上自然構成了斷點。因此,許多國內外學者應用RD來探究新型冠狀病毒感染及相關防控措施帶來的影響。
Brodeur等[11]和Bakolis等[28]應用RD發(fā)現(xiàn)新型冠狀病毒感染疫情期間城市封鎖等措施可能會對人群心理健康產生影響。而有些學者則應用RD探究了新型冠狀病毒感染疫情期間不同地區(qū)的空氣質量變化[12-13],新型冠狀病毒感染以外其他疾病的發(fā)病率和死亡率的變化等[29]。此外,RD還可應用于探究新型冠狀病毒感染疫情期間健康需求和醫(yī)療服務是否發(fā)生了改變[30]。
新型冠狀病毒感染的流行在時間序列上自然形成斷點,環(huán)境的變化、人群心理健康的變化、其他疾病流行特征的變化都可以考慮運用RD進行探究。
(四)衛(wèi)生服務與政策研究
RD在衛(wèi)生服務與政策研究領域也有著廣泛的應用,其可應用于教育等因素對孕產婦保健的影響[31],全科醫(yī)生連續(xù)性護理中斷對醫(yī)療保健利用的影響[32]等。在政策研究方面,除前文所述空氣質量相關研究應用外,藥物使用指南對青少年吸毒“累犯”的影響[33],養(yǎng)老金[34]和退休[35]等因素對老年人醫(yī)療服務利用的影響均可運用RD進行探索。
較多衛(wèi)生服務與政策研究會使用時序數(shù)據,一般可將時間(日期、月份或年齡)設置為分配變量,政策實施的時間點設置為斷點[15]。
(五)結核病研究
近年來,RD在公共衛(wèi)生領域的應用逐漸增多。作為一種應用較為簡單的準實驗方法,RD未來可以更多地應用于公共衛(wèi)生領域的多個方面。在肺結核研究領域,RD可用于探究新型冠狀病毒感染疫情發(fā)生對肺結核發(fā)病的影響,疫情后時代肺結核患者的心理健康變化等。以新型冠狀病毒感染對某地區(qū)肺結核發(fā)病的影響為例,可將發(fā)病率設為y,日期或月份或年份設為x,新型冠狀病毒感染開始傳播的時間點設為斷點c,并需要考慮季節(jié)等因素,可設為協(xié)變量,具體可參考類似研究[29]。此外,RD還可更多應用于肺結核防治相關政策的評估與制定、肺結核患者心理健康狀況的評估與改善等方面。
四、RD的優(yōu)點與局限性
RD作為一種準實驗方法,應用條件相對簡單,能較好地節(jié)約人力和物力資源。RD主要關注斷點附近的干預效果,可以為各種制度決策和閾值劃定提供依據。RD能更真實地反映變量之間的因果關系,能較大程度降低混雜的影響[7]。
當然,RD也存在一些局限性。RD需要較大的樣本量來獲得足夠的統(tǒng)計效能。Hilton Boon等[36]發(fā)現(xiàn),許多應用RD的研究具有較大的樣本量,因此,可能忽視了其低樣本量時統(tǒng)計效能較低的缺點。此外,RD的應用需要滿足較多假設,并應確保沒有任何外部因素操縱分配和研究結果。因此,RD更適用于具有較大樣本量的研究[37],且進行穩(wěn)健性檢驗和敏感性分析是很有必要的。
綜上所述,公共衛(wèi)生領域內RD的應用可能比以前認識到的要更加廣泛,RD在公共衛(wèi)生領域具有較強的適用性,有著較大的應用潛力。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻于勝男:實施研究、起草文章;高琦、鄭良、石圓和陳奕瑾:修改文章;李秀君:對文章的知識性內容作批評性審閱、指導