徐應(yīng)軍
1.3 偏倚控制
醫(yī)學(xué)研究通常是以人為對象,由于人的心理反應(yīng)和依從性在研究中是難以控制的,而且容易受到外界因素的干擾,因此研究的結(jié)果極易出現(xiàn)各種誤差,如研究對象回答問題的真實性(是否如實回答問題)、對發(fā)生在過去的事件回憶的準(zhǔn)確性(時間、數(shù)量記憶是否準(zhǔn)確)等,如果不真實、不準(zhǔn)確將會使研究結(jié)果系統(tǒng)地偏離其真實值,這種現(xiàn)象稱為偏倚(bias)。偏倚是影響研究質(zhì)量的重要因素,在研究中不可能做到完全沒有偏倚,只有通過周密設(shè)計和科學(xué)處理盡量減少偏倚。識別、分析、控制偏倚,是研究者必須具備的基本功,是研究的關(guān)鍵技術(shù)之一。偏倚控制需要貫穿于研究的全過程,包括研究設(shè)計、實施過程、資料分析、結(jié)果評價等各個階段。
由于研究的方法、對象、方案等一系列問題是設(shè)計階段決定的,如果存在問題將會直接影響研究結(jié)果的真實性,而且一旦執(zhí)行了設(shè)計方案,產(chǎn)生的偏倚許多是無法消除的,因此研究者在設(shè)計上嚴(yán)格把關(guān)是預(yù)防和控制偏倚的重要環(huán)節(jié)。
1.3.1 設(shè)計階段可能產(chǎn)生的偏倚
1.3.1.1 選擇偏倚(selection bias) 由于設(shè)計時選擇研究對象的方法不當(dāng)而引起的偏倚,例如利用非隨機(jī)樣本推論總體,或樣本的依從性較差造成的無應(yīng)答率偏高等。選擇偏倚主要影響樣本的代表性,常見的選擇偏倚有:
1)入院率偏倚(admission bias):如果要研究某種疾病的特征,選擇住院患者為研究對象時會出現(xiàn)入院率偏倚,因為各種疾病的入院率不同,也不會100%的患者都到一個醫(yī)院住院,患者對醫(yī)院有選擇性,醫(yī)院對患者也有選擇性,因而在一個醫(yī)院住院的患者必定是一個患該病的特殊群體,以他們?yōu)閷ο筮M(jìn)行研究,顯然結(jié)果是有偏性的,這就導(dǎo)致入院率偏倚。
2)現(xiàn)患病例偏倚(prevalence-incidence bias):同樣的問題是研究某種疾病的特征,如果這種疾病早期部分患者死去(如急性心肌梗死患者),那么存活下來的患者就是一個特殊群體,選擇存活的患者(現(xiàn)患病例)為研究對象,顯然不能代表該病的總體情況,這就是現(xiàn)患病例偏倚,也稱為奈曼氏偏倚(Neyman's bias)。
3)無應(yīng)答偏倚(non-response bias):設(shè)計時被選定的樣本中沒有接受研究的個體為無應(yīng)答者,如果無應(yīng)答者較多,或無應(yīng)答者是因為某種原因拒絕研究,那么僅憑應(yīng)答者的研究結(jié)果產(chǎn)生結(jié)論是有偏性的。例如在人群健康普查中,身體狀況較好者參與的比率低于健康狀況較差者,如果按照這樣的普查結(jié)果,人群的患病率將會高于實際水平。
1.3.1.2 信息偏倚(information bias) 設(shè)計時選擇了不恰當(dāng)?shù)恼{(diào)查和檢測方法導(dǎo)致獲取的數(shù)據(jù)不準(zhǔn)確而引起的偏倚,如非盲法調(diào)查、對比組間調(diào)查方式不一致、使用的儀器設(shè)施未經(jīng)校正等。常見的信息偏倚有:
1)調(diào)查者偏倚(investigator bias):如果參與調(diào)查的調(diào)查員均與調(diào)查密切相關(guān),希望獲得某種調(diào)查結(jié)局,因此在調(diào)查中會不自覺地,或多或少地將個人的意愿表露出來,影響調(diào)查對象對問題答案的選擇,致使調(diào)查數(shù)據(jù)不夠真實,也稱為誘導(dǎo)偏倚。
2)回憶偏倚(recall bias):來自研究對象對發(fā)生在過去事件的回憶主動性和準(zhǔn)確性,例如在有關(guān)環(huán)境污染和職業(yè)危害對健康影響的調(diào)查中,研究對象往往回憶的比較主動,對細(xì)節(jié)問題也不放過,甚至夸大,導(dǎo)致調(diào)查到的數(shù)據(jù)不準(zhǔn)確。
1.3.1.3 混雜偏倚(confounding bias) 在資料分析過程中,由于外界因素的干擾,使研究結(jié)果發(fā)生偏離的現(xiàn)象為混雜偏倚。雖然混雜偏倚出現(xiàn)在資料的分析階段,但由于混雜因素是自然存在的,因此設(shè)計時可以采取措施對可疑的混雜因素進(jìn)行控制,例如匹配設(shè)計、分層抽樣等。
1.3.2 設(shè)計階段偏倚控制措施
1.3.2.1 提高抽樣技術(shù) 根據(jù)研究目的,選擇適當(dāng)?shù)某闃臃椒ㄊ强刂七x擇偏倚的重要措施。需要推論總體的調(diào)查,應(yīng)以人群為基礎(chǔ),采用隨機(jī)抽樣;需要選擇病例為調(diào)查對象時,盡量選用新發(fā)病例;對特殊目的的調(diào)查研究,如總結(jié)經(jīng)驗、教訓(xùn)等可選擇典型樣本,將目標(biāo)人群局限性。
1.3.2.2 重視無應(yīng)答 理論上無應(yīng)答率不能超過5%,否則結(jié)果不可靠。如果無應(yīng)答率較高,需要采取措施。首先是分析無應(yīng)答的原因,制定補(bǔ)救措施;其次是分析無應(yīng)答者的特征,估計無應(yīng)答對結(jié)果的影響程度。如果確定無應(yīng)答者是有偏性的,必須通過溝通,最大限度地調(diào)查無應(yīng)答者。
1.3.2.3 采用盲法調(diào)查(blind survey) 調(diào)查時如果調(diào)查對象,或調(diào)查者不知道調(diào)查分組情況則為盲法調(diào)查,如果只有一方不知道為單盲,雙方均不知道為雙盲。盲法調(diào)查可以克服來自調(diào)查對象及調(diào)查者的主觀因素的干擾,減少數(shù)據(jù)的偏性。
1.3.2.4 平衡調(diào)查 研究很多情況下需要設(shè)置對照,通過觀察組與對照組的相互比較產(chǎn)生結(jié)論。在研究設(shè)計時,要保證每個調(diào)查員調(diào)查的觀察組與對照組人數(shù)的比例接近,例如一個調(diào)查員調(diào)查暴露組的人數(shù)占全部暴露組的30%,那么這個調(diào)查員調(diào)查的對照組人數(shù)也應(yīng)該占全部對照組的30%,這就是平衡調(diào)查。因為每個調(diào)查員對問題的理解、技術(shù)的掌握及工作的態(tài)度不盡相同,因此平衡調(diào)查可以減少對比組間人為的差別,使比較結(jié)果更趨合理。
1.3.2.5 匹配設(shè)計 是設(shè)計階段控制混雜偏倚的有效方法。通常年齡、性別、種族、職業(yè)、經(jīng)濟(jì)文化水平等,是各類研究首選的匹配條件;疾病類型、病程、病情、并發(fā)癥及治療經(jīng)過等,是臨床研究中需要考慮的匹配條件,因為這些因素是最為常見的混雜因素。但采用匹配設(shè)計,應(yīng)該符合以下要求:①因為條件限制,如時間、經(jīng)費(fèi)、人力等資源有限,不能開展大樣本研究;②因為研究的疾病罕見,沒有足夠的研究對象;③匹配的條件不宜過多,除年齡、性別之外,其他因素需要慎重。
1.3.2.6 控制混雜因素 混雜偏倚是由混雜因素引起,可以通過分層分析、多因素分析加以調(diào)整與控制,然而前提是設(shè)計時必須將混雜因素列為調(diào)查因素,這樣才能在調(diào)查中獲得混雜因素的信息,才能夠通過適當(dāng)?shù)慕y(tǒng)計學(xué)方法進(jìn)行控制。因此在設(shè)計調(diào)查因素時不僅僅關(guān)注假設(shè)因素,而且要充分考慮潛在的混雜因素。
2 現(xiàn)況研究
現(xiàn)況研究(cross sectional study)是在特定時間內(nèi)對特定人群中某種健康問題的狀況進(jìn)行研究的一種方法。健康問題的狀況可以是疾病的表現(xiàn)形式、危害程度、分布規(guī)律,以及影響分布的因素等。由于現(xiàn)況研究揭示的是目前的狀況,因此研究工作必須在一個短時間內(nèi)完成,相當(dāng)于描述一個時間斷面上存在的事件,因此也稱它為橫斷面研究。
2.1 原理與特性
2.1.1 基本原理
現(xiàn)況研究是按照預(yù)先設(shè)計好的問卷,在人群中同時收集有關(guān)疾?。ɑ蚰硞€事件)及其相關(guān)因素分布狀況的資料,比較不同因素狀態(tài)下(因素的有無,或因素的多少)疾病的患病率(或事件存在的程度),如果比較結(jié)果具有統(tǒng)計學(xué)意義,則認(rèn)為分析因素對疾病或事件有影響,由于因素和疾?。ㄊ录┰谡{(diào)查中同時被看到,并不能區(qū)分時間的先后順序,因此該因素只能被認(rèn)為是疾病病因的一個重要線索,或是因果關(guān)系研究的假設(shè)。
2.1.2 主要特性
2.1.2.1 觀察法研究 現(xiàn)況研究中所有調(diào)查的因素是人群固有的或已經(jīng)存在的,如年齡、性別、民族、職業(yè)、文化程度、生活習(xí)慣,以及患病狀況等,無人為干預(yù)因素。
2.1.2.2“因”“果” 同時觀察到 研究的因(因素)及果(事件)的資料在調(diào)查中被同時收集到,無法辨別時序關(guān)系,因此現(xiàn)況研究不能確定因素與事件的因果關(guān)系,只是探索性研究。
2.1.2.3 描述性研究 通過描述疾病(事件)在自然狀態(tài)下(無人為干預(yù))的分布特征,發(fā)現(xiàn)影響分布的因素,這些因素將是建立因果關(guān)系假設(shè)的重要線索。
2.1.2.4 不專設(shè)對照組 現(xiàn)況研究在設(shè)計時不專門設(shè)置對照組,而是根據(jù)研究人群內(nèi)固有因素的暴露程度分組進(jìn)行對比分析,實際上現(xiàn)況研究采用的是內(nèi)對照設(shè)計。
2.2 研究類型與目的
2.2.1 研究類型
2.2.1.1 普查(census) 普查是將特定范圍人群內(nèi)全部成員均作為對象進(jìn)行的調(diào)查,特定范圍可以是某個地區(qū)、某個單位,或者是具有某種特征的人群,如患有某種疾病、具有某種癥狀、從事某種活動等等。例如對某市全部鋼鐵高溫作業(yè)工人進(jìn)行的健康調(diào)查。普查的優(yōu)點(diǎn)是確定觀察對象比較簡單,并且不存在抽樣誤差,所觀察到的現(xiàn)象來自每個個體,可以完整描述所研究內(nèi)容的全貌,研究結(jié)果具有代表性。普查的缺點(diǎn)是需要調(diào)查的對象多,難以控制漏查,同時參與調(diào)查的人員多,工作不易做細(xì),系統(tǒng)誤差較大。
普查通常用于:①建立人體正常值范圍或臨床診斷標(biāo)準(zhǔn),例如人群各項指標(biāo)的生理常數(shù)等;②了解人群健康水平,例如兒童生長發(fā)育狀況、某種疾病的人群患病狀況等;③早期發(fā)現(xiàn)病人,許多疾病如果能夠早期發(fā)現(xiàn),可以使患者得到及時治療,提高疾病的治療效果,如對某些惡性腫瘤的普查等。
2.2.1.2 抽樣調(diào)查(sampling survey) 抽樣調(diào)查是通過抽樣的方法,在特定范圍人群內(nèi)抽取一個樣本進(jìn)行的調(diào)查研究,多數(shù)情況下希望以樣本的調(diào)查結(jié)果代表全人群的實際,即以樣本推論總體。
抽樣調(diào)查與普查對比,具有省時、省力,可以集中精力將調(diào)查工作做深、做細(xì)等優(yōu)點(diǎn)。但抽樣調(diào)查的設(shè)計和資料分析相對復(fù)雜,同時抽樣誤差是不可避免的,調(diào)查的結(jié)果能否推論總體,取決于樣本的代表性和足夠的樣本量。
2.2.2 研究目的
2.2.2.1 描述疾病特征 認(rèn)識疾病特征是疾病防治工作的基礎(chǔ),然而在自然狀態(tài)下疾病的一些特征存在短期波動或長期變異,表現(xiàn)為疾病的臨床特征、危害程度、患病率、人群的易感性、分布狀態(tài)、影響因素等在不同時期會出現(xiàn)變化,例如猩紅熱在20世紀(jì)30年代以前,臨床表現(xiàn)兇險,病死率高,但隨后逐漸溫和,現(xiàn)在幾乎沒有特征性的臨床表現(xiàn),也未見病死者。因此連續(xù)地在人群中進(jìn)行現(xiàn)況研究,描述疾病特征,觀察變化動態(tài),可及時發(fā)現(xiàn)問題,有利于正確指導(dǎo)疾病的防治工作,也可以對已經(jīng)采取過的防治策略、措施的效果進(jìn)行評價。
2.2.2.2 探索病因線索 描述疾病的分布特征是現(xiàn)況研究的一項重要任務(wù),那些影響分布的因素就是重要的病因線索。例如早期人們在描述人群肺癌分布特征時發(fā)現(xiàn),吸煙人群的肺癌死亡率明顯高于非吸煙人群,因此吸煙與肺癌有關(guān)的假設(shè)被提了出來。
2.2.2.3 確定高危人群 高危人群是指特別容易受到某種疾病威脅的人群,通常是具有發(fā)生某種疾病危險因素的人群。確定高危人群有利于疾病的預(yù)防控制。例如高血壓是腦卒中的危險因素,可以將現(xiàn)況研究中發(fā)現(xiàn)的高血壓患者確定為腦卒中的高危人群。
2.2.2.4 提供衛(wèi)生決策依據(jù) 通過對社區(qū)人群的健康及衛(wèi)生服務(wù)狀況的現(xiàn)況研究,可以發(fā)現(xiàn)該社區(qū)人群目前存在的主要公共衛(wèi)生問題,這是衛(wèi)生管理和研究部門制定決策的重要依據(jù)。
2.3 研究設(shè)計與實施步驟
2.3.1 設(shè)計思路及技術(shù)要點(diǎn)
2.3.1.1 技術(shù)路線 現(xiàn)況研究過程的主要環(huán)節(jié)及流程見圖1。
2.3.1.2 技術(shù)要點(diǎn)
1)抽樣:現(xiàn)況研究的目的在于了解事物的本質(zhì),揭示客觀現(xiàn)象和規(guī)律,是進(jìn)一步深入研究的基礎(chǔ)和方向,因此研究結(jié)果的真實性是衡量研究質(zhì)量的重要指標(biāo)之一。在抽樣調(diào)查中,隨機(jī)抽樣是保證研究結(jié)果質(zhì)量的一項關(guān)鍵技術(shù)。需要注意的是,隨機(jī)抽樣是非常具體的可操作的方法,而不是一句空頭的口號。在設(shè)計報告中,或發(fā)表的論文中,不能簡單的說用隨機(jī)的方法選取樣本,而應(yīng)該詳細(xì)說明隨機(jī)的具體實施方法,如果樣本不是隨機(jī)抽取,而說成隨機(jī)是不科學(xué)的,需要避免。非隨機(jī)的樣本也是可以進(jìn)行研究的,但研究者必須認(rèn)識到和說明這樣研究的意義和局限性,實事求是是科學(xué)的態(tài)度。
2)樣本量:描述客觀事實,揭示自然規(guī)律是現(xiàn)況研究的主要目的,這不僅要求研究的樣本有代表性,能夠反映客觀實際,而且必須有足夠的樣本為保障。現(xiàn)況研究分析的重要指標(biāo)是患病率,按照大數(shù)穩(wěn)定的原理,調(diào)查的樣本數(shù)量越大,所得到的率就越穩(wěn)定,受個體差異和偶然機(jī)會的影響就越小;另外,抽樣誤差是隨著樣本量的增加而減小,當(dāng)樣本量趨向無窮大時,抽樣誤差為0。所以大樣本的研究可以降低抽樣誤差,提高研究結(jié)果的真實性和可靠性。在研究的設(shè)計時,必須對所需要的樣本量進(jìn)行嚴(yán)格測算,在保證統(tǒng)計學(xué)檢驗所需的樣本量基礎(chǔ)上,保留余地地增加研究的樣本量。
3)時間限制:現(xiàn)況研究是為了揭示現(xiàn)時狀況,發(fā)現(xiàn)當(dāng)前的問題,為確定下一步研究方向和內(nèi)容、制定工作計劃和決策提供科學(xué)依據(jù),因此研究的時間不能拖得過長,特別是對環(huán)境和社會因素敏感問題的調(diào)查,更需要在短時間內(nèi)完成。
2.3.2 設(shè)計與實施步驟
2.3.2.1 選題 現(xiàn)況研究是對一個問題進(jìn)行系統(tǒng)調(diào)查分析的起步階段,通常是針對新問題,包括新出現(xiàn)的問題、以前沒有研究過的問題,或以前研究過又出先新情況的問題。因此當(dāng)實際工作中發(fā)現(xiàn)某個問題需要解決,或者文獻(xiàn)報道的某個問題本地也存在,但以前對該問題了解甚少,可以立題開展調(diào)查研究。
2.3.2.2 確定研究目的和意義 如果研究的題目選定,就必須明確研究的目的和意義,包括立題的依據(jù)、擬解決的問題以及解決問題的實際意義。
2.3.2.3 選擇研究對象 結(jié)合研究目的、基礎(chǔ)條件、可行性確定研究對象的特征、范圍。
2.3.2.4 樣本量估計 影響抽樣調(diào)查樣本量的因素主要有:①研究事件的發(fā)生頻率(P):發(fā)生的頻率高,所需的樣本量小;②研究結(jié)果的精確度(容許誤差d):對研究結(jié)果的精確度要求越高,樣本量越大,通常d=10%P,即容許研究誤差為10%;③檢驗的顯著性水平(α):α取值越小,需要的樣本量越大,通常選擇α=0.05為檢驗的顯著性水平,如果選擇α=0.01為檢驗的顯著性水平,則需要的樣本量將明顯增大。
當(dāng)上述各項條件確定后,樣本量可以根據(jù)公式估計,例如研究目的是觀察某種疾病人群中的患病率,則可利用下式估計:
n=400×q/p? ??式(1)
式中n是當(dāng)α=0.05為檢驗的顯著性水平,容許誤差d=0.1P時,所需要的樣本量;P為所要研究事件預(yù)期的發(fā)生頻率,可以根據(jù)預(yù)調(diào)查結(jié)果估計,或根據(jù)文獻(xiàn)類似研究報道的結(jié)果估計;q=1-p。
例:根據(jù)文獻(xiàn)報道我國成年人群乙型肝炎表面抗原攜帶率在10%左右,為了解某人群乙型肝炎表面抗原攜帶情況,按照常規(guī)設(shè)計(α=0.05,d=0.1P)應(yīng)抽取多少人?
此例p=0.10;q=1-p=1-0.10=0.90,代入上式得n=3600(人),即該研究應(yīng)該至少抽取3600人。
研究目的和指標(biāo)的性質(zhì)不同選用樣本量估計的公式也不同,這里所介紹的是一個特例。此外也可以查閱樣本量估計專用表,或利用計算機(jī)軟件估計,具體方法見本書有關(guān)章節(jié)。
2.3.2.5 抽樣方法 現(xiàn)況研究應(yīng)盡量選擇隨機(jī)抽樣方法,增強(qiáng)研究結(jié)果的代表性。但在實際研究中,有時也可以采用非隨機(jī)的方法,如典型抽樣等,或?qū)⒛衬?、某醫(yī)院的患者作為研究對象。非隨機(jī)方法具有可行性好,便于操作的優(yōu)點(diǎn),但研究結(jié)果的代表性較差,研究者在下結(jié)論時或使用研究結(jié)果時應(yīng)慎重。
2.3.2.6 擬定問卷 現(xiàn)況研究中大部分因素與疾?。ㄊ录┦峭瑫r觀察到的,如疾病的診斷結(jié)果和生理生化檢測結(jié)果,但有些因素也需要通過回憶獲得,如過去的生活習(xí)慣和經(jīng)歷等。雖然現(xiàn)況研究不能區(qū)分“因”與“果”的時間順序,但在制定問卷時仍要考慮因素的時效性,即暴露的時間。
2.3.2.7 現(xiàn)場調(diào)查與資料收集 調(diào)查員在進(jìn)入現(xiàn)場前需要經(jīng)過嚴(yán)格訓(xùn)練。負(fù)責(zé)采訪調(diào)查的人員需要熟悉問卷內(nèi)容、調(diào)查方法、記錄方法,掌握調(diào)查技術(shù)和標(biāo)準(zhǔn)等;負(fù)責(zé)臨床檢查的人員,需要準(zhǔn)備好設(shè)備,熟悉操作技術(shù)和診斷標(biāo)準(zhǔn)等;負(fù)責(zé)實驗室檢測的人員,需要準(zhǔn)備好采樣器材、熟悉采樣和樣品保管、運(yùn)送技術(shù)等;負(fù)責(zé)摘錄歷史數(shù)據(jù)的人員,需要熟悉資料的來源,摘錄內(nèi)容和記錄方法等。
2.3.3 資料的整理與分析
2.3.3.1 資料錄入與整理 將經(jīng)過核實和整理過的每份問卷數(shù)據(jù)錄入計算機(jī),建立數(shù)據(jù)文件。對定量數(shù)據(jù)進(jìn)行正態(tài)性分析,非正態(tài)分布的數(shù)據(jù)需要進(jìn)行適當(dāng)?shù)臄?shù)據(jù)轉(zhuǎn)換,如對數(shù)轉(zhuǎn)換等,再分析是否符合正態(tài)分布,如果轉(zhuǎn)換后仍然為非正態(tài)分布,則這類數(shù)據(jù)將采用非參數(shù)分析。
2.3.3.2 列制分析表格 將計劃分析的內(nèi)容,根據(jù)統(tǒng)計學(xué)的要求列制成分析表格,現(xiàn)況研究最基本的分析表格形式見表1,如果數(shù)據(jù)為定量的見表2。
2.3.3.3 計算分析指標(biāo) 根據(jù)研究目和數(shù)據(jù)的性質(zhì),選擇恰當(dāng)?shù)慕y(tǒng)計分析指標(biāo),現(xiàn)況研究最常用的指標(biāo)是事件的陽性率,例如疾病的患病率、現(xiàn)患率、陽性率、檢出率或死亡率等,因此現(xiàn)況研究也被稱為患病率研究(prevalence study)。定量的資料可以計算均數(shù)、標(biāo)準(zhǔn)差等重要參數(shù),見表2。
2.3.3.4 描述分析 現(xiàn)況研究分析的重點(diǎn)是描述事件的“三間分布”,即事件在人群(人間)、時間、地區(qū)(空間)的分布特征。例如某大學(xué)在新生入學(xué)時進(jìn)行了HbsAg攜帶率的普查,分析新生中HbsAg陽性的分布特征,結(jié)果表明,HbsAg攜帶率男性高于女性、南方高于北方、農(nóng)村高于城市,顯著性檢驗具有統(tǒng)計學(xué)意義,見表3。
2.3.3.5 統(tǒng)計學(xué)檢驗 不同組間(如暴露組與非暴露組,或不同暴露程度組)比較時需要進(jìn)行統(tǒng)計學(xué)檢驗方可作出有無意義的結(jié)論。通常單因素分時,率的比較采用卡方檢驗,均數(shù)比較采用t檢驗或方差分析,見表3。
2.3.3.6 其他分析 在不同地區(qū)和人群進(jìn)行率的比較時,需要計算標(biāo)準(zhǔn)化率;對個別混雜因素控制可采用分層分析方法,需要同時控制多個混雜因素時可采用多因素分析方法;對定量或分等級的數(shù)據(jù)可進(jìn)行量效關(guān)系或線性趨勢分析。
2.4 注意事項
2.4.1 樣本代表性
當(dāng)無法對總體進(jìn)行普查,而且需要對總體進(jìn)行推測時,必須采用抽樣調(diào)查。樣本結(jié)果能否真實反映總體特征,能否代表總體就是樣本的代表性?,F(xiàn)況研究的樣本代表性與抽樣技術(shù)和樣本量有關(guān),按照隨機(jī)的原則抽樣,適當(dāng)增加樣本量均可提高樣本的代表性。如果條件所限,確實無法進(jìn)行隨機(jī)、大樣本調(diào)查,現(xiàn)況研究的結(jié)果就不能用來推測總體,研究的價值和意義將受到限制。
2.4.2 偏倚
控制偏倚是保證研究質(zhì)量,提高結(jié)果真實性和可靠性的另一項關(guān)鍵技術(shù),現(xiàn)況研究中偏倚主要有無應(yīng)答偏倚、測量偏倚、調(diào)查者偏倚、混雜偏倚等。偏倚的控制應(yīng)當(dāng)從設(shè)計開始,因為一些偏倚只有提前認(rèn)識到,采取措施防止其發(fā)生,才能有效控制,否則一旦發(fā)生了將無法糾正,例如樣本選擇不合適,或儀器設(shè)備有故障未及時校正,或操作人員技術(shù)不過關(guān),導(dǎo)致測量數(shù)據(jù)不準(zhǔn)確等。在設(shè)計時,要認(rèn)真分析研究過程中的每個環(huán)節(jié),找出可能出現(xiàn)偏倚的細(xì)節(jié),并針對偏倚的特性制定出防范措施。同時,研究中要評價措施的效果,估計偏倚的控制程度。
2.4.3 患病率
患病率(prevalence)是現(xiàn)況研究主要的分析指標(biāo),也稱為現(xiàn)患率。現(xiàn)況調(diào)查時的患病率的計算公式為:
患病率=調(diào)查時發(fā)現(xiàn)的患者人數(shù)/調(diào)查人數(shù)(公式2)
患病率與發(fā)病率的概念明顯不同,后者的分子僅僅是調(diào)查期間新發(fā)生的患者,只有當(dāng)疾病的病程很短(急性?。┗虿∷缆屎芨邥r二者比較接近,因此在使用時要注意相互區(qū)別。相對危險度是反映暴露因素與疾病之間聯(lián)系強(qiáng)度的重要指標(biāo),是暴露組的發(fā)病率與非暴露組發(fā)病率之比,因此在現(xiàn)況研究中,除了極個別情況下,是不能計算相對危險度以及近似值OR。
2.5 現(xiàn)況研究實例
近些年來,我國社會經(jīng)濟(jì)的迅速發(fā)展,改變著人們的生活水平、生活習(xí)慣和生活方式,致使人群的疾病譜也出現(xiàn)重大變化,特別是在經(jīng)濟(jì)發(fā)達(dá)的城市,傳染性疾病的發(fā)病率不斷下降,而以肥胖、糖尿病、高血壓、高血脂為代表的代謝綜合征的患病率逐漸升高。為了解新形勢下,代謝綜合征的人群分布特征及其影響因素,某大學(xué)醫(yī)學(xué)院的在校學(xué)生,以北京市某區(qū)18歲以上常駐居民為目標(biāo)人群,開展了現(xiàn)況調(diào)查研究。
2.5.1 設(shè)計要點(diǎn)
2.5.1.1 樣本量估計 根據(jù)預(yù)調(diào)查可知,該地區(qū)成人代謝綜合征標(biāo)化患病率為32%左右,按照常規(guī)設(shè)計,取α=0.05為檢驗的顯著性水平,容許誤差d=0.1P,則:
n=400×0.68/0.32 =850(人)
因為影響分布的因素較多,以及無應(yīng)答的存在,所以按照計算樣本量的10倍選取樣本,計劃完成8500例。
2.5.1.2 抽樣方法 采用多級分層整群抽樣的方法選擇研究樣本。
1)分層:首先分為城區(qū)和郊區(qū)兩個層,再在各層內(nèi)分為東西南北中5個區(qū)域,以各區(qū)域內(nèi)的社區(qū)衛(wèi)生服務(wù)中心作為調(diào)查點(diǎn)。
2)多階段分層整群隨機(jī)抽樣
第一階段:將各區(qū)域內(nèi)的社區(qū)衛(wèi)生服務(wù)中心編碼,采取抽簽的方法各抽取1個服務(wù)中心為樣本點(diǎn),共計10個點(diǎn)。
第二階段:以每個樣本點(diǎn)所轄的居委會為單位編碼,仍采用抽簽的方法抽取1個居委會,如果該居委會符合調(diào)查的對象不足900人,則繼續(xù)抽取下1個居委會,至達(dá)到900人為止。
2.5.2 現(xiàn)場調(diào)查
2.5.2.1 問卷調(diào)查 問卷調(diào)查由學(xué)生負(fù)責(zé)完成,問卷內(nèi)容包括:①一般情況:包括年齡、性別、民族、文化程度、婚姻狀況、職業(yè)、人均收入等內(nèi)容;②家族史及既往史:包括家族史及個人既往史等;③生活方式和行為習(xí)慣:包括吸煙、飲酒、食用鹽攝入量及體力活動等方面的內(nèi)容;④精神及社會因素:包括生活、工作等家庭及社會方面影響因素等。
2.5.2.2 體格檢查 問卷調(diào)查的同時采用標(biāo)準(zhǔn)的方法測量每個對象的身高、體重及血壓。
2.5.2.3 實驗室檢測 由該衛(wèi)生服務(wù)中心的專業(yè)人員負(fù)責(zé)采血,由該區(qū)醫(yī)院體檢中心負(fù)責(zé)血脂、血糖等生化指標(biāo)的檢測。
2.5.2.4 診斷標(biāo)準(zhǔn) 由該區(qū)醫(yī)院體檢中心專業(yè)醫(yī)師按2004年10月中華醫(yī)學(xué)會糖尿病學(xué)分會推出的適合中國人群特征的代謝綜合征診斷標(biāo)準(zhǔn)來診斷。
2.5.3 結(jié)果分析
2.5.3.1 代謝綜合征人群分布特征 該人群代謝綜合征粗患病率為18.7%(標(biāo)化患病率17.7%),男性20.7%(標(biāo)化患病率22.1%),女性16.9%(標(biāo)化患病率17.7%);總患病率男性高于女性(χ2=20.15,P<0.001),但65歲后,女性高出男性。男性與女性人群代謝綜合征患病率均呈現(xiàn)隨年齡增長而升高的趨勢,見表4。
2.5.3.2 代謝綜合征城郊分布特征 代謝綜合征患病率城區(qū)人群為17.8%(標(biāo)化患病率16.8%);郊區(qū)為20.4%(標(biāo)化患病率20.0%),郊區(qū)高于城區(qū),見表5。
2.5.3.3 代謝綜合征影響因素分析 此次調(diào)查的代謝綜合征影響因素涉及人口學(xué)及社會經(jīng)濟(jì)地位、生活方式及行為習(xí)慣、家族史及既往病史、家庭及社會因素、精神及心理因素5大類,30余項。
單因素分析結(jié)果發(fā)現(xiàn)具有家族史、過量飲酒史、既往病史、缺乏體育鍛煉的人群代謝綜合征的患病率升高,具有統(tǒng)計學(xué)意義,其他因素均無統(tǒng)計學(xué)意義,見表6。
2.5.4 研究結(jié)論
該人群代謝綜合征患病率隨年齡增加而升高,總體男性高于女性,但65歲以后女性患病率急劇升高,超過男性,這種現(xiàn)象應(yīng)該引起重視。研究結(jié)果還提示,郊區(qū)人群患病率高于城區(qū),與其他人群研究結(jié)果不一致,原因有待差查明。影響該人群代謝綜合征的主要因素是具有家族史、過量飲酒史、既往病史、缺乏體育鍛煉,是今后健康教育的重點(diǎn)。
3病例對照研究
病例對照研究(case control study )是分析性研究方法之一,是探索事物間相互關(guān)系和關(guān)系密切程度的重要方法,是較現(xiàn)況研究更深入一步的研究類型。由于病例對照研究良好的可行性和所提供研究證據(jù)的力度較高,因此在實際工作中,倍受研究者青睞。有關(guān)病因?qū)W領(lǐng)域,利用病例對照研究發(fā)表的論文舉不勝舉,經(jīng)典的范例是Doll和Hill關(guān)于吸煙與肺癌關(guān)系的病例對照研究,以及Herbst關(guān)于年輕女性陰道腺癌的病例對照研究,在這個例子中,Herbst僅僅用了8例患者和32例對照為對象,得出了母親在妊娠早期服用乙烯雌酚是年輕女性陰道腺癌的重要危險因素的結(jié)論,顯示出這種方法獨(dú)到的優(yōu)越性。
3.1 原理與特性
3.1.1 基本原理
病例對照研究是在目標(biāo)人群中選擇一組已經(jīng)確診的某種疾病的患者為病例組,再在未患該病的人群中選擇一組與病例組具有可比性的個體為對照組,根據(jù)回顧,調(diào)查兩組過去各種可能的危險因素的暴露史,比較兩組間各個危險因素的暴露比例,如果兩組之間某因素的暴露比例差異具有統(tǒng)計學(xué)意義,則認(rèn)為該因素與疾病間存在統(tǒng)計學(xué)聯(lián)系,在排除了誤差和偏倚的影響后,依據(jù)相關(guān)的專業(yè)知識,做出某因素或某些因素為該病的危險因素的推斷。
病例對照研究是從疾病開始,追溯原因,從因和果的時序性來看是由“果”到“因”的研究,故也稱為回顧性研究(retrospective study)。當(dāng)某個問題的基礎(chǔ)已經(jīng)調(diào)查清楚,并提出了明確假設(shè),這時可以考慮選擇病例對照研究進(jìn)行假設(shè)的檢驗。
3.1.2 主要特性
3.1.2.1 觀察法研究 研究的因素是研究對象固有的或已經(jīng)存在的,通過詢問、體檢、實驗室檢測、查閱歷史資料獲得。
3.1.2.2 分析性研究 病例對照研究是根據(jù)病例組與對照組間某些因素的暴露程度有無差別,分析因素與疾病之間的關(guān)系類型,獲取有無關(guān)系的證據(jù),達(dá)到探索和檢驗病因假設(shè)的目的。
3.1.2.3 回顧性研究 病例對照研究是由“果”至“因”的,因此病例對照研究結(jié)果不能證明因與果的時序關(guān)系,這就決定了病例對照研究結(jié)果不能得出因果關(guān)系的推論,而只是危險因素的推論,是對因果假設(shè)的初步檢驗。
3.2 研究的類型
3.2.1 按照病例與對照是否匹配分類
3.2.1.1 不匹配設(shè)計 也稱為成組設(shè)計,是在目標(biāo)人群中,分別選擇一定數(shù)量的病例與對照組成病例組與對照組,一般要求對照組的樣本量大于或等于病例組。
這種設(shè)計的優(yōu)點(diǎn)是相對比較簡單、對照容易選擇、資料便于處理、信息丟失較少,適用于病例較多,或研究成本較低的大樣本研究。如果條件滿足,是設(shè)計時首先考慮選擇的研究方法。
3.2.1.2 匹配設(shè)計 也稱為配比設(shè)計,匹配(matching)設(shè)計要求依據(jù)病例的某些特征選擇對照,即對照在某些特定的因素或特征上與病例保持一致。匹配的目的是使病例與對照之間保持較好的可比性,排除某些因素對研究結(jié)果的干擾作用。例如以性別為匹配因素,可使病例組與對照組的性別構(gòu)成相同,在結(jié)果分析過程中性別不再起任何作用,也就避免了由于兩組間性別構(gòu)成不同對結(jié)果造成影響,使結(jié)果更容易解釋。根據(jù)匹配因素在資料分析中失去作用的原理,匹配設(shè)計通常也作為控制混雜因素的有效方法。另外匹配設(shè)計可以提高統(tǒng)計學(xué)效率,即達(dá)到同樣的統(tǒng)計學(xué)檢驗結(jié)果,匹配設(shè)計所需要的樣本量相對較小,這是選擇匹配設(shè)計的主要目的。
(1)匹配設(shè)計類型:匹配設(shè)計可分為頻率匹配和個體匹配兩類。
1)頻率匹配(frequency matching):按照某個特征在病例組中所占的頻率,選擇對照組。例如病例組中男性占65%,那么對照組中男性也必須占65%。實際上頻率匹配是介于成組設(shè)計和匹配設(shè)計之間的一種類型,即按照成組設(shè)計選擇病例組,按照條件選擇對照組。
2)個體匹配(individual matching):按照每個病例的某些特征選擇與之匹配的對照。如果每個病例均選1個與之匹配的對照,稱為1:1匹配的病例對照研究,或配對研究(pair matching);如果每個病例均選2個對照稱為1:2,依此類推有1:3,1:4,最多是1:4。增加對照數(shù)量是為了提高病例信息的使用效率,病例所含信息的使用效率隨對照數(shù)量的增加而增加,但對照數(shù)在4個以上效率增加不明顯,因此最多4個。如果在一次病例對照研究中,每個病例匹配的對照數(shù)不一致,例如有1個的,也有2個或3個、4個的,稱為1:R可變匹配設(shè)計。每個病例與之匹配的對照組成對子,是匹配設(shè)計資料分析的基本單位。在Herbst關(guān)于年輕婦女陰道腺癌的經(jīng)典研究中,采取的是1:4匹配設(shè)計,8個病例與32個對照組成了8個對子。
(2)匹配因素(匹配條件):是選擇對照的限制因素,即要求對照與病例保持一致的因素。匹配因素在設(shè)計中一旦確定,就應(yīng)該嚴(yán)格按照要求選擇對照。理論上匹配因素越多,對照組與病例組一致性越高,兩組的可比性越好,但實際操作中匹配的因素太多有如下缺點(diǎn):
1)增加了研究的難度:如果匹配的條件過多,合適的對照不易找到,增加了研究的難度,甚至使研究無法進(jìn)行。
2)降低研究的信息量:因為一個因素一旦被確定為匹配因素后,這個因素就不再起任何作用,由該因素所含有的任何信息均不能參與研究,也就無法分析該因素與疾病的關(guān)系,以及與其他因素的交互關(guān)系,降低了研究的效率。
3)匹配過頭錯誤(over-matching):有些因素之間存在內(nèi)在聯(lián)系,如果一個因素被控制,與該因素有關(guān)聯(lián)的因素實際上也被控制了,例如飲酒與吸煙習(xí)慣通常是密不可分的,如果我們擬研究吸煙與某種疾病的關(guān)系,將飲酒習(xí)慣作為匹配因素,就相當(dāng)于吸煙也被匹配了,吸煙與疾病的關(guān)系就會被掩蓋難以發(fā)現(xiàn),即使被發(fā)現(xiàn)二者之間的關(guān)聯(lián)程度也將被低估,這種由于過度匹配導(dǎo)致的掩蓋或?qū)⒔档脱芯恳蛩氐膶嶋H作用的錯誤稱為匹配過頭錯誤。
匹配的因素過多不行,但過少達(dá)不到匹配的目的,一般在實際操作中選4個左右為宜。那么什么樣的因素可以作為匹配因素呢?應(yīng)該是已知的混雜因子,或具有潛在可能的混雜因子。通常年齡、性別是必須要考慮的因素,因為在多數(shù)研究中年齡與性別均是混雜因子,其他因素的選擇可依據(jù)研究的具體需要,例如在臨床研究中患者的病情、病程;在職業(yè)人群研究中工種、工齡等是重要的混雜因子。
(3)匹配設(shè)計的適用范圍:匹配設(shè)計較成組設(shè)計復(fù)雜、對照選擇困難、資料處理繁瑣(1:1配對設(shè)計除外)、容易丟失信息,因此一般多用于不易開展大樣本研究的情況,如病例較少、研究成本較高、研究的投入不足等。
3.2.2 按照病例的來源分類
1)以醫(yī)院為基礎(chǔ)(hospital based)的病例對照研究在醫(yī)院的門診或住院的患者中選擇病例進(jìn)行的病例對照研究,這種研究病例選擇簡單、成本低、可行性好,是許多學(xué)生做課題時首選的研究方法。但是病例缺乏代表性,因為不是每個患者均到醫(yī)院就醫(yī),容易出現(xiàn)選擇偏倚。Herbst關(guān)于乙烯雌酚與年輕婦女陰道腺癌的關(guān)系研究,就是典型的醫(yī)院為基礎(chǔ)的病例對照研究。
2)以人群為基礎(chǔ)(population based)的病例對照研究在社區(qū)人群中選擇病例進(jìn)行的病例對照研究,這種研究代表性好,但工作的難度很大、研究成本高。
3.2.3 衍生類型
是將傳統(tǒng)的病例對照研究與其他類型研究方法結(jié)合派生出的一些新的病例對照研究類型。
3.2.3.1 巢式病例對照研究(nested case control study) 在隊列研究的基礎(chǔ)上,將隨訪結(jié)束時所觀察到的全部發(fā)病者作為病例組,再在隊列中選擇一定數(shù)量的未發(fā)病者作為對照組,進(jìn)行的病例對照研究。
巢式病例對照研究是將隊列研究設(shè)計和病例對照研究設(shè)計結(jié)合起來進(jìn)行的研究,因此同時具有兩種設(shè)計的特征,其優(yōu)點(diǎn)為:
1)前瞻性:隊列研究是由暴露開始隨訪至結(jié)局出現(xiàn),是先“因”后“果”的研究,巢式病例對照研究應(yīng)用的是隊列研究的暴露與結(jié)局事件,也是先“因”后“果”的,在因果時序關(guān)系上為前瞻性的。因此,巢式病例對照研究克服了普通病例對照研究不能判斷“因”與“果”時序性的缺陷,極大提高了所獲得的病因?qū)W證據(jù)的力度。
2)可比性:巢式病例對照研究的病例與對照來自同一個隊列人群,病例組與對照組同質(zhì)性好,可以提高組間的可比性,降低選擇偏倚。
3.2.3.2 病例隊列研究(case-cohort study)在隊列研究的起始,隨機(jī)抽取一個樣本作為對照組,在隨訪結(jié)束時將全部新發(fā)病人作為病例組,進(jìn)行的病例對照研究。病例隊列研究也是隊列研究與病例對照研究方法的結(jié)合,與巢式病例對照研究的不同點(diǎn)是:①對照是隨機(jī)的,巢式病例對照研究是在隊列研究結(jié)束時,按照匹配條件在未發(fā)病人群中選定的,而病例隊列研究的對照組是在隊列研究開始隨機(jī)選定的,雖然不一定與病例匹配,但能夠較好地代表產(chǎn)生病例的源人群的特征;②對照是在病例發(fā)生前選定的,而巢式病例對照研究是在病例發(fā)生之后選定的;③對照中含有病例,因為病例隊列研究的對照是在隊列建立時選定的一個隨機(jī)樣本,隨訪結(jié)束時樣本中也有出現(xiàn)病例的可能,但為了保持樣本的完整性,病例是不剔除的。對照中含有病例在某種程度上會降低研究結(jié)果的靈敏度,低估暴露與疾病的關(guān)系。
(未完待續(xù))
作者單位:063210河北省唐山市,華北理工大學(xué)