史蕓萍 劉軍廷 么鴻雁 于石成 王琦琦 胡躍華
?
·流行病學(xué)與統(tǒng)計(jì)學(xué)方法·
統(tǒng)計(jì)學(xué)方法的合理選擇和常見(jiàn)誤區(qū)
史蕓萍 劉軍廷 么鴻雁 于石成 王琦琦 胡躍華
統(tǒng)計(jì)學(xué)是幫助人們透過(guò)“偶然性”掌握事物發(fā)展規(guī)律的重要工具,但現(xiàn)狀卻是很多學(xué)者不重視統(tǒng)計(jì)學(xué)甚至不具備基本的統(tǒng)計(jì)技能。本文以“統(tǒng)計(jì)資料類型”為著手點(diǎn),對(duì)統(tǒng)計(jì)學(xué)方法的選擇進(jìn)行了系統(tǒng)介紹,并匯總了文獻(xiàn)中常見(jiàn)的統(tǒng)計(jì)方法誤區(qū),期望引起廣大學(xué)者對(duì)統(tǒng)計(jì)學(xué)方法的重視。
統(tǒng)計(jì)學(xué); 人口統(tǒng)計(jì)學(xué); 生物統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)學(xué)的應(yīng)用貫穿于整個(gè)科學(xué)研究過(guò)程中,包括研究設(shè)計(jì)、資料收集整理、分析方法和軟件選擇,以及最終的結(jié)果解釋。英國(guó)著名統(tǒng)計(jì)學(xué)家高爾頓曾說(shuō):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的超凡能力,當(dāng)科學(xué)探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),惟有統(tǒng)計(jì)學(xué)可以幫助他們打開(kāi)一條通道?!笨墒?,統(tǒng)計(jì)學(xué)也很容易被誤用或?yàn)E用。Nature雜志于2014年發(fā)表的評(píng)論文章Numbercrouch中提到:很多研究者缺乏統(tǒng)計(jì)學(xué)基本知識(shí),普遍存在統(tǒng)計(jì)學(xué)方法誤用現(xiàn)象,在一些基礎(chǔ)科學(xué)領(lǐng)域這種情況十分嚴(yán)重[1]。關(guān)于文獻(xiàn)中的統(tǒng)計(jì)學(xué)問(wèn)題,早在二十世紀(jì)30年代就已展開(kāi)討論[2],來(lái)自不同領(lǐng)域的研究者們發(fā)現(xiàn),很多科學(xué)文獻(xiàn)中存在統(tǒng)計(jì)學(xué)錯(cuò)誤,甚至包括那些發(fā)表在影響因子很高的雜志的文章[3-4]。二十世紀(jì)80年代,國(guó)外的醫(yī)學(xué)文獻(xiàn)審稿人發(fā)現(xiàn),統(tǒng)計(jì)學(xué)方法使用不正確的文章大約占50%[5]。我國(guó)學(xué)者也指出:“我國(guó)科技期刊,尤其是醫(yī)學(xué)期刊中,存在大量的誤用和濫用統(tǒng)計(jì)學(xué)方法的現(xiàn)象[6]。筆者就統(tǒng)計(jì)學(xué)方法的合理選擇進(jìn)行匯總分析,并指出統(tǒng)計(jì)學(xué)方法選擇的常見(jiàn)誤區(qū),旨在幫助讀者避免常見(jiàn)錯(cuò)誤,正確使用統(tǒng)計(jì)學(xué)方法。
合理選擇統(tǒng)計(jì)學(xué)分析方法的首要前提是正確識(shí)別統(tǒng)計(jì)資料類型。資料類型的現(xiàn)代劃分法將資料先分成定量資料和定性資料兩大類。其中,定量資料是測(cè)量每個(gè)觀察單位某項(xiàng)指標(biāo)值大小所得到的資料;定性資料是觀測(cè)每個(gè)觀察單位某項(xiàng)指標(biāo)質(zhì)的狀況所得的資料。
定量資料又劃分為計(jì)量資料和計(jì)數(shù)資料。計(jì)量資料是指標(biāo)的取值可以帶度量衡單位,甚至可以帶表示測(cè)量精度的小數(shù)位的定量資料,例如測(cè)量正常成年男女的身高(cm)、體質(zhì)量(kg)、血紅蛋白(g/L)、體溫(℃)等所得的資料。計(jì)數(shù)資料是指標(biāo)的取值可以帶度量衡單位,但不可以帶小數(shù),只能取整數(shù),通常為正整數(shù)的定量資料;例如,測(cè)得正常成年男子脈搏數(shù)(次/min)、引體向上次數(shù)(次/min)、現(xiàn)有子女?dāng)?shù)(個(gè))等所得的資料。
定性資料又劃分為名義資料和有序資料。名義資料是指標(biāo)的不同狀況之間在本質(zhì)上沒(méi)有數(shù)量大小或先后順序之分的定性資料,可分為二項(xiàng)分類名義資料和多項(xiàng)分類名義資料。二項(xiàng)分類名義資料舉例:檢查某小學(xué)學(xué)生大便中的蛔蟲(chóng)卵,以每名學(xué)生為觀察單位,結(jié)果分為蛔蟲(chóng)卵陽(yáng)性或陰性所得的資料;觀察某藥治療某病患者的治療結(jié)果,以每例患者為觀察單位,結(jié)果分為治愈和未治愈所得的資料。多項(xiàng)分類名義資料舉例:某學(xué)校全體師生按血型A、B、O、AB來(lái)記錄每個(gè)人的情況所得的資料;某鄉(xiāng)鎮(zhèn)全體居民按人群分類(散居兒童、幼托兒童、學(xué)生、教師、農(nóng)民、工人、干部職員、家務(wù)及待業(yè)等)記錄每個(gè)人的情況所得資料。有序資料是指標(biāo)的不同狀況之間在本質(zhì)上有數(shù)量大小或先后順序之分的定性資料,例如:測(cè)定某化工廠全體職員血清反應(yīng),結(jié)果可分為“-、±、+、++”四級(jí)所得到的資料;觀察某藥治療某病患者的治療效果,分為治愈、顯效、好轉(zhuǎn)、無(wú)效、死亡所得到的資料。
(一)常用方法
對(duì)于定量資料,常用的描述指標(biāo)分為兩類,一類是描述數(shù)據(jù)分布集中趨勢(shì)的指標(biāo),另一類是描述數(shù)據(jù)分布的離散程度的指標(biāo)。其中,描述集中趨勢(shì)的指標(biāo)主要包括算術(shù)均數(shù)、幾何均數(shù)、中位數(shù);描述離散趨勢(shì)的統(tǒng)計(jì)指標(biāo)主要包括極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。
對(duì)于定性資料,常用的描述指標(biāo)有相對(duì)數(shù),包括比和率。相對(duì)數(shù)可以分為結(jié)構(gòu)相對(duì)數(shù)和強(qiáng)度相對(duì)數(shù),比反映部分與整體或某一部分與另一部分之間的關(guān)系,屬結(jié)構(gòu)相對(duì)數(shù);率反映某種事物或現(xiàn)象發(fā)生的強(qiáng)度,屬?gòu)?qiáng)度相對(duì)數(shù)。常用的相對(duì)數(shù)指標(biāo)包括率、構(gòu)成比、相對(duì)比、動(dòng)態(tài)數(shù)列的定基比和環(huán)比。
(二)定量資料常見(jiàn)誤區(qū)
1.使用均數(shù)描述偏態(tài)資料的集中趨勢(shì):算術(shù)均數(shù)適用于描述對(duì)稱分布資料,特別是滿足正態(tài)分布資料的集中趨勢(shì);幾何均數(shù)適用于原始數(shù)據(jù)不對(duì)稱、但經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料。而中位數(shù)則適用于任何分布的資料,包括對(duì)稱的、偏態(tài)的、開(kāi)口的。需要根據(jù)資料分布情況來(lái)選擇合適的描述指標(biāo),不能一出現(xiàn)對(duì)資料進(jìn)行描述就采用均數(shù)加減標(biāo)準(zhǔn)差的形式。例如,描述正常人血鉛含量時(shí),因血鉛含量呈偏態(tài)分布,不應(yīng)再用均值來(lái)描述。《中國(guó)防癆雜志》2015年11月第37卷第11期的一篇文章[7]中,在描述“取樣時(shí)病程”和“取樣時(shí)抗結(jié)核治療時(shí)間”也是采用均數(shù)加減標(biāo)準(zhǔn)差的形式,但文獻(xiàn)中數(shù)據(jù)顯示,標(biāo)準(zhǔn)差與均值接近甚至標(biāo)準(zhǔn)差大于均值,數(shù)據(jù)資料明顯不服從正態(tài)分布,應(yīng)采用中位數(shù)(四分位間距)描述更為恰當(dāng)。
2.混淆標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤:標(biāo)準(zhǔn)差用來(lái)描述數(shù)據(jù)分布的離散程度,表示觀察值之間波動(dòng)的大??;而標(biāo)準(zhǔn)誤用來(lái)描述樣本均數(shù)間的離散程度,可以表示均數(shù)抽樣誤差的大小。前者可與均數(shù)一起計(jì)算正常值范圍,后者可計(jì)算置信區(qū)間,文獻(xiàn)中有混用現(xiàn)象。
(三)定性資料常見(jiàn)誤區(qū)
1.構(gòu)成比與率混淆濫用:構(gòu)成比只能說(shuō)明事物各組成部分的比重或分布,率是用來(lái)描述某種現(xiàn)象發(fā)生的頻率或強(qiáng)度。兩者概念和計(jì)數(shù)方法都不同,所得結(jié)論也不同。文獻(xiàn)中容易發(fā)生用構(gòu)成比代替率來(lái)表達(dá)強(qiáng)度,并得出錯(cuò)誤結(jié)論。還要注意,不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析。例如文獻(xiàn)[7]中,描述研究對(duì)象的一般情況時(shí),制作的表1將構(gòu)成比以“率(%)”來(lái)描述,且表中數(shù)據(jù)與文中描述不符。
2.計(jì)算相對(duì)數(shù)的分母過(guò)小:如果觀察單位過(guò)少,那么偶然性就大,則其可靠性就差。例如,觀察某藥物療效時(shí),5例患者,4例有效,1例無(wú)效,不能說(shuō)該藥物有效率為80%。一般當(dāng)觀察例數(shù)較少時(shí),如觀察例數(shù)少于30例時(shí),采用絕對(duì)數(shù)表示為好。通常觀察單位足夠多時(shí),計(jì)算出的相對(duì)數(shù)比較穩(wěn)定,能夠正確反映實(shí)際情況。
3.相對(duì)數(shù)比較時(shí)忽略了可比性:影響率或構(gòu)成比變化的因素很多,除了要比較的研究因素外,其余的影響因素應(yīng)盡可能相同或相近。一旦其他影響因素不同或者差異很大而直接進(jìn)行分析和比較時(shí),往往會(huì)得到錯(cuò)誤的結(jié)果和結(jié)論。但實(shí)際應(yīng)用中,很多學(xué)者只關(guān)注研究因素,而把其余的影響因素,如觀察時(shí)間、地區(qū)、民族、性別、年齡等因素忽略了。例如,分析某工廠不同工種工人的疾病發(fā)病規(guī)律時(shí),要考慮年齡、工齡、工種、病程、環(huán)境條件等因素;比較兩地人口某病發(fā)病及死亡情況時(shí),應(yīng)考慮兩地人口構(gòu)成。《中國(guó)防癆雜志》2015年第37卷第9期中的一篇文章[8]對(duì)正常組和異常組利福平血藥濃度進(jìn)行了比較,但治療時(shí)間的長(zhǎng)短對(duì)血藥濃度有直接影響,文中就未考慮或未對(duì)治療和服藥時(shí)間因素進(jìn)行交代。
(一)常用方法
對(duì)于定量資料,常用到的基本的統(tǒng)計(jì)學(xué)分析方法有t檢驗(yàn)、方差分析、相關(guān)與回歸等。要想做到合理選用定量資料統(tǒng)計(jì)分析方法,關(guān)鍵在于做好以下兩點(diǎn):第一,正確判斷定量資料所應(yīng)用的實(shí)驗(yàn)設(shè)計(jì)類型;第二,檢查資料是否滿足“正態(tài)分布、獨(dú)立性和方差齊性”3個(gè)前提條件。
對(duì)于定性資料,當(dāng)原因變量全是定性變量時(shí),常用到的基本的統(tǒng)計(jì)學(xué)分析方法包括卡方檢驗(yàn)、秩和檢驗(yàn)、Spearman秩相關(guān)檢驗(yàn)、Kappa檢驗(yàn)等;當(dāng)原因變量既有定性變量,又有定量變量時(shí),需要根據(jù)實(shí)驗(yàn)?zāi)康膩?lái)選擇是將資料離散化還是設(shè)置啞變量采用logistic回歸分析方法;當(dāng)原因變量全為定量變量時(shí),可直接采用logistic回歸分析方法。
(二)定量資料常見(jiàn)誤區(qū)
1.直接進(jìn)行分析未判斷方法的前提條件:文獻(xiàn)中會(huì)出現(xiàn)拿到定量資料后不進(jìn)行判斷甚至在不滿足前提條件的情況下,仍舊直接進(jìn)行統(tǒng)計(jì)學(xué)分析。但不論是t檢驗(yàn)、方差分析還是相關(guān)與回歸,都有著方法自身的前提條件。如t檢驗(yàn)要求資料正態(tài)、獨(dú)立和方差齊性;直線相關(guān)分析要求雙變量滿足雙變量正態(tài)分布等。當(dāng)資料不滿足條件時(shí),可尋找其他分析方法。例如,t檢驗(yàn)如果資料不滿足正態(tài)性條件,可以對(duì)數(shù)據(jù)進(jìn)行變量變換后再進(jìn)行正態(tài)性檢驗(yàn),然后進(jìn)行分析;或者,可以采用非參數(shù)檢驗(yàn)方法。
2.選擇統(tǒng)計(jì)學(xué)分析方法時(shí)未正確判斷實(shí)驗(yàn)設(shè)計(jì)類型:多因素實(shí)驗(yàn)設(shè)計(jì)本身就復(fù)雜,再加上收集資料表達(dá)形式多樣化(未必一定是標(biāo)準(zhǔn)的樣子),一旦缺乏一定的統(tǒng)計(jì)能力,就會(huì)被資料的表象所迷惑,不能正確判斷實(shí)驗(yàn)設(shè)計(jì)類型,例如,將兩因素析因設(shè)計(jì)看成單因素四水平設(shè)計(jì)或成組設(shè)計(jì)。因此,成組、配伍組、配對(duì)、交叉等基本實(shí)驗(yàn)設(shè)計(jì)方法一定要分清楚。
3.t檢驗(yàn)的誤用:不考察定量資料所對(duì)應(yīng)的實(shí)驗(yàn)設(shè)計(jì)類型,不檢查定量資料是否滿足“正態(tài)、獨(dú)立和方差齊性”的條件,只要看到資料為定量資料,就使用t檢驗(yàn)進(jìn)行分析。成組設(shè)計(jì)、配對(duì)設(shè)計(jì)、單因素多水平設(shè)計(jì)的t檢驗(yàn)互相混用,甚至對(duì)多組均數(shù)的比較也采用t檢驗(yàn)進(jìn)行兩兩比較。
4.方差分析的誤用:醫(yī)學(xué)文獻(xiàn)中經(jīng)常涉及到重復(fù)測(cè)量資料,因重復(fù)測(cè)量數(shù)據(jù)間存在一定的自相關(guān)性和隨機(jī)誤差的多層次性,直接使用普通的方差分析方法來(lái)分析重復(fù)測(cè)量資料是不妥的。正確判斷資料實(shí)驗(yàn)設(shè)計(jì)類型,如果為重復(fù)測(cè)量資料,應(yīng)該采用重復(fù)測(cè)量的方差分析方法進(jìn)行分析。
(三)定性資料常見(jiàn)誤區(qū)
1.對(duì)于四格表,不區(qū)分普通卡方與確切概率法:很多人在看到普通四格表定性資料時(shí),隨手就進(jìn)行普通卡方檢驗(yàn)。其實(shí)應(yīng)首先判斷資料的情況。例如,對(duì)于普通的四格表,當(dāng)樣本量≥40并且所有理論頻數(shù)>5時(shí),可以用普通的卡方檢驗(yàn);當(dāng)樣本量≥40而有理論頻數(shù)在1~5之間時(shí),應(yīng)使用校正的卡方檢驗(yàn);當(dāng)樣本量<40或者有理論頻數(shù)<1時(shí),則應(yīng)該使用確切概率法,不能在應(yīng)該使用確切概率法時(shí)還在用普通的卡方檢驗(yàn)。而在分析R×C表資料時(shí),除了上述方法外,一旦分析的數(shù)據(jù)出現(xiàn)了理論頻數(shù)<1,或者理論頻數(shù)≥1且<5的格子數(shù)超過(guò)格子總數(shù)的1/5,還可以通過(guò)增加樣本量,使理論頻數(shù)增大;或者根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或者看能否將理論頻數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列進(jìn)行合并來(lái)解決。
2.對(duì)于復(fù)雜的R×C列聯(lián)表,不判斷資料是否有序:不同情況的列聯(lián)表,需選取不同的分析方法。對(duì)于復(fù)雜的R×C列聯(lián)表,要在錯(cuò)綜復(fù)雜的實(shí)際問(wèn)題中,看清事物的本質(zhì)面目。例如,單向有序列聯(lián)表可采用“秩和檢驗(yàn)或Ridit分析,或有序資料的logistic 回歸模型”進(jìn)行處理;兩有序變量之間的相關(guān)關(guān)系可采用Spearman秩相關(guān)分析或典型相關(guān)分析進(jìn)行處理;兩有序變量之間的線性變化趨勢(shì)可采用線性趨勢(shì)檢驗(yàn)進(jìn)行分析。對(duì)于高維列聯(lián)表資料,根據(jù)分析目的,則可選用加權(quán)卡方檢驗(yàn)、對(duì)數(shù)線性模型、一般的logistic回歸模型或有序資料的logistic回歸模型進(jìn)行分析。
綜上所述,只有在科學(xué)地進(jìn)行實(shí)驗(yàn)設(shè)計(jì),合理地進(jìn)行資料收集和數(shù)據(jù)整理,準(zhǔn)確地判斷實(shí)驗(yàn)類型的前提下,才有可能選取正確的統(tǒng)計(jì)學(xué)分析方法。在避開(kāi)常見(jiàn)統(tǒng)計(jì)學(xué)錯(cuò)誤的同時(shí),還需注意統(tǒng)計(jì)圖表的表達(dá)、統(tǒng)計(jì)結(jié)果的表述等,也需要遵循統(tǒng)計(jì)學(xué)要求。
[1] Number crunch. Nature, 2014,506(13):131-132.
[2] Mainland D. Chance and the blood count. Can Med Assoc J, 1934, 30(2):225-227.
[3] Gore SM, Jones G, Thompson SG. The Lancet’s statistical review process: areas for improvement by authors. Lancet, 1992, 340(8811):100-102.
[4] Schor S, Karten I. Statistical evaluation of medical journal manuscripts. JAMA, 1966, 195(13):1123-1128.
[5] Glantz SA. Biostatistics: how to detect, correct and prevent errors in the medical literature. Circulation, 1980,61(1):1-7.
[6] 胡良平,李子建. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與典型錯(cuò)誤辨析.北京:軍事醫(yī)學(xué)科學(xué)出版社,2003:2.
[7] 梁瑞霞,谷蘊(yùn)婷,董偉杰,等. 兩種分子檢測(cè)技術(shù)快速診斷骨關(guān)節(jié)結(jié)核及其耐藥性的研究. 中國(guó)防癆雜志,2015, 37(11):1126-1129.
[8] 鄧國(guó)防,孫麗珍,詹森林,等. 有機(jī)陰離子轉(zhuǎn)運(yùn)多肽1B1基因多態(tài)性和利福平血藥濃度對(duì)肝毒性的影響. 中國(guó)防癆雜志,2015, 37(9):933-937.
(本文編輯:李敬文)
Proper selection and common pitfalls of statistical methods
SHIYun-ping*,LIUJun-ting,YAOHong-yan,YUShi-cheng,WANGQi-qi,HUYue-hua.
*DepartmentofStatisticsandInformation,BeijingCenterforDiseasesControlandPrevention,Beijing100013,China
Correspondingauthor:HUYue-hua,Email:huyueer@163.com
Statistics is an important tool that helping people master the law of things through the accidental, however, currently many scholars do not care statistics enough or even have no basic statistical skills. This article systemly introduces the selection of statistical method based on types of statistical data, as well as summarizes common statistical methods pitfalls in literature, in order to make scholars pay more attention to statistics.
Statistics; Demography; Biometry
10.3969/j.issn.1000-6621.2016.05.004
中國(guó)疾病預(yù)防控制中心青年科研基金課題(2016A201)
100013 北京市疾病預(yù)防控中心信息統(tǒng)計(jì)中心(史蕓萍);首都兒科研究所流行病學(xué)研究室(劉軍廷);中國(guó)疾病預(yù)防控制中心流行病學(xué)辦公室(么鴻雁、于石成、王琦琦、胡躍華)
胡躍華,Email: huyueer@163.com
2016-04-17)