1. 忽略統(tǒng)計學方法使用的前提條件 隨著統(tǒng)計軟件的廣泛應用,有些醫(yī)學生獲得數據后直接選擇軟件中常見的幾種統(tǒng)計學方法進行分析,完全不考慮本研究的數據是否滿足該方法的使用條件。例如,醫(yī)學研究中經常要進行兩組或多組間均數的比較,有些醫(yī)學生直接就采用t檢驗或方差分析進行統(tǒng)計。實際上,t檢驗和方差分析都是參數檢驗,需要滿足前提條件:正態(tài)性和方差齊性。正態(tài)性是指各組資料要服從正態(tài)分布(或近似正態(tài)分布);方差齊性指各組資料取自的總體方差相等。目前常用的統(tǒng)計軟件都可以對資料的正態(tài)性和方差齊性進行驗證,但是很多學生都忽略了這一步,因而可能出現統(tǒng)計學問題。只有按照各種統(tǒng)計學方法自身的適用條件來合理使用,統(tǒng)計方法才能成為發(fā)現數據內在統(tǒng)計規(guī)律的有力工具。
2. 忽略研究設計,盲目套用統(tǒng)計方法 (1) 誤用t檢驗處理單因素多水平資料:t檢驗和方差分析是醫(yī)學論文中最常用的、也通常被認為是最簡單的統(tǒng)計學方法,然而實際應用中的正確率卻低于10%[2]。除了上述的說明不清楚和忽略使用條件的問題外,忽略研究設計也常常是導致t檢驗和方差分析使用錯誤的原因。對于呈正態(tài)分布的單因素多水平定量資料,兩組間的比較可用t檢驗;兩組以上資料的比較則需選用方差分析。有些醫(yī)學生簡單地使用t檢驗來處理多組間的比較。這樣做的問題是由于多次采用t檢驗,增加了假陽性錯誤的概率;同時失去了原來多組設計的意義,不能給出概括性的結論,因此結論不可靠。正確的方法是當滿足方差分析的前提條件時應采用單因素多水平定量資料的方差分析;當檢驗結果為各組總體均數間不完全相等時,再進一步進行組間均數的兩兩比較。如果當任何兩個均數之間都要比較,可采用SNK法,而如果要分別將各試驗組與同一個對照組比較,可采用Dunnett法。當資料不滿足方差分析的前提條件時,需對資料進行數據正態(tài)化處理或采用秩和檢驗。
(2)誤用單因素方差分析處理重復測量的資料:醫(yī)學研究中常需要對同一受試對象的某項指標在不同時點進行重復測量,此類資料即為重復測量的資料,例如研究對象服用某種藥物后多個時間點的血壓值。由于同一個體不同次測量的結果往往存在相關性,這時用單因素多水平方差分析來比較不同時點的測量結果是不恰當的,因為單因素方差分析要求各比較組間是獨立的。如果僅將兩個時間點上的數據放在一起進行配對t檢驗則割裂了原來多組比較的整體設計。正確方法的方法是先判斷重復測量數據之間是否存在相關性(如SPSS的球形檢驗),如不存在相關性,則采用單因素方差分析即可;如存在相關性,則需進行重復測量數據的方差分析[3]。
(3)誤用χ2檢驗處理有序的列聯表資料:對于定性資料,很多醫(yī)學生都會直接應用χ2檢驗來處理。實際上,因研究設計的不同,定性資料的列聯表又分為雙向無序的列聯表、單向有序的列聯表和雙向有序的列聯表等不同類型。對于雙向無序的列聯表,可采用χ2檢驗進行分析。但需注意的是在列聯表的χ2檢驗中,若P<0.05,只能得出總的結論。如需進行兩兩比較時,因為重復多次的檢驗將使第一類錯誤擴大,因此需重新設定檢驗水準,通常采用α′=α/N,其中N為所需檢驗的次數[4]。此外,醫(yī)學研究中還經常將某種定性的測量指標分成若干個有序的等級,如疾病的不同嚴重程度和預后的不同水平等,然后分類計數各組研究對象的具體狀態(tài)。這種資料屬于有序的(等級的)列聯表資料,看似可以用χ2檢驗處理,但χ2檢驗只能比較各組的構成,而與順序或等級無關,因而此類資料應采用與分組順序有關的檢驗方法,如秩和檢驗和Ridit分析等[5]。
(4)將非同質的研究對象合并進行相關分析:臨床研究中經常采用病例-對照研究的設計,如糖尿病患者和正常對照,有時還需按患者的不同特征分為多組,如血糖正常、空腹血糖受損、糖耐量減低和糖尿病四種情況。為了突出總樣本量,有些醫(yī)學生把所有研究對象合計在一起進行分析。事實上,由于各組研究對象在生物學特征上可能有明顯差異,這種合并分析需特別謹慎。尤其是進行相關分析時,指標之間的關系在不同組之間可能完全不同,即研究對象不同質,因此不應合并在一起進行相關分析。