高藝祥,楊民紅,李蘭會
(1.河北農業(yè)大學動物醫(yī)學院,河北 保定 071001;2.河北省新樂市農林畜牧局農業(yè)行政綜合執(zhí)法大隊,河北 新樂050700;3.河北農業(yè)大學動物科技學院,河北 保定 071001)
醫(yī)學統(tǒng)計學是臨床醫(yī)學、基礎醫(yī)學、公共衛(wèi)生學和醫(yī)療衛(wèi)生服務研究的一門基礎學科[1],研究對象主要是醫(yī)學中具有不確定性結果的事物,其主要作用是通過數據的偶然性揭示內在的規(guī)律性[2]。統(tǒng)計分析的要點是正確地選用統(tǒng)計分析方法,并結合專業(yè)知識做出科學的結論??茖W的任務就在于,從看起來錯綜復雜的偶然性中揭露出潛在的必然性,即事物的客觀規(guī)律性。這種客觀規(guī)律性是在大量現象中發(fā)現的,例如臨床要觀察某種療法對某病的療效時,如果觀察的病人較少,便不容易正確判斷該療法對某病是否有效;但當觀察病人的數量足夠多時,就可以得出該療法在一定程度上有效或無效的結論,因此,醫(yī)學統(tǒng)計學是醫(yī)學科學研究的重要工具。
醫(yī)學統(tǒng)計學的內容包括:①定量數據的統(tǒng)計描述。主要內容包括集中趨勢的統(tǒng)計指標:算數均數、幾何均數、中位數和百分位數。變異程度的統(tǒng)計指標:極差、四分位數間距、方差、標準差、變異系數。②總體指標的估計。醫(yī)學研究中實際觀測或調查的部分個體稱為樣本,研究對象的全體稱為總體。除用均數、率等統(tǒng)計指標對調查或實驗結果進行描述外,更重要的是通過樣本的信息,來估計總體中相應的統(tǒng)計指標,即參數估計。③假設檢驗。就是依據資料性質和所需解決的問題,先建立適當的假設,然后采用適當的檢驗方法。④基本的運算工具是假設檢驗的方法工具:U檢驗、t檢驗、方差分析和 χ2檢驗[3]。
以馬斌榮主編的醫(yī)學統(tǒng)計學教材為例[1],解釋說明應用Excel和SPSS統(tǒng)計工具進行獨立樣本t檢驗的基本過程?!澳稠椦芯吭u估低氧環(huán)境對運動者心肌血流量的影響,將17名男性志愿者隨機分為2組,分別在正常含氧環(huán)境(正常組)和低氧環(huán)境 (低氧組)中測定運動后的心肌血流量[mL/(min·g)]:正常組為 3.5、3.1、3.1、2.7、2.5、2.3、2.3、2.2、2.2 mL/(min·g); 低氧組為 6.4、5.7、5.6、5.3、5.1、4.9、4.7、3.5 mL/(min·g)。 問 2 種環(huán)境中運動者的心肌血流量有無差異?”。
表1 Excel的F檢驗·雙樣本方差輸出結果(一)
兩獨立樣本t檢驗,又稱成組t檢驗,它適用于完全隨機設計的兩樣本均數比較,其目的是檢驗兩樣本代表的總體均數是否相等,即通過x1和推斷μ1和μ2。該案例在于揭示氧氣濃度不同對運動者的生理狀態(tài)是否有影響,將志愿者隨機分為2組,采用了完全隨機的試驗設計方法,通過低氧和正常環(huán)境2種環(huán)境下志愿者運動后的心肌血流量揭示氧氣濃度與生理狀態(tài)間是否存在關系。
利用Excel分析操作步驟分兩步,第一步是進行F檢驗,工具→數據分析→F檢驗·雙樣本方差,F檢驗的目的在于分析兩樣本數據的總體方差和是否相等;第二步在F檢驗的基礎上進行t檢驗,推斷兩總體均值μ1和μ2是否相等,主要分兩種情況:如果方差相等,則進行等方差假設的t檢驗,否則進行異方差假設的t檢驗[4]。
由Excel雙樣本方差輸出結果(見表1)可知,低氧組和正常組的心肌血流量樣本均值分別為5.15和2.66, 方差和分別為0.73和0.23,兩樣本的樣本含量分別為8和9,兩樣本自由度分別為7和8。F檢驗的F檢驗統(tǒng)計量為3.22,F為兩樣本方差的比值,即F==0.73/0.23=3.22,F值3.22在自由度df1和df2分別為7和8的F分布下出現的單尾概率P=0.06,該概率為F值小于3.22的區(qū)間概率,即F值為0~3.22在F分布總體0~+∞中所占的百分比,由此可知,F值的概率大于0.05,不是小概率,所以認為兩樣本間的差異是由實驗誤差引起的,兩總體方差和相等。同時輸出結果中F單尾臨界值3.50,即否定域和接受域的分界線為3.50,0~3.50的區(qū)域為接受域,F分布的右尾3.50~+∞的區(qū)域為否定域,所以F值3.22落在接受域,不能否定H0,兩樣本所在總體方差相等。
表2 Excel的F檢驗·雙樣本方差輸出結果(二)
Excel操作過程中重新進行F檢驗,但變換變量1和變量2的區(qū)域,即低氧組設為變量2,正常組為變量1,輸出結果見表2。
通過表1和表2的對比可知交換變量后,正常組和低氧組的平均數、方差、觀測值、自由度、單尾P值都沒有變化,而統(tǒng)計量F值和F的單尾臨界值發(fā)生了改變。表2中,在自由度df1和df2分別為8和7的F分布下出現的單尾概率P=0.06,即F值為0~0.31在F分布總體0~+∞中所占的百分比為6%。表2中F單尾臨界值0.29,由于變化了兩個變量的位置,F值否定域改變?yōu)镕分布的左尾:0~0.29,0.29~+∞ 為接受域, 所以 F 值 0.31 落在接受域,不能否定H0,兩樣本所在總體方差相等,因此,交換變量后并沒有發(fā)生實質性的變化,最后的結論依然不變。
Excel分析工具中有等方差假設和異方差假設的兩種獨立樣本t檢驗工具[5],根據雙樣本方差分析結果,該例選用等方差假設的獨立樣本t檢驗,Excel輸出的t檢驗結果見表3。根據t檢驗的輸出結果,可以由4個統(tǒng)計量推斷低氧組和正常組兩總體均值心肌血流量是否相等,分別是單尾概率、單尾臨界值、雙尾概率和雙尾臨界值。
由表3可知,低氧組和正常組的合并方差t檢驗統(tǒng)計量:
表3 Excel的等方差假設t檢驗輸出結果
①由單尾概率推斷:t值7.58在自由度為15的t分布下出現的單尾概率P=8.33×10-7,該概率為t值大于等于7.58的區(qū)間概率,即t值為7.58~∞在t分布總體-∞~+∞中所占的百分比,由此可知,t值的概率小于0.05,是小概率,拒絕H0可認為兩總體均值μ1和μ2不相等。
②由單尾臨界值推斷:t單尾臨界值1.75,即否定域和接受域的分界線為1.75,-∞~1.75的區(qū)域為接受域,1.75~+∞的區(qū)域為否定域,所以t值7.58落在拒絕域,否定H0,兩樣本所在總體均值不相等。
③由雙尾概率推斷:t值7.58在自由度為15的t分布下出現的雙尾概率P=1.67×10-6,該概率為t值7.58落在該t分布總體的兩個尾部的概率,即t值在-∞~-7.58和7.58~+∞2個尾部的區(qū)間概率。該概率小于0.05,根據小概率實際不可能原理拒絕H0,認為兩總體均值不相等。
④根據t雙尾臨界值2.13,即自由度15的t分布總體中-∞~-2.13和2.13~+∞的區(qū)域為拒絕域,-2.13~2.13的區(qū)域為接受域,所以t值7.58落在拒絕域,否定H0,兩樣本所在總體均值不相等。
利用SPSS分析操作步驟為分析→比較均值→獨立樣本t檢驗,輸出結果見表4。SPSS的獨立樣本t檢驗結果中的內容涵蓋了Excel的雙樣本方差檢驗、兩樣本等方差t檢驗和雙樣本異方差t檢驗的結果。
SPSS的方差齊性檢驗方法與Excel不同,采用的Levene檢驗方法[6],從輸出結果的F值及其概率進行推斷,概率為0.33>0.05,所以不能否定H0:,推斷兩總體方差相等,所以后面采用等方差假設的t檢驗結果進行推斷。t=-7.58,與Excel的結果完全一致,但表4中無單尾概率,只有雙尾概率0.00<0.05,也沒有臨界值,但推斷結論與Excel完全一致,否定H0,認為μ1和μ2不相等。
表4同時給出平均值差值,即表面效應和實驗誤差分別為平均值差值:-=2.49和差值標準誤 SX1-X2=0.33,二者的比值即 t值(公式 2),t是表面效應和實驗誤差(差值標準誤)大小比較,如果表面效應的大小遠遠超出實驗誤差能解釋的數據變異范圍,即t值較大,那么表面效應就不單純是由實驗誤差引起的,還有本質效應μ1-μ2起作用;反之,表面效應是由實驗誤差引起的,本質效應不存在。表4同時給出了本質效應的估計值,差值95%的置信區(qū)間1.79~3.20,該區(qū)間大于0,不包括零假設的μ1-μ2=0,所以推斷本質效應存在,低氧組的心肌血流量高于正常組。這一研究結果提示人們鍛煉身體所處的環(huán)境對身體生理狀態(tài)有顯著影響,因此選擇舒適的外圍環(huán)境是強身健體的首選。
Excel中的方差齊性檢驗為單側檢驗,當大方差比小方差時,F值大于1,否定域位于F分布總體的右尾部;當小方差比大方差時,F值小于1,否定域位于F分布總體的左尾部。該案例調換變量1和變量2的取值后,計算得到的F值互為倒數,F臨界值也互為倒數,F值出現的單尾概率不變,推斷結論不發(fā)生改變。
表4 SPSS的獨立樣本t檢驗結果
根據雙樣本方差分析結果,即兩樣本所在總體方差是否相等,選擇等方差和異方差假設的t檢驗推斷兩樣本總體均值是否相等。等方差假設t檢驗進行推斷估計的準確度高,如果方差不等,對計算的t值或自由度進行調整,如表4顯示異方差假設的t值和自由度都進行了矯正,目的在于降低估計誤差,提高估計準確度。
Excel的雙樣本t檢驗的輸出結果中有單側概率及其臨界值和雙側概率及其臨界值,即分別是進行單側檢驗和雙側檢驗的推斷依據。單側和雙側檢驗多數情況的推斷結論是一致的,但也有出現矛盾的時候,具體是按單側還是雙側則應根據題干要求進行選擇,如果分析兩個處理哪個高哪個低,則選擇單側檢驗;如果分析兩個處理是否相同或不同,則選擇雙側檢驗。
SPSS的輸出結果更為完整,雖然沒有列出臨界值,臨界值的應用是由于過去沒有計算機,直接計算概率困難,借用臨界值作為標準;現在計算簡單方便,計算得到統(tǒng)計量后,其概率可以直接得出,所以直接利用統(tǒng)計量的概率即可進行推斷。另外,SPSS給出了表面效應、實驗誤差的大小,以及本質效應的估計值,也可以由本質效應進行推斷。醫(yī)用生物統(tǒng)計課程性質的特殊性決定了學習方式的靈活多樣性,生物統(tǒng)計學的生命在于應用,統(tǒng)計的價值和魅力只有在解決實際問題的應用中才能得以體現[7-8]。學生在上機實驗時結合SPSS和Excel程序運行統(tǒng)計分析、習題課等多種學習方式[9]可以有效提高其學習興趣,并能強化學習效果。