李湘鳴+王勁松
[摘 要]醫(yī)學統(tǒng)計學教學離不開概率的計算。而在傳統(tǒng)的醫(yī)學統(tǒng)計學教學中,概率是通過查相應的密度函數(shù)分布表(如t值、u值(或Z值)、F值及χ2值表等)獲得的,無法滿足醫(yī)學科學發(fā)展的需求。隨著人民生活水平的提高、計算機和有關應用軟件的普及,大學醫(yī)學統(tǒng)計學教學應與時俱進,可用計算機的密度函數(shù)取代現(xiàn)行的密度函數(shù)分布表。
[關鍵詞]計算機密度函數(shù);界值表;醫(yī)學統(tǒng)計學
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2016)04-0091-02在醫(yī)學研究中,人們要對醫(yī)學數(shù)據(jù)進行整理、分析、判斷,最后得出結論,而這一切都離不開醫(yī)學統(tǒng)計學,所以醫(yī)學統(tǒng)計學是一門應用性很強的學科。由于課程原理主要涉及高等數(shù)學的概率分布,且概念抽象、具有邏輯推理性,特別涉及密度函數(shù)的分布時,所計算出來的統(tǒng)計量,如t值、u值(或Z值)、F值及χ2值等,需通過查相應的密度函數(shù)分布表(多數(shù)醫(yī)學統(tǒng)計學書稱之為界值表),獲得相應的P值(即概率),然后進行判斷。由于密度函數(shù)分布表的有限性,它所得到的P值多數(shù)為一范圍值,如0.1>P>0.05或0.01
一、取消界值表的現(xiàn)實性與可行性
在60~70年代,學生上數(shù)學課或做課外數(shù)學作業(yè)時,經(jīng)常會用到平方表、算術平方根表、三角函數(shù)表、反三角函數(shù)表、對數(shù)表、反對數(shù)表以及隨機數(shù)字表等。隨著科學技術的發(fā)展、計算機的普及,這些表陸續(xù)退出了歷史的舞臺。
同樣,隨著我國人民生活水平的提高,筆記本電腦在大學生中已經(jīng)普及,在我校,平均一個大學生(包括貧困生)有一臺筆記本電腦。由此可以推斷:筆記本電腦如同手機一樣,已成為大學生的必備。同時,相應的計算機軟件,如Office、WPS等辦公軟件,已經(jīng)得到普遍的應用。這為醫(yī)學統(tǒng)計學取消有關界值表創(chuàng)造了良好的條件,也為理論教學與實踐(練習)的結合打下了良好的基礎,消除了以往的教學與實踐相脫節(jié)的弊端。
二、界值表與計算機函數(shù)
(一)標準正態(tài)分布面積表與標準正態(tài)分布函數(shù)
標準正態(tài)曲線呈對稱分布,多數(shù)醫(yī)學統(tǒng)計學教材在設計面積分布表時,均給出1 / 2的概率分布,另一半則需要根據(jù)對稱性的原理進行推算。而且由于表的有限性,所給出的面積和u(或Z)的界值也十分有限。
眾所周知,標準正態(tài)曲線下面積是從-∞向+∞積分所得,面積為1。在EXCEL或WPS表格的統(tǒng)計函數(shù)(Statistical)中,提供了NORMSDIST,格式為NORMSDIST(z)。參數(shù)Z為從-∞積分到當前Z(或u)值的面積或概率。例如,公式“=NORMSDIST(-1.23)”的計算結果為0.109348552,即從-∞到-1.23的曲線下面積(或概率)為0.109348552。同時,NORMSDIST函數(shù)具有返回標準正態(tài)累積分布函數(shù)(反函數(shù)),格式為NORMSINV(probability),返回從-∞到任意曲線下累積面積的u(或Z)的界值。例如,公式“=NORMSINV(0.109348552)”返回-1.23。
(二)t值表與t分布函數(shù)
t分布曲線形態(tài)是與自由度(Degree of freedom)大小有關的對稱分布曲線,與標準正態(tài)分布曲線相比,曲線下面積仍為1,但是,自由度愈大,t分布曲線愈接近標準正態(tài)分布。多數(shù)醫(yī)學統(tǒng)計學的t值表(或t界值表)分別有限地給出了在一定的自由度下,t分布曲線下雙尾側或單尾側的概率,實際上是任意一側的積分面積,或者兩側的積分面積之和。
在EXCEL或WPS表格的統(tǒng)計函數(shù)中,有TDIST函數(shù),返回t分布雙側或單側的概率,格式為TDIST(x,degrees_freedom,tails)。X為計算的t值;Degrees_freedom為自由度;Tails指明返回的分布函數(shù)是雙側或單側分布的概率。如果tails=2,函數(shù)TDIST返回雙側概率;如果tails=1,函數(shù)TDIST返回單側分布概率。使用此函數(shù)可以代替t分布的臨界值表。例如,t=2.343,degrees_freedom=10,公式“=TDIST(2.343,10,2)”返回0.041128661,即從-∞到-2.343與+∞到+2.343的兩側概率之和;如果Tails=1,自動返回左側或右側曲線下面積或概率(如為0.020564331,即0.041128661/2)。由此可見,t值必須為絕對值。同樣,TDIST函數(shù)具有TINV反函數(shù),TINV函數(shù)可返回某一概率和自由度t分布曲線下的t值,格式為TINV(probability,degrees_freedom)。參數(shù)Probability為對應于雙側t分布的概率,Degrees_freedom為分布的自由度。例如,公式“=TINV(0.041128661,10)”返回2.343,即當前曲線下,兩側的t值分別為-2.343和+2.343。
(三)F值表與F分布函數(shù)
F值表來自F分布,由于與兩個數(shù)據(jù)集的自由度變化有關以及表的有限性,僅有右側的0.05和0.01兩個概率值,無法滿足醫(yī)學科研的實際需要。而在EXCEL或WPS表格的FDIST函數(shù)中,可提供兩個數(shù)據(jù)集任意自由度變化的右側任何概率積分,格式為FDIST(x,deg_freedom1,deg_freedom2)。X為所計算的F值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,經(jīng)方差分析、計算,得F=5.343,分子自由度(組間)=3,分母自由度(組內(nèi))=28,公式“=FDIST(5.343,3,28)”返回0.004883957,即在F分布曲線下,從+∞到5.343右側的面積(概率)為0.004883957。同樣,F(xiàn)DIST有FINV反函數(shù)。FINV函數(shù)返回F分布右側概率的F界值,格式為FINV(probability,deg_freedom1,deg_freedom2)。Probability為F分布右側的概率,即P值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,已知F分布曲線下右側的概率(P)=0.005,分子自由度(組間)=3,分母自由度(組內(nèi))=28,那么其相應的F界值是多少?可用公式“=FINV(0.005,3,28)”,返回5.317,即當前的F分布曲線下,當P=0.005時,其F界值為5.317。
(四)χ2值表與χ2分布函數(shù)
卡方(χ2)值表同t值表類似,與自由度有關,所給出的概率和χ2值也是有限的。而EXCEL或WPS表格的CHIDIST函數(shù)可取代χ2值表,格式為CHIDIST(x,degrees_freedom),可返回χ2分布曲線下右側的概率。X為計算的χ2數(shù)值;Degrees_freedom為自由度。例如,經(jīng)卡方分析、計算,得χ2=8.643,自由度=3,公式“=CHIDIST (8.643,3)”返回0.034434,即在當前的χ2分布曲線下,從+∞到8.643右側的面積(概率)為0.034434。同樣,CHIINV為CHIDIST的反函數(shù),計算χ2分布曲線下右側概率的反函數(shù)值,即χ2界值,格式為CHIINV(probability,degrees_freedom)。例如,已知當前的χ2分布曲線下右側P=0.005,自由度=3,求其相應的χ2界值??捎霉健?CHIINV (0.005,3)”返回12.838,即在當前的χ2分布曲線下,當右側面積(概率)為0.005時,其相應的χ2界值為12.838。
至于在直線相關分析、秩和檢驗中所用到r界值表和T界值表,實際上來自t分布、χ2或u(Z)分布,可用其相應的計算機函數(shù)代替。而在方差分析中,所用到的Q界值表等,在我國比較普及的SPSS或SAS等統(tǒng)計軟件提供了相應的分布概率值。特別是SPSS軟件,因其為菜單式界面和對話框的特點,教師易于操作,只需點擊鼠標就可完成,比較適合于在課堂教學中運用,也可為學生今后的學術發(fā)展打下一定的基礎。該軟件是在醫(yī)學界非專業(yè)人員應用最多的統(tǒng)計分析軟件,也是國際醫(yī)學期刊引用最多的統(tǒng)計軟件。[4]
三、意義
(一)統(tǒng)計界值表的取消可促進教學效率的提高
在傳統(tǒng)的醫(yī)學統(tǒng)計學教學中,教師多側重于某一章節(jié)理論知識的講授,然后安排學生到計算機房進行相應的統(tǒng)計實習。由于實習課與理論課有一定的時間間隔,多數(shù)學生遺忘了理論知識,故容易出現(xiàn)理論與實際相脫節(jié)的現(xiàn)象。
在醫(yī)學統(tǒng)計學教學中,取消有關統(tǒng)計界值表的教學內(nèi)容可促使教師將教學與計算機結合起來,將統(tǒng)計學理論與實踐結合起來,加深學生對統(tǒng)計學理論的理解,提高學生綜合運用理論和方法的能力。
例如,對于標準正態(tài)分布,為何其標準差為1,均數(shù)為0?以往的教學中,教師往往通過數(shù)學證明,或者讓學生死記,學生只知其然,不知其所以然。但是,如果教師課前將大樣本資料通過QQ群傳給學生,上課首先簡單地講解一下數(shù)學公式證明,然后讓學生用計算機求出樣本資料均數(shù)和標準差,再通過均數(shù)和標準差求出各觀察值u(Z),用計算機繪u(Z)直方分布圖,并求其均數(shù)和標準差。不難發(fā)現(xiàn)u(Z)呈正態(tài)分布,其均數(shù)和標準差為0。
(二)統(tǒng)計界值表的取消可提高學生的學習能力和教師的教學水平
將計算機直接引入課堂后,可以讓學生通過自身的電腦產(chǎn)生一個合理的隨機數(shù),并與課堂作業(yè)練習相結合。這樣將復雜統(tǒng)計資料的處理、運算與具體的實踐相融合,可大大激發(fā)學生的學習興趣,提高學生綜合分析、解決問題的能力,避免作業(yè)互相抄襲的現(xiàn)象。
統(tǒng)計界值表的取消必然要求學生“帶電腦進課堂”。由于學生所帶電腦的“檔次”不同,會出現(xiàn)不同版本的操作系統(tǒng)和應用軟件。這迫使教師要在課前熟悉不同版本的操作系統(tǒng)和應用軟件。課中主導與從屬地位的相互轉換,促進了教師與學生的互動,既可獲得良好的教學效果,又可極大地提高教師的教學水平。
[ 參 考 文 獻 ]
[1] 陳啟光,陳炳為.醫(yī)學統(tǒng)計學(第三版)[M].南京:東南大學出版社,2013:222-236.
[2] 高祖新.醫(yī)藥數(shù)理統(tǒng)計學方法(第五版)[M].北京:人民衛(wèi)生出版社,2013:268.
[3] 方積乾,徐勇勇.衛(wèi)生統(tǒng)計學(第七版)[M].北京:人民衛(wèi)生出版社,2012:458.
[4] 李英.淺談統(tǒng)計學基礎的教學改革[J].高校講壇,2011(2):265-266.
[責任編輯:鐘偉芳]