李禧娜,鄭倩玲(《中國職業(yè)醫(yī)學(xué)》編輯部,廣東廣州 510300)
醫(yī)學(xué)期刊中3種常用統(tǒng)計(jì)學(xué)方法的誤用分析
李禧娜,鄭倩玲
(《中國職業(yè)醫(yī)學(xué)》編輯部,廣東廣州 510300)
結(jié)合日常處理稿件的經(jīng)驗(yàn),列舉容易誤用的3種統(tǒng)計(jì)學(xué)方法進(jìn)行辨析,包括析因設(shè)計(jì)資料的方差分析的誤用、配對(duì)設(shè)計(jì)資料的t檢驗(yàn)的誤用和有序分類變量資料的非參數(shù)檢驗(yàn)的誤用,以提高編輯人員辨別論文統(tǒng)計(jì)學(xué)方法的能力,提高論文的科學(xué)性和辦刊質(zhì)量.
醫(yī)學(xué)期刊;統(tǒng)計(jì)學(xué);析因設(shè)計(jì);重復(fù)測量;完全隨機(jī)設(shè)計(jì)資料的方差分析;配對(duì)設(shè)計(jì)資料的t檢驗(yàn);有序分類變量
判斷醫(yī)學(xué)論文的科學(xué)性與正確性的前提之一是采納正確的統(tǒng)計(jì)學(xué)方法及其分析的合理性,研究結(jié)果是否經(jīng)正確的統(tǒng)計(jì)學(xué)分析得出結(jié)論與醫(yī)學(xué)論文的質(zhì)量密切相關(guān)[1-2].國外20世紀(jì)對(duì)科研論文統(tǒng)計(jì)學(xué)誤用情況進(jìn)行研究,發(fā)現(xiàn)半數(shù)以上的論文存在統(tǒng)計(jì)學(xué)問題[3].國內(nèi)學(xué)者邱芬等對(duì)《西安交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)》2009 年200篇論文進(jìn)行統(tǒng)計(jì)學(xué)審查,發(fā)現(xiàn)存在各種統(tǒng)計(jì)學(xué)問題的文章達(dá)92.0%[4].安勝利等對(duì)《護(hù)理學(xué)報(bào)》2008 年1月至2012年3月的護(hù)理科研論文進(jìn)行統(tǒng)計(jì)學(xué)分析,發(fā)現(xiàn)統(tǒng)計(jì)學(xué)方法使用錯(cuò)誤的論文占43.0%[5].可見,統(tǒng)計(jì)學(xué)方法誤用的現(xiàn)象在我國醫(yī)學(xué)論文中較為嚴(yán)重.醫(yī)學(xué)期刊編輯在處理稿件時(shí),除了將相關(guān)稿件送統(tǒng)計(jì)學(xué)專家審閱外;編輯自身對(duì)常見統(tǒng)計(jì)學(xué)方法進(jìn)行簡單的了解也是很有必要的.張維、高永等對(duì)常用的統(tǒng)計(jì)學(xué)方法進(jìn)行了簡單介紹[6-7].筆者將結(jié)合實(shí)際工作中經(jīng)常碰到的另外3種常見統(tǒng)計(jì)學(xué)方法進(jìn)行簡單介紹,以期為醫(yī)學(xué)期刊編輯今后遇到相關(guān)內(nèi)容提供參考.
析因設(shè)計(jì)(Factorial design)是將兩個(gè)或多個(gè)實(shí)驗(yàn)因素的各水平進(jìn)行全面組合的實(shí)驗(yàn),能夠分析各實(shí)驗(yàn)因素的單獨(dú)效應(yīng)、主效應(yīng)和因素間的交互效應(yīng)[8].析因設(shè)計(jì)資料的方差分析與完全隨機(jī)設(shè)計(jì)資料的方差分析的主要區(qū)別在于,后者的數(shù)據(jù)是相互獨(dú)立,且研究的因素為單個(gè)因素;而析因設(shè)計(jì)資料的方差分析與重復(fù)測量資料的方差分析的主要區(qū)別在于,前者為對(duì)同一受試對(duì)象的同一觀察指標(biāo)僅測量1次,后者為對(duì)同一受試對(duì)象的同一觀察指標(biāo)在不同時(shí)間點(diǎn)上進(jìn)行多次測量.因此,對(duì)具有正態(tài)性分布的多組間數(shù)據(jù)進(jìn)行分析比較,不能簡單的以完全隨機(jī)設(shè)計(jì)資料的方差分析進(jìn)行,應(yīng)根據(jù)上述提到的不同點(diǎn)選擇相應(yīng)的統(tǒng)計(jì)學(xué)方法,以使數(shù)據(jù)分析更加科學(xué)、合理.
例1對(duì)對(duì)照組、低劑量組、中劑量組和高劑量組4組大鼠進(jìn)行氧化釹(Nd2O3)染毒,分別在14、21和28 d 3個(gè)時(shí)間點(diǎn)檢測肝臟、腎臟和腦的Nd2O3水平[9].對(duì)例1進(jìn)行分析:本例涉及到3個(gè)試驗(yàn)因素,即染毒劑量因素、時(shí)間因素和臟器因素;作者在原始稿件中采用單因素方差分析的方法將大鼠染毒后不同時(shí)間和不同臟器的Nd2O3水平分別與不同染毒劑量比較,選用該分析方法使數(shù)據(jù)所蘊(yùn)含的部分信息丟失,無法全面地解釋實(shí)驗(yàn)結(jié)果;故本例的正確設(shè)計(jì)應(yīng)根據(jù)3個(gè)因素的水平作4×3×3析因設(shè)計(jì)的方差分析.如表1所示,得出染毒劑量分別與時(shí)間因素和臟器因素、時(shí)間因素與臟器因素間均存在交互效應(yīng)(F值分別為11.123、94.764 和14.677,P<0.01),在固定其他因素的水平后,逐一分析各因素的單獨(dú)效應(yīng).
表1 4組染毒后不同時(shí)間大鼠肝臟、腎臟和腦中Nd2O3水平比較(mg/kg,x±s)
t檢驗(yàn)的應(yīng)用條件為隨機(jī)樣本、來自正態(tài)分布總體和均數(shù)比較時(shí),要求量總體方差相等(方差齊性).筆者在日常處理稿件中,常會(huì)碰到部分作者一看到2組數(shù)據(jù)間只要符合上述3個(gè)條件時(shí),就會(huì)不假思索的采用兩獨(dú)立樣本資料的t檢驗(yàn).其實(shí),采用兩獨(dú)立樣本資料的t檢驗(yàn)還是配對(duì)設(shè)計(jì)資料的t檢驗(yàn)的主要區(qū)別在于研究設(shè)計(jì)是配對(duì)還是完全隨機(jī)設(shè)計(jì)[10].配對(duì)設(shè)計(jì)(Paired design)是一種比較特殊的設(shè)計(jì)方式,能夠很好地控制非實(shí)驗(yàn)因素對(duì)結(jié)果的影響[8].在醫(yī)學(xué)科學(xué)研究中的配對(duì)設(shè)計(jì)主要適用于自身配對(duì)、平行配對(duì)和成對(duì)配對(duì)3 種.因此,編輯在今后遇到類似數(shù)據(jù)時(shí),不應(yīng)盲目想當(dāng)然認(rèn)為作者采用兩獨(dú)立樣本資料的t檢驗(yàn)是正確的,應(yīng)根據(jù)專業(yè)知識(shí)來判斷,進(jìn)一步考慮幾組數(shù)據(jù)間是否存在配對(duì)關(guān)系.
例2對(duì)3例百草枯中毒患者入院時(shí)(第1天)、入院第14天和出院時(shí)的小氣道肺功能進(jìn)行檢測[11].對(duì)例2進(jìn)行分析:作者在原始稿件中將3例患者的25%~75%、25%、50%和75%肺活量時(shí)的最大呼氣流速(FEF25%~75%、FEF25%、FEF50%和FEF75%)在第14天、出院時(shí)分別與入院時(shí)(第1天)進(jìn)行兩獨(dú)立樣本資料的t檢驗(yàn)似乎是正確的;但結(jié)合文章實(shí)驗(yàn)設(shè)計(jì)和表2內(nèi)容發(fā)現(xiàn),不同時(shí)間點(diǎn)的3例患者其實(shí)是同一批人員,屬于自身配對(duì)實(shí)驗(yàn),以觀察每個(gè)實(shí)驗(yàn)對(duì)象處理前后2次結(jié)果有無差異.故應(yīng)該采用配對(duì)設(shè)計(jì)資料的t檢驗(yàn).
表2 住院期間3例百草枯中毒患者小氣道肺功能測定結(jié)果
有序分類變量是指各類別之間有程度的差別的變量,如尿糖檢測結(jié)果按-、+、++、+++ 和++++分類;療效按治愈、顯效、好轉(zhuǎn)和無效分類.對(duì)于有序分類變量資料如果選用X2檢驗(yàn)進(jìn)行分析,只能比較各組數(shù)據(jù)間的差別,但對(duì)于各級(jí)強(qiáng)度之間的差別則無法分析.有序分類變量資料應(yīng)根據(jù)設(shè)計(jì)類型的不同,選擇不同的非參數(shù)檢驗(yàn),如Wilcoxon配對(duì)符號(hào)秩和檢驗(yàn)(適用于配對(duì)設(shè)計(jì)資料)、Wilcoxon秩和檢驗(yàn)(適用于兩組獨(dú)立樣本資料)和Kruskal-Wallis H檢驗(yàn)(適用于多組獨(dú)立樣本資料).
例3對(duì)對(duì)照組、二氧化硅(SiO2)模型組和新疆維吾爾藥驅(qū)蟲斑鳩菊(VAM)干預(yù)組3組大鼠肺組織中轉(zhuǎn)化生長因子(TGF-β1)蛋白陽性表達(dá)情況進(jìn)行比較[12].對(duì)例3進(jìn)行分析:表3結(jié)果變量“TGF-β1蛋白陽性表達(dá)積分動(dòng)物數(shù)”屬于有序分類變量資料.作者在原始稿件中采用X2檢驗(yàn)檢測3組大鼠肺組織中TGF-β1蛋白陽性表達(dá)情況,得出3組大鼠肺組織中TGF-β1蛋白陽性表達(dá)差異有統(tǒng)計(jì)學(xué)意義(X2=24.93,P<0.05).本例選用X2檢驗(yàn)分析無法利用資料的“等級(jí)”信息.X2檢驗(yàn)只能說明“3組大鼠在TGF-β1蛋白陽性表達(dá)”上有無差異,而無法說明“3組大鼠在TGF-β1蛋白陽性表達(dá)平均水平”上有無差異,而事實(shí)上“3組大鼠在TGF-β1蛋白陽性表達(dá)平均水平”的比較才是研究者關(guān)心的主要問題.故應(yīng)該采用Kruskal-Wallis H檢驗(yàn).如表3所示,3組大鼠TGF-β1蛋白陽性表達(dá)水平比較,差異有統(tǒng)計(jì)學(xué)意義(H=43.81,P<0.01),且SiO2模型組和VAW干預(yù)組TGF-β1蛋白陽性表達(dá)水平均高于對(duì)照組(Z值分別為-5.75和-5.50,P<0.01),SiO2模型組TGF-β1蛋白陽性表達(dá)水平高于VAW干預(yù)組(Z=-2.85,P<0.01).
表3 3組大鼠肺組織中TGF-β1蛋白陽性表達(dá)情況 只
醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)方法誤用的現(xiàn)象比較嚴(yán)重,本文總結(jié)了常見的3種錯(cuò)誤,并給了正確的使用方法,以期拋磚引玉,為醫(yī)院編輯及相關(guān)作者提供參考.
[1]魏琛.醫(yī)學(xué)科研設(shè)計(jì)與論文撰寫[J].中國康復(fù)理論與實(shí)踐,2002,8(8):5-8.
[2]遲殿元.科研設(shè)計(jì)與統(tǒng)計(jì)學(xué)在醫(yī)學(xué)論文中的問題與對(duì)策[J].齊齊哈爾醫(yī)學(xué)院學(xué)報(bào),2012,33(11):1548-1549.
[3]胡良平.影響我國醫(yī)藥科技事業(yè)發(fā)展的要因分析及其對(duì)策研究[J].醫(yī)學(xué)情報(bào)工作,2005,49(2):152.
[4]邱芬,曾令霞,國榮.統(tǒng)計(jì)學(xué)審查在醫(yī)學(xué)論文審稿中的必要性[J].中國科技期刊研究,2011,22(4):574-576.
[5]安勝利,郭萃.《護(hù)理學(xué)報(bào)》作者所投論文常見統(tǒng)計(jì)學(xué)方法誤用分析[J].護(hù)理學(xué)報(bào),2013,20(1A):8-11.
[6]張維,鄧強(qiáng)庭,冷懷明.醫(yī)學(xué)期刊中容易誤用的統(tǒng)計(jì)學(xué)方法辨析[J].編輯學(xué)報(bào),2013,25(5):435-437.
[7]高永,張中文,石德文,等.基于Excel的統(tǒng)計(jì)分析系統(tǒng)在期刊編輯部審稿中的應(yīng)用[J].編輯學(xué)報(bào),2013,25(5):478-481.
[8]方積乾.衛(wèi)生統(tǒng)計(jì)學(xué)[M].6版.北京:人民衛(wèi)生出版社,2011:129.
[9]武婧,王素華,余艷琴,等.稀土氧化釹顆粒物致大鼠肺損傷相關(guān)性研究[J].中國職業(yè)醫(yī)學(xué),2013,40(5):389-393.
[10]周素華,陸云霞.t檢驗(yàn)和χ2檢驗(yàn)常見誤用辨析[J].公共衛(wèi)生與預(yù)防醫(yī)學(xué),2007,18(2):110-112.
[11]樊春月,陳嘉斌,程櫻,等.呼吸道吸入兼皮膚吸收百草枯所致中毒6例臨床分析[J].中國職業(yè)醫(yī)學(xué),2014,41(3):290-294.
[12]劉桂桃,王文玉,哈木拉提·吾甫爾,等.驅(qū)蟲斑鳩菊對(duì)大鼠矽肺纖維化TGF-β1、KL-6和CCL18影響研究[J].中國職業(yè)醫(yī)學(xué),2014,41(4):374-378.
Misuse of 3 Kinds of Statistical Methods in Medical Journals
LI Xi-na,ZHENG Qian-ling
(Editorial Board of China Occupational Medicine,Guangzhou 510300,Guangdong,China)
According to the experiences of dealing with the journal,listed three kinds of statistical methods which were easy to misuse,including the misuse of factorial design analysis,paired design of t test and ordinal categorical variable.Attempting to improve the judgment ability of editors and the journal quality.
medical journal;statistics;factorial design;repeated measurement data;completely randomized design;paired design;ordinal categorical variable
G232.2
A
1007-5348(2016)06-0073-04
(責(zé)任編輯:邵曉軍)
2016-04-28
李禧娜(1984-),女,廣東汕頭人,《中國職業(yè)醫(yī)學(xué)》編輯部編輯,碩士研究生;研究方向:編輯學(xué).