閆娟,李國(guó)琪
摘 要:檢索關(guān)于“醫(yī)學(xué)稿件統(tǒng)計(jì)學(xué)方法誤用”主題的中文研究論文,對(duì)論文中提及的統(tǒng)計(jì)學(xué)誤用方法進(jìn)行系統(tǒng)分析并匯總,總結(jié)關(guān)于該主題論文的分布規(guī)律和發(fā)展脈絡(luò),并提出對(duì)該問題的應(yīng)對(duì)策略。
關(guān)鍵詞:醫(yī)學(xué)稿件;統(tǒng)計(jì)學(xué)方法;誤用;評(píng)價(jià)
中圖分類號(hào):C81 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-8122(2013)02-0058-02
醫(yī)學(xué)統(tǒng)計(jì)學(xué)為醫(yī)學(xué)研究提供了手段和方法,已經(jīng)廣泛地應(yīng)用到醫(yī)學(xué)科學(xué)研究中,是醫(yī)學(xué)研究不可分割的部分。據(jù)研究,有86%的文章都使用了統(tǒng)計(jì)學(xué)方法[1]。統(tǒng)計(jì)學(xué)方法應(yīng)用的正確與否,直接關(guān)系到研究的結(jié)果,然而醫(yī)學(xué)稿件中的統(tǒng)計(jì)學(xué)方法誤用的情況卻較多,有研究對(duì)應(yīng)用了統(tǒng)計(jì)學(xué)分析的1371篇醫(yī)學(xué)稿件研究發(fā)現(xiàn),在統(tǒng)計(jì)學(xué)處理方面完全符合要求的只有26.7%[2]。本文通過對(duì)以往發(fā)表的關(guān)于醫(yī)學(xué)稿件中統(tǒng)計(jì)學(xué)方法誤用方面的文獻(xiàn)進(jìn)行系統(tǒng)分析,總結(jié)歸納出主要的統(tǒng)計(jì)學(xué)問題,并提出應(yīng)對(duì)措施。
一、研究對(duì)象和方法
以“醫(yī)學(xué)”、“期刊”、“稿件”、“文章”、“論文”、“統(tǒng)計(jì)學(xué)方法”為關(guān)鍵詞,在中國(guó)生物醫(yī)學(xué)文獻(xiàn)光盤數(shù)據(jù)庫(CBM)、中文科技期刊數(shù)據(jù)庫(維普)、中國(guó)知網(wǎng)(CNKI)及萬方數(shù)據(jù)上進(jìn)行檢索。檢索到關(guān)于醫(yī)學(xué)稿件統(tǒng)計(jì)學(xué)方法誤用相關(guān)主題的論文題錄58篇,將題錄導(dǎo)入NoteExpress2.0軟件,通過逐條閱讀題錄的題目、關(guān)鍵詞和摘要,結(jié)合本研究?jī)?nèi)容制定的篩選標(biāo)準(zhǔn),最終獲取到密切相關(guān)文獻(xiàn)的全文40篇。其中關(guān)于醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)方法誤用問題方面的研究性論文29篇,關(guān)于醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)方法正確應(yīng)用方面的繼續(xù)教育性質(zhì)論文11篇。通過逐篇閱讀,提取文中所提及的有關(guān)論文統(tǒng)計(jì)學(xué)方法方面的信息。
二、文章基本信息分析
1.研究性論文時(shí)段分布。29篇研究論文中,6篇發(fā)表于上世紀(jì)90年代,最早的一篇《關(guān)于論文中數(shù)據(jù)的統(tǒng)計(jì)學(xué)處理問題》發(fā)表于1991年3期的《中華護(hù)理雜志》。23篇發(fā)表于2000—2011年,其中近5年發(fā)表的論文占69.6%(16/23)。
2.研究性論文發(fā)表刊物分布及論文作者情況。8篇發(fā)表于編輯出版專業(yè)刊物《編輯學(xué)報(bào)》和《中國(guó)科技期刊研究》上,其他主要發(fā)表在醫(yī)學(xué)院學(xué)報(bào)、預(yù)防醫(yī)學(xué)雜志及其他醫(yī)學(xué)類專業(yè)期刊上。論文第一作者專業(yè)為編輯學(xué)者14人,占48.3%(14/29);為流行病和衛(wèi)生統(tǒng)計(jì)者8人,占27.6%(8/29)。
3.研究性論文選題分布。29篇中有25篇是關(guān)于醫(yī)學(xué)稿件統(tǒng)計(jì)學(xué)問題的專題研究,占86.2%,其他4篇是兼論,還提及了科研設(shè)計(jì)、表格設(shè)計(jì)及論文投稿過程中的其他問題。從研究方式來看,有10篇(34.5%)是通過對(duì)以往發(fā)表論文進(jìn)行調(diào)查研究的客觀總結(jié),其他的多是作者根據(jù)自己閱讀文獻(xiàn)或?qū)徖砀寮r(shí)發(fā)現(xiàn)的統(tǒng)計(jì)學(xué)問題,梳理后的經(jīng)驗(yàn)總結(jié)。
4.繼教論文情況分析。11篇關(guān)于醫(yī)學(xué)統(tǒng)計(jì)學(xué)的繼教論文中,有7篇刊登于2000年之后。8篇是雜志社邀請(qǐng)的有關(guān)專家書寫的專題論文,多是連續(xù)刊登多個(gè)專題,刊登在“教育園地”和“繼續(xù)醫(yī)學(xué)教育”等欄目;余下3篇是期刊編輯部在自己期刊上發(fā)表的有關(guān)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方面的繼教文章,多刊登在“讀者·編者·作者”欄目。
三、醫(yī)學(xué)稿件中常見的統(tǒng)計(jì)學(xué)問題
1.將t檢驗(yàn)視為處理定量資料的“萬能鑰匙”。主要分為兩種情況,一種是將2組t檢驗(yàn)用于方差分析后的組間兩兩比較,這樣會(huì)增加Ⅰ型錯(cuò)誤的概率[3],致使假陽性結(jié)果。這是最常見的統(tǒng)計(jì)學(xué)方法誤用類型,幾乎所有關(guān)于統(tǒng)計(jì)學(xué)方法誤用的文章都提到了這個(gè)問題。滕洪松等[4]通過對(duì)6所學(xué)報(bào)期刊3個(gè)年度的論著文章進(jìn)行分析發(fā)現(xiàn),這種誤用情況占所有誤用文章的44.4%~60.5%,平均達(dá)半數(shù)以上。沈進(jìn)等[5]對(duì)544篇論著的統(tǒng)計(jì)學(xué)方法研究發(fā)現(xiàn),該種錯(cuò)誤占63.09%,可見此種誤用類型的普遍性。另一種是將成組t檢驗(yàn)用于配對(duì)設(shè)計(jì)資料。因?yàn)榕鋵?duì)資料已經(jīng)從設(shè)計(jì)時(shí)盡量減少了實(shí)驗(yàn)誤差,本該用配對(duì)t檢驗(yàn)的資料若還用成組t檢驗(yàn),無疑會(huì)增大了混雜因素,降低了實(shí)驗(yàn)的精準(zhǔn)度和結(jié)果的可信度。還有研究提到了將t檢驗(yàn)和χ2檢驗(yàn)相互誤用的情況,如劉英等[6]舉例,比較兩種治療方法的遠(yuǎn)期臨床不良事件發(fā)生情況,應(yīng)采用率表示,分析應(yīng)采用χ2檢驗(yàn),而有的研究卻誤用了t檢驗(yàn),從而導(dǎo)致結(jié)果完全不同。隨著多數(shù)作者科研水平的提高,這種“簡(jiǎn)單錯(cuò)誤”已經(jīng)較少見。
2.將χ2檢驗(yàn)視為處理定性資料的“通用方法”。常見的誤用類型有:(1)誤用χ2檢驗(yàn)代替確切概率法。當(dāng)四格表資料的n<40或最小理論頻數(shù)<1時(shí),應(yīng)該用確切概率法[7]。但許多研究都沒有考慮到這個(gè)因素,而簡(jiǎn)單用了四格表χ2檢驗(yàn),劉英等[6]比較了2種藥物治療心絞痛的療效,若正確的使用確切概率法,結(jié)果顯示差異無統(tǒng)計(jì)學(xué)意義,若錯(cuò)誤的使用χ2檢驗(yàn),則會(huì)得到相反的結(jié)果。(2)誤用χ2檢驗(yàn)代替秩和檢驗(yàn)和Ridit分析。若是行×列表資料,且表格一個(gè)方向是等級(jí)資料,當(dāng)?shù)燃?jí)數(shù)大于3時(shí),應(yīng)該用秩和檢驗(yàn),但很多研究都用了χ2檢驗(yàn),萬瑜等[8]將2002—2006年《中華骨科雜志》5年發(fā)表的論著文獻(xiàn)中常見的統(tǒng)計(jì)學(xué)方法誤用類型進(jìn)行分析發(fā)現(xiàn),行×列表資料誤用χ2檢驗(yàn)這種類型占所有統(tǒng)計(jì)學(xué)誤用文獻(xiàn)的15.1%,是除方差分析誤用t檢驗(yàn)之外的排名第二的誤用類型,和滕洪松等[4]的研究結(jié)果基本一致。
3.誤用單因素方差分析。當(dāng)定量資料屬于2個(gè)因素 2個(gè)水平的組合設(shè)計(jì)時(shí), 應(yīng)該采用析因設(shè)計(jì)資料的方差分析,而不能簡(jiǎn)單化為單因素4個(gè)水平(多水平)設(shè)計(jì)資料的方差分析[2]。當(dāng)資料屬于重復(fù)測(cè)量定量資料時(shí),應(yīng)該采用重復(fù)測(cè)量的兩因素設(shè)計(jì)定量資料的方差分析。當(dāng)需要對(duì)多因素設(shè)計(jì)中的某個(gè)因素各水平下的平均值進(jìn)行兩兩比較時(shí),若因素之間的交互作用項(xiàng)具有統(tǒng)計(jì)學(xué)意義,不應(yīng)簡(jiǎn)單地采用單因素多水平設(shè)計(jì)定量資料的q檢驗(yàn)法、LSD-t檢驗(yàn)法或Dunnett-t檢驗(yàn)法,而應(yīng)建立在相應(yīng)設(shè)計(jì)定量資料的方差分析基礎(chǔ)之上[9]。上述t檢驗(yàn)、χ2檢驗(yàn)及方差分析是最基本最常用的統(tǒng)計(jì)推斷方法,但據(jù)統(tǒng)計(jì),出現(xiàn)錯(cuò)誤最多的就是這些最基本的概念和經(jīng)典的統(tǒng)計(jì)方法[10]。除此之外,還有很多關(guān)于統(tǒng)計(jì)學(xué)指標(biāo)和結(jié)果表述等問題,都會(huì)影響研究結(jié)果的正確表達(dá)。
4.統(tǒng)計(jì)學(xué)指標(biāo)運(yùn)用不當(dāng)。(1)率與構(gòu)成比的誤用。如作者統(tǒng)計(jì)分析某市某年乙型腦炎不同年齡段的發(fā)生情況,將患者按≤3歲、3~9歲、≥10歲3個(gè)年齡階段,分析不同年齡段患者所占比率,即構(gòu)成比,而非率[2]。(2)患病率與發(fā)病率混淆誤用。發(fā)病率是指觀察期內(nèi)(年、季、月等)新發(fā)生某病的例數(shù)與同期平均人口數(shù)之比,強(qiáng)調(diào)在觀察期內(nèi)的新發(fā)病例數(shù);而患病率則指觀察時(shí)點(diǎn)某病的現(xiàn)患病例數(shù)與該時(shí)點(diǎn)人口數(shù)之比,強(qiáng)調(diào)的是該觀察時(shí)點(diǎn)上某病的現(xiàn)患(新、舊病例)情況。然而在論文撰寫中,許多作者沒能正確區(qū)分觀察、統(tǒng)計(jì)的時(shí)間,將二者混淆誤用[11]。(3)病死率和死亡率的混淆誤用。死亡率=死亡人數(shù)/同期人口數(shù),是觀察人群中某病的死亡頻率,反映了觀察人口因某病的死亡水平,是一個(gè)人口學(xué)指標(biāo),一般以10萬分率表示;而病死率=死亡人數(shù)/患某病的患者總數(shù),是某病患者中因該病而死亡的頻率,反映了某病的死亡危險(xiǎn)性,一般以百分率表示。而部分作者常將某病住院病死率誤認(rèn)為某病的死亡率[12]。
5.統(tǒng)計(jì)學(xué)結(jié)果表述和解釋不當(dāng)。對(duì)于統(tǒng)計(jì)結(jié)果的展示,一般要求應(yīng)給出具體的統(tǒng)計(jì)量和P值,而很多文獻(xiàn)只標(biāo)明P>0.05,P<0.05,而未給出統(tǒng)計(jì)量,這是最常見的統(tǒng)計(jì)學(xué)錯(cuò)誤[13]。還有對(duì)統(tǒng)計(jì)學(xué)結(jié)果的解釋,很多文章易將統(tǒng)計(jì)學(xué)結(jié)果和專業(yè)結(jié)論混淆,將P>0.05解釋為“差異不顯著”,P<0.05為“差異顯著”,P<0.01為“差異非常顯著”,這都是不對(duì)的[14]。P<0.01只能說是有此樣本推斷總體的把握性更大,P值越小,就越有理由認(rèn)為被比較的均數(shù)或率之間有差異。至于差異有多大,要由它們之間實(shí)際相差有多大再結(jié)合專業(yè)知識(shí)來確定。
四、研究性論文綜合評(píng)價(jià)
筆者通過對(duì)文章內(nèi)容分析發(fā)現(xiàn),早期的關(guān)于醫(yī)學(xué)稿件統(tǒng)計(jì)學(xué)方面的文章內(nèi)容相對(duì)較淺,涉及的統(tǒng)計(jì)分析方法簡(jiǎn)單,后期的文章除了談及常見的統(tǒng)計(jì)學(xué)問題外,還涉及到了科研設(shè)計(jì)和較復(fù)雜的統(tǒng)計(jì)學(xué)方法。如劉英等[6]提及在科研設(shè)計(jì)階段要注意樣本量和“隨機(jī)、對(duì)照、均衡、重復(fù)”四大原則等,在統(tǒng)計(jì)學(xué)分析時(shí),談到了析因設(shè)計(jì)和重復(fù)測(cè)量方差分析。關(guān)于此主題文章的發(fā)展趨勢(shì),基本是隨著稿件資料的復(fù)雜和設(shè)計(jì)的完善,統(tǒng)計(jì)學(xué)方法應(yīng)用正確率逐漸提高,也越來越完善和豐富。從客觀指標(biāo)被引頻次排名來看,發(fā)表在編輯學(xué)報(bào)上的關(guān)于這一主題的文章被引率較高,見表1。
統(tǒng)計(jì)學(xué)處理在醫(yī)學(xué)科技論文中的地位舉足輕重,統(tǒng)計(jì)學(xué)方法的正確使用與否直接關(guān)系到結(jié)果的差異有無統(tǒng)計(jì)學(xué)意義。因此,應(yīng)從多方面做起,提高統(tǒng)計(jì)學(xué)方法的正確使用率。首先,編輯人員應(yīng)從思想上重視對(duì)統(tǒng)計(jì)學(xué)處理的把關(guān),還應(yīng)加強(qiáng)統(tǒng)計(jì)學(xué)專業(yè)知識(shí)的系統(tǒng)學(xué)習(xí),提高自己的能力,遇到有異議的地方要翻閱資料以求正確解決。其次,可聘請(qǐng)統(tǒng)計(jì)專業(yè)的專家給予指導(dǎo)。當(dāng)然,對(duì)于某些稿件來說,上述措施實(shí)屬“亡羊補(bǔ)牢”,因?yàn)榭赡茏畛醯膶?shí)驗(yàn)設(shè)計(jì)階段就存在一些問題,致使后期的統(tǒng)計(jì)學(xué)處理無法滿足研究者的分析需求。這就需要從源頭抓起,提高作者的統(tǒng)計(jì)學(xué)處理能力。編輯部可以舉辦關(guān)于稿件統(tǒng)計(jì)學(xué)處理的專題培訓(xùn)班,還可以在期刊上開設(shè)相關(guān)欄目,對(duì)讀者進(jìn)行系統(tǒng)的繼續(xù)醫(yī)學(xué)教育。
參考文獻(xiàn):
[1] 賴娟,李征,何集篇等.臨床醫(yī)學(xué)雜志論著中統(tǒng)計(jì)學(xué)方法應(yīng)用的對(duì)比研究[J].中國(guó)耳鼻咽喉顱底外科雜志,2010(2).
[2] 李霞,張印朋,閆蘇平.醫(yī)學(xué)期刊作者來稿統(tǒng)計(jì)學(xué)應(yīng)用與表述常見問題分析[J].中國(guó)科技期刊研究,2011(1).
[3] 李晶,徐秦,楊愛萍.醫(yī)學(xué)論文中的常見統(tǒng)計(jì)學(xué)問題及其處理[J].新疆醫(yī)科大學(xué)學(xué)報(bào),2002(2).
[4] 滕洪松,周曉彬.山東省醫(yī)學(xué)院校學(xué)報(bào)論著中統(tǒng)計(jì)學(xué)方法應(yīng)用狀況調(diào)查[J].預(yù)防醫(yī)學(xué)情報(bào)雜志,2007(6).
[5] 沈進(jìn),茍莉,湯潔.生物醫(yī)學(xué)期刊的統(tǒng)計(jì)學(xué)方法應(yīng)用情況分析[J].中國(guó)修復(fù)重建外科雜志,2007(5).
[6] 劉英,廖玉華.醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)方法常見問題及對(duì)策[J].醫(yī)學(xué)信息(上旬刊),2010(6).
[7] 章新生,姚仁斌,劉璐.醫(yī)學(xué)稿件中常見統(tǒng)計(jì)學(xué)方法誤用辨析[J].蚌埠醫(yī)學(xué)院學(xué)報(bào),2011(6).
[8] 萬瑜,馬駿,張鳳菊.《中華骨科雜志》論著文章統(tǒng)計(jì)學(xué)方法應(yīng)用現(xiàn)狀[J].預(yù)防醫(yī)學(xué)情報(bào)雜志,2007(2).
[9] 胡良平.如何合理選擇統(tǒng)計(jì)分析方法處理實(shí)驗(yàn)資料[J].中國(guó)醫(yī)藥生物技術(shù),2007(1).
[10] 王玖,徐天和,祁愛琴等.醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)誤用及其防范對(duì)策[J].編輯學(xué)報(bào),2002(6).
[11] 宋雙明.醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)的幾個(gè)問題[J].編輯學(xué)報(bào),1998(2).
[12] 金明,周慶泰.醫(yī)學(xué)論文中常見的統(tǒng)計(jì)錯(cuò)誤分析[J].蚌埠醫(yī)學(xué)院學(xué)報(bào),1992(2).
[13] 李永紅.醫(yī)學(xué)論文中常見的統(tǒng)計(jì)學(xué)錯(cuò)誤與處理[J].海峽預(yù)防醫(yī)學(xué)雜志,2007(1).
[14] 肖麗娟,孫茂民.醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)處理常見問題及應(yīng)對(duì)措施[J].編輯學(xué)報(bào),2010(6).