吳 優(yōu) 許汝福 黃紅稷 王亞南 程 敏
醫(yī)學(xué)科研論文大多涉及數(shù)據(jù)收集和統(tǒng)計(jì)分析,正確合適的數(shù)據(jù)統(tǒng)計(jì)分析方法,才可能保證科研結(jié)果的正確性。雖然論文撰寫的國(guó)際規(guī)范對(duì)數(shù)據(jù)統(tǒng)計(jì)學(xué)分析有明確的要求,科研人員也學(xué)習(xí)過(guò)醫(yī)學(xué)統(tǒng)計(jì)學(xué),但如何正確選擇統(tǒng)計(jì)分析方法,準(zhǔn)確描述統(tǒng)計(jì)分析結(jié)果,仍然是很多科研人員比較困惑的問(wèn)題。有些作者在論文中誤用、錯(cuò)用統(tǒng)計(jì)學(xué)方法,直接影響研究結(jié)果的可信度,導(dǎo)致論文質(zhì)量不高或者結(jié)論錯(cuò)誤[1-3]。本文對(duì)某雜志2014年至2015年度送審論文中的統(tǒng)計(jì)學(xué)問(wèn)題進(jìn)行分析,旨在幫助作者避免類似的錯(cuò)誤,提升科研論文質(zhì)量。
數(shù)據(jù)來(lái)源于2014年至2015年某雜志送審的論文及審稿記錄。207篇論文被納入分析,其中2014年度112篇,2015年度95篇。
采用EXCEl文檔,記錄每篇論文的如下信息。
(1)文章的稿件編號(hào)、第一作者姓名、論文題目。
(2)數(shù)據(jù)的一致性方面:摘要與正文之間、描述與統(tǒng)計(jì)圖表之間、統(tǒng)計(jì)表之間、分組與合計(jì)之間的樣本量一致性;亞組分析與整體之間、前后描述之間、描述與統(tǒng)計(jì)圖表之間、統(tǒng)計(jì)表之間、統(tǒng)計(jì)表圖之間、摘要與統(tǒng)計(jì)圖表之間、摘要與正文之間、結(jié)果與討論之間的結(jié)果一致性。
(3)數(shù)據(jù)資料統(tǒng)計(jì)描述方面:是否涉及相對(duì)數(shù)計(jì)算,選擇的相對(duì)數(shù)指標(biāo)是否正確,計(jì)算相對(duì)數(shù)分母選擇是否正確,相對(duì)數(shù)是否正確;是否涉及平均指標(biāo)與變異指標(biāo),平均數(shù)是否正確,標(biāo)準(zhǔn)差是否正確,是否只有均數(shù)無(wú)標(biāo)準(zhǔn)差,是否明顯偏態(tài)分布使用均數(shù)等。
(4)組間比較差異性分析方面:是否涉及χ2檢驗(yàn),分析方法是否正確,統(tǒng)計(jì)量是否正確,P值是否正確;是否涉及兩組計(jì)量資料差異性分析,分析方法是否正確,統(tǒng)計(jì)量是否正確,P值是否正確;是否涉及多組計(jì)量資料差異性分析,分析方法是否正確,統(tǒng)計(jì)量是否正確,P值是否正確;是否涉及秩和檢驗(yàn),統(tǒng)計(jì)量是否正確,P值是否正確。
(5)線性相關(guān)回歸分析方面:是否涉及線性相關(guān)回歸分析,相關(guān)分析方法是否正確,有無(wú)將不同組別數(shù)據(jù)混在一起做相關(guān)、非正態(tài)分布使用線性相關(guān)系數(shù)r值、線性相關(guān)與等級(jí)相關(guān)混淆、散點(diǎn)圖呈曲線關(guān)系使用直線回歸分析、文獻(xiàn)報(bào)道曲線關(guān)系采用直線回歸分析;相關(guān)系數(shù)r值與P值的關(guān)系是否正確,線性回歸模型擬合結(jié)果是否正確。
(6)多因素模型擬合方面:是否涉及多因素Logistic回歸模型,OR與回歸系數(shù)β的關(guān)系是否正確,OR95%CI與P值的關(guān)系是否正確,OR與95%CI的關(guān)系是否正確,回歸系數(shù)β檢驗(yàn)統(tǒng)計(jì)量是否正確,檢驗(yàn)統(tǒng)計(jì)量與P值的關(guān)系是否正確,是否將多分類因素說(shuō)明為分類因素,是否使用逐步回歸篩選自變量。
數(shù)據(jù)采用SPSS18.0統(tǒng)計(jì)學(xué)軟件進(jìn)行統(tǒng)計(jì)分析,結(jié)果采用 [n(%)]形式表示。
207篇送審論文中,樣本量前后不一致論文31篇(14.98%),其中摘要與正文例數(shù)不一致2篇(0.97%)、描述與統(tǒng)計(jì)圖表間例數(shù)不一致16篇(7.73%)、統(tǒng)計(jì)表間例數(shù)不一致2篇(0.97%)、分組與合計(jì)的例數(shù)不一致13篇(6.28%)。1篇文章摘要與正文例數(shù)不一致、描述與統(tǒng)計(jì)圖表間例數(shù)不一致;1篇文章摘要與正文例數(shù)不一致、分組與合計(jì)的例數(shù)不一致。
207篇送審論文中,結(jié)果前后不一致論文17篇(8.21%),其中亞組分析與合計(jì)間結(jié)果不一致5篇(2.42%)、前后描述結(jié)果不一致2篇(0.97%)、描述與圖表間結(jié)果不一致4篇(1.93%)、統(tǒng)計(jì)表間結(jié)果不一致2篇(0.97%)、統(tǒng)計(jì)表圖間結(jié)果不一致1篇(0.48%)、摘要與圖表間結(jié)果不一致1篇(0.48%)、摘要與正文間結(jié)果不一致3篇(1.45%)、結(jié)果與討論間結(jié)果不一致1篇(0.48%)。1篇文章描述與圖表間結(jié)果不一致、摘要與圖表結(jié)果不一致;1篇文章描述與圖表間結(jié)果不一致、摘要與正文結(jié)果不一致。
涉及相對(duì)數(shù)計(jì)算的論文157篇(75.85%)。相對(duì)數(shù)指標(biāo)選擇不正確5篇(3.18%),計(jì)算相對(duì)數(shù)分母選擇不正確2篇(1.27%),相對(duì)數(shù)計(jì)算結(jié)果不正確18篇(11.46%)。
涉及平均指標(biāo)與變異指標(biāo)的論文153篇(73.91%)。平均數(shù)計(jì)算錯(cuò)誤3篇(1.96%),標(biāo)準(zhǔn)差計(jì)算錯(cuò)誤3篇(1.96%),只有均數(shù)無(wú)標(biāo)準(zhǔn)差4篇(2.61%),明顯偏態(tài)分布使用均數(shù)10篇(6.53%),沒(méi)有描述資料是否服從正態(tài)分布直接使用均數(shù)與標(biāo)準(zhǔn)差140篇(91.50%)。
涉及χ2檢驗(yàn)的論文149篇(71.98%)。χ2檢驗(yàn)分析方法不正確3篇(2.01%),χ2檢驗(yàn)統(tǒng)計(jì)量不正確25篇(16.78%),χ2檢驗(yàn)P值不正確28篇(18.79%)。
涉及兩組計(jì)量資料差異性分析的論文121篇(58.45%)。兩組比較分析方法不正確20篇(16.53%),兩組比較統(tǒng)計(jì)量計(jì)算不正確19篇(15.70%),兩組比較P值不正確20篇(16.53%)。
涉及多組計(jì)量資料差異性分析的論文34篇(16.43%)。使用方差分析21篇(61.76%),使用秩和檢驗(yàn)16篇(47.06%),多組比較使用t檢驗(yàn)10篇(29.41%),方差不齊使用方差分析4篇(11.76%),多組比較統(tǒng)計(jì)量計(jì)算不正確3篇(8.82%),多組比較P值不正確3篇(8.82%)。
涉及線性相關(guān)回歸分析51篇(24.64%)。簡(jiǎn)單相關(guān)回歸分析方法不正確15篇(29.41%),其中將不同組別數(shù)據(jù)混在一起做相關(guān)分析4篇(7.84%),直線相關(guān)分析與等級(jí)相關(guān)分析混淆4篇(7.84%),線性回歸模型錯(cuò)誤3篇(5.88%),非正態(tài)分布使用直線相關(guān)分析1篇(1.96%),散點(diǎn)圖呈曲線使用直線分析1篇(1.96%),文獻(xiàn)報(bào)道曲線關(guān)系采用直線分析1篇(1.96%),自變量賦值有問(wèn)題1篇(1.96%);線性相關(guān)系數(shù)r值與P值矛盾1篇(1.96%)。
涉及多因素Logistic回歸模型的論文46篇(22.22%)。OR與回歸系數(shù)β的數(shù)據(jù)關(guān)系矛盾11篇(23.91%),OR與95%CI的數(shù)據(jù)關(guān)系矛盾9篇(19.57%),OR95%CI與P值的數(shù)據(jù)關(guān)系矛盾7篇(15.22%),OR95%CI錯(cuò)誤6篇(13.04%),未使用逐步回歸篩選自變量5篇(10.87%),回歸系數(shù)β檢驗(yàn)統(tǒng)計(jì)量計(jì)算錯(cuò)誤4篇(8.70%),檢驗(yàn)統(tǒng)計(jì)量與P值的數(shù)據(jù)關(guān)系矛盾4篇(8.70%),多分類因素未說(shuō)明為分類因素的1篇(2.17%)。
論文數(shù)據(jù)正確是科研論文撰寫的基本要求。207篇送審論文中,發(fā)現(xiàn)14.98%的論文樣本量前后不一致,8.21%的論文結(jié)果前后不一致。如某作者在“HPV感染與早期宮頸鱗癌”臨床研究中報(bào)告共納入因?qū)m頸鱗癌行廣泛子宮全切及盆腔淋巴結(jié)清掃患者186例。表1顯示低分化18例、中分化146例、高分化22例,而表2低分化13例、中分化117例、高分化54例,兩個(gè)統(tǒng)計(jì)表的例數(shù)不一致。再如某作者在“口服水化方案預(yù)防門診高危人群對(duì)比劑腎病”臨床研究,文章描述74例患者年齡(63.79±8.81)歲,又描述常規(guī)水化組年齡(56.88±12.82)歲,強(qiáng)化水化組(62.87±5.38)歲,簡(jiǎn)易水化組年齡(58.12±10.97)歲??偩鶖?shù)應(yīng)為三組均數(shù)的加權(quán)平均數(shù)。顯然三個(gè)組年齡的均數(shù)都低于總均數(shù)63.79,數(shù)據(jù)前后不一致,年齡均數(shù)肯定有錯(cuò)誤。如果一篇論文前后例數(shù)都不一致,或者前后結(jié)果都不一致,說(shuō)明作者沒(méi)有認(rèn)真核對(duì)科研數(shù)據(jù),論文撰寫后沒(méi)有認(rèn)真檢查,科研作風(fēng)不夠嚴(yán)謹(jǐn)。因此,作者要對(duì)文章中涉及的同一組數(shù)據(jù),看其前后是否一致,結(jié)果分析是否與圖表中的數(shù)據(jù)一致,摘要中的數(shù)據(jù)是否與正文一致[4-5]。
數(shù)據(jù)資料差異性分析,應(yīng)根據(jù)研究設(shè)計(jì)及數(shù)據(jù)分布確定統(tǒng)計(jì)分析方法。如兩組設(shè)計(jì)計(jì)量資料差異性分析,數(shù)據(jù)服從正態(tài)分布、方差齊性使用兩組獨(dú)立樣本t檢驗(yàn),不服從正態(tài)分布或者方差不齊采用兩組秩和檢驗(yàn);配對(duì)設(shè)計(jì)差異性分析,數(shù)據(jù)服從正態(tài)分布使用配對(duì)樣本t檢驗(yàn),不服從正態(tài)分布使用符號(hào)秩檢驗(yàn)。多組計(jì)量資料差異性分析,數(shù)據(jù)服從正態(tài)分布、方差齊性使用方差分析,不服從正態(tài)分布或者方差不齊使用秩和檢驗(yàn)[8]。分析發(fā)現(xiàn),涉及兩組計(jì)量資料差異性分析的121篇論文中,16.53%的論文非正態(tài)分布或者方差不齊使用t檢驗(yàn)。涉及多組計(jì)量資料差異性分析的34篇論文中,29.41%的論文多組均數(shù)比較使用t檢驗(yàn),11.76%的論文方差不齊使用方差分析。尼瑪歐珠等[9]的表1、表2、表3的統(tǒng)計(jì)量有問(wèn)題。表1研究組45例,治療8 d后的創(chuàng)傷面積為(27.12±11.08)cm2,對(duì)照組45例,治療8 d后的創(chuàng)傷面積為(44.17±13.62)cm2,經(jīng)檢驗(yàn)t=6.514,而表中的統(tǒng)計(jì)量t=14.297;表2研究組治療8 d后總有效率為97.78%,對(duì)照組為64.44%,經(jīng)檢驗(yàn)χ2=16.317,而表中的統(tǒng)計(jì)量χ2=5.187;表3研究組植皮術(shù)后感染率為0例,對(duì)照組3例,經(jīng)檢驗(yàn)χ2=3.103,P=0.078,而表中的統(tǒng)計(jì)量χ2=4.156,P<0.05。周亮等[10]的表1顯示,s-rTMS組12例,m-rTMS組10例,治療后HAMD評(píng)分差異顯著(25.76±1.48vs. 25.20±2.04,P<0.05),SDS評(píng)分差異顯著(65.08±2.15vs. 63.30±1.95,P<0.05)。經(jīng)檢驗(yàn)HAMD評(píng)分、SDS評(píng)分均無(wú)顯著差異(t=0.746,P=0.465;t=2.016,P=0.057)。郭金強(qiáng)等[11]表1的14個(gè)P值中13個(gè)是錯(cuò)誤的,7個(gè)指標(biāo)的結(jié)論相反。如果統(tǒng)計(jì)分析方法不正確,得到的統(tǒng)計(jì)分析結(jié)論就可能是錯(cuò)誤的。作者應(yīng)注意統(tǒng)計(jì)分析方法是否正確。
多因素回歸分析要求作者正確選擇統(tǒng)計(jì)分析模型,準(zhǔn)確描述統(tǒng)計(jì)分析結(jié)果。分析發(fā)現(xiàn)涉及多因素Logistic回歸模型的46篇論文中,23.91%的論文OR與β數(shù)據(jù)關(guān)系矛盾,19.57%的論文OR與95%CI數(shù)據(jù)關(guān)系矛盾,15.22%的論文OR95%CI與P值數(shù)據(jù)關(guān)系矛盾。如某作者在“重度燒傷患者合并念珠菌血癥的相關(guān)因素分析”中描述“性別、年齡、手術(shù)后胃腸道并發(fā)癥是重度燒傷患者合并念珠菌血癥的獨(dú)立危險(xiǎn)因素(P<0.05)”,性別OR=5.02,95%CI=1.22~23.70;年齡的OR=0.88,95%CI=0.91~1.00。原文中敗血癥組女性占40.0%,非敗血癥組女性占39.5%,兩組女性占比基本一致,性別不應(yīng)該是危險(xiǎn)因素,性別OR=5.02讓人懷疑;年齡的OR=0.88,小于OR95%CI的下限,OR與95%CI數(shù)據(jù)關(guān)系矛盾。胡穎等[12]的表3多因素分析的Waldχ2、P與回歸系數(shù)、標(biāo)準(zhǔn)誤的數(shù)據(jù)矛盾。何佳虹等[13]表7的OR與95%CI數(shù)據(jù)有錯(cuò)誤。因此,多因素回歸分析時(shí),作者應(yīng)注意統(tǒng)計(jì)分析模型是否正確,最好使用統(tǒng)計(jì)分析軟件的結(jié)果。
論文統(tǒng)計(jì)分析方法不正確,數(shù)據(jù)表達(dá)不規(guī)范,將直接影響研究結(jié)果的可信度。建議:(1)強(qiáng)化作者的統(tǒng)計(jì)學(xué)意識(shí),重視論文撰寫中的統(tǒng)計(jì)學(xué)問(wèn)題,確保論文數(shù)據(jù)的一致性、統(tǒng)計(jì)描述指標(biāo)的正確性、統(tǒng)計(jì)推斷方法的正確性和統(tǒng)計(jì)分析模型的正確性,增加優(yōu)質(zhì)稿源;(2)醫(yī)學(xué)期刊編輯應(yīng)加強(qiáng)統(tǒng)計(jì)學(xué)知識(shí)學(xué)習(xí),提升論文統(tǒng)計(jì)學(xué)錯(cuò)誤的識(shí)別能力,把好論文初審關(guān);(3)邀請(qǐng)統(tǒng)計(jì)學(xué)專家參與醫(yī)學(xué)論文的審稿工作,把好統(tǒng)計(jì)審查關(guān),以確保論文的科學(xué)性和真實(shí)性。