国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

體育碩士學位論文中常見統(tǒng)計方法誤用及解決方案

2016-11-28 11:33陳永欣李尚濱糾延紅
體育科技文獻通報 2016年10期
關鍵詞:樣本量論文檢驗

焉 石,陳永欣,李尚濱,糾延紅,楊 俊

?

體育碩士學位論文中常見統(tǒng)計方法誤用及解決方案

焉石,陳永欣,李尚濱,糾延紅,楊俊

本研究通過運用文獻資料法,對目前體育碩士學位論文中常見統(tǒng)計方法誤用進行了探討,結(jié)果顯示大致存在七方面誤用:抽樣方法的隨意性、樣本量確定的盲目性、數(shù)據(jù)實際含義描述的缺失、統(tǒng)計方法使用前提不明、方法簡化的不適宜、效果量考量的欠缺、結(jié)論與結(jié)果的脫節(jié)。

樣本量;效果量;體育統(tǒng)計

體育統(tǒng)計學是運用統(tǒng)計學的原理和方法,通過對體育實踐中隨機現(xiàn)象進行數(shù)量化描述、推斷和分析,揭示體育現(xiàn)象內(nèi)在規(guī)律的一門應用型學科。它是體育工作者進行體育實踐所必須掌握的一種重要方法,在體育科學化發(fā)展過程中發(fā)揮著無法替代的作用,如今體育統(tǒng)計學早已成為體育院校中一門非常重要的基礎課程[1]。但筆者在指導學生論文及參加相關統(tǒng)計培訓后發(fā)現(xiàn),目前大量的碩士學位論文中普遍存在統(tǒng)計方法的誤用,并且雷同錯誤比比皆是,甚至被一直延續(xù),乃至于很多錯誤被誤認為是必須形式廣泛模仿,而且呈愈演愈烈的趨勢,這對我國體育科研的長遠發(fā)展極為不利,相信這與我國體育工作者對基礎統(tǒng)計的了解不夠,并且對統(tǒng)計的新方法認識不足有密切相關。本研究旨在揭示體育碩士論文中最常見的代表性誤用展開討論,并同時提出解決方案,為廣大體育專業(yè)碩士論文能夠正確合理的運用體育統(tǒng)計方法提供參考。

1 抽樣方法的誤用

很多學生的論文甚至是核心期刊上的學術論文,在陳述抽樣方法時,作者只是簡單陳述道“本研究采用了隨機抽樣方式”,至于具體如何采用隨機抽樣以及是否真的采用了隨機則無從考證,甚至有的采用了非概率抽樣也會報告為采用了概率抽樣,這是目前畢業(yè)論文中經(jīng)常出現(xiàn)的問題[2]。例如某論文想比較全國不同區(qū)大學生的體制健康問題,在抽樣方面陳述為“本研究采用隨機抽樣方式通過選取位于我國北部、中部和南部四所代表性高等院校,分別以北京體育大學、武漢體育學院、中山大學和廣州大學等在校大學生為調(diào)查對象”。該研究有兩點問題:其一,可以理解為作者是以北京體育大學為北部代表,武漢體育學院為南部代表,中山大學和廣州大學為中部代表,但是抽樣的目的就是要用一個具有代表性的樣本對總體進行精確推論,根據(jù)這一原則以上所述各代表是否真正具有代表性。其二,體育類高校和普通高校的學生根本無法針對體質(zhì)健康這一指標進行比較,即使不考慮術科的學生,只比較學科的學生,也是具有前期差異的,因為在體育大學的學科學生常年受環(huán)境的影響勢必比普通高校的學生鍛煉的機會多。綜上可以看出該作者在論文設計抽樣方面考慮不夠,導致研究的結(jié)果不具有任何意義。所以在論文設計階段尤為關鍵,特別是在抽樣方式上,首先要了解概率抽樣和非概率抽樣都包含哪些形式,然后結(jié)合自身研究并考慮研究者能力最終選取最適合方法,尤其是在標準類的制定研究中,一定要慎重考慮抽樣方法,如果采用非概率抽樣勢必影響結(jié)果的概化程度,并且結(jié)果也是不可信的。

2 樣本量的盲目確定

經(jīng)常會有學生對自己的研究設計究竟應該收集多少樣本量感到疑惑,100人、200人還是更多?那么采用多少樣本的依據(jù)是什么,大多同學都無法回答,只是強調(diào)某某研究這樣我也這樣,或許也有人會說當然越多越好,但是實際研究中由于一些特殊原因樣本量無法收集更多,另外作為一名學生有時候無論從人力、物力還是財力都存在一定局限性,所以如何在保證統(tǒng)計檢驗力的前提下合理的收集樣本,一直都是學生們不解的問題。本文只針對做差異性檢驗的研究展開探討,對做一般調(diào)查性研究不予以探討。首先確定樣本量必須要了解什么是統(tǒng)計效力,統(tǒng)計效又稱統(tǒng)計功效、統(tǒng)計檢驗力,即能夠正確地拒絕一個錯誤的虛無假設,接受一個正確的備擇假設的概率,也就是不犯二型錯誤的概率。這里需要說明的是,在做差異檢驗時通常會設定研究假設,即兩者間存在差異的備擇假設。然后圍繞研究假設進行統(tǒng)計檢驗,在統(tǒng)計檢驗過程中會存在兩種錯誤,一種指二者間并不存在差異,而統(tǒng)計結(jié)果卻顯示存在差異,稱為一型錯誤用ɑ表示,判定指標為小于0.5;另一種指二者間明明存在差異,而統(tǒng)計結(jié)果卻顯示無差異,稱為二型錯誤用β表示,由于β值無法求出,所以要通過統(tǒng)計功效來判斷多大把握正確接受備擇假設。那么,針對統(tǒng)計功效究竟該何時報告呢?當統(tǒng)計結(jié)果顯示接受備擇假設時,以表明正確接受備擇假設的概率。所以在實際研究中,研究者希望統(tǒng)計效力足夠大,但統(tǒng)計效力受樣本量大小、顯著水平及效應大小的影響,其中顯著水平和效應大小是不可控的,只有樣本量的大小可以操控,所以換言之樣本容量的增加能夠提高統(tǒng)計效力,在實際的研究中,增加被試的數(shù)目是能夠提高統(tǒng)計效力的最重要的途徑,反過來也可以依據(jù)統(tǒng)計效力決定樣本量多少。目前,在樣本量的確定方面可以使用G-POWER軟件進行換算,該軟件分別結(jié)合了效果量、單雙尾檢驗、顯著性和統(tǒng)計功效等重要指標,對樣本的總量給出了最佳范圍,該軟件被國外廣大期刊所認可,針對具體操作環(huán)節(jié)由于篇幅有限不加以介紹。

3 數(shù)據(jù)實際含義描述的缺失

實施一個研究后,將會面對大量的數(shù)字信息,這些信息通常都是以原始數(shù)據(jù)的形式出現(xiàn),但原始數(shù)據(jù)的粗糙使讀者無法獲得其中的意義,此時就有描述統(tǒng)計的用武之地。描述統(tǒng)計指關于對已有數(shù)據(jù)進行描述或表征的技術。作用:(1)組織我們從樣本中收集到的數(shù)據(jù);(2)總結(jié)由樣本中得到的結(jié)果;(3)以一種輕松與人交流的方式呈現(xiàn)這種結(jié)果[3]。例某研究針對體育院校羽毛球?qū)_x不同性別學生競技狀態(tài)焦慮進行差異性檢驗并制定了圖表,但針對該表內(nèi)的數(shù)據(jù)沒有任何解釋,只是簡單羅列了數(shù)據(jù),并且沒有注明平均數(shù)和標準差,這讓讀者無法初步判斷變量特征,類似錯誤比比皆是,所以應該注意描述性統(tǒng)計是推論統(tǒng)計的重要前提,二者相輔相成缺一不可,如果描述性統(tǒng)計缺失,那將嚴重影響推論統(tǒng)計的可信度。

4 統(tǒng)計方法的適用前提不明

任何的統(tǒng)計方法都有與之相對應的統(tǒng)計前提,只有在滿足前提的要求下才可以實施,但在指導學生論文中發(fā)現(xiàn),大多學生并不了解,在論文的設計階段考慮不周,只是隨心所欲或者照葫蘆畫瓢,常常導致一些選題非常有價值的研究不了了之。目前最常見的錯誤就是在調(diào)查性研究中,為了驗證問卷的信度而采用間隔一段時間后實施兩次調(diào)查,然后將兩次調(diào)查的分數(shù)進行相關性分析,給出一個所謂的重測信度值R。但通過觀察問卷可以了解到,問卷中的題目既不是等距的也不是順序的,甚至還有個別復選題,針對這一類型數(shù)據(jù)根本無法進行相關檢驗,皮爾遜相關要求數(shù)據(jù)符合等距特征,斯皮爾曼要求數(shù)據(jù)符合順序特征。那么,這么多的調(diào)查類研究的R值是如何得出的呢?而且都非常穩(wěn)定的維持在0.8-0.9之間,這個我們不得而知,但至少我們知道它是錯誤的,這都說明研究者根本就不了解各種統(tǒng)計的前提就盲目的實施調(diào)查。筆者認為類似于純粹調(diào)查性的研究沒有必要進行問卷的信度檢驗,只要通過專家的效度檢驗即可。

5 不適宜的簡化

針對不適宜的簡化問題方面,筆者認為主要由于目前國內(nèi)體育界廣大學者對于統(tǒng)計基礎的掌握不夠以及對統(tǒng)計新方法的不了解所致。例如某經(jīng)典例子,某研究想針對新老教學方法展開比較研究,常見的錯誤方法是分別采用4個T檢驗,首先將實驗組與對照組在未實施實驗前進行一次獨立樣本T檢驗,目的證明兩組無差異,然后分別實施各自組的實驗前后進行配對樣本T檢驗,目的比較實驗組與對照組前后的差異大小,主要說明實驗組的效果好于對照組,最后再針對對照組和實驗組的后測進行一次獨立樣本T檢驗,目的證明兩者間有明顯差異性,實驗組好于對照組。針對以上設計存在兩方面錯誤:其一即使兩組參與者前測差異未達到顯著水平,也不能作為兩組被試相等的證據(jù),除非P值大于0.95可以接受。從哲學角度看,假設檢驗其實是一個推翻過程,而不是一個證實過程,比如我們假設所有的女性都留長發(fā),我們只要找一個短發(fā)的女性就可以推翻該假設,反過來即使找不到留短發(fā)的女性我們也無法下所有女性都是留長發(fā)的結(jié)論,也就說推翻不了女性都留長發(fā)的假設。根據(jù)這一理論,即使實驗組和對照組實驗前的差異不顯著,也不能成為兩組是相等的證據(jù),如果想證明兩組是相等的就應該假設兩組不相等假設,但T檢驗的目的是檢驗兩組是相等假設,所以這種方法是錯誤的。其二,多次使用T檢驗會增加一型錯誤的概率。比如一個完全可以運用方差分析的統(tǒng)計方法,將其拆分為4個T檢驗,這時就犯了不適宜簡化的錯誤,將導致一型錯誤的概率將由0.05上升至0.2。正確方法是每次用ɑ水平0.05為總體檢驗值然后除以檢驗的次數(shù),用得出的值作為假設檢驗的指標。所以4次T檢驗的值為0.05/4=0.0125,然后用每次檢驗的P值與ɑ水平0.0125相比較,如果P值小于或等于0.0125,則拒絕虛無假設,反之則接受虛無假設,這樣才能將保證整個檢驗犯一型錯誤不超過0.05,如果不這樣調(diào)整,每個檢驗都用0.05來執(zhí)行,那么一系列檢驗的總體ɑ水平將接近四個檢驗的ɑ水平之和,即0.2。針對以上問題解決方案有兩種:其一,如實驗前采用非隨機分組,建議考慮將前測變量作為協(xié)變量,進行協(xié)方差分析;如不能滿足協(xié)方差分析的條件,建議考慮對后測與前測的差異,進行方差分析。其二,如實驗采用嚴格的隨機分組,協(xié)方差分析或重復測量的方差分析(含組間變量)均可使用。

6 效果量考量的不足

效果量是衡量一個研究發(fā)現(xiàn)重要性的關鍵評價指標,尤其在沒有客觀單位的研究中。APA在針對論文報告方面明確要求作者要在結(jié)果報告中呈現(xiàn)效果量,但筆者查閱大量體育碩士學位論文,并沒有發(fā)現(xiàn)一篇論文注明效果量,并且國內(nèi)關于統(tǒng)計方面書籍中也幾乎很少涉及,再次證明了國內(nèi)體育科研工作者對統(tǒng)計學知識的了解不夠。大多學生認為只要我的研究拒絕了虛無假設,結(jié)果顯示P值小0.05就說明具有顯著性,研究就有新發(fā)現(xiàn),而且認為0.001比0.01差異顯著,0.01比0.05差異顯著,總之P值只要小于0.05就萬事大吉。其實不然,我們說所謂的顯著性背后隱藏的二者差異到底有多大,顯著性是不能說明的,它只代表差異大小,至于效果大小只能通過效果量來衡量。那么效果量該何時報告呢?只有當研究結(jié)果拒絕虛無假設,接受備擇假設時報告,反之則不必報告。目前大部分統(tǒng)計軟件都可以提供效果量的計算。

7 結(jié)果與結(jié)論的脫節(jié)

在此部分主要有兩方面常見錯誤:其一,不進行推論統(tǒng)計,就外推描述性統(tǒng)計結(jié)果,獲得對總體的結(jié)論。筆者認為應該明確描述統(tǒng)計和推論統(tǒng)計的在一項研究中的具體作用,描述性統(tǒng)計是在收集所有被試的反應數(shù)據(jù)之后,想知道被試的總體情況,例如被試的分數(shù)位于哪個區(qū)間?平均水平是多少?離散情況如何?要了解這些問題就必須要進行描述性統(tǒng)計。而推論統(tǒng)計目的常常是是要對一個總體的某個問題得出特定的結(jié)

論來驗證假設,但由于現(xiàn)實條件的限制,我們無法逐個考察總體當中的每一個個體,只能利用有代表性的樣本來推測總體的情況,這就是推論統(tǒng)計。所以描述統(tǒng)計和推論統(tǒng)計對于一個研究來說各司其職,但不能混為一談,應該區(qū)別對待。其二,推論統(tǒng)計未能推翻虛無假設,支持備擇假設,但結(jié)論中卻仍然對總體做出備擇假設正確的結(jié)論。針對這一低級錯誤屢見不鮮,常常表現(xiàn)為P值大于0.05,而結(jié)論中卻仍然義無反顧的敘述到備擇假設成立,似乎無論整個檢驗結(jié)果如何作者早已胸懷定論,統(tǒng)計的檢驗過程不過是一種形式而已,這一現(xiàn)象又一次說明了目前我國高校在體育統(tǒng)計方面培訓的嚴重欠缺。

結(jié)束語

以上七方面是目前體育碩士學位論文中常見的錯誤,應該引起我國體育科研的高度重視,在本科階段應重視基礎統(tǒng)計的應用學習,同時定期系統(tǒng)舉辦全國體育統(tǒng)計培訓會議,使廣大體育工作者及學生能夠及時掌握最前沿統(tǒng)計方法,形成學習,實踐,總結(jié),再學習,再實踐,再總結(jié)的培訓機制,“工欲善其事,必先利其器”,只有全面掌握了應用統(tǒng)計的各種方法,在體育科研中才能客觀的、科學的揭示體育現(xiàn)象及規(guī)律。

[1]田漢君. 首都體育學院專業(yè)學位碩士研究生學位論文統(tǒng)計方法應用現(xiàn)狀的研究[D].首都體育學院,2013.

[2]體育科學研究方法編寫組.體育科學研究方法[M].北京:北京體育大學出版社,2014.

[3]理查德·魯尼恩,奧黛麗·哈伯,凱·科爾曼,著,林豐勛,譯.心理統(tǒng)計導論M].北京:人民郵電出版社,2010.

Common Misuses and Solutions of Statistical Methods in Sport Master Degree Dissertations

Yan Shi, Chen Yongxin, Li Shangbin, Jiu Yanhong, Yang Jun

This research discusses the current common misuses of statistical methods in master degree dissertations in sports through the documentary method. The result has revealed misuses in 7 major aspects: randomness of sampling methods, aimlessness in determining the sample size, deficiency in describing the actual meaning of data, indeterminacy of the use premise for statistical methods, inappropriateness of method simplification, deficiency in considering the effect size, and separation between the conclusion and result.

sample size; effect size; sports statistics

哈爾濱工程大學2014年研究生教育教學改革項目(項目編號:JG2014YYB21)

焉石(1981-),男,黑龍江哈爾濱人,副教授,研究方向:體育教育訓練學

哈爾濱工程大學體育部,黑龍江 哈爾濱150001

Department of Physical Education, Harbin Engineering University, Harbin 150001, Heilongjiang, China.

G807

A

1005-0256(2016)010-0039-3

10.19379/j.cnki.issn.1005-0256.2016.010.018

猜你喜歡
樣本量論文檢驗
卡方檢驗的應用條件
一種基于進化算法的概化理論最佳樣本量估計新方法:兼與三種傳統(tǒng)方法比較*
苯中水分的檢驗
網(wǎng)絡Meta分析研究進展系列(二十):網(wǎng)絡Meta分析的樣本量計算及精確性評估
臨床研究樣本量的估計方法和常見錯誤
檢驗真朋友的新標準
本期論文英文摘要
本期論文英文摘要
小議離子的檢驗與共存
本期論文英文摘要