劉如強(qiáng),董寶林,張丹青,劉 陽,4,毛麗娟*
(1.上海體育學(xué)院 體育教育訓(xùn)練學(xué)院,上海 200438;2.蘇州幼兒師范高等??茖W(xué)校,江蘇 蘇州 215131;3.上海杉達(dá)學(xué)院 體育教研室,上海 201209;4.上海市學(xué)生體質(zhì)健康研究中心,上海 200438)
隨機(jī)對照試驗(yàn)(randomized controlled trial,RCT)是評價(jià)醫(yī)療保健干預(yù)措施的金標(biāo)準(zhǔn)(Schulz等,2010)。在體育科學(xué)研究中,RCT研究(包括對RCT的元分析)處在因果關(guān)系證據(jù)力度等級的頂端部分(張力為等,2017),能夠?yàn)橐蚬P(guān)系提供有力證據(jù),并廣泛應(yīng)用于學(xué)生身心健康促進(jìn)、運(yùn)動技能學(xué)習(xí)、老年人健康促進(jìn)、運(yùn)動員競技水平提高等領(lǐng)域。不可否認(rèn),我國當(dāng)代體育類的RCT研究尚未完全展現(xiàn)其應(yīng)有價(jià)值:一方面,與國內(nèi)其他專業(yè)相比,對方法學(xué)的關(guān)注弱于循證醫(yī)學(xué)等;另一方面,與國外同領(lǐng)域研究相比,部分研究質(zhì)量偏低(王帝之等,2019)。眾所周知,開展高質(zhì)量試驗(yàn)研究是體育科學(xué)研究不斷追求的目標(biāo)。為使RCT研究充分展現(xiàn)證據(jù)力度,需找到該類研究尚存的問題,有效提出改進(jìn)方向。近年,體育學(xué)者持續(xù)關(guān)注試驗(yàn)方法在體育科學(xué)研究中的應(yīng)用,對變量控制、樣本量、報(bào)告規(guī)范等環(huán)節(jié)出現(xiàn)的問題進(jìn)行了深入分析(石巖等,2014;張連成,2016;張連成 等,2020;張禹,2016),但鮮見對處于證據(jù)鏈頂端的RCT研究以及審視其方法學(xué)與報(bào)告的整體情況。鑒于此,有必要對我國體育類RCT研究的方法學(xué)與報(bào)告質(zhì)量進(jìn)行評價(jià)與分析。方法學(xué)是RCT的核心,試驗(yàn)報(bào)告是展現(xiàn)試驗(yàn)全貌與規(guī)范性的重要依據(jù),對兩者的評價(jià)與分析能全面了解我國體育類RCT研究的現(xiàn)狀與不足之處,從而進(jìn)一步提出發(fā)展或改進(jìn)方向。
RCT研究的方法學(xué)質(zhì)量常用偏倚風(fēng)險(xiǎn)(risk of bias)來體現(xiàn)(來保勇等,2018)。偏倚又稱系統(tǒng)誤差,指在研究過程中,一些已知或可控因素引起的使研究結(jié)果或推論系統(tǒng)地偏離真實(shí)情況(王建華,2010)223。偏倚風(fēng)險(xiǎn)是出現(xiàn)系統(tǒng)誤差的可能性,如果RCT研究中設(shè)計(jì)、實(shí)施、報(bào)告等環(huán)節(jié)未得到嚴(yán)格控制,就會高估或低估干預(yù)效果,增加偏倚風(fēng)險(xiǎn)。偏倚程度難以定量評價(jià),只能定性判斷偏倚風(fēng)險(xiǎn)。在眾多偏倚風(fēng)險(xiǎn)評估工具中,Cochrane風(fēng)險(xiǎn)偏倚評估工具(Higgins et al.,2011)更受專家推崇(曾憲濤 等,2012)。該工具對RCT方法學(xué)有重要影響的偏倚分為6個類別7個偏倚來源:選擇性偏倚(隨機(jī)序列生成與分配隱藏)、實(shí)施偏倚(主試或受試者施盲)、測量偏倚(對結(jié)局評估者施盲)、隨訪偏倚(結(jié)果數(shù)據(jù)不完整)、報(bào)告偏倚(選擇性報(bào)告)與其他偏倚,7種偏倚風(fēng)險(xiǎn)全面反映了RCT研究的方法學(xué)質(zhì)量。
RCT報(bào)告質(zhì)量問題在20世紀(jì)90年代已受到關(guān)注,為解決報(bào)告不充分問題,在方法學(xué)專家與期刊編輯等組成的研究小組建議下,TheJournaloftheAmericanMedical Association(JAMA)于1996年發(fā)表了試驗(yàn)報(bào)告的統(tǒng)一標(biāo)準(zhǔn)(consolidated standards of reporting trials,CONSORT)聲明(Begg et al.,1996)。此后,CONSORT工作組不斷對其進(jìn)行完善,形成了由1份包含25個條目的檢查對照清單和1份流程圖組成的CONSORT 2010聲明,并發(fā)表在British MedicalJournal(BMJ)上(Schulz等,2010)。該聲明自形成以來,得到全世界400多種期刊和多家編輯委員會的明確支持,對改善RCT報(bào)告質(zhì)量發(fā)揮了積極作用。
本研究運(yùn)用Cochrane偏倚風(fēng)險(xiǎn)評估工具與CONSORT 2010清單兩項(xiàng)權(quán)威工具,對2010—2020年體育科學(xué)研究領(lǐng)域《中文社會科學(xué)引文索引》(Chinese Social Sciences Citation Index,CSSCI)刊發(fā)的RCT文獻(xiàn)進(jìn)行偏倚風(fēng)險(xiǎn)評估和報(bào)告質(zhì)量評價(jià),旨在了解現(xiàn)狀、發(fā)現(xiàn)問題、提出建議。
以我國體育領(lǐng)域中RCT研究的偏倚風(fēng)險(xiǎn)和報(bào)告情況為研究對象,以2010—2020年均被評為CSSCI來源期刊的9本體育類期刊為調(diào)查對象:《體育科學(xué)》《中國體育科技》《上海體育學(xué)院學(xué)報(bào)》《北京體育大學(xué)學(xué)報(bào)》《體育學(xué)刊》《體育與科學(xué)》《天津體育學(xué)院學(xué)報(bào)》《武漢體育學(xué)院學(xué)報(bào)》《西安體育學(xué)院學(xué)報(bào)》。
通過文獻(xiàn)資料檢索、收集相關(guān)文獻(xiàn),運(yùn)用數(shù)理統(tǒng)計(jì)法對提取信息進(jìn)行統(tǒng)計(jì)與分析,對照Cochrane偏倚風(fēng)險(xiǎn)評估工具和CONSORT 2010清單進(jìn)行逐條評價(jià)。
1.2.1 文獻(xiàn)獲取
運(yùn)用中國知網(wǎng)(CNKI)高級檢索程序,來源期刊逐一選定指定期刊,來源類別設(shè)定為CSSCI,檢索時間設(shè)定為2010—2020年(截止時間為2021年1月1日),逐篇篩選(圖1)。首先將題目中出現(xiàn)干預(yù)、影響、實(shí)驗(yàn)、試驗(yàn)、實(shí)證、提升、促進(jìn)、改善、提高、實(shí)施、效應(yīng)、效果、效益、療效、應(yīng)用、作用、調(diào)節(jié)、學(xué)習(xí)、比較、關(guān)系、關(guān)聯(lián)字樣的文獻(xiàn)導(dǎo)入閱讀與管理軟件,然后根據(jù)摘要與全文進(jìn)一步篩選,根據(jù)納入標(biāo)準(zhǔn),最終168篇RCT文獻(xiàn)為符合標(biāo)準(zhǔn)文獻(xiàn)。
圖1 文獻(xiàn)篩選流程Figure 1.Process of Document Retrieval
1.2.2 納入與排除標(biāo)準(zhǔn)
納入標(biāo)準(zhǔn):1)包含干預(yù)組與對照組;2)受試對象分組時有“隨機(jī)分組”“隨機(jī)分配”等描述;3)以人為干預(yù)對象;4)試驗(yàn)報(bào)告了相關(guān)結(jié)局指標(biāo)。排除標(biāo)準(zhǔn):1)隨機(jī)分配固定班級或固定小組的試驗(yàn)設(shè)計(jì)[此類試驗(yàn)分配單位是組群而非個體,為整群隨機(jī)試驗(yàn),非真正的RCT研究(陳新林 等,2015)];2)動物類試驗(yàn);3)其他非隨機(jī)對照類試驗(yàn)。
1.2.3 信息提取
兩名研究員根據(jù)相關(guān)標(biāo)準(zhǔn)獨(dú)立逐篇閱讀、提取資料,如遇分歧,與第3名研究者討論解決。采用Endnote與Excel建立資料提取表提取資料,內(nèi)容主要包括文獻(xiàn)基本信息、研究方法學(xué)特征、報(bào)告規(guī)范評價(jià)指標(biāo)等。
1.2.4 評價(jià)
正式評價(jià)前,兩名研究員系統(tǒng)學(xué)習(xí)Cochrane評價(jià)手冊和CONSORT 2010聲明,利用計(jì)算機(jī)隨機(jī)數(shù)字生成器隨機(jī)抽取5篇進(jìn)行預(yù)評價(jià),保證兩位評價(jià)員對評價(jià)標(biāo)準(zhǔn)理解一致。正式評價(jià)共進(jìn)行3輪:第1輪兩名研究員分別根據(jù)標(biāo)準(zhǔn)進(jìn)行獨(dú)立評價(jià),第2輪與第3輪分別對上一輪評價(jià)不一致的條目進(jìn)行再次評價(jià)和討論,最終達(dá)到評價(jià)一致。
偏倚風(fēng)險(xiǎn)評估時,依據(jù)偏倚風(fēng)險(xiǎn)表中每個偏倚來源的詳細(xì)描述,對每篇文獻(xiàn)6類偏倚的7個來源信息進(jìn)行評估。結(jié)果判定時,將偏倚風(fēng)險(xiǎn)評為“低風(fēng)險(xiǎn)”“高風(fēng)險(xiǎn)”“不確定”3類。其中,“低風(fēng)險(xiǎn)”意味著存在的偏倚不可能嚴(yán)重影響研究結(jié)果,“高風(fēng)險(xiǎn)”代表存在的偏倚可能會嚴(yán)重減弱研究結(jié)果的可信度,“不確定”表示信息缺乏或?qū)撛谄胁淮_定,意味著存在的偏倚會引起對研究結(jié)果的懷疑。在評估的同時,將數(shù)據(jù)導(dǎo)入RevMan 5.4軟件分析處理,繪制偏倚風(fēng)險(xiǎn)圖直觀展現(xiàn)偏倚情況。
報(bào)告質(zhì)量評價(jià)時,對照CONSORT 2010聲明中25個條目內(nèi)容逐一評價(jià)所納入文獻(xiàn)。根據(jù)文獻(xiàn)描述,將各條目的報(bào)告情況劃分為“明確報(bào)告”“部分報(bào)告”“未報(bào)告”。結(jié)果評定時,將“明確報(bào)告”比例大于60%的條目評為“高質(zhì)量”,將“報(bào)告”比例大于60%(“明確報(bào)告”比例未達(dá)到60%,但與“部分報(bào)告”比例之和大于60%)的條目評為“中等質(zhì)量”,將“未報(bào)告”比例大于40%的條目評為“報(bào)告質(zhì)量較低”。由于篇幅限制,本研究重點(diǎn)關(guān)注方法學(xué)和規(guī)范性的條目,如“8a隨機(jī)序列產(chǎn)生”“12a描述統(tǒng)計(jì)方法”等,對體育類RCT研究較少涉及的一些提示性條目如“6b試驗(yàn)開始后結(jié)局指標(biāo)的任何變化及原因”等不進(jìn)行重點(diǎn)關(guān)注。此外,鑒于工具來自醫(yī)學(xué)領(lǐng)域,在評價(jià)時將11a條目中的“醫(yī)務(wù)工作者”改為“干預(yù)實(shí)施者”;將15條目中“臨床特征”改為“當(dāng)前水平”。
2010年1月—2020年12月,9本體育類C刊共刊登符合本研究標(biāo)準(zhǔn)的RCT文獻(xiàn)168篇(圖2),涉及10 169名受試者。
圖2 9本體育類C刊共刊登符合本研究標(biāo)準(zhǔn)的RCT文獻(xiàn)Figure 2.RCT Literature Published in 9 Sports Journals of CSSCI which Meet the Criteria of This Study
所有類別偏倚中,風(fēng)險(xiǎn)“不確定”的比例最高,選擇性偏倚、實(shí)施偏倚、測量偏倚、隨訪偏倚和其他偏倚類別中均有超過一半文獻(xiàn)為“風(fēng)險(xiǎn)不確定”(圖3),說明大多數(shù)文獻(xiàn)難以根據(jù)報(bào)告內(nèi)容判斷這5類偏倚的風(fēng)險(xiǎn)等級?!暗惋L(fēng)險(xiǎn)”偏倚類別主要涉及選擇性偏倚(隨機(jī)化序列生成)、實(shí)施偏倚、測量偏倚、隨訪偏倚、報(bào)告偏倚和其他偏倚,其中報(bào)告偏倚均為“低風(fēng)險(xiǎn)”,顯示所有文獻(xiàn)均無選擇性報(bào)告。偏倚“高風(fēng)險(xiǎn)”比例最低,主要集中在實(shí)施偏倚、隨訪偏倚和其他偏倚3類,具體體現(xiàn)在試驗(yàn)控制不充分、受試者流失過多和樣本量過少等。
圖3 偏倚風(fēng)險(xiǎn)Figure 3.Risk of Bias
報(bào)告質(zhì)量較高的條目(表1):所有文獻(xiàn)均介紹了試驗(yàn)背景(2a);94%的文獻(xiàn)報(bào)告了試驗(yàn)?zāi)康幕蚣僭O(shè)(2b);97%的文獻(xiàn)清楚界定了主次要結(jié)局指標(biāo)(6a);69%的文獻(xiàn)描述了各組干預(yù)措施的相似之處(11b);86%的文獻(xiàn)描述了統(tǒng)計(jì)學(xué)方法(12a);98%的文獻(xiàn)描述了招募和隨訪日期(14a);所有文獻(xiàn)均解釋了試驗(yàn)結(jié)果(22)。
表1 納入文獻(xiàn)報(bào)告質(zhì)量評價(jià)結(jié)果Table 1 The Results of Evaluation of Document Reporting Quality
續(xù)表1
報(bào)告質(zhì)量中等的條目:38%的文獻(xiàn)摘要缺少部分信息(1b);85%的文獻(xiàn)描述干預(yù)措施時不能完全滿足“可以重復(fù)試驗(yàn)”要求(5);56%的文獻(xiàn)只報(bào)告了分配時各組別人數(shù),處理和分析時的人數(shù)不詳(13a);所有文獻(xiàn)進(jìn)行結(jié)局評估時皆描述了主次要結(jié)果,47%的文獻(xiàn)報(bào)告評估效應(yīng)與精確度時不夠全面(17a)。
報(bào)告質(zhì)量較低的條目:所有文獻(xiàn)均難以通過題目識別為RCT研究(1a);60%的文獻(xiàn)未明確描述試驗(yàn)設(shè)計(jì)類型(3a);52%的文獻(xiàn)未提供受試者入選標(biāo)準(zhǔn)(4a);45%的文獻(xiàn)受試者來源描述過于簡單(4b);1%的文獻(xiàn)交代了樣本量確定依據(jù)(7a);3%的文獻(xiàn)報(bào)告了隨機(jī)序列產(chǎn)生方法(8a);11%的文獻(xiàn)報(bào)告施盲(11a);57%的文獻(xiàn)未報(bào)告受試者流失情況(13b);14%的文獻(xiàn)報(bào)告了研究局限性(20)。
偏倚控制展現(xiàn)RCT研究方法學(xué),高質(zhì)量的偏倚控制使研究得到更接近真實(shí)的結(jié)果;規(guī)范報(bào)告呈現(xiàn)試驗(yàn)全貌,高質(zhì)量的試驗(yàn)報(bào)告是讀者和本領(lǐng)域?qū)W者對研究進(jìn)行全面賞析與評價(jià)的前提。依據(jù)Cochrane偏倚評估工具中7種偏倚來源信息,認(rèn)為我國體育類RCT研究中選擇性偏倚、實(shí)施偏倚、測量偏倚、隨訪偏倚和其他偏倚的控制措施有待提升;對照CONSORT 2010聲明中25個條目內(nèi)容,認(rèn)為報(bào)告中文題摘要、受試者、樣本量、干預(yù)措施、統(tǒng)計(jì)方法與結(jié)局評估需進(jìn)一步規(guī)范。
3.1.1 選擇性偏倚
選擇性偏倚包括隨機(jī)序列的生成與使用、實(shí)施分配隱藏兩個類別。其中,隨機(jī)序列生成與使用,即隨機(jī)化處理在體育類RCT中涉及較多。對受試者進(jìn)行隨機(jī)化處理是RCT研究設(shè)計(jì)的三大原則之一(張寧,2010),正確使用隨機(jī)化有助于減少選擇或混雜偏倚,有利于實(shí)施盲法,以及使用概率論對組間差異進(jìn)行統(tǒng)計(jì)分析(Schulz et al.,2002b)。隨機(jī)化主要包括隨機(jī)抽樣與隨機(jī)分配,理想情況下是先對總體進(jìn)行隨機(jī)抽樣,然后進(jìn)行隨機(jī)分配。然而,現(xiàn)實(shí)中目標(biāo)總體太大,難以進(jìn)行隨機(jī)取樣,如若要探索身體活動對小學(xué)生基本動作技能的影響,無法得到全部小學(xué)生的名單進(jìn)行隨機(jī)取樣。在此情況下,為增加RCT研究的內(nèi)部效度,須保證隨機(jī)分配(伯克·約翰遜等,2015)。采取何種辦法進(jìn)行隨機(jī)分配體現(xiàn)主試如何努力控制選擇性偏倚,將風(fēng)險(xiǎn)降到最低,因此,Cochrane手冊判斷“低風(fēng)險(xiǎn)”的標(biāo)準(zhǔn)為研究者在序列產(chǎn)生過程中描述了隨機(jī)方法。在本次評估的168項(xiàng)研究中,僅5項(xiàng)研究描述了隨機(jī)序列的生成方式,如抽簽、使用隨機(jī)數(shù)字表或計(jì)算器取數(shù)程序等,其余163項(xiàng)研究的隨機(jī)過程均概括為將受試者隨機(jī)分為試驗(yàn)組和對照組,忽略了報(bào)告隨機(jī)序列生成方法、分配實(shí)施的相關(guān)信息,難以判斷隨機(jī)化過程是否合理、實(shí)施是否正確。根據(jù)Cochrane手冊,將此163項(xiàng)研究的選擇性偏倚風(fēng)險(xiǎn)等級評為“不確定”。風(fēng)險(xiǎn)“不確定”意味著可能存在的偏倚會引起本領(lǐng)域?qū)W者或讀者對研究結(jié)果的懷疑,使整體研究質(zhì)量降低。其實(shí),隨機(jī)化處理花費(fèi)的時間和精力較少,之后卻可以獲得科學(xué)的精確性和可信性,研究者應(yīng)該投入合適的資源生成恰當(dāng)?shù)男蛄?,并清晰展現(xiàn)所使用的方法(Schulz等,2010)。目前,科學(xué)研究方法的不斷發(fā)展對隨機(jī)方法提出了更高的要求。在眾多隨機(jī)方法中,擲硬幣、擲骰子、抽簽、抓鬮和發(fā)撲克牌等手工方法,因存在對隨機(jī)性造成傷害、執(zhí)行困難和缺乏驗(yàn)證試驗(yàn)等缺陷均已較少使用,隨機(jī)數(shù)字表、電腦隨機(jī)數(shù)字生成器、SPSS軟件或SAS軟件等克服了上述缺點(diǎn),均是較好的隨機(jī)方法(曾憲濤等,2013a)。
3.1.2 實(shí)施偏倚
實(shí)施偏倚評估重點(diǎn)考察對主試或受試者的施盲情況。在體育類RCT研究中,對主試施盲可以讓其在指導(dǎo)過程中避免心理預(yù)期,對受試者施盲可以讓其在自然狀態(tài)下進(jìn)行體育活動,對兩者同時施盲可以較大力度保證干預(yù)內(nèi)容“無污染”。在所納入168項(xiàng)RCT中,有8項(xiàng)試驗(yàn)對受試者施盲,其中2項(xiàng)同時對主試施盲,另外3項(xiàng)試驗(yàn)報(bào)告為單盲或雙盲試驗(yàn)。在偏倚風(fēng)險(xiǎn)評估時,根據(jù)Cochrane手冊將此11項(xiàng)試驗(yàn)的實(shí)施偏倚評為“低風(fēng)險(xiǎn)”。另有10項(xiàng)試驗(yàn),如研究在不同氧壓環(huán)境中探討高低氧環(huán)境對人體氧化應(yīng)激反應(yīng)等,滿足Cochrane手冊中未施盲法但結(jié)局不會受到未施盲法的影響判斷標(biāo)準(zhǔn),同樣評為“低風(fēng)險(xiǎn)”。5項(xiàng)研究存在試驗(yàn)人員或受試者知曉試驗(yàn)?zāi)康牡那闆r,實(shí)施偏倚風(fēng)險(xiǎn)等級為“高風(fēng)險(xiǎn)”。如在探討某運(yùn)動項(xiàng)目對大學(xué)生心血管影響試驗(yàn)中,受試者分組和教學(xué)均由試驗(yàn)設(shè)計(jì)者實(shí)施,主試的期望很可能會出現(xiàn)羅森塔爾效應(yīng),增加實(shí)施偏倚風(fēng)險(xiǎn);在另外4項(xiàng)研究中,受試者明確知曉試驗(yàn)內(nèi)容和目的,可能出現(xiàn)霍桑效應(yīng)或約翰亨利效應(yīng)影響干預(yù)效果。在體育類RCT研究中,對受試者施盲較為容易,如不告知受試者練習(xí)目的等;由于多數(shù)主試身兼試驗(yàn)設(shè)計(jì)者、干預(yù)實(shí)施者、結(jié)果測量人員等多重身份,對主試施盲相對困難,為降低偏倚風(fēng)險(xiǎn),采取第三者干預(yù)等方式可有效控制偏倚。
3.1.3 測量偏倚
測量偏倚重點(diǎn)評估結(jié)果測量是否施盲,在結(jié)果評價(jià)環(huán)節(jié)施盲可以保證干預(yù)結(jié)果真實(shí)可靠,展現(xiàn)干預(yù)措施的原本效果。在168項(xiàng)體育類RCT的測量偏倚評價(jià)中,7項(xiàng)研究描述了結(jié)局測量時的具體施盲方法,滿足對結(jié)局測量施盲,且盲法不會被破壞的標(biāo)準(zhǔn),測量偏倚為“低風(fēng)險(xiǎn)”。7項(xiàng)研究中施盲方法主要有:1)評價(jià)時隨機(jī)編輯受試者順序,如在《網(wǎng)球初學(xué)者類比學(xué)習(xí)和外顯學(xué)習(xí)的協(xié)同效應(yīng)》研究中,將每位受試的擊球動作視頻編輯成獨(dú)立文件并隨機(jī)分成3組進(jìn)行評定;2)不告知測量人員有關(guān)試驗(yàn)信息,如《功能訓(xùn)練對青少年過度胸椎后凸干預(yù)效果的研究》進(jìn)行結(jié)果測量時,脊柱形態(tài)測試人員不知曉受試者的脊柱健康狀況;3)測量評價(jià)環(huán)節(jié)交由第三方實(shí)施,如在《五禽戲干預(yù)中年男性代謝綜合征的效果及生物學(xué)機(jī)制探討》中,相關(guān)體質(zhì)和血液指標(biāo)檢測均由第三方協(xié)助完成。此外,有47項(xiàng)研究在結(jié)果測量時雖然未施盲法,同樣滿足結(jié)局測量不會受到未施盲法的影響要求,測量偏倚風(fēng)險(xiǎn)較低。如在多項(xiàng)與心理發(fā)展有關(guān)的試驗(yàn)中,測試結(jié)果直接由電腦生成;多項(xiàng)試驗(yàn)測試指標(biāo)為血鎂濃度等血液指標(biāo),結(jié)果必須由相關(guān)儀器進(jìn)行檢測和分析。評估時認(rèn)為此類試驗(yàn)結(jié)果測量和評價(jià)較為客觀,測量偏倚控制較好,故評為“低風(fēng)險(xiǎn)”。一般而言,結(jié)果測評指標(biāo)完全由儀器進(jìn)行評價(jià)時,可在一定程度上避免主觀傾向,測量偏倚風(fēng)險(xiǎn)較低;若結(jié)果測量環(huán)節(jié)含有主觀評價(jià)內(nèi)容,建議采取隨機(jī)編輯受試者或第三方測評等措施減少測量偏倚。
測量偏倚與實(shí)施偏倚主要考察試驗(yàn)的施盲情況,成功施盲可以提高試驗(yàn)效度,發(fā)表在《柳葉刀》上的研究總結(jié)了成功施盲具有減少受試者流失等多項(xiàng)潛在益處(Schulz et al.,2002a)。整理168篇文獻(xiàn)發(fā)現(xiàn),體育類RCT研究在施盲環(huán)節(jié)存在以下不足之處:1)施盲試驗(yàn)不多。近10年9本C刊報(bào)告施盲的試驗(yàn)為18項(xiàng),占比11%,比例較低。2)施盲對象不夠豐富。RCT試驗(yàn)中,施盲對象可以有受試者和(或)實(shí)施者和(或)數(shù)據(jù)分析者和(或)結(jié)果評價(jià)者,相應(yīng)的盲法有單盲、雙盲、三盲和四盲4種(曾憲濤等,2013b)。在本次納入的18項(xiàng)施盲的試驗(yàn)中,有12項(xiàng)單盲試驗(yàn),雙盲及以上的盲法較少;從具體施盲對象來看,主要對受試者或測試人員施盲,對主試或數(shù)據(jù)分析人員施盲的試驗(yàn)不多。3)描述不夠準(zhǔn)確和詳細(xì)。2項(xiàng)研究報(bào)告為“雙盲試驗(yàn)”,但施盲對象分別描述為“受試者、體育教師和測試人員”“受試者、教練員和隊(duì)醫(yī)”,皆應(yīng)為三盲試驗(yàn)。另有3項(xiàng)研究僅簡略報(bào)告為“本試驗(yàn)為單盲試驗(yàn)”等,難以判斷試驗(yàn)施盲對象、施盲是否成功,也難以判斷偏倚風(fēng)險(xiǎn)等級?;谝陨蠁栴},未來研究中應(yīng)盡可能實(shí)施盲法,并在報(bào)告中準(zhǔn)確描述施盲對象,詳細(xì)報(bào)告施盲過程,以便讀者判斷盲法質(zhì)量。
3.1.4 隨訪偏倚
隨訪偏倚是指研究中受試者退出導(dǎo)致結(jié)局?jǐn)?shù)據(jù)不完整帶來的系統(tǒng)誤差,判斷其風(fēng)險(xiǎn)等級主要依據(jù)每個結(jié)局指標(biāo)中結(jié)果數(shù)據(jù)的完整性,即流失與剔除的數(shù)據(jù)。如果試驗(yàn)中流失或試驗(yàn)后被剔除的數(shù)據(jù)過多,可能意味著干預(yù)措施質(zhì)量不高、統(tǒng)計(jì)分析失衡,導(dǎo)致試驗(yàn)證據(jù)力度較低。體育類RCT研究干預(yù)周期長、不可控因素較多,較易出現(xiàn)隨訪偏倚。本次評估的168項(xiàng)試驗(yàn)中,41項(xiàng)明確報(bào)告沒有受試者流失或被剔除,隨訪偏倚風(fēng)險(xiǎn)等級為“低風(fēng)險(xiǎn)”。評估明確報(bào)告流失數(shù)目的27項(xiàng)研究時,根據(jù)以下3個問題逐步判斷:1)是否可以獲得絕大多數(shù)受試者的結(jié)局?jǐn)?shù)據(jù),一般認(rèn)為流失率低于5%時發(fā)生偏倚的風(fēng)險(xiǎn)較?。?)數(shù)據(jù)缺失的比例和原因在組間是否均衡,其中“均衡”是指各組間數(shù)據(jù)缺失的比例接近,各組缺失的原因沒有系統(tǒng)性差異;3)是否有證據(jù)支持,即使存在數(shù)據(jù)缺失,分析結(jié)果仍然是可靠的(楊智榮等,2017)。評估中,19項(xiàng)研究或流失率低于安全臨界點(diǎn),或流失率雖略高于5%但組間仍較為均衡,風(fēng)險(xiǎn)等級為“低風(fēng)險(xiǎn)”;8項(xiàng)研究流失率較高,且上述第3個問題為否定答案,隨訪偏倚等級評為“高風(fēng)險(xiǎn)”。其余100項(xiàng)研究均遺漏了報(bào)告受試者流失情況,難以判斷結(jié)局?jǐn)?shù)據(jù)是否完整,隨訪偏倚風(fēng)險(xiǎn)等級均為“不確定”??梢姡L(fēng)險(xiǎn)“不確定”比例較高與存在“高風(fēng)險(xiǎn)”是當(dāng)前體育類RCT研究中控制隨訪偏倚需要解決的兩個問題。解決風(fēng)險(xiǎn)“不確定”比例較高的問題,需要在控制發(fā)表偏倚的前提下規(guī)范RCT報(bào)告;解決存在“高風(fēng)險(xiǎn)”的問題,可采取試驗(yàn)前請受試者認(rèn)真閱讀知情同意書、與受試者(或監(jiān)護(hù)人)簽訂試驗(yàn)協(xié)議,試驗(yàn)中鼓勵受試者、增加人文關(guān)懷,試驗(yàn)后及時補(bǔ)測等措施降低隨訪偏倚。
3.1.5 其他偏倚
除上述環(huán)節(jié)外,RCT研究還包括招募、設(shè)置對照、安排主試、設(shè)置干預(yù)時間與地點(diǎn)等諸多環(huán)節(jié),每一環(huán)節(jié)未得到嚴(yán)格控制都有可能影響試驗(yàn)質(zhì)量,造成試驗(yàn)偏倚。Cochrane手冊將偏倚風(fēng)險(xiǎn)評估工具未提到且與偏倚有重要關(guān)聯(lián)的情況列為其他偏倚。在此類偏倚風(fēng)險(xiǎn)評估中,21項(xiàng)研究因各環(huán)節(jié)控制較好,符合沒有其他偏倚來源標(biāo)準(zhǔn),評為“低風(fēng)險(xiǎn)”;143項(xiàng)研究根據(jù)沒有充分信息判斷是否存在重要偏倚風(fēng)險(xiǎn)的判斷依據(jù),偏倚風(fēng)險(xiǎn)等級評為“不確定”;另外4項(xiàng)試驗(yàn)中存在如各組別受試者人數(shù)過少(不到5名)、受試者心理狀態(tài)評定(試驗(yàn)重要環(huán)節(jié))不規(guī)范、因變量測試結(jié)果誤差較大等問題,增加試驗(yàn)偏倚的可能性較大,故評為“高風(fēng)險(xiǎn)”。其他偏倚類別雖然沒有明確涉及試驗(yàn)?zāi)骋画h(huán)節(jié),但涉及面更廣,涵蓋的內(nèi)容更多,提示,開展RCT研究時,研究者需嚴(yán)格、嚴(yán)謹(jǐn)處理每個環(huán)節(jié)。
綜上,偏倚控制是RCT研究的重要組成部分,部分體育類RCT研究的偏倚控制相對欠缺。未來開展RCT研究時,研究者應(yīng)不斷鉆研試驗(yàn)方法,嚴(yán)格控制試驗(yàn)過程的每一步驟,努力降低各環(huán)節(jié)偏倚風(fēng)險(xiǎn),提高試驗(yàn)質(zhì)量,展現(xiàn)RCT研究應(yīng)有的高證據(jù)力度。
3.2.1 文題摘要
文題不夠精確、部分摘要信息不夠完整是此條目的主要問題。1)文題:25個條目的檢查對照清單要求根據(jù)文題能夠識別為隨機(jī)試驗(yàn),所納入文獻(xiàn)文題多以“……對……的影響”或“……的試驗(yàn)研究”為主,均無法識別為RCT研究。在檢索和篩選文獻(xiàn)時發(fā)現(xiàn),此類描述方式與單組試驗(yàn)研究、隨機(jī)分配固定班級試驗(yàn)的文題描述類似,但后兩者屬于準(zhǔn)試驗(yàn)(張力為,2002)或弱試驗(yàn)(黃漢升,2005),與被稱為真試驗(yàn)研究的RCT研究在提供因果關(guān)系證據(jù)力度上存在較大差距?,F(xiàn)有描述方式難以凸顯“隨機(jī)對照”,忽視了RCT研究的意義和價(jià)值,同時為辨別是否為RCT研究增加了難度,故建議在RCT報(bào)告文題中增加“隨機(jī)對照試驗(yàn)”等描述。2)摘要:在CONSORT 2010聲明影響下,作者和編輯將會愈加注重對摘要的要求,如表達(dá)清晰、撰寫規(guī)范、提供相應(yīng)關(guān)鍵信息等,以使讀者通過摘要正確評估整個試驗(yàn)(Hays et al.,2016)。所納入文獻(xiàn)中有70篇摘要未完全符合對照清單要求,多數(shù)文獻(xiàn)的結(jié)構(gòu)式摘要缺少試驗(yàn)設(shè)計(jì)信息,少數(shù)摘要僅報(bào)告了試驗(yàn)宏觀意義和結(jié)論,試驗(yàn)關(guān)鍵信息描述不夠全面。雖然對照清單考慮到很多期刊有自己的寫作格式,并非要求其改變格式,但仍建議RCT研究報(bào)告使用結(jié)構(gòu)式摘要報(bào)告目的、方法、設(shè)計(jì)、結(jié)果和結(jié)論,表述簡單明了,更易使讀者準(zhǔn)確獲取信息。
3.2.2 受試者
對照清單中,4a、4b、13a、13b等多個條目與受試者有關(guān),本研究將涉及受試者的內(nèi)容作集中討論。依照清單,所納入文獻(xiàn)中與受試者有關(guān)的問題主要包括部分文獻(xiàn)中缺少納入標(biāo)準(zhǔn)、來源信息不夠詳細(xì)、忽略各階段人數(shù)報(bào)告,以及流失或被剔除等信息不夠詳細(xì)。1)受試者納入標(biāo)準(zhǔn)在試驗(yàn)最初階段或隨機(jī)分配之前使用,詳細(xì)描述納入標(biāo)準(zhǔn)有助于重復(fù)該試驗(yàn)和準(zhǔn)確判定試驗(yàn)效果推廣到人群類別(張禹,2016)。在所納入文獻(xiàn)中,超過半數(shù)忽略了提供受試者標(biāo)準(zhǔn),多數(shù)文獻(xiàn)是受試者入選后對其特征進(jìn)行描述,使讀者對試驗(yàn)效果的適用人群產(chǎn)生疑惑。與針刺類100%的研究(陳曉虹等,2020)提供受試者納入標(biāo)準(zhǔn)相比,體育類RCT研究在受試者選擇環(huán)節(jié)需要更加嚴(yán)謹(jǐn)。2)根據(jù)對照清單,受試者來源和資料獲取場所需要準(zhǔn)確報(bào)告。我國幅員遼闊,南北、東西部地區(qū)差別較大,不同的環(huán)境、試驗(yàn)場所,以及文化、經(jīng)濟(jì)、氣候等因素會影響研究結(jié)果的外部真實(shí)性。在所納入文獻(xiàn)中,75篇文獻(xiàn)對受試者的描述類似于“以女大學(xué)生為研究對象”,讓讀者難以判斷該受試者來自哪個城市或哪個地區(qū),對重復(fù)試驗(yàn)和判斷試驗(yàn)推廣程度造成影響。3)受試者流程:試驗(yàn)研究開展時間較長,受不可控因素較多,在試驗(yàn)的各階段都可能有受試者流失或被剔除,因此,對照清單要求明確報(bào)告分配、處理與分析時各組人數(shù),并極力推薦使用流程圖(圖4)。閱讀168篇納入文獻(xiàn)發(fā)現(xiàn),絕大部分文獻(xiàn)在試驗(yàn)開始部分的分配環(huán)節(jié)報(bào)告了各組人數(shù),僅41%的文獻(xiàn)(69篇)通過使用流程圖、描述流失情況、在表格中注明等形式報(bào)告了試驗(yàn)各階段受試者人數(shù)。99篇文獻(xiàn)由于作者未在干預(yù)和數(shù)據(jù)分析環(huán)節(jié)報(bào)告受試者人數(shù),或報(bào)告有流失卻忽略了報(bào)告流失時段與具體人數(shù),使讀者不清楚試驗(yàn)后期各組別受試者流失情況、具體分析數(shù)目,難以判斷受試者流失對試驗(yàn)偏倚造成的影響。鑒于以上情況,建議報(bào)告中明確受試者入選標(biāo)準(zhǔn)和來源信息,并使用流程圖,以便讀者了解試驗(yàn)過程中受試者整體狀況。同時,即使整個試驗(yàn)過程沒有受試者流失或被剔除,建議同樣在文中注明。
圖4 兩組平行隨機(jī)對照試驗(yàn)各階段受試者流程(Schulz等,2010)Figure 4.Flow Diagram of the Progress Through the Phases of a Parallel Randomized Trial of Two Groups(Schulz等,2010)
3.2.3 樣本量
所納入文獻(xiàn)中,99%的文獻(xiàn)未報(bào)告試驗(yàn)樣本量的確定依據(jù)。出于科學(xué)與倫理的原因,須詳細(xì)計(jì)算開展試驗(yàn)的樣本量,并在實(shí)際意義與統(tǒng)計(jì)學(xué)要求之間求取平衡(Moher et al.,2010)。因?yàn)橹挥泻线m的樣本量才能保證檢驗(yàn)效能,樣本量過小或過大都有其弊端。樣本量過小,指標(biāo)不穩(wěn)定,研究的偶然性增加,導(dǎo)致試驗(yàn)的可重復(fù)性變差、統(tǒng)計(jì)力度降低,影響試驗(yàn)的內(nèi)部效度(張連成,2016);樣本量過大,不僅浪費(fèi)人、財(cái)、力,還可能引入更多混雜因素,影響數(shù)據(jù)質(zhì)量(李嬋娟等,2011)。在本研究所納入的RCT研究中,樣本量最小為10,最大為1 000,除2項(xiàng)研究報(bào)告利用前人研究的效應(yīng)量估算樣本量外,其他166項(xiàng)均忽略了報(bào)告樣本量計(jì)算過程,特別是總體樣本量較低或每組樣本量較低(2項(xiàng)試驗(yàn)每組只有4名受試者)的研究,難以判斷是否考慮了檢驗(yàn)效能。通過整理發(fā)現(xiàn)目前體育類RCT研究樣本量確定方法主要有:1)招募,招募到受試者的數(shù)量即為樣本含量;2)根據(jù)教學(xué)對象數(shù)量,如對剛?cè)雽W(xué)的大一新生或某選項(xiàng)課所有學(xué)生進(jìn)行試驗(yàn)。從確定途徑來看,多數(shù)RCT研究樣本量確定的隨意性較大,使試驗(yàn)不夠嚴(yán)謹(jǐn),顯示出與國外同領(lǐng)域RCT研究質(zhì)量的差距。因此,建議未來體育類RCT研究在設(shè)置樣本量環(huán)節(jié)投入更多精力,并在報(bào)告中詳細(xì)展現(xiàn)樣本量計(jì)算過程。在確定樣本量時,可以參考已有表格或利用相關(guān)公式,也可以在確定效應(yīng)量、檢驗(yàn)效能(1-β)和I類錯誤概率(α)后,通過G-Power軟件獲得。其中,效應(yīng)量可以通過前人研究或預(yù)試驗(yàn)獲得,檢驗(yàn)效能和I類錯誤概率通常情況下可以設(shè)置為0.80和0.05(Schulz等,2010)。需要注意的是,在實(shí)際應(yīng)用時需要考慮15%~20%的損失,以免樣本流失導(dǎo)致樣本含量不足(王建華,2010)78。
3.2.4 干預(yù)措施
依據(jù)對照清單,需要描述各組干預(yù)措施的準(zhǔn)確詳情,如何及何時實(shí)施干預(yù)。本研究所納入文獻(xiàn)的主要問題在于何時、何人干預(yù)的信息不夠詳細(xì),常規(guī)對照組的描述不夠具體。以上問題不僅影響讀者了解試驗(yàn)背景與過程,還影響判斷該試驗(yàn)的外部效度。首先,何時干預(yù)的問題主要體現(xiàn)在兩個方面:1)84%的文獻(xiàn)在報(bào)告干預(yù)時間時未具體到年、月、日。由于在不同年份、季節(jié),甚至同一天的不同時間進(jìn)行干預(yù),影響效果都有可能不同,如學(xué)齡前兒童春季在園的中、高強(qiáng)度身體活動時間顯著高于冬季(常振亞等,2020),人體精細(xì)運(yùn)動在早上表現(xiàn)更好,無氧運(yùn)動與肌肉力量在下午表現(xiàn)更好(Chtourou et al.,2012)等。因此,體育類RCT報(bào)告在描述干預(yù)時間時應(yīng)更加詳細(xì),如《兩種軀干支柱力量訓(xùn)練方案對身體姿態(tài)控制影響程度的研究》將干預(yù)時間報(bào)告為2014年9月8日—11月14日。2)報(bào)告時以干預(yù)頻率代替何時干預(yù)。干預(yù)頻率雖然明確了每周干預(yù)幾次,然而模糊的干預(yù)時間同樣會影響判斷試驗(yàn)效果。如同樣每周干預(yù)2次,周一、周二進(jìn)行干預(yù)與周一、周四進(jìn)行干預(yù)效果可能不同,因此報(bào)告時應(yīng)明確具體時間,如在每周一、周四的下午課外活動時間進(jìn)行干預(yù)等,讓讀者清晰知曉具體干預(yù)時間。其次,133篇文獻(xiàn)未報(bào)告何人干預(yù)。在體育科學(xué)研究中,多數(shù)干預(yù)類試驗(yàn)是受試者在指導(dǎo)下進(jìn)行某種練習(xí),然后觀察練習(xí)帶來的影響。在練習(xí)中,不同身份的指導(dǎo)者如一般人員與專業(yè)教練、新教師與經(jīng)驗(yàn)豐富的老教師對受試者產(chǎn)生的影響會有所不同。因此,在報(bào)告中需明確指導(dǎo)者身份,并對性別、專長、從業(yè)年限等作簡要介紹,讓讀者了解更多試驗(yàn)信息。再次,對照組的描述過于簡單。對照清單明確要求報(bào)告各組干預(yù)措施的準(zhǔn)確詳情,以便重復(fù),即作者應(yīng)該詳盡描述包括對照組在內(nèi)的每一種干預(yù)措施,足以讓其他研究者進(jìn)行實(shí)踐和推廣(Glasziou et al.,2008)。在設(shè)置常規(guī)對照組(受試者不接受特殊干預(yù)措施,只進(jìn)行常規(guī)鍛煉)的121篇文獻(xiàn)中,51篇用“進(jìn)行常規(guī)鍛煉”等概括對照組在干預(yù)期間的活動情況,由于常規(guī)鍛煉的具體內(nèi)容、方式等不夠明確,難以判斷干預(yù)效應(yīng)是建立在何種對照之上,也難以為后續(xù)研究者重復(fù)試驗(yàn)提供借鑒。故報(bào)告時,在發(fā)表篇幅允許的條件下,應(yīng)對包括對照組在內(nèi)的各組干預(yù)措施進(jìn)行更加詳盡的描述。
3.2.5 統(tǒng)計(jì)方法
對照清單發(fā)現(xiàn),部分文獻(xiàn)中統(tǒng)計(jì)方法的問題主要是描述不夠精確。同時,通過進(jìn)一步分析發(fā)現(xiàn),涉及統(tǒng)計(jì)方法的內(nèi)容中還存在部分文獻(xiàn)忽略了前提條件與檢驗(yàn)水準(zhǔn)描述欠規(guī)范兩個問題。首先,所納入文獻(xiàn)中,24篇文獻(xiàn)由于描述不夠精確,使讀者難以知曉在統(tǒng)計(jì)分析時具體使用何種統(tǒng)計(jì)分析方法。其中,9篇文獻(xiàn)僅報(bào)告使用了“t檢驗(yàn)”,未具體說明是3種t檢驗(yàn)中的哪一種;15篇文獻(xiàn)將統(tǒng)計(jì)方法或數(shù)據(jù)處理過程概括為“經(jīng)過統(tǒng)計(jì)學(xué)檢驗(yàn)”或“統(tǒng)計(jì)分析顯示”等,具體用的何種統(tǒng)計(jì)方法同樣不清晰。統(tǒng)計(jì)方法描述不夠精確的文獻(xiàn)雖然不多,但體現(xiàn)出部分作者對準(zhǔn)確描述統(tǒng)計(jì)方法環(huán)節(jié)不夠重視,報(bào)告的嚴(yán)謹(jǐn)程度需要進(jìn)一步提高。其次,在選擇統(tǒng)計(jì)分析方法時,研究者不僅需要考慮變量間關(guān)系等問題,還需考慮數(shù)據(jù)滿足統(tǒng)計(jì)分析方法的前提條件,如數(shù)據(jù)類型及分布形態(tài)、變量間關(guān)系的形式、組間方差同質(zhì)性等(郭璐,2016)。在整理統(tǒng)計(jì)方法的前提條件時發(fā)現(xiàn),明確報(bào)告統(tǒng)計(jì)方法的144篇文獻(xiàn)中,僅11篇報(bào)告了數(shù)據(jù)滿足所使用統(tǒng)計(jì)方法的前提條件,說明這一點(diǎn)尚未得到足夠重視。另外,部分文獻(xiàn)在描述檢驗(yàn)水準(zhǔn)時存在不規(guī)范情況。在報(bào)告了檢驗(yàn)水準(zhǔn)的115篇文獻(xiàn)中,描述形式主要有:1)統(tǒng)計(jì)顯著性為P=0.05;2)置信區(qū)間α=0.01;3)P<0.05表示差異顯著,P<0.01表示差異非常顯著;4)顯著性水平取P<0.05;5)統(tǒng)計(jì)檢驗(yàn)的顯著水平設(shè)置為α<0.05;6)顯著性水平為α=0.05。前兩種描述明顯錯誤,第3~5的問題分別在于“差異具有顯著性”更傾向描述為差異具有統(tǒng)計(jì)學(xué)意義、忽視了P=0.05(或0.01)的情況、顯著性水平不是用P而是用α表示。需要強(qiáng)調(diào)的是α為I型錯誤概率的上限,應(yīng)為一個具體值,因此檢驗(yàn)水準(zhǔn)應(yīng)表述為“檢驗(yàn)水準(zhǔn)α=0.05”或“顯著性水平α=0.05”(郭瑞 等,2019)。
3.2.6 結(jié)局評估
所納入文獻(xiàn)在結(jié)局評估時的主要問題是結(jié)局指標(biāo)報(bào)告不規(guī)范、不全面。對照清單明確結(jié)局評估需要報(bào)告各指標(biāo)的結(jié)果、估計(jì)效應(yīng)值及精確性(如95%置信區(qū)間),絕大部分文獻(xiàn)明確報(bào)告了結(jié)果指標(biāo)測量值,包括數(shù)據(jù)的集中趨勢(如連續(xù)變量的均值)與離散趨勢(如標(biāo)準(zhǔn)差)等,但在報(bào)告精確值與估計(jì)效應(yīng)量方面需要更加準(zhǔn)確和規(guī)范。在P值報(bào)告方面,雖然P值的使用目前仍然處于爭論之中(Diaz-Quijano et al.,2020),但在如何解讀統(tǒng)計(jì)效應(yīng)的新共識達(dá)成之前,P值仍可以對結(jié)果進(jìn)行有價(jià)值的描述。目前,越來越多的期刊要求報(bào)告精確的P值,本研究所有納入文獻(xiàn)在報(bào)告統(tǒng)計(jì)效應(yīng)時均使用了P值,但有79篇文獻(xiàn)未報(bào)告具體P值,只報(bào)告為P<0.05或P<0.01,另有多篇文獻(xiàn)中P值報(bào)告的數(shù)值形式不統(tǒng)一。為規(guī)范報(bào)告與促進(jìn)交流,借鑒醫(yī)學(xué)領(lǐng)域?qū)值報(bào)告規(guī)定,建議P值大于0.05時報(bào)告小數(shù)點(diǎn)后兩位;P值在0.05至0.001之間報(bào)告小數(shù)點(diǎn)后三位;P值小于0.001時報(bào)告為P<0.001(嚴(yán)若華 等,2019;Habibzadeh,2017)。除報(bào)告顯著性外,同時報(bào)告效應(yīng)量(效果量)和置信區(qū)間早已得到學(xué)界重視(郭璐,2016;張力為 等,2013;Appelbaum et al.,2018)。然而,在所納入文獻(xiàn)中,除報(bào)告均值外僅有9篇在報(bào)告效應(yīng)量時報(bào)告了η2的大小,10篇文獻(xiàn)報(bào)告了置信區(qū)間,且其中1篇將置信區(qū)間描述為“置信區(qū)間α=0.01”,顯然將置信區(qū)間和檢驗(yàn)水準(zhǔn)混淆。可見,同時報(bào)告置信區(qū)間與效應(yīng)量是未來體育類RCT研究需要進(jìn)一步完善的地方。效應(yīng)量表示處理效應(yīng)或調(diào)查變量相關(guān)的大小;置信區(qū)間表示如果重復(fù)該試驗(yàn),在所有計(jì)算出的置信區(qū)間中,約有95%(95%置信水平)的置信區(qū)間包含真實(shí)均值(王珺,2019),其不僅能幫助回答差別是否有統(tǒng)計(jì)學(xué)意義,還能提示差別有無實(shí)際意義。因此報(bào)告結(jié)果時,除報(bào)告P值外,必須兼顧效應(yīng)量和置信區(qū)間才能獲取更多的信息和進(jìn)行更完整的分析。
總之,試驗(yàn)報(bào)告出現(xiàn)的以上問題對讀者準(zhǔn)確獲取試驗(yàn)信息、全面了解試驗(yàn)過程,以及重復(fù)試驗(yàn)增加了困難,原因可能是體育領(lǐng)域無干預(yù)類報(bào)告標(biāo)準(zhǔn),部分作者忽視了某個環(huán)節(jié)的重要性,以及發(fā)表篇幅限制等。未來撰寫試驗(yàn)報(bào)告時,研究者應(yīng)在滿足發(fā)表要求的同時盡可能使描述詳細(xì)、準(zhǔn)確和規(guī)范,以呈現(xiàn)高質(zhì)量的試驗(yàn)報(bào)告。
本研究雖然嚴(yán)格按照Cochrane評價(jià)手冊和CONSORT 2010聲明進(jìn)行評估,但兩項(xiàng)評價(jià)工具均來自醫(yī)學(xué)領(lǐng)域,學(xué)科不同必定存在一定局限性。首先,醫(yī)學(xué)領(lǐng)域RCT研究更多關(guān)照干預(yù)措施(醫(yī)藥或治療措施等)對受試者的作用,在體育類RCT研究中,除干預(yù)措施與受試者發(fā)生互動外,還存在干預(yù)實(shí)施者(如體育教師、教練等)與受試者之間、受試者相互間的情感交流與人文關(guān)懷,這一點(diǎn)難以用工具客觀評價(jià)。其次,醫(yī)學(xué)類RCT研究大多探究自變量的劑量效應(yīng)與時間效應(yīng),體育領(lǐng)域RCT研究中的自變量不僅與運(yùn)動量、干預(yù)周期有關(guān),還與運(yùn)動強(qiáng)度控制、主試的人格魅力、受試者心理狀態(tài)、干預(yù)環(huán)境、所用設(shè)備器材等有關(guān),本研究所使用工具中的評價(jià)條目尚不能呈現(xiàn)所有內(nèi)容。再次,醫(yī)學(xué)類RCT因變量更多關(guān)注對生命體征嚴(yán)格、精確與客觀的數(shù)字化檢測,體育類研究結(jié)果除關(guān)注身體健康外,還關(guān)注與健康有關(guān)的所有方面,如精神面貌的改善、鍛煉習(xí)慣養(yǎng)成、運(yùn)動發(fā)生機(jī)制、團(tuán)隊(duì)間的影響機(jī)制、個體與社會的互動發(fā)展等,用上述兩項(xiàng)工具同樣難以對所有體育類RCT研究結(jié)果進(jìn)行精確評價(jià)與分析。
追求因果關(guān)系是科學(xué)研究的重要目標(biāo),隨著體育科學(xué)研究對這一目標(biāo)的不斷追求,RCT研究在體育科學(xué)研究領(lǐng)域?qū)峁└嗟淖C據(jù)支持。9本具有代表性的體育類期刊展示了RCT研究在多個研究領(lǐng)域的重要成果,但同時應(yīng)意識到體育類RCT研究在方法學(xué)與規(guī)范報(bào)告存在的提升空間。未來開展RCT研究時,科學(xué)研究人員應(yīng)嚴(yán)格控制隨機(jī)化處理、盲法實(shí)施、受試者流失等試驗(yàn)環(huán)節(jié),努力降低偏倚風(fēng)險(xiǎn),使RCT研究在體育科學(xué)研究領(lǐng)域充分展現(xiàn)應(yīng)有價(jià)值;撰寫報(bào)告時,完善文題、樣本量確定、干預(yù)措施等條目的描述,精確報(bào)告統(tǒng)計(jì)方法,規(guī)范報(bào)告結(jié)局指標(biāo),進(jìn)一步提高報(bào)告質(zhì)量,為促進(jìn)試驗(yàn)結(jié)果的交流提供便利。