金 晶,李衛(wèi)東,馬 蓮,唐 炎
體育教學(xué)實(shí)驗(yàn)干預(yù)研究是決定教與學(xué)因果關(guān)系的關(guān)鍵研究設(shè)計(jì)。實(shí)驗(yàn)干預(yù)研究結(jié)果對(duì)教學(xué)實(shí)踐和改革具有重要的指導(dǎo)作用。在體育教學(xué)研究中,實(shí)驗(yàn)干預(yù)研究非常少[1]。作者呼吁體育科研人員應(yīng)更多地進(jìn)行實(shí)驗(yàn)干預(yù)研究,而不是相關(guān)性研究,并且要加強(qiáng)實(shí)驗(yàn)干預(yù)研究的科學(xué)嚴(yán)謹(jǐn)性。體育教學(xué)實(shí)驗(yàn)干預(yù)研究的科學(xué)嚴(yán)謹(jǐn)性由許多因素決定,這些因素包括:實(shí)驗(yàn)設(shè)計(jì)類型、樣本抽取方法、教師培訓(xùn)質(zhì)量、樣本量、和實(shí)驗(yàn)干預(yù)執(zhí)行有效度(fidelity of implementation)。實(shí)驗(yàn)干預(yù)執(zhí)行有效度是體育教學(xué)實(shí)驗(yàn)干預(yù)研究科學(xué)嚴(yán)謹(jǐn)性的一個(gè)重要決定因素,但體育科研人員往往忽略了對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行的有效度進(jìn)行測(cè)量和評(píng)估,也就成為科研人員通常所說的“黑箱”研究(black box study)。因?yàn)闆]有對(duì)實(shí)驗(yàn)干預(yù)進(jìn)行執(zhí)行有效度檢驗(yàn),實(shí)驗(yàn)過程所發(fā)生的一切都是無(wú)知的,也無(wú)法對(duì)結(jié)果數(shù)據(jù)給出科學(xué)解釋。
因此,通過深入探討實(shí)驗(yàn)研究,對(duì)干預(yù)執(zhí)行有效度進(jìn)行具體的測(cè)量和評(píng)價(jià)具有深刻地研究意義。本文從國(guó)外對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義以及五個(gè)部分的概念框架入手,探討實(shí)驗(yàn)研究對(duì)干預(yù)執(zhí)行有效度進(jìn)行測(cè)量和評(píng)價(jià)的重要性,提供關(guān)于實(shí)驗(yàn)干預(yù)執(zhí)行有效度測(cè)量工具的詳細(xì)案例,并創(chuàng)建了測(cè)量與評(píng)價(jià)體系,旨在提高我國(guó)體育教學(xué)實(shí)驗(yàn)干預(yù)研究的科學(xué)嚴(yán)謹(jǐn)性。
實(shí)驗(yàn)干預(yù)執(zhí)行有效度指:“在實(shí)驗(yàn)過程中,實(shí)驗(yàn)干預(yù)在多大程度上是按照原定設(shè)計(jì)的內(nèi)容計(jì)劃執(zhí)行的”[2]。實(shí)驗(yàn)干預(yù)執(zhí)行有效度是評(píng)估實(shí)驗(yàn)結(jié)果的必要因素。對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效性進(jìn)行測(cè)量和評(píng)價(jià)的重要性體現(xiàn)在五個(gè)方面。(1)眾多因素決定了一項(xiàng)研究的數(shù)理統(tǒng)計(jì)能力(statistical power)。它們包括實(shí)驗(yàn)設(shè)計(jì),alpha,科學(xué)嚴(yán)謹(jǐn)?shù)臏y(cè)量工具,樣本量,樣本抽樣方法,以及實(shí)驗(yàn)干預(yù)執(zhí)行有效度。然而,對(duì)于一項(xiàng)實(shí)驗(yàn)研究,如果實(shí)驗(yàn)干預(yù)執(zhí)行有效度非常差,那么實(shí)驗(yàn)的統(tǒng)計(jì)能力就會(huì)被大大降低[3-5]。(2)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的測(cè)量數(shù)據(jù)可以為科研人員提供大量的有效信息。例如,為什么實(shí)驗(yàn)干預(yù)成功了,達(dá)到預(yù)期的效果,實(shí)驗(yàn)效果是什么時(shí)候產(chǎn)生以及是如何產(chǎn)生的[4]。實(shí)驗(yàn)干預(yù)執(zhí)行有效度數(shù)據(jù)可以幫助科研工作者了解哪些干預(yù)內(nèi)容按照原來計(jì)劃執(zhí)行了以及執(zhí)行的質(zhì)量如何。同樣可以幫助科研工作者了解在實(shí)驗(yàn)過程中產(chǎn)生了哪些具體的內(nèi)容調(diào)整和改變,以及這些內(nèi)容調(diào)整和改變對(duì)實(shí)驗(yàn)結(jié)果的影響是什么[3]。如果科研工作者想要知道實(shí)驗(yàn)結(jié)果的失敗是不是由于實(shí)驗(yàn)干預(yù)的質(zhì)量差,還是實(shí)驗(yàn)干預(yù)內(nèi)容與理論不一致而造成的,那么這些實(shí)驗(yàn)干預(yù)執(zhí)行有效度的數(shù)據(jù)就顯得非常重要了[5]。如果實(shí)驗(yàn)干預(yù)執(zhí)行有效度非常高,所有的實(shí)驗(yàn)干預(yù)內(nèi)容按照原來計(jì)劃高質(zhì)量地執(zhí)行,那么實(shí)驗(yàn)結(jié)果沒有達(dá)到預(yù)期的效果,問題不在于干預(yù)過程,科研工作者就需要根據(jù)原來的理論或者采用不同理論來重新設(shè)計(jì)干預(yù)內(nèi)容[3]。(3)實(shí)驗(yàn)干預(yù)執(zhí)行有效度對(duì)于檢驗(yàn)理論的準(zhǔn)確性非常重要。所有實(shí)驗(yàn)干預(yù)內(nèi)容都是在某一特定的理論思想指導(dǎo)下設(shè)計(jì)出來的。如果沒有確信所有的實(shí)驗(yàn)干預(yù)內(nèi)容被有效地,高質(zhì)量地執(zhí)行了,那么就無(wú)法檢驗(yàn)理論的正確性[6]。(4)對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度進(jìn)行評(píng)估是評(píng)估一個(gè)實(shí)驗(yàn)研究的內(nèi)在和外在合理性的關(guān)鍵因素(internal and external validity)[6]。高質(zhì)量的實(shí)驗(yàn)干預(yù)執(zhí)行有效度數(shù)據(jù)可以大大增加科研工作者對(duì)實(shí)驗(yàn)結(jié)果的可信度。沒有實(shí)驗(yàn)干預(yù)執(zhí)行有效度數(shù)據(jù),科研工作者就很難對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行解釋,把它歸結(jié)于實(shí)驗(yàn)干預(yù)的結(jié)果。其原因是顯著差異的研究結(jié)果有可能是來自偶然的機(jī)會(huì)或者是實(shí)驗(yàn)過程中引入了其它非實(shí)驗(yàn)內(nèi)容的因素所造成的[7-9]。(5)對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度進(jìn)行評(píng)估是復(fù)制和推廣應(yīng)用一項(xiàng)科學(xué)研究的必要條件[2,3,10]。沒有實(shí)驗(yàn)干預(yù)執(zhí)行有效度數(shù)據(jù)就很難復(fù)制一項(xiàng)科學(xué)研究。因?yàn)槿绻蒲泄ぷ髡卟恢缹?shí)驗(yàn)過程中會(huì)發(fā)生什么,不知道實(shí)驗(yàn)內(nèi)容執(zhí)行程度如何,執(zhí)行過程中需要做什么調(diào)整等重要信息,那么,也就無(wú)法對(duì)這項(xiàng)研究進(jìn)行復(fù)制。但一項(xiàng)實(shí)驗(yàn)研究如果有很高的實(shí)驗(yàn)干預(yù)執(zhí)行有效度,不僅可以通過干預(yù)執(zhí)行有效度的測(cè)量數(shù)據(jù)對(duì)該項(xiàng)研究進(jìn)行復(fù)制,還可以增加教學(xué)工作者將研究結(jié)果應(yīng)用于教學(xué)實(shí)踐的信心,從而促進(jìn)科學(xué)研究結(jié)果的應(yīng)用和推廣。
體育教學(xué)科研工作者也漸漸開始認(rèn)識(shí)到對(duì)課程實(shí)驗(yàn)干預(yù)進(jìn)行有效度檢驗(yàn)的重要性[1,11-15]。究其原因是因?yàn)橐郧暗目茖W(xué)研究結(jié)果顯示:體育教師在實(shí)驗(yàn)中受到同樣的培訓(xùn),但是在教學(xué)中執(zhí)行課程模式的程度卻各不相同[14,16]。另外,研究表明:在體育教學(xué)領(lǐng)域,實(shí)驗(yàn)干預(yù)執(zhí)行有效度的好壞與實(shí)驗(yàn)結(jié)果的關(guān)聯(lián)程度非常大[1,17-18]。Li et al (in press)研究結(jié)果顯示只有49% 的體育教學(xué)實(shí)驗(yàn)干預(yù)研究測(cè)量并評(píng)估實(shí)驗(yàn)干預(yù)執(zhí)行有效度,大部分的研究沒有測(cè)量和評(píng)估實(shí)驗(yàn)干預(yù)有效度[1]。
Hastie and Casey 呼吁體育科研工作者使用正式合理的檢驗(yàn)方法來全面地體現(xiàn)實(shí)驗(yàn)干預(yù)執(zhí)行質(zhì)量[12]。他們還建議在測(cè)量實(shí)驗(yàn)干預(yù)執(zhí)行有效度時(shí)要測(cè)量環(huán)境因素。這些因素包括:教師的特長(zhǎng)、學(xué)生以前的課程經(jīng)歷、教學(xué)時(shí)間以及其它影響實(shí)驗(yàn)干預(yù)的因素。然而,對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的測(cè)量和評(píng)估并不統(tǒng)一,存在許多的差異性。正如[1]Li et al.(in press)研究結(jié)果顯示:清單(checklists)、錄像分析(video analysis)、以及行為觀察表格(observational instruments)經(jīng)常被用來測(cè)量和評(píng)估實(shí)驗(yàn)干預(yù)執(zhí)行有效度。在體育教學(xué)領(lǐng)域中,并沒有一個(gè)統(tǒng)一的概念框架(conceptual framework)來指導(dǎo)對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度進(jìn)行測(cè)量和評(píng)估。我國(guó)體育教學(xué)研究在這個(gè)方面更是欠缺,許多實(shí)驗(yàn)干預(yù)研究成為黑箱研究,沒有測(cè)量和評(píng)估實(shí)驗(yàn)干預(yù)執(zhí)行有效度。因此,需要一個(gè)統(tǒng)一的概念框架來指導(dǎo)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的測(cè)量和評(píng)估。
在20 世紀(jì)70 年代以前,美國(guó)科研學(xué)者認(rèn)為對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的研究沒有必要性。他們要么認(rèn)為實(shí)驗(yàn)干預(yù)有效度會(huì)很高,或者實(shí)驗(yàn)干預(yù)實(shí)施者會(huì)完全按照原先的實(shí)驗(yàn)設(shè)計(jì)和計(jì)劃去執(zhí)行干預(yù)內(nèi)容。但科研學(xué)者漸漸地意識(shí)到實(shí)驗(yàn)干預(yù)實(shí)施者會(huì)根據(jù)自己的思想和興趣有意或無(wú)意的改變實(shí)驗(yàn)干預(yù)內(nèi)容,而且這種現(xiàn)象在實(shí)驗(yàn)干預(yù)執(zhí)行中時(shí)常發(fā)生[19]。自20 世紀(jì)80 年代,美國(guó)各界學(xué)者開始對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度進(jìn)行定義[4]。O'Donnell 等對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義進(jìn)行了綜述,把定義主要分為衛(wèi)生健康和教育學(xué)兩個(gè)領(lǐng)域。實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義有許多共同之處,但是也因?yàn)檠芯款I(lǐng)域不同而有所不同之處[4]。
在衛(wèi)生健康領(lǐng)域,對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的研究比較多。學(xué)者對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義也是具有多樣性,學(xué)者都有自己的定義和測(cè)量方法。在Moncher and Prinz[20]文章發(fā)表之前,實(shí)驗(yàn)干預(yù)有效度(treatment fidelity)的定義基本上是指:“與原先設(shè)計(jì)和計(jì)劃的干預(yù)內(nèi)容相比較,實(shí)驗(yàn)干預(yù)實(shí)施執(zhí)行的程度如何”。在Moncher and Prinz[20]的文章里,作者將傳統(tǒng)的實(shí)驗(yàn)干預(yù)一致性(treatment integrity)的定義進(jìn)行拓展,加入了實(shí)驗(yàn)干預(yù)組之間的區(qū)別性(treatment differentiation),也就是“實(shí)驗(yàn)各個(gè)組之間的差異和特征有沒有在實(shí)驗(yàn)中執(zhí)行和實(shí)施?!盡oncher and Prinz[20]首次在他們的文章中正式介紹實(shí)驗(yàn)干預(yù)有效度(treatment fidelity)的定義,并提供了一些用來增強(qiáng)實(shí)驗(yàn)干預(yù)有效度的指南[7]。后來的學(xué)者對(duì)實(shí)驗(yàn)干預(yù)有效度定義以及測(cè)量進(jìn)行了進(jìn)一步完善[3,6,8,21-24]。比如Lichstein,Riedel,and Grieve[22]認(rèn)為實(shí)驗(yàn)干預(yù)有效度應(yīng)該包括其它兩個(gè)部分:第一,實(shí)驗(yàn)參與者對(duì)實(shí)驗(yàn)干預(yù)內(nèi)容的接受和理解程度(treatment receipt)。第二,實(shí)驗(yàn)干預(yù)內(nèi)容在日常生活中的運(yùn)用(treatment enactment)。目前對(duì)實(shí)驗(yàn)干預(yù)有效性的測(cè)量包括五個(gè)部分:實(shí)驗(yàn)設(shè)計(jì)(treatment design);對(duì)實(shí)驗(yàn)干預(yù)實(shí)施者的培訓(xùn)有效性(training provider);實(shí)驗(yàn)干預(yù)的執(zhí)行(delivery of treatment);參與者對(duì)實(shí)驗(yàn)的接受和理解程度(receipt of treatment);實(shí)驗(yàn)干預(yù)內(nèi)容在日常生活中的運(yùn)用(enactment of treatment skills)[8]。
在教育學(xué)領(lǐng)域,學(xué)者主要是研究實(shí)驗(yàn)干預(yù)執(zhí)行有效度(Fidelity of implementation)。這個(gè)概念與健康衛(wèi)生領(lǐng)域的實(shí)驗(yàn)干預(yù)有效度(treatment integrity)相一致。教育界學(xué)者對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義基本相同,只是使用不同的語(yǔ)言。比如,Berman and McLaughlin[25]和Scheirer &Rezmovic[26]分別將實(shí)驗(yàn)干預(yù)執(zhí)行有效度定義為:實(shí)驗(yàn)干預(yù)研究在多大程度上執(zhí)行了原先制定的內(nèi)容計(jì)劃,但是Berman and McLaughlin[25]在定義使用了“原先提出(originally proposed),而Scheirer and Rezmovic[26]沒有使用“原先提出”一詞。
自20 世紀(jì)90 年代以來,教育界和健康衛(wèi)生的學(xué)者都提出了測(cè)量實(shí)驗(yàn)干預(yù)執(zhí)行有效度的5 個(gè)維度的概念框架[3-4,21]。這五個(gè)部分包括:(1)干預(yù)一致性(adherence);(2)干預(yù)劑量(intervention exposure or dose);(3)干預(yù)質(zhì)量(quality of program delivery);(4)實(shí)驗(yàn)參與者的參與與反應(yīng)(participant responsiveness);(5)實(shí)驗(yàn)干預(yù)組之間的區(qū)別性(program differentiation)。下面對(duì)每個(gè)維度的定義以及指標(biāo)進(jìn)行舉例闡述:
干預(yù)一致性指的是干預(yù)內(nèi)容在多大程度上按照原來計(jì)劃和設(shè)計(jì)來執(zhí)行的[3,4,21]。科研學(xué)者通常根據(jù)實(shí)驗(yàn)干預(yù)的內(nèi)容來設(shè)計(jì)一份觀察清單表,然后采用清單來觀察課程教學(xué)進(jìn)行評(píng)估。如表1 所示,第一列是任務(wù),在第二列列出課程教學(xué)的所有干預(yù)內(nèi)容。列出課程教學(xué)的所有干預(yù)內(nèi)容。在第三列,評(píng)估結(jié)果。當(dāng)觀察者觀察到這一教學(xué)內(nèi)容時(shí),就寫下“是”。當(dāng)沒有觀察到這一教學(xué)內(nèi)容時(shí),就寫下“否”。表2是另外一個(gè)例子,主要針對(duì)特定的教學(xué)方法進(jìn)行執(zhí)行有效度的評(píng)估。每個(gè)課程教學(xué)模式都有自己特定的教學(xué)方法,這是實(shí)戰(zhàn)情境教學(xué)課程模式所采用的教學(xué)方法。為了確定教師在使用該模式進(jìn)行教學(xué)時(shí)使用了該教學(xué)方法,研究者必須設(shè)計(jì)一個(gè)觀察清單來評(píng)估執(zhí)行有效度。同樣使用“是或否”來評(píng)估。
表1 教學(xué)內(nèi)容干預(yù)執(zhí)行有效度觀察清單Table 1 Checklist for adherence to program intervention components
表2 教學(xué)方法干預(yù)執(zhí)行有效度觀察清單Table 2 Checklist for adherence to pedagogical approaches
干預(yù)劑量指的是實(shí)驗(yàn)干預(yù)對(duì)象在實(shí)驗(yàn)過程中所接受的干預(yù)程度是多少[3-4,21]。在體育教學(xué)干預(yù)研究中,通常指的是課時(shí)的時(shí)間和次數(shù),每次課的內(nèi)容是否有變更,以及每個(gè)實(shí)驗(yàn)對(duì)象的出勤情況??蒲泄ぷ髡呖梢酝ㄟ^觀察記錄,訪談和教師日志來對(duì)干預(yù)劑量進(jìn)行評(píng)估。確定實(shí)驗(yàn)對(duì)象的出勤情況可以通過出勤表來評(píng)估。對(duì)于課時(shí)的時(shí)間和次數(shù)以及課的內(nèi)容變更,科研學(xué)者通常無(wú)法每次課都在場(chǎng),他們可以隨機(jī)選一些課來進(jìn)行觀察或者進(jìn)行幾次訪談,來記錄課程的時(shí)間安排。但是,這仍無(wú)法記錄所有的課時(shí)執(zhí)行情況,所以最好的評(píng)估手段是采用教師的日志。每次課結(jié)束后,任課教師可以寫日志來記錄課時(shí)的時(shí)間,次數(shù)和內(nèi)容是否有變更等重要信息(見表3)。
表3 教師日志Table 3 Teacher log
干預(yù)質(zhì)量指的是實(shí)驗(yàn)干預(yù)者在什么程度上正確地使用教學(xué)方法和手段來執(zhí)行干預(yù)內(nèi)容[3-4,21]。按照既定的計(jì)劃,實(shí)驗(yàn)干預(yù)內(nèi)容是否被非常正確地和清楚地實(shí)施和執(zhí)行?實(shí)驗(yàn)干預(yù)的效果不僅取決于干預(yù)的劑量,更取決于干預(yù)的質(zhì)量。在做干預(yù)執(zhí)行有效度檢驗(yàn)的時(shí)候,學(xué)者必須要收集具體的數(shù)據(jù)來反映干預(yù)的質(zhì)量。比如,在Ward,Kim,Ko 和Li[27]研究里,作者采用了觀察清單對(duì)所有教案里的練習(xí)任務(wù)進(jìn)行了干預(yù)執(zhí)行有效度檢驗(yàn)(見表4)。通過對(duì)每個(gè)層次數(shù)據(jù)進(jìn)行百分比統(tǒng)計(jì)分析,作者就可以得到非常精確的信息,從而知道干預(yù)的質(zhì)量如何。教師有沒有采用正確的教學(xué)內(nèi)容和練習(xí)進(jìn)行教學(xué)。
表4 練習(xí)任務(wù)干預(yù)質(zhì)量檢驗(yàn)觀察清單Table 4 Program delivery quality checklist for learning tasks
指的是實(shí)驗(yàn)對(duì)象多大程度上參與到教學(xué)活動(dòng)中[3-4,21]。這個(gè)維度體現(xiàn)了學(xué)生和實(shí)驗(yàn)參與者作為主體的教學(xué)理念。如果學(xué)生或?qū)嶒?yàn)參與者消極參與,那么即使干預(yù)劑量和質(zhì)量非常高,實(shí)驗(yàn)干預(yù)效果也不會(huì)太好,所以科研工作者一定要對(duì)這一維度進(jìn)行測(cè)量和評(píng)估。比如,Hastie 研究運(yùn)動(dòng)教育課程模式對(duì)學(xué)生的技術(shù)和戰(zhàn)術(shù)能力的影響[28]。他采用了計(jì)算機(jī)軟件,通過對(duì)錄像進(jìn)行分析,從而測(cè)量到學(xué)生在運(yùn)動(dòng)教育課程單元每次課的身體活動(dòng)量。這些運(yùn)動(dòng)量的數(shù)據(jù)就可以檢驗(yàn)學(xué)生在課程單元的參與程度。當(dāng)然在教學(xué)課程干預(yù)的研究里,參與者的參與與反應(yīng)通常是我們所感興趣的自變量。在測(cè)量和評(píng)估這個(gè)維度的時(shí)候,科研工作者要根據(jù)自己具體的研究來決定是否可以合理地對(duì)這個(gè)維度進(jìn)行測(cè)量,并且要有創(chuàng)新性。
組間的區(qū)別性指的是實(shí)驗(yàn)組與對(duì)照組/控制組之間的差異特征有沒有在實(shí)驗(yàn)干預(yù)過程里實(shí)施[3-4,21]。也就是說,實(shí)驗(yàn)組按照既定的計(jì)劃來,采用特定的教學(xué)方法和手段來正確地執(zhí)行教學(xué)內(nèi)容干預(yù)。同樣,對(duì)照組/控制組按照既定的計(jì)劃來,采用特定的教學(xué)方法和手段來正確地執(zhí)行教學(xué)內(nèi)容。如果一個(gè)研究有兩個(gè)或兩個(gè)以上的實(shí)驗(yàn)組或者至少一個(gè)實(shí)驗(yàn)組和一個(gè)對(duì)照組/控制組,那么研究者需要對(duì)所有組別的教學(xué)內(nèi)容,方法和手段進(jìn)行執(zhí)行有效度檢驗(yàn),然后通過數(shù)據(jù)分析和對(duì)比來評(píng)估這一維度。上面所討論的對(duì)實(shí)驗(yàn)干預(yù)組所采用的觀察量表(如表1 和表2)都可以在這里使用,需要增加的就是對(duì)對(duì)照組或控制組的執(zhí)行有效度進(jìn)行測(cè)量和評(píng)估。
根據(jù)實(shí)驗(yàn)干預(yù)執(zhí)行有效度的5 個(gè)維度的概念框架,Li等[29]創(chuàng)建了測(cè)量與評(píng)價(jià)體系(見表5)。這個(gè)測(cè)量與評(píng)價(jià)體系包括5 個(gè)維度。針對(duì)每個(gè)維度,有相應(yīng)的一些指標(biāo)。在使用這個(gè)測(cè)量與評(píng)價(jià)體系時(shí),科研工作者可以根據(jù)文章作者是否提供相應(yīng)的數(shù)據(jù)信息,來進(jìn)行評(píng)價(jià)。如果文章作者提供了相應(yīng)的信息,那么就給“是”。如果文章作者沒有提供相應(yīng)的信息,那么就給“否”。如果這個(gè)維度不適用于該文章,那么就給“不適用”。
表5 實(shí)驗(yàn)干預(yù)執(zhí)行有效度測(cè)量與評(píng)價(jià)體系Table 5 Checklist for fidelity of implementation
續(xù)表5
本文介紹了國(guó)外實(shí)驗(yàn)干預(yù)執(zhí)行有效度的定義以及發(fā)展歷史,并詳細(xì)地舉例來闡述如何對(duì)實(shí)驗(yàn)干預(yù)執(zhí)行有效度進(jìn)行測(cè)量。對(duì)于這五個(gè)維度的概念框架,現(xiàn)在還沒有確定是否要對(duì)所有的維度都要進(jìn)行測(cè)量。不過由于這五個(gè)維度互相關(guān)聯(lián),并且互補(bǔ),對(duì)所有維度進(jìn)行測(cè)量可以全面的了解實(shí)驗(yàn)干預(yù)的執(zhí)行度。不管實(shí)驗(yàn)效果成功或失敗,作者可以從干預(yù)執(zhí)行有效度的測(cè)量數(shù)據(jù)中具體地找出成功或失敗的原因,從而為今后提高實(shí)驗(yàn)效果打下堅(jiān)實(shí)的基礎(chǔ)和提供參考意見。實(shí)驗(yàn)干預(yù)執(zhí)行有效度測(cè)量與評(píng)價(jià)體系的建立,會(huì)對(duì)實(shí)驗(yàn)干預(yù)研究的干預(yù)執(zhí)行有效度狀況進(jìn)行全面的評(píng)價(jià),從而找出優(yōu)缺點(diǎn),以期提高我國(guó)體育教學(xué)實(shí)驗(yàn)干預(yù)研究的科學(xué)嚴(yán)謹(jǐn)性。
成都體育學(xué)院學(xué)報(bào)2021年3期