謝 洋 王佳佳
(河南中醫(yī)學院第一附屬醫(yī)院呼吸科 呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南 鄭州 450000)
項目反應理論在呼吸疾病生存質(zhì)量研究中的應用
謝 洋 王佳佳
(河南中醫(yī)學院第一附屬醫(yī)院呼吸科 呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南 鄭州 450000)
項目反應理論;呼吸疾病
項目反應理論(IRT)又稱潛在特質(zhì)理論,是在分析和克服經(jīng)典測量理論(CTT)局限性基礎上發(fā)展起來的一種新興的心理和教育測量理論。美國心理測量學家Lord〔1〕于1952年首次提出著名的正態(tài)卵形模型,標志著IRT的誕生。此后,IRT在國外得到了充分發(fā)展,主要應用于心理和教育測量領域,而在國內(nèi)由心理學家張厚粲教授于20世紀80年代首次引入〔2〕。IRT應用于生存質(zhì)量研究始于20世紀末期〔3〕。Haley等〔4〕McHorney等〔5〕較早應用IRT的Rasch模型評價了SF-36軀體功能量表(PF-10)的單維性,建立了可重復的評分標準,證實了Rasch評分模型在區(qū)分疾病嚴重程度方面較Likert評分模型的相對精度高。隨后,Cella等〔6〕探討了IRT在健康狀況評估中的應用,IRT在生存質(zhì)量研究應用進一步深入?,F(xiàn)就IRT及其在國內(nèi)外呼吸領域生存質(zhì)量研究中的應用進行概述,并分析當前應用現(xiàn)狀及未來發(fā)展方向,以期為生存質(zhì)量的研究提供思路。
IRT建立在潛在特質(zhì)理論的基礎上,其主要揭示被試者在測驗項目上的反應與其潛在特質(zhì)之間的關系,這種關系可以用一種非線性的單調(diào)遞增的函數(shù)來描述,即項目特征曲線(ICC)〔7,8〕。ICC是IRT的基礎,常被描述為一條“S”型曲線,區(qū)分度參數(shù)(a)和難度參數(shù)(b,也稱位置參數(shù)、閾值參數(shù))決定了它的形狀,三參數(shù)模型還可以估計猜測系數(shù)(c)〔2,9〕。在ICC的基礎上,IRT還可產(chǎn)生類別反應曲線,它表示項目每個選項在特定能力水平下被選擇的概率。IRT另一個重要特征就是項目信息曲線(IIC)。IIC將反映項目特征的難度、區(qū)分度和猜測系數(shù)合而為一,表示項目對不同能力水平的被試者所能提供信息的多少。IRT有兩個基本假設〔10〕,即單維性和局部獨立性。依據(jù)數(shù)據(jù)類型,IRT模型可分為三類,即二級評分IRT模型、多級評分IRT模型和連續(xù)性IRT模型〔2〕。根據(jù)不同的模型,可選擇的參數(shù)估計軟件有RUMM、Winsteps、MULTILOG、BILOG和Parscale等〔2,9〕。
2.1 條目篩選 條目篩選是測評工具研制和修訂的重要環(huán)節(jié)。選擇恰當?shù)暮Y選方法與評價指標是篩選優(yōu)質(zhì)條目的前提,也是保證測評工具具有良好信度、效度和反應度的重要過程。應用IRT篩選條目主要是為了得到信息函數(shù)最大的條目,從而得到最大的信息量。為了研制能夠評估慢性阻塞性肺疾病(COPD)對患者健康狀況影響的簡短且心理測量學特性良好的問卷,Jones等〔11〕應用IRT的Rasch模型對備選的21個條目進行分析,刪除6個不理想條目,再結(jié)合CTT評價結(jié)果,形成了COPD評估測試(CAT)。Meguro等〔12〕應用IRT的Rasch模型對圣喬治呼吸問卷(SGRQ)進行修訂,刪除10個條目(其中8個條目與模型擬合欠佳),最終形成COPD專版SGRQ,初步驗證顯示具有良好的心理測量學特性。董麗敏等〔13〕研制哮喘患者報告臨床結(jié)局量表時,將IRT作為條目篩選方法之一,以區(qū)分度和難度作為篩選指標,通過該法建議刪除的條目有PHD2、PHD3、PSD20、PSD21、PSD22、SOD52-58、TRD59-63和TRD68-72。呂宏梅〔14〕研制COPD患者報告臨床結(jié)局量表時,應用IRT將區(qū)分度小于0.5和難度嚴重超出規(guī)定范圍的條目刪除,綜合考慮各參數(shù)的估計值后刪除條目15、37、38、39、48、49、52和56。石志紅等〔15〕將IRT等級反應模型應用于慢性呼吸衰竭患者報告結(jié)局量表的條目篩選,以區(qū)分度小于0.4為標準,綜合考慮區(qū)分度和難度等級參數(shù),建議刪除的條目有20、21、22、43、48、50、51、53、57和60。
2.2 心理測量學特性評價 目前評價測評工具的心理測量學特性主要有信度評價和效度評價等方法,而隨著測評工具的不斷發(fā)展,IRT也逐漸被用于測評工具的信度、效度評價及條目分析,主要通過項目參數(shù)及各種擬合指標反映條目的優(yōu)劣和測評工具的結(jié)構(gòu)。Lo等〔16〕應用IRT的Rasch模型對臺灣版SGRQ的心理測量學特性進行分析,結(jié)果顯示癥狀、活動和影響三個領域均具有單維性,除癥狀領域外,活動和影響領域均具有較好的內(nèi)部一致性信度和結(jié)構(gòu)層次。Paap等〔17〕分別應用非參數(shù)和多維參數(shù)IRT模型評價SGRQ的心理測量學特性,結(jié)果表明該問卷具有單維性,刪除19條劣質(zhì)條目后形成的SGRQ簡短版仍具有較高的精確度。
2.3 DIF分析 在生存質(zhì)量研究中,條目功能差異(DIF)是指具有不同的文化背景和生活經(jīng)歷但具有相同生存質(zhì)量(能力)的不同群體(比如性別、民族)對同一條目的理解和反應不同〔18〕。目前分析DIF的方法很多,基于IRT的方法是其中之一。Jones等〔11〕應用IRT的Rasch模型對研制的CAT進行DIF分析,結(jié)果未顯示出與疾病狀態(tài)相關的DIF。Lo等〔16〕應用IRT的Rasch模型對臺灣版SGRQ進行DIF分析,發(fā)現(xiàn)許多條目顯示出與年齡和疾病嚴重程度相關的DIF。
3.1 應用現(xiàn)狀 IRT在呼吸疾病生存質(zhì)量研究中的應用主要特點有:(1)起步晚,從目前的文獻研究來看,最早追溯到Meguro等〔12〕的研究;(2)范圍窄,國外主要將IRT應用于SGRQ、CAT等國際公認的COPD測評工具的研究,包括篩選條目、評價心理測量學特性以及分析DIF等,而國內(nèi)則僅限于篩選量表條目;(3)模型單一,IRT分析應用的模型多局限于等級反應模型和Rasch模型等單維模型,只有Paap等〔17〕應用到非參數(shù)模型和多維參數(shù)模型。
3.2 發(fā)展方向 CTT與IRT聯(lián)合應用于研制和修訂測評工具:盡管IRT是在分析和克服CTT局限性的基礎上發(fā)展起來的,但并不能完全代替CTT,CTT主要從宏觀的角度評價測評工具,而IRT則主要從微觀的角度分析條目〔9〕,將兩種理論聯(lián)合應用到呼吸疾病生存質(zhì)量研究中能研制出具有更好心理測量學特性的測評工具。
構(gòu)建優(yōu)質(zhì)條目池,編制計算機自適應測驗條目池是測評工具研制的基礎,應采用定性與定量相結(jié)合的方法全面搜集國內(nèi)外與呼吸疾病相關的條目,形成普適性和特異性條目池,再基于IRT對初步產(chǎn)生的條目池進行評估,構(gòu)建優(yōu)質(zhì)條目池,從而為編制計算機自適應測驗奠定基礎。基于IRT的計算機自適應測驗為患者報告結(jié)局的測量和管理提供了一個新的可行的途徑〔18,19〕,Paap等〔17〕已開始考慮研制SGRQ計算機自適應測驗版用于測量COPD患者的生存質(zhì)量。因此,基于IRT編制計算機自適應測驗是包括但不局限于呼吸疾病生存質(zhì)量研究的重要方向。
1 Lord FM.A theory of test scores〔M〕.New York:Psychometric Society,1952:1-84.
2 劉保延.患者報告結(jié)局的測量:原理、方法與應用〔M〕.北京:人民衛(wèi)生出版社,2011:170-90.
3 McHorney CA.Generic health measurement:past accomplishments and a measurement paradigm for the 21st century〔J〕.Ann Intern Med,1997;127(8 Pt 2):743-50.
4 Haley SM,McHorney CA,Ware JE Jr.Evaluation of the MOS SF-36 physical functioning scale(PF-10):I.Unidimensionality and reproducibility of the Rasch item scale〔J〕.J Clin Epidemiol,1994;47(6):671-84.
5 McHorney CA,Haley SM,Ware JE.Jr.Evaluation of the MOS SF-36 Physical Functioning Scale(PF-10):Ⅱ.Comparison of relative precision using Likert and Rasch scoring methods〔J〕.J Clin Epidemiol,1997;50(4):451-61.
6 Cella D,Chang CH.A discussion of item response theory and its applications in health status assessment〔J〕.Med Care,2000;38(9 Suppl):II66-72.
7 Edelen MO,Reeve BB.Applying item response theory(IRT)modeling to questionnaire development,evaluation,and refinement〔J〕.Qual Life Res,2007;16(Suppl 1):5-18.
8 丁樹良,羅 芬,涂冬波,等.項目反應理論新進展專題研究〔M〕.北京:北京師范大學出版社,2012:3-4.
9 林岳卿,張偉濤,方積乾.項目反應理論在醫(yī)學量表條目篩選中的應用〔J〕.中國醫(yī)藥導報,2014;11(5):155-8.
10 Embretson SE,Reise SP.Item response theory for psychologists〔M〕.Mahwah,N.J.L.Erlbaum Associates,2000:1-371.
11 Jones PW,Harding G,Berry P,etal.Development and first validation of the COPD Assessment Test〔J〕.Eur Respir J,2009;34(3):648-54.
12 Meguro M,Barley EA,Spencer S,etal.Development and validation of an improved,COPD-specific version of the St.George Respiratory Questionnaire〔J〕.Chest,2007;132(2):456-63.
13 董麗敏,劉曉英,張巖波.哮喘患者報告臨床結(jié)局量表的研制和條目篩選〔J〕.中國藥物與臨床,2012;12(7):873-5.
14 呂宏梅.“基于慢性阻塞性肺病患者報告的臨床結(jié)局評價量表”的編制與評價〔D〕.太原:山西醫(yī)科大學,2012.
15 石志紅,曾憲華,羅艷虹,等.IRT等級反應模型在慢性呼吸衰竭PRO量表編制中的應用〔J〕.數(shù)理醫(yī)藥學雜志,2014;27(4):453-6.
16 Lo C,Liang WM,Hang LW,etal.A psychometric assessment of the St.George's respiratory questionnaire in patients with COPD using rasch model analysis〔J〕.Health Qual Life Outcomes,2015;13(1):131.
17 Paap MC,Brouwer D,Glas CA,etal.The St George's Respiratory Questionnaire revisited:a psychometric evaluation〔J〕.Qual Life Res,2015;24(1):67-79.
18 Teresi JA,Fleishman JA.Differential item functioning and health assessment〔J〕.Qual Life Res,2007;16(Suppl 1):33-42.
19 Chang CH.Patient-reported outcomes measurement and management with innovative methodologies and technologies〔J〕.Qual Life Res,2007;16(Suppl 1):157-66.
〔2016-07-19修回〕
(編輯 李相軍)
國家自然科學基金面上項目(81473648);河南省屬高?;究蒲袠I(yè)務費專項(2014KYYWF-YQ08);呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心項目(豫科技2013(638)號)
謝 洋(1983-),男,博士,主治醫(yī)師,主要從事中醫(yī)藥防治老年呼吸系統(tǒng)疾病研究。
R7114.253
A
1005-9202(2017)04-1038-02;
10.3969/j.issn.1005-9202.2017.04.113