蔡婷婷 黃躍師 李丹鈺 朱瑞 黃青梅 楊瑒,2 袁長蓉
(1.復旦大學護理學院,上海 200032;2.復旦大學附屬腫瘤醫(yī)院,上海 200032)
關注患者報告的健康相關結局,傾聽患者的真實感受成為近年來國內外慢性病領域研究的熱點?;颊咦晕覉蟾娼Y局測量信息系統(tǒng)(Patient-reported outcomes measurement information system,PROMIS)使得不同疾病、不同人群間的研究結果具有可比性,適用于普通人群和多種慢性病患者群體自我報告的癥狀及功能的測評[1]。PROMIS包括簡表(Short form,SF)、特征集(Profile)和計算機自適應系統(tǒng)(Computerized adaptive testings,CATs)三種形式[2-3]。鑒于核心健康領域的簡短有效的患者自我報告結局測評工具在臨床應用中具有重要價值,成人患者報告結局測量信息系統(tǒng)特征集(Adult PROMIS Profile)作為特定核心健康領域簡表的集合成為了PROMIS的重要發(fā)展方向[4]。Adult PROMIS Profile由該領域具有高信息量的條目集合而成,可用盡量少的條目獲取多方面的信息,在大幅度降低慢性病患者測量負擔的同時,可獲得較精確可靠的信息[4]。鑒于Adult PROMIS Profile已在臨床實踐中得到一定應用并展現出較多的優(yōu)勢,本文對Adult PROMIS Profile的概念、特征、研制過程進行介紹,并綜述Adult PROMIS Profile的研究現狀,提出對未來發(fā)展趨勢及不足的思考,以期為完善Adult PROMIS Profile的應用提供借鑒。
1.1概念 患者報告結局測量信息系統(tǒng)特征集(PROMIS Profile)通過固定的PROMIS簡表的集合以測評多個健康領域,是在各領域的條目排序和計算機自適應系統(tǒng)模擬的基礎上,由該領域具有高信息量的條目集合而成的測量工具[4]。PROMIS Profile可分為成人及兒童兩個版本[4]。其中,Adult PROMIS Profile是專為18歲及以上的成年人所開發(fā)的測評工具,包含生理健康、心理健康及社會健康3方面的核心癥狀及功能的測量,其使用范圍廣泛,可用于一般人群及不同疾病群體[4]。
1.2特征 Adult PROMIS Profile包含7個固定的PROMIS核心領域,即身體功能、焦慮、抑郁、疲勞、睡眠困擾、擔任社會角色與參加社交活動的能力、疼痛(影響及強度)[5]。Adult PROMIS Profile中的簡表大多數評估受試者過去7 d的癥狀或功能水平,但身體功能和擔任社會角色與參加社交活動的能力領域除外,這兩個領域的評估沒有嚴格時間要求的限制。根據每個PROMIS領域的條目數目,Adult PROMIS Profile可分為3種形式:PROMIS-29、PROMIS-43及PROMIS-57[6]。其中,PROMIS-29包含29個條目,7個領域各為4個條目,各領域的分值為4~20,加上一個疼痛強度條目,以0~10分的數字評分法(Numeric rating scale,NRS)方式進行測評。以數字評分法評估的疼痛強度條目在臨床研究和實踐中得到廣泛應用,并且可提供疼痛影響的背景。PROMIS-43每個領域包含6個條目,各領域的分值為6~30,另包含1個0~10分測評的疼痛強度條目。PROMIS-57每個領域為8個條目,各領域的分值為8~40,另包含一個以0~10分測評的疼痛強度條目[6]。Adult PROMIS Profile僅疼痛強度條目采用數字評分法形式測評,其余領域均采用Likert 5級評分法進行計分,但各條目的5個選項描述間存在差異[7]。上述3個測評工具中每個簡表單獨評分,從而產生共7個領域的分數。此外,分值均需轉換為標準化T分數,其平均值均為50,標準差為10[8]。T分數越高,反映相應測量概念的程度越高,其中正向計分領域條目的分值越高,表明相應功能越好或者癥狀越少,而負向計分領域條目的分值越高,則表明其功能受損或癥狀越明顯,如擔任社會角色與參加社交活動的能力簡表的T分數為70,表明受試者擔任社會角色與參加社交活動的能力高于一般人群均值,患者相應的社會功能較好[9-10]。另一方面,抑郁簡表的T分數為70,則代表受試者的抑郁高于一般人群均值,患者抑郁水平較高[9-10]。上述3個測評工具均具有良好的信效度,已被翻譯為40多種語言,得到較為廣泛的應用[5]。
在進行多領域健康狀況的測評過程中,現有的研究多采用普適和特定疾病的測評工具對受試者不同領域的健康狀態(tài)進行調查,但這些工具所獲得的測量結果之間可能存在重復[5]。此外,傳統(tǒng)測評工具的研制過程中較少利用項目反應理論(Item response theory,IRT)的優(yōu)勢對條目進行篩選,以確保測評工具可廣泛地覆蓋期望評估的概念。為滿足上述需求,Adult PROMIS Profile由包含臨床專家在內的多研究團隊成員基于患者為中心的理念及IRT的現代心理測量方法所研發(fā),旨在滿足多種研究和臨床實踐應用的需求。
目前Adult PROMIS Profile已發(fā)展至2.0版本。其中,Adult PROMIS Profile 2.0版本在1.0版本的基礎上進行了優(yōu)化,將原有的社會角色和活動的滿意度簡表(PROMIS-satisfaction with social roles and activities short form)替換為參與社會角色和活動的能力簡表(PROMIS-ability to participate in social roles and activities short form)[9]。Adult PROMIS Profile的研制過程主要包含兩個關鍵步驟。在第一個步驟中,研究團隊基于廣泛的文獻研究,并綜合醫(yī)務人員、社會學專家、心理測量學專家及利益相關者的意見,在22個PROMIS領域及子領域中確定被納入Adult PROMIS Profile的領域,使其包含生理健康、心理健康及社會健康的核心領域,并適用于大多數的臨床環(huán)境[5]。在第二個步驟中,研究團隊對Adult PROMIS Profile各領域所包含的具體條目進行確定。基于經典測量學理論及項目反應理論所測得的結果,Adult PROMIS Profile各領域的條目需滿足信息量區(qū)間及CATs模擬的要求。構成Adult PROMIS Profile的簡表間應相互獨立,且其條目應具有高信息量。其中,最大信息量區(qū)間要求Adult PROMIS Profile中每個條目的信息函數具有從平均值到較平均值少于2個標準差的信息區(qū)間[11]。研究者基于每個領域內的條目信息量進行條目排序,并選取具有最大信息量區(qū)間的條目[11]。另一方面,研究者將對相應簡表條目池中所有條目的反應度等指標進行1 000次的CATs模擬測試,依據其測量性能進行排序,以篩選最優(yōu)條目[11]。研究者選取了三個數據集中的受試者對各領域的條目池進行測試,所選取的數據集基于PROMIS團隊在多年研究以來所創(chuàng)建的包含一般人群及疾病人群的多個數據集[12-15]。對于一般人群數據集[12-13]中的3 507名受試者,除對特定受試者分配身體功能領域測試以外,其余受試者均接受相關領域完整條目池的測試。由于身體功能領域條目池條目較多,接受身體功能領域條目池測評的受試者僅隨機完成條目池中一半條目的測試。以此相似,第二個數據集用于測評睡眠困擾領域,主要包含存在睡眠困擾的人群[14]。第三個數據集用于測評社會健康領域,主要包含有自我報告社會健康受損的人群[15]。選取的每個領域的樣本量從628例(疲勞領域)至1 255例(睡眠困擾領域)不等[5]。鑒于Adult PROMIS Profile在臨床患者中將具有更多的用途,條目的信息量排序結果將與CATs模擬的排序結果相結合,以確定每個領域中信息量最大的15個候選條目的列表。隨后,PROMIS研究團隊中的3~5個相關領域專家組成專家小組,在每個領域提供的15個條目列表中選擇8個最佳的條目[5]。專家將考慮條目與臨床患者的相關性,8個選定條目所涉及的內容覆蓋面、條目內容間的一致性及關聯性等指標。在確定每個領域的8個條目以建立PROMIS-57后,研究者將分別刪去8個條目中的2個條目及4個條目并保持內容的覆蓋面,以進一步建立PROMIS-43及PROMIS-29,因此,PROMIS-57包含PROMIS-43及PROMIS-29的所有條目[5]。研究者對PROMIS-29、PROMIS-43和PROMIS-57的心理學測量學性能進行研究,結果顯示三者的信息量依次呈現遞增趨勢,且均具有較廣的測量范圍及良好的反應度[5]。此外,上述測評工具在一般人群及患者群體中的大樣本檢驗證實上述特征集在臨床樣本中可實現較好的測量精確度,具備檢測臨床樣本的細微差異或變化的能力[5]。
3.1一般人群 研究者將Adult PROMIS Profile嵌套于移動設備,或使用電子或紙質問卷的形式對受試者進行測評[5]。在3類Adult PROMIS Profile中,PROMIS-29因其相對簡短的條目而得到最為廣泛的應用。Hays等[9]通過大樣本的研究證實了PROMIS-29的良好信效度。驗證性因子分析結果顯示,PROMIS-29可歸為軀體健康及心理健康兩個因子,其中生理健康及心理健康的信度分別為0.98和0.97,且兩者存在相關性。此外,PROMIS-29的生理健康及心理健康總分與生活質量相關指標的關聯性較高,較其他量表可更有效地識別受試者身心健康水平的變化,且允許生理健康及心理健康的得分之間存在相互關聯,而不是強迫它們之間的零相關性。Fischer等[16]同時在英國(n=1 509)、法國(n=1 501)和德國(n=1 502)3個國家采用相應語言版本的PROMIS-29進行了一項基于網絡的調查。研究者通過多組驗證性因子分析測試了PROMIS-29的心理測量學特性。研究結果顯示,PROMIS-29在總體上具有良好的信效度,其T分數在英國、法國和德國的受試者之間具有良好的可比性,但身體功能和疼痛領域得分方面顯示出地板效應,可能與一般人群中上述健康問題較少有關。
3.2慢性病人群 Tang等[17]以腎移植患者為研究對象,分析了PROMIS-57和PROMIS-29的信效度,并將其與患者健康問卷(Patient health questionnaire,PHQ9)、廣泛性焦慮癥(General anxiety disorder,GAD7)、埃德蒙頓癥狀評定量表(Edmonton symptom assessment scale revised,ESASr)和腎病生活質量(Kidney disease quality of life,KDQoL-36)進行比較。結果顯示,PROMIS-57和PROMIS-29具有良好的信度、結構效度及效標效度,可用于測評慢性病患者疾病體驗的核心領域。Lin等[18]在慢阻肺患者群體中檢驗了PROMIS-43與歐洲五維健康量表(The five-level EQ-5D,EQ-5D-5L)的心理測量特性。該研究結果顯示,PROMIS-43及EQ-5D-5L的測評結果與臨床客觀數據所獲得的癥狀及功能結果呈中度至強相關,證實了PROMIS-43及EQ-5D-5L在慢阻肺患者癥狀及功能評估中的有效性。一項研究[19]將PROMIS-29及慢性病治療功能評價-呼吸困難簡表(Functional assessment of chronic illness therapy-dyspnea short form,FACIT-Dyspnea)及傳統(tǒng)問卷如醫(yī)學研究委員會呼吸困難評分(Medical research council dyspnea score)、圣喬治呼吸問卷(St. george’s respiratory questionnaire,SGRQ)、健康評估問卷-殘疾指數(Health assessment questionnaire-disability index,HAQ-DI)和醫(yī)療結局研究量表簡表-36(Medical outcomes study short form-36,SF-36)用于系統(tǒng)性硬化疾病患者癥狀的縱向研究,以比較兩類問卷的特點。該研究顯示,PROMIS-29和FACIT-Dyspnea是測量系統(tǒng)性硬化疾病患者健康狀況和呼吸困難的有效工具,但在生理功能評估中未顯示出較傳統(tǒng)工具更好的反應性,因此研究者建議,應考慮較長的PROMIS簡表或采用CATs,以提高系統(tǒng)性硬化疾病患者的皮膚病改變對其生理功能的反應性[19]。Katz等[20]將PROMIS-29用于風濕系統(tǒng)疾病患者中以檢驗其心理測量性能,結果顯示,PROMIS-29可為風濕系統(tǒng)疾病患者癥狀的評估提供有效的工具。然而,PROMIS-29在風濕系統(tǒng)疾病患者中有較明顯的天花板效應,因此可能更適合測量病情較差的患者,其反應度有待提高。
4.1特征 研究者基于PROMIS-29研發(fā)了PROMIS偏好評分系統(tǒng)(PROMIS-Preference scoring system,PROPr)。PROPr作為PROMIS-29及2個PROMIS-認知功能-能力條目的組合,亦可命名為PROMIS-29+2 Profile v2.1?;赑ROPr,研究者可同時收集受試者的健康狀況及基于社會偏好的評分,基于特定PROMIS領域的T分數獲得基于偏好的匯總分數,避免在測量過程中出現顯著的天花板效應及地板效應[21]。PROPr基于多屬性效用理論(Multi-Attribute Utility Theory)中的偏好理論,以PROMIS所描述的健康狀態(tài)為基礎,將PROMIS為代表的心理測量系統(tǒng)與基于效用的評分系統(tǒng)構建的最佳實踐相連接,是第一個將美國具有代表性樣本的社會偏好與IRT測量的健康領域進行聯系,以提高健康測量的針對性、可靠性及有效性的評分系統(tǒng)[22-23]。
PROPr共涵蓋7個核心領域,包括抑郁、身體功能、疼痛影響、認知功能-能力、疲勞、擔任社會角色與參加社交活動的能力及睡眠困擾。上述領域跨越健康的多個方面,對于一般人群、患者均具有重要的價值[23]。當PROMIS-29及PROMIS-認知功能-能力的T分數被輸入至PROPr單屬性函數后,系統(tǒng)將計算每個領域得分并進一步應用一個多屬性函數對單領域得分進行特定的組合以生成一個總得分[24]。PROPr涵蓋了PROMIS-29的6個領域,另有認知功能-能力領域,但不包括PROMIS-29中的焦慮和疼痛強度兩方面[23]。
4.2研制過程及應用 在PROPr的研制過程中,Hanmer等[25]從患者報告結果測量信息系統(tǒng)中選取可用于基于偏好評估的潛在領域,所選領域的標準包括表面效度、綜合性和結構獨立性。在選定PROMIS領域后,經過對9位健康結局測量專家三輪的Delphi咨詢以及50名具有代表性的社區(qū)人員的訪談,研究者篩選出10個PROMIS領域。其中,社區(qū)成員認為所選出的10個PROMIS領域結構上獨立的比例在50%~95%,平均值為78%,且身體功能、疼痛影響和抑郁領域應予以保留,因其具有一定普遍性。此外,社區(qū)成員認為認知功能-能力、疲勞、擔任社會角色與參加社交活動的能力以及睡眠困擾的評估對社區(qū)成員具有重要價值,且67%的受訪者認為這4個領域是相互獨立的。綜合健康結局測量專家及社區(qū)成員的意見,研究團隊對相應領域的結構獨立性及重要性進行評價直至多方意見達成一致,最終選擇了現有PROPr的7個PROMIS領域。進一步地,Dewitt等[26]基于Profile-29、PROMIS-認知功能-能力簡表,采用具有代表性的983名美國一般人群樣本開展在線調查,獲取了PROMIS健康狀態(tài)的偏好,并基于7個PROMIS域中每個領域的單維和多維效用函數進行評分,構建了采用PROMIS-29、PROMIS-認知功能-能力簡表中的7個PROMIS健康領域的通用且基于社會偏好的健康相關生活質量評分系統(tǒng)。Hanmer等[25]基于上述PROPr調查了美國約3 000名受試者,結果表明,PROPr得分與其他相關量表得分的相關系數為0.67~0.70,且PROPr能有效區(qū)分有無慢性病的人群,顯示出良好的結構效度。Hays等[27]指出,僅通過Adult PROMIS Profile得分較難直接計算獲得PROPr總分,除非研究者可基于相關結果預測缺失的認知功能得分?;谠摫尘埃芯空卟捎貌煌P蛯ROMIS Profile的數據進行運算以預測認知功能評分,從而生成一個總結性的PROPr總分,所納入的模型包括零模型(Zero model)、天花板模型(Ceiling model)、地板模型(Floor model)、線性回歸模型(Linear regression model)、貝葉斯神經網絡模型(Bayesian neural network)。研究者基于Adult PROMIS Profile獲得的大樣本數據獲得了PROPr得分的模型。研究顯示,盡管貝葉斯神經網絡模型與線性回歸模型的性能相近,但線性回歸模型更易于使用,因此研究者建議使用基于線性回歸模型的PROMIS-29等測評工具以獲得其PROPr得分[27]。
目前,Adult PROMIS Profile得到了一定應用,其信效度得到了較多認可,但在應用過程中也存在一些困難。首先,Adult PROMIS Profile在慢性病群體中的應用研究有待擴展,后續(xù)研究應擴展其在癌癥患者等慢性病群體中的信效度及應用價值,以更好了解該測評工具可能存在的不足并進行優(yōu)化。如在臨床實踐中,一些研究顯示Adult PROMIS Profile在一些群體中可能存在天花板效應或地板效應,但其結果可能與研究對象的特點相關,有待后續(xù)研究的推進以明確其是否反映了相應人群的真實健康狀態(tài)。此外,當前國內與Adult PROMIS Profile相關的翻譯及應用研究較少,而英文版的原始量表是基于美國成年人所開發(fā),這一人群與我國患者所處的臨床環(huán)境和疾病特點存在差異,因此在不同語言版本測評工具的翻譯過程中,認知性訪談具有重要意義,后續(xù)研究需進一步探討其在國內一般人群及慢性病患者群體中的應用價值。另一方面,PROPr是基于PROMIS-29等測評工具發(fā)展而來的評分系統(tǒng),有望減少現有PROMIS-29在一些群體中應用時可能存在的天花板效應及地板效應。然而,目前PROPr尚不能納入Adult PROMIS Profile的焦慮和疼痛強度領域,今后PROPr是否可覆蓋PROMIS-29的上述領域或可根據預測模型預測受試者的焦慮和疼痛強度有待研究者的積極探索。另一方面,PROPr尚未得到推廣使用,且其使用較為復雜。如何將PROPr整合至臨床實踐中,使得PROMIS-29及其他Adult PROMIS Profile工具得到更為便捷有效的使用有待探索。