李 琪,周 潔,覃盛媚,黃海韻,吳 靜
(上海中醫(yī)藥大學(xué)護(hù)理學(xué)院,上海201203)
在醫(yī)學(xué)領(lǐng)域中,“預(yù)測(cè)模型”通常被用來(lái)預(yù)測(cè)個(gè)體疾病的發(fā)生及轉(zhuǎn)歸,以便指導(dǎo)醫(yī)務(wù)人員制定合理的治療方案。“預(yù)測(cè)模型”的構(gòu)建最早源于心血管疾病研究領(lǐng) 域[1],始 于1948 年 的 美 國(guó)Framingham 心 臟 研 究(Framingham heart study,F(xiàn)HS),1961 年首次提出疾病“危險(xiǎn)因素”概念[2],也是當(dāng)前眾多疾病預(yù)警與干預(yù)模式研究的基石。隨著大數(shù)據(jù)及臨床循證護(hù)理理念的不斷深化,預(yù)測(cè)模型研究逐漸成為近年來(lái)護(hù)理領(lǐng)域的研究熱點(diǎn),化療副反應(yīng)[3]、壓瘡[4]、疼痛護(hù)理[5]、衰弱評(píng)估在病人不良健康結(jié)局或手術(shù)風(fēng)險(xiǎn)預(yù)測(cè)[6?7]等方面凸顯價(jià)值。然而,評(píng)估模型開(kāi)發(fā)與驗(yàn)證相關(guān)研究的報(bào)告質(zhì)量[8?9]發(fā)現(xiàn)仍存在諸如缺失數(shù)據(jù)的處理、模型構(gòu)建的策略、使用小數(shù)據(jù)集建模等[10?13]問(wèn)題,導(dǎo)致很少有預(yù)測(cè)模型被運(yùn)用于臨床實(shí)踐中。個(gè)體預(yù)后和診斷的多變量預(yù)測(cè)模型透明報(bào)告(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)規(guī)范的引入使得多變量預(yù)警研究更為嚴(yán)謹(jǐn),而其在護(hù)理領(lǐng)域的應(yīng)用仍較局限?,F(xiàn)從TRIPOD 規(guī)范的產(chǎn)生背景、核心內(nèi)容等方面進(jìn)行介紹,并以老年衰弱的發(fā)生及不良事件的預(yù)警研究為例對(duì)護(hù)理領(lǐng)域預(yù)測(cè)模型的研究和不足進(jìn)行綜述,以期為臨床醫(yī)護(hù)人員關(guān)注預(yù)測(cè)模型,提高報(bào)告質(zhì)量提供參考。
TRIPOD 是指導(dǎo)預(yù)測(cè)模型研究如何進(jìn)行規(guī)范化報(bào)告的清單,提高臨床預(yù)測(cè)模型研究的報(bào)告質(zhì)量及可重現(xiàn)性。2011 年6 月,24 名統(tǒng)計(jì)學(xué)家、流行病學(xué)專(zhuān)家及期刊編輯組成的研究小組在英國(guó)基于文獻(xiàn)編制項(xiàng)目清單并通過(guò)會(huì)議討論、郵件征集對(duì)其進(jìn)行縮減和修訂,形成了TRIPOD 指南[14],包括22 個(gè)條目,涉及標(biāo)題和摘要(條目1 和條目2)、背景和目標(biāo)(條目3)、方法(條目4~條目12)、結(jié)果(條目13~條目17)、討論(條目18~條目20)及其他信息(條目21 和條目22)。TRIPOD 規(guī)范條目如圖1 所示。
圖1 TRIPOD 規(guī)范條目
2.1 多變量預(yù)測(cè)模型的開(kāi)發(fā) 開(kāi)發(fā)預(yù)測(cè)模型包括識(shí)別預(yù)測(cè)因子、分配預(yù)測(cè)因子相對(duì)權(quán)重、通過(guò)校正和區(qū)分評(píng)估模型預(yù)測(cè)效果,繼而采用內(nèi)部驗(yàn)證技術(shù)優(yōu)化模型、校正模型的過(guò)度擬合[15]。TRIPOD 強(qiáng)調(diào)模型建立應(yīng)明確研究對(duì)象和結(jié)局事件的數(shù)量、定義。研究表明,傳統(tǒng)的模型開(kāi)發(fā)方法已被應(yīng)用于實(shí)踐,如專(zhuān)家共識(shí)、Delphi技術(shù)或文獻(xiàn)綜述等,專(zhuān)家通過(guò)使用這些方法決定模型應(yīng)包含哪些潛在預(yù)后因素、如何分配預(yù)測(cè)因子的權(quán)重,從而反映預(yù)測(cè)因子對(duì)結(jié)局的預(yù)測(cè)預(yù)后強(qiáng)度。然而,上述方法因主觀選擇的偏差性和預(yù)測(cè)效度不佳而屢受質(zhì)疑[16]。目前,數(shù)據(jù)建模常用的方法有Cox 比例風(fēng)險(xiǎn)函數(shù)、Weibull 回歸函數(shù)和Logistic 回歸模型[1],其中常用的是Cox 比例風(fēng)險(xiǎn)函數(shù),如著名的Framingham Risk Score、Reynolds、QRISK 等心血管病發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型皆基于此方法[17]。隨著大數(shù)據(jù)理念的飛速發(fā)展,也有研究嘗試采用決策樹(shù)、故障樹(shù)分析法、層次分析法等構(gòu)建預(yù)測(cè)模型。多變量預(yù)測(cè)模型的建立規(guī)范如圖2所示。
圖2 多變量預(yù)測(cè)模型的建立
2.2 多變量預(yù)測(cè)模型的驗(yàn)證 模型的驗(yàn)證是指對(duì)模型的性能指標(biāo)(區(qū)分度、校準(zhǔn)度)進(jìn)行考察的過(guò)程[18]。根據(jù)考察過(guò)程中是否使用預(yù)測(cè)模型的開(kāi)發(fā)隊(duì)列數(shù)據(jù),分為內(nèi)部驗(yàn)證和外部驗(yàn)證。內(nèi)部驗(yàn)證是檢驗(yàn)?zāi)P烷_(kāi)發(fā)過(guò)程的可重復(fù)性,包括隨機(jī)拆分驗(yàn)證、交叉驗(yàn)證、Bootstrap重復(fù)抽樣以及“內(nèi)部?外部”交叉驗(yàn)證。外部驗(yàn)證考察的是模型的可移植性和可泛化性,TRIPOD 準(zhǔn)則第15項(xiàng)明確要求,模型必須完整報(bào)告所有回歸系數(shù)、模型截距或者基礎(chǔ)生存概率,以確保對(duì)個(gè)體進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)[19?20],常見(jiàn)形式包括時(shí)段驗(yàn)證、空間驗(yàn)證以及領(lǐng)域驗(yàn)證。TRIPOD 要求模型驗(yàn)證需描述預(yù)測(cè)值的計(jì)算方法及模型驗(yàn)證后的更新內(nèi)容,并比較驗(yàn)證數(shù)據(jù)集和建立數(shù)據(jù)集在重要變量上的分布差異,如人口學(xué)資料、預(yù)測(cè)指標(biāo)和結(jié)局指標(biāo)等。此外,模型應(yīng)用前,應(yīng)進(jìn)一步驗(yàn)證該模型在非參與模型建立人群中的預(yù)測(cè)效果,觀察根據(jù)模型確立的風(fēng)險(xiǎn)因素建立的干預(yù)措施對(duì)臨床問(wèn)題產(chǎn)生實(shí)際影響,若該預(yù)測(cè)模型具備良好的識(shí)別和預(yù)測(cè)潛在風(fēng)險(xiǎn)的價(jià)值,則可在相應(yīng)的臨床實(shí)踐和公共衛(wèi)生領(lǐng)域得以應(yīng)用推廣。多變量預(yù)測(cè)模型的驗(yàn)證規(guī)范如圖3 所示。
圖3 多變量預(yù)測(cè)模型的驗(yàn)證
3.1 衰弱病人不良健康結(jié)局的預(yù)警研究現(xiàn)狀 衰弱是指老年人由于多個(gè)生理系統(tǒng)功能儲(chǔ)備能力下降,機(jī)體易損性增加,維持自穩(wěn)態(tài)能力降低及抗應(yīng)激能力減退,面對(duì)較小刺激也可致一系列臨床不良事件發(fā)生的一種常見(jiàn)老年綜合征[21],能夠量化不良健康結(jié)局風(fēng)險(xiǎn)[22]。研究表明,衰弱與跌倒、住院、疼痛、失能、殘疾以及最終死亡等高風(fēng)險(xiǎn)相關(guān),而使用預(yù)測(cè)數(shù)據(jù)挖掘可幫助發(fā)現(xiàn)潛在的危險(xiǎn)因素,作為臨床決策支持系統(tǒng),為醫(yī)護(hù)人員提供病人可能發(fā)生的結(jié)局并據(jù)此給予風(fēng)險(xiǎn)評(píng)估和預(yù)防干預(yù)[23?25]。風(fēng)險(xiǎn)預(yù)測(cè)模型在廣泛實(shí)施之前應(yīng)經(jīng)歷識(shí)別預(yù)后因素以建立模型、在相似人群(內(nèi)部驗(yàn)證)和/或不同人群(外部驗(yàn)證)中測(cè)試模型以及評(píng)估對(duì)病人結(jié)局、醫(yī)師決策或成本的影響3 個(gè)階段,最終促使臨床醫(yī)護(hù)人員準(zhǔn)確識(shí)別風(fēng)險(xiǎn)因子,個(gè)體化給予危險(xiǎn)人群干預(yù)措施。Sokoreli 等[26]評(píng)估衰弱和社會(huì)支持對(duì)心力衰竭病人住院預(yù)后的預(yù)測(cè)能力,報(bào)告遵循TRIPOD指南使用臨床變量對(duì)模型進(jìn)行比較,通過(guò)Bootstrap 重復(fù)采樣對(duì)模型的判別性能進(jìn)行內(nèi)部驗(yàn)證,結(jié)果表明包含衰弱、家庭支持等指標(biāo)的模型較僅有臨床變量的模型曲線下面積大,可見(jiàn)衰弱的評(píng)估可提高對(duì)病人入院30 d 預(yù)后的預(yù)測(cè)性能。但該研究的局限在于未對(duì)模型進(jìn)行外部驗(yàn)證,其推廣性仍需進(jìn)一步探討。衰弱指數(shù)可用于預(yù)測(cè)老年人跌倒、殘疾、骨折和死亡[27],即在已知不良健康結(jié)局預(yù)測(cè)因子情況下,根據(jù)TRIPOD 要求,研究應(yīng)對(duì)現(xiàn)有模型進(jìn)行驗(yàn)證或比較。司華新[28]研究表明,利用衰弱篩查工具可預(yù)測(cè)老年衰弱病人跌倒、失能等不良健康結(jié)局的發(fā)生;Ensrud 等[27]比較兩種不同衰弱指數(shù)對(duì)不良健康結(jié)局的預(yù)測(cè)性,隨訪3 132 名男性老年人,利用曲線下面積對(duì)包含骨質(zhì)疏松性骨折研究(SOF)指標(biāo)的模型與心血管健康研究(CHS)指標(biāo)的模型進(jìn)行比較,便于臨床使用過(guò)程中選擇更佳的模型,發(fā)揮模型建立的臨床意義。衰弱具有可逆性,作為老年人綜合健康狀況的評(píng)價(jià)指標(biāo)對(duì)多種不良健康結(jié)局的預(yù)測(cè)作用可促進(jìn)風(fēng)險(xiǎn)防范的早期實(shí)施和干預(yù)。此外,構(gòu)建危險(xiǎn)因素或預(yù)后預(yù)測(cè)模型在對(duì)病人的護(hù)理風(fēng)險(xiǎn)評(píng)估方面發(fā)揮著至關(guān)重要的作用,如根據(jù)預(yù)測(cè)因子及時(shí)采取干預(yù)措施以有效預(yù)防骨折[29]、深靜脈血栓[30]、尿失禁[31]等結(jié)局,研究對(duì)象多為老年人,依托養(yǎng)老院、療養(yǎng)院的研究逐漸增多[32]。
3.2 現(xiàn)存不足與誤區(qū) 結(jié)合TRIPOD 規(guī)范,發(fā)現(xiàn)既往相關(guān)預(yù)測(cè)模型的研究文獻(xiàn)報(bào)告尚存在一定的不足和誤區(qū),其中常見(jiàn)的、共同的問(wèn)題多表現(xiàn)在樣本量、缺失數(shù)據(jù)的處理、預(yù)測(cè)因子的選擇策略不佳及缺乏對(duì)模型的驗(yàn)證等方面。建立模型需要有可靠的數(shù)據(jù)樣本( 通常是代表性較好的大樣本前瞻性隊(duì)列研究),能夠較準(zhǔn)確地預(yù)測(cè)未來(lái)某段時(shí)間內(nèi)( 通常為10 年) 疾病的發(fā)病概率,且對(duì)樣本量進(jìn)行詳細(xì)的解釋以保證最終模型的可靠性。如Zaslavsky 等[33]比較了常用的婦女健康倡議(WHI)和CHS 衰弱表型工具對(duì)老年婦女健康倡議臨床試驗(yàn)參與者跌倒、髖部骨折和死亡的預(yù)測(cè)能力,研究基于大樣本并對(duì)結(jié)果進(jìn)行仔細(xì)判斷,同時(shí)長(zhǎng)期隨訪的完整性保證了結(jié)果的穩(wěn)定性。尚有不少研究的樣本量不足且缺乏合理的解釋?zhuān)仪罢靶躁?duì)列研究有限[5,34]。TRIPOD 要求研究報(bào)告中應(yīng)描述缺失數(shù)據(jù)的處理手段和插補(bǔ)方法的細(xì)節(jié),在缺乏數(shù)據(jù)的情況下,由于有效樣本量少可能對(duì)預(yù)后估計(jì)產(chǎn)生偏倚。理想情況下,應(yīng)使用先進(jìn)的技術(shù)進(jìn)行數(shù)據(jù)處理。如Hassler 等[35]針對(duì)現(xiàn)有數(shù)據(jù)庫(kù),利用數(shù)據(jù)挖掘技術(shù)探索尋找衰弱的危險(xiǎn)因素并建立預(yù)測(cè)模型,研究?jī)H分析了一個(gè)隊(duì)列的474 例病人,包括284 個(gè)變量,故只能粗略地評(píng)估模型性能。然而,該研究表明利用數(shù)據(jù)挖掘技術(shù)對(duì)不完整、不平衡的醫(yī)療數(shù)據(jù)進(jìn)行整理、估算和特征選擇等來(lái)尋找預(yù)測(cè)因子、建立預(yù)測(cè)模型是可行的。此外,模型的預(yù)測(cè)因子應(yīng)能夠從某生理機(jī)制或途徑得以合理的解釋?zhuān)?dāng)候選變量較多時(shí),可參考既往研究已公開(kāi)報(bào)道的對(duì)結(jié)局事件有獨(dú)立作用的變量作為重點(diǎn)的候選變量以供備選,而預(yù)測(cè)因子的選擇策略仍是研究的問(wèn)題之一,如Kojima 等[36]利用基于綜合監(jiān)測(cè)系統(tǒng)的高質(zhì)量前瞻性數(shù)據(jù)建立老年衰弱病人跌倒預(yù)測(cè)模型,其未能獲取并控制如認(rèn)知功能、乙醇使用或高危藥物使用等重要的潛在混雜因素。Bromfield 等[37]研究中也存在未能獲取體重減輕、步態(tài)速度和握力等衰弱相關(guān)指標(biāo)的局限?,F(xiàn)有的疾病風(fēng)險(xiǎn)預(yù)測(cè)模型在自變量選擇上除根據(jù)基線資料組間單因素分析結(jié)果及臨床背景,鮮少考慮變量之間的交互作用,也未進(jìn)行自變量的多重篩選,繼而導(dǎo)致模型自變量之間可能存在共線性,影響模型的預(yù)測(cè)能力[38]。有學(xué)者提出采用關(guān)聯(lián)規(guī)則挖掘技術(shù)或Lasso回歸,有望改善模型自變量選擇的潛在交互問(wèn)題。預(yù)測(cè)模型研究是為了量化使用預(yù)測(cè)模型對(duì)醫(yī)護(hù)人員的決策或直接對(duì)病人健康結(jié)果的影響,而非單純地使用模型[39]。盡管大部分研究對(duì)模型進(jìn)行了校正和調(diào)整,且顯示具備良好的擬合性,但其是否被應(yīng)用于臨床及對(duì)臨床病人結(jié)局的改變長(zhǎng)期效果仍不清晰,無(wú)法確定這些模型在臨床實(shí)踐中的價(jià)值。
疾病預(yù)防從宏觀和微觀層面可以分為公共衛(wèi)生防控、個(gè)人疾病篩查和健康管理[40],衛(wèi)生保健提供者和決策者越來(lái)越多地建議在臨床實(shí)踐中使用預(yù)測(cè)模型,為臨床路徑的各階段決策提供信息[41?42],這無(wú)疑促進(jìn)了人類(lèi)疾病的預(yù)防和健康管理。未來(lái)的研究應(yīng)根據(jù)TRIPOD 規(guī)范報(bào)告模型的開(kāi)發(fā)與驗(yàn)證,應(yīng)用合適的預(yù)測(cè)因子選擇策略,適當(dāng)處理缺失數(shù)據(jù)和連續(xù)預(yù)測(cè)因子,避免過(guò)度擬合。在模型的呈現(xiàn)上,Nomogram 只是一個(gè)回歸模型的可視化呈現(xiàn)方法,本質(zhì)跟普通的回歸方程式一樣,故應(yīng)選擇適合表達(dá)及便于理解的呈現(xiàn)方式[43]。目前,數(shù)據(jù)挖掘技術(shù)正在成為醫(yī)學(xué)界和臨床工作者的重要分析工具,便于對(duì)病人和臨床研究數(shù)據(jù)的二次利用,有助于提高衛(wèi)生保健系統(tǒng)的效率和效力。
綜上所述,只有在充分和透明的報(bào)告下,才能揭示研究的優(yōu)缺點(diǎn),從而促進(jìn)模型在臨床環(huán)境中的應(yīng)用,有助于實(shí)現(xiàn)對(duì)病人照護(hù)服務(wù)的個(gè)體化,便于給予病人實(shí)時(shí)、高效的服務(wù),落實(shí)國(guó)家促進(jìn)護(hù)理服務(wù)業(yè)改革與發(fā)展政策。