吳瑤,陶立波,2
1.北京大學醫(yī)學部 衛(wèi)生政策與技術評估中心,北京 100191;2.北京大學 公共衛(wèi)生學院 衛(wèi)生政策與管理學系,北京 100191
醫(yī)用耗材管理是我國衛(wèi)生管理工作中的重要內容之一,由于醫(yī)用耗材的品種繁多而技術多樣,產品材質、特征不同會造成不同耗材產品的內在質量及臨床療效存在差異,因此醫(yī)用耗材醫(yī)保支付方面的編碼歸類工作一直進展緩慢,醫(yī)用耗材在藥監(jiān)、醫(yī)保、醫(yī)療環(huán)節(jié)的分類編碼規(guī)則長期缺乏有效銜接,直到2019 年國家醫(yī)療保障局發(fā)布《醫(yī)療保障標準化工作指導意見》[1],明確了醫(yī)保醫(yī)用耗材編碼規(guī)則和方法。而基于醫(yī)用耗材的復雜性,對其進行價值評價的難度較大,目前我國常用的衛(wèi)生技術價值綜合評價方法主要來自藥品評價的經驗,通常采用多維度評價體系,根據(jù)專家咨詢設置維度和權重,以綜合評估藥品價值。醫(yī)用耗材則一般采用傳統(tǒng)衛(wèi)生技術評估(Health Technology Assessment,HTA)方法對安全性、有效性、經濟性等維度進行評價。與藥品相比,醫(yī)用耗材評價難度更大,僅有部分專家共識發(fā)表,缺少官方指南,因此對醫(yī)用耗材進行價值綜合評價受到了人們的廣泛關注。基于此,本研究旨在通過綜述國內外文獻,對價值綜合評價的方法、開展醫(yī)用耗材價值評價的難點,以及國內外醫(yī)用耗材價值評價方法的應用進展進行總結和分析,以期為促進我國醫(yī)用耗材價值評價工作的開展提供參考。
當前我國藥品的價值綜合評價主要采用國家衛(wèi)生健康委辦公廳發(fā)布的《關于規(guī)范開展藥品臨床綜合評價工作的通知》[2],通過開展基于價值的藥品定價研究、藥物的臨床價值研究、上市后藥品價值研究,促進藥品回歸臨床價值,以提高藥事服務質量,保障臨床基本用藥的供應與合理使用,更好地服務國家藥物政策決策需求[2-3]。藥品的臨床綜合評價是對HTA、多準則決策分析(Multi-Criteria Decision Analysis,MCDA)等評價工具的綜合運用,可以分為證據(jù)收集和綜合分析決策兩個過程,其中證據(jù)收集是根據(jù)評價維度采用不同的方法收集藥品內在價值因素的循證證據(jù),綜合分析決策是對所有評價維度的證據(jù)進行整合分析,綜合評價藥品價值[4]。
評價維度的選擇是藥品價值綜合評價的基礎。近年來,相關學會、政府部門相繼發(fā)布了藥品綜合評價指南,其評價維度和內容各不相同[5]。國家衛(wèi)生健康委辦公廳發(fā)布的《關于規(guī)范開展藥品臨床綜合評價工作的通知》[2]提出藥品臨床綜合評價應包括安全性、有效性、經濟性、創(chuàng)新性、適宜性、可及性6 個維度。確定評價維度后,需要應用多種評價方法和工具展開定性、定量評價,以收集證據(jù)進行整合分析與綜合研判。不同評價維度采取的評價方法不盡相同,安全性、有效性和經濟性的評價以定量分析方法為主,多利用臨床試驗、文獻分析、真實世界數(shù)據(jù)(Real-World Data,RWD)來支持對藥品的臨床療效、不良反應、成本產出等具體指標的評價。在藥品的創(chuàng)新性、適宜性、可及性維度的評價上,雖然也有研究采用定量方法來進行公平性影響分析、藥品適宜性指數(shù)計算等具體指標的評價,但主要評價方法為描述性分析、問卷調查、咨詢訪談等定性分析方法[6]。綜合決策分析需要將各維度的定性資料和定量資料結合起來綜合評定藥品價值,常用德爾菲法、層次分析法、MCDA 等方法[5],基本做法是使不同利益相關者參與決策,基于評價維度構建具體的指標體系并賦予權重,以獲得綜合評價結果。在國家藥物和衛(wèi)生技術綜合評估中心發(fā)布的《心血管病、抗腫瘤、兒童藥品臨床綜合評價技術指南》[7]中,明確將MCDA 用于藥品綜合決策分析環(huán)節(jié),對不同藥品進行綜合價值排序以確定最佳選擇。
近年來,我國藥品價值綜合評價相關研究逐漸增多,有關藥品臨床綜合評價質量控制[8],以及特定品類藥品如心血管慢病藥品[9]、中成藥[10]等的指南和專家共識相繼發(fā)布,有利于推動評價工作的持續(xù)開展和評價結果的運用、轉化,但現(xiàn)階段的指南只是對評價流程、維度和內容的初步介紹,具體的評價方法和實施路徑仍處于探索階段。首先是評價維度尚未完全統(tǒng)一,2021 年國家衛(wèi)生健康委辦公廳發(fā)布的《關于規(guī)范開展藥品臨床綜合評價工作的通知》[2]提出的6 個維度是評價的重要參考,但具體評價過程中可能根據(jù)藥品特點增加其他維度進行共同評價,如張旭明等[11]在6 個評價維度基礎上增加中醫(yī)藥特色和藥品信息服務兩個維度共同對注射用血栓通(凍干)治療急性腦梗死進行臨床綜合評價;也可能減少某些維度來適應不同的決策場景,如2022 年醫(yī)保藥品目錄遴選要求提交5 個維度的證據(jù),與指南相比,去掉了對適宜性、可及性證據(jù)的要求,新增對公平性的考量[12]。其次,每個維度的評價指標選擇具有多樣性[3],不同藥品構建的具體指標體系中,二級指標乃至三級指標構成可能不同[13-14],為每種或每類藥品構建不同指標體系費時費力,標準也難以統(tǒng)一。另外,評價方法學的嚴謹性、數(shù)據(jù)來源的真實可靠性直接影響評價結果的質量。以定量方法為主的維度在評價時能獲得的證據(jù)資料相對較多,決策時能更明確地判斷證據(jù)質量;而定性分析的維度往往缺乏明確的評價標準,證據(jù)資料不足現(xiàn)象突出。肖秘蘇等[15]分析我國藥品綜合評價研究現(xiàn)狀發(fā)現(xiàn),對于指南中要求的6 個評價維度,以安全性和有效性的研究居多,其次為經濟性,涉及創(chuàng)新性、適宜性和可及性的相關研究較少,且多在其他研究中被提及。最后,由藥品品種、研究目的、證據(jù)資料完備程度等因素導致的評價維度、內容和方法上的差異,均會影響最終的綜合分析決策過程。如何整合不同維度、不同證據(jù)等級的資料,以及得出的評價結果在不同決策場景的應用、轉化方式均有待進一步探索實踐。
近年來,技術進步促使新型醫(yī)用耗材不斷投入臨床應用,同時高值醫(yī)用耗材價格虛高、過度使用等問題持續(xù)存在,導致醫(yī)用耗材在衛(wèi)生費用中的占比不斷增加,醫(yī)用耗材價格形成機制改革逐漸成為政策關注的重點,尤其是單價和資源消耗占比相對較高的高值醫(yī)用耗材。為降低高值醫(yī)用耗材虛高價格、完善價格形成機制,2019 年國務院辦公廳發(fā)布《治理高值醫(yī)用耗材改革方案》[16],提出將高值醫(yī)用耗材作為重點治理對象,統(tǒng)一耗材分類和編碼體系,實行醫(yī)保準入和目錄動態(tài)調整,探索高值醫(yī)用耗材分類集中采購。這意味著醫(yī)用耗材的定價將從以往的粗放式管理走向更加精細化的管理,而關鍵之一是如何獲得各方都可接受的醫(yī)用耗材價格。與藥品類似,基于證據(jù)的價值評價可作為定價的重要參考。除定價環(huán)節(jié)以外,在醫(yī)療機構內部的耗材遴選、采購、臨床使用等環(huán)節(jié),相關文件也提出應按照合法、安全、有效、適宜、經濟等原則[17],進行醫(yī)用耗材的選用和管理,這均需要相關證據(jù)的收集和評價。
當前我國衛(wèi)生技術價值綜合評價工作尚處于起步和探索階段,主要集中在藥品領域,已有學者從醫(yī)療機構醫(yī)用耗材遴選和管理視角展開了針對止血材料[18]、吻合器[19]等醫(yī)用耗材的價值綜合評估探索,在國家層面尚未發(fā)布醫(yī)用耗材價值綜合評價的相關指南或辦法,但從改革方案中可以看出,醫(yī)用耗材的評價維度與藥品具有一定的相似之處,參考藥品建立價值綜合評價制度是一個可行的思路。與藥品基于通用名進行分類管理不同,耗材分類復雜,管理難度更大。在對醫(yī)用耗材進行價值綜合評價時,除了面臨藥品評價的問題之外,還有很多與醫(yī)用耗材相關的特點和難點亟待解決。
針對產品本身而言,長期以來醫(yī)用耗材缺乏統(tǒng)一通用名,產品種類繁多,型號、規(guī)格復雜,企業(yè)自定標準、自定名稱現(xiàn)象普遍;技術更新迭代快,不同品類、產地、材質、規(guī)格、品牌的醫(yī)用耗材同時存在,使得醫(yī)用耗材的遴選及合理使用困難較多[20-21]。2019 年醫(yī)保醫(yī)用耗材編碼規(guī)則和方法的發(fā)布一定程度上改善了醫(yī)用耗材命名和分類混亂的現(xiàn)狀,但從產品注冊、醫(yī)保準入到收費多個流程之間,現(xiàn)行使用的目錄分類方式均不相同,仍缺乏有效銜接[22]。
耗材應用場景復雜且與醫(yī)護人員接受的培訓、能力和經驗密切相關。我國定義的高值醫(yī)用耗材多為高風險的,常用于三、四級重大手術的植入類或介入類醫(yī)用耗材,對臨床操作要求高,使用不當會造成患者安全風險[23]。醫(yī)用耗材的臨床價值與醫(yī)生技術水平密切相關,進行安全性、有效性等維度評價時,更易受醫(yī)護人員學習曲線差異因素干擾[24]。即使是同類醫(yī)用耗材,不同廠家的產品在使用上仍存在一定差異,醫(yī)生經過培訓和日常操作已形成相對固定的使用習慣,更換品牌存在較高的學習成本,因此醫(yī)生在醫(yī)用耗材選用上具有一定的使用者偏好,品牌粘性較強,在操作滿意度、醫(yī)護使用體驗等定性指標評價上,更易受主觀偏好影響[25]。
醫(yī)用耗材臨床資料普遍不足的現(xiàn)狀導致開展多維度綜合評價的證據(jù)基礎薄弱。與藥品相比,醫(yī)用耗材產品的注冊審批要求相對簡單,開展的臨床研究較少,上市前臨床試驗提供的安全性、有效性證據(jù)不充分現(xiàn)象普遍存在[25]。上市前通常采用一些安全性測量,將慣用技術參數(shù)作為判斷產品優(yōu)劣的指標,往往需要通過上市后臨床應用積累數(shù)據(jù)資料,驗證其安全性、有效性[21]。此外,企業(yè)常采用累進性微創(chuàng)新策略,導致產品上市快、生命周期短[26],缺乏積累數(shù)據(jù)的條件,加劇了評價所需證據(jù)不足的現(xiàn)狀。
部分醫(yī)用耗材還存在適應證不明確和證據(jù)鏈過長的問題。藥品的適應證通常較明確,在藥品臨床綜合評價中,可以針對特定的適應證探討其臨床價值。而一些起診斷或輔助治療作用的耗材、器械通常適應證廣泛,缺乏直接的短期或長期療效產出,導致證據(jù)鏈比較長,難以獲得足夠的數(shù)據(jù)進行分析評價[26]。
總體來看,醫(yī)用耗材和藥品雖然都屬于衛(wèi)生技術,在臨床中合理應用均有利于提高患者健康水平,改善生活質量,兩者在進行價值綜合評價時有一定的共通之處,但醫(yī)用耗材價值評價的不確定性更強,具有一定的特殊性,主要體現(xiàn)為評價所需證據(jù)資料不足和證據(jù)質量欠佳現(xiàn)象普遍存在,以及學習曲線和使用者偏好導致評價結果的不確定性。由此導致在進行醫(yī)用耗材醫(yī)保報銷、臨床應用等決策時,往往受到不充分或不適用的證據(jù)阻礙。而決策的不確定性可能會帶來巨大的成本,導致有價值的衛(wèi)生技術出現(xiàn)不必要的延遲應用使患者不能充分獲益,或者未經合理驗證的技術應用后可能對患者造成直接傷害和資源浪費。
當前國際上醫(yī)用耗材價值評價主要采用傳統(tǒng)的HTA方法。HTA 是對藥品、醫(yī)療器械、醫(yī)用耗材等在內的衛(wèi)生技術的特性、作用及影響的系統(tǒng)評估,其主要目的是為醫(yī)療領域中與技術有關的決策提供信息,促進具有成本效益的新技術應用,并避免不能保障安全性及效益的技術應用于臨床[27-28]。在國際上,HTA 廣泛應用于藥械技術綜合評估,其在藥品領域的應用已日漸完善,多個國家已發(fā)布相關指南以指導藥品HTA 實踐和結果應用,但在醫(yī)用耗材領域仍處于探索階段。據(jù)聶海鑫[27]的研究統(tǒng)計,目前歐洲41 個國家發(fā)布的官方HTA 指南中僅有23%適用于醫(yī)用耗材,僅4 個針對醫(yī)用耗材HTA 進行了單獨討論,但可實施的解決方案有限。盡管如此,HTA 仍是醫(yī)用耗材選用和醫(yī)保決策的重要參考,尤其是不屬于現(xiàn)有分類的新興耗材,無法參考同類產品獲得醫(yī)保報銷,可通過提交HTA 評估資料證明其具有更好的臨床療效或經濟性更佳[29]。
醫(yī)用耗材HTA 評估也面臨評價維度選擇的問題,不同國家和地區(qū)HTA 報告納入的維度不盡相同,共同之處是均關注對醫(yī)用耗材有效性、安全性和經濟性的評價,除此之外,一些國家還將耗材的技術特性(包括使用壽命和范圍)、創(chuàng)新性、社會適應性、可負擔性等的一個或多個維度納入評估[24,27-28,30-32]。當前我國從全社會層面開展的醫(yī)用耗材HTA 研究較少,尚未針對評價維度形成共識。孫輝等[33]提出高值醫(yī)用耗材價值評估框架應包括需求、技術特性、臨床獲益、學習曲線、經濟性和社會影響6 個維度。邱英鵬等[23]、陳毅捷等[24]認為我國高值醫(yī)用耗材內涵體現(xiàn)了臨床價值、經濟價值和社會價值3 個核心維度,選擇具體評估維度時,安全性和有效性是核心,也是醫(yī)保支付的前提,在此基礎上可增加經濟性和其他維度,以滿足我國高值醫(yī)用耗材治理價值取向。
與藥品臨床綜合評價類似,醫(yī)用耗材綜合價值評價也重視對臨床價值和經濟性的評價,其中以安全性、有效性為核心的臨床價值是醫(yī)用耗材綜合評價的基礎,在醫(yī)保決策、醫(yī)院遴選中,經濟性評價也是關注的重點。根據(jù)國際上已發(fā)布的HTA 報告,產品的技術特性、安全性、有效性和經濟性是關注度較高的維度,而較少涉及公平性、對患者和醫(yī)療系統(tǒng)的影響等體現(xiàn)醫(yī)用耗材社會價值的維度[24]。與藥品綜合評價的主要不同點包括:醫(yī)用耗材適用范圍廣泛和證據(jù)鏈長的問題更突出,難以獲得長期療效產出的醫(yī)用耗材通常需要采用中間指標來代替結局指標進行評價[18-19];醫(yī)用耗材的學習曲線問題在評估中應有所考量,如與對照品相比是否需要對醫(yī)護人員進行額外培訓[34]。此外,醫(yī)用耗材特點所致證據(jù)資料不充分對價值評估方法學的挑戰(zhàn)更突出。一項對歐洲高風險醫(yī)療器械HTA 報告的系統(tǒng)分析發(fā)現(xiàn)[27],50%以上報告中關于器械有效性和安全性的臨床質量等級為中低水平,即使有系統(tǒng)評價及隨機對照試驗可供評估,但大多數(shù)研究的偏倚風險為不清楚或高風險。由于醫(yī)用耗材產品在進入市場后,產品的評估和修改仍在繼續(xù),因此將產品整個生命周期中產生的RWD 形成的真實世界證據(jù)(Real-World Evidence,RWE)作為前瞻性臨床試驗的替代或補充以進行價值評估,有利于加快創(chuàng)新耗材產品的上市進程,使患者能更早受益。2016 年美國已批準美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)在審查新申請(上市前審批)醫(yī)療器械和新適應證時可考慮RWE 的應用。根據(jù)美國FDA 發(fā)布的關于使用RWE 支持醫(yī)療器械監(jiān)管決策的指南,包括RWD 在內的非傳統(tǒng)數(shù)據(jù)來源的證據(jù)可部分或全部構成評估醫(yī)療器械安全性和有效性的充分證據(jù)[35]。即使如此,數(shù)據(jù)的分散、非標準化等問題仍制約了RWD的應用,在這種情況下,權威的、有代表性的專家咨詢意見成為補充證據(jù)的重要和快速途徑[36]。
醫(yī)用耗材價值綜合評價結果來自對各維度證據(jù)的整合分析,由于在進行各維度評價時普遍存在證據(jù)數(shù)量和質量不足的現(xiàn)象,更加依賴專家咨詢,而新型醫(yī)用耗材臨床應用較少,專家意見的可靠性缺乏臨床驗證,仍然采用MCDA 方法構建指標體系將加劇評價結果的不確定性。從國際經驗來看,在耗材HTA 評估中對各維度分別評價并重點關注經濟性指標是更常見的做法。Hill等[37]研究發(fā)現(xiàn),澳大利亞Medicare 在衛(wèi)生技術醫(yī)保準入決策時,不建議納入醫(yī)保的最主要因素為HTA 報告中成本效益的不確定性。英國、加拿大的HTA 指南中也將經濟學評價證據(jù)作為基本要求,沒有成本效果證據(jù)的支持,衛(wèi)生技術難以被推薦用于臨床實踐[38]。除經濟性評價以外,其他維度作為重要的支持材料共同輔助決策制定,其中安全性和有效性資料是開展經濟性評價的基礎,高質量的創(chuàng)新和療效證據(jù)有利于產品獲得更高的報銷標準[31]。國內已有研究[18-19,39]探索建立針對特定品類耗材的多維度綜合價值評價指標體系,但應用場景局限于院內耗材的遴選采購,由醫(yī)護人員和醫(yī)院管理者對醫(yī)用耗材的安全性、有效性、經濟性或財務影響、生產供應等維度展開評價,其中耗占比、企業(yè)知名度、服務信譽度等多個具體指標基于醫(yī)院管理需求而制定,其評價方法的落地應用,以及向其他決策場景擴展的可行性仍有待進一步驗證。
當前醫(yī)用耗材價值綜合評價以傳統(tǒng)的HTA 方法為主,對安全性、有效性、經濟性等維度分別展開評價,并且在風險、治療效果可接受的基礎上,重點關注對成本效果證據(jù),即經濟性的審查。藥品價值綜合評價中常用的MCDA 方法在耗材領域尚不多見,醫(yī)用耗材在注冊上市、醫(yī)保準入、醫(yī)院遴選等決策場景中,其價值內涵取決于相應的決策需求,建立適用于醫(yī)用耗材的多維度、多指標評價體系仍有待進一步的可行性和方法學上的探索。目前,國內對醫(yī)用耗材價值綜合評價的應用尚處于探索階段,未來有必要針對耗材評價的特點和難點繼續(xù)展開價值綜合評價方法學的研究,包括探討不同決策場景醫(yī)用耗材綜合價值的主要內涵,如何提高評價的證據(jù)質量和降低學習曲線因素的干擾,以及探索評價結果在不同情境下的決策應用,以提高衛(wèi)生決策的科學化、規(guī)范化、同質化,為我國醫(yī)用耗材供應保障、政策制定與調整提供決策依據(jù)。
醫(yī)用耗材價值綜合評價是耗材研發(fā)生產、準入、使用各環(huán)節(jié)決策的科學、有效的輔助工具,合理應用有助于識別真正有價值的醫(yī)用耗材使患者盡早獲益。而價值評價的復雜性和醫(yī)用耗材的特點導致評價結果不確定性較強,且在新型耗材的臨床應用早期階段尤為突出,原因主要包括耗材市場準入的監(jiān)管要求相對寬松,難以從隨機對照試驗中產生確鑿的證據(jù),醫(yī)用耗材技術特性、學習效應,以及產品累進式迭代更新使得現(xiàn)有研究結果在其他環(huán)境中難以推廣,這種不確定性導致耗材價值評價時普遍缺乏高質量證據(jù)的支持。為降低不確定性的影響,在實踐中加強對RWE 的應用可一定程度上彌補隨機對照試驗數(shù)據(jù)的不足,但獲得足夠、有價值的RWD需要相關證據(jù)報告制度建立和信息化建設的支持,有待未來進一步發(fā)展和完善。