李呈呈 劉紅慧 陳曦來 莊 夢 劉 戀 涂新華 徐城偉 段 禹 王 靜△
【提 要】 目的 將半?yún)?shù)分位數(shù)回歸模型應用于老年人醫(yī)療費用的研究,探究不同醫(yī)療支出水平對其影響因素的響應情況并提出建議,為實現(xiàn)健康老齡化提供參考依據(jù)。方法 使用中國健康與養(yǎng)老追蹤調查(CHARLS)2018年數(shù)據(jù)庫,使用R 4.0.4軟件建立半?yún)?shù)分位數(shù)回歸模型探究老年人醫(yī)療費用的影響因素。結果 年齡、個人年收入、性別、居住地城鄉(xiāng)分布、自評健康狀況及醫(yī)療保險是影響老年人醫(yī)療費用的重要因素。年齡增加使老年人醫(yī)療支出增加,尤其在低醫(yī)療支出的高齡老年人中,年齡增加的效應迅速變強;個人收入對老年人醫(yī)療支出的影響效應呈現(xiàn)U型,即對低收入與高收入的老年人醫(yī)療支出影響較高,而對中等收入老人影響較低;不同性別老年人醫(yī)療支出差異較小,女性總體略高于男性;城市老年人醫(yī)療支出顯著高于農(nóng)村老年人,且這種差異在低醫(yī)療支出和高醫(yī)療支出老年人群中更為明顯;自評健康狀況和參加醫(yī)療保險情況也是影響老年人醫(yī)療支出的重要因素。結論 半?yún)?shù)分位數(shù)回歸模型在對老年人醫(yī)療支出影響因素的研究有較好的效果。不同醫(yī)療支出水平對于影響因素有著不同的響應情況。
根據(jù)2020年第七次人口普查結果,我國60歲及以上老年人口達到26402萬人,占總人口數(shù)的18.70%,人口老齡化程度進一步加深。老年人口的增多增加了醫(yī)療衛(wèi)生服務的花費,給社會和家庭帶來了巨大的撫養(yǎng)負擔[1]。目前已有多種研究方法應用于老年人醫(yī)療支出的研究,其中以Tobit回歸模型[2-3]和線性回歸模型[4-5]等最為常用。然而,不同影響因素對老年人醫(yī)療支出的影響形式不同,若使用單純參數(shù)或非參數(shù)模型可能會錯誤地估計因素的效應。此外,不同水平的醫(yī)療支出可能對于影響因素有著不同的響應,我們不僅想了解均值處的情況,還關注低醫(yī)療消費水平人群和高醫(yī)療消費水平人群等非中心位置的情況,而目前的研究多未加以考慮。
半?yún)?shù)分位數(shù)回歸模型可以很好地解決上述問題。它將分位數(shù)回歸的思想融入半?yún)?shù)模型中,既可以觀測到變量間的線性與非線性的關系,也能觀察到變量在不同位置的具體情況,對因變量不同條件分位數(shù)下的情況進行分析[6-7];此外還具有需要的樣本量少、對數(shù)據(jù)的限制小、不易受數(shù)據(jù)分布與異常值的影響等優(yōu)點,已成功應用于多領域的研究[8-11]。
因此,本研究使用中國健康與養(yǎng)老追蹤調查(CHARLS)2018年數(shù)據(jù)庫,建立半?yún)?shù)分位數(shù)回歸模型,探究我國老年人醫(yī)療費用的影響因素并提出建議,旨在幫助社會研究者、政策制定者更好地制訂政策方案,以積極應對人口老齡化的挑戰(zhàn)。
1.數(shù)據(jù)來源與處理
本研究使用的數(shù)據(jù)來自中國健康與養(yǎng)老追蹤調查(CHARLS)2018年數(shù)據(jù)庫,選取其中60歲以上老年人為調查對象,因變量為老年人醫(yī)療支出,包括三個部分:(1)住院治療費用:調查前一年住院的總費用;(2)門診費用:調查前一個月看病的總費用;(3)自我治療費用:調查前一個月自己買藥的花費。由于調查前一年的門診支出與自我治療支出數(shù)據(jù)無法獲取,因此將后兩項進行換算,(月門診費用+月自我治療費用)×12+年住院治療費用作為年醫(yī)療支出,并取對數(shù)以減小數(shù)據(jù)波動。通過文獻綜述以及數(shù)據(jù)獲取的完整性,本文選取年齡、性別、居住地城鄉(xiāng)分布、自評健康狀況、醫(yī)療保險和個人年收入為自變量。
CHARLS調查問卷的原始數(shù)據(jù)編碼較復雜,本文使用SPSS23.0軟件對部分變量進行了計算、重新編碼與賦值。其中年齡為調查年份與實際出生年份的差值;個人年收入為過去一年工資收入與支付轉移收入之和,因為原始數(shù)據(jù)波動較大且存在0值,將原始數(shù)據(jù)加1并取對數(shù);性別變量男性、女性分別用1、2表示;居住地城鄉(xiāng)分布原編碼為:1=城或鎮(zhèn)中心區(qū)、2=城鄉(xiāng)或鎮(zhèn)鄉(xiāng)結合區(qū)、3=農(nóng)村、4=特殊區(qū)域,其中3為農(nóng)村,1、2、4合并為城市,分別用1、2表示;自評健康狀況是指研究對象對自身健康狀況的自我感知,能反映客觀與主觀健康狀況,是反映健康狀況的一個綜合指標[12],自評健康狀況原分類包括:1=很好、2=好、3=一般、4=不好、5=很不好,本研究將1、2合并為好,3為一般,4、5合并為不好,分別用1、2、3表示;醫(yī)療保險變量合并為無醫(yī)療保險、城鎮(zhèn)職工醫(yī)療保險、城鄉(xiāng)居民醫(yī)療保險、其他醫(yī)療保險,分別用0、1、2、3表示。去除無醫(yī)療支出、醫(yī)療支出數(shù)據(jù)缺失及自變量信息缺失的樣本,最終納入研究的老年人共4809人。
2.模型方法
(1)分位數(shù)回歸
分位數(shù)回歸的思想由Koenker和Bassett于1978年提出[13]。分位數(shù)回歸研究自變量與因變量不同條件分位數(shù)之間的關系,通過建立不同分位數(shù)下的回歸模型,了解因變量的條件概率分布。分位數(shù)回歸是最小二乘回歸的拓展,它們都通過最小化因變量實際值與擬合值之間的距離來估計參數(shù),但方法有所不同。對于一般線性回歸模型Y=XTβ+ε,最小二乘回歸估計求最小殘差平方和,即
而分位數(shù)回歸求的是最小加權絕對殘差和,即
分位數(shù)回歸中不同分位點處符號的參數(shù)估計值根據(jù)分位數(shù)τ的不同而不同,因此可以在欲研究的分位數(shù)上進行針對性分析。
(2)半?yún)?shù)分位數(shù)回歸模型
半?yún)?shù)分位數(shù)回歸模型是將分位數(shù)回歸的思想應用于半?yún)?shù)模型中而建立的,其一般表達式為:
R軟件的“quantreg”包可實現(xiàn)多種分位數(shù)回歸的相關估計與檢驗,本文關于分位數(shù)回歸的分析主要使用R 4.0.4軟件實現(xiàn)。
納入研究的4809位老年人平均年齡為68.72歲,其中男性占47.4%,女性占52.6%;中位醫(yī)療支出為1800元。表1和表2給出了老年人醫(yī)療費用及其影響因素的描述性分析結果。對醫(yī)療支出數(shù)據(jù)進行正態(tài)性檢驗,結果顯示老年人醫(yī)療支出在0.05的檢驗水準下不符合正態(tài)分布(統(tǒng)計量=0.389,P<0.01)。對原始數(shù)據(jù)進行對數(shù)變換,再次檢驗其正態(tài)性,仍不符合正態(tài)分布(統(tǒng)計量=0.065,P<0.01),不滿足線性回歸對數(shù)據(jù)正態(tài)性的要求,可使用分位數(shù)回歸進行研究。
表1 老年人醫(yī)療費用分類變量影響因素描述
表2 老年人醫(yī)療費用及其連續(xù)變量影響因素描述
根據(jù)以往研究及數(shù)據(jù)獲取的方便性和完整性,以60歲及以上老年人過去一年醫(yī)療支出的對數(shù)為因變量,選擇性別、年齡、居住地城鄉(xiāng)分布、自評健康狀況、個人年收入對數(shù)、醫(yī)療保險為自變量。通過計算比較將性別、居住地城鄉(xiāng)分布、自評健康狀況和醫(yī)療保險為參數(shù)因素;年齡和個人年收入為非參數(shù)因素,建立半?yún)?shù)分位數(shù)回歸模型,選取0.05、0.25、0.50、0.75、0.95五個分位點進行分析,結果如表3~4。
表3 半?yún)?shù)分位數(shù)回歸模型參數(shù)項系數(shù)估計與檢驗
居住地城鄉(xiāng)分布和自評健康狀況因素在各分位數(shù)上均顯著;性別因素在0.75與0.95分位數(shù)上不顯著;醫(yī)療保險因素中,城鎮(zhèn)職工醫(yī)療保險在各分位數(shù)上均顯著,城鄉(xiāng)居民醫(yī)療保險僅在0.05和0.95分位數(shù)上顯著,其他醫(yī)療保險僅在0.05分位數(shù)上不顯著。為了便于比較,將不同分位數(shù)下各參數(shù)項系數(shù)繪制成折線圖,如圖1。
圖1 半?yún)?shù)分位數(shù)回歸模型中參數(shù)系數(shù)變化圖
從表3和圖1可以看到,居住地城鄉(xiāng)分布因素的系數(shù)均為正值,說明城市老年人的醫(yī)療支出高于農(nóng)村老年人,其值在低醫(yī)療支出人群中較大而在高醫(yī)療支出人群中較小。自評健康狀況系數(shù)均為正值,健康狀況越差系數(shù)越大。各分位數(shù)上自評健康狀況因素系數(shù)變化不大,說明健康狀況對不同位置的醫(yī)療支出的影響效應相近。性別因素的系數(shù)整體很小,其在中低的醫(yī)療消費水平上為正,即女性醫(yī)療支出高于男性。而在高醫(yī)療消費水平上,性別因素系數(shù)不顯著。醫(yī)療保險因素系數(shù)均為正值,表明醫(yī)療保險增加了老年人的醫(yī)療支出,城鎮(zhèn)職工醫(yī)療保險系數(shù)在各分位數(shù)上均大于城鄉(xiāng)居民醫(yī)療保險。
表4給出了半?yún)?shù)分位數(shù)回歸模型非參數(shù)項的顯著性檢驗,可以看到年齡和個人年收入在各個分位點上的回歸結果均顯著,說明模型非參數(shù)部分擬合結果較好。
表4 半?yún)?shù)分位數(shù)回歸模型非參數(shù)項顯著性檢驗
圖2是非參數(shù)因素年齡和個人年收入在不同分位點上對老年人醫(yī)療費用的影響效應圖,其中左側列為年齡的影響效應,右側列為個人年收入的影響效應,由上至下依次為0.05、0.25、0.50、0.75、0.95分位數(shù)。
圖2 半?yún)?shù)分位數(shù)回歸模型中非參數(shù)因素的影響效應
圖2左側表明,在不同分位點上,年齡對老年人醫(yī)療支出的影響效應表現(xiàn)出明顯的不規(guī)則性。從變化趨勢上來看,在85歲之后,各分位點圖形的變化差異較大,醫(yī)療支出較低的老年人群(0.05和0.25分位值)85歲左右之后年齡對醫(yī)療支出的影響效應開始迅速增加,而醫(yī)療支出中等和較高的老年人群增加較少或未增加。圖2右側為個人年收入對醫(yī)療支出的影響,各分位點處個人年收入對醫(yī)療支出的影響效應總體表現(xiàn)為U型,即在低收入與高收入老年人群中的效應較高,而在中等收入老年人群中效應較低,但均為正向效應。
本研究利用CHARLS 2018年數(shù)據(jù),通過建立半?yún)?shù)分位數(shù)回歸模型,對老年人醫(yī)療費用的影響因素進行分析,結果表明年齡、個人年收入、性別、居住地城鄉(xiāng)分布、醫(yī)療保險以及自評健康狀況是影響老年人醫(yī)療費用的重要因素,并且不同的醫(yī)療支出水平對于影響因素的響應情況存在差異。
年齡增長是老年人醫(yī)療支出增加的重要因素,且對不同醫(yī)療支出水平的影響效應差異較大。低醫(yī)療支出的老年人在85歲左右時年齡增長對醫(yī)療費用的影響效應迅速增大。低醫(yī)療支出老年人可能身體健康狀況較好,但隨著年齡增加身體狀況變差導致醫(yī)療支出增加;高醫(yī)療的支出老年人可能身體健康狀況已經(jīng)出現(xiàn)問題,已有較高的支出水平,因此未出現(xiàn)迅速增加的現(xiàn)象。
個人收入對于老年人醫(yī)療支出整體呈現(xiàn)出“U”型的影響,即對低收入與高收入的老年人醫(yī)療支出影響較大,而對中等收入老人影響較小。收入較高的老人可能更愿意選擇優(yōu)質的醫(yī)療服務以期達到更好的治療效果,因此醫(yī)療支出對其收入的響應較高。收入中等的老年人支付水平有限,往往會選擇較為保守的治療方法和平價的藥物等,因此醫(yī)療支出響應較低。收入水平低的老人可能本身健康狀況較差,加上生活水平低,治療不積極等導致病情加重,反而容易增加醫(yī)療支出。
居住地為城市的老年人醫(yī)療支出顯著高于居住地為農(nóng)村的老年人。相比于農(nóng)村,城市的醫(yī)療體系更加完善、醫(yī)療資源更加豐富、醫(yī)療服務獲取的便利性更高。此外,醫(yī)療支出的城鄉(xiāng)差異在低醫(yī)療支出的老年人中更加明顯,這可能與城鄉(xiāng)老年人健康觀念的不同有關。城市老年人在未患病時更愿意參加健康體檢、購買健康保健服務等,患病早期也愿意及時就醫(yī);而農(nóng)村老年人由于健康素養(yǎng)較低[15],在未得病時可能不愿意進行體檢,患病初期也多選擇保守觀察,因此醫(yī)療支出較少。性別因素系數(shù)在高消費水平上不顯著,表明性別對于老年人醫(yī)療支出的影響可能較小,這與馬寧寧[16]、劉珊珊[17]等的研究結果一致。自評健康狀況也是影響老年人醫(yī)療支出的重要因素,各分位數(shù)上自評健康狀況因素系數(shù)變化不大,說明健康狀況對不同醫(yī)療支出水平的影響效應相近。城鎮(zhèn)職工醫(yī)療保險與其他醫(yī)療保險能夠顯著增加老年人醫(yī)療支出,而城鄉(xiāng)居民醫(yī)療保險顯著性較差,這表明不同醫(yī)療保險存在著不平衡,仍需深化醫(yī)療改革,進一步加強醫(yī)療公平性。
此外,本研究也存在著局限性。醫(yī)療支出為0以及部分信息缺失的個體被舍棄,這可能會對研究結果產(chǎn)生一定的影響。然而本研究仍表明半?yún)?shù)分位數(shù)回歸模型在對老年人醫(yī)療支出影響因素的研究上有著較好的效果。相比于先前研究常使用的Tobit回歸、多元線性回歸等模型,本研究使用的半?yún)?shù)分位數(shù)回歸模型,不僅同時考慮了參數(shù)與非參數(shù)因素,還克服了醫(yī)療支出數(shù)據(jù)非正態(tài)分布的問題,揭示了影響因素在不同的醫(yī)療支出水平下的不同效應情況,這為今后處理類似數(shù)據(jù)提供了很好的思路,也為制定更有針對性的醫(yī)療政策提供了一定的參考。