中山大學(xué)孫逸仙紀(jì)念醫(yī)院信息科(510120)
薛允蓮
logistic回歸結(jié)合決策樹技術(shù)在冠心病患者住院費用組合分析中的應(yīng)用*
中山大學(xué)孫逸仙紀(jì)念醫(yī)院信息科(510120)
薛允蓮
目的 探討在logistic回歸分析基礎(chǔ)上進行決策樹分析的風(fēng)險,分析不同病例組合下冠心病患者的住院費用。方法 采用logistic回歸分析動脈粥樣硬化性心臟病的影響因素,將有統(tǒng)計學(xué)意義的變量納入決策樹分析,用CHAID法進行預(yù)剪枝處理,最后進行病例組合分析探討每種組合的費用。結(jié)果 logistic回歸結(jié)合決策樹分析方法的風(fēng)險分值為0.245,小于單純決策樹分析的風(fēng)險分值(0.329)。根據(jù)住院天數(shù)、手術(shù)、性別建立病例組合,每種組合的費用差異明顯。結(jié)論 logistic回歸結(jié)合決策樹分析能降低預(yù)測風(fēng)險分值,提高不同病例組合的費用差異度。
logistic回歸 決策樹 數(shù)據(jù)挖掘 冠心病
動脈粥樣硬化性心臟病(簡稱冠心病,亦稱缺血性心臟病)是指供應(yīng)心臟本身的冠狀動脈管壁形成粥樣斑塊,造成血管腔狹窄引起的心臟病變。冠心病是全球死亡率最高的疾病之一,根據(jù)世界衛(wèi)生組織2011年的報告,中國的冠心病死亡人數(shù)已列世界第二位,且發(fā)病呈年輕化趨勢[1]。由此給患者帶來了巨大的疾病負(fù)擔(dān)和經(jīng)濟負(fù)擔(dān)。了解該疾病住院費用的影響因素以及不同病例組合時的費用特征,能為衛(wèi)生行政部門和醫(yī)院領(lǐng)導(dǎo)提供病種費用情況的直觀認(rèn)識,也為日后醫(yī)療預(yù)付費制度的實施打下基礎(chǔ)。
1.資料來源
數(shù)據(jù)來源于廣東省某三甲醫(yī)院2009年至2013年診斷為動脈粥樣硬化性心臟病的8224例出院患者資料。ICD碼四位為I 25.1。將所有可能影響住院費用的因素均導(dǎo)出,本次共導(dǎo)出的因素有住院次數(shù)、性別、年齡、住院天數(shù)(天數(shù))、婚姻狀況、付款方式、是否手術(shù)、病人來源、是否轉(zhuǎn)科、是否搶救等十個。
2.研究目的與統(tǒng)計方法
本文旨在分析動脈粥樣硬化性心臟病住院費用的影響因素及組合情況。采用SPSS20.0統(tǒng)計軟件進行分析。先用logistic回歸分析(向前LR)篩選影響因素,再在此基礎(chǔ)上進行決策樹分析。
1.住院費用的影響因素分析
將住院費用按照中位數(shù)分為兩組,低費用組和高費用組。采用向前LR方法分析影響動脈硬化性心臟病住院費用的因素。有統(tǒng)計學(xué)意義的變量列于表1中。
2.決策樹和病例組合分析
根據(jù)logistic回歸分析結(jié)果,將有意義的變量均納入進行決策樹分析。決策樹分析采用CHAID預(yù)剪枝的方法進行樹的剪枝處理,選取最小個案數(shù):父節(jié)點800,子節(jié)點600。使用10倍交叉驗證進行決策樹計算效果的驗證。
通過決策樹分析,最終決策樹納入天數(shù)、手術(shù)和性別三個變量。具體的決策樹見圖1。
3.病例組合情況
根據(jù)決策樹確定最終的病例組合方式,本文確定了9種病例組合。將每種病例組合的費用數(shù)據(jù)列表2中。以P75+1.5Q作為費用上線控制標(biāo)準(zhǔn)[2]。本文按該標(biāo)準(zhǔn)共篩選出超額費用患者373例,占4.5%。
DRGs(diagnosis related groups)是以病人特征、住院特征和住院期間接受的治療措施為基礎(chǔ)的一種病例分類方案[3]。DRGs已經(jīng)在很多國家不斷探索成熟,我國仍處于探索階段。本文利用某醫(yī)院動脈硬化性心臟病患者的病案首頁信息進行病例組合分析,先用logistic回歸分析進行影響因素篩選,后將有統(tǒng)計學(xué)意義的變量納入決策樹分析,進而提出病例組合方案。
logistic回歸分析用于因變量為分類變量的影響因素分析,通過P值判斷自變量是否有統(tǒng)計學(xué)意義,通過OR值判斷自變量對因變量的影響大小及作用方向。其主要分析在控制其他變量對因變量影響的前提下,某個自變量對因變量的影響大小。logistic回歸分析主要研究變量的主效應(yīng),但很難體現(xiàn)變量之間的交互效應(yīng),也無法從分類的角度給出直觀具體的解釋[4]。而決策樹(decision tree)是解決實際應(yīng)用中分類問題的數(shù)據(jù)挖掘方法,通過訓(xùn)練樣本集,建立目標(biāo)變量關(guān)于各輸入變量的分類預(yù)測模型,全面實現(xiàn)輸入變量和目標(biāo)變量不同取值下的數(shù)據(jù)分組,進而用于對新數(shù)據(jù)對象的分類和預(yù)測[5]。但是決策樹分析時,對數(shù)的剪枝處理非常關(guān)鍵,剪枝的效果也影響了對未知數(shù)據(jù)分類的準(zhǔn)確性。當(dāng)納入的因素眾多時,決策樹的剪枝處理會更加困難。
本研究在logistic回歸分析基礎(chǔ)上,納入有統(tǒng)計學(xué)意義的變量進行決策樹分析。研究結(jié)果顯示決策樹的預(yù)測風(fēng)險分值為0.245,小于將所有因素納入決策樹分析的預(yù)測風(fēng)險(0.329)??梢?,用logistic回歸分析先選定有統(tǒng)計學(xué)意義的變量后進行決策樹分析,能充分利用兩種方法的優(yōu)點,分類處理的效率更高,預(yù)測風(fēng)險也有所降低。
本文結(jié)合決策樹制定了影響動脈硬化性心臟病患者住院費用的9種組合,并給出了每種組合下的例數(shù),費用情況以及超額費用情況,不同病例組合下患者的治療、醫(yī)療需求和醫(yī)療支出高度相關(guān)。這一方面便于醫(yī)療機構(gòu)對患者進行管理,了解疾病住院患者費用情況,提高工作效率;另一方面根據(jù)醫(yī)療資源消耗強度一致的各病例組合,為醫(yī)院進行合理的費用補償制定統(tǒng)一的支付標(biāo)準(zhǔn)。
本研究中,對動脈硬化性心臟病患者住院費用影響最大的是住院天數(shù),其次是是否手術(shù),性別影響較小。這提示在患者醫(yī)療費用控制過程中,住院天數(shù)的控制非常關(guān)鍵,這也與衛(wèi)計委縮短平均住院日的要求是一致的。此外,在動脈硬化性心臟病患者費用分析中,可以將手術(shù)作為患者分型的基礎(chǔ)指標(biāo)。
[1]劉鴻閩.胺碘酮治療冠心病室性心律失常的臨床療效.齊齊哈爾醫(yī)學(xué)院學(xué)報,2012,33(22):3081.
[2]高子厚,萬崇華,蔡樂,等.按DRGs組合方式制定消化系統(tǒng)疾病患者住院費用的研究.中國衛(wèi)生統(tǒng)計,2006,23(4):323-325.
[3]Dana,Navarro,Maria.Refinement of medicare diagnosis-related groups to incorporate a measure of severity.Health Care Revive,1994,16(2)45.
[4]劉海霞,王玖,田考聰,等.決策樹與回歸技術(shù)在農(nóng)村居民就診服務(wù)研究中的應(yīng)用.中國衛(wèi)生事業(yè)管理,2012,5:376-378.
[5]劉海霞,王玖,林林,等.決策樹與回歸技術(shù)在居民就診影響因素中的應(yīng)用研究.中國衛(wèi)生統(tǒng)計,2012,29(4):500-503.
(責(zé)任編輯:郭海強)
廣東省醫(yī)學(xué)科研基金(B2014126)