謝世堂 周海迎 何 靜 戴力輝△
數(shù)據(jù)分析與信息提煉在現(xiàn)代醫(yī)院的運(yùn)營管理中具有重要作用。醫(yī)院管理者往往希望通過對醫(yī)院以往各項運(yùn)營指標(biāo)數(shù)據(jù)的統(tǒng)計分析與提煉,獲得各指標(biāo)間相互作用、相互影響的數(shù)量關(guān)系,作為其制定各項管理目標(biāo)的依據(jù)。醫(yī)院綜合目標(biāo)管理涉及醫(yī)療、教育、科研、醫(yī)保等眾多子目標(biāo),而與各子目標(biāo)相關(guān)的醫(yī)院運(yùn)營指標(biāo)則信息更為豐富,如何通過恰當(dāng)?shù)臄?shù)理統(tǒng)計方法,將與各管理目標(biāo)相關(guān)的眾多指標(biāo)的數(shù)量關(guān)系提煉出來,是統(tǒng)計方法在醫(yī)院管理中應(yīng)用的一項重要課題。目前,主成分回歸在醫(yī)院管理中應(yīng)用的研究報道非常少見,本文通過實例探討如何利用該方法來實現(xiàn)指標(biāo)間數(shù)量關(guān)系的建立及其模型在醫(yī)院管理上的應(yīng)用。
文章以某三甲醫(yī)院的25個月的出院人次、門診診次、平均住院日、床位使用率、床位數(shù)、醫(yī)護(hù)人數(shù)數(shù)據(jù)為例,闡述主成分回歸在醫(yī)院目標(biāo)管理中的應(yīng)用思路。
在醫(yī)療指標(biāo)中,出院人次是醫(yī)院主要的醫(yī)療產(chǎn)出指標(biāo)之一,其大小受到醫(yī)院規(guī)模指標(biāo)、服務(wù)人群指標(biāo)、資源效率指標(biāo)的影響。本文以出院人次Y為應(yīng)變量,實際開放床位數(shù)X1、醫(yī)護(hù)人數(shù)X2、門診診次X3、平均住院日X4、床位使用率X5為自變量,通過線性回歸分析來解釋各指標(biāo)間的相關(guān)性及關(guān)聯(lián)程度。
對變量Y、X1~X5通過SPSS 13.0做相關(guān)分析,結(jié)果如表1所示。
Y與X1-X5都相關(guān)且有統(tǒng)計學(xué)意義。但X1~X4之間也存在相關(guān)性且有統(tǒng)計學(xué)意義,X3與X5存在相關(guān)性且有統(tǒng)計學(xué)意義。提示自變量間可能存在多元共線性。
當(dāng)經(jīng)典的多元線性回歸無法提煉具有共線性的醫(yī)療指標(biāo)的管理信息時,引入相對復(fù)雜的主成分回歸便是一種選擇。通過引進(jìn)主成分分析來將相互關(guān)聯(lián)的多個變量化成幾個互不相關(guān)的綜合變量,再以主成分為自變量與應(yīng)變量建立回歸方程,形成主成分回歸分析〔1〕。這樣,在保留了原自變量信息的同時,既減少了回歸分析中自變量的個數(shù),而且作為自變量的各主成分互不相關(guān),保證了回歸方程的穩(wěn)定性。
表1 變量間的相關(guān)系數(shù)
自變量X1~X5之間相關(guān),采用主成分分析,提取包含主要信息的主成分。
如表2所示,主成分1、2已包含了自變量X1~X5的主要原始數(shù)據(jù)信息,其貢獻(xiàn)率分別為59.644%、27.553%,主成分1、2的累積貢獻(xiàn)率為87.197%。
表2 主成分方差貢獻(xiàn)率和累計貢獻(xiàn)率
分析得到第一主成分、第二主成分與標(biāo)準(zhǔn)化后自變量之間的函數(shù)關(guān)系。第一主成分Z1=0.805X1+0.860X2+0.812X3-0.904X4+0.345X5;第二主成分Z2=-0.467X1-0.156X2+0.503X3+0.235X4+0.910X5(主成分表達(dá)式中X1-X5是原始指標(biāo)通過公
為了方便計算主成分,將主成分表達(dá)式的標(biāo)準(zhǔn)化自變量替換成原始自變量。分別求出X1~X5的均數(shù)和標(biāo)準(zhǔn)差,如表3所示。
將原始自變量代入主成分表達(dá)式后,第一主成分Z1=0.04828165X1+0.00982509X2+0.00005023X3-0.84644194X4+0.03716471X5-57.00091054;第二主成分 Z2=-0.0280093X1-0.00178223X2+0.00003112X3+0.22003745X4+0.09802865X5+13.45279431。經(jīng)過代入原始自變量的主成分表達(dá)式,在引入自變量數(shù)據(jù)后得到第一主成分Z1、第二主成分Z2的數(shù)據(jù)。
經(jīng)過以上主成分分析后,在基本保留原數(shù)據(jù)信息的前提下,將5個具有一定相關(guān)性的自變量(X1~X5)降為2個相互獨(dú)立主成分(Z1、Z2),這就為多元線性回歸分析奠定了基礎(chǔ)。
(2)主成分回歸的建立
在主成分分析后,就應(yīng)變量出院人次Y、主成分Z1、Z2進(jìn)行多元線性回歸擬合。出院人次不服的正態(tài)分布,將Y進(jìn)行對數(shù)變換后的lgY為應(yīng)變量,模型擬合效果更好,見表4。
表4 模型評價參數(shù)
模型的殘差的標(biāo)準(zhǔn)差為0.022,提示模型預(yù)測的穩(wěn)定性較好,該值越小則反映模型預(yù)測應(yīng)變量的效果越好〔2〕。
對于該模型,F(xiàn)=113.155,P<0.001。說明至少一個自變量的回歸系數(shù)不為0,所建立的回歸模型有統(tǒng)計學(xué)意義。
對偏回歸系數(shù)的檢驗如表5所示。
表5 模型偏回歸系數(shù)的t檢驗結(jié)果
模型的常數(shù)項、Z1、Z2的偏回歸系數(shù)分別是3.343、0.020、0.024;對 Z1、Z2的偏回歸系數(shù)是否等于0的t檢驗結(jié)果,t值分別是13.396、7.273,P 值分別為P<0.001、P<0.001。據(jù)此,得到應(yīng)變量lg Y的回歸方程:
對模型進(jìn)行殘差分析,根據(jù)殘差圖觀測,挑選出2個異常值,結(jié)合專業(yè)判斷予以剔除。如圖1所示,該模型基本符合多元線性回歸的LINE條件。
圖1 殘差圖
通過主成分回歸擬合,得到有統(tǒng)計學(xué)意義的模型。為了實際應(yīng)用的可操作性,需要把主成分表達(dá)式代入主成分回歸方程,以便在對應(yīng)變量預(yù)測時,代入自變量X1~X5的原始數(shù)據(jù)就可以,其模型如下:
將某期的X1~X5的數(shù)據(jù)代入模型后,得到lg Y的測算值Y,并進(jìn)行10為底的指數(shù)變化后,便可得到當(dāng)期的出院人次的預(yù)測值。同時,可以預(yù)測各自變量在一定的區(qū)間內(nèi)的變化對應(yīng)變量的影響程度。
通過主成分回歸模型的應(yīng)用,對醫(yī)院某些指標(biāo)的預(yù)測將更趨于可靠;有助于科室綜合目標(biāo)的管理趨向精細(xì)化、系統(tǒng)化;同時,有助于職能科室指導(dǎo)臨床科室如何加強(qiáng)指標(biāo)管理。
由于模型基于樣本數(shù)據(jù)的擬合,決定了模型的擬合度局限于樣本的特性,因此,當(dāng)所研究的醫(yī)院已經(jīng)在發(fā)展方式、管理流程等影響醫(yī)療產(chǎn)出效率的關(guān)鍵因素發(fā)生變化時,模型應(yīng)該根據(jù)歷史數(shù)據(jù)適時再次擬合。
1.孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計學(xué).北京:人民衛(wèi)生出版社,2002:328-329.
2.張文彤,董偉.SPSS統(tǒng)計分析高級教程.北京:高等教育出版社,2004:97-98.