中山大學(xué)孫逸仙紀(jì)念醫(yī)院(510120) 薛允蓮
廣州某院門(mén)診量的ARIMA模型預(yù)測(cè)*
中山大學(xué)孫逸仙紀(jì)念醫(yī)院(510120) 薛允蓮
目的對(duì)門(mén)診量序列進(jìn)行預(yù)測(cè),分析預(yù)測(cè)效果。方法采用時(shí)間序列ARIMA模型,對(duì)原始門(mén)診量序列和調(diào)整1~2月門(mén)診量后的序列進(jìn)行預(yù)測(cè),并在調(diào)整預(yù)測(cè)值基礎(chǔ)上計(jì)算2月份的校正預(yù)測(cè)值。結(jié)果調(diào)整后序列的相對(duì)預(yù)測(cè)誤差絕對(duì)值均值為3.84,明顯小于原始序列的相對(duì)預(yù)測(cè)誤差絕對(duì)值均值7.10。結(jié)論調(diào)整1~2月門(mén)診量序列的預(yù)測(cè)效果明顯優(yōu)于原始門(mén)診量序列的預(yù)測(cè)效果。
門(mén)診量 ARIMA模型 移動(dòng)假日效應(yīng) 預(yù)測(cè)
隨著信息化的進(jìn)展,統(tǒng)計(jì)預(yù)測(cè)越來(lái)越成為現(xiàn)代醫(yī)院管理工作不可或缺的工具[1]。門(mén)診量是衡量醫(yī)院門(mén)診業(yè)務(wù)量發(fā)展的重要指標(biāo)之一。通過(guò)對(duì)既往門(mén)診量數(shù)據(jù)動(dòng)態(tài)變化的分析,能夠科學(xué)、準(zhǔn)確的進(jìn)行預(yù)測(cè),合理安排人財(cái)物等資源,提高經(jīng)濟(jì)和社會(huì)效益。由于每年的春節(jié)在1月或2月出現(xiàn),移動(dòng)春節(jié)效應(yīng)會(huì)影響門(mén)診量序列的預(yù)測(cè)效果。本研究用ARIMA模型比較原始門(mén)診量序列的預(yù)測(cè)效果和調(diào)整1-2月門(mén)診量,并校正2月門(mén)診量后預(yù)測(cè)效果的差異。
1.研究對(duì)象
本次研究利用2005年1月至2012年12月廣州市某三甲醫(yī)院每月門(mén)診量數(shù)據(jù)進(jìn)行建模,利用2013年的每月門(mén)診量數(shù)據(jù)進(jìn)行模型擬合效果的評(píng)價(jià)。
2.方法
(1)對(duì)原始門(mén)診量序列的ARIMA預(yù)測(cè)
本文稱(chēng)原始門(mén)診量序列的預(yù)測(cè)值為原始預(yù)測(cè)值。ARIMA預(yù)測(cè)的步驟主要是模型識(shí)別、模型選擇和建模[2]。
(2)對(duì)調(diào)整門(mén)診量序列的ARIMA預(yù)測(cè)
用調(diào)整1~2月份的門(mén)診量序列預(yù)測(cè)后,校正2月份的門(mén)診量預(yù)測(cè)值,得出最終的校正預(yù)測(cè)值。將2月份的校正預(yù)測(cè)值替代2月份的調(diào)整預(yù)測(cè)值,與其他月份的調(diào)整預(yù)測(cè)值一起考察調(diào)整后序列的預(yù)測(cè)效果。
①對(duì)調(diào)整1~2月門(mén)診量序列后的預(yù)測(cè)
為了降低移動(dòng)春節(jié)效應(yīng)的影響,本研究對(duì)1~2月門(mén)診量序列進(jìn)行調(diào)整:1月份調(diào)整門(mén)診量=mean(2~12月門(mén)診量),2月份調(diào)整門(mén)診量=mean(1月、3月~12月門(mén)診量)。對(duì)調(diào)整后的門(mén)診量序列進(jìn)行預(yù)測(cè),將所得預(yù)測(cè)值稱(chēng)為調(diào)整預(yù)測(cè)值。
②移動(dòng)假日效應(yīng)(春節(jié))影響月份的預(yù)測(cè)值校正
在調(diào)整預(yù)測(cè)值的基礎(chǔ)上,對(duì)春節(jié)影響月份的門(mén)診量預(yù)測(cè)值進(jìn)行校正:根據(jù)工作經(jīng)驗(yàn),春節(jié)對(duì)門(mén)診量影響的時(shí)間段主要是春節(jié)及節(jié)后至農(nóng)歷正月十五。由于2013年春節(jié)日期為2月10日,故春節(jié)移動(dòng)假日效應(yīng)對(duì)門(mén)診量的影響主要在2月份,本次研究中對(duì)門(mén)診量的校正也是針對(duì)2月份的數(shù)據(jù)。
校正主要通過(guò)線(xiàn)性回歸完成,為兩步:(1)因變量:2月份門(mén)診量比例=2月份原始門(mén)診量/(1月+2月)原始門(mén)診量和;自變量:落入2月份的天數(shù),以1.31日為0點(diǎn),向前記為負(fù)數(shù),向后記為正數(shù)。通過(guò)線(xiàn)性回歸得出2013年的2月份門(mén)診量比例。(2)因變量:差值和=(1月+2月)原始門(mén)診量-(1月+2月)調(diào)整門(mén)診量;自變量:年份。通過(guò)線(xiàn)性回歸得出2013年差值和。
根據(jù)2月份門(mén)診量比例和2013年差值和,得出2月份門(mén)診量校正值。2月份校正預(yù)測(cè)值=2月份調(diào)整預(yù)測(cè)值+2月份門(mén)診量校正值。
(3)預(yù)測(cè)效果評(píng)價(jià)指標(biāo)
用相對(duì)預(yù)測(cè)誤差絕對(duì)值進(jìn)行原始預(yù)測(cè)和調(diào)整預(yù)測(cè)的預(yù)測(cè)效果比較。相對(duì)預(yù)測(cè)誤差絕對(duì)值abs=abs((實(shí)際值-預(yù)測(cè)值)/實(shí)際值)×100%。
1.原始門(mén)診量序列的預(yù)測(cè)
2005年1月至2012年12月的門(mén)診量序列圖見(jiàn)圖1??梢?jiàn),序列總體呈上升趨勢(shì),每年春節(jié)后有明顯的下降,初步判斷存在年度周期。對(duì)序列進(jìn)行年度差分,對(duì)差分后序列進(jìn)行ARIMA建模。
圖1 2005年1月至2012年12月的門(mén)診量序列的時(shí)序圖
根據(jù)ARIMA建模方法,選擇疏系數(shù)模型:自回歸部分為1+0.36074 B(1);移動(dòng)平均部分為1-0.85004 B(12)。預(yù)測(cè)效果見(jiàn)表1。
2.調(diào)整門(mén)診量序列的最終預(yù)測(cè)
對(duì)1~2月門(mén)診量調(diào)整后的序列進(jìn)行預(yù)測(cè)。根據(jù)ARIMA建模方法,選擇疏系數(shù)模型:自回歸部分為1+0.22718 B(4),移動(dòng)平均部分為1-0.50782 B(12)。調(diào)整序列的預(yù)測(cè)效果見(jiàn)表1。
以2月份觀測(cè)值比例(Y1)為因變量,以落入2月份的天數(shù)(X1)為自變量建立線(xiàn)性回歸方程,Y1=55.602+2.322X1;R2=0.723,P=0.007<0.05。根據(jù)2013年X1=10,可知2013年2月份觀測(cè)值比例為78.822。見(jiàn)表1。
以差值和(Y2)為因變量,以年份(X2)為自變量建立線(xiàn)性回歸方程(因2007年觀測(cè)值為異常值,故剔除),Y2=3332482.152-1688.862X2;R2=0.663,P=0.026<0.05。根據(jù)2013年X2=2013,可知2013年差值和為-67197.05。根據(jù)Y2和Y1可知,2013年2月份的校正預(yù)測(cè)值=2月份的調(diào)整預(yù)測(cè)值+Y2×Y1× 0.01=106040.0。見(jiàn)表2。
表1 原始序列和調(diào)整序列的ARIMA模型預(yù)測(cè)結(jié)果
表2 回歸分析用數(shù)據(jù)
ARIMA模型又稱(chēng)求和自回歸移動(dòng)平均模型,這一模型是建立在歷史數(shù)據(jù)基礎(chǔ)上的,因此對(duì)歷史數(shù)據(jù)的搜集時(shí)間有一定要求(一般要求多于50個(gè)點(diǎn)),通常,歷史數(shù)據(jù)越多,模型的準(zhǔn)確性越高。
在用ARIMA模型進(jìn)行預(yù)測(cè)時(shí),需要注意移動(dòng)假日效應(yīng)的影響。移動(dòng)假日效應(yīng)是指假日在各年出現(xiàn)的公歷日期不同,具體表現(xiàn)為以下兩個(gè)特征[3]:①假日前后序列測(cè)量的活動(dòng)規(guī)律有上升或下降趨勢(shì),②假日對(duì)某相鄰兩個(gè)月(公歷)的影響程度依賴(lài)于每年出現(xiàn)的不同日期。節(jié)假日在公歷日期上的“移動(dòng)”最直接表現(xiàn)為各年某些月份(如春節(jié)影響的1、2月份)觀測(cè)指標(biāo)的不可比,甚至影響季節(jié)調(diào)整的效果[4]。Edward等[5]指出調(diào)整移動(dòng)假日效應(yīng)能提高序列的預(yù)測(cè)效果。
本文分別對(duì)原始門(mén)診量序列和調(diào)整1~2月門(mén)診量后的序列進(jìn)行ARIMA建模和預(yù)測(cè),并對(duì)2月份的調(diào)整預(yù)測(cè)值進(jìn)行移動(dòng)假日效應(yīng)的校正,用2月份的校正預(yù)測(cè)值替代2月份的調(diào)整預(yù)測(cè)值。從預(yù)測(cè)效果看,調(diào)整預(yù)測(cè)的預(yù)測(cè)誤差絕對(duì)值均值明顯小于原始序列的預(yù)測(cè)誤差絕對(duì)值均值??梢?jiàn),移動(dòng)春節(jié)效應(yīng)降低了序列的預(yù)測(cè)效果,這可能與移動(dòng)春節(jié)效應(yīng)對(duì)序列的時(shí)域和頻域均產(chǎn)生影響有關(guān)[6-7]??梢?jiàn),在序列進(jìn)行預(yù)測(cè)研究之前,有必要對(duì)移動(dòng)假日效應(yīng)進(jìn)行調(diào)整。
致謝:非常感謝中山大學(xué)公共衛(wèi)生學(xué)院張晉昕副教授對(duì)本論文的指導(dǎo)和幫助。
1.周忠彬,呂紅梅,鄒郢.ARIMA干預(yù)模型在醫(yī)院門(mén)診量預(yù)測(cè)中的應(yīng)用.中國(guó)醫(yī)院統(tǒng)計(jì),2008,15(2):110-112.
2.肖枝洪,郭明月.時(shí)間序列分析與SAS應(yīng)用,2009:13-109,145-163.
3.X-12-ARIMA Reference Manual.Version 0.3.Time Series Staff Statistical Research Division Room.U.S.Census Bureau,Washington,2007.http://www.census.gov/srd/www/x12a/
4.Alper CE,Aruoba SB.Moving Holidays and Seasonal Adjustment:The Case of Turkey.Review of Middle East Economics and Finance,2004,2(3):203-209.
5.Edward E.Leamer.Workday,holiday and calendar adjustment with 21st century data:monthly aggregates from daily diesel fuel purchases.2011,C81:http://www.nber.org/papers/w16897
6.薛允蓮,張晉昕.時(shí)間序列分析中的移動(dòng)假日效應(yīng).中國(guó)衛(wèi)生統(tǒng)計(jì),2009,26(5):502-504.
7.薛允蓮,張晉昕,劉貴浩,等.醫(yī)院住院人數(shù)序列的春節(jié)效應(yīng)調(diào)整.中國(guó)衛(wèi)生統(tǒng)計(jì),2010,27(5):473-476.
(責(zé)任編輯:郭海強(qiáng))
*廣東省醫(yī)學(xué)科研基金(No.B2014126)
中國(guó)衛(wèi)生統(tǒng)計(jì)2015年2期