摘要:本文收集了廣州地區(qū)2003年至2022年的中醫(yī)藥衛(wèi)生技術(shù)人員和醫(yī)院床位數(shù)等數(shù)據(jù),采用R語(yǔ)言構(gòu)建自回歸整合移動(dòng)平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)進(jìn)行中醫(yī)藥衛(wèi)生資源配置預(yù)測(cè)研究,分析了廣州市中醫(yī)藥衛(wèi)生資源的情況以及發(fā)展趨勢(shì),為廣州市相關(guān)中醫(yī)藥衛(wèi)生政策制定提供參考依據(jù)。
關(guān)鍵詞:R語(yǔ)言;衛(wèi)生資源配置;自回歸整合移動(dòng)平均模型;衛(wèi)生預(yù)測(cè)
ResearchontheTeachingApplication
ofDataVisualizationintheCourseofHealthInformationManagement
GuoDechao1ZhangHao2*XuJianmin2
1.SchoolofPublicHealthandManagement,GuangzhouUniversityofChineseMedicine
GuangdongGuangzhou510006;
2.GuangzhouCenterforDiseaseControlandPreventionGuangdongGuangzhou510000
Abstract:ThisarticlecollecteddataontraditionalChinesemedicinehealthcareprofessionalsandhospitalbedsinGuangzhoufrom2003to2022.UsingRlanguage,anautoregressiveintegratedmovingaveragemodel(ARIMA)wasconstructedtopredicttheallocationofhealthcareresources.ThesituationanddevelopmenttrendsoftraditionalChinesemedicinehealthcareresourcesinGuangzhouwereanalyzed,providingreferencefortheformulationofrelevanttraditionalChinesemedicinehealthcarepoliciesinGuangzhou.
Keywords:Rprogramminglanguage;healthserviceresource;autoregressiveintegratedmovingaveragemodel;healthforecast
一、概述
衛(wèi)生資源是維護(hù)公共健康的物質(zhì)基礎(chǔ),是特定社會(huì)和經(jīng)濟(jì)條件下整個(gè)社會(huì)提供給健康部門各項(xiàng)支持的總和,包括人力、財(cái)力和物力等[1],在當(dāng)代中國(guó),隨著老齡化日益嚴(yán)重,衛(wèi)生資源的合理配置已經(jīng)是國(guó)家衛(wèi)生戰(zhàn)略的重要目標(biāo)。中共中央、國(guó)務(wù)院于2016年發(fā)布的《“健康中國(guó)2030”綱要》指出,健康優(yōu)先、改革創(chuàng)新、科學(xué)發(fā)展和公平公正是貫徹落實(shí)健康中國(guó)戰(zhàn)略部署的基本原則[2],因此,利用大數(shù)據(jù)技術(shù)對(duì)衛(wèi)生資源進(jìn)行預(yù)測(cè)和優(yōu)化,是實(shí)現(xiàn)有限的衛(wèi)生資源科學(xué)配置的有力手段。時(shí)間序列模型是統(tǒng)計(jì)學(xué)的分支之一,是一種基于隨機(jī)理論和數(shù)理統(tǒng)計(jì)學(xué)的方法,它可以基于歷史數(shù)據(jù)預(yù)測(cè)未來(lái)的發(fā)展變化的規(guī)律和趨勢(shì),揭示研究對(duì)象在一定時(shí)期內(nèi)的變化趨勢(shì),從而可以有效預(yù)測(cè)未來(lái)的變化,為政府部門科學(xué)決策提供依據(jù)。ARIMA模型被研究人員用于預(yù)測(cè)股票的價(jià)格或者某地區(qū)GDP的發(fā)展趨勢(shì),目前,醫(yī)療研究人員將ARIMA應(yīng)用于感染性疾病和傳染病學(xué)[34],也有研究人員將其應(yīng)用于預(yù)防醫(yī)學(xué)和公共衛(wèi)生研究[57]。本文擬利用時(shí)間序列模型來(lái)分析廣州市2003年至2022年的中醫(yī)藥衛(wèi)生資源配置數(shù)據(jù),預(yù)測(cè)相關(guān)衛(wèi)生指標(biāo),為相關(guān)部門決策提供參考。
二、材料與方法
(一)數(shù)據(jù)資料
本文中的廣州市中醫(yī)醫(yī)院床位數(shù)、中醫(yī)藥衛(wèi)生技術(shù)人員等數(shù)據(jù)來(lái)源于廣東省衛(wèi)生健康委員會(huì)發(fā)布的2022年廣東省衛(wèi)生健康統(tǒng)計(jì)年鑒[9],其中床位數(shù)是2003年至2022年廣州市中醫(yī)醫(yī)療機(jī)構(gòu)床位數(shù),衛(wèi)生技術(shù)人員是2003年至2022年廣州市中醫(yī)藥衛(wèi)生技術(shù)人員數(shù),具體數(shù)據(jù)如圖1、圖2所示。
(二)方法
本研究采用基于R語(yǔ)言的ARIMA時(shí)間序列分析法,ARIMA時(shí)間序列分析法也稱為BoxJenkins模型,用來(lái)處理單變量同方差的非平穩(wěn)時(shí)間序列,通過(guò)差分法或適當(dāng)?shù)淖儞Q轉(zhuǎn)化為平穩(wěn)序列,再使用ARMA模型。
ARIMA(p,d,q)模型的形式如下:
Φ(B)Δdxt=Θ(B)εt或Δdxt=Θ(B)εtΦ(B)
其中,Δd=(I-B)d為d階差分。
三、程序代碼及其解釋
處理床位數(shù)數(shù)據(jù)的程序及其代碼解釋如下:
##統(tǒng)一設(shè)置ggplot2的繪圖風(fēng)格
library(ggplot2)
theme_set(theme_bw())
####:自回歸移動(dòng)平均模型####
##使用ARMA模型來(lái)預(yù)測(cè)未來(lái)的數(shù)據(jù)
library(ggfortify)#載入內(nèi)置函數(shù)包
library(gridExtra)#載入內(nèi)置函數(shù)包
library(forecast)#載入內(nèi)置函數(shù)包
##讀取數(shù)據(jù)
data<read.csv("data/data.csv")
data<ts(data$x)
plot.ts(data)
autoplot(data)+ggtitle("序列變化趨勢(shì)")
##白噪聲檢驗(yàn)
Box.test(data,type="LjungBox")
##pvalue=3.045e05,說(shuō)明不是白噪聲
##平穩(wěn)性檢驗(yàn),單位根檢驗(yàn)
adf.test(data)
##pvalue=0.01,說(shuō)明數(shù)據(jù)是平穩(wěn)的
##分析序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)確定參數(shù)p和q
p1<autoplot(acf(data,lag.max=30,plot=F))+
ggtitle("序列自相關(guān)圖")
p2<autoplot(pacf(data,lag.max=30,plot=F))+
ggtitle("序列偏自相關(guān)圖")
gridExtra::grid.arrange(p1,p2,nrow=2)
auto.arima(data)
##對(duì)數(shù)據(jù)建立ARMA(2,1)模型,并預(yù)測(cè)后面的數(shù)據(jù)
ARMAmod<arima(data,order=c(2,0,1))
summary(ARMAmod)
##對(duì)擬合殘差進(jìn)行白噪聲檢驗(yàn)
Box.test(ARMAmod$residuals,type="LjungBox")
##pvalue=0.7853,說(shuō)明是白噪聲
##可視化模型未來(lái)的預(yù)測(cè)值
plot(forecast(ARMAmod,h=20))
四、結(jié)果和討論
偏自相關(guān)系數(shù)PACF在1階后截尾,即滯后期偏自相關(guān)系數(shù)的大小幾乎為0,可以認(rèn)為p的取值約為1(如圖3所示);自相關(guān)系數(shù)ACF在3階后拖尾,即滯后期自相關(guān)系數(shù)的大小幾乎為0,可以認(rèn)為q的取值約為3(如圖4所示)。
通過(guò)觀察自相關(guān)系數(shù)和偏自相關(guān)系數(shù)雖然可以確定p和q,但是這不是最好的方法,R提供了自動(dòng)尋找序列合適的參數(shù)的函數(shù)auto.arima(),運(yùn)行該函數(shù)后發(fā)現(xiàn)較好的ARMA模型為ARMA(2,1),對(duì)數(shù)據(jù)建立ARMA(2,1)模型,并預(yù)測(cè)后面的數(shù)據(jù),程序運(yùn)行后AIC=464.66,ar1、ar2、ma1三個(gè)系數(shù)分別為:1.148、-0.1514、0.0605,且在訓(xùn)練集上模型的擬合絕對(duì)值誤差MAE=0.7656117,數(shù)值非常小,說(shuō)明模型的擬合效果很好。
用函數(shù)Box.test()對(duì)ARMA(2,1)擬合殘差白噪聲進(jìn)行檢驗(yàn),從程序輸出的結(jié)果可以發(fā)現(xiàn),pvalue=0.9822>0.05,說(shuō)明殘差序列已經(jīng)是白噪聲,即ARMA(2,1)已經(jīng)成分地提取數(shù)據(jù)中的有用信息。
最后用forecast()函數(shù)來(lái)預(yù)測(cè)未來(lái)20年的數(shù)據(jù),并將其可視化,得到的結(jié)果如圖5、圖6所示。圖中包含了原始序列和預(yù)測(cè)的序列曲線,并且給出預(yù)測(cè)值的置信度為80%(舌側(cè)陰影部分)和95%(淺色陰影部分)的置信區(qū)間。
本文使用R語(yǔ)言來(lái)實(shí)現(xiàn)時(shí)間序列模型,能夠較好地?cái)M合數(shù)據(jù),預(yù)測(cè)廣州市衛(wèi)生資源配置的相關(guān)指標(biāo),具有一定的理論和實(shí)踐價(jià)值,本文為廣州市的衛(wèi)生資源優(yōu)化配置提供了參考依據(jù)。
參考文獻(xiàn):
[1]韓春蕾,韓坤,王培成.我國(guó)衛(wèi)生資源配置現(xiàn)狀及均等化分析研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2015,42(14):25672570.
[2]中共中央國(guó)務(wù)院印發(fā)《“健康中國(guó)2030”規(guī)劃綱要》[EB/OL].http://www.mohrss.gov.cn/,2016.
[3]BaiL,LuK,DongY,etal.PredictingmonthlyhospitaloutpatientvisitsbasedonmeteorologicalenvironmentalfactorsusingtheARIMAmodel.SciRep.2023Feb15,13(1):2691.
[4]LiuXD,WangW,YangY,etal.NestingtheSIRVmodelwithNAR,LSTMandstatisticalmethodstofitandpredictCOVID19epidemictrendinAfrica.BMCPublicHealth.2023Jan19,23(1):138.
[5]XuM,YueW,SongX,etal.EpidemiologicalCharacteristicsofParainfluenzaVirusType3andtheEffectsofMeteorologicalFactorsinHospitalizedChildrenWithLowerRespiratoryTractInfection.FrontPediatr.2022Apr27,10:872199.
[6]ZhaoW,SunY,LiY,etal.PredictionofCOVID19DataUsingHybridModelingApproaches.FrontPublicHealth.2022Jul22,10:923978.
[7]XinY,WangB,ZhangH,etal.Machinelearningassessmentofwhitebloodcellcountsinworkersexposedtobenzene:ahistoricalcohortstudy.EnvironSciPollutResInt.2023Mar,30(13):3820238211.
基金信息:廣州市哲學(xué)社科規(guī)劃2023年度課題,廣州市中醫(yī)藥衛(wèi)生資源空間配置及預(yù)警研究(編號(hào):2023GZGJ64)
作者簡(jiǎn)介:郭德超(1978—),男,漢族,河南南陽(yáng)人,碩士,講師,主要從事衛(wèi)生信息管理工作;徐建敏(1971—),女,漢族,內(nèi)蒙古包頭人,碩士,主任技師,主要從事病媒生物與寄生蟲預(yù)防控制。
*通訊作者:張豪(1979—),女,漢族,河南南陽(yáng)人,碩士,主任醫(yī)師,主要從事疾病預(yù)防控制工作。