楊 霜,劉蕓男,楊小麗,楊冬燕
1)重慶醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院;醫(yī)學(xué)與社會發(fā)展研究中心;健康領(lǐng)域社會風(fēng)險(xiǎn)預(yù)測治理協(xié)同創(chuàng)新中心 重慶 400016 2)重慶市血液中心業(yè)務(wù)部 重慶 400015
近年來,隨著我國血液保障體系的日趨完善,已基本實(shí)現(xiàn)臨床用血全部來自自愿無償獻(xiàn)血的目標(biāo)。然而,由于自愿無償獻(xiàn)血易受天氣、季節(jié)等因素的影響,故難以保障穩(wěn)定的血液供應(yīng),尤其是在高級別醫(yī)療機(jī)構(gòu)集中的省級血液中心覆蓋的區(qū)域,由于周邊區(qū)縣疑難病患的大量涌入,因血液資源不足而推遲手術(shù)和延緩治療的現(xiàn)象時(shí)有發(fā)生[1]。自回歸移動平均(auto-regressive integrated moving average, ARIMA)模型是將一組隨時(shí)間變化的數(shù)據(jù)序列看作一個(gè)隨機(jī)序列,利用該序列建立相應(yīng)的數(shù)學(xué)模型,來描述序列值不同時(shí)間點(diǎn)之間的相關(guān)關(guān)系,并根據(jù)歷史序列值變化規(guī)律對其未來發(fā)展趨勢進(jìn)行預(yù)測[2]。因此,為了更好地實(shí)現(xiàn)對血液需求的科學(xué)預(yù)測和動態(tài)管理,本研究擬采用時(shí)間序列分析中的ARIMA模型對重慶市血液中心紅細(xì)胞臨床用量進(jìn)行分析,探尋紅細(xì)胞臨床用量的預(yù)測方法,以期為科學(xué)地制定無償獻(xiàn)血招募和采供血計(jì)劃提供依據(jù)。
1.1 數(shù)據(jù)來源數(shù)據(jù)源于重慶市血液中心2006年以來連續(xù)13 a的紅細(xì)胞臨床月用量,依據(jù)2006年1月至2018年12月的紅細(xì)胞臨床月用量構(gòu)建預(yù)測模型,以2019年1~6月的數(shù)據(jù)對模型預(yù)測效果進(jìn)行評價(jià)。
1.2 ARIMA模型的構(gòu)建根據(jù)時(shí)間序列是否隨季節(jié)性變化,其結(jié)構(gòu)可分為ARIMA(p,d,q)及ARIMA(p,d,q)×(P,D,Q)s,其中p、q為自回歸階數(shù)和移動平均階數(shù),d、D為非季節(jié)性和季節(jié)性差分次數(shù),P、Q為季節(jié)性自回歸階數(shù)和移動平均階數(shù),s為時(shí)間序列周期或循環(huán)長度[3-4]。
ARIMA模型建構(gòu)過程:①序列平穩(wěn)處理。根據(jù)原始時(shí)序圖或相關(guān)函數(shù)圖判斷序列是否平穩(wěn),對于不平穩(wěn)的序列進(jìn)行差分或季節(jié)性差分處理,以實(shí)現(xiàn)序列的平穩(wěn)。②模型識別及參數(shù)確定。根據(jù)差分后平穩(wěn)序列的自相關(guān)(auto-correlation function,ACF)圖和偏自相關(guān)(partial auto-correlation function,PACF)圖的拖尾或截尾情況來確定p、q階數(shù),并依據(jù)差分次數(shù)確定d值,初步建立備選模型。③模型檢驗(yàn)與優(yōu)化。依據(jù)殘差序列的ACF圖、PACF圖、Ljung-Box Q檢驗(yàn)統(tǒng)計(jì)量,判定殘差是否呈白噪聲。若是,提示模型可用于預(yù)測;否則需重返第2步。最優(yōu)模型的確定依賴于貝葉斯信息準(zhǔn)則值(Bayesian information criterion,BIC)和決定系數(shù)(R2)的大小,即在初步建立的備選模型中BIC值最小、R2最大者為相對最優(yōu)模型[5-6]。④預(yù)測并驗(yàn)證。運(yùn)用最優(yōu)的ARIMA模型進(jìn)行預(yù)測,分析實(shí)際值與預(yù)測值的擬合情況,并根據(jù)二者的平均相對誤差對模型預(yù)測效果進(jìn)行評價(jià)。
1.3 統(tǒng)計(jì)分析應(yīng)用SPSS 26.0對獲取的數(shù)據(jù)資料進(jìn)行統(tǒng)計(jì)分析、處理和模型的構(gòu)建,檢驗(yàn)水準(zhǔn)α=0.05。
2.1 數(shù)據(jù)平穩(wěn)處理繪制2006年1月至2018年12月紅細(xì)胞臨床月用量的原始時(shí)序圖(圖1上),可以看出紅細(xì)胞月用量存在明顯的趨勢性及季節(jié)周期變化,整體上呈波動上升趨勢,在每年的3~4月、11~12月出現(xiàn)用血高峰,低谷則集中在每年的1~2月、6~8月。由于序列呈現(xiàn)周期性及趨勢性的不平穩(wěn)特征,故需對數(shù)據(jù)進(jìn)行差分和季節(jié)性差分處理。經(jīng)過一階差分和一階季節(jié)性差分后觀測值均圍繞0值上下隨機(jī)波動(圖1下),表明處理后的序列為平穩(wěn)序列。
圖1 紅細(xì)胞用量原始時(shí)序圖(上)和經(jīng)差分處理后的時(shí)序圖(下)
2.2 模型識別及參數(shù)確定根據(jù)紅細(xì)胞用量原始時(shí)序圖的季節(jié)變化特征,確定為季節(jié)性ARIMA(p,d,q)(P,D,Q)s模型。因進(jìn)行了一階差分和一階季節(jié)性差分處理,故d=1,D=1;季節(jié)周期為12,故s=12。根據(jù)差分后平穩(wěn)序列的ACF圖和PACF圖(圖2),發(fā)現(xiàn)ACF截尾或拖尾特征不明顯,在1、4、11、12、13階時(shí)顯著不為0,故考慮q取0;而PACF呈三階截尾,考慮p取3;因季節(jié)模型的P、Q值難以判斷,而其超過2階的情況極少,故分別從0~2由低到高逐個(gè)試驗(yàn)[7],初步擬定備選模型為ARIMA(3,1,0)(1,1,0)12、ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(2,1,0)12。
圖2 經(jīng)差分處理后平穩(wěn)序列的ACF圖與PACF圖
2.3 模型檢驗(yàn)與優(yōu)化應(yīng)用Ljung-Box Q方法對備選模型殘差行白噪聲檢驗(yàn),P>0.05,表示殘差為白噪聲,剔除未通過白噪聲檢驗(yàn)及模型參數(shù)無統(tǒng)計(jì)學(xué)意義的模型,從備選模型中選出BIC值最小且R2最大者即為最優(yōu)模型,結(jié)果見表1。由表1可知,ARIMA(3,1,0)(0,1,1)12為最優(yōu)模型,其殘差序列的ACF與PACF基本都落入95%CI內(nèi)(圖3),且殘差Ljung-Box Q=14.749,P=0.396,表明殘差序列不存在相關(guān)關(guān)系,殘差呈白噪聲,可用于預(yù)測紅細(xì)胞臨床月用量。
表1 初篩備選模型的參數(shù)估計(jì)及假設(shè)檢驗(yàn)結(jié)果
圖3 ARIMA(3,1,0)(0,1,1)12模型殘差序列的ACF圖與PACF圖
2.4 模型擬合效果評價(jià)運(yùn)用最終確定的模型ARIMA(3,1,0)(0,1,1)12預(yù)測2019年1~6月的紅細(xì)胞臨床月用量,從繪制的模型預(yù)測圖(圖4)可見,模型預(yù)測結(jié)果與同期紅細(xì)胞臨床實(shí)際月用量基本吻合,提示模型擬合效果較好。根據(jù)預(yù)測結(jié)果(表2),各月份紅細(xì)胞臨床實(shí)際用量基本落在預(yù)測值的95%CI內(nèi),平均相對誤差為6.15%,表明模型預(yù)測精度較高。
圖4 ARIMA(3,1,0)(0,1,1)12模型的紅細(xì)胞臨床月用量預(yù)測圖
表2 2019年1~6月的模型預(yù)測評價(jià)結(jié)果
紅細(xì)胞作為臨床用量最大的血液成分[8],可快速提高人體血氧供應(yīng)能力,緩解組織缺氧狀態(tài),在危急重病患的搶救中起著不可替代的作用。但紅細(xì)胞的有效儲存期限較短,最多不超過35 d,因此,科學(xué)把握和預(yù)測紅細(xì)胞臨床用量,指導(dǎo)血液中心合理制定采供血計(jì)劃至關(guān)重要。然而,目前紅細(xì)胞臨床用量的預(yù)測主要依據(jù)血液中心相關(guān)人員主觀經(jīng)驗(yàn)進(jìn)行粗略估計(jì),極易造成紅細(xì)胞采集、制備、供給及庫存不足與過期報(bào)廢現(xiàn)象的發(fā)生。
本研究結(jié)果表明重慶市血液中心覆蓋區(qū)域紅細(xì)胞臨床月用量具有明顯的季節(jié)周期性特征,每年1~2月和6~8月紅細(xì)胞臨床用量較低,究其原因可能是1~2月和6~8月正值大學(xué)生寒、暑假期,加之天氣寒冷和持續(xù)高溫,街頭流動人口大幅減少,血液采集受到較大影響,血液中心不得不控制紅細(xì)胞的臨床供給。基于紅細(xì)胞臨床用量的季節(jié)周期性特點(diǎn),故選擇季節(jié)性ARIMA(p,d,q)(P,D,Q)s模型來預(yù)測未來紅細(xì)胞的臨床用量。
本研究利用2006年以來連續(xù)13 a的紅細(xì)胞臨床月用量數(shù)據(jù),構(gòu)建紅細(xì)胞臨床月用量ARIMA乘積季節(jié)模型,并對模型進(jìn)行識別、檢驗(yàn)與優(yōu)化,挑選出最優(yōu)模型ARIMA(3,1,0)(0,1,1)12,運(yùn)用最優(yōu)模型預(yù)測2019年1~6月的紅細(xì)胞臨床月用量,并與實(shí)際用量比較,結(jié)果顯示,各月份實(shí)際用量基本落入預(yù)測結(jié)果95%CI內(nèi),且預(yù)測結(jié)果與實(shí)際用量基本吻合,平均相對誤差為6.15%,提示該模型擬合效果較好,預(yù)測精度較高。鑒于ARIMA模型應(yīng)用方便、可操作性強(qiáng)、短期預(yù)測效果好的特點(diǎn)[9-11],建議血液資源供需矛盾較為突出的省級血液中心運(yùn)用和推廣,以避免憑個(gè)人經(jīng)驗(yàn)估算臨床用血量所產(chǎn)生的主觀隨意性和預(yù)測精度低等問題的發(fā)生。
ARIMA模型是依賴歷史數(shù)據(jù)資料建立的預(yù)測數(shù)學(xué)模型,未考慮外部因素的影響,如突發(fā)公共衛(wèi)生事件和國家重大衛(wèi)生政策的調(diào)整和改變等。當(dāng)外部因素發(fā)生較大變化時(shí),模型的預(yù)測結(jié)果會隨之改變[12]。因此,ARIMA模型適用于短期預(yù)測[13-14],若預(yù)測時(shí)間過長,則可能影響預(yù)測精度[15]。為保障模型有更好的預(yù)測效果,應(yīng)對數(shù)據(jù)進(jìn)行每年更新,并及時(shí)對預(yù)測模型進(jìn)行修正或重新擬合。