李 紅 潘東峰 郭忠琴 王 嵐 梁沛楓△
隨著現(xiàn)代醫(yī)學(xué)的快速發(fā)展,侵入性診療技術(shù)的開展以及放、化療等使醫(yī)院感染發(fā)生的影響因素復(fù)雜化,醫(yī)院感染不斷出現(xiàn)新的特點(diǎn),產(chǎn)生新的危害,其已成為醫(yī)學(xué)界亟待解決的重大問題。醫(yī)院感染的監(jiān)測(cè)能及時(shí)發(fā)現(xiàn)醫(yī)院感染病例及其相關(guān)因素,可有效降低其發(fā)生率。目前對(duì)醫(yī)院感染的監(jiān)測(cè)雖已從全面綜合性監(jiān)測(cè)轉(zhuǎn)向針對(duì)性強(qiáng)的目標(biāo)性監(jiān)測(cè)或靶位監(jiān)測(cè),但感染控制的監(jiān)測(cè)模式仍處于“形式化”感控階段〔1〕,實(shí)現(xiàn)對(duì)醫(yī)院感染危險(xiǎn)因素造成的危害進(jìn)行事前監(jiān)測(cè),從而建立醫(yī)院感染預(yù)警模式則是醫(yī)院感染管理工作今后發(fā)展的重要方向。利用統(tǒng)計(jì)預(yù)測(cè)分析技術(shù),對(duì)醫(yī)院感染進(jìn)行預(yù)測(cè)性數(shù)據(jù)挖掘是對(duì)醫(yī)院感染危險(xiǎn)度監(jiān)測(cè)的前瞻性研究方法。本研究選擇寧夏某大型綜合醫(yī)院為監(jiān)測(cè)點(diǎn),嘗試應(yīng)用三種不同的時(shí)間序列模型對(duì)醫(yī)院感染發(fā)生率進(jìn)行模擬構(gòu)建,探討模型在醫(yī)院感染領(lǐng)域應(yīng)用的適用性及價(jià)值,并應(yīng)用最優(yōu)時(shí)間序列模型以間接監(jiān)測(cè)醫(yī)院感染發(fā)展趨勢(shì),以期發(fā)現(xiàn)醫(yī)院感染的潛在規(guī)律,發(fā)出早期預(yù)警,從而提高監(jiān)控效率。
資料來(lái)源于寧夏某三甲醫(yī)院2005年1月1日至2011年10月31日出院病人數(shù)據(jù)庫(kù)及該院醫(yī)院感染監(jiān)測(cè)網(wǎng)。
將醫(yī)院HIS系統(tǒng)中的2005~2010年出院病人數(shù)據(jù)庫(kù)轉(zhuǎn)換為能滿足統(tǒng)計(jì)預(yù)測(cè)分析所需的數(shù)據(jù)環(huán)境,并篩選符合醫(yī)院感染診斷標(biāo)準(zhǔn)的全部病例,對(duì)篩查出的醫(yī)院感染病例與醫(yī)院感染監(jiān)測(cè)網(wǎng)上報(bào)的院感病例進(jìn)行核對(duì),補(bǔ)全數(shù)據(jù)庫(kù)中漏填病例,計(jì)算醫(yī)院感染發(fā)病率。診斷標(biāo)準(zhǔn)及感染率計(jì)算方法根據(jù)衛(wèi)生部頒布的《醫(yī)院感染診斷標(biāo)準(zhǔn)(試行)》。
(1)ARIMA 模型〔2-3〕,即自回歸滑動(dòng)平均混合模型,主要分析時(shí)間序列的隨機(jī)性、平穩(wěn)性和季節(jié)性。ARIMA模型中的三個(gè)參數(shù)p、d、q分別表示自回歸階數(shù)、差分階數(shù)和移動(dòng)平均階數(shù),其數(shù)學(xué)表達(dá)式為:
其中Φ(L)和Θ(L)分別表示L的p,q階特征多項(xiàng)式;t表示時(shí)間;yt表示時(shí)間序列;ut為白噪聲過程。若序列具有線性趨勢(shì)或周期性,可通過d階差分或季節(jié)差分使序列滿足ARIMA的建模條件,最后通過殘差序列檢驗(yàn)擬合的模型是否有效,并可通過AIC準(zhǔn)則或BIC準(zhǔn)則判斷多個(gè)模型中的最優(yōu)模型。
(2)指數(shù)平滑法〔2〕的原理是對(duì)離預(yù)測(cè)期較近的觀察值賦予較大的權(quán)數(shù),對(duì)離預(yù)測(cè)值較遠(yuǎn)的觀察值賦予較小的權(quán)數(shù),權(quán)數(shù)由近到遠(yuǎn)按指數(shù)規(guī)律遞減。其基本形式的數(shù)學(xué)表達(dá)式為:
其中,yt是實(shí)際值序列,是平滑值序列,是上期平滑值,α是平滑系數(shù),也叫衰減因子,平滑系數(shù)的取值范圍為:0≤α≤1。
(3)灰色模型〔4-5〕的理論基礎(chǔ)是一般的非負(fù)準(zhǔn)光滑序列經(jīng)過累加生成后,都會(huì)減少隨機(jī)性,呈現(xiàn)出近似的指數(shù)增長(zhǎng)規(guī)律。原始序列越光滑,生成后指數(shù)規(guī)律與越明顯。其數(shù)學(xué)表達(dá)式為:
其中,z(1)k=1/2[(x(1)(k)+x(1)(k-1)]GM(1,1)模型中的參數(shù)-a為發(fā)展系數(shù),b為灰色作用量。-a反映了及的發(fā)展態(tài)勢(shì)。
(4)模型效果的評(píng)價(jià)
采用相對(duì)誤差絕對(duì)值平均MAPE(mean absolute percentage error)及其相應(yīng)的等級(jí)評(píng)定〔5〕來(lái)評(píng)價(jià)ARI-MA模型、指數(shù)平滑模型、灰色模型對(duì)醫(yī)院感染發(fā)生率資料的擬合效果。
T表示樣本容量,n表示樣本外預(yù)測(cè)期數(shù),^yt表示預(yù)測(cè)值,yt是實(shí)際值。
ARIMA模型和指數(shù)平滑模型運(yùn)用eviews6.0進(jìn)行擬合,灰色模型應(yīng)用《灰色系統(tǒng)理論及其應(yīng)用》〔4〕一書的配套軟件進(jìn)行建模。
以醫(yī)院感染的月發(fā)病率信息為縱軸,對(duì)應(yīng)的時(shí)間為橫軸,繪制醫(yī)院感染率時(shí)序圖(圖1),時(shí)序圖顯示各月醫(yī)院感染的發(fā)病率呈現(xiàn)出一定波動(dòng),且每年均出現(xiàn)發(fā)病高峰月,醫(yī)院感染率具有季節(jié)性和周期性。
圖1 寧夏某三甲醫(yī)院醫(yī)院感染率時(shí)序圖
對(duì)醫(yī)院感染率序列進(jìn)行季節(jié)調(diào)整后的單位根檢驗(yàn)再次確定了醫(yī)院感染的季節(jié)性,對(duì)原變量進(jìn)行一階差分、季節(jié)差分后,嘗試擬合不同的ARIMA季節(jié)模型,依據(jù)信息量準(zhǔn)則判別模型的優(yōu)劣,其中AIC和SBC最低的模型是最好的模型。最終確定模型為ARIMA(0,1,1)(0,1,1)12,其 AIC 和 BIC 值分別為 1.9047、1.9752。通過殘差自相關(guān)函數(shù)圖檢驗(yàn)?zāi)P偷碾S機(jī)誤差項(xiàng)是一個(gè)白噪聲序列。故 ARIMA(0,1,1)(0,1,1)12模型是所要確定的最終模型,其對(duì)應(yīng)的模型表達(dá)式為:
醫(yī)院感染序列實(shí)際值與預(yù)測(cè)值的MAPE值為12.50,對(duì)應(yīng)的擬合圖形如圖2。
圖2 感染率實(shí)際值與ARIMA模型預(yù)測(cè)值趨勢(shì)圖
對(duì)原序列擬合加法性季節(jié)Holt-Winters法和乘法性季節(jié)Holt-Winters方法,其殘差平方和分別為19.34和19.38,以殘差平方和最小為最合適模型,并進(jìn)行殘差圖檢驗(yàn),最終加法性季節(jié)Holt-Winters法是指數(shù)平滑法中最合適模型。其對(duì)應(yīng)的模型表達(dá)式為:
醫(yī)院感染序列實(shí)際值與預(yù)測(cè)值的MAPE值為10.41,對(duì)應(yīng)的擬合圖形如圖3。
圖3 醫(yī)院感染率實(shí)際值與指數(shù)平滑法預(yù)測(cè)值趨勢(shì)圖
對(duì)原序列進(jìn)行灰色模型的可行性判斷,結(jié)果顯示,σ(k)∈(0.5000,2.6242),級(jí)比檢驗(yàn)滿足建模的基本要求,由于原序列具有季節(jié)性及漸升趨勢(shì),故采用灰色季節(jié)趨勢(shì)法對(duì)模型進(jìn)行擬合。最終模型通過后驗(yàn)檢驗(yàn),對(duì)應(yīng)的模型表達(dá)式為
醫(yī)院感染序列實(shí)際值與預(yù)測(cè)值的MAPE值為19.03,對(duì)應(yīng)的擬合圖形如圖4。
圖4 醫(yī)院感染率實(shí)際值與灰色模型預(yù)測(cè)值趨勢(shì)圖
以2011年1~10月的醫(yī)院感染發(fā)生率資料作為模型評(píng)價(jià)樣本,對(duì)上述三種時(shí)間序列模型應(yīng)用MAPE值判斷其預(yù)測(cè)精度,結(jié)果見表1。
三種時(shí)間序列模型的預(yù)測(cè)精度均為良好,其中指數(shù)平滑模型預(yù)測(cè)值與實(shí)際值間的MAPE值最小,為10.41,故指數(shù)平滑模型為該醫(yī)院感染發(fā)生率預(yù)測(cè)模型的最優(yōu)模型。
表1 不同月份各時(shí)間序列模型預(yù)測(cè)MAPE值及等級(jí)評(píng)價(jià)
統(tǒng)計(jì)預(yù)測(cè)是在大量統(tǒng)計(jì)資料的基礎(chǔ)上,運(yùn)用數(shù)理統(tǒng)計(jì)方法研究事物發(fā)展變化趨勢(shì)和方向的預(yù)測(cè)方法。常用統(tǒng)計(jì)預(yù)測(cè)方法很多,諸如回歸分析法、時(shí)間序列法、灰色模型等等。有研究顯示,各種模型在疾病的預(yù)測(cè)中及醫(yī)院管理等方面均取得了較好的效果〔6-8〕。在國(guó)內(nèi)外研究中,灰色模型、季節(jié)性時(shí)間序列的線性模型、人工神經(jīng)網(wǎng)絡(luò)模型均已應(yīng)用于醫(yī)院感染危險(xiǎn)度的預(yù)測(cè)中,取得了良好的預(yù)期效果〔9-11〕。但醫(yī)院感染的發(fā)生受多種因素共同作用影響,在特定環(huán)境中,醫(yī)院感染發(fā)生率及其發(fā)展變化的趨勢(shì)不盡相同,在對(duì)特定醫(yī)院的醫(yī)院感染進(jìn)行監(jiān)控時(shí),為提高監(jiān)控效率,可應(yīng)用統(tǒng)計(jì)預(yù)測(cè)技術(shù)進(jìn)行院感的前瞻性研究,但哪種模型更適合該醫(yī)院的醫(yī)院感染危險(xiǎn)度的預(yù)測(cè),還需進(jìn)一步探索。本文應(yīng)用ARIMA模型、指數(shù)平滑模型、灰色模型對(duì)特定的醫(yī)院感染危險(xiǎn)度進(jìn)行構(gòu)建,取得了預(yù)期效果,擬合值和實(shí)際值間預(yù)測(cè)的相對(duì)誤差絕對(duì)值平均在10~20之間,預(yù)測(cè)精度為良好,說明這三種對(duì)醫(yī)院感染率的預(yù)測(cè)具有可行性,其對(duì)醫(yī)院感染率的發(fā)生趨勢(shì)判斷具有參考價(jià)值。
ARIMA模型、指數(shù)平滑模型、灰色模型除其基本形式外,又都包括了多種衍生類型,各類型都有其不同適用條件,在模型擬合時(shí)一定要根據(jù)原序列的特征確定不同的模型類型才能得到較好的預(yù)測(cè)效果。本例資料由于有明確的季節(jié)性,故在各模型擬合時(shí)均選擇季節(jié)性類型。從三種模型擬合的趨勢(shì)圖看,灰色模型的預(yù)測(cè)值普遍小于其實(shí)際值,而ARIMA模型和指數(shù)平滑模型的預(yù)測(cè)值的擬合圖形軌跡與實(shí)際值較吻合,特別是指數(shù)平滑模型,其可能是由于ARIMA模型在操作過程中考慮到了序列的隨機(jī)性、平穩(wěn)性和季節(jié)性,而指數(shù)平滑模型在考慮了整體均值、整體趨勢(shì)和季節(jié)性的同時(shí)又考慮的序列的最鄰近的值。醫(yī)院感染的發(fā)生雖有其明顯的季節(jié)性,但隨機(jī)性也較強(qiáng),ARIMA模型和指數(shù)平滑模型都考慮了其隨機(jī)性,而灰色模型只能用于數(shù)據(jù)離散較小且發(fā)展趨勢(shì)呈單調(diào)性的情況,無(wú)法分析系統(tǒng)的波動(dòng)規(guī)律〔12〕,即使在事先對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,剔除了其趨勢(shì)性和季節(jié)性,但對(duì)序列隨機(jī)性的把握仍欠缺,且灰色模型在擬合時(shí),由于其軟件只包含基本形式的預(yù)測(cè)用程序組,對(duì)其趨勢(shì)性和季節(jié)性均需先運(yùn)算剔除后再回代,整個(gè)操作過程較前兩種模型復(fù)雜。
由于醫(yī)院感染的發(fā)生率資料收集相對(duì)較方便,故本次研究?jī)H對(duì)醫(yī)院感染的發(fā)病率建立了一維的時(shí)間序列模型,在研究中發(fā)現(xiàn)其具有較強(qiáng)的可操作性和現(xiàn)實(shí)意義。但醫(yī)院感染的發(fā)生是諸多因素綜合影響的結(jié)果,可嘗試?yán)枚嘣y(tǒng)計(jì)分析方法,將各影響因素的作用融入模型,借助先進(jìn)工具進(jìn)行分析預(yù)測(cè),可能會(huì)使結(jié)果更加貼近實(shí)際,更具操作性。
1.王良俊,周霞,楊金霞,等.醫(yī)院感染監(jiān)測(cè)中存在問題及對(duì)策.中華醫(yī)院感染學(xué)雜志,2008,18(4):492-493.
2.孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第2版 北京:人民衛(wèi)生出版社,2005,7:461-462.
3.王燕.應(yīng)用時(shí)間序列分析.第2版,北京:中國(guó)人民大學(xué)出版社,2008,12:149-150.
4.劉思峰,謝乃明,等.灰色系統(tǒng)理論及其應(yīng)用.北京:科學(xué)出版社,2008.
5.劉思峰.預(yù)測(cè)方法與技術(shù).北京:高等教育出版社,2005.
6.尹志英,繆明正.指數(shù)曲線模型在預(yù)測(cè)甲肝流行趨勢(shì)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(5):555.
8.胡興,胡錫?。陆瓾1N1甲型流感預(yù)測(cè)模型的比較研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(3):342-343.
7.肖玉霞,張穎.用線性趨勢(shì)季節(jié)模型預(yù)測(cè)出院人次.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(3):213-215.
8.羅陽(yáng),丁國(guó)英,府偉靈,等.季節(jié)性時(shí)間序列分析在醫(yī)院感染中的應(yīng)用.中華醫(yī)院感染學(xué)雜志,2005,15(4):390-392.
9.張素萍,王建斌,吳俊霞,等.醫(yī)院感染灰色模型監(jiān)控效果的探討.中華醫(yī)院感染學(xué)雜志,2000,10(5):380-381.
11.許林勇,白毅,胡明,等.基于人工神經(jīng)網(wǎng)絡(luò)模型的醫(yī)院感染危險(xiǎn)度預(yù)測(cè).中南大學(xué)學(xué)報(bào),2006,31(3):404-407.
12.顏杰,相麗馳,方積乾.灰色預(yù)測(cè)模型及SAS實(shí)現(xiàn).中國(guó)衛(wèi)生統(tǒng)計(jì),2006,23(1):75.