王清青,范馨月,查筑紅
(1.貴州醫(yī)科大學(xué)附屬醫(yī)院醫(yī)院感染管理科,貴州 貴陽 550004;2.貴州大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,貴州 貴陽 550025)
近年來,醫(yī)院感染(healthcare-associated Infection,HAI)給患者和社會(huì)造成的嚴(yán)重經(jīng)濟(jì)負(fù)擔(dān)已成為醫(yī)學(xué)界急需解決的重大問題。醫(yī)院感染不僅會(huì)提高患者死亡風(fēng)險(xiǎn),還會(huì)延長患者的住院時(shí)間、降低病床周轉(zhuǎn)率,嚴(yán)重影響醫(yī)療質(zhì)量[1-3]。因此,建立預(yù)測模型準(zhǔn)確預(yù)測醫(yī)院感染發(fā)病率,提前采取相應(yīng)防控措施,對降低醫(yī)院感染發(fā)病率具有重要的現(xiàn)實(shí)意義。醫(yī)院感染發(fā)病率常用的預(yù)測方法包括自回歸移動(dòng)平均滑動(dòng)模型(autoregressive integrated moving average model,ARIMA)[4-6]、灰色預(yù)測模型(gray forecast model,GM)[7-9]和神經(jīng)網(wǎng)絡(luò)模型(neural network model,NNM)[10-13]等。ARIMA 模型和GM 模型使用解析模型對數(shù)據(jù)進(jìn)行擬合預(yù)測,誤差較大。NNM 模型易陷入局部最優(yōu)解,學(xué)習(xí)效率和模型精度較低。極端學(xué)習(xí)機(jī)(extreme learning machine,ELM)模型為單隱層前饋神經(jīng)網(wǎng)絡(luò)(single-hidden layer feedforward neural networks,SLFNs),具有原理簡單、訓(xùn)練速度快的特點(diǎn)[14],但數(shù)據(jù)的不平衡分布及其冗余信息產(chǎn)生的噪聲以及離群點(diǎn)會(huì)對ELM的泛化能力產(chǎn)生影響?;诖耍狙芯繕?gòu)建了一種基于小波去噪后的ELM 模型對醫(yī)院感染率進(jìn)行預(yù)測分析,以期為醫(yī)院感染預(yù)防與控制提供一定的參考依據(jù)。
1.1 資料來源 選取貴州省某三甲醫(yī)院2014 年1 月-2019 年12 月收治的住院時(shí)間超過48 h的所有住院患者的月度醫(yī)院感染發(fā)病率資料。本研究經(jīng)過醫(yī)院倫理委員會(huì)審核通過,患者及家屬簽署知情同意書。
1.2 醫(yī)院感染診斷標(biāo)準(zhǔn) 參照中華人民共和國衛(wèi)生部發(fā)布施行的《醫(yī)院感染診斷標(biāo)準(zhǔn)》[15]。
1.3 方法
1.3.1 小波去噪后極端學(xué)習(xí)機(jī)模型 根據(jù)噪聲與信號在不同頻帶上的小波分解系數(shù)具有不同強(qiáng)度分布的特點(diǎn),將各頻帶上的噪聲對應(yīng)的小波系數(shù)去除,保留原始信號的小波分解系數(shù),然后對處理后的系數(shù)進(jìn)行小波重構(gòu),得到不含噪聲的信號。離散型的小波變換定義為
其中,m 為尺度參數(shù),n 為平移常數(shù),φ*為復(fù)共軛函數(shù),φ(x)為母小波。小波去噪后的序列消除了序列的噪聲對預(yù)測結(jié)果的影響。
不同的樣本數(shù)據(jù)(Xi,Yi),其中X=[X1,X2,……XN]T∈RN,Y=[Y1,Y2,……YN]T∈Rm網(wǎng)絡(luò)中含有L 個(gè)隱層節(jié)點(diǎn)
其中,αi=(αi1,αi2,……,αiN)N為連接i 個(gè)隱層節(jié)點(diǎn)與輸入節(jié)點(diǎn)的輸入權(quán)值向量,bi為第i 個(gè)隱層結(jié)點(diǎn)的偏置。βi=(βi1,βi2,……,βiN)T為連接第i 個(gè)隱層結(jié)點(diǎn)和輸出結(jié)點(diǎn)的輸出權(quán)值向量,f(·)為激活函數(shù)。(1)式改寫為矩陣形式為:
其中,H 是隱層節(jié)點(diǎn)的輸出,β 為輸出權(quán)重,Y為期望輸出。
Y=(Y1,Y2,……,YN)T,β=(β1,β2,……,βN)T,ELM的訓(xùn)練過程等價(jià)于求解線性方程(2),隱含層和輸出層之間的連接權(quán)值β 不需要迭代調(diào)整,這也是ELM 最大的特點(diǎn)。ELM 輸入層和隱含層的連接權(quán)值、隱含層的閾值可以隨機(jī)設(shè)定,且設(shè)定完后不用再調(diào)整,ELM 結(jié)構(gòu)圖見圖1。
圖1 ELM 結(jié)構(gòu)圖
1.3.2 參數(shù)選擇 ELM 模型中的參數(shù)有嵌入維數(shù)、隱含層神經(jīng)元數(shù)、輸入權(quán)重αi、神經(jīng)元偏置bi和輸出權(quán)值。根據(jù)預(yù)測誤差確定嵌入維數(shù)和隱含層神經(jīng)元數(shù),這里取嵌入維數(shù)為2,隱含層神經(jīng)元數(shù)量3。輸入權(quán)重和神經(jīng)元偏置在[-1,1]內(nèi)隨機(jī)取值,輸出權(quán)重β通過求解線性方程(2)的矩陣H的Moore-Penrose廣義逆得到。以2014 年1 月-2019 年6 月醫(yī)院感染發(fā)病率數(shù)據(jù)作為訓(xùn)練樣本構(gòu)建小波去噪后極端學(xué)習(xí)機(jī)模型、原極端學(xué)習(xí)機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型,分別對2019 年7 月-12 月該醫(yī)院的醫(yī)院感染發(fā)病率進(jìn)行預(yù)測,并對其預(yù)測效果進(jìn)行比較。用較優(yōu)的預(yù)測模型對2020 年1 月-12 月醫(yī)院感染發(fā)病率進(jìn)行預(yù)測。
左小龍雖然在每擰下一次油門的時(shí)候都會(huì)把大帥的摩托車和自己的西風(fēng)做比較,然后唏噓,但是他依然執(zhí)著的向著……不知道什么地方開去。他只是在想,他熱愛自己的家園,但如果每天能做的只是發(fā)射鵝卵石,未免太過英雄氣短。但他轉(zhuǎn)念一想,每個(gè)人都有自己的報(bào)仇方式,有些人報(bào)仇為了報(bào)仇,有些人報(bào)仇為了悅己。況且這些不是仇恨,只是恨。
1.4 統(tǒng)計(jì)學(xué)分析 應(yīng)用SPSS 18.0 軟件進(jìn)行統(tǒng)計(jì)分析。每年醫(yī)院感染發(fā)病率之間比較采用χ2檢驗(yàn),P<0.05 表示差異有統(tǒng)計(jì)學(xué)意義。采用Matlab 2017a 軟件建立小波去噪后極端學(xué)習(xí)機(jī)模型,模型精度評價(jià)采用平均絕對誤差百分比(MAPE)、平均相對誤差絕對值(MRE)和均方根誤差(RSE)。
相對誤差絕對值的平均值(MRE)為:
均方根誤差(RSE)為:
2.1 醫(yī)院感染情況 該院2014-2019 年醫(yī)院感染發(fā)病率在0.54%~2.69%,各年發(fā)病率比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),且存在下降趨勢(P<0.05),見圖2。
圖2 2014-2019 年某院醫(yī)院感染發(fā)病率變化趨勢
2.2 模型識別 采用小波去噪后ELM 模型、原ELM模型和NN 模型對2014 年1 月-2019 年6 月該三甲醫(yī)院醫(yī)院感染發(fā)病率進(jìn)行訓(xùn)練。小波去噪后ELM模型能較好地?cái)M合2014 年1 月-2019 年6 月該三甲醫(yī)院醫(yī)院感染發(fā)病率,平均絕對誤差為0.11%,均方根誤差為0.01,對原始數(shù)據(jù)的擬合效果優(yōu)于原ELM 模型和NN 模型,見圖3及表1。
表1 三種預(yù)測模型對醫(yī)院感染率擬合誤差情況
圖3 三種預(yù)測模型對醫(yī)院感染發(fā)病率的預(yù)測擬合效果
圖4 三種預(yù)測模型對醫(yī)院感染發(fā)病率的預(yù)測效果
表2 三種預(yù)測模型對醫(yī)院感染率的預(yù)測誤差
2.4 模型預(yù)測 選用小波去噪后ELM 模型對2020年1 月-12 月醫(yī)院感染發(fā)病率進(jìn)行預(yù)測,預(yù)測值均在95%CI范圍內(nèi),見圖5。
圖5 小波去噪后ELM 模型對醫(yī)院感染發(fā)病率的預(yù)測情況
醫(yī)院感染作為特殊的傳染性疾病,其發(fā)生、發(fā)展與醫(yī)療活動(dòng)息息相關(guān)。通過醫(yī)院感染發(fā)病率的前瞻性預(yù)測,不僅可以對當(dāng)前采取的醫(yī)院感染控制措施效果進(jìn)行評價(jià),同時(shí)還對潛在的院感暴發(fā)具有一定的預(yù)警作用。因此,基于醫(yī)院感染監(jiān)測數(shù)據(jù)建立準(zhǔn)確的醫(yī)院感染預(yù)測、預(yù)報(bào)體系,使醫(yī)院管理者從整體上把握醫(yī)院感染的趨勢,從而及時(shí)調(diào)整相應(yīng)的預(yù)防控制措施,已成為醫(yī)院感染管理工作的重要發(fā)展方向[16-18]。
醫(yī)院感染發(fā)病率受到季節(jié)、環(huán)境等因素的影響,數(shù)據(jù)變化情況較為復(fù)雜,如果作為時(shí)間序列進(jìn)行處理難以用解析函數(shù)對其進(jìn)行逼近,導(dǎo)致傳統(tǒng)的ARIMA 模型和GM(1,1)模型擬合精度較低。對NN模型而言,由于隱函數(shù)為非線性函數(shù),其導(dǎo)數(shù)值也僅僅在中心值附近呈近似線性性質(zhì),中心值的差異性導(dǎo)致線性關(guān)系范圍的大小不同,使得NN 模型難以收斂或僅僅達(dá)到局部收斂。ELM 只有網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)需要人為設(shè)定,在訓(xùn)練過程中輸入權(quán)值及神經(jīng)元偏置隨機(jī)生成,具有學(xué)習(xí)和收斂速率快,擬合能力強(qiáng)等優(yōu)點(diǎn)。因此,ELM 算法及其改進(jìn)算法在醫(yī)療診斷[19]、疾病預(yù)測[20-22]、通信技術(shù)[23]方面都有廣泛的應(yīng)用。本研究構(gòu)建的小波去噪后ELM 模型,有效結(jié)合了小波函數(shù)的非線性數(shù)據(jù)處理能力和極端學(xué)習(xí)機(jī)的函數(shù)逼近能力。本研究從模型的擬合精度和預(yù)測精度進(jìn)行了對比分析,結(jié)果顯示,小波去噪后ELM模型的MAPE、MRE 和RSE 分別為0.89%、0.01、0.02,均小于原極端學(xué)習(xí)機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型,具有較好的預(yù)測效果。但是,預(yù)測的結(jié)果仍存在一定誤差,可能與樣本數(shù)據(jù)較少、資料所限有關(guān)。
醫(yī)院感染的發(fā)生受諸多因素的影響,不同的醫(yī)院環(huán)境其醫(yī)院感染發(fā)病率及變化趨勢也不盡相同。因此,醫(yī)院感染發(fā)病率預(yù)測模型預(yù)測效果的優(yōu)劣要結(jié)合醫(yī)院實(shí)際情況而定,需具體研究。其次,預(yù)測模型的構(gòu)建基于平時(shí)的監(jiān)測數(shù)據(jù),后續(xù)研究中為進(jìn)一步提高模型預(yù)測精度,需要不斷積累監(jiān)測數(shù)據(jù),對小波去噪后ELM 模型參數(shù)進(jìn)行調(diào)整,從而修正或重新擬合醫(yī)院感染發(fā)病率預(yù)測模型。另外,可以考慮將醫(yī)院感染相關(guān)影響因素納入模型,以便提高結(jié)果的準(zhǔn)確性。