范馨月 王清青
摘要:目的 ?采用SARIMA、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡及小波神經(jīng)網(wǎng)絡模型對貴州省某??漆t(yī)院的精神類疾病患者數(shù)進行擬合及預測,并比較各類預測模型的預測效果。方法 ?將貴州省某??漆t(yī)院2016年1月1日~12月31日HIS系統(tǒng)中精神類疾病的數(shù)據(jù)作為訓練集,建立SARIMA(1,1,1)×(1,1,1)3模型、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡、小波神經(jīng)網(wǎng)絡模型。分別對2017年1月1日~16日精神類疾病患者數(shù)進行預測,將2017年1月1日~16日數(shù)據(jù)作為驗證集。分別用3類誤差分析指標衡量模型的擬合效果,并比較模型預測的準確性。結(jié)果 ?RBF神經(jīng)網(wǎng)絡模型對該醫(yī)院精神類疾病患者數(shù)的擬合效果優(yōu)于BP神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型,平均絕對誤差為(1.84×10-7)%,平均相對誤差為4.92×10-6,均方根誤差為4.74×10-6。3類預測誤差平均值分別為23.70%、3.633、93.72。結(jié)論 ?4種模型均能用于醫(yī)院精神類疾病患者數(shù)的預測,但就預測效果而言,小波神經(jīng)網(wǎng)絡模型的各項誤差指標均低于其他3種預測模型,小波神經(jīng)網(wǎng)絡模型可作為預防和醫(yī)院管理的理論依據(jù)。
關(guān)鍵詞:SARIMA;BP神經(jīng)網(wǎng)絡;RBF神經(jīng)網(wǎng)絡;小波神經(jīng)網(wǎng)絡模型;預測;精神類疾病
中圖分類號:R749 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:B ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2019.12.003
文章編號:1006-1959(2019)12-0006-04
Abstract:Objective ?To fit and predict the number of mental illness patients in a specialized hospital in Guizhou Province by SARIMA, BP neural network, RBF neural network and wavelet neural network model, and compare the prediction effects of these types of prediction models. Methods ?The data of mental illness in the HIS system from January 1 to December 31, 2016 in a specialized hospital in Guizhou Province was used as a training set to establish the SARIMA (1,1,1)×(1,1,1)3 model. BP neural network, RBF neural network, wavelet neural network model. The number of patients with mental illness was predicted from January 1st to 16th, 2017, and the data from January 1st to 16th, 2017 was used as the verification set. The three types of error analysis indicators were used to measure the fitting effect of the model, and the accuracy of the model prediction was compared. Results ?The RBF neural network model was better than BP neural network and wavelet neural network model in fitting the number of patients with psychiatric diseases. The average absolute error was (1.84×10-7)%, and the average relative error was 4.92×10-6. The square root error is 4.74×10-6. The average values of the three types of prediction errors are 23.70%, 3.633, and 93.72, respectively. Conclusion ?The four models can be used to predict the number of patients with mental illness in hospitals. However, in terms of prediction results, the error indicators of wavelet neural network model are lower than the other three prediction models. The wavelet neural network model can be used as prevention and The theoretical basis of hospital management.
Key words:SARIMA; BP neural network; RBF neural network; Wavelet neural network model;Prediction; Mental illness
隨著現(xiàn)代社會的飛速發(fā)展,生活節(jié)奏日益加快,現(xiàn)代人的精神壓力也越來越大,逐漸出現(xiàn)各種各樣的精神心理問題。精神衛(wèi)生問題成為全球性的重大公共衛(wèi)生問題,也是較為嚴重的社會問題[1]。目前全球約有4.5億人受到精神疾病的困擾,而且社會中每4個人當中就有1人有某種程度的精神問題。世界衛(wèi)生組織預測,到2020年中國精神疾病的負擔將占疾病總負擔的1/4以上[2]。國內(nèi)調(diào)查顯示,精神疾病的患病率在不同地區(qū)之間存在較大差異。此外,還有研究表明,癌癥和精神疾病有著密切的相關(guān)性,癌癥患者在診斷、治療、恢復、死亡等階段均可出現(xiàn)心理危機,其中焦慮和抑郁性障礙比例高達70%左右[3]。建立合適的預測模型,準確預測區(qū)域精神疾病的發(fā)生量,盡早采取防控措施,可有效降低精神疾病的發(fā)病率。本文基于貴州省某精神病??漆t(yī)院2016年1月~2017年1月精神病患者數(shù)據(jù)構(gòu)建SARIMA模型、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型,對該院精神病患者數(shù)據(jù)進行預測,并比較4個模型的預測效果,提高監(jiān)控效率。為積極開展社區(qū)防治,規(guī)范精神疾病患者管理提供科學依據(jù)。
1對象與方法
1.1研究對象 ?數(shù)據(jù)來源于貴州省某精神病專科醫(yī)院HIS系統(tǒng),選擇2016年1月~2017年1月門診患者的監(jiān)測數(shù)據(jù)。門診患者共166168人,其中精神類疾病患者103910人。
1.2研究內(nèi)容 ?對貴州省某??艸IS系統(tǒng)中2016年1月~12月門診患者監(jiān)測數(shù)據(jù)進行分析,在SQL Server 2012中進行數(shù)據(jù)整理與清洗。建立基于精神類疾病患者數(shù)的SARIMA模型、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型,預測2017年1月1日~16日精神類疾病患者數(shù),通過評價指標比較預測模型的預測效果。并進一步預測2017年1月17日~31日精神類疾病患者人數(shù)。
1.3方法
1.3.1 乘積SARIMA(p,d,q)×(P,D,Q)s模型 ?傳統(tǒng)的ARIMA模型在醫(yī)學統(tǒng)計中已經(jīng)得到了廣泛的應用[4,5]。乘積季節(jié)性差分自回歸滑動平均模型[SARIMA(p,d,q)×(P,D,Q)s]模型ARIMA模型之一,這里(p,d,q),(P,D,Q)s分別代表非季節(jié)性和季節(jié)性自回歸項、差分和移動平均項系數(shù),s為季節(jié)性指數(shù)。由于精神病患者就醫(yī)具有季節(jié)性和隨機性的特殊性,用SARIMA(p,d,q)×(P,D,Q)s模型擬合時間序列可達到較好的預測效果。
1.3.2 BP神經(jīng)網(wǎng)絡模型 ?BP神經(jīng)網(wǎng)絡是一種多層前饋神經(jīng)網(wǎng)絡,從模擬生物神經(jīng)網(wǎng)絡出發(fā),包含輸入層、輸出層、隱含層和輸出層。BP神經(jīng)網(wǎng)絡具有并行分布處理、高度容錯能力、分布存儲及學習能力,能充分逼近復雜的非線性關(guān)系等特點[6]。加上BP神經(jīng)網(wǎng)絡對數(shù)據(jù)無假設性條件,適合處理非線性問題。BP神經(jīng)網(wǎng)絡利用信號傳遞前向,誤差傳遞反向的方法,通過不斷調(diào)整網(wǎng)絡權(quán)值和閾值,使得神經(jīng)網(wǎng)絡預測達到較好的預測效果。
1.3.3 RBF神經(jīng)網(wǎng)絡模型 ?徑向基函數(shù)神經(jīng)網(wǎng)絡是一類非常重要的神經(jīng)網(wǎng)絡,具有結(jié)構(gòu)簡單、收斂速度快、逼近能力強、網(wǎng)絡結(jié)構(gòu)易于調(diào)整的優(yōu)點,其在神經(jīng)網(wǎng)絡的應用廣泛程度僅次于BP神經(jīng)網(wǎng)絡[7]。對于BP網(wǎng)絡,已經(jīng)證明了三層網(wǎng)絡結(jié)構(gòu)能夠逼近任意連續(xù)函數(shù),而RBF神經(jīng)網(wǎng)絡能以任意精度逼近任意非線連續(xù)函數(shù)。到目前為止,已經(jīng)提出了許多種RBF網(wǎng)絡的訓練算法,RBF神經(jīng)網(wǎng)絡的優(yōu)良特性使其成為替代BP網(wǎng)絡的另一種神經(jīng)網(wǎng)絡,越來越廣泛地應用于各個領域。
1.3.4 小波神經(jīng)網(wǎng)絡模型 ?小波神經(jīng)網(wǎng)絡是非平穩(wěn)信號分析和處理的強有力工具。小波神經(jīng)網(wǎng)絡具有自學習、自組織、容錯性儲存等一般神經(jīng)網(wǎng)絡所具有的優(yōu)點外,還克服了Fourier變換不能作局部分析的缺點,其強大的非線性映射能力使它在預測領域具有很大的優(yōu)勢。小波神經(jīng)網(wǎng)絡的結(jié)構(gòu)和表達式與BP網(wǎng)絡基本一致,不同之處主要是BP網(wǎng)絡隱含層神經(jīng)元的激勵函數(shù)取Sigmoid函數(shù),而小波神經(jīng)網(wǎng)絡采用滿足可允許條件的小波函數(shù)為激勵函數(shù),小波函數(shù)一般取Morlet函數(shù)或者Mexican Hat小波函數(shù),使得在調(diào)整權(quán)值和小波參數(shù)時,采用算法也不同。此外,還有的學者經(jīng)過大量實驗證實經(jīng)驗模態(tài)分解具有類似小波變換中的二進濾波器的特性[8]。
1.4數(shù)據(jù)分析 ?本研究在SQL server 2012中進行數(shù)據(jù)處理,使用Matlab 2017a進行統(tǒng)計分析,以2016年1月~2016年12月HIS系統(tǒng)中的精神類疾病患者數(shù)據(jù)作為訓練樣本建立SARIMA、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡擬合模型,預測2017年1日~16日醫(yī)院精神類疾病患者數(shù),模型精度評價采用平均絕對誤差百分比(MAPE)、平均相對誤差絕對值(MRE)和均方根誤差(RSE)。
2結(jié)果
2.1醫(yī)院精神類疾病患者數(shù)分布特點 ?精神類疾病患者包括診斷為精神分裂、雙向情感障礙、自閉癥、抑郁癥、強迫癥等。2016年1月1日~2017年1月16日該??漆t(yī)院精神類疾病患者共計103910人,占該專科醫(yī)院患病人數(shù)62.50%,每天患精神類疾病患者數(shù)量及占該醫(yī)院總疾病比例資料見表1,按繪制時序圖見圖1,春季是精神類疾病的高發(fā)季節(jié),較下半年而言,患者數(shù)量較多,幾乎是秋冬季節(jié)的兩倍。該時間序列是一個非平穩(wěn)序列,并且有季節(jié)性趨勢。
2.2模型識別 ?由于原序列呈現(xiàn)出周期性季節(jié)波動的非平穩(wěn)序列特點,因此需要建立混合效應SARIMA(p,d,q)×(P,D,Q)s。一階差分后的醫(yī)院精神類疾病患者的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)圖見圖3。差分后通過ADF檢驗,確定ARIMA(p,d,q)×(P,D,Q)s中的 和D分別為1和1。此時殘差序列自相關(guān)函數(shù)和偏相關(guān)函數(shù)在可信區(qū)間內(nèi),AIC數(shù)值越小。通過實驗數(shù)據(jù)分析,自回歸部分階數(shù)和移動平均階數(shù)可以選取p=1,q=1,P=1,Q=1。綜上得出的最優(yōu)預測模型為ARIMA(1,1,1)×(1,1,1)3。基于和SARIMA同樣的歷史數(shù)據(jù)輸入,采用BP神經(jīng)網(wǎng)絡和RBF神經(jīng)網(wǎng)絡模型對2016年1月1日~年12月31日該??漆t(yī)院精神類疾病患者數(shù)進行擬合,取最大神經(jīng)元個數(shù)為3000個,擴展速度為3,誤差為0.00001。圖3和圖4中,三種神經(jīng)網(wǎng)絡均能擬合該院精神類疾病患者數(shù)。其中,RBF神經(jīng)網(wǎng)絡訓練效果最好,具體擬合誤差指標見表2。
由圖3和表2可以看出,RBF神經(jīng)網(wǎng)絡模型和其他兩個神經(jīng)網(wǎng)絡模型相比,能較好地擬合該專科醫(yī)院患精神類疾病發(fā)病數(shù),平均絕對誤差為(1.84×10-7)%,平均相對誤差為4.92×10-6,均方根誤差為4.74×10-6,對原始數(shù)據(jù)的擬合效果優(yōu)于BP神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型。
2.3模型診斷 ?通過SARIMA(1,1,1)×(1,1,1)3、BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型,預測2017年1月1日至16日精神類疾病患者數(shù),并和實際值計算評價指標進行對照檢驗(見表3)。由表3可見,訓練的四種預測模型均可作為精神類疾病患者數(shù)的預測,就預測效果而言,小波神經(jīng)網(wǎng)絡模型的各項誤差指標均明顯低于SARIMA(1,1,1)×(1,1,1)3模型,BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型,可作為預防和精神類疾病發(fā)作或爆發(fā)的理論依據(jù)。
3討論
隨著醫(yī)院信息化和現(xiàn)代醫(yī)學的發(fā)展,醫(yī)院HIS數(shù)據(jù)越來越豐富和完善,特殊疾病的患病率預測在醫(yī)院管理工作中起到舉足輕重的作用,可將被動管理轉(zhuǎn)換為主動預防。大多數(shù)精神類疾病的病因和發(fā)病機理不清楚,體征和實驗室檢查無特異性,未識別率高[9]。目前,精神類疾病導致的殘疾已成為世界性主要問題,通過運用數(shù)學建模對其進行挖掘,建立醫(yī)院特殊疾病預測預報體系,準確預測醫(yī)院精神類疾病患者數(shù)的未來變化情況,對于醫(yī)院感染的預防與控制將起到?jīng)Q定性的作用。
在之前的研究中,有文獻建立ARIMA模型和BP神經(jīng)網(wǎng)絡模型進行疾病預測,本研究中以RBF神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡模型是對精神類疾病患者數(shù)預測建模的探索。在本研究中,采用SARIMA模型和神經(jīng)網(wǎng)絡模型基于貴州省某??漆t(yī)院2016年1月~12月醫(yī)院精神類疾病患者數(shù)據(jù)進行訓練,然后對2017年1月1日~16日患者數(shù)作預測。SARIMA和神經(jīng)網(wǎng)絡訓練模型均能用于具有該非平穩(wěn)且具有季節(jié)性時間序列的預測,SARIMA模型對季節(jié)性有一定的要求,其參數(shù)如季節(jié)參數(shù),自回歸階數(shù)的選取需多次實驗優(yōu)化選取;三層的BP網(wǎng)絡結(jié)構(gòu)能逼近任意連續(xù)函數(shù),可用于非平穩(wěn)非線性序列的預測;在建立RBF神經(jīng)網(wǎng)絡模型時應注意樣本數(shù)據(jù)擬合和預測模型進行外推時的估計誤差,即殘差的平方和要盡可能小,RBF神經(jīng)網(wǎng)絡能以任意精度逼近任意非線連續(xù)函數(shù)。但實際應用中,由于序列的變化有很多隨機性及非線性性,過多地強調(diào)對樣本集的擬合精度可能導致將不是變化趨勢的隨機因素也作為趨勢變量,進而導致外推精度變差而發(fā)生過擬合。MAPE、MRE、RSE三種指標顯示,小波神經(jīng)網(wǎng)絡盡管擬合效果不如RBF神經(jīng)網(wǎng)絡,但就預測效果而言,三項指標分別為10.59%、1.084、89.07,均小于BP神經(jīng)網(wǎng)絡模型、RBF神經(jīng)網(wǎng)絡與SARIMA模型,有較好的預測效果。但是,預測的結(jié)果仍存在一定誤差,可能與樣本數(shù)據(jù)較少,資料所限有關(guān)。醫(yī)院精神類疾病患者數(shù)影響因素眾多,比如具有隨機時變性、以及患病不主動就醫(yī)等情況,要對其做出準確的預測,必須有完備的資料。因此,在后續(xù)研究中,應在不斷積累資料的同時擴大訓練樣本,對幾種模型的參數(shù)做出相應的優(yōu)化,從而不斷提高模型的預測精度,以期達到更好的預測效果。并在實驗中將患者的家庭情況,生活習性等因素考慮進來,建立患者的電子病歷,提前預測患者發(fā)病時間,做好防護措施。
參考文獻:
[1]李向青,杜敏霞,李榮.2005-2012年中國精神疾病死亡率的流行病學分析[J].現(xiàn)代預防醫(yī)學,2015,42(1):4-7.
[2]Desjarlais R,Eisenberg L,Good B,et al.World Mental Health[M].New York:Oxford University Press,1995.
[3]賈韻博,張陽,韓芳.癌癥相關(guān)基因與精神疾病的關(guān)聯(lián)[J].現(xiàn)代腫瘤學,2017,25(21):3527-3530.
[4]毛圓圓,周麗紅,劉麗,等.ARIMA模型在醫(yī)院流產(chǎn)數(shù)時間趨勢分析中的應用[J].中國衛(wèi)生統(tǒng)計,2018,35(1):52-54.
[5]高雅,王伶,吳偉,等.遼寧省手足口病疫情季節(jié)性ARIMA模型預測效果評價[J].中國公共衛(wèi)生,2017,33(10):1482-1484.
[6]周志華.機器學習[M].北京:清華大學出版社,2016.
[7]張怡君,左穎婷,劉近春,等.GA-BP與BP神經(jīng)網(wǎng)絡在醫(yī)學研究中的應用與比較[J].中國衛(wèi)生統(tǒng)計,2018,35(2):239-245.
[8]劉振球,嚴瓊,左佳鷺,等.EMD-BP神經(jīng)網(wǎng)絡在傳染病發(fā)病趨勢和預測研究中的應用[J].中國衛(wèi)生統(tǒng)計,2018,35(1):152-155.
[9]杜召云.精神科護理學[M].北京:人民衛(wèi)生出版社,2009:41-49.
收稿日期:2019-3-29;修回日期:2019-4-8
編輯/成森