国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用遺傳算法優(yōu)化的ARIMA-BP組合模型預(yù)測(cè)手足口病發(fā)病趨勢(shì)

2014-01-08 01:54吳文博李虹艾萬(wàn)鵬程袁秀琴南華大學(xué)公共衛(wèi)生學(xué)院湖南衡陽(yáng)400南華大學(xué)經(jīng)濟(jì)管理學(xué)院
關(guān)鍵詞:口病權(quán)值遺傳算法

吳文博,李虹艾,萬(wàn)鵬程,袁秀琴(.南華大學(xué)公共衛(wèi)生學(xué)院,湖南 衡陽(yáng) 400;.南華大學(xué)經(jīng)濟(jì)管理學(xué)院)

近年來(lái),手足口病的發(fā)病數(shù)逐年增多,作為丙類傳染病中為我省重點(diǎn)監(jiān)測(cè)的疾病之一,因其發(fā)病率高、目前尚無(wú)疫苗進(jìn)行免疫接種、并發(fā)癥危害大,故其防控形勢(shì)較為嚴(yán)峻。在傳染病的防控中,通過(guò)建立相對(duì)準(zhǔn)確的統(tǒng)計(jì)預(yù)測(cè)模型,從而建立預(yù)警監(jiān)測(cè)機(jī)制,為制定防控政策和衛(wèi)生資源配置提供依據(jù),這是傳染病防控的重點(diǎn)及難點(diǎn)之一[1]。本文基于某市近年來(lái)手足口病的發(fā)病資料,先后建立差分自回歸移動(dòng)平均模型(ARIMA)、遺傳算法(Gentic Algorithm,GA)優(yōu)化的ARIMA-BP神經(jīng)網(wǎng)絡(luò)模型,比較兩種模型的預(yù)測(cè)準(zhǔn)確性,并探討組合模型在預(yù)測(cè)方面的優(yōu)越性。

1 材料與方法

1.1 資料來(lái)源

數(shù)據(jù)資料來(lái)源于中國(guó)疾病預(yù)防控制信息系統(tǒng)(傳染病報(bào)告信息管理系統(tǒng)),按發(fā)病日期檢索某市2009年1月1日~2013年12月31日的手足口病月發(fā)病數(shù)。

1.2 方法

將數(shù)據(jù)導(dǎo)入SPSS18.0中,檢查有無(wú)缺失數(shù)據(jù)。以2009年1月1日~2012年12月的發(fā)病數(shù)據(jù)作為模型擬合值,預(yù)測(cè)2013年手足口病月發(fā)病數(shù),將預(yù)測(cè)值與實(shí)際值進(jìn)行比較,以相對(duì)偏差的大小衡量模型的精確性。在建模方法上,首先建立ARIMA模型,將ARIMA模型預(yù)測(cè)值作為BP神經(jīng)網(wǎng)絡(luò)的輸入值,真實(shí)值作為輸出值,同時(shí)應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),不斷尋找預(yù)測(cè)值與真實(shí)值的關(guān)系,從而調(diào)整ARIMA模型的預(yù)測(cè)精度。比較這兩種模型的相對(duì)偏差,并對(duì)模型預(yù)測(cè)精度進(jìn)行評(píng)價(jià)。

1.3 原理

1.3.1 ARIMA模型 ARIMA模型的基本思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來(lái)近似描述這個(gè)序列[2]。該模型由美國(guó)數(shù)學(xué)家Box與英國(guó)統(tǒng)計(jì)學(xué)家Jenkins提出,在預(yù)測(cè)具有季節(jié)周期性的時(shí)間序列中,以乘積季節(jié)性模型最為常用,記ARIMA(p,d,q)(P,D,Q)n,其中p,q為非季節(jié)性模型的自回歸項(xiàng)及移動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列平穩(wěn)化時(shí)所做的差分次數(shù);P,Q為季節(jié)性模型的自回歸及移動(dòng)平均項(xiàng),D為季節(jié)差分的階數(shù)。其建模過(guò)程見(jiàn)圖1。

圖1 ARIMA的建模過(guò)程

1.3.2 BP神經(jīng)網(wǎng)絡(luò)及遺傳算法 BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點(diǎn)是信號(hào)前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號(hào)從輸入層經(jīng)隱含層逐層處理,直至輸出層。每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài)[3]。如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖2所示。根據(jù)輸入向量X,輸入層和隱含層間連接權(quán)值ωij,以及隱含層閾值a,可以計(jì)算隱含層輸出向量H,即:

圖2 BP神經(jīng)網(wǎng)絡(luò)拓補(bǔ)結(jié)構(gòu)

但BP神經(jīng)網(wǎng)絡(luò)容易受數(shù)據(jù)極值的影響,從而導(dǎo)致預(yù)測(cè)精度的下降,同時(shí)由于各層權(quán)重的權(quán)值是主觀經(jīng)驗(yàn)確定的,導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)的主觀傾向性過(guò)大,為此引入GA算法。

遺傳算法(Genetic Algorithm,GA)是一種進(jìn)化算法,其基本原理是仿效生物界中的“物競(jìng)天擇、適者生存”的演化法則。遺傳算法的做法是把問(wèn)題參數(shù)編碼為染色體,再利用迭代的方式進(jìn)行選擇、交叉以及變異等運(yùn)算來(lái)交換種群中染色體的信息,最終生成符合優(yōu)化目標(biāo)的染色體[4]。遺傳算法所優(yōu)化的內(nèi)容是BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值一般是通過(guò)隨機(jī)初始化為[-0.5,0.5]區(qū)間的隨機(jī)數(shù),這個(gè)初始化參數(shù)對(duì)網(wǎng)絡(luò)訓(xùn)練的影響很大,引入遺傳算法就是為了優(yōu)化出最佳的初始權(quán)值和閾值,以提高研究的預(yù)測(cè)精度。

1.4 軟件平臺(tái)

ARIMA模型構(gòu)建采用SPSS18.0,神經(jīng)網(wǎng)絡(luò)及遺傳算法編程采用MATLAB 7.0,操作系統(tǒng)為Windows XP。

2 結(jié) 果

2.1 ARIMA模型的建立

(1)模型的平穩(wěn)化識(shí)別

首先定義估計(jì)區(qū)間,依據(jù)2009年1月~2012年12月的發(fā)病數(shù)擬合模型,并繪制序列圖,見(jiàn)圖3。從序列圖中可見(jiàn),手足口病發(fā)病數(shù)序列存在著明顯的季節(jié)性周期波動(dòng)規(guī)律,在每一年5~8月份,出現(xiàn)發(fā)病高峰;報(bào)告數(shù)在2012年明顯增多??偟膩?lái)看,手足口病發(fā)病數(shù)呈現(xiàn)逐年增多的趨勢(shì),提示該序列是一個(gè)非平穩(wěn)的序列,需對(duì)其進(jìn)行差分,和對(duì)數(shù)轉(zhuǎn)化,以達(dá)到序列平穩(wěn)化的目的。

(2)季節(jié)性ARIMA模型的建立:通過(guò)做出自相關(guān)函數(shù)(ACF)、偏自相關(guān)函數(shù)(PACF)圖,見(jiàn)圖4。依據(jù)“截尾性”估計(jì)季節(jié)性模型參數(shù);同時(shí)在殘差中識(shí)別非季節(jié)性模型,確定若干個(gè)備選模型后,利用Bayesian信息準(zhǔn)則(BIC)最小原則,確定最后的模型,模型ARIMA(1,0,0)(1,1,0)12的BIC最小,為13.002。并對(duì)該模型進(jìn)行診斷、對(duì)模型參數(shù)進(jìn)行估計(jì),相關(guān)統(tǒng)計(jì)量見(jiàn)表1,表2。同時(shí)利用Ljung-Box方法檢驗(yàn)殘差白噪聲,得到L-B統(tǒng)計(jì)量為16.847,P﹥0.05,可以認(rèn)為殘差為白噪聲序列。綜上,選用ARIMA(1,0,0)(1,1,0)12模型進(jìn)行預(yù)測(cè)。

圖3 手足口病發(fā)病數(shù)序列圖

表1 預(yù)測(cè)模型的相關(guān)檢驗(yàn)統(tǒng)計(jì)量

表2 模型的參數(shù)估計(jì)

圖4 手足口病序列的ACF、PACF圖

2.2 ARIMA-BP組合模型的建立與遺傳算法的優(yōu)化

(1)將ARIMA模型預(yù)測(cè)得到的預(yù)測(cè)值、2013年1月~12月的手足口病實(shí)際發(fā)病數(shù)數(shù)據(jù)進(jìn)行歸一化處理,使其集中在[-0.5,0.5]之間;

(2)學(xué)習(xí)樣本的選擇

輸出變量:2013年1月~12月的實(shí)際觀測(cè)值yi。

(3)網(wǎng)絡(luò)初始化,利用遺傳算法進(jìn)化50代尋找最佳初始權(quán)值和閾值。確定遺傳算法參數(shù)的程序代碼如下:

%%定義遺傳算法參數(shù)

NIND=5; %個(gè)體數(shù)目

MAXGEN=50; %最大遺傳代數(shù)

PRECI=10; %變量的二進(jìn)制位數(shù)

GGAP=0.95; %代溝

px=0.7; %交叉概率

pm=0.01; %變異概率

trace=zeros(N+1,MAXGEN); %尋優(yōu)結(jié)果的初始值

FieldD=[repmat(PRECI,1,N);repmat([-0.5;0.5],1,N);repmat([1;0;1;1],1,N)]; %區(qū)域描述器

(4)依據(jù)遺傳算法尋找的最佳閾值與連接權(quán)值,計(jì)算隱含層與輸出層;

(5)計(jì)算誤差,不斷迭代更新閾值與權(quán)值,直至誤差保持在穩(wěn)定水平時(shí)輸出最后結(jié)果。迭代進(jìn)化過(guò)程中誤差變化見(jiàn)圖5。

圖5 遺傳算法進(jìn)化過(guò)程中誤差的變化

利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)的程序如下:

net.iw{1,1}=reshape(w1,hiddennum,inputnum);

net.lw{2,1}=reshape(w2,outputnum,hiddennum);

net.b{1}=reshape(B1,hiddennum,1);

net.b{2}=reshape(B2,outputnum,1);

%%訓(xùn)練網(wǎng)絡(luò)

net=train(net,inputn,outputn);

%BP網(wǎng)絡(luò)預(yù)測(cè)

%預(yù)測(cè)數(shù)據(jù)歸一化

inputn_test=P_test./80;

%網(wǎng)絡(luò)預(yù)測(cè)輸出

an=sim(net,inputn_test);

2.3 ARIMA模型與組合模型的預(yù)測(cè)精度比較

表3 ARIMA模型與組合模型預(yù)測(cè)2013年各月份發(fā)病數(shù)的結(jié)果比較

由表4可見(jiàn),組合模型的平均預(yù)測(cè)精度高于ARIMA模型,且對(duì)于部分極端值(尤其是發(fā)病高峰5~8月)的預(yù)測(cè)較為準(zhǔn)確。對(duì)模型整體的評(píng)價(jià)指標(biāo)見(jiàn)表4。其中決定系數(shù)R2用來(lái)反映模型的擬合效果,即:

SSi表示預(yù)測(cè)值的離均差平方和,SSo表示實(shí)際值得離均差平方和。

表4 兩種模型的綜合評(píng)價(jià)

3 討 論

傳染病的發(fā)病預(yù)測(cè)是當(dāng)前傳染病疾病預(yù)防與控制的難點(diǎn)[5]。用于發(fā)病預(yù)測(cè)的方法有很多,實(shí)際工作中通常的做法是定性預(yù)測(cè)法,即基于日常的疾病監(jiān)測(cè)數(shù)據(jù)、傳染病的發(fā)病特點(diǎn),進(jìn)行趨勢(shì)外推。這種做法主觀因素較大,沒(méi)有充分利用監(jiān)測(cè)數(shù)據(jù),難以保證預(yù)測(cè)的準(zhǔn)確性。對(duì)于組合模型,國(guó)內(nèi)外相關(guān)的研究相對(duì)較少,如:Gamer分解定律、對(duì)不同模型給予一定的權(quán)重[6],但權(quán)重的設(shè)定僅能依靠經(jīng)驗(yàn)的判斷,導(dǎo)致預(yù)測(cè)的主觀性增加,影響了預(yù)測(cè)的精度。有關(guān)基于ARIMA的組合模型預(yù)測(cè),朱玉等[7]利用ARIMA-GRNN對(duì)猩紅熱的發(fā)病進(jìn)行擬合;章勤等[8]則利用BP神經(jīng)網(wǎng)絡(luò)對(duì)矽肺的發(fā)病情況,進(jìn)行了預(yù)測(cè),取得了較好的效果。雖然上述采用神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)方法,避免了對(duì)各分模型權(quán)重大小選取的討論,但是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的閾值以及連接權(quán)值,均需要依靠經(jīng)驗(yàn)反復(fù)設(shè)定,在實(shí)際利用中較為繁瑣。本次研究的創(chuàng)新點(diǎn)在于使用了遺傳算法,通過(guò)進(jìn)化代數(shù)的迭代,優(yōu)化了神經(jīng)網(wǎng)絡(luò)參數(shù),使得預(yù)測(cè)結(jié)果更加科學(xué)可信。

從預(yù)測(cè)結(jié)果上看,利用遺傳算法優(yōu)化的ARIMA-BP組合模型實(shí)現(xiàn)了對(duì)手足口病的發(fā)病趨勢(shì)的預(yù)測(cè),相比于ARIMA模型,該組合模型對(duì)極端值的預(yù)測(cè)效果較好,此外,從整體上看,手足口病的發(fā)病數(shù)年年攀升,需引起足夠重視,由于手足口病致病病原體種類繁多,難以進(jìn)行免疫接種干預(yù),故應(yīng)在每年的疾病高發(fā)時(shí)期,建立統(tǒng)計(jì)預(yù)警,加大對(duì)托幼機(jī)構(gòu)、學(xué)校的消毒、衛(wèi)生檢查以及衛(wèi)生宣教;廣大醫(yī)療機(jī)構(gòu)應(yīng)加強(qiáng)監(jiān)測(cè)篩檢機(jī)制,動(dòng)員醫(yī)療資源做到早發(fā)現(xiàn)、早診斷、早治療。

由于納入本次建模的數(shù)據(jù)樣本量并不大,組合模型的效果變化并不是非常明顯,但當(dāng)數(shù)據(jù)量增大時(shí),采用本法的組合模型,將會(huì)依舊保持良好的預(yù)測(cè)精度。此外,介于本模型的非線性映射能力較強(qiáng)、不受極端數(shù)值的影響[9],基于ARIMA的組合模型尚可以用于金融、人口、水文以及環(huán)境保護(hù)領(lǐng)域,但仍需進(jìn)一步的研究與討論。

[1]羅靜,楊舒,張強(qiáng),等.時(shí)間序列ARIMA在艾滋病疫情預(yù)測(cè)中的應(yīng)用[J].重慶醫(yī)學(xué),2012,41(13):1255-1257.

[2]張晉昕,醫(yī)學(xué)時(shí)間序列分析及其預(yù)測(cè)應(yīng)用相關(guān)問(wèn)題的研究[D].西安:第四軍醫(yī)大學(xué)博士研究生畢業(yè)論文,2000:23-25.

[3]SimonHaykin.神經(jīng)網(wǎng)絡(luò)原理[M].北京:機(jī)械工程出版社,2004:154-167.

[4]史峰,王小川,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航天航空大學(xué)出版社,2010:21-25.

[5]牟瑾,謝旭,李媛,等.將ARIMA模型應(yīng)用于深圳市1980~2007重點(diǎn)法定傳染病預(yù)測(cè)分析[J].預(yù)防醫(yī)學(xué)論壇,2009,15(11):1051-1055.

[6]Erxu Pi,Mantri,Sai Ming Ngai.BP-ANN for fitting the temperature-germination model and its application in predicting sowing time and region for bermudagrass[J].PLoS One 2013,11(8):e82413.

[7]朱玉,夏結(jié)來(lái),王靜.單純ARIMA模型和GRNN-ARIMA組合模型在猩紅熱發(fā)病率中的研究[J].中華流行病學(xué)雜志,2009,30(9):964-966.

[8]章勤,田晶,孫傲冰,等.基于BP神經(jīng)網(wǎng)絡(luò)的矽肺病組合模型預(yù)測(cè)研究[J].計(jì)算機(jī)科學(xué),2009,36(4):265-269.

[9]嚴(yán)薇榮,徐勇,楊小兵,等.基于ARIMA-GRNN組合模型的傳染病發(fā)病率預(yù)測(cè)[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(1):82-83.

猜你喜歡
口病權(quán)值遺傳算法
一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
2010—2019年寶雞市手足口病流行特征及時(shí)空聚集分析
基于遺傳算法的高精度事故重建與損傷分析
手足口病那些事
警惕手足口病
基于遺傳算法的智能交通燈控制研究
強(qiáng)規(guī)劃的最小期望權(quán)值求解算法?
計(jì)算機(jī)測(cè)量與控制(2018年3期)2018-03-27
腸道病毒71型感染所致危重癥手足口病的診治分析
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用