国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LSTM模型對(duì)印度新冠肺炎疫情的預(yù)測(cè)

2022-03-21 14:29王劍輝蔣杏麗
關(guān)鍵詞:準(zhǔn)確度時(shí)刻印度

王劍輝, 蔣杏麗

(沈陽(yáng)師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽(yáng) 110034)

0 引 言

印度于2020年1月30日?qǐng)?bào)告了首例新冠肺炎疫情確診病例,隨后疫情在印度蔓延并暴發(fā)。截至文章成稿時(shí),印度累計(jì)確診人數(shù)已經(jīng)超過了4 000萬(wàn),僅次于美國(guó)[1]。新冠肺炎疫情很難被預(yù)知和掌控,很多學(xué)者建立神經(jīng)網(wǎng)絡(luò)模型來預(yù)測(cè)新冠的傳播規(guī)律和發(fā)展趨勢(shì)。

機(jī)器學(xué)習(xí)和人工智能(artificial intelligence)算法被廣泛用于預(yù)測(cè)分析和模式識(shí)別[2]。國(guó)內(nèi)外眾多研究者也利用機(jī)器學(xué)習(xí)[3]和SEIR(susceptible-exposed-infectious-recovered)模型[4]去分析并預(yù)測(cè)新冠肺炎疫情。Hidayat等[5]利用線性回歸、向量自回歸和多層感知機(jī)模型來預(yù)測(cè)印度新冠肺炎疫情。Saleh等[6-7]使用差分自回歸移動(dòng)平均(auto regressive integrated moving average model,ARIMA)模型預(yù)測(cè)西班牙、意大利等受疫情影響較大的國(guó)家的經(jīng)濟(jì)狀況。與循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[8]相比,LSTM在處理時(shí)間序列并具長(zhǎng)期記憶的數(shù)據(jù)時(shí)更有優(yōu)勢(shì),它更適用于對(duì)長(zhǎng)序列數(shù)據(jù)進(jìn)行分類、處理及預(yù)測(cè)[9-10]。

首先采集印度確診病例數(shù)據(jù),數(shù)據(jù)預(yù)處理并劃分后應(yīng)用到LSTM模型上,在訓(xùn)練的過程中使用Adam優(yōu)化器不斷優(yōu)化模型直至完成所定義的Epoch。

1 數(shù)據(jù)集提取與LSTM模型

1.1 LSTM數(shù)據(jù)集

研究使用的數(shù)據(jù)集是印度在2022年3月1日至2022年11月8日期間的新冠肺炎累計(jì)確診病例, 數(shù)據(jù)來源于印度疫情實(shí)時(shí)大數(shù)據(jù)報(bào)告網(wǎng)站。 將建模需要的確診病例提取出來, 部分確診病例數(shù)據(jù)見表1。

表1 部分印度每日確診病例數(shù)

數(shù)據(jù)預(yù)處理后,將3月1日至9月7日期間的數(shù)據(jù)按7∶3的比例劃分為訓(xùn)練集和測(cè)試集2個(gè)部分。其中,訓(xùn)練集用來訓(xùn)練LSTM模型[11]使其參數(shù)最優(yōu)化,測(cè)試集對(duì)建立的預(yù)測(cè)模型進(jìn)行驗(yàn)證并調(diào)試參數(shù)。為了能實(shí)現(xiàn)根據(jù)已知確診病例來預(yù)測(cè)未來任意一段時(shí)間內(nèi)確診病例的目的,將后3個(gè)月(9月8日至11月8日)的數(shù)據(jù)用于模型實(shí)際應(yīng)用,以便于觀察出模型的預(yù)測(cè)效果。

1.2 LSTM預(yù)測(cè)模型

LSTM模型是由Hochreiter和Schmidhuber于20世紀(jì)90年代提出的一種特殊的RNN,它很好地解決了RNN梯度消失和梯度爆炸等重大問題。LSTM模型結(jié)構(gòu)如圖1所示。

在某一時(shí)刻,LSTM的輸入包括當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入值xt、上一時(shí)刻LSTM的輸出值ht-1以及上一時(shí)刻的單元狀態(tài)ct-1;輸出包含當(dāng)前時(shí)刻LSTM的輸出值ht和當(dāng)前時(shí)刻的單元狀態(tài)ct。在LSTM中,有3個(gè)門[12]來控制長(zhǎng)期狀態(tài),每個(gè)門[13]利用sigmoid函數(shù)來篩選數(shù)據(jù),0代表不通過,1代表通過。

圖1 LSTM模型內(nèi)部結(jié)構(gòu)Fig.1 Internal structure of LSTM model

2 LSTM預(yù)測(cè)模型的建立及評(píng)估

建立LSTM模型預(yù)測(cè)印度某段時(shí)間內(nèi)新冠肺炎疫情的確診數(shù), 模型分為輸入層、LSTM層和輸出層。 輸入層中節(jié)點(diǎn)數(shù)是提取到的數(shù)據(jù)數(shù)量, LSTM隱藏層數(shù)設(shè)置為4, 輸出層引入一個(gè)全連接層來將最后結(jié)果降成一維并輸出。 將參數(shù)Batch_Size設(shè)置為1, Epoch設(shè)置為100, 學(xué)習(xí)率設(shè)置為0.001, 此外還使用了Adam算法[14]作為模型優(yōu)化器, 將MSE作為模型的損失函數(shù), 選用準(zhǔn)確度作為模型的評(píng)價(jià)指標(biāo)。 對(duì)比LSTM和SVM模型的準(zhǔn)確度得到二者的擬合效果, 準(zhǔn)確度越大說明模型預(yù)測(cè)效果越好。

圖2為印度在3月1日至9月7日的新冠肺炎確診病例折線圖。

圖2 每日確診病例數(shù)Fig.2 Daily number of confirmed cases

將3月1日至9月7日數(shù)據(jù)的70%用于訓(xùn)練模型,剩下的數(shù)據(jù)用于對(duì)模型進(jìn)行測(cè)試。最后結(jié)果如圖3和圖4所示,建立的預(yù)測(cè)模型的損失值隨著Epoch增大而減小,模型的真實(shí)值與預(yù)測(cè)值擬合效果較好。

圖3 LSTM模型損失值Fig.3 Loss value of LSTM model

圖4 模型預(yù)測(cè)值與真實(shí)值對(duì)比

訓(xùn)練好LSTM模型后,圖5為模型對(duì)印度9月8日至11月8日預(yù)測(cè)的確診病例數(shù),圖6是同樣時(shí)間段印度疫情實(shí)際確診病例數(shù)統(tǒng)計(jì),對(duì)比可知模型確實(shí)能夠成功預(yù)測(cè)未來某段時(shí)間內(nèi)的新冠肺炎疫情發(fā)展情況。最終得到LSTM預(yù)測(cè)模型的準(zhǔn)確度為87.49%,而SVM模型的準(zhǔn)確度僅為73.25%,表明在新冠肺炎疫情預(yù)測(cè)的效果上LSTM更準(zhǔn)確。

圖5 60天內(nèi)確診病例預(yù)測(cè)數(shù)Fig.5 Prediction of confirmed cases within 60 days

圖6 確診實(shí)際數(shù)據(jù)Fig.6 Actual data of confirmed cases

3 結(jié) 論

本文收集印度新冠肺炎累計(jì)確診病例數(shù)后,運(yùn)用深度學(xué)習(xí)中的LSTM算法對(duì)其某一段時(shí)間內(nèi)的累計(jì)確診病例數(shù)進(jìn)行預(yù)估。目前使用LSTM模型預(yù)測(cè)印度新冠肺炎病例數(shù)的研究并不多,由于數(shù)據(jù)大小受限,該模型的預(yù)測(cè)準(zhǔn)確率還需要進(jìn)一步提高。

猜你喜歡
準(zhǔn)確度時(shí)刻印度
冬“傲”時(shí)刻
捕獵時(shí)刻
五彩繽紛的灑紅節(jié) 印度
幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
印度簽訂長(zhǎng)單合同 需求或?qū)p弱
動(dòng)態(tài)汽車衡準(zhǔn)確度等級(jí)的現(xiàn)實(shí)意義
一款基于18位ADC的高準(zhǔn)確度三相標(biāo)準(zhǔn)表的設(shè)計(jì)
印度式拆遷
印度運(yùn)載火箭的現(xiàn)在與未來
一天的時(shí)刻