国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

COVID-19疫情預(yù)測模型的研究進展

2022-03-24 08:16鄧遠嘉董明華楊白彬
關(guān)鍵詞:傳染病病例預(yù)測

鄧遠嘉,董明華,楊白彬

(1. 贛南醫(yī)學(xué)院2019級碩士研究生;2. 贛南醫(yī)學(xué)院預(yù)防醫(yī)學(xué)系流行病學(xué)教研室;3. 贛南醫(yī)學(xué)院2018級本科預(yù)防醫(yī)學(xué)專業(yè),江西 贛州 341000)

2020 年1 月,新型冠狀病毒肺炎(Corona virus disease 2019,COVID-19)疫情在武漢暴發(fā),1月30日,世界衛(wèi)生組織將COVID-19 疫情列為“國際關(guān)注的突發(fā)公共衛(wèi)生事件”,3 月11 日晚間,世界衛(wèi)生組織宣布,COVID-19疫情已經(jīng)構(gòu)成全球性大流行(Pandemic)。據(jù)約翰霍普金斯大學(xué)網(wǎng)站數(shù)據(jù)統(tǒng)計,截至2021 年8月16 日19 時,國內(nèi)累計確診病例106 529 例,死亡病例4 848例,美國累計確診病例36 680 287例,死亡病例621 636 例,全球累計確診病例207 278 035 例,死亡病例4 364 473 例[1]。COVID-19 疫情傳播速度極快、感染范圍極廣、防控難度極大,是第二次世界大戰(zhàn)結(jié)束以來最嚴(yán)重的全球危機和全球公共衛(wèi)生突發(fā)事件。

在公共衛(wèi)生領(lǐng)域,通過建立數(shù)學(xué)模型研究傳染病的發(fā)展趨勢是較為重要的研究方法。疫情初期,傳染病模型可以預(yù)測疫情的發(fā)生、發(fā)展和傳播規(guī)律,預(yù)測疫情拐點和頂峰;疫情中期,可以評價防疫控制措施的效果;疫情后期,可以開展預(yù)警、監(jiān)控疫情發(fā)展[2]。本文主要闡述5 種不同類型的疫情預(yù)測模型,并歸納總結(jié)近期COVID-19 疫情預(yù)測模型的研究進展。

1 COVID-19基本概況

COVID-19 是由嚴(yán)重急性呼吸綜合征冠狀病毒2型(SARS-CoV-2)感染引起的急性呼吸道疾病,屬于乙類傳染病,按甲類傳染病管理。SARS-CoV-2 可通過包括飛沫、氣凝膠、皮膚接觸或直接接觸帶病毒的分泌物進行傳播[3],幾乎人人易感[4]。研究發(fā)現(xiàn)基本再生數(shù)為1.4~6.49[5],潛伏期平均為5.5天[6],病死率約為5%[7],截止至2021 年8 月16 日全球累積治愈率74.6%[1],免疫時間約5個月[8]。

但目前文獻研究的COVID-19 相關(guān)指標(biāo)僅供參考,SARS-CoV-2為RNA 病毒,隨著疫情的發(fā)展,病毒仍在變異中,疫情的傳染病相關(guān)指標(biāo)在后續(xù)疫情中是否適用仍然未知,因此后期仍要重視基本再生數(shù)、潛伏期等傳染病基本參數(shù)的研究。

2 疫情預(yù)測模型概述

疫情預(yù)測模型也稱傳染病預(yù)測模型,是通過數(shù)學(xué)模型的方法來模擬疾病的流行過程,用以探討疾病流行的動力學(xué),從而為疾病預(yù)防和控制、衛(wèi)生策略地制定提供服務(wù),屬于理論流行病學(xué)研究范疇[9]。其基本原理是流行病學(xué)結(jié)合數(shù)學(xué)、統(tǒng)計學(xué)、運籌學(xué)、系統(tǒng)科學(xué)以及計算機科學(xué)等學(xué)科理論,根據(jù)疾病特點、研究需求和疫情數(shù)據(jù)類型選用常微分方程、離散概率分布、決策樹、復(fù)雜網(wǎng)絡(luò)以及元啟發(fā)算法等合適工具建立模型,用以分析研究時滯效應(yīng)、空間異質(zhì)性、人口流動等因素對疫情的影響,進而達到有效準(zhǔn)確預(yù)測疫情發(fā)展趨勢、評價防疫干預(yù)效果、評估地區(qū)風(fēng)險等目的。目前常見的有時間序列模型、傳染病動力學(xué)模型、復(fù)雜網(wǎng)絡(luò)模型、機器學(xué)習(xí)模型以及多學(xué)科交叉的混合模型等五類模型。

2.1 時間序列模型 COVID-19疫情的確診病例、康復(fù)病例以及死亡病例等歷史數(shù)據(jù)均屬時間序列,適用于時間序列模型,此模型可以研究疫情數(shù)據(jù)和時間的關(guān)系,常用的有自回歸模型(Autoregressive model,AR)、移動平均模型(Moving average model,MA)、自回歸移動平均模型(Autoregressive moving av‐erage model,ARMA)。

本次COVID-19 疫情數(shù)據(jù)的時間序列存在上升和下降趨勢,且屬于齊次非平穩(wěn)時間序列,因此適用差分整合移動平均自回歸模型(Autoregressive inte‐grated moving average mode,ARIMA),也有研究者為考慮疫情變化趨勢的影響,對疫情數(shù)據(jù)進行加權(quán)線性變換采用特殊加權(quán)移動平均模型即指數(shù)平滑模型開展研究[10],而實際研究中大部分采用ARIMA 模型預(yù)測COVID-19 疫情[11],只是不同的研究在自回歸階數(shù)p、差分次數(shù)d、移動平均階數(shù)q 等參數(shù)設(shè)定上略有差異。

但由于時間序列模型本身的限制,模型依賴于內(nèi)生變量即數(shù)據(jù)本身,未考慮與因變量相關(guān)的其他變量,傳統(tǒng)的時間序列分析方法不能捕捉非線性關(guān)系,只適合進行中短期預(yù)測,難以評價干預(yù)措施效果,因此適用范圍較小。

2.2 傳染病動力學(xué)模型 傳染病動力學(xué)模型是COVID-19 疫情預(yù)測應(yīng)用較多的一類模型,能夠考慮傳播速度、傳播模式及各種防控措施等因素對疫情的影響,一般而言會將受新型冠狀病毒肺炎疫情影響的總?cè)巳悍譃橐赘腥巳海⊿usceptible,S)、暴露人群(Ex‐posed,E)、感染人群(Infectious,I)和康復(fù)人群(Recov‐ered,R)4 類,此外病死人群(Deceased,D)在模型中會被歸入康復(fù)人群一同移出總?cè)巳?。基于COVID-19有潛伏期、可治愈的特點,SEIR 模型較為符合疫情實際也較為常用,如有研究者引入死亡病例等人群因素[12]、交通路線等空間因素[13]、時間滯后效應(yīng)等時間因素[14]開展研究和討論。但也有研究者采用SIR、SISR、SEIRD 等模型,甚至更為復(fù)雜的SEIQHRS、SEIHCRD模型。

由于傳染病動力學(xué)模型考慮的參數(shù)難以全面估計,且參數(shù)可能在疫情不同階段發(fā)生動態(tài)變化,因此預(yù)測效果往往不佳,但對早期預(yù)警、防控決策支持及防控效果評價具有重要的應(yīng)用價值[15]。不同國家和地區(qū)對隔離和檢疫人群的劃分標(biāo)準(zhǔn)不盡相同,人為劃分人群類型的單一傳染病動力學(xué)模型與真實情況存在差異,模型的適用性有限,難以保證預(yù)測效果。同時考慮復(fù)陽患者的存在、新冠病毒變異、免疫力有限以及二次感染等情況,康復(fù)人群有可能轉(zhuǎn)變?yōu)橐赘腥巳?,因此SEIRS 模型可能比SEIR 模型更加貼近真實情況,但目前SEIRS 模型的研究較少,SEIRS 模型的深入研究值得重視,如多種群SEIRS模型的全局穩(wěn)定性等問題[16]。

2.3 復(fù)雜網(wǎng)絡(luò)模型 復(fù)雜網(wǎng)絡(luò)根據(jù)其拓?fù)浣Y(jié)構(gòu)可以分為完全隨機網(wǎng)絡(luò)、完全規(guī)則網(wǎng)絡(luò)、小世界網(wǎng)絡(luò)和無標(biāo)度網(wǎng)絡(luò)4 類[2],而新型冠狀病毒肺炎疫情全球大流行的背景是社會和經(jīng)濟高速發(fā)展的21 世紀(jì),擁有發(fā)達的互聯(lián)網(wǎng)和交通網(wǎng)絡(luò)的現(xiàn)實環(huán)境,具有復(fù)雜網(wǎng)絡(luò)的小世界效應(yīng)、無標(biāo)度特性等特點。通過復(fù)雜網(wǎng)絡(luò)模型,可以更加深入地研究隔離、人員流動等空間因素對COVID-19 疫情的影響。裴韜等研究表明,COVID-19疫情中復(fù)雜人流網(wǎng)絡(luò)的時空傳播呈現(xiàn)典型的網(wǎng)絡(luò)特征[17],而HURD T R 也將現(xiàn)實社會視為一個非齊次隨機社會網(wǎng)絡(luò)進而研究極端異質(zhì)性人群的新型冠狀病毒肺炎疫情傳播情況[18]。

2.3.1 無標(biāo)度網(wǎng)絡(luò)模型 BLASIUS B發(fā)現(xiàn)COVID-19疫情確診病例在全球呈現(xiàn)冪律分布,即少數(shù)國家流行率較高,而許多國家的流行率較低,國家之間的流行率過度呈現(xiàn)無標(biāo)度網(wǎng)絡(luò)的特點[19],而基因組學(xué)的研究也顯示疫情傳播網(wǎng)絡(luò)是無標(biāo)度的,少數(shù)基因組變異導(dǎo)致了大多數(shù)可能的傳播[20]。在無標(biāo)度網(wǎng)絡(luò)的背景框架下,SONG W Y 等評價了大規(guī)模遷徙對COVID-19 疫情影響[21]。此外,無標(biāo)度網(wǎng)絡(luò)模型還可以用于描述超級傳播者事件,但目前COVID-19 疫情研究中此類研究較少,值得關(guān)注。

2.3.2 小世界網(wǎng)絡(luò)模型 受疫情影響下的城市和社區(qū)適用小世界網(wǎng)絡(luò)模型描述其相對封閉、內(nèi)部人員聯(lián)系緊密的空間特點,BRETHOUWER J T 在小世界網(wǎng)絡(luò)的空間背景下建立了SEIR 模型,研究發(fā)現(xiàn)減少遠距離傳輸對于遏制COVID-19 疫情擴散非常有效[22]。

復(fù)雜網(wǎng)絡(luò)模型適用于描述疫情的空間背景,但其本身并不能預(yù)測疫情的發(fā)展趨勢,需要結(jié)合時間序列模型和傳染病動力學(xué)模型等方法開展預(yù)測,但復(fù)雜網(wǎng)絡(luò)模型更加貼近真實世界的空間特點,具有較好的預(yù)測潛力。

2.4 機器學(xué)習(xí)模型 機器學(xué)習(xí)具有自主學(xué)習(xí)、適用范圍廣、泛化能力強等特點,適用于COVID-19 疫情復(fù)雜多變、數(shù)據(jù)樣本量大、高維度的數(shù)據(jù),因此人工神經(jīng)網(wǎng)絡(luò)[23]、支持向量機(Support vector machine,SVM)[23]、隨機化過程[24]和貝葉斯學(xué)習(xí)[25]等機器學(xué)習(xí)相關(guān)理論和技術(shù)越來越多地被運用到COVID-19 疫情預(yù)測研究中。

2.4.1 人工神經(jīng)網(wǎng)絡(luò)模型 人工神經(jīng)網(wǎng)絡(luò)具有較強的自主學(xué)習(xí)和自適應(yīng)能力,黃麗紅等認(rèn)為人工神經(jīng)網(wǎng)絡(luò)模型可以綜合考慮不同防控措施以及多種因素的影響,如果考慮得當(dāng),預(yù)測效果將會有所提高[15]。HAO Y 對比Elman 神經(jīng)網(wǎng)絡(luò)、SVM 和長短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long short-term memory,LSTM)的預(yù)測效果,發(fā)現(xiàn)Elman 神經(jīng)網(wǎng)絡(luò)和SVM 都可以預(yù)測新增的確診病例、死亡病例和康復(fù)病例,而LSTM更適合預(yù)測累計確診病例[23],三種模型在適用范圍上略有差異。但人工神經(jīng)網(wǎng)絡(luò)模型類似黑箱,缺少透明度,推理功能有所欠缺,面對復(fù)雜多變的疫情形勢其預(yù)測效果有限,因此也有研究者采用自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive network-based fuzzy infer‐ence system,ANFIS)預(yù)測COVID-19 疫情[12],以彌補人工神經(jīng)網(wǎng)絡(luò)在推理功能、知識和經(jīng)驗上的不足。

2.4.2 隨機化過程 疫情受多方面隨機因素影響,一般用馬爾可夫模型可以較好刻畫這些隨機因素的作用。有研究者運用馬爾可夫模型模擬個人在S、E、I、R不同狀態(tài)的隨機轉(zhuǎn)換,進而探究COVID-19疫情對無家可歸者的影響[24]。

2.4.3 貝葉斯學(xué)習(xí) 貝葉斯預(yù)測模型可以充分利用經(jīng)驗和判斷等先驗信息,將主觀因素和客觀因素結(jié)合起來預(yù)測,相對靈活,如JHA P K 采用貝葉斯學(xué)習(xí)方法對混合理論連續(xù)模型進行校準(zhǔn)、驗證和預(yù)測[25]。與普通回歸預(yù)測模型相比較,貝葉斯預(yù)測模型在先驗經(jīng)驗上具有一定的優(yōu)越性。

2.5 多學(xué)科交叉模型 COVID-19 疫情的空間和時間跨度大,疫情傳播過程復(fù)雜涉及數(shù)學(xué)、醫(yī)學(xué)、統(tǒng)計學(xué)、動力學(xué)、地理科學(xué)、運籌學(xué)、公共管理學(xué)等諸多領(lǐng)域,疫情預(yù)測模型的研究也呈現(xiàn)多學(xué)科交叉特點。多學(xué)科交叉的預(yù)測模型在疫情的空間傳播速度、不同場景的疫情預(yù)測、復(fù)工復(fù)產(chǎn)評估、疫情風(fēng)險地區(qū)預(yù)測以及確診人數(shù)估計等方面發(fā)揮較大優(yōu)勢,為不同環(huán)節(jié)和場景疫情干預(yù)措施制定提供了有力的理論指導(dǎo)。

2.5.1 地理模型 王聰?shù)冉Y(jié)合百度遷徙規(guī)模指數(shù)運用時域差分模型,推導(dǎo)疫情首次達到特定行政區(qū)域的可能時間[26],應(yīng)申等通過GIS空間分析技術(shù)中的五元組模型(主體、活動、對象、時間和位置等五個元素)實現(xiàn)了病例數(shù)據(jù)的計算機自動化處理,快速獲取疫情發(fā)展?fàn)顩r,推演疫情傳播過程[27]。

2.5.2 大數(shù)據(jù)模型 周松等采用疫情專題、行政區(qū)劃、基礎(chǔ)底圖、人口遷徙以及常住人口等時空大數(shù)據(jù),運用Logistic 模型擬合江蘇省確診人數(shù)變化趨勢并開展疫情高危地區(qū)預(yù)測[28],孟杰等基于手機定位大數(shù)據(jù)構(gòu)建了捕獲再捕獲模型,估計COVID-19 高危人群總量,并可以用于識別與監(jiān)測復(fù)產(chǎn)復(fù)工中的高風(fēng)險人群[29]。PASARIBU U S 采用廣義時空自回歸(Generalized space time autoregressive,GSTAR)模型研究爪哇島COVID-19疫情傳播的空間依賴性[30]。

2.5.3 運籌學(xué)模型 石耀霖等采用排隊論的Erlang概率分布對每日確診病人數(shù)據(jù)進行處理,估計每日新發(fā)病和未來10 日的確診人數(shù),可以較快獲得比較可靠的近期確診人數(shù)數(shù)據(jù)[31]。BIRD J J 將決策論中的決策樹算法與梯度提升法結(jié)合用于預(yù)測不同國家的疫情傳播風(fēng)險[32],SAHIN U 等使用灰色預(yù)測模型預(yù)測累積病例數(shù)[33]。此外,COVID-19 疫情的長期抗?fàn)幤鋵嵸|(zhì)是人與SARS-CoV-2 的長期博弈,疫情早期的醫(yī)療資源擠兌與方艙醫(yī)院的建立,疫情后期SARS-CoV-2變異與人免疫力的提高等現(xiàn)象都是博弈的過程,博弈論也為COVID-19 疫情預(yù)測模型研究提供了新的視角。

2.5.4 其他模型 此外,還有研究者將元胞自動機與傳染病動力學(xué)模型聯(lián)合使用建模,模擬復(fù)雜系統(tǒng)下COVID-19 疫情的傳播情況[34];使用灰狼算法等元啟發(fā)算法優(yōu)化COVID-19 疫情預(yù)測模型[35];引入動態(tài)面板數(shù)據(jù)模型反映COVID-19 疫情的動態(tài)滯后效應(yīng)[36];使用非參數(shù)方法如核密度估計模型預(yù)測武漢封城與不封城的發(fā)病風(fēng)險[37];使用基于常微分方程的人口區(qū)劃模型研究空間異質(zhì)性對COVID-19 疫情的影響[38]。

同時在疫情預(yù)測研究中,單純的數(shù)學(xué)模型理論和方法存在一些自身理論無法解決的問題,如不同數(shù)據(jù)庫的數(shù)據(jù)顆粒度不一致、不同空間和時間的疫情傳播速度不一致。個體生理變化、交通情況等現(xiàn)實數(shù)據(jù)的獲取,接觸者的實施監(jiān)測和追蹤等需要多學(xué)科共同合作,多學(xué)科合作是COVID-19 疫情預(yù)測模型研究的趨勢。

綜上所述,COVID-19疫情預(yù)測模型的種類較多,不同模型在適用范圍和參數(shù)設(shè)置等方面存在差異(表1)。時間序列模型適用于探究COVID-19 疫情數(shù)據(jù)和時間因素的關(guān)系;傳染病動力學(xué)模型可以納入不同的參數(shù)研究實際傳播情況和防控措施等因素,但目前COVID-19 疫情的傳染率、病死率和治愈率等參數(shù)仍在動態(tài)變化,預(yù)測效果難以保證;復(fù)雜網(wǎng)絡(luò)模型則是適用于疫情空間網(wǎng)絡(luò)特征對疫情的影響;機器學(xué)習(xí)模型適用范圍廣,但對數(shù)據(jù)的要求較高;同時多個模型聯(lián)合使用、取長補短的混合模型也是COVID-19 疫情預(yù)測的研究趨勢;此外,多學(xué)科交叉模型的預(yù)測效果也不錯,提供了數(shù)理統(tǒng)計、地理交通、公共管理和運籌學(xué)等多領(lǐng)域的研究視角,進一步推進對COVID-19 疫情的三間分布和發(fā)生發(fā)展的了解和認(rèn)識。

表1 COVID-19疫情預(yù)測模型

續(xù)表1 COVID-19疫情預(yù)測模型

3 展 望

目前,針對COVID-19 疫情各地研究人員開展了諸多研究,在疫情傳播規(guī)律研究、防控效果評估和預(yù)警監(jiān)測等方面取得了較好的效果。但目前的研究依然面臨一些難點和問題,部分研究直接采用網(wǎng)絡(luò)大數(shù)據(jù),未對數(shù)據(jù)進行處理,與真實數(shù)據(jù)存在一定的差異;疫情數(shù)據(jù)顆粒度較大,具體到患者個體的詳細(xì)數(shù)據(jù)難以統(tǒng)計和獲得;各類模型對應(yīng)用環(huán)境較為敏感,適用場景不同的模型應(yīng)用存在一定的局限性,缺少普適性的模型;數(shù)學(xué)建??刹捎肕atlab、SPSS、SAS、R、Python 等多種工具,不同軟件的算法不同,輸出的結(jié)果和形式也不同,應(yīng)用范圍不一,不同的研究和模型之間難以統(tǒng)一量化評價;研究主要聚焦在建立模型方面,根據(jù)后續(xù)疫情數(shù)據(jù)對模型開展驗證和評價的研究較少;部分研究只考慮部分防控措施的影響,未全面考慮各防控措施的綜合影響,與真實世界割裂,準(zhǔn)確性有待提高;COVID-19病毒處于變異過程中,變異后的病毒在傳播路徑、傳染力和病人病毒載量等都與之前存在較大差異,先前的預(yù)測模型可能不適用于變異之后的疫情場景。因此總體而言,疫情數(shù)據(jù)處理、模型適用場景、模型檢驗和評價以及模型準(zhǔn)確性等方面值得關(guān)注,有待進一步深入研究。

猜你喜歡
傳染病病例預(yù)測
無可預(yù)測
《傳染病信息》簡介
傳染病的預(yù)防
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
選修2—2期中考試預(yù)測卷(A卷)
3種傳染病出沒 春天要格外提防
“病例”和“病歷”
本土現(xiàn)有確診病例降至10例以下
妊娠期甲亢合并胎兒甲狀腺腫大一例報告
麻阳| 宁明县| 芦溪县| 新津县| 浮梁县| 耿马| 沂源县| 泽普县| 英山县| 太仓市| 邻水| 逊克县| 马关县| 汽车| 抚松县| 宜兰市| 宣恩县| 丹棱县| 吴忠市| 河津市| 定襄县| 盘山县| 永吉县| 调兵山市| 额尔古纳市| 高唐县| 合肥市| 精河县| 辉县市| 五原县| 镇沅| 连平县| 平和县| 天祝| 永川市| 无锡市| 来凤县| 宁明县| 门源| 图们市| 巍山|