童易成等
[摘要]針對(duì)埃博拉病毒的影響程度,利用線性回歸、非線性回歸、函數(shù)變換等分析方法,分別建立疫情較為嚴(yán)重的幾個(gè)國(guó)家的埃博拉病毒感染人數(shù)規(guī)模變動(dòng)、新藥研制期限模型,運(yùn)用Matlab7、Excel等軟件計(jì)算得出埃博拉疫情爆發(fā)與時(shí)間的關(guān)系及研制對(duì)抗埃博拉病毒新藥的最終期限。
[關(guān)鍵詞]埃博拉疫情;線性回歸;非線性回歸
[中圖分類號(hào)]R1818+1[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]
2095-3283(2015)08-0140-03
[作者簡(jiǎn)介]童易成(1993-),女,安徽安慶人,本科生,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)。
[通訊作者]朱家明(1973-),男,安徽泗縣人,數(shù)學(xué)建模實(shí)驗(yàn)室主任,副教授,碩士,研究方向:應(yīng)用數(shù)學(xué)與數(shù)學(xué)建模。
[基金項(xiàng)目]國(guó)家自然科學(xué)基金(項(xiàng)目編號(hào):11301001);安徽財(cái)經(jīng)大學(xué)教研項(xiàng)目(項(xiàng)目編號(hào):acjyzd201429)。
埃博拉(Ebola virus)是一種能夠引發(fā)人類和靈長(zhǎng)類動(dòng)物產(chǎn)生埃博拉出血熱的烈性傳染病病毒,十分罕見,死亡率也相當(dāng)高。1976年這種病毒在蘇丹南部和剛果(金)(舊稱扎伊爾)的埃博拉河地區(qū)被發(fā)現(xiàn)后,引發(fā)了醫(yī)學(xué)界的廣泛關(guān)注和重視,該病毒也因此得名。本文根據(jù)從世界衛(wèi)生組織獲得的埃博拉病毒在非洲各國(guó)爆發(fā)的感染和死亡數(shù)據(jù),按照當(dāng)年感染人數(shù)規(guī)模,選取疫情較為嚴(yán)重的國(guó)家進(jìn)行研究,并分析研制出治療這種疾病的新藥的最終期限。
一、埃博拉病毒感染人數(shù)規(guī)模變動(dòng)趨勢(shì)
(一)研究思路
根據(jù)從世界衛(wèi)生組織獲得的關(guān)于埃博拉病毒在非洲各國(guó)爆發(fā)的感染和死亡數(shù)據(jù),按照當(dāng)年感染人數(shù)規(guī)模,選取疫情較為嚴(yán)重的國(guó)家搜集相關(guān)數(shù)據(jù),大致擬合出這些國(guó)家的感染人數(shù)的趨勢(shì)方程,并根據(jù)方程判斷埃博拉病毒感染人數(shù)規(guī)模變動(dòng)情況,做出正確預(yù)測(cè)。
(二)數(shù)據(jù)處理
根據(jù)世界衛(wèi)生組織的相關(guān)數(shù)據(jù),選取剛果民主共和國(guó)、蘇丹、加蓬、烏達(dá)干四個(gè)疫情較為嚴(yán)重的國(guó)家(見表1)。
根據(jù)表1數(shù)據(jù)分別繪出埃博拉感染和死亡人數(shù)與年份的折線圖(見圖1)。由圖1可知,1976年、1995年、2000年、2003年、2007年埃博拉病毒疫情爆發(fā)規(guī)模較大,感染人數(shù)在(178,602)范圍內(nèi),時(shí)間間隔分別為19、5、3、4年,爆發(fā)周期縮短,可見埃博拉疫情爆發(fā)趨于頻繁。
圖11970—2010年埃博拉病毒感染人數(shù)與死亡人數(shù)
由于不同年份感染人數(shù)存在較大差別,故將因埃博拉病毒導(dǎo)致的年感染人數(shù)超過150人的年份定為一級(jí)疫情年份,年感染人數(shù)在150人以下的定為二級(jí)疫情年份。一級(jí)疫情的年份周期浮動(dòng)在3—5年,由此推斷2006—2025年期間一級(jí)疫情爆發(fā)的年份將在區(qū)間[2003+3i,2005+3i]之內(nèi)。
通過線性擬合的方法處理1979年以來(lái)的埃博拉病毒一級(jí)疫情年份的感染人數(shù)數(shù)據(jù),用于模擬疫情感染人數(shù)的趨勢(shì):y=a+bx,通過軟件Matlab7計(jì)算得到a=10921,b=5548,即:y=-10921+5548x。該公式表示自1976年首次爆發(fā)疫情后的第x年感染人數(shù)為y。
然而,由于一級(jí)疫情年份與二級(jí)疫情年份是呈周期性變化的,并非單純直線增長(zhǎng),所以實(shí)際中每次埃博拉疫情出現(xiàn)時(shí)的感染人數(shù)y與此處擬合值偏差很大。從擬合的直線得到b=5548>0,可知埃博拉一級(jí)疫情爆發(fā)呈周期性增長(zhǎng)趨勢(shì)。由圖1也可知二級(jí)疫情年份的爆發(fā)也呈周期性增長(zhǎng)趨勢(shì)??梢越⒎匠淌饺缦拢?/p>
y=a1(n-1975)+b1,n為一級(jí)疫情年份a2(n-1975)+b2,n為二級(jí)疫情年份
n∈[2003+3i,2005+3i],i=1,2,3,4,5,6,7
通過計(jì)算得到a1=75321,b1=19101,a2=26042,b2=21471,即
y=
75321(n-1975)+19101,n為一級(jí)疫情年份26042(n-1975)+21471,n為二級(jí)疫情年份,
一級(jí)疫情年份n∈[2003+3i,2005+3i],i=1,2,3,4,5,6,7
由此可以得到2006—2025年的疫情情況(見表2)。由于一級(jí)疫情爆發(fā)具有周期性,但這種周期只是一個(gè)范圍,并不能具體到特定的數(shù)字,所以選取其中的一種情況,即周期是3年時(shí),預(yù)測(cè)2006—2025年間埃博拉病毒感染人數(shù)。
(三)結(jié)果分析
由表2可知,在埃博拉疫情爆發(fā)后,沒有藥物介入治療的情況下,2006年的感染人數(shù)為103人;2007年出現(xiàn)一級(jí)疫情時(shí),感染人數(shù)為433人;到了2010年,感染人數(shù)達(dá)到568人?;诎2├咔橐?guī)模逐年遞增的特點(diǎn),疫情如果得不到有效的藥物控制,死亡人數(shù)將是相當(dāng)可觀的,這不僅對(duì)非洲人民甚至對(duì)全世界來(lái)說都將是巨大的災(zāi)難。
二、治療埃博拉感染新藥研制最終期限的研究
(一)研究思路
在埃博拉疫情爆發(fā)初期,由于得不到社會(huì)的足夠重視,所以疫情處于自由蔓延時(shí)期,感染和死亡人數(shù)都會(huì)不斷增長(zhǎng)。但在到達(dá)高峰期后,感染和死亡人數(shù)會(huì)逐漸減少,然后保持平穩(wěn)。因此,從疫情初發(fā)期到高峰期不妨設(shè)定每位感染者平均每天可傳染的人數(shù)是固定不變的。
(二)數(shù)據(jù)處理
埃博拉病毒在感染者體內(nèi)的侵染過程可分為三個(gè)階段。第一階段:假如一個(gè)人不幸感染埃博拉病毒,在感染初期埃博拉病毒已經(jīng)開始摧毀人體的免疫系統(tǒng),這類病毒的潛伏期一般是5—10天;第二階段:埃博拉病毒進(jìn)一步侵染感染者的身體,幾天后便達(dá)到感染者身體承受極限,一些幸運(yùn)的感染者通過有效治療病情沒有進(jìn)一步惡化并慢慢痊愈,而其他一些感染者則會(huì)發(fā)展到致命階段;第三階段:絕大多數(shù)感染者將因?yàn)槎鄠€(gè)器官衰竭、出血不止或者是休克而死亡,這種情況一般發(fā)生在第一次發(fā)病后的8—17天之間。endprint
關(guān)于這類問題的研究,可以通過建立阻滯增長(zhǎng)模型來(lái)解決。阻滯作用體現(xiàn)在對(duì)感染病人的增長(zhǎng)率r的影響上,使得r隨著感染人數(shù)y的增加而下降。若將r表示為y的函數(shù)ry,那么可以看出該函數(shù)是一個(gè)減函數(shù)。因此有:
dxdt=ryy,y0=y0(1)
對(duì)ry的一個(gè)最簡(jiǎn)單的假定是,設(shè)ry為y的線性函數(shù)。即:
ry=r-sy r>0,s>0 (2)
設(shè)自然資源和社會(huì)環(huán)境條件中的最大人口數(shù)量為ym,當(dāng)y=ym時(shí)感染人數(shù)不再增長(zhǎng),即增長(zhǎng)率rym=0,代入式②得: ry=r1-yym (3)
將式(3)代入方程(1)得: dydt=ry1-yymy0=y0 (4)
解方程(4)可得: yt=ym1+ymy0-1e-rt (5)
從官方新聞媒體中收集整理數(shù)據(jù),得到2014年埃博拉疫情較為嚴(yán)重的幾內(nèi)亞、利比里亞和塞拉利昂3個(gè)國(guó)家的感染和死亡人數(shù)數(shù)據(jù)(見表3)。
將2014年3月22日作為時(shí)刻t=1,則4月1日為t=11,以此類推,以11月7日為t=231作為終時(shí)刻,用函數(shù)(5)對(duì)表2中的數(shù)據(jù)進(jìn)行非線性擬合,運(yùn)用相關(guān)軟件計(jì)算得到相關(guān)參數(shù)ym=14618,可決系數(shù)R2=09916。同時(shí)也可以利用公式:
r=∑ni=1xi-yi-∑ni=1xi-2∑ni=1yi-2
計(jì)算出相關(guān)系數(shù)r=0026。
由可決系數(shù)來(lái)看,擬合效果比較理想,所以得到2014年埃博拉感染和死亡人數(shù)變化趨勢(shì)的擬合曲線為:
y(t)=146181+14618602-1e-0026t
(三)結(jié)果分析
由阻滯增長(zhǎng)模型可以看出,對(duì)于整個(gè)社會(huì)而言,埃博拉病毒感染人數(shù)的增長(zhǎng)速度與時(shí)間呈現(xiàn)以下趨勢(shì)(見圖2)。由圖2可知,高峰期時(shí)增長(zhǎng)速度達(dá)到最大,因此應(yīng)最遲在ym/2時(shí)刻,即高峰期時(shí)刻研制出抑制病毒發(fā)展的新藥并采取相應(yīng)隔離措施控制疫情。
圖2埃博拉病毒感染人數(shù)的增長(zhǎng)速度與時(shí)間
對(duì)于感染者而言,根據(jù)埃博拉病毒的潛伏期、首次發(fā)病、死亡三個(gè)階段,運(yùn)用模糊集合的思想,利用函數(shù)變換方法,建立感染者從健康狀態(tài)開始(第0天)到感染埃博拉病毒至死(第27天)的時(shí)間周期內(nèi)健康指標(biāo)隸屬函數(shù)。K表示健康指標(biāo),t表示時(shí)間。
K=-008t+10≤t<5-002t+075≤t<10-215t+5610≤t<13(t-27)14013≤t≤27
在潛伏期前健康指標(biāo)整體下降05,第二個(gè)階段即潛伏期后健康指標(biāo)下降速度加快。由第二階段至第三階段為病情蔓延的重要轉(zhuǎn)折點(diǎn),此時(shí)一些感染者病情好轉(zhuǎn),而也有一些感染者病情加快惡化,甚至死亡。因此,感染者應(yīng)在轉(zhuǎn)折點(diǎn)及第二階段之前及時(shí)接受隔離及服用藥品(見圖3)。
三、結(jié)論
以上各模型通過相應(yīng)的軟件檢驗(yàn),具有一定的合理性。分析結(jié)果表明,埃博拉疫情規(guī)模呈逐年增長(zhǎng)趨勢(shì);相關(guān)部門應(yīng)在疫情爆發(fā)的高峰期研制出治療病毒的新藥;感染者在感染病情的第二階段(5—10天后)接受藥物治療,將會(huì)達(dá)到最好的效果。
[參考文獻(xiàn)]
[1]陸軍,郭迎清等線性擬合法建立航空發(fā)動(dòng)機(jī)狀態(tài)變量模型[J]航空動(dòng)力學(xué)報(bào),2011(5):1174-1175
[2]李柏年,吳禮斌Matlab數(shù)據(jù)分析方法[M]北京:機(jī)械工業(yè)出版社,2012:44-47
[3]鄭洲順,曲選輝Logistic阻滯增長(zhǎng)模型的穩(wěn)定性與混沌[J]數(shù)學(xué)理論與應(yīng)用,2003(1):57-58
[4]陳永勝基于MATLAB和SPSS的非線性回歸分析[J]牡丹江師范學(xué)院學(xué)報(bào),2009(5):101-102
[5]曾五一統(tǒng)計(jì)學(xué)簡(jiǎn)明教程[M]北京:中國(guó)人民大學(xué)出版社,2012:55-57
Abstract:Aiming at the influence level of the Ebola virus,using linear regression and nonlinear regression,the methods such as function transform,respectively established outbreak given infection people in the countiies epidemic is scale changes,the new drug development deadline model,calculate using Matlab7,Excel software such as Ebola outbreak and the relation between the time,the dealine that new drugs should be developed to fight the virus
Key words:Ebola epidemic;linear regression;nonlinear regression
(責(zé)任編輯:劉茜)endprint