曹然
5月11日,在俄羅斯克拉斯諾戈爾斯克的一處展覽中心,用于應對新冠疫情的臨時醫(yī)院正在施工中。圖/衛(wèi)星社
在有關新冠病毒的科學、政策和公眾討論中,流行病學模型是穿梭其中的幽靈。政府依據模型制定防疫政策,預判疫情走向;學者們通過模型分析病毒的傳播能力,評估防疫體系的得失;社會輿論常被模型指向的龐大感染和死亡數據震驚,又在不同模型得出的不同結論前不知所措。
2020年4月,聯合國非洲經濟委員會在報告中援引英國帝國理工學院的模型稱,非洲最多可能有300萬人死于新冠病毒,一百多位非洲知識分子隨后聯署呼吁更有效的防疫政策。
事實上,英國帝國理工模型預設的是非洲沒有采取有效社交隔離等防疫措施情況下的疫情走勢,其估算的死亡數據最高值是300萬,最低值則是30萬。但在數據發(fā)布時,非洲已有二十多個國家實施了全國性的封鎖隔離措施。
“采取了積極的防疫措施后,結果其實會很不一樣。”南非金山大學醫(yī)學院公衛(wèi)專家莎拉·尼沃德對《中國新聞周刊》表示。倫敦衛(wèi)生和熱帶病醫(yī)學院當月中旬發(fā)布的另一個模型指出,非洲國家的積極防疫措施最多可以將死亡率降低75%。
對于流行病學、生物統(tǒng)計等領域的專業(yè)人士而言,模型數據背后的研究目的、建模方式、參數設定及完整結論要比看上去讓人震驚的單個數字更值得關注。但政府和公眾對于這些模型的數據卻時而過度輕信,時而又棄之如敝履。
一直追蹤非洲防疫的尼沃德說,現在她已經不再關注任何模型數據了。哈佛大學流行病學助理教授約納塔·格拉德則對《中國新聞周刊》強調:“我們要一直記住一點,模型從來不是像天氣預報那樣用來準確預測疫情的,它的價值在于提供決策參考?!?h3>哪種模型更有效?
新冠疫情在武漢蔓延之初,那不勒斯腓特烈二世大學數學教授西亞圖斯等一批歐洲學者就開始通過流行病學模型著手研究這個全新的傳染病,并在SCI期刊發(fā)表了多篇同行評議論文。對他們來說,這只是日常的科研工作,就像之前建立關于埃博拉疫情和MERS疫情的流行病學模型一樣。
得益于流行病學模型最近一百余年的發(fā)展,在新冠病毒剛出現且人們對其生物學特征一無所知時,相關的流行病學模型就可以建立了。這是因為流行病的自然史密碼已經被破解,即健康的人(易感人群)感染病毒,出現臨床癥狀,最終康復或死亡的過程。
健康、感染、康復人群的此消彼長,決定著病毒周期性的流行和消退?;谶@一規(guī)律,“在疫情發(fā)生之初建立的模型,雖然在數據預測上難以準確,但卻能提供可靠的趨勢性分析?!蔽鱽唸D斯對《中國新聞周刊》說。
西亞圖斯采用的是最經典的SIR系列模型。這種模型將人群分為易感人群S、感染者I和康復者R,將對病毒傳播能力和防疫政策的假設體現于人群從一個組別向另一個組別轉移的數學規(guī)則中,從而計算病毒的感染率和峰值區(qū)間。目前,在與美國疾病控制與預防中心(CDC)合作監(jiān)測新冠疫情的12個模型中,5個都采用了SIR系列模型。
“SIR系列模型比較簡單,被證明能夠在短期內充分模擬病毒在一般人群中的流行動態(tài)?!蔽鱽唸D斯介紹,相比于其他類型的模型,這類模型最大的優(yōu)勢是基本變量只有三到四個,“需要校準的參數數量最少,這一點,在數據不多的疫情第一階段非常重要。”
西亞圖斯提到的其他模型主要是統(tǒng)計學模型。其中,曾被白宮援引的西雅圖華盛頓大學衛(wèi)生計量和評估研究所(IHME)的模型最為有名,也最受爭議。該團隊研究了新冠病毒在世界各地暴發(fā)的數據,以世界各地的既有數據和美國人口、疾病傳播及防疫政策的假設為基礎,推斷美國及各州疫情可能的曲線。
IHME認為,這樣的統(tǒng)計學模型更為準確,因為它“主要依賴于真實世界的數據,而不是關于疾病如何傳播的假設”。SIR模型的使用者確實因對新冠病毒特性的假設而做出過誤判。被英國政府援引“60%的人可能感染”的帝國理工學院模型,就將新冠病毒放進了一個為流感設計的SIR模型中。
美國疫情在4月進入暴發(fā)期后,IHME對各州峰值和病床壓力的預估也多次出現失誤。IHME團隊承認難以預估“模型的不確定性”,且這種不確定性時而是高估,時而是低估。
一些專家指出,這與統(tǒng)計學模型對“真實數據”的依賴有關。疫情暴發(fā)之初,各大模型的數據主要來自中國,但當時中國的數據并未統(tǒng)計無癥狀感染者,因此關于確診病例數和其他數據的比例不一定能反映病毒的真實傳播能力。
“新冠病毒流行初期,感染、死亡等數據常常受到檢測不足、檢測不一致、報告延誤、記錄不全等因素的限制。”倫敦衛(wèi)生和熱帶病醫(yī)學院醫(yī)療數據專家尼古拉斯·朱厄爾在一篇分析新冠模型得失的論文指出。相比于有自己的邏輯、基礎變量較少的流行病學模型,統(tǒng)計學模型受前期數據不足的影響更為嚴重。
2020年5月4日,在進行了大規(guī)模修正后,IHME模型重新上線。新模型采用了混合模式,結合了統(tǒng)計建模方法和疾病傳播方法,利用兩類模型的優(yōu)勢,將疾病傳播模型的結果與統(tǒng)計模型的結果進行對照。
在IHME調整其統(tǒng)計學模型的同時,SIR模型的建模者之間也出現了爭論。因為最基礎的SIR模型僅設有易感人群、感染者和康復者三個基本變量,難以反映新冠病毒潛伏期的傳播,也拙于應付學者對病死率的關切,有學者提出加入處于潛伏期的暴露者E,采用SEIR模型。西亞圖斯等學者則將病亡者D作為基本變量,發(fā)展出SIRD模型。對此,朱厄爾評論稱,增加一些從流行病學角度觀察到的、反映傳染病傳播特點的基本變量,有助于更好地分析新冠疫情。
不過,《自然》雜志子刊《自然醫(yī)學》4月22日刊登的意大利特倫托大學教授朱利亞·喬亞努團隊的論文,卻將SIR模型的復雜化推向了高峰。該論文基于新冠病毒前期研究的成果,將代表病毒傳播不同階段的八種人群全部列為基本變量,建立SIDARTHE模型。這八個基本變量分別是易感人群(S)、無癥狀感染者(I)、無癥狀確診者(D)、有癥狀感染者(A)、有癥狀確診者(R)、重癥者(T)和已治愈者(H)和病亡者(E)。
“SIDARTHE模型確實比其他模型更復雜、更全面,因為它的目標不僅僅是預測疫情走向?!眴虂喤瑢Α吨袊侣勚芸方忉尫Q,這一模型的主要目的是為決策者提供一個有用的工具,有助于比較不同的防疫措施及它們的組合使用對疫情走向的不同影響。
但在很多學者看來,這卻不是一個好的模型。西亞圖斯對《中國新聞周刊》表示,過于復雜的模型會遭遇“維度詛咒”,即難以在一個模型中校準太多的參數。朱厄爾也指出,如果復雜的模型在運算中遺漏關鍵數據,那么它們可能比簡單的模型更不可靠,“微小的錯誤將導致更大的災難”。
朱厄爾還指出,“復雜的模型也會讓人產生錯覺,更難發(fā)現關鍵的疏漏?!?/p>
面對質疑,喬亞努對《中國新聞周刊》承認,過多的基本參數確實使得校準模型更具挑戰(zhàn)性。但他認為,“一旦數據合適,復雜的模型可以提供更準確的趨勢預測?!?/p>
在約翰·霍普金斯大學的流行病學家里弗斯看來,圍繞流行病學模型的建模方式的爭議,很大程度上緣于人們在疫情暴發(fā)之初并不知道怎樣的流行病學或統(tǒng)計學模型可能是更有效的,也不知道應當如何改進SIR這樣的經典模型。
2020年4月,牛津大學教授古塔普團隊用血清調查數據推翻了自己此前的模型結論。
3月24日,該團隊曾以假設新冠病毒感染者中只有0.1%到1%的人需要入院治療為前提,運用SIR模型分析英國和意大利兩國的重癥和死亡病例數。當時的模型還預測稱,截至3月19日,英國可能有36%到68%的民眾感染新冠病毒,而意大利到3月6日可能有60%到80%的民眾感染。一個月后的血清調查結果則顯示,英國和意大利的新冠病毒整體感染比例或都低于10%。
莎拉·尼沃德對《中國新聞周刊》說,古塔普團隊出現的問題具有一定的典型性。“在急于發(fā)表預測結果的背景下,許多模型對關鍵數據的假設都缺乏嚴謹性?!焙凸潘請F隊發(fā)布的論文一樣,研究者們很少說明采取這些假設的原因。
模型本質上是一組數學公式,任何一個關鍵項的輸入值稍有變化,就會得出非常不同的結果。而有關新冠病毒的模型,最初幾乎所有數值都是不確定的。從病毒本身的生物學特征,到免疫等人類生物學特征,再到人群接觸等社會運作方式,以及醫(yī)療體系的承載能力等,都存在很多變量。
“對病毒大流行的研究,其實是人類曾經嘗試研究的一些最復雜和最混亂的東西的混合,從人類行為學,到病毒學,再到免疫學?!崩锔ニ褂纱烁锌?,預測新冠疫情是一個巨大的挑戰(zhàn),即使是最聰明的頭腦也不知道這一切將如何結束。
以帝國理工學院模型對英國疫情的估算為例,如果模型中的基本傳染數值(R0)為2,社會疏離措施設置為最強,則疫情僅造成數千人死亡;假設R0值為2.6且沒有社會疏離措施,則疫情能造成55萬人死亡。這兩個結果相差懸殊,后者是前者的百倍還多。
倫敦衛(wèi)生和熱帶病醫(yī)學院的朱厄爾將這種對重要參數的推測稱為“關鍵假設”。病死率和感染率是兩項最困難的“關鍵假設”,前者缺乏真實數據的支撐,后者則需面對捉摸不定的人類行為。
日內瓦大學全球公衛(wèi)研究所所長安托萬·弗拉奧曾對《中國新聞周刊》預測過非洲新冠疫情的一個特征:非洲的人口結構相對年輕,但并不是說中青年人就不會成為新冠重癥患者。考慮到非洲重癥救治的醫(yī)療條件比較薄弱,理論上非洲中青年人新冠病死率會遠高于歐美。
比病死率更難以捉摸的變量是R0值。R0值是指在沒有外力介入且所有人都沒有免疫力的情況下,一個感染者將病毒傳染給其他人的平均數。R0值越低,意味著病毒傳播能力越弱。R0值會隨疫情的周期性變化而改變,研究者則需要通過計算接觸率、傳播率、接觸量、傳播時間等因素,確定新冠病毒的R0值。
平均接觸率是指每個感染者在一段時間內平均與多少人接觸,而這取決于他們的生活環(huán)境與社交習慣;每次接觸的傳播率則被專家看作是“在不均衡的變化中”。但新冠病毒并不以“每人幾例”的方式有序傳播,超級傳播者的出現足以打亂模型的預測,比如發(fā)生在意大利倫巴第大區(qū)醫(yī)院、韓國“新天地教會”教堂、美國馬薩諸塞州生物學會議上的聚集性傳播事件。
4月7日,在南非開普敦,工作人員對當地居民開展排查工作。圖/路透
像帝國理工和古塔普團隊這樣的模型,都預設病毒以固定的速率在整個樣本人群中均質地傳播,不同癥狀的感染者的傳播能力沒有差異,不同群體被感染的幾率也沒有差異。
此外,當一些學者試圖計算每次接觸的傳播量和傳播的持續(xù)時間時,他們還需要病毒生物學和免疫學領域研究的支撐。而病毒在傳播者身上存活的時間、在潛伏期內產生傳染性的時間,很長一段時間內都眾說紛紜。
在估算模型參數時,最難預測的還是人類行為。北卡羅來納大學副教授圖費克奇指出,一些模型未必是高估了感染比例,而是模型的結論嚇住了社會公眾,并引發(fā)了嚴厲的封鎖隔離措施,直接阻斷了病毒傳播的可能。
對于專業(yè)人士,模型并不是他們判斷疫情的唯一標準。但對于政府而言,模型是疫情之初極少數有科學依據的政策參考之一。對公眾來說,模型則更是最好的警示。
喬亞努對《中國新聞周刊》表示,所有模型都需要基于本地數據進行適當校準,與傳染率和測試率相關的一些關鍵參數甚至要在適當的時間“瞬間改變”,以反映防疫政策的變化。
如今,美國北卡羅來納、伊利諾伊、加利福尼亞等州已經開始使用多個不同的模型作為決策依據,且在防疫政策變動后會確定新的參考模型。一些專家則呼吁建立“新一代模型”,不再只是對疫情做長期的、概要性的預測,而是可以為地方政府的具體防疫措施提供更細致的參考。
美國哥倫比亞大學推出了一個帶有直觀的交互式地圖的模型,專門預測在不同的社會隔離政策下,美國哪些縣的醫(yī)療體系在何時會不堪重負。不過,該項目也飽受數據缺乏、很多變量難以假設的困擾。
針對亞非拉地區(qū)的模型,能獲得的數據比歐美國家要少得多。尼沃德對《中國新聞周刊》指出,為保證有關非洲的模型結論有效,目前至少需要四個方面的真實材料:年齡分布和健康狀況的人口學統(tǒng)計資料,國家的檢測追蹤能力,醫(yī)療衛(wèi)生資源的基本數據,以及政府采取的社會干預政策。