麻策
南方周末發(fā)表的《買票都實名制了,為何還借媒體找密切接觸者》引起了我極大的好奇和困惑。文章報道稱:截至1月28日晚,全國至少有117趟火車、35架航班和3條地鐵線路正在(通過網(wǎng)絡(luò)等媒體)緊急尋找確診患者的同行乘客,這是“因為實名制找人要太多的手續(xù)”。為此,2020年1月27日,幾位程序員還迅速研發(fā)了“2019-nCoV新型肺炎確診患者相同行程查詢工具”。
但是,這種原始的網(wǎng)絡(luò)找人方式顯然仍易產(chǎn)生漏網(wǎng)之魚,因為疫情非常之時網(wǎng)絡(luò)信息(包括謠言)太多,即使有人看到了也可能基于各種原因而不上報。我自己也沒有想到,浙江的杭州和溫州會分別由于湖北人員空降和湖北返工密集原因,突然間成為新的重點防疫區(qū)所在。
圖1 丁香醫(yī)生全國疫情新增趨勢圖(截至2020.02.01)。來源:衛(wèi)建委 不含港澳臺
我的好奇和困惑在于,全球以及中國抗擊傳染病應(yīng)該是一項比較成熟的安排,難道全球視野下,沒有更具優(yōu)勢的方式進(jìn)行密切接觸者的識別和追蹤么?特別是在中國春運人群大遷徙的背景下,有沒有方式對傳染病遷徙路徑進(jìn)行實時分析并作出疫區(qū)預(yù)判呢?
本文也僅能對本文所描述的大數(shù)據(jù)技術(shù)方法進(jìn)行說明,興許還存在更優(yōu)的大數(shù)據(jù)解決方案,不贅言。
“有效隔離”是傳染流行病學(xué)防治的第一良藥,世界衛(wèi)生組織在《關(guān)于2019新型冠狀病毒疫情的突發(fā)事件委員會第二次會議的聲明》中認(rèn)為:“只要各國采取強有力的措施,及早發(fā)現(xiàn)、隔離和治療病例,追蹤接觸者,并提倡針對風(fēng)險程度采取相應(yīng)的減少社交接觸的措施,仍然有可能阻斷病毒傳播?!?/p>
而“有效隔離”的重中之重是“有效識別”,包括對(1)確診病例個體的有效識別;(2)對密切接觸者的有效識別;(3)對密切接觸者遷徒路徑的有效識別。做到了有效的識別,才能進(jìn)行有效隔離,并有效的調(diào)配社會資源,精準(zhǔn)預(yù)測疫情蔓延所在。
在這次中國新型冠狀病毒疫情中,對來自重點防疫區(qū)(例如湖北)以及爆發(fā)防疫區(qū)(例如浙江溫州)的人員,目前各省市已經(jīng)將來自該地區(qū)的人員視為“密切接觸者”予以重點關(guān)注,浙江杭州因為湖北地區(qū)航空接收,浙江溫州因為湖北返溫人員潮出現(xiàn)等原因,疫情嚴(yán)峻形式徒然上升,各地出現(xiàn)了直接勸返,以及對這些遷徙流入的密切接觸者進(jìn)行強制隔離觀察的現(xiàn)象。
不過,目前的“有效識別”,似乎仍然停留在直接觀察和較為簡單初級階段的識別,例如,對可見的“鄂”字車輛進(jìn)行嚴(yán)防死守、對身份證顯示為湖北籍的重點盤查,對飛自湖北境內(nèi)的航班進(jìn)行醫(yī)學(xué)隔離,以及要求所有被盤查的人員主動申報是否來自湖北,同乘交通工具人員的主動上報等等。
但這一招對于那些短暫停留或路過重點防疫區(qū)以及爆發(fā)防疫區(qū)的人員,對提前離開該類防疫區(qū),以及對這些人員沿途以及目的地所在人群的遷徙影響,甚至在特定行政區(qū)存在刻意隱瞞疫情等等例外情況下,似乎就不那么有效識別了。隨著疫情的變化,密切接觸者的范圍也會發(fā)生比較大的變化。
潮落礁起,平常被吹乎神技的大數(shù)據(jù)技術(shù),在這場防疫之戰(zhàn)中似乎并沒有任何驚艷于公眾的華彩亮相。國外倒是有媒體報道某人工智能公司早在2019年的12月底,就首次利用了新聞報道以及旅行者數(shù)據(jù)確定了下一步可能會出現(xiàn)新型冠狀病毒的地區(qū)。不過,我們目前主要依賴于群防群控、地毯式布控,堅信自上而下網(wǎng)格管理的“人定勝天”之道,目前來看,這些傳統(tǒng)防治方法確實比所謂的大數(shù)據(jù)技術(shù)來得更靠譜。那么,大數(shù)據(jù)技術(shù)是不是真的無用武之地呢?
至少從全球流行病防控史上來看,有一種大數(shù)據(jù)技術(shù)的應(yīng)用和作用已經(jīng)被發(fā)現(xiàn)并成熟運用,那就是移動電話網(wǎng)絡(luò)大數(shù)據(jù)。
移動電話網(wǎng)絡(luò)是重疊的無線電覆蓋區(qū)域的蜂窩,由無數(shù)的手機基站塔產(chǎn)生,覆蓋范圍從幾百米到幾公里不等。人們在打電話和使用網(wǎng)絡(luò)時,通過這些基站的蜂窩網(wǎng)絡(luò)將人們的電話連接到其他電話用戶或互聯(lián)網(wǎng)。我們以前的漫游收費,以及現(xiàn)在當(dāng)坐著動車高鐵穿梭于不同省市時收到的“歡迎到此一游”的識別你所在之處的短信廣告,就是基于這個原理而實現(xiàn)。
早在2009年,德國報紙《時代周刊》(Die Zeit)就進(jìn)行了一項詳細(xì)的試驗,經(jīng)同意,他們使用德國某政府官員在六個月內(nèi)的移動電話呼叫詳細(xì)記錄(CDR)數(shù)據(jù),詳細(xì)分析并成功繪制出了該官員六個月內(nèi)的全部行蹤軌跡,包括每天停留的地點、夜晚休息的地點以及和他人的通信(電話和短信)日志。
通過CDR大數(shù)據(jù)分析,可以有效分析疫區(qū)人群或密切接觸者的遷徙路徑,并據(jù)此估計每個地區(qū)傳染病的嚴(yán)重程度,推斷當(dāng)?shù)鼐用袷艿礁腥镜娘L(fēng)險,當(dāng)?shù)匦姓C關(guān)可以據(jù)此發(fā)布不同等級的風(fēng)險預(yù)警。
事實上,這種移動電話網(wǎng)絡(luò)CDR“大數(shù)據(jù)技術(shù)”早已被應(yīng)用于除了傳染病防疫之外的很多人道主義救助之中。例如在土耳其難民融合項目中,350余萬遷徙于土耳其的難民中,90%以上早已生活在聯(lián)合國難民署經(jīng)營的難民營之外,CDR“大數(shù)據(jù)技術(shù)”被聯(lián)合國用于難民融合本地化的評估工作。
埃博拉病毒(Ebola) 肆虐表。來源:美國疾病控制與預(yù)防中心及世界衛(wèi)生組織
CDR“大數(shù)據(jù)技術(shù)”還用于分析地區(qū)貧困指數(shù),并據(jù)此作為精準(zhǔn)扶貧的佐證數(shù)據(jù)。例如,紐約大學(xué)布法羅分校的Neeti Pokhriyal使用來自900萬個CDR數(shù)據(jù)在塞內(nèi)加爾創(chuàng)建了“貧困圖”。在該圖中,鏈接的粗細(xì)表示區(qū)域之間交換的呼叫和文本的數(shù)量。圓圈的大小指示總的傳入和傳出呼叫和文本。
海地地震中的CDR技術(shù)運用至今仍令人耳目一新。2010年1月,在造成22.25萬人死亡、19.6萬人受傷的海地大地震中,CDR“大數(shù)據(jù)技術(shù)”被首次應(yīng)用于人道主義行動中,用于實時監(jiān)控震后人群分布情況,以便于社會物資的分配。
圖2 全國新型冠狀病毒感染每日確診數(shù)據(jù)。來源:衛(wèi)建委 不含港澳臺
地震在當(dāng)?shù)貢r間16:50分左右開始,地震造成的恐慌驅(qū)使人們大量地離開海地首都太子港,而大量救援物資到達(dá)太子港后卻不知向何處進(jìn)行調(diào)度分配。當(dāng)時的Flowminder研究團隊聯(lián)系了海地兩家電信運營商,但只有其中一家,即Digicel同意將其CDR數(shù)據(jù)共享進(jìn)行研究,F(xiàn)lowminder研究團隊對1.92億個注冊呼叫中的190萬張SIM卡進(jìn)行了數(shù)據(jù)清理和過濾,并從中近乎實時地分析出人員遷移的總體規(guī)模和運動趨勢。
針對飽受瘧疾困擾的肯尼亞,CDR技術(shù)用于人口流動的量化。在《手機和瘧疾:模擬人類和寄生蟲的旅行》研究報告中,研究人員認(rèn)為:“在許多瘧疾流行國家,手機幾乎普及了,這為以前所未有的動態(tài)規(guī)模檢查國家人口流動提供了一種新方法。移動電話已在全球范圍內(nèi)迅速采用,它提供了一種獨特的方式來隨時間推移,跟蹤數(shù)百萬個體并了解瘧疾流行人群的動態(tài)。使用移動電話作為人類傳感器來測量人類活動模式是一個迅速發(fā)展的領(lǐng)域。從移徙工人、季節(jié)性放牧者,從農(nóng)村到城市的移民以及難民,在從瘧疾到霍亂和艾滋病毒等傳染病的傳播中都發(fā)揮著重要作用。”
2009年,墨西哥豬流感(H1N1)疫情暴發(fā),政府于2009年4月實施的控制H1N1流感爆發(fā)的措施,包括在4月16日發(fā)布第一批H1N1流感病例醫(yī)療警報,在4月27日至4月30日關(guān)閉學(xué)校;并從5月1日至5月5日暫停所有非必要活動。CDR技術(shù)及數(shù)據(jù)被用于分析人員的動向,以便政府作出實時的應(yīng)對,CDR技術(shù)證明了政府的這些措施成功地減少了被病毒感染的人數(shù),并將大流行高峰推遲了兩天。
2014年,埃博拉病毒(Ebola)肆虐西非,據(jù)世界衛(wèi)生組織發(fā)表數(shù)據(jù)顯示,埃博拉出血熱疫情肆虐的利比里亞、塞拉利昂和幾內(nèi)亞等西非三國的感染病例(包括疑似病例)已達(dá)19031人,其中死亡人數(shù)達(dá)到11325人(美國CDC數(shù)據(jù)),這是被世界衛(wèi)生組織視為近代最為緊急的國際公共衛(wèi)生事件。此后,埃博拉病毒又分別于2017-2019年連年曝發(fā),致死率達(dá)到50-90%,可謂人類共敵。
2014年,埃博拉病毒在幾內(nèi)亞、塞拉利昂和利比里亞以及向尼日利亞、塞內(nèi)加爾的迅速傳播,可能源發(fā)于幾內(nèi)亞一個小村莊的一個18個月大的男孩被蝙蝠感染,另外更是由于當(dāng)?shù)貐^(qū)域恐慌性遷徙所致。
從CDR大數(shù)據(jù)技術(shù)應(yīng)用的實踐來看,最大的法律障礙在于個人隱私權(quán)益的保護和商業(yè)數(shù)據(jù)的共享問題。上述各個典型案例中,各大數(shù)據(jù)分析機構(gòu)也不時被各電信運營商排斥和不理睬,無法拿到CDR數(shù)據(jù)并進(jìn)行分析。
在中國,個人信息收集使用的的條款,目前還沒有得到有效的實踐。個人建議,在這次全國疫情契機下,官方機構(gòu)可以嘗試激活“與公共安全、公共衛(wèi)生、重大公共利益直接相關(guān)的”個人信息,并在保障網(wǎng)絡(luò)數(shù)據(jù)安全的情況下提供研究使用。
實際上,部分電信運營商確實開始研究和開發(fā)了大數(shù)據(jù)產(chǎn)品。例如聯(lián)通大數(shù)據(jù)公司開發(fā)的人口大數(shù)據(jù)產(chǎn)品,表示可以“結(jié)合運營商的人員屬性、位置、愛好等數(shù)據(jù),與政府?dāng)?shù)據(jù)關(guān)聯(lián)融合,提高數(shù)據(jù)的實時性、準(zhǔn)確性,分析工作人口、過路人口、實有人口、人口遷徙、人口熱力等情況,及時了解轄區(qū)各類人員的變化”。疫情發(fā)生后,工信部還向各大運營商等調(diào)度部署了疫情防控大數(shù)據(jù)支撐服務(wù),要求“運用大數(shù)據(jù)分析,支撐服務(wù)疫情態(tài)勢研判、疫情防控部署以及對流動人員的疫情監(jiān)測、精準(zhǔn)施策,迫在眉睫”。
不過,這些電信運營商在中國非典以來,有沒有認(rèn)識到CDR數(shù)據(jù)的重要戰(zhàn)略意義,以及目前有沒有針對傳染病這類重大公共衛(wèi)生事件進(jìn)行CDR的研究,不得而知。至少從目前來看,這些寶藏型數(shù)據(jù)可能仍然沒有被充分利用,也可能會錯過這次全國疫情“賜予”他們的良機。
因此,呼吁行政主管部門能夠把這些數(shù)據(jù)匿名化后,作為政府?dāng)?shù)據(jù)資源開放給更多的研究機構(gòu)進(jìn)行研究,用社會的力量,別讓疫情的結(jié)局只留下災(zāi)難和遺憾。
因為更多的可能,在這場新型冠狀病毒防疫戰(zhàn)爭中,中國興許會對全球傳染病防治作出標(biāo)桿性的歷史貢獻(xiàn),中國大數(shù)據(jù)產(chǎn)業(yè)和技術(shù)也可能會給全人類創(chuàng)造新的價值圖景。
這樣的歷史機遇,請別讓它溜走!