中國(guó)信息通信研究院
2020年開年之際,新型冠狀病毒帶來的肺炎疫情洶涌而至。疫情突發(fā)性高、傳染性強(qiáng)、擴(kuò)散性廣、風(fēng)險(xiǎn)性大,防控工作任務(wù)艱巨、時(shí)間緊迫、形勢(shì)嚴(yán)峻。在這場(chǎng)疫情阻擊戰(zhàn)中,大數(shù)據(jù)、云計(jì)算、人工智能等快速發(fā)展的新一代信息通信技術(shù)加速與交通、醫(yī)療、教育等領(lǐng)域深度融合,讓疫情防控的組織和執(zhí)行更加高效,成為戰(zhàn)“疫”的強(qiáng)有力武器??梢钥闯?,隨著疫情發(fā)展,數(shù)據(jù)驅(qū)動(dòng)的疫情防控在迅速展開,各企業(yè)的疫情防控應(yīng)用場(chǎng)景不斷涌現(xiàn),應(yīng)用范圍持續(xù)拓展。
雖然大數(shù)據(jù)和智能技術(shù)在疫情防控過程中可以發(fā)揮重大作用,但從此次疫情應(yīng)對(duì)情況來看,特別是基于互聯(lián)網(wǎng)企業(yè)在數(shù)據(jù)驅(qū)動(dòng)的疫情防控過程中發(fā)揮的作用來看,仍有很大空間值得挖掘和提升。
從各互聯(lián)網(wǎng)企業(yè)的案例中不難看出,大部分企業(yè)在疫情防控中的數(shù)據(jù)基本來源于政府公開數(shù)據(jù),而目前政府公開的數(shù)據(jù)維度不夠豐富,難以滿足公眾需求。
在大數(shù)據(jù)時(shí)代,公眾的信息需求發(fā)生了變化,面對(duì)疫情,公眾關(guān)注的重點(diǎn)不僅僅是防控工作動(dòng)態(tài)、自我防護(hù)知識(shí)、相關(guān)政策文件等信息,同時(shí)更加關(guān)注一些具體的、量化的疫情相關(guān)數(shù)據(jù)。
例如,公眾既希望獲知一個(gè)地方總體概況的統(tǒng)計(jì)數(shù)據(jù)(各個(gè)省市或區(qū)縣每天累計(jì)有多少疑似、確診、危重、出院或死亡病例?每天又新增或減少了多少?疑似病例中有多少人被排除了?密切接觸者中又有多少人被解除了觀察?),也希望獲知相關(guān)病人個(gè)體的數(shù)據(jù)(這些病人分別從哪里來?去過哪里?哪天發(fā)???在哪家醫(yī)院就診?有什么病癥?目前情況如何?)。根據(jù)目前政府公開的信息和企業(yè)案例中提供的數(shù)據(jù),絕大部分地區(qū)都還難以滿足這些需求。
此外,一些政府部門和基層組織在采集疫情相關(guān)數(shù)據(jù)時(shí)仍然采用手工作坊式的人海戰(zhàn)術(shù),通常采用手工填表、電話問詢等方式,這既給基層工作人員增加負(fù)擔(dān),也無法保證數(shù)據(jù)的真實(shí)性。例如,在采集患者個(gè)人信息時(shí),由于沒有區(qū)分所留手機(jī)號(hào)是病患的還是病患家屬的,可能導(dǎo)致運(yùn)營(yíng)商系統(tǒng)核驗(yàn)存在大量身份號(hào)與手機(jī)號(hào)不一致的結(jié)果,給后續(xù)數(shù)據(jù)分析的準(zhǔn)確性和真實(shí)性造成困難。
從疫情分析的數(shù)據(jù)來看,目前公開渠道獲取的數(shù)據(jù)不規(guī)范,數(shù)據(jù)口徑、數(shù)據(jù)統(tǒng)計(jì)時(shí)間等維度不統(tǒng)一,為分析帶來很大困難。數(shù)據(jù)源混雜重復(fù)、數(shù)據(jù)質(zhì)量不高的情況十分普遍,數(shù)據(jù)可信性有待提升。
疫情防控分析過程中,每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù)。一個(gè)疏忽錯(cuò)登的身份號(hào)、一條記錄不詳?shù)募彝プ≈贰⒁淮纬鲂行畔⒌牟m報(bào)、一例本人未知的密切接觸,都可能成為觸發(fā)新疫情的導(dǎo)火索。對(duì)大數(shù)據(jù)的預(yù)處理階段的不重視,數(shù)據(jù)處理的不規(guī)范,很可能導(dǎo)致真實(shí)數(shù)據(jù)獲取難度的增加。從現(xiàn)有數(shù)據(jù)上報(bào)形式和數(shù)據(jù)上報(bào)的質(zhì)量來看,數(shù)據(jù)上報(bào)過程中還存在很多不規(guī)范、不合理的情況。
以上種種原因,導(dǎo)致數(shù)據(jù)的可用性差、質(zhì)量差、不準(zhǔn)確。防控分析大數(shù)據(jù)的意義不僅僅是要收集規(guī)模龐大的數(shù)據(jù)信息,還要對(duì)收集到的數(shù)據(jù)進(jìn)行很好地預(yù)處理,讓數(shù)據(jù)分析和數(shù)據(jù)挖掘人員從可用性高的大數(shù)據(jù)中提取有價(jià)值的信息,這才是最終目標(biāo)。
隨著新冠肺炎疫情防控形勢(shì)不斷升級(jí),各地紛紛采取多樣的宣傳預(yù)防方式,其中,排查上報(bào)重點(diǎn)地區(qū)返鄉(xiāng)人員和確診患者信息,是一項(xiàng)十分重要的舉措,能夠幫助衛(wèi)生監(jiān)督機(jī)構(gòu)及時(shí)掌握情況,迅速切斷傳播。雖然有關(guān)部門第一時(shí)間制作了隱去個(gè)人隱私信息的確診患者相同行程查詢工具,但在原始數(shù)據(jù)上報(bào)過程中,數(shù)據(jù)還是遭到不同程度的泄露。不久前有許多載有個(gè)人信息的文件,突然間在微信、微博等社交平臺(tái)上瘋狂轉(zhuǎn)發(fā),內(nèi)容包括相關(guān)人員的姓名、照片、工作單位、就讀學(xué)校、家庭住址、手機(jī)號(hào)碼及身份號(hào)等,給返鄉(xiāng)人員及確診患者的生活帶來極大困擾,不少人接到騷擾電話和謾罵短信,暴露出個(gè)人數(shù)據(jù)保護(hù)的不足。
《中華人民共和國(guó)民法總則》第一百一十條、第一百一十一條規(guī)定:公民享有隱私權(quán),個(gè)人信息受法律保護(hù),任何組織和個(gè)人不得非法收集、使用、加工、傳輸他人個(gè)人信息,不得非法買賣、提供或者公開他人個(gè)人信息?!吨腥A人民共和國(guó)傳染病防治法》第十二條也有相關(guān)規(guī)定,疾病預(yù)防控制機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)不得泄露涉及個(gè)人隱私的有關(guān)信息、資料。
在疫情防控的特殊時(shí)期,公眾知情權(quán)、公共安全與公民隱私權(quán)需要兼顧平衡?;谝咔榉揽剡@一公共利益的切實(shí)需要,可以對(duì)特殊人群的特定信息進(jìn)行披露,但應(yīng)當(dāng)遵循合規(guī)原則,公開內(nèi)容應(yīng)確實(shí)必要,符合疫情防控目的,公開手段應(yīng)合理適當(dāng),盡可能將負(fù)面影響降到最低。
為做好新冠肺炎疫情聯(lián)防聯(lián)控中的個(gè)人信息保護(hù),積極利用包括個(gè)人信息在內(nèi)的大數(shù)據(jù)支撐聯(lián)防聯(lián)控工作,中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室在2020年2月4日發(fā)布《關(guān)于做好個(gè)人信息保護(hù)利用大數(shù)據(jù)支撐聯(lián)防聯(lián)控工作的通知》,明確為疫情防控、疾病防治收集的個(gè)人信息,不得用于其他用途。任何單位和個(gè)人未經(jīng)被收集者同意,不得公開姓名、年齡、身份號(hào)碼等個(gè)人信息。
通知要求,各地區(qū)各部門要高度重視個(gè)人信息保護(hù)工作,除國(guó)務(wù)院衛(wèi)生健康部門依據(jù)《中華人民共和國(guó)網(wǎng)絡(luò)安全法》《中華人民共和國(guó)傳染病防治法》《突發(fā)公共衛(wèi)生事件應(yīng)急條例》授權(quán)的機(jī)構(gòu)外,其他任何單位和個(gè)人不得以疫情防控、疾病防治為由,未經(jīng)被收集者同意收集使用個(gè)人信息。法律、行政法規(guī)另有規(guī)定的,按其規(guī)定執(zhí)行。
通知還要求,收集必需的個(gè)人信息應(yīng)參照國(guó)家標(biāo)準(zhǔn)的個(gè)人信息安全規(guī)范,堅(jiān)持最小范圍原則,收集對(duì)象原則上限于確診者、疑似者、密切接觸者等重點(diǎn)人群,一般不針對(duì)特定地區(qū)的所有人群,防止形成對(duì)特定地域人群的事實(shí)上歧視。
通知明確,為疫情防控、疾病防治收集的個(gè)人信息,不得用于其他用途。任何單位和個(gè)人未經(jīng)被收集者同意,不得公開姓名、年齡、身份號(hào)碼、電話號(hào)碼、家庭住址等個(gè)人信息,因聯(lián)防聯(lián)控工作需要,且經(jīng)過脫敏處理的除外。
大數(shù)據(jù)的核心在于互聯(lián)互通。只有融會(huì)了多源數(shù)據(jù),才能體現(xiàn)大數(shù)據(jù)的價(jià)值。在疫情防控中我們也看到數(shù)據(jù)分散割裂、聚而不通、通而不用的問題。這很大程度上是因?yàn)閿?shù)據(jù)源與數(shù)據(jù)開發(fā)能力不匹配所導(dǎo)致的,即掌握數(shù)據(jù)的一方缺少足夠的數(shù)據(jù)開發(fā)利用能力,而擁有數(shù)據(jù)開發(fā)能力的一方?jīng)]有足夠的數(shù)據(jù),致使數(shù)據(jù)無法流通并發(fā)揮最大作用。
同時(shí),不同企業(yè)和政府部門的數(shù)據(jù)呈現(xiàn)“孤島”形態(tài),數(shù)據(jù)亟需高效整合。全國(guó)各級(jí)地方政府部門、各大互聯(lián)網(wǎng)企業(yè)利用大數(shù)據(jù)防疫的挑戰(zhàn)之一就是數(shù)據(jù)的碎片化。從多個(gè)互聯(lián)網(wǎng)企業(yè)案例來看,數(shù)據(jù)常常散落在不同部門,而且這些數(shù)據(jù)存在不同的數(shù)據(jù)倉庫中,不同部門的數(shù)據(jù)技術(shù)也有可能不一樣,這導(dǎo)致地區(qū)內(nèi)部、企業(yè)內(nèi)部自己的數(shù)據(jù)都沒法打通。如果不打通這些數(shù)據(jù),大數(shù)據(jù)的價(jià)值將非常難挖掘。大數(shù)據(jù)需要不同數(shù)據(jù)的關(guān)聯(lián)和整合才能更好地發(fā)揮優(yōu)勢(shì)。如何將數(shù)據(jù)打通,并且實(shí)現(xiàn)技術(shù)和工具共享,是更好地體現(xiàn)大數(shù)據(jù)在防疫中的價(jià)值的關(guān)鍵。
編輯:張程? 3567672799@qq.com