中共重慶市萬(wàn)州區(qū)委黨校 王海濤
重大公共衛(wèi)生事件,是指那些突然發(fā)生的,已經(jīng)或可能對(duì)公眾身體健康造成嚴(yán)重?fù)p害的公共衛(wèi)生事件。主要包括重大傳染類疾病、不明原因的群體性疾病、重大食源性疾病以及食物中毒事件等。其中,危害最大、控制處理最為困難的就是重大傳染類疾病。從早期的天花病毒、黑死病、霍亂、鼠疫、結(jié)核病到近期2003年的SARS(嚴(yán)重急性呼吸綜合征)疫情,2009年暴發(fā)的H1N1禽流感,2014年西非爆發(fā)的埃博拉疫情,以及2020年全球爆發(fā)的新型冠狀病毒疫情等,這類事件具有傳播速度快、感染性強(qiáng)、危害性大、控制處理困難等特征,處置不當(dāng)極易由小范圍的個(gè)體感染事件發(fā)展為社會(huì)性的群體感染事件甚至演變?yōu)槿蛐缘闹卮蠊残l(wèi)生事件,這對(duì)傳統(tǒng)的疾病防控和社會(huì)治理帶來(lái)了極大的挑戰(zhàn)。
傳統(tǒng)小數(shù)據(jù)時(shí)代,對(duì)于突發(fā)公共衛(wèi)生事件的處理決策,一般采用“抽樣數(shù)據(jù)+經(jīng)驗(yàn)判斷”的模式,決策者易受樣本數(shù)據(jù)、經(jīng)歷背景等多方面因素影響,分析結(jié)構(gòu)可信賴度差,時(shí)效性低,易延誤事件準(zhǔn)確及時(shí)處理。以數(shù)據(jù)挖掘、人工智能、深度機(jī)器學(xué)習(xí)等新興技術(shù)為主的大數(shù)據(jù)技術(shù),能夠有效解決重大公共衛(wèi)生事件處理中信息匱乏與快速?zèng)Q策的矛盾困境,在輔助決策、追蹤密切接觸者、優(yōu)化重點(diǎn)資源配置和維護(hù)網(wǎng)絡(luò)思想意識(shí)安全等方面發(fā)揮重要作用。
大數(shù)據(jù)技術(shù)作為新興的數(shù)據(jù)處理技術(shù),能夠充分利用網(wǎng)絡(luò)資源,實(shí)時(shí)并行處理不斷累積的大數(shù)據(jù)集時(shí),在面對(duì)數(shù)據(jù)類型多樣、數(shù)據(jù)總量龐大的復(fù)雜數(shù)據(jù)集,相對(duì)于傳統(tǒng)的本地處理系統(tǒng)與單點(diǎn)數(shù)據(jù)處理技術(shù)有顯著的優(yōu)勢(shì)。小數(shù)據(jù)時(shí)代,傳統(tǒng)數(shù)據(jù)處理模式能夠處理的數(shù)據(jù)規(guī)模與數(shù)據(jù)類型都十分有限,同時(shí)受限于處理能力與數(shù)據(jù)樣本規(guī)模,數(shù)據(jù)分析的時(shí)效性與準(zhǔn)確性都難以得到保障。隨著具備更強(qiáng)大處理能力的超級(jí)計(jì)算機(jī)與云計(jì)算平臺(tái)架構(gòu)技術(shù)興起之后,能夠快速收集重大公共衛(wèi)生安全事件中產(chǎn)生的眾多零散數(shù)據(jù),為及時(shí)、準(zhǔn)確、高效地處理大數(shù)據(jù)集提供技術(shù)保障。面對(duì)復(fù)雜大數(shù)據(jù)集高效性、準(zhǔn)確性的要求,大數(shù)據(jù)技術(shù)具有傳統(tǒng)數(shù)據(jù)處理技術(shù)不可替代的優(yōu)勢(shì),其高度匹配性主要體現(xiàn)在以下三個(gè)方面。
大數(shù)據(jù)時(shí)代,所有的信息都需要并能夠被數(shù)據(jù)化處理。在重大公共衛(wèi)生事件處理中,我們能夠利用的大數(shù)據(jù)集主要分為兩類:一類是集成型數(shù)據(jù),主要包括公眾社交數(shù)據(jù)、醫(yī)療衛(wèi)生數(shù)據(jù)、搜索引擎數(shù)據(jù)等;另一類是分析型數(shù)據(jù),主要包括特殊的大數(shù)據(jù)系統(tǒng)或平臺(tái),通過(guò)數(shù)據(jù)挖掘、模擬仿真等技術(shù),得出的空間地理軌跡信息、輿情熱點(diǎn)等分析數(shù)據(jù)。這兩類數(shù)據(jù)是我們要重點(diǎn)關(guān)注的類型。從數(shù)據(jù)類型上分,這些數(shù)據(jù)又可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。從各個(gè)醫(yī)療機(jī)構(gòu)系統(tǒng)數(shù)據(jù)庫(kù)中抓取的數(shù)據(jù),具有固定的屬性結(jié)構(gòu),屬于結(jié)構(gòu)化數(shù)據(jù)。在網(wǎng)絡(luò)上隨機(jī)抓取的圖片、音頻、視頻等信息,不能用統(tǒng)一的數(shù)據(jù)模型定義,則屬于非結(jié)構(gòu)化數(shù)據(jù)。除此之外,還有一些應(yīng)用系統(tǒng)產(chǎn)生的日志文件、email等,則屬于半結(jié)構(gòu)化數(shù)據(jù)。
通過(guò)分析,可以發(fā)現(xiàn),在這個(gè)突發(fā)事件處理過(guò)程中,我們面對(duì)的數(shù)據(jù)類型復(fù)雜多樣,同時(shí)隨著時(shí)間的不斷累積,數(shù)據(jù)規(guī)模也在不斷擴(kuò)大。傳統(tǒng)的數(shù)據(jù)處理技術(shù)只能在本地進(jìn)行類型固定的數(shù)據(jù)處理,而且隨著數(shù)據(jù)集的擴(kuò)充,處理速度會(huì)越來(lái)越慢甚至無(wú)法處理。大數(shù)據(jù)技術(shù)中的并行處理技術(shù),能夠充分調(diào)動(dòng)互聯(lián)網(wǎng)中閑置的異地異構(gòu)數(shù)據(jù)處理平臺(tái),并發(fā)處理不同結(jié)構(gòu)類型、體量不斷積聚的大數(shù)據(jù)集合。
移動(dòng)互聯(lián)網(wǎng)、人工智能等新興技術(shù)的不斷發(fā)展,物流、交通等基礎(chǔ)設(shè)施也實(shí)現(xiàn)了跨越式的發(fā)展。公眾的出行、交流與生活更加便利,信息傳播更加快捷。在這樣的背景下,一旦有重大突發(fā)公共衛(wèi)生事件(尤其是傳染類公共衛(wèi)生事件)發(fā)生,對(duì)公眾身體健康、社會(huì)穩(wěn)定和經(jīng)濟(jì)發(fā)展都會(huì)帶來(lái)極大影響。傳統(tǒng)數(shù)據(jù)處理技術(shù),只能對(duì)收集到的歷史數(shù)據(jù)做單一結(jié)構(gòu)的處理,對(duì)于信息量較大的數(shù)據(jù)集,也需要進(jìn)行數(shù)據(jù)拆分或者數(shù)據(jù)抽樣處理,耗費(fèi)時(shí)間長(zhǎng),遠(yuǎn)遠(yuǎn)達(dá)不到這類事件快速反應(yīng)的要求。同時(shí),隨著時(shí)間的推移,數(shù)據(jù)庫(kù)系統(tǒng)累積的數(shù)據(jù)會(huì)越來(lái)越大,而對(duì)于數(shù)據(jù)處理速度的需求卻在不斷提高,這對(duì)傳統(tǒng)的單點(diǎn)處理技術(shù)提出了巨大挑戰(zhàn),需要一種新的處理模式加以改進(jìn)。面對(duì)不斷“長(zhǎng)胖”、分布零散、結(jié)構(gòu)各異的數(shù)據(jù)集,大數(shù)據(jù)中的云平臺(tái)架構(gòu),能夠調(diào)度網(wǎng)絡(luò)上的閑置計(jì)算資源,改變傳統(tǒng)處理技術(shù)的流水線作業(yè)模式,同時(shí)調(diào)度使用多個(gè)網(wǎng)絡(luò)系統(tǒng)并發(fā)處理不斷累積的大數(shù)據(jù)集,規(guī)避抽樣方法的缺陷和樣本的偏差,既節(jié)約硬件資源,又能顯著提高分析效率。這很好的契合了重大公共衛(wèi)生事件處理過(guò)程中快速反應(yīng)的要求。
在應(yīng)對(duì)重大公共衛(wèi)生事件的過(guò)程中,我們不僅僅要求反應(yīng)快速高效,同時(shí)結(jié)果的客觀準(zhǔn)確也是不可或缺的要素。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析結(jié)果是政府決策的重要參考。數(shù)據(jù)分析結(jié)果的準(zhǔn)確性直接與政府決策的科學(xué)性、有效性密切相關(guān)。一旦數(shù)據(jù)分析結(jié)果出現(xiàn)偏差,政府決策的效果差異就會(huì)放大,事件處理的效果就會(huì)產(chǎn)生較大偏差,甚至產(chǎn)生負(fù)面影響,造成不可挽回的影響或損失。
傳統(tǒng)數(shù)據(jù)分析方法受限于處理能力、分析樣本、噪音數(shù)據(jù)等因素,分析結(jié)果的準(zhǔn)確性與實(shí)時(shí)性都有一定偏差。大數(shù)據(jù)技術(shù)處理的樣本包含不同系統(tǒng)平臺(tái)匯集的歷史數(shù)據(jù)、以及正在產(chǎn)生的現(xiàn)實(shí)同步數(shù)據(jù),數(shù)據(jù)樣本龐大、覆蓋面廣、時(shí)效性強(qiáng),分析的數(shù)據(jù)是完整的、全面的、實(shí)時(shí)的,能夠有效規(guī)避傳統(tǒng)數(shù)據(jù)處理技術(shù)中備選數(shù)據(jù)集較小,抽樣方法缺陷等因素導(dǎo)致的分析結(jié)果偏差甚至錯(cuò)誤的情形。除此之外,大數(shù)據(jù)本身的客觀真實(shí)性也為最終結(jié)果提供了有力支撐。集合中每個(gè)數(shù)據(jù)元都是現(xiàn)實(shí)事件的客觀反映。公眾軌跡數(shù)據(jù)是個(gè)體空間行為移動(dòng)的客觀反映,具有真實(shí)性和可追溯性。搜索引擎統(tǒng)計(jì)數(shù)據(jù)是對(duì)當(dāng)前一段時(shí)間網(wǎng)民網(wǎng)絡(luò)輿情熱點(diǎn)、網(wǎng)絡(luò)內(nèi)心訴求的真實(shí)反映。這些對(duì)公共衛(wèi)生事件的決策處理、網(wǎng)絡(luò)輿情引導(dǎo)以及公眾心理干預(yù)具有重要參考價(jià)值。
綜上,大數(shù)據(jù)技術(shù)中這些特點(diǎn)能夠很好地契合重大公共衛(wèi)生事件中數(shù)據(jù)信息處理中面對(duì)的一系列“棘手”芒刺,以數(shù)據(jù)挖掘、人工智能等技術(shù)為基礎(chǔ)的數(shù)據(jù)處理模式能夠應(yīng)對(duì)事件中面對(duì)的技術(shù)挑戰(zhàn)。
認(rèn)識(shí)世界,預(yù)測(cè)未來(lái)一直是人們苦苦追求的目標(biāo)。科技力量的加入使得我們對(duì)未來(lái)事件的認(rèn)知有了長(zhǎng)足進(jìn)步。例如:天氣預(yù)報(bào),目前我們已經(jīng)能夠做到單位區(qū)域內(nèi)、具體時(shí)間的準(zhǔn)確預(yù)測(cè)。當(dāng)然也存在如地震這類自然災(zāi)害事件到目前為止依然很難提前預(yù)報(bào)的情形。對(duì)于突發(fā)的重大公共衛(wèi)生事件而言,我們需要根據(jù)已經(jīng)發(fā)現(xiàn)的某個(gè)區(qū)域、部分群體的數(shù)據(jù)信息,結(jié)合歷史事件的發(fā)展規(guī)律,來(lái)判斷整個(gè)事件的發(fā)展趨勢(shì),包括影響力、破壞力、傳染性等等。能否準(zhǔn)確根據(jù)收集的信息對(duì)事件未來(lái)的發(fā)展態(tài)勢(shì)做客觀準(zhǔn)確的分析判斷,是防止這類突發(fā)事件進(jìn)一步惡化的關(guān)鍵。數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的深度結(jié)合,有效解決了傳統(tǒng)事件預(yù)測(cè)中的難題。
現(xiàn)實(shí)社交網(wǎng)絡(luò)中,個(gè)人是網(wǎng)絡(luò)的中心。所有的數(shù)據(jù)都是圍繞個(gè)人展開(kāi),包括跨區(qū)域流動(dòng)、行為軌跡等都是有跡可循的。這是大數(shù)據(jù)技術(shù)能夠在重大公共衛(wèi)生事件中得以應(yīng)用的最大前提。利用“大數(shù)據(jù)+計(jì)算機(jī)仿真”的模式,能夠?qū)@類事件進(jìn)行提前模擬預(yù)測(cè)。2009年,H1N1甲型流感暴發(fā)初期,美國(guó)的Google公司利用其獨(dú)特的技術(shù)和資源就對(duì)疫情的暴發(fā)作了提前預(yù)測(cè)。2019年底,加拿大的BlueDot公司利用收集到的健康數(shù)據(jù)在新冠疫情暴發(fā)初期對(duì)其客戶推送了疫情的預(yù)警信息。2020年,我國(guó)鐘南山院士團(tuán)隊(duì)根據(jù)掌握的全國(guó)疫情大數(shù)據(jù)對(duì)我國(guó)的疫情形勢(shì)做出了準(zhǔn)確的評(píng)估與預(yù)測(cè),為后來(lái)的疫情防控提供了巨大幫助。
傳染類突發(fā)公共衛(wèi)生事件處理中,人流是最大的變量。解決好這個(gè)變量,是處理這類事件的關(guān)鍵。身處事件中的每個(gè)人都多了一個(gè)感染狀態(tài)屬性。根據(jù)這個(gè)屬性可以將所有的公眾分為四類:感染者、疑似感染者、密切接觸者和正常者。前三類是重點(diǎn)關(guān)注群體,對(duì)他們的處理與控制是所有傳染性突發(fā)公共衛(wèi)生事件處理的重點(diǎn)。傳統(tǒng)的疫情防控,只能根據(jù)本地醫(yī)療、防疫機(jī)構(gòu)上報(bào)的樣本數(shù)據(jù),進(jìn)行流行病學(xué)分析,然后采用回溯的方式,去尋找可能潛在的患者,難以全面、準(zhǔn)確、快速地找出空間移動(dòng)軌跡中所有的密切接觸者,極易延誤疫情的處理控制。
傳統(tǒng)人工詢問(wèn)排查方式,受被排查對(duì)象的瞞報(bào)或謊報(bào)、病毒本身的潛伏特性等外部因素影響較大,人力資源耗費(fèi)巨大,進(jìn)度緩慢,效果不佳,難以達(dá)到徹底排查的目的。借助大數(shù)據(jù)分析技術(shù),結(jié)合個(gè)人身份信息庫(kù)、交通大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、通信大數(shù)據(jù)等等,通過(guò)信息比對(duì),能夠準(zhǔn)確“繪制”出對(duì)象的出行軌跡,在已知的感染者周?chē)軌颉翱棾伞币粡埱逦墓婈P(guān)系網(wǎng)絡(luò),準(zhǔn)確找出所有密切接觸者,并逐級(jí)找到二級(jí)、三級(jí)接觸者,分析他們與感染者的鏈接強(qiáng)弱度,及時(shí)有針對(duì)性采取醫(yī)療防護(hù)、區(qū)域隔離等防護(hù)措施,防止發(fā)生區(qū)域性的暴發(fā)性傳染事件?;谶@樣的思路,2020年中國(guó)電科開(kāi)發(fā)了一款大數(shù)據(jù)程序,通過(guò)這款應(yīng)用政府和相關(guān)部門(mén)能夠?qū)崟r(shí)掌握各個(gè)地方的疫情情況,同時(shí)對(duì)于每個(gè)群眾而言,通過(guò)這個(gè)程序,能夠清晰地看到,自己身邊的疫情情況,及時(shí)調(diào)整外出計(jì)劃,發(fā)揮群眾的主觀能動(dòng)性,切實(shí)提高防疫措施的精準(zhǔn)度與針對(duì)性,極大地節(jié)省了人力、物力資源。在新冠疫情暴發(fā)初期,浙江省利用空間流動(dòng)大數(shù)據(jù),通過(guò)深度挖掘,提前評(píng)估了病毒蔓延的危害性,率先啟動(dòng)一級(jí)應(yīng)急響應(yīng),果斷采取了限制人口聚集、控制人口流動(dòng)、加強(qiáng)流動(dòng)人口登記、及時(shí)隔離確診與疑似病人等措施,有效地控制了疫情在當(dāng)?shù)氐穆印?/p>
在重大公共衛(wèi)生事件處理中,涉及的重點(diǎn)物資主要包含醫(yī)療物資和生活物資。重點(diǎn)物資調(diào)度包括現(xiàn)有儲(chǔ)備統(tǒng)計(jì)反饋、市場(chǎng)需求預(yù)測(cè)、目前生產(chǎn)預(yù)期與規(guī)劃以及物資分配方案等涉及多個(gè)方面的問(wèn)題。醫(yī)療物資是醫(yī)療衛(wèi)生機(jī)構(gòu)以及防疫部門(mén)正常有序開(kāi)展工作的重要保障。生活物資是保障公眾基本生活、維護(hù)社會(huì)穩(wěn)定的重要保證。對(duì)于生活物資而言,根據(jù)大數(shù)據(jù)系統(tǒng)收集到的每個(gè)區(qū)域的公眾管控情形、交通管制狀況,綜合考慮各個(gè)區(qū)域內(nèi)市場(chǎng)需求與供應(yīng)的情況,從全局調(diào)整應(yīng)急生活物資的分配,從而確保群眾基本生活平穩(wěn)有序,尤其是處于隔離、管制狀況的群眾,基本的生活保障是安撫群眾情緒的基本保障;對(duì)于醫(yī)療物資而言,尤其是基本防護(hù)設(shè)備、一線醫(yī)療防護(hù)設(shè)備等關(guān)鍵物資,需要根據(jù)各地的疫情發(fā)展?fàn)顩r進(jìn)行分析,根據(jù)各個(gè)區(qū)域的不同預(yù)警級(jí)別,從全局來(lái)保障應(yīng)急醫(yī)療物資的供應(yīng)與調(diào)度。
通過(guò)分析人群跨區(qū)域流動(dòng)和人群聚集重點(diǎn)區(qū)域,提前預(yù)警高暴發(fā)高風(fēng)險(xiǎn)地區(qū),及時(shí)向該區(qū)域調(diào)配醫(yī)療和生活物資,做到防控收益的最大化,避免出現(xiàn)社會(huì)恐慌、哄搶物資等現(xiàn)象,保障經(jīng)濟(jì)社會(huì)穩(wěn)定運(yùn)行。利用大數(shù)據(jù)排查出疫情暴發(fā)的高風(fēng)險(xiǎn)地區(qū),能夠使防疫部門(mén)可以提前有針對(duì)性地布置防疫工作,加強(qiáng)重點(diǎn)區(qū)域的布控,提升防疫資源的使用效率。
外部環(huán)境的突然變化會(huì)引發(fā)公眾強(qiáng)烈的心理波動(dòng),可能導(dǎo)致極端的思想情緒和現(xiàn)實(shí)行為。移動(dòng)互聯(lián)網(wǎng)、智能終端的普及使得公眾的關(guān)注焦點(diǎn)由傳統(tǒng)媒體轉(zhuǎn)移到微信、微博等社交平臺(tái)。多種網(wǎng)絡(luò)信息的夾雜容易與現(xiàn)實(shí)行動(dòng)互相交織,網(wǎng)絡(luò)信息在傳播的過(guò)程中容易發(fā)生偏差、甚至產(chǎn)生逆轉(zhuǎn),在專業(yè)知識(shí)、風(fēng)險(xiǎn)認(rèn)知以及情緒感染等多方面的影響下,容易產(chǎn)生放大效應(yīng)。移動(dòng)社交網(wǎng)絡(luò)的普及會(huì)放大這種個(gè)體不安情緒的傳播并加速向整個(gè)社會(huì)群體蔓延。若引導(dǎo)不當(dāng),極易導(dǎo)致社會(huì)恐慌,被不法分子利用,破壞社會(huì)穩(wěn)定。典型的事件有2003年SARS發(fā)生后,北京發(fā)生學(xué)生集體返家、民工返鄉(xiāng)事件。2011年由日本核泄漏事件引發(fā)的國(guó)內(nèi)部分地區(qū)搶鹽事件。
在重大突發(fā)公共衛(wèi)生事件處理中,網(wǎng)絡(luò)輿情大數(shù)據(jù)和搜索引擎大數(shù)據(jù)是我們重點(diǎn)關(guān)注的焦點(diǎn)。網(wǎng)絡(luò)輿情大數(shù)據(jù)主要來(lái)自于微博、微信等社交平臺(tái),主要包含公眾主動(dòng)發(fā)聲或者參與的網(wǎng)絡(luò)熱點(diǎn)事件信息,是公眾個(gè)人意見(jiàn)的客觀表達(dá),是網(wǎng)民內(nèi)心活動(dòng)與內(nèi)心訴求的真實(shí)寫(xiě)照。通過(guò)大數(shù)據(jù)技術(shù)對(duì)網(wǎng)絡(luò)輿情信息進(jìn)行抓取,可以實(shí)時(shí)跟蹤網(wǎng)絡(luò)輿情熱點(diǎn)問(wèn)題,及時(shí)研判問(wèn)題的網(wǎng)絡(luò)態(tài)勢(shì)和發(fā)展趨勢(shì),能夠及時(shí)針對(duì)輿情熱點(diǎn)難點(diǎn)問(wèn)題進(jìn)行回應(yīng),從而正確引導(dǎo)或應(yīng)對(duì)網(wǎng)絡(luò)輿情事件,對(duì)輔助把握民意,保證國(guó)家思想意識(shí)安全提供科技支撐。搜索引擎大數(shù)據(jù),主要來(lái)自于公眾利用搜索引擎在互聯(lián)網(wǎng)上獲取的數(shù)據(jù)信息,是公共內(nèi)心迫切想獲得某種數(shù)據(jù)信息的集合。通過(guò)對(duì)關(guān)鍵字、關(guān)鍵詞等搜索頻度的統(tǒng)計(jì)分析,深度挖掘公眾心理特征,捕捉公眾心理健康服務(wù)需求,有針對(duì)性地推送心理輔導(dǎo)資源,從而及時(shí)化解網(wǎng)絡(luò)危機(jī),及時(shí)做好心理干預(yù)。
當(dāng)然,在重大公共衛(wèi)生事件處理的過(guò)程中,大數(shù)據(jù)技術(shù)的應(yīng)用還不僅僅于此,在事件中后期的病源尋找、疫苗研發(fā)、企業(yè)復(fù)工復(fù)產(chǎn)等諸多方面都發(fā)揮了重要作用。
目前,我們能夠看到大數(shù)據(jù)技術(shù)在重大公共衛(wèi)生事件中發(fā)揮了重要作用,并將它的影響拓展到更豐富的領(lǐng)域。然而,我們也要清醒地認(rèn)識(shí)到,要充分發(fā)揮大數(shù)據(jù)技術(shù)的作用,我們?cè)跀?shù)據(jù)格式規(guī)范、數(shù)據(jù)開(kāi)放共享、數(shù)據(jù)信息安全等方面仍存在不同程度的缺陷,亟須解決。
數(shù)據(jù)格式的統(tǒng)一規(guī)范是大數(shù)據(jù)技術(shù)能夠廣泛應(yīng)用并向縱深發(fā)展的基本前提。目前,出于安全因素考慮,數(shù)據(jù)信息流動(dòng)一般僅限于部門(mén)內(nèi)部或者行業(yè)系統(tǒng)內(nèi)部,部門(mén)之間或者不同系統(tǒng)之間只存在少量的數(shù)據(jù)交流。對(duì)于普通屬性或字段,缺乏全社會(huì)統(tǒng)一規(guī)范與標(biāo)準(zhǔn),即使是最基本的屬性,部門(mén)數(shù)據(jù)庫(kù)都是依照部門(mén)或系統(tǒng)內(nèi)部制定的標(biāo)準(zhǔn),所采集的數(shù)據(jù)在大小、格式上都可能存在巨大的差異。比如,生日屬性:就存在純數(shù)字、數(shù)字字符夾雜以及定義多少位字符的差異。數(shù)據(jù)格式的差異直接導(dǎo)致部門(mén)之間數(shù)據(jù)不能共享,不同部門(mén)、系統(tǒng)之間的信息交流絕大部分情形執(zhí)行的是查詢操作。如果要對(duì)本部門(mén)以外的平臺(tái)數(shù)據(jù)進(jìn)行修改或者導(dǎo)入到本部門(mén)數(shù)據(jù)系統(tǒng)使用,需要耗費(fèi)額外的人力物力財(cái)力去執(zhí)行噪音數(shù)據(jù)清洗、數(shù)據(jù)格式調(diào)整、冗余字段刪除等操作,會(huì)極大影響大數(shù)據(jù)的使用效率。同時(shí),數(shù)據(jù)格式的不規(guī)范也造成了一定程度的資源浪費(fèi)。因此在通用屬性與常用字段的標(biāo)準(zhǔn)上,各級(jí)政府要推動(dòng)制定全社會(huì)統(tǒng)一的數(shù)據(jù)規(guī)范。
重大突發(fā)性公共衛(wèi)生事件,最重要的是對(duì)未來(lái)發(fā)展趨勢(shì)的預(yù)測(cè)與事件過(guò)程中的處理。整個(gè)事件的處理對(duì)預(yù)防和控制鏈的體系要求特別高,它體現(xiàn)的不只是某個(gè)環(huán)節(jié)的突出表現(xiàn),更需要的是整個(gè)體系的協(xié)同處理能力?!靶畔⒐聧u”的漏洞,導(dǎo)致區(qū)域之間信息的不對(duì)稱,數(shù)據(jù)的跨區(qū)域流動(dòng)會(huì)有一定的滯后現(xiàn)象,最直接的影響便是各地協(xié)同防控難度加大。保障數(shù)據(jù)平臺(tái)之間的數(shù)據(jù)有序開(kāi)放與共享,是大數(shù)據(jù)技術(shù)得以充分發(fā)揮的重要因素。任何大數(shù)據(jù)系統(tǒng)都是由“小數(shù)據(jù)”匯合而成。各數(shù)據(jù)平臺(tái)通過(guò)接口實(shí)現(xiàn)數(shù)據(jù)開(kāi)放,完成數(shù)據(jù)共享,是大數(shù)據(jù)系統(tǒng)形成的基礎(chǔ)。然而,從歷次重大公共衛(wèi)生事件處理過(guò)程可以發(fā)現(xiàn),醫(yī)療系統(tǒng)之間、各地政府之間、交通部門(mén)之間等“信息孤島”問(wèn)題依然突出,數(shù)據(jù)共享共通不夠,區(qū)域之間、部門(mén)之間依然存在書(shū)面?zhèn)鬟f疫情信息的情況。信息孤島極易帶來(lái)數(shù)據(jù)的重復(fù)采集和醫(yī)療資源的浪費(fèi),由此引發(fā)的數(shù)據(jù)不全、表達(dá)差異、指揮不當(dāng)、決策偏差等問(wèn)題時(shí)有出現(xiàn),大大延誤了事件的高效處理。因此,要充分發(fā)揮企業(yè)的技術(shù)優(yōu)勢(shì),為公眾提供優(yōu)質(zhì)信息資源及技術(shù)服務(wù)。相關(guān)部門(mén)要制定措施積極推進(jìn)健康大數(shù)據(jù)的共建共享,建立以政府為主導(dǎo)的大數(shù)據(jù)開(kāi)放共享體系,促進(jìn)政府?dāng)?shù)據(jù)與社會(huì)數(shù)據(jù)互聯(lián)互通,降低公眾獲取數(shù)據(jù)的門(mén)檻或成本,擴(kuò)大數(shù)據(jù)規(guī)模,豐富數(shù)據(jù)種類,實(shí)現(xiàn)大數(shù)據(jù)的系統(tǒng)性開(kāi)發(fā)與利用,充分利用大數(shù)據(jù)為我們的生產(chǎn)生活服務(wù)。
數(shù)據(jù)信息的安全是大數(shù)據(jù)技術(shù)應(yīng)用的重要保障。在重大突發(fā)公共衛(wèi)生事件處理中,我們依托的大數(shù)據(jù)與個(gè)人信息息息相關(guān)。這些數(shù)據(jù)具有客觀真實(shí)性,是個(gè)人工作、生活、學(xué)習(xí)的客觀反映,與個(gè)人的隱私息息相關(guān)。在大數(shù)據(jù)的收集、清洗、存儲(chǔ)、分析和應(yīng)用等階段,都存在數(shù)據(jù)信息泄露風(fēng)險(xiǎn),甚至還有不法分子通過(guò)非法交易數(shù)據(jù)信息牟取暴利,嚴(yán)重侵害了公眾的個(gè)人隱私。數(shù)據(jù)信息的保護(hù)不僅涉及個(gè)人,還涉及醫(yī)院、疾控中心等部門(mén)以及第三方大數(shù)據(jù)企業(yè)平臺(tái),每個(gè)成員的力量都不可或缺,這就增加了個(gè)人信息保護(hù)的難度。相關(guān)大數(shù)據(jù)一旦發(fā)生泄露,不僅會(huì)導(dǎo)致個(gè)人正常生活困擾、財(cái)產(chǎn)損失,還可能導(dǎo)致國(guó)家安全問(wèn)題。因此,要采取相應(yīng)措施保護(hù)好個(gè)人隱私數(shù)據(jù)的安全。完善相關(guān)法律,明確數(shù)據(jù)保護(hù)的權(quán)屬問(wèn)題,包括個(gè)人基本信息、醫(yī)院科研院所的研究成果等,避免監(jiān)管和保護(hù)出現(xiàn)真空地帶;加強(qiáng)醫(yī)院、疾控等相關(guān)部門(mén)內(nèi)部的數(shù)據(jù)使用權(quán)限管理,避免內(nèi)部的數(shù)據(jù)信息泄露發(fā)生;加強(qiáng)第三方大數(shù)據(jù)管理與應(yīng)用機(jī)構(gòu)的資質(zhì)審查和監(jiān)督管理,實(shí)現(xiàn)從數(shù)據(jù)的收集、存儲(chǔ)、分析和使用都處于監(jiān)管狀態(tài),同時(shí)充分發(fā)揮企業(yè)與高校科研院所的專業(yè)技術(shù)優(yōu)勢(shì),拓展企業(yè)參與渠道,實(shí)現(xiàn)多主體共同開(kāi)發(fā)共同管理的良好局面。
重大公共衛(wèi)生事件的處理既是對(duì)國(guó)家治理能力的考驗(yàn),也是國(guó)家現(xiàn)代應(yīng)急管理體系和現(xiàn)代化技術(shù)的實(shí)力體現(xiàn)。大數(shù)據(jù)帶來(lái)的新思路、新技術(shù),是“定性+定量”分析的現(xiàn)實(shí)應(yīng)用,必將推動(dòng)公共衛(wèi)生安全甚至其它突發(fā)事件的處理模式的變革與發(fā)展。
相關(guān)鏈接
大數(shù)據(jù)(big data),IT行業(yè)術(shù)語(yǔ),是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)的5V特點(diǎn)(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。
對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來(lái)適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘。但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)。隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注。分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過(guò)時(shí)間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展的存儲(chǔ)系統(tǒng)。