陳悅 曹可建
一、健康醫(yī)療大數(shù)據(jù)概述
隨著物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等新興信息技術(shù)的迅猛發(fā)展和普及應(yīng)用,行業(yè)應(yīng)用系統(tǒng)規(guī)模迅速擴(kuò)大,產(chǎn)生的數(shù)據(jù)呈現(xiàn)前所未有的爆發(fā)式增長(zhǎng)態(tài)勢(shì)。2016年6月21日,國(guó)務(wù)院辦公廳發(fā)布《國(guó)務(wù)院辦公廳關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》。部署通過(guò)“互聯(lián)網(wǎng)+健康醫(yī)療”探索服務(wù)新模式、培育發(fā)展新業(yè)態(tài),努力建設(shè)人民滿意的醫(yī)療衛(wèi)生事業(yè),為打造健康中國(guó)提供有力支撐。意見中指出要堅(jiān)持以人為本、創(chuàng)新驅(qū)動(dòng),規(guī)范有序、安全可控,開放融合、共建共享的原則,以保障全體人民健康為出發(fā)點(diǎn),大力推動(dòng)政府健康醫(yī)療信息系統(tǒng)和公眾健康醫(yī)療數(shù)據(jù)互聯(lián)融合、開放共享,積極營(yíng)造促進(jìn)健康醫(yī)療大數(shù)據(jù)安全規(guī)范、創(chuàng)新應(yīng)用的發(fā)展環(huán)境。
健康醫(yī)療大數(shù)據(jù)是指與健康醫(yī)療相關(guān),滿足大數(shù)據(jù)基本特征的數(shù)據(jù)集合,是國(guó)家重要的基礎(chǔ)性戰(zhàn)略資源,正快速發(fā)展為新一代信息技術(shù)和新型健康醫(yī)療服務(wù)業(yè)態(tài)。健康醫(yī)療大數(shù)據(jù)通??梢詣澐譃橐韵聨讉€(gè)方面:以電子健康檔案、電子病歷、醫(yī)學(xué)影像、檢驗(yàn)檢查等為主的健康醫(yī)療服務(wù)數(shù)據(jù);基因序列、蛋白質(zhì)組等生物醫(yī)學(xué)數(shù)據(jù);新型農(nóng)村合作醫(yī)療、城鎮(zhèn)職工基本醫(yī)療保險(xiǎn)、城鎮(zhèn)居民基本醫(yī)療保險(xiǎn)等醫(yī)療保險(xiǎn)數(shù)據(jù);藥物臨床試驗(yàn)、藥物篩查、基本藥物集中采購(gòu)、醫(yī)療機(jī)構(gòu)藥品與疫苗電子監(jiān)管等醫(yī)藥研發(fā)與管理數(shù)據(jù);疾病監(jiān)測(cè)、突發(fā)公共衛(wèi)生事件監(jiān)測(cè)、傳染病報(bào)告等公共衛(wèi)生數(shù)據(jù);患者行為表現(xiàn)、保健品購(gòu)買記錄、健身信息等行為與情緒數(shù)據(jù);衛(wèi)生資源與醫(yī)療服務(wù)調(diào)查、計(jì)劃生育統(tǒng)計(jì)等統(tǒng)計(jì)數(shù)據(jù);居民婚姻、家庭、計(jì)劃生育登記等人口管理數(shù)據(jù);與人類健康密切相關(guān)的空氣污染物和氣候狀況等環(huán)境數(shù)據(jù)。
二、國(guó)內(nèi)外發(fā)展現(xiàn)狀
2009年,Google比美國(guó)疾病控制與預(yù)防中心提前1~ 2周預(yù)測(cè)到了甲型H1N1流感爆發(fā),此事件震驚了醫(yī)學(xué)界和計(jì)算機(jī)領(lǐng)域的科學(xué)家。2012年聯(lián)合國(guó)發(fā)布《大數(shù)據(jù)促進(jìn)發(fā)展:挑戰(zhàn)與機(jī)遇》白皮書,以推動(dòng)各國(guó)政府機(jī)構(gòu)、重大行業(yè)對(duì)大數(shù)據(jù)技術(shù)的研究和應(yīng)用。自2012年開始,美、英、加、澳、日、韓等發(fā)達(dá)國(guó)家相繼發(fā)布一系列大數(shù)據(jù)技術(shù)研究和發(fā)展計(jì)劃,大力推進(jìn)大數(shù)據(jù)研究和應(yīng)用。2012年美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health,NIH)成立了大數(shù)據(jù)轉(zhuǎn)化知識(shí)聯(lián)盟(Big Data to Knowledge,BD2K),該組織關(guān)注生物醫(yī)學(xué)研究領(lǐng)域的大數(shù)據(jù)及其科學(xué)整合和最大化。2013年5月英國(guó)牛津大學(xué)成立了首個(gè)綜合運(yùn)用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研中心-李嘉誠(chéng)衛(wèi)生信息與發(fā)現(xiàn)中心。澳大利亞研究基金會(huì)(Australian Research Council,ARC)通過(guò)卓越研究中心項(xiàng)目對(duì)大數(shù)據(jù)研究進(jìn)行資助,包括在墨爾本大學(xué)投入2000萬(wàn)美元進(jìn)行數(shù)學(xué)和統(tǒng)計(jì)領(lǐng)域大數(shù)據(jù)、大模型、新見解卓越研究中心建設(shè),用于開展包括健康在內(nèi)的社會(huì)問(wèn)題新數(shù)據(jù)模型研究;資助生物信息學(xué)卓越研究中心,研究領(lǐng)域包括生物大數(shù)據(jù)及其應(yīng)用。目前不僅歐美國(guó)家針對(duì)健康醫(yī)療大數(shù)據(jù)推出相應(yīng)指導(dǎo)文件和建立機(jī)構(gòu)開展研究,包括日本、韓國(guó)在內(nèi)的亞洲國(guó)家也相應(yīng)發(fā)布相關(guān)大數(shù)據(jù)戰(zhàn)略。
與國(guó)外部分發(fā)達(dá)國(guó)家相比,我國(guó)大數(shù)據(jù)發(fā)展起步較晚。2015年我國(guó)出臺(tái)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,提出要構(gòu)建包括電子健康檔案、電子病歷的健康醫(yī)療服務(wù)大數(shù)據(jù),建設(shè)覆蓋公共衛(wèi)生、醫(yī)療服務(wù)、醫(yī)療保障、藥品供應(yīng)、計(jì)劃生育和綜合管理業(yè)務(wù)的健康醫(yī)療管理和服務(wù)大數(shù)據(jù)應(yīng)用體系,開展健康醫(yī)療大數(shù)據(jù)創(chuàng)新應(yīng)用研究。2016年4月國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì)規(guī)劃司從慧民服務(wù)工程、業(yè)務(wù)協(xié)同工程、業(yè)務(wù)監(jiān)管工程、平臺(tái)基礎(chǔ)建設(shè)工程4個(gè)方面分列3級(jí)平臺(tái)必備70項(xiàng)功能,絕大多數(shù)均涉及健康醫(yī)療大數(shù)據(jù)應(yīng)用,健康醫(yī)療大數(shù)據(jù)將成為“十三五”人口健康信息化建設(shè)的核心工作。
目前國(guó)內(nèi)外針對(duì)健康醫(yī)療大數(shù)據(jù)的研究廣泛而多領(lǐng)域,包括生物醫(yī)學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)等領(lǐng)域,大數(shù)據(jù)的應(yīng)用是醫(yī)療健康信息化智能化的最新趨勢(shì)。而目前國(guó)內(nèi)外還無(wú)人對(duì)醫(yī)療數(shù)據(jù)形成、醫(yī)療數(shù)據(jù)采集、醫(yī)療數(shù)據(jù)存儲(chǔ)、醫(yī)療數(shù)據(jù)傳輸交互與發(fā)布、醫(yī)療數(shù)據(jù)分析到可視化等領(lǐng)域進(jìn)行系統(tǒng)而全面的綜述性研究。因此為了促進(jìn)我國(guó)健康醫(yī)療大數(shù)據(jù)技術(shù)的發(fā)展,迫切需要系統(tǒng)且全面地綜述健康醫(yī)療大數(shù)據(jù)的發(fā)展?fàn)顩r,多視角總結(jié)最新健康醫(yī)療大數(shù)據(jù)研究技術(shù)與學(xué)術(shù)成果,深度分析健康醫(yī)療大數(shù)據(jù)各種應(yīng)用場(chǎng)景的技術(shù)成熟度及產(chǎn)業(yè)化現(xiàn)狀,對(duì)具有發(fā)展?jié)摿Φ膽?yīng)用場(chǎng)景及其支撐技術(shù)提出建議,為促進(jìn)我國(guó)醫(yī)療健康大數(shù)據(jù)的發(fā)展提供有力而系統(tǒng)化參考與指導(dǎo)意見。
三、健康醫(yī)療大數(shù)據(jù)技術(shù)特征
醫(yī)療大數(shù)據(jù)具有多態(tài)性、不完整性、時(shí)效性、冗余性、隱私性等特征。
(1)多態(tài)性:醫(yī)療數(shù)據(jù)的表達(dá)格式包括文本型、數(shù)字型和圖像型。文本型數(shù)據(jù)包括人口特征、醫(yī)囑、藥物使用、臨床癥狀描述等數(shù)據(jù);數(shù)字型數(shù)據(jù)包括檢驗(yàn)科的生理數(shù)據(jù)、生化數(shù)據(jù)、生命體征數(shù)據(jù)等;圖像型數(shù)據(jù)包括醫(yī)院中的各種影像學(xué)檢查如B超、CT、MRI、X光等圖像資料。在文本型數(shù)據(jù)中,數(shù)據(jù)的表達(dá)很難標(biāo)準(zhǔn)化,對(duì)病例狀態(tài)的描述具有主觀性,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)和要求,甚至對(duì)臨床數(shù)據(jù)的解釋都是使用非結(jié)構(gòu)化的語(yǔ)言。多態(tài)性是醫(yī)學(xué)數(shù)據(jù)區(qū)別于其他領(lǐng)域數(shù)據(jù)的最根本和最顯著的特性。這種特性也在一定程度上加大了醫(yī)療數(shù)據(jù)的分析難度和速度。
(2)不完整性:醫(yī)療數(shù)據(jù)的搜集和處理過(guò)程存在脫節(jié),醫(yī)療數(shù)據(jù)庫(kù)對(duì)疾病信息的反映有限。同時(shí),人工記錄的數(shù)據(jù)會(huì)存在數(shù)據(jù)的偏差與殘缺,數(shù)據(jù)的表達(dá)、記錄有主觀上的不確定性。同一種疾病并不可能全面由醫(yī)學(xué)數(shù)據(jù)反映出來(lái),因此疾病的臨床治療方案并不能通過(guò)對(duì)數(shù)據(jù)的分析和挖掘而得出。另外,從長(zhǎng)期來(lái)看,隨著治療手段和技術(shù)手段的發(fā)展,新類型的醫(yī)療數(shù)據(jù)被創(chuàng)造出來(lái),數(shù)據(jù)挖掘的對(duì)象的維度是在不停的增長(zhǎng)的。
(3)時(shí)效性:病人的就診、疾病的發(fā)病過(guò)程在時(shí)間上有一個(gè)進(jìn)度,醫(yī)學(xué)檢測(cè)的波形信號(hào)(比如說(shuō)心電、腦電)和圖像信號(hào)(MRI, CT等)屬于時(shí)間函數(shù),具有時(shí)效性。例如心電信號(hào)檢測(cè)中,短時(shí)的心電無(wú)法檢出某些陣發(fā)性信號(hào),而只能通過(guò)長(zhǎng)期監(jiān)測(cè)的方式實(shí)現(xiàn)心臟狀態(tài)的監(jiān)測(cè)。
(4)冗余性:醫(yī)療數(shù)據(jù)中存在大量的相同或類似信息被記錄下來(lái)。比如常見疾病的描述信息,與病理特征無(wú)關(guān)的檢查信息。
(5)隱私性:在對(duì)醫(yī)療數(shù)據(jù)的數(shù)據(jù)挖掘中,不可避免的會(huì)涉及到患者的隱私信息,這些隱私信息的泄露會(huì)對(duì)患者的生活造成不良的影響。特別是在移動(dòng)健康和醫(yī)療服務(wù)的體系中,將醫(yī)療數(shù)據(jù)和移動(dòng)健康監(jiān)測(cè)甚至一些網(wǎng)絡(luò)行為、社交信息整合到一起的時(shí)候,醫(yī)療數(shù)據(jù)的隱私泄露帶來(lái)的危害將更加嚴(yán)重。大數(shù)據(jù)分析中隱私保護(hù)要注意兩個(gè)方面:其一,用戶身份、姓名、地址和疾病等敏感信息的保密;其二,經(jīng)分析后所得的私人信息的保密。
四、應(yīng)用前景
醫(yī)療健康大數(shù)據(jù)應(yīng)用廣泛,行業(yè)治理、臨床科研、公共衛(wèi)生、管理決策、便民惠民以及產(chǎn)業(yè)發(fā)展是當(dāng)前我國(guó)健康醫(yī)療大數(shù)據(jù)的六大核心應(yīng)用。主要表現(xiàn)在疾病預(yù)防、臨床輔助決策、科學(xué)研究、醫(yī)療評(píng)價(jià)、健康管理、個(gè)性化治療、醫(yī)保支付等多個(gè)方面,然而就國(guó)內(nèi)目前的情況來(lái)看,醫(yī)療健康大數(shù)據(jù)仍處于探索階段,在疾病預(yù)防、臨床決策等方面還有很長(zhǎng)的路要走。
行業(yè)治理聚焦于體制改革評(píng)估、醫(yī)院管理和醫(yī)??刭M(fèi);臨床科研方面以臨床決策支持最為熱門,另外還包括藥物研發(fā)、精準(zhǔn)醫(yī)療等方面;公共衛(wèi)生則在多元化數(shù)據(jù)檢測(cè)的基礎(chǔ)上,構(gòu)建重大突發(fā)事件預(yù)警和應(yīng)急響應(yīng)體系,同時(shí)探索開展個(gè)性化健康管理服務(wù)。在應(yīng)用開發(fā)方面,IT 巨頭和數(shù)據(jù)驅(qū)動(dòng)型創(chuàng)新企業(yè)各有特點(diǎn),除此之外,擁有豐富資源的政府和醫(yī)療機(jī)構(gòu)也開始扮演重要的角色。
醫(yī)療行業(yè)的傳統(tǒng)數(shù)據(jù)應(yīng)用具有重要的參考價(jià)值,必須明確的是大數(shù)據(jù)的發(fā)展是建立在已有的技術(shù)基礎(chǔ)、數(shù)據(jù)積累之上的拓展。新的信息分析技術(shù)和通訊技術(shù)為傳統(tǒng)的醫(yī)療網(wǎng)絡(luò)應(yīng)用和數(shù)據(jù)分析帶來(lái)了新的思路。