王 藝,任淑霞
天津工業(yè)大學 計算機科學與軟件學院,天津 300387
醫(yī)療大數(shù)據(jù)可視化研究綜述
王 藝,任淑霞+
天津工業(yè)大學 計算機科學與軟件學院,天津 300387
隨著“互聯(lián)網(wǎng)+”的迅速發(fā)展,醫(yī)療大數(shù)據(jù)不僅數(shù)據(jù)類型繁多、關系復雜,且呈爆炸式增長,一般的數(shù)據(jù)可視化方法難以對其進行有效的展示,醫(yī)療大數(shù)據(jù)可視化技術(shù)面臨巨大挑戰(zhàn)。概述了醫(yī)療大數(shù)據(jù)的起源、特點及其研究進展,介紹了醫(yī)療大數(shù)據(jù)可視化的相關概念及其研究現(xiàn)狀,將現(xiàn)有醫(yī)療大數(shù)據(jù)可視化方法劃分為兩大類,分類闡述了常見的醫(yī)療大數(shù)據(jù)可視化方法,給出了包括分類、圖例、特性的可視化方法比較一覽表。最后分析了醫(yī)療大數(shù)據(jù)可視化中存在的問題,指出其未來研究重點,對醫(yī)療大數(shù)據(jù)可視化方法研究與普及應用具有重要的參考價值。
醫(yī)療大數(shù)據(jù);大數(shù)據(jù)可視化;互聯(lián)網(wǎng)+
隨著“互聯(lián)網(wǎng)+”的迅速發(fā)展,醫(yī)療大數(shù)據(jù)呈爆炸式增長,面臨著海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)處理的挑戰(zhàn)。近年來很多國家都在積極推進醫(yī)療信息化發(fā)展,醫(yī)療大數(shù)據(jù)的分析和應用發(fā)揮了巨大的作用,大大提高了醫(yī)療效率和醫(yī)療效果。傳統(tǒng)醫(yī)學是患者生病后由醫(yī)生來治病,而目前疾病預防重于治療,強調(diào)醫(yī)生應該對“健康人”進行健康管理,把疾病治療的關口前移。因此,醫(yī)療大數(shù)據(jù)的重要性和有效性突顯出來,研究醫(yī)療大數(shù)據(jù)可視化技術(shù)變得尤為關鍵。
自2007年IBM正式提出“云計算”概念以來,許多專家給出“云計算”的定義[1]。各種智能設備、傳感器、電子網(wǎng)站、社交網(wǎng)絡每時每刻都在產(chǎn)生海量數(shù)據(jù),引發(fā)數(shù)據(jù)規(guī)模爆炸式增長,從而催生“大數(shù)據(jù)(big data)”出現(xiàn)。醫(yī)療行業(yè)[2]將和銀行、電信、電商等行業(yè)一起邁入大數(shù)據(jù)時代。
大數(shù)據(jù)[3-4]被定義為5個“V”(規(guī)模Volume、多樣Variety、速度Velocity、價值Value、真實Veracity)。第一,數(shù)據(jù)規(guī)模龐大(Volume):大數(shù)據(jù)的起始計量單位至少是P(1015)、E(1018)或Z(1021)。目前,大數(shù)據(jù)規(guī)模是一個不斷變化的指標,單一數(shù)據(jù)集的規(guī)模從幾十TB到數(shù)PB不等[5-6]。第二,數(shù)據(jù)類型繁多(Variety):比如社交媒體(圖像、音頻、視頻)、互聯(lián)網(wǎng)搜索、傳感器網(wǎng)絡、地理位置信息等。第三,處理速度快(Velocity):即數(shù)據(jù)被創(chuàng)建和移動傳輸?shù)乃俣瓤欤@一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。第四,價值密度低,商業(yè)價值高(Value):通過分析大數(shù)據(jù)可以得出事物發(fā)展趨勢,從而獲取有價值的商業(yè)信息[7]。第五,數(shù)據(jù)真實性(Veracity):大數(shù)據(jù)的本質(zhì)就是從龐大的網(wǎng)絡數(shù)據(jù)中科學地提取出能夠解釋和預測現(xiàn)實事件的過程[8],然而數(shù)據(jù)內(nèi)容的真實與否,將影響大數(shù)據(jù)的有效性,進而影響其價值。
2.1 醫(yī)療大數(shù)據(jù)來源
醫(yī)療大數(shù)據(jù)指的是在醫(yī)療行業(yè)中產(chǎn)生的數(shù)據(jù),它們主要有以下4個來源[9-11]。
(1)臨床實驗數(shù)據(jù)
醫(yī)療機構(gòu)的信息系統(tǒng)多而復雜,數(shù)據(jù)量增長非???,一張CT圖像含有數(shù)據(jù)量約為100 MB,一個標準病理圖接近5 GB,以此計算,僅一個社區(qū)醫(yī)院的數(shù)據(jù)量就可達數(shù)TB甚至數(shù)PB之多。
(2)生物醫(yī)藥
藥物研發(fā)是密集型的過程,中小型的制藥企業(yè)產(chǎn)生的數(shù)據(jù)也在TB以上。在生命科學領域,DNA基因序列、生物芯片等研究過程每時每刻都在產(chǎn)生新的數(shù)據(jù),比如說,DNA測序每年產(chǎn)生的數(shù)據(jù)量都在PB級。
(3)電子病例、診斷書
就醫(yī)過程中對病情的描述,醫(yī)生的診斷和用藥信息,產(chǎn)生的電子病例。例如,EMR是基于一個特定系統(tǒng)的電子化病人記錄,該系統(tǒng)提供用戶訪問完整準確的數(shù)據(jù)、警示、提示和臨床決策支持系統(tǒng)的能力。
(4)個體健康信息
由于移動可穿戴設備正在不斷普及,個體健康信息實時上傳至互聯(lián)網(wǎng),由此也可產(chǎn)生海量數(shù)據(jù)[12]。
2.2 醫(yī)療大數(shù)據(jù)的研究特點及應用
近年來,醫(yī)療大數(shù)據(jù)理論得到初步發(fā)展,但在其應用方向發(fā)展緩慢。醫(yī)療大數(shù)據(jù)除了具有大數(shù)據(jù)5個特點之外,還有多態(tài)性、時效性、不完整性、冗余性、隱私性等特點。
多態(tài)性是指醫(yī)師對病人的描述具有主觀性而難以達到標準化;時效性是指數(shù)據(jù)僅在一段時間內(nèi)有用;不完整性是指醫(yī)療分析對病人的狀態(tài)描述有偏差和缺失;冗余性是指醫(yī)療數(shù)據(jù)存在大量重復或無關的信息;隱私性是指用戶的醫(yī)療健康數(shù)據(jù)具有高度的隱私性,泄漏信息會造成嚴重后果。
喬布斯通過大數(shù)據(jù)輔助治療癌癥,丹麥癌癥協(xié)會通過大數(shù)據(jù)研究手機是否致癌等,美國最大的西奈山醫(yī)療中心使用來自大數(shù)據(jù)創(chuàng)業(yè)公司Ayasdi的技術(shù)分析大腸桿菌的全部基因序列,包括超過100萬個DNA變體,來了解菌株為什么會對抗生素產(chǎn)生抗藥性。上述應用研究體現(xiàn)出分析醫(yī)療大數(shù)據(jù)的價值。
2013年,中國衛(wèi)生信息學會做出中國健康信息技術(shù)的成熟度曲線[13]。通過中國醫(yī)療衛(wèi)生信息技術(shù)應用成熟度曲線,可直觀得出中國醫(yī)療大數(shù)據(jù)正處于技術(shù)觸發(fā)期和期望膨脹期交界,并且受關注程度比較高,同時該圖也顯示出未來醫(yī)療大數(shù)據(jù)的技術(shù)成熟趨勢和發(fā)展前景。
3.1 醫(yī)療大數(shù)據(jù)簡介
英特爾全球醫(yī)療解決方案架構(gòu)師吳聞新團隊提出全球老齡化讓醫(yī)療行業(yè)數(shù)據(jù)大幅度增長,尤其體現(xiàn)在影像數(shù)據(jù)和EMR電子病歷數(shù)據(jù)中[14]。對于大幅度增長的醫(yī)療數(shù)據(jù)快速檢索和存儲均需建立一種全新的數(shù)據(jù)模式,來滿足更大的容量需求和更好的性能要求等[15],如圖1所示。
Fig.1 Maturity curve of Chinese healthcare information technology圖1 中國醫(yī)療衛(wèi)生信息技術(shù)應用成熟度曲線
在這種全新的數(shù)據(jù)模式基礎上,對大幅度增長的醫(yī)療大數(shù)據(jù)進行分析并使用可視化技術(shù)進行直觀展示變得尤為重要。由此可見,目前是研究醫(yī)療大數(shù)據(jù)可視化的最佳時期。截止到2016年12月,在美國《科學引文索引》(Science Citation Index,SCI)中收錄的以醫(yī)療大數(shù)據(jù)為主題的學術(shù)論文共有6 497篇,在美國《工程索引》(The Engineering Index,EI)中收錄的以醫(yī)療大數(shù)據(jù)為主題的學術(shù)論文942篇,在中國知網(wǎng)(China National Knowledge Infrastructure,CNKI)中收錄的以醫(yī)療大數(shù)據(jù)為主題的學術(shù)論文13 244篇。
以醫(yī)療大數(shù)據(jù)為主題的學術(shù)論文數(shù)量統(tǒng)計如圖2所示。2005年醫(yī)療大數(shù)據(jù)研究剛剛起步,自2007年進入增長期,至今仍處于研究領域的焦點地位。
Fig.2 Number of medical big data literatures圖2 醫(yī)療大數(shù)據(jù)文獻數(shù)量
3.2 醫(yī)療大數(shù)據(jù)國內(nèi)外研究進展
醫(yī)療大數(shù)據(jù)的研究和應用越來越廣泛,對SCI、EI和CNKI中收錄的以醫(yī)療大數(shù)據(jù)為主題的學術(shù)論文進行統(tǒng)計,發(fā)現(xiàn)在精準醫(yī)療大數(shù)據(jù)、生物醫(yī)藥大數(shù)據(jù)、公共衛(wèi)生大數(shù)據(jù)和生命科學等領域都得到不同程度的發(fā)展。
(1)國內(nèi)醫(yī)療大數(shù)據(jù)研究現(xiàn)狀
截止到2016年12月,中南大學發(fā)表了39篇相關學術(shù)論文,研究了大數(shù)據(jù)分析及其在醫(yī)療領域中的應用[16],國外醫(yī)學大數(shù)據(jù)研究進展及其啟示[17],大數(shù)據(jù)在醫(yī)療衛(wèi)生中的應用前景[18],顯示出在大數(shù)據(jù)的背景下,醫(yī)療大數(shù)據(jù)量增長之快和發(fā)展速度之迅猛。
(2)國外醫(yī)療大數(shù)據(jù)研究現(xiàn)狀
截止到2016年12月,在SCI檢索系統(tǒng)中,標題中含Big Data和Medical的學術(shù)論文共6 497篇。對研究團隊進行統(tǒng)計:Causal Discovery團隊發(fā)表的學術(shù)論文影響因子較大,主要研究從大數(shù)據(jù)的生物醫(yī)學知識發(fā)現(xiàn)的因果關系[19];ACTION研究小組發(fā)表相關學術(shù)論文,對東南亞8個國家關于衛(wèi)生支出、死亡率和癌癥發(fā)病率進行縱向?qū)Ρ妊芯縖20];美國心臟協(xié)會通過心血管大數(shù)據(jù)調(diào)查,提出了未來建立心血管疾病和中風疾病相互協(xié)作的數(shù)字生態(tài)系統(tǒng)[21];Participating實驗室發(fā)表相關學術(shù)論文,闡述了由制造商使用大數(shù)據(jù)技術(shù)來監(jiān)測實驗室數(shù)據(jù)的過程[22];Wang等人發(fā)表了MOOC研究機構(gòu)在高血壓醫(yī)療大數(shù)據(jù)研究中扮演重要角色[23];Sun等人發(fā)表相關學術(shù)論文,研發(fā)了用于移動設備的基于網(wǎng)絡的醫(yī)學圖像協(xié)同處理系統(tǒng)[24]。
通過研究發(fā)現(xiàn),醫(yī)療大數(shù)據(jù)的研究仍處于探索階段。由于醫(yī)療大數(shù)據(jù)作為跨學科的研究,研究過程存在一定難度,而且醫(yī)療系統(tǒng)數(shù)據(jù)管制體系也導致了醫(yī)療大數(shù)據(jù)難以獲取,存在醫(yī)療信息孤島等問題,使得醫(yī)療大數(shù)據(jù)研究難以在一般研究機構(gòu)開展。目前,相關工作主要集中在工程應用部分,具體體現(xiàn)在數(shù)據(jù)采集和存儲。而在理論研究方面,大多數(shù)工作現(xiàn)僅停留在評述醫(yī)療大數(shù)據(jù)規(guī)模特點及使用價值上,針對醫(yī)療大數(shù)據(jù)本身的挖掘計算、數(shù)據(jù)關系分析和可視化技術(shù)等基礎方面的實質(zhì)性研究較少。
在計算機科學的分類中,利用人眼的感知能力對數(shù)據(jù)進行交互的可視化表達以增強認知的技術(shù)稱為可視化[25]。大數(shù)據(jù)可視化不僅利用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中挖掘有用的信息,而且還要把數(shù)據(jù)挖掘技術(shù)得到的信息向用戶直觀地展示。
4.1 大數(shù)據(jù)可視化簡介
一幅圖勝過千言萬語,從此立足點出發(fā),大數(shù)據(jù)分析的理論和方法研究可以從兩個維度展開:一是從機器或計算機的角度出發(fā),強調(diào)機器的計算能力和人工智能,以各種高性能處理算法、智能搜索與挖掘算法等為主要研究內(nèi)容,例如基于Hadoop和Map-Reduce框架的大數(shù)據(jù)處理方法以及各類面向大數(shù)據(jù)的機器學習和數(shù)據(jù)挖掘方法等,這也是目前大數(shù)據(jù)分析領域的研究主流。另一維度以人作為分析主體和需求主體的角度作為出發(fā)點,強調(diào)基于人機交互的、符合人的認知規(guī)律的分析方法,意圖將人所具備的、機器并不擅長的認知能力融入分析過程中,此研究分支以大數(shù)據(jù)可視化[26]為主要代表。
4.2 醫(yī)療大數(shù)據(jù)可視化技術(shù)研究概況
截止到2016年12月,統(tǒng)計以醫(yī)療大數(shù)據(jù)可視化主題搜索的學術(shù)論文數(shù):SCI中收錄826篇,EI中收錄148篇,CNKI中收錄61篇。醫(yī)療大數(shù)據(jù)可視化的研究和應用尚處于探索階段。在SCI等高級檢索數(shù)據(jù)庫中從2013年起各個醫(yī)療領域可視化文章數(shù)量逐年暴漲,如圖3所示。
Fig.3 Literatures in various fields in SCI圖3 SCI各醫(yī)療領域文獻數(shù)量
4.2.1 國外醫(yī)療大數(shù)據(jù)可視化研究現(xiàn)狀
截止到2016年12月,在SCI檢索系統(tǒng)中,標題中含醫(yī)療大數(shù)據(jù)可視化的相關學術(shù)論文共142篇。其中Yang團隊研究精準醫(yī)療大數(shù)據(jù)可視化并發(fā)表論文,提出從社會媒體中過濾大數(shù)據(jù),建立藥物不良反應預警系統(tǒng)[27];Zhang團隊研究生物醫(yī)藥大數(shù)據(jù)可視化并發(fā)表論文,進行免疫學中的大數(shù)據(jù)分析[28];Gaspar團隊的論文闡述了大數(shù)據(jù)增量生成拓撲圖的化學數(shù)據(jù)可視化與分析[29];Alvarez-Moreno團隊通過研究化學醫(yī)藥大數(shù)據(jù)可視化并發(fā)表論文,提出使用iochem-BD平臺來解決計算化學的大數(shù)據(jù)問題[30];You團隊研究如何使用集成計算模型的生物傳感大數(shù)據(jù)來檢測大規(guī)模蛋白質(zhì)的相互作用[31]。Ahlbrandt團隊在公共衛(wèi)生大數(shù)據(jù)可視化領域中,發(fā)表論文并提出大數(shù)據(jù)的發(fā)展需求和病人隱私的平衡點——分散式急救護理研究數(shù)據(jù)庫的一個信息系統(tǒng)基礎設施[32];Lupse團隊在公共衛(wèi)生大數(shù)據(jù)可視化研究中,闡述了大數(shù)據(jù)處理支持診斷與治療[33]的必要性。
4.2.2 國內(nèi)醫(yī)療大數(shù)據(jù)可視化研究現(xiàn)狀
目前,國內(nèi)醫(yī)療大數(shù)據(jù)可視化的研究和應用均處于探索階段,截止到2016年12月,在中國知網(wǎng)可檢索到標題中出現(xiàn)醫(yī)療大數(shù)據(jù)可視化的學術(shù)論文共61篇,其中影響較大的浙江大學在醫(yī)療大數(shù)據(jù)可視化方面發(fā)表了7篇學術(shù)論文:提出了多GPU環(huán)境下的并行體繪制[34],分布式醫(yī)學影像數(shù)據(jù)的Streaming技術(shù)框架研究及實踐[35],基于GPU集群的并行體繪制[36],海量數(shù)據(jù)的曲面分層重建算法[37],海量數(shù)據(jù)的曲面分片重建算法[38],基于變換編碼的壓縮體繪制[39]的研究。電子科技大學團隊對醫(yī)療大數(shù)據(jù)可視化進行了一系列的研究,發(fā)表了什邡市人民醫(yī)院醫(yī)學圖像三維可視化系統(tǒng)的構(gòu)建的學術(shù)論文[40-43]。南方醫(yī)科大學的董現(xiàn)玲團隊對醫(yī)療大數(shù)據(jù)可視化進行了一系列的研究,提出了實時交互的醫(yī)學圖像可視化[44]、醫(yī)學圖像體繪制及其加速技術(shù)研究[45]。
在精準醫(yī)療[46]領域中,哈爾濱工業(yè)大學的肖永飛提出了醫(yī)學數(shù)據(jù)三維交互的可視化方法[47]。在生物醫(yī)藥領域中,劉江濤和邢輝團隊闡述了生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[48];李正和康立源團隊進行了中藥制藥過程數(shù)據(jù)集成、數(shù)據(jù)挖掘與可視化技術(shù)[49]的研究。在公共衛(wèi)生領域中,山東大學的王亮完成了基于DSP的心電監(jiān)護系統(tǒng)的設計與開發(fā)[50]。
面對復雜的醫(yī)療數(shù)據(jù)和日漸增長的就醫(yī)需求,醫(yī)療大數(shù)據(jù)可視化是最為行之有效的工具。它具有挖掘數(shù)據(jù)價值,預測疾病發(fā)展趨勢,輔助臨床診斷,研發(fā)生物醫(yī)藥等方面的作用,從而推動大數(shù)據(jù)時代背景下智能醫(yī)療不斷前進。
大數(shù)據(jù)可視化技術(shù)包含傳統(tǒng)的科學可視化和信息可視化,從大數(shù)據(jù)分析以挖取信息和洞悉知識作為目標的角度出發(fā),信息可視化技術(shù)將在大數(shù)據(jù)可視化中扮演更為重要的角色。數(shù)據(jù)信息類型各異,可分為時空數(shù)據(jù)、非時空數(shù)據(jù)兩大類。這些與大數(shù)據(jù)密切相關的信息類型與Shneiderman[51-52]的分類交叉融合,將成為大數(shù)據(jù)可視化的主要研究領域。
大數(shù)據(jù)分析技術(shù)不僅對結(jié)構(gòu)化數(shù)據(jù)有很強的處理能力,對非結(jié)構(gòu)化數(shù)據(jù)的分析能力也日益加強。例如醫(yī)療影像(X光片、CT、MRI)數(shù)據(jù)可以借助于圖像識別技術(shù),通過區(qū)分不同灰度值來判斷病灶的精確位置,從而使得臨床決策支持系統(tǒng)更加智能化,給醫(yī)生提供更合理的診療建議。
盡管醫(yī)療大數(shù)據(jù)信息類型繁多,但強大而靈活的可視化技術(shù),可以增強醫(yī)療大數(shù)據(jù)的可讀性。為便于對醫(yī)療大數(shù)據(jù)進行進一步的理解和應用,對不同類型的醫(yī)療大數(shù)據(jù)可視化方法進行分類研究顯得尤為重要。
本文分析了常見的16種醫(yī)療大數(shù)據(jù)可視化方法,根據(jù)數(shù)據(jù)特點將其分為以下兩類:時空數(shù)據(jù)和非時空數(shù)據(jù),如圖4所示。
5.1 時空數(shù)據(jù)
時空數(shù)據(jù)是指具有地理位置與時間標簽的數(shù)據(jù)。傳感器與移動終端的迅速普及,使得時空數(shù)據(jù)成為大數(shù)據(jù)時代典型的數(shù)據(jù)類型[53-54]。時空數(shù)據(jù)可視化與地理制圖學相結(jié)合,重點對時間與空間維度以及與之相關的信息對象屬性建立可視化表征,對與時間和空間密切相關的模式及規(guī)律進行展示。大數(shù)據(jù)環(huán)境下時空數(shù)據(jù)的高維性、實時性等特點,也是時空數(shù)據(jù)可視化的重點。
Fig.4 Classification tree of medical big data visualization圖4 醫(yī)療大數(shù)據(jù)可視化分類樹
5.1.1 空間標量場可視化
空間數(shù)據(jù)[55-56]spatial data)是帶有物理空間坐標的數(shù)據(jù),其中標量場是空間采樣位置上記錄單個標量的數(shù)據(jù)場。
(1)一維標量場可視化
一維標量場可視化[57]是沿某一條路徑采樣得到的標量場數(shù)據(jù),用線圖形式呈現(xiàn)出數(shù)據(jù)的分布規(guī)律。在血常規(guī)化驗單中,血項數(shù)值會使用一維標量場可視化呈現(xiàn)出結(jié)果,如圖5所示。
Fig.5 1-dimensional scalar field visualization圖5 一維標量場可視化
此方法適用于各種生物化驗結(jié)果的顯示,如血常規(guī)中的紅細胞RBC(俗稱紅血球)、白細胞(俗稱白血球)、血小板計數(shù)PLT等血項。通過觀察數(shù)量變化及形態(tài)分布判斷疾病,是醫(yī)生診斷病情的常用輔助檢查手段之一。另外該方法還適用于佩戴式的移動醫(yī)療保健檢測儀器中,佩戴者通過觀測身體各項指標來及時監(jiān)控自己的健康狀況。
(2)二維標量場可視化
二維標量場可視化[58]通過在二維面上標量數(shù)據(jù)的分布特征表現(xiàn)出來。比如用于醫(yī)學診斷X光片的顏色映射法[59],如圖6所示。
Fig.6 2-dimensional scalar field visualization圖6 二維標量場可視化
此方法適用于X光片技術(shù),由于穿過病灶后映射出灰度圖像的深淺不同,可判斷出是否有病灶及其精確位置,從而幫助醫(yī)生快速確診。
5.1.2 地理信息可視化
地理信息可視化[60]是地理信息傳輸?shù)年P鍵步驟,其理論與技術(shù)的拓展將為地理信息傳輸效果的提升提供更有效的途徑。
(1)點數(shù)據(jù)可視化
透過地理空間中的離散點(數(shù)據(jù)對象),具有經(jīng)緯度的坐標,用于表示數(shù)據(jù)對象的發(fā)展現(xiàn)狀。透過數(shù)據(jù)對象屬性(顏色、大?。﹨^(qū)分,遵循指定的原則來可視化出其發(fā)展程度。Ward等人[61]發(fā)現(xiàn)基于地圖劃分的地理信息點的數(shù)據(jù)統(tǒng)計中,三維方柱越高,代表該區(qū)域空間內(nèi)交通越忙碌,如圖7所示。
Fig.7 Point data visualization圖7 點數(shù)據(jù)可視化圖
此方法適用于分析歷年病例,通過統(tǒng)計不同時段不同地區(qū)各類常見疾病的發(fā)病情況,實時預測是否有異常出現(xiàn),從而推斷出是否有新病種或疫情出現(xiàn)。
(2)線數(shù)據(jù)可視化
線數(shù)據(jù)可視化地理空間數(shù)據(jù)中,線數(shù)據(jù)是連接兩個或者多個地點的線段或路徑,可展示地區(qū)性遺傳疾病和流感發(fā)病預測的分布情況。為了反映信息對象隨時間進展與空間位置所發(fā)生的行為變化,可通過信息對象的屬性可視化來展現(xiàn)。流式地圖Flow map是一種典型的方法[62-64],如圖8所示。
此方法適用于控制突發(fā)性傳染病蔓延趨勢,通過分析病疫情的來源及蔓延趨勢程度,及時準確收集信息,做出高效的應對方案,切斷傳染源,控制疫情的發(fā)展。
Fig.8 Line data visualization圖8 線數(shù)據(jù)可視化圖
(3)區(qū)域數(shù)據(jù)可視化
地理空間的一個區(qū)域中有長度也有寬度,是由一系列點所標識的一個二維的封閉空間。目的是為了表現(xiàn)區(qū)域[65-66]的屬性,在不同區(qū)域中,分析人口密集度,便于政府考慮數(shù)據(jù)分布和地理區(qū)域大小對稱性,如圖9所示。
Fig.9 Visualization map of area data圖9 區(qū)域數(shù)據(jù)可視化地形圖
此方法適用于區(qū)域衛(wèi)生數(shù)據(jù)的分析和預測,結(jié)合地理位置、環(huán)境污染程度和經(jīng)濟形勢等因素,監(jiān)測新生兒死亡率或慢性病的發(fā)病情況。同時也可判斷是否出現(xiàn)地域性遺傳病。
5.1.3 時變數(shù)據(jù)可視化
隨著時間變化、帶有時間屬性的數(shù)據(jù)稱作時變數(shù)據(jù)(temporal data)。
(1)時間屬性可視化
將時間屬性或者順序當成時間軸變量,每個數(shù)據(jù)實例是軸上某個變量值對應的事件。按照歷史動力學理論,通過人口增長數(shù)量、環(huán)境污染指數(shù)等變量,推斷出有經(jīng)驗的規(guī)律和周期。
如圖10所示,Spinney等人[67]展示了每隔50年美國城市暴力的周期圖例。
Fig.10 Temporal attribute visualization圖10 時間屬性可視化圖
如圖11所示,基于聚類分析的日歷視圖和時間序列數(shù)據(jù)圖分析,Wijk等人[68]將小時、日期作為x、y軸,耗電量作為高度,既呈現(xiàn)了全年的耗電量走勢,也呈現(xiàn)了每日耗電量的周期性特征。
Fig.11 Calendar view and time series data graph based on cluster analysis圖11 基于聚類分析日歷視圖和時間序列數(shù)據(jù)圖
此方法適用于日常門診,通過分析每日就診量及候診時間等信息,借助日歷視圖和時間屬性圖,全面研究和分析日常就診的每個業(yè)務過程的瓶頸,從而改善日常工作就診的服務質(zhì)量。
(2)流數(shù)據(jù)可視化
通過流模式生成流數(shù)據(jù),一類特殊的具有無限長度的時間軸的時變型數(shù)據(jù)。按功能可以把這樣的數(shù)據(jù)分為兩類。
第一類為監(jiān)控型,是用流動窗口固定一個時間區(qū)間,把流數(shù)據(jù)轉(zhuǎn)化成靜態(tài)數(shù)據(jù),數(shù)據(jù)更新方式是刷新,屬于局部分析。
第二類是疊加型,是把新產(chǎn)生的數(shù)據(jù)可視映射到原來的歷史數(shù)據(jù)可視化結(jié)果上,更新方式是漸進式更新,屬于全局分析。Luo等人[69]使用增量聚類算法從一系列時間中提取熱門話題,用EventRiver在一個布局界面中自然地表達出來,如圖12所示。
Fig.12 Flow data visualization of EventRiver圖12 EventRiver流數(shù)據(jù)可視化圖
此方法適用于按日期銷售藥品量,對各大醫(yī)院、社區(qū)醫(yī)院和網(wǎng)絡銷售等不同渠道的藥品銷量進行分析。通過數(shù)據(jù)流可視化圖預測近期高發(fā)疾病,以便制藥公司、各大醫(yī)院提前準備藥品,防治多發(fā)疾病。
5.2 非時空數(shù)據(jù)
5.2.1 層次和網(wǎng)絡數(shù)據(jù)可視化
層次和網(wǎng)絡數(shù)據(jù)可視化[70]對于具有海量節(jié)點和邊的大規(guī)模網(wǎng)絡,如何在有限的屏幕空間中進行可視化,將是大數(shù)據(jù)時代面臨的難點和重點。除了對靜態(tài)的網(wǎng)絡拓撲關系進行可視化,大數(shù)據(jù)相關的網(wǎng)絡往往具有動態(tài)演化性。
(1)層次數(shù)據(jù)可視化
層次數(shù)據(jù)是一種常見的數(shù)據(jù)類型,著重表達個體之間的層次關系,可以抽象成樹結(jié)構(gòu),這種關系表達了包含和從屬的關系,如圖13所示。Robertson等人[71]使用了基于圓錐樹方法的樹結(jié)構(gòu)數(shù)據(jù)可視化。對于大層次結(jié)構(gòu),在樹下空間不足的缺陷下,導師節(jié)點互相重疊,Lamp等人提出了雙曲樹的可視化方法,如圖14所示。
Fig.13 Tree structure圖13 樹結(jié)構(gòu)
Fig.14 Hyperbolic tree圖14 雙曲樹
層次數(shù)據(jù)可視化的要點是對數(shù)據(jù)中層次關系(即樹形結(jié)構(gòu))的有效刻畫。不同的類型關系用不同的視覺符號表示,這決定了層次數(shù)據(jù)可視化分為以下兩種方法。
第一種是節(jié)點-鏈接法,將單個個體繪成一個節(jié)點,節(jié)點之間的連線表示個體之間的層次關系。代表技術(shù)為圓錐樹、空間樹等,常常表達承接的層次關系。Teoh等人[72]為文件建立目錄數(shù)據(jù),在徑向樹中,圓周的大小隨層次深度的增加而線性增長,樹節(jié)點呈幾何級數(shù)增長。不足之處在于樹的底層空間不足,可能會導致節(jié)點相互重疊,影響可視化效果,如圖15所示。
Fig.15 Rings trees圖15 環(huán)狀徑向樹法
此方法適用于檢測數(shù)據(jù)之間的排斥反應,通過大量的醫(yī)學數(shù)據(jù)分析,找出某幾種疾病或某幾種藥之間的不良反應;同樣此方法適用于各種疾病之間的關聯(lián)以及全基因組關聯(lián)性分析。
第二種是空間填充法。從空間填充的角度實現(xiàn)層次數(shù)據(jù)的可視化[73],數(shù)據(jù)描述采用樹的結(jié)構(gòu)。在樹圖中,采用矩形表示層次結(jié)構(gòu)里的節(jié)點,父子節(jié)點之間的層次關系用矩形之間的相互嵌套隱喻來表達,此方法可以充分利用全部的屏幕空間。
樹圖組織比較適合用于層次結(jié)構(gòu)不復雜的數(shù)據(jù)結(jié)構(gòu)系統(tǒng)。在新聞分類可視化系統(tǒng)的Newsmap新聞樹圖(http://newsmap.jp/)中使用該方法,來表達各地新聞之間的層次關系,如圖16所示。
Fig.16 Newsmap圖16 新聞樹圖
此方法適用于臨床決策支持,在醫(yī)生診療過程中,通過大數(shù)據(jù)分析給出更加合理精準的醫(yī)療方案。
(2)網(wǎng)絡數(shù)據(jù)可視化
網(wǎng)絡數(shù)據(jù)不具有自底向上或自頂向下的層次結(jié)構(gòu),因此表達更加自由。這決定了網(wǎng)絡數(shù)據(jù)可視化分為以下兩種方法。
第一種是弧長鏈接圖法,即節(jié)點-鏈接法的變種,采用一維布局方式,節(jié)點沿某個線性軸或者環(huán)形排列,圓弧表示節(jié)點之間的鏈接關系。文中使用弧長鏈接圖[74]描述《悲慘世界》中的人物關系圖譜(http:// hci.stanford.edu/jheer/files/zoo/)效果,如圖17所示。
Fig.17 Arc connection diagram圖17 弧長連接圖
此方法適用于用藥情況分析和日常病情監(jiān)測,能夠輔助檢測出是否有病變的可能,最終引發(fā)其他疾病的情況。
第二種是力引導布局圖,用節(jié)點表示對象,線表示關系的節(jié)點-鏈接布局,是自然的可視化布局。最早由Eades[75]提出了啟發(fā)式畫圖算法,目的是減少布局中邊的交叉數(shù)量,盡量保持邊長度一致。在啟發(fā)式畫圖算法基礎上,F(xiàn)ruchterman等人[76]提出了力引導圖的概念,如圖18所示。
Fig.18 Force-directed diagram圖18 力引導布局圖
此方法適用于基因關聯(lián)分析,如患II糖尿病人群基因組分析檢測,從胰島代謝、基因表達等角度對病人的敏感位點進行分析,通過分析找出II糖尿病的患病根源。
5.2.2 文本和文檔可視化
(1)文本內(nèi)容可視化
文本信息內(nèi)容是大數(shù)據(jù)時代非結(jié)構(gòu)化數(shù)據(jù)類型的典型代表,是互聯(lián)網(wǎng)中最主要的信息類型,也是物聯(lián)網(wǎng)各種傳感器采集后生成的主要信息類型。文本可視化的意義在于,能夠?qū)⑽谋局刑N含的語義特征形象化表達。根據(jù)不同的形態(tài),把文本內(nèi)容分為以下兩種。
第一種是標簽云,即一套相關的標簽以及與此相應的權(quán)重。典型的標簽云有30至150個標簽。權(quán)重影響使用的字體大小或其他視覺效果。標簽是典型的超鏈接,因此標簽云[77]是可以交互的,如圖19所示。
Fig.19 Tag cloud圖19 標簽云
此方法適用于醫(yī)療領域中所有文本信息的可視化,如病例信息、臨床醫(yī)療記錄、藥物清單,甚至是網(wǎng)絡論壇中醫(yī)療保健信息。通過分析用戶在各大網(wǎng)站搜索相關疾病的記錄,發(fā)現(xiàn)高頻出現(xiàn)的疾病名稱,并預測疾病的發(fā)展趨勢,及時準備治療流行病的方案。
第二種是文檔散,又稱旭日圖法,該圖采用關鍵字作為可視化文本的內(nèi)容,并且參考關鍵字在人類詞匯中的關系來對不同的關鍵字進行布局,從而描述出關鍵詞之間的語義層次關系。
Collins等人[78]對DocuBurst作出了解釋,文檔散中,外圈詞匯是里圈詞匯的下義詞,圓心處的關鍵字是文章所涉及內(nèi)容的最頂層概述,如圖20所示。
Fig.20 DocuBurst圖20 文檔散法
此方法適用于疾病的自我檢測,通過社交網(wǎng)絡,共享自身病例和醫(yī)療記錄?;诤笈_大數(shù)據(jù)處理技術(shù),患者可以測量自我疾病發(fā)展程度,參考同病癥的患者用藥記錄決定自己的用藥治療方案。
Fig.21 Word tree圖21 單詞樹法
(2)文本關系可視化
基于文本關系的可視化目的是將文本或者文檔里的內(nèi)涵關系進行可視化描述,如文本之間的應用、網(wǎng)頁之間的超級鏈接關系、文本的相似性和文檔集合內(nèi)容的層次性等。Scharl等人[79]提出單詞樹(word tree),從句法層面可視化表達穩(wěn)步詞匯的前綴關系。Wattenberg等人[80]利用樹形結(jié)構(gòu)來可視化文本中的句子方法,如圖21所示。
此方法適用于從大量的電子病歷中檢索出有價值的字段,通過單詞樹來分析就醫(yī)者自述的病癥信息,快速推斷出患者的疾病。
5.2.3 復雜高維多元數(shù)據(jù)可視化
復雜高維多元數(shù)據(jù)是指具有多個維度屬性的數(shù)據(jù)變量,廣泛存在于基于傳統(tǒng)關系數(shù)據(jù)庫以及數(shù)據(jù)倉庫的應用中,例如病人信息系統(tǒng)及藥物智能系統(tǒng)。高維多元數(shù)據(jù)分析的目標是探索高維多元數(shù)據(jù)項的分布規(guī)律和模式,并揭示不同維度屬性之間的隱含關系。
基于幾何圖形的高維多元可視化方法是近年來主要的研究方向。醫(yī)療大數(shù)據(jù)背景下,除了數(shù)據(jù)項規(guī)模擴大帶來的挑戰(zhàn),高維多元所引起的問題也是研究的難點。
(1)散點圖及散點矩陣
二維散點圖將多個維度中的兩個維度屬性值集合映射至兩條軸,在二維軸確定的平面內(nèi)通過圖形標記的不同視覺元素來反映其他維度屬性值。Keim等人[81-83]歸納了高維多元可視化的基本方法,如圖22所示。
Fig.22 3-dimensional scatter plot圖22 三維散點圖
此方法適用于高維多元數(shù)據(jù)的散點圖可視化,橫軸為年收入,縱軸為幼兒死亡率,圓點大小和顏色分別表示城市人口和所在區(qū)域,便于統(tǒng)計整體數(shù)據(jù)并進行綜合分析。
(2)星形圖與雷達圖
雷達圖方法是基于形似導航雷達顯示屏上的圖形而構(gòu)建的一種多變量對比分析技術(shù),許多統(tǒng)計方面的專家用雷達圖[84]來分析經(jīng)濟和銀行利率、企業(yè)風險等。吳穎慧等人[85]提出了2013—2014年香港地區(qū)九龍中、九龍東與九龍西醫(yī)院聯(lián)網(wǎng)運營雷達圖,如圖23所示。
Fig.23 Radar chart圖23 雷達圖
此方法適用于高維多元數(shù)據(jù)分析,在突發(fā)病暴發(fā)期間,能夠直觀地對該過程中地理位置變化、時間變化、發(fā)病人數(shù)變化以及特殊事件進行立體展現(xiàn)。
5.3 醫(yī)療大數(shù)據(jù)可視化技術(shù)分類
對醫(yī)療大數(shù)據(jù)可視化方法及其特性進行分類,可分為時空數(shù)據(jù)可視化方法和非時空數(shù)據(jù)可視化方法。
5.3.1 時空數(shù)據(jù)可視化方法及特性
時空數(shù)據(jù)可視化如表1所示。
5.3.2 非時空數(shù)據(jù)可視化方法及特性
非時空數(shù)據(jù)可視化如表2所示。
Table 1 Spatial-temporal data visualization methods and features表1 時空數(shù)據(jù)可視化方法及特性
綜上所述,當前有關醫(yī)療健康和生物大數(shù)據(jù)的研究在基礎研究、臨床應用及新興產(chǎn)業(yè)中發(fā)揮了不可替代的作用。在“醫(yī)療健康與生物大數(shù)據(jù)”論壇中,通過探討醫(yī)療健康和生物醫(yī)藥大數(shù)據(jù)在基礎研究中的價值及面臨的挑戰(zhàn),可以釋放更多無法衡量的價值。希望通過大數(shù)據(jù)的應用,引領醫(yī)療領域的可視化分析,從而走向醫(yī)療大數(shù)據(jù)可視化的新時代[86]。
6.1 醫(yī)療大數(shù)據(jù)可視化存在的問題
醫(yī)療大數(shù)據(jù)可視化的應用越來越廣泛,尤其在精準醫(yī)療[87]、生物醫(yī)藥、公共衛(wèi)生分析中越來越重要。目前,醫(yī)療大數(shù)據(jù)可視化研究仍處于探索階段,有許多問題亟待解決[88-89]。
(1)醫(yī)療信息安全性
醫(yī)療大數(shù)據(jù)可視化,有很多信息安全問題不容忽視,這些都制約著醫(yī)療大數(shù)據(jù)和及其可視化的研究與應用,是一個值得探討的問題。
(2)系統(tǒng)化可視化方法
在不同的研究領域中醫(yī)療大數(shù)據(jù)可視化的圖形化表示方法各不相同,深入研究醫(yī)療大數(shù)據(jù)及其可視化,需要對方法進行深入分析,找出共性,提出一種規(guī)范的、抽象層次更高的醫(yī)療大數(shù)據(jù)可視化方法??梢暬谋硎拘问蕉喾N多樣,對于每一種畫法,將其美觀地繪制出來是一個難題,因此設計表現(xiàn)力研究也是一個重要課題。
(3)數(shù)據(jù)冗余問題
隨著數(shù)據(jù)規(guī)模的增大,數(shù)據(jù)信息的網(wǎng)絡復雜程度將越來越高,醫(yī)療大數(shù)據(jù)所要解決的問題也會越來越復雜,能否解決醫(yī)療大數(shù)據(jù)數(shù)字化、碎片化等實際問題至關重要。
(4)多樣性可視化
在大數(shù)據(jù)分析中,由于數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)類型繁多,用單一的分析方法進行分析難以表現(xiàn)出其內(nèi)在特性與價值,將醫(yī)療大數(shù)據(jù)可視化技術(shù)與各種大數(shù)據(jù)分析技術(shù)有機地融合是具有挑戰(zhàn)性的研究課題。
Table 2 Non-spatial-temporal data visualization methods and features表2 非時空數(shù)據(jù)可視化方法及特性
6.2 醫(yī)療大數(shù)據(jù)可視化研究重點
(1)視覺噪聲
醫(yī)療大數(shù)據(jù)中有很多強關聯(lián)的數(shù)據(jù),每種數(shù)據(jù)不能將其單獨可視化。對這些具有強關聯(lián)的數(shù)據(jù)進行處理并將其可視化的過程中,因處理方式、顯示程度的不同,導致可視化結(jié)果不明顯,但不能理解為是數(shù)據(jù)丟失和數(shù)據(jù)扭曲。
(2)關系復雜
醫(yī)療大數(shù)據(jù)的網(wǎng)絡中,錯綜復雜的關系導致圖像交叉、重疊過多,以至于看起來不是那樣的直觀。
(3)性能需求
大數(shù)據(jù)可視化包含靜態(tài)可視化和動態(tài)可視化。尤其動態(tài)可視化中,對速度的性能要求非常高。若速度達不到要求,就無法完成實時的數(shù)據(jù)更新,例如實時觀測突發(fā)疾病的狀況。
(4)信息安全
醫(yī)療大數(shù)據(jù)類型繁多和關系復雜,通過復雜的聚合和過濾過程來分析數(shù)據(jù)之間的相關性。此過程會消耗大量的時間和性能資源,導致信息不完整,嚴重影響可視化效果。
未來,醫(yī)療大數(shù)據(jù)規(guī)模將越來越大,類型也將越來越多,結(jié)構(gòu)也會越來越復雜,醫(yī)療大數(shù)據(jù)可視化及可視分析面臨巨大挑戰(zhàn)。醫(yī)療大數(shù)據(jù)可視化及其可視分析技術(shù)在精準醫(yī)療、公共衛(wèi)生、生物醫(yī)藥以及生命科學等眾多領域?qū)l(fā)揮更大的作用。
[1]Assun??o M D,Calheiros R N,Bianchi S,et al.Big data computing and clouds:trends and future directions[J].Journal of Parallel and Distributed Computing,2014,79-80:3-15.
[2]Doctorow C.Big data:welcome to the petacentre[J].Nature, 2008,455(7209):16-21.
[3]Chen C L P,Zhang Chunyang.Data-intensive applications, challenges,techniques and technologies:a survey on big data [J].Information Sciences,2014,275(11):314-347.
[4]Chen Min,Mao Shiwen,Liu Yunhao.Big data:a survey[J]. Mobile Networks andApplications,2014,19(2):171-209.
[5]Lynch C.Big data:how do your data grow?[J].Nature,2008, 455(7209):28-29.
[6]Szalay A,Gray J.2020 computing:science in an exponential world[J].Nature,2006,440(7083):413-414.
[7]Zuech R,Khoshgoftaar T M,Wald R.Intrusion detection and big heterogeneous data:a survey[J].Journal of Big Data, 2015,2(1):3.
[8]Labrinidis A,Jagadish H V.Challenges and opportunities with big data[J].Proceedings of the VIDB Endowment, 2012,5(12):2032-2033.
[9]Liu Ning,Chen Min.Applying themes and related data sources research of healthcare big data[J].China Digital Medicine,2016,11(8):6-9.
[10]Song Bo,Yang Yanli,Feng Yunxia.Review of medical big data research[J].Translational Medicine Journal,2016,5(5): 298-300.
[11]Jin Xing,Wang Yonghong.Applications and development of health big data[J].Chinese Journal of Health Informatics and Management,2016,13(2):187-190.
[12]Li Tianding,Wang Li.Talking about the data mining and data visualizing in big data age[J].Librarianship and Information Science,2016,1(1):100-101.
[13]Zhang Zhen,Zhou Yi,Du Shouhong,et al.Medical data and its opportunities and challenges[J].Chinese Journal of Medical Information,2014,35(6):1-8.
[14]Wu Xueyan,Sun Yongjie.Cloud computing and big data helps medical collaboration[J].Communications World,2013 (10):15.
[15]Tu Xinli,Liu Bo,Lin Weiwei.Survey of big data[J].Application Research of Computers,2014,31(6):1612-1616.
[16]Zou Beiji.Major data analysis and its application in medical field[J].Computer Education,2014(7):24-29.
[17]Yao Shanhu,Luo Aijing,Feng Lin.Research progress of foreign medical big data and its implications[J].Journal of Medical Informatics,2016,37(2):16-21.
[18]Wang Xiao,Zhang Aidi,Yan Jin.Application prospects of big data in healthcare[J].Chinese General Practice,2015,18 (1):113-115.
[19]Cooper G F,Bahar I,Becich M J,et al.The center for causal discovery of biomedical knowledge from big data[J].Journal of the American Medical Informatics Association,2015, 22(6):1132-1136.
[20]Kimman M,Jan S,Yip C H,et al.Catastrophic health expenditure and 12-month mortality associated with cancer in Southeast Asia:results from a longitudinal study in eight countries[J].BMC Medicine,2015,13(1):1-11.
[21]Antman E M,Benjamin E J,Harrington R A,et al.Acquisition,analysis,and sharing of data in 2015 and beyond:a survey of the landscape:a conference report from the American heart association data summit 2015[J].Journal of the American HeartAssociation,2015,4(11):e002810.
[22]Goossens K,Van U K,Twomey P J,et al.Monitoring laboratory data across manufacturers and laboratories—a prerequisite to make“Big Data”work[J].Clinica Chimica Acta, 2015,445:12-18.
[23]Wang Xinyan,Tian Liyuan,Xu Bo,et al.MOOC for medical big data research:an important role in hypertension big data research[C]//Proceedings of the 1st International Conference on Big Data Computing Service and Applications, Redwood City,USA,Mar 30-Apr 2,2015.Washington:IEEE Computer Society,2015:453-455.
[24]Sun Sujun,Ma Dianfu,Shen Hualei.A Web-based medical image collaborative processing system using mobile devices [C]//Proceedings of the 4th International Conference on Software Technology and Engineering,Phuket,Thailand, Sep 1-2,2012.Piscataway,USA:IEEE,2012:52.
[25]Wu Yingbin,Guo Fuliang.Visualization technology basedon the treatment of complicated data[J].Computer&Digital Engineering,2015,43(11):1985-1989.
[26]He Xiaoping,Huang Long.Visualization analysis of evolution path research hotspots and frontiers of big data[J].Journal of Modern Information,2015,35(4):46-51.
[27]Yang Ming,Kiang M,Shang Wei.Filtering big data from social media—building an early warning system for adverse drug reactions[J].Journal of Biomedical Informatics, 2015,54(C):230-240.
[28]Zhang Guanglan,Sun Jing,Chitkushev L,et al.Big data analytics in immunology:a knowledge-based approach[J].Biomed Research International,2014(1):437987.
[29]Gaspar HA,Baskin I I,Marcou G,et al.Chemical data visualization and analysis with incremental generative topographic mapping:big data challenge[J].Journal of Chemical Information&Modeling,2015,55(1):84-94.
[30]Moreno M A,De Graaf C,Lopez N,et al.Managing the computational chemistry big data problem:the ioChem-BD platform[J].Journal of Chemical Information&Modeling, 2015,55(1):95-103.
[31]You Zhuhong,Li Shuai,Gao Xin,et al.Large-scale proteinprotein interactions detection by integrating big biosensing data with computational model[J].BioMed Research International,2014(2):59812.
[32]Ahlbrandt J,Brammen D,Majeed R W,et al.Balancing the need for big data and patient data privacy—an IT infrastructure for a decentralized emergency care research database[J]. Studies in Health Technology&Informatics,2014,205: 750-754.
[33]Lup?e O S,Cri?anvida M,Stoicutivadar L,et al.Supporting diagnosis and treatment in medical care based on big data processing[J].Studies in Health Technology&Informatics, 2014,197:65-69.
[34]Shen Cong.Parallel volume rendering under multi-GPU environment[D].Hangzhou:Zhejiang University,2003.
[35]Xie Shunhua.Research and Implementation of streaming technology framework for distributed medial image[D].Hangzhou:Zhejiang University,2013.
[36]Kong Mingming.GPU cluster based parallel volume rendering [D].Hangzhou:Zhejiang University,2007.
[37]Lv Shengmin,Yang Xunnian,Wang Guozhao.A layered surfaces reconstruction algorithm from large volumetric datasets[J].Journal of Software,2003,14(8):1448-1455.
[38]Lv Shengmin,Yang Xunnian,Wang Guozhao.Surface reconstruction algorithm for massive data[C]//Proceedings of the 2002 National Symposium on Geometric Design and Computation,Qingdao,China,2002:1448-1455.
[39]Jiang Peng.Compression volume rendering based on transform coding[D].Hangzhou:Zhejiang University,2008.
[40]Xian Kun.The construction of Shifang city People's hospital medical image 3D visualization system[D].Chengdu: University of Electronic Science and Technology of China, 2015.
[41]Jang Yi.Study on key technologies of routing security in wireless sensor networks[D].Chengdu:University of Electronic Science and Technology of China,2015.
[42]Zu Li.The design and implementation of CCD image acquisition software system[D].Chengdu:University of Electronic Science and Technology of China,2012.
[43]Shen Xin.Design and realization of automatic keeping control system[D].Chengdu:University of Electronic Science and Technology of China,2007.
[44]Wang Wenhua.Real-time interactive visualization in medical[D].Guangzhou:Southern Medical University,2013.
[45]Dong Xianling.Research on medical image volume rendering and its acceleration technique[D].Guangzhou:Southern Medical University,2010.
[46]Gu Yan.According to the“Chinese gene”to create“accurate medical plan”[J].China's Strategic Emerging Industries,2015(17):78-80.
[47]Xiao Yongfei.Research on 3D interactive visualization for medical data[D].Harbin:Harbin Institute of Technology, 2010.
[48]Liu Jiangtao,Xing Hui.Analysis on the present situation and challenges of visualization of large biological data[J]. New Communications,2016(2).
[49]Li Zheng,Kang Liyuan,Fan Xiaohui.Data integration,data mining and visualization analysis of traditional Chinese medicine manufacturing process[J].China Journal of Chinese Material Medical,2014,39(15):2989-2992.
[50]Wang Liang.Design and development of ECG monitoring system based on DSP[D].Jinan:Shandong University,2010.
[51]Ren Lei,Du Yi,Ma Shuai,et al.Visual analytics towards big data[J].Journal of Software,2014,25(9):1909-1936.
[52]Card S K,Mackinlay J D,Shneiderman B.Using vision to think[M]//Readings in Information Visualization.San Francisco,USA:Morgan Kaufmann Publishers Inc,1999:579-581.
[53]Halevi G,Moed H.The evolution of big data as a research and scientific topic:overview of the literature[J].Research Trends,2012,30(1):3-6.
[54]Hey T,Gannon D,Pinkelman J.The future of data-intensive science[J].Computer,2012,45(5):81-82.
[55]Zhou Dongru,Yang Rong,Yang Wei,et al.Algorithm and implementation of 3D data field visualization[J].Engineering Graphics,1993(2):1-6.
[56]Crawfis R A,Max N.Texture splats for 3D scalar and vector field visualization[C]//Proceedings of the 4th Conference on Visualization,San Jose,USA,Oct 25-29,1993.Washington:IEEE Computer Society,1993:261-266.
[57]Zhao Wei.Data visualization technology and its application software[D].Xi'an:Northwestern Polytechnical University, 1998.
[58]Lin Yi,Yan Lei,Gao Wei,et al.Advanced combinatorial algorithm for 2D navigator scalar field modeling[J].Journal of Basic Science and Engineering,2008,16(4):472-477.
[59]Wang Dexin,Huang Xiying.Medical application of X-ray technology progress[J].Medical Journal of Chinese People's Health,2011,23(18):2316.
[60]Hou Suoyuan,An Xiaoya,Xu Jian,et al.An overview and analysis of the new geo-visualization technology[J].Geometrics&Spatial Information Technology,2014,37(1):30-32.
[61]Ward M,Grinstein G G,Keim D.Interactive data visualization:foundations,techniques,and applications[J].Seed& Plant Production Journal,2010,51(4):188-195.
[62]Waldo R T.Experiments in migration mapping by computer [J].TheAmerican Cartographer,1987,14(2):155-163.
[63]Phan D,Xiao Ling,Yeh R,et al.Flow map layout[C]//Proceedings of the 2005 IEEE Symposium on Information Visualization,Minneapolis,USA,Oct 23-25,2005.Washington: IEEE Computer Society,2005:29.
[64]Buchin K,Speckmann B,Verbeek K.Flow map layout via spiral trees[J].IEEE Transactions on Visualization and Computer Graphics,2011,17(12):2536-2544.
[65]Li Xiuyi.A visualization method of regional data based on improved density clustering[J].Computer CD Software and Applications,2014(19):119.
[66]He Zhaocheng,Zhou Yaqiang,Yu Zhi.Regional traffic state evaluation method based on data visualization[J].Journal of Traffic and Transportation Engineering,2016,16(1):133-140.
[67]Spinney L.Human cycles:history as science[J].Nature, 2012,488(7409):24.
[68]Van Wijk J J,Van Selow E R.Cluster and calendar based visualization of time series data[C]//Proceedings of the 1999 IEEE Symposium on Information Visualization,San Francisco,USA,Oct 24-29,1999.Washington:IEEE Computer Society,1999:4.
[69]Luo Dongning,Yang Jing,Krstajic M,et al.EventRiver:visually exploring text collections with temporal references[J]. IEEE Transactions on Visualization and Computer Graphics, 2012,18(1):93-105.
[70]Herman I,Melancon G,Marshall M S.Graph visualization and navigation in information visualization:a survey[J]. IEEE Transactions on Visualization and Computer Graphics, 2000,6(1):24-43.
[71]Robertson G G,Mackinlay J D,Card S K.Cone trees:animated 3D visualizations of hierarchical information[C]// Proceedings of the 1991 SIGCHI Conference on Human Factors in Computing Systems,New Orleans,USA,Apr 27-May 2,1991.New York:ACM,1991:189-194.
[72]Teoh S T,Ma K L.RINGS:a technique for visualizing large hierarchies[C]//Proceedings of the 10th International Symposium on Graph Drawing,Irvine,Aug 26-28,2002.London,UK:Springer-Verlag,2002:268-275.
[73]Stasko J,Catrambone R,Guzdial M,et al.An evaluation of space-filling information visualizations for depicting hierarchical structures[J].International Journal of Human-Computer Studies,2000,53(5):663-694.
[74]Yan Gaofeng.Research on visual analytic system of port transportation based on big data[D].Beijing:Beijing Jiaotong University,2016.
[75]Eades P A.A heuristic for graph drawing[J].Congressus Numerantium,1984,42:149-160.
[76]Fruchterman T M J,Reingold E M.Graph drawing by forcedirected placement[J].Software Practice&Experience, 1991,21(11):1129-1164.
[77]Koh K,Lee B,Kim B,et al.ManiWordle:providing flexible control over wordle[J].IEEE Transactions on Visualization and Computer Graphics,2010,16(6):1190-1197.
[78]Collins C,Carpendale S,Penn G.DocuBurst:visualizing document content using language structure[J].Computer Graphics Forum,2009,28(3):1039-1046.
[79]Scharl A,Hubmannhaidvogel A,Jones A,et al.Analyzing the public discourse on works of fiction-detection and visualization of emotion in online coverage about HBO's game of thrones[J].Information Processing&Management,2015, 179(52):470-479.
[80]Wattenberg M,Viégas F B.The word tree,an interactive visual concordance[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1221-1228.
[81]Keim D,Andrienko G,Fekete J D,et al.Visual analytics: definition,process,and challenges[M]//LNCS 4950:Information Visualization.Berlin,Heidelberg:Springer,2008: 154-175.
[82]Ahlberg C,Shneiderman B.Visual information seeking: tight coupling of dynamic query filters with starfield displays[C]//Proceedings of the 1994 Conference Companion on Human Factors in Computing Systems,Boston,USA, Apr 24-28,1994.New York:ACM,1994:450-456.
[83]Elmqvist N,Dragicevic P,Fekete J D.Rolling the dice:multidimensional visual exploration using scatterplot matrix navigation[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1141-1148.
[84]Ding Jiemin,Li Weibo.Visualization representation and feature analysis of radar-map-based multi-dimensional data[J]. Modern Electronics Technique,2010,33(23):24-26.
[85]Wu Yinghui,Ye Xiaojin.Application of radar image in hospital management under data visualization background[J]. Guangxi Medical Journal,2016,38(7):1050-1052.
[86]Jiang Qiping,Feng Haichao,Gu Fu.Major trend of data service[J].Internet Weekly,2013(7):26-46.
[87]Yang Chunhua,Wang Tianjin,Huang Simin,et al.Precision medicine oriented clinical decision supporting system in foreign countries[J].Chinese Journal of Medical Library and Information Science,2016,25(2):14-19.
[88]Yur'Evich G E,Vasil'Evich G V.Analytical review of data visualization methods in application to big data[J].Journal of Electrical&Computer Engineering,2013(4):1-7.
[89]Khan M,Shah S.Data and information visualization methods,and interactive mechanisms:a survey[J].International Journal of ComputerApplications,2011,34(1):1-14.
附中文參考文獻:
[9]劉寧,陳敏.醫(yī)療健康大數(shù)據(jù)應用主題及相關數(shù)據(jù)來源研究[J].中國數(shù)字醫(yī)學,2016,11(8):6-9.
[10]宋波,楊艷利,馮云霞.醫(yī)療大數(shù)據(jù)研究進展[J].轉(zhuǎn)化醫(yī)學雜志,2016,5(5):298-300.
[11]金興,王詠紅.健康醫(yī)療大數(shù)據(jù)的應用與發(fā)展[J].中國衛(wèi)生信息管理雜志,2016,13(2):187-190.
[12]李田丁,王莉.淺談大數(shù)據(jù)時代的數(shù)據(jù)挖掘和數(shù)據(jù)可視化[J].科技情報開發(fā)與經(jīng)濟,2016,1(1):100-101.
[13]張振,周毅,杜守洪,等.醫(yī)療大數(shù)據(jù)及其面臨的機遇與挑戰(zhàn)[J].醫(yī)學信息學雜志,2014,35(6):1-8.
[14]鄔雪艷,孫永杰.云計算和大數(shù)據(jù)助力醫(yī)療協(xié)同[J].通信世界,2013(10):15.
[15]涂新莉,劉波,林偉偉.大數(shù)據(jù)研究綜述[J].計算機應用研究,2014,31(6):1612-1616.
[16]鄒北驥.大數(shù)據(jù)分析及其在醫(yī)療領域中的應用[J].計算機教育,2014(7):24-29.
[17]姚山虎,羅愛靜,馮麟.國外醫(yī)學大數(shù)據(jù)研究進展及其啟示[J].醫(yī)學信息學雜志,2016,37(2):16-21.
[18]王瀟,張愛迪,嚴謹.大數(shù)據(jù)在醫(yī)療衛(wèi)生中的應用前景[J].中國全科醫(yī)學,2015,18(1):113-115.
[25]吳英彬,郭福亮.基于復雜數(shù)據(jù)處理的可視化技術(shù)研究[J].計算機與數(shù)字工程,2015,43(11):1985-1989.
[26]何曉萍,黃龍.大數(shù)據(jù)領域演進路徑、研究熱點與前沿的可視化分析[J].現(xiàn)代情報,2015,35(4):46-51.
[34]沈聰.多GPU環(huán)境下的并行體繪制[D].杭州:浙江大學, 2013.
[35]謝順華.分布式醫(yī)學影像數(shù)據(jù)的Streaming技術(shù)框架研究及實踐[D].杭州:浙江大學,2003.
[36]孔明明.基于GPU集群的并行體繪制[D].杭州:浙江大學,2007.
[37]呂晟珉,楊勛年,汪國昭.海量數(shù)據(jù)的曲面分層重建算法[J].軟件學報,2003,14(8):1448-1455.
[38]呂晟珉,楊勛年,汪國昭.海量數(shù)據(jù)的曲面分片重建算法[C]//第一屆全國幾何設計與計算學術(shù)會議論文集,青島, 2002-06-01.中國工業(yè)與應用數(shù)學學會幾何設計與計算專業(yè)委員會,2002:1448-1455.
[39]江鵬.基于變換編碼的壓縮體繪制[D].杭州:浙江大學, 2008.
[40]鮮錕.什邡市人民醫(yī)院醫(yī)學圖像三維可視化系統(tǒng)的構(gòu)建[D].成都:電子科技大學,2015.
[41]蔣溢.無線傳感器網(wǎng)絡路由安全技術(shù)研究[D].成都:電子科技大學,2015.
[42]祖力.CCD圖像采集軟件系統(tǒng)的設計與實現(xiàn)[D].成都:電子科技大學,2012.
[43]沈新.自動化守控系統(tǒng)的設計與實現(xiàn)[D].成都:電子科技大學,2007.
[44]王文化.實時交互的醫(yī)學圖像可視化[D].廣州:南方醫(yī)科大學,2013.
[45]董現(xiàn)玲.醫(yī)學圖像體繪制及其加速技術(shù)研究[D].廣州:南方醫(yī)科大學,2010.
[46]顧彥.根據(jù)“中國基因”打造“精準醫(yī)療計劃”[J].中國戰(zhàn)略新興產(chǎn)業(yè),2015(17):78-80.
[47]肖永飛.醫(yī)學數(shù)據(jù)三維交互可視化方法的研究[D].哈爾濱:哈爾濱工業(yè)大學,2010.
[48]劉江濤,邢輝.淺析生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].中國新通信,2016(2).
[49]李正,康立源,范驍輝.中藥制藥過程數(shù)據(jù)集成、數(shù)據(jù)挖掘與可視化技術(shù)研究[J].中國中藥雜志,2014,39(15):2989-2992.
[50]王亮.基于DSP的心電監(jiān)護系統(tǒng)的設計與開發(fā)[D].濟南:山東大學,2010.
[51]任磊,杜一,馬帥,等.大數(shù)據(jù)可視分析綜述[J].軟件學報, 2014,25(9):1909-1936.
[55]周洞汝,楊榮,楊衛(wèi),等.三維數(shù)據(jù)場可視化的算法及實現(xiàn)[J].圖學學報,1993(2):1-6.
[57]趙衛(wèi).數(shù)據(jù)可視化技術(shù)及其應用軟件研究[D].西安:西北工業(yè)大學,1998.
[58]林沂,晏磊,高偉,等.輔助導航二維標量場模擬生成的組合改進算法[J].應用基礎與工程科學學報,2008,16(4): 472-477.
[59]王德信,黃希穎.X線技術(shù)的醫(yī)學應用研究進展[J].中國民康醫(yī)學,2011,23(18):2316.
[60]侯溯源,安曉亞,許劍,等.地理信息可視化新技術(shù)綜述與分析[J].測繪與空間地理信息,2014,37(1):30-32.
[65]李秀怡.一種基于改進的密度聚類的區(qū)域數(shù)據(jù)可視化方法[J].計算機光盤軟件與應用,2014(19):119.
[66]何兆成,周亞強,余志.基于數(shù)據(jù)可視化的區(qū)域交通狀態(tài)特征評價方法[J].交通運輸工程學報,2016,16(1):133-140.
[74]顏高峰.基于大數(shù)據(jù)的港口集疏運可視分析系統(tǒng)研究[D].北京:北京交通大學,2016.
[84]丁杰敏,李偉波.基于雷達圖的多維數(shù)據(jù)可視化表示及特征分析[J].現(xiàn)代電子技術(shù),2010,33(23):24-26.
[85]吳穎慧,葉小巾.數(shù)據(jù)可視化背景下雷達圖在醫(yī)院管理中的應用[J].廣西醫(yī)學,2016,38(7):1050-1052.
[86]姜奇平,馮海超,古福.數(shù)據(jù)業(yè)務主營化大趨勢[J].互聯(lián)網(wǎng)周刊,2013(7):26-46.
[87]楊春華,王天津,黃思敏,等.支持精準醫(yī)療的國外臨床決策支持系統(tǒng)[J].中華醫(yī)學圖書情報雜志,2016,25(2):14-19.
WANG Yi was born in 1989.She is an M.S.candidate at Tianjin Polytechnic University.Her research interests include big data analysis and big data visualization,etc.
王藝(1989—),女,天津人,天津工業(yè)大學計算機科學與軟件學院碩士研究生,主要研究領域為大數(shù)據(jù)分析,大數(shù)據(jù)可視化等。
REN Shuxia was born in 1973.She received the Ph.D.degree in computer application technology from Tianjin University in 2014.Now she is an associate professor at School of Computer Science and Software Engineering,Tianjin Polytechnic University.Her research interests include data mining and big data analysis,etc.
任淑霞(1973—),女,山東梁山人,2014年于天津大學獲得博士學位,現(xiàn)為天津工業(yè)大學計算機科學與軟件學院副教授,主要研究領域為數(shù)據(jù)挖掘,大數(shù)據(jù)分析等。
Survey on Visualization of Medical Big Data
WANG Yi,REN Shuxia+
School of Computer Science and Software Engineering,Tianjin Polytechnic University,Tianjin 300387,China
+Corresponding author:E-mail:t_rsx@126.com
WANG Yi,REN Shuxia.Survey on visualization of medical big data.Journal of Frontiers of Computer Science and Technology,2017,11(5):681-699.
With the development of the Internet+,medical big data is showing explosive growth which has multitudinous data types and complex relationships.The general data visualization method is difficult to demonstrate medical big data effectively,the medical big data visualization technology faces the huge challenge.This paper outlines the origin,characteristics and research progress of medical big data,introduces the related concepts and research status of visualization of medical big data.The existing visualization methods of medical big data are studied and divided into 2 types,which give a comprehensive description of the characteristics,legend and common visualization methods of medical big data by using a table.Future research focuses and problems of visualization of medical big data are analyzed and also have important reference value in research methods and universal application of visualization of medical big data.
medical big data;visualization of big data;Internet+
10.3778/j.issn.1673-9418.1609014
A
:TP311
Received 2016-09,Accepted 2017-01.
CNKI網(wǎng)絡優(yōu)先出版:2017-01-16,http://www.cnki.net/kcms/detail/11.5602.TP.20170116.1702.002.html