衛(wèi)婷婷
醫(yī)學(xué)數(shù)據(jù)自古有之,它是對(duì)疾病狀態(tài)的精確刻畫,也是對(duì)診療足跡的普遍記錄。隨著醫(yī)療衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快和生物檢測(cè)技術(shù)的革新發(fā)展,醫(yī)學(xué)數(shù)據(jù)的類型和規(guī)模正以前所未有的速度增長(zhǎng)。毋庸置疑,作為資源和資產(chǎn)的龐大醫(yī)學(xué)數(shù)據(jù),“大容量”只是表象,“大價(jià)值”才是根本,對(duì)這些數(shù)據(jù)的有效利用關(guān)系到國(guó)家乃至全球的疾病防控、新藥品研發(fā)和頑疾攻克的能力。
如何在合理的時(shí)間內(nèi)實(shí)現(xiàn)海量醫(yī)學(xué)數(shù)據(jù)的擷取、管理和整合,如何以數(shù)據(jù)創(chuàng)新探索未來(lái)的醫(yī)學(xué)科學(xué),如何在龐大的數(shù)據(jù)資源中快速獲取信息以提升人類醫(yī)療集體經(jīng)驗(yàn),是亟待探討的現(xiàn)實(shí)問題。這也是廣東省人民醫(yī)院信息管理處和廣東省醫(yī)學(xué)科學(xué)院醫(yī)學(xué)大數(shù)據(jù)研究中心負(fù)責(zé)人梁會(huì)營(yíng)主任一直思考的問題,他帶領(lǐng)團(tuán)隊(duì)致力于打通醫(yī)學(xué)大數(shù)據(jù)基礎(chǔ)研究、原始創(chuàng)新“最先一公里”和成果轉(zhuǎn)化、信息化應(yīng)用“最后一公里”。
扎根一線的醫(yī)學(xué)
大數(shù)據(jù)交叉復(fù)合型人才隊(duì)伍
當(dāng)前,醫(yī)學(xué)大數(shù)據(jù)、人工智能、遠(yuǎn)程醫(yī)療等核心技術(shù)的應(yīng)用,改變了當(dāng)代醫(yī)學(xué)的價(jià)值觀、思維模式、診療策略、技術(shù)特征。如何順勢(shì)而為、搶抓機(jī)遇?基于廣東省醫(yī)學(xué)科學(xué)院和廣東省人民醫(yī)院兩大優(yōu)秀平臺(tái),梁會(huì)營(yíng)聚焦“醫(yī)學(xué)+信息化建設(shè)”和“醫(yī)學(xué)+大數(shù)據(jù)應(yīng)用”雙引擎,注重學(xué)科交叉,突出醫(yī)工融合,形成了鮮明的團(tuán)隊(duì)組建特色,人才匯聚成績(jī)斐然。在30余人的“醫(yī)學(xué)+信息化建設(shè)”團(tuán)隊(duì)基礎(chǔ)上,全新組建了一支覆蓋了醫(yī)學(xué)、數(shù)學(xué)、計(jì)算機(jī)、金融、生物醫(yī)學(xué)工程、模式識(shí)別、統(tǒng)計(jì)學(xué)、生物信息學(xué)等13個(gè)不同專業(yè),知識(shí)結(jié)構(gòu)合理、功能齊全的“醫(yī)學(xué)+大數(shù)據(jù)應(yīng)用”高層次人才團(tuán)隊(duì)。
作為“雙引擎”理念的踐行者,梁會(huì)營(yíng)帶領(lǐng)眾多年輕骨干奮斗在信息化建設(shè)和大數(shù)據(jù)應(yīng)用的第一線,始終走在醫(yī)學(xué)信息化建設(shè)和數(shù)據(jù)智能化應(yīng)用的最前沿,提出了“借助這個(gè)‘培養(yǎng)皿,培養(yǎng)具有打通大數(shù)據(jù)挖掘原始創(chuàng)新‘最先一公里和信息化建設(shè)轉(zhuǎn)化應(yīng)用‘最后一公里能力的復(fù)合型人才”。
在廣東省人民醫(yī)院,全新的信息化建設(shè)和大數(shù)據(jù)應(yīng)用人才培養(yǎng)方案正在生成,梁會(huì)營(yíng)直言,只有依托一線實(shí)戰(zhàn)平臺(tái),培養(yǎng)符合行業(yè)需求的“原生新醫(yī)科人才”,才能進(jìn)一步彌合“研—建—用”的過(guò)度脫節(jié),為我國(guó)智慧醫(yī)療的標(biāo)準(zhǔn)化建設(shè)走在國(guó)際前列作貢獻(xiàn)。
緊貼需求的多模態(tài)
醫(yī)學(xué)數(shù)據(jù)智能化應(yīng)用技術(shù)體系
不同模態(tài)醫(yī)學(xué)數(shù)據(jù)是從同一患者的不同角度和不同檢查檢驗(yàn)途徑獲取到的信息,這種不同模態(tài)之間的關(guān)聯(lián)性和互補(bǔ)性使得同時(shí)使用多種模態(tài)信息可以更加全面地描述疾病的復(fù)雜特征。其中,文本模態(tài)、影像模態(tài)(包括信號(hào)和視頻類型)、組學(xué)模態(tài)是最重要、最復(fù)雜、最具代表性的三大關(guān)鍵模態(tài)數(shù)據(jù)。
文本模態(tài)是醫(yī)生從經(jīng)驗(yàn)和知識(shí)出發(fā),面向患者的個(gè)性化表現(xiàn),生產(chǎn)的醫(yī)學(xué)知識(shí)最豐富的數(shù)據(jù)類型;影像模態(tài)在醫(yī)療數(shù)據(jù)中占比超過(guò)75%,也是標(biāo)準(zhǔn)化程度最高、信息負(fù)載最高、離人工智能落地最近的數(shù)據(jù)模態(tài);組學(xué)模態(tài)是指基于測(cè)序、質(zhì)譜等先進(jìn)的高通量組學(xué)方法獲取的基因、蛋白、代謝等微觀層面的生物學(xué)數(shù)據(jù),是實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)的基石。
多模態(tài)醫(yī)學(xué)數(shù)據(jù)來(lái)源眾多且形式異構(gòu),不同模態(tài)需要不同方法進(jìn)行針對(duì)性處理,多模態(tài)醫(yī)學(xué)數(shù)據(jù)分析主要分為單模態(tài)分析和多模態(tài)融合兩個(gè)階段。其中,單模態(tài)分析是多模態(tài)融合的基礎(chǔ),多模態(tài)融合是單模態(tài)分析的發(fā)展和延伸。因此,從具體模態(tài)切入,研究不同模態(tài)醫(yī)學(xué)數(shù)據(jù)的分析方法,進(jìn)而通過(guò)不同模態(tài)數(shù)據(jù)間的互補(bǔ)學(xué)習(xí)來(lái)更加準(zhǔn)確地挖掘疾病的復(fù)雜特征,支撐后續(xù)的智能決策、預(yù)測(cè),是多模態(tài)醫(yī)學(xué)數(shù)據(jù)分析與傳統(tǒng)醫(yī)學(xué)數(shù)據(jù)分析的主要區(qū)別,也是多模態(tài)醫(yī)學(xué)數(shù)據(jù)開采關(guān)注的技術(shù)難點(diǎn)。
在文本模態(tài)數(shù)據(jù)中,蘊(yùn)含著豐富的層次結(jié)構(gòu)關(guān)系,如呼吸系統(tǒng)疾病細(xì)分到哮喘分支過(guò)程中有豐富的類似家系式的層次結(jié)構(gòu)。然而傳統(tǒng)算法多將這些特征扁平化同等看待,沒考慮其中蘊(yùn)含的家系關(guān)系。如何捕獲這些家系關(guān)系?通過(guò)利用這些家系關(guān)系是否可以加快模型的學(xué)習(xí)過(guò)程、提高模型的診斷性能?
針對(duì)這一現(xiàn)實(shí)需求,梁會(huì)營(yíng)帶領(lǐng)團(tuán)隊(duì)以疾病名稱、藥物名稱、癥狀體征、檢查部位等家系關(guān)系最豐富的臨床文本類數(shù)據(jù)為基礎(chǔ),基于137萬(wàn)份電子病歷數(shù)據(jù),耗時(shí)3年構(gòu)建了4棵家系關(guān)系樹,通過(guò)關(guān)系樹可以為提取到的特征賦予家系關(guān)系。為了驗(yàn)證家系關(guān)系對(duì)AI算法的助力效果,團(tuán)隊(duì)以兒童發(fā)熱癥候群疾病為研究方向,將家系關(guān)系作為先驗(yàn)知識(shí)融入AI算法,這是首次將家系關(guān)系作為先驗(yàn)知識(shí)融入AI算法的創(chuàng)新。成果發(fā)表在《自然·醫(yī)學(xué)》(Nature?Medicine),衍生發(fā)明專利2項(xiàng),被評(píng)為2019年中國(guó)百篇最具影響國(guó)際學(xué)術(shù)論文,并成功入選2019年中國(guó)重大醫(yī)學(xué)進(jìn)展成果。
在影像模態(tài)數(shù)據(jù)中,擁有精標(biāo)注結(jié)果的高質(zhì)量醫(yī)學(xué)影像數(shù)據(jù)非常少見,傳統(tǒng)的算法模型多是基于單一類型影像,并未考慮不同類型影像間的遷移應(yīng)用,因而無(wú)法解決標(biāo)注數(shù)據(jù)量少導(dǎo)致的模型性能低下的問題??煞窕谶w移橋接信息的捕獲,實(shí)現(xiàn)跨影像類型的模型遷移?不同影像類型間遷移關(guān)系的應(yīng)用是否可以達(dá)到降低訓(xùn)練樣本量、提升模型性能的目的?
面向多源多模態(tài)醫(yī)學(xué)影像學(xué)數(shù)據(jù)間的差異性和潛在關(guān)聯(lián)性,梁會(huì)營(yíng)帶領(lǐng)團(tuán)隊(duì)創(chuàng)新性以遷移學(xué)習(xí)模式的深度卷積神經(jīng)網(wǎng)絡(luò)為主體架構(gòu),結(jié)合多重遷移和多橋接遷移的思想,形成全新的多重多橋接遷移學(xué)習(xí)模型,并引入了基于“遮擋測(cè)試”思想的黑盒行為檢測(cè)機(jī)制,通過(guò)這一模型為多模態(tài)醫(yī)學(xué)影像數(shù)據(jù)間互補(bǔ)特征的提取與融合提供了新思路。成果以封面故事發(fā)表在《細(xì)胞》(Cell)雜志,成功授權(quán)發(fā)明專利1項(xiàng),基于此成果的兒童肺炎/肺損傷智能識(shí)別產(chǎn)品獲得了良好的臨床轉(zhuǎn)化。
組學(xué)模態(tài)醫(yī)學(xué)數(shù)據(jù)具有鮮明的小樣本、高維度、價(jià)值稀疏的特點(diǎn),導(dǎo)致標(biāo)志物在數(shù)據(jù)層面很容易被淹沒,需要算法來(lái)識(shí)別,但傳統(tǒng)的算法多基于單組學(xué)數(shù)據(jù)差異性分析,效率低下。面對(duì)這種情況,梁會(huì)營(yíng)帶領(lǐng)團(tuán)隊(duì)思考的是多組學(xué)數(shù)據(jù)間互作關(guān)系的利用是否有助于標(biāo)志物的精準(zhǔn)篩選。
于是,團(tuán)隊(duì)將不同組學(xué)水平的數(shù)據(jù)整合形成多組學(xué)水平濾網(wǎng),進(jìn)一步融合機(jī)器學(xué)習(xí)的相關(guān)模型,實(shí)現(xiàn)了從單一組學(xué)數(shù)據(jù)孤立遴選標(biāo)志物到多組學(xué)水平過(guò)濾標(biāo)志物的轉(zhuǎn)變;從而大大提高了標(biāo)志物的篩選效率和精準(zhǔn)性。采用這一設(shè)計(jì),團(tuán)隊(duì)先后基于新冠肺炎患者隊(duì)列的蛋白組學(xué)數(shù)據(jù)和代謝組學(xué)數(shù)據(jù)、兒童人群的表觀組學(xué)數(shù)據(jù),實(shí)現(xiàn)了預(yù)測(cè)早期輕癥患者后期病情進(jìn)展及準(zhǔn)確擬合兒童生物學(xué)年齡的最具辨識(shí)力標(biāo)志物子集的篩選,相關(guān)成果先后發(fā)表在《自然·醫(yī)學(xué)》(Nature?Medicine)、《歐洲呼吸雜志》(European?Respiratory?Journal)等期刊。
但山巔之上還有星空,為了更緊貼多模態(tài)醫(yī)學(xué)大數(shù)據(jù)創(chuàng)新應(yīng)用需求,梁會(huì)營(yíng)帶領(lǐng)團(tuán)隊(duì)正向著“多模態(tài)醫(yī)學(xué)數(shù)據(jù)無(wú)損壓縮調(diào)用”“跨系統(tǒng)數(shù)據(jù)智能互聯(lián)理論與算法”“低質(zhì)量多模態(tài)醫(yī)學(xué)數(shù)據(jù)聚類”“醫(yī)學(xué)人工智能產(chǎn)品偏倚檢測(cè)及評(píng)價(jià)”等一個(gè)個(gè)多模態(tài)醫(yī)學(xué)大數(shù)據(jù)“采集—應(yīng)用—轉(zhuǎn)化”的瓶頸難題發(fā)起沖鋒。
釋放大數(shù)據(jù)價(jià)值
暢享祖國(guó)的美好未來(lái)
近5年,梁會(huì)營(yíng)帶領(lǐng)團(tuán)隊(duì)先后主持醫(yī)學(xué)人工智能相關(guān)國(guó)家重點(diǎn)研發(fā)計(jì)劃課題3項(xiàng),國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目2項(xiàng),申請(qǐng)發(fā)明專利15項(xiàng)、實(shí)用新型專利2項(xiàng)、新產(chǎn)品軟件著作權(quán)20余項(xiàng)。2021年,繼廣東省青年拔尖人才、廣州市高層次人才、廣州市醫(yī)學(xué)重點(diǎn)人才等稱號(hào)之后,梁會(huì)營(yíng)實(shí)現(xiàn)了廣東省人民醫(yī)院“國(guó)家優(yōu)青”零的突破,更彰顯了他和團(tuán)隊(duì)的不懈努力和卓越追求?!斑@些成績(jī),不是我一個(gè)人的努力,而是在優(yōu)秀平臺(tái)的基礎(chǔ)上,團(tuán)隊(duì)一群人的付出!”優(yōu)秀的成績(jī)來(lái)之不易,而梁會(huì)營(yíng)關(guān)于未來(lái)醫(yī)療數(shù)據(jù)智能化的研究也不會(huì)停下。
回望過(guò)去,2015年,我國(guó)提出實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。2017年,習(xí)近平總書記在中共中央政治局第二次集體學(xué)習(xí)時(shí)強(qiáng)調(diào),要瞄準(zhǔn)世界科技前沿,集中優(yōu)勢(shì)資源突破大數(shù)據(jù)核心技術(shù),加快構(gòu)建自主可控的大數(shù)據(jù)產(chǎn)業(yè)鏈、價(jià)值鏈和生態(tài)系統(tǒng),以數(shù)據(jù)為紐帶促進(jìn)產(chǎn)學(xué)研深度融合,形成數(shù)據(jù)驅(qū)動(dòng)型創(chuàng)新體系和發(fā)展模式,打造多層次、多類型的大數(shù)據(jù)人才隊(duì)伍。2021年,“十四五”規(guī)劃中提到:“時(shí)代的發(fā)展,要求我們加快數(shù)字化發(fā)展,建設(shè)數(shù)字中國(guó)?!绷簳?huì)營(yíng)及其團(tuán)隊(duì)基于廣東省人民醫(yī)院(廣東省醫(yī)學(xué)科學(xué)院)這一實(shí)戰(zhàn)平臺(tái),發(fā)揮“喚醒數(shù)據(jù),點(diǎn)‘?dāng)?shù)成金”的作用,正是順應(yīng)國(guó)家政策的引導(dǎo)方向。他和團(tuán)隊(duì)堅(jiān)定地相信屬于祖國(guó)的數(shù)據(jù)驅(qū)動(dòng)型智慧醫(yī)療浪潮將會(huì)以更加迅猛的速度向前發(fā)展,美好的未來(lái)已經(jīng)在路上了……
(責(zé)編:蘇寒山)07AEAAD5-8D02-4FB2-9564-64CFF3C0ED87