国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

醫(yī)學(xué)信息學(xué)在罕見病診療中的研究進(jìn)展及應(yīng)用

2018-03-28 05:57:36姜召蕓盧宇藍(lán)弓孟春史文釗張抒揚(yáng)周文浩
協(xié)和醫(yī)學(xué)雜志 2018年2期
關(guān)鍵詞:信息學(xué)表型基因組

姜召蕓,盧宇藍(lán),余 樂,弓孟春,史文釗,張抒揚(yáng),周文浩

1神州數(shù)碼醫(yī)療科技股份有限公司,北京 100080 2復(fù)旦大學(xué)附屬兒科醫(yī)院 兒科研究所,上海 201102 3復(fù)旦大學(xué)兒童發(fā)育與疾病轉(zhuǎn)化醫(yī)學(xué)中心,上海 201102 4上海市出生缺陷重點(diǎn)實(shí)驗(yàn)室,上海 201102 5中國(guó)醫(yī)學(xué)科學(xué)院罕見病研究中心,北京 100730 6中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院,北京 100730

1 概述

目前國(guó)際上尚無對(duì)罕見病的統(tǒng)一定義。在美國(guó),罕見病被定義為影響少于20萬美國(guó)人的疾病;在歐盟,罕見病被定義為發(fā)病率在萬分之五以下的疾病[1]。目前公認(rèn)的罕見病數(shù)量為6000~7000種[1]。其中近75%為兒童罕見病,約5000種,影響全世界數(shù)百萬兒童[2]。一項(xiàng)對(duì)歐洲17個(gè)國(guó)家8種罕見病的調(diào)查研究顯示,25%的患者需要等待5~30年才被確診,40%的患者最初診斷不正確,部分患者未被診斷[3]。盡管這些疾病通常是慢性和進(jìn)行性的,但若能早期診斷(如新生兒篩查),并通過標(biāo)準(zhǔn)和/或靶向治療進(jìn)行最佳管理,則長(zhǎng)期并發(fā)癥可被減輕或延遲[4]。

大多數(shù)罕見病由單基因突變引起,這些罕見的遺傳性疾病也被稱為孟德爾遺傳病或單基因疾病。因此,罕見病是很好的病因研究模型,可為很多常見疾病的發(fā)病機(jī)制研究提供重要線索。隨著新興技術(shù)尤其是基因組學(xué)分析和相關(guān)序列分析技術(shù)的興起,以及個(gè)性化醫(yī)療的出現(xiàn),可發(fā)現(xiàn)更多致病基因,增加疾病的亞型數(shù)量,進(jìn)一步促進(jìn)罕見病研究方法的發(fā)展[1]。

醫(yī)學(xué)信息學(xué)是新興交叉學(xué)科,研究者為追求科學(xué)探究、問題解決和決策制定,對(duì)生物醫(yī)學(xué)數(shù)據(jù)、信息、知識(shí)進(jìn)行有效利用,以提高人類健康[5]。醫(yī)學(xué)信息學(xué)研究的最新進(jìn)展,包括電子病歷、生物信息技術(shù)、醫(yī)院信息系統(tǒng)、決策支持系統(tǒng)、影像信息技術(shù)、遠(yuǎn)程醫(yī)療與互聯(lián)網(wǎng)以及數(shù)據(jù)標(biāo)準(zhǔn)等。罕見病作為病因研究模型,有利于研究整合不同來源數(shù)據(jù),這些來源不同的數(shù)據(jù)包括臨床和生理數(shù)據(jù)(如肌張力檢查和肌酸激酶濃度)、分子數(shù)據(jù)(如基因表達(dá)和基因型)、生物樣本庫數(shù)據(jù)和模式生物/疾病模型信息[6]。對(duì)罕見病不同維度的數(shù)據(jù)進(jìn)行研究會(huì)促進(jìn)醫(yī)學(xué)信息學(xué)技術(shù)的發(fā)展。本文將詳細(xì)闡述醫(yī)學(xué)信息學(xué)的關(guān)鍵技術(shù)及其在罕見病診療中的應(yīng)用。

2 醫(yī)學(xué)信息學(xué)關(guān)鍵技術(shù)

2.1 罕見病臨床術(shù)語標(biāo)準(zhǔn)化

罕見病種類繁多且表型復(fù)雜多樣,不僅在不同疾病間存在差異,同一疾病的不同患者在表型上也可能不同,具有高度的臨床異質(zhì)性,為罕見病數(shù)據(jù)整合帶來很大挑戰(zhàn)[7]。目前國(guó)際上已形成一批廣泛認(rèn)可、應(yīng)用效果良好的醫(yī)學(xué)語義標(biāo)準(zhǔn),如國(guó)際衛(wèi)生術(shù)語標(biāo)準(zhǔn)制定組織研發(fā)的SNOMED-CT(systematized nomencl-ature of medicine-clinical terms)[1]、美國(guó)國(guó)立圖書館研發(fā)的統(tǒng)一醫(yī)學(xué)語言系統(tǒng)UMLS(unified medical language system)[8]、德國(guó)柏林夏里特醫(yī)學(xué)院研發(fā)的人類表型本體(the human phenotype ontology,HPO)[9]等,這些本體系統(tǒng)在規(guī)范描述不同類別的臨床數(shù)據(jù)方面發(fā)揮重要作用。其中SNOMED-CT是世界上最全面、多語言的臨床醫(yī)學(xué)術(shù)語產(chǎn)品,包含大多數(shù)方面的臨床信息,如人體結(jié)構(gòu)、臨床發(fā)現(xiàn)、臨床操作、事件、藥物等19個(gè)臨床領(lǐng)域,超過50個(gè)國(guó)家在使用。但SNOMED-CT目前缺少中文版,在中文電子病歷中的應(yīng)用受限。UMLS包括超級(jí)敘詞表(metathesaurus)、語義網(wǎng)絡(luò)(semantic network)、情報(bào)源圖譜(information sources map)和專家詞典(SPECIALIST lexicon)4部分。其中超級(jí)敘詞表是生物醫(yī)學(xué)概念、術(shù)語、詞匯及其涵義、等級(jí)范疇的廣泛集成。UMLS的語義網(wǎng)絡(luò)不僅運(yùn)用了常規(guī)語義控制手段,如語義等級(jí)、屬分、相關(guān)關(guān)系控制,且在語義規(guī)范和語義關(guān)系分析、延伸等多方面有許多創(chuàng)新。HPO解決了對(duì)罕見病表型標(biāo)準(zhǔn)化詞匯表的需求[10],在數(shù)項(xiàng)大型國(guó)際項(xiàng)目中用來對(duì)患者進(jìn)行編碼。HPO是一個(gè)有向無環(huán)圖,表示超過10 000個(gè)表型異常,其中節(jié)點(diǎn)(HPO項(xiàng))通過“is a”關(guān)系彼此連接。 HPO由諸多醫(yī)學(xué)領(lǐng)域?qū)<覄?chuàng)建,以適應(yīng)不同來源表型數(shù)據(jù)的編碼,如實(shí)驗(yàn)室試驗(yàn)、圖像、圖表和臨床解釋[11]。由歐洲生物信息研究所(the European Bioinformatics Institute,EMBL-EBI)、葛蘭素史克(Glaxo Smith Kline, GSK)和威康信托桑格研究所(the Wellcome Trust Sanger Institute, WTSI)合作開發(fā)的基于基因組實(shí)驗(yàn)的藥物靶點(diǎn)證據(jù)知識(shí)庫CTTV(the center for therapeutic target validation),將生成的數(shù)據(jù)與EMBL-EBI、GSK和WTSI 資源中的現(xiàn)有數(shù)據(jù)進(jìn)行整合,使用EFO(experimental factor ontology)作為其應(yīng)用本體。EFO為其他本體提供整合框架,例如ORDO、ChEBI,the gene ontology 和Uberon[12]。

建立統(tǒng)一的罕見病語義網(wǎng)絡(luò),規(guī)范疾病癥狀描述,對(duì)罕見病研究至關(guān)重要。 構(gòu)建語義網(wǎng)絡(luò)的基礎(chǔ)是對(duì)雜亂無章的非結(jié)構(gòu)化臨床文本信息結(jié)構(gòu)化處理。臨床自然語言處理(nature language processing,NLP)利用多層算法融合,對(duì)文本信息進(jìn)行分詞、邏輯關(guān)系處理、特征提取,以完成對(duì)非結(jié)構(gòu)化文本信息的處理。臨床NLP為臨床醫(yī)生提供關(guān)鍵的患者病例詳細(xì)信息,這些詳細(xì)信息通常被鎖定在非結(jié)構(gòu)化臨床文本中,并散布在患者的健康記錄中。語義分析是臨床NLP研究的主要目標(biāo)之一,通過鑒定臨床實(shí)體(如患者、臨床醫(yī)生)和事件(如疾病、治療)并呈現(xiàn)其關(guān)系來解鎖文本的意義[13]。語義互操作性是實(shí)現(xiàn)語義網(wǎng)絡(luò)的關(guān)鍵,通常以本體和可控詞匯的形式存在。本體是“概念化的明確說明”,是一種以結(jié)構(gòu)化的方式描述領(lǐng)域知識(shí)的方法[14]。如果以一個(gè)本體作為參考(如the gene ontology和SNOMED-CT),那么其對(duì)真實(shí)世界數(shù)據(jù)的表示則成為個(gè)標(biāo)準(zhǔn),數(shù)據(jù)整合也會(huì)變得容易[15]。

2.2 影像組學(xué)數(shù)據(jù)分析

影像組學(xué)被定義為數(shù)量映射,即對(duì)大量醫(yī)學(xué)圖片特征進(jìn)行提取、分析和建模[16]。影像組學(xué)的研究可分為數(shù)據(jù)選擇、醫(yī)學(xué)成像、特征提取、探索分析和構(gòu)建模型5個(gè)階段:(1)數(shù)據(jù)選擇:影像組學(xué)的分析始于成像步驟、感興趣體積(volume of interest, VOI)和預(yù)期靶點(diǎn)的選擇。(2)醫(yī)學(xué)成像:VOI可被手動(dòng)或半自動(dòng)化切割[17]。切割決定圖像中被分析元素,切割的多樣性在影像特征的評(píng)價(jià)中引入了偏差。(3)特征提?。河跋窠M學(xué)的本質(zhì)是定量圖像特征的高通量提取以表征VOI。特征值依賴于圖像預(yù)處理(如濾波或強(qiáng)度離散化)和重構(gòu)(如濾波反投影或迭代重建)等因素。此外,在特征命名、數(shù)學(xué)定義、方法論和特征提取算法的軟件實(shí)現(xiàn)中存在差異[18]。(4)探索分析:影像特征和非影像特征可與預(yù)測(cè)目標(biāo)相結(jié)合以創(chuàng)建單個(gè)數(shù)據(jù)集。高度相關(guān)的影像特征組可以通過聚類來識(shí)別,而這些特征可以簡(jiǎn)化為每個(gè)聚類的單一原型特征。從多重分割、多次成像和幻影研究中收集的輔助特征數(shù)據(jù)可以用來評(píng)估特征的魯棒性。(5)構(gòu)建模型:影像組學(xué)建模涉及3個(gè)主要方面,即特征選擇、建模方法學(xué)和驗(yàn)證。特征選擇應(yīng)該是數(shù)據(jù)驅(qū)動(dòng)的,因?yàn)榭赡艿挠跋裉卣鞣秶鷱V,這種分析應(yīng)該以強(qiáng)有力和透明的方式進(jìn)行。關(guān)于建模方法的選擇,確定最佳的機(jī)器學(xué)習(xí)方法是邁向臨床決策支持的關(guān)鍵一步。因此,在理想的情況下,應(yīng)該采用多種機(jī)器學(xué)習(xí)方法[19],全面記錄實(shí)施情況。未經(jīng)驗(yàn)證的模型價(jià)值有限,驗(yàn)證也是完整的影像分析不可缺少的組成部分。

影像組學(xué)在罕見病應(yīng)用中很重要的一個(gè)方面是患者人臉識(shí)別功能。Face2Gene通過對(duì)來自真實(shí)患者的數(shù)據(jù)、數(shù)以百萬計(jì)的數(shù)據(jù)點(diǎn)進(jìn)行訓(xùn)練,結(jié)合基因組學(xué),通過患者面部特征對(duì)疾病進(jìn)行診斷。將面部識(shí)別軟件與臨床知識(shí)(特征注釋和人體測(cè)量)相結(jié)合,從二維面部照片中能夠檢測(cè)畸形特征和可識(shí)別的人類畸形模式。所進(jìn)行的測(cè)量形成臉部描述符,可與其他描述符進(jìn)行比較,并以圖形方式顯示為面具[20]。

雖然目前影像組學(xué)處理流程已經(jīng)比較完善,但很多流程的優(yōu)化仍是難題,如其中關(guān)鍵的分割算法的改進(jìn)仍是挑戰(zhàn)性問題,人工分割耗時(shí)耗力,自動(dòng)分割魯棒性和精度難以保證。隨著近期深度學(xué)習(xí)浪潮的推動(dòng),基于深度機(jī)器學(xué)習(xí)的分析預(yù)測(cè)方法將是影像學(xué)未來發(fā)展方向之一,為預(yù)測(cè)準(zhǔn)確率的提高提供了突破方向。另一方面,由于目前醫(yī)院患者人數(shù)眾多,影像檢查費(fèi)時(shí)費(fèi)力,影像組學(xué)也應(yīng)盡可能與臨床特征相融合,成為臨床醫(yī)師更加信賴和認(rèn)可的方法,從真正意義上發(fā)展為一種輔助診斷工具,提供更為便捷和放心的服務(wù)。

2.3 基因組學(xué)數(shù)據(jù)分析

目前基因組學(xué)分析已廣泛應(yīng)用于罕見病的研究。基因組及相關(guān)技術(shù)近幾年在醫(yī)學(xué)領(lǐng)域的應(yīng)用發(fā)展迅速。隨著全基因組、全外顯子組測(cè)序價(jià)格的下降、計(jì)算速度的加快以及精度的提高,科學(xué)家們已經(jīng)能夠在單核苷酸分辨率的水平上測(cè)序整個(gè)基因組[21]?;蚪M學(xué)的大規(guī)模分析使單基因遺傳病的致病病因可在分子水平或細(xì)胞水平進(jìn)行定義,治療也更加個(gè)性化和有針對(duì)性。

用于罕見病研究的基因組檢測(cè)方法主要有3種:(1)基因panel:對(duì)相似表型相關(guān)的若干個(gè)基因的編碼序列進(jìn)行平行測(cè)序;(2)全外顯子組測(cè)序(whole exome sequencing,WES):對(duì)人類基因組的所有已知編碼區(qū)進(jìn)行測(cè)序;(3)全基因組測(cè)序(whole genome sequencing,WGS):對(duì)整個(gè)人類基因組進(jìn)行測(cè)序。 WES近年來主導(dǎo)了罕見病研究,外顯子序列約占人類全部基因組序列的1%,卻涵蓋了大約85%的變異[22]。與WGS相比,WES在收集和分析基因組數(shù)據(jù)方面更為經(jīng)濟(jì)有效,基因panel測(cè)序提供了比WES更快的周轉(zhuǎn)時(shí)間,但不能發(fā)現(xiàn)新的致病基因[23]。

2.4 表型組學(xué)和基因組學(xué)數(shù)據(jù)融合分析

表型組學(xué)是測(cè)量表型組的生物學(xué)領(lǐng)域,包括物理和生物化學(xué)特征,會(huì)隨著基因突變和環(huán)境影響而發(fā)生改變[24]。表型信息對(duì)臨床診斷決策至關(guān)重要,包括基因檢測(cè)之前和基因檢測(cè)之后。基因檢測(cè)之前,表型信息可輔助鎖定要研究的區(qū)域,幫助篩選檢驗(yàn)項(xiàng)目。基因檢測(cè)之后,表型信息可和基因信息關(guān)聯(lián)起來對(duì)疾病進(jìn)行解釋。將表型信息和基因型信息結(jié)合起來進(jìn)行研究對(duì)疾病的判別至關(guān)重要。

2.4.1 全基因組關(guān)聯(lián)分析

全基因組關(guān)聯(lián)分析(genome-wide association studies, GWAS)是研究某種基因變異與特定疾病表型之間關(guān)系的方法,屬于正向遺傳學(xué)研究范疇, 一般應(yīng)用于檢測(cè)單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和疾病之間的關(guān)系,如心臟病、糖尿病、自身免疫性疾病和精神疾病等[25]。針對(duì)群體中個(gè)體的表型(如是否患有某種疾病)進(jìn)行研究,然后從成千上萬種SNP中找出與該表型相關(guān)的基因型。若能從統(tǒng)計(jì)學(xué)上確認(rèn)這些SNP與該表型之間具有聯(lián)系,就可初步認(rèn)定其是與該表型相關(guān)的基因型。隨后,還需要在另一個(gè)種群中進(jìn)行試驗(yàn),驗(yàn)證上述發(fā)現(xiàn)是否正確。標(biāo)準(zhǔn)GWAS統(tǒng)計(jì)方法包括回歸建模(線性和邏輯),并調(diào)整相關(guān)協(xié)變量,如性別、年齡、種族或民族。對(duì)于多重檢驗(yàn)調(diào)整顯著性閾值,普遍接受的全基因組顯著性閾值為P<5.0×10-8[26]。GWAS已經(jīng)走過10年的發(fā)展歷史,數(shù)百個(gè)復(fù)雜性狀的GWAS結(jié)果已被報(bào)道。目前,GWAS研究主要依賴于SNP 芯片,但是這些芯片無法覆蓋所有的遺傳變異,未來將以全基因組測(cè)序?yàn)榛A(chǔ)。隨著研究規(guī)模的擴(kuò)大,發(fā)現(xiàn)的新致病位點(diǎn)對(duì)疾病的影響往往更小,對(duì)于發(fā)病率低的罕見病而言,研究受樣本數(shù)量的限制,需提升技術(shù)來克服這些挑戰(zhàn)[27]。

2.4.2 全表型組關(guān)聯(lián)分析

全表型組關(guān)聯(lián)分析(phenome-wide association studies,PheWAS)旨在研究與已知的基因變異相關(guān)聯(lián)的表型,是與GWAS相反的研究方法,屬于反向遺傳學(xué)范疇。PheWAS方法已通過已知的基因型-表型關(guān)系得到驗(yàn)證,且使用PheWAS已能區(qū)分真正的多效性和臨床共病,增加遺傳發(fā)現(xiàn)的背景,還有助于定義疾病亞型。同時(shí),PheWAS有利于研究數(shù)據(jù)收集,可能會(huì)改變藥物用途。深入理解電子健康記錄(electronic health record,EHR)數(shù)據(jù),整合廣泛且強(qiáng)大的表型數(shù)據(jù), 將會(huì)創(chuàng)造豐富的資源,可以產(chǎn)生更多有效且詳細(xì)的基因組-表型組分析,促進(jìn)精準(zhǔn)醫(yī)學(xué)的新發(fā)現(xiàn)[26]。受具有多種表型隊(duì)列的限制,PheWAS 2010年才被開發(fā)使用[28]。應(yīng)用PheWAS算法分析7個(gè)已知關(guān)聯(lián)的SNP-疾病對(duì),其中4個(gè)被重復(fù)且P值在2.8×10-6和0.011之間。PheWAS算法還鑒定了19個(gè)之前未知的SNP與疾病在統(tǒng)計(jì)學(xué)上的關(guān)聯(lián)(P<0.01)。

關(guān)于PheWAS的開放性的研究問題:是否能夠從流行病學(xué)數(shù)據(jù)或通過重新利用收集到的EHR數(shù)據(jù)中全面捕捉到人類基因組的變異?考慮到不同表型組定義在特異性和粒度方面的差異,表征不同表型之間的表型相關(guān)性以及建立PheWAS特異性、顯著性閾值成為目前研究熱點(diǎn)[29]。

2.5 罕見病數(shù)據(jù)庫/知識(shí)庫

通過先進(jìn)的醫(yī)學(xué)信息學(xué)技術(shù)整合不同來源的數(shù)據(jù),形成罕見病表型和遺傳多樣性之間的知識(shí)關(guān)聯(lián),建立相關(guān)數(shù)據(jù)庫和知識(shí)庫,對(duì)于罕見病診療至關(guān)重要。目前國(guó)際上已有很多數(shù)據(jù)庫或知識(shí)庫提供罕見病基因型與表型之間的關(guān)聯(lián):(1)OMIM(online mendelian inheritance in man)是一個(gè)綜合且權(quán)威的關(guān)于人類基因與遺傳變異的數(shù)據(jù)庫[30],主要針對(duì)遺傳性疾病,內(nèi)容包括文本信息、相關(guān)參考信息、序列紀(jì)錄、圖譜和相關(guān)其他數(shù)據(jù);(2)Orphanet是一個(gè)罕見病和治療藥物及其他資料的綜合知識(shí)庫,收錄了近6000種罕見病各種相關(guān)信息,是目前世界上最權(quán)威和豐富的罕見病知識(shí)庫[31];(3)DECIPHER(databasE of genomiC varIation and phenotype in humans using ensembl resources)是一個(gè)基于網(wǎng)絡(luò)的可交互數(shù)據(jù)庫,整合了一套旨在幫助解釋基因組變異的工具,從患者遺傳變異相關(guān)的各種生物信息學(xué)資源中檢索信息以增強(qiáng)臨床診斷[32];(4)GeneReviews主要由兩大部分組成,即包含描述特定遺傳疾病的標(biāo)準(zhǔn)化同行評(píng)議的論文和包含單個(gè)基因和表型信息的章節(jié),目前共包含691個(gè)章節(jié),在PubMed中可被索引;(5)ClinVar是一個(gè)公共數(shù)據(jù)庫,其主要目的在于整合不同來源的數(shù)據(jù),將基因變異位點(diǎn)、臨床表型、實(shí)證數(shù)據(jù)以及功能注釋等方面的信息,形成一個(gè)標(biāo)準(zhǔn)的、可信的、穩(wěn)定的遺傳變異-臨床表型相關(guān)數(shù)據(jù)庫,可免費(fèi)訪問[33];(6)HGMD(the human gene mutation database) 可提供人類遺傳性疾病突變的綜合性數(shù)據(jù),已被廣泛應(yīng)用于臨床,可實(shí)現(xiàn)針對(duì)單一突變的快速查詢,同時(shí)支持各種先進(jìn)的搜索應(yīng)用[34];(7) GeneCards是人類基因綜合數(shù)據(jù)庫,提供基因組、蛋白質(zhì)組、轉(zhuǎn)錄、遺傳和功能上所有已知和預(yù)測(cè)的人類基因[35];(8)MalaCards是一個(gè)可搜索人類疾病及其注釋的綜合數(shù)據(jù)庫,收錄了約2萬種疾病,在15個(gè)部分中描繪了廣泛的注釋主題,包括摘要、癥狀、解剖背景、藥物、基因測(cè)試、變異和相關(guān)文獻(xiàn)[36]。

對(duì)基因變異的最全面解讀不僅需精心設(shè)計(jì)的數(shù)據(jù)庫、分離分析和數(shù)據(jù)共享,還應(yīng)進(jìn)行適當(dāng)?shù)墓δ芊治?,如評(píng)估變異對(duì)剪接或基因表達(dá)的影響[37]。在當(dāng)前基因組學(xué)時(shí)代,意義不明變異仍最常見[38]。

3 醫(yī)學(xué)信息學(xué)技術(shù)在罕見病診療中的應(yīng)用

3.1 罕見病致病基因的發(fā)現(xiàn)及診斷

罕見病由于其遺傳性較好,可利用二代測(cè)序技術(shù)方便尋找致病基因[39]。WES在疾病致病基因的鑒定研究中取得了較大成果,不僅在單基因遺傳病,還在多基因影響的復(fù)雜疾病中發(fā)現(xiàn)了大量相關(guān)基因。2010年,華盛頓大學(xué)孟德爾基因組學(xué)研究中心的研究小組發(fā)現(xiàn)了Miller綜合征的遺傳病因,其特征是嚴(yán)重小頭畸形、唇裂和/或腭裂、四肢發(fā)育不良、眼瞼和多余的乳頭[40]。同一年,同樣的方法成功鑒定了Kabuki(MLL2)[41],Schinzel-Giedion(SETBP1)[42]和Sensenbrenner(WDR35)[43]綜合征的致病基因。2014年,加拿大FORGE(finding of rare disease genes)組織花費(fèi)兩年時(shí)間,匯集了加拿大各地21個(gè)遺傳中心和3個(gè)科技創(chuàng)新中心的臨床醫(yī)生和科學(xué)家,對(duì)246例罕見病患者進(jìn)行WES分析,發(fā)現(xiàn)了引發(fā)疾病的146個(gè)突變位點(diǎn)和67個(gè)異?;騕44]。

GWAS技術(shù)也被成功應(yīng)用于罕見病致病基因的發(fā)現(xiàn)。GWAS已經(jīng)鑒定了數(shù)千種與特定人類表型相關(guān)的常見遺傳變異[45]。Duan等[46]利用GWAS分析方法對(duì)1492例煙霧病病例和5084例對(duì)照組進(jìn)行研究,發(fā)現(xiàn)了煙霧病的新易感基因。同樣,PheWAS在研究SNP-疾病對(duì)中也被成功應(yīng)用,成為研究SNP-疾病對(duì)的關(guān)聯(lián)性可用方法[28]。

3.2 罕見病藥物的研發(fā)

因罕見病病因復(fù)雜、基因異質(zhì)性高、病理機(jī)制未明、參與臨床試驗(yàn)的患者數(shù)量少等問題,治療罕見病的藥物(也稱孤兒藥)在研發(fā)上具有很大的局限性。而醫(yī)學(xué)信息學(xué)技術(shù)的發(fā)展對(duì)于突破這些局限性提供了有力幫助,在新藥研發(fā)、老藥新用等方面展示出良好的前景,如組學(xué)和信息學(xué)技術(shù)的發(fā)展為藥物靶點(diǎn)發(fā)現(xiàn)提供了新契機(jī);同時(shí),臨床記錄與基因組學(xué)數(shù)據(jù)、藥物間相互作用等多維度信息的整合分析,對(duì)安全、高效的老藥新用策略具有重要意義。隨著高通量技術(shù)的發(fā)展,人們對(duì)基因組的研究逐步深入,對(duì)罕見病發(fā)病機(jī)制的認(rèn)識(shí)越來越清晰。一些用于治療常見疾病的藥物被發(fā)現(xiàn)可用于罕見病的治療,如美國(guó)食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)2009年批準(zhǔn)將治療勃起功能障礙的他達(dá)拉非(tadalafil)用于肺動(dòng)脈高壓的治療[47]。FDA已批準(zhǔn)約400種孤兒藥,但這些孤兒藥僅對(duì)5%的罕見病起作用,大多數(shù)罕見病的治療仍依賴癥狀治療甚至安慰劑治療[48]。隨著信息數(shù)據(jù)庫和網(wǎng)絡(luò)技術(shù)的發(fā)展,新的計(jì)算機(jī)模型將有助于加速罕見病臨床前藥物開發(fā)的目標(biāo)識(shí)別和過程優(yōu)化[49]。

3.3 罕見病注冊(cè)登記平臺(tái)的建立

在罕見病領(lǐng)域,注冊(cè)登記系統(tǒng)被認(rèn)為是開展臨床研究的有力工具,有助于規(guī)劃臨床試驗(yàn),改善患者的護(hù)理和醫(yī)療保健計(jì)劃。數(shù)據(jù)質(zhì)量被定義為數(shù)據(jù)集特征和特性的總和,這些數(shù)據(jù)集的特征和能力滿足數(shù)據(jù)預(yù)期使用所產(chǎn)生的需求。在注冊(cè)登記中,“產(chǎn)品”是數(shù)據(jù),質(zhì)量是指數(shù)據(jù)質(zhì)量,意味著進(jìn)入注冊(cè)登記系統(tǒng)的數(shù)據(jù)已得到驗(yàn)證,可供分析和研究使用。通過對(duì)數(shù)據(jù)進(jìn)行多維度的評(píng)估來確定數(shù)據(jù)的質(zhì)量,包括評(píng)估數(shù)據(jù)的完整性、有效性、一致性、可比性、可訪問性、實(shí)用性、及時(shí)性和預(yù)防重復(fù)記錄[50]。醫(yī)學(xué)信息學(xué)技術(shù)在罕見病注冊(cè)登記平臺(tái)中起到重要支撐作用。

4 展望

隨著精準(zhǔn)醫(yī)學(xué)的發(fā)展,醫(yī)學(xué)信息學(xué)關(guān)鍵技術(shù)(圖1)在罕見病診斷、孤兒藥開發(fā)等領(lǐng)域發(fā)揮巨大的推動(dòng)作用。但這些技術(shù)的應(yīng)用仍存在一定局限性,面臨多種挑戰(zhàn)。比如基因分析技術(shù)的發(fā)展,克服了罕見病致病基因未知、突變類型多變的困難,為罕見病能得到及時(shí)、準(zhǔn)確的診斷創(chuàng)造了條件。但目前二代測(cè)序技術(shù)的應(yīng)用還僅局限于大型醫(yī)學(xué)或遺傳學(xué)研究中心,且由于高通量測(cè)序數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)保存和結(jié)果解讀仍面臨巨大挑戰(zhàn)。

圖 1 罕見病研究中的醫(yī)學(xué)信息學(xué)技術(shù)路線

盡管目前存在各種挑戰(zhàn),但是精準(zhǔn)醫(yī)學(xué)的發(fā)展和醫(yī)學(xué)信息學(xué)的不斷進(jìn)步,為罕見病的診斷和個(gè)性化治療帶來了前所未有的機(jī)遇。相信隨著對(duì)罕見病研究的不斷深入,醫(yī)學(xué)信息學(xué)相關(guān)技術(shù)的不斷發(fā)展,高通量測(cè)序等技術(shù)將在罕見病診斷和治療中發(fā)揮越來越關(guān)鍵的作用。

[1] Fung KW, Richesson R, Bodenreider O. Coverage of rare disease names in standard terminologies and implications for patients, providers, and research [J]. AMIA Annu Symp Proc, 2014: 564- 572.

[2] Boycott KM, Dyment DA, Sawyer SL, et al. Identification of genes for childhood heritable diseases [J]. Annu Rev Med, 2014,65: 19- 31.

[3] Schieppati A, Henter JI, Daina E,et al. Why rare diseases are an important medical and social issue [J]. Lancet, 2008,371: 2039- 2041.

[4] Boycott KM, Rath A, Chong JX, et al. International cooperation to enable the diagnosis of all rare genetic diseases [J]. Am J Hum Genet, 2017,100: 695- 705.

[5] Liang J, Wei K, Meng Q, et al. Development of medical informatics in China over the past 30 years from a conference perspective and a Sino-American comparison [J]. Peer J, 2017, 5: e4082.

[6] Roos M, López Martin E,Wilkinson MD. Preparing data at the source to foster interoperability across rare disease resources [J]. Adv Exp Med Biol, 2017,1031: 165- 179.

[7] Ma’ayan A, Rouillard AD, Clark NR, et al. Lean big data integration in systems biology and systems pharmacology [J]. Trends Pharmacol Sci, 2014, 35: 450- 460.

[8] He Z, Chen Y, de Coronado S, et al. Topological-pattern-based recommendation of UMLS concepts for national cancer institute thesaurus [J]. AMIA Annu Symp Proc, 2016: 618- 627.

[9] K?hler S, Vasilevsky NA, Engelstad M, et al. The human phenotype ontology in 2017 [J]. Nucleic Acids Res, 2017, 45: D865-D876.

[10] K?hler S, Doelken SC, Mungall CJ, et al. The human phenotype ontology project: linking molecular biology and disease through phenotype data [J]. Nucleic Acids Res, 2014, 42: D966-D974.

[11] Greene D, BioResource N, Richardson S, et al. Phenotype similarity regression for identifying the genetic determinants of rare diseases [J]. Am J Hum Genet, 2016, 98: 490- 499.

[12] Sarntivijai S, Vasant D, Jupp S, et al. Linking rare and common disease: mapping clinical disease-phenotypes to ontologies in therapeutic target validation [J]. J Biomed Semantics, 2016, 7: 8.

[13] Velupillai S, Mowery D, South BR, et al. Recent advances in clinical natural language processing in support of semantic analysis [J]. Yearb Med Inform, 2015, 10: 183- 193.

[14] Machado CM, Rebholz-Schuhmann D, Freitas AT, et al. The semantic web in translational medicine: current applications and future directions [J]. Brief Bioinform, 2015, 16: 89- 103.

[15] De Silva TS, MacDonald D, Paterson G, et al. Systematized nomenclature of medicine clinical terms (SNOMED CT) to represent computed tomography procedures [J]. Comput Methods Programs Biomed, 2011, 101: 324- 329.

[16] Lambin P, Leijeaar RTH, Deist TM, et al. Radiomics: the bridge between medical imaging and personalized medicine [J]. Nat Rev Clin Oncol, 2017, 14: 749- 762.

[17] Polan DF, Brady SL,Kaufman RA.Tissue segmentation of computed tomography images using a random forest algorithm: a feasibility study [J]. Phys Med Biol, 2016, 61: 6553- 6569.

[18] Zhang L, Fried DV, Fave XJ, et al. IBEX: an open infrastructure software platform to facilitate collaborative work in radiomics [J]. Med Phys, 2015, 42: 1341- 1353.

[19] Parmar C, Grossmann P, Bussink J, et al. Machine learning methods for quantitative radiomic biomarkers [J]. Sci Rep, 2015, 5: 13087.

[20] Liehr T, Acquarola N, Pyle K, et al. Next generation phenotyping in emanuel and pallister-killian syndrome using computer-aided facial dysmorphology analysis of 2D photos [J]. Clin Genet, 2018,93:378- 381.

[21] Katsanis SH,Katsanis N. Molecular genetic testing and the future of clinical genomics [J]. Nat Rev Genet, 2013, 14: 415- 426.

[22] Bamshad MJ, Ng SB, Bigham AW, et al. Exome sequencing as a tool for mendelian disease gene discovery [J]. Nat Rev Genet, 2011, 12: 745- 755.

[23] Fernandez-Marmiesse A, Gouveia S,Couce ML. NGS technologies as a turning point in rare disease research, diagno-sis, and treatment [J]. Curr Med Chem, 2018,25:404- 432.

[25] Visscher PM, Brown MA, McCarthy MI, et al. Five years of GWAS discovery [J]. Am J Hum Genet, 2012, 90: 7- 24.

[26] Denny JC, Bastarache L, Roden DM. Phenome-wide association studies as a tool to advance precision medicine [J]. Annu Rev Genomics Hum Genet, 2016, 17: 353- 373.

[27] Visscher PM, Wray NR, Zhang Q, et al. 10 Years of GWAS discovery: biology, function, and translation [J]. Am J Hum Genet, 2017, 101: 5- 22.

[28] Denny JC, Ritchie MD, Basford MA, et al. PheWAS: demonstrating the feasibility of a phenome-wide scan to discover gene-disease associations [J]. Bioinformatics, 2010, 26: 1205- 1210.

[29] Bush WS, Oetjens MT,Crawford DC.Unravelling the human genome-phenome relationship using phenome-wide association studies [J]. Nat Rev Genet, 2016, 17: 129- 145.

[30] McKusick VA. Mendelian Inheritance in Man and its online version, OMIM [J]. Am J Hum Genet, 2007, 80: 588- 604.

[31] Pavan S, Rommel K, Mateo Marquina ME, et al. Clinical practice guidelines for rare diseases: the orphanet database [J]. PLoS One, 2017, 12: e0170365.

[32] Swaminathan GJ, Bragin E, Chatzimichali EA, et al. DECIPHER: web-based, community resource for clinical interpretation of rare variants in developmental disorders [J]. Hum Mol Genet, 2012, 21: R37- R44.

[33] Zhang X, Minikel EV, O’Donnell-Luria AH, et al. ClinVar data parsing [J]. Wellcome Open Res, 2017, 2: 33.

[34] Stenson PD, Ball EV, Mort M, et al. The human gene mutation database (HGMD) and its exploitation in the fields of personalized genomics and molecular evolution [J]. Curr Protoc Bioinformatics, 2012, Chapter 1: Unit1.13.

[35] Stelzer G, Rosen N, Plaschkes I, et al. The gene cards suite: from gene data mining to disease genome sequence analyses [J]. Curr Protoc Bioinformatics, 2016, 54:1.30.1- 1.30.33.

[36] Rappaport N, Twik M, Plaschkes I, et al. MalaCards: an amalgamated human disease compendium with diverse clinical and genetic annotation and structured search [J]. Nucleic Acids Res, 2017, 45: D877-D887.

[37] Pepin MG, Murray ML, Bailey S, et al. The challenge of comprehensive and consistent sequence variant interpretation between clinical laboratories [J]. Genet Med, 2016, 18: 20- 24.

[38] Richards S, Aziz N, Bale S, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology [J]. Genet Med, 2015, 17: 405- 424.

[39] Van Dijk EL, Auger H, Jaszczyszyn Y, et al. Ten years of next-generation sequencing technology [J]. Trends Genet, 2014, 30: 418- 426.

[40] Ng SB, Buckingham KJ, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder [J]. Nat Genet, 2010, 42: 30- 35.

[41] Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome [J]. Nat Genet, 2010, 42: 790- 793.

[42] Hoischen A, van Bon BW, Gilissen C, et al. De novo mutations of SETBP1 cause Schinzel-Giedion syndrome [J]. Nat Genet, 2010, 42: 483- 485.

[43] Gilissen C, Arts HH, Hoischen A, et al. Exome sequencing identifies WDR35 variants involved in Sensenbrenner syndrome [J]. Am J Hum Genet, 2010, 87: 418- 423.

[44] Beaulieu CL, Majewski J, Schwartzentruber, et al. FORGE Canada Consortium: outcomes of a 2-year national rare-disease gene-discovery project [J]. Am J Hum Genet, 2014, 94: 809- 817.

[45] Welter D, MacArthur J, Morales J, et al. The NHGRI GWAS Catalog, a curated resource of SNP-trait associations [J]. Nucleic Acids Res, 2014, 42: D1001-D1006.

[46] Duan L, Wei L, Tian Y, et al. Novel susceptibility loci for moyamoya disease revealed by a genome-wide association study [J]. Stroke, 2018, 49: 11- 18.

[47] Sardana D, Zhu C, Zhang M, et al.Drugrepositioningforor-phandiseases[J]. Brief Bioinform, 2011,12: 346- 356.

[48] Stockklausner C, Lampert A, Hoffmann GF, et al. Novel treatments for rare cancers: the U.S. orphan drug act is deli-vering-A cross-sectional analysis [J]. Oncologist, 2016, 21: 487- 493.

[49] Zhao M,Wei DQ. Rare diseases: drug discovery and informatics resource [J]. Interdiscip Sci, 2018,10:195- 204.

[50] Kodra Y,Posada de la Paz M, Coi A,et al. Data quality in rare diseases registries [J]. Adv Exp Med Biol, 2017, 1031: 149- 164.

猜你喜歡
信息學(xué)表型基因組
牛參考基因組中發(fā)現(xiàn)被忽視基因
雞NRF1基因啟動(dòng)子區(qū)生物信息學(xué)分析
初論博物館信息學(xué)的形成
建蘭、寒蘭花表型分析
GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
慢性乙型肝炎患者HBV基因表型與血清學(xué)測(cè)定的臨床意義
miRNA-148a在膀胱癌組織中的表達(dá)及生物信息學(xué)分析
72例老年急性白血病免疫表型分析
基因組DNA甲基化及組蛋白甲基化
遺傳(2014年3期)2014-02-28 20:58:49
有趣的植物基因組
旅游| 高密市| 襄垣县| 镇远县| 新兴县| 广南县| 孟津县| 宝清县| 湖北省| 盈江县| 临漳县| 渑池县| 密云县| 奉化市| 辉县市| 华宁县| 都兰县| 广宁县| 湟中县| 夏邑县| 泸溪县| 栾川县| 舟山市| 鄄城县| 阿瓦提县| 册亨县| 浠水县| 东台市| 榆林市| 通化市| 舟曲县| 衢州市| 安达市| 珠海市| 晋宁县| 肥乡县| 高安市| 衡山县| 马山县| 台州市| 喀喇|