国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

二代測序在遺傳性神經肌肉病分子生物學中的應用

2017-07-19 13:48盧正娟常蕾蕾吳家勇牛豐南綜述運審校
中風與神經疾病雜志 2017年6期
關鍵詞:外顯子基因組測序

趙 燕, 盧正娟, 劉 卓, 常蕾蕾, 吳家勇, 牛豐南綜述, 徐 運審校

二代測序在遺傳性神經肌肉病分子生物學中的應用

趙 燕1, 盧正娟1, 劉 卓1, 常蕾蕾1, 吳家勇1, 牛豐南2綜述, 徐 運1審校

遺傳性神經肌肉病(inherited neuromuscular disorders,NMDs)是一組少見的累及神經(遺傳性運動感覺周圍神經病、肌萎縮側索硬化、遺傳性脊肌萎縮癥等)、肌肉(各型肌病/肌營養(yǎng)不良、離子通道病等)及神經-肌肉接頭疾病的單基因遺傳性疾病,多以肌無力、肌萎縮,伴/不伴肌張力低下及感覺障礙為主要臨床表現(xiàn),可于新生兒、兒童或成年期發(fā)病,為患者及其家庭以及公共衛(wèi)生造成極大負擔。該類疾病具有臨床/遺傳異質性,基因檢測是診斷的金標準。以往Sanger法一直是DNA測序的最主要方法和金標準。然而不典型的臨床癥狀、龐大的致病基因譜及致病基因分子量巨大,導致傳統(tǒng)測序方法對該類疾病診斷具有局限性。2005年,Roche公司的454測序儀,可以進行大規(guī)模平行焦磷酸測序,標志著高通量基因組分析時代的到來。接著Illumina公司的Solexa技術以及ABI公司的SOLiD技術為標志各種新測序平臺和技術的逐漸成熟,宣告新一代測序技術時代的來臨[1]。大規(guī)模平行測序技術(massively parallel sequencing,MPS),又稱下一代測序技術(next generation sequencing,NGS),可以快速診斷大部分NMDs。

1 NGS的概述

1.1 NGS與一代測序比較 DNA測序技術誕生于上世紀70年代,逐漸成為單基因遺傳病確診的最直接和準確的手段。幾十年來,經典的DNA測序技術的發(fā)展經歷了Maxam-Gilbert化學測定、Sanger鏈終止測序等階段,以毛細管電泳為代表的自動化Sanger測序又稱為第一代測序技術,并成為此后20年間被廣泛應用的DNA測序技術。目前Sanger測序可以一次檢測最大長度約1 kb的DNA片段,準確度達到99.999%。雖然經典Sanger測序對人類遺傳性疾病的診斷做出了很大貢獻,但該方法測序效率低而成本高,對巨大基因、染色體甚至整個基因組的測序費時費力。此外Sanger法測序是先合成再測序,測序前必須先擴增目的片段。如果進行DNA重組生物體內擴增,則成本高,耗時長;PCR體外擴增,由于PCR時各種條件限制,引物設計等多方面因素,會導致無法擴增出目的片段,即使能夠擴增目的片段,可重復性差,無法穩(wěn)定擴增目的片段。

NGS技術特點是邊合成邊測序(通過捕捉新合成的末端的標記來確定DNA的序列),而且通量高、速度快、單堿基成本低,與傳統(tǒng)的Sanger測序相比,NGS在各個遺傳學領域均具有革命性的進步。其實驗主要分為以下幾個步驟[2]:(1)基因組DNA隨機片段化、測序文庫構建及文庫片段加測序接頭;(2)外顯子雜交捕獲、富集(全基因組測序時所有的DNA片段不需捕獲均行NGS檢測);(3)外顯子擴增和NGS測序;(4)生物信息學分析。由于采用并行測序,可同時對數(shù)以萬計的DNA片段進行測序,測序效率較經典Sanger測序提高了成千上萬倍,同時單位測序量的成本僅為Sanger測序的萬分之一;通過反復測序同一區(qū)域的DNA片段達到Sanger測序所不能企及的靈敏度及準確度[2]。

NGS技術與傳統(tǒng)的Sanger測序相比較,盡管它的高通量減少了成本,但是讀取準確性以及片段的長度都不及Sanger測序,這些不足都可以通過測序的覆蓋率和生物信息學的方法來克服。

1.2 NGS的幾大平臺及應用 目前主流的NGS平臺有Illumina公司的HiSeq2000系列、羅氏454系列以及LifeTech公司的SOLiD系列、Polonator平臺。這幾個技術平臺各有優(yōu)點,454測序片段長,Solexa測序性價比最高,SOLID測序準確度高。上述測序平臺成本較高,通量太大,實驗周期較長,主要應用于基礎研究領域或重大項目的大規(guī)模測序之中,并不適合于醫(yī)療領域的分子檢測、臨床診斷方面。為了滿足醫(yī)院及中小實驗室的測序需求,三大公司相繼都推出了低通量、低成本的測序平臺:Life Tech的IonTorrent(PGM、Proton)、Illumina的Miseq以及Roche的GS Junior(見表1)。

1.3 NGS生物信息分析流程 主要包括:(1)質量控制:對測序產生的原始數(shù)據(jù)(Raw data)進行質控、過濾低質量序列等處理,得到Clean data;(2)將Clean data比對到參考基因組;(3)將比對好的文件進行突變檢測,使用不同的軟件檢測SNVs和InDel,WGS還可使用多種軟件檢測CNVs;(4)注釋突變及篩選致病基因:利用ANNOVAR對檢測到的成千上萬的突變進行注釋(突變對蛋白質編碼的情況及突變位于各基因區(qū)間信息等),利用已知突變數(shù)據(jù)庫如dbSNP、1000 Genome、ESP 6500等,去除出現(xiàn)頻率較高的突變,利用預測軟件(SIFT、Polyphen等)對突變進行致病性和保守性預測,同時通過疾病數(shù)據(jù)庫將突變與疾病表型聯(lián)系起來。

1.4 NGS在醫(yī)學上的主要應用 NGS的應用十分廣泛,包括基因組測序、轉錄組測序和表觀遺傳測序、DNA和蛋白質相互作用研究以及基因組DNA甲基化分析等,而在孟德爾遺傳型疾病中的應用主要為基因組測序,包括如下兩大類: (1)全基因組重測序(Whole-genome sequencing,WGS):是指對某物種的整個基因組進行高通量測序。通過WGS能夠全面檢測個體基因組上所有的基因突變[3],其在測序過程中不需要捕獲外顯子,對基因組所有DNA片段進行測序。WGS可檢測人全基因組水平與疾病相關的單核苷酸變異(SNVs)、插入缺失(InDels)、拷貝數(shù)變異(CNV)和結構變異(SV)及非編碼區(qū)的SNVs、InDels等多種全面的突變信息[4,5]。WGS的缺點是價格昂貴、數(shù)據(jù)量巨大而使數(shù)據(jù)分析速度慢及測序深度較低和覆蓋度不足而使測序精度不能達到臨床應用的標準[6]。(2)目標區(qū)域測序:利用特制探針對感興趣的基因組區(qū)域進行富集,結合NGS技術將這些富集的目標區(qū)域進行測序。目標測序法由于其測序的目標區(qū)域只占全基因組的小部分,相比WGS能夠達到很高的測序深度。主要分為以下兩種:(1)外顯子測序(Whole-exome sequencing,WES):將基因組外顯子區(qū)域DNA利用序列捕獲技術進行捕獲,然后進行高通量測序。外顯子區(qū)域僅占人類基因組區(qū)域的1%左右,卻擁有約85%與疾病相關的變異位點[7]。因此,對外顯子區(qū)域選擇性的測序,即能檢測大部分人類疾病致病基因及突變。有研究認為,如果不考慮價格因素,WGS可以比WES更有效地檢測外顯子組的突變。(2)目標區(qū)域測序(targeted regions sequencing,TRS)指將感興趣的基因區(qū)域DNA利用序列捕獲技術進行捕獲,然后進行高通量測序。與外顯子測序相比,目的基因富集測序,對已知疾病基因譜系全面篩查,相比外顯子測序,更為高效,覆蓋度更全面,測序深度更有保障,以及測序費用最為低廉,因此用于臨床最為廣泛[8~10]。 捕獲測序在研究單基因遺傳病和多基因遺傳疾病(如癌癥、糖尿病、肥胖癥等)的致病基因和易感基因方面起到極為重要的作用,為疾病的臨床分子診斷提供了新的線索。

表1 二代測序主流的四大技術平臺

2 高通量測序技術在NMDs的應用

2.1 該組疾病的分子診斷存在諸多挑戰(zhàn)

2.1.1 遺傳異質性 NDMs是一組最具遺傳異質性的疾病,涉及基因數(shù)目達300多種。如CMT有30多種致病基因,肢帶型肌營養(yǎng)不良致病基因20多種等。

2.1.2 大基因的涉入 NDMs包含了眾多人類最大的致病基因,如DMD致病基因DMD(MIM#300377),有79個外顯子,分子量超過2.3 Mb[11];先天性肌病基因譜系中TTN(MIM#188840)擁有363個外顯子[12];NEB(MIM#161650)有183個外顯子;而RYR1(MIM#180901)有106個外顯子。如果檢測這些基因,以往的Sanger測序只是篩查熱點突變或部分區(qū)域,很少對整個基因進行測序。

2.1.3 臨床異質性 同種基因變異可以引起多種疾病表型。如RYR1為多種先天性肌病(中央軸空病、多微小軸空病、肌纖維類型不均、中心核肌病)及其他肌病(惡性高熱、King-Denborough綜合征)的致病基因[13~17]。而且同一種突變亦可導致嚴重程度不等的臨床表現(xiàn),因此難以通過臨床表現(xiàn)確定可能的致病基因。

2.1.4 臨床特點不明確 很大一部分患者臨床表現(xiàn)及骨骼肌病理無明顯特征,如先天性肌病中根據(jù)骨骼肌病理活檢通常分為桿狀體肌病、軸空性肌病及中心核肌病等,然而近一半的患者并沒有這些特殊表現(xiàn),而有特征表現(xiàn)的患者,還有臨床及病理現(xiàn)象重疊的表現(xiàn)。因此傳統(tǒng)的一代測序法測出某一候選基因的突變即會終止實驗,而導致未能篩選出真正的致病基因,若候選基因未檢測到突變,則需要費時費力的挨個的篩查其他基因。

2.1.5 需要使用不同的技術 NMDs患者的突變具有多種形式,例如DMD約60%~65%存在缺失;5%~15%為重復突變;剩余的為點突變及小的插入缺失突變[18],因此分子診斷需要不同的實驗技術來實現(xiàn),如MLPA。

2.1.6 未明確的基因 很多NMDs研究不明確,存在未知的致病基因,如肌萎縮側索硬化(amyotrophic lateral sclerosis,ALS)可能與以下基因有關:SOD1 (MIM#147450)、SETX (MIM#608465)、TARDBP (MIM#605078)[19]、FUS (MIM#137070)等[20],然而大部分ALS患者在以上基因中均未發(fā)現(xiàn)突變,提示可能存在其他致病基因。綜合以上因素約40%的NMDs患者不能獲得最終的分子診斷。

2010年,Lupski[21]等第一次報道了在NMDs運用NGS技術,他們運用CMT相關基因的全外顯子組確定1例AR遺傳的CMT為SH3TC2的復合雜合突變。此后,NMDs運用大規(guī)模平行測序技術檢測可能的致病突變的報道越來越多。

2012年,Vasli等[22]利用靶向基因富集(267個NMDs相關基因)外顯子組測序對16例NMDs患者進行檢測,8例有明確臨床表型,找到了致病,同時也在另8例臨床表現(xiàn)相似和遺傳缺陷未知的NMDs患者中的5例樣本中找到了候選致病突變。Vasli進一步認為,在對此類患者采取侵入性或其他特殊手段進行診斷性試驗之前,將NGS技術作為常規(guī)診斷試驗進行候選基因突變篩查,對于遺傳性神經肌肉疾病患者的臨床診療和遺傳咨詢具有重要價值。Lim等則指出NGS實驗中某些編碼區(qū)域測序深度不夠可能使其檢測靈敏度降低,仍需采用Sanger測序進行補充。

隨著生物信息學的飛速發(fā)展,使用NGS進行CNVs的診斷已經得到實踐[23]。越來越多的報道證實NGS在診斷DMD/BMD中的廣泛應用,其既可以檢測CNVs,又可同時篩查點突變,大大提高檢測效率[24]。

NGS具有其技術局限性,在核苷酸序列重復疾病如強直性肌營養(yǎng)不良、脊髓小腦共濟失調、肯尼迪病等,不如傳統(tǒng)片段分析法準確、低廉,但是隨著捕獲技術及生物信息學技術的進步,NGS的應用會越來越廣泛[25]。

3 NGS的局限性及展望

3.1 假陰性 某些NMDs可能有重復片段導致假陰性結果,可以增加測序覆蓋度、提高生物信息分析技術及更新生物信息分析軟件,必要時結合其他分子檢測技術(如毛細管電泳片段分析)共同診斷。在目標區(qū)域捕獲測序中,可以提高捕獲探針數(shù)目,以增加基因編碼區(qū)的覆蓋度降低假陰性率。

3.2 假陽性 通過NGS途徑可產生成百上千SNV及InDels,數(shù)據(jù)分析沒有統(tǒng)一標準,另外測序時重復區(qū)域的堿基延伸具有一定錯誤率,造成假陽性結果,后者的錯誤可通過Sanger測序進行驗證,但前者錯誤仍是NGS應用的最大限制。

3.3 海量數(shù)據(jù)的存儲及處理 如標準的WGS測序數(shù)據(jù)可達100 GB左右,若經過生物信息分析后可得到clean data、BAM文件、SAM 文件,存儲空間需要300 GB。而如此巨大的數(shù)據(jù)在數(shù)據(jù)的管理、分析處理及存儲均帶來極大挑戰(zhàn)。目前快速發(fā)展的云存儲、云計算為這一問題帶來了曙光。

綜上NGS技術平臺的可以一次對多個位點或者同樣的位點進行深度檢測,檢測到基因結構的低頻變化,在NMDs診斷中提供較為全面和深度的信息,可代替大部分基因測序方法,但不能替代臨床檢查及骨骼肌活檢。臨床及骨骼肌病理可指導基因測序方向。少部分NMDs,具有明確表型和有家族史的患者,拒絕/無條件有創(chuàng)檢查(骨骼肌活檢等)時,可以直接行NGS檢測[26]。總之,NGS在NMDs的臨床診斷及研究中發(fā)揮重要作用。

[1]Reinke T.Next-generation sequencing problematic,if promising[J].Managed Care,2013,22(12):38-41.

[2]Mueller W,Lyons J,Kerr G,et al.Standard enrichment methods for targeted next-generation sequencing in high-repeat genomic regions[J].Genetics Med,2013,15(11):910-911.

[3]Schnekenberg RP,Nemeth AH.Next-generation sequencing in childhood disorders[J].Archiv Dis Childhood,2014,99(3):284-290.

[4]Brunstein J.High throughput sequencing:next generation methods[J].MLO:Medical Laboratory Observer,2013,45(10):36,8-9.

[5]Parson W,Strobl C,Huber G,et al.Reprint of:Evaluation of next generation mtGenome sequencing using the Ion Torrent Personal Genome Machine (PGM)[J].Forensic Sci Inter Genetic,2013,7(6):632-639.

[6]Korfhage C,Fisch E,Fricke E,et al.Whole-genome amplification of single-cell genomes for next-generation sequencing[J].Current Protocols Molec Biol,2013,104(Unit):7-14.

[7]Ross LF,Rothstein MA,Clayton EW.Premature guidance about whole-genome sequencing [J].Personalized Med,2013,10(6):523-526

[8]Menzies D.Molecular methods for tuberculosis trials:time for whole-genome sequencing[J].Lancet Respiratory Med,2013,1(10):759-761.

[9]Mamanova L,Coffey AJ,Scott CE,et al.Target-enrichment strategies for next-generation sequencing [J].Nature Methods,2010,7(2):111-118.

[10]Choi M,Scholl U I,JW,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J].Proceedings of the National Academy of Sciences of the United States of America,2009,106(45):19096-190101.

[11]Garcia-Planells J,Torres-Puente M,Vilchez JJ,et al.Novel human pathological mutations.Gene symbol:DMD.Disease:muscular dystrophy,Duchenne[J].Hum Genet,2009,126(2):338.

[12]D’Argenio V,Frisso G,Precone V,et al.DNA sequence capture and next-generation sequencing for the molecular diagnosis of genetic cardiomyopathies[J].J Molecular Diagnostics,2014,16(1):32-44.

[13]Bertini E,Darras BT.Congenital myopathies:rebuilding the natural history,one gene at a time[J].Neurology,2015,84(1):15-16.

[14]Lillis S,Abbs S,Mueller CR,et al.Clinical utility gene card for:Central core disease[J].European J Human Genetics,2012,20:2.

[15]Amburgey K,Bailey A,Hwang JH,et al.Genotype-phenotype correlations in recessive RYR1-related myopathies[J].Orphanet J Rare Dis,2013,8:117.

[16]Dowling JJ,Lillis S,Amburgey K,et al.King-Denborough syndrome with and without mutations in the skeletal muscle ryanodine receptor (RYR1) gene[J].Neuromuscular Disord,2011,21(6):420-427.

[17]Bevilacqua JA,Monnier N,Bitoun M,et al.Recessive RYR1 mutations cause unusual congenital myopathy with prominent nuclear internalization and large areas of myofibrillar disorganization[J].Neuropathol Applied Neurobiol,2011,37(3):271-284.

[18]White SJ,den Dunnen JT.Copy number variation in the genome; the human DMD gene as an example[J].Cytogenetic Genome Res,2006,115(3/4):240-246.

[19]Sheerin UM,Schneider SA,Carr L,et al.ALS2 mutations:juvenile amyotrophic lateral sclerosis and generalized dystonia[J].Neurology,2014,82(12):1065-1067.

[20]Birve A,Neuwirth C,Weber M,et al.A novel SOD1 splice site mutation associated with familial ALS revealed by SOD activity analysis[J].Human Molecul Genetic,2010,19(21):4201-4426.

[21]Lupski JR,Reid JG,Gonzaga-Jauregui C,et al.Whole-genome sequencing in a patient with Charcot-Marie-Tooth neuropathy[J].New Eng J Med,2010,362(13):1181-1191.

[22]Vasli N,Bohm J,Le Gras S,et al.Next generation sequencing for molecular diagnosis of neuromuscular diseases[J].Acta Neuropathol,2012,124(2):273-283.

[23]Lee KW,Woon PS,Teo YY,et al.Genome wide association studies (GWAS) and copy number variation (CNV) studies of the major psychoses:what have we learnt[J].Neurosci Biobehavioral Rev,2012,36(1):556-571.

[24]Niba ET,Tran VK,Tuan-Phamle A,et al.Validation of ambiguous MLPA results by targeted next-generation sequencing discloses a nonsense mutation in the DMD gene[J].Clinica Chimica Acta,2014,436:155-159.

[25]Ellard S,Patrinos GP,Oetting WS.Clinical applications of next-generation sequencing:the 2013 human genome variation society scientific meeting[J].Human Mutation,2013,34(11):1583-1587.

[26]Johansen Taber KA,Dickinson BD,Wilson M.The promise and challenges of next-generation genome sequencing for clinical care[J].JAMA Internal Med,2014,174(2):275-280.

1003-2754(2017)06-0569-03

R746

2016-12-11;

2017-01-29

國家自然科學基金青年基金(No.81300977);國家自然科學基金面上項目(No.81671113)

(1.南京大學醫(yī)學院附屬鼓樓醫(yī)院神經內科,江蘇 南京 210008;2.南京大學醫(yī)學院附屬鼓樓醫(yī)院病理科,江蘇 南京 210008)

徐 運,E-mail:xuyun20042001@aliyun.com

猜你喜歡
外顯子基因組測序
外顯子跳躍模式中組蛋白修飾的組合模式分析
“植物界大熊貓”完整基因組圖譜首次發(fā)布
牛參考基因組中發(fā)現(xiàn)被忽視基因
外顯子組測序助力產前診斷胎兒骨骼發(fā)育不良
科學家找到母愛改變基因組的證據(jù)
血清HBV前基因組RNA的研究進展
中草藥DNA條形碼高通量基因測序一體機驗收會在京召開
基因測序技術研究進展
外顯子組測序助力產前診斷胎兒骨骼發(fā)育不良
人類組成型和可變外顯子的密碼子偏性及聚類分析