陳怡然, 吳小華
隨著2002年人類基因組計(jì)劃的完成,以及其他種類生物全基因組圖譜的陸續(xù)描繪,發(fā)現(xiàn)不同種群間的基因差別僅為1%,主要表現(xiàn)為外顯子的差異。外顯子作為蛋白質(zhì)的編碼區(qū),是DNA中的重要功能序列,其僅占人類基因組約1%[1],但涵蓋了與個(gè)體表型相關(guān)的大部分功能性變異,與人類約85%的導(dǎo)致疾病的基因突變相關(guān)[2]。全外顯子組(exome)為人類基因組全部外顯子區(qū)域的總稱,全外顯子組測(cè)序(whole-exome sequencing)又稱為定向外顯子組捕獲(targeted exome capture),可選擇性的對(duì)人類基因組的編碼區(qū)進(jìn)行測(cè)序,從而發(fā)現(xiàn)罕見(jiàn)及常見(jiàn)疾病相關(guān)的異?;騕3]。目前,全外顯子組測(cè)序相比于全基因組測(cè)序,其低成本、高效率的優(yōu)勢(shì)日益顯著。在單基因疾病的應(yīng)用中,其不僅加快單基因缺陷疾病的基因確定,在系統(tǒng)地預(yù)測(cè)疾病相關(guān)基因方面亦有應(yīng)用。對(duì)于復(fù)雜疾病如腫瘤、糖尿病等的致病基因和易感基因的測(cè)定等[4]也有相當(dāng)?shù)膽?yīng)用前景。本文主要對(duì)全外顯子組測(cè)序技術(shù)以及目前該技術(shù)在腫瘤研究中的應(yīng)用等問(wèn)題進(jìn)行闡述。
全外顯子組測(cè)序技術(shù)作為一種新型的基因組分析技術(shù),包括全外顯子組序列捕獲及測(cè)序。
以兩種較成熟的方法為例。
1.1.1NimbleGen外顯子序列捕獲芯片法基因組DNA被隨機(jī)打斷成片段,隨后在DNA片段兩端分別連上接頭,與定制的序列捕獲芯片雜交,去除未與芯片結(jié)合的背景DNA,將經(jīng)過(guò)富集的外顯子區(qū)域的DNA洗脫并擴(kuò)增。
1.1.2In-Solution 捕獲法所要求的基因起始量低,能有效地捕獲包含未知突變的DNA。具體步驟[5]:(1)基因組DNA被打斷,并組裝成測(cè)序平臺(tái)特異的文庫(kù)形式。在捕獲之前,對(duì)文庫(kù)的大小進(jìn)行選擇,并利用電泳等方法來(lái)進(jìn)行驗(yàn)證。(2)精選大小的文庫(kù),隨后與誘餌共同孵育24 h。(3)加入鏈酶親和素標(biāo)記的磁珠,并通過(guò)強(qiáng)磁鐵從混合物中釣出RNA誘餌-DNA雜合體。(4)洗脫磁珠,將RNA誘餌降解,將得到的目的DNA進(jìn)行常規(guī)的擴(kuò)增和測(cè)序。
以上方法主要通過(guò)捕獲芯片或溶液型目標(biāo)富集系統(tǒng)完成。捕獲芯片作為定向測(cè)序的快速有效的方法,更適用于小型化研究,而溶液型則適用于樣品數(shù)量上千的大規(guī)模高通量測(cè)序研究。
目前應(yīng)用的主要測(cè)序平臺(tái)有:Roche454,Illumina Genome Analyzer Ⅱ,Applied Biosystems SOLiD。
圖1 In-Solution法捕獲外顯子組流程[5]
1.2.1Roche454即大規(guī)模并行焦磷酸合成測(cè)序法,采用GS FLX系統(tǒng):每個(gè)磁珠通過(guò)接頭,與一條大小為300~800bp的DNA片段結(jié)合構(gòu)成樣品文庫(kù)。包含磁珠和擴(kuò)增試劑的水溶液注入礦物油中,形成油包水的乳濁液結(jié)構(gòu),乳濁液PCR在每個(gè)小水滴中獨(dú)立進(jìn)行,產(chǎn)生幾百萬(wàn)相同的拷貝,焦磷酸測(cè)序反應(yīng)測(cè)得每個(gè)磁珠上的片段產(chǎn)生一條讀長(zhǎng),由此進(jìn)行數(shù)據(jù)分析[6]。
1.2.2Applied Biosystems SOLiD即基于磁珠的大規(guī)模并行克隆連接DNA測(cè)序法,采用SOLD系統(tǒng):利用微珠通過(guò)接頭捕獲DNA片段,之后進(jìn)行乳液PCR。其以連接反應(yīng)取代傳統(tǒng)的聚合酶延伸反應(yīng),以8bp的探針作為連接反應(yīng)的底物,探針設(shè)計(jì)為將3′端1~2位的堿基與5′端標(biāo)記的熒光信號(hào)的顏色相對(duì)應(yīng)。一次SOLiD測(cè)序共為五輪循環(huán)測(cè)序,每輪由多個(gè)連接反應(yīng)組成。五輪測(cè)序完成后,可得到各位置的顏色信息,從而推斷出相應(yīng)的堿基序列[7]。
1.2.3Illum ina Genome Analyzer Ⅱ即合成測(cè)序法,采用GA Ⅱ系統(tǒng)。單鏈的DNA片段兩端通過(guò)接通固定到芯片表面,形成橋結(jié)構(gòu),之后以寡核苷酸為引物進(jìn)行PCR擴(kuò)增,得到單克隆DNA族群。測(cè)序中,利用“可逆終止子”,使得每個(gè)測(cè)序循環(huán)只摻入單個(gè)堿基,獲得各位置單個(gè)堿基的信息后,將反應(yīng)試劑洗脫,加入新的反應(yīng)體系,開始下一測(cè)序循環(huán)[8]。
新一代的測(cè)序平臺(tái),與傳統(tǒng)測(cè)序技術(shù)相比,利用接頭構(gòu)建基因文庫(kù),在反應(yīng)基質(zhì)上進(jìn)行大規(guī)模的并行PCR,實(shí)現(xiàn)了邊合成邊測(cè)序的可能性。
不可否認(rèn)的是,全外顯子測(cè)序技術(shù)作為一種新型技術(shù),目前其對(duì)于全基因組蛋白質(zhì)編碼區(qū)的覆蓋并不如設(shè)計(jì)的理想,Jacobs等[9]評(píng)估后發(fā)現(xiàn),NimbleGen的捕獲探針捕獲蛋白質(zhì)編碼序列堿基率為77%,Agilent為83%,并且不同方法的測(cè)序亦均有一定程度的缺失。故目前對(duì)于該新型技術(shù)的應(yīng)用,尤其是對(duì)于實(shí)驗(yàn)陰性結(jié)果的解釋,仍需謹(jǐn)慎為之。
全外顯子組測(cè)序技術(shù)由于對(duì)外顯子的高覆蓋而獲得大量的基因樣本。故即使在樣本中腫瘤細(xì)胞含量較少和(或)樣本純度差異較大的情況下,其仍可較好的對(duì)外顯子區(qū)域的基因突變進(jìn)行測(cè)定,從而進(jìn)一步確定腫瘤相關(guān)癌基因及抑癌基因,為腫瘤的早期診斷提供依據(jù)[10]。
Wei等[11]對(duì)14位配對(duì)的正常人及轉(zhuǎn)移黑素瘤患者進(jìn)行比較研究,發(fā)現(xiàn)TRRAP頻發(fā)突變具有致癌功能;患者GRIN2A突變頻率達(dá)33%;突變均發(fā)生在谷氨酸信號(hào)通路的編碼區(qū)域,通過(guò)該信號(hào)通路的修飾達(dá)到抑制腫瘤生長(zhǎng)成為潛在的治療手段。類似地,Varela等[12]在對(duì)7例腎透明細(xì)胞癌患者的研究中,發(fā)現(xiàn)SWI/SNF染色質(zhì)重組復(fù)合體基因PBRM1作為該腫瘤的第二大癌基因,在患者組截?cái)嗤蛔兟蔬_(dá)41%。Jones等[13]通過(guò)對(duì)42例卵巢透明細(xì)胞癌患者的腫瘤和正常細(xì)胞的對(duì)比分析,篩選得到4個(gè)基因,PIK3CA編碼磷脂酰肌醇-3激酶亞單位,KRAS與已知癌基因產(chǎn)物相關(guān)。PPP2R1A編碼絲氨酸-蘇氨酸磷酸酶2的調(diào)控亞單位,功能類似癌基因。ARID1A作為腫瘤抑制基因編碼產(chǎn)物參與染色體重構(gòu),并且其在42例患者中突變率達(dá)到57%。Parsons等[14]在兒童髓母細(xì)胞瘤的研究中,發(fā)現(xiàn)16%的髓母細(xì)胞瘤的患者中存在著組蛋白-賴氨酸-N甲基轉(zhuǎn)移酶基因MLL2或MLL3的鈍化突變。該研究同時(shí)揭示了兒童及成人髓母細(xì)胞瘤的遺傳景觀上的關(guān)鍵差異。
相比于散發(fā)而言,家族性腫瘤的遺傳傾向常更明顯,故全面的、無(wú)偏倚的蛋白質(zhì)編碼區(qū)的基因測(cè)序成為確定相關(guān)責(zé)任基因的一種可行方法。Jones等[15]對(duì)家族性胰腺癌進(jìn)行測(cè)定,發(fā)現(xiàn)該家系的3個(gè)獨(dú)立的截?cái)嗤蛔?,確立了PALB2為家族性胰腺癌的易感基因。Goldin等[16]在對(duì)腫瘤易感家族的研究中,對(duì)3個(gè)黑色素瘤及2個(gè)霍杰金淋巴瘤的家族以及各家族1名遠(yuǎn)親對(duì)比進(jìn)行全外顯子組的測(cè)序,發(fā)現(xiàn)每個(gè)家族可以獲得0~100不等的候選非同義突變。通過(guò)追蹤,對(duì)各家族其他成員進(jìn)行基因分析,使得篩選該腫瘤的家族易感基因成為可能。
某些特定腫瘤的基因分型,對(duì)之后的治療方案、靶向藥物的選擇和治療結(jié)局等都有一定的指示作用,故利用適當(dāng)?shù)幕驕y(cè)序技術(shù),對(duì)其進(jìn)行個(gè)體化分型,成為未來(lái)腫瘤治療的一大趨勢(shì)。Timmermann等[17]發(fā)現(xiàn),由于全外顯子組測(cè)序可以平行探測(cè)微衛(wèi)星不穩(wěn)定性(microsatellite instability,MSI) 結(jié)直腸癌的頻發(fā)突變,潛在錯(cuò)配修復(fù)(mismatch repair, MMR)機(jī)制的缺失甚至對(duì)結(jié)直腸癌亞型的高頻突變?nèi)鏐RAF、KRAS和TP53進(jìn)行測(cè)定,使其可能成為未來(lái)結(jié)直腸癌基因分型的工具。
轉(zhuǎn)移作為惡性腫瘤的一大特征,是腫瘤患者死亡的最常見(jiàn)原因,但目前對(duì)于腫瘤轉(zhuǎn)移遺傳學(xué)的所知甚少。Harbour等[18]經(jīng)過(guò)對(duì)轉(zhuǎn)移性的葡萄膜黑素瘤進(jìn)行外顯子組捕獲及高通量平行測(cè)序,發(fā)現(xiàn)BAP1(BRCA1-關(guān)聯(lián)蛋白1)的缺失與該病高轉(zhuǎn)移性相關(guān)。另外,胰腺癌預(yù)后不佳常常與其不能早期診斷及早期遠(yuǎn)處轉(zhuǎn)移相關(guān)。Yachida等[19]報(bào)道,對(duì)7例轉(zhuǎn)移胰腺癌患者進(jìn)行基因測(cè)序,除評(píng)估原發(fā)灶與轉(zhuǎn)移灶之間同源細(xì)胞關(guān)系之外,亦對(duì)胰腺癌的遺傳學(xué)演變進(jìn)行 了研究,發(fā)現(xiàn)細(xì)胞原始突變的發(fā)生至原位腫瘤親代細(xì)胞的產(chǎn)生至少需要10年時(shí)間,之后獲得轉(zhuǎn)移能力至少經(jīng)歷5年,轉(zhuǎn)移后患者平均在2年內(nèi)死亡。其結(jié)論提示,可以通過(guò)研究腫瘤進(jìn)展的遺傳學(xué)特征,明確腫瘤轉(zhuǎn)移前的時(shí)間窗,以期早期發(fā)現(xiàn),預(yù)防腫瘤轉(zhuǎn)移導(dǎo)致的死亡結(jié)局[20]。
Pasqualucci等[21]關(guān)于B細(xì)胞非霍奇金淋巴瘤中最常見(jiàn)類型——彌漫大B細(xì)胞淋巴瘤以及濾泡性淋巴瘤的研究中發(fā)現(xiàn),基因組結(jié)構(gòu)的改變使得與組蛋白及非組蛋白乙酰轉(zhuǎn)移酶高度相關(guān)的基因CREBBP和EP300鈍化,其表達(dá)不足造成BCL6和p53的乙?;蛔?,最終導(dǎo)致相關(guān)腫瘤蛋白的激活以及p53腫瘤抑制基因活性的下調(diào),提示可利用藥物針對(duì)乙酰化/去乙?;M(jìn)行靶向治療。Timmermann等[17]研究顯示,結(jié)直腸癌中BRAF、KRAS、FGFR2、MTOR等腫瘤藥物靶區(qū)的基因突變,直接影響腫瘤藥物的治療效果。Parsons等[14]在兒童髓母細(xì)胞瘤的研究中,發(fā)現(xiàn)一種特別類型的組蛋白甲基化在該腫瘤形成中的作用,提供靶向抑瘤的研究方向。Jiao等[22]在胰腺內(nèi)分泌腫瘤的研究中,除了發(fā)現(xiàn)關(guān)于DAXX、ATRX、MEN1等突變導(dǎo)致的染色體重組,亦顯示14%的該腫瘤患者存在鈉巴霉素的靶向通路(mammalian target of rapamycin, mTOR)相關(guān)基因的突變,從而使得篩選該類患者進(jìn)行mTOR抑制治療存在可能。
因此,通過(guò)全外顯子組測(cè)序技術(shù)獲得腫瘤基因突變相關(guān)的最佳藥物靶點(diǎn),改變相應(yīng)代謝途徑,或可能成為未來(lái)腫瘤個(gè)體化治療的金標(biāo)準(zhǔn)。
Yan等[23]研究顯示, 在急性單核細(xì)胞性白血病(AML-M5)患者中,DNMT3A 基因突變導(dǎo)致了DNA甲基轉(zhuǎn)移酶的活性降低,并表現(xiàn)出對(duì)組蛋白H3的異常親和力。DNA甲基化作為重要的基因組修飾,調(diào)控著許多重要細(xì)胞過(guò)程,其與腫瘤發(fā)生的相關(guān)性也已被證實(shí)。研究者經(jīng)分析后發(fā)現(xiàn)DNMT3A作為與總生存率相關(guān)的獨(dú)立預(yù)后變量,攜帶該基因常顯示預(yù)后不佳。而Jiao等[22]關(guān)于胰腺內(nèi)分泌腫瘤臨床研究中顯示,DAXX、ATRX、MEN1基因突變則提示較好預(yù)后。
腫瘤干細(xì)胞(Cancer Sterm Cells, CSCs)學(xué)說(shuō)認(rèn)為腫瘤中存在著一類細(xì)胞,其抗調(diào)亡能力、成瘤能力、遷徙和侵襲能力等與占大多數(shù)分化程度較高的腫瘤細(xì)胞存在差異[24],是腫瘤無(wú)限增殖、復(fù)發(fā)和轉(zhuǎn)移的根源[25]。該理論為腫瘤的發(fā)生、發(fā)展、復(fù)發(fā)和轉(zhuǎn)移等機(jī)制的研究提供了全新的視角。目前,全外顯子組測(cè)序技術(shù)應(yīng)用于干細(xì)胞,甚至是腫瘤干細(xì)胞的研究尚處于初步階段。Howden等[26]在對(duì)于1例視網(wǎng)膜環(huán)狀萎縮患者誘導(dǎo)性多潛能干細(xì)胞(IPS cell)的遺傳校正及分析研究中,對(duì)IPS細(xì)胞株進(jìn)行最初的重編程、基因靶向、選擇性片段移除后,聯(lián)合應(yīng)用全外顯子組測(cè)序技術(shù)與aCGH方法,評(píng)估其基因組完整性。找到該患者原始IPS細(xì)胞的蛋白質(zhì)編碼區(qū)域中共有1個(gè)基因缺失、2個(gè)基因擴(kuò)增以及9個(gè)基因突變。為研究該疾病IPS細(xì)胞分化潛能的機(jī)制提供了新思路。Totoki等[27]在關(guān)于肝細(xì)胞癌的基因組研究顯示,發(fā)現(xiàn)的47個(gè)非同義突變中的TSC1復(fù)合體的無(wú)義突變僅在小部分的腫瘤細(xì)胞中出現(xiàn),并與負(fù)性調(diào)節(jié)鈉巴霉素的哺乳動(dòng)物靶向通路有關(guān),成為與該腫瘤細(xì)胞的“干性”表達(dá)、生長(zhǎng)、代謝相關(guān)的重要致癌途徑。
綜上所述,目前全外顯子組測(cè)序技術(shù)在腫瘤學(xué)的應(yīng)用仍處于較早期的階段。相比于傳統(tǒng)全基因組測(cè)序技術(shù),其低花費(fèi)、高產(chǎn)量已成為明顯的優(yōu)勢(shì),在腫瘤分子生物學(xué)的研究和臨床應(yīng)用方面顯示了多方面的影響。相信隨著測(cè)序成本的進(jìn)一步降低,通過(guò)該技術(shù)對(duì)腫瘤進(jìn)行基因水平的診斷、分型,治療靶點(diǎn)的確立以及預(yù)后的分析等,將成為未來(lái)腫瘤分子生物學(xué)及個(gè)體化治療的有效手段。
參考文獻(xiàn):
[1]Ng SB, Turner EH, Robertson PD, et al. Targeted capture and massively parallel sequencing of 12 human exomes[J]. Nature, 2009,461(7261): 272-276.
[2]Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J]. Proc Natl Acad Sci U S A, 2010, 106(45): 19096-19101.
[3]Ng SB, Buckingham KJ, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder[J]. Nat Genet, 2010, 42(1): 30-35.
[4]Lehne B, Lewis CM, Schlitt T.Exome localization of complex desease association signals[J]. BMC Genomics, 2011, 12:92.
[5]Ernani FP, LeProust EM. Agilent’s sureselect target enrichment systems: Bringing cost and process efficiency to next-generation sequencing[EB/OL]. http://www.chem.agilent.com/Library/brochures/5990-3532en_lo%20CMS.pdf
[6]Margulies M, Egholm M, Altman WE, et al.Genome sequencing in open microfabricated high density picolitre reactors[J]. Nature, 2005, 437(7057): 376-380.
[7]Smith DR, Quinlan AR, Peckham HE, et al. Rapid whole-genome mutational profiling using next-generation sequencing technologies[J]. Genome Res, 2008,18(10): 1638-1642.
[8]Bentley DR, Balasubramanian S, Swerdlow HP,et al. Accurate whole human genome sequencing using reversible terminator chemistry[J]. Nature, 2008, 456(7218): 53-59.
[9]Jacobs KB, Yeager M, Cullen MG, et al. Realities and limitations of coverage in current whole-exome sequencing capture approaches[J]. Genetic epidemiology, 2010, 34(8): 919-920.
[10]Meyerson M, Gabriel S, Getz G.Advances in understanding cancer genomes through second-generation sequencing[J]. Nat Rev Genet, 2010, 11(10): 685-696.
[11]Wei X, Walia V, Lin JC,et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma[J]. Nat Genet, 2011,43(5):442-446.
[12]Varela I, Tarpey P, Raine K,et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma[J]. Nature, 2011, 469(7331): 539-542.
[13]Jones S, Wang TL, Shih IeM,et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma[J]. Science, 2010,330(6001):228-231.
[14]Parsons DW, Li M, Zhang X,et al. The genetic landscape of the childhood cancer medulloblastoma[J]. Science, 2011, 331(6016):435-439.
[15]Jones S, Hruban RH, Kamiyama M,et al. Exomic sequencing identifies PALB2 as a pancreatic cancer susceptibility gene[J]. Science, 2009, 324(5924): 217.
[16]Goldin LR, Yang XR, McMaster ML, et al. The use of whole exome sequencing to identify rare susceptibility variants in cancer prone families[J]. Genetic epidemiology,2010, 34(8):924.
[17]Timmermann B, Kerick M, Roehr C, et al. Somatic mutation profiles of MSI and MSS colorectal cancer identified by whole exome next generation sequencing and bioinformatics analysis[J]. PLoS One, 2010, 5(12): e15661.
[18]Harbour JW, Onken MD, Roberson ED,et al. Frequent mutation of BAP1 in metastasizing uveal melanomas[J]. Science, 2010,330(6009): 1410-1413.
[19]Yachida S, Jones S, Bozic I,et al. Distant metastasis occurs late during the genetic evolution of pancreatic cancer[J]. Nature, 2010,467(7319):1114-1117.
[20]Campbell PJ, Yachida S, Mudie LJ, et al. The patterns and dynamics of genomic instability in metastatic pancreatic cancer[J]. Nature, 2010, 467(7319): 1109-1113.
[21]Pasqualucci L, Dominguez-Sola D, Chiarenza A, et al. Inactivating mutations of acetyltransferase genes in B-cell lymphoma[J]. Nature, 2011,471(7337): 189-195.
[22]Jiao Y, Shi C, Edil BH, et al. DAXX/ATRX, MEN1, and mTOR pathway genes are frequently altered in pancreatic neuroendocrine tumors[J]. Science, 2011, 331(6021):1199-1203.
[23]Yan XJ, Xu J, Gu ZH,et al. Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemia[J].Nature Genetics, 2011,43(4): 309-315.
[24]O’Brien CA, Kreso A, Jamieson CH. Cancer stem cells and self-renewal[J]. Clin Cancer Res. 2010, 16(12): 3113-3120.
[25]Marx J. Cancer research. Mutant stem cells may seed cancer[J]. Science, 2003, 301(5638): 1308-1310.
[26]Howden SE, Gore A, Li Z, et al. Genetic correction and analysis of induced pluripotent stem cells from a patient with gyrate atrophy[J]. Proc Natl Acad Sci U S A,2011, 108(16): 6537-6542.
[27]Totoki Y, Tatsuno K, Yamamoto S et al. High-resolution characterization of a hepatocellular carcinoma genome[J]. Nat Genet, 2011, 43(5): 464-469.