李妍 綜述;徐興祥 審校
(1.大連醫(yī)科大學(xué) 研究生院,遼寧 大連 116044;2.江蘇省蘇北人民醫(yī)院 呼吸科,江蘇 揚(yáng)州 225001)
二代測(cè)序技術(shù)是在過去十年中不斷發(fā)展起來的測(cè)序技術(shù)[1]。在20世紀(jì)70年代,Sanger等[2]和Maxam與Gilbert[3]分別開發(fā)了通過鏈終止和斷裂技術(shù)對(duì)DNA進(jìn)行測(cè)序的方法。這種生物轉(zhuǎn)化是通過提供破譯完整基因以及后來整個(gè)基因組的工具來實(shí)現(xiàn)。由于Sanger及其同事開發(fā)的技術(shù),通常被稱為Sanger測(cè)序,與Maxam和Gilbert的方法相比,對(duì)有毒化學(xué)品和放射性同位素的處理要求較少,因此它成為未來30年內(nèi)更為普遍應(yīng)用的DNA測(cè)序方法。隨著對(duì)測(cè)序通量需求的不斷增加,促進(jìn)了實(shí)驗(yàn)室自動(dòng)化和測(cè)序流程的并行化,最終導(dǎo)致大量的測(cè)序儀器批量式生產(chǎn),由于這些進(jìn)步,Sanger技術(shù)最終在2004年實(shí)現(xiàn)了第一個(gè)人類基因組測(cè)序的完成[4]。然而,人類基因組計(jì)劃(Human Genome Project,HGP)的完成需要大量的時(shí)間和資源,顯然我們需要更快,更高通量和更經(jīng)濟(jì)的測(cè)序技術(shù)。因此,在2004年,國家人類基因組研究所(National Human Genome Research Institute,NHGRI)發(fā)起了一項(xiàng)資助計(jì)劃,目標(biāo)是在十年內(nèi)將人類基因組測(cè)序的成本降低到1000美元[5],這刺激了二代測(cè)序技術(shù)的開發(fā)和商業(yè)化。新的測(cè)序技術(shù)主要有三個(gè)方面的改進(jìn)[6]:首先,它們不依賴于細(xì)菌DNA片段的克隆,而是依賴于非細(xì)胞系統(tǒng)中二代測(cè)序技術(shù)(next-generation sequencing,NGS)文庫的制備。其次,并行產(chǎn)生數(shù)千至數(shù)百萬個(gè)測(cè)序反應(yīng),而不是通常的數(shù)百個(gè)。第三,無需電泳即可直接檢測(cè)到測(cè)序輸出,整個(gè)過程是循環(huán)和并行進(jìn)行的。NGS產(chǎn)生的大量讀數(shù)能夠以前所未有的速度對(duì)整個(gè)基因組進(jìn)行測(cè)序。這些重大改進(jìn)使科學(xué)家能夠在很短的時(shí)間內(nèi)以低成本處理整個(gè)基因組的測(cè)序,開辟了基因組學(xué)和分子生物學(xué)的新時(shí)代。
從1977年第一代DNA測(cè)序技術(shù)(Sanger法),發(fā)展至今三十多年時(shí)間,測(cè)序技術(shù)已取得了相當(dāng)大的發(fā)展,從第一代到第三代乃至第四代,測(cè)序讀長從長到短,再從短到長,不斷經(jīng)歷著重大變革的同時(shí)也取得了技術(shù)上不斷的進(jìn)步。目前,第二代測(cè)序技術(shù)在全球測(cè)序市場(chǎng)上已占據(jù)絕對(duì)的優(yōu)勢(shì),同時(shí)第三和第四代測(cè)序技術(shù)也初露鋒芒。測(cè)序技術(shù)每一次變革,都對(duì)基因組研究,疾病醫(yī)療研究,藥物研發(fā),育種等領(lǐng)域產(chǎn)生巨大的推動(dòng)作用。
二代測(cè)序技術(shù)的原理包括合成法測(cè)序及連接法測(cè)序。目前高通量測(cè)序的主要平臺(tái)代表有羅氏公司(Roche)的454測(cè)序儀(Roch GS FLX sequencer),Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)和ABI的SOLiD測(cè)序儀(ABI SOLiD sequencer)。
羅氏454是第一個(gè)商業(yè)上成功的下一代測(cè)序系統(tǒng)。使用焦磷酸測(cè)序繼續(xù),而非雙脫氧核苷酸來終止鏈擴(kuò)增,焦磷酸測(cè)序技術(shù)依賴于核苷酸摻入期間釋放的焦磷酸的檢測(cè)。羅氏公司的454焦磷酸測(cè)序技術(shù)原理為:在DNA聚合酶、ATP硫酸化酶、熒光素酶和雙磷酸酶的作用下,將每一個(gè)脫氧核糖核苷三磷酸(deoxy-ribonucleotide triphosphate,dNTP)的聚合與一次化學(xué)發(fā)光信號(hào)的釋放偶聯(lián)起來,通過檢測(cè)化學(xué)發(fā)光信號(hào)的有無和強(qiáng)度,達(dá)到實(shí)時(shí)檢測(cè)DNA序列的目的[7]。
該技術(shù)的流程可大致分為以下幾部分,第一步為DNA文庫制備,即基因組DNA/cDNA利用酶促或機(jī)械方法片段化處理至300~800 bp間,經(jīng)末端修復(fù)與特異性接頭等修飾后變性處理回收單鏈DNA。第二步為乳液聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction,PCR)[8]:單鏈DNA文庫被固定在直徑約28 μm的DNA捕獲磁珠上,乳化,形成油包水的混合物,每個(gè)獨(dú)特的片斷在自己的微反應(yīng)器里進(jìn)行獨(dú)立的擴(kuò)增,回收純化。第三步為焦磷酸測(cè)序反應(yīng):攜帶DNA片段的磁珠被放入一種稱作“PicoTiterPlate”(PTP)的平板中供測(cè)序反應(yīng)使用。測(cè)序方法采用焦磷酸測(cè)序法,將一種比PTP板上小孔直徑(約為44 μm)更小的磁珠放入小孔中,啟動(dòng)測(cè)序反應(yīng)。測(cè)序反應(yīng)以磁珠上大量擴(kuò)增出的單鏈DNA為模板,每次反應(yīng)加入一種dNTP進(jìn)行合成反應(yīng),如果dNTP能與待測(cè)序列配對(duì),則會(huì)在合成后釋放相同數(shù)量的焦磷酸基團(tuán),釋放的焦磷酸基團(tuán)會(huì)與反應(yīng)體系中的三磷酸腺苷(adenosine triphosphate,ATP)硫酸化學(xué)酶反應(yīng)生成ATP,生成的ATP和熒光素酶共同氧化使測(cè)序反應(yīng)中的熒光素分子并發(fā)出熒光[9],同時(shí)由PTP板另一側(cè)的電荷耦合器件(charge coupled device,CCD)照相機(jī)記錄,最后通過計(jì)算機(jī)進(jìn)行光信號(hào)處理而獲得最終的測(cè)序結(jié)果。由于每一種dNTP在反應(yīng)中產(chǎn)生的熒光顏色不同,因此可以根據(jù)熒光的顏色來判斷被測(cè)分子的序列。反應(yīng)結(jié)束后,游離的dNTP會(huì)在雙磷酸酶的作用下降解ATP,從而導(dǎo)致熒光淬滅,以便使測(cè)序反應(yīng)進(jìn)入下一個(gè)循 環(huán)。
由于454測(cè)序技術(shù)中,每個(gè)測(cè)序反應(yīng)都在PTP板上獨(dú)立的小孔中進(jìn)行,因而能大大降低相互間的干擾和測(cè)序偏差。此技術(shù)讀取長度最長,高質(zhì)量的讀長能達(dá)到400 bp[10],但通量最低。其主要的錯(cuò)誤來自于同聚物,當(dāng)測(cè)序遇到序列中存在類似于PolyA的多聚核苷酸的情況時(shí),如TAAAAC序列,即相同的堿基的連續(xù)延伸,其中T和C的讀取沒有問題,但A只記錄了一次光信號(hào),僅信號(hào)強(qiáng)度與TAC序列的A有所不同,因此同聚物越長,可能產(chǎn)生的誤差就越大,重復(fù)的堿基個(gè)數(shù)只能通過熒光強(qiáng)度推測(cè)獲得,堿基個(gè)數(shù)與信號(hào)強(qiáng)度不再成線性關(guān)系,引入插入和缺失的測(cè)序錯(cuò)誤將不可避免,所以在檢測(cè)具有重復(fù)序列的DNA片段時(shí)該測(cè)序方法具有困難。
相對(duì)于Sanger測(cè)序、Solexa和SOLid測(cè)序而言,454焦磷酸測(cè)序可以提供中等的讀長和適中的價(jià)格,適合從頭測(cè)序、轉(zhuǎn)錄組測(cè)序、基因組結(jié)構(gòu)分析、宏基因組研究等[11]。
2006年,Solexa發(fā)布了Genome Analyzer(GA)測(cè)序儀,2007年該公司被Illumina收購。測(cè)序儀采用合成測(cè)序技術(shù)(sequencing by synthesis,SBS)。該測(cè)序方法的核心技術(shù)是:“DNA簇”和“可逆性末端終止”。具體技術(shù)原理是:將基因組DNA的隨機(jī)片段附著到光學(xué)透明的測(cè)序芯片表面,稱為流動(dòng)槽(flow cell),這些DNA片段經(jīng)過延伸和橋式擴(kuò)增后,在flow cell上形成了數(shù)以億計(jì)的DNA簇,每個(gè)簇是具有數(shù)千份相同模板的單分子簇。然后利用帶熒光基團(tuán)的四種特殊脫氧核糖核苷酸,通過可逆性終止的邊合成邊測(cè)序技術(shù)對(duì)待測(cè)的模板DNA進(jìn)行測(cè)序[12]。
該測(cè)序方法具體步驟為,第一步文庫構(gòu)建:方法同454測(cè)序,不同之處在于讀長,除特殊需要外,大多數(shù)研究主要是打斷成長度為200~500 bp的序列片段。第二步為簇的生成:flow cell是用于吸附流動(dòng)DNA片段的槽道,每個(gè)flow cell有8個(gè)管道(channel),每個(gè)channel的表面都附有很多接頭,當(dāng)文庫建好后,這些文庫中的DNA在通過flow cell的時(shí)候會(huì)隨機(jī)附著在flow cell表面的管道上,隨后DNA在其表面進(jìn)行橋式PCR的擴(kuò)增。第三步為橋式PCR擴(kuò)增與變性,進(jìn)行這一過程的目的在于實(shí)現(xiàn)將堿基的信號(hào)強(qiáng)度放大,以達(dá)到測(cè)序所需的信號(hào)要求。第四步測(cè)序:測(cè)序方法采用邊合成邊測(cè)序的方法。在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會(huì)被洗脫掉。隨后,再加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號(hào),并有光學(xué)設(shè)備完成熒光信號(hào)的記錄,最后利用計(jì)算機(jī)分析將光學(xué)信號(hào)轉(zhuǎn)化為測(cè)序堿基。這樣熒光信號(hào)記錄完成后,再加入化學(xué)試劑淬滅熒光信號(hào)并去除dNTP 3'-OH保護(hù)基團(tuán),以便能進(jìn)行下一輪的測(cè)序反應(yīng)。Illumina的這種測(cè)序技術(shù)每次只添加一個(gè)dNTP的特點(diǎn)能夠很好的地解決同聚物長度的準(zhǔn)確測(cè)量問題,它的主要測(cè)序錯(cuò)誤來源是堿基的替換,目前它的測(cè)序錯(cuò)誤率大致在1%~1.5%之間。Solexa技術(shù)特色突出表現(xiàn)在:①每張測(cè)序芯片有8個(gè)通道,每個(gè)通道可單獨(dú)運(yùn)行一個(gè)樣品,也可把多個(gè)樣品混合在一起檢測(cè);②一次實(shí)驗(yàn)可讀取大于15億個(gè)堿基/芯片;③可精確讀取重復(fù)序列,如:GGGGGG;④成本低,為傳統(tǒng)方法的1/100;⑤不需要建立文庫,自動(dòng)化樣品制備,簡單易行。
Solexa平臺(tái)的應(yīng)用范圍十分廣泛,幾乎覆蓋了目前基因組學(xué)研究的各個(gè)方面,如基因組從頭測(cè)序、轉(zhuǎn)錄組測(cè)序、表達(dá)譜分析、小RNA及非編碼RNA測(cè)序、表觀遺傳學(xué)研究等。此項(xiàng)技術(shù)讀取的片段多,測(cè)序通量高,高度自動(dòng)化,適合大量小片段DNA的測(cè)序。其優(yōu)點(diǎn)在于性價(jià)比最高,不僅機(jī)器的售價(jià)比其他兩種低,而且運(yùn)行成本也低,在數(shù)據(jù)量相同的情況下,成本只有焦磷酸測(cè)序的 1/10。但局限性在于可逆反應(yīng)時(shí)隨反應(yīng)次數(shù)的增加效率減低、信號(hào)減弱,且讀長短,從頭測(cè)序具有困難。Solexa的讀長在100~150 bp之間,適合小RNA鑒定、甲基化和表觀遺傳學(xué)研究。
SOLiD由Applied Biosystems于2006年購買。測(cè)序儀采用基于連接測(cè)序的雙堿基測(cè)序技術(shù)。該技術(shù)的獨(dú)特之處在于以四色熒光標(biāo)記寡核苷酸的連續(xù)連接合成為基礎(chǔ),取代了傳統(tǒng)PCR,可對(duì)單拷貝DNA片段進(jìn)行大規(guī)模擴(kuò)增和高通量并行測(cè)序[9]?;驹硎峭ㄟ^熒光標(biāo)記的8個(gè)堿基單鏈DNA探針與模板配對(duì)連接,發(fā)出不同的熒光信號(hào),其包含連接位點(diǎn)(第一個(gè)堿基),切割位點(diǎn)(第五個(gè)堿基)和4個(gè)不同的熒光染料(連接到最后一個(gè)堿基)[10],從而讀取目標(biāo)序列的堿基排列順序。在該方法下,目標(biāo)序列的所有堿基都被讀取了兩遍,因此,該測(cè)序方法最大的優(yōu)勢(shì)就是極高的準(zhǔn)確率。該技術(shù)原理為:用連接法測(cè)序獲得基于“雙堿基編碼原理”的SOLiD顏色編碼序列,隨后的數(shù)據(jù)分析比較原始顏色序列與轉(zhuǎn)換成顏色編碼的reference序列,把SOLiD顏色序列定位到reference上,同時(shí)校正測(cè)序錯(cuò)誤,并可結(jié)合原始顏色序列的質(zhì)量信息發(fā)現(xiàn)潛在單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)位點(diǎn)。
測(cè)序技術(shù)流程:第一步同樣為文庫構(gòu)建,SOLiD系統(tǒng)能支持兩種測(cè)序模板:片段文庫或配對(duì)末端文庫,我們通常根據(jù)需要選擇對(duì)應(yīng)的文庫。片段文庫多用于轉(zhuǎn)錄組測(cè)序、RNA定量、miRNA探索、目標(biāo)(區(qū)域)重測(cè)序(targeted resequencing)、3',5'-RACE、甲基化分析、染色質(zhì)免疫共沉淀(chromatin immuno precipitation,ChIP)測(cè)序等。配對(duì)末端文庫多用于全基因組測(cè)序(whole genome sequencing,WGS)、SNP分析、結(jié)構(gòu)重排/拷貝數(shù)等研究。第二步為乳液PCR/微珠富集:SOLiD的PCR過程也和454的方法類似,但這些微珠比起454系統(tǒng)來說則要小得多,只有1 μm。與454測(cè)序方法相比,在同一系統(tǒng)中高通量的實(shí)現(xiàn)顯得更為輕松。第三步為連接酶測(cè)序。這一步是SOLiD測(cè)序的獨(dú)特之處,就在于兩個(gè)堿基確定一個(gè)熒光信號(hào),相當(dāng)于一次能決定兩個(gè)堿基,這種測(cè)序方法也稱之為“雙堿基測(cè)序法”。第四步為數(shù)據(jù)分析,SOLiD測(cè)序完成后,得到了由顏色編碼組成的SOLiD原始序列??紤]到堿基與顏色信息的簡并性,為避免錯(cuò)誤顏色編碼引起后續(xù)的連鎖解碼錯(cuò)誤,SOLiD序列分析軟件不直接將SOLiD原始顏色序列解碼成堿基序列,而是依靠參考(reference)序列進(jìn)行后續(xù)數(shù)據(jù)分析。
SOLiD的讀取長度最初是35 bp,每次運(yùn)行輸出數(shù)據(jù)量為3 G。由于采用雙堿基測(cè)序方法,過濾后SOLiD可達(dá)到99.85%的高精度。ABI在2007年底發(fā)布了第一個(gè)SOLiD系統(tǒng),在2010年末發(fā)布了SOLiD 5500xl測(cè)序系統(tǒng)。從SOLiD到SOLiD 5500xl,ABI在短短三年內(nèi)發(fā)布了五次升級(jí)。SOLiD 5500xl實(shí)現(xiàn)了每次運(yùn)行在讀長、精確度及輸出量分別為85 bp,99.99%和30 G。一次完整運(yùn)行可在七天內(nèi)完成,目前是第二代測(cè)序技術(shù)中準(zhǔn)確性最高的。并且由于Solid測(cè)序法采用的不是PCR反應(yīng)進(jìn)行DNA合成與測(cè)序,因此對(duì)于高GC含量的樣本具有很大優(yōu)勢(shì)。但在熒光解碼階段,鑒于其是雙堿基確定一個(gè)熒光信號(hào),因而一旦發(fā)生錯(cuò)誤就容易產(chǎn)生連鎖的解碼錯(cuò)誤。另外,在這三種技術(shù)中該技術(shù)測(cè)序讀長為50 bp最短,后續(xù)序列拼接同樣比較復(fù)雜,且讀取長度受反應(yīng)次數(shù)限制,給從頭測(cè)序拼接帶來困難。因此,我們?cè)谶x擇測(cè)序方法之前應(yīng)權(quán)衡利弊,選擇最合適的測(cè)序方法。該測(cè)序方法常用平臺(tái)為ABI 3730 XL,適于基因組重測(cè)序和單核苷酸多態(tài)性(SNP)檢測(cè)。
目前,我們可以根據(jù)要解決問題的不同使用不同的方法。初始輸入材料可以是基因組DNA(DNA-seq),信使或非編碼RNA(RNA-seq)或特異性獲得的任何核/核糖核酸材料。
包括全基因組測(cè)序[13],全外顯子測(cè)序(whole exome sequencing,WES)[14]和靶向測(cè)序[15]。
WGS允許對(duì)整個(gè)基因組測(cè)序,需要大的DNA樣品,為了準(zhǔn)確地檢測(cè)臨床突變,可能需要100至200倍的測(cè)序覆蓋,即在時(shí)間和成本上具有一定的限制性。通常,采用足以鑒定結(jié)構(gòu)重排的30至60倍測(cè)序。WGS的主要技術(shù)優(yōu)點(diǎn)是文庫制備不需要任何富集或擴(kuò)增,測(cè)序特異性理論上為100%,在實(shí)踐中實(shí)現(xiàn)約為95%~98%,在整個(gè)輸入材料的感興趣區(qū)域(region of interest,ROI)中具有均勻的覆蓋。日常應(yīng)用WGS最重要的障礙是成本高,數(shù)據(jù)的復(fù)雜通路分析和數(shù)據(jù)解釋。該方法特異度為95%~98%,測(cè)序深度為30~60 x,20 x以上的目標(biāo)區(qū)域占所有目標(biāo)區(qū)域的90%~95%,操作過程所需時(shí)間為6~24個(gè)小時(shí)[15-17]。
對(duì)于許多應(yīng)用來說,整個(gè)基因組測(cè)序既不實(shí)用也不必要。WES僅對(duì)基因組的編碼區(qū)進(jìn)行測(cè)序,關(guān)注基因組的外顯子,約2.5%的人類基因組已發(fā)現(xiàn)與疾病或表型相關(guān)的罕見或常見變體[18-19]。與WGS相比,WES降低了成本和時(shí)間。最常見的方法依賴于通過寡核苷酸探針雜交以“捕獲”靶向的DNA片段,從而富集外顯子序列。WES目前已應(yīng)用于識(shí)別與癌癥相關(guān)的基因[20],糖尿病[21],免疫疾病[22-23]等。WES文庫制備/樣本處理最常用的技術(shù)為TruSeq,代表了Illumina測(cè)序的最新進(jìn)展,旨在優(yōu)化數(shù)據(jù)準(zhǔn)確性,研究可擴(kuò)展性和用戶體驗(yàn)。典型的測(cè)序工作流程包括樣品/文庫制備,簇?cái)U(kuò)增,DNA測(cè)序,圖像分析/堿基調(diào)用,讀取比對(duì)和變體發(fā)現(xiàn)。通過TruSeq技術(shù),該流程中的每個(gè)步驟均經(jīng)過優(yōu)化,可提供最準(zhǔn)確的數(shù)據(jù),以確保任何研究項(xiàng)目的最高質(zhì)量標(biāo)準(zhǔn)。通常,WES測(cè)序的特異度為75%~80%,測(cè)序深度為100~200 x,20 x以上的目標(biāo)區(qū)域占所有目標(biāo)區(qū)域的90%~95%,操作過程所需時(shí)間為6~72個(gè)小時(shí)。
靶向測(cè)序即測(cè)序集中于針對(duì)特定疾病的目標(biāo)基因。由于靶向測(cè)序技術(shù)聚焦于對(duì)特定疾病ROI的選擇,在節(jié)約時(shí)間和成本方面,對(duì)于更多針對(duì)臨床應(yīng)用研究的實(shí)驗(yàn)室更加準(zhǔn)確和方便。
RNA測(cè)序旨在對(duì)選擇性的基因剪接轉(zhuǎn)錄物的發(fā)現(xiàn)、轉(zhuǎn)錄后修飾、基因融合、突變/單核苷酸多態(tài)性(SNP)的檢測(cè)以及小和長非編碼RNA和基因表達(dá)變化等研究[24]。首先將提取的RNA富集并逆轉(zhuǎn)錄成互補(bǔ)DNA,然后加工。此外,即使當(dāng)前沒有可用于診斷的相關(guān)基因測(cè)序板,使用NGS方法,仍然可以對(duì)表觀遺傳學(xué)改變,例如啟動(dòng)子甲基化,微小RNA和其他小RNA的表達(dá)進(jìn)行研究。
早期的RNA-seq研究經(jīng)常使用不保留鏈信息的方案。然而,真核轉(zhuǎn)錄組遠(yuǎn)比我們預(yù)想的復(fù)雜得多,許多基因會(huì)產(chǎn)生反義轉(zhuǎn)錄物[25]。為了應(yīng)對(duì)這種復(fù)雜性,已經(jīng)開發(fā)了許多特異性的RNA-seq方案,其中第一個(gè)出現(xiàn)在2008年[24]。這些方案使得鑒定具有重要生物功能的新型反義調(diào)控轉(zhuǎn)錄物成為可能[26-28]。目前,一些新型的樣品制備方法可允許在單細(xì)胞水平進(jìn)行轉(zhuǎn)錄組分析。單細(xì)胞轉(zhuǎn)錄組學(xué)提供了與經(jīng)典方法相比更為詳細(xì)的轉(zhuǎn)錄動(dòng)力學(xué)視圖。例如,來自對(duì)單細(xì)胞轉(zhuǎn)錄組的分析顯示,看似相同的細(xì)胞之間可能存在實(shí)質(zhì)的轉(zhuǎn)錄異質(zhì)性[29]。最近發(fā)表的一篇開創(chuàng)性研究描述了一種稱為熒光原位RNA測(cè)序(fluorescent in situ sequencing,FISSeq)的方法,不僅能夠研究單細(xì)胞的轉(zhuǎn)錄組,而且可以確定細(xì)胞內(nèi)每個(gè)轉(zhuǎn)錄物的精確位置[30]。
經(jīng)典RNA-seq僅限于測(cè)量RNA穩(wěn)態(tài)水平,通常不直接反映轉(zhuǎn)錄活性或蛋白質(zhì)合成速率。幾年前,開發(fā)了一種在單核苷酸分辨率下通過特異地測(cè)序新生轉(zhuǎn)錄物使轉(zhuǎn)錄可視化的方法。NET-seq是2011年開發(fā)的一種RNA測(cè)量工具,它是提供更高分辨率并保留RNA鏈信息的RNA聚合酶ChIP-seq的替代品。這里提到的ChIP-seq是將染色質(zhì)免疫共沉淀技術(shù)(ChIP)與NGS技術(shù)相結(jié)合的染色質(zhì)免疫共沉淀測(cè)序(ChIP-seq),最初被開發(fā)用于鑒定體內(nèi)蛋白質(zhì)-DNA相互作用[31],并已經(jīng)廣泛用于研究生物過程的多樣性。近年來,很多的突變都被這種技術(shù)檢測(cè)出來。
雖然,二代測(cè)序的出現(xiàn)為臨床診療提供了一個(gè)嶄新的平臺(tái)和廣闊的前景,包括個(gè)體化癌癥治療和精準(zhǔn)醫(yī)學(xué)等廣泛應(yīng)用[32-34]。然而,實(shí)施NGS的重大挑戰(zhàn)仍然存在,局限性仍然不容忽視。除以上列舉的技術(shù)性局限性之外,數(shù)據(jù)存儲(chǔ)和處理也是NGS面臨的重要挑戰(zhàn)。在未來幾年,成千上萬的新的人類基因組將使已經(jīng)令人印象深刻的可用序列數(shù)據(jù)量翻倍。越來越多的人選擇進(jìn)行基因組測(cè)序,保密成為一個(gè)重要因素。這些信息將如何存儲(chǔ)以及訪問權(quán)限,是否可以讓測(cè)序者知道其基因組的每個(gè)細(xì)節(jié),或只知道與疾病診斷或治療相關(guān)的細(xì)節(jié),我們?nèi)绾畏乐箍赡艹霈F(xiàn)的“遺傳歧視”,以及道德問題等肯定會(huì)隨著個(gè)人基因組的發(fā)展而出現(xiàn),這些問題仍迫切需要解決。此外,以更高效的數(shù)據(jù)存儲(chǔ)和分析方法來跟上數(shù)據(jù)生產(chǎn)的增長速度也有待研究[35],后續(xù)大量的測(cè)序數(shù)據(jù)分析,以及如何以生物學(xué)知識(shí)去科學(xué)地解釋和實(shí)際應(yīng)用都值得我們進(jìn)一步探索。