国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

煙草基因組知識篇:2.基因組測序

2010-02-12 23:42孫玉合
中國煙草科學(xué) 2010年2期
關(guān)鍵詞:文庫作圖堿基

孫玉合

(中國農(nóng)業(yè)科學(xué)院煙草研究所,青島 266101)

基因組計劃的最終目標(biāo)是獲取所研究生物體的全部DNA序列,一般包括三個圖譜,即遺傳圖譜、物理圖譜和基因組全序列圖譜,并將基因以及其他有意義的特征定位于DNA序列中。人以及模式生物的染色體都不能直接進(jìn)行DNA測序,因此首先必須將它們隨機(jī)地“敲碎”(通過限制性內(nèi)切酶酶切或超聲波處理或 DNA酶Ⅰ降解)變成成千上萬的小片段,構(gòu)建成不同水平和類型的基因組文庫,例如 YAC(yeast artificial chromosome,酵母人工染色體)文庫、BAC(bacterial artificial chromosome,細(xì)菌人工染色體)文庫和cDNA文庫等。然后對文庫中的每個克隆片段進(jìn)行DNA測序,再對所有測定的每條序列經(jīng)過計算機(jī)程序處理裝配成染色體上完整的DNA序列。

1 DNA測序方法

兩種不同的快速有效的傳統(tǒng) DNA測序方法于上世紀(jì) 70年代中期幾乎同時發(fā)表。鏈終止法(chain termination method)指單鏈DNA分子的序列由互補(bǔ)的多核苷酸鏈的酶促合成來決定,互補(bǔ)鏈在特定的核苷酸位置終止[1]?;瘜W(xué)降解法(chemical degradation method)指雙鏈DNA分子用化學(xué)物質(zhì)處理后,在特定核苷酸位置被切開,從而確定 DNA分子的序列[2]。鏈終止法是基因組測序的主要方法,一方面因為化學(xué)降解法中的化學(xué)試劑有毒,對測序人員的健康有害,另一方面主要因為鏈終止法更易自動化[3]?;蚪M計劃包括大量的測序反應(yīng),手工測序?qū)⒒ㄙM很多年時間,因此要在可接受的時間內(nèi)完成測序計劃,就必須采用自動測序方法。

自上世紀(jì)90年代初,所有的DNA測序操作幾乎無一例外地全部采用半自動化毛細(xì)管電泳鏈終止測序法。為了提高測序速度,人們嘗試設(shè)計新的測序方法,其中一種就是焦磷酸測序(pyrosequencing),它不需要電泳或其他方法分離不同長度片段,因此比鏈終止法測序速度快[4]。最近,許多新一代測序儀(例如美國Roche Applied Science公司的454基因組測序儀、美國Illumina公司和英國Solexa technology公司合作開發(fā)的Illumina測序儀又稱作Solexa測序儀、美國Applied Biosystems公司的SOLiD測序儀等)都使用了一種稱之為循環(huán)芯片測序法(cyclic-array sequencing)的新方法,也可將其稱為“新一代測序技術(shù)或者第二代測序技術(shù)”[5]。所謂循環(huán)芯片測序法,簡言之就是對布滿DNA樣品的芯片重復(fù)進(jìn)行基于DNA的聚合酶反應(yīng)以及熒光序列讀取反應(yīng)。新型納米孔測序法(nanopore sequencing)是采用電泳技術(shù),借助電泳驅(qū)動單個分子逐一通過納米孔來實現(xiàn)測序的,它可以價廉、快速地進(jìn)行DNA測序,它有望成為第三代測序技術(shù)(也可稱為下下一代測序技術(shù))[6-7]。

2 DNA測序的策略

基因組測序工作量浩大,選擇適當(dāng)?shù)臏y序策略很重要。測序策略主要有兩種:第一種是克隆重疊群作圖(clone contig mapping),也稱“自上而下”作圖(top-down mapping)或由長到短作圖策略;第二種是“全基因組鳥槍法”(whole-genome shotgun method)作圖,也稱“自下而上”作圖(bottom-up approach/mapping)或由短到長作圖策略[8]。這兩種測序策略也稱作完全測序和草圖型測序策略[9]。

在第一種測序策略中,首先建立連續(xù)克隆重疊群,再對單個重疊群采用鳥槍法進(jìn)行逐個測序,最后在重疊群內(nèi)進(jìn)行拼接,獲得全長序列。而在第二種測序策略中,直接將基因組DNA隨機(jī)切成2 kb(kilobase,千堿基)左右的小片段,然后進(jìn)行隨機(jī)末端測序,再以基因組的分子標(biāo)記為起點進(jìn)行DNA片段拼接,計算機(jī)分析串聯(lián)得到全序列。序列拼接的最初結(jié)果是一系列的骨架序列(scaffold),每條骨架序列包括一系列被序列缺口分開的連續(xù)序列,不同的骨架序列之間被物理缺口分開;通過封閉序列缺口和物理缺口,可將不同的骨架序列拼接起來。

3 DNA序列的裝配

無論是采用哪種策略進(jìn)行測序,得到的都是成百上千萬的小片段DNA序列,最后必須要將它們裝配成基因組每條染色體上真實的排列順序,這是手工操作無法完成的,需要借助計算機(jī)和數(shù)據(jù)庫以及相關(guān)的軟件系統(tǒng)。因此,DNA序列的裝配是一項浩繁、技術(shù)要求高而又精細(xì)的工作。

首先需要通過計算機(jī)軟件對測定的DNA序列的數(shù)據(jù)質(zhì)量和準(zhǔn)確性進(jìn)行評估,包括給出每個堿基的可信度;確定所測每個樣品的高質(zhì)量部分;在序列拼接完成后對拼接成的重疊群整體的可信度進(jìn)行評估,給出可能的錯誤率[8]。其次,進(jìn)行序列裝配。一般采用的是Phil Green實驗室建立和發(fā)展的Phred-Phrap-Consed軟件系統(tǒng)。不過,隨著基因組計劃的不斷進(jìn)行,各國各實驗室都開發(fā)和建立了自己的基因組測序裝配的相關(guān)軟件。

基因組測序的最后一步是基因組注釋(genome annotation),即利用生物信息學(xué)方法和工具,對基因組所有基因的生物學(xué)功能進(jìn)行高通量注釋,包括基因識別和基因功能注釋(這將在下期中介紹)。

人類基因組計劃(HGP)于1990年正式啟動。2001年,“國際人類基因組測序聯(lián)合體”(International Human Genome Sequencing Consortium, IHGSC)和美國Celera Genomics公司幾乎同時在《自然》和《科學(xué)》雜志上刊文發(fā)表了兩個人類基因組序列的“工作框架圖”,它們覆蓋了97%的基因組,組裝了85%的基因組序列[10-11]。在對人類基因組的測序與序列裝配過程中,IHGSC和Celera Genomics公司采用了不同的方法。IHGSC采用的是克隆重疊群法,也稱為層次鳥槍測序法(hierarchical shotgun sequencing),而Celera Genomics公司采用的則是全基因組鳥槍測序法,也稱為隨機(jī)全基因組測序法(random whole-genome sequencing)。2004年,IHGSC在《自然》上發(fā)表了人類基因組全序列的測定結(jié)果[12],人類基因組接近完整的序列圖包含28億5千萬個堿基對,覆蓋了常染色質(zhì)99%的序列,在10萬個堿基中誤差率只有一個堿基,特別值得注意的是人類基因組僅有2~2.5萬個編碼蛋白質(zhì)的基因。

[1]Sanger F, Nicklen S, Coulson A R.DNA sequencing with chain terminating inhibitors[J].Proc Natl Acad Sci USA, 1977, 74:5463-5467.

[2]Maxam A M, Gilbert W.A new method for sequencing DNA[J].Proc Natl Acad Sci USA, 1977, 74: 560-564.

[3]布朗T A.基因組2[M].袁建剛,等譯.北京:科學(xué)出版社,2002:192-218.

[4]Ronaghi M, Ehleen M, Nyrn P.A sequencing method based on real-time pyrophosphate[J].Science, 1998, 281: 363-365.

[5]Shendure J, Ji H.Next-generation DNA sequencing[J].Nat Biotechnol, 2008, 26: 1135-1145.

[6]Branton D, Deamer D W, Marziali A, et al.The potential and challenges of nanopore sequencing[J].Nat Biotechnol, 2009, 26:1146-1153.

[7]Rusk N.Cheap third-generation sequencing[J].Nat Methods, 2009, 6: 244-245.

[8]路鐵剛, 丁毅.分子遺傳學(xué)[M].北京: 高等教育出版社,2008:406-409.

[9]Morot-Gaudry J –F, Lea P, Briat J –F.植物功能基因組學(xué)[M].王元英, 時焦,等譯.北京:中國農(nóng)業(yè)科學(xué)技術(shù)出版社,2009:17-23.

[10]International Human Genome Sequencing Consortium.Initial sequencing and analysis of the human genome[J].Nature, 2001,409: 860-945.

[11]Venter J C, Adams M D, Myers E W, et al.The sequence of the human genome[J].Science, 2001, 291: 1304-1351.

[12]International Human Genome Sequencing Consortium.Finishing the euchromatic sequence of the human genome[J].Nature,2004, 431: 931-945.

猜你喜歡
文庫作圖堿基
第12講 作圖專題復(fù)習(xí)
巧用三條線 作圖不再難
反射作圖有技巧
專家文庫
反射作圖有技巧
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
優(yōu)秀傳統(tǒng)文化啟蒙文庫
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
關(guān)于推薦《當(dāng)代詩壇百家文庫》入選詩家的啟事
生命“字母表”迎來新成員