龔達(dá)平
(中國農(nóng)業(yè)科學(xué)院煙草研究所,青島 266101)
基因組學(xué)的研究可分為兩方面:以基因組測序?yàn)槟繕?biāo)的結(jié)構(gòu)基因組學(xué)和以功能鑒定為目標(biāo)的功能基因組。結(jié)構(gòu)基因組學(xué)是在基因組學(xué)研究的早期階段,著重進(jìn)行基因作圖、序列分析以研究基因組成、定位的科學(xué)。染色體不能直接用來測序,必須將基因組分解成容易操作的較小的結(jié)構(gòu),即進(jìn)行基因組作圖,獲得基因組圖譜。根據(jù)作圖使用的標(biāo)志和手段,基因組圖譜可分為遺傳圖譜(genetic map)、物理圖譜(physical map)、轉(zhuǎn)錄圖譜(transcription map)及序列圖譜(sequence map)[1]。
遺傳圖譜又稱連鎖圖譜(linkage map),它是以連鎖的遺傳標(biāo)記間的重組頻率確定遺傳學(xué)距離(一般用厘摩 cM 表示,即減數(shù)分裂事件中 1%的重組率)的基因組圖。早期使用的多態(tài)性標(biāo)志有RFLP(限制性酶切片段長度多態(tài)性)、RAPD(隨機(jī)引物擴(kuò)增多態(tài)性 DNA)、AFLP(擴(kuò)增片段長度多態(tài)性);20世紀(jì)80年代后期,開始應(yīng)用MS(微衛(wèi)星)標(biāo)記繪制圖譜。MS的出現(xiàn)不但提高了遺傳圖的精度,同時(shí)也成為物理圖譜上的標(biāo)記,從而促進(jìn)了遺傳圖譜與物理圖譜的整合;近年來,第三代的多態(tài)性標(biāo)記SNP(單核苷酸多態(tài)性)標(biāo)記得到大量使用。Dib等在5264個(gè)AC/TG型微衛(wèi)星的基礎(chǔ)上繪制了人類的完整遺傳圖譜[2],平均密度是每0.6 Mb一個(gè)標(biāo)記。遺傳圖譜的建立為基因識(shí)別和疾病相關(guān)基因的定位創(chuàng)造了條件。
遺傳圖譜的分辨率和精確度都非常有限,對(duì)于大多數(shù)真核生物來說,在進(jìn)行大規(guī)模DNA測序前,需要用其它作圖方法來補(bǔ)充遺傳圖譜。物理圖譜是DNA序列上可以識(shí)別的標(biāo)記位置和相互之間的距離(以堿基對(duì)的數(shù)目為衡量單位)的信息。這些標(biāo)記包括限制性內(nèi)切核酸酶的酶切位點(diǎn)、基因等。物理作圖方法很多,主要為以下三類:限制性酶作圖,熒光原位雜交(FISH)和序列標(biāo)記位點(diǎn)(STS)。限制性圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位,用于對(duì)如kb數(shù)量級(jí)的小區(qū)域做精細(xì)結(jié)構(gòu)制圖。最早的物理圖譜是細(xì)胞遺傳學(xué)圖譜,通過原位雜交將基因定位在染色體各區(qū)帶上。細(xì)胞遺傳學(xué)圖用于較大片段的區(qū)域制圖;熒光原位雜交圖譜使用熒光標(biāo)記的DNA探針,來探測DNA序列在染色體上位置的物理圖譜。但限制酶作圖和FISH均不能滿足快速簡單繪制大基因組物理圖譜的要求。最有效的物理作圖技術(shù)是STS作圖,其優(yōu)點(diǎn)在于適合大規(guī)模測序并容易在染色體上定位。STS是具有位點(diǎn)專一性、染色體定位明確、而且可用PCR擴(kuò)增的單拷貝序列。HGP在1998年完成了包含52 000個(gè)STS位標(biāo)、覆蓋人類基因組大部分區(qū)域的YAC或BAC為載體構(gòu)建的連續(xù)克隆系[3]。
轉(zhuǎn)錄圖譜即基因圖譜,是識(shí)別基因組所包含的蛋白質(zhì)編碼序列在基因組中的位置以及基因表達(dá)模式等信息的圖譜。轉(zhuǎn)錄圖譜是以表達(dá)序列標(biāo)簽(EST)為標(biāo)志繪制的分子遺傳圖譜。通過從cDNA文庫中隨機(jī)挑選克隆進(jìn)行測序所獲得的部分cDNA的5′或3′端序列稱為表達(dá)序列標(biāo)簽,一般長為300~500 bp。EST在基因的鑒定、基因圖譜的構(gòu)建以及基因表達(dá)水平分析等方面起著重要的作用。目前公共數(shù)據(jù)庫NCBI中人類的EST數(shù)量超過830萬條。EST數(shù)據(jù)的不足之處在于其不能獲得基因的完整信息,同時(shí)低豐度表達(dá)和那些在特殊環(huán)境條件脅迫下誘導(dǎo)表達(dá)的基因很難獲得。構(gòu)建全長文庫以及利用新一代高通量的測序技術(shù)開展轉(zhuǎn)錄組測序可以提高對(duì)基因的認(rèn)識(shí)。此外,必須開展全基因組測序,以獲得基因結(jié)構(gòu)的完整信息,如基因在染色體上的排列順序、基因間的間隔結(jié)構(gòu)、啟動(dòng)子的結(jié)構(gòu)以及內(nèi)含子的分布等。
基因組計(jì)劃的最終目標(biāo)是為了獲得生物的全基因組序列,通過測序來得到基因組的序列圖譜?;蚪M測序的基本策略主要有兩種:逐步克隆法和全基因組鳥槍法。前者是對(duì)連續(xù)克隆系中排定的BAC克隆逐個(gè)進(jìn)行亞克隆測序并進(jìn)行組裝。后者是在獲得一定的遺傳及物理圖譜信息的基礎(chǔ)上,繞過BAC克隆逐個(gè)排序的過程,將基因組DNA分解成2 kb左右的小片段進(jìn)行隨機(jī)測序,輔以一定數(shù)量的10 kb的克隆和BAC克隆的末端測序,利用超級(jí)計(jì)算機(jī)進(jìn)行序列組裝。這兩種方法各有利弊。逐步克隆法需要構(gòu)建大片段基因組文庫和精細(xì)的物理圖譜,成本高,時(shí)間長,但組裝相對(duì)容易。全基因組鳥槍法的優(yōu)點(diǎn)在于測序速度快,并且不需要遺傳圖譜或物理圖譜,可以在較短時(shí)間內(nèi)完成對(duì)一個(gè)基因組的測序。但由于是隨機(jī)測序,需要對(duì)基因組進(jìn)行高冗余測序。同時(shí),拼接過程中對(duì)計(jì)算機(jī)技術(shù)和新算法的要求比較高。隨著計(jì)算機(jī)和測序技術(shù)的快速發(fā)展,特別是新一代測序儀的出現(xiàn),大大降低了測序時(shí)間和成本[4-6]。全基因組鳥槍法已經(jīng)應(yīng)用在很多物種基因組測序中,如人類(美國Celera公司)、果蠅、水稻、家蠶、熊貓等。IHGSC和Celera Genomics公司分別于2001年宣布了人類基因組草圖,2003年4月人類基因組精細(xì)圖問世,2004年10月人類基因組完成圖公布[7-9]。
基因組測序完成之后,基因組研究的重心由結(jié)構(gòu)向功能轉(zhuǎn)移。功能基因組學(xué)代表基因分析的新階段,在結(jié)構(gòu)基因組學(xué)提供的信息基礎(chǔ)上系統(tǒng)地研究基因的功能,包括基因功能發(fā)現(xiàn)、基因表達(dá)分析及突變檢測等。對(duì)生物學(xué)的研究也從對(duì)單一基因或蛋白質(zhì)的研究轉(zhuǎn)向多基因或蛋白質(zhì)作用網(wǎng)絡(luò)的系統(tǒng)研究[10]。
[1]布朗T A.基因組2[M].袁建剛,等譯.北京:科學(xué)出版社,2002:192-218.
[2]Dib C,Fauré S,Fizames C,et al.A comprehensive genetic map of the human genome based on 5264 microsatellites[J].Nature,1996,380:152-154.
[3]Schuler G D,Boguski M S,Stewart E A,et al.A gene map of the human genome[J].Science,1996,274:540-546.
[4]Shendure J,Ji H.Next-generation DNA sequencing[J].Nat Biotechnol,2008,26:1135-1145.
[5]Branton D,Deamer D W,Marziali A,et al.The potential and challenges of nanopore sequencing[J].Nat Biotechnol,2009,26:1146-1153.
[6]Rusk N.Cheap third-generation sequencing[J].Nat Methods,2009,6:244-245.
[7]International Human Genome Sequencing Consortium.Initial sequencing and analysis of the human genome[J].Nature,2001,409:860-945.
[8]Venter J C,Adams M D,Myers E W,et al.The sequence of the human genome[J].Science,2001,291:1304-1351.
[9]International Human Genome Sequencing Consortium.Finishing the euchromatic sequence of the human genome[J].Nature,2004,431:931-945.
[10]Morot-Gaudry J –F,Lea P,Briat J –F.植物功能基因組學(xué)[M].王元英,時(shí)焦,等譯.北京:中國農(nóng)業(yè)科學(xué)技術(shù)出版社,2009:17-23.