王元英
(中國農(nóng)業(yè)科學院煙草研究所 青島 266101)
基因組(genome)是指生物的全部基因和染色體組成,也就是生物DNA分子所攜帶的全部遺傳信息;基因組學是研究生物基因組的組成、組內各基因的精確結構、相互關系及表達調控的科學?;蚪M學研究一般包括兩方面的內容:以全基因組測序為目標的結構基因組學(structural genomics)和以基因功能鑒定為目標的功能基因組學(functional genomics)。
結構基因組學是通過基因作圖、核苷酸序列分析以確定基因組成、基因定位的科學。染色體不能直接用來測序,必須將基因組這一巨大的研究對象進行分解,使之成為較易操作的小結構區(qū)域,這個過程就是基因作圖,包括遺傳圖譜、物理圖譜、轉錄圖譜以及最終的全序列圖譜。
功能基因組學又稱為后基因組學(post-genomics),是利用結構基因組學研究所獲得的大量數(shù)據(jù)與信息,結合高通量的實驗、統(tǒng)計和計算機分析技術,研究包括生化功能、細胞功能、發(fā)育功能、適應功能等基因功能的科學。功能基因組學的主要工具和方法包括生物信息學、遺傳分析、基因表達測量和基因功能鑒定等。
1980年完成噬菌體Φ-X174基因組(5,368 bp)的測序,成為第一個測序的基因組;1995年完成第一個原核生物(流感嗜血桿菌,Haemophilus influenzae,1.8 M)基因組的測序;1997年完成大腸桿菌(Escherichia coli,4.6 M)和第一個真核生物(啤酒酵母,Saccharomyces cerevisiae,12 M)的完整基因圖譜繪制;1998年完成第一個多細胞生物(秀麗線蟲,Caenorhabditis elegans,97 M)基因組的測序;2000年完成果蠅(Drosophila melanogaster,180 M)和第一個植物-擬南芥(Arabidopsis thaliana,125 M)的基因組測序以及人類的基因組草圖;2002年完成水稻(Oryza sativa,466 M)的基因組草圖,小鼠(Mus musculus,2500 M)、瘧原蟲(Plasmodium falciparum,23 M)和按蚊(Anopheles gambiae,280 M)基因組測序完成;2003年完成人類(Homo sapiens,3000 M)全基因組完整圖譜;2004年完成原雞(Gallus gallus,1200 M)和家蠶(Bombyx mori,360 M)的基因組測序;2005年完成水稻基因組全序列測定;2007年首個中國人基因組圖譜(又稱“炎黃一號”)繪制完成(也是第一個亞洲人、黃種人的全基因序列圖譜)。目前完成基因組框架圖測序的生物還有大鼠(Rattus norvegicus)、斑馬魚(Brachydanio rerio)、蜜蜂(Apis mellifera)、家豬(Susscrofa domestica)、葡萄(Vitis vinifera)、番木瓜(Carica papaya)、咖啡(Coffea arabica)、玉米(Zea mays)、黃瓜(Cucumis sativus)、大熊貓(Ailuropoda melanoleuca)、馬鈴薯(Solanum tuberosum)及油菜(Brassica campestris)等。正在進行測序的重要植物還有棉花(Gossypium herbaceum)、番茄(Lycopersicon esculentum)、小麥(Triticum aestivum)、沙特椰棗(Phoenix dactylifera)等。
在基因組測序領域中,由美國科學家于 1985年率先提出并在 1990年正式啟動的人類基因組計劃(human genome project,HGP)是一個標志性的研究項目。HGP計劃投資 30億美元,用 15年的時間(1990-2005年)揭示人類基因組的全部奧秘。計劃任務分兩大階段:繪制基因組結構圖譜和基因組測序。HGP自實施以來,不僅進展順利,而且還帶動了其他生物體基因組研究的蓬勃開展。經(jīng)過全球科學家近10年的共同努力,人類基因組“工作框架圖”于2000年6月繪制完成。人類基因組圖譜堪稱人類的“第二張解剖圖”,是人類科學史上的又一個里程碑,對人類疾病基因研究、基因診斷、基因治療、基因工程藥物產(chǎn)業(yè)和社會經(jīng)濟產(chǎn)生了巨大影響。
煙草屬于茄科(Solanaceae)煙草屬(Nicotiana)。煙草屬有66個種,分布廣泛,其中45個種原產(chǎn)于北美或南美,15種原產(chǎn)于澳大利亞。目前生產(chǎn)上推廣最普遍、經(jīng)濟價值最大的栽培種是普通(紅花)煙草(N.tabacum)。一般認為,普通煙草是林煙草(N.sylvestris)和絨毛狀煙草(N.tomentosiformis)種間雜交后染色體加倍而產(chǎn)生的。絨毛狀煙草和林煙草均為二倍體(2n=24),栽培種普通煙草為四倍體(2n=48)。煙草具有非常大的基因組,二倍體煙草基因組大小約為23億堿基對(2300 M),四倍體煙草基因組大小約為45億堿基對(4500 M),是人類基因組的1.5倍。初步預測,煙草的基因數(shù)目約為2.5-5萬個。作為典型的大植物基因組,煙草基因組中重復序列含量很高,可能達到基因組序列的60%-80%,這給煙草基因組的測序和拼接造成了一定困難。
“煙草基因組計劃”是我國《煙草行業(yè)中長期科技發(fā)展規(guī)劃綱要(2006-2020年)》中確定的煙草行業(yè)9個科技重大專項之一。按照規(guī)劃,煙草基因組計劃將重點開展大規(guī)模煙草基因組測序,構建煙草全基因組序列圖譜、高密度分子標記遺傳圖譜、物理圖譜,建立自主知識產(chǎn)權的煙草基因信息數(shù)據(jù)庫;開展煙草重要性狀相關基因定位;克隆與煙堿、有害成分、主要抗性、香氣物質、主要礦物質吸收利用效率、煙葉成熟和烘烤特性等主要性狀調控機制相關的功能基因等。
實施煙草基因組計劃可以全面揭示煙草種質資源的遺傳背景,獲得一批具有自主知識產(chǎn)權的煙草重要性狀功能基因,提高我國煙草育種技術和水平,確立我國在煙草基因組研究上的核心優(yōu)勢,對實現(xiàn)煙草品種的根本性突破、更好地發(fā)揮煙草模式植物的基礎研究作用具有重要意義。