郭起榮 張 瑩 冉 洪 廉 超 胡 陶 馮 云
(國際竹藤中心 國家林業(yè)局竹藤科學(xué)與技術(shù)重點實驗室 北京100102)
竹子基因調(diào)查分析報告
郭起榮張瑩冉洪廉超胡陶馮云
(國際竹藤中心 國家林業(yè)局竹藤科學(xué)與技術(shù)重點實驗室 北京100102)
竹子作為一種重要經(jīng)濟植物,具有經(jīng)濟、生態(tài)和文化價值。隨著生物技術(shù)的快速發(fā)展,越來越多的以竹類植物為對象的基因序列得到克隆與驗證,基于BPG(2012)更新系統(tǒng),截至2014年底,已經(jīng)有3 913個竹子基因得到確證,這些基因覆蓋了竹亞科的3個族,隸屬19個屬30個種。文章統(tǒng)計分析了已確認的基因描述、基因類型和參考序列情況,展望了竹子基因發(fā)展態(tài)勢。
竹種;BPG;基因;全基因組測序;基因參考序列
竹子屬于禾本科(Poaceae/ Gramineae)竹亞科(Bambusoideae)植物,是禾本科植物中最大的類群,主要分布在熱帶和亞熱帶地區(qū),少數(shù)種類分布于溫帶和寒帶[1]。竹類植物是地球陸地生態(tài)系統(tǒng)的重要組成部分,具有生長快、產(chǎn)量高、用途廣、一次造林可以永續(xù)利用的特性,是經(jīng)濟效益和生態(tài)效益良好結(jié)合的林種,在林業(yè)經(jīng)濟和產(chǎn)業(yè)結(jié)構(gòu)中占有重要地位,被公認為 21 世紀(jì)世界上最重要的植物資源之一[2]。世界竹林面積2 200 萬hm2[3],我國有竹林面積601 萬hm2,占森林資源總面積的3%以上,占世界竹林總面積的1/3[4]。
基因是指攜有遺傳信息的DNA序列,是控制性狀的基本遺傳單位,功能性的DNA片段具有遺傳效應(yīng),控制著生物性狀的結(jié)構(gòu)和功能。竹子系統(tǒng)發(fā)育研究小組(BPG)2012年更新的一份清單[5]顯示,世界竹亞科有3個族:青籬竹族(Arundinarieae)、
竹族(Bambuseae)和莪利竹族(Olyreae)。結(jié)合竹子分類學(xué)最新進展[6-9],并遵循“國際植物命名法規(guī)”,研究認為世界發(fā)現(xiàn)的竹類物種數(shù)量已超過1 500種。
眾所周知,世界最權(quán)威的3大核酸序列(DNA)數(shù)據(jù)庫為:美國國家生物技術(shù)信息中心(NCBI)的GenBank、歐洲分子生物學(xué)實驗室(EMBL)的DNA數(shù)據(jù)庫和日本的DNA數(shù)據(jù)庫(DDBJ)。3個數(shù)據(jù)庫間每日都相互交換、更新數(shù)據(jù),從而保證了數(shù)據(jù)的最新性。
截至2014年年底,NCBI中已提交的竹亞科基因數(shù)3 913個,占禾本科已提交基因數(shù)的1.8%,BEP支系(BEP clade)的4%,基因號(GeneID)8223103是NCBI中的第1個竹子基因記錄,于2009年7月10日由中國臺灣的中央研究院林崇熙研究組登錄(表1)。竹子基因在3個竹族中均有發(fā)現(xiàn),其中青籬竹屬(537個)、剛竹屬(524 個)、箭竹屬(390個)、 竹屬(390個)和箬竹屬(259個),占已發(fā)現(xiàn)基因數(shù)的54%。
表1 竹種基因在竹族中的分布
已提交的3 913個竹子基因,是以竹子葉綠體、質(zhì)體等采用同源比對、基因克隆等方法,從30個竹種(隸屬于19個屬)中發(fā)掘出來的(表2)。
值得一提的是,只有我國特產(chǎn)的貢山竹屬(1種)和美洲特產(chǎn)的青籬竹屬(3種)2個屬內(nèi)的全部竹種均有基因登記。而且,在1 500多個竹種中,NCBI中注冊基因數(shù)量最多的是阿巴拉契亞青籬竹(137個),其次為青籬竹(136個);我國全基因組草圖已公布的毛竹登錄的基因為131個,分子生物學(xué)研究較多的麻竹、慈竹、綠竹、孝順竹、早園竹等并非是登錄基因較多的竹種。
NCBI提供了每一個登錄基因的描述。調(diào)查發(fā)現(xiàn)(表3),涉及竹子核糖體、葉綠體的基因是研究的熱點之一。其中,與轉(zhuǎn)運RNA有關(guān)的基因描述最多,為1 167個,占總基因數(shù)的30%。
核糖體是細胞內(nèi)蛋白質(zhì)合成的“反應(yīng)中心”,核糖體RNA(240個)和核糖體蛋白(785個),涉及4.5S rRNA、5S rRNA、16S rRNA和23S rRNA等。光合系統(tǒng)蛋白基因已經(jīng)登錄903個,包括光系統(tǒng)I、光系統(tǒng)Ⅱ、細胞色素、組裝、輔基、脫輔基等蛋白、羧化/加氧酶、囊膜、反應(yīng)中心等亞基的相關(guān)基因。呼吸酶包括ATP合酶、NADH脫氫酶等。對于竹子的BaolC_t001Psal、NdhH、InfA、PetN等單個基因,是通過同源比對的方法在綠竹中獲得的。
基因類型指示基因?qū)傩?,包括tRNA、rRNA、snRNA、scRNA、snoRNA、miscRNA、ncRNA、編碼蛋白、假定基因、其他和未知等類型。將3 913個竹子基因根據(jù)基因?qū)傩苑譃榱?個類型,分別為:編碼蛋白基因,2 490個,占63.6%;tRNA類型,1167個,占29.8%;rRNA類型,240個,占6.1%;假定基因15個,其他基因(BaolC_t001)1個。
表2 各竹種公開的基因數(shù)
表3 已登錄的竹子基因描述
NCBI中的參考序列(RefSeq)數(shù)據(jù)庫提供了校正的序列數(shù)據(jù)和相關(guān)信息,為中心法則中從染色體→mRNA→蛋白的分子研究提供參考序列標(biāo)準(zhǔn),同時也為突變分析、基因表達研究和多態(tài)性發(fā)現(xiàn)提供了一個穩(wěn)定的參考點。參考序列數(shù)據(jù)庫是一個參考序列的非冗余集合,包括構(gòu)建的基因組contig、mRNA、蛋白以及整個染色體。參考序列記錄有3種狀態(tài):臨時基因、預(yù)測基因和復(fù)查基因。其中,竹子基因狀態(tài)標(biāo)注為臨時的達2 490個。
近年來,國內(nèi)外科學(xué)工作者克隆了大量竹子基因序列,可以查詢到的竹子核苷酸數(shù)據(jù)達21 126 條。但是,從拿到基因核苷酸序列到確定完整的基因全長(結(jié)構(gòu)與功能)還有好幾道坎,再加上竹子開花結(jié)實少等原因,限制了包括其系統(tǒng)發(fā)育、遺傳學(xué)等方面的研究。
2013年初,毛竹全基因組測序成果發(fā)布,開啟了竹類全基因組解碼先河,采用基因預(yù)測建模確定了31 987 個基因[10],利用毛竹全基因組數(shù)據(jù)已進行GO功能注釋的基因數(shù)達3 946 個[11]。據(jù)悉,桂竹(Phyllostachys Bambusoideae)、紫竹(Phyllostachys nigra)、麻竹等竹種的全基因組測序工作正在進行中,竹子基因數(shù)量、功能即將得到更深刻理解。
隨著分子技術(shù)的迅猛發(fā)展,科技工作者已經(jīng)可充分利用組學(xué)(基因組、轉(zhuǎn)錄組、蛋白組、代謝組等)的研究成果,結(jié)合傳統(tǒng)的基因發(fā)掘手段(包括準(zhǔn)確的表型鑒定和遺傳分析技術(shù))來發(fā)現(xiàn)豐富的竹種資源中蘊藏著的有重要價值的基因,不斷豐富著竹子基因。
[1]江澤慧.世界竹藤[M].沈陽:遼寧科學(xué)技術(shù)出版社, 2002: 3.
[2]周芳純.竹林培育學(xué)[M].北京:中國林業(yè)出版社, 1998: 1.
[3]Lobovikov M, Ball L, Guardia M, et al. World bamboo resources: a thematic study prepared in the framework of the Global Forest Resources Assessment 2005[M]. FAO, 2007.
[4]國家林業(yè)局.中國森林資源報告(2009-2013)[M]. 北京:中國林業(yè)出版社, 2014.
[5]Bamboo Phylogeny Group. An updated tribal and subtribal classification of the bamboos (Poaceae: Bambusoideae)[C]// Gielis J, Geert P. Proceedings of the 9th World Bamboo Congress. Antwerp, Belgium: World Bamboo Organization, 2012: 3-27.
[6]李德銖,楊紅梅,張玉霄.《中國植物志》(英文版)竹亞科青籬竹屬和新小竹屬的修訂(英文)[J].植物分類與資源學(xué)報, 2013, 35(5): 605-612.
[7]Yang J B, Yang H Q, Li D Z, et al. Phylogeny of bambusa and its allies (Poaceae: Bambusoideae) inferred from nuclear GBSSI gene and plastid psbA-trnH, rpl32-trnL and rps16 intron DNA sequences[J]. Taxon, 2010, 59(4): 1102-1110.
[8]楊林,易同培.我國云南西北部箭竹屬一新種和井岡寒竹的中文名稱[J].四川林業(yè)科技, 2013(2): 48-51.
[9]楊林,易同培.云南高黎貢山西坡玉山竹屬二新種[J].植物研究, 2014, 34(1): 1-5.
[10]Peng Z, Lu Y, Li L, et al. The draft genome of the fastgrowing non-timber forest species moso bamboo (Phyllostachys heterocycla)[J]. Nature Genetics, 2013, 45(4): 456-461.
[11]Zhao H, Peng Z, Jiang Z, et al. BambooGDB: a bamboo genome database with functional annotation and an analysis platform[J]. Database, 2014, bau006. doi: 10.1093/database/bau006.
Gene Analysis Report for Bamboo
Guo QirongZhang YingRan HongLian ChaoHu TaoFeng Yun
(International Center for Bamboo and Rattan; Key Laboratory of Bamboo and Rattan Science and Technology, State Forestrey Administration, Beijing 100102 China)
Bambusoideae has important economic,ecological and cultural values as an important economic plant. With the rapid development of biotechnology, more and more bamboo gene sequences have been cloned and verified based on the Bamboo Phylogeny Group (2012) system. By the end of 2014, 3 913 bamboo genes had been confirmed, which all cover 3 tribes, 19 genera and 30 species of bambusoideae. The paper made statistical analysis of gene description, gene types and reference sequence of the confirmed genes, and finally prospected the development trend of bamboo genes.
bamboo species, bamboo phylogeny group (BPG), gene, whole genome sequencing, gene reference sequence
10.13640/j.cnki.wbr.2015.02.003
國家自然科學(xué)基金項目(31370631);國際竹藤中心基金項目(1632013008)。
郭起榮(1968-),男,博導(dǎo),教授,主要從事竹子種質(zhì)資源研究。E-mail:RGUO@icbr.ac.cn。