江新鳳 劉本英 李友勇 李洪波
(1.江西省蠶桑茶葉研究所 330202;2.云南省茶學(xué)重點(diǎn)實(shí)驗(yàn)室 666201)
中國(guó)是茶的故鄉(xiāng),茶產(chǎn)業(yè)的發(fā)展源遠(yuǎn)流長(zhǎng),茶樹(shù)種質(zhì)資源豐富,截至2017年,通過(guò)國(guó)家級(jí)審(認(rèn)、鑒)定的茶樹(shù)品種有134個(gè),數(shù)量位于世界前列[1~3]。長(zhǎng)期以來(lái),對(duì)于茶樹(shù)種質(zhì)資源以及品種特性研究均通過(guò)形態(tài)學(xué)特征和農(nóng)藝特征觀察來(lái)實(shí)現(xiàn),但由于茶樹(shù)是一種長(zhǎng)期異化授粉、自交不親和性的作物,表現(xiàn)為高度雜合的生殖特點(diǎn),加上品種選育均采用傳統(tǒng)的系統(tǒng)和雜交選育,且父母本親緣關(guān)系較近,其后代發(fā)生的遺傳變異小,故通過(guò)表型來(lái)進(jìn)行品種鑒定存在一定的難度和不確定性。
轉(zhuǎn)錄組學(xué)為茶樹(shù)基因研究開(kāi)辟了新途徑,對(duì)茶樹(shù)的進(jìn)化、基因突變以及翻譯調(diào)控等多種生物學(xué)過(guò)程提供有效工具,也可作為標(biāo)記進(jìn)行輔助育種,降低標(biāo)記選擇成本,縮短了育種進(jìn)程[4~6]。本文對(duì)近年來(lái)茶樹(shù)轉(zhuǎn)錄組學(xué)研究進(jìn)展進(jìn)行總結(jié),為轉(zhuǎn)錄組測(cè)序技術(shù)在茶樹(shù)上的進(jìn)一步應(yīng)用提供參考。
轉(zhuǎn)錄組學(xué)(Transcriptomics)是研究細(xì)胞在某一功能狀態(tài)下所含mRNA的類型與拷貝數(shù);比較不同功能狀態(tài)下mRNA表達(dá)的變化,搜尋與功能狀態(tài)變化緊密相關(guān)的重要基因群,對(duì)每種轉(zhuǎn)錄本在發(fā)育過(guò)程中和不同條件下表達(dá)水平的變化進(jìn)行量化[7~8]。轉(zhuǎn)錄組的概念是由Velculescu等人[9~10]于1997年最早提出的,20 世紀(jì)90 年代中期,轉(zhuǎn)錄組學(xué)開(kāi)始在生物學(xué)領(lǐng)域作為一門新技術(shù),成為研究熱點(diǎn)并且得到廣泛的應(yīng)用[11~12],比如EST(Expressed Sequence tags,表達(dá)序列標(biāo)簽 )是從已建好的cDNA庫(kù)中隨機(jī)抽取克隆,從5’末端或3’末端對(duì)插入的cDNA片段進(jìn)行一輪單向自動(dòng)測(cè)序,所獲得的約60~500bp的一段cDNA序列。20世紀(jì)90年代初Craig Venter提出了EST的概念,并測(cè)定了609條人腦組織的EST,宣布了cDNA大規(guī)模測(cè)序時(shí)代的開(kāi)始[13]。1993年前EST數(shù)據(jù)收錄于GenBank、EBI和DDBJ。同年NCBI(National Center of Biotechnology Information)建立了一個(gè)專門的EST數(shù)據(jù)庫(kù)dbEST來(lái)保存和收集所有的EST數(shù)據(jù)。1995年中期GenBank中EST的數(shù)目超過(guò)了非EST的數(shù)目?,F(xiàn)在GenBank中EST的數(shù)目已經(jīng)超過(guò)了三千五百萬(wàn),約占GenBank中序列數(shù)的60%。轉(zhuǎn)錄組學(xué)方法尤其是cDNA微陣列的應(yīng)用促進(jìn)基因表達(dá)數(shù)據(jù)爆炸性增長(zhǎng),但如何對(duì)這些數(shù)據(jù)進(jìn)行分析,從中提取有意義的生物學(xué)信息,是未來(lái)一段時(shí)間轉(zhuǎn)錄組學(xué)的研究熱點(diǎn)和需要攻克的技術(shù)瓶頸。
隨著科學(xué)研究的不斷深入,雜交技術(shù)、PCR 技術(shù)、標(biāo)簽序列分析等新方法、新技術(shù)已成功地應(yīng)用于轉(zhuǎn)錄組學(xué)研究。轉(zhuǎn)錄組學(xué)研究方法到目前為止,經(jīng)歷三代發(fā)展。早期,由于測(cè)序價(jià)格昂貴、基因序列數(shù)目有限,轉(zhuǎn)錄組學(xué)研究者只能進(jìn)行極少數(shù)特定基因的結(jié)構(gòu)功能分析和表達(dá)研究。最早廣泛應(yīng)用測(cè)序技術(shù)為70年代的 Sanger 法,這也是完成人類基因組計(jì)劃的基礎(chǔ)。最近十幾年, 分子生物學(xué)技術(shù)的快速發(fā)展使高通量分析成為可能,高通量研究方法主要可以分為兩類:一類是基于雜交的方法,主要是指微陣列技術(shù)(Microarray);一類是基于測(cè)序的方法,這類方法包括表達(dá)序列標(biāo)簽技術(shù)(Expression Sequence Tags Technology,EST)、基因表達(dá)系列分析技術(shù)(Serial analysis of gene expression,SAGE)、大規(guī)模平行測(cè)序技術(shù)(Massively parallel signature sequencing,MPSS)、RNA 測(cè)序技術(shù)(RNA sequencing,RNA-seq)。自2005年以來(lái),以Roche 公司的454技術(shù)、Illumina 公司的 Solexa 技術(shù)以及 ABI 公司的 Solid 技術(shù)為標(biāo)志的高通量測(cè)序技術(shù)相繼誕生[14~15]。不同轉(zhuǎn)錄組研究方法比較見(jiàn)表1[16~17]。轉(zhuǎn)錄組學(xué)研究有助于了解特定生命過(guò)程中相關(guān)基因的整體表達(dá)情況,進(jìn)而從轉(zhuǎn)錄水平初步揭示該生命過(guò)程的代謝網(wǎng)絡(luò)及其調(diào)控機(jī)理。隨著后基因組時(shí)代的到來(lái),轉(zhuǎn)錄組測(cè)序成為率先發(fā)展且應(yīng)用相對(duì)廣泛的技術(shù) 。
表1 各種轉(zhuǎn)錄組(測(cè)序技術(shù))研究方法比較
高通量測(cè)序技術(shù)的發(fā)展極大推動(dòng)了轉(zhuǎn)錄組學(xué)的研究,使研究者能發(fā)現(xiàn)更多新轉(zhuǎn)錄本,挖掘更多分子標(biāo)記,更清晰地繪制轉(zhuǎn)錄圖譜以及更準(zhǔn)確地確定代謝途徑通路[6]。轉(zhuǎn)錄組技術(shù)在茶樹(shù)中的應(yīng)用較玉米、大豆、水稻等大田作物較少[18]。但是隨著第三代測(cè)序技術(shù)的不斷完善和發(fā)展,將來(lái)測(cè)序成本會(huì)大大降低,測(cè)序的通量和準(zhǔn)確性也會(huì)不斷提高,其在茶樹(shù)的功能基因挖掘、次生代謝調(diào)控、抗性及茶樹(shù)遺傳育種和進(jìn)化分析等研究中將進(jìn)一步拓展。
目前,由于基因組測(cè)序的功能注釋還不夠完備,因此基因優(yōu)化可以通過(guò)轉(zhuǎn)錄組測(cè)序技術(shù)進(jìn)行,通過(guò)深入比較分析已知基因組注釋模型與轉(zhuǎn)錄組測(cè)序結(jié)果,從而挖掘該物種的新基因及完善其基因組的注釋[19]。張成才[20]以中茶108和福鼎大白茶為材料,進(jìn)行了自交(SP)和雜交授粉(CP),選取了自交和雜交授粉后24h、48h和72h的花柱,進(jìn)行轉(zhuǎn)錄組學(xué)分析,結(jié)果發(fā)現(xiàn),自交和雜交授粉花柱在基因表達(dá)模式上有顯著差異,篩選到了大量可能與茶樹(shù)育性相關(guān)的重要基因;韋康[21~22]使用Illumina測(cè)序法對(duì)茶樹(shù)扦插枝條使用吲哚丁酸(IBA)進(jìn)行轉(zhuǎn)錄組分析,發(fā)現(xiàn)許多基因參與了植物激素信號(hào)轉(zhuǎn)導(dǎo)、次生代謝、細(xì)胞壁組織和谷胱甘肽代謝;譚立強(qiáng)[23]利用Illumina測(cè)序平臺(tái)進(jìn)行高通量測(cè)序,分析了茶樹(shù)的轉(zhuǎn)錄組,構(gòu)建SSR覆蓋1 156.9cm的237個(gè)SSR標(biāo)記分布的15個(gè)連鎖群遺傳連鎖圖譜;馬春雷[24]利用第一代cDNA微陣列方法對(duì)“安吉白茶”泛白不同階段基因表達(dá)進(jìn)行了分析,篩選部分茶樹(shù)功能基因;韋朝領(lǐng)[25]發(fā)現(xiàn)了茶樹(shù)特有化合物主要代謝途徑的大量候選基因。
近年,轉(zhuǎn)錄組技術(shù)在次生代謝調(diào)控方面運(yùn)用頗多,對(duì)茶樹(shù)特征性次生代謝相關(guān)基因進(jìn)行挖掘,以及對(duì)基因的結(jié)構(gòu)、功能、表達(dá)及調(diào)控方面研究也有相關(guān)報(bào)道[26]。李春芳[27]通過(guò)對(duì)茶樹(shù)的13個(gè)不同組織部位進(jìn)行轉(zhuǎn)錄組測(cè)序,得到了34.7萬(wàn)條特異的茶樹(shù)基因序列,找到了1 719個(gè)基因參與次生代謝產(chǎn)物的合成,其中206個(gè)基因參與類黃酮、咖啡因和茶氨酸的合成,找到了339個(gè)可能調(diào)控類黃酮、咖啡因和茶氨酸合成途徑基因的轉(zhuǎn)錄因子。邰玉玲[28]對(duì)茶樹(shù)和油茶轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比較分析,研究了茶樹(shù)特征性代謝成分形成的分子機(jī)制,結(jié)果表明,在茶樹(shù)特征性成分積累的過(guò)程中,與兒茶素、茶氨酸和咖啡堿相關(guān)的代謝途徑的基因表達(dá)量茶樹(shù)比油茶高;王璐[29]通過(guò)比較龍井43和中黃2號(hào),分析了兩品種的生化成分、葉綠體結(jié)構(gòu)、基因表達(dá)與代謝途徑,發(fā)現(xiàn)中黃2號(hào)與龍井43中存在4 902個(gè)差異基因,其中259個(gè)與氨基酸代謝、光合作用和色素代謝有關(guān);吳華玲[30]用20個(gè)特色茶樹(shù)品系的嫩梢、幼葉、成熟葉為材料,構(gòu)建cDNA文庫(kù)并利用Roche/454轉(zhuǎn)錄組測(cè)序,共讀取437 908個(gè)基因序列,通過(guò)重組裝得到25 637條,并用這些序列與公眾數(shù)據(jù)庫(kù)進(jìn)行比對(duì)。結(jié)果發(fā)現(xiàn)這些基因的大多數(shù)映射到碳水化合物代謝、能量代謝和次生代謝產(chǎn)物生物合成途徑。
劉聲傳[31]以“寧州2 號(hào)”為RNA-Seq材料進(jìn)行了轉(zhuǎn)錄組測(cè)序,揭示了干旱脅迫與復(fù)水下茶樹(shù)激素代謝和信號(hào)轉(zhuǎn)導(dǎo)以及可溶性糖和脯氨酸代謝的機(jī)理;王璐[32]、王新超[33]、張悅[34]使用Illumina及RNA-Seq技術(shù)對(duì)茶樹(shù)冷脅迫下進(jìn)行全轉(zhuǎn)錄組測(cè)序,通過(guò)比較轉(zhuǎn)錄組或基因表達(dá)譜的研究以揭示生物學(xué)現(xiàn)象或疾病發(fā)生的分子機(jī)制。王丹[35~36]比較不同茶樹(shù)品種轉(zhuǎn)錄組差異,借助生物信息學(xué)方法分析海量數(shù)據(jù)后,對(duì)茶樹(shù)抵御茶尺蠖抗性相關(guān)基因進(jìn)行了功能注釋、代謝通路分析,同時(shí)關(guān)鍵基因進(jìn)行了篩選。
目前,轉(zhuǎn)錄組測(cè)序技術(shù)已在醫(yī)學(xué)和農(nóng)學(xué)等基礎(chǔ)以及應(yīng)用基礎(chǔ)研究中廣泛應(yīng)用。由于測(cè)序技術(shù)和生物信息學(xué)的不斷發(fā)展,分析其測(cè)序結(jié)果會(huì)越來(lái)越真實(shí)可靠,基于轉(zhuǎn)錄組數(shù)據(jù)的分析研究,將有助于得到新的功能基因和代謝通路,為茶樹(shù)種質(zhì)資源鑒定、保存與優(yōu)良種質(zhì)選育提供分子基礎(chǔ);通過(guò)對(duì)次生代謝途徑關(guān)鍵酶基因的研究,為茶樹(shù)活性成分的生物合成與調(diào)控提供新的思路和方法,或通過(guò)基因轉(zhuǎn)錄水平的調(diào)節(jié),提高茶樹(shù)功能成分的產(chǎn)量與活性,為茶樹(shù)的良種選育、規(guī)范化種植和質(zhì)量控制提供技術(shù)支撐。當(dāng)然,作為一種快速、高通量、全面解讀茶樹(shù)基因組信息的全新技術(shù)手段,茶樹(shù)轉(zhuǎn)錄組研究在基礎(chǔ)理論和生產(chǎn)實(shí)踐中均具有重要的意義的同時(shí)也存在一些弊端,如樣本需求量大、容易受環(huán)境因素的影響,因此轉(zhuǎn)錄組學(xué)的應(yīng)用結(jié)合眾多新興組學(xué),例如蛋白質(zhì)組學(xué)和代謝組學(xué)的研究,實(shí)現(xiàn)高通量與高效率的結(jié)合,揭示傳統(tǒng)茶樹(shù)生物學(xué)內(nèi)涵,為茶產(chǎn)業(yè)的發(fā)展提供助力。
[1]江新鳳,李文金,楊普香.江西省茶樹(shù)種質(zhì)資源研究進(jìn)展[J].蠶桑茶葉通訊,2016(5):29~31.
[2]Kamunya S M, Wachira F N, Pathak R S, et al. Genomic mapping and testing for quantitative trait loci in tea (Camelliasinensis(L.) O. Kuntze) [J]. Tree Genetics & Genomes, 2010, 6(6): 915~929.
[3]Zhao L P, Liu Z, Chen L, et al. Generation and characterization of 24 novel EST derived microsatellites from tea plant (Camelliasinensis) and cross-species amplification in its closely related species and varieties [J]. Conservation Genetics, 2008, 9(5):1327~1331.
[4]Chen L, Zhou Z X, Yang Y J, et al. Genetic improvement and breeding of tea plant (Camelliasinensis) in China: from individual selection to hybridization and molecular breeding [J]. Euphytica, 2007, 154:239~248.
[5]史碩博,陳濤,趙學(xué)明.轉(zhuǎn)錄組平臺(tái)技術(shù)及其在代謝工程中的應(yīng)用[J].生物工程學(xué)報(bào),2010,26(9):1 187~1 198.
[6]王繼玥,余庭躍,張彩波.玉米轉(zhuǎn)錄組學(xué)研究進(jìn)展[J].華北農(nóng)學(xué)報(bào),2014,29(增刊):10~15.
[7] Wang Z, Gerstein M, Snyder M, et al. RNA-Seq: a revolutionary tool for transcriptomics[J]. Nat Rev Genet, 2009,10(1):57~63.
[8] Costa V, Angelini C, De F I, et al. Uncovering the complexity of transcriptomes with RNA-Seq [J]. Journal of Biomedicine & Biotechnology, 2010, 5 757 (2 010):e853916.
[9] Velculescu V E, Zhang L, Zhou W, et al. Characterization of the yeast transcriptome[J]. Cell, 1997, 88(2):243~251.
[10] 徐云碧.分子植物育種[M].北京:科學(xué)出版社,2014:79~80.
[11] Lockhart D J,Winzeler E A. Genomics,gene expression and DNA arrays[J].Nature,2000, 6 788 (405): 827~836.
[12] Birzele F,Schaub J,Rust W,et al.Into the unknown: expression profiling without genome sequence information in CHO by next generation sequencing[J].Nucleic Acids Research,2010,38 ( 12 ) :3 999~4 010.
[13] Adams M D, Kerlavage A R, Fleischmann R D, et al. Initial assessment of human gene diversity and expression patterns based upon 83 million nucleotides of cDNA sequence[J]. Nature, 1995, 6 547 (377,Suppl):3.
[14] Maher C A, Kumarsinha C, Cao X, et al. Transcriptome sequencing to detect gene fusions in cancer[J]. Nature, 2009, 7 234 ( 458):97~101.
[15] Zhou X, Ren L, Li Y, et al. The next-generation sequencing technology: a technology review and future perspective.[J]. Science China Life Sciences, 2010, 53(1):44.
[16]楊曉玲,施蘇華,唐恬.新一代測(cè)序技術(shù)的發(fā)展及應(yīng)用前景[J].生物技術(shù)通報(bào),2010(10):76~82.
[17]田李,張穎,趙云峰.新一代測(cè)序技術(shù)的發(fā)展和應(yīng)用[J]. 生物技術(shù)通報(bào),2015,31(11):1~8.
[18]劉冠,趙婷婷,楊歡歡,等.番茄轉(zhuǎn)錄組學(xué)研究進(jìn)展[J].基因組學(xué)與應(yīng)用生物學(xué),2016,35(10):2 802~2 807.
[19] 竇孝銳.馬鈴薯轉(zhuǎn)錄組測(cè)序研究進(jìn)展[J].現(xiàn)代農(nóng)業(yè)科技,2015(13):81~83.
[20] Zhang C C, Wei K,Ni D J, et al. Transcriptome analysis reveals self-incompatibility in the tea plant (Camelliasinensis) might be under gametophytic control [J]. BMC Genomics,2016,17(1):359.
[21] Wei K, Wang L Y, Wu L Y, et al. Transcriptome analysis of indole-3-butyric acid-induced adventitious root formation in nodal cuttings ofCamelliasinensis(L.)[J]. Plos One, 2014, 9(9):e107201.
[22] Wei K, Wang L, Zhang C, et al. Transcriptome analysis eveals key flavonoid 30-hydroxylase and lavonoid 30,50-hydroxylase genes in affecting the ratio of dihydroxylated to trihydroxylated catechins inCamelliasinensis. [J].Plos One 2015,10(9): e0137925.
[23]Tan L Q, Wang L Y, Wei K, et al. Floral transcriptome sequencing for SSR marker development and linkage map construction in the tea plant (Camelliasinensis)[J]. Plos One, 2013, 8(11):e81611.
[24]Ma C L, Chen L, Wang X C,et al. Differential expression analysis of different albescent stages of Anji Baicha (Camelliasinensis(L.) O. Kuntze) using cDNA microarray[J]. Scientia Horticulturae ,2012,148:246~254.
[25] Shi C Y, Yang H, Wei C L, et al. Deep sequencing of theCamelliasinensistranscriptome revealed candidate genes for major metabolic pathways of tea-specific compounds[J]. BMC Genomics, 2011, 12(1):131.
[26]宛曉春,夏濤.茶樹(shù)次生代謝[M].北京:科技出版社,2015:180.
[27] Li C F, Zhu Y, Yu Y, et al. Global transcriptome and gene regulation network for secondary metabolite biosynthesis of tea plant (Camelliasinensis)[J]. BMC Genomics, 2015, 16(1):560.
[28] Tai Y L,wei C L,Wan X C,et al.Transcriptomic and phytochemical analysis of the biosynthesis of characteristic constituents in tea (Camelliasinensis) compared with oil tea (Camelliaoleifera)[J]. BMC Plant Biology,2015, 15(1): 190.
[29] Wang L, Yue C, Cao H, et al. Biochemical and transcriptome analyses of a novel chlorophyll-deficient chlorina teaplantcultivar[J]. BMC Plant Biology, 2014, 14(1):352.
[30] Wu H L, Chen D, Li J, et al. De Novo characterization of leaf transcriptome using 454 sequencing and development of EST-SSR markers in tea (Camelliasinensis)[J]. Plant Molecular Biology Reporter, 2013, 31(3):524~538.
[31] Liu S C, Jin J Q, Ma J Q, et al. Transcriptomic analysis of tea plant responding to drought stress and recovery[J]. Plos One, 2016, 11(1):e0147306.
[32] Wang L, Wang X, Yue C, et al. Development of a 44 K custom oligo microarray using 454 pyrosequencing data for large-scale gene expression analysis ofCamelliasinensis[J]. Scientia Horticulturae, 2014, 174(1):133~141.
[33] Wang X C, Zhao Q Y, Ma C L, et al. Global transcriptome profiles ofCamelliasinensis, during cold acclimation[J]. BMC Genomics, 2013, 14(1):415.
[34] Zhang Y, Zhu X, Chen X, et al. Identification and characterization of cold-responsive microRNAs in tea plant (Camelliasinensis) and their targets using high-throughput sequencing and degradome analysis[J]. BMC Plant Biology, 2014, 14(1):271.
[35] Wang D, Li C F, Ma C L, et al. Novel insights into the molecular mechanisms underlying the resistance ofCamelliasinensisto Ectropis oblique, provided by strategic transcriptomic comparisons[J]. Scientia Horticulturae, 2015, 192(2):429~440.
[36]王丹,陳亮.茶樹(shù)對(duì)茶尺蠖抗性機(jī)制研究[J].茶葉科學(xué),2014,34(6):541~547.