蔣費濤 王書平 祁俊生 熊春霞
摘 要:轉錄組學作為系統(tǒng)生物學的一個重要分支,可以從整體水平上反映細胞或者組織中基因的表達情況及其調控規(guī)律,已經(jīng)被應用到各個研究領域。主要簡述了轉錄組學以及轉錄組學在植物系統(tǒng)學中的應用,最后展望了轉錄組學技術在植物系統(tǒng)學中的研究前景。
關鍵詞:轉錄組學;植物分類學;分子標記
基金項目:“重要跨境農業(yè)入侵生物精準識別與智能化快速檢測”(2017YFC1200602)
系統(tǒng)學這一詞最早出現(xiàn)在林奈的書籍中,隨后在Smith和Nutall等人的著作中,系統(tǒng)植物學(Systematics Botany)作為一門學科被提出,系統(tǒng)學最初的含義是將命名的生物按照某個鑒別性狀或順序排列起來。Simpson Michael G.在他編寫的《植物系統(tǒng)學(Plants Systematic)》一書中將系統(tǒng)學定義為“包括并涵蓋傳統(tǒng)分類學、描述、識別、命名和生物分類,其首要的目標是重建系統(tǒng)發(fā)育和生命進化史”[1]。
植物系統(tǒng)學既是植物學的基礎,同時,也是生態(tài)學等全部生命科學的基礎,對植物系統(tǒng)學進行研究有著至關重要的意義。首先,對植物系統(tǒng)學的研究可以提供生命巨大的多樣性信息,可以讓人們充分地了解植物種間的系統(tǒng)發(fā)育關系和生命發(fā)展史,而對生命發(fā)展史的充分了解不僅可以洞察其他領域,還具有實用價值。其次,系統(tǒng)學的研究為劃分物種和種下分類(亞種和變種)提供了科學依據(jù),并為確定種間區(qū)別提供了科學依據(jù),這類研究在保護生物學的今天尤為重要,了解種類分類群的界限,可以更明確地對稀有或瀕危的物種加以保護和保存。植物系統(tǒng)學是記錄生物多樣性的主要工具,也是幫助拯救生物多樣性的重要工具[1]。
轉錄組學作為功能基因組學的代表,利用高通量測序開發(fā)分子標記的優(yōu)勢明顯,由于不需要物種的選擇性、測序靈敏度高,特別是對于尚未公布基因組測序的新物種,轉錄組測序能夠快速高效地呈現(xiàn)出覆蓋面廣、準確度高的信息,成為開發(fā)分子標記的良好工具而被廣泛應用于植物的遺傳育種、種質資源保護和開發(fā)等領域,從分子的層面研究物種的演化和系統(tǒng)的分類[2]。本研究就目前轉錄組學的研究方法以及轉錄組學在植物分類中的應用情況作介紹。
1 轉錄組學
1.1 轉錄組學概述
20世紀90年代以來,越來越多的基因組序列被測定,后基因組學時代到來,轉錄組學(Transcriptomics)、基因組學(Genomics)、代謝組學(Metabolomics)和蛋白質組學(Proteomics)等組學技術得到了迅速的發(fā)展與廣泛的應用[3]。其中以轉錄過程作為研究對象的轉錄組學是最先發(fā)展且應用最廣的組學技術[4]。
轉錄組學是一門在整體水平上研究細胞中基因轉錄情況及轉錄調控規(guī)律的學科。轉錄組通常是狹義上的轉錄組,指細胞中所有參與蛋白質翻譯的信使RNA(mRNA)的總和[5]。研究整個轉錄組的第一次嘗試開始于20世紀90年代初,轉錄組(Transcriptome)這個術語是C. Auffray于1996年最先提出來的,用來描述整套轉錄本的特征。隨后在1997年,VECLALESUC在研究釀酒酵母細胞時提出并在科學論文中第一次使用[6]。
自20世紀90年代初開始嘗試研究轉錄組學后,到20世紀90年代末,科學技術的快速進步與發(fā)展使轉錄組學成了一門被廣泛應用于各個領域的科學[7]。目前,轉錄組學研究技術主要分為兩類:一類是在20世紀90年代發(fā)展起來的基于雜交方法的微陣列技術(Microarray),另一類是在2000年發(fā)展起來的基于測序的方法,主要包括表達序列標簽技術(Expressed Sequence Tag,EST)、基因表達序列分析技術(Serial Analysis of Gene Expression,SAGE)、大規(guī)模平行測序技術(Massively Parallel SignatureSequencing,MPSS)以及高通量直接全轉錄組RNA測序技術(RNA Sequencing,RNA-seq)等[8]。
其中,較早發(fā)展起來的技術是Microarray以及EST技術,隨著近幾年的快速發(fā)展,RNA-seq逐漸成了基因表達分析的首選技術,在轉錄應用和微陣列的替代等方面都取得了極其重大的進展[9]。
1.2 微陣列技術
20世紀90年代,微陣列技術逐漸發(fā)展起來,其通過與一系列互補探針的雜交來測量一組已確定的轉錄組的豐度,最早發(fā)表于1995年[10]。微陣列技術的原理是將短核苷酸寡聚體構成的探針分子固定在玻璃等支持物上,然后與已經(jīng)被標記的樣品分子進行雜交,對雜交的信號強度進行檢測和分析后,就可以得到樣品分子的數(shù)量和樣品分子的基因表達信息。隨著科技的發(fā)展,微陣列設計和制造的進步提高了探針的特異性,并允許更多基因在單個陣列上進行檢測。與此同時,熒光檢測技術的快速發(fā)展提高了低豐度轉錄組的靈敏度和測量精度。用于轉錄分析的微陣列通常分為兩類,一類是低密度斑點陣列,另一類是高密度短探針陣列[11]。直到2000年末,高密度微陣列都是轉錄分析首先選擇的方法[12]。
1.3 表達序列標簽技術
20世紀80年代,低通量Sanger測序開始被用來對cDNA庫中的隨機單個轉錄本進行測序,稱為表達序列標簽。表達序列標簽是由單個RNA轉錄體產(chǎn)生的核苷酸短序列[13]。20世紀80年代早期,人們認識到來自cDNA的短片段可以用于鑒定基因后開始研究EST技術?;蜓芯克═he Institute for Genomic Research,TIGR)的科學家是最早大規(guī)模生成EST數(shù)據(jù)的科學家。
表達序列標簽是隨機挑選cDNA文庫,通過單向測序獲得的部分序列信息來代表完整cDNA序列的一種技術方法,EST序列的長度通常小于1 000 bp。通過對生物體EST 的分析,可以獲得生物體內基因的表達情況和表達豐度[14]。使用EST技術時可以不需要了解它們來自于具體哪些有機體,對非模型生物具有吸引力[15]。表達序列標簽技術目前已經(jīng)被應用在發(fā)現(xiàn)和分離新的基因、繪制遺傳學圖譜等領域[14]。
1.4 基因表達系列分析
1995年,最早的基于測序的轉錄組學方法之一—SAGE被開發(fā)出來,它是由Sanger對連接的隨機轉錄片段進行測序的結果。SAGE是EST方法的一種發(fā)展,因為EST方法通量低、價格昂貴且一般無法定量,SAGE就是為了克服這些限制而發(fā)展起來的。SAGE目的是提高標記的吞吐量,并能夠對轉錄的豐度進行量化[16]。
SAGE技術的原理是將mRNA逆轉錄成cDNA后,利用限制性內切酶將cDNA切割為11 bp的片段,然后將cDNA片段連接成長度大于500 bp的長鏈,利用低通量長讀數(shù)的方法測序,然后根據(jù)特定序列標簽出現(xiàn)的次數(shù)估計基因表達的豐度。SAGE技術在疾病、發(fā)育、細胞凋亡等多個領域已被廣泛地應用,但在植物方面的研究相對較少[17-18]。
1.5 RNA測序
RNA-seq是利用深度測序技術來對轉錄組學進行分析的一種方法。與那些以雜交為原理的轉錄組學技術相比,以測序技術為基礎的技術可以直接測定cDNA序列。RNA-seq通過使用高通量測序方法,再結合一些計算方法來達到捕獲和量化提取物中轉錄本的目的,所產(chǎn)生的核苷酸序列長度根據(jù)所使用測序方法的不同而不同,一般在30~1 000 bp。RNA測序技術自2006年被提出后,發(fā)展得非常迅速并且被廣泛使用,2015年取代微陣列成為主要的轉錄技術[19]。
RNA-seq主要以第二代測序平臺為基礎,擁有一整套全新且完備的建庫、測序以及分析體系[20]。目前,用于RNAseq的高通量測序平臺可從4家公司獲得,分別是Illumina,Roche 454,Helicos BioScience和Life Technologies[21]。
RNA-seq雖然是一項正在開發(fā)的技術,但與其他的現(xiàn)有技術相比,優(yōu)勢仍然比較明顯。與基于雜交方法的微陣列技術相比,RNA-seq不能局限于檢測與現(xiàn)有基因組序列相對應的轉錄本,RNA-seq對于尚未確定基因組序列的生物特別有吸引力;微陣列技術在應用于低水平或者高水平表達的基因時敏感性比較低,同時,RNA-seq也具有很大的動態(tài)范圍,RNA-seq的典型動態(tài)范圍約為5個數(shù)量級。RNA-seq的輸入RNA量也遠低于微陣列技術,在表達水平方面,RNA-seq被證明是非常準確的,其結果也顯示了高水平的重復性且使用的成本要低于Sanger測序等[22-24]。
2 轉錄組學在植物分類研究中的應用
2.1 轉錄組學在物種鑒定上的研究
隨著高通量測序技術的不斷發(fā)展,利用RNA-seq開發(fā)EST-SSR標記,逐漸成為一種低成本、高效率的技術,該技術已經(jīng)在中藥偽品鑒定、植物品種鑒定方面有廣泛的應用[25]。
蔣超等[26]對忍冬與其變種的ESTs序列進行了分析,選出15對引物對52份金銀花進行實驗驗證,發(fā)現(xiàn)其中3對引物可以準確鑒別金銀花的原植物忍冬。馬慶華等[27]開發(fā)12對EST-SSR引物對平歐雜種榛進行品種鑒定,其中 CAF-2、CAF-3、CAF-12和CAF-13等4對引物的組合使用,可區(qū)分43個平歐雜種榛品種,CAF-2、CAF-13等2對引物可區(qū)分主栽的16個品系,為平歐雜種榛的鑒定提供了快捷且有效的方式。這表明EST-SSR 標記法應用于物種的鑒別具有較好的可行性。
2.2 轉錄組學在種質資源上的研究與應用
種質資源是生物體遺傳給子代的遺傳物質,可以保證生命延續(xù)和種族繁衍,種質資源是作物遺傳改良和相關研究的基礎,擁有種質資源的數(shù)量和質量,直接影響種質資源的利用效率和現(xiàn)代種業(yè)的可持續(xù)發(fā)展[28]。
龍蕩等[29]對早實枳進行轉錄本測序,共設計SSR引物29對,對18份來自蕓香科柑橘3大屬的不同品種進行研究,將18份材料成功聚類到3個群體,并開發(fā)選擇出9對多態(tài)性好的引物對早實枳種質資源進行監(jiān)督,鑒定出15份不同程度的變異植株。龍妮等[30]對6種野生煙草種和西紅柿的蛋白質組進行基因家族分析,識別出2 491個單拷貝基因家族,從轉錄組水平上解釋了野生煙草在進化上的位置。同時,研究了野生煙草種的抗性基因及煙堿轉錄基因,對今后煙草和茄科物種抗病性品種的育種具有指導意義。這些轉錄組序列豐富了煙屬野生種生物的信息數(shù)據(jù),為今后煙草分子標記開發(fā)、重要形狀相關基因克隆及功能分析等研究奠定了基礎。
2.3 轉錄組學在遺傳多樣性上的研究與應用
遺傳多樣性不僅是生物多樣性的基礎,同時顯示著基因的多樣性,在分子層面對遺傳多樣性進行研究可以揭示差異的本質[31]。
孫圣[31]基于SSR標記對瀕危植物血皮槭11個群體288個樣本的天然群體遺傳變異的研究,結果說明血皮槭具有較高的遺傳多樣性,同時,發(fā)現(xiàn)血皮槭自然分布區(qū)內中心群體的遺傳多樣性要高于周圍群體遺傳多樣性,綜合分析認為血皮槭的遺傳多樣性不是導致其瀕危的主要原因。張?zhí)鸬萚32]基于Illumina HISeq 2 000對核桃的4種組織(葉、芽、雌花、雄花)進行轉錄組測序,并進行生物信息學分析,對轉錄組數(shù)據(jù)進行特征分析,開發(fā)EST-SSR引物,隨機挑選78對進行擴增,其中53對有條帶,39對具有多態(tài)性。利用這些引物對來自88個核桃的個體進行遺傳多樣性研究,結果表明不同地理群體的核桃具有其特有的遺傳性狀,且88個個體遺傳多樣性都很高。
2.4 轉錄組學在植物系統(tǒng)分類中的應用
邢俊連等[33]利用皂莢轉錄組與基因組數(shù)據(jù)對皂莢屬在豆科植物中的系統(tǒng)進化位置進行研究,通過使用直系同源對建立物種系統(tǒng)進化樹的方法,對皂莢在豆科中的進化位置進行分析,實驗結果與形態(tài)學分類定位一致。同時,利用皂莢屬轉錄組數(shù)據(jù)開發(fā)EST-SSR引物,為今后品種鑒定、遺傳多樣性分析以及皂莢遺傳資源評價提供了分子手段。李清瑩等[34]對火力楠的10個天然群體進行EST-SSR分子標記研究,對火力楠進行轉錄組測序后利用轉錄組數(shù)據(jù),設計并篩選出火力楠EST-SSR引物12對,利用這些引物將火力楠的10個天然群體分為兩大類群4個亞類群。
3 問題與展望
近年來,隨著科學技術的不斷發(fā)展,轉錄組學被廣泛應用于各個研究領域。目前,轉錄組學在研究植物系統(tǒng)分類、物種鑒定以及遺傳多樣性分析等方面均取得了一定的進展,在植物系統(tǒng)學的研究及內部系統(tǒng)發(fā)育關系中發(fā)揮著不可或缺的作用。目前,尋找準確且快速鑒定和測試植物種類的技術逐漸成為很多國家的目標,很多研究表明EST-SSR標記應用于植物品種鑒定是可行的[35]。
轉錄組學技術的發(fā)展為植物系統(tǒng)學研究提供了新的技術手段,使植物的轉錄組研究進入到一個快速發(fā)展的階段。但在實際應用中,轉錄組學研究也面臨著一些問題,比如如何高效地挖掘功能基因。隨著生物信息學軟件的不斷開發(fā)與完善,蛋白組學及代謝組學等多組學時代到來,在進行植物系統(tǒng)學的研究時,有必要將轉錄組學技術與其他組學技術有機結合起來,合理分析,提供更科學和準確的結果。
[參考文獻]
[1] JUDD W S,李德株.植物系統(tǒng)學:中文版[J].3版.李德株,譯.生命世界,2012(12):98.
[2] 王飛,劉林波,高天歌,等.轉錄組學在牧草上的應用進展[J].草業(yè)科學,2019,36(2):135-146.
[3] YAN W,ZHAO W W,XV W T,et al.Advances in omics technology and application in food science research[J]. Biotechnology Bulletin,2011,21(11):26-32.
[4] LOCKHART D J,WINZELER E A.Genomics,gene expression and DNA arrays[J].Nature,2000,405(6788):827-836.
[5] 王躍,毛開云,王恒哲,等.轉錄組學測序技術應用與市場分析[J].生物產(chǎn)業(yè)技術,2017(5):11-17.
[6] VELCULESCU V E,ZHANG L,ZHOU W,et al. Characterization of the yeast transcriptome[J].Cell,1997,88(2):243-251.
[7] LOWE R,SHIRLEY N,BLEACKLEY M,et al.Transcriptomics technologies[J].Plos Computational Biology,2013(5):1005457.
[8] QIAN X,BA Y,ZHUANG Q,et al.RNA-seq technology and its application in fish transcriptomics[J].Omics:A Journal of Integrative Biology,2013,18(2):98.
[9] 祁云霞,劉永斌,榮威恒.轉錄組研究新技術:RNA-seq及其應用[J].遺傳,2011,33(11):1191-1202.
[10] WANG Z,GERSTEIN M,SNYDER M.RNA-seq:a revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2010,10(1):57-63.
[11] HELLER M J.DNA microarray technology:devices,systems,and applications[J].Annual Review of Biomedical Engineering,2002,4(1):129-153.
[12] CORLAN A D.Medline trend:automated yearly statistics of PubMed results for any query[J].Mendele,2017(4):27.
[13] MARRA M A,HILLIER L,WATERSTON R H.Expressed sequence tags—ESTablishing bridges between genomes[J]. Trends in Genetics Tig,1998,14(1):4.
[14] PUTNEY S D,HERLIH Y.Nature 302[J].Science,1983(2):718-721.
[15] 金基強.茶樹EST-SSR標記的建立及其應用研究[D].杭州:浙江大學,2006.
[16] EL-MEANAWY M A,BARATHAN S,HAYDEN P S,et al.Serial analysis of gene expression[M].Totowa:Humana Press,1995.
[17] FRED V R,F(xiàn)RANK B.Serial analysis of gene expression(SAGE)[J].Nature Protocols,2007,383(2):1743-1760.
[18] 張振乾,譚太龍,肖鋼,等.基因表達系列分析法(SAGE)的改進及其在植物功能基因組研究中的應用[J].基因組學與應用生物學,2009,28(6):1204-1210.
[19] 朱莉,常汝鎮(zhèn),邱麗娟.基因表達系列分析技術在植物基因表達分析中的應用[J].中國農業(yè)科學,2003(11):5-12.
[20] MEYERS B C,VU T H,TEJ S S,et al.Analysis of the transcriptional complexity of Arabidopsis thaliana by massively parallel signature sequencing[J].Biotechnol., 2004(2):22.
[21] WANG Z,GERSTEIN M,SNYDER M.RNA-seq:a revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2010,10(1):57-63.
[22] SU Z,F(xiàn)ANG H,HONG H,et al.An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era[J].Genome Biol.,2014(3):15.
[23] 王楚彪,盧萬鴻,林彥,等.轉錄組測序的發(fā)展和應用[J].桉樹科技,2018,35(4):27-33.
[24] 祁云霞,劉永斌,榮威恒.轉錄組研究新技術:RNA-seq及其應用[J].遺傳,2011(11):42-53.
[25] 劉培培,羅光明,柴華文,等.SSR標記技術在中藥鑒定中的應用[J].生物技術通報,2019,35(2):198-203.
[26] 蔣超,袁媛,劉貴明,等.基于EST-SSR的金銀花分子鑒別方法研究[J].藥學學報,2012,47(6):803-810.
[27] 馬慶華,李京璟,趙天田,等.基于EST-SSR標記的平歐雜種榛品種鑒定[J].植物遺傳資源學報,2017,18(5):952-959.
[28] 黎裕,李英慧,楊慶文,等.基于基因組學的作物種質資源研究:現(xiàn)狀與展望[J].中國農業(yè)科學,2015(17):52-72.
[29] 龍蕩.基于轉錄組測序大規(guī)模開發(fā)早實枳SSR標記[D].武漢:華中農業(yè)大學,2014.
[30] 龍妮.煙草屬野生種轉錄組比較分析[D].昆明:昆明理工大學,2016.
[31] 孫圣.基于SSR標記的血皮槭天然群體遺傳變異研究[D].南京:中國林業(yè)科學研究院,2014.
[32] 張?zhí)?核桃譜系地理學和轉錄組學遺傳標記開發(fā)研究[D].西安:西北大學,2016.
[33] 邢俊連.皂莢屬系統(tǒng)進化分析及SSR分子標記開發(fā)[D].合肥:安徽農業(yè)大學,2016.
[34] 李清瑩.火力楠種質資源遺傳多樣性研究[D].南京:中國林業(yè)科學研究院,2018.
[35] 黃少勇,張智俊,羅淑萍,等.山核桃EST-SSR引物的篩選及通用性分析[J].經(jīng)濟林研究,2013(3):16-21.
Research progress of transcriptional technology and its advances in plant phylogeny
Jiang Feitao1, Wang Shuping2, Qi Junsheng1, Xiong Chunxia1(1.Chongqing Three Gorges University, Chongqing 050024, China; 2.Animal, Plant and Food Inspection and Quarantine Technology Center of Shanghai Entry Exit Inspection and Quarantine Bureau, Shanghai 200000, China)
Abstract:As an important branch of systems biology, transcriptomics can reflect the expression of genes and their regulation in cells or tissues from the overall level, and has been applied to various research fields. The application of transcriptomics and transcriptomics in plant phylogeny is briefly described in this paper. Finally, the prospect of transcriptomics in plant phylogeny is prospected.
Key words:transcriptomics; plant taxonomy; molecular markers