摘要:【目的】為豐富血葉蘭轉(zhuǎn)錄組數(shù)據(jù)信息,以期幫助蘭科植物的功能基因挖掘?!痉椒ā勘驹囼?yàn)通過Illumina測序平臺對兩種葉色血葉蘭的葉片進(jìn)行轉(zhuǎn)錄組測序和生物信息學(xué)分析?!窘Y(jié)果】兩種葉色血葉蘭樣品各三個重復(fù)總計(jì)產(chǎn)出37.23 Gb Clean reads,共獲得97 089條Unigene序列,平均長度 1 038.76 bp,N50達(dá)到1 892 bp。將得到的 Unigene和8個公共數(shù)據(jù)庫進(jìn)行比較,31 095個 Unigene獲得注釋。其中29 730條Unigene在NR數(shù)據(jù)庫中獲得注釋,與鐵皮石斛的同源序列最多。與 GO數(shù)據(jù)庫進(jìn)行比對,23 871條Unigene在細(xì)胞組分、生物進(jìn)程和分子功能三大類別中獲得注釋。通過與 KOG數(shù)據(jù)庫的比對,14 791個 Unigene獲得注釋,這些基因的功能主要集中在三大功能類別:普通功能預(yù)測、蛋白的翻譯后修飾以及信號轉(zhuǎn)導(dǎo)。在兩個品系間的差異表達(dá)基因共5 791個。與暗紫色葉片相比,綠色葉片中3 120個基因的表達(dá)量升高,2 671個基因表達(dá)量降低。差異表達(dá)基因的KEGG富集結(jié)果表明,最顯著性富集的是植物與病原菌相互作用,其次是植物MAPK信號途徑和植物激素信號轉(zhuǎn)導(dǎo)途徑、光合作用-天線蛋白、還有苯丙烷類代謝途徑、類黃酮代謝途徑、卟啉和葉綠素代謝途徑?!窘Y(jié)論】研究結(jié)果將為深入發(fā)掘血葉蘭藥用植物的功能基因研究奠定一定的基礎(chǔ)。
關(guān)鍵詞:血葉蘭;轉(zhuǎn)錄組;基因注釋;葉色
中圖分類號:S682.31" " " " " " " " " " "文獻(xiàn)標(biāo)識碼:A" " " " " " " " " " " "文章編號:2095-5774(2024)04-0285-11
Transcriptome Analysis of Ludisia discolor with two Leaf Colors
Wu Yingxiang1,Yang Junjie2,ChenYunyun3,Cai Kunxiu2,Chen Xiande3,Zhang Tianxiang2,
Wu Sihao2,F(xiàn)u Wenqun3*,Zheng Tao2*
(1 Qiangyuan Agricultural Science and Technology Extension Service Center,Qingyuan,Guangdong 511518,China;
2 Fujian Institute of Tropical Crops,F(xiàn)ujian Zhangzhou,363001,China;
3 Minnan Normal University,School of Biological Science and Biotechnology,Zhangzhou,F(xiàn)ujian 363000,China)
Abstract:【Objective】To enrich transcriptome data of Ludisia discolor in order to assist in its functional gene mining.【Method】Leaves of two kinds of L.discolor cultivars with different leaf colors were sequenced by Illumina Hiseq 2 000 and further analyzed by bioinformatics.【Result】37.23 Gb clean reads were generated from three replicates of L. discolor with two leaf colors,which was the de novo assembled into 97 089 unigenes with a mean length of 1 038.76bp,N50 of 1 892 bp. 31 095 unigenes were annotated against 8 prominent bioinformatics databases. Within the NR database,a total of 29 730 unigenes were primarily annotated from L. discolor;with the most homologous sequences to Dendrobium officinale. 23 871 unigenes were annotated in GO database and were divided into three categories:cellular component,biological process and molecular function. There were 14 791 unigenes annotated in KOG function categories,which mainly focused on general function prediction,posttranslational modification and signal transduction. A total of 5 791 DEGs were screened out from‘XGH’vs‘BX’. Compared with the dark-purple leaves,the expression of 3 120 genes increased while the expression of 2 671 genes decreased in green leaves. KEGG enrichment analysis showed that the differentially expressed genes were most significantly enriched in plant-pathogen interaction;the secondary enriched was MAPK signaling pathway and plant hormone signal transduction,photosynthesis-antenna protein,and the other pathway including phenylpropanoid biosynthesis,flavonoid biosynthesis,porphyrin and chlorophyll metabolism. 【Conclusion】This investigation furnished scientific support for study of functional genes in L. discolor as medicinal plant.
Key words:Ludisia discolor L.;Transcriptome;Gene annotation;Leaf color
血葉蘭(Ludisia discolor(Ker-Gawl.)A. Rich.)
為蘭科(Orchidaceae)血葉蘭屬(Ludisia discolor)的多年生常綠草本植物,又名石蠶或石上藕或公石松,具有觀賞價值和藥用價值,是閩南民間珍稀中草藥。在中國的海南、福建和越南、馬來西亞等國家地區(qū)都有種植[1-2]。血葉蘭‘西貢紅’是目前市場主要流通的品種,屬于原生種,葉片顏色為暗紫色。前期人工選育過程中獲得了一株穩(wěn)定遺傳的綠葉突變體單株,經(jīng)組培擴(kuò)繁后形成株系,命名為‘碧璽’,該株系葉片從一開始就表現(xiàn)淺綠,且整個生長期都保持這一特性,綠葉是其重要的觀賞特征。目前關(guān)于血葉蘭的研究主要集中在藥效[3-5]、藥用成分[6-8]、觀賞價值分析[9]、組織培養(yǎng)[10-13]、形態(tài)結(jié)構(gòu)和遺傳多樣性[14]、黃酮類合成功能基因[15]等方面,鮮有人對血葉蘭的葉色進(jìn)行研究,制約了血葉蘭不同葉色觀賞品種的選育。
轉(zhuǎn)錄組RNA-Seq測序技術(shù)能夠分析植物整體基因的轉(zhuǎn)錄特征,是研究彩葉植物呈色機(jī)制的一種有效手段,此技術(shù)可以分析植物不同葉色的差異表達(dá)基因進(jìn)而挖掘關(guān)鍵候選基因[16]。陳燕等[17]通過RNA-seq測序技術(shù),篩選出10個與類黃酮相關(guān)的基因,為研究杜梨葉色分子機(jī)制提供理論依據(jù)。武悅等[18]通過RNA-seq測序技術(shù)對瞿麥幼苗葉片的轉(zhuǎn)錄本進(jìn)行測序,可見RNA-seq測序已廣泛應(yīng)用于植物葉片呈色機(jī)制的分子機(jī)制研究中。由于目前關(guān)于血葉蘭葉片顏色變化的研究尚未見報道,有必要從分子層面探究血葉蘭葉片的呈色機(jī)制,為其不同葉色品種選育奠定基礎(chǔ)。鑒于此,本研究以暗紫色品系‘西貢紅’和綠葉突變體‘碧璽’的葉片為材料,采用RNA-Seq測序技術(shù)構(gòu)建轉(zhuǎn)錄組數(shù)據(jù)庫,將得到的Unigene與8個公共數(shù)據(jù)庫比對后進(jìn)行生物信息學(xué)分析,分析、確定葉色變化過程中的差異表達(dá)基因,以期為血葉蘭呈色機(jī)制的研究提供參考。
1 材料與方法
1.1 試驗(yàn)材料
2023年3月上旬于福建省熱帶作物科學(xué)研究所血葉蘭種質(zhì)資源圃中,采集移栽6個月左右健康的血葉蘭暗紫色‘西貢紅’和綠葉突變體‘碧璽’的葉片,每種重復(fù)3次,用錫箔紙包住葉片,快速放于液氮中保存,用于總RNA提取。
1.2 試驗(yàn)方法
1.2.1總RNA提取及質(zhì)量檢測
按照 Trizol RNA 試劑盒(Promega,USA)分別提取‘西貢紅’(XGH)和‘碧璽’(BX)葉片組織的總RNA,并利用超微量分光光度計(jì)檢測樣品中RNA的質(zhì)量、含量和完整性。
1.2.2 cDNA文庫構(gòu)建
以符合條件的 mRNA為模板,采用6-堿基隨機(jī)引物,AMPure XP bead核酸純化試劑盒,PCR擴(kuò)增等方法,制備 cDNA庫。
1.2.3 文庫質(zhì)控及測序
利用q-PCR技術(shù),精確測定 cDNA文庫中的有效濃度(文庫有效濃度gt;2 nmol/L)。庫檢查通過后,委托北京百邁客生物科技有限公司利用 Illumina技術(shù)對其進(jìn)行RNA-seq高通量測序。
1.2.4 De novo拼接和注釋
通過篩選和測序,可以獲取Raw reads,獲得Clean reads,De novo拼接是在 Trinity軟件[35]中執(zhí)行的。利用 NCBI數(shù)據(jù)庫中的 BLAST將拼接完成的Unigene與NCBI無冗余蛋白質(zhì)序列數(shù)據(jù)庫NR(NCBI Non-redundant Database)、Swiss-Prot數(shù)據(jù)庫、 KOG(euKaryotic Orthologous Groups)數(shù)據(jù)庫和 KEGG(Kyotoencyclopedia of Genes and Genomes)數(shù)據(jù)庫、COG (Clusters of Orthologous Groups of proteins)(E≤1e-5)數(shù)據(jù)庫、TrEMBL數(shù)據(jù)庫進(jìn)行比對和注釋。利用 HMMER3.0package與Protein family(Pfam)進(jìn)行比對(hmmscane-value≤1e-2)。利用Blast2go(http://www.blast2go.com/b2ghome)軟件和WEGO軟件進(jìn)行GO(Gene Ontology)注釋和分類統(tǒng)計(jì)。
1.2.5差異基因表達(dá)分析
利用高通量測序技術(shù)對‘西貢紅’和‘碧璽’6個樣品葉片的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比較分析。使用DESeq R軟件包(1.10.1)對血葉蘭‘西貢紅’和‘碧璽’葉片進(jìn)行組間的差異表達(dá)分析,用FPKM(fragments per kilobase of transcript per million fragments mapped)值表示基因的表達(dá)量,以兩組間差異倍數(shù)(fold change,F(xiàn)C)的對數(shù)值的絕對值即| log2FC |≥1,且FDR(1 discovery rate,F(xiàn)DR)lt;0.05作為篩選標(biāo)準(zhǔn),滿足此篩選標(biāo)準(zhǔn)的基因即為差異表達(dá)基因(differential gene expression,DEGs)。將篩選到的DEGs分別在KEGG數(shù)據(jù)庫進(jìn)行比對,對DEGs進(jìn)行KEGG代謝通路富集分析。
2 結(jié)果與分析
2.1 血葉蘭轉(zhuǎn)錄組測序
為了提高物種低表達(dá)水平轉(zhuǎn)錄本的測序準(zhǔn)確性,對血葉蘭的6份樣品進(jìn)行轉(zhuǎn)錄組測序,獲得平均 37.23 Gb Clean reads,各樣品Clean Data均達(dá)到5.81 Gb,Q20、Q30的堿基百分比分別在97%、93%以上,GC堿基含量介于45.95%~46.91%(表1),研究結(jié)果顯示,基于高通量測序技術(shù)的血葉蘭轉(zhuǎn)錄組測序數(shù)據(jù)具有很高的質(zhì)量,Clean reads質(zhì)量合格,可以繼續(xù)進(jìn)行后續(xù)的基因拼接。
2.2 數(shù)據(jù)拼接、組裝與注釋
由于血葉蘭沒有可供參考的基因組數(shù)據(jù),通過Trinity軟件對獲取的測序數(shù)據(jù)進(jìn)行Denovo組裝,總共獲得了254 585條轉(zhuǎn)錄本,這些轉(zhuǎn)錄本的總序列長度達(dá)343 971 647 bp,平均每條轉(zhuǎn)錄本的長度為1 351.11 bp。其中,N50值為2 145 bp。進(jìn)一步地,從這些轉(zhuǎn)錄本中提取了97 089個Unigene片段,它們的總長度為100 851 717 bp,平均每個Unigene的長度為1 038.76 bp。Unigene的N50值為1 892 bp,這表明超過50%的Unigene長度超過了這一標(biāo)準(zhǔn),說明數(shù)據(jù)組裝效果較好(表2)。
通過BLAST將Unigene與8個公共數(shù)據(jù)庫進(jìn)行比對,共31 095 Unigene獲得注釋,占全部 Unigene的30.03%,不同數(shù)據(jù)庫注釋數(shù)量差別較大(表3)。獲得TrEMBL數(shù)據(jù)庫注釋的Unigene有29 786條,所占比例(30.68%)最大,其它注釋所占比例從大到小分別是 NR數(shù)據(jù)庫(30.62%)、 GO數(shù)據(jù)庫(24.59%)、 KEGG數(shù)據(jù)庫(18.19%)、Pfam數(shù)據(jù)庫(16.07%)、Pfam Swiss-Prot數(shù)據(jù)庫(15.57%)、KOG數(shù)據(jù)庫(15.23%)。獲得COG數(shù)據(jù)庫注釋的Unigene最少,只有5 274條。Unigene注釋結(jié)果顯示,長度為300~1 000 bp的有9 903條,占10.20%;長度大于1 000 bp 的Unigene18 012條,占18.55%(表3)。
2.3 血葉蘭Unigene的NR分類
將血葉蘭的Unigene與NR數(shù)據(jù)庫進(jìn)行比對,29 730條獲得注釋,與鐵皮石斛(Dendrobium catenatum)的同源序列最多,注釋比占38.06%;其次為小蘭嶼蝴蝶蘭(Phalaenopsis equestris)注釋比為12.75%;深圳擬蘭(Apostasia shenzhenica)注釋比為5.82%;其他有一定匹配度的物種分別是葡萄(Vitis vinifera),占比 0.53%;玉米(Zea mays),占比2.19%;土瓶草(Cephalotus follicularis),占比1.23%;油棕(Elaeis guineensis),占比0.95%;鳳梨(Ananas comosus),占比0.94%;扁桃(Prunus dulcis),占比0.86%;紅車軸草(Trifolium pratense),占比0.85%;其他物種占比34.12%(圖 1)。
2.4血葉蘭Unigene 的GO分類
根據(jù)NR數(shù)據(jù)庫中的注釋結(jié)果,再利用WEGO,對所有比對的 23 871條Unigene按功能分類,將其劃分為3大類41種功能組,即:細(xì)胞組分(18 890條)、分子功能(27 660條)和生物進(jìn)程(36 905條)。細(xì)胞組分類別中包含4種功能組, 其中定位于細(xì)胞質(zhì)基因比例為34.39% (6 496條)、定位于細(xì)胞器和細(xì)胞膜基因占比56.95% (10 757條)。在分子功能的15種功能組中,最多的是具有結(jié)合功能的14 370種(占比51.95%),具有催化作用的有10 716種(占比38.74%)。在生物進(jìn)程類別的22種功能性組中,12 972條(占比35.15%)屬于代謝過程,13 386條(占比36.27%)屬于細(xì)胞進(jìn)程(圖 2)。
2.5 血葉蘭Unigene的KOG分類
通過與KOG數(shù)據(jù)庫的比對,發(fā)現(xiàn)了14,791條 Unigene,共注釋25種功能分類,高豐富度的基因類別為普通功能預(yù)測,占40.59%(6 004條)。其次是翻譯后修飾、蛋白轉(zhuǎn)運(yùn)類群及信號傳導(dǎo)機(jī)制類群,分別占 8.35%(1 235條)和 6.84%
(1 012條)。而 Unigene中僅有極少數(shù)的細(xì)胞活性被注釋(圖 3)。
2.6 差異表達(dá)基因的鑒定
為了尋找血葉蘭葉片呈色相關(guān)的候選基因,對測序后得到的基因進(jìn)行差異表達(dá)分析。結(jié)果表明,紅色葉片‘西貢紅’和綠色葉片‘碧璽’品系間共有5,791個差異表達(dá)基因(Padjlt; 0.05,| log2Fold Change | gt;1)。其中,與紅色葉片‘西貢紅’相比,綠色葉片‘碧璽’中表達(dá)量增加的基因有3 120個,而表達(dá)量降低的基因有
2 671個 (圖4a,4b)。
2.7差異表達(dá)基因的KEGG富集分析
將血葉蘭unigene 與KEGG 數(shù)據(jù)庫進(jìn)行比對,共有18 341條 unigene 參與了136個代謝通路,占總unigene的18.89%,分為五大代謝通路類型,分別是細(xì)胞進(jìn)程、新陳代謝、生物系統(tǒng)、基因信息進(jìn)程、環(huán)境信息進(jìn)程,參與新陳代謝途徑unigene的數(shù)量最多,其次為基因信息進(jìn)程代謝途徑。本研究集中葉色形成相關(guān)因素富集分析,其中,共有64條unigene參與黃酮類化合物生物合成代謝通路,有58條unigene 參與胡蘿卜素生物合成代謝通路,有14條unigene參與黃酮和黃酮醇生物合成代謝通路,有213條unigene參與苯丙烷生物合成代謝通路,有110條unigene參與光合作用通路,有43條unigene參與光合作用-天線蛋白通路,有64條unigene參與卟啉和葉綠素代謝通路。
差異表達(dá)基因的 KEGG 富集分析能夠揭示相關(guān)代謝途徑的變化。紅色葉片‘西貢紅’和綠色葉片‘碧璽’差異表達(dá)的基因中共有123條被注釋到KEGG中,本研究中只列舉富集顯著性最可靠的前20個通路(圖5)。最顯著性富集的是植物與病原菌相互作用(plant-pathogen interaction),其次是植物MAPK信號途徑(mitogen-activated protein kinase,MAPK)和植物激素信號轉(zhuǎn)導(dǎo)途徑(plant hormone signal transduction),光合作用-天線蛋白,還有苯丙烷類代謝途徑、類黃酮代謝途徑、卟啉和葉綠素代謝途徑等。
3 討論
我們利用 llumina高通量測序方法,共檢測到了血葉蘭97 089個 Unigene,平均長度1 038.76 bp;
并通過對 Unigene全長、GC堿基含量、Q20及Q30分析,測序結(jié)果相對較好。Unigene的注釋資料有助于研究血葉蘭屬的基因功能。雖然還有部分血葉蘭Unigene沒有被完全解析,但是其功能基因鑒定和分子標(biāo)記位點(diǎn)信息,也為進(jìn)一步研究其基因資源和類群的遺傳多樣性奠定了基礎(chǔ)。經(jīng) NR數(shù)據(jù)庫比對,29 730條Unigenes獲得注釋,與鐵皮石斛匹配度較高,究其原因可能是二者同屬蘭科蘭亞科。與陳育青等[15]的測序結(jié)果有所差異,已報道的研究結(jié)果公石松(血葉蘭的別名)與油棕的同源性較高,本研究中的測序結(jié)果與油棕只有0.95%的同源性,造成這一差異的原因,可能是品種不同。蘭科物種基因組信息匱乏,公共基因組數(shù)據(jù)庫中缺乏完整的信息,且未發(fā)現(xiàn)新的獨(dú)特的功能信息,這是導(dǎo)致該物種與其它物種基因組不完全吻合的重要因素。
葉色呈色是一個十分復(fù)雜的生物學(xué)過程,它不僅受環(huán)境因子的影響,而且還與植物自身的色素合成代謝有關(guān)。近年來,高通量轉(zhuǎn)錄組測序技術(shù)的發(fā)展,為了解植物葉片呈色機(jī)理的研究提供了幫助[19]。但大多數(shù)蘭花物種的遺傳信息尚不清楚。轉(zhuǎn)錄組學(xué)是指一個器官某一具體生長階段中全部轉(zhuǎn)錄本的總和,它可以從某種意義上彌補(bǔ)基因組信息缺失的缺陷,從而可以從整體水平上解析基因之間的分子調(diào)控網(wǎng)絡(luò)及調(diào)節(jié)機(jī)制[20-21],綠色突變體‘碧璽’是研究葉色形成機(jī)制的良好材料。本研究中,通過轉(zhuǎn)錄組分析鑒定出5,791個在暗紫色品系‘西貢紅’和綠色突變體‘碧璽’葉片中差異表達(dá)的基因,通過對這些差異表達(dá)基因的篩選,發(fā)現(xiàn)差異表達(dá)基因被顯著富集到植物與病原菌相互作用,以及植物MAPK信號途徑、光合作用-天線蛋白、苯丙烷生物合成途徑、類黃酮合成途徑、卟啉和葉綠素代謝途徑等,為解析血葉蘭葉色形成分子機(jī)制提供了一定的科學(xué)依據(jù)。
參考文獻(xiàn):
[1]趙國平,戴慎,陳仁壽. 中藥大辭典(上冊)[M]. 上海:上??茖W(xué)技術(shù)出版社,2006:1281-1282.
[2]沈賢娟,黃澤豪. 民間藥公石松的文獻(xiàn)考證[J]. 中藥材,2015,38(3):629-631.
[3]石鶴坤,邱韻玲,陳開杰,等. 公石松抗運(yùn)動性疲勞的活性部位篩選[J]. 中國藥房,2016,27(10):1343-1346.
[4]石鶴坤,陳開杰,林小鳳,等. 公石松水提液對小鼠運(yùn)動能力與血清乳酸、尿素氮及肝糖原的影響[J]. 藥學(xué)實(shí)踐雜志,2016,34(5):399-402.
[5]李秋靜,陳育青,林美珍,等.公石松提取液抗氧化研究[J].中國中醫(yī)藥現(xiàn)代遠(yuǎn)程教育,2021,19(10):156-159.
[6]李秋靜,謝偉容,黃建軍,等.響應(yīng)面法提取公石松總黃酮工藝優(yōu)化研究[J].中國藥師,2018,21(7):1141-1145.
[7]盧彩燕. 血葉蘭與金線蓮的糖分組成及含量比較[J].東南園藝,2019,7(4):16-19.
[8]沈穎,陳惠琴,吳妃,等.血葉蘭化學(xué)成分及其生物活性研究[J/OL]. 廣西植物,[2023-12-27],https://link.cnki.net/urlid/45.1134.q.20231225.1043.004.
[9]何叡穎. 錦葉玉花血葉蘭[J]. 中國花卉盆景,2009(4):9.
[10]蘇建睦,朱惠,黃肇宇,等. 血葉蘭叢生芽增殖及生根研究[J]. 玉林師范學(xué)院學(xué)報,2017,38(5):90‐92,104.
[11]蔡坤秀,盧彩燕,鄭濤.公石松組培初代培養(yǎng)研究[J].福建熱作科技,2018,43(3):26-27.
[12]朱育端.公石松組培技術(shù)的建立[J].寧德師范學(xué)院學(xué)報(自然科學(xué)版),2019,31(4):395-398.
[13]陳耀麗,尤燕平,鐘云芳,等.海南黎藥血葉蘭的無菌播種及高效繁育技術(shù)初探[J].熱帶林業(yè),2023,51(1):40-45.
[14]鄭濤,鄒龍運(yùn),蔡坤秀,等.基于葉綠體DNA RPS16序列的血葉蘭多樣性分析[J].福建熱作科技,2022,47(2):1-5.
[15]陳育青,陳榮珠,鄒毅輝,等.閩草藥公石松轉(zhuǎn)錄組分析及黃酮類合成功能基因的挖掘[J].分子植物育種,2022,20(14):4654-4664.
[16]舒福興,黃瑤,賈啟,等. 胡蘿卜果膠桿菌侵染下半夏轉(zhuǎn)錄組中SSR位點(diǎn)信息分析[J]. 種子,2023,42(2):116-120.
[17]陳燕,郭聰,王瑩,等.杜梨葉片轉(zhuǎn)錄組分析[J].江蘇農(nóng)業(yè)科學(xué),2022,50(3):58-67.
[18]武悅,單飛彪,閆文芝,等. 基于高通量測序的瞿麥葉片轉(zhuǎn)錄組分析[J]. 分子植物育種,2022,20(5),1522-1529.
[19]Zhang G Q,Liu K W,Li Z,et al. The Apostasia genome and the evolution of orchids[J]. Nature,2017,549 :379-383.
[20]Zhang G Q,Xu Q,Bian C,et al. The Dendrobium catenatum Lindl. genome sequence provides insights into polysaccharide synthase,floral development and adaptive evolution[J]. Scientific Reports,2016,6:19029-19039.
[21]Sawettalake N,Bunnag S,Wang Y W,et al. DOAP1 promotes flowering in the orchid Dendrobium Chao Praya smile[J]. Frontiers in Plant Science,2017,8:400-417.
(責(zé)任編輯:馮" " 新)