趙雪艷 李思鋒 柏國(guó)清 李為民
(陜西省西安植物園,陜西省植物研究所,陜西省植物資源保護(hù)與利用工程技術(shù)研究中心,西安 710061)
百合屬(Lilium)是百合科(Liliaceae)百合族(Lilieae)中一個(gè)具有重要經(jīng)濟(jì)價(jià)值和系統(tǒng)發(fā)育研究意義的屬。百合是多年生的球根類草本植物,許多百合種和品種花姿百態(tài)、芳香怡人、花色豐富,是世界上十大切花之一,也是盆栽、園林綠化和點(diǎn)綴庭院的名貴花卉[1],有關(guān)花發(fā)育相關(guān)基因的研究具有重要的意義。另外,百合中含有豐富的營(yíng)養(yǎng)物質(zhì),如蛋白質(zhì)、淀粉、葡甘露聚糖和膳食纖維等,同時(shí)也含有多種生物活性化合物,可食用有的種亦可藥用,具有較好的開(kāi)發(fā)利用價(jià)值和發(fā)開(kāi)前景[2]。
全球百合屬植物大約有110種,我國(guó)野生百合資源最為豐富,是百合屬植物的分布中心之一,約有55 種18 變種,其中35 種15 變種為我國(guó)特有種。細(xì)葉百合(L.pumilium)又名山丹,其花下垂,花被片反卷,無(wú)斑點(diǎn)或有少數(shù),花朵嬌艷,是著名的野生藥用植物,并具極高的觀賞價(jià)值,是重要的觀賞性花卉。細(xì)葉百合在寒冷的條件下可以越冬,是百合抗性育種的重要親本[3]。中國(guó)藥典規(guī)定藥材百合的來(lái)源為百合科百合屬植物百合(L. brownii var.viridulum)或細(xì)葉百合的肉質(zhì)鱗葉。具有養(yǎng)陰潤(rùn)肺,清心安神的功效。主治陰虛燥咳,勞嗽咳血,陰虛有熱之失眠心悸及百合病心肺陰虛內(nèi)熱證[4]。然而,張衛(wèi)等通過(guò)系統(tǒng)的本草考證研究認(rèn)為百合科植物野百合(L.brownie)及其變種百合為中國(guó)古代藥用百合的正品[5]。卷丹(L.lancifolium)是我國(guó)藥食兼用百合品種,具有適應(yīng)性強(qiáng)、抗病和耐寒等優(yōu)勢(shì),可在百合病害高發(fā)地區(qū)推廣種植[6]。川百合(L. davidii)花色艷麗,橙黃色且有紫黑色斑點(diǎn),花被片極度反卷,其鱗莖可食用,具有優(yōu)良的觀賞價(jià)值和較好的食用價(jià)值,并且其抗病性強(qiáng),是良好的抗性育種材料[7]。野百合是我國(guó)特有種,花型大而美麗,較好的抗逆性與觀賞利用價(jià)值。本團(tuán)隊(duì)前期采用高通量測(cè)序技術(shù)平臺(tái)對(duì)野百合進(jìn)行轉(zhuǎn)錄組測(cè)序,經(jīng)過(guò)組裝共獲得47 605個(gè)unigenes。
不同物種之間的比較轉(zhuǎn)錄組研究可以用于快速進(jìn)化基因以及適應(yīng)性相關(guān)基因的研究。Ai等對(duì)11 種報(bào)春苣苔屬植物進(jìn)行比較轉(zhuǎn)錄組學(xué)分析,研究了11 種報(bào)春苣苔屬植物的系統(tǒng)進(jìn)化、親緣關(guān)系及適應(yīng)性相關(guān)基因[8]。并且對(duì)牛耳朵和黃花牛耳朵的比較轉(zhuǎn)錄組分析,研究?jī)蓚€(gè)物種在巖溶環(huán)境中的分子適應(yīng)機(jī)制,尋找出與巖溶環(huán)境適應(yīng)有關(guān)的19 對(duì)功能基因[9]。趙建花通過(guò)對(duì)地黃屬5 個(gè)種的轉(zhuǎn)錄組數(shù)據(jù)分析研究地黃屬植物5 個(gè)物種間的系統(tǒng)親緣關(guān)系,發(fā)現(xiàn)二倍體裂葉地黃處在地黃屬的基部,二倍體天目地黃和湖北地黃構(gòu)成姐妹類群,四倍體地黃和茄葉地黃聚成姐妹類群[10]。目前,對(duì)百合屬植物的研究主要集中在品種培育、繁殖技術(shù)、栽培、化學(xué)成分以及資源保護(hù)方面。目前只有少數(shù)關(guān)于百合遺傳結(jié)構(gòu)和系統(tǒng)進(jìn)化方面的研究[11~13]。傳統(tǒng)的分類學(xué)研究方法很難解決百合屬物種間的系統(tǒng)發(fā)育問(wèn)題,揭示百合屬物種在進(jìn)化過(guò)程中基因組結(jié)構(gòu)是否發(fā)生變化、種間基因流的變化規(guī)律、潛在的選擇作用等需要基因組層面的研究。本文通過(guò)對(duì)秦嶺地區(qū)的百合屬4個(gè)物種(細(xì)葉百合、川百合、卷丹和百合)的花進(jìn)行轉(zhuǎn)錄組測(cè)序,分析花發(fā)育相關(guān)基因。并結(jié)合本團(tuán)隊(duì)前期的野百合轉(zhuǎn)錄組數(shù)據(jù),分析篩選5種百合屬植物的直系同源基因及正選擇壓力相關(guān)基因,并利用獲取的直系同源基因構(gòu)建百合屬物種的進(jìn)化關(guān)系,為進(jìn)一步研究百合花的發(fā)育和調(diào)控以及百合屬植物進(jìn)化提供依據(jù)。
在陜西朱雀國(guó)家森林公園采集4種百合屬(細(xì)葉百合L.pumilum;川百合L.davidii;卷丹L.lanci?folium;百合L. brownii var. viridulum)健康植株的花。迅速放入液氮中速凍,隨后放在-80℃冰箱中保存。
采用Trizol 法提取細(xì)葉百合、川百合、卷丹和百合花中的總RNA。經(jīng)質(zhì)量檢測(cè)合格后,用帶有Oligo(dT)的磁珠富集mRNA。然后將mRNA 分裂成短片段,并反轉(zhuǎn)錄合成第一鏈cDNA,隨后合成另一條鏈,從而純化得到的雙鏈cDNA。進(jìn)而修復(fù)雙鏈cDNA 的末端并在其末端加上poly(A)尾巴并連接Illumina 測(cè)序接頭。制備測(cè)序文庫(kù)。委托廣州基迪奧生物技術(shù)公司采用Illumina 雙端測(cè)序平臺(tái)對(duì)4 種百合屬植物的花器官進(jìn)行測(cè)序。將獲得的原始數(shù)據(jù)過(guò)濾后得到高質(zhì)量的讀序,用Trinity和TGICL 按照默認(rèn)參數(shù)對(duì)得到的高質(zhì)量讀序進(jìn)行從頭組裝,得到unigene。
為獲得4 種百合屬植物花的unigene 功能信息,將測(cè)序得到的unigene 與公共數(shù)據(jù)庫(kù)(Nr、Swiss-Prot、KOG、GO、KEGG)進(jìn)行相似性比對(duì)以獲得其基因功能。隨后結(jié)合野百合的轉(zhuǎn)錄組數(shù)據(jù)對(duì)百合屬5 種植物(野百合、細(xì)葉百合、川百合、卷丹和百合)unigene的功能注釋結(jié)果進(jìn)行比較,并且分析花發(fā)育相關(guān)基因。
首先使用transdecoder 軟件預(yù)測(cè)各物種Unige?ne 中的CDS 區(qū)域,然后利用OrthoMCL 對(duì)預(yù)測(cè)所得的5 種百合屬植物的CDS 序列進(jìn)行直系同源基因搜索,從中篩選出一對(duì)一的直系同源基因[14]。然后用paml-codeml 計(jì)算直系同源基因的非同義替換(Ka),同義替換率(Ks)值,并計(jì)算Ka/Ks 值[15],進(jìn)而篩選出受正選擇作用的基因。
利用GOseq[16]的GO 基因富集方法對(duì)受到正選擇的直系同源基因(Ka/Ks>1)進(jìn)行基因分類富集。另外,對(duì)受到正向選擇的直系同源基因進(jìn)行Pathway 富集分析[17],尋找受到正向選擇的直系同源基因相對(duì)于所有注釋的基因顯著富集的pathway。
采用Illumina HiSeq 2500測(cè)序技術(shù)對(duì)百合屬4種植物(細(xì)葉百合L.pumilum;川百合L.davidii;卷丹L. lancifolium;百合L. brownii var. viridulum)的花進(jìn)行轉(zhuǎn)錄組測(cè)序。獲得的轉(zhuǎn)錄組原始數(shù)據(jù)已上傳到NCBI數(shù)據(jù)庫(kù)(SRA編號(hào):SRP253797)。
使用Trinity 軟件對(duì)所有reads 進(jìn)行組裝,其中,在細(xì)葉百合中共獲得44 565個(gè)unigene,序列平均長(zhǎng)度為701 bp;在川百合中共獲得51 413 個(gè)unigene,序列平均長(zhǎng)度為719 bp;在卷丹中共獲得41 638個(gè)unigene,序列平均長(zhǎng)度為688 bp;在百合中共獲得44 716個(gè)unigene,序列平均長(zhǎng)度為737 bp(見(jiàn)表1)。細(xì)葉百合、川百合、卷丹、百合組裝的unigene的N50長(zhǎng)度分別為1 066、1 149、1 017和1 183 bp。
為了獲得本研究中4 種百合屬植物花的基因功能信息,分別將4 個(gè)物種獲得unigene 序列與公共數(shù)據(jù)庫(kù)(GO、Nr、Swiss-Prot、KOG、KEGG)進(jìn)行比對(duì)(E 值<1E-5)以及基因的功能注釋。5 種植物的unigene在上述公共數(shù)據(jù)庫(kù)進(jìn)行注釋結(jié)果顯示細(xì)葉百合、川百合、卷丹和百合中能夠得到注釋的基因的百分比為分別為55.23%、61.54%、56.96% 和48.93%(見(jiàn)表2)。沒(méi)有匹配到的基因比較多,這可能是由于目前百合屬植物沒(méi)有基因組信息。
表1 百合屬4種植物的測(cè)序結(jié)果統(tǒng)計(jì)信息Table 1 Statistical information for transcriptome sequencing of four species of Lilium
表2 百合屬5種植物轉(zhuǎn)錄組注釋信息Table 2 Annotation information of five species of Lilium
GO 注釋結(jié)果顯示細(xì)葉百合、川百合、卷丹和百合分別有6 785、7 398、6 475以及7 360條unige?ne序列得到注釋結(jié)果。GO注釋的結(jié)果主要分為3大類:生物過(guò)程、細(xì)胞組分和分子功能。結(jié)果顯示4種植物轉(zhuǎn)錄組的GO注釋結(jié)果相似。在生物過(guò)程功能類別中代謝過(guò)程和細(xì)胞過(guò)程組分中注釋的基因數(shù)目最多;在細(xì)胞組分類別中,注釋最多的基因歸類到細(xì)胞和細(xì)胞組分類別中;而在分子功能類別中,注釋最多的功能類別是催化活性和結(jié)合(見(jiàn)圖1)。這和前期關(guān)于野百合的基因的GO 注釋結(jié)果相似。
將本實(shí)驗(yàn)4種百合屬物種得到的unigene 序列分別與KOG 數(shù)據(jù)庫(kù)進(jìn)行比對(duì)進(jìn)而預(yù)測(cè)其功能,并和野百合的KOG 注釋比較分析。結(jié)果顯示,在25個(gè)功能類別中,“一般功能預(yù)測(cè)”類別中的unigene在5種百合屬植物都是最多,其次是“翻譯后修飾,蛋白質(zhì)轉(zhuǎn)運(yùn)和分子伴侶”“信號(hào)轉(zhuǎn)導(dǎo)和機(jī)制”以及“RNA的處理和修飾”。在5個(gè)物種均是只有少數(shù)unigene序列注釋到“細(xì)胞運(yùn)動(dòng)”這一類別中(見(jiàn)圖2)。
百合屬植物是重要的觀花植物,花是百合重要的經(jīng)濟(jì)性狀。通過(guò)對(duì)百合屬植物花轉(zhuǎn)錄組數(shù)據(jù)的注釋和分析,共鑒別到13個(gè)花發(fā)育相關(guān)基因,包括MADS-box 基因、AGL 類基因和LIM 類基因等(見(jiàn)表3)。
利用保守的單拷貝同源基因序列比對(duì)后,采用MEGA 構(gòu)建NJ 樹(shù),其中野百合和細(xì)葉百合聚為一類,卷丹和百合聚為一類,而川百合單獨(dú)為一類(見(jiàn)圖3)。本研究中得到的直系同源基因序列可以用于開(kāi)發(fā)SSR 位點(diǎn),為百合屬的遺傳標(biāo)記開(kāi)發(fā)提供資源。
表3 鑒別的花發(fā)育相關(guān)的基因Table 3 Identified genes involved in the development of flower
通過(guò)orthomcl analysis 分析,在5 種百合屬植物中共得到9440 對(duì)單拷貝直系同源基因,計(jì)算這些直系同源基因的非同義替換(Ka)、同義替換率(Ks)、Ka/Ks。且數(shù)據(jù)經(jīng)過(guò)嚴(yán)格過(guò)濾后,共有8 247對(duì)直系同源基因被確定,其中32 對(duì)直系同源基因的Ka/Ks>1,表明這些基因受到了強(qiáng)烈的正向選擇;355 對(duì)直系同源基因的0.5 對(duì)5 種百合屬植物的正選擇基因進(jìn)行GO 基因功能富集分析發(fā)現(xiàn)正向選擇的基因功能在生物過(guò)程(Biological process)分類中主要集中在代謝過(guò)程(Metabolic process)上,在細(xì)胞組分(Cellular component)分類中主要集中在細(xì)胞器(organelle)、細(xì)胞(Cell)、細(xì)胞部分(Cell part),而在分子功能(Molecular function)分類中則主要集中在結(jié)合活性(Binding)、催化活性(Catalytic activity)上。強(qiáng)烈正選擇基因的KEGG 富集的結(jié)果發(fā)現(xiàn),在5種百合屬植物中,代謝途徑、萜類骨架的生物合成、苯基丙酸類生物合成以及植物-病原體的相互作用等通路相關(guān)的基因受到了比較強(qiáng)的正選擇作用(見(jiàn)表4)。 目前Illumina 二代測(cè)序技術(shù)已經(jīng)成為獲取無(wú)參考基因組的物種基因數(shù)據(jù)的一種有效方法,廣泛應(yīng)用于抗性和活性成分基因的挖掘以及分子標(biāo)記的開(kāi)發(fā)應(yīng)用[18]。不同近緣物種的轉(zhuǎn)錄組測(cè)序分析可以預(yù)測(cè)物種的選擇作用以及適應(yīng)性進(jìn)化。本研究通過(guò)二代轉(zhuǎn)錄組測(cè)序比較分析百合屬4 種植物花的轉(zhuǎn)錄組數(shù)據(jù)。通過(guò)組裝分別在細(xì)葉百合、川百合、卷丹以及百合的花朵中獲得44 565、51 413、41 638 和44 716 個(gè)unigene 序列。本研究獲得的轉(zhuǎn)錄組數(shù)據(jù)將為未來(lái)這4 種植物的研究提供有用的數(shù)據(jù)和資源。 表4 強(qiáng)烈正向選擇的基因的KEGG通路Table 4 The enriched KEGG pathways of strongly positive selection unigenes 將獲得的基因序列在Nr、Swiss-Prot、GO、KOG和KEGG 等公共數(shù)據(jù)庫(kù)中注釋,4 個(gè)物種中一半左右的基因在五大數(shù)據(jù)庫(kù)中有注釋信息,但是幾乎一半的基因沒(méi)有注釋信息,這可能是由于4種植物目前都沒(méi)有參考基因組信息,這些基因可能是百合屬特有的一些基因,這和前期關(guān)于野百合的注釋信息類似,都是大約50%的基因能匹配到注釋信息。通過(guò)比較本實(shí)驗(yàn)的4 種百合屬植物以及野百合中基因的GO 和KOG 注釋結(jié)果,發(fā)現(xiàn)5種百合屬植物花的轉(zhuǎn)錄本歸屬的分類條目類似,說(shuō)明5種植物在百合屬內(nèi)親緣關(guān)系較近。 百合是多年生的宿根花卉植物,有球根“花卉之王”的美譽(yù),花的形成和花器官的發(fā)育研究極其重要。本研究通過(guò)轉(zhuǎn)錄組數(shù)據(jù)共鑒別了13個(gè)花發(fā)育相關(guān)的基因,控制植物花器官發(fā)育的基因大多數(shù)含有一個(gè)保守的MADS 結(jié)構(gòu)域。其中,MADS2基因參與胚珠的發(fā)育[19],并且Tzeng 等在麝香百合中克隆到了MADS2 基因,MADS2 基因僅在胚珠中表達(dá),在花的其他部位中不表達(dá)[20]。除此之外,目前在麝香百合中還克隆出了MADS1、MADS3 和MADS4基因,它們分別參與雄蕊和花瓣的發(fā)育[21]。在本研究中鑒別到的MADS6基因參與調(diào)控花分生組織的分化和開(kāi)花時(shí)間[22~23],MADS14 基因調(diào)控開(kāi)花時(shí)間[22]。Wang 等研究表明過(guò)表達(dá)MADS-box 轉(zhuǎn)錄因子BpPI 可以延遲開(kāi)花[24]。MADS16 基因參與花被和雄蕊的發(fā)育[25~26]。在樺樹(shù)中,研究發(fā)現(xiàn)BpAP1 可以促進(jìn)其雄花序的形成[27]。在AGL 基因家族中,AGL104 基因和AGL3 基因參與花粉的成熟與花粉管的生長(zhǎng)[28],AGL8 基因參與花分生組織的分化[29]。AGL19 基因可以響應(yīng)春化作用,促進(jìn)開(kāi)花,而AGL15 基因參與開(kāi)花的負(fù)調(diào)控[30]。另外,本研究中鑒別到的SOC1 基因和EJ2 基因分別調(diào)控開(kāi)花時(shí)間以及花的發(fā)育和形成[31]。LIM 類基因LIM15 是與減數(shù)分裂相關(guān)基因,在染色體的配對(duì)和重組起重要作用[32]。Mori等在百合中克隆到了與花粉發(fā)育相關(guān)的GlsA基因,其僅僅在花粉的發(fā)育過(guò)程中表達(dá)[33]。本研究中鑒別的花發(fā)育相關(guān)基因可以為進(jìn)一步研究百合花器官發(fā)育和調(diào)控提供基礎(chǔ)。 Ka/Ks 值常用來(lái)驗(yàn)證蛋白質(zhì)編碼基因是否經(jīng)歷選擇作用。正選擇作用是物種對(duì)環(huán)境因素的適應(yīng)手段之一。本研究共檢測(cè)到32對(duì)強(qiáng)烈的正向選擇基因(Ka/Ks>1)以及355 對(duì)弱的正向選擇基因(0.5 在植物病原體的相互作用途徑中,發(fā)現(xiàn)了正選擇基因疾病抗性蛋白R(shí)PM1 基因,RPM1 基因是NBS-LRR 基因中的一員,RPM1 基因通過(guò)一系列的信號(hào)傳導(dǎo)使植物體產(chǎn)生過(guò)敏反應(yīng),加強(qiáng)植株的抗病性,造成病原菌感染區(qū)域及周圍組織細(xì)胞程序性凋亡,使病原菌不會(huì)擴(kuò)散到健康的組織器官中,從而達(dá)到抗病目的。對(duì)大豆灰斑病表現(xiàn)出正向調(diào)控的抗性[34]。過(guò)氧化物酶57基因參與苯丙烷類化合物木質(zhì)素的生物合成。苯丙烷類化合物作為植物抗逆保護(hù)因子及特定環(huán)境下的次生代謝產(chǎn)物對(duì)植物的生長(zhǎng)發(fā)育及應(yīng)答逆境脅迫具有重要作用,特異性調(diào)控苯丙烷代謝途徑相關(guān)基因的表達(dá)可以增強(qiáng)植物對(duì)環(huán)境脅迫的抗性[35]。一些研究表明正選擇直系同源基因常常與生物和非生物脅迫、生物合成、代謝過(guò)程和酶相關(guān)[9,35~37]。本研究也發(fā)現(xiàn)了抗性以及參與代謝相關(guān)的正向選擇基因。2.5 正選擇基因的GO和KEGG富集分析
3 討論
3.1 百合屬4種植物花的轉(zhuǎn)錄組測(cè)序和注釋
3.2 花發(fā)育相關(guān)基因的分析
3.3 百合屬5種植物的直系同源基因以及正選擇基因