馬芮,李瑞雪,鄭煜聆,李永強(qiáng),2*
(1.浙江師范大學(xué) 化學(xué)與生命科學(xué)學(xué)院,浙江 金華 321004;2.浙江省特色經(jīng)濟(jì)植物生物技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 金華 321004)
APETALA2/ethylene response factor(AP2/ERF)轉(zhuǎn)錄因子家族作為植物中最大的轉(zhuǎn)錄因子家族之一,參與植物體內(nèi)各種信號(hào)傳導(dǎo)和生長發(fā)育調(diào)節(jié)[1-3]。AP2/ERF家族每個(gè)成員包含至少一個(gè)由60~70個(gè)氨基酸組成的AP2結(jié)構(gòu)域,包括AP2、ERF和RAV亞家族,根據(jù)AP2結(jié)構(gòu)域的數(shù)目和序列的相似程度將AP2/ERF超家族分為AP2家族、ERF家族和RAV家族[4]。其中AP2家族具有兩個(gè)AP2/ERF保守結(jié)構(gòu)域,而ERF家族成員包含一個(gè)AP2/ERF保守結(jié)構(gòu)域。AP2結(jié)構(gòu)域首次在擬南芥(Arabidopsisthaliana)中被發(fā)現(xiàn)AP2蛋白中的重復(fù)基序,能夠參與花的發(fā)育[5]。RAV家族蛋白包含一個(gè)B3結(jié)構(gòu)域和一個(gè)AP2/ERF結(jié)構(gòu)域[6]。研究表明,ERF轉(zhuǎn)錄因子在植物的生長發(fā)育以及多種逆境脅迫應(yīng)答反應(yīng)中發(fā)揮著重要調(diào)控作用[7-8]。在乙烯信號(hào)轉(zhuǎn)導(dǎo)級(jí)聯(lián)反應(yīng)中一個(gè)重要的轉(zhuǎn)錄因子家族是乙烯響應(yīng)因子(ERFs)。他們作為AP2/ERF超家族的成員,由EILs基因激活并進(jìn)一步表達(dá),部分ERFs激活GCC-box靶基因,激活功能基因進(jìn)行各種代謝反應(yīng)。前人研究表明,從煙草(Nicotianatabacum)中分離出的含有保守ERF結(jié)構(gòu)域的乙烯響應(yīng)元件結(jié)合蛋白(ERF),它可以與乙烯響應(yīng)元件GCC-box結(jié)合,調(diào)控乙烯相關(guān)基因的表達(dá)[9]。
目前,在番茄中已有多個(gè)ERFs被鑒定出來,部分可以正向調(diào)控果實(shí)成熟,而也有部分乙烯響應(yīng)因子對(duì)成熟調(diào)控起到負(fù)調(diào)控作用[10]。研究表明,AP2/ERF超家族成員廣泛參與植物乙烯信號(hào)途徑和花芽萌發(fā)以及果實(shí)成熟,除此之外還參與植物發(fā)育過程中的脅迫、代謝、衰老等。AP2/ERF能夠響應(yīng)各種生物和非生物脅迫,進(jìn)而調(diào)節(jié)植物的生長發(fā)育,例如低溫[11]、干旱、高溫[12-13]、鹽脅迫等。AP2家族中的基因被證實(shí)可以決定玉米穗的分生組織[14],AP2/ERF轉(zhuǎn)錄因子通過轉(zhuǎn)錄和翻譯等多種機(jī)制參與調(diào)控生長、發(fā)育、激素和應(yīng)激反應(yīng)等多種生物學(xué)過程的基因表達(dá)[15-16]。有研究證明,過表達(dá)DREB2C時(shí)會(huì)導(dǎo)致植物種子推遲萌發(fā)[17]。Sl-ERF2轉(zhuǎn)基因番茄種子比野生型提早萌發(fā),提高了植株對(duì)乙烯的敏感性[18]。ERFs基因廣泛存在于高等植物中,可以通過與DNA直接結(jié)合,達(dá)到調(diào)控下游基因轉(zhuǎn)錄的目的,也可以調(diào)控各種信號(hào)轉(zhuǎn)導(dǎo)途徑[19-21]。當(dāng)山毛櫸(Faguslongipetiolata)處于休眠狀態(tài)時(shí),ERF1在種胚中的表達(dá)量較低,但休眠解除時(shí),其表達(dá)量顯著升高[22]。
藍(lán)莓(Vacciniumspp.)是杜鵑花科(Ericaceae)越橘屬(Vaccinium)植物,不僅具有較高的營養(yǎng)價(jià)值,還具有較高的經(jīng)濟(jì)價(jià)值,在提高免疫力、增強(qiáng)心肺功能等方面作用顯著,被譽(yù)為“漿果之王”[23]。由于AP2/ERF轉(zhuǎn)錄因子在植物生長發(fā)育過程中起到重要作用,本研究借助四倍體藍(lán)莓品種Draper的基因組數(shù)據(jù),對(duì)藍(lán)莓ERF基因進(jìn)行鑒定,共得到160個(gè)家族成員。進(jìn)行了多序列比對(duì),保守基序、基因結(jié)構(gòu)、啟動(dòng)子分析,通過轉(zhuǎn)錄組數(shù)據(jù)分析藍(lán)莓AP2/ERF基因家族成員在花芽休眠解除過程中的表達(dá)情況。研究結(jié)果為進(jìn)一步研究ERF基因在果樹芽休眠調(diào)控中的功能奠定基礎(chǔ),為藍(lán)莓產(chǎn)業(yè)的發(fā)展提供理論基礎(chǔ)。
通過ArabidopsisInformation Resource(TAIR)數(shù)據(jù)庫(http://www.arabidopsis.org),獲取擬南芥AP2/ERF基因家族成員,下載蛋白質(zhì)序列作為參考序列,從越橘基因組數(shù)據(jù)庫(GENOME DATABASE FOR VACCINIUM,GDV)中獲取藍(lán)莓蛋白數(shù)據(jù)庫[24]。以擬南芥ERF蛋白序列作參考,使用TBtools軟件對(duì)蛋白數(shù)據(jù)庫進(jìn)行BlastP比對(duì)[25]。
選擇從上述程序獲得的獨(dú)特序列作為候選AP2/ERF家族蛋白序列。通過CD-Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)排除一些不包含AP2結(jié)構(gòu)域的蛋白序列,通過MEME將篩選出的藍(lán)莓ERF蛋白序列進(jìn)行保守基序分析,確定藍(lán)莓AP2/ERF基因家族成員。
利用ProtParam在線軟件預(yù)測藍(lán)莓中ERF蛋白的氨基酸長度、分子量(MW)、理論等電點(diǎn)(pI)、親水性(GRAVY)。應(yīng)用WoLF PSORT軟件分析ERF蛋白序列,進(jìn)行亞細(xì)胞定位預(yù)測[26]。
通過MEGA5.0分析軟件對(duì)篩選得到的160個(gè)藍(lán)莓ERF全長蛋白序列進(jìn)行多序列比對(duì)并構(gòu)建系統(tǒng)發(fā)育樹,方法為:鄰接法(Neighbor-Joining method)Bootstrap 1 000次重復(fù)[27],借助在線工具EvolView(https://www.evolgenius.info/evolview/#/)繪制進(jìn)化樹圖[28]。
利用MEME(http://meme-suite.org/tools/meme)在線工具進(jìn)行蛋白保守結(jié)構(gòu)域預(yù)測分析,將保守基序(motif)大小設(shè)定為默認(rèn)參數(shù),輸出結(jié)構(gòu)域最大數(shù)為5,motif寬度最長為60,其余為默認(rèn)[29]。
根據(jù)藍(lán)莓基因組信息將160個(gè)VcERF基因定位到染色體上。通過運(yùn)行BlastP來檢索藍(lán)莓基因組中的同源基因?qū)?E< 10-5,前五個(gè)匹配項(xiàng))。然后將同源對(duì)用作MCScanX的輸入文件,分析基因復(fù)制的類型[30-31]。采用Circos軟件作圖[32]。
根據(jù)藍(lán)莓花芽休眠時(shí)期的轉(zhuǎn)錄組表達(dá)數(shù)據(jù),獲得VcERFs在花芽內(nèi)休眠解除、生態(tài)休眠解除的表達(dá)量數(shù)據(jù),將FPKM值(fragments per kilobases per millionreads)進(jìn)行l(wèi)og2a標(biāo)準(zhǔn)化處理,使用TBtools軟件的“HeatMap”功能,構(gòu)建藍(lán)莓ERF基因的表達(dá)熱圖[25]。
根據(jù)藍(lán)莓ERF基因各轉(zhuǎn)錄組表達(dá)情況,篩選可能有重要調(diào)控作用的藍(lán)莓ERF候選基因。通過藍(lán)莓基因組文件提取VcERFs編碼區(qū)上游2 000 bp的啟動(dòng)子序列,使用PlantCARE(http://bioinfoatics.psb.ugent.be/webtools/plantcare/html/)網(wǎng)站分析相關(guān)藍(lán)莓ERF基因啟動(dòng)子的順式作用元件,將得到的順式作用元件進(jìn)行篩選和統(tǒng)計(jì),用熱圖展示順式作用元件的類型及數(shù)量[33]。
通過序列比對(duì)及結(jié)構(gòu)域分析,最終篩選獲得160個(gè)藍(lán)莓ERF蛋白(表1)。使用ExPasy網(wǎng)站在線工具對(duì)VcERF蛋白的理化特性進(jìn)行分析,結(jié)果顯示,ERF蛋白的氨基酸數(shù)量均在154~786個(gè),分子量17.6~86.5 ku,等電點(diǎn)4.71~10.75。不穩(wěn)定系數(shù)變化范圍在32.58~74.54,ERF蛋白大部分處于不穩(wěn)定形態(tài),親水性值在-1.000至-0.312,說明均為親水蛋白。亞細(xì)胞定位預(yù)測分析發(fā)現(xiàn),VcERF蛋白定位在細(xì)胞的各個(gè)部位,主要定位在細(xì)胞核,少數(shù)成員定位在細(xì)胞質(zhì)、葉綠體、線粒體和細(xì)胞基質(zhì)。
表1 藍(lán)莓ERF蛋白基本信息
為更深入地了解藍(lán)莓AP2/ERF轉(zhuǎn)錄因子同源進(jìn)化關(guān)系,通過MEGA5.0軟件構(gòu)建了160個(gè)藍(lán)莓ERF蛋白成員的系統(tǒng)進(jìn)化樹,系統(tǒng)進(jìn)化樹分枝顯示(圖1),AP2/ERF家族成員被分為3個(gè)亞族,藍(lán)莓ERF分布在AP2家族、RAV家族和ERF家族中,AP2家族含有54個(gè)ERF蛋白,ERF家族所含的藍(lán)莓成員最多,共82個(gè),RAV家族中有24個(gè)ERF蛋白,此類成員含有一個(gè)AP2結(jié)構(gòu)域和一個(gè)B3結(jié)構(gòu)域。
圖1 藍(lán)莓AP2/ERF基因家族成員系統(tǒng)進(jìn)化樹分析
為更深入地了解VcERFs中基序(motif)組成的多樣性,利用MEME預(yù)測藍(lán)莓ERF蛋白質(zhì)保守基序,共得到5個(gè)保守基序(圖2),結(jié)果表明,所有VcERF蛋白均存在高度保守的AP2結(jié)構(gòu)域(motif 1),motif 1作為DNA的結(jié)合模塊,對(duì)ERF蛋白的功能至關(guān)重要。根據(jù)保守基序的分布特點(diǎn),可將藍(lán)莓ERF蛋白分為3組,Ⅰ組成員最多,含有82個(gè)ERF蛋白成員,Ⅱ組含有54個(gè),Ⅲ組含有24個(gè)。從圖2中可知,每條ERF蛋白序列所含有的保守基序的數(shù)量以及類型都存在或多或少的差異,其在分布上也存在差異,可能表明每個(gè)基序的功能有所差異,其中Ⅲ組成員含有的保守域數(shù)量最多,Ⅱ組成員除特有的AP2結(jié)構(gòu)域外,還含有一個(gè)特殊的B3結(jié)構(gòu)域(motif 5)。
A—藍(lán)莓VcERF進(jìn)化關(guān)系及保守基序;B—藍(lán)莓VcERF Motif序列。
為了進(jìn)一步探討藍(lán)莓AP2/ERF基因家族的起源和可能的進(jìn)化機(jī)制,將藍(lán)莓自身蛋白比對(duì)的結(jié)果輸入MCScanX,輸出同源配對(duì)文件,分析VcERFs的組內(nèi)同源配對(duì)情況發(fā)現(xiàn),VcERF的同源配對(duì)非常復(fù)雜,除VcERF5、VcERF6、VcERF15、VcERF21、VcERF23、VcERF26、VcERF27、VcERF38、VcERF39、VcERF50、VcERF51、VcERF52、VcERF58等30個(gè)基因沒有同源配對(duì)外,其他基因家族成員均存在線性關(guān)系,見圖3中紅色連線。藍(lán)莓AP2/ERF基因家族共有45條染色體上存在共線性基因,其中17、27號(hào)染色體上共線性基因最多,均有7對(duì)共線性基因,其次21、26號(hào)染色體上均有6對(duì)共線性基因。
圖3 藍(lán)莓ERF基因在染色體上的分布和共線性
基于已有的藍(lán)莓轉(zhuǎn)錄組數(shù)據(jù)分析AP2/ERF基因家族成員在花芽休眠解除下的表達(dá)模式(圖4),相同亞家族VcERF在休眠解除過程中的表達(dá)模式并不相似,暗示其可能在花芽休眠解除過程中發(fā)揮不同的作用。ERF家族成員VcERF51、VcERF115、VcERF119、VcERF74、VcERF95、VcERF14、VcERF29、VcERF137、VcERF48、VcERF49、VcERF148、VcERF103在休眠解除過程中表達(dá)量較高;VcERF146、VcERF50、VcERF99、VcERF122、VcERF133、VcERF82、VcERF81、VcERF105、VcERF117在內(nèi)休眠初期表達(dá)量水平很高,在內(nèi)休眠解除過程中下調(diào);其中VcERF81、VcERF105、VcERF117、VcERF65、VcERF106在生態(tài)休眠解除過程中的表達(dá)量升高,最終也沒有恢復(fù)到內(nèi)休眠初期的表達(dá)量水平。
a—ERF家族;b—AP2家族;c—RAV家族。
AP2家族成員VcERF109、VcERF114、VcERF33、VcERF140、VcERF70、VcERF145、VcERF157在休眠解除過程中表達(dá)量較高;VcERF112、VcERF53的表達(dá)量在內(nèi)休眠解除過程中下調(diào)。
第Ⅲ類RAV家族成員VcERF5、VcERF43、VcERF153、VcERF87、VcERF125、VcERF73、VcERF142在內(nèi)休眠及生態(tài)休眠解除過程中幾乎不表達(dá);VcERF30、VcERF138、VcERF72、VcERF141隨著內(nèi)休眠的解除表達(dá)量上升;VcERF30、VcERF141的表達(dá)量在生態(tài)休眠解除過程中先下降后上升。
為進(jìn)一步分析藍(lán)莓AP2/ERF家族基因在啟動(dòng)子區(qū)域的調(diào)控元件特點(diǎn),對(duì)10個(gè)ERF基因上游2 000 bp片段進(jìn)行啟動(dòng)子順式作用元件分析。結(jié)果顯示(圖5),藍(lán)莓ERF啟動(dòng)子區(qū)域含有大量光響應(yīng)元件和激素響應(yīng)元件,包括光反應(yīng)(Box 4、ATCT-motif、MRE、SP1、G-box)等,脫落酸(ABRE)、赤霉素(P-box、TATC-box、GARE-motif)、生長素(TGA-element)、茉莉酸甲酯(CGTCA-motif、TGACG-motif)、水楊酸(TCA-element)等,表明藍(lán)莓ERF基因可能在光響應(yīng)和激素響應(yīng)中起重要作用。除此之外,藍(lán)莓ERF基因還含有脅迫響應(yīng)元件,如低溫(LTR)、防御應(yīng)激(TC-rich repeats)。
圖5 藍(lán)莓ERF基因啟動(dòng)子的順式作用元件分析
本研究中采用生物信息學(xué)方法從藍(lán)莓基因組數(shù)據(jù)庫中鑒定出160個(gè)ERF基因,分布于藍(lán)莓48條染色體中的45條上,亞細(xì)胞定位預(yù)測顯示ERF基因主要定位于細(xì)胞核。通過生信分析發(fā)現(xiàn),最長的VcERF基因編碼786個(gè)氨基酸,最短的編碼154個(gè)氨基酸,分子量分布在17.6~86.5 ku,對(duì)VcERF基因的結(jié)構(gòu)分析表明,雖然VcERF基因的長度存在較大差異,但總體上同一亞類的基因具有相似的基因結(jié)構(gòu),這說明VcERF基因在進(jìn)化上是保守的。為了進(jìn)一步研究藍(lán)莓與擬南芥中AP2/ERF家族的同源進(jìn)化關(guān)系,利用鄰接法構(gòu)建AP2/ERF基因家族系統(tǒng)發(fā)育樹,并根據(jù)其分類特點(diǎn)將這些基因分為3組。擬南芥中的一些AP2/ERF基因家族成員功能已經(jīng)得到驗(yàn)證,根據(jù)進(jìn)化關(guān)系中基因的同源性,推測與擬南芥位于同一組的藍(lán)莓ERF基因也具有與其相同或相類似的功能。藍(lán)莓基因組中之所以存在如此豐富的AP2/ERF基因家族成員,一方面可能是由于其屬于多倍體物種,本研究用于AP2/ERF基因家族生物信息學(xué)預(yù)測的基因組來源于四倍體藍(lán)莓品種Draper,多倍體化會(huì)影響基因家族的分布和大??;另一方面可能與基因組加倍事件有關(guān),藍(lán)莓基因組經(jīng)歷了至少1次全基因組重復(fù)[24]和大量串聯(lián)重復(fù),串聯(lián)重復(fù)和片段重復(fù)是基因家族擴(kuò)張和進(jìn)化的重要因素。系統(tǒng)發(fā)育分析也表明,許多藍(lán)莓AP2/ERF家族成員具有高度相似性,而一些VcERF基因的相鄰染色體位置為串聯(lián)復(fù)制提供了進(jìn)一步的支持。
通過對(duì)ERF基因在藍(lán)莓休眠及解除過程中的轉(zhuǎn)錄水平進(jìn)行研究,發(fā)現(xiàn)多數(shù)VcERF基因在內(nèi)休眠及生態(tài)休眠解除過程中均能表達(dá)。其中VcERF51、VcERF115、VcERF119、VcERF74、VcERF95、VcERF14、VcERF29等基因在內(nèi)休眠及生態(tài)休眠解除過程中表達(dá)量較高;VcERF116、VcERF118、VcERF123、VcERF82、VcERF81等基因隨著內(nèi)休眠的解除表達(dá)量下降;不同的基因在不同暖溫處理時(shí)長下表達(dá)存在差異。啟動(dòng)子順式作用元件分析結(jié)果顯示,10個(gè)ERF基因啟動(dòng)子區(qū)域存在光響應(yīng)、激素響應(yīng)(脫落酸、赤霉素、生長素、茉莉酸甲酯、水楊酸)和脅迫響應(yīng)元件(低溫、防御應(yīng)激),說明藍(lán)莓ERF可能通過光、激素和脅迫信號(hào)調(diào)控藍(lán)莓花芽的生長發(fā)育和休眠。本研究可為藍(lán)莓ERF的研究提供一定的理論基礎(chǔ)。