孫耀國(guó),蔡天潤(rùn),姬行舟,張軍
(河北農(nóng)業(yè)大學(xué) 林學(xué)院/河北省林木種質(zhì)資源與森林保護(hù)重點(diǎn)實(shí)驗(yàn)室,河北 保定 071000)
轉(zhuǎn)錄因子(TFs)在調(diào)節(jié)和控制植物許多關(guān)鍵的生物學(xué)過(guò)程中起著重要作用,此類蛋白的不同功能區(qū)通過(guò)結(jié)合功能基因或調(diào)控基因的啟動(dòng)子順式作用元件或與其他蛋白互作來(lái)調(diào)控基因的表達(dá)[1]。據(jù)前人研究表明,目前在植物中已經(jīng)發(fā)現(xiàn) 64 種轉(zhuǎn)錄因子家族[2]。其中,bZIP轉(zhuǎn)錄因子家族是最大和最多樣化的家族之一[3]。
堿性亮氨酸拉鏈(Basic leucine zipper,bZIP)因具有一個(gè)高度保守的結(jié)構(gòu)域而得名,該結(jié)構(gòu)域由60~80個(gè)氨基酸組成,包括2個(gè)功能區(qū)域,1個(gè)堿性區(qū)域和1個(gè)亮氨酸拉鏈[4]。堿性氨基酸區(qū)域位于C端,緊靠亮氨酸拉鏈結(jié)構(gòu)域的N末端,由16~20個(gè)保守的氨基酸殘基組成,通過(guò)一個(gè)固定的N-x7-R/K結(jié)構(gòu)與特異DNA序列相結(jié)合[5-6];亮氨酸拉鏈區(qū)域位于N端,由若干個(gè)重復(fù)七肽或者疏水性氨基酸殘基組成,每7個(gè)氨基酸的第7位含有1個(gè)亮氨酸(亮氨酸有時(shí)會(huì)被苯丙氨酸、纈氨酸、異亮氨酸、和蛋氨酸替代),該結(jié)構(gòu)域主要負(fù)責(zé)bZIP蛋白DNA 結(jié)合之前的異源或同源二聚化[7-8]。目前,已經(jīng)在多種植物的全基因組范圍內(nèi)鑒定出bZIP轉(zhuǎn)錄因子基因,如擬南芥中有75個(gè)[9],玉米125個(gè)[10],水稻89個(gè)[11],大豆131個(gè)[12],蓖麻49個(gè)[13],黃瓜64個(gè)[14],葡萄55個(gè)[15],木薯77個(gè)[16]。大量研究表明,bZIP轉(zhuǎn)錄因子在植物的生長(zhǎng)發(fā)育過(guò)程起著重要的調(diào)節(jié)作用,例如種子的成熟和萌發(fā)[17-18],細(xì)胞伸長(zhǎng)[19-20],血管發(fā)育[19],花的誘導(dǎo)和發(fā)育[21-25],胚胎發(fā)生[26]等。還有研究表明,bZIP轉(zhuǎn)錄因子還參與植物的生物和非生物脅迫響應(yīng)。在水稻中,OsbZIP12和OsbZIP46響應(yīng)干旱,鹽分和寒冷脅迫以及受ABA信號(hào)而誘導(dǎo)[27-28];黃瓜中,在干旱處理24 h后,在根中的10個(gè)被選定的bZIP基因都發(fā)生了上調(diào),而在葉片中,被選定的bZIP基因都發(fā)生了下調(diào)[29]。在番茄中,bZIP轉(zhuǎn)錄因子SIAREB參與了對(duì)水分缺乏和鹽脅迫的反應(yīng)[30]。
西洋梨(PyruscommunisL.)是與東方梨齊名的世界兩大栽培類型梨之一[31],因其肉質(zhì)細(xì)膩,芳香多汁,柔軟易溶于口,而備受消費(fèi)者青睞。近年隨著人們生活水平的提高,西洋梨在中國(guó)需求逐漸增加,栽培面積也逐漸擴(kuò)大[32]。西洋梨全基因組測(cè)序的完成,為bZIP基因家族的全基因組分析奠定了基礎(chǔ)。但目前有關(guān)西洋梨bZIP轉(zhuǎn)錄因子家族的研究還未見(jiàn)報(bào)道。本研究利用生物信息學(xué)的方法對(duì)西洋梨bZIP基因家族進(jìn)行了全基因組鑒定,并對(duì)其基因結(jié)構(gòu)、理化性質(zhì)、保守基序、系統(tǒng)發(fā)育關(guān)系、染色體定位、共線性關(guān)系和順式作用元件進(jìn)行了分析,為西洋梨bZIP基因的功能研究提供依據(jù)。
西洋梨全基因組數(shù)據(jù)下載于GDR數(shù)據(jù)庫(kù)(http://www.rosaceae.org/)[33]。通過(guò)pfam數(shù)據(jù)庫(kù) (http://pfam.xfam.org/)下載bZIP轉(zhuǎn)錄因子的隱馬爾科夫模型文件 (ID:PF07716、CPF12498、PF03131、PF00170),以上面的隱馬爾科夫模型文件為搜索條件,利用HMMER 3.0 軟件中的Hmmse-arch程序?qū)ξ餮罄娴鞍踪|(zhì)序列進(jìn)行搜索(E<0.001),將得到的結(jié)果去除重復(fù),并通過(guò)pfam和InterProScan數(shù)據(jù)庫(kù)進(jìn)一步鑒定和篩選,最后得到西洋梨bZIP家族蛋白質(zhì)序列。最后利用在線工具ProtParam tool(http://web.expasy.org/protparam/)分析西洋梨bZIP蛋白序列的等電點(diǎn)和分子量等信息,采用CELLO 2.5 (http://cello.life.nctu.edu.tw/)在線軟件預(yù)測(cè)分析西洋梨bZIP蛋白的亞細(xì)胞定位。
從Phytozome數(shù)據(jù)庫(kù)(http://www.phytozome.net/cassava.php)下載擬南芥(Arabidopsisthaliana)bZIP蛋白序列。利用MEGA 7.0軟件把西洋梨bZIP蛋白與擬南芥中的bZIP蛋白序列進(jìn)行多序列比對(duì),并用鄰接法(NJ)構(gòu)建系統(tǒng)進(jìn)化樹(shù),參數(shù)設(shè)置為Bootstrap method 1000;其余參數(shù)為默認(rèn)。
利用在線網(wǎng)站GSDS(http://gsds.cbi.pku.edu.cn)對(duì)西洋梨bZIP基因家族成員的基因結(jié)構(gòu)進(jìn)行分析[34];并使用MEME(http://meme-suite.org/tools/meme)來(lái)識(shí)別西洋梨bZIP基因家族蛋白質(zhì)序列中的保守基序,設(shè)置的參數(shù)為:重復(fù)次數(shù),任何; 最大圖案數(shù)量,20; 每個(gè)圖案的最佳寬度,在6到100個(gè)殘基之間[35]。最后利用TBtools軟件繪制西洋梨bZIP基因家族成員進(jìn)化樹(shù)、基因結(jié)構(gòu)、基因組成組合圖。
根據(jù)西洋梨基因組注釋文件,獲得PcbZIPs基因在染色體上的位置信息,再利用MapChart[36]軟件繪制PcbZIP基因在染色體上的定位圖。西洋梨bZIP基因家族的基因加倍事件我們利用Multiple Collinearity Scan toolkit(MCScanX)軟件來(lái)分析,其中被定義為片段重復(fù)基因有以下2個(gè)條件:(1)較短序列至少占較長(zhǎng)序列的70%; (2)2條基因序列的相似性大于70%[37-38]。另外,被認(rèn)定為是串聯(lián)重復(fù)基因的條件是:位于相同染色體上的,并且中間相隔的基因數(shù)量不得超過(guò)1個(gè)的同源基因[39]。最后利用Circos軟件將bZIP基因加倍事件的分析結(jié)果以圖片的形式展示出來(lái)[40]。為了展示西洋梨和其他選定物種獲得的直系同源bZIP基因的共線性關(guān)系,使用python程序構(gòu)建了共線性分析圖。使用KaKs_Calculator 1.2計(jì)算重復(fù)基因?qū)Φ耐x替換率以及非同義替換率[41]。
利用perl程序提取PcbZIPs編碼序列的上游文件(1.5kb)隨后提交到PlantCARE[42](http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)來(lái)識(shí)別順式作用元件,最后利用在線網(wǎng)站GSDS(http://gsds.cbi.pku.edu.cn)繪制出PcbZIP基因家族順式作用元件圖。
通過(guò)HMMER 3.0 軟件中Hmmsear程序?qū)ξ餮罄娴鞍踪|(zhì)序列進(jìn)行搜索,并通過(guò)pfam和InterProScan數(shù)據(jù)庫(kù)剔除不含保守結(jié)構(gòu)域的蛋白質(zhì)序列,手動(dòng)去除重復(fù)和不完整的序列,最后在西洋梨全基因組內(nèi)共鑒定出52個(gè)bZIP基因家族成員。我們發(fā)現(xiàn)PcbZIP基因不均勻地分布在西洋梨17條染色體上,如圖1所示。
圖1 西洋梨bZIP基因的染色體分布
由圖1可知,8號(hào)染色體含有的PcbZIP基因最多,有8個(gè)基因,占PcbZIP基因總數(shù)的15.4%。根據(jù)其在染色體上的位置依次命名為PcbZIP1-PcbZIP52。西洋梨bZIP基因及其相關(guān)信息見(jiàn)表1。
由表1可知,西洋梨bZIP家族蛋白質(zhì)長(zhǎng)度在122(PcbZIP18)~741(PcbZIP21)個(gè)氨基酸之間;蛋白質(zhì)分子量在14 025.17 Da~7 976.86 Da;等電點(diǎn)在5.42~10.41;根據(jù)CELLO的預(yù)測(cè)顯示,52個(gè)PcbZIP基因全部定位在細(xì)胞核上。
表1 西洋梨bZIP基因及其相關(guān)信息Table 1 List of PcbZIP genes and their related information
表1(續(xù))
用MEGA 7.0中的Clustal W程序?qū)?2個(gè)PcbZIP蛋白質(zhì)序列進(jìn)行比對(duì)分析。結(jié)果表明:PcbZIP蛋白結(jié)構(gòu)域由堿性結(jié)構(gòu)域和亮氨酸拉鏈組成,堿性區(qū)域由固定的N-X7-R/K結(jié)構(gòu)組成,亮氨酸拉鏈的二聚化區(qū)域緊密與堿性區(qū)域相連,由7個(gè)氨基酸殘基組成1個(gè)重復(fù)單元,并且每個(gè)重復(fù)單元的第7位都含有1個(gè)亮氨酸(L),少數(shù)情況下會(huì)被纈氨酸(V),異亮氨酸(I),苯丙氨酸(F),蛋氨酸(M)取代,這與前人對(duì)bZIP轉(zhuǎn)錄因子結(jié)構(gòu)的研究相符合。
為了研究西洋梨和擬南芥中bZIP基因家族的系統(tǒng)進(jìn)化關(guān)系,使用西洋梨預(yù)測(cè)出來(lái)的bZIP蛋白(52個(gè))與擬南芥中bZIP蛋白(72個(gè)),構(gòu)建了系統(tǒng)進(jìn)化樹(shù)見(jiàn)圖2。
圖2 西洋梨和擬南芥bZIP蛋白的系統(tǒng)進(jìn)化樹(shù)
注:bZIP蛋白被分為9個(gè)亞族(A、B、C、E、F、G、H、I、S)。UC代表未分類的基因或進(jìn)化枝。
由圖2可知,根據(jù)擬南芥bZIP轉(zhuǎn)錄因子的分類標(biāo)準(zhǔn),可以把西洋梨bZIP轉(zhuǎn)錄因子分為9個(gè)亞家族,即A、B、C、E、F、G、H、I和S,在D亞族中沒(méi)有成員。每個(gè)亞家族對(duì)應(yīng)的bZIP基因數(shù)目分別為:10、2、4、3、3、1、2、10和14個(gè)。
對(duì)鑒定得到的52個(gè)PcbZIP基因進(jìn)行基因結(jié)構(gòu)分析,結(jié)果見(jiàn)圖3。
圖3 西洋梨bZIP家族成員的系統(tǒng)發(fā)育關(guān)系,基序和基因結(jié)構(gòu)
從圖3可以看出,PcbZIPs中外顯子的個(gè)數(shù)從1~10個(gè)不等,其中PcbZIP4的外顯子最多,有10個(gè)外顯子;PcbZIP3、PcbZIP49、PcbZIP36、PcbZIP27、PcbZIP45、PcbZIP12、PcbZIP5、PcbZIP50、PcbZIP46、PcbZIP33、PcbZIP41、PcbZIP51、Pcb
ZIP20、PcbZIP7和PcbZIP22的外顯子最少,只有1個(gè)。此外,從圖中還可以看出,同一亞族內(nèi)的成員具有相似的基因結(jié)構(gòu),例如外顯子的長(zhǎng)度和數(shù)目。
利用MEME在線網(wǎng)站對(duì)PcbZIPs蛋白的保守基序進(jìn)行分析。結(jié)果表明:同一亞族內(nèi)蛋白的保守基序的數(shù)量和種類大體相同,不同亞族內(nèi)保守基序的數(shù)量和種類存在較大差異。并且發(fā)現(xiàn)所有PcbZIP蛋白都具有bZIP結(jié)構(gòu)域即Motif 1,此外,某些基序具有明顯的特異性,例如,Motif 8只出現(xiàn)在S亞族內(nèi),Motif 4、Motif 11和Motif 12只出現(xiàn)在A亞族內(nèi),Motif 5、Motif 6和Motif 14只出現(xiàn)在I亞族內(nèi),Motif 13、Motif 15和Motif 19只出現(xiàn)在B亞族內(nèi),Motif 9只出現(xiàn)在F亞族內(nèi)。
在進(jìn)化過(guò)程中,片段重復(fù)和串聯(lián)重復(fù)是基因家族產(chǎn)生的重要方式[43]。因此,我們分析了PcbZIPs基因的復(fù)制事件。從圖4中可以看出有1對(duì)串聯(lián)重復(fù)基因PcbZIP25/PcbZIP26,除了串聯(lián)重復(fù)事件外,還用了MCScaX方法鑒定出了36個(gè)片段重復(fù),見(jiàn)圖4。
圖4 西洋梨bZIP基因的共線性分析
為了更好地推測(cè)西洋梨PcbZIP家族的系統(tǒng)發(fā)育機(jī)制,構(gòu)建了西洋梨與擬南芥的共線性分析圖,見(jiàn)圖5。
圖5 西洋梨和擬南芥的bZIP基因的共線性分析
由圖5可知,在西洋梨與擬南芥的bZIP基因中,共有30對(duì)基因具有共線性關(guān)系。我們還發(fā)現(xiàn)一些PcbZIP基因同時(shí)與擬南芥中3個(gè)不同的基因之間存在共線性關(guān)系,如PcbZIP50和PcbZIP5。
為了進(jìn)一步研究PcbZIP在非生物脅迫響應(yīng)中的潛在機(jī)制,提取了PcbZIPs基因起始位點(diǎn)上游的1.5kb范圍內(nèi)的序列,并且提交到PlantCARE中檢測(cè)順式作用元件,結(jié)果見(jiàn)圖6。
圖6 PcbZIPs啟動(dòng)子中預(yù)測(cè)的順勢(shì)元件
如圖6所示,分析并顯示了5個(gè)與非生物脅迫有關(guān)的順式作用元件,分別是ABA響應(yīng)元件、干旱誘導(dǎo)響應(yīng)元件(MBS)、低溫響應(yīng)元件(LTR)、防御和應(yīng)激反應(yīng)元件(TC-rich repeats)和創(chuàng)傷響應(yīng)元件(WUN-motif)。除PcbZIP36和PcbZIP49外,其他基因都具有1個(gè)或多個(gè)順式作用元件,其中PcbZIP3和PcbZIP38只含有1個(gè)順式作用元件,PcbZIP15所含的順式作用元件最多,有14個(gè)。其他PcbZIPs具有至少1種順式作用元件,表明PcbZIPs的表達(dá)可能與這些非生物脅迫有關(guān)??偣灿?3個(gè)PcbZIP(63%)具有1個(gè)或多個(gè)ABA響應(yīng)元件,21個(gè)PcbZIP(40%)具有1個(gè)或多個(gè)LTR響應(yīng)元件,這表明PcbZIPs有可能對(duì)ABA和低溫脅迫響應(yīng)明顯。另外,18個(gè)PcbZIP(35%)具有TC-rich repeats響應(yīng)元件,在PcbZIP成員中各有9個(gè)PcbZIP具有WUN-motif響應(yīng)元件和TC-rich repeats響應(yīng)元件。分析表明,PcbZIPs可能響應(yīng)不同的非生物脅迫。
西洋梨是世界上主要的栽培種之一,是歐洲、北美、南美、非洲和澳洲生產(chǎn)上主要栽培種,在我國(guó)也有廣泛栽植。與其他栽培水果(例如蘋果和葡萄)相比,西洋梨的研究進(jìn)展極其緩慢。越來(lái)越多的研究表明,bZIP轉(zhuǎn)錄因子在植物的生長(zhǎng)和發(fā)育過(guò)程中起著重要的調(diào)控作用。目前已經(jīng)在許多植物物種中鑒定出bZIP基因家族,但是在西洋梨中有關(guān)bZIP基因的研究還未見(jiàn)報(bào)道。
本研究中,在西洋梨全基因組中鑒定出52個(gè)bZIP家族基因,這一結(jié)果表明西洋梨中bZIP家族成員的數(shù)量與葡萄[15]和黃瓜[14]bZIP成員數(shù)量相似。系統(tǒng)發(fā)育分析表明,PcbZIPs可分為9個(gè)亞族,與擬南芥、水稻、玉米等相比缺少D亞族的成員,可能是因?yàn)樵搧喿宓幕蛟谖餮罄婊蚪M進(jìn)化或人工馴化過(guò)程中發(fā)生了丟失[44]。值得注意的是,一些原屬于I亞族內(nèi)的AtbZIP基因與其簇發(fā)生了分離,這種現(xiàn)象在葡萄[15]中也出現(xiàn)過(guò)。此外,AtbZIP74/AtbZIP33/AtbZIP31、AtbZIP72和PcbZIP18與其他bZIPs基因有所區(qū)別,在這個(gè)進(jìn)化枝中沒(méi)有其他物種bZIP基因的個(gè)體進(jìn)化枝,在NIJHAWAN[11]和WEI[10]的研究中也出現(xiàn)了類似的情況。
基因結(jié)構(gòu)和保守基序分析進(jìn)一步驗(yàn)證了系統(tǒng)發(fā)育分析的分組結(jié)果?;蚪Y(jié)構(gòu)分析表明,PcbZIPs的內(nèi)含子數(shù)量從0~9個(gè)不等。在PcbZIPs中發(fā)現(xiàn)大約有28.8%的成員沒(méi)有內(nèi)含子,在水稻[11]和木薯[16]中分別發(fā)現(xiàn)了15.3%和20.8%的bZIP家族成員不含有內(nèi)含子。并且這種現(xiàn)象都發(fā)生在S和F組,在玉米[10]中也觀察到這種現(xiàn)象。在研究中還發(fā)現(xiàn),G亞族成員的內(nèi)含子數(shù)量比A、B、C、E、F、H、I和S組亞族的內(nèi)含子數(shù)量多,之前有關(guān)水稻的研究表明,內(nèi)含子丟失的速度快于節(jié)段復(fù)制后內(nèi)含子的獲取速度[45]。因此,G亞族成員有可能是原始基因。保守的基序分析表明,所有PcbZIPs蛋白都含有典型的bZIP結(jié)構(gòu)域,即motif 1,并且每個(gè)亞族具有相似的保守基序組成,某些基序只屬于特定的組。
基因的串聯(lián)重復(fù)和片段重復(fù)對(duì)于基因家族基因的產(chǎn)生具有重要的作用。分析的結(jié)果表明,在西洋梨8號(hào)染色體上我們觀察到一個(gè)串聯(lián)重復(fù)事件,PcbZIP25和PcbZIP26。并且發(fā)現(xiàn),這2個(gè)基因都被分到了I亞族,基因的結(jié)構(gòu)和基序的組成都極其的相似。我們還觀察到36個(gè)片段重復(fù)事件,并且一些基因不止復(fù)制了1次,例如PcbZIP1、PcbZIP3、PcbZIP5等。由片段復(fù)制產(chǎn)生的基因約占所有PcbZIP基因的48%。這種現(xiàn)象在大豆中占58%[12]。這些結(jié)果表明,片段重復(fù)和串聯(lián)重復(fù)共同促進(jìn)了PcbZIP基因的產(chǎn)生,但是前者起主要作用。為了更好的地理解PcbZIP基因的選擇壓力,計(jì)算了PcbZIPs基因?qū)Φ腒a/Ks值,結(jié)果表明,所有串聯(lián)重復(fù)和片段重復(fù)基因?qū)Φ腒a/Ks<1,這表明PcbZIP家族在進(jìn)化過(guò)程中受到了純化選擇的作用[46]。
比較不同生物體的基因組可能是推斷未表征基因的進(jìn)化歷史,起源和功能的有效手段[47]。由于擬南芥是模式植物,對(duì)bZIP基因家族研究的比較多,因此我們構(gòu)建了西洋梨和擬南芥bZIP基因的共線性圖。共有22個(gè)PcbZIP基因與21個(gè)AtbZIP基因鑒定出共線性關(guān)系。其中鑒定出2個(gè)直系同源基因?qū)?,分別是PcbZIP4、AtbZIP41和PcbZIP16、AtbZIP37,表明這些基因可能存在于2個(gè)物種的最后共同祖先的基因組中。并且,發(fā)現(xiàn)這2個(gè)直系同源基因?qū)Ψ謩e聚集在系統(tǒng)發(fā)生樹(shù)的同一進(jìn)化枝內(nèi),具有相似的基因結(jié)構(gòu)和基序組成。已有研究表明,AtbZIP36、AtbZIP37和AtbZIP38協(xié)同調(diào)節(jié)與干旱脅迫響應(yīng)有關(guān)的ABRE依賴性ABA信號(hào)傳導(dǎo)[48]。因此,推測(cè)西洋梨中與AtbZIP37有直系同源關(guān)系的PcbZIP16可能會(huì)在抗旱過(guò)程中發(fā)揮著功能。
本研究以西洋梨基因組數(shù)據(jù)為基礎(chǔ),鑒定并分析了西洋梨中bZIP轉(zhuǎn)錄因子家族成員的基因結(jié)構(gòu)、理化性質(zhì)、保守基序、系統(tǒng)發(fā)育關(guān)系、染色體定位、共線性關(guān)系和順式作用元件。分析結(jié)果表明,從西洋梨全基因組中共鑒定出52bZIP基因,系統(tǒng)進(jìn)化將其分為9個(gè)亞族(A、B、C、E、F、G、H、I和S)?;蚨ㄎ伙@示,52個(gè)PcbZIP基因不均勻地分布在17條染色體上?;蚪Y(jié)構(gòu)分析表明:PcbZIP中外顯子的個(gè)數(shù)從1~10個(gè)不等,同一亞族內(nèi)的成員具有相似的基因結(jié)構(gòu)和基序組成。PcbZIP轉(zhuǎn)錄因子的氨基酸數(shù)目在122~741個(gè);蛋白質(zhì)分子量在14 025.17 Da~7 976.86 Da;等電點(diǎn)在5.42~10.41,PcbZIP基因都定位在細(xì)胞核上。通過(guò)共線性分析,發(fā)現(xiàn)了1個(gè)串聯(lián)重復(fù)事件和36個(gè)片段復(fù)制事件,這說(shuō)明PcbZIP基因在產(chǎn)生過(guò)程中片段復(fù)制事件起了主要作用。順式作用元件分析表明,大多數(shù)PcbZIP基因含有1個(gè)或多個(gè)順式作用元件,這表明,PcbZIP基因可能響應(yīng)不同的非生物脅迫。本研究為進(jìn)一步探究西洋梨bZIP基因的功能提供了依據(jù)。