賀喬喬, 周希希, 鄭世茂, 張曉娟, 張 羽
(陜西理工大學 生物科學與工程學院, 陜西 漢中 723000)
蕓薹屬植物的3個基本二倍體組物種包括白菜Brassicarapa(AA,X=10,2n=20)、黑芥菜B.nigra(BB,X=8,2n=16)和甘藍B.Oleracea(CC,X=9,2n=18),其中白菜組在演化過程中最原始,芥菜組較進化,甘藍組為最近分化出來的物種,進化程度相對最高。甘藍型油菜大約在7500年前由白菜和甘藍自然雜交形成,是非?!澳贻p”的多倍體植物,其基因組為AACC(2n=38)。菌核病是甘藍型油菜三大病害(菌核病、霜霉病、病毒病)之首,是由真菌核盤菌(Sclerotiniasclerotiorum(Lib.)de Bary)侵染引起的一種嚴重危害油菜產(chǎn)量和品質的廣譜性病害,抗菌核病油菜育種是油菜育種的重要目標,抗源篩選對抗病育種非常重要。研究表明,甘藍型油菜比白菜型油菜對菌核病的抗性強[1]。目前,抗菌核病油菜分子標記輔助育種還未在實踐中應用,在大豆中首次報道P5CR(pyrroline-5-carboxylate reductase,吡咯林-5-羧酸還原酶)基因與菌核病抗性強關聯(lián)[2],在油菜中關于P5CR基因方面的研究還未見報道。P5CR是真核生物中存在的一種重要管家蛋白,催化鳥氨酸、精氨酸和谷氨酸途徑的中間代謝產(chǎn)物P5C(Δ1-pyrroline-5-carboxylate,吡咯啉-5-羧酸)成為脯氨酸,是脯氨酸生物合成的最后一個酶。植物中,脯氨酸參與了蛋白質與細胞壁的合成,在植物抗?jié)B透脅迫調節(jié)中起著非常重要的作用。大量研究表明,在高鹽和干旱脅迫下,植物體內脯氨酸積累較多,同時涉及脯氨酸生物合成的相關基因表達變化較明顯[3-9]。P5C能夠產(chǎn)生活性氧而導致或促進細胞凋亡,研究表明如果把擬南芥中的P5CR基因敲除會導致植株胚胎死亡[10],而脯氨酸恰好相反,是生物體內一種重要的非酶類抗氧化劑,對抗細胞凋亡起著重要的作用,并且對細胞內的氧化還原電位也有一定的影響,這種氧化還原悖論與動物的能量代謝及人類許多疾病也有關[11-15]。研究發(fā)現(xiàn),當使用殺蟲劑三唑磷對雌性褐飛虱用藥第3天后,雌性褐飛虱轉錄水平上調的6個候選基因中包括P5CR[16],說明P5CR在動物中與抗逆性也相關。通過已經(jīng)報道的在植物中克隆的P5CR基因分析表明,不同物種中的P5CR基因結構有較大區(qū)別[17]。隨著全基因組分析技術的發(fā)展和蕓薹屬基因組數(shù)據(jù)的公布,研究發(fā)現(xiàn)同一屬內某個基因家族中的每個基因也可能各自具有不同的表達調控模式[18],對某個基因家族內每個基因的生物信息學分析比較,可以為家族內具體基因的深入研究提供選擇參考。
為了準確而全面地鑒定到蕓薹屬3個基本物種的P5CR基因,使用:(1)利用擬南芥(http://www.arabidopsis.org/)P5CR基因(AT5G14800.1)的CDS編碼序列(Coding sequence)作為種子序列,在蕓薹屬數(shù)據(jù)庫(https://brassicadb.org/)對白菜、甘藍和甘藍型油菜基因組CDS序列進行Blastn同源比對(Evalue=0);(2)用擬南芥的P5CR蛋白序列作為種子序列在Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)中獲得P5CR結構特征域的HMM profile文件,對白菜、甘藍和甘藍型油菜基因組的蛋白序列進行Blastp同源搜索(Evalue=10-37)。用以上兩種方法獲得的同源序列再使用SMART軟件(http://smart.emblheidelberg.de/)進一步鑒定蕓薹屬AC亞基因組中的P5CR候選基因。
為了進一步研究蕓薹屬AC亞基因組中P5CR基因家族功能,綜合分析后決定從蕓薹屬基因組數(shù)據(jù)文件中提取P5CR基因上游2000 bp區(qū)域作為啟動子序列[19],利用在線軟件Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[20]分析脅迫響應、激素響應、光響應和植物生長發(fā)育等順式作用元件,并用R語言中ggplot2作圖。
采用在線軟件ProtParam(https://web.expasy.org/protparam/)[21]預測P5CR基因家族蛋白質的理論分子量(molecular weight,Mw)、等電點(theoretical,pI)、GRAVY(grand average of hydropathy)等。NetPhos3.1(http://www.cbs.dtu.dk/services/NetPhos/)[22]分析蛋白質磷酸化。
用MEGA11(https://www.megasoftware.net/index.php)[23]進行UPGMA法構建CesA蛋白進化樹,Bootstrap檢驗(重復次數(shù)500)。利用在線軟件Syntenic(http://brassicadb.org/brad/searchSynteny.php)進行P5CR基因家族同線性分析,基因密度大的為LF,次之的為MF1,最小的為MF2。
使用在線軟件Swiss_Model(https://www.expasy.org/structural_bioinformatics)[24]分析P5CR二級結構。
通過Pfam分析,將候選基因匹配的P5CR結構域區(qū)段提取出來。利用Clustal Omega進行序列比對,并利用在線工具WebLogo3(http://weblogo.threeplusone.com/create.cgi)[25]繪制出結構域logo圖,調查結構域序列特征及其保守氨基酸出現(xiàn)情況。
采用在線軟件MEME(http://meme.nbcr.net/meme/cgi-bin/meme.cgi)[26]分析P5CR基因家族蛋白質序列中特征性motif,并利用Weblogo3繪制出logo圖。
蕓薹屬AC亞基因組P5CR基因家族鑒定結果(見表1)表明,在白菜基因組中獲得兩條序列,位于A03和A10染色體上,分別命名為Bra006270和Bra008735;在甘藍基因組中獲得兩條序列,位于C03和C09染色體上,分別命名為Bol034305和Bol030409。在甘藍型油菜A亞基因組中獲得兩條序列,位于A03和A10染色體上,分別命名為GSBRNA2T00130008001和GSBRNA2T00135564001;C亞基因組中獲得兩條序列,位于C03和C09染色體上,分別命名為GSBRNA2T00140419001和GSBRNA2T00031643001。蕓薹屬AC亞基因組中P5CR基因的CDS序列除Bra006270(1323 bp)外都為831 bp,且都有7個外顯子。
表1 蕓薹屬AC亞基因組中P5CR基因家族的基因信息
順式作用元件分析如圖1所示,結果顯示除了甘藍型油菜A亞基因組上的P5CR基因(GSBRNA2T00135564001)沒有預測到核心啟動子/轉錄因子結合位點外,其余P5CR基因都預測到順式作用元件,在所有預測到順式作用元件的P5CR基因家族啟動子序列中都發(fā)現(xiàn)了光響應(CACGTT、GGTTAAT、ATTAAT)和茉莉酸甲酯的順式作用元件(CGTCA、TGACG)。其次為脫落酸(ACGTG)和缺氧響應元件(AAACCA)。再次為赤霉素反應元件(TCTGTTG、CCTTTTG、TATCCCA),另外還有生長素(TGTCTC、TGACG)的順式作用元件、干旱響應元件(CAACTG)、防御與應激相關順式作用元件(如GAAAAA、GTTTTCTTAC、GTTAGTT和ATTCTCTAAC)和胚乳表達順式作用元件(TGAGTCA)。僅在Bol030409中發(fā)現(xiàn)參與低溫響應元件(CCGAAA)。僅在GSBRNA2T00130008001中發(fā)現(xiàn)參與水楊酸元件(TCAGAAGAGG)。僅在Bra008735中發(fā)現(xiàn)參與玉米醇溶蛋白代謝調節(jié)元件GATGA(C/T)(A/G)TG(A/G)、GTTGACGTGA。僅在Bra006270中發(fā)現(xiàn)參與調控種子發(fā)育的作用元件CATGCATG。說明蕓薹屬AC亞基因組P5CR基因家族除參與光調控通路外,主要參與宿主的防御和逆境脅迫。
圖1 蕓薹屬AC亞基因組P5CR基因上游2000 bp啟動子元件
為進一步探究蕓薹屬AC亞基因組P5CR基因家族成員在基因組間和基因組內的進化關系,構建擬南芥、白菜、甘藍及甘藍型油菜P5CR蛋白的系統(tǒng)發(fā)育樹(圖2),結果顯示P5CR基因家族共形成3個分支。第I類有4個基因,包括Bol034305、GSBRNA2T00140419001、Bra006270和GSBRNA2T00130008001;第II類有2個基因,為Bra008735和GSBRNA2T00135564001;第III類有2個基因,為Bol030409和GSBRNA2T00031643001。親緣關系最近的為甘藍C亞基因組的Bol034305(Chr.03)與甘藍型油菜C亞基因組的GSBRNA2T00140419001(Chr.03),為同一個基因,說明其在進化過程中沒發(fā)生蛋白序列的改變。其次為白菜A亞基因組的Bra006270(Chr.A03)和甘藍型油菜A亞基因組的GSBRNA2T00130008001(Chr.A03),白菜A亞基因組的Bra008735(Chr.A10)和甘藍型油菜A亞基因組的GSBRNA2T00135564001(A10),甘藍C亞基因組的Bol030409(Chr.C09)和甘藍型油菜C亞基因組的GSBRNA2T00031643001(Chr.C09)。關系最遠的為Bra006270和AT5G14800.1,說明擬南芥的P5CR基因最先和白菜組P5CR基因分開。
圖2 P5CR蛋白序列系統(tǒng)進化樹
由于蕓薹屬的3個二倍體基因組和擬南芥基因組來源于相同的二倍體原始基因組,通過對擬南芥、白菜、甘藍和甘藍型油菜的同線性分析(見表2),結果表明,擬南芥P5CR(AT5G14800.1)在蕓薹屬白菜中有2個同源基因,甘藍中有2個同源基因,在甘藍型油菜中有4個,A、C亞基因組上各有2個,這些同源基因位于LF區(qū)或MF區(qū)。
表2 擬南芥P5CR基因在白菜、甘藍和甘藍型油菜共線性區(qū)的同源基因
利用在線軟件Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)對蕓薹屬AC亞基因組中鑒定的P5CR蛋白進行亞細胞定位分析,發(fā)現(xiàn)該蛋白均定位于細胞質。使用ProtParam在線分析工具對P5CR蛋白進行理化性質分析(見表3),結果表明,蕓薹屬AC亞基因組中的白菜組P5CR蛋白均包含20種常見氨基酸。蛋白序列長度最長的為440個氨基酸(Bra006270);其次為326個(Bol030409),剩余全為276個。分子量最大的為47233.01(Bra006270),最小為28624.09(Bra008735);等電點(pI)最高為9.02(Bol030409),最低為6.00(Bol034305、GSBRNA2T00140419001);不穩(wěn)定性系數(shù)最大為37.77(Bra006270),最小為34.58(Bol034305、GSBRNA2T00140419001),8個P5CR均為穩(wěn)定蛋白(<40);脂肪族氨基酸系數(shù)最大為98.59(AT5G14800.1),最小為84.43(Bra006270);帶負電荷氨基酸殘基數(shù)(Asp/Glu)最大值為43(Bra006270),最小值為28(GSBRNA2T00031643001),帶正電荷氨基酸殘基數(shù)(Arg/Lys)最大值為43(Bra006270),最小值為26(Bol034305、GSBRNA2T00140419001)。親疏水性分析發(fā)現(xiàn)肽鏈總體均表現(xiàn)為疏水性(正值),疏水性系數(shù)最大為0.180(Bra008735),最小為0.021(Bra006270),可見這些P5CR蛋白雖然均表現(xiàn)為疏水性,但疏水性強弱差異較大。
表3 蕓薹屬AC亞基因組P5CR蛋白的理化性質
從蕓薹屬AC亞基因組P5CR蛋白氨基酸組成(見圖3)可以看出,P5CR蛋白在氨基酸組成上差異很小,各種氨基酸的含量在P5CR蛋白之間的變化不大。Ala含量最高,其次為Val,表明P5CR蛋白由大量疏水性氨基酸殘基組成,使其表現(xiàn)出較強的疏水性。Cys在白菜組中含量很低,甘藍組和油菜組中不含半胱氨酸(Cys)。均不含有稀有氨基酸吡咯賴氨酸(Pyl)和硒代半胱氨酸(Sec)。
圖3 蕓薹屬AC亞基因組P5CR蛋白氨基酸組成
蛋白質的二級結構是連接一級和高級結構的重要紐帶和橋梁,它為高級結構分析奠定了基礎。對P5CR蛋白的二級結構進行分析(見表4),發(fā)現(xiàn)P5CR蛋白主要由α-螺旋、無規(guī)則卷曲、β-折疊和β-轉角4種結構組成,α-螺旋和無規(guī)則卷曲為主要二級結構元件,分別平均占46.13%和38.21%,β-折疊所占比例較少(平均值15.67%),與人源P5CR蛋白的二級結構比例相似。
表4 P5CR蛋白二級結構預測
蛋白質磷酸化是生物體內普遍存在的一種重要活性調節(jié)機制。使用NetPhos 3.1軟件對蕓薹屬AC
表5 P5CR蛋白的磷酸化位點分析
亞基因組中P5CR蛋白的磷酸化位點進行分析(見表5),結果發(fā)現(xiàn)白菜、甘藍和甘藍型油菜的P5CR均具有多種不同的磷酸化位點。其中,絲氨酸磷酸化位點(Ser)最多為38個(Bra006270),最少為15個(Bol034305、GSBRNA2T00140419001);蘇氨酸磷酸化位點(Thr)最多為16個(Bra006270),最少為7個(Bra008735、GSBRNA2T00130008001);酪氨酸磷酸化位點(Tyr)變化較小,只有Bra006270具有2個,其余都為1個。說明P5CR蛋白的磷酸化主要以絲氨酸和蘇氨酸磷酸化為主。
通過Pfam提取P5CR基因結構域區(qū)段,得到每個基因的特征結構域范圍(見表1)。利用Clustal Omega進行序列比對后,發(fā)現(xiàn)其保守結構域區(qū)段長度約為105個氨基酸。采用WebLogo3繪制出的結構域logo圖(見圖4),P5CR-Dimer Motif為高度保守motif,只在3個位點有多態(tài)性(18位、41位和100位)。
同時通過MEME進行全蛋白的motif分析,基于最大期望值(EM)算法識別motif(見圖5)。按P<0.01標準,在P5CR基因內共找到8個motif區(qū)段,motif 1—motif 4具有50個氨基酸殘基,位于81~130個氨基酸之間,Bra006270從第245個氨基酸開始。Motif 5具有21個氨基酸殘基,位于133~153個氨基酸之間,Bra006270從第297個氨基酸開始。Motif 6和Motif 7為15個氨基酸殘基,位于66~80個氨基酸之間,Bra006270從第230個氨基酸開始。Motif 8為11個氨基酸殘基,位于1~11個氨基酸之間,Bra006270從第165個氨基酸開始。8個P5CR基因都含有motif 1—motif 8。
圖4 P5CR-dimer結構域
圖5 各蛋白質motif序列和分布
植物基因家族擴張主要通過全基因組加倍和基因串聯(lián)重復兩種方式,P5CR基因在不同植物中的拷貝數(shù)差異較大,但在不同植物中非常保守[17,27],本研究也表明蕓薹屬AC亞基因組在演化過程中,P5CR基因數(shù)目及其特征穩(wěn)定,可能在不同植物中P5CR具有相同的基因功能。
對蕓薹屬AC亞基因組上的P5CR基因啟動子區(qū)的預測表明,該基因除含有轉錄增強因子外,還含有與誘導表達相關的順式作用元件,如光響應、激素響應、脅迫響應和植物生長發(fā)育等順式作用元件。在植物防御反應中,有大量轉錄因子的參與,而茉莉酸甲酯在大部分情況下誘導這些轉錄因子轉錄,這與本研究鑒定到的8個P5CR基因都預測到茉莉酸甲酯、脅迫應激等反應順式元件相互印證,也與前人報道的該基因為轉錄水平調控吻合。
研究顯示來源于進化程度更高的C亞基因組上的P5CR基因啟動子區(qū)域具有干旱、低溫等應答應激的順式元件,而A亞基因組上的P5CR基因啟動子區(qū)域沒有。系統(tǒng)發(fā)育樹表明,同為十字花科的擬南芥中的P5CR基因最先和白菜型油菜中的P5CR基因分開,也驗證了A亞基因組在蕓薹屬演化過程中為最原始。
P5CR基因參與植物滲透脅迫的報道很多,但與植物病原菌脅迫關聯(lián)的報道只出現(xiàn)在大豆中[28]。大豆中與菌核病抗性強關聯(lián)的P5CR基因(Glyma-03gl29100)同源比對到甘藍型油菜中的A10和C09染色體上,而A10染色體上的P5CR基因2000 bp啟動子區(qū)域沒有預測到順式作用元件,可能A10上的P5CR基因為一個假基因,而C09上的P5CR預測出啟動子區(qū)含有HNF-1、INF.1、TCR-beta_decamer、c-fos_US5、beta-pol_CS、EivF/CREB、EivF、ATF、CREB、GCF、TFIID、TATA等元件。其中ATF(活化轉錄因子)以3次且權重最高被預測到;CREB被3次預測到,它能刺激基因轉錄,被稱為轉錄增強因子。綜上,本研究通過對蕓薹屬AC亞基因組P5CR基因家族的生物信息學分析,可以為深入研究該屬植物P5CR基因家族的功能和調控機制提供基礎數(shù)據(jù)。