田驕陽(yáng),王秋霞,鄭淑文,劉文獻(xiàn)
(蘭州大學(xué)草地農(nóng)業(yè)生態(tài)系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)農(nóng)業(yè)農(nóng)村部草牧業(yè)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)草地農(nóng)業(yè)教育部工程研究中心,蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,甘肅 蘭州 730020)
轉(zhuǎn)錄因子(transcription factors)是一類能夠與DNA 特異序列結(jié)合并調(diào)節(jié)翻譯過程的蛋白質(zhì),由轉(zhuǎn)錄調(diào)控區(qū)、核定位信號(hào)區(qū)、寡聚位點(diǎn)和DNA 結(jié)合區(qū)組成,通過4 個(gè)區(qū)域相互協(xié)同,激活或抑制下游基因轉(zhuǎn)錄[1]。轉(zhuǎn)錄因子能夠參與環(huán)境脅迫響應(yīng)、代謝調(diào)節(jié)、物質(zhì)生成等生命過程[2],在動(dòng)植物生長(zhǎng)發(fā)育及應(yīng)激反應(yīng)中具有重要作用,是深入解析生命活動(dòng)分子調(diào)控機(jī)制的關(guān)鍵環(huán)節(jié)。CPP(cysteine-rich polycomb-like protein)基因家族是一類小轉(zhuǎn)錄因子,廣泛存在于除酵母與原核生物外的各種生物中[3]。CPP 轉(zhuǎn)錄因子中包含一個(gè)或兩個(gè)富含半胱氨酸的CXC 功能域(PF03638),保守序列的結(jié)構(gòu)為CXCX4CX3YCXCX6CX3CXCX2C,并被一個(gè)含有短的保守序列RNPXAFXPK 的基序分隔[3]。CXC 結(jié)構(gòu)域可以通過結(jié)合DNA 對(duì)靶基因起調(diào)控作用[4]。突變的CXC 保守結(jié)構(gòu)域失去與DNA 結(jié)合活性,抑制細(xì)胞周期進(jìn)程,導(dǎo)致細(xì)胞核形態(tài)異常[5]。CXC 結(jié)構(gòu)域在不同植物中高度保守,可通過DNA 結(jié)合來誘導(dǎo)基因的抑制或表達(dá)[6]。隨著植物基因組測(cè)序的相繼完成,在全基因組水平對(duì)CPP基因家族的鑒定和分析成為可能。截至目前,已在擬南芥(Arabidopsis thaliana)[7]、水稻(Oryza sativa)[7]、大豆(Glycine max)[8]、玉米(Zea mays)[9]、黃瓜(Cucumis sativus)[10]、茶樹(Camellia sinensis)[11]等物種中分別鑒定到8、11、20、13、5、11 個(gè)CPP基因,從而為深入解析該基因家族的生物學(xué)功能奠定了基礎(chǔ)。
前人研究發(fā)現(xiàn),CPP基因家族在植物生長(zhǎng)發(fā)育及響應(yīng)脅迫過程中具有重要作用。例如,TSO1是在擬南芥中發(fā)現(xiàn)的第一個(gè)CPP 轉(zhuǎn)錄因子,在調(diào)節(jié)細(xì)胞分裂以及開花中起到重要作用[12-13]。AtTSO1編碼一個(gè)花特異性的細(xì)胞分裂成分,該基因突變會(huì)導(dǎo)致花分生組織細(xì)胞分裂過程受到影響,表現(xiàn)為細(xì)胞壁形成受阻以及DNA 倍性增加,導(dǎo)致突變體花的細(xì)胞核大小和形狀不規(guī)則[12]。另外,TSO1 和MYB3R1 形成一個(gè)調(diào)節(jié)模塊,協(xié)調(diào)芽和根組織細(xì)胞增殖與分化,造成莖和根分生組織收縮,從而導(dǎo)致地上部分和根部發(fā)育嚴(yán)重異常[11]。大豆中的GmCPP1能夠與血紅蛋白基因Gmlbc3的啟動(dòng)子相互作用,參與共生根瘤中大豆血紅蛋白基因的調(diào)控[14]。GhCPP基因在陸地棉(Gossypium hirsutum)的雌蕊中高度表達(dá),可能參與了花器官和雌蕊發(fā)育的調(diào)控過程。此外,CPP基因家族也在響應(yīng)多種應(yīng)激脅迫過程中發(fā)揮功能。通過qRT-PCR 對(duì)13 個(gè)ZmCPP基因的表達(dá)分析表明,大多數(shù)ZmCPP基因的表達(dá)在熱應(yīng)激24 h 和冷應(yīng)激12 h 后達(dá)到峰值[9]。大豆中GmCPP 轉(zhuǎn)錄因子除GmCPP03和GmCPP07外,其余18 個(gè)基因均在調(diào)節(jié)熱應(yīng)激反應(yīng)中起重要作用[8]。另外,黃瓜CsCPP基因能夠以依賴脫落酸的方式提高植物對(duì)逆境的耐性[10]。
蒺藜苜蓿(Medicago truncatula)是一種豆科模式植物,具有基因組?。?70 Mb)、自花授粉、植株再生時(shí)間短以及突變體多樣的特點(diǎn)[15]。另外,蒺藜苜蓿與大多數(shù)豆科植物有著較高的遺傳相似性,通過研究蒺藜苜蓿可以為其他豆科植物,特別是紫花苜蓿(Medicago sativa)提供理論依據(jù)[16]。隨著蒺藜苜?;蚪M測(cè)序的完成,多種蒺藜苜蓿基因家族,例如LBD 家族[17]、AQPs 家族[18]、FAD 家族[19]被鑒定和系統(tǒng)研究,從而為深入解析蒺藜苜蓿生長(zhǎng)發(fā)育調(diào)控及逆境脅迫響應(yīng)過程提供了重要基因資源。截至目前,蒺藜苜蓿CPP基因家族的相關(guān)研究尚未見報(bào)道。本研究以蒺藜苜?;蚪M數(shù)據(jù)為基礎(chǔ),利用生物信息學(xué)方法對(duì)全基因組水平的蒺藜苜蓿CPP基因家族進(jìn)行鑒定,進(jìn)而對(duì)不同家族成員的理化性質(zhì)、結(jié)構(gòu)特征、順式作用元件、進(jìn)化關(guān)系及壓力、染色體位置等進(jìn)行系統(tǒng)分析。此外,對(duì)CPP基因家族在蒺藜苜蓿不同組織及非生物脅迫下的表達(dá)模式進(jìn)行研究,以期為后期深入研究蒺藜苜蓿CPP基因家族功能以及通過基因工程技術(shù)創(chuàng)制高抗逆苜蓿新種質(zhì)提供理論依據(jù)。
本試驗(yàn)于2020 年7 月-2021 年3 月進(jìn)行。根據(jù)Pfam(http://pfam. sanger. ac. uk/search)[20]數(shù)據(jù)庫(kù)獲得的CPP 的保守結(jié)構(gòu)域(PF03638),從Phytozome 網(wǎng)站(https://phytozome.jgi.doe.gov/pz/portal.html)下載蒺藜苜蓿CPP基因家族的蛋白質(zhì)編碼區(qū)(coding sequence, CDS)和蛋白序列。通過HMMER(http://www.ebi.ac.uk/)[21]驗(yàn) 證 保 守 結(jié) 構(gòu) 域。在ExPASy 網(wǎng) 站(http://www. expasy. org/)分 析 等 電 點(diǎn)(isoelectric point),分 子 量(molecular weight)和親水指數(shù)(grand average of hydropathicity)等參數(shù)[22]。通過WoLF-PSORT(https://www.genscript.com/wolf-psort.html)網(wǎng)站對(duì)MtCPP 蛋白亞細(xì)胞定位進(jìn)行預(yù)測(cè)分析[23]。
擬南芥、水稻及大豆的CPP 蛋白序列分別從http://www. arabidopsis. org/,http://rice. plantbiology. msu.edu/,http://phyozome. jgi. doe. gov/soybean 下載。利用MEGA 7.0 軟件(http://www. megasoftware. net/)及Bioedit 軟件構(gòu)建系統(tǒng)發(fā)育樹,方法為最大似然法(maximum likelihood estimate),設(shè)置最大循環(huán)數(shù)為1000[24]。利用MCScanX 和TBTools 軟件進(jìn)行基因區(qū)塊識(shí)別并計(jì)算同義替換率(the ratio of the number of synonymous substitutions per synonymous site,Ks)、非同義替換率(the ratio of the number of nonsynonymous substitutions per nonsynonymous site,Ka)[25-26]。
利用Mapchart 軟件對(duì)MtCPP基因染色體定位進(jìn)行作圖。通過GSDS 2.0 網(wǎng)站(http://gsds.cbi.pku.edu.cn)分析蒺藜苜蓿的外顯子-內(nèi)含子結(jié)構(gòu)。MtCPP基因的啟動(dòng)子區(qū)(翻譯起始密碼子上游2000 bp)從蒺藜苜?;蚪M數(shù)據(jù)中獲得,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對(duì)啟動(dòng)子順式作用元件進(jìn)行分析。利用MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi)分析蒺藜苜蓿保守結(jié)構(gòu)域,采用TBtools 工具進(jìn)行作圖[27]。
為分析MtCPP基因在不同器官及非生物脅迫下的表達(dá)模式,從Noble 網(wǎng)站(https://mtgea. noble.org/v3/blastt_search_form.php)中獲取不同MtCPP基因探針,并獲得了對(duì)應(yīng)探針在葉、葉柄、葉芽、幼苗、莖、花、莢果、種衣、種子、根等組織中以及干旱脅迫和鹽脅迫下的表達(dá)量。干旱處理是對(duì)幼苗和根組織干旱脅迫2、3、4、7、10、14 d 以及解除脅迫后1、2、4 d。鹽處理是利用200 mmol·L-1NaCl 對(duì)根 組織處理1、2、5、10 和24 h。最后使用TBtools 軟件構(gòu)建表達(dá)熱圖。
通過Pfam 結(jié)構(gòu)域搜索最終在蒺藜苜蓿基因組共鑒定出9 個(gè)CPP基因家族成員,分別重新命名為MtCPP1~MtCPP9。利用在線網(wǎng)站對(duì)MtCPP基因編碼蛋白的長(zhǎng)度、分子量、理論等電點(diǎn)、親水性和亞細(xì)胞定位進(jìn)行分析。MtCPP基因的編碼序列長(zhǎng)度介于924(MtCPP5)~2604 bp(MtCPP1),蛋白質(zhì)由307(MtCPP5)~867 AA(MtCPP1)個(gè) 氨基酸 組 成,分 子 量 為34610.89~93893.24 Da,等 電 點(diǎn)介于4.60~8.93,其 中MtCPP1 和MtCPP3 等電點(diǎn)小于6.5,為酸性氨基酸;MtCPP5、MtCPP6 和MtCPP9 等電點(diǎn)大于8,為堿性氨基酸。此外,MtCPP家族的蛋白質(zhì)親水性范圍為-0.802(MtCPP4)~-0.169(MtCPP5),9 個(gè)蛋白質(zhì)均為親水性蛋白質(zhì)。根據(jù)WoLF PSORT 預(yù)測(cè),除MtCPP5為葉綠體基因外,其他8 個(gè)基因都為核基因(表1)。
表1 MtCPP 家族基本信息Table 1 The basic information of MtCPP gene family in M.truncatula
為了研究MtCPP基因家族成員的系統(tǒng)進(jìn)化特征,利用MEGA 7.0 軟件構(gòu)建了蒺藜苜蓿與擬南芥、水稻和大豆CPP 家族之間的系統(tǒng)發(fā)育樹(圖1)?;谙到y(tǒng)發(fā)育樹,可將CPP 蛋白分為A、B、C 三組。A 組中包含7 個(gè)GmCPP 蛋白、3 個(gè)MtCPP 蛋白及1 個(gè)OsCPP 蛋白。在A 組中,除了OsCPP4 來源于單子葉植物外,其余蛋白都來源于雙 子葉植物。B 組包含3 個(gè)MtCPP 蛋 白、6 個(gè)GmCPP 蛋 白、5 個(gè)OsCPP 蛋白及4 個(gè)AtCPP 蛋白。C 組含有3 個(gè)MtCPP 蛋白、7 個(gè)GmCPP 蛋白、5 個(gè)OsCPP 蛋白及4 個(gè)AtCPP 蛋白。由以上 結(jié)果發(fā)現(xiàn),MtCPP基因均勻地分布于3 組中;3 組中均含有單子葉與雙子葉基因,表明CPP基因是在單子葉和雙子葉分化前形成的[7]。在B和C 組中,蒺藜苜蓿的CPP 基因與大豆的遺傳距離較近,如B 組中MtCPP6 與GmCPP5、GmCPP7,C 組中MtCPP1 與GmCPP16、GmCPP17、GmCPP18,表明雙子葉和單子葉植物在分化后沿著不同方向進(jìn)化[7]。研究表明,A 組中的GmCPP1 可以調(diào)節(jié)豆血紅蛋白的合成[14],因此,同組的蒺藜苜蓿MtCPP基因可能具有類似的功能。C 組中的AtCPP4 和AtCPP5 分別對(duì)應(yīng)SOL1、TSO1基因的蛋白序列,在花器官中表達(dá),并調(diào)控花的發(fā)育[3],因此C 組中的MtCPP基因功能可能與花的發(fā)育有關(guān)。
圖1 MtCPP 基因家族進(jìn)化分析Fig. 1 The phylogenetic analysis of MtCPP gene family
為了探究MtCPPs 的進(jìn)化模式、選擇壓力,對(duì)MCScanX 篩選出的兩對(duì)MtCPP同源基因(MtCPP6和MtCPP9、MtCPP8和MtCPP9)計(jì)算非同義/同義替換比(Ka/Ks),結(jié)果如表2 所示,兩對(duì)MtCPP基因的Ka都明顯小于Ks,Ka/Ks都小于1,表明在MtCPP基因進(jìn)化過程中,主要是凈化選擇發(fā)揮作用[28]。
表2 MtCPP 基因進(jìn)化壓力分析Table 2 Evolutionary stress analysis of MtCPP genes
根據(jù)蛋白序列分析發(fā)現(xiàn)(圖2),大部分MtCPP 中有兩個(gè)CXC 保守結(jié)構(gòu)域以及在兩個(gè)保守結(jié)構(gòu)域之間的R 基序;兩個(gè)CXC 結(jié)構(gòu)域中都富含9 個(gè)保守的半胱氨酸(cysteine,Cys),在R 基序中含有相對(duì)保守的RNPXAFXPK 序列。有研究表明CXC 結(jié)構(gòu)域可以結(jié)合特定DNA 序列[13]。另外,并不是所有MtCPP 都具有兩個(gè)CXC 保守結(jié)構(gòu)域,其中MtCPP2 缺少CXC1 結(jié)構(gòu)域,并且在CXC1 區(qū)域具有較多的冗余氨基酸序列,這與前人研究結(jié)果相同[7]。MtCPP5 缺少CXC2 部分序列;MtCPP3 的CXC2 保守結(jié)構(gòu)域較短,其原因?yàn)镹 端丟失了含有3 個(gè)保守半胱氨酸的11 個(gè)氨基酸序列;缺失和缺少CXC 結(jié)構(gòu)域可能會(huì)影響基因功能的發(fā)揮。蒺藜苜蓿MtCPP 家族的CXC1 結(jié)構(gòu)域保守性高于CXC2 結(jié)構(gòu)域,這一結(jié)果與水稻[29]、擬南芥[29]、茶樹[11]等的研究結(jié)果一致。
圖2 MtCPP 氨基酸序列比對(duì)Fig. 2 Multiple alignments of the amino acid sequences of MtCPPs
為了進(jìn)一步驗(yàn)證CPP 轉(zhuǎn)錄因子在蒺藜苜蓿中的保守結(jié)構(gòu)域,使用MEME 軟件對(duì)蒺藜苜蓿的7 個(gè)結(jié)構(gòu)域進(jìn)行分析(圖3)。結(jié)果表明,9 個(gè)MtCPP 蛋白的結(jié)構(gòu)域長(zhǎng)度介于11~49 AA,分別含有2~7 個(gè)保守結(jié)構(gòu)域。除MtCPP2 以外,其他家族成員均含有保守結(jié)構(gòu)域1(位于CXC1 的N 端);除MtCPP5 以外,其他家族成員均含有保守結(jié)構(gòu)域5(位于CXC1 的C 端)。保守結(jié)構(gòu)域2 和7 在多個(gè)MtCPP 蛋白中存在。雖然MtCPP基因家族在進(jìn)化過程中發(fā)生分化,但一些基序在特定的亞家族中具有保守性,例如,MtCPP6、MtCPP8、MtCPP9 三個(gè)成員之間以及MtCPP1、MtCPP4、MtCPP7 三個(gè)成員之間均具有相同的保守結(jié)構(gòu)域。
圖3 基于綜合系統(tǒng)發(fā)育樹的MtCPPs 特征分析Fig. 3 Characteristic features of the MtCPPs based on the comprehensive phylogenetic tree
為進(jìn)一步了解MtCPP基因的結(jié)構(gòu)差異,進(jìn)一步比較了MtCPP的全長(zhǎng)基因序列及結(jié)構(gòu)差異(圖4)。結(jié)果表明,MtCPP基因家族片段長(zhǎng)度差異較大,MtCPP5的片段長(zhǎng)度最短,MtCPP2的片段長(zhǎng)度最長(zhǎng)。MtCPP基因內(nèi)含子數(shù)目在6~16 個(gè)之間,外顯子數(shù)目在7~17 個(gè)之間。同一亞組的內(nèi)含子數(shù)目相近,如MtCPP6與MtCPP9都具有6 個(gè)內(nèi)含子;MtCPP1和MtCPP7基因結(jié)構(gòu)特征類似,但MtCPP7較MtCPP1缺少1 個(gè)內(nèi)含子。
圖4 MtCPP 系統(tǒng)發(fā)育關(guān)系及基因結(jié)構(gòu)分析Fig. 4 Phylogenetic relationships and gene structure of MtCPP genes
轉(zhuǎn)錄因子通過與啟動(dòng)子特定序列結(jié)合對(duì)基因轉(zhuǎn)錄的起始與表達(dá)進(jìn)行調(diào)控,進(jìn)而在調(diào)控植物生長(zhǎng)發(fā)育及響應(yīng)逆境脅迫過程中發(fā)揮重要作用。為了預(yù)測(cè)MtCPP基因家族成員在響應(yīng)逆境脅迫方面的潛在功能,通過PlantCare 網(wǎng)站(http://www.bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析了不同MtCPP家族成員2000 bp 長(zhǎng)度啟動(dòng)子中的順式作用元件[30]。結(jié)果如圖5 所示,以激素調(diào)節(jié)和逆境脅迫為篩選條件,共在9 個(gè)基因啟動(dòng)子中篩選了15 種順式作用元件,分別為無(wú)氧誘導(dǎo)(ARE、GC-motif)、水楊酸反應(yīng)(TCA-element)、防御和壓力反應(yīng)(TC-rich repeats)、茉莉酸甲酯反應(yīng)(CGTCA-motif、TGACG-motif)、干旱誘導(dǎo)(MBS)、類黃酮生物合成基因調(diào)控(MBSI)、脫落酸反應(yīng)(ABRE)、赤霉素反應(yīng)(GARE-motif、P-box、TATC-box)、創(chuàng)傷反應(yīng)(WUN-motif)以及生長(zhǎng)素反應(yīng)(AuxRR-core、TGA-element)。結(jié)果表明,平均每個(gè)基因中含有7 個(gè)順式作用元件。其中,MtCPP5和MtCPP6含有最多與激素調(diào)節(jié)和逆境脅迫相關(guān)的順式作用元件(13 個(gè)),MtCPP3中順式作用元件最少(2 個(gè));MtCPP1、MtCPP2、MtCPP5、MtCPP6中有較多的無(wú)氧誘導(dǎo)元件,MtCPP5和MtCPP7中有較多的創(chuàng)傷誘導(dǎo)元件??刂祁慄S酮生物合成基因啟動(dòng)子調(diào)控元件僅在MtCPP3中存在。具有干旱誘導(dǎo)元件的基因有MtCPP2、MtCPP5、MtCPP6、MtCPP7;MtCPP4、MtCPP5、MtCPP9具有脫落酸誘導(dǎo)元件,而MtCPP7和MtCPP8啟動(dòng)子中具有生長(zhǎng)素誘導(dǎo)元件。
圖5 MtCPP 基因啟動(dòng)子順式作用元件分析Fig. 5 The analysis of cis-elements in the promoters of MtCPP genes
通過分析蒺藜苜蓿GFF3 文件獲取9 個(gè)MtCPP基因的染色位置進(jìn)行染色體定位。結(jié)果如圖6 所示,9 個(gè)MtCPP定位在6 條染色體上。其中,4 個(gè)基因(MtCPP1、MtCPP2、MtCPP3、MtCPP4)定位在1 號(hào)染色體上;2、3、5、6、8 號(hào)染色體上都包含一個(gè)基因。相較于其他染色體,染色體1 上存在密度較大的基因簇,其中,MtCPP3與MtCPP4為串聯(lián)重復(fù)?;诨蛑貜?fù)分析,在MtCPP6與MtCPP9、MtCPP8和MtCPP9之間發(fā)生了兩個(gè)片段重復(fù)事件,預(yù)測(cè)這些基因在進(jìn)化過程中可能來源于片段重復(fù)與串聯(lián)重復(fù)。
圖6 MtCPP 基因家族共線性分析Fig. 6 The collinearity analysis of MtCPP gene family
為了進(jìn)一步解析MtCPP基因的表達(dá)模式,基于蒺藜苜蓿探針提取了9 個(gè)MtCPP基因不同組織、相同組織不同時(shí)期以及逆境脅迫下的56 個(gè)表達(dá)芯片數(shù)據(jù)[31]并進(jìn)行熱圖制作,基因表達(dá)強(qiáng)度用紅-黃-藍(lán)聚類圖指示。從紅色到黃色最后到藍(lán)色,基因的表達(dá)量逐漸降低,結(jié)果如圖7 所示。在營(yíng)養(yǎng)器官及發(fā)育時(shí)期特異性方面,根據(jù)聚類分析可將9 個(gè)基因劃分為兩類(圖7A),MtCPP1~MtCPP4為Ⅰ類,MtCPP5~MtCPP9為Ⅱ類。Ⅰ類基因在根中相對(duì)表達(dá)量較高,表明Ⅰ類基因主要為根表達(dá)基因。Ⅰ類中只有MtCPP1基因在種衣中表達(dá)量較高,Ⅱ類中除MtCPP5基因外,其余4 個(gè)基因在種衣中表達(dá)量均較高。在莢果中,Ⅰ類基因表達(dá)量較高,Ⅱ類基因中除了MtCPP5,其余基因表達(dá)量均較低。MtCPP1、MtCPP2、MtCPP5和MtCPP8基因在種子授粉后表達(dá)量在種子中下降,MtCPP2在種子授粉后20 d,達(dá)到最低值;MtCPP1、MtCPP5和MtCPP8在種子授粉后36 d 達(dá)到最低值,表明這4 個(gè)基因可能主要在植物的營(yíng)養(yǎng)生長(zhǎng)過程中發(fā)揮作用。MtCPP3表達(dá)量在授粉后上升,可能在植物的生殖生長(zhǎng)中發(fā)揮作用。MtCPP5基因主要在葉芽和種子中表達(dá);MtCPP8基因隨著莖的發(fā)育表達(dá)量增加;MtCPP9基因在花、葉以及莢果中表達(dá)量較高。
圖7 MtCPP 基因不同組織及響應(yīng)脅迫表達(dá)模式分析Fig. 7 Analysis of MtCPP gene expression profiles in different tissues and stress
水分脅迫處理基因表達(dá)數(shù)據(jù)分析結(jié)果顯示(圖7B),對(duì)幼苗和根脅迫處理后,MtCPP6和MtCPP7基因被誘導(dǎo)表達(dá),并在解除脅迫后表達(dá)量降低,表明MtCPP6和MtCPP7基因在響應(yīng)干旱脅迫方面可能發(fā)揮著重要作用。對(duì)根進(jìn)行干旱脅迫后,MtCPP2和MtCPP5基因表達(dá)量升高,可能為根特異性干旱脅迫響應(yīng)基因。MtCPP4、MtCPP5、MtCPP8、MtCPP9基因在受脅迫后表達(dá)量降低,解除脅迫后表達(dá)量升高,根中MtCPP1基因受干旱脅迫影響,表明這些基因受干旱脅迫的影響。MtCPP1和MtCPP2基因在幼苗中對(duì)干旱脅迫不敏感,MtCPP8基因?qū)Ω母珊得{迫不敏感,表明MtCPP基因在響應(yīng)干旱過程中具有組織特異性。MtCPP2、MtCPP8在鹽脅迫誘導(dǎo)的條件下表達(dá)量升高,表明MtCPP2、MtCPP8是植物響應(yīng)鹽脅迫的重要基因。MtCPP1、MtCPP5、MtCPP6、MtCPP7基因在鹽脅迫條件下表達(dá)量降低,表明鹽脅迫影響著這4 個(gè)基因的表達(dá)(圖7C)。
CPP基因普遍存在于植物和動(dòng)物基因組中,截至目前,CPP基因家族的一些成員已經(jīng)在模式植物中進(jìn)行了廣泛的研究,例如大豆和擬南芥[12,14]。并且發(fā)現(xiàn)CPP家族的基因在調(diào)控生長(zhǎng)發(fā)育及響應(yīng)逆境脅迫過程中具有重要的生物學(xué)功能[11]。然而,蒺藜苜蓿MtCPP基因家族尚未進(jìn)行鑒定,其生物學(xué)功能仍不清晰。本研究利用生物信息學(xué)方法,在蒺藜苜蓿中共鑒定出9 個(gè)CPP家族基因,不均勻分布在蒺藜苜蓿6 條染色體上。其中MtCPP3與MtCPP4為串聯(lián)重復(fù),MtCPP6與MtCPP9、MtCPP8與MtCPP9為片段重復(fù)。因此,蒺藜苜蓿CPP基因家族進(jìn)化過程中,串聯(lián)重復(fù)以及片段重復(fù)可能起到了重要的促進(jìn)作用。
CPP基因家族廣泛存在著兩個(gè)CXC 保守結(jié)構(gòu)域及保守結(jié)構(gòu)域之間的保守R 基序[4]。其中,CXC 保守結(jié)構(gòu)域廣泛存在于動(dòng)物和植物中,但動(dòng)物中的CPP同源基因缺失兩個(gè)CXC 保守基序之間的保守R 基序[3]。在兩個(gè)CXC結(jié)構(gòu)域中具有9 個(gè)保守的半胱氨酸,C1 結(jié)構(gòu)域的保守性大于C2 結(jié)構(gòu)域,該特征廣泛存在于蒺藜苜蓿、水稻[7]、擬南芥[7]、黃瓜[10]等CPP基因家族中。多重序列比對(duì)結(jié)果顯示,并非所有的CPP 家族蛋白都有3 個(gè)完整的跨膜結(jié)構(gòu)域。蒺 藜 苜 蓿MtCPP5 只 含 有C1 保 守 結(jié) 構(gòu) 域,與 水 稻OsCPP4 相 同[10];MtCPP7 只 含 有C2 結(jié) 構(gòu) 域,與 小 麥(Triticum aestivum)中TaCPP3 和TaCPP4[32]相同;其余7 個(gè)MtCPP 均含有C1 和C2 結(jié)構(gòu)域。較多的冗余氨基酸出現(xiàn)在MtCPP2 兩種蛋白C1 結(jié)構(gòu)域的第3 和4 個(gè)半胱氨酸殘基之間,而MtCPP3 在C1 的N 端則缺失16 個(gè)氨基酸,包括3 個(gè)半胱氨酸殘基,與AtCPP6 研究結(jié)果類似[7]。目前,已有研究表明兩個(gè)CXC 結(jié)構(gòu)域和兩個(gè)結(jié)構(gòu)域之間的保守結(jié)構(gòu)域間存在著高度相關(guān),并共同進(jìn)化,兩個(gè)結(jié)構(gòu)域相互協(xié)同發(fā)揮特定功能,一個(gè)結(jié)構(gòu)域中氨基酸序列的變化將導(dǎo)致另一個(gè)結(jié)構(gòu)域中的反選擇或補(bǔ)償變化[33],缺失某部分CXC 可能會(huì)導(dǎo)致兩個(gè)CXC 結(jié)構(gòu)域之間的相互作用及其功能喪失。本研究中MtCPP6 和MtCPP9 來自片段重復(fù),有著相同的保守結(jié)構(gòu)域,并且它們的基因結(jié)構(gòu)也非常相似,推測(cè)它們可能具有相同的功能。
為了進(jìn)一步探究蒺藜苜蓿的進(jìn)化關(guān)系,本研究通過與其他3 個(gè)已鑒定物種的CPP 蛋白的系統(tǒng)進(jìn)化進(jìn)行了分析,進(jìn)而可將MtCPP分為A、B、C 三個(gè)類群。在A 組中,除1 個(gè)水稻基因外,其他都為大豆和蒺藜苜蓿CPP基因,表明同為豆科植物的CPP家族之間的親緣關(guān)系更為相近。其他兩組中均含有4 個(gè)物種基因,以上結(jié)果說明單子葉植物與雙子葉植物擁有共同的進(jìn)化起源以及不同方向的進(jìn)化選擇[7]。這種進(jìn)化關(guān)系在水稻的SAUR基因家族[34]、擬南芥和水稻的Dof基因家族[29]等中都有類似報(bào)道。另外,進(jìn)化關(guān)系相近的蛋白之間表現(xiàn)出更為相近的生物學(xué)功能。本研究中,A 組中的大豆CPP1 蛋白具有調(diào)節(jié)豆血紅蛋白合成的功能[14],C 組中擬南芥的SOL1及TSO1在調(diào)節(jié)花器官的發(fā)育方面具有重要功能[12-13],從而為與這些功能已知CPP基因進(jìn)化關(guān)系更近的蒺藜苜蓿CPP基因的進(jìn)一步生物學(xué)功能解析提供了參考和指導(dǎo)。
赤霉素在響應(yīng)干旱、水淹、鹽脅迫方面發(fā)揮著重要作用[35]。MtCPP5、MtCPP6和MtCPP7中含有多種與激素相關(guān)的順式作用元件,表明這3 個(gè)基因可能受多種激素調(diào)控響應(yīng)逆境脅迫。CPP基因家族參與植物對(duì)多種非生物脅迫的反應(yīng)。在本研究中,9 個(gè)MtCPP基因在干旱和鹽脅迫處理的不同時(shí)間點(diǎn)表現(xiàn)出不同的表達(dá)模式。在干旱脅迫下,MtCPP2、MtCPP5、MtCPP6和MtCPP7被誘導(dǎo)表達(dá),其中MtCPP2和MtCPP5僅在根中誘導(dǎo)表達(dá)。前人研究中,干旱脅迫導(dǎo)致玉米中ZmCPP1.1、ZmCPP7.1、ZmCPP9、ZmCPP12在處理12 h 后上調(diào)表達(dá)[9];大豆[8]、黃瓜[10]、茶樹[11]等研究中也表明CPP家族一些基因具有抗旱作用。啟動(dòng)子是調(diào)控基因表達(dá)及響應(yīng)逆境脅迫的重要順式調(diào)控元件。植物激素在響應(yīng)脅迫方面發(fā)揮重要作用。干旱條件下,脫落酸調(diào)節(jié)植物氣孔的開閉并參與抗逆基因的表達(dá)調(diào)控。MtCPP5基因中含有脫落酸和干旱誘導(dǎo)順式作用元件,可能通過依賴脫落酸的方式發(fā)揮抗旱作用。對(duì)茶樹的CsCPP基因進(jìn)行qRT-PCR 分析,6 個(gè)基因在干旱和脫落酸處理后上調(diào)表達(dá),并且啟動(dòng)子區(qū)分布有抗旱及脫落酸相關(guān)的順式作用元件[11]。黃瓜CsCPP基因的抗逆性依賴于脫落酸調(diào)節(jié)作用[10]。在外源脫落酸的作用下,橡膠樹(Hevea brasiliensis)葉片HbCPP1表達(dá)量升高[36]。這些結(jié)論表明,CPP基因家族中的部分基因可能通過脫落酸的調(diào)節(jié)誘導(dǎo)植物發(fā)揮抗旱功能。
CPP基因家族的一些基因與生殖相關(guān)。例如,擬南芥的TSO1影響著胚珠、花粉的生長(zhǎng);SOL1主要在花粉中表達(dá)[3];黃瓜CsCPP4參與黃瓜的子房發(fā)育[10];巴西橡膠樹HbCPP1基因隨著花器官的生長(zhǎng)表達(dá)量增加[36]。本研究發(fā)現(xiàn),MtCPP9在花器官及莢果中大量表達(dá),并隨著生殖階段的變化而在不同生殖器官差異表達(dá),MtCPP9可能參與蒺藜苜?;ㄆ鞴俚陌l(fā)育以及生殖調(diào)控過程。B 類基因除MtCPP5以外,其他基因均可能參與種皮的形成,可能在生殖生長(zhǎng)的后期發(fā)揮重要作用。另外,CPP基因在植物的營(yíng)養(yǎng)生長(zhǎng)方面也起到重要作用,例如,TSO1與MYB3R1結(jié)合共同調(diào)節(jié)擬南芥根和芽的分化[14];北美鵝掌楸(Liriodendron tulipifera)中LtTCX2基因在葉中大量表達(dá);大豆中GmCPP16在幼嫩葉片和根瘤中特異表達(dá)[8]。本研究發(fā)現(xiàn)MtCPP3、MtCPP8、MtCPP9分別在根、莖、葉中大量表達(dá),暗示這些MtCPP基因可能對(duì)營(yíng)養(yǎng)生長(zhǎng)發(fā)育過程具有重要調(diào)控作用。
本研究在全基因組水平首次鑒定分析了蒺藜苜蓿的9 個(gè)CPP基因,發(fā)現(xiàn)MtCPP基因中存在著CXC 保守結(jié)構(gòu)域,可能為MtCPP基因發(fā)揮功能的關(guān)鍵因素。系統(tǒng)發(fā)育分析表明MtCPP基因與大豆CPP基因親緣關(guān)系較近。此外,9 個(gè)MtCPP基因表達(dá)模式具有一定的時(shí)空特異性,并具有響應(yīng)干旱和鹽脅迫的特性。本研究結(jié)果可為進(jìn)一步研究MtCPP在植物逆境響應(yīng)中的調(diào)控機(jī)制和功能提供基礎(chǔ),也可為在其他豆科植物,特別是在紫花苜蓿中鑒定和分析CPP家族基因功能提供一定參考。