胡祥祥,許 姣,2,宋夢(mèng)瑤,2,朱畇昊,2
(1.河南中醫(yī)藥大學(xué)藥學(xué)院,河南鄭州 450046; 2.呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南鄭州 450046)
Ca2+作為第二信使,負(fù)責(zé)協(xié)調(diào)植物對(duì)內(nèi)外界各種刺激的感知,在植物體內(nèi)多種信號(hào)途徑傳導(dǎo)過程中起重要作用。鈣信號(hào)感應(yīng)器識(shí)別Ca2+濃度變化,將信號(hào)傳遞至下游級(jí)聯(lián)系統(tǒng),激活植物逆境響應(yīng)機(jī)制。鈣依賴蛋白激酶(CDPK)是CDPK-SnRK超家族的主要成員[1],廣泛存在于植物和一些原生生物中,具有典型的絲氨酸和蘇氨酸激酶結(jié)構(gòu)域及EF-hand結(jié)構(gòu)域,在植物生長和發(fā)育、激素信號(hào)傳導(dǎo)中發(fā)揮重要作用[2]。研究表明,CDPK在植物中主要以器官分布為主,且參與植物生長發(fā)育的大部分過程,如細(xì)胞骨架建成、氣孔運(yùn)動(dòng)、以及生物與非生物脅迫響應(yīng)等[3-5]。此外,CDPK還參與植物細(xì)胞內(nèi)其他的信號(hào)通路,如脫落酸(ABA)信號(hào)通路、茉莉酸信號(hào)通路、水楊酸合成途徑等等[6]。目前,已有研究對(duì)許多植物的全基因組水平進(jìn)行CDPK及相關(guān)基因家族鑒定。
紅花(CarthamustinctoriusL.)是菊科紅花屬植物,一種重要的草本植物,以花入藥,有活血化瘀之功效。紅花種子含油率為20%~40%,平均亞油酸含量高于75%,素有“亞油酸之王”的美譽(yù),同時(shí)還含有豐富的維生素和人體必需的氨基酸[7]。紅花喜歡溫暖、干燥的氣候,較一般植物有著較強(qiáng)的抗寒能力。但是紅花對(duì)栽培條件要求較高,抗旱怕澇,這也是目前影響紅花產(chǎn)業(yè)發(fā)展的一個(gè)重要因素。然而,對(duì)于CDPK基因家族是否介導(dǎo)紅花生長發(fā)育的調(diào)控目前尚無研究報(bào)道。
本研究通過對(duì)紅花全基因組數(shù)據(jù)庫的搜索,篩選出CDPK基因家族成員,通過構(gòu)建系統(tǒng)進(jìn)化樹、染色體定位、基因組比較等生物信息學(xué)方法,分析CDPK基因的進(jìn)化關(guān)系,以期為探究紅花CDPK基因家族功能奠定一定的基礎(chǔ)。
分別從紅花基因組數(shù)據(jù)庫(http://safflower.scuec.edu.cn)和擬南芥(Arabidopsisthaliana)數(shù)據(jù)庫TAIR (https://www.ara‐bidopsis.org/)下載紅花的30個(gè)CDPK基因蛋白序列以及擬南芥21個(gè)CDPK基因的蛋白序列,進(jìn)行本地BLASTp比對(duì),得到最佳比對(duì)結(jié)果,通過Pfam 和CDD在線工具對(duì)得到的序列進(jìn)行結(jié)構(gòu)域確認(rèn),選擇同時(shí)含有CDPK蛋白典型結(jié)構(gòu)域的蛋白序列,利用在線工具Expasy ProtParam對(duì)CtCDPK蛋白的分子量、等電點(diǎn)(pI)等進(jìn)行分析。利用GPS-Lipid 網(wǎng)站預(yù)測(cè)N-豆蔻?;褪轷;奈稽c(diǎn)。利用CELLO V2.5網(wǎng)站預(yù)測(cè)紅花CDPK蛋白的亞細(xì)胞定位信息。
利用 Perl 程序從紅花基因組注釋信息中獲取得到CtCDPK基因的染色體位置信息,之后利用MapChart軟件構(gòu)建紅花染色體定位圖。
利用從擬南芥數(shù)據(jù)庫TAIR下載21個(gè)AtCDPK蛋白序列,運(yùn)用MEGA 7.0軟件,將下載的21個(gè)ATCDPK蛋白與鑒定得到的30個(gè)CtCDPK蛋白進(jìn)行序列比對(duì),通過鄰接法構(gòu)建系統(tǒng)進(jìn)化樹[8]。
根據(jù)紅花基因組注釋信息GFF文件中CDPK基因的外顯子和內(nèi)含子位置信息,利用GSDS 網(wǎng)站(http://gsds.gao-lab.org/)繪制紅花CDPK基因結(jié)構(gòu)圖。利用MEME在線網(wǎng)站(http://meme-suite.org/tools/meme)對(duì)紅花CDPK蛋白序列保守基序進(jìn)行分析。
利用TBTools提取紅花CtCDPK基因家族成員密碼子上游1 500 bp,然后提交到PlantCARE數(shù)據(jù)庫預(yù)測(cè)順式作用元件,然后利用GSDS網(wǎng)站繪圖。
將紅花CDPK蛋白序列導(dǎo)入STRING數(shù)據(jù)庫(https://string-db.org/),建立蛋白互作網(wǎng)絡(luò)(protein-protein interaction networks,PPI),將結(jié)果保存為TSV文件,然后通過Cytoscape軟件將PPI網(wǎng)絡(luò)可視化。
從NCBI數(shù)據(jù)庫分別下載紅花3個(gè)部位:葉、花瓣、種子(PRJNA76135)上傳于2011年10月29日的高通量測(cè)序原始數(shù)據(jù);5個(gè)時(shí)期:小芽期、中芽期、初花期、盛花期、爛花期(PRJNA774916)上傳于2021年10月27日的高通量測(cè)序原始數(shù)據(jù),利用NCBI SRA Toolkit將測(cè)序數(shù)據(jù)sra文件轉(zhuǎn)換為fasta文件,利用轉(zhuǎn)錄組定量工具Kallisto計(jì)算TPM,將其作為基因表達(dá)量,利用Tbtools將結(jié)果可視化。
根據(jù)鑒定篩選結(jié)果在紅花中共獲得30個(gè)CDPK基因家族成員,并依次命名為CtCDPK1~CtCDPK30(表1)。隨后通過對(duì)紅花CDPK蛋白基因家族進(jìn)行分子量及等電點(diǎn)的理化性質(zhì)分析,分析結(jié)果表明,其中最長的CtCDPK16編碼855個(gè)氨基酸,分子量為93 251.66;最短的CtCDPK12編碼418個(gè)氨基酸,分子量為47 781.96。30個(gè)CDPK蛋白家族等電點(diǎn)介于5.09~9.26之間,大部分蛋白等電點(diǎn)小于7。亞細(xì)胞定位結(jié)果表明,大部分成員定位在葉綠體和細(xì)胞質(zhì)中,小部分定位在線粒體等其他地方。與此同時(shí),大部分基因家族成員N端并沒有發(fā)現(xiàn)豆蔻酰化保守序列位點(diǎn),但是均有十六烷?;谋J匦蛄形稽c(diǎn)。
表1 紅花CtCDPK基因家族蛋白理化性質(zhì)
由紅花CDPK基因在染色體上的位置分布(圖1)可知,CtCDPK基因在各條染色體上分布不均勻,除2號(hào)、4號(hào)染色體上沒有分布外,其余10條染色體上均有分布,在8號(hào)染色體上分布數(shù)量最多,有5條;在5號(hào)染色體上只分布1條。
通過MEGA構(gòu)建紅花與擬南芥CDPK基因家族進(jìn)化樹。參照擬南芥CDPK分組情況,可將所有的CDPK基因分成6類(Ⅰ~Ⅵ)。第Ⅰ組家族成員最多,并且紅花CtCDPK家族成員主要集中在此家族,有8個(gè)擬南芥CDPKs和19個(gè)紅花CDPKs;第Ⅲ組的數(shù)量最少,包含1個(gè)紅花CDPKs(圖2)。
根據(jù)全基因組注釋信息中基因的內(nèi)含子、外顯子信息,繪制紅花CtCDPK基因家族成員基因結(jié)構(gòu)圖,結(jié)果(圖3-C)顯示,CtCDPK基因內(nèi)含子數(shù)量在5~13個(gè)之間,外顯子數(shù)量在6~13個(gè)之間,含有內(nèi)含子數(shù)最少的是CtCDPK12,含有5個(gè)內(nèi)含子,內(nèi)含子數(shù)量最多的是CtCDPK16,含有14個(gè)內(nèi)含子,并且CtCDPK16所含外顯子數(shù)量也是最多的,為13個(gè),同一亞家族的外顯子數(shù)量較為穩(wěn)定。在同一個(gè)基因家族中,含有共同motif的成員有可能功能相似,使用MEME在線軟件來識(shí)別它們的保守基序,結(jié)果(圖3-B)顯示,motif2、motif1、motif5、motif4、motif12、motif7、motif9存在于每個(gè)家族成員,這些motif構(gòu)成了CDPK基因典型的結(jié)構(gòu)域,motif3存在于除CtCDPK29外的每個(gè)家族成員;motif6存在于除CtCDPK4、CtCDPK18、CtCDPK1外的所有成員;同時(shí),只有CtCDPK6、CtCDPK2和CtCDPK29不含motif8,且CtCDPK29也不含motif10,除此之外,CtCDPK12和CtCDPK13既不含motif10也不含motif11。同一亞家族的成員,結(jié)構(gòu)相似。
根據(jù)PlantCARE數(shù)據(jù)庫預(yù)測(cè)順式作用元件,GSDS網(wǎng)站的繪圖結(jié)果表明,在多數(shù)CtCDPK基因中出現(xiàn)頻率最高的順式作用元件是光響應(yīng)元件,有25種,包括G-Box、G-box、Box 4、GT1-motif、TCT-motif、GA-motif、I-box等,由此推測(cè)CtCDPK在紅花響應(yīng)光調(diào)控過程中發(fā)揮重要作用。此外還有脅迫響應(yīng)元件、激素應(yīng)答響應(yīng)元件、生長發(fā)育響應(yīng)元件,其中脅迫響應(yīng)元件主要有厭氧誘導(dǎo)(ARE)、防御與應(yīng)激(TC-rich repeats)、干旱誘導(dǎo)(MBS)、低溫響應(yīng)(LTR)、損傷響應(yīng)(WUN-motif)等5種,表明含有這些響應(yīng)元件的基因可能會(huì)在受到脅迫的情況下提高植物的抗逆性,其中LTR主要存在于CtCDPK14中;WUN-motif只存在于CtCDPK11中;激素應(yīng)答響應(yīng)元件及生長發(fā)育響應(yīng)元件出現(xiàn)頻率比較低,只能在少數(shù)CtCDPK基因中預(yù)測(cè)到。
如圖5所示,紅花CDPK蛋白之間以及與其他如ABF1、OZS1、XLG2、ABF4等蛋白間存在較強(qiáng)的關(guān)聯(lián),其中尤其是與XLG2蛋白關(guān)聯(lián)最強(qiáng)。根據(jù)互作網(wǎng)絡(luò)節(jié)點(diǎn)大小可以直觀地看出核心蛋白除上述關(guān)聯(lián)性較強(qiáng)的蛋白之外還有AT4G34150、CtCDPK28、CtCDPK21、CtCDPK23等。XLG2蛋白屬于G-alpha超家族,作為對(duì)觸發(fā)水楊酸 (SA) 途徑的病原體抗性的正調(diào)節(jié)劑。ABF1鑒定為與脫落酸反應(yīng)元件結(jié)合的蛋白質(zhì),可能介導(dǎo)ABA反應(yīng)的轉(zhuǎn)錄調(diào)控,屬于bZIP家族,能夠與rd29B基因啟動(dòng)子的ABA反應(yīng)元件特異性結(jié)合。擬南芥CDPK基因家族中的AT5G66210.1作為協(xié)調(diào)莖伸長和血管發(fā)育的發(fā)育控制調(diào)節(jié)劑,與之對(duì)應(yīng)的CtCDPK1、CtCDPK4、CtCDPK16均有此作用。此外,CtCDPK19、CtCDPK23均與ABF4互作,作為鈣介導(dǎo)的脫落酸信號(hào)通路的調(diào)節(jié)劑。
根據(jù)Tbtools的結(jié)果(圖6),對(duì)CtCDPK基因在3個(gè)不同組織部位中(種子、葉、花瓣)的表達(dá)模式進(jìn)行分析,發(fā)現(xiàn)只有CtCDPK12未在任一組織中檢測(cè)到,大部分CtCDPK基因都可以在3種不同的組織中被檢測(cè)到。其他該家族基因的表達(dá)模式也不相同,一些CtCDPK基因在3個(gè)不同組織中都有著較高的表達(dá)量,如CtCDPK2、CtCDPK4、CtCDPK23、CtCDPK24,說明這些CtCDPK基因在紅花的生長發(fā)育過程中有著不可替代的作用,還有一些CtCDPK基因只在1種組織中表達(dá),具有表達(dá)特異性,如CtCDPK18、CtCDPK27只在紅花花瓣中表達(dá);此外,CtCDPK1、CtCDPK5和CtCDPK29只在葉和花瓣中表達(dá),在種子中不表達(dá),表明這3個(gè)基因家族成員調(diào)控紅花的葉和花瓣的發(fā)育,在紅花葉和花瓣的發(fā)育過程中有一定的調(diào)控作用,但還需要進(jìn)一步研究其功能機(jī)制。
根據(jù)NCBI不同發(fā)育階段下的轉(zhuǎn)錄組數(shù)據(jù)對(duì)CtCDPK基因的表達(dá)量作圖(圖6-B),發(fā)現(xiàn)CtCDPK12在初花期及腐爛花期均不表達(dá),在其他的生長發(fā)育階段表達(dá)量比較低,而與此相反的是CtCDPK21、CtCDPK22、CtCDPK23、CtCDPK24這幾個(gè)基因家族的成員在紅花生長的任意階段,無論是小芽期、中芽期、初花期、盛花期、腐爛花期的表達(dá)量都普遍高于其他家族成員,說明這幾個(gè)成員對(duì)于調(diào)控紅花的整個(gè)生長發(fā)育階段有著比較重要的作用,CtCDPK25在腐爛花期-1階段的表達(dá)量明顯高于其他發(fā)育階段,說明它在該階段有特異性表達(dá)。
紅花作為一種常用的中藥材,主要含紅花黃色素、紅花甙、紅花多糖等,可用于治療閉經(jīng)痛經(jīng)、跌打損傷、心腦血管等疾病[9],具有廣闊的發(fā)展前景。CDPK基因家族的身影在植物界中隨處可見,二倍體棉花基因組中鑒定出41個(gè)CDPK基因[10],辣椒30個(gè)[11],山核桃25個(gè)[12],楊樹30個(gè)[13],葡萄19個(gè)[14]。本研究從紅花基因組中鑒定出30個(gè)CtCDPK基因家族成員,進(jìn)一步和擬南芥CDPK基因家族構(gòu)建系統(tǒng)發(fā)育樹,共獲得了6個(gè)亞家族,6個(gè)亞家族的成員大部分定位于葉綠體,說明這些CtCDPK基因家族成員主要在葉綠體中和細(xì)胞質(zhì)中發(fā)揮作用。對(duì)CtCDPK蛋白結(jié)構(gòu)域進(jìn)行分析,發(fā)現(xiàn)所有的CtCDPK蛋白均含有典型結(jié)構(gòu)域Ser/Thr蛋白激酶區(qū),該結(jié)構(gòu)域也是CDPK蛋白的主要功能結(jié)構(gòu)域[15-16]。
自然界中有許多基因或蛋白參與植物生長發(fā)育的調(diào)控,目前已有研究證明,熱激蛋白HSP101在非脅迫條件下會(huì)促進(jìn)擬南芥開花,這種促進(jìn)過程取決于與開花相關(guān)基因FLC及SVP基因的表達(dá)[17]。有關(guān)研究表明,牡丹PI基因能夠調(diào)控植物花器官的形成,牡丹中PsPI基因在生殖器官中的表達(dá)相對(duì)于營養(yǎng)器官來說是高表達(dá)的,花瓣中表達(dá)量最高[18]。基因的表達(dá)模式可能與其功能特征相關(guān),而CDPK基因在不同植物組織中、不同發(fā)育期表達(dá)量差異顯著,其中CtCDPK12在紅花的任意組織部位表達(dá)量為零,CtCDPK18和CtCDPK27具有表達(dá)選擇性,只在花瓣中有一定的表達(dá)量,在其他組織部位不表達(dá),在有些植物中也存在這種情況,如玉米中的1個(gè)CDPK基因只在花粉中表達(dá)[19]。
相關(guān)研究表明,CDPK基因家族的成員主要參與植株生長和發(fā)育的調(diào)控,對(duì)矮牽牛在花粉期表達(dá)的2種CDPK基因PiCDPK1和PiCDPK2的研究發(fā)現(xiàn),若二者均過量表達(dá),則前者影響花粉管的生長極性;后者則抑制了花粉管的伸長能力[20]。進(jìn)一步研究表明,在許多植物體內(nèi)發(fā)現(xiàn)CDPK基因與抗氧化酶有密切的聯(lián)系[21],酶在植物體內(nèi)廣泛分布,參與植物的多種代謝途徑,研究結(jié)果表明,玉米體內(nèi)CDPK的過量表達(dá),能夠明顯提高超氧化物歧化酶和過氧化物酶的活性[22],從而加快植物的代謝過程。此外,CDPK基因還能調(diào)節(jié)種子的萌發(fā)過程,在蓖麻(RicinuscommunisL.)種子早期發(fā)育過程中,RcCDPK2的表達(dá)量先上升后下降[23]。同時(shí)CDPK還參與對(duì)植物細(xì)胞骨架的調(diào)節(jié)以及對(duì)離子和水分跨膜轉(zhuǎn)運(yùn)的調(diào)節(jié)等[24]。
CDPK基因編碼的蛋白質(zhì)作為Ca2+感受器,貫穿植物的整個(gè)生命周期,參與植物體內(nèi)的各種生命活動(dòng)。本研究基于紅花基因組數(shù)據(jù),共鑒定出30個(gè)CtCDPK基因,并通過生物信息學(xué)分析,明確30個(gè)CtCDPK基因家族成員的基本信息,包括進(jìn)化關(guān)系、結(jié)構(gòu)域及酰化位點(diǎn)、互作關(guān)系等,本研究結(jié)果為后續(xù)深入探究CtCDPK基因的功能提供了思路。