默韶京,王志城,王省芬,劉正文,吳立強,張桂寅,馬峙英,張艷,段會軍
(河北農業(yè)大學農學院,華北作物改良與調控國家重點實驗室,河北省作物種質資源重點實驗室,河北 保定 071000)
脂肪酶是一種脂質水解酶,廣泛分布于動物、植物及微生物中。脂肪酶家族成員包含3個高度保守的氨基酸殘基(Ser、Asp和His),可形成催化三聯(lián)體[1]。根據(jù)基因保守結構域特點將脂肪酶分為GxSxG-motif和GDSL-motif脂肪酶。GxSxG型脂肪酶的活性位點位于蛋白的中心附近,而GDSL型脂肪酶(GDSL-type esterase/lipase proteins,GELPs)的活性位點Ser位于蛋白的N端附近,在保守區(qū)Ⅰ中表現(xiàn)為Gly-Asp-Ser-(Leu)[GDS(L)]基序[2-3]。所有GELP脂肪酶蛋白結構中都包括5個保守域(Ⅰ~Ⅴ),其中Ⅰ、Ⅱ、Ⅲ和Ⅴ保守域內分別存在嚴格保守的Ser(S)、Gly(G)、Asn(N)和His(H)催化殘基,因此GELP脂肪酶也屬于SGNH水解酶超家族。GELP脂肪酶的活性位點非常靈活,因此該脂肪酶家族具有廣泛的底物特異性,能水解硫酯、芳酯、磷脂和氨基酸等多種底物[3-5]。
GELP脂肪酶家族成員眾多,對其功能的報道主要聚焦在調節(jié)植物次生代謝、生長發(fā)育、形態(tài)建成等,GELP脂肪酶參與植物防御反應逐漸引起研究者的注意,目前這方面的研究主要集中在模式植物擬南芥中。擬南芥GLIP1(GDSL LIPASE-LIKE 1)具有抗菌活性,可通過對乙烯信號進行正、負反饋調節(jié)來調控植物免疫[6-8];擬南芥GLIP2通過負調控植物生長素信號通路,參與了對胡蘿卜軟腐菌的抗性[9]。最新研究表明,擬南芥脂肪酶基因(At1g06990)的突變降低了植株對黑斑病的抗性[10]。此外,過表達擬南芥AtGDSL1基因可引起脂質前體磷脂酸水平的升高,激活下游ROS/SA防御相關通路,進而提高植株對菌核病的抗性[11]。在非模式植物中,辣椒CaGLIP(GDSL-type lipase)可受水楊酸、乙烯和茉莉酸的誘導,對油菜黃單胞菌(Xanthomonascampestrispv.Vesicatoria,Xcv)具有抗性,此外,辣椒不同脂肪酶基因也參與了對非生物脅迫的反應[12-14]。
為了深入發(fā)掘GELP脂肪酶基因家族在植物中的生物學功能,研究者對不同物種的GELP基因家族進行了系統(tǒng)的分析,分別從擬南芥、水稻、白菜、葡萄、大豆中鑒定到105、114、121、83和194個GELP家族成員[5,15-18]。作為異源四倍體,陸地棉擁有龐大而復雜的基因組,關于棉花GELP脂肪酶家族成員在棉花基因組中的鑒定和分析尚未見報道。
棉花是重要的天然纖維作物,由土傳真菌大麗輪枝菌引起的黃萎病是影響棉花產量和品質較嚴重的限制因素之一。黃萎病菌寄主范圍極廣,其產生的微菌核可在土壤中存活數(shù)十年,使黃萎病的防治難度大。因此,通過基因工程手段增強植物的免疫系統(tǒng)是提高植物對抗病原菌有效、環(huán)保的策略[19-22]。本研究基于已公布的陸地棉TM-1三代基因組對棉花GELP家族成員進行全基因組鑒定,并對家族成員特性進行系統(tǒng)分析。結合黃萎病菌、干旱、高溫、冷害和鹽脅迫處理后的轉錄組數(shù)據(jù)庫,對參與黃萎病抗性反應和非生物脅迫的GhGELP基因進行篩選,為陸地棉GELP基因家族成員的功能研究奠定重要基礎。
陸地棉TM-1三代基因組數(shù)據(jù)下載自CottonFGD(http://www.cottonfgd.org/),擬南芥AtGELP氨基酸序列下載自TAIR(http://arabidopsis.org/),陸地棉4種逆境脅迫(冷、熱、干旱和鹽)處理后的轉錄組數(shù)據(jù)下載自NCBI SRA(sequence read archive)數(shù)據(jù)庫(genome sequencing project accession:PRJNA248163)。
基于GhGELP基因家族特有保守結構域(PF00657),從Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)下載結構域文件,HMMER3.0軟件建立隱馬爾可夫模型并鑒定候選基因,利用SMART(http://smart.embl-heidelberg.de)和 CDD (http://www.ncbi.nlm.nih.gov/cdd)分析候選蛋白序列,去除不含完整保守結構域的序列。得到的候選基因在CottonFGD進一步確認保守結構域。通過PSORT(https://www.genscript.com/psort.html)進行亞細胞定位分析。蛋白長度、分子量、等電點利用本地Perl腳本批量計算。
通過ClustalW功能對陸地棉GhGELP家族基因編碼的蛋白序列進行多序列比對,MEGA7.0軟件構建系統(tǒng)進化樹,采用鄰接法(NJ,Neighborjoining),Bootstrap設置為1 000次。
基因結構信息和染色體位置信息提取自基因組結構注釋文件,并用TBtools軟件展示基因結構圖,用MapChart軟件繪制染色體定位圖。MEME(http://meme-suite.org/tools/meme)分析GhGELP家族的保守結構域,motif數(shù)量設置為20。利用棉花基因組數(shù)據(jù)庫CottonFGD提取陸地棉GELP基因序列起始密碼子ATG上游2 000 bp序列,在線網站PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測可能存在的順式作用元件,TBtools軟件制圖。
利用本實驗室構建的陸地棉栽培品種農大601受黃萎病菌脅迫處理2、6、12、24、48 h根部的轉錄組數(shù)據(jù)庫(未發(fā)表),F(xiàn)PKM(fragments per kilobase of transcript per million fragments mapped)用于評估基因表達量。將GELP家族基因的表達量進行l(wèi)og2(fold change)標準化(fold change代表處理FPKM與對照FPKM的比值),使用HemI(Heatmap Illustrator version 1.0)軟件繪制GELP基因家族各成員表達量熱圖。
利用從NCBI SRA數(shù)據(jù)庫下載的陸地棉低溫、高溫、鹽和PEG6000模擬干旱逆境脅迫處理下的不同時期的轉錄組數(shù)據(jù),對棉花GELP基因在各種非生物脅迫中的全基因組表達進行了分析。差異表達倍數(shù)FC(fold change)代表脅迫處理FPKM與對照FPKM的比值。選取差異表達基因的標準為至少在一個處理時間點差異表達倍數(shù)FC>2(上調)或FC<0.5(下調)。
通過HMM搜索,在陸地棉基因組中共鑒定出210個GELP的候選基因,并根據(jù)它們在相應的染色體中從上到下的順序和位置,將其命名為GhGELP1~GhGELP210。陸地棉GhGELP基因編碼蛋白的氨基酸數(shù)目在149(GhGELP42)~804(GhGELP3)之間,平均蛋白序列長度為356個氨基酸?;蚪M中GhGELP基因的長度則在1 056~18 365 bp之間;蛋白質的分子量分布在18.76~82.87 kD之間,等電點則在4.48(GhGELP210)~9.8(GhGELP95)之間。對棉花GELP家族成員進行亞細胞定位分析,定位結果顯示,分別有33、44、6、53、27、2、45個基因定位到細胞質、內質網、高爾基體、線粒體、細胞核、液泡和胞外。亞細胞定位結果在一定程度上印證了GhGELP家族成員在植物生長發(fā)育等眾多生物學過程中發(fā)揮著關鍵的作用。
為了更好地闡明陸地棉與擬南芥GELP基因的系統(tǒng)發(fā)育關系,對210個GhGELP和111個AtGELP蛋白構建系統(tǒng)發(fā)育樹(圖1)?;谧钚碌腡AIR數(shù)據(jù)庫,擬南芥GELP蛋白序列與之前報道[15]的略有不同(擬南芥中不存在AtGELP29和AtGELP57),新增的8個AtGELP均以基因ID表示。依據(jù)系統(tǒng)發(fā)育樹,將321個GELP成員分為10個亞家族(A~J),每個亞族包含3~89個成員。大多數(shù)亞族同時包含棉花GELP和擬南芥GELP,表明這些成員可能在雙子葉植物中功能保守。此外,Ⅰ亞族7個成員都來自棉花,表明Ⅰ亞族的GhGELP出現(xiàn)于棉花和擬南芥分化之后,可能在棉花生長發(fā)育和防御反應中起著獨特的作用。擬南芥中AtGLIP1(AT5G40990、AtGLP97)、AtGLIP2(At1g53940、AtGLP20)、AtGDSL1(At1g2967 0、AtGLP16)、AtGLP1(At1g06990)等基因參與了擬南芥對各種病原菌的防御[6-7,9-11,23]。另外,擬南芥中過表達AtLTL1(AT3G04290、AtGLP60)可增加轉基因擬南芥的耐鹽性[13]。棉花中與AtGLIP1(AtGLP97)和AtGLIP2(AtGLP20)同位于C亞族且同源性最高的GhGELP128、GhGELP28、GhGELP127、GhGELP27,與AtGLP1(At1g06990)同位于E亞族且同源性最高的GhGELP121、GhGELP39、GhGELP11,與AtGDSL1(AtGLP16)同位于F亞族且同源性最高的GhGELP175、GhGELP69、GhGELP130、GhGELP30、GhGELP148、GhGELP46等基因,可能參與了棉花對抗病原菌的防御反應。而與AtLTL1同位于G亞族且同源性最高的GhGELP52、GhGELP154、GhGELP59、GhGELP163則有可能參與了棉花對非生物脅迫的響應。
圖1 陸地棉和擬南芥GELP家族成員進化分析Fig.1 Phylogenetic analysis of GELP proteins in cotton and Arabidopsis
如圖2所示,陸地棉210個GhGELP基因不均勻地分布在26條染色體上(GhGELP63位于大片段上,未標注),且主要分布在染色體兩端,這與之前報道的GELP基因在大豆基因組中的分布特征相似[18]。其中,在A5和D5染色體上分布比較集中,分別有17和21個成員;A2、D3、D4和D6染色體上分布較少,都僅有4個成員(圖2)。
圖2 陸地棉GELP家族成員的染色體分布Fig.2 Chromosomal location of the 210 GhGELP genes in G.hirsutum L.
植物GELP基因的顯著特征是有5個外顯子和4個內含子的結構。例如,在水稻和大豆中,大約49.1%和74.2%的GELP成員含有4個內含子[5,18]。對陸地棉中GELP基因的內含子數(shù)目進行統(tǒng)計(未列出),發(fā)現(xiàn)陸地棉GhGELP基因內含子數(shù)目從1到12不等,所有基因都含有至少1個內含子,除GhGELP30和GhGELP41分別含有7個和12個內含子外,其他成員內含子數(shù)目都不多于6個。高達66.7%的GhGELP基因有4個內含子,與水稻和大豆中情況一致。
保守序列和基序在酶的功能中起著重要作用。210個GhGELP蛋白中共發(fā)現(xiàn)了20個保守基序。其中保守基序4、5、9和1分別代表了GELP家族的保守域Ⅰ、Ⅱ、Ⅲ和Ⅴ(圖3),這4個保守基序幾乎存在于所有GhGELP中。此外,在超過60%的GhGELP蛋白中檢測到另外8個保守基序(motif 2、3、6、7、8、11、12和14),其中,高達90%的成員中包含保守基序2和3。其他的保守基序僅存在于系統(tǒng)發(fā)育樹個別的亞組中,如motif 17、18、20僅存在于A亞族,motif 19僅存在于A、B、D和H亞族。
圖3 陸地棉GELP基因家族成員保守基序分析Fig.3 Motif logos of four conservative blocks detected in GhGELP proteins
對GhGELP基因啟動子區(qū)上游2 000 bp的序列進行分析發(fā)現(xiàn),順式作用元件包括與激素信號相關的ABA反應元件、GA反應元件、auxin反應元件、水楊酸(SA)應答元件、MeJA應答元件及與環(huán)境脅迫相關的低溫應答元件和干旱應答元件。其中,ABA反應元件是最豐富的順式作用元件,128個GhGELP成員含有ABA反應元件。另外,含有GA反應元件、auxin反應元件、SA應答元件、MeJA應答元件、低溫應答元件和干旱應答元件的GhGELP基因數(shù)目分別為 102、87、89、124、92和111。SA應答元件、JA應答元件、低溫應答元件和干旱應答元件的富集表明,棉花GELP基因可能參與了植物對各種病原菌及環(huán)境脅迫的響應。
基于黃萎病菌脅迫下陸地棉栽培品種農大601的轉錄組數(shù)據(jù)庫[24],利用接種處理后不同時間點的表達數(shù)據(jù)構建GhGELP基因家族成員的表達模式圖(未列出),發(fā)現(xiàn)有將近1/3的GhGELP基因受黃萎病菌誘導。將這些基因提取出來重新構建表達模式圖(圖4),進行進一步分析。根據(jù)受黃萎病菌誘導后表達模式的不同,將69個GhGELP基因分成3個亞組,第1亞組(Group 1)的成員受黃萎病菌誘導后表達量降低,且該類型基因在響應黃萎病菌誘導的GELP脂肪酶基因中占絕大多數(shù)。其中,預測與黃萎病抗性有關的GhGELP175位于該亞組。第2亞組(Group 2)的成員受黃萎病菌誘導后表達持續(xù)上調。其中,預測與黃萎病抗性有關的GhGELP128、GhGELP28和GhGELP27位于該亞組。第3亞組(Group 3)的成員受黃萎病菌誘導后表達先下調后上調,該類型基因僅有2個成員。
圖4 陸地棉GELP基因在黃萎病脅迫下的表達模式Fig.4 Expression profiles ofGhGELPsfrom upland cotton inoculated withV.dahliae
基于陸地棉TM-1受到非生物脅迫的轉錄組數(shù)據(jù)庫,分析GhGELP基因家族響應干旱、高溫、冷害和高鹽脅迫的表達模式。將受非生物脅迫誘導后顯著差異表達的GhGELP基因提取出來構建表達模式圖(圖5),進行進一步分析。在鹽脅迫處理中,大部分的基因在脅迫處理后6和12 h表現(xiàn)出顯著下調表達。在PEG處理中,大部分的基因則在脅迫處理后12 h表現(xiàn)出顯著下調表達。在熱處理中,有將近1/2的基因在脅迫處理后1 h表現(xiàn)出顯著下調表達。在冷處理中,有將近1/3的基因在脅迫處理后12 h顯著下調表達。在各種脅迫處理中,都只有少數(shù)基因在個別時間點顯著上調表達。這些表達模式結果表明,陸地棉GELP家族基因受非生物脅迫誘導后呈下調表達趨勢。此外,GhGELP2、GhGELP5、GhGELP29和GhGELP37等14個基因表達量同時在4種非生物脅迫處理下發(fā)生顯著變化。GhGELP26、GhGELP30、GhGELP32和GhGELP42等18個基因表達量同時在3種非生物脅迫下發(fā)生顯著變化(表1)。這些結果表明,GELP基因在棉花應對各種復雜的環(huán)境脅迫時發(fā)揮著重要作用。
表1 GhGELP基因對不同脅迫處理的響應Table 1 GhGELP genes response to different abiotic stress
續(xù)表Continued
圖5 陸地棉GELP基因在各種非生物脅迫下的表達模式Fig.5 Expression profiles of GhGELPs in response to different abiotic stress
GELP基因家族已在擬南芥[15]、水稻[5]和大豆[18]等植物中進行了系統(tǒng)分析。陸地棉屬于異源四倍體,基因組龐大而復雜,目前只有極少數(shù)GhGELP基因被鑒定[25-26],且主要集中在纖維、種子發(fā)育等棉花生長發(fā)育進程中。本研究利用高質量的陸地棉三代測序基因組系統(tǒng)鑒定了GELP脂肪酶基因家族,并結合系統(tǒng)發(fā)育、染色體分布和序列特征等信息對GELP基因家族進行了系統(tǒng)分析。通過對棉花基因組中GELP基因的搜索,鑒定了210個成員。亞細胞定位結果顯示,這些成員可分別定位到細胞質、內質網、高爾基體、線粒體、細胞核、液泡和胞外,與該家族復雜多樣的功能相一致[18]。根據(jù)系統(tǒng)發(fā)育關系將這210個成員分為10個亞家族。染色體定位結果顯示,這210個成員大多分布在染色體的兩端。5個外顯子和4個內含子的結構是植物GELP基因的顯著特征,棉花中66.7%的GhGELP基因有4個內含子。該系統(tǒng)分析是了解陸地棉中GELP作用的第1步,為預測GELP在棉花中可能的作用奠定了堅實的基礎。
GELP家族的脂肪酶具有靈活的活性位點,可以隨著不同底物的存在和結合而改變構象使其擁有更加廣泛的底物結合性,因此,該酶底物特異性廣泛且具有多重功能[3]。該特性一方面導致GELP基因可在植物生長發(fā)育等多種生物過程中發(fā)揮作用,如在種子油脂代謝、抗逆性、角質層形成、組織形態(tài)發(fā)生發(fā)育和雄性育性等方面起重要作用[16,25,27-32];另一方面,本研究發(fā)現(xiàn),在響應非生物脅迫的78個GhGELP基因中,有32個基因同時在3種以上脅迫處理下表達量發(fā)生顯著變化。這可能是由其底物特異性廣泛造成的,同一GhGELP蛋白可降解不同的底物以應對不同的環(huán)境脅迫。與該結果一致的是,辣椒中CaGLIP1同時介導了對病菌的感病性和對干旱、ABA、葡萄糖等非生物脅迫的抗性[12]。擬南芥AtLTL1受到SA誘導表達上調,在增強轉基因植株耐鹽性的同時可能也參與了對病原菌的防御反應[13]。
脂肪酶是一類具有脂質代謝功能的酶,脂質及其代謝產物在植物生長和對環(huán)境刺激的反應中均發(fā)揮著不同的作用,越來越多的證據(jù)表明,脂質可作為信號分子介導植物免疫[33-34]。水稻中病原菌感染和水楊酸處理可抑制OsGLIP1和OsGLIP2的表達,同時下調OsGLIP1和OsGLIP2可以提高植物對細菌和真菌病原體的抗性,而過表達OsGLIP1和OsGLIP2則顯著降低植物的抗病性,表明這兩個基因均是介導水稻抗病性的負調節(jié)因子[28]。本研究分析了陸地棉脂肪酶GELP基因家族對黃萎病脅迫的響應,發(fā)現(xiàn)棉花接種黃萎病菌后,大多數(shù)GhGELP基因呈現(xiàn)下調表達模式,表明棉花與水稻中情況相似,可通過負調控一部分GELP基因來增強植物的抗病性。而AtGDSL1則正調控擬南芥對核盤菌的抗性,其功能缺失導致擬南芥對菌核病易感性增強,油菜中過表達AtGDSL1可增強油菜對菌核病的抗性[11]。棉花中有9個GhGELP基因受黃萎病菌誘導后表達量顯著上調,其可能為介導棉花對黃萎病抗性的正調控因子。這些GELP家族基因是否在響應黃萎病脅迫中具有重要作用,還需要進一步研究。