周廣燦,劉夏婷,王博,杜晶晶
(菏澤學院農(nóng)業(yè)與生物工程學院(牡丹學院),山東 菏澤274015)
絲氨酸羥甲基轉(zhuǎn)移酶(Serine hydroxymethyltransferase,SHMT) 是一種磷酸吡哆醛(PLP)依賴酶,在細胞的一碳代謝途徑中通過參與轉(zhuǎn)氨基和脫羧反應,催化絲氨酸和甘氨酸的相互轉(zhuǎn)化以發(fā)揮作用[1-3].作為參與基礎代謝的重要酶類,SHMT在原核生物中多以二聚體形式存在,而在動物和真菌中則以四聚體形式存在[4].在擬南芥基因組中有7個SHMT基因,分別為AtSHM1~AtSHM7,其中SHM1與SHM2編碼的蛋白質(zhì)產(chǎn)物定位在線粒體基質(zhì)中,其他5個SHMT基因編碼的蛋白質(zhì)缺乏可識別的定位序列,推測其存在于細胞質(zhì)中[5].
除為生物合成作用提供一碳單位外,許多研究表明SHMT蛋白在植物抗病中也發(fā)揮重要功能[6-9].例如,擬南芥AtSHM1基因發(fā)生突變后,突變株易受到不同病原菌的感染[7].栽培大豆(GlycinemaxMerr.)中一個命名為Rhg4的SHMT基因的抗性等位基因具有兩個重要的點突變(P130R和N358Y),影響了大豆根細胞內(nèi)的葉酸穩(wěn)態(tài),最終限制胞囊線蟲的生長,從而具有抵抗大豆胞囊線蟲的功能[9].因此,對于植物中SHMT基因的研究可以揭示其功能,并為相關應用提供理論指導.
牡丹是一種重要的觀賞植物,在我國多地均有種植.其中,菏澤、洛陽、北京、臨夏、彭州、銅陵縣等地區(qū)牡丹種植面積較大.牡丹不僅可以用于觀賞,還具有豐富的食用和藥用價值[10].然而,如今牡丹的病蟲害問題日益突出,這直接影響了牡丹的生長和品質(zhì),同時也增加了種植者的管理難度和經(jīng)濟成本,已經(jīng)嚴重影響了牡丹的產(chǎn)業(yè)化發(fā)展.因此,應加強對牡丹病蟲害的監(jiān)測和防治,以保障牡丹產(chǎn)業(yè)的健康發(fā)展.在危害牡丹產(chǎn)業(yè)化生產(chǎn)的諸多病蟲害中,牡丹根結(jié)線蟲病是主要病害之一,在北京、菏澤的牡丹栽培區(qū)均有分布[11-12].該病的病原是北方根結(jié)線蟲,主要危害牡丹根部.染病植株除出現(xiàn)根結(jié)之外,其地上部分也會出現(xiàn)生長滯慢、植株矮小,甚至整株枯死的現(xiàn)象.該病害嚴重影響了牡丹的開花率和牡丹皮的產(chǎn)量與質(zhì)量[13].
基于目前已知的大豆中SHMT基因具有抵抗大豆胞囊線蟲的功能,根據(jù)同源基因的功能相似推測,牡丹中該類基因也可能具有抵抗牡丹根結(jié)線蟲病的功能,但目前還未見有牡丹SHMT基因的相關研究.因此,本研究旨在借助生物信息學方法鑒定和分析牡丹基因組中該基因家族的數(shù)量與理化性質(zhì),并進一步分析演化關系,以揭示其功能,從而為防治牡丹根結(jié)線蟲病等實際應用提供理論指導.
首先,在牡丹基因組網(wǎng)站(https://ftp.cngb.org/pub/CNSA/data5/ CNP0003098/ CNS0560369/ CNA 0050666/)下載牡丹基因組數(shù)據(jù),在BioEdit軟件(Version 7.2.5)中構(gòu)建本地的牡丹蛋白質(zhì)數(shù)據(jù)庫.以擬南芥SHMT基因編碼的氨基酸序列為查詢序列,用BLAST檢索獲得牡丹基因組中的同源序列.然后使用 Pfam (https://www.ebi.ac.uk/interpro/)網(wǎng)站分析所得候選序列,以確定候選序列中是否存在 SHMT 結(jié)構(gòu)域.最后,利用 NCBI BLASTP (https://blast.ncbi.nlm.nih.gov/Blast.cgi)和CD Search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)在線網(wǎng)站進一步驗證 SHMT結(jié)構(gòu)域的完整性.
在ExPasy(https://web.expasy.org/protparam)網(wǎng)站對牡丹SHMT 基因家族成員的氨基酸序列的理化性質(zhì)進行分析預測,并通過在線網(wǎng)站W(wǎng)oLF PSORT(https://wolfpsort.hgc.jp)對牡丹SHMT 基因進行亞細胞定位預測.利用牡丹基因庫gff文件與牡丹SHMT家族的ID號通過TBtools軟件對牡丹SHMT基因家族成員進行基因結(jié)構(gòu)分析并進行可視化繪圖.
根據(jù)牡丹基因組的物理位置,利用牡丹gff文件和SHMT基因家族的ID通過TBtools軟件的Gene location visualize from GTF/GFF繪制牡丹SHMT基因的染色體位置示意圖.
為預測和揭示牡丹SHMT基因的功能,通過Plant CARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)網(wǎng)站預測分析牡丹SHMT基因的啟動子順式作用原件.首先,采用 TBtools 軟件的GXF Sequences Extract提取牡丹基因組中起始密碼子ATG上游2 000 bp基因序列作為啟動子區(qū)域;進一步通過TBtools軟件的Fasta Extract提取牡丹SHMT基因的啟動子區(qū)域.將提取到的啟動子區(qū)域提交至Plant CARE網(wǎng)站進行預測分析,并將結(jié)果用 TBtools 軟件的Basic Biosequence View進行可視化分析.
為了分析牡丹SHMT基因的演化特征,以擬南芥SHMT基因作為參考,使用MEGA5.1軟件,用ML法(最大似然法)構(gòu)建進化樹.首先,利用整合在MEGA5.1里的Clustal W軟件對牡丹SHMT基因和擬南芥SHMT基因編碼的氨基酸序列進行align排序,手動校正,建樹時Bootstrap method數(shù)值設定為1 000,其余參數(shù)為默認值,建立演化關系樹.通過建立的進化樹分析以揭示牡丹SHMT基因在系統(tǒng)發(fā)育進化過程中的演化特征.
在牡丹基因組中共鑒定到33條SHMT基因,這些基因編碼的蛋白質(zhì)在氨基酸數(shù)量、分子量大小、等電點、不穩(wěn)定系數(shù)等理化性質(zhì)方面均存在較大差異(見表1).該家族成員編碼的蛋白質(zhì)含有69~603個不等的氨基酸,分子量大小為7.52~66.90 kD,理論等電點處于4.90~10.45之間,大多數(shù)pI值為堿性.該家族中含有20個穩(wěn)定性蛋白(不穩(wěn)定系數(shù)<40),13個不穩(wěn)定性蛋白.亞細胞定位預測結(jié)果顯示,近半數(shù)(15個)成員都定位在細胞質(zhì)中,其余成員分布在葉綠體、線粒體、細胞質(zhì)膜等位置,不具有明顯規(guī)律性.
表1 牡丹SHMT基因理化性質(zhì)分析
通過 MEME 在線網(wǎng)站預測了20個保守氨基酸基序,將預測結(jié)果與使用牡丹SHMT蛋白的氨基酸序列構(gòu)建的系統(tǒng)發(fā)育樹整合后繪制保守基序分析圖.結(jié)果如圖1所示,可根據(jù)系統(tǒng)發(fā)育樹將牡丹SHMT蛋白分成3個亞群.第Ⅰ亞群中包含19個成員,其中有7個成員特異性含有motif15,3個成員特異性含有motif18.第Ⅱ亞群僅有1個成員(Pos.gene52457),它僅含有motif2和motif6兩個保守基序.第Ⅲ亞群中有13位成員,其中Pos.gene44940與Pos.gene47215的motif組成較為類似.
圖1 牡丹SHMT基因保守氨基酸基序可視化圖
此外,牡丹SHMT基因編碼的蛋白質(zhì)所含保守氨基酸基序種類較多,其中同一亞群的成員具有相似的保守氨基酸基序,而不同亞群中保守氨基酸基序種類差異較大.這些數(shù)據(jù)提示同一亞群成員功能的相似性和不同亞群間的功能差異性,即同一亞群的成員具有相似的生物學功能,而不同亞群的成員可能有不同的生物學功能.該結(jié)果對于通過牡丹SHMT基因家族保守基序來研究這些基因的功能及其在進化中的作用具有重要意義.
基因結(jié)構(gòu)可視化結(jié)果如圖2所示,除第Ⅰ亞群的Pos.gene22394與第Ⅲ亞群的Pos.gene48365基因只含有1個外顯子,其余成員均含兩個或多個外顯子.其中,Ⅰ亞群的的Pos.gene29350基因含有14個外顯子,Ⅲ亞群的Pos.gene44940基因含有13個外顯子.
圖2 牡丹SHMT基因結(jié)構(gòu)比較圖
SHMT基因染色體定位結(jié)果顯示,所有成員均能定位到牡丹的5條染色體上,但在染色體上的分布不均勻(見圖3).其中,1號染色體和3號染色體僅分布1個成員,2號染色體和5號染色體上各有5個成員,4號染色體上的成員數(shù)最多,為21個.
圖3 牡丹SHMT基因的染色體定位圖
為推測牡丹SHMT基因的功能,對其啟動子順式作用元件進行功能預測分析.結(jié)果如圖4所示,SHMT基因啟動子中存在眾多參與植物應激反應、生長發(fā)育的作用元件.在參與激素應答方面,SHMT基因中有10個成員可以對生長素作出反應,15個成員可以對赤霉素作出反應,16個成員對水楊酸作出反應,21個成員可以對茉莉酸甲酯作出反應,還有28個成員對脫落酸作出反應.由于各成員所含激素應答的元件種類和數(shù)量均有差異,表明SHMT基因家族在牡丹的不同激素響應過程中可能有著重要作用.此外,牡丹SHMT基因啟動子中還包含多種與非生物脅迫因素相關的元件.如:有21個成員含有厭氧誘導元件,11個成員含有防御脅迫元件,14個成員含有低溫響應元件,19個成員含有干旱誘導元件等,表明該家族成員在脅迫應答中也發(fā)揮著重要作用.在植物生長發(fā)育方面,SHMT基因家族中有6個成員含有細胞周期調(diào)控元件,2個成員含有胚乳表達元件,24個成員含有分生組織表達相關元件,2個成員含有細胞分化調(diào)節(jié)元件等.值得注意的是,SHMT基因家族中有3個成員還含有與黃酮類生物合成相關的基因調(diào)控元件,推測這些基因成員在黃酮類生物合成方面發(fā)揮著重要作用.在該家族中的諸多作用元件中,光反應元件占比最多,除Pos.gene49382基因以外,其余32個成員均具有一個或多個光反應作用元件.上述結(jié)果表明,調(diào)控SHMT基因家族成員的順式作用元件的種類和數(shù)量較多,說明SHMT基因家族可能具有豐富的潛在功能.
圖4 牡丹SHMT基因啟動子的順式作用元件圖
利用牡丹和擬南芥的SHMT基因構(gòu)建系統(tǒng)發(fā)育樹如圖5所示,結(jié)果顯示牡丹SHMT基因分為三個亞類.其中Ⅰ亞類含有11個牡丹SHMT基因和擬南芥SHMT3基因,Ⅱ亞類含有20個牡丹SHMT基因和2個擬南芥SHMT (SHM1、SHM2)基因,Ⅲ亞類僅包含2個牡丹SHMT基因和4個擬南芥SHMT基因(SHM4、SHM5、SHM6和SHM7).
圖5 牡丹SHMT基因系統(tǒng)發(fā)育樹
隨著基因克隆技術的進步和眾多植物基因組測序的完成,很多植物的SHMT基因被鑒定,并對它們的結(jié)構(gòu)和功能及表達調(diào)控進行了研究[14].例如:擬南芥有7個SHMT基因,毛果楊(Populustrichocarpa)有9個SHMT基因[15],水稻(Oryzasativa)有5個SHMT基因[16],壇紫菜(Pyropiahaitanensis)有2個SHMT基因[17],大豆有14個SHMT基因[18],而本研究在牡丹基因組中鑒定出33個SHMT基因.由此可見,不同物種間SHMT基因的數(shù)量具有差異性.
壇紫菜基因組大小為50.25 Mb,含有2條SHMT基因;擬南芥基因組大小為125 Mb,含有7條SHMT基因;水稻基因組大小為307.2 Mb,含有5條SHMT基因;毛果楊的基因組大小為392.2 Mb,含有9條SHMT基因;大豆基因組大小為978.4 Mb,含有14條SHMT基因;牡丹的基因組大小為11.5 G,有33條SHMT基因,由此可見,SHMT基因數(shù)量和基因組的大小呈一定的正相關關系.
啟動子順式作用元件預測表明,在牡丹SHMT基因啟動子中存在大量參與植物生長發(fā)育、應激反應的順式元件,表明其潛在的功能多樣.在該家族中的諸多作用元件中,光反應元件占比最多,除Pos.gene49382基因以外,其余32個成員均具有一個或多個光反應作用元件,可以推測該家族成員與光反應有著密切的關系.值得注意的是,牡丹SHMT基因家族中有3個成員含有與黃酮類物質(zhì)生物合成相關的調(diào)控元件,而黃酮類化合物又有著抗腫瘤[19]、降血糖[20]、抗氧化性[21]等功能.可以推測這些基因在黃酮類生物合成方面發(fā)揮著重要作用,可能使牡丹具有以上功能.
目前已有許多研究表明SHMT蛋白在植物抗病中發(fā)揮著重要功能.例如,擬南芥AtSHM1基因與大豆SHMT基因發(fā)生突變后,植株的抗病蟲害功能均發(fā)生變化.本研究構(gòu)建的系統(tǒng)發(fā)育樹結(jié)果顯示Ⅱ亞類的牡丹SHMT基因數(shù)量較多,且與擬南芥SHM1基因的親緣性較近,可以為推測該亞類中的牡丹SHMT基因的抗病蟲害功能提供一定的理論支撐.