張曉瓊++喬琳++胡利宗++廖立冰++王秋霞++解恒昌++周琳
摘要:二脂酰甘油?;D移酶Ⅱ(DGAT2)是催化三酰甘油生物合成的關鍵酶,利用生物信息學手段在二倍體棉花和6種模式植物中共鑒定出25個DGAT2基因,詳細剖析這些基因的結構、序列和進化特征。基因結構分析表明,絕大多數(shù)植物包含8個或9個外顯子,且內含子相位高度保守,說明該基因結構起源于陸生植物。蛋白序列分析顯示,核心保守基序1、2、3與功能結構域相互重疊,說明功能結構域起源于藻類植物。進化分析顯示:在棉花中,DGAT2基因發(fā)生特異性擴增,其分子機制為串聯(lián)重復;結合滑動窗口方法和位點模型選擇壓力檢測結果,DGAT2蛋白均受制于負選擇作用。這些結果為棉花及模式植物DGAT2的功能研究提供幫助。
關鍵詞:二酰甘油酰基轉移酶;保守基序;棉花;模式植物;進化
中圖分類號: S562.03;Q78文獻標志碼: A文章編號:1002-1302(2016)10-0069-04
收稿日期:2015-08-28
基金項目:周口師范學院高層次人才科研啟動經(jīng)費(編號:ZKNU2014109);周口師范學院大學生科研創(chuàng)新基金(編號:ZKNUD15037)。
作者簡介:張曉瓊(1991—),女,河南安陽人,碩士研究生,主要從事植物遺傳學研究。E-mail:zxqxiaoqiong00@163.com。
通信作者:胡利宗,博士,副教授,主要從事植物遺傳學研究。E-mail:hulizong@126.com。二酰甘油?;D移酶(DGAT,EC 2.3.1.20)是催化三酰甘油(TAG)合成最后一步的關鍵酶[1]。目前,在植物中存在3種類型的DGAT,即DGAT1、DGAT2和DGAT3[2]。前人研究表明,DGAT1、DGAT2和DGAT3隸屬于不同基因家族,其蛋白序列相似性極低,但三者均具有二脂酰甘油酰基轉移酶活性,過表達這些基因均可不同程度提高植物種子含油量[3]。前人研究顯示,DGAT酶參與種子油脂合成、種子萌發(fā)與發(fā)育以及幼苗發(fā)育等眾多生物學過程,具有多樣化的功能[4]。自Lardizabal等成功克隆MrDGAT2基因以來,在人類、擬南芥和藻類等物種中均克隆出DGAT2基因[5-7]。DGAT2基因功能研究顯示,DGAT2基因具有底物特異性,優(yōu)先利用特殊脂肪酸進行三酰甘油合成[8]。因此,DGAT2基因的相關研究越來越受到人們的重視。棉花不僅是一種重要的經(jīng)濟作物,還是天然纖維與油料作物。雖然在棉花纖維發(fā)育、纖維品質以及抗逆性等方面開展了許多研究,但棉花DGAT2基因的研究仍未見報道。此外,二倍體雷蒙德氏棉[9]和亞洲棉[10]全基因組序列測定已經(jīng)被完成,這為在棉花中研究DGAT2基因提供了數(shù)據(jù)資源。利用生物信息學手段鑒定棉花DGAT2基因,并剖析這些基因的結構、保守基序、功能結構域以及系統(tǒng)進化關系。這些結果能為闡明棉花油脂積累的分子機制奠定基礎,為進一步研究棉花DGAT2基因的功能提供線索。
1材料與方法
1.1物種抽樣與基因序列下載
本研究涉及的物種包括亞洲棉、雷蒙德氏棉和其他6種模式植物。序列下載步驟為:在NCBI數(shù)據(jù)庫直接檢索并下載已知的DGAT2基因序列,以這些序列為檢索序列,利用BLAST工具在默認參數(shù)條件下分別搜索相關數(shù)據(jù)庫CottonGen(http://www.cottongen.org/)、Greenphyl V4(http://www.greenphyl.org/cgi-bin/index.cgi)和Phytozome V9.1(http://www.phytozome.net/),最終獲取棉花及其他模式植物的DGAT2基因。并利用Pfam工具[11]確定這些基因是否含有DAGAT(PF03982)。
1.2序列特征與蛋白特性分析
通過DNA和cDNA的比較,棉花與模式植物DGAT2基因外顯子和內含子的組織結構模式被鑒定,由GSDS 2.0工具繪制[12]。MEME服務器被用于剖析棉花與模式植物DGAT2蛋白的保守基序組成模式,參數(shù)設置如下:保守基序氨基酸長度為6~180 bp;保守基序數(shù)目最大值為10;E閾值為 0.000 01,其他參數(shù)默認[13]。此外,利用HMMTOP工具剖析DGAT2蛋白的跨膜結構域的數(shù)目與位置[14]。
1.3系統(tǒng)進化與選擇壓力檢測
為闡明DGAT2蛋白的系統(tǒng)進化關系,利用Clustal X軟件[15]在默認條件下對DGAT2蛋白進行序列比對,其比對結果直接導入MEGA軟件[16]中,輸出進化樹并進行細微調整。在進化樹的末端,可鑒定出同源基因對,同時基于滑動窗口方法剖析同源基因對的選擇壓力,其計算由DnaSP 5.10完成,參數(shù)設置為:滑動窗口100 bp和步長10 bp[17]。此外,利用Pal2nal工具準備所有DGAT2基因的密碼子比對序列[18],利用位點特異模型對DGAT2基因進行選擇壓力分析,其計算過程由PAML 3.15軟件包中的CODEML程序完成[19]。
2結果與分析
2.1棉花與模式植物DGAT2鑒定與蛋白序列特征
利用Blast工具在2種棉花與6種模式植物中共鑒定出25個DGAT2基因,這些基因的位點標識符、染色體、正負鏈位置以及基因組匹配區(qū)段均被列出(表1)。功能結構域分析表明,DGAT2基因編碼的蛋白均具有典型的功能結構域DAGAT(PF03982)。聚類分析顯示,2種棉花DGAT2與擬南芥和水稻DGAT2聚在一起形成了一個雙子葉植物類群;低等植物DGAT2傾向于聚為一類,但有些低等植物DGAT2蛋白單獨形成一個分支(圖1-A)。此外,利用HMMTOP工具分析DGAT2蛋白的跨膜結構,結果顯示,除PaDGAT2c外,棉花與模式植物DGAT2蛋白均具有至少1個跨膜結構域(表1)。
利用MEME軟件對DGAT2蛋白的保守基序進行分析,結果表明,在25個棉花和模式植物DGAT2蛋白中存在10個保守基序(Motif1~10),共形成13種保守基序組織模式,其中6個棉花DGAT2蛋白共享的保守基序組成模式為 Motif4-6-2-1-3,而AtDGAT2、OsDGAT2a/b和PpDGAT2d等共享的保守基序模式為Motif9-6-2-1-3(圖1-B)。就單個保守基序而言,所有DGAT2蛋白保守基序被分為兩大類型,即種屬普遍類型和種屬特異類型。保守基序1、2、3、6、9幾乎存在于所有DGAT2蛋白中,屬于種屬普遍類型;但保守基序4、5、7、8、10表現(xiàn)出不同程度的種屬特異性,屬于種屬特異類型。此外,DGAT2蛋白的DAGAT(PF03982) 功能結構域與保守基序1、2、3、6、9相互重疊,這說明植物的5個保守基序均可能與DGAT2活性高度相關。
2.2棉花與模式植物DGAT2基因的外顯子與內含子組成模式
通過比較DNA與CDS序列,棉花與模式植物DGAT2基因的結構特點均被闡明,并鑒定其內含子相位。根據(jù)外顯子數(shù)目,這些DGAT2基因結構被分為三大類型:(1)8個外顯子類型,這種類型的基因包括GrDGAT2a、GrDGAT2d和AtDGAT2等5個基因;(2)9個外顯子類型,這種類型的基因包括GrDGAT2b、GaDGAT2a和OsDGAT2a等11個基因;(3)2、3、5、6、7、13個或14個外顯子類型,這類基因包括CrDGAT2a、PpDGAT2b和PaDGAT2c等9個基因(圖1-C)。結合DGAT2蛋白聚類結果可知,位于同一進化分支的基因往往具有相同或相似的基因結構,甚至外顯子和內含子長度、內含子相位具有高度保守性;棉花DGAT2蛋白聚為一類,具有高度相似的基因結構,并且這些基因的內含子相位高度保守;此外,有些物種DGAT2蛋白單獨形成一個分支,具有獨特的基因結構如PaDGAT2d、CrDGAT2a和PaDGAT2b,它們分別擁有2、6、5個外顯子,并且其內含子相位變異較大??傊藁ㄅc模式植物DGAT2基因的結構多數(shù)以8個或9個外顯子形式存在,尤其是在高等植物中該基因的結構具有較高的保守性。
2.3棉花與模式植物DGAT2基因的系統(tǒng)進化關系
在構建棉花與模式植物DGAT2基因的進化樹前,移走覆蓋度低于80%、相似度低于30%的序列,進而構建由亞洲棉、雷蒙德氏棉和水稻等8種植物的14個DGAT2蛋白形成的進化樹。系統(tǒng)進化分析表明,藻類植物CrDGAT2a蛋白單獨形成1個進化分支,與其他植物具有較遠的親緣關系;其他苔蘚類、蕨類、裸子與被子植物DGAT2蛋白明顯被分為2個進化分支,其中被子植物DGAT2蛋白形成1個進化分支,蘚類、蕨類和裸子植物DGAT2形成另一個進化分支(圖2)。此外,在進化樹末端分支上,存在4對同源基因,其中2對屬于直系同源基因,2對屬于旁系同源基因;旁系同源基因包括GaDGAT2b/GaDGAT2c和OsDGAT2a/OsDGAT2b,它們起源于物種特異的基因擴增;直系同源基因包括GrDGAT2c/GaDGAT2d和GaDGAT2a/GrDGAT2d,它們起源于物種分化事件(圖2)。
2.4基于同源對水平的棉花與模式植物DGAT2基因的選擇壓力
為考察進化樹末端的4對同源基因之間是否經(jīng)歷適應性進化,本研究利用DnaSP 5.10軟件對4對DGAT2同源基因進行滑動窗口分析,參數(shù)設置:窗口尺寸為100 bp,步移長度為10 bp。結果顯示,4對同源基因的ω平均值從大到小為044(GrDGAT2d/GaDGAT2a)>0.31(GaDGAT2b/GaDGAT2c)>016(OsDGAT2b/OsDGAT2a)>0.15(GaDGAT2d/GrDGAT2c)。就旁系同源基因而言,亞洲棉旁系基因對GaDGAT2b/GaDGAT2c和水稻旁系同源基因對OsDGAT2b/OsDGAT2a的每個步移窗口對應的進化速率具有異質性,但所有的步移窗口的ω值均小于1,這充分說明這2對旁系同源基因均受控于負選擇作用,也揭示了基因重復之后并未發(fā)生適應性進化(圖3-A)。同理,在2種棉花物種中,直系同源基因對GrDGAT2d/GaDGAT2a 和GaDGAT2d/GrDGAT2c的ω均不大于1,這說明物種分化產(chǎn)生重復基因受到負選擇作用,這可能與功能限制密切相關(圖3-B)。
2.5基于類群水平的棉花與模式植物DGAT2基因的選擇壓力
以亞洲棉、雷蒙德氏棉和水稻等8種植物的14個DGAT2基因為研究對象,利用位點模型對DGAT2基因進行選擇壓力檢測,鑒定出正選擇位點,并利用貝葉斯后驗概率推斷每個正選擇位點概率值。似然比檢驗表明,2ΔlnL=271.62>13277(M0/M3),這說明M3極顯著優(yōu)于M0(P<0.01),因此,這些DGAT2蛋白位點間的進化速率明顯具有異質性;就M2a和M1a比較而言,似然比檢驗值2ΔlnL=0<5.991,說明M2a并不優(yōu)于M1a模型,DGAT2基因可能未經(jīng)歷適應性進化;同理,2ΔlnL=0<5.991(M7/M8),說明M8模型并不優(yōu)于M7模型,進而可推知棉花與模式植物DGAT2基因中并沒有鑒定到正選擇氨基酸位點(表2)。結合似然比測驗和貝葉斯推斷分析可知,棉花與模式植物DGAT2基因均受制于負選擇作用,這意味著DGAT2具有高度保守性,這可能與嚴格的功能限制相關。
3結論與討論
DGAT2基因廣泛存在于真菌、藻類、植物和動物基因組中,尤其是在藻類植物中通常以多拷貝形式存在[1,3,20-21],這說明DGAT2基因起源較早,是一個古老的基因家族。與藻類植物相比,被子植物中DGAT2基因數(shù)目較少,絕大多數(shù)物種僅包括1個或2個成員。但令人感興趣的是,在2種二倍體棉花中均發(fā)現(xiàn)了4個DGAT2基因,并且在2種二倍體棉花中DGAT2基因均以串聯(lián)重復方式排列在同一個染色體區(qū)段內,這說明棉花DGAT2基因發(fā)生了物種特異性串聯(lián)重復?;蚪Y構和蛋白保守基序分析顯示,所有物種DGAT2序列特征具有較高的多樣性,但在被子植物中DGAT2基因的結構與蛋白基序均表現(xiàn)出高度保守性,這說明被子植物DGAT2蛋白受到嚴格的功能限制,具有高度相似的生物學功能,這與前人的研究結果[21-22]基本一致。此外,水稻和棉花的DGAT2同源基因對選擇壓力檢測顯示,同源基因對分化后并沒有發(fā)生適應性進化。同時,基于位點模型對DGAT2蛋白進行選擇壓力分析,結果表明植物的14個DGAT2蛋白均受控于負選擇作用,受到嚴格的功能限制作用[21]??傊扼w棉花基因組中存在4個DGAT2基因,這些基因呈現(xiàn)串聯(lián)重復特征,并且棉花DGAT2基因受純凈選擇作用,這與其功能重要性密切相關。這些結果揭示了DGAT2基因的序列特征與進化關系,為其功能研究提供了理論基礎。
參考文獻:
[1]Weselake R J,Taylor D C,Rahman M H,et al. Increasing the flow of carbon into seed oil[J]. Biotechnol Advances,2009,27(6):866-878.
[2]唐桂英,柳展基,單雷. 二?;视王;D移酶 (DGAT) 研究進展[J]. 中國油料作物學報,2010,32(2):320-328.
[3]Turchetto-Zolet A C,Maraschin F S,de Morais G L,et al. Evolutionary view of acyl-CoA diacylglycerol acyltransferase (DGAT),a key enzyme in neutral lipid biosynthesis[J]. BMC Evolutionary Biology,2011,11(1):263.
[4]Chai Y,Hao X,Yang X,et al. Validation of DGAT1-2 polymorphisms associated with oil content and development of functional markers for molecular breeding of high-oil maize[J]. Molecular Breeding,2012,29(4):939-949.
[5]Lardizabal K D,Mai J T,Wagner N W,et al. DGAT2 is a new diacylglycerol acyltransferase gene family purification,cloning,and expression in insect cells of two polypeptides from Mortierella ramanniana with diacylglycerol acyltransferase activity[J]. Journal of Biological Chemistry,2001,276(42):38862-38869.
[6]房逢立,吳洪,周志剛. 缺刻緣綠藻二酰甘油酰基轉移酶2(DGAT2)的基因特性與功能鑒定[J]. 水產(chǎn)學報,2013,37(8):1162-1172.
[7]袁崢嶸,柳小春,馬海明,等. 二脂酰甘油?;D移酶2(DGAT2)基因研究進展[J]. 遺傳,2008,30(3):289-294.
[8]Li R,Yu K,Hildebrand D F. DGAT1,DGAT2 and PDAT expression in seeds and other tissues of epoxy and hydroxy fatty acid accumulating plants[J]. Lipids,2010,45(2):145-157.
[9]Paterson A H,Wendel J F,Gundlach H,et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres[J]. Nature,2012,492(7429):423-427.
[10]Li F,F(xiàn)an G,Wang K,et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics,2014,46(6):567-572.
[11]Bateman A,Birney E,Cerruti L,et al. The Pfam protein families database[J]. Nucleic Acids Research,2002,30(1):276-280.
[12]郭安源,朱其慧,陳新,等. GSDS:基因結構顯示系統(tǒng)[J]. 遺傳,2007,29(8):1023-1026.
[13]Bailey T L,Williams N,Misleh C,et al. MEME:discovering and analyzing DNA and protein sequence motifs [J]. Nucleic Acids Research,2006,34:369-373.
[14]Tusnady G E,Simon I. The HMMTOP transmembrane topology prediction server[J]. Bioinformatics,2001,17(9):849-850.
[15]Thompson J D,Gibson T J,Plewniak F. The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Research,1997,25(24):4876-4882.
[16]Tamura K,Dudley J,Nei M,et al. MEGA4:molecular evolutionary genetics analysis (MEGA) software version 4.0[J]. Molecular Biology and Evolution,2007,24(8):1596-1599.
[17]Librado P,Rozas J. DnaSP v5:a software for comprehensive analysis of DNA polymorphism data[J]. Bioinformatics,2009,25(11):1451-1452.
[18]Suyama M,Torrents D,Bork P. PAL2NAL:robust conversion of protein sequence alignments into the corresponding codon alignments[J]. Nucleic Acids Research,2006,34:609-612.
[19]Yang Z. PAML4:Phylogenetic analysis by maximum likelihood[J]. Molecular Biology and Evolution,2007,24(8):1586-1591.
[20]朱紅霞,胡利宗,鄧小莉,等. 三種豆科植物 DGAT1 基因家族的分子特征與進化分析[J]. 生物技術通報,2011,3(10):163-166.
[21]Cao H. Structure-function analysis of diacylglycerol acyltransferase sequences from 70 organisms[J]. BMC Research Notes,2011,4(1):249.
[22]陳振璽,王鵬,蓋江濤,等. 在基因家族背景下對四種植物中DGAT2的鑒定和序列分析[J]. 植物科學學報,2015,33(2):186-194.陶虎,索效軍,李曉峰,等. 山羊miR-27a靶基因預測及生物信息學分析[J]. 江蘇農(nóng)業(yè)科學,2016,44(10):73-75.