孫熹微 范海闊 弓淑芳 劉蕊 糾鳳鳳 肖勇
摘? 要:ZF-HD蛋白是一類只存在于植物體內(nèi)且含有鋅指結(jié)構(gòu)域的轉(zhuǎn)錄因子家族,其不僅能夠調(diào)節(jié)植物的生長發(fā)育,且在植物響應(yīng)逆境過程中也起著重要的作用。本研究通過比對已開發(fā)的椰子基因組數(shù)據(jù),共鑒定出20個椰子ZF-HD蛋白。采用生物信息學(xué)的方法,對其基因結(jié)構(gòu)、蛋白理化性質(zhì)、蛋白質(zhì)保守結(jié)構(gòu)域、超二級結(jié)構(gòu)、系統(tǒng)進化樹及表達譜進行分析。結(jié)果顯示:椰子ZF-HD蛋白多為堿性蛋白,且主要定位于細(xì)胞核、葉綠體及線粒體中。椰子ZF-HD基因家族可分為6個亞族,每個亞家族都具有相似的結(jié)構(gòu)域和超二級結(jié)構(gòu)。motif搜索分析顯示,CoMIF亞族只含有鋅指結(jié)構(gòu)域保守序列,其他亞族均含有鋅指結(jié)構(gòu)域序列與同源異形盒結(jié)構(gòu)域序列。表達譜分析顯示,CoZHD18、CoZHD20在測序的各組織中表達較少,其他家族成員在各組織中的表達量具有差異性。
關(guān)鍵詞:ZF-HD基因家族;椰子;生物信息學(xué)
中圖分類號:S667.4;Q786???? 文獻標(biāo)識碼:A
Abstract: ZF-HD protein is a family of transcription factors that contain zinc finger domains and only exist in plants. It not only regulates the growth and development of plants, but also plays an important role in floristic response to stress. In this study, 20 ZF-HD proteins of coconut were identified by comparison with the developed coconut genome database. Bioinformatics methods were used to analyze its genic structure, protein physicochemical properties, protein conserved domains, motifs, phylogenetic trees and expression profiles. The analysis showed that the coconut ZF-HD proteins are mostly basic protein. And they are mainly located in the nucleus, chloroplast and mitochondria. The coconut ZF-HD gene family could be divided into 6 subfamilies, each of which had similar structural domains and super secondary structures. The motif search analysis showed that the CoMIF subfamily only contained the zinc finger domain conserved sequence, and the other subfamilies contained the zinc finger domain sequence and the homeobox domain sequence. And expression profiling revealed that CoZHD18 and CoZHD20 were not detected in the sequenced tissues, and the expression levels of other family members in each tissue were different.
Keywords: ZF-HD gene family; coconut; bioinformatics
同源異型盒基因廣泛存在于生物體中,其最早于1984年在果蠅中發(fā)現(xiàn)[1],之后又在其他生物中陸續(xù)發(fā)現(xiàn)。同源異型盒基因參與生物個體生長發(fā)育的調(diào)控過程,但在植物發(fā)育中起到的作用也不盡相同。例如:擬南芥WUS基因參與擬南芥子房發(fā)育成型與側(cè)生器官形成的調(diào)控[2],而擬南芥中ZHD1基因參與擬南芥的抗逆表達,提高擬南芥逆境中的抗性[3]。鋅指蛋白是一種Zn2+與氨基酸螯合形成的具有手指狀結(jié)構(gòu)域的轉(zhuǎn)錄因子。其廣泛存在于所有生物體中,最早于1983年在非洲爪蟾蟾(Xenopus laevis)的卵母細(xì)胞的轉(zhuǎn)錄因子TF母細(xì)胞中發(fā)現(xiàn)[4-5]。Berg等[6]通過鋅指蛋白中組氨酸(His)與半胱氨酸(Cys)殘基位置與個數(shù)的不同將鋅指蛋白分為C2H2、C2HC、C6、C8、C2HC5、C3HC4、C4HC3、C2C2和CCCH共8種。鋅指蛋白能夠與目標(biāo)DNA[7]、RNA[8]、DNA-RNA雜交雙鏈[9]相互作用或與其他鋅指蛋白、自身之間[10]相互作用,從而調(diào)控蛋白的轉(zhuǎn)錄及翻譯。ZF-HD(zinc finger-homeobox)基因家族的顯著特點是含有1個鋅指結(jié)構(gòu)域和1個同源異形盒結(jié)構(gòu)域,廣泛地存在于陸生植物中[11]。該類蛋白在細(xì)胞凋亡以及基因轉(zhuǎn)錄的調(diào)控過程中起著關(guān)鍵的作用[12]。
椰子是棕櫚科椰子屬單子葉多年生喬木[13],具有很高的經(jīng)濟價值及藥用價值。椰水中含有豐富的脂肪、蛋白質(zhì)、維C以及人體必須的微量元素,經(jīng)常飲用可強心、清暑、利尿。椰肉可以用來制作糕點、菜肴,椰香濃郁。椰油中含有大量的月桂酸,長期食用可降低人體固醇含量,提高身體免疫力,有效預(yù)防疾病。椰殼更是可入藥,對心絞痛、癬癥、梅毒有特殊功效[14]。目前關(guān)于椰子的研究較少,且還沒有對椰子ZF-HD基因家族進行深入的生物信息學(xué)分析。本研究通過擬南芥ZF-HD基因家族蛋白保守序列比對椰子基因組序列,獲得椰子ZF-HD基因家族序列,并對該家族成員的保守結(jié)構(gòu)域、三維結(jié)構(gòu)和進化關(guān)系等方面進行了初步的生物信息學(xué)分析,同時通過表達譜分析該家族成員在椰子不同部位的表達量,為進一步研究椰子ZF-HD基因家族提供依據(jù)。
1? 材料與方法
1.1? 椰子ZF-HD基因家族的鑒定
在(GIGA)nDB(http://gigadb.org/dataset/100?347? tdsourcetag=s_pcqq_aiomsg)上下載已經(jīng)拼接好的椰子基因組數(shù)據(jù)。從TAIR(https://www.arabi?dopsis.org/)數(shù)據(jù)庫中下載擬南芥ZF-HD 基因家族基因號,在NCBI(https://www.ncbi.nlm.nih. gov/)數(shù)據(jù)庫中下載擬南芥ZF-HD基因家族中基因?qū)?yīng)的蛋白序列。之后將擬南芥ZF-HD基因家族蛋白序列與椰子基因組數(shù)據(jù)進行TBLASTN比對(E值≤1對LA10)。所得結(jié)果去掉重復(fù)項,將其序列翻譯后在Pfma(http://pfam.xfam.org/ search)數(shù)據(jù)庫中進行結(jié)構(gòu)域的預(yù)測,去除不含有結(jié)構(gòu)域的序列。再使用ExPASy-ProtParam?(https:// web.expasy.org/protparam/)在線工具對獲得的蛋白序列進行分子量、等電點和氨基酸數(shù)的預(yù)測。使用WoLF PSORT在線工具對獲得的蛋白序列進行亞細(xì)胞定位分析。
1.2? 構(gòu)建進化樹
依照檢索對比所得到的基因的內(nèi)含子、外顯子信息,利用GSDS 2.0(http://gsds.cbi.pku.edu.cn)在線繪制內(nèi)含子與外顯子組成圖。并使用Clus?talW軟件對獲得的蛋白序列與擬南芥ZF-HD基因家族序列進行多序列比對。將得到的結(jié)果輸入MAGA7軟件中,采用鄰接法構(gòu)建進化樹,校檢次數(shù)(Bootstrap)為1000次。
1.3? 超二級結(jié)構(gòu)預(yù)測與三級結(jié)構(gòu)同源建模
利用GeneDoc序列分析軟件對比得到的椰子ZF-HD基因家族蛋白序列進行多序列比對分析。再利用MEME(http://meme-suite.org/tools/ meme)在線工具對比得到的椰子蛋白序列與擬南芥ZF-HD基因家族序列進行motif搜索。在SWISS-MODEL(https://www.swissmodel.expasy. org/)上在線進行蛋白質(zhì)三級結(jié)構(gòu)同源建模。
1.4? 基因家族表達分析
在NCBI數(shù)據(jù)庫中下載不同品種椰子葉片(SRR1063404、SRR1063407、SRR1125016、SRR?1173229、SRR1273180)與椰子胚(SRR?12?73070)、胚乳(SRR1265939)及胚愈傷組織(SRR1137438)的轉(zhuǎn)錄組數(shù)據(jù)。用FPKM(Fragments Per Kilobase Million)的計算方法標(biāo)準(zhǔn)化paired-end測序的轉(zhuǎn)錄組數(shù)據(jù)。依照Trapnell等[15]提供的算法,公式如下:
式中,F(xiàn)為fragment,l(t)為transcript長度。檢索后得到比對所得基因在不同品種椰子葉片、胚、胚乳以及胚愈傷組織中的FPKM值,并以l g函數(shù)處理FPKM值,之后將數(shù)據(jù)導(dǎo)入MeV軟件構(gòu)建基因表達譜。
2? 結(jié)果與分析
2.1? 椰子ZF-HD基因家族的鑒定及理化性質(zhì)與亞細(xì)胞定位分析
本研究用擬南芥ZF-HD基因家族的基因序列比對椰子基因組數(shù)據(jù),去掉重復(fù)項后得到20條椰子基因序列。之后用MAGA7軟件將得到的序列翻譯為蛋白序列,在Pfma數(shù)據(jù)庫中進行結(jié)構(gòu)域的預(yù)測。結(jié)果顯示,20條序列均含有ZF-HD蛋白二聚區(qū)結(jié)構(gòu)域。將20條椰子ZF-HD基因家族基因序列按照其基因ID排序從CoZHD1~CoZH?D20。最后,對椰子ZF-HD基因家族進行了蛋白理化性質(zhì)的分析以及亞細(xì)胞結(jié)構(gòu)的定位,結(jié)果如下(表1)。
從表1中可以看出,椰子ZF-HD基因家族的蛋白質(zhì)等電點在6.78~9.66之間,其中僅有CoZ?HD8、CoZHD19等電點小于7,而其他18個家族成員均為堿性蛋白質(zhì)。分子量在10012.12~ 75156.63?Da之間,分子量最小的是CoZHD2,而CoZHD8的分子量遠(yuǎn)大于家族中其他成員,為其他家族成員的2~3倍。CoZHD8的氨基酸數(shù)目最多,為670 aa,而CoZHD2的氨基酸數(shù)目最少,為91 aa。通過亞細(xì)胞定位分析發(fā)現(xiàn),椰子ZF-HD基因家族20個家族成員均分布在細(xì)胞核、線粒體與葉綠體中,而在葉綠體、線粒體中均有功能蛋白翻譯。這也與ZF-HD基因家族蛋白的基因調(diào)控功能相吻合。
2.2? 椰子ZF-HD基因家族與擬南芥ZF-HD基因家族進化樹分析
依照與椰子基因組數(shù)據(jù)對比所得椰子ZF-HD基因家族家族成員的內(nèi)含子、外顯子信息,利用GSDS2.0在線繪制內(nèi)含子與外顯子組成圖。再將其蛋白序列與擬南芥ZF-HD基因家族成員蛋白序列進行多序列比對,將得到的結(jié)果輸入MA?GA7軟件中,采用鄰接法構(gòu)建椰子ZF-HD基因家族進化樹與椰子、擬南芥ZF-HD基因家族系統(tǒng)進化樹(圖1)。圖1、圖2根據(jù)Hu等[12]對擬南芥ZF-HD基因家族亞家族的分類,從構(gòu)建所得的進化樹中,可將擬南芥與椰子ZF-HD基因家族分為7個亞家族(表2),分別為ZHDⅠ、ZHDⅡ、ZHDⅢ、ZHDⅣ、ZHDⅤ、MIF、UK(unknown)。將椰子ZF-HD基因家族分為6個亞家族(表3),分別為CoZHDⅠ、CoZHDⅡ、CoZHDⅢ、CoZHDⅣ、CoMIF、UK。進化樹顯示,ZHDⅢ亞族中沒有椰子ZF-HD基因家族成員。這是由于擬南芥為雙子葉植物而椰子單子葉植物,而ZHDⅢ亞族中均為雙子葉植物。UK亞家族的功能尚不知曉,其功能還尚待研究。在椰子ZF-HD基因家族中有85%(17個)的基因不含有內(nèi)含子,只有外顯子。這也與Irish[16]對擬南芥ZF-HD基因家族的研究保持一致。
圖1? 椰子、擬南芥ZF-HD基因家族系統(tǒng)進化樹
Fig. 1? Phylogenetic tree of the ZF-HD gene family of coconut and Arabidopsis thaliana
圖2? 椰子ZF-HD基因家族蛋白進化樹與基因結(jié)構(gòu)
Fig. 2? Protein evolution tree and gene structure of coconut ZF-HD gene family
2.3? 椰子ZF-HD基因家族蛋白結(jié)構(gòu)分析
利用MEME在線工具對椰子ZF-HD基因家族家族成員進行motif超二級結(jié)構(gòu)搜索(圖3)。在一個基因家族中共有的motif很有可能就是執(zhí)行此基因家族功能的序列或是組成此基因家族所必不可少的序列。通過搜索,共搜索到9個motif。其中motif1、motif2、motif3、motif4的保守性最高。從圖3可以看出,椰子ZF-HD基因家族各成員均含有motif2與motif3,且motif2與motif3是典型的鋅指結(jié)構(gòu)域序列,與蛋白二聚體的形成有關(guān)。椰子ZF-HD基因家族家族成員可能也具有相似的功能。除椰子MIF亞族外,
其他家族成員均含有motif1或motif4。motif1與motif4為同源異形盒結(jié)構(gòu)域序列,與DNA的特異性結(jié)合有關(guān)。這與ZF-HD基因家族具有1個鋅指結(jié)構(gòu)域與1個同源異形盒結(jié)構(gòu)域的特征相吻合。而從椰子ZF-HD基因家族保守域多序列比對圖(圖4)中,能夠更加清晰的看出椰子ZF-HD基因家族中保守的序列與所檢測到的motif1、motif2、motif3、motif4序列相吻合,更加驗證了所鑒定出的椰子ZF-HD基因家族基因的可靠性。而椰子CoMIF亞族中只含有motif2與motif3,根據(jù)擬南芥ZF-HD基因家族中MIF亞族的功能推測,可能會競爭性的與家族中的其他轉(zhuǎn)錄因子結(jié)合,形成雜二聚體,從而阻斷同型二聚體的結(jié)合活性[12]。
本研究利用SWISS-MODEL在線對20個椰子ZF-HD基因家族成員進行三維結(jié)構(gòu)同源建模。選取其中最具代表性的4種結(jié)構(gòu)進行分析(圖5)。椰子MIF亞族具有與其他亞族不同的空間結(jié)構(gòu)。在CoZHD2、CoZHD20中均含有典型的鋅指結(jié)構(gòu)域,即1條-螺旋與2條反向的平行(圖5A)。在CoZHD8中則呈現(xiàn)出多條鋅指結(jié)構(gòu)的高度聚集(圖5B)、這可能與CoZHD8本身的功能有關(guān),可能是為了特異性識別某些較長的片段。在其他的家族成員中,都含有三螺旋結(jié)構(gòu)(圖5C,圖5D)。它們通過三螺旋結(jié)構(gòu)可以更好的結(jié)合DNA的大小溝,從而調(diào)節(jié)染色質(zhì)的狀態(tài)[17]。
2.4? 椰子ZF-HD基因家族表達量分析
在NCBI數(shù)據(jù)庫中下載不同品種椰子葉片與椰子胚、胚乳及胚愈傷組織的轉(zhuǎn)錄組數(shù)據(jù)(表4)。
圖5? 椰子ZF-HD基因家族三維結(jié)構(gòu)模型
Fig. 5? 3D structure model of coconut ZF-HD gene family
用FPKM(Fragments Per Kilobase Million)的計算方法標(biāo)準(zhǔn)化paired-end測序的轉(zhuǎn)錄組數(shù)據(jù)。在檢索椰子ZF-HD基因家族基因號后,得到椰子ZF-HD基因家族在葉片、胚乳、胚以及胚愈傷組織中的FPKM值,并以l g函數(shù)處理FPKM值,將處理后的數(shù)據(jù)導(dǎo)入MeV軟件構(gòu)建基因表達譜(圖6)。除CoZHD18外,所有椰子ZF-HD基因家族成員在胚愈傷組織中均有表達,這說明大部分椰子ZF-HD基因在椰子的早期生長與分化中起著至關(guān)重要的作用。CoZHD18、CoZHD20整體表達量較少,其具體功能還尚待研究。CoZHD 12、CoZHD 13、CoZHD 14在葉片中表達較少,其主要在在胚、胚乳、胚愈傷組織中表達,說明其與幼苗的發(fā)育有關(guān)。CoZHD13在胚乳中有較高的表達,在胚中幾乎沒有表達、在胚愈傷組織中卻有所表達,其可能與椰子胚乳的形成有關(guān)。CoZHD9、CoZHD15、CoZHD19在各部位中均有較高的表達量,其可能在整個椰子的生長周期中發(fā)揮作用。已有研究證明,擬南芥在受到鹽脅迫時會誘導(dǎo)ZHD鹽亞族基因的表達[10],而與其同亞族的椰子CoZHD9在椰子葉片、胚、胚乳、胚愈傷組織中均有較高的表達,這可能與椰子本身較高的耐鹽性有關(guān)。CoZHD16在葉片中表達量較低,但在胚乳、胚、胚愈傷組織中均有較高的表達量,它可能主要參與椰子果實生長發(fā)育的調(diào)控。
3? 討論
椰子具有極高的營養(yǎng)、藥用和經(jīng)濟價值,但目前國內(nèi)外對椰子的研究較少,與椰子相關(guān)的許多研究還尚未展開。為更好的認(rèn)識椰子ZF-HD基因家族的種類與數(shù)量,本研究采用生物信息學(xué)方法對椰子ZF-HD基因家族進行了鑒定以及生物信息學(xué)分析,旨在為椰子ZF-HD基因家族的進一步研究提供基礎(chǔ)。
本研究用擬南芥ZF-HD基因家族蛋白序列比對椰子基因組數(shù)據(jù)庫,去除掉不含結(jié)構(gòu)域的基因后共鑒定出20條椰子ZF-HD基因家族序列。根據(jù)前人對擬南芥ZF-HD基因家族的研究,將椰子ZF-HD基因家族分為6個亞族,其中UK亞族功能尚未知曉。其可能是單子葉植物所特有的亞族,也有可能是椰子ZF-HD基因家族所特有的亞族,其具體功能還尚待研究。椰子ZF-HD基因家族中大部分(17個)成員都只含有內(nèi)含子,這與Irish[16]對擬南芥ZF-HD基因家族的研究保持一致,在白菜與棉花中也有類似的現(xiàn)象[18-19],這是ZF-HD基因家族特有的特點。不含有內(nèi)含子使得ZF-HD基因無法進行可變剪切,從而使得ZF-HD蛋白高度保守。但不同的是,擬南芥ZF-HD基因家族17個家族成員全部都不含有內(nèi)含子,而椰子ZF-HD基因家族中有3個成員含有內(nèi)含子。
通過motif搜索發(fā)現(xiàn),椰子ZF-HD基因家族中CoMIF亞族3個成員與擬南芥MIF亞族成員一樣,僅有鋅指結(jié)構(gòu)域而不具有同源異形盒結(jié)構(gòu)域。其他亞族成員均具有ZF-HD基因家族典型特征,即含有1個鋅指結(jié)構(gòu)域與1個同源異形盒結(jié)構(gòu)域。通過三維結(jié)構(gòu)同源建模,更加直觀清晰的看出ZF-HD基因家族中的鋅指結(jié)構(gòu)域以及三螺旋結(jié)構(gòu)。
CoZHD9在葉片、胚、胚乳、胚愈傷組織中具有較高的表達,而擬南芥中ZHD、家族已被證明在被鹽脅迫誘導(dǎo)表達[10],其較高的表達量可能與椰子本身較高的耐鹽性有關(guān)。CoZHD16在葉片中表達量較低,但在胚乳、胚、胚愈傷組織中均有較高的表達量,其可能主要參與椰子果實生長發(fā)育的調(diào)控。CoZHD9、CoZHD15、CoZHD19在各部位中均有較高的表達量,其可能在整個椰子的生長周期中發(fā)揮作用。CoZHD18、CoZHD20整體表達量較少,可能在其他部位有相應(yīng)的表達,還待更深入的研究。
本研究運用生物信息學(xué)的分析方法,鑒定了椰子ZF-HD基因家族的20個成員,并對其結(jié)構(gòu)、同源關(guān)系、功能進行了預(yù)測。這為椰子ZF-HD基因家族的研究與利用提供了理論基礎(chǔ),也為部分椰子ZF-HD基因家族成員的生物學(xué)功能提供了參考。
參考文獻
Lovering R, Hanson I M, Borden K L, et al. Identification and preliminary characterization of a protein motif related to the zinc finger[J]. Proceedings of the National Academy of Sciences of the United States of America, 1993, 90(6): 2112-2116.
Gehring W J . How genes support development: the history of the homeobox[M]. Basel: Birkh?user Verlag AG, 2000.
Haecker A, Grosshardt R, Geiges B, et al. Expression dynamics of WOX genes mark cell fate decisions during early embryonic patterning in Arabidopsis thaliana[J]. Develop-
ment, 2004, 131(3): 657-668.
Miller J, Mclachlan A D, Klug A. Repetitive zinc-binding domains in the protein transcription factor IIIA from Xenopus oocytes[J]. Embo Journal, 1985, 4(6): 1609-1614.
Lee M S, Gippert G P, Soman K V, et al. Three-dimensional solution structure of a single zinc finger DNA-binding domain[J]. Science, 1989, 245(4918): 635-637.
Berg J M, Shi Y. The galvanization of biology: a growing appreciation for the roles of Zinc[J]. Science, 1996, 271(5252): 1081-1085.
Ren B. Genome-wide location and function of DNA binding proteins[J]. Science, 2000, 290(5500): 2306-2309.
宋? 冰, 洪? 洋, 王? 武, 等. 植物C2H2型鋅指蛋白的研究進展[J]. 基因組學(xué)與應(yīng)用生物學(xué), 2010, 29(6): 1133- 1141.
Lee J A, Suh D C, Kang J E, et al. Transcriptional activity of Sp1 is regulated by molecular interactions between the zinc finger DNA binding domain and the inhibitory domain with corepressors, and this interaction is modulated by MEK[J]. Journal of Biological Chemistry, 2005, 280(30): 28061-28071.
Tran L S, Nakashima K, Sakuma Y, et al. Co-expression of the stress-inducible zinc finger homeodomain ZFHD1 and NAC transcription factors enhances expression of the ERD1 gene in Arabidopsis[J]. Plant Journal, 2010, 49(1): 46-63.
Figueiredo D D, Barros P M, Cordeiro André M, et al. Seven zinc-finger transcription factors are novel regulators of the stress responsive gene OsDREB1B[J]. Journal of Experimental Botany, 2012, 63(10): 3643-3656.
Hu W, Depamphilis C W, Ma H. Phylogenetic analysis of the plant-specific?zinc finger-homeobox?and?mini zinc finger gene families?[J]. Journal of Integrative Plant Biology, 2008, 50(8): 1031-1045.
毛祖舜, 邱維美. 椰子種質(zhì)資源[M]. 北京: 中國農(nóng)業(yè)出版社, 2006.
劉? 瑩. 椰子全身都是寶[J]. 解放軍健康, 2002(4): 31.
Trapnell C, Williams B A, Pertea G, et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation[J]. Nature Biotechnology, 2010, 28(5): 511-515.
Irish T V F. The Arabidopsis Zinc Finger-homeodomain genes encode proteins with unique biochemical properties that are coordinately expressed during floral development[J]. Plant Physiology, 2006, 140(3): 1095-1108.
張大勇, 王長彪, 易金鑫, 等. 大豆ZF-HD蛋白家族的全基因組序列特征分析[J]. 江蘇農(nóng)業(yè)學(xué)報, 2011, 27(3): 675-677.
Wang W, Wu P, Li Y, et al. Genome-wide analysis and expression patterns of ZF-HD transcription factors under different developmental tissues and abiotic stresses in Chinese cabbage[J]. Molecular Genetics and Genomics, 2016, 291(3): 1465-1465.
倪萬潮, 徐珍珍, 沈新蓮. 陸地棉 ZF-HD 蛋白的全基因組分析[J]. 棉花學(xué)報, 2016, 28(6): 519-526.