廖嘉儀, 廖芷依, 王 蘭
(華南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院, 廣州 510642)
E3連接酶是蛋白泛素化修飾的關(guān)鍵酶之一,蛋白泛素化修飾過程由泛素激活酶(E1,Ubiquitin-activating enzyme,UBA)、泛素結(jié)合酶 (E2,Ubiquitin-conjugating enzyme,UBC) 和泛素連接酶 (E3,Ubiquitin ligase)組成[1-2]。在蛋白泛素化修飾過程中,E3連接酶決定了泛素化的特異性,并在泛素介導(dǎo)的蛋白質(zhì)降解選擇中發(fā)揮核心作用[3]。E3連接酶可分成3種主要類型:含鋅結(jié)合結(jié)構(gòu)域蛋白(Really Interesting New Gene,RING) 型 (包括含U-box 結(jié)構(gòu)域蛋白)、E6-AP的羧基端同源蛋白 (Homologous to E6-associated protein C Terminus,HECT) 型和RBR(RING Between RING fingers)型[4-6]。RBR型E3連接酶包含3個(gè)結(jié)構(gòu)域:與裝載了泛素的E2結(jié)合的RING1結(jié)構(gòu)域,通過半胱氨酸殘基催化硫代酯化反應(yīng)并從RING1接收泛素的RING2結(jié)構(gòu)域,以及In-between-RING(IBR)結(jié)構(gòu)域[7]。IBR結(jié)構(gòu)域編碼一種E3泛素連接酶,被報(bào)道參與許多植物生長和發(fā)育等重要的生理過程[8-9]。解析IBR基因家族的特性有利于更好地研究該家族基因的功能,完善IBR基因的調(diào)控網(wǎng)絡(luò),為水稻分子育種提供理論依據(jù)。
IBR(In-between-RING fingers)結(jié)構(gòu)域是一個(gè)富含半胱氨酸的鋅指結(jié)構(gòu)域,它含有兩個(gè)結(jié)合鋅離子,結(jié)合到C4和C2HC配體上,這是所有IBR同源物中最保守的殘基[10]。IBR家族與LAP(Leukemia-associated Protein)/PHD(Plant Homeo Domain),LIM(Lin11,Isl1,and Mec3)和RING(Really Interesting New Gene)finger家族并列,都屬于鋅指蛋白一類[11-12]。鋅指蛋白(ZFPs,Zinc Finger Proteins)是一個(gè)具有鋅離子結(jié)合指樣(ZnF,Zinc Finger)結(jié)構(gòu)域的大型調(diào)控蛋白家族,能夠與RNA、DNA、多聚ADP-核糖、蛋白質(zhì)和脂質(zhì)相互作用?!颁\指”已經(jīng)被廣泛用于描述幾乎任何圍繞一個(gè)或多個(gè)結(jié)構(gòu)鋅構(gòu)建的小蛋白質(zhì)結(jié)構(gòu)域。目前,已有30多種不同類型的ZFPs被描述,它們涉及多種細(xì)胞過程,包括轉(zhuǎn)錄調(diào)節(jié)、染色質(zhì)重塑、蛋白質(zhì)穩(wěn)態(tài)、信號轉(zhuǎn)導(dǎo)以及細(xì)胞增殖和分化[13-16]。IBR家族結(jié)構(gòu)模型為C-X4-C-X(14-30)-C-X(1-4)-C-X4-C-X2-C-X4-H-X2-C,其中,C代表Cys(半胱氨酸),H代表His(組氨酸),X代表任意一種氨基酸殘基。結(jié)構(gòu)域包括處于特定位點(diǎn)的7個(gè)半胱氨酸和一個(gè)組氨酸殘基,以及其他氨基酸。與鋅結(jié)合的配位基為C=半胱氨酸,H=組氨酸。IBR結(jié)構(gòu)域通常出現(xiàn)在一對RING finger結(jié)構(gòu)域之間,也被稱為C6HC(Cys(6)-His-Cys)或者DRIL(double RING finger linked)結(jié)構(gòu)域[11]。在植物中,許多RING finger蛋白被報(bào)道可以增強(qiáng)耐旱性和耐鹽性[17]。這3個(gè)結(jié)構(gòu)域的順序和距離具有保守性,表明這種空間組織具有重要的功能,因此又把這3個(gè)結(jié)構(gòu)域看作一體,命名為RBR/TRIAD(for two RING fingers and a DRIL)結(jié)構(gòu)域[11]。RBR連接酶可通過連接子域連接子的靈活性實(shí)現(xiàn)3個(gè)子域彼此間的重排,從而在多步反應(yīng)中轉(zhuǎn)移泛素[18]。每種RBR連接酶都進(jìn)化出了特定的理化性質(zhì),以適應(yīng)其調(diào)節(jié)的生物過程[19]。已有研究顯示,SCF(SKP1-CUL1-F-box)連接酶可與ARIHI(一種RBR型E3連接酶)形成E3-E3超級組裝,從而將F-box蛋白上的不同底物泛素化[20]。此外,也有研究發(fā)現(xiàn)RBR連接酶與底物之間存在直接結(jié)合相互作用[21]。目前關(guān)于水稻基因組中IBR基因家族的研究尚未見報(bào)道。
本研究圍繞IBR基因家族的特性,從IBR基因家族氨基酸序列的結(jié)構(gòu)特點(diǎn)、物種之間的進(jìn)化關(guān)系以及代表性基因的結(jié)構(gòu)域情況等進(jìn)行系統(tǒng)的描述,研究結(jié)果為深入闡述IBR基因家族的分子功能和調(diào)控網(wǎng)絡(luò)提供理論依據(jù)。
通過NCBI中的蛋白數(shù)據(jù)庫,搜索到水稻基因組中的含有IBR結(jié)構(gòu)域的基因。通過SMART/PFam(http://smart.embl.de/smart/set_mode.cgi?GENOMIC=1或http://pfam.xfam.org/)對搜索到的IBR蛋白逐個(gè)核實(shí)其是否冗余。通過NCBI蛋白數(shù)據(jù)庫搜索IBR和物種關(guān)鍵詞,再通過分類群(Taxonomic Groups)篩選得到IBR蛋白氨基酸序列。
根據(jù)鄰近法推斷IBR進(jìn)化歷史[22],得到分支長度總和為11.13的最優(yōu)樹。通過p-distance的方法[23]以及每個(gè)單元中氨基酸差異位點(diǎn)的數(shù)量計(jì)算得到進(jìn)化距離。此次分析包括了124個(gè)氨基酸序列,所有低于50%覆蓋率的位點(diǎn)(即低于50%的對位空隙、空缺數(shù)據(jù)、歧義堿基被允許出現(xiàn)在任何的位點(diǎn))都被清除。最終數(shù)據(jù)結(jié)果一共比對了226個(gè)位點(diǎn),通過MEGA7軟件進(jìn)行進(jìn)化分析[24]。
IBR結(jié)構(gòu)域氨基酸序列比對通過軟件MEGA7中ClustalW功能實(shí)現(xiàn)。無根的系統(tǒng)發(fā)生樹采用軟件MEGA7中進(jìn)化樹(Phylogeny)模塊中的鄰近法,根據(jù)氨基酸序列的對位比較結(jié)果而建成。參數(shù)設(shè)置中,Number of Bootstrap Replications為5 000,即反復(fù)計(jì)算5 000次,用來檢驗(yàn)所計(jì)算的進(jìn)化樹分支可信度;Bootstrap value>70時(shí)認(rèn)為分支可靠。
水稻、高粱、玉米、大豆、擬南芥這5個(gè)物種的基因組大小數(shù)據(jù),來自于NCBI中的genome數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genome/)。
通過鄰近法推斷IBR進(jìn)化歷史[22],得到分支長度總和為22.78的最優(yōu)樹。通過p-distance的方法[23]以及每個(gè)單元中氨基酸差異位點(diǎn)的數(shù)量計(jì)算得到進(jìn)化距離。此次分析包括了這5個(gè)物種共234個(gè)氨基酸序列。所有低于50%覆蓋率的位點(diǎn)(即低于50%的對位空隙、空缺數(shù)據(jù)、歧義堿基被允許出現(xiàn)在任何的位點(diǎn))都被清除。最終數(shù)據(jù)結(jié)果一共比對了120個(gè)位點(diǎn),通過MEGA7軟件進(jìn)行進(jìn)化分析[24]。
保守結(jié)構(gòu)域的預(yù)測通過PROSITE數(shù)據(jù)庫(https://prosite.expasy.org/)實(shí)現(xiàn)。結(jié)構(gòu)域的作圖通過在線作圖網(wǎng)站(http://ibs.biocuckoo.org/online.php)實(shí)現(xiàn)?;蚬δ艿念A(yù)測通過NCBI中的BLAST功能(https://blast.ncbi.nlm.nih.gov/Blast.cgi)實(shí)現(xiàn)。
水稻IBR蛋白的亞細(xì)胞定位通過Plant-PLoc server(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)實(shí)現(xiàn)。
水稻含IBR結(jié)構(gòu)域基因表達(dá)情況的分析通過網(wǎng)站(https://ricexpro.dna.affrc.go.jp/category-select.php)實(shí)現(xiàn)。
為了深入了解IBR基因家族的特性,本研究在NCBI數(shù)據(jù)庫中共找到184條預(yù)測為IBR結(jié)構(gòu)域的水稻蛋白質(zhì)序列。對這些蛋白質(zhì)進(jìn)行冗余分析,發(fā)現(xiàn)其中一些蛋白被同一基因編碼。另外,使用SMART的PFam domain分析功能,發(fā)現(xiàn)有些蛋白序列中含有IBR結(jié)構(gòu)域,有些蛋白質(zhì)序列則不包含IBR結(jié)構(gòu)域。最終確定水稻基因組中沒有冗余且含有IBR結(jié)構(gòu)域的基因共124個(gè)。
使用MEGA7軟件對上述124個(gè)蛋白序列進(jìn)行多序列對位排列,結(jié)果表明,其基因兩側(cè)都存在RING finger結(jié)構(gòu)域,不存在只有單獨(dú)的IBR結(jié)構(gòu)域或只有一側(cè)有RING finger結(jié)構(gòu)域的情況。
對水稻家族中124個(gè)IBR基因進(jìn)行系統(tǒng)進(jìn)化分析,結(jié)果表明,水稻124個(gè)IBR基因被分為A、B兩個(gè)組,A組包括79個(gè)基因,B組包括45個(gè)基因。每一組又被進(jìn)一步分為兩個(gè)亞族,其中A1、A2分別包含75個(gè)和4個(gè)基因;B1、B2分別有22個(gè)和23個(gè)基因(圖1)。
注:“★”表示被選出分析保守結(jié)構(gòu)域。圖1 124個(gè)IBR基因家族成員在水稻中的系統(tǒng)進(jìn)化關(guān)系Fig.1 Phylogenetic relationships for the 124 members of IBR gene family in rice
為了進(jìn)一步了解其他物種IBR基因家族的進(jìn)化情況,本研究選取了模式植物擬南芥(Arabidopsisthaliana)和常見的農(nóng)作物玉米(Zeamays)、大豆(Glycinemax)、高粱(Sorghumbicolor),對其IBR基因家族進(jìn)行分析。和水稻IBR基因家族的搜索方法一樣,首先在NCBI數(shù)據(jù)庫中找到含IBR結(jié)構(gòu)域的蛋白,然后對這些蛋白進(jìn)行冗余分析,再通過SMART的PFam domain分析功能確定含IBR保守域的蛋白。最終確定了模式作物中含IBR結(jié)構(gòu)域的蛋白分別有:高粱44個(gè)、玉米44個(gè)、大豆43個(gè)、擬南芥39個(gè)。利用MEGA7的鄰近法建樹算法,把所確認(rèn)的這些物種IBR蛋白與水稻的64個(gè)IBR蛋白的氨基酸序列進(jìn)行系統(tǒng)發(fā)生分析,并建立系統(tǒng)發(fā)生進(jìn)化樹。
結(jié)果表明,玉米、大豆、高粱、擬南芥中的IBR蛋白嵌合到水稻系統(tǒng)發(fā)生樹的4個(gè)分支內(nèi)。其中,高粱中大多數(shù)IBR家族基因被分到了A組;A2分支中僅包含水稻和高粱的IBR家族基因;除A2分支外,以上5個(gè)物種的IBR家族基因在其他3個(gè)分支(即A1、B1、B2分支)中均有分布(圖2和表1)。
圖2 擬南芥、玉米、大豆、高粱和水稻5個(gè)物種的IBR家族基因系統(tǒng)進(jìn)化關(guān)系Fig.2 Phylogenetic relationships for the IBR gene family in five species of arabidopsis (At),maize (Zm),soybean (Gm),sorghum (Sb),and rice (Os)
表1 5種植物中IBR家族基因在系統(tǒng)發(fā)生進(jìn)化樹中不同分支的分布Table 1 The distribution of IBR family genes in the phylogenetic tree of five crops
從水稻系統(tǒng)發(fā)生進(jìn)化樹的不同分支中選取9個(gè)IBR家族基因進(jìn)行蛋白結(jié)構(gòu)域的分析(圖3),其中A1分支選取4個(gè)基因(OsJ_29388、OSIGBa0101B20.22、OSIGBa0101B20.26、OSJNBa0006A01.8),A2分支選取1個(gè)基因(Os07g0621500),B1分支選取2個(gè)基因(LOC_Os03g42790、LOC_Os03g13100),B2分子選取2個(gè)基因(OJ990528_30.1、Os08g0540300)。結(jié)果表明,這9個(gè)含有IBR結(jié)構(gòu)域的基因,除了包含IBR結(jié)構(gòu)域之外,還包含其他的保守功能結(jié)構(gòu)域,例如:RING、ZF_RANBP2、ZF_BBOX、RWD、C2H2、2FE2S_FER結(jié)構(gòu)域。ZF_RANBP2、ZF_BBOX、C2H2這3個(gè)結(jié)構(gòu)域都屬于鋅指結(jié)構(gòu)域家族;RWD結(jié)構(gòu)域在PROSITE數(shù)據(jù)庫中,預(yù)測到的α螺旋/β折疊可能為與泛素結(jié)合酶的結(jié)構(gòu)域有關(guān);2FE2S_FER結(jié)構(gòu)域,即鐵氧化還原結(jié)合型鐵硫結(jié)合蛋白,通常在代謝酶的結(jié)構(gòu)域中發(fā)現(xiàn)。
圖3 水稻中9個(gè)IBR家族基因蛋白結(jié)構(gòu)分析Fig.3 Analysis on protein structure of 9 IBR family genes in rice
通過GenBank數(shù)據(jù)庫中的BLAST對上述9個(gè)IBR家族基因的氨基酸序列進(jìn)行同源性分析,分別預(yù)測它們的功能。結(jié)果顯示,水稻中與這9個(gè)基因同源性高(query cover>90%)的氨基酸序列都被預(yù)測為E3泛素連接酶,且在不同的水稻品種中都被預(yù)測具有E3泛素連接酶的功能。被預(yù)測的E3泛素連接酶的類型有6種,分別為E3 ubiquitin-protein ligase RNF144A-B、RNF14、ARI1、ARI2、ARI3、ARI8。
對水稻中的124個(gè)IBR蛋白,用Plant-PLoc server[21]軟件進(jìn)行亞細(xì)胞定位預(yù)測。結(jié)果顯示,這些IBR蛋白主要被定位到細(xì)胞核、高爾基體、葉綠體等亞細(xì)胞結(jié)構(gòu)內(nèi)(表2)。其中,120個(gè)被定位在細(xì)胞核,占96.8%;2個(gè)被同時(shí)定位在細(xì)胞核和高爾基體;1個(gè)被同時(shí)定位在細(xì)胞核和葉綠體;1個(gè)被定位在高爾基體。
從水稻表達(dá)譜數(shù)據(jù)庫RiceXPro搜索到23個(gè)含IBR結(jié)構(gòu)域的水稻基因,分析其在幼苗、幼穗及愈傷組織中的RNA表達(dá)情況,發(fā)現(xiàn)這些基因在不同組織或器官中檢測到的表達(dá)水平不同。在23個(gè)含IBR結(jié)構(gòu)域的水稻基因中,有15個(gè)至少在一個(gè)組織或器官中表達(dá)(FPKM>1);12個(gè)基因的表達(dá)水平較高(FPKM>3),其中,基因Os08g0540300在幼苗和愈傷組織中表達(dá)水平最高,基因LOC_Os12g43560在幼穗中表達(dá)水平最高。
在高表達(dá)的12個(gè)基因中,有6個(gè)屬于A1分支,1個(gè)屬于A2分支,2個(gè)屬于B1分支,3個(gè)屬于B2分支。
水稻是我國的主要糧食作物之一,也是世界上食用人口最多的農(nóng)作物,對水稻基因家族的研究有利于更好地了解這些家族基因的特性,從而挖掘一些優(yōu)異基因應(yīng)用于水稻分子育種[26]。在高等植物中,IBR基因家族普遍存在,甚至在細(xì)菌、病毒中也廣泛存在。IBR基因家族是一個(gè)相對較古老的基因家族[16],但對該基因家族特性卻很少被系統(tǒng)地報(bào)道。
根據(jù)水稻基因組精確測序結(jié)果,水稻基因組大小為389 Mb,預(yù)測編碼大約32 000個(gè)基因[27]。其他單子葉植物的基因組更大,高粱泛基因組大小為954.8 Mb,其中核心基因組序列占比62%,非核心基因組序列占比38%[28];玉米基因組大小約為2 191 Mb[29]。然而,本研究發(fā)現(xiàn)沒有冗余的含有IBR結(jié)構(gòu)域的基因中,水稻、玉米、高粱分別有124個(gè)、44個(gè)和44個(gè);水稻的基因組最小,但其IBR家族基因最多。表明IBR基因家族在水稻中進(jìn)化得更快,且與基因組的大小無關(guān)。
通過多序列比對和進(jìn)化分析發(fā)現(xiàn),水稻IBR結(jié)構(gòu)域兩側(cè)都存在RING finger結(jié)構(gòu)域,這與Ngwa等[16]的研究成果相符合。但是水稻IBR結(jié)構(gòu)域兩側(cè)RING finger結(jié)構(gòu)域具有不同于已報(bào)道的典型RING finger結(jié)構(gòu)域的特點(diǎn)[30]。結(jié)合IBR結(jié)構(gòu)域的研究成果[31-32],推測這種變化可能是為了配合IBR結(jié)構(gòu)域?qū)崿F(xiàn)細(xì)胞代謝中的某些功能,如調(diào)控誘導(dǎo)信號通路或參與葡萄糖代謝等途徑。進(jìn)一步分析發(fā)現(xiàn),IBR結(jié)構(gòu)域N末端的RING finger結(jié)構(gòu)域的結(jié)構(gòu)十分保守,與Sun等[30]的研究結(jié)果相比,推測水稻含有IBR結(jié)構(gòu)域的基因中N末端RING finger結(jié)構(gòu)域的保守性可能與結(jié)合某種E2泛素結(jié)合酶有關(guān)。
本研究對水稻9個(gè)IBR基因家族保守結(jié)構(gòu)域進(jìn)行分析,共預(yù)測到6種E3泛素連接酶,說明水稻中的IBR結(jié)構(gòu)域與兩側(cè)RING finger結(jié)構(gòu)域組成的復(fù)合體是一類E3泛素連接酶。關(guān)于水稻中泛素化的研究已取得一些進(jìn)展,如OsPUB67蛋白可正向調(diào)節(jié)干旱脅迫[33];OsPUB2和OsPUB3蛋白響應(yīng)低溫脅迫[34];OsATL38蛋白負(fù)向調(diào)控水稻對冷脅迫的耐受性[35];GW2基因影響水稻粒型[36]等。在水稻(Oryzasativa)中發(fā)現(xiàn)的一種微管相關(guān)的E3連接酶(Microtubule-associated C4HC3-type E3 Ligase,MEL),能夠整合和啟動一系列宿主免疫信號,對病毒、真菌和細(xì)菌病原體具有廣譜抗性[37]。此外,E3泛素連接酶基因OsJMJ715被報(bào)道參與了水稻中褐飛虱誘導(dǎo)的防御反應(yīng)[38]。這些結(jié)果表明,IBR基因家族功能廣泛,對水稻生長發(fā)育及抗性具有重要的作用。
本研究預(yù)測的IBR蛋白的亞細(xì)胞定位絕大多數(shù)(98.6%)位于細(xì)胞核中,而在亞細(xì)胞定位預(yù)測中位于細(xì)胞核的蛋白一般為組蛋白、DNA合成酶類、RNA轉(zhuǎn)錄及加工酶類、起調(diào)控作用的蛋白因子等,由此推測IBR蛋白在細(xì)胞代謝中可能作為某種具有調(diào)控作用的蛋白因子。調(diào)查水稻中IBR家族基因的表達(dá)情況,發(fā)現(xiàn)在幼苗、愈傷組織、和幼穗中具有高表達(dá)量的基因,推測可能與水稻特定生長發(fā)育過程所需的細(xì)胞代謝有關(guān)。
本研究利用生物信息學(xué)方法,對水稻IBR基因家族進(jìn)行了系統(tǒng)的描述。在水稻基因組中找到了124個(gè)含有IBR結(jié)構(gòu)域的基因,其中120個(gè)被定位在細(xì)胞核。這些水稻IBR家族基因聚成A、B兩類,包含1個(gè)以上保守結(jié)構(gòu)域。擬南芥、玉米、大豆、高粱的IBR蛋白嵌合到水稻的IBR蛋白系統(tǒng)發(fā)生樹的各分支內(nèi)。蛋白結(jié)構(gòu)域分析顯示水稻IBR家族是一類E3泛素連接酶,根據(jù)亞細(xì)胞定位結(jié)果推測可能與水稻特定生長發(fā)育過程所需的細(xì)胞代謝有關(guān)。這些結(jié)果為深入研究該基因家族的功能提供了思路。