趙 亮, 狄佳春, 陳旭升
(江蘇省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所/農(nóng)業(yè)部長江下游棉花與油菜重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210014
甲基化作用廣泛存在于生物體內(nèi),由甲基轉(zhuǎn)移酶(methyltransferases,簡稱MTs)依賴S-腺苷-L-甲硫氨酸(S-adenosine-L-methionine,簡稱SAM)作為甲基供體催化形成相對應(yīng)的甲基化形式產(chǎn)物[1]。在植物次生代謝中甲基化是一個(gè)非常普通的酶修飾反應(yīng),幾乎所有的植物次生代謝途徑都會(huì)發(fā)生甲基化,例如氨基酸、生物堿、苯丙素類、糖、嘌呤、甾醇類、硫醇類和黃酮類。甲基轉(zhuǎn)移酶可根據(jù)甲基轉(zhuǎn)移到受體分子上不同的原子而分為C、N、S和O位甲基轉(zhuǎn)移酶[2]。
SABATH甲基轉(zhuǎn)移酶是屬于O位甲基轉(zhuǎn)移酶(O-methyltransferase,簡稱OMTs),該家族催化一些小分子羧基和生物堿的甲基化,這個(gè)家族在最初發(fā)現(xiàn)鑒定的3個(gè)酶的基礎(chǔ)上共同命名為SABATH甲基轉(zhuǎn)移酶(SABATH-MTs)。這3個(gè)酶分別是水楊酸羧基甲基轉(zhuǎn)移酶(salicylic acid carboxyl methyltransferases,簡稱SAMT)、苯甲酸羧基甲基轉(zhuǎn)移酶(benzoic acid carboxyl methyltransferases,簡稱BAMT)和可可堿合酶(theobromine synthase)[3-7]。對SABATHMTs基因序列分析表明,在擬南芥中存在24個(gè)該家族基因成員。功能研究清楚的有茉莉酸羧基甲基轉(zhuǎn)移酶(jasmonic acid carboxyl methyltransferase,簡稱JMT)[8]、苯甲酸/水楊酸羧基甲基轉(zhuǎn)移酶(benzoic/salicylic acid carboxyl methyltransferases,簡稱BSMT)[9]、吲哚乙酸羧基甲基轉(zhuǎn)移酶(indole-acetic acid carboxyl methyltransferase,簡稱IAMT)[10]、法尼烯酸羧基甲基轉(zhuǎn)移酶(farnesoic acid carboxyl methyltransferase,簡稱FAMT)[11]、赤霉素羧基甲基轉(zhuǎn)移酶(gibberellin acid carboxyl methyltransferase,簡稱GAMT)[12]。棉花基因組數(shù)據(jù)的公開發(fā)表,為SABARH-MTs基因家族的全基因組分析提供了便利的條件。本研究利用生物信息學(xué)的方法,從棉花基因組數(shù)據(jù)庫中查找可能的SABATH-MTs基因家族成員,并對這些成員進(jìn)行結(jié)構(gòu)、進(jìn)化及表達(dá)上的分析。
陸地棉遺傳標(biāo)準(zhǔn)系TM-1的基因組數(shù)據(jù)庫來源于http://mascotton.njau.edu.cn;棉花二倍體D基因組雷蒙德氏棉(G.Raimondii)的基因組數(shù)據(jù)庫來源于http://www.phytozome.net;棉花二倍體A基因組亞洲棉的基因組數(shù)據(jù)來源于http://cgp.genomics.org.cn/page/species/index.jsp;擬南芥GAMT基因來源于擬南芥信息資源(the arabidopsis information resource,簡稱TAIR)數(shù)據(jù)庫(http://www.arabidopsis.org)。
GAMT注釋根據(jù)Sonnhammer等[13]的方法,HMMER軟件版本為3.0;GAMT種子文件來自于蛋白質(zhì)家族的集合數(shù)據(jù)庫(Pfam數(shù)據(jù)庫,http://pfam.sanger.ac.uk/),種子編號(hào)為PF03492。蛋白質(zhì)的氨基酸序列保守結(jié)構(gòu)域的分析采用在線的SMART(http://smart.embl-heidelberg.de)進(jìn)行檢測。
利用MEGA 5.05[14]構(gòu)建進(jìn)化樹,構(gòu)建方法利用最大似然函數(shù),Bootstrap實(shí)行1 000次重復(fù)。序列比對利用 Clastal 1.83 完成,比對結(jié)果及處理利用GENDOC軟件來完成。
基因表達(dá)分析采用高通量的陸地棉遺傳標(biāo)準(zhǔn)系TM-1營養(yǎng)組織(根、莖、葉)、花瓣、花藥及纖維發(fā)育時(shí)期[開花當(dāng)天(0 day post-anthesis,簡稱0 DPA)、開花后10天(10 DPA)、開花后20天(20DPA)]的RNA-seq數(shù)據(jù)庫[15]。基因表達(dá)水平利用Log2(FPKM)的數(shù)值進(jìn)行評估,其結(jié)果利用Cufflinks軟件(http://cufflinks.cbcb.umd.edu)進(jìn)行處理。
由于SABATHMTs家族基因的蛋白結(jié)構(gòu)中含有一個(gè)Methyltransf_7的蛋白結(jié)構(gòu)域,該結(jié)構(gòu)域在Pfam數(shù)據(jù)庫中的種子文件編號(hào)為PF03492。通過HMMER 3.0中的hmmsearch程序及種子文件,在陸地棉遺傳標(biāo)準(zhǔn)系TM-1基因組中共查找到37個(gè)基因,其中At亞組中有16個(gè)基因,Dt亞組中有19個(gè),還有2個(gè)基因的染色體信息不清楚;二倍體D基因組雷蒙德氏棉中查找到22個(gè)基因;二倍體A基因組亞洲棉中查找到24個(gè)基因,這些基因在染色體上呈現(xiàn)不均勻的分布。以陸地棉TM-1為例,在查找到的37個(gè)基因不均勻的分布在19條染色體上,其中9條染色體屬于At亞組,10條染色體屬于Dt亞組;A10、D10和D13上的分布的基因最多,分別預(yù)測到4個(gè)基因(圖1)。
根據(jù)已經(jīng)報(bào)道具有已知功能的SABATH-MTs基因,從美國國立生物技術(shù)信息中心(national center for biotechnology information,簡稱NCBI)上下載其對應(yīng)的蛋白序列與棉花基因組中預(yù)測的基因進(jìn)行系統(tǒng)進(jìn)化分析。結(jié)果表明,在總計(jì)預(yù)測到的83個(gè)基因(四倍體中有37個(gè);二倍體D組中有22個(gè);二倍體A組中有24個(gè))中,有34個(gè)基因能夠與已知功能的SABATH-MTs基因聚到同一分支(圖2)。這34個(gè)基因中有8個(gè)基因來自于二倍體A組,9個(gè)基因來自于二倍體D組;17個(gè)基因包括At亞組9個(gè)、Dt亞組8個(gè)。進(jìn)一步分析表明,來源二倍體A組和D組的基因在四倍體中都能夠找到其相應(yīng)的同源基因(表1)。
在陸地棉TM-1中預(yù)測到的37個(gè)SABATH-MTs基因在其根、莖、葉、花瓣、花藥及3個(gè)纖維發(fā)育時(shí)期(0、10、20 DPA)的轉(zhuǎn)錄組中的表達(dá)分析表明,共有20個(gè)基因在至少1個(gè)轉(zhuǎn)錄組數(shù)據(jù)庫中能夠檢測到表達(dá)[Log2(FPKM)>1]。其中有10個(gè)基因只在1個(gè)轉(zhuǎn)錄組數(shù)據(jù)庫中能夠檢測到表達(dá)。Gh_D02G2159、Gh_A10G1598、Gh_A13G0249和Gh_D13G0266只在根的轉(zhuǎn)錄組中檢測到有表達(dá);只在莖的轉(zhuǎn)錄組中檢測有表達(dá)的為Gh_D13G2235和Gh_D09G0289;Gh_A05G1642在葉的轉(zhuǎn)錄組中?;磉_(dá);Gh_D10G1851和Gh_D11G1755在花藥的轉(zhuǎn)錄組中?;磉_(dá);Gh_A01G0661在0 DPA的胚珠中?;磉_(dá)?;ò?、10 DPA和20 DPA的纖維中沒有找到?;磉_(dá)的基因(圖3)。
甲基化在許多生物進(jìn)程中發(fā)揮著關(guān)鍵的修飾作用,它包括基因和代謝的調(diào)控。在植物中,甲基化也有著廣泛的作用。與其他已知的甲基轉(zhuǎn)移酶比較發(fā)現(xiàn),SABATH家族在幾個(gè)方面都是獨(dú)特的。首先,除了保守的SAM結(jié)合序列,SABATH-MTs與其他MTs沒有序列的相似性[2];再者,SABATH基因家族的蛋白能夠催化O位和N位2個(gè)位置的甲基化,而其他的MTs只能執(zhí)行1種類型的甲基化[3,5,7]。擬南芥基因組中包含24個(gè)SABATH家族蛋白成員,其中一些蛋白具有明顯的特征。例如,茉莉酸羧基甲基轉(zhuǎn)移酶(JMT)、苯甲酸嘌呤/水楊酸羧基甲基轉(zhuǎn)移酶(BSMT)、吲哚乙酸甲基轉(zhuǎn)移酶(IAMT)、法尼烯酸羧基甲基轉(zhuǎn)移酶(FAMT)及赤霉素羧基甲基轉(zhuǎn)移酶(GAMT)等[8-9,11-12,16-18]。而根據(jù)生物信息學(xué)的分析,在四倍體陸地棉中預(yù)測了37個(gè)SABATH-MTs家族成員;在二倍體亞洲棉中預(yù)測了24個(gè);在二倍體雷蒙德氏棉中預(yù)測了22個(gè)。這些家族成員通過進(jìn)化分析,有部分成員能夠與已經(jīng)報(bào)道的具有特定功能的SABATH-MTs基因聚集到同一分支。四倍體陸地棉TM-1中預(yù)測到的37個(gè)基因中,有20個(gè)基因能夠在轉(zhuǎn)錄組數(shù)據(jù)庫中檢測到表達(dá),另外的17個(gè)基因未能檢測到表達(dá)。這些未能檢測到表達(dá)的基因有可能是以假基因的形式存在于基因組中, 或者在其他組織部位及纖維發(fā)育時(shí)期?;磉_(dá)而未能檢測到。通過進(jìn)化及表達(dá)分析的結(jié)果,為今后對于棉花中SABATH-MTs家族成員的功能研究起到了一定的指導(dǎo)作用。
表1 通過進(jìn)化分析具有特定功能的SABATH-MTs基因