王鵬飛,袁麗芳,張慶田,王海利,慕茜,王欽超,韓金濤,趙紅軍
(1. 山東省葡萄研究院,山東濟(jì)南 250100;2. 山東省農(nóng)藥科學(xué)研究院,山東濟(jì)南 250100;3. 山東師范大學(xué),山東濟(jì)南 250014;4. 龍口市省級(jí)農(nóng)業(yè)高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)管委會(huì),山東龍口 265701;5. 農(nóng)業(yè)農(nóng)村部華東都市農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室/山東省葡萄栽培與精深加工工程技術(shù)研究中心,山東濟(jì)南 250100)
葡萄根癌病是一種細(xì)菌性病害,由葡萄根癌病病原菌引起。葡萄根癌病通常在夏季發(fā)病,對(duì)葡萄極具破壞性。根癌病病原菌可引起葡萄產(chǎn)量的下降,甚至導(dǎo)致葡萄藤的枯死[1]。最早被發(fā)現(xiàn)的葡萄根癌病病原菌是Agrobacterium vitis[1-2]。后來,根癌病病原菌Agrobacterium tumefaciens也從葡萄根部被分離出來,說明A. tumefaciens株系也能侵染葡萄,引發(fā)根癌病[2]。葡萄根癌病病原菌對(duì)葡萄的侵染可以分為3個(gè)步驟:第一步是致病菌侵入到葡萄的非原質(zhì)體部位,匯集在葡萄的根部,再通過根部的傷口入侵[3-4];第二步,病原菌在葡萄的木質(zhì)部定殖;第三步,通過葡萄木質(zhì)部的液流散布到葡萄的各個(gè)器官和部位[5]。
根癌病病原菌的致病效應(yīng)子VirA和VirG作為毒力蛋白可以促進(jìn)根癌病病原菌對(duì)葡萄的侵染[1]。狹義上,效應(yīng)子(又名效應(yīng)蛋白)可以被定義為一類有利于致病菌侵染植物的蛋白質(zhì)。當(dāng)植物的致病菌分泌效應(yīng)蛋白后,還必須將這些效應(yīng)蛋白運(yùn)輸至植物寄主的精確亞細(xì)胞位置才能發(fā)揮功能,協(xié)助致病菌入侵植物。目前,大量的致病菌效應(yīng)蛋白被報(bào)道,這些相關(guān)研究的增多使得效應(yīng)子的特征被逐步分析和明確。研究顯示,效應(yīng)蛋白有如下特征:(1)具有信號(hào)肽;(2)無跨膜區(qū)域;(3)包含的氨基酸少于300個(gè);(4)富含半胱氨酸;(5)具有已知的效應(yīng)子結(jié)構(gòu)域;(6)與已知蛋白功能無同源性等[6]。
六型分泌系統(tǒng)(The type VI secretion system;T6SS)是存在于根癌病病原菌等革蘭氏陰性菌中的分泌系統(tǒng),因?yàn)槟芊置谝恍┡c致病相關(guān)的效應(yīng)子,并與病原菌致病能力密切相關(guān)。然而,人們對(duì)六型分泌系統(tǒng)分泌的非致病效應(yīng)子蛋白研究的較少。目前研究表明,六型分泌系統(tǒng)在細(xì)菌競爭中也發(fā)揮重要作用。有一種六型分泌系統(tǒng)分泌的非致病效應(yīng)蛋白稱為Tae4蛋白,在分泌Tae4蛋白后,會(huì)系統(tǒng)性地轉(zhuǎn)運(yùn)Tae4蛋白并注射到附近細(xì)菌的周質(zhì)空間中。而這種非致病相關(guān)的Tae4效應(yīng)蛋白具有酰胺酶活性,可以水解細(xì)菌的肽聚糖進(jìn)而殺死附近的競爭細(xì)菌[7]。有的細(xì)菌可免受自身分泌Tae4蛋白的傷害,是因?yàn)槠淞头置谙到y(tǒng)可分泌一種Tai4,它是Tae4蛋白的免疫蛋白。目前有兩種根癌病病原菌A. tumefaciens株系(ATU4346和ATU4347)被發(fā)現(xiàn)含有Tai4蛋白和Tae4蛋白[8]。由于這兩個(gè)株系缺少完整的基因組,因此無法進(jìn)行全基因組范圍的Tai4蛋白和Tae4蛋白家族成員鑒定。本研究以具備完整基因組的18個(gè)A. tumefaciens和4個(gè)A. vitis株系為對(duì)象,鑒定這些菌株中含有Tai4蛋白和Tae4蛋白家族成員的確切數(shù)目,并分析該蛋白家族成員的特性。對(duì)其Tai4蛋白和Tae4蛋白的鑒定與分析可為將來研究如何借助Tae4對(duì)一些致病菌進(jìn)行殺滅奠定基礎(chǔ)。
18個(gè)A. tumefaciens株系完整基因組以及全部蛋白序列信息下載于NCBI的A. tumefaciens基因組數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genome/browse/#!/prokaryotes/177/),株系名稱分別是:BIMB-1315G、1D1609、CFBP6623、12D1、CFBP6624、186、6N2、1D1460、EML4、CFBP7129、1D1108、6A、15955、FDAARGOS、BIM B-441、CFBP5499、CFBP5877、Q15_94。4個(gè)A.vitis株系完整基因組及其全部蛋白序列信息來源于NCBI的基因組數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genome/browse/#!/prokaryotes/1215/),株系名稱分別是:VAR06-30、VAR03-1、S4以及VAT03-9。
用HMMER軟件,基于Tae4結(jié)構(gòu)域(Tae4 domian;Pfam編號(hào)為PF14113)的隱馬克夫模型(Hidden Markov Model,HMM),分別搜索18個(gè)A. tumefaciens株系和4個(gè)A. vitis株系基因組中全部Tae4蛋白,從而鑒定2種葡萄根癌病病原菌的Tae4蛋白家族成員。利用在線軟件SMART(http://smart.embl-heidelberg.de/)確定蛋白是否具有完整的Tae4結(jié)構(gòu)域,剔除無完整Tae4結(jié)構(gòu)域的蛋白。
用HMMER軟件,基于Tai4結(jié)構(gòu)域(Tai4 domian;Pfam編號(hào)為PF16695)的隱馬克夫模型,分別搜索18個(gè)A. tumefaciens株系和4個(gè)A. vitis株系基因組中全部Tai4蛋白,從而鑒定2種葡萄根癌病病原菌的Tai4蛋白家族成員。利用在線軟件SMART(http://smart.embl-heidelberg.de/)確定蛋白是否具有完整的Tai4結(jié)構(gòu)域,剔除無完整的Tai4結(jié)構(gòu)域蛋白。
利用在線軟件TargetP(http://www.cbs.dtu.dk/services/TargetP/)預(yù)測Tae4和Tai4蛋白家族成員的亞細(xì)胞定位;利用在線軟件NLStradamus(http://www.moseslab.csb.utoronto.ca/NLStradamus/)分析核定位信號(hào)。設(shè)置參數(shù)為:Prediction Cutoff=0.6;用TMHMM2.0軟件(http://www.cbs.dtu.dk/services/TMHMM/)分析跨膜結(jié)構(gòu)域;利用在線軟件SignalP(http://www.cbs.dtu.dk/services/SignalP/)分析信號(hào)肽。
利用ClustalX 2.0軟件對(duì)Tae4和Tai4蛋白家族成員進(jìn)行蛋白多重序列比對(duì)分析;用MEGA 6.0軟件構(gòu)建系統(tǒng)發(fā)育樹,方法為鄰接法(Neighbor-Joining tree)。設(shè)置參數(shù)為:自舉值(bootstrap value)被計(jì)算1000次。bootstrap value大于70的分支認(rèn)為是1個(gè)組[9]。利用在線軟件Topo-phylogeny(http://bar.utoronto.ca/Topophylogeny/)進(jìn)行進(jìn)化樹的拓?fù)浣Y(jié)構(gòu)分析。
利用在線軟件MEME suite 5.3.3(https://meme-suite.org/meme/tools/meme)分析Tae4和Tai4蛋白家族成員的保守蛋白基序(motif)。設(shè)置參數(shù)為:motif發(fā)現(xiàn)數(shù)量=10,motif長度范圍為10~200個(gè)氨基酸[9]。
利用在線軟件SWISS-MODEL(https://swissmodel.expasy.org/)分析蛋白質(zhì)的三級(jí)結(jié)構(gòu)。
利用在線軟件STRING(https://string-db.org/)分析Tae4和Tai4蛋白家族成員與其他蛋白的互作。數(shù)據(jù)庫中A.tumefaciens蛋白互作數(shù)據(jù)來自株系CCNWGS0286。
利用軟件PAML包中的Code ml program(version 4.7)[10]分析Tae4蛋白編碼基因在進(jìn)化過程中受到的選擇壓力。利用PAML軟件中的3個(gè)選擇壓力位點(diǎn)模型分析。利用位點(diǎn)模型M0(one ratio)分析整體受到的選擇壓力;利用位點(diǎn)模型M8(βandω)貝葉斯分析法(Bayesian Analysis)鑒定Tae4基因進(jìn)化過程中的正向選擇位點(diǎn)[11]。
目前,NCBI公布的根癌農(nóng)桿菌基因組數(shù)據(jù)包含18個(gè)A. tumefaciens和4個(gè)A. vitis的完整基因組。在18個(gè)A. tumefaciens株系的基因組中鑒定了14個(gè)Tae4基因,在4個(gè)A.vitis株系的基因組中鑒定了1個(gè)Tae4基因和1個(gè)Tai4基因。其中,A. tumefaciens物種中只有BIMB-1315G、1D1609、CFBP6623、12D1、CFBP6624、186、6N2、1D1460、EML4、CFBP7129、1D1108、6A、15955、FDAARGOS株系中發(fā)現(xiàn)各有1個(gè)Tae4基因,其他株系中未發(fā)現(xiàn),且這18個(gè)株系基因組中均未發(fā)現(xiàn)存在Tai4基因。A. vitis物種中只有VAR06-30株系基因組中被發(fā)現(xiàn)1個(gè)Tae4基因和1個(gè)Tai4基因。并且發(fā)現(xiàn),14個(gè)A. tumefaciensTae4基因都存在線形染色體(linear chromosome),而1個(gè)A. vitisTae4基因和1個(gè)A. vitisTai4基因存在A. vitisVAR06-30株系的環(huán)狀染色體(circular chromosome)。
本文發(fā)現(xiàn)的Tai4基因編碼蛋白都含有Tae4結(jié)構(gòu)域(Pfam編號(hào)為PF14113),其中的A. tumefaciensTae4蛋白都含有EAGR_box結(jié)構(gòu)域(Pfam編號(hào)為PF16713)。本文發(fā)現(xiàn)的唯一A. vitisTai4蛋白含有1個(gè)Tai4結(jié)構(gòu)域(Pfam編號(hào)為PF16695)和1個(gè)Paramyxo_PCT結(jié)構(gòu)域。此外,用于預(yù)測結(jié)構(gòu)域的SMART軟件還檢測到A.vitisTai4蛋白含有一段長度為22個(gè)氨基酸的信號(hào)肽,序列為“MMYRLLLLGLVGLCVNSQIAAA”。
通過檢測15個(gè)Tae4蛋白和1個(gè)Tai蛋白的性質(zhì)發(fā)現(xiàn),15個(gè)Tae4蛋白都各自包含166個(gè)氨基酸,其半胱氨酸均分別占各自氨基酸含量的1.8%;Tai4蛋白包含151個(gè)氨基酸,其半胱氨酸占自身氨基酸含量的2%。A. vitisTae4蛋白的等電點(diǎn)是8.96,分子量是18 446.84;A. vitisTai4蛋白的等電點(diǎn)是6.71,分子量是16 749.02。A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白的等電點(diǎn)是8.81,其他12個(gè)都是9.05;A. tumefaciens的14個(gè)株系Tae4蛋白的分子量在18 214.44到18 353.57之間。15個(gè)Tae4蛋白與其他效應(yīng)子一樣不含有跨膜結(jié)構(gòu)域,A. vitisTai4蛋白也不含有跨膜結(jié)構(gòu)域。經(jīng)預(yù)測,15個(gè)Tae4蛋白與A. vitisTai4蛋白都是GPI錨定蛋白,定位于線粒體。先前的研究顯示,促進(jìn)致病菌侵染植物的效應(yīng)子都含有信號(hào)肽[6]。本研究結(jié)果顯示,A. vitisTae4蛋白被預(yù)測含有信號(hào)肽的可能性略高于14個(gè)A. tumefaciensTae4蛋白。在線軟件SignalP分析結(jié)果也顯示,A. vitisTai4蛋白含有信號(hào)肽。
疏水性分析結(jié)果顯示,A. vitisTae4蛋白疏水氨基酸和親水氨基酸的分布與A. tumefaciensTae4蛋白略有差異。而本次鑒定出的1個(gè)Tai4蛋白和15個(gè)Tae4蛋白既不屬于親水蛋白質(zhì)也不屬于疏水蛋白質(zhì)(圖1)。
圖1 蛋白的疏水性分析結(jié)果Figure 1 Hydrophobicity analysis of protein
將14個(gè)A. tumefaciensTae4蛋白利用ClustalX 2.0軟件進(jìn)行比對(duì)發(fā)現(xiàn),A. tumefaciensTae4蛋白比較保守,14個(gè)A. tumefaciensTae4蛋白之間的相似度較高。相對(duì)而言,A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白相對(duì)于其他12個(gè)蛋白在4個(gè)氨基酸位點(diǎn)上有差異,與其他Tae4蛋白差別最大(圖2 A)。A. tumefaciens株系FDAARGOS_1048的Tae4基因的起始密碼子是TCA,終止密碼子是CAT,而其他A. tumefaciensTae4蛋白的起始密碼子都是ATG,終止密碼子都是TGA。A. tumefaciens株系FDAARGOS_1048的Tae4蛋白序列并未因起始密碼子和終止密碼子的區(qū)別而有顯著差異,其蛋白序列與大部分A. tumefaciensTae4蛋白相似度高,極為保守(圖2 A)。而將14個(gè)A. tumefaciensTae4蛋白和A. vitisTae4蛋白利用ClustalX 2.0軟件進(jìn)行比對(duì)發(fā)現(xiàn),A. tumefaciensTae4蛋白和A. vitisTae4蛋白相似度不高,而A. vitisTae4蛋白和A. vitisTai4蛋白的相似度也不高(圖2 B)。
圖2 蛋白比對(duì)結(jié)果Figure 2 Alignment of proteins
利用MEGA 6.0軟件構(gòu)建系統(tǒng)發(fā)育樹顯示,14個(gè)A. tumefaciensTae4蛋白可以被分為2組。一組包含A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白,另一組包含其他12個(gè)蛋白。A. vitisTae4蛋白不屬于這兩個(gè)組,獨(dú)立成為一個(gè)孤兒蛋白(圖3)。利用在線軟件Topo-phylogeny分析MEGA 6.0軟件構(gòu)建系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)分析顯示,該15個(gè)Tae4蛋白可以被分為3組:一組包含A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白,另一組包含其他12個(gè)蛋白,第三組包含A. vitisTae4蛋白。進(jìn)化樹的分析結(jié)果與ClustalX 2.0軟件比對(duì)結(jié)果高度一致。
圖3 15個(gè)Tae4蛋白的進(jìn)化樹分析結(jié)果Figure 3 The evolutionary tree of 15 Tae4 proteins
利用在線軟件MEME suite 5.3.3分析了15個(gè)Tae4蛋白和1個(gè)Tai4蛋白的保守基序(motif)。結(jié)果顯示,14個(gè)A. tumefaciensTae4蛋白中可以鑒定出2個(gè)保守基序,其中motif1長達(dá)71個(gè)氨基酸,motif2包含19個(gè)氨基酸。15個(gè)根癌病病原菌Tae4蛋白間可以鑒定出10個(gè)保守基序,每個(gè)保守基序都含有10個(gè)氨基酸。這10個(gè)保守基序在A. tumefaciensTae4蛋白和A. vitisTae4蛋白中排序不同。
利用在線軟件SWISS-MODEL預(yù)測了15個(gè)Tae4蛋白和1個(gè)Tai4蛋白的三級(jí)結(jié)構(gòu)(圖4)。由圖4可見,A. tumefaciensTae4蛋白和A. vitisTae4蛋白的三級(jí)結(jié)構(gòu)有所區(qū)別。A. tumefaciensTae4蛋白結(jié)構(gòu)與SWISS-MODEL蛋白三級(jí)結(jié)構(gòu)數(shù)據(jù)庫中的模板6ijf.1.C具有93.87%的相似度。該模板的蛋白三級(jí)結(jié)構(gòu)來源于A. tumefaciensATU4346和 ATU4347株系中的Tae4蛋白的晶體結(jié)構(gòu)[8]。A. vitisTae4蛋白結(jié)構(gòu)與SWISS-MODEL蛋白三級(jí)結(jié)構(gòu)數(shù)據(jù)庫中的模板蛋白4jur.1.A具有41.14%的相似度,且最接近這個(gè)模板蛋白。該模板蛋白三級(jí)結(jié)構(gòu)來源于陰溝腸桿菌和鼠傷寒沙門氏菌的Tae4蛋白晶體結(jié)構(gòu)[12]。此外,利用在線軟件STRING分析兩種葡萄根癌病病原菌Tae4和Tai4蛋白家族成員在各自物種中與其他蛋白的互作,結(jié)果顯示,A. tumefaciensTae4可與10個(gè)蛋白互作,包括溶血素協(xié)同調(diào)節(jié)蛋白(Hemolysin-coregulated protein,HCP)、六型分泌系統(tǒng)蛋白VasG等(圖5)。而除了A. vitisTae4蛋白和A. vitisTai4蛋白二者能互作外,沒有預(yù)測到這兩個(gè)蛋白在A. vitis物種中能與其他蛋白互作。分析基于STRING數(shù)據(jù)庫中A. tumefaciens株系CCNWGS0286版本的數(shù)據(jù)。
圖4 蛋白的三級(jí)結(jié)構(gòu)預(yù)測結(jié)果Figure 4 The 3D structure of the protein
圖5 STRING分析A. tumefaciens Tae4蛋白與物種中其他蛋白互作的結(jié)果Figure 5 STRING analysis of A. tumefaciens Tae4 proteins with other proteins in species
將14個(gè)A. tumefaciensTae4蛋白的編碼基因作為一個(gè)整體進(jìn)行選擇壓力分析,PAML軟件的M0模型分析結(jié)果顯示,A. tumefaciensTae4蛋白編碼基因整體遭受純化選擇(dN/dS=0.3719)。用PAML軟件只在14個(gè)A. tumefaciensTae4蛋白的編碼基因中發(fā)現(xiàn)了1個(gè)顯著的正向選擇位點(diǎn)(149F)。將14個(gè)A. tumefaciensTae4蛋白和1個(gè)A. vitisTae4蛋白的編碼基因作為一個(gè)整體進(jìn)行選擇壓力分析,PAML軟件的M0模型分析結(jié)果顯示,這15個(gè)Tae4蛋白的編碼基因整體遭受正向選擇(dN/dS=2.39292)。PAML軟件M8模型用貝葉斯分析法在這15個(gè)Tae4蛋白的編碼基因中發(fā)現(xiàn)了27個(gè)顯著的正向選擇位點(diǎn)。
本研究分析了基因組被測序的18個(gè)A. tumefaciens和4個(gè)A. vitis株系的Tae4蛋白和Tai4蛋白及其編碼基因。結(jié)果顯示,18個(gè)A. tumefaciens株系基因組不是全部都含有Tae4基因,并且都不含有Tai4基因。然而,之前的研究顯示,有的A. tumefaciens株系基因組含有Tai4基因,例如ATU4346和ATU4347株系[8]。本研究的4個(gè)A. vitis株系中只有VAR06-30株系的基因組含有Tae4基因和Tai4基因。這說明,對(duì)于A. tumefaciens和A. vitis,Tae4蛋白和Tai4蛋白雖然可以做為一種攻擊其他病原菌的“武器”及自身免疫這種“武器”的防具[7],但這兩種蛋白的編碼基因并不是該兩種葡萄根癌病病原菌生長發(fā)育所必須的基因。也說明A. tumefaciens和A. vitis不同株系基因組之間Tae4和Tai4兩個(gè)基因位點(diǎn)的變異程度較高。有的株系基因組Tae4或Tai4基因缺失可能是由于基因組發(fā)生了結(jié)構(gòu)變異(Structural Variation,SV)或插入缺失(Indel)。有的A. tumefaciens株系基因組缺失了Tai4基因,說明可能存在其他機(jī)制協(xié)助這些A. tumefaciens株系抵御自身Tae4蛋白的傷害。另一種可能是這些A. tumefaciens株系的Tae4蛋白具有較小的傷害作用。而這些A. tumefaciens株系是否能抵御其他屬種的Tae4也需要進(jìn)一步研究。在A. tumefaciens株系中,Tae4基因也存在堿基突變。例如A. tumefaciens株系CFBP6623和CFBP6624相對(duì)于其他株系在Tae4基因上存在較多的非同義突變,A. tumefaciens株系FDAARGOS_1048的Tae4基因的起始密碼子和終止密碼子相對(duì)于其他株系的Tae4基因存在堿基突變,但都屬于同義突變,并沒有引起氨基酸的改變。
對(duì)于A. tumefaciens和A. vitis的Tae4蛋白性質(zhì)的分析顯示,這些葡萄根癌病病原菌的Tae4蛋白都包含少于200個(gè)氨基酸,也不含跨膜結(jié)構(gòu)域,這與之前報(bào)道的致病效應(yīng)子類似[6]。A. tumefaciens和A. vitis的Tae4蛋白共有10個(gè)保守基序,然而這些保守基序在這兩個(gè)物種中的排列順序不同。這種保守基序排列順序的差別可能導(dǎo)致了這兩個(gè)物種中Tae4蛋白較顯著的序列差異。盡管A. tumefaciens和A. vitis的Tae4蛋白都含有Tae4結(jié)構(gòu)域,并且含有較多的保守基序,但是這些保守基序排列順序的差異可能導(dǎo)致功能上的差異,本試驗(yàn)得到的蛋白互作分析結(jié)果也證明了這種差異可能存在。結(jié)果顯示,A. tumefaciensTae4可與溶血素協(xié)同調(diào)節(jié)蛋白、六型分泌系統(tǒng)蛋白VasG等互作,而A. vitis的Tae4蛋白則不能。而選擇壓力分析顯示,A. tumefaciens株系的Tae4基因間遭受純化選擇,蛋白之間沒有新功能的產(chǎn)生。而A. tumefaciens和A. vitis的Tae4基因間遭受正向選擇,且鑒定出許多正向選擇位點(diǎn),正向選擇可能會(huì)導(dǎo)致功能分歧或新功能的產(chǎn)生[13]。因此,推測不同葡萄根癌病病原菌間的Tae4基因功能可能存在差異。A. tumefaciens和A. vitis的Tae4蛋白三級(jí)結(jié)構(gòu)的差異也較明顯。A. vitisTae4蛋白的三級(jí)結(jié)構(gòu)與陰溝腸桿菌和鼠傷寒沙門氏菌的Tae4蛋白晶體結(jié)構(gòu)更為相似。進(jìn)化樹的結(jié)果也證明了A. tumefaciens和A. vitis中Tae4蛋白的差異較大。
綜上所述,該研究認(rèn)為,不是全部A. tumefaciens株系基因組含有Tae4基因,部分A. tumefaciens株系不含Tai4基因。說明對(duì)于A. tumefaciens和A. vitis,Tae4蛋白和Tai4蛋白雖然可以做為一種攻擊其他病原菌的“武器”及自身免疫這種“武器”的防具,但這兩種蛋白的編碼基因并非生長發(fā)育所必須的基因。A. tumefaciens和A. vitis的Tae4蛋白的氨基酸序列差異較大,不同葡萄根癌病病原菌間的Tae4基因功能可能存在差異。