張琪,周靜,周江林,孔娜,胡明達,彭小川,李北平,梁龍,靳遠,任洪廣,岳俊杰
軍事科學院軍事醫(yī)學研究院生物工程研究所,北京100071
原核生物的可移動遺傳元件(mobile genetic element,MGEs)可通過接合、轉(zhuǎn)化、轉(zhuǎn)導等方式介導遺傳物質(zhì)在不同種屬細菌間的橫向(水平)基因轉(zhuǎn)移(lateral/horizontal gene transfer,LGT/HGT)。Burrus 于2002 年首次對那些可以從染色體上剪切并整合進宿主染色體,通過接合的方式在細菌細胞之間進行轉(zhuǎn)移的遺傳元件進行了歸類,稱之為整合性接合元件(integrating conjugative elements,ICEs)[1]。ICEs 兼有質(zhì)粒和噬菌體的特征,與接合性質(zhì)粒相似,它可通過接合的方式進行轉(zhuǎn)移;與質(zhì)粒不同的是,它們不能自主復(fù)制,其復(fù)制方式與溫和噬菌體相似,通過整合進宿主染色體,隨宿主染色體一起復(fù)制[2]。ICEs 具有吸收和傳播包括毒力因子及耐藥基因在內(nèi)的多種特性基因進入細菌宿主細胞的功能。它們常賦予宿主細菌新的性狀,如耐藥性和致病性等[3]。
迄今,已在多種細菌中發(fā)現(xiàn)了ICEs,但目前還沒有公認的ICEs 分類方法。歐竑宇提出了根據(jù)整合酶序列相似性以及核心結(jié)構(gòu)同線性的特征對ICEs 進行分類的方法[4],按照這種方法可以把發(fā)現(xiàn)的大部分ICEs 歸為28 個家族。SXT/R391是目前已知的ICEs 中研究最早和最詳細的一個家族[5]。
SXT 元件最早發(fā)現(xiàn)于1992 年在印度和孟加拉導致霍亂的O139 群霍亂弧菌MO10 的染色體上,該元件能夠以整合接合的方式進入宿主菌染色體。SXT 攜帶多種耐藥基因,能夠介導霍亂弧菌對磺胺甲惡唑(sulfamethoxazole,Su)、甲氧芐氨嘧啶(trimethoprim,Tm)、鏈霉素(streptomycin,Sm)和氯霉素(chloramphenicol,Cm)的耐藥性。當時根據(jù)其攜帶的基因編碼對磺胺甲惡唑和甲氧芐胺嘧啶的抗性而命名為SXT[6]。R391 在上世紀70年代早期被鑒定為賦予抗卡那霉素的質(zhì)粒,最初被認為是不相容性群質(zhì)?!癐ncJ”的原生代表。20多年后,很多研究表明R391 和其他被稱作“R 因子”的遺傳元件具有與SXT 高度類似的基因組骨架結(jié)構(gòu)以及固定的染色體插入/重組位點,它們與SXT 實際上屬于同一類型的整合接合元件,因此將這一類元件劃分為同一個SXT/R391 家族。
目前發(fā)現(xiàn)的SXT/R391 元件基因組的大小為70~120 kb。SXT/R391 元件的基因組包括核心保守區(qū)和可變區(qū)兩部分[5,7-8]。SXT/R391 元件的保守區(qū)編碼的基因介導SXT 元件的整合/切除、接合轉(zhuǎn)移和ICEs 生命周期所需的調(diào)控,另外一些保守基因的功能未知。SXT/R391 可變區(qū)基因的編碼產(chǎn)物主要負責宿主對抗生素的耐藥性、重金屬離子抗性、生物膜形成和細菌運動能力的調(diào)節(jié),另外也編碼毒素-抗毒素系統(tǒng)、限制性修飾系統(tǒng)、解旋酶、核酸內(nèi)切酶等[9]。
作為多藥耐藥(multi-drug resistance,MDR)基因的載體,SXT 元件在菌株間播散可造成新的優(yōu)勢菌型流行。SXT/R391 元件的進化是造成其擴散能力增強的驅(qū)動力。闡明SXT/R391 家族元件的進化特征有助于防止SXT 元件擴散,將對致病菌防控研究起到重要的實踐指導意義。
首先以“SXT/R391”及“ICE”為關(guān)鍵詞在PubMed 中搜索獲得含有報道SXT/R391 元件的文獻,通過閱讀文獻獲取SXT/R391 元件的序列信息。接著進行SXT/R391 元件的預(yù)測,為了保證獲得完整的SXT/R391 元件序列,我們從基因組序列完整度為完整基因組(Complete Genome)和染色體(Chromosome)狀態(tài)的9632 個細菌基因組序列中搜索SXT/R391 元件。通過BLASTp 軟件進行比對,匹配結(jié)果中包含整合與剪切模塊(integration/excision module)、DNA 分泌模塊(DNA secretion module)和調(diào)控模塊(regulation module)等3 個必需模塊的蛋白區(qū)域推斷為潛在的ICE,如果在一段連續(xù)區(qū)域內(nèi)(70~130 kb)出現(xiàn)編碼SXT/R391 家族元件的整合酶Int、Ⅳ型分泌系統(tǒng)接合蛋白和調(diào)控蛋白SetR 的基因,則預(yù)測該基因組存在一個完整的SXT/R391 元件。最終,我們通過文獻和預(yù)測獲得83 個SXT/R391 家族元件。
提取SXT/R391 元件的52 個核心基因序列,對83 個元件做Blast 分析,分析每個基因在83 個元件上的分布和復(fù)制情況。
1.2.1 重組分析 應(yīng)用分子生物學軟件包RDP4[10]中的RDP、GENECONV、BootScan、MaxChi、Chimaera 等5 種較為常見的方法,分別探測83 個SXT/R391 元件的52 個核心基因序列的重組事件和重組信號。其中,GENECONV 的參數(shù)g-scale 設(shè)置為1,允許重組片段內(nèi)部的錯配;其他方法的參數(shù)設(shè)置為默認值,不作修改。P≤0.01 為具有統(tǒng)計學顯著性差異。
1.2.2 正選擇分析 選擇在線工具Datamonkey(http://datamonkey.org/)[11]進行SXT/R391 元件核心基因的正選擇壓力分析。首先使用MUSCLE 進行序列比對,提交序列及選擇運算模型。我們選擇了4 種模型,即隨機效應(yīng)似然法(REL)、固定效應(yīng)似然法(FEL)、單一祖先計數(shù)法(SLAC)及混合效應(yīng)進化模型方法(MEME)。依據(jù)ω 值[ω=dN/dS(非同義置換率/同義置換率)]判斷選擇的方向。當ω>1 且差異顯著時判斷為正向選擇,0<ω<1 時為凈化選擇,ω=1 時為中性選擇。
通過文獻收集和預(yù)測共獲得83 個SXT/R391元件的基因組序列,包括從文獻中提取的54 個和細菌基因組序列中預(yù)測的29 個,元件所在宿主基因組的分離時間為1967~2014 年,地理分布包括21 個國家和地區(qū),元件宿主跨越25 個菌屬。在預(yù)測的29 個SXT/R391ICE 元件中,有12 個曾經(jīng)被報道,但未提取和報道元件的完整序列。SXT/R391元件的宿主廣泛(圖1),但分布存在較大偏性,在霍亂弧菌中發(fā)現(xiàn)的數(shù)量最多,奇異變形桿菌緊隨其后。有趣的是,臨床發(fā)現(xiàn)的SXT/R391 元件也都集中在霍亂弧菌和奇異變形桿菌。在環(huán)境中發(fā)現(xiàn)的SXT/R391 元件大多來自水環(huán)境。SXT/R391的菌種分布不均勻,說明元件能在宿主中存在和保藏可能需要滿足一定的遺傳背景。
Wozniak 等對13 個SXT/R391 元件的基因組進行了比較分析[7],發(fā)現(xiàn)該元件具有52 個核心基因。我們提取了SXT/R391 元件的52 個核心基因序列,對獲得全基因組信息的83 個SXT/R391 元件的全基因組序列進行同源搜索,分析元件的核心基因的分布情況,結(jié)果見圖2。
83 個SXT/R391 元件中有一個特殊的成員ICEPmiChn3,該元件缺少20 個核心基因,其中13個發(fā)揮接合功能。缺少的20 個核心基因被一個新的由轉(zhuǎn)座子和耐藥基因組成的基因簇取代。實驗結(jié)果表明,該元件的接合功能完全喪失[12],因而ICEPmiChn3 已經(jīng)不是一個具有完整組件和功能的元件。因此,后續(xù)的核心基因數(shù)量分析排除了該元件。
經(jīng)過計算,52 個核心基因中有39 個依然出現(xiàn)在全部元件中。另外有6 個基因僅在1 個元件中缺少,這些基因可稱為軟核心基因(soft core)[13]。另有7 個基因(rumA、s024、s025、s026、traL/E/K)在2 個或2 個以上元件中缺失,其中的rumA、s024、s025、s026都是SXT/R391 元件擴散所需的最小功能基因集合,缺失這些基因可能會影響元件的傳播擴散。以上結(jié)果說明從文獻報道的13 個元件中推導出的52 個核心基因并不都是嚴格保守的核心基因,其中有一些基因?qū)儆谲浐诵幕颉?/p>
圖1 SXT/R391 的菌屬分布
值得注意的是,83 個元件的整合酶基因有2類,分別為int-1、int-2,2 類間的序列相似性僅為22%。裂解酶xis基因也有2 類,分別為xis-1、xis-2。我們發(fā)現(xiàn)在元件中,int-1與xis-1協(xié)同出現(xiàn),int-2和xis-2協(xié)同出現(xiàn)。
另外,從圖2 可以看出,traFHG、eex、setC、setD、s082、s083、s084、s086、setR基因在菌株Alteromonas macleodiistr.MED6-ICE 的SXT/R391 元件中出現(xiàn)了整體的基因復(fù)制。
除了基因復(fù)制,還有少數(shù)核心基因呈現(xiàn)了基因融合/裂解信號。全長rumB基因讀框長度為1269 bp,蛋白產(chǎn)物為423 aa,但該基因在46 個元件表現(xiàn)為2 個及更多的片段(圖3),說明rumB基因發(fā)生了基因融合/裂解,可能與位點附近發(fā)生的頻繁的插入有關(guān)。
此外,trhF與traW在一些元件中為2 個基因。如在元件Proteus mirabilisMD20140901(KX243408)中,trhF讀框[54557..55069],長度513 bp,蛋白產(chǎn)物171 aa;traW讀框[55080..56204],長度1125 bp,蛋白產(chǎn)物375 aa。再如,在元件Vibrio choleraeO37MZ03(JQ345361)中,trhF讀框[26846..27358],長度513 bp,蛋白產(chǎn)物171 aa;traW讀框[27369..28493],長度1125 bp,蛋白產(chǎn)物375 aa。但在元件Providencia stuartiiATCC33672(CP008920)中,對應(yīng)的2 個基因融合為1 個基因,融合基因讀框[1904626..1906272](基因組位置),長度1647 bp,融合蛋白產(chǎn)物(549 aa)為type-F conjugative transfer system pilin assembly family protein(AIN64681.1)。
圖2 核心基因分布情況
圖3 rumB 基因在不同元件中的分布
元件之間的重組能導致形成新的雜合元件,重組事件是SXT/R391 元件多樣性產(chǎn)生的動力之一。有研究報道,SXT/R391 元件核心區(qū)存在基因間重組。重組除了發(fā)生在基因及基因以上水平,還可能發(fā)生在亞基因水平(sub-gene level)。為了探測SXT/R391 元件的亞基因水平重組事件,我們檢測了SXT/R391 元件52 個核心基因的基因內(nèi)重組。在52 個核心基因中,有22 個核心基因在3種及3 種以上的方法中可以檢測到明顯的重組信號(表1)。
圖4 用紅色標出了重組基因在SXT/R391 元件基因組上的位置,這些基因涉及元件核心基因的全部4 個必需功能模塊,即整合與剪切模塊、DNA 復(fù)制及加工模塊(replication/DNA processing module)、DNA 分泌模塊和調(diào)控模塊。分泌模塊,即Ⅳ型分泌系統(tǒng)(type Ⅳsecretion system,T4SS)有關(guān)基因簇的大部分基因都檢測到了重組信號。此外,還有一些具有重組信號的核心基因為未知功能基因。
正選擇(positive selection)也是微生物進化過程中獨立的遺傳變異驅(qū)動力,在生物的適應(yīng)性進化中發(fā)揮關(guān)鍵作用。我們檢測了SXT/R391 元件基因組中基因的正選擇信號。為了避免重組事件對正選擇分析造成干擾,我們只在未發(fā)生重組事件的核心基因上檢測正選擇。計算結(jié)果顯示,除去以上分析的22 個發(fā)生重組的核心基因,SXT/R391 元件中沒有重組信號的30 個核心基因中有7 個檢測到正選擇信號(表2)。這7 個基因中的mobI和traJ編碼SXT/R391 元件接合轉(zhuǎn)移所需蛋白,其他5 個基因編碼未知功能蛋白,且不在SXT/R391 ICE 最小功能基因集合(minimal functional SXT/R391 ICE gene set)中,它們對SXT/R391 元件多樣性的貢獻有待進一步研究。
表1 核心基因重組信號檢測
圖4 22 個發(fā)生重組的核心基因在SXT/R391 元件骨架上的位置
表2 核心基因的正選擇氨基酸數(shù)量與位點
利用I-TASSER 軟件對mobI和TraJ基因編碼的蛋白進行三維結(jié)構(gòu)預(yù)測[14]。從預(yù)測的三維結(jié)構(gòu)圖(圖5)中可以看出,mobI基因編碼的蛋白上正選擇位點52、104 殘基處于α螺旋結(jié)構(gòu)的端頭,130殘基位于另一α螺旋結(jié)構(gòu)上;TraJ 基因編碼的蛋白發(fā)生正選擇的位點62 殘基正處于α螺旋結(jié)構(gòu)的端頭位置,195 殘基位于α螺旋結(jié)構(gòu)上,根據(jù)預(yù)測該蛋白的191~210 殘基為一個跨膜結(jié)構(gòu)域,正選擇位點195 殘基處于該結(jié)構(gòu)域內(nèi)。以上位點所處的蛋白結(jié)構(gòu)域或與轉(zhuǎn)移運輸有關(guān),這些位點受到選擇壓力可能與元件的轉(zhuǎn)移擴散相關(guān)。
圖5 mobI 基因(A)和traJ 基因(B)編碼蛋白的三維結(jié)構(gòu)及正選擇位點
作為MDR基因的載體,SXT 元件在菌株間播散可造成新的優(yōu)勢菌型流行。SXT/R391 元件的進化是造成其擴散能力增強的驅(qū)動力。闡明SXT/R391 家族ICEs 的進化特征、遷移模式及其散播的分子機制,有助于防止SXT 元件擴散,對致病菌防控研究有重要的實踐指導意義。SXT/R391 元件的核心基因決定了元件的復(fù)制和轉(zhuǎn)移。重組和正選擇是微生物進化過程中2 種獨立的遺傳變異驅(qū)動力,在生物的適應(yīng)性進化中發(fā)揮關(guān)鍵作用。本研究收集了目前發(fā)現(xiàn)的SXT/R391元件,對核心基因的分布以及核心基因的重組和正選擇兩大進化特征進行了分析。
本研究表明,同源重組和正選擇在SXT/R391元件核心基因的進化過程中發(fā)揮了重要作用。我們發(fā)現(xiàn)了22 個核心基因在進化中經(jīng)歷了同源重組,導致了元件相當一部分核心基因的遺傳變異。另外,有7 個核心基因存在正選擇信號,其中2 個基因mobI和traJ與元件的接合轉(zhuǎn)移有關(guān)。元件發(fā)生重組和正選擇變異都是為了SXT/R391 元件適合度的提升,從而能適應(yīng)生態(tài)環(huán)境的變化。綜上,我們分析了SXT/R391 元件核心基因的特征及適應(yīng)性進化,為了解SXT/R391 元件的擴散及進化規(guī)律奠定了基礎(chǔ)。