豬鏈球菌(Streptococcussuis)是一種對人獸健康有嚴(yán)重危害的革蘭氏陽性病原菌,可造成豬和人患上敗血癥、腦膜炎等病,對畜牧養(yǎng)殖業(yè)和人的健康造成很大的威脅[1]。我國于1998年和2005年發(fā)生兩起人感染豬鏈球菌聚集性疫情,造成多人死亡,近年來常有零星病例報(bào)告,需要引起重視[2-4]。豬鏈球菌根據(jù)莢膜多糖抗原的不同分為33個血清型,包括1/2、1-31、33型[5-7],2型是迄今為止從豬和人類病例中分離出的最常見的血清型[8-9]。然而,在許多歐洲國家,9型已經(jīng)成為引起豬侵襲性疾病的重要且流行的血清型,這種血清型經(jīng)常從密集飼養(yǎng)的豬群的患病豬分離出來,流行病學(xué)研究表明,近年來,我國9型的流行率不斷上升[9-11]。并且已有從野豬、野貓中分離出來的報(bào)道[13-14]。近年來也有豬鏈球菌9型引起的人類病例的報(bào)道[15],說明這種血清型具有人獸共患特性,這應(yīng)該引起我們重視。
基因組技術(shù)的使用使得豬鏈球菌發(fā)病機(jī)理的研究有了質(zhì)的飛躍,以往研究表明豬鏈球菌種群的基因組存在很大差異,即使是同一血清型的菌株之間基因型也可能不同,同時毒力因子也存在差異,存在較大地理差異[16-17],意味著毒力潛力是遺傳相關(guān)的。盡管9型流行率越來越高,但是關(guān)于9型菌株的數(shù)據(jù)很少,有少量的研究報(bào)道稱并非所有9型菌株都具有相同的毒力潛力[18-19],加大對9型豬鏈球菌的分子水平研究十分必要。本研究測定分離自廣東某豬9型豬鏈球菌強(qiáng)毒株的全基因組序列,將測序得到的結(jié)果與NBCI上的基因組數(shù)據(jù)庫上的數(shù)據(jù)進(jìn)行對比分析,獲得全基因組序列注釋信息并與NCBI中得到近緣菌株進(jìn)行比較分析。本研究結(jié)果為9型豬鏈球菌基因組整體水平的研究奠定基礎(chǔ)和提供數(shù)據(jù)支撐。
1.1 菌株及基因組序列 菌株GD18分離自廣東某豬場發(fā)病豬的關(guān)節(jié)液,鑒定為9型高致病菌株并采用Illumina HiseqTM完成基因組測序[20]。
1.2 基因組的注釋 將GD18菌株測序得到的基因信息與NCBI上的COG、GO、KEGG、CAZyVFDB、PHI-base、CARD數(shù)據(jù)庫進(jìn)行比對,使用SinalP軟件預(yù)測信號肽、使用ProCamp軟件對蛋白進(jìn)行亞細(xì)胞定位,最終可獲得GD18菌株全基因組注釋的結(jié)果。
1.3 GD18菌株與其他豬鏈球菌全基因組的比較分析 根據(jù)菌株GD18的基因組序列獲取16S rRNA的基因序列,采用BLAST與NCBI上的16S rRNA數(shù)據(jù)庫進(jìn)行比對,選取同源性高的近緣菌株,并從NCBI中得到近緣菌株的基因組信息,利用PGAP軟件比較GD18與近緣菌株的共有基因和特有基因。進(jìn)一步對不同的菌株進(jìn)行比較分析得到基因上的SNPs位點(diǎn),以UPGMA聚類方式構(gòu)建系統(tǒng)發(fā)育樹。
2.1 基因組基本特征 豬鏈球菌GD18的基因組大小為2 067 661 bp,GC含量為41.33%。組分分析發(fā)現(xiàn),基因總數(shù)為2 048個,基因平均長度為893.79 bp,基因總長度為1 830 482 bp,基因編碼比例率為88.53%。總蛋白數(shù)1 961 個,tRNA為45個,rRNA為5個。
2.2 基因組注釋
2.2.1 COG數(shù)據(jù)庫注釋結(jié)果 COG數(shù)據(jù)庫是位于NCBI上一個基于同源基因直系關(guān)系的數(shù)據(jù)庫,COG將所有編碼基因分為25類。COG數(shù)據(jù)庫對比分析結(jié)果顯示,GD18菌株有1 511個功能基因被劃分為20個COG亞類,占總蛋白的77.05%,存在最多的是碳水化合物運(yùn)輸和代謝相關(guān)基因(10.79%),其次是用于翻譯、核糖體結(jié)構(gòu)和生物發(fā)生(10.13%),氨基酸轉(zhuǎn)運(yùn)與代謝(8.14%),轉(zhuǎn)錄(7.41%),復(fù)制、重組和修復(fù)(6.35%),細(xì)胞壁、膜合成(5.43%),無機(jī)離子轉(zhuǎn)運(yùn)與代謝(4.24%)相關(guān)基因等(圖1)。
2.2.2 GO數(shù)據(jù)庫注釋結(jié)果 GO數(shù)據(jù)庫是一個基因功能的分類體系,含有分子功能、生物過程、細(xì)胞組分3個本體。GD18在GO數(shù)據(jù)庫中注釋到1 398個蛋白,占總蛋白的71.29%。在3個類別的分布:分子功能為19項(xiàng),主要體現(xiàn)在催化和結(jié)合等;參與生物過程為13項(xiàng),主要體現(xiàn)在代謝過程和細(xì)胞過程等;構(gòu)成細(xì)胞組分為12項(xiàng),主要體現(xiàn)在細(xì)胞和細(xì)胞部分等(圖2)。
2.2.3 KEGG數(shù)據(jù)庫注釋結(jié)果 KEGG數(shù)據(jù)庫是關(guān)于生物系統(tǒng)較完善的數(shù)據(jù)庫,包括基因組、化學(xué)信息以及系統(tǒng)功能信息。對預(yù)測到的GD18菌株基因預(yù)測信息進(jìn)行KO注釋,結(jié)果顯示GD18僅有861個基因可以對應(yīng),占總蛋白的43.91%,主要包括碳水化合物代謝通路、氨基酸代謝通路、膜轉(zhuǎn)運(yùn)通路等(圖3)。
2.2.4 CAZy數(shù)據(jù)庫注釋結(jié)果 CAZy 數(shù)據(jù)庫是表示碳水化合物活性酶的數(shù)據(jù)庫,該數(shù)據(jù)分為按照活性酶的在生物學(xué)過程中的作用不同分為5個主要分類和與碳水化合物結(jié)合結(jié)構(gòu)域。使用HMMER3將GD18與CAZy數(shù)據(jù)庫進(jìn)行比對,38個基因注釋為糖苷水解酶、25個基因注釋為糖基轉(zhuǎn)移酶、12個基因注釋為糖類酯解酶、10個基因注釋為碳水化合物結(jié)合結(jié)構(gòu)域、2個基因注釋為多糖裂解酶、1個基因注釋為氧化還原酶,共注釋到88個碳水化合物活性酶基因,占總基因的4.49%。
2.2.5 PHI-base數(shù)據(jù)庫注釋結(jié)果 PHI-base是病原與宿主互作數(shù)據(jù)庫,對藥物干預(yù)靶基因的研究具有重要的作用,數(shù)據(jù)庫主要是關(guān)于微生物病原與動植物、真菌宿主的相互作用數(shù)據(jù)。GD18共有66個基因注釋到該數(shù)據(jù)庫中,占總基因的3.37%。將這些基因進(jìn)行表型分類,注釋為導(dǎo)致毒力降低的基因26個,對毒力沒有影響的基因24個,導(dǎo)致毒力損失的基因6個,混合功能的基因6個,致病效應(yīng)基因5個,導(dǎo)致毒力增強(qiáng)的基因4個,致死因子2個,抗藥性1個,其中有10個基因注釋為2~5個表型。
2.2.6 毒力因子分析 VFDB數(shù)據(jù)庫是一個用于專門研究致病菌的相關(guān)的毒力因子的數(shù)據(jù)庫,分為setA和setB兩部分。GD18菌株預(yù)測蛋白與VFDB數(shù)據(jù)比對,與SetA數(shù)據(jù)庫比對得到毒力因子133個,與SetB數(shù)據(jù)庫比對得到毒力因子140個,包括多種結(jié)合蛋白、反應(yīng)調(diào)控因子、透明質(zhì)酸裂解酶前體和莢膜多糖等。對照已報(bào)道的70個毒力因子[21-28],GD18具有66個,缺乏epf、sly、rgg、nadR。
2.2.7 耐藥基因分析 CARD數(shù)據(jù)庫是用于研究藥物作用、環(huán)境治理的經(jīng)典耐藥性數(shù)據(jù)庫。使用BLAST把基因蛋白序列與CARD數(shù)據(jù)庫進(jìn)行對比,后將GD18全基因組序列和其對應(yīng)的耐藥性注釋信息結(jié)合分析,注釋結(jié)果表明GD18包含β-內(nèi)酰胺類、喹諾酮類、大環(huán)內(nèi)酯類、林可酰胺類、四環(huán)素類、氨基糖苷類、磺胺類等多種類型的抗生素耐藥基因,共28個抗生素耐藥基因。其作用機(jī)制主要藥物作用靶位改變、核糖體靶位改變、靶蛋白的保護(hù)、產(chǎn)生修飾酶、二氫蝶酸合成酶發(fā)生變異等。另外存在多種與外排機(jī)制相關(guān)的基因,如假定ABC轉(zhuǎn)運(yùn)蛋白ATP結(jié)合蛋白/MT1014、大環(huán)內(nèi)酯輸出ATP結(jié)合/滲透酶蛋白MacB、假定的ABC轉(zhuǎn)運(yùn)蛋白ATP結(jié)合蛋白YxlF。
2.2.8 信號肽預(yù)測 信號肽蛋白是一種攜帶新合成的蛋白轉(zhuǎn)移到相應(yīng)的代謝通路信息的短肽鏈。運(yùn)用SignalP軟件進(jìn)行GD18菌株的信號肽蛋白預(yù)測,結(jié)果顯示GD18具有114個信號肽蛋白,占總蛋白的5.81%,大小由12~52個氨基酸組成。
2.2.9 蛋白的亞細(xì)胞定位 細(xì)胞中的蛋白需要在特定的位置發(fā)揮作用,細(xì)胞中蛋白的位置往往與作用位置相同,通過對蛋白位置的定位可以初步了解蛋白所發(fā)揮的作用。運(yùn)用ProtCamp軟件對GD18菌株的蛋白進(jìn)行亞細(xì)胞定位,結(jié)果顯示1 098個位于胞漿(55.99%),414個位于細(xì)胞膜(21.11%),30個位于胞外(1.53%)。
2.3 GD18與其他豬鏈球菌比較分析 使用GD18D的16srRNA序列與NCBI上的數(shù)據(jù)庫進(jìn)行比對,選取同源性高15個近緣菌株,各菌株基因組基本信息見表1,基因組大小在1.88~2.35 Mb之間,GC含量基本在41%左右,基因數(shù)在1 813~2 265個之間,蛋白數(shù)在1 709~2 139個之間,tRNA在27~59個之間,rRNA在3~12個之間,各菌株間表現(xiàn)出較大差異。PGAP軟件對16個菌株基因組序列分析結(jié)果表明16個菌株共有的核心基因?yàn)? 244個,特有基因24~214個,GD18有特有基因82個(表1),共有基因占各菌株總基因的58%~73%。16個菌株非共有基因共1 685個,菌株特有基因共1 417個,COG注釋表明共有核心基因以代謝相關(guān)基因占優(yōu)勢,有401個(32%),而非共有基因和特有基因主要是功能未知等無顯著特征的基因,分別有1 057和1 102個(63%和78%)(表2)。
表1 16株豬鏈球全基因組比較Tab.1 Genomic comparison of 16 Streptococcus suis strains
表2 16株豬鏈球菌核心、非共有和特有Orthologs Cluster的COG分布Tab.2 Distribution of orthologs of core, dispensable and specific COG clusters from 16 Streptococcus suis strains
將上述15株菌株與GD18的全基因組進(jìn)行比較分析構(gòu)建系統(tǒng)進(jìn)化樹圖,結(jié)果詳見圖4,該進(jìn)化樹含有6 個分支,GD18株與加拿大分離株89-3576-3,丹麥分離株4417和一個國內(nèi)分離株YS24同處一個分支,與89-3576-3株親緣關(guān)系最近;而其它3個國內(nèi)分離株均屬于不同分支(圖 4)。
隨著現(xiàn)代基因測序技術(shù)的進(jìn)步,為防治豬鏈球菌提供了一種全新的思路。針對現(xiàn)有的豬鏈球菌株研究主要集中在2型,9型菌株的數(shù)據(jù)很少的現(xiàn)狀,本研究測定一株9型高致病豬鏈球菌菌株全基因組序列,基因組全長為2 067 661 bp,基因總數(shù)為2 048個,蛋白總數(shù)為1 961個。COG結(jié)果顯示GD18菌株碳水化合物運(yùn)輸和代謝、翻譯,核糖體結(jié)構(gòu)和生物發(fā)生、氨基酸轉(zhuǎn)運(yùn)和代謝等相關(guān)基因特別活躍,GO分析顯示在分子功能方面大多數(shù)基因參與催化、結(jié)合和轉(zhuǎn)運(yùn),生物過程方面大多數(shù)基因參與代謝過程和細(xì)胞過程,KEGG分析顯示GD18主要包括碳水化合物代謝通路、氨基酸代謝通路、膜轉(zhuǎn)運(yùn)通路,這些重要的功能和通路也許與該菌的致病性、物質(zhì)轉(zhuǎn)運(yùn)、胞內(nèi)環(huán)境的建立以及表達(dá)調(diào)控有重要的聯(lián)系。CAZy 數(shù)據(jù)庫注釋結(jié)果表明GD18含有豐富的碳水化合物活性酶,說明該菌能利用多種糖類,環(huán)境適應(yīng)性強(qiáng)。另外GD18預(yù)測到114個信號肽蛋白,其長度在12-52個氨基酸之間,信號肽蛋白可引導(dǎo)蛋白質(zhì)分泌到細(xì)胞外,通常分泌蛋白可能在細(xì)菌致病中起重要作用,對GD18亞細(xì)胞定位顯示有30個蛋白位于細(xì)胞外,長度在48-1104個氨基酸之間,其中26個蛋白長度小于700個氨基酸,小型蛋白結(jié)構(gòu)一般簡單,會更方便與宿主互作,但是它們在致病中是否起重要作用,有待實(shí)驗(yàn)驗(yàn)證。同時注釋結(jié)果也表明有很多基因并沒有注釋入這些數(shù)據(jù)庫或功能未知,這些基因有待于進(jìn)一步的挖掘功能。
VFDB數(shù)據(jù)庫對比結(jié)果表明GD18具有豐富的毒力因子,與SetA數(shù)據(jù)庫比對得到133個,與SetB數(shù)據(jù)庫比對得到140個。對照已報(bào)道的70個毒力因子,GD18具有66個,缺乏epf、sly、rgg、nadR,已有研究表明菌株的高毒力與其mrp/epf/sly基因的存在呈正相關(guān)[29],而GD18缺乏其中2種,但臨床表現(xiàn)仍為高致病性菌株,這表明豬鏈球菌毒力因子的復(fù)雜以及并非所有的豬鏈球菌菌株都有一套通用的毒力因子。CARD對比結(jié)果表明GD18具有7大類,28個抗生素耐藥基因,其耐藥機(jī)制多樣,存在多種可能與外排機(jī)制相關(guān)的基因,這些外排系統(tǒng)意著示GD18可能處于一個高濃度的抗生素環(huán)境,多種抗生素的使用導(dǎo)致其具備了多種耐藥基因。
在GD18與其它15個近緣豬鏈球菌菌株的比較分析發(fā)現(xiàn)豬鏈球菌不同菌株在基因組大小、基因數(shù)、tRNA、rRNA等方面表現(xiàn)出較大差異。PGAP軟件對16個菌株基因組序列分析結(jié)果表明16 個菌株共有的核心基因?yàn)?1 244 個,共有基因占各菌株總基因的58%~73%,特有基因24~214個,說明豬鏈球菌遺傳高度可變和復(fù)雜性。共有基因以代謝相關(guān)基因占優(yōu)勢,占比約32%,體現(xiàn)了菌株的基本生物學(xué)特性。而非共有基因和特有基因主要是功能未知等無顯著特征的基因,分別占比約63%和78%,這些基因也許體現(xiàn)了不同菌株在致病性、耐藥性等方面的差異,值得進(jìn)一步對比研究。進(jìn)化分析表明16個菌株分為6個分支,GD18與加拿大分離株89-3576-3親緣關(guān)系最近,同處一個分支的還有丹麥分離株4417和一個國內(nèi)分離株YS24,但其它3個國內(nèi)分離株均處在不同分支,這表明國內(nèi)菌株遺傳關(guān)系復(fù)雜,且菌株存在國際交流,進(jìn)化途徑多樣。
利益沖突:無
引用本文格式:席小燕,李曉琪,陳家苑,等. 1株9型豬鏈球菌全基因組分析[J]. 中國人獸共患病學(xué)報(bào),2022,38(8):707-713. DOI:10.3969/j.issn.1002-2694.2022.00.0102